南乌拉尔国立大学高级研究员,科学(物理和数学)候选人阿列克谢•鲁恰伊和他的同事正对诸多领域的问题进行研究:数字银行,畜牧业,面部识别,通过胸部X光检查识别肿瘤。创新理念与技术的熟练使用相结合,让您获得有趣的结果。
梯度提升与随机森林
什么是交易?银行将钱从一个账户转移到另一个账户的操作等等。
在计算机视图中,交易是显示现金流历史记录的数据。这是为了什么存在这一操作步骤?以便始终能够上诉并获取有关转移的信息。
有些交易在税务机关、银行和执法机构看来可能很可疑。例如,如果某人一直收到相同的收入,他不是从事非法贸易吗?有些数额可能会引起分发毒品的想法。打击洗钱是金融稳定和安全的重要条件。
人工智能的任务是学习如何识别可疑和非法交易。计算机不负责用“人类语言”来表述原因,它创建一个数学标准来决定交易的合法性就足够了。对于训练,使用已经开发的事务数据库,其中预先标记了可疑行。数据库是平衡的,也就是说,其中应该有大致相等的“正常”和“坏”事务。在银行的实际活动中,可疑和非法交易只占很小的份额。从“生活中”接收到真实数据后,系统将花费更多时间学习,但效果较差。
南乌拉尔国立大学高级研究员,科学(物理和数学)候选人阿列克谢•鲁恰伊和他的同事使用选择比特币交易的Elliptic数据库来训练和测试他们的系统。这个数据库是不平衡的:其中大约有二十万笔交易,其中大约十分之一是非法的。为了准备它,科学家必须首先平衡数据库。
椭圆基底是众所周知的,当然也引起了其他专家的注意。他们尝试了不同的机器学习方法,名字很有趣:“随机森林”、“逻辑回归”、“朴素贝叶斯分类器”、“多层感知器方法”。阿列克谢•鲁恰伊和他的同事在梯度提升的帮助下设法超越了之前的所有结果。
提升(来自“加强”一词)有助于提高预测的准确性。提升逐步构建模型,在每一步中,模型都会根据在上一步中出错的示例进行训练,从而在不破坏整体准确性的情况下对其进行更正。
“梯度”一词来源于分析,这种提升类似于“梯度下降”,优化功能,找到其最小值或最大值。有必要犯最少的错误并识别最多的可疑交易,这就是我们正想要的吧?
XGBClassifier算法得到的结果是基于椭圆数据库的正确答案比例的0.9921,而之前公布的结果仅为0.9780。这两个数字之间的区别是根本性的:前一个不符合检测异常交易的可靠性要求,现在满足条件。这是一场胜利!
三十三头牛——多少公斤?
农场动物应该不时被放在秤上。众所周知,奶牛会因此而承受压力,因此它们会减轻5-10%的体重。不是因为他们像节食时尚达人一样看待天平的划分。只是任何不熟悉的程序,任何与陌生人的密切接触都会吓到动物。
然而,牛仍然相当强壮。对于在农场生长的猪来说,这更加困难。专家说,如果怀孕或哺乳期的母猪被带去称重,她可能会出现心肌梗塞并立即死亡。
因此,所有研究都经过初步和仔细的协调,实验获得生物伦理学许可。还遵守隔离措施。任何动物都不应该在测量过程中受苦!
南乌拉尔国立大学高级研究员,科学(物理和数学)候选人阿列克谢•鲁恰伊参加了一个项目,根据农场动物的外部尺寸——外部或形态特征来评估农场动物的活重。这项工作得到了俄罗斯科学基金会的资助,并与奥伦堡的俄罗斯科学院联邦生物系统和农业技术科学中心联合进行。自2017年以来,研究一直在进行中。
使用卷尺进行手动测量给奶牛带来的压力与试图让奶牛站在秤上的压力一样大。因此,数学、计算机视觉和人工智能来救援。
计算机视觉是通过数码相机和图像分析进行观察。为了评估猪的轮廓,有必要修复它,或者让相机本身有机会选择所需的角度。在动态中评估拍摄参数并不容易,有必要考虑动物的轨迹。但事实证明,动物也害怕摄像机,尤其是嗡嗡声和移动。因此,仅从上方射击动物很方便。以这种方式固定的相机不那么脏。
阿列克谢•鲁恰伊说道:“每年我们的数据库都会补充200-300个人的图像——包括牛和猪,创建这样的数据库是一个耗时的过程。我们的初步计算表明,从俯视图估计动物的体重可以给出令人满意的结果,但它们的质量肯定不如从侧面视图估计。
此外,顶视图还提供更多信息,在它的帮助下,您可以估算牛奶和肉类的性能。
动物的体重受季节变化的影响,重要的是要考虑温度和其他环境参数。估计模型给出的权重的误差将为5-10%,这对于农业综合体来说是可以接受的。如果出现来自不同体重类别的动物图像,如果不是在混凝土地板上而是在橡胶垫上拍摄,则模型可能会出错——这些都是任何神经网络的问题。
阿列克谢•鲁恰伊:“当然,动物的几何形状和外部参数决定了质量,我们的任务更加雄心勃勃:还将动物的遗传参数与其形态特征联系起来。我们进行基因分析,建立样本,找出哪些基因与肩部的高度,骶骨,胸部的深度和宽度等相关,我们能够识别出几个这样的基因。
二维半
阿列克谢•鲁恰伊工作的另一个领域与面部识别有关。 这里使用了一个有趣的想法——使用2.5D图像,字面意思是“二维半”。
如今,面部识别系统已成为日常生活的一部分。通常,它们与二维图像一起工作——并且有效地工作。但是,当然,有时他们会犯错误。如果一个人的脸离相机很远或离相机太近,如果它以一定角度旋转,神经网络可能会给出错误的结果。你可以通过制定规则和标准来让一个人正确地站起来,或者你可以考虑改进技术。
平面图像由像素组成,每个像素由颜色的强度决定:红色、绿色和蓝色。RGB 是每个计算机用户都熟悉的缩写。2.5维“图片”的原理是将D添加到RGB——图像的深度或从相机到物体表面(在我们的例子中是面部)的距离。
有三种方法可以确定深度。第一种简单且不可靠的方法是光度法:比较彼此相距一定距离的两个相同的平面图像。第二种是使用激光。第三个是红外照明:物体的几何形状由红外网格的“曲率”决定。
源材料是神经网络,这些神经网络已经被训练来识别传统的面部二维图像。它们的创建需要大量的图像并在超级计算机的帮助下进行处理,只有大公司才能做到。所以谷歌创建了这样一个数据库Imagenet。车里雅宾斯克数学家在他们的基础上创造了一种更先进的人工智能,它已经考虑到了图片的“深度”。
注意,网络威胁!
阿列克谢•鲁恰伊参与的新项目是“确保企业自动化过程控制系统工业网络网络安全的智能方法”。该项目的工作正在南乌拉尔国立大学高级研究员康斯坦丁•科斯特罗米廷的指导下进行。
在乌拉尔,这种系统主要由冶金企业使用。高温、腐蚀性酸性烟雾和其他危害对可能处于环境灾难中心的城市工人和居民来说,使自动化变得至关重要。
来自摄像头和传感器的数据被输入普通计算机,通过TCP/IP等协议相互连接。如果病毒干扰了系统的运行,或者恶意黑客决定在城市中安排当地的“启示录”怎么办?
当然,已经有很多技术手段可以防止网络攻击。然而,这让人想起“堵孔”。同时,冶金厂可能有很多单位需要安全。
神经网络经过大量网络攻击示例的训练,可以“作为一个整体”监控系统的状态,甚至在可疑状态造成损害之前识别它们。让我们回想一下本文开头描述的“边际”银行交易是如何发生的。人工智能将帮助您有效地设置控制点并对其进行监控,以便不仅按时而且提前发出警报。