精确度达人眼两倍!仅凭照片就能快速区分盐和糖,AI视觉比人眼还毒辣

智造趣闻录 2023-09-11
2327 字丨阅读本文需 6 分钟

近日,据《工业与工程化学研究》杂志报道,日本北海道大学的研究人员开发了一种机器学习模型,只需使用样品的照片就可以区分固体化学混合物的组成比例。

该模型是以糖和盐的混合物作为测试案例来设计和开发的。为了创建更多用于训练和测试的子图像,团队对样品的原始照片进行随机裁剪、旋转。结果,仅使用300张原始图像进行训练就开发出了该模型。经过训练的模型的精确度大约是团队中最专业的成员肉眼精确度的两倍。

糖和盐混在一起该如何区分?

当你有一天不小心将盐和糖混在一起了,你会怎么做?按照懒人的办法,干脆破罐子破摔,就不分开了,等到做饭的时候,将混在一起的盐和糖直接放下去就可以了。

但是也不排除一些网友,看到盐和糖混在一起,心里特别不舒服,非要把这两个给分开才肯罢休。可能许多人看到盐和糖混在一起,简直一个头两个大,外表相似不说,想要分开两个物品,花上一天一夜都弄不完。也不乏一些无事可做的网友,拿着镊子拿着碗,特别细心地将盐和糖一粒粒的分开。但做这些之前,我们也要了解了解,盐和糖这两样物品究竟有什么区别?

糖,从表面来看,它的颜色是乳白色,而且它的表面直径只有0.5毫米。盐,它表面的颜色是泛黄色,直径只有0.1毫米。想要用这样的方法去区别盐和糖,需要“显微镜”的帮忙,因为人类的肉眼远没有那么先进,去观察毫米以下的实物。

当然不止上面一个区别的方法,我们可以同时将盐和糖分别放置与两个不同的纸上,然后通过手的触感,去推断两者的区别。如果你的手指先接触到糖,然后在手里静置两分钟,再将糖粒放下,你会感觉到手上很黏腻,而且刚开始触摸的时候,糖有一种比较细滑的感觉。如果先触碰到的是盐,刚接触的一瞬间,你会感觉到盐摸起来,有一种很粗糙的感觉。

当然,为确定固体混合物的成分,我们还可以采用核磁共振、高分辨率的质谱仪和光谱仪等。这些方法可以得到相当准确的定量分析结果。但是,肉眼观察依旧是化学实验中的一个重要方法,可以得到初步的评价结果,并且具有快速、无损的优点。在历史上,法国著名的微生物学家、化学家路易斯・巴斯德就是通过对晶体进行仔细的肉眼观察,分辨出了酒石酸盐。以这项突破性的发现为起点,科学家建立并发展了分子手性的相关理论,现在分子手性已经广泛应用于药物开发领域。

超越人眼的机器识别能力

北海道研究人员在一开始利用糖和食盐混合物的照片来训练机器学习模型。虽然原始照片只有 300 张,但研究人员利用随机裁剪、翻转、旋转等手段对原始照片进行处理,以创建更多的子图像用于训练和测试。测试的结果显示,机器学习模型识别这些照片的准确度是研究团队中肉眼观察准确率最高的人的两倍。

因此,相对于传统的分析方法,它更适合用于实时分析一些动态过程。利用这种模型,我们可以及时发现问题,并在隐患酝酿出事故之前,尽早地介入生产或实验的过程,减少损失。

例如,氨基水杨酸(PAS)是一种用于结核病药物治疗的抗生素,固态的氨基水杨酸可以发生热脱羧反应形成 m-氨基酚(MAP)。随着反应的进行,由反应物和生成物组成的混合物的物理外观会不断变化。通过让机器学习模型分析相关图片,研究人员就能准确地知道反应进度以及各阶段的反应产率。

在成功的测试案例之后,研究人员还将该模型应用于不同固体混合物的评估,特别是该模型还成功地区分了不同的多晶型和对映异构体。同一种物质以两种或两种以上晶体结构的形式存在,它们彼此之间就叫做多晶型;而互为对映异构体的物质虽然具有相同的分子量、原子组成,但原子的排列具有细微差异,其实是两种物质。这两种差异在制药行业很重要,区分这些差异通常需要耗费大量的时间和精力。

另外,研究人员还利用该模型分析了更复杂的情况:具有 4 种组分的混合物,最后发现模型能准确地评估目标分子在四组分混合物中的百分比。该团队进一步证明了模型的多功能性,表明在进行补充培训后,它可以准确地分析用手机拍摄的图像。

研究人员表示,机器学习模型能够复制甚至超过有经验的化学家眼睛的准确性。这一工具能成为缺乏经验的新手化学家的一双得力“眼睛”,对于那些视力受损的人来说,这也可作为一种观察工具。

当机器视觉开始超越人眼

AI技术的进步很大程度上得益于计算机视觉的发展。计算机视觉技术关注的是构建能够收集和处理视觉信息的软件。应用计算机视觉可以识别照片中的人物、读取X光片、进行工厂机器人系统的智能升级,但它的影响范围远不止于此。

大多数人都对自己的视觉习以为常,殊不知要拿起叉子或接住球,我们的大脑要进行大量的运算。计算机变得足够快速、强大和小巧来实现计算机视觉的实际应用,不过是这几年的事情。最先进的计算机视觉技术要运用到深度学习,而深度学习是AI的一大领域,灵感来自于人脑。深度学习算法使用的人工神经网络(ANN),是指能够分析并相互传递信息的互相连接的节点层,与神经元的通信机制类似。

如果我们向神经网络展示一张自拍照,一层神经元将会识别类似于面部轮廓的粗线条;另一层神经元会关注五官之间的区域,例如眼睛到嘴巴的距离;还有其他神经元会负责观察耳朵的形状。藉此,该算法可判断出这是不是一张人物照片,甚至看出这人是谁。

“在大多数计算机视觉任务当中,神经网络都能轻而易举地生成最佳算法,”腾讯优图实验室杰出科学家贾佳亚说道。像人工神经网络一样,计算机视觉技术工程师也在试图模仿人类视觉系统的运作机制。但是机器比人更有优势的一处是,它不需要像人类那样依赖可见光,还能使用传感器更清楚地看到世界。

“在人脸识别、图像分类等众多任务中,计算机视觉能比人类视觉完成的更优秀。但在其他需要推理的任务,计算机视觉还有很长的路要走。”贾佳亚表示,“人类能轻易明白物体彼此之间的关联,我们看到一张图就能编出一个故事。但计算机还远不能达到这种程度的理解能力和想象力。”

随着计算机视觉技术的不断发展,它将会带来更多新的发现。计算机视觉和 AI 都还有很多东西值得探索。计算机视觉技术的进步可能会推动AI 的迅猛发展,把科幻小说的情节全部变成现实——比如无人车、机器人管家,甚至远距离太空旅行。

随着 AI 扩展到更多领域并发展出新功能,它可能会遇到新的技术难题。但是,当我们回顾 AI 的历史时,给计算机提供视觉的能力可能是最重要的一项进步。拥有视力的机器将带领我们走向更光明的未来。

文章来源: SF 中文,极目新闻,自然解说甲,数据派THU

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:智造趣闻录
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...