Hinton五年前预测失算,Google在Nature发文:AI只能当放射科医生的助理

1793 字丨阅读本文需 7 分钟

来源:nature

你会信任AI 医生给你的诊断吗?

2016 年,深度学习先驱 Geoffrey Hinton 曾放出豪言,我认为如果你是一名放射科医生,你就像一只已经越过悬崖边缘但还没有往下看的土狼,它还没有意识到他的下面并不是地面。

人们现在应该停止培训放射科医生。很明显,在五年内,深度学习将比放射科医生做得更好,因为它会获得更多经验,或者可能需要十年,但我们现在已经有很多放射科医生了。

但五年后的今天,人工智能并没有让放射科医生失业。事实上,尽管放射科医师的数量有所增加,但全球放射科医师仍然严重短缺,因为放射科医生的工作不仅仅是查看 X 射线扫描。

最近Google 在 Nature 上发表了一篇论文,描述了一个深度学习系统,可以帮助放射科医生确定胸部x光检查的优先顺序,它还可以在没有经验丰富的放射科医生的情况下,作为急救环境中的优先考虑使用的工具。

不过研究结果表明,虽然深度学习还不能取代放射科医生,但在COVID-19还在世界范围流行的今天,医学专家严重短缺的情况下,深度学习将有助于提高放射科医生的工作效率。

以后也就是说有一个24小时工作,经验丰富,但只收电费的助理医生来帮你看胸片了,距离Hinton 设想的世界越来越近了。

该论文还展示了 AI 研究社区在构建可以降低深度学习模型风险的流程和创建可以在未来进一步构建的工作方面取得的进展。

Google 的深度学习模型虽然成功地检测到异常 X 射线拍摄的胸片,其准确度可与人类放射科医生相媲美,在某些情况下甚至优于人类放射科医生。但它还无法作为一个单独的医生来进行诊断,该系统的真正好处在于它用于提高放射科医生的工作效率。

为了评估深度学习系统的效率,研究人员在两个模拟场景中对其进行了测试,该模型通过帮助放射科医生确定异常扫描的优先级或排除发现正常的扫描来帮助放射科医生。在这两种情况下,深度学习和放射科医生的结合都显着改善了周转时间。

无论是部署在相对健康的门诊实践中,还是部署在异常繁忙的住院或门诊环境中,这样的系统都可以帮助优先处理异常 CXR,可以让放射科医生有更多的时间做更难的事。

胸片 (CXR) 是最广泛使用的胸部临床成像方式,对于指导心胸疾病的管理至关重要。特定 CXR 检测一直是AI 系统的主要关注点。人工智能驱动的医学影像分析正在取得的进步,现在已经有数十种医学成像深度学习系统已获得 FDA 和全球其他监管机构的正式批准。

但是这些模型中的大多数的问题在于,它们已经针对非常狭窄的任务进行了训练,例如在 X 射线图像中寻找特定疾病和状况的痕迹。因此,它们仅在放射科医生知道要寻找什么的情况下才有用

但放射科医生不一定会从寻找特定疾病开始, 建立一个可以检测所有可能疾病的系统是极其困难的,并且CXR 异常情况数不胜数的情况下,通过构建多个单独的系统来检测所有可能的情况也是不切实际的。

Google 的解决方案是创建一个深度学习系统来检测胸部扫描是否正常或包含临床可操作的结果。定义深度学习系统的问题是在特异性和普遍性之间找到平衡的一种方法。

特异性是指深度学习模型可以执行非常具体的任务,如检测肺炎或骨折,但代价是不能推广到其他任务,例如检测结核病。另一方面,通用性可以让系统回答更一般的问题,例如此 X 射线扫描是否正常或是否需要进一步检查的问题,但无法解决更具体的、特定的问题。

数据对于深度模型来说是至关重要的。深度学习工程师经常面临的挑战是,他们的模型会发现隐藏在训练数据中的错误偏差。

例如,在一个案例中,用于皮肤癌检测的深度学习系统错误地学会了检测皮肤上标尺标记的存在。在其他情况下,模型可能会对不相关的因素变得敏感,例如用于捕获图像的设备品牌可能在模型看来是很重要的特征。更重要的是,经过训练的模型可以在不同人群中保持其准确性,这一点很重要。

为了确保有问题的偏见不会蔓延到模型中,研究人员使用了6 个独立的数据集进行训练和测试。深度学习模型接受了来自印度5 家医院的248,445 名患者的匿名化(de-identified)的 X 射线扫描作为训练。根据从结果报告中提取的信息,这些示例被标记为正常或异常进行分类。

然后使用从印度、中国和美国的医院获得的新胸部 X 光片作为测试集对该模型进行评估,以确保其推广到不同地区的人。测试数据还包含训练数据集 TB 和 Covid-19 中未包含的两种疾病的 X 射线扫描,以检查模型对未知疾病的表现。

数据集中标签的准确性由三位放射科医生独立审查和确认。研究人员已公开这些标签,以帮助未来对放射学的深度学习模型进行研究。

结果表明,使用包含各种 CXR 异常的大型数据集训练的 AI 系统概括为 新的患者群体和未见的疾病。在 AI 系统优先处理异常案例的模拟工作流程中,异常案例的周转时间减少了 7-28%。这些结果代表了在评估 AI 是否可以安全地用于标记存在以前未发现的异常的一般环境中的案例方面迈出的重要一步。

参考资料:

https://venturebeat.com/2021/09/16/googles-new-deep-learning-system-can-give-a-boost-to-radiologists/

本文来自微信公众号“新智元”(ID:AI_era),编辑:LRS,36氪经授权发布。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:新智元
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...