加速病理研究、加快药物研发,AI是医学史上最强“外援”

圈圈圆圆圈圈 2023-09-20
2704 字丨阅读本文需 7 分钟

当地时间9月19日,国际顶刊《科学》(Science)刊发了来自谷歌DeepMind团队的论文,论文提出一种新的AI系统AlphaMissense——通过微调蛋白质预测模型AlphaFold,可以预测改变蛋白质单个氨基酸的错义突变的致病性。换句话说,这一AI工具可用于判别人类的基因突变是否会导致疾病,且可预测的范围比人类专家提升近千倍。

具体来说,AlphaMissense成功预测了19233个标准人类蛋白质的2.16亿种可能的单一氨基酸变化的致病性,得到了7100万个错义突变的预测,并将这7100万个可能性中的89%分类为可能致病或可能良性。相比之下,人类专家只能完成0.1%的识别。这意味着AI有望助力解决人类遗传学中的重大挑战。

AlphaMissense根据AlphaFold微调而来,而后者成功预测了来自100万个物种的约2亿种蛋白质结构,几乎涵盖了地球上所有已知的蛋白质。DeepMind于2022年7月开源发布了AlphaFold 2数据库,这使得研究人员确定蛋白质3D结构的时间可以按秒计算。

一直以来,AI for Science是科技巨头在AI领域的一大主战场,蛋白质结构预测又是其中重要领域之一。Meta曾于2022年11月推出150亿参数网络EMSFold,在预测结构方面比AlphaFold快60倍;清华大学智能产业研究院(AIR)研发的系统化蛋白质结构预测解决方案AIRFold,在蛋白质结构预测竞赛CAMEO上连续四周夺冠……AI在蛋白质预测领域的竞争可谓激烈。

目前,DeepMind宣布已将AlphaMissense的全部预测结果免费提供给科研界,并开源发布了模型代码。

成功预测89%的错义突变

比人类专家提升近千倍

在遗传学中,错义突变指的是由单个核苷酸点突变引起蛋白质一个氨基酸异化,是DNA序列一种非同义替换。错义突变可以使生成的蛋白质失去功能,从而导致疾病。

如果把DNA想象成一种语言,那么一个字母的转换就可以改变一个单词,并完全改变一个句子的意思。在这种情况下,置换会改变翻译的氨基酸,从而影响蛋白质的功能。

平均每个人身上都携带着9000多个错义突变。其中大多数是良性的,几乎没有影响,但也有一些是致病性的,会严重破坏蛋白质的功能。错义突变可用于罕见遗传病的诊断,少数甚至单个错义突变都可能直接导致疾病。它们对于研究复杂疾病也很重要,因为这种疾病可能是由多种不同类型的基因突变共同引起的。

因此,对错义突变进行分类是了解哪些蛋白质变化可能导致疾病的重要一步。在人类已经出现的400多万个错义突变中,目前只有2%被专家注释为致病或良性突变,约占所有7100万个可能的错义突变的0.1%。而其余的突变,由于缺乏有关其影响的实验或临床数据,则被认为是“意义不明的突变”。

而据论文介绍,AlphaMissense可以对7100万个可能性中的89%进行分类,其阈值在已知疾病突变数据库中的精确度达到了90%。在分类的89%中,有57%被预测为良性,剩下32%则可能是致病性的。这将极大提高遗传病的诊断预测率,并帮助发现新的致病基因。

AI加速了蛋白质研究进程

一说起蛋白质,很多人会联想到食物、身体的主要成分之一等。

“蛋白质,大自然最壮观的机器!”分子之心创始人,美国芝加哥大学丰田计算技术研究所教授,清华大学智能产业研究院(AIR)访问学者许锦波用这句话为他的主旨演讲《AI蛋白质技术最新进展》开头。“以血红蛋白为例,这是人体内负责运输氧气、排除二氧化碳的蛋白质。其结构的首位测定者获得1962年诺贝尔化学奖。”

科学家们为何如此热衷于测定蛋白质的结构?原来蛋白质测序可揭开成千上万种蛋白质的奥秘。以医学为例,在许多疾病中,细胞产生的蛋白质等物质可以充当类似于指纹的独特的生物标志物。检测这些生物标志物能够帮助研究人员了解疾病成因,提供更准确的诊断,甚至为寻找治疗方法提供新思路。

许锦波介绍,使用传统的生物实验解析法、传统计算生物测序法,耗时长、成本高、成功率低。AI的出现大大加速了蛋白质研究进程。2016年,他开发了第一个能大幅提升蛋白质结构预测精度的AI算法。之后的三四年,这一问题引发工业界的广泛关注和深度投入。2020年,大多数蛋白质结构预测的问题基本得到了解决。

AI预测蛋白质结构只是一个开始。

许锦波介绍,在制药、材料、农业、食品、环保等真实的产业应用中,AI蛋白生成技术将才是真正驱动多领域变革的新技术引擎。

例如,在药物设计方面,蛋白疗法可以覆盖很多小分子药物未能覆盖的疾病靶点。AI可助力新靶点的发现,缩短药物研发周期、提升成功率,并变革新药发现模式,从“试错式”升级为“可编程”“可预测”。

在高性能材料方面,AI生成的超越自然界的新蛋白质材料,可满足特定机械性能需求,同步解决环境保护和实现经济可持续发展等问题。

在食品保健方面,AI可以设计出更营养、更安全、更具风味的蛋白质,变革传统食品工业模式,智能化的食品工业更高效、低碳、优质,满足新时代的食品需求。

据介绍,“生成式”的AI蛋白质技术目前还在发展初期,无论是基础研究还是产业应用,都有很多难题亟待突破。幸运的是,随着生成式AI的广泛应用、生物制药产业发展、合成生物学的爆发,AI蛋白质生成技术发展已经具备了优质的生长土壤,未来几年有望迎来飞速发展。

AI:提高新药研发成功率

AI制药的发展是一个随着底层基础理论从“0”到“1”的发展过程,随着理论到实践的突破性应用,AI制药的发展经历 了几次“AlphaGo”般重大突破发展时期。AI制药的快速发展集中在2018伊始,国外以谷歌DeepMind,国内以英矽智能为 首的公司相继为业内熟知,2020年行业进入加速发展期,资本开始大量涌入赛道,催化公司发展,业内合作纷纷建立。 相较于传统的药物发现过程,AI赋能在临床前发现阶段缩短药物研发周期,根据Exscientia的数据,可平均节约药物合成 时间40~60%,降低研发成本,并提高研发成功率12%~14%。例如国内的AI制药龙头公司,英矽智能在临床前发现阶段 的靶点发现到先导化合物的优化,只需要约18个月完成,总体投入不超过270万美金,而这个过程过去往往需要五年甚至 更长,并需要投入数亿美金。

AI制药公司的商业模式可分为三类:1)软件供应商:提供算法进行软件产品授权,医药专业性较低,产品溢价低可快速 切入市场并创造营收,如OpenEye、Chemical Computing Group等计算机公司采取此模式;另外也有一些公司采取向软件 整合延申,提供“电脑内服务”如Atomwise等。2)AI+CRO:提供新药研发服务,集中在临床前靶点发现、先导化合物 发现,更加偏向CRO模式,临床前阶段进行向外授权,用一定新药研发风险换取较多上行空间收益,如Exscientia、Absci 等。3)AI+Biotech:自研新药研发并推进临床研究,偏向创新药企模式,专业性高,进入门槛高,可在临床一定阶段向 外授权或自主商业化,创造更高价值,如薛定谔、英矽智能、Relay Therapeutics、BenevolentAI、Cyclica等。

而采用多种商业模式,从软件授权到新药研发“端到端”AI赋能制药的公司,以薛定谔、英矽智能为代表。底层AI自主 的新药研发,随着临床管线的推进,AI赋能制药实际价值得以显现,切实加快药物研发,解决未满足临床需求。

医疗大模型赛道已经开跑

9月19日,百度发布了基于文心大模型的医疗大模型“灵医”,并宣布向大健康上下游产业开放邀测。

目前,灵医大模型推出Lite版、旗舰版、定制版三个版本,分别对应不同需求和应用场景,合作伙伴可通过API方式调用大模型能力,或以插件形式将大模型能力嵌入到已有产品系统中,打造AI原生的应用产品。

随着大模型持续在各个行业中落地,在办公、科研等领域之后,医疗也成为下一个大模型企业竞逐的赛道,在灵医发布之前,市场中已经存在不少医疗大模型。比如在国内市场中,商汤科技发布了医疗语言大模型、医疗影像大模型、生信大模型等多种垂类基础模型群;腾讯健康基于自研的混元通用大模型,打造了面向医疗行业的专属大模型等。而在国外市场,谷歌医疗大模型登上了Nature,号称水平媲美临床医生。

文章来源: 智东西,羊城派,未来智库,市界观察

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:圈圈圆圆圈圈
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...