谷歌用AI预测人类生命变化!AI+基因检测癌症检测技术哪家强?

5252 字丨阅读本文需 15 分钟

知情郎·眼|

侃透天下专利事儿

几天前,美国人工智能圈又发生了大事儿。

据说,谷歌最新人工智能AlphaFold,创造了新的奇迹。

它成功根据氨基酸序列预测了生命基本分子——蛋白质的三维结构。


关键是,AlphaFold用时少,利用实验室手段可能需要数年的研究才能解析一个蛋白质结构,利用计算结构模型最快只需10分钟。

谷歌在算法领域走的真远,当年用AI算寿命、算人死亡时间,现在来预测微观蛋白质结构如何变化了。

01蛋白质三维结构是啥玩意儿?

很多人可能并不明白蛋白质的三维结构是什么意思,有什么意义?

知情郎先简单科普下。

行业人士的观点就是,蛋白质是组成生命体的重要物质基础。不同的蛋白质通过折叠形成不同的三维结构,执行多种多样的生理功能。癌症、痴呆等几乎所有疾病,都与细胞内蛋白质结构变化相关,如果能够掌握蛋白质结构的变化,将对疾病的预防、治疗等带来重要影响。

从氨基酸序列到对应蛋白质三维结构的预测问题被认为是生物学领域最具有挑战性的问题之一。

在过去几十年的研究中,科学家们为探测蛋白质结构发展出三大实验手段:X射线晶体学、核磁共振和冷冻电镜。但实验方法成本高、周期长。

目前人类已知有数十亿氨基酸序列,但还原出结构的只有十几万。生物学发展因此颇受掣肘。

一句话总结就是,人类之所以会生病,因为你分子状态的蛋白质结构起了变化。

现在人工智能已经可以预测这玩意儿如何变化了。


02谷歌的算法有多牛?

不可阻挡!

谷歌AlphaFold,和打败围棋高手的AlphaGo,都是谷歌流水线下的兄弟产物。

只不过,后者是下国际围棋的,而前者,则是将其人工智能转向了人类科学中最棘手的领域——基因医疗科学!

两年前,上一版本的AlphaFold便已经取得了里程碑的突破,但是,仍然没有完全解决蛋白质折叠问题。这次AlphaFold 2,直接斩获92.4的准确性高分,其误差基本不超过一个原子的大小。

正如如此,这一巨大的突破,直接引爆了全网,李飞飞、马斯克等大佬纷纷点赞。

挑战赛评委之一的进化生物学家Andrei Lupas表示,“这将改变医学,这将改变研究,这将改变生物工程,这将改变所有一切。”

《自然》杂志的话,更是直接了当:“这将改变一切!”

     

知情郎查了下谷歌在人工智能与基因检测方面的美国发明专利。

从技术角度而言,把人工智能应用于基因科学,把海量的运算交给AI,这是一种检测人类本身疾病隐患最省成本的做法。

其实大家也明了,现代医生看病,也只是根据患者做一次全身检查后的血液、血压、拍片等各方面数据汇总整合后,来确定患者的治疗方法。

其实,这个确诊的过程,无非是通过患者本身的大数据整合、依靠特征算法判定,最终确定所患病,再给出确诊后的治疗方案。

这种极度依赖人体海量数据确诊的工作方式,人工智能完全可以代替传统医生来看病。

03人工智能如何替代人类医生

从海外科研机构公开的信息来看,人工智能与基因检测大规模应用要经历数个步骤:

1、第一步:人工智能、基因检测和深度检查结合,成千上万人将在患病之前接受深度检查,由人工智能给出你的生命预测。

人工智能,正让这种深度检查价格迅速下降:刚刚完成人类基因图谱时,个人基因组测序成本介于1000万至5000万美元之间。2010年,这一成本已下降到5000美元。而今,私营机构的检测成本已低至数百美元。

随着人工智能的强势介入,这一价格还将持续下降。今后,人类做一次检测,或将和用体温计量一次体温一样便捷。

或许在数年之内,每个新生儿都会被绘制基因组图,每个成年人都通晓生命出路。

2、第二步:人工智能医生将逐渐取代目前最优秀的医生,用基因治疗的方法,重塑体内一切组织和器官的活性。

在这一阶段,大批医生将逐渐消失,由读过无数人类病历的人工智能医生替代。从此,医疗彻底成为一项信息+基因的科技。

依靠人工智能和基因技术,我们将能重塑体内一切组织和器官的活性,并能够开发出药物,直接锁定一种疾病背后的代谢流程,而不必再采取试探性的治疗手法。

我们可以为病人添加那个缺少的基因,删除不好的基因。靶向药扫荡癌细胞,DNA编程逆转衰老,干细胞被改写,上帝的密码防线逐渐崩溃。

3、第三步:人工智能开始大规模改造人类体内的“生命软件”,即人体内被称为基因的23000个“小程序”,通过重新编程,帮助人类远离疾病和衰老。

库兹韦尔认为,到了2045年,人工智能的创造力将达到巅峰,超过今天所有人类智能总和的10亿倍。到了那时,人类将彻底改造基因的编程,我们上千年不再使用的陈旧基因将被抛弃,我们的生命升级成为一个更高级的操作系统。

在这一阶段,人类不仅能做到延缓衰老,更可以返老还童:到那时,八十岁的你,看上去只有四十岁的样子。

04人类的担心?

基因科学领域,大家的担心是,也许人类会设计没有基因缺陷的个体,原本以人类的计算能力是做不到,但通过人工智能就有可能。

如果有人设计不断自我完善、直到最终超越人类的人工智能,最终会解译出所有的基因片段。

下面又回到了科幻片中老话题了。

为了爱美,人人去整容。

这只是肢体上的外部整形,如果能从基因层面改变个体性状,

有钱人在未来有机会花钱变动子女的DNA,从而创造出有更好基“超级人类”。

相信所有富豪都会乐意试验。

毕竟,延寿、提高生活快感是生命始终的追求。

一旦有机会变成“超级人类”,相比普通人类将提高智力和寿命,甚至对疾病的抵抗力都会增强。

人人都急着做改善基因的新人类。

然后世界就成了2个系统,改造基因的新人类和没改造基因的旧人类撕逼大战!

05基于人工智能的基因检测专利哪家强?

聊完事件,下面聊人工智能、基因检测方面的专利哪家强话题。

看看中美到底哪些玩家技术储备深!

在德高行全球专利数据库中,以关键词基因检测技术(主要是算法技术)为关键词进行检索,非企业高校科研机构专利申请人排名如下:

浙江工业大学在国内排第一,出乎人意料。

关于基因技术的专利,知情郎浏览了下浙工大在这方面的专利情况,大部分围绕人工智能在基因特征提取方法、基因表达式编程方法、各类基因工程菌构建及培养方法、肿瘤特征基因提取方法、CRISPR/Cas9的酵母基因组编辑方法等。

看来,浙工大深藏不露!

在德高行全球专利数据库中,以关键词基因检测技术(主要是算法技术)为关键词进行检索,企业机构专利申请人排名如下:

企业领域,至本医疗科技(上海)有限公司排名第一,也挺出乎意料之外,知情郎一直以为这领域华大基因是扛把子!

不过华大基因子公司众多,专利也分布在不同子公司,统计起来计算比较麻烦。

至本医疗是家什么公司?

公司官网的信息称,公司是一家以领先测序技术为基础、以真实世界大数据为驱动的肿瘤精准医疗公司,致力于为每个患者提供全面准确的分子诊断解决方案,将其与相关的靶向治疗、免疫治疗以及临床试验相匹配,并为制药企业提供“一站式”定制化解决方案,推动中国癌症临床治疗方式的革新。

至本医疗拥有国际标准的CAP、CLIA双认证实验室和丰富的肿瘤精准诊断产品管线,是中国首家推出DNA+RNA检测的精准医疗公司,业务范围已覆盖中国500多家医院和科研机构。

简单看了下这家公司的专利布局,核心专利围绕各类癌症的预测和检测!这公司前景远大,毕竟如何预测检测癌症是绝大多数用户的刚需。

比如,结肠癌预后评估基因集及其构建方法、预测肺腺癌患者对免疫疗法敏感性的生物标志物、用于实体瘤靶向用药指导的多基因富集和检测、用于预测肝癌预后的评估基因集及试剂盒方法等。

好了,下面就是读基因检测经典专利环节,知情郎选谷歌和至本医疗这两家公司的专利!

06谷歌经典算法专利

技术背景介绍

过去十年来,DNA测序技术的快速改进已经产生了丰富的分子信息。

虽然读取基因组的能力已经彻底改变了生物学研究,但大量的表型和疾病状态信息还不能从基因组中推断出来。

RNA测序提供了一个更深层次的理解基因组的功能元素和他们的表达水平,然而,重大挑战仍然围绕努力关联蛋白质mRNA表达水平(苏阿,佩纳尔瓦,马科特,&沃格尔,2009)(沃格尔&马科特,2012),导致无法精确定量蛋白质,会让其中信息丢失。

细胞的状态难以预测。当评估血清中的蛋白质时,RNA分析不能预测蛋白质的存在,因为蛋白质可以从细胞排出并在整个血液系统中循环,导致RNA序列与其翻译靶点之间失去空间联系。

此外,蛋白质测序可以揭示许多未知的东西,即宿主血液中其他生物体(如病毒、细菌等)并影响宿主。


RNA和DNA测序对抗体序列的了解有限,因为抗体重复序列的多样性是由体细胞高突变事件产生的。

为了捕获DNA加工和分泌后发生的信息,如翻译后蛋白质修饰、翻译保真度、蛋白质折叠完整性。

科学家必须能够测序proteins(i.e.read的氨基酸序列)直接从感兴趣的样本中推断proteins(i.e.read水平及其酶效应之间的相关性。

从头蛋白质测序可以导致从任何生物体(如各种组织、病原体、突变的癌细胞)和任何含有蛋白质的sample(e.g.blood、皮肤、脑脊液.土壤)中发现罕见和新的蛋白质。

蛋白质测序也可以作为治疗疗效的指标,允许在疾病治疗过程中进行广泛的生理监测。

然而,目前还没有成本和时间有效的战略跨越整个蛋白质表达动态范围的蛋白质和蛋白质组的大规模和高通量测序。

也没有一种可靠的方法来对非靶向的低表达蛋白进行测序。

因此,抗体和低表达蛋白的测序仍然面临着使用当前技术的障碍,除了最专业的研究工作外,所有人几乎都无法获得。


本公开描述了形成开发和使用蛋白质测序平台的管道的方法和组合物的集合,该平台利用与n端氨基酸专门结合的适配体。

氨基酸特异性适配体可以使用本文描述的新方法生成(RCIT-SELEX)。

氨基酸适体可用于识别、识别和转换每个氨基酸的蛋白质或肽的DNA序列(PROSEQ)或等氨基酸适体可用于识别和识别,基于视觉信号,每个氨基酸的蛋白质或肽(PROSEQ-VIS)。

此外,还有一些问题。可以同时生成许多不同的目标特异性适配体,并用于生产和筛选大量的粘合剂(MUL-TIPLEX)。

同时和特异性的适配体选择依赖于目标的稳健识别。

核酸条形码靶标的生成可以在体内通过肽或蛋白质之间的非共价键,使用rna结合蛋白及其相应的识别序列(周转率)来完成。

最后,成功的SELEX实验要求将10个4-10个15个候选序列的适配体包含在原始的候选序列中,这只是所有可能的DNA序列的一小部分。

机器捆绑(ML)可以帮助优化实验种子粘合剂,因此,与传统的SELEX实验不同,最佳粘合剂不需要出现在实验数据集中。

使用受控输入池构建相互衍生的、可定制的DNA文库的能力,可以通过系统分析包含已知结合倾向的序列(乐高)的候选适配体,显著增加探索空间。


在一个方面,提供了获得对靶标具有亲和力和特异性的适配体的方法。

这种方法通常包括

(a)提供多个适配体;

(b)对多个适配体进行负选择;

(c)可选地,向多个适配体加入控制寡核苷酸;

(d)可选地,放大多个适配体;

(e)在允许多个适配体与多个潜在目标结合的条件下孵化多个适配体;

(f)可选地,在允许多个适配体与至少一个结合的条件下,将多个适配体与至少一个零目标孵育多个适配体。

(g)去除未结合的适配体;

(h)测序目标结合的适配体;

(i)多次重复步骤(a)-(h),

从而获得对目标具有亲和力和特异性的适配体。

在一些实施例中,多个潜在靶点是多肽、氨基酸、核酸、小分子、整个蛋白质或蛋白质复合物,或细胞。

在一些实施例中,放大多个适配体步骤遵循单个提升步骤或双提升步骤。

下面都是具体的实操细节,知情郎就不复述展开了,有兴趣的自行下载专利PDF,由于是全英文版,且是生物医药最前沿的基因技术,大量专业术语,非行业人大概看了像天书般,此间翻译也是机器翻译,若不准确,多海涵!

07至本医疗癌症检测专家?

再看至本医疗科技的基因检测专利,这家公司专利做癌症检测,尤其针对性的做肝癌、肺癌、结肠癌、胃癌等。

背景技术介绍

肿瘤作为不可治愈的疾病,治疗目标非常明确,自肿瘤被诊断之后,通过治疗让患者活得更久。肝癌是我国最常见的癌症类型之一,发病率和病死率均较高。治疗一般采取手术、放化疗和中药结合疗法。

一直以来,肝癌的复发率和不良结局率仍然很高,5年无复发生存率和总生存率较低

目前临床上已有的预后评价指标如甲胎蛋白水平、TNM分期等不能满足全面反映肿瘤特征和准确判断患者生存风险的要求。

因此,迫切需要可靠的预后指标来建立可靠的预后模型,并做出准确的生存预测,并结合相应的分子特征进行针对性的治疗干预。

在早期临床应用中,如何为医生和患者提供肝癌预后预测信息,是亟待解决的问题,有助于制定个体化的治疗方案,对于改善患者术后生存、实现肝癌精准治疗具有重要的临床意义。

肿瘤细胞活性和肿瘤微环境中的免疫细胞都参与了肿瘤的发生和发展,因此,肿瘤免疫学应引起重视。肿瘤浸润免疫细胞是宿主免疫应答的关键细胞成分,是肿瘤微环境的重要成员。许多研究证实,肿瘤浸润免疫细胞与多种癌症的治疗反应和预后有关。

用特征基因集表达值评价患者预后的优势在于客观,不存在研究者的主观偏倚。不足之处在于观测时间较长,需要记录所有事件的发生,即所有患者的死亡。已发表的免疫相关基因的标志物,通常仅涉及单个免疫基因或少数免疫细胞。但机体内免疫反应的发生涉及多种免疫细胞的参与,单个免疫基因或少数免疫细胞对于预后的评估并不完整。因此,仍需要更准确、更高效的、能够预测癌症患者预后情况的模型。

发明内容

本发明基于TCGA肝细胞肝癌样本,将样本随机分为训练集和测试集,结合基因表达值数据,通过对免疫相关基因进行筛选,挑选出能根据基因表达值,预测肝细胞肝癌预后的评估基因集。

本发明涉及一种用于预测肝癌患者预后的评估基因集,所述评估基因集包括62个基因。

这个专利核心就是算法的价值!

如何预测肝癌患者以及后续医疗状态的方法,其包括以下的步骤:

a)样本收集与数据检测:收集所述患者的样本,测定其在表1中的评估基因集中的62个基因的表达值;

b)风险评分计算:计算肝癌患者在评估基因集的62个基因的总表达值,即风险评分(Risk Score);所述风险评分计算公式下:

其中Ei为各基因表达值,Coefi为各基因的权重系数,n为特征基因集中基因个数,即62;

c)预测结果,根据计算得到的肝癌患者的风险评分来预测患者的预后情况:患者的风险评分越低,则预后越好;将风险评分与界定值比较,若高于界定值,则预测其预后不佳,若低于界定值,则预测其预后较好。

在一些实施方案中,所述界定值为约4.14。

在一些实施方案中,所述患者样本来自所述患者的组织,包括肿瘤组织,所述肿瘤组织为原发灶或转移灶。

本发明为了准确预测肝癌患者的预后风险,确定了62个免疫相关基因来预测肝癌预后情况,可将肝癌患者的高风险组和低风险组有效区分,能够开发为潜在的体外诊断产品,以预测对肝癌患者预后情况进行检测,从而预防性用药或治疗,为肝癌患者预后的进一步辅助治疗提供了精准的判断依据。


免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:德高行知情郎
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...