DNA居然可以储存数据!华大团队研发全新“DNA硬盘”

电子放大镜 2022-04-27

dna硬盘大数据硬盘存储

1785 字丨阅读本文需 5 分钟

4月25日,《自然-计算科学》发表一项来自深圳的最新成果,该研究开创了一套独具优势的“阴阳”编解码系统,用以解决当前DNA信息存储领域的技术难题。研究由深圳华大生命科学研究院主导,深圳国家基因库、首都师范大学、美国哈佛大学等多个研究团队共同参与。

DNA存储技术是一项面向未来的 具有里程碑意义的存储技术,它利用人工合成的DNA作为存储介质,具有速度快、存储量大、存储时间长、易获取且免维护的优点。

一、DNA存储信息,“阴阳”编解码系统

所有信息在计算机中由二进制的方式存储,即0和1两个数码;而储存在DNA中的生物遗传信息,则储存在DNA中,以A、T、G、C四种碱基表现。“如果把信息语言的0和1,转换为生物语言的ATGC,DNA就有望成为‘完美’存储器了。”该负责人说。

2017年,科学家引进信息通信领域的编码方法——喷泉码,以条件过滤的方式筛选DNA序列,唯有满足筛选条件方可进行最终生成,基于此实现了对生物技术的兼容。

“DNA的双链模型,是否能如‘阴阳’一样对立、统一和互化?”基于此,研究团队开创了一套名为“阴阳”的比特-碱基编解码系统,验证了该系统在信息密度、技术兼容性、数据恢复稳定性等多方面的优势。

“我们以两套不同的规则,分别对两条二进制信息进行‘一对一’编译转换,再取两者统一交集的部分为最终解,实现将两条独立的信息组合统一为一串DNA序列。”华大相关负责人表示。

据悉,目前常用的保存方法分为体内和体外两种模式,两者孰优孰劣尚未形成明确定论。为了全方位验证“阴阳”系统的信息恢复稳定性,华大研究院团队通过体外DNA干粉和细胞体内大片段两种存储环境进行测试,皆实现了原始存储数据的完整恢复。

一方面,研究团队采用不同浓度的原始DNA文库溶液,进行了共200多组测试。结果证明,“阴阳”编码采用的线性数据恢复模式,在每种DNA分子的平均拷贝数仅有100时,仍然能恢复最高88%的原始数据。而同样条件下,DNA喷泉码使用的编码方式,平均恢复率仅有1.3%。

另一方面,团队还将信息存在了酵母活细胞的体内,酵母菌株经过1000代以上传代之后,信息仍可以被完美恢复。“这在一定程度上意味着,利用活体细胞作为DNA存储的载体,上千年后原始信息或仍能被解读,”华大表示,“这样一来,每克DNA能存储的信息量约为432.2 EB,接近于天然DNA分子存储理论极限的物理信息密度。”

二、存储信息的DNA的获取有三种方式

DNA的研究鲜为人知的一面,便是 利用DNA储存数据。传统储存主要包括 机械硬盘,SSD固态硬盘,和DVD光盘,但这些储存最大寿命也就几十年,而DNA储存技术至少可以保存500年。

并且相对于传统的电子储存技术,DNA的数据储存密度更大,研究发现,仅需十克的DNA就可以存储相当于大约3000万张光盘的数据,那么人类要想储存地球上所有的数据信息,仅需要不到20克的DNA就ok了!但这种DNA的获取不能通过生物组织,而必须通过人造的方式获取。

存储信息的DNA的获取有三种方式:逆向转录法、细胞基因分离法、人工化学合成法。前两种 合成速度和生物体一样慢,而且耗财耗力,根本就是不可取的。只有第三种方法是目前认可的 准确率最高 速度最快的方法,可以根据不同的要求,规划基因序列。不同的基因序列就代表着不同的信息,这也是DNA存储技术的原理所在!

三、DNA存储技术面临哪些挑战?

在全球数据信息总量呈指数级增长的背景下,DNA存储技术开始在不同领域探索应用。因其存储优越性,DNA 存储技术也已引起多个国家和地区的重视。

美国是进行相关规划布局最多的国家,其涵盖了从数据“写入”到“读取”的多个技术过程;欧盟虽未明确出台文件政策进行 DNA 存储技术布局,但也对相关研发进行了资助;日本、澳大利亚等国在合成生物学领域的重视程度也进一步提升;我国也已布局相关领域,我国“十四五”规划明确提出“加快布局量子计算、量子通信、神经芯片、DNA存储等前沿技术”。

企业也早已敏锐看到了这一领域的广阔前景。美国微软公司是最早研究DNA存储技术的公司之一,2016年微软宣布购买1000万条DNA用于研究数据储存。

2019年,华为宣布成立战略研究院,表示主要研发前沿技术,比如光计算、DNA存储及原子制造。在今年的华为全球分析师大会上,华为董事、战略研究院院长徐文伟表示将要借助DNA存储来突破超大存储空间模型和编码技术,打破容量墙。

对于DNA存储技术的应用场景,刘宏表示,DNA存储适合应用于有长期信息存储需求的地方,主要起到存储功能,不需要经常读取信息。

尽管DNA存储技术潜力巨大,但就其应用来看,依然面临挑战。

据了解,目前DNA存储技术还受到数据覆盖和重写、随机读写等方面的制约。“尤其是DNA合成的成本和效率,仍然是限制DNA存储技术发展的主要挑战。”刘宏表示。据业内分析师估计,目前DNA存储200MB数据,需要耗资80万美元。

“但相信经过技术的不断发展,成本会越来越低。” 刘宏说道。

虽然研究已经取得了重要进展,但刘宏认为这还只是一个初步成果。“为存储更多数据,下一步我们要做基于大规模电极阵列的数据存储。我们现走的只是第一步,用DNA做存储介质实际上还有很长的路要走。”刘宏说道。

文章来源:科普中国,读创网,乐讯要闻

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:电子放大镜
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...