数据存储的未来是“双螺旋”的:DNA将成为存储音频、视频等资料的最佳“仓库”

科技少年QAQ 2022-03-04

双螺旋数据存储dna

1332 字丨阅读本文需 3 分钟

想象一下,巴赫的“第一大提琴组曲”是在 DNA 链上演奏的。

这种情况并不像看起来那样不可能。DNA 太小,无法承受有节奏的弹奏,但它是存储音频文件和各种其他媒体资料的最佳“仓库”。

双链 DNA 片段。图片来源:Vcpmartin/维基媒体/CC BY-SA 4.0

“DNA 是大自然的原始数据存储系统。我们可以用它来存储任何类型的数据:图像、视频、音乐——任何东西,”贝克曼先进科学与技术研究所的研究员、《科学》杂志的合著者 Kasra Tabataei 说。

扩展 DNA 的分子构成并开发一种精确的新测序方法,使一个多机构团队能够将双螺旋转变为一个强大、可持续的数据存储平台。

在数字信息时代,任何敢于浏览每日新闻的人都会感到全球档案与日俱增。纸质文件越来越多地被数字化以节省空间并保护信息免受自然灾害的影响。

从科学家到社交媒体影响者,任何需要存储信息的人都可以从安全、可持续的数据锁箱中受益——而双螺旋结构符合要求。

伊利诺伊大学厄巴纳-香槟分校的研究生、本研究的合著者潘超说:“DNA 是存储档案数据的最佳选择之一,如果不是最佳选择的话。”

它的寿命只能与耐用性相媲美,DNA 旨在抵御地球最恶劣的条件——有时长达数万年——并且仍然是一个可行的数据源。科学家们可以对化石链进行测序,以揭示遗传历史,并为失落已久的景观注入生命。

尽管身材矮小,但 DNA 有点像臭名昭著的警察局医生:内部比看起来要大。

“每天,互联网上都会产生数 PB 的数据。只有一克 DNA 就足以存储这些数据。这就是 DNA 作为存储介质的密集程度,”五年级博士生 Tabatabaei 说。

DNA 的另一个重要方面是它的自然丰度和近乎无限的可再生性,这是当今市场上最先进的数据存储系统所不具备的特性:硅微芯片,它通常在被随意埋葬在垃圾填埋场之前仅循环数十年。

“在我们面临前所未有的气候挑战之际,可持续存储技术的重要性不容小觑。新的绿色 DNA 记录技术正在出现,这将使分子存储在未来变得更加重要,”富兰克林大学的 Olgica Milenkovic 说。

展望数据存储的未来,跨学科团队研究了 DNA 已有千年历史的 MO。然后,研究人员添加了他们自己的 21 世纪转折。

在自然界中,每条 DNA 链都包含四种化学物质——腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶——通常用首字母 A、G、C 和 T 表示。它们沿着双螺旋排列和重新排列成科学家可以解码的组合,或序列,以产生意义。

研究人员通过在现有的四字母序列中添加七个合成核碱基,扩展了 DNA 已经广泛的信息存储容量。

“想象一下英文字母表。如果你只有四个字母可以使用,你只能创造这么多的单词。如果你有完整的字母表,你可以产生无限的单词组合,DNA 也是如此。而不是将 0 和 1 转换为A、G、C 和 T,我们可以将零和一转换为 A、G、C、T 以及存储字母表中的七个新字母,”Tabatabaei 说。

因为这个团队是第一个使用化学修饰的核苷酸在 DNA 中存储信息的团队,成员们围绕一个独特的挑战进行了创新:并非所有当前的技术都能够解释化学修饰的 DNA 链。为了解决这个问题,他们将机器学习和人工智能相结合,开发了一种首创的 DNA 序列读出处理方法。

他们的解决方案可以将改性化学物质与天然化学物质区分开来,并将七种新分子中的每一种都区分开来。

我们尝试了 11 种核苷酸的 77 种不同组合,我们的方法能够完美区分每一种,”潘说:“作为我们识别不同核苷酸方法的一部分,深度学习框架是通用的,这使得我们的方法能够推广到许多其他应用。”

这种字母完美的翻译来自纳米孔:中间有一个开口的蛋白质,DNA 链可以很容易地穿过。值得注意的是,研究小组发现纳米孔可以检测和区分 DNA 链上的每个单体单元——无论这些单元是天然的还是化学的。

“这项工作为将大分子数据存储扩展到非天然化学物质提供了令人兴奋的原理验证演示,这有可能大幅提高非传统存储介质的存储密度,”詹姆斯经济材料教授查尔斯施罗德说。

DNA通过存储遗传信息创造了历史。从这项研究来看,数据存储的未来也是双螺旋的。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:科技少年QAQ
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...