长期保存是几年,保存的时间长

聚客2022-05-29  35

dna保存多久(dna保存时间多久)

如今,在大数据洗礼的时代,弄清楚如何以低成本的方式存储数据已经成为一个越来越重要的核心问题。也许最奇怪的解决方案是最好的答案:在DNA分子中储存信息。

目前,流行的长期冷藏方法可以追溯到20世纪50年代,当时人们会将数据写入披萨大小的磁带卷中。相比之下,DNA存储可能更便宜、更节能、更耐用。研究表明,用盐密封的DNA可以在室温下稳定储存几十年,如果在数据中心的受控环境中,应该可以储存更长时间。另外,DNA本身不需要维护,DNA中的文件容易复制,存储成本几乎可以忽略不计。

更好的是,DNA可以在一个几乎不可思议的口袋里储存惊人数量的信息空。让我们展望未来:到2025年,预计人类将拥有33千兆字节的数据——即33后跟21个0。DNA存储可以把这些信息全部存储在一个乒乓球大小的空间里,甚至还有很大的空间空。美国国会图书馆总共7400万字节的信息,可以塞进一个小小的芝麻,也就是乒乓球体积的千分之一。只有半个芝麻可以存储脸书的所有数据。

听起来像科幻?不会的。DNA存储技术目前已经存在,但要完全实现,研究人员还需要克服技术集成中的各种困难。为了完成这项意义重大的工作,洛斯阿拉莫斯国家实验室的团队开发了一项分子存储的关键技术,支持软件可以使用自适应DNA存储规范(ADS Codex)将数据文件从计算机中的二进制形式翻译成具有生物学意义的四字母代码。

ADS Codex也是智能高级研究计划局(IARPA)分子信息存储(MIST)项目的关键组成部分。MIST希望为政府和私营部门的大数据运营提供更低成本、更大规模和更持久的存储解决方案。目前的短期发展目标是实现24小时内写入1 TB(1万亿字节)、读取10 TB数据的性能,成本控制在1000美元。

从计算机代码到因子代码

提到DNA,大多数人首先想到的是生命的蓝图——与计算机无关。但DNA本身其实是一个四个字母的代码,用来传递生物的各种信息。DNA由四个碱基或核苷酸组成,每个碱基或核苷酸由一个字母标记,分别是腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶(C)。这些是所有DNA密码的基础,指导着地球上所有生物的繁殖和生长。

DNA合成是一项成熟的技术,广泛应用于医学、制药、生物燃料开发等领域。该技术的本质是将碱基组织成由A、C、G和t的特定序列所指示的不同排列,这些碱基形成相互缠绕的扭曲链(即双螺旋)结构的分子。字母本身的顺序也建立了一个编码系统,可以用来指导生物的生长发育。

一套完整的DNA分子将构成基因组,这是身体生长的蓝图。通过从零开始合成DNA分子,研究人员发现他们可以写出一长串字母A、C、G和T,并随时读取序列信息。整个过程类似于二进制信息在计算机中的存储方式,只是这次我们需要将二进制计算机文件编码成四字母生物分子的形式。

这种方法已经被证明是有效的,但是读写DNA编码文件需要很长时间。给DNA添加一个碱基大约需要一秒钟,以这个速度写一个档案可能需要几十年。但研究人员正在开发更快的方法,包括一次写入多个分子和进行大规模并发操作。

在转换过程中没有数据丢失

ADS Codex准确地解释了如何将0和1转录成四个字母A、C、G和t的组合序列。Codex还可以将该序列解码回二进制形式。DNA可以通过许多方法合成,ADS Codex已经将这些合成方法标准化。

不幸的是,与传统的数字系统相比,使用DNA合成的分子书写的错误率非常高。这些错误的来源与数字书写完全不同,因此更难纠正。在数字硬盘上,误写0到1意味着出错,反之亦然。但是对于DNA来说,问题主要来自于插入和删除错误。比如我们可能想写A-C-G-T,实际上A写不正常,于是整个字母序列左移,变成C-G-T,当然也有可能写一次,直接形成A-A-A。

常规的纠错码不能很好的解决这类问题,所以ADS Codex增加了一个检错码来验证数据。当软件将数据转换回十进制时,它还会测试代码是否匹配。如果没有匹配,碱基(字母)将被删除或添加,直到验证成功。

[S2/]前景很有希望

目前ADS Codex的1.0版本已经完成,计划在今年年底用于评估其他MIST团队开发的存储和检索系统。这项工作也与洛斯阿拉莫斯国家实验室在计算领域的历史使命和探索精神高度一致。自20世纪40年代以来,我们一直在研究计算技术,并积累了下一批最古老和最大的纯数字数据资产。今天,这些资产仍然有相当大的价值。我们会永远保留这些数据,希望能为他们找到最理想的冷藏方案。

最终每个用户的数码照片和推文,全球财务部门Baxter的所有记录。关于农业、设施、冰川融化的卫星图像,现代科学背后的所有模拟系统和其他数据最终都会回家。如今,我们熟悉的“云”并不是高高在上的天空,而是消耗大量电力来存储这些万亿字节的巨大数据中心。这些数据中心的建设、供电和运营成本数十亿美元,但随着数据存储需求的指数级增长,我们很难无限支撑这样的基础设施规模。

也许DNA是数据存储的终极解决方案。诚然,这项技术需要新的工具和新的方式来使用它,但如果有一天世界上最有价值的信息可以存储在一个微小的芝麻中,请不要太惊讶。

本文地址:http://www.diemang.com/post/23265.html

转载请注明原文地址:https://juke.outofmemory.cn/read/192254.html

最新回复(0)