微软,大学研究人员打破了DNA数据存储记录

2021-08-26 12:46:45来源:

微软和华盛顿大学(UW)的研究人员表示,他们通过将200MB的合成DNA股线上的数据存储了世界纪录。

研究人员表示,令人印象深刻的部分达到200MB里程碑,这不仅仅是他们能够编码合成DNA的数据,然后解码,他们也可以将其存放在困境中。

一旦编码,数据在测试管中占据了一个点“远小于铅笔尖端”,Microsoft在监督该项目的合作伙伴建筑师Douglas Carmean Douglas Carmean。

即使在恶劣的条件下,DNA储存也有500年的半衰期。DNA的半衰期 - 就像放射性物质一样 - 确定其衰减率或其股线粘合需要的一半以破裂。

但总的来说,这是一个巨大的前进。“想想压缩成几种糖立方体的大数据中心中的数据量。或者互联网上的所有公开访问数据都滑入了鞋盒。这是DNA存储的承诺 - 一旦科学家能够扩展技术并克服一系列技术障碍,“微软在博客中陈述。

存储在分子DNA上的数据包括数字版本的艺术作品,包括乐队的高清音乐视频GO Go!,超过100种语言的人权宣言,项目Guttenberg的前100本书非营利性作物信托基因数据库在DNA链中。

作为存储介质需要DNA,因为世界的数据呈指数增长,并且分子级存储比硬盘驱动器,固态驱动器(SSD)或甚至即将到来的技术(如相变存储器)的数据变得更加密集。

“这些系统在几年或几十年后也会降级,而DNA可以可靠地保留几个世纪以来的信息,”华盛顿大学(UW)研究人员在新闻发布中表示。“DNA最适合归档应用程序,而不是需要立即访问文件的实例。”

塔拉棕色摄影/华盛顿大学

UW副教授Luis Henrique Ceze,蓝色,研究科学家Lee Oniterick准备含有数字数据的DNA进行测序,这允许它们读取和检索原始文件。

UW和Microsoft研究人员是全国范围内的两支球队之一,也表明了从分子池进行随机访问数据的能力,它们被描述为类似于重新组装来自撕毁书籍图书馆的故事的一章。

研究人员表示,他们开发了“一种新的方法”,将数字数据中的长串和零转换为DNA序列的四个基本构建块 - 腺嘌呤,鸟嘌呤,胞嘧啶和胸腺嘧啶 - 代表为GS,CS和TS。

数字数据被分解成片,并通过将其作为大量的微小DNA分子合成,这可以脱水并保存用于长期储存。

虽然DNA存储的进展依赖于生物技术行业开创的技术,但它还需要从信息技术中吸取的经验教训。例如,Microsoft和UW团队的编码方法使用计算机内存中常用的纠错方案。

“这是我们”重新借用自然 - DNA的东西 - 储存信息。但是,我们“重新使用计算机所知的东西 - 如何纠正内存错误 - 并申请返回自然,”电脑科学与工程和大学的主要研究人员UW副教授Luis Henrique Ceze表示项目。

要访问存储的数据,研究人员将相当于ZIP码和街道地址编码为DNA序列。聚合酶链式反应(PCR)技术 - 常用于分子生物学 - 帮助他们更容易识别他们正在寻找的邮政编码。

“现在,与当前记忆相比,它非常缓慢 - 大约一个兆字节的每小时写作,以及每小时100岁的MB阅读,”CEZE说。

使用DNA测序技术,研究人员可以通过使用街道地址来读取数据并将其转换回视频,图像或文档文件来重新排序数据。

今天的大多数数据都存储在磁性和光学介质上。磁带技术最近看到了具有大约185TB的磁带盒的显着密度改进,是当今商业上可用的最密集的储存形式,每毫米(mm)约10gb。最近的研究报告了能够存储1PB的光盘的可行性,产生约100gg / mm的密度。尽管有这种改进,但仍将储存Zettabytes的数据仍然需要数百万个单位,并使用重要的物理空间。

国家人类基因组研究所

对DNA双螺旋的描述。

DNA具有高于每毫米的一个Exabyte的理论极限,这比胶带八个数量幅度。基于DNA的存储也有永恒相关的好处:只要存在基于DNA的生命,就会有强烈的理由阅读和操纵DNA,研究人员在4月份的研究论文中说明。

根据IDC和EMC的正在进行的“数字宇宙”研究,预测2017年以超过16个Zettabytes(ZB)的数据量预测。大部分地,事物互联网将负责每两年加倍数字数据,导致2020年的千兆字节(44ZB)。

“这一数据的大部分是档案形式;例如,Facebook最近建立了一个专用于1个冷藏储存的整个数据中心,”科学家们在他们的研究论文中说明。

研究人员一直在尝试DNA作为数据存储媒介,超过十几年,但它已经进展了很快。1999年,基于DNA的存储涉及编码和恢复只有23个字符的信息。

微软

4月,微软和GW研究人员能够存储这三个图像文件,这些文件在DNA中合成和测序。

到2013年,基于U.K的科学家们的Embl-欧洲生物信息学研究所声称他们“D编码了MP3版本的Martin Luther King”S“我有一个梦想”在DNA中的演讲。

4月,微软和UW研究人员释放了纸质,详细介绍了合成DNA如何用作档案储存的形式。

基于DNA合成的目前的进展和储存技术的排序,CEIZE推测,在新的存储介质可用于商业档案目的之前,它仍然仍然是大约十年。

“DNA是一个惊人的信息存储分子,用于编码有关生活系统如何工作的数据。我们“重新批准存储数字数据的能力 - 图片,视频,文件,”Ceze表示。“这是借用自然借用以建立更好的计算机系统的重要例子。”


返回科技金融网首页 >>

版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“科技金融网”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场,如有侵权,请联系我们删除。


相关文章