首页 > 科技未来 > 内容

你体内的DNA可以储存整个宇宙的数据

发布于:2024-06-18 编辑:匿名 来源:网络

恐龙灭绝一万多年后,科学家获得了一块含有史前蚊子的琥珀,并从蚊子的血液中获得了恐龙基因,从而复活了遥远的生物。

讲述这个故事的《侏罗纪公园》至今仍位居全球票房电影前十名。

这一系列故事的原理很简单:DNA存储了恐龙的生物信息,而技术让它得以重新表达。

现在,用DNA想象另一个故事:在宇宙的长河中,“人类世纪”也消失了。

另一种智慧生物出现,他们前往探索古老的“人类文明”。

什么将承载人类文明的记忆?气温发生了巨大的变化,地球上只剩下了巨大的数据中心的痕迹。

冻土中有一份DNA拷贝。

它很轻,只有1公斤。

它看起来像一些封装在胶囊中的白色粉末。

读完之后,里面包含了地球上曾经存在过的海量信息。

视频、文字、代码展现了人类历史进程中无数的发明和文学艺术作品。

于是那个遥远文明的痕迹再次在宇宙中扩散开来。

这又是一个科幻设定。

其背后的技术是目前备受关注的一个前沿方向:DNA存储信息。

在自然界中,DNA 负责存储遗传信息。

人类单个细胞的平均直径为5至10微米,其中的DNA可以包含一个人的全部遗传信息:30亿个碱基对。

那么为什么碱基不能用来存储其他信息呢?这种类似科幻小说的想法已经走出实验室,并被视为未来信息存储的解决方案。

01 基因组数据太多,怎么办?最初,生物学家想要解决生物学发展中的问题。

十一年前,一群生物信息学家在德国的一家酒店讨论“数据存储问题”。

其中包括尼克·戈德曼(Nick Goldman),他是欧洲生物信息学研究所(EBI)高级科学家的第二年。

大规模基因组测序正在进行中,生成的数据规模正在迅速增长。

存储和压缩这些数据很麻烦,而且现有的技术解决方案似乎不起作用。

据估计,人类基因组需要高达 2-40 EB 的存储容量。

这可能比一家世界级科技公司的云存储还要多——全球 Apple 用户在 Google Cloud 上存储的数据总量约为 8 艾字节。

这 8EB 的数据每月需要 2.18 亿美元的存储费。

(1EB= ^3GB) 生物学家很沮丧。

有人突然灵机一动:是什么阻止我们用DNA来存储数据呢?这看起来像一个笑话,但生物学家意识到这不仅仅是一个笑话。

他们拿起手边的餐巾纸,用圆珠笔仔细计算着可行性。

DNA存储遗传信息的原理并不复杂。

它由A、T、G、C四种核苷酸组成,相互成对对应,形成双螺旋结构。

核苷酸序列记录遗传信息。

在数字世界中,所有信息本质上都是一串0和1。

如果想让DNA存储数字信息,简单的理解就是将0和1的编码序列转换成核苷酸序列。

DNA存储的优点是密度高,大约只有眼前逗号的大小。

1立方毫米的DNA可以容纳9TB(1TB=GB)的信息。

使用 DNA 存储数据并不是一个全新的想法。

科学家们之前已经尝试过。

但这是科学与艺术之间开创性的跨界实验。

2000 年,艺术家乔·戴维斯 (Joe Davis) 和哈佛大学的研究人员在短链 DNA 中存储了一种名为“微维纳斯”的模式。

该模式的编码很简单,白色区域标记为0,黑色线条标记为1。

文件大小只有35位,使用长度为28个核苷酸的DNA链来存储。

那次酒店讨论两年后,高盛团队发表了他们的研究结果。

这次,他们存储了 5 种不同格式的文件,总计 0.75MB。

为了保证读取信息不会出现错误,科学家将每条信息都以四倍的冗余度进行存储。

这五个文件是: ? 莎士比亚的 14 行诗(ASCII 编码格式) ? 一篇提出 DNA 双螺旋结构的论文(PDF 版本) ? 一张照片(JPEG 格式) ? 马丁·路德·金的《我有一个梦想》 26 秒的语音片段(MP3 格式) ? 霍夫曼代码字符串。

近年来,DNA存储容量不断被突破。

2016年,美国初创公司Catalog在DNA中存储了16GB的维基百科。

该公司表示,正在打造世界上第一个基于DNA的大规模数字数据存储和计算平台。

02 编码解码,要处理的事情很多。

在一些生物学家看来,用DNA来存储是一件非常“顺利”的事情。

“大自然的编码语言与我们在计算机领域使用的二进制语言非常相似。

在硬盘上,我们使用 0 和 1 来表示数据,在 DNA 中,我们有 4 种形式的核苷酸,A、C、T 和 G”。

瑞士联邦理工学院的生物学家罗伯特·格拉斯说。

DNA 存储的关键之一是使用四个核苷酸来映射数字 0 和 1。

计划可以很简单。

例如:A对应00,C对应01,G对应10,T对应11。

然后根据需要的核苷酸序列,将核苷酸串成串珠状。

(这就是DNA合成)当需要读取信息时,利用基因测序技术读出这串核苷酸序列,然后将其翻译成一串0和1。

这个过程是编码-DNA合成-测序-解码。

这听起来像是一个“把大象放进冰箱”的过程,但操作过程中需要考虑的问题有很多。

否则科学家们就不必继续研究新的编码方案。

在自然界存在的DNA中,A和T、C和G是成对配对的。

一段DNA中,CG和AT的比例基本均匀,约为50%。

如果C和G含量过高,可能会导致DNA链中出现一些复杂的物理结构。

这使得 DNA 测序(解码)变得复杂。

而在“串珠”(即合成DNA链)的过程中,出错率是不可避免的。

目前,合成的每个碱基大约会发生一个错误。

这是目前化学合成技术造成的瓶颈。

每次合成一个碱基,准确率都在99.9%以上。

但当碱基串变长并且0.01%的概率成倍增加时,错误就不可避免了。

目前,合成DNA的单链长度一般不超过3个碱基,极限在1个碱基左右。

在自然界中,DNA 通常有数千个碱基对。

也就是说,尽管DNA具有很大的存储容量,但它必须以许多短链的形式存在。

如果存储的信息量比较大,这些短链DNA就像一本松散的书。

它可以存储大量信息,但它以标有页码的纸张形式存在。

当然,短链DNA可以拼接??成长链。

这意味着添加了一个额外的过程。

在测序过程中,长链需要被打断成短链。

这是因为当前的技术无法一次读取长链。

测序过程中也存在错误率。

虽然目前的错误率低至10^-3,但与商用硬盘的读写错误率仍至少相差9个数量级。

准确率受合成和测序两种技术的影响。

科学家们想到了设计一种编码方案来避免这种情况:在编码中添加纠错机制。

这样,即使碱基合成和测序过程中出现错误,仍然可以保证DNA中存储的内容能够被正确读取。

03 走出实验室,还要考虑速度和成本。

DNA存储也在尝试走出实验室。

今年10月,微软、西部数据、基因测序巨头Illumina、DNA合成初创公司Twist Bioscience等共同成立了DNA数据存储联盟。

这是全球首个该领域的学术和产业链联盟。

该联盟希望制定技术和格式标准,并最终建立一个可以普遍使用的商业系统。

微软研究院于2016年建立了DNA存储项目,并聘请华盛顿大学计算机科学与工程学院副教授Karin Strauss担任高级首席研究经理。

2008年,她和同事参观了英国的EBI,了解了Goldman及其同事在DNA存储方面的研究,激发了她对此方向的极大兴趣。

“我们对 DNA 的密度、稳定性和成熟度感到兴奋,”施特劳斯说。

在他们的研究中,他们想要开发另一个功能:随机阅读。

在常见的DNA测序技术中,必须一次性读取所有碱基串才能获取信息。

要么不读,要么全部读完。

如果你只想要一小段数据,那就很麻烦了。

2011年,他们发表了一项研究,可以在DNA中已存储的信息中搜索指定的图像。

找到后,他们用酶复制所需的DNA片段,然后只需要读取这个小片段即可。

为了使 DNA 存储更接近商业用途,还需要解决合成速度和成本问题。

目前的综合速度是每秒存储数千字节(KB),成熟的云存储解决方案已经达到每秒超??过千兆字节(GB)。

这意味着DNA写入速度需要再提高6个数量级。

如何提高数据处理能力?正如并行计算可以提高数据处理速度一样,科学家希望能够并行合成多条DNA链并同时进行处理。

2016年,微软开发出首款纳米级DNA存储器,每平方厘米面积可同时合成25X()个碱基序列。

这项新技术将同时合成的碱基序列数量从个位数增加到了数千个。

此吞吐量使 DNA 合成速度达到每秒兆字节 (MB)。

更大的吞吐量意味着更低的成本。

DNA 存储目前每 TB 的成本为 8 亿美元。

磁带存储成本已降至每 TB 不到 16 美元。

你体内的DNA可以储存整个宇宙的数据

相比之下,这似乎没有竞争力。

但现实生活中大型数据中心的维护成本极高,硬件必须定期更新; DNA存储密度大、体积小、长期不变质等优点成为对降维的打击。

因此,量大、读取频率低的“冷数据”被认为是DNA存储的最新应用场景。

Twist Bioscience最近在一份市场报告中强调,这项技术可以帮助科技公司在“大规模、低功耗”下更有效地部署。

其他乐观的科学家相信技术进步。

自2006年人类基因组计划完成以来,测序成本下降了1万倍。

2000年,当面对每秒千字节的速度时,戈德曼表示,“六个数量级(读写速度的提高)对于基因组学来说并不是什么大问题。

你只需要再等一会儿。

”那么这个“一会儿”到底有多长呢?这个领域似乎已经走到了最后一步,仍在等待突破。

你体内的DNA可以储存整个宇宙的数据

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 韩国当选总统尹锡岳今天将与荷兰首相通电话,或讨论深化半导体合作等事宜

    韩国当选总统尹锡岳今天将与荷兰首相通电话,或讨论深化半导体合作等事宜

    据韩联社报道,3月30日,韩国发言人金恩惠韩国当选总统尹锡岳在新闻发布会上表示,尹锡岳将于当天下午与荷兰首相马克吕特通电话。 金恩惠表示,韩国和荷兰是历史悠久的友好国家,双方共同追求自由民主、市场经济、人权等价值观。 欧盟国家中,荷兰是韩国第二大贸易伙伴,两国

    06-08

  • 宁德时代投资4400万元投资加拿大Neo Lithium锂电公司

    宁德时代投资4400万元投资加拿大Neo Lithium锂电公司

    投资界9月17日消息,据当地媒体报道,在加拿大多伦多V板上市的Neo Lithium近日宣布签署战略合作协议。 与宁德时代旗下子公司签订股权认购协议。 宁德时代将以每股普通股0.84加元的价格认购1万多股加拿大新锂业股票,投资总额约人民币1万元,占新锂业总股本的8%,成为该公司第

    06-17

  • 河北:建成476个科技特派员工作站、43个科技特派员工作室

    河北:建成476个科技特派员工作站、43个科技特派员工作室

    创头条获悉,近日,河北省科技厅下发通知,启动个人科技特派员工作站和43个科技特派员工作室建设,重点提升科技特派员服务支撑体系,推动高校、科研院所科技成果与市县主导产业、科技型企业、农业合作社精准对接,深度解决科技成果转化“最后一公里”问题成果转化为现实生产力

    06-18

  • 多地出台“十四五”新基建规划,加快新一轮5G建设,

    多地出台“十四五”新基建规划,加快新一轮5G建设,

    创建了头条新闻。 据《证券日报》报道,新一轮5G建设正进入加速期。 近阶段,“十四五”新基建规划多地密集发布,积极释放政策红利推进5G建设。 据悉,5G建设已逐渐成为各城市建设的重点。 例如,四川省颁布的《四川省“十四五”新型基础设施建设规划》提出了5G建设的量化指标

    06-18

  • 张鸣晨先生在红点中国晋升合伙人

    张鸣晨先生在红点中国晋升合伙人

    据投资界9月17日消息,红点创投中国基金宣布张鸣晨先生晋升合伙人。 到目前为止,红点中国共有三位合伙人:主管合伙人袁文达先生、合伙人张翰先生、合伙人张鸣晨先生。 张先生于2016年加入红点中国团队,主要关注消费互联网、工业互联网、人工智能等领域的早期投资。 他目前

    06-18

  • 北京第三支S基金已启动,初始规模5亿

    北京第三支S基金已启动,初始规模5亿

    据投资界(ID:pedaily)6月10日消息,北京愿景接力创业投资基金近日在东城区注册成立。 该基金是继青岛S基金、英国科勒资本之后,北京推动设立的第三只S基金。 该基金由中关村发展集团旗下中关村创业投资发展有限公司管理,初始规模5亿元。 主要投资于高精尖行业私募基金二级

    06-18

  • 马斯克:SpaceX星链天线成本正在快速下降

    马斯克:SpaceX星链天线成本正在快速下降

    SpaceX首席执行官埃隆马斯克表示,星链互联网卫星天线的成本正在“快速下降”。 近日,针对“SpaceX正在以远低于制造成本的价格出售星链卫星天线”的推文,马斯克回应道:“目前来看,成本正在迅速下降。

    06-18

  • 中国中医药研究促进会将参与设立中医药健康产业引导基金,规模20亿

    中国中医药研究促进会将参与设立中医药健康产业引导基金,规模20亿

    据投资界(ID:pedaily)4月26日消息,近日,日前,由中国中医药研究促进会管理有限公司牵头的北京中开资本宣布,将与旗下联航发展投资有限公司共同设立中医药健康产业引导基金。 重庆南川区国有金融中心。 据了解,该基金总规模为20亿元,基金首期将募集1亿元。 以中医药健

    06-18

  • 创投市场“最忙下半年”:惊喜注册红利还是虚假繁荣?

    创投市场“最忙下半年”:惊喜注册红利还是虚假繁荣?

    冬天已经到来,一级市场已经超越了经济周期,变得比以往更加繁忙和火爆。 “我第一次出差是在五月份,没想到今年这么忙:尤其是下半年,基本上就没停过。 ”一位FA告诉今日头条。 出差、对项目进行尽职调查、做报告和决策、与创始人会面,这样的日常工作比往年更加密集。 金沙

    06-18

  • 华中科技大学成立未来科技学院、集成电路学院

    华中科技大学成立未来科技学院、集成电路学院

    创头条获悉,7月14日,华中科技大学未来科技学院、集成电路学院同步揭牌。 据悉,该校未来科技学院是今年5月教育部批准的首批12所未来科技学院之一。 将围绕“大工程、大健康”未来战略产业发展,依托机械工程、生物医学工程、光电信息科学与工程、自动化等四个国家一流本科专

    06-18

  • 阿里、腾讯、小米投资,百川智能完成3亿美元融资,成新独角兽

    阿里、腾讯、小米投资,百川智能完成3亿美元融资,成新独角兽

    投资界(ID:pedaily)消息,百川智能近日完成A1轮战略融资,融资金额为3亿美元。 阿里、腾讯、小米等科技巨头以及多家顶级投资机构参与了本轮融资。 算上1万美元天使轮,百川智能融资金额已达3.5亿美元。 成立不到半年,就跨入科技独角兽行列,创下了国内大型初创企业成为独

    06-17

  • 滴答旅游重新提交港股上市申请更新数据,2020年调整后净利润升至3.43亿元

    滴答旅游重新提交港股上市申请更新数据,2020年调整后净利润升至3.43亿元

    4月13日,滴答旅游向港交所重新提交上市申请,并更新了经营状况和相关数据。 更新后的招股书披露,财务数据方面,嘀嗒出行全年总交易额(GTV)为90亿元人民币,营业收入为7.91亿元人民币,同比增长36.3%,调整后净利润为人民币3.43亿元。

    06-18