基于DNA存储的数据存储卡片亮相

文章正文
发布时间:2024-02-10 17:13

DNA存储技术来了

■侯文雄

DNA数字存储过程。制图:侯文雄

近日,法国一家致力于DNA存储的公司,宣布推出基于DNA存储的数据存储卡片并开始向公众售卖。这张信用卡大小的DNA存储卡仅有1kB,约等于一封仅有文本信息的简短电子邮件;相比于硬盘驱动器约为10年的使用寿命,它的存储寿命最短可达150年。

该公司表示,DNA存储卡现阶段本质上是一个概念证明,1kB只是一个开端。下一步他们将进一步扩大设备的容量,并计划将存储时间延长至1000年,最终延长至10000年。

众所周知,在人们的日常生活中,硬盘、闪存、CD/DVD等数字存储设备正深刻地改变着人们的生活。尽管数字存储在长期“进化”中一次又一次打破了自身上限,但在大数据时代,随着互联网、物联网和人工智能飞速发展,传统数字存储技术低保真、高能耗、存储量不足等一系列弊端日益凸显。

面对这一问题,具有低能耗、高保真、存储容量巨大的数字存储技术——DNA存储技术应运而生。

以1kB为开端,DNA存储技术的容量到底能有多大?就信息密度而言,当今世界所有电脑上储存的数据转换为DNA体积,仅有一个鞋盒大小。此外,DNA可以防止水、空气和光的侵蚀,能够在没有能量的情况下保持上千年乃至数万年完好无损。

硬盘、闪存日渐乏力,DNA存储被寄予厚望

高效存储,方有上乘数据。

现阶段,诸如SD卡、U盘等闪存载体遍布在我们的日常工作生活之中。但这些闪存载体通常小巧玲珑,在遇到较大存储要求时,自身存储量难以满足需要。以用于数码相机存储的SD卡为例,64G、128G、256G是常见的存储容量,拥有64G数字存储容量的相机一次可拍摄约2000张高质量图片。但对于高帧率、高画质的视频来说,存储空间明显乏力。

与此同时,闪存存储器的使用寿命也存在隐患。基于电子擦除与写入技术,闪存存储器在每次存储过程中,会不可避免地产生损耗,导致数据失真,甚至丢失数据。在传输数据时,相信不少人都遇到过“U盘已损坏”这短短一行让人崩溃的电脑提示。

相对闪存存储器来说,另外一种较为常见的存储媒介——硬盘,拥有更大“肚量”和更稳定的性能,但随之而来的是更大的能耗和更笨重的外观。

可以说,随着数据量的不断增加,存储量不足、低寿命和体积笨重的传统存储技术已无法满足人们对存储介质的需求。社会生产生活亟待出现新型数字存储技术,以突破低保真、高能耗、存储量不足等传统数字存储技术的瓶颈,提供更高质量的数据,实现数字存储的飞跃。

人们在DNA这里找到了启发。

在生物领域,DNA是生命遗传信息的载体,其双螺旋结构已经被人类发现并解析。在此基础上,科研人员打开了新思路:我们染色体中的编码语言和计算机的二进制语言非常相似。在计算机数据中,所有的信息最终都被分解为0和1的排列组合,如果用DNA的四个碱基(A、C、G、T)对数字数据进行大批量编码,DNA分子也能成为数据存储的载体,应用于信息技术领域。

DNA存储思想的产生,可以追溯到20世纪60年代中期提出的“基因记忆”概念。后来,这一概念被科学家证实,囿于当时合成生物学技术发展的有限,科学家们只能想象着DNA存储的美好前景却束手无策。

直到21世纪初,第二代、第三代DNA测序技术问世。这给DNA存储技术插上了腾飞的翅膀,科学家又重新审视了DNA存储的概念,并在短短6年时间实现了DNA存储技术研发的巨大突破。2019年,美国华盛顿大学和微软研究院的研发人员在《自然》杂志上发文,文章中对基于DNA的分子数字数据存储进行了总结。此外,一些生物技术公司也已经开始提供基于DNA的存储和测序服务。

今年,中国农业科学院研发团队创立Derrick系统,用以解决DNA存储技术中存在的系统误差和随机误差等问题,大大提高了纠错效率,使得DNA存储技术又迈上了一个新的台阶。

现如今常用存储介质——SD存储卡。资料图片

现如今常用存储介质——硬盘。资料图片

高保真、低能耗、易存储的“分子记录器”

凭借高保真、低能耗、大存储等特点,DNA存储技术轻松地解决了传统技术的痛点,科学家们都对DNA存储技术寄予厚望。

“哪怕一个最简单的细胞,也比迄今为止设计出的任何智能电脑更精巧!”正如科学家所言,人类已经不是第一次在自然界中汲取灵感,在自然生命中寻找科技难题的答案。

DNA作为绝大部分生物的遗传物质,具有长期保存、易复制、高密度存储等特点。人体内的DNA分子约有30亿个碱基对,可用于存储遗传信息,并且可以通过聚合酶链式反应进行扩增和快速复制,并能使遗传信息长期稳定保存。同时,DNA中编码的生物信息可以通过一定手段进行操作。如果体内DNA在自我复制时出现错误,还可以利用与生俱来的独特修复机制,其错配率仅为十亿分之一到百亿分之一。

就像DNA在生物领域保存遗传信息那样,在信息技术领域,DNA存储的基本过程包括将数字信息编码为DNA序列、将序列写入实际DNA分子、调节并将其组织到库中用于长期存储、选择性访问、读取分子并转换回原始数字数据,即“编码-合成-随机访问-测序-解码”。

通俗来说,当我们需要存储大量数据时,就将想要储存的大量数字信息转换为DNA代码,写入DNA分子,等需要拿出这些储存数据时,再将储存于DNA分子中的数据解码为原始数据即可。

在多个维度上,DNA存储技术都可以“力压”传统数字存储技术——

其一是高密度。DNA分子是一种高度复杂的生物分子,其双螺旋结构由碱基组成,每个碱基都可以编码一个二进制位,DNA分子由此可以作为数据存储介质,其理论上的存储密度近乎天文数字——1千克DNA就可以轻松存储全球的数据,当今全球所有的存储需求都可以容纳在一个小小的立方体盒子里。

其二是低能耗。和传统的数据中心不同,以DNA形式存储的数据更易于维护。在存储过程中,DNA存储不需要大量的人力、财力投入,仅需要将其保存在低温环境中即可。在能耗方面,1GB的数据硬盘存储能耗约为0.04瓦,而同一容量DNA存储的能耗则小于百亿分之一瓦。这对于当下能源紧张的人类社会来说无疑是福音。

其三是易存储。DNA分子对于外部环境具有较强的抗干扰能力,如高温、振荡等。因此,DNA数据容易存储,可以长时间保存且不容易丢失。据研究,从化石中可以提取出百万年前动物的DNA,这表明DNA数据在没有特别人工干预的情况下能够保存数万年之久,而商用磁带和光盘等传统存储介质仅仅只有几十年寿命。

挑战与机遇并存,探索研究仍在路上

尽管众多科学家对于DNA存储技术好评连连,但目前DNA数据存储仍然面临诸多挑战。

首先,DNA存储技术想要广泛应用于市场,必须化解成本上的尴尬局面。据预测,DNA存储中最基本的阵列合成成本每字节平均约为0.0001美元,一万字节要花费8美元。如果换算成人民币,一个汉字占2个字节,那么一篇5000字的文章将要花费近30元来支付存储成本。

其次,DNA存储技术的信息读写非常耗时。目前,数码信息编入DNA只能由专门的DNA合成设备来做,而从DNA中读取信息时,重组复原为最初的数码文件也很费时。据悉,用户在应用法国公司推出的DNA数据存储卡时,目前大约需要8个小时才能生成1KB的数据。

第三,DNA存储技术不能重复使用。也就是说,当我们把信息传入到DNA数字存储以后,目前尚不能进行修改和删除。这与光盘、硬盘等价格低廉又可反复存取文档的存储介质相比,还有巨大的进步空间。

诚如以上种种短板,主要由当前DNA存储技术刚刚起步的技术局限性所导致,其真正蕴含的“实力”还远未得到释放。未来,随着技术的不断进步和应用场景的不断扩展,DNA存储技术有望得到更广泛的应用和发展。

长期数据存储——对于需要长期保存但不经常访问的数据,例如历史档案、文化遗产和历史记录,DNA存储技术提供了理想的解决方案。

高价值数据备份——对于具有重要历史、文化或科学价值的数据,DNA存储技术可以提供极高的保障。例如在医疗领域,一些遗传疾病的治疗需要获取患者的基因信息进行诊断和治疗。这些信息就可以使用 DNA存储技术进行保存和管理。

空间探索——在空间任务中,DNA存储由于小型化和耐久性等特性,可以作为存储大量数据的理想选择。

总的来说,DNA存储着生物体的奥秘,同时也是无比庞大的“数据盘”“信息库”。随着技术的不断进步和应用场景的不断拓展,DNA存储技术将逐步展示其巨大潜力和独特优势。

我们期待着,未来某一天,所有的硬盘和光盘都可以丢到一边,只需用一根头发大小的DNA载体,就能够存储下我们一生所需要的数据。

首页
评论
分享
Top