用DNA存储技术保存敦煌壁画
作者: 王建英从人类结绳记事到书籍再到硬盘,存储信息一直是人类文明的基础性支撑。可以说,人类每一次文明的突破,都与存储信息技术的革命直接相关。然而,任何存储方式都有局限性,拿今天的数字存储技术来说,虽然和之前的技术相比,这种技术的容量和读取方式都更能满足数字社会的需要,并且还在不断改进,但是仍然有不足。比如,硬盘寿命一般在20年以下,而十年之后,硬盘中存储的信息就不完整了。再者,数字存储技术耗能惊人。因此,科学界开始寻找更方便的、更低耗能的存储新技术。
其实,目前人类已知的效率最高的、保存最稳定的、耗能最低的存储技术,就是DNA存储技术。DNA存储技术历史极其悠久,可以说,从有生命开始,DNA存储技术就已经广泛运用。这种技术能够轻松地将我们的鼻子、眉毛、眼睛的位置,蛋白质合成途径,人类进化过程等海量的生物信息,存储在比细胞还要小的DNA上,而且可以形成一种超级稳定的结构,几乎可以说这些信息是长在DNA上的。从存储密度来看,理论上每一克DNA可以存储数据215PB(千兆字节),约225443840GB(吉字节),相当于22万个1TB(太字节)硬盘的存储量。在理想状态下,目前1千克左右的DNA就可以存储全世界的信息。然而,这项技术尚不成熟,其难度在于写入、读取、还原和检索都比较麻烦。
前不久,天津大学的元英进团队在DNA存储技术方面取得突破性进展,他们精选了十幅敦煌壁画,写入DNA。经过实验室检测,科研人员认为在室温9.4℃的情况下,这些信息可以保存两万年,且成本非常低廉。元英进指出,DNA存储技术最大的优势就在于存储的密度远远高于传统的存储介质。
那么,怎样才能把图片信息存储到DNA中呢?DNA是脱氧核糖核酸的简称,其中包含“A”“T”“C”“G”四种碱基,可以构建一种四进制的存储机制。而计算机采用的是二进制代码,只要运用某种转化方法,把计算机的二进制系统转化为四进制系统,就可以把信息写入DNA。科研人员先把十幅敦煌壁画转化成数字图像,这些数字图像本质上就是一些二进制的比特串,“我们通过编码,将这些二进制的比特串转化为四进制的A、T、C、G碱基序列,再通过DNA合成技术,将碱基序列写入DNA,敦煌壁画的数据图像就‘变’为DNA了。”
如果仅仅把数字图像写入DNA,那么这项成就还不算突出。元英进团队成员韩明哲解释说,他们团队这一成就的独特之处在于,可以在较为宽松的条件下写入与读取数据。即便是天然界的DNA,也存在长期存放出现裂解的问题,而元英进团队通过一些特殊的重建算法,完整读取了已经裂解的DNA。在实验室中,团队模拟了一些比较恶劣的环境,如将温度升高到70℃,之后通过重建算法,仍然可以读取DNA中96.4%的信息。至于其他信息,团队也通过另一种编码方式完整地读取了出来。
元英进表示团队未来将在写入、存储、读取与存放等方面继续这项研究,“距离实用化并不遥远”。或许在不远的将来,我们可以把电脑和一根木头或者一杯溶液连起来,读取里面的海量信息。