馮智
信息的儲存對人類文明的傳承來說至關(guān)重要,數(shù)千年來,人類保存信息的方式由巖洞壁畫、甲骨文、竹木簡、牛皮紙,一直發(fā)展到近百年來的磁帶、膠卷、光盤,以及如今的精密半導(dǎo)體存儲芯片。介質(zhì)越來越小巧,可存儲的信息量卻越來越龐大。在可預(yù)見的未來,會不會出現(xiàn)更具革命性的儲存手段呢?比如細(xì)菌。
事實上,科學(xué)家從未停止過對更新存儲介質(zhì)的探索,畢竟在信息爆炸的未來,找到更便宜、容量更大的存儲介質(zhì),能給人們的生活和工作帶來更多便利。于是有人提出,能不能利用DNA儲存信息?畢竟DNA的存儲量之巨是顯而易見的,它能輕易裝下人體內(nèi)所有的秘密。
當(dāng)然,DNA存儲并非一個嶄新的概念,早在半個多世紀(jì)以前,就有人提出過,然而受制于當(dāng)時有限的生物學(xué)發(fā)展進度,很多想法也僅僅止步于概念。但如今,得益于近十年來分子生物學(xué)的突飛猛進,人們開始重新重視DNA存儲技術(shù)。
話說回來,DNA是如何記住每個人體內(nèi)獨有的海量遺傳信息呢?據(jù)分子生物學(xué)家介紹,DNA可將腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四種堿基以不同的方式排列組合,輔以細(xì)胞特有的讀取方式,高效儲存生物體豐富的遺傳信息。因此科學(xué)家認(rèn)為,既然遺傳信息都能夠被留存下來,那么其他信息為何不可?
這種推想完全可行。舉個例子,單位質(zhì)量的DNA可存儲455EB的信息,這是全球一年信息總量的四分之一;而單位體積的DNA可存儲的信息為整個互聯(lián)網(wǎng)的33倍。顯然,DNA可以作為一種穩(wěn)定且密集的數(shù)據(jù)存儲介質(zhì),潛在優(yōu)勢是密度大、能耗低,且壽命長。
對此,生物學(xué)家進行了嘗試。
首先是確定信息轉(zhuǎn)換的規(guī)則。生物學(xué)家為DNA內(nèi)的腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四種堿基,賦予了數(shù)字概念,把它們當(dāng)做數(shù)字信息,即把數(shù)字化的信息轉(zhuǎn)變?yōu)橛脡A基來表示。用二進制來舉個例子,如果把A和G當(dāng)做0,C和T當(dāng)做1,就可以排列組合成任何信息,簡單又直觀。
后來科學(xué)家開始采用四進制模式,即把A、T、C、G看作0、1、2、3,這種方式可以大大縮小數(shù)據(jù)量,但同時也導(dǎo)致堿基重復(fù)出現(xiàn),序列穩(wěn)定性隨之變差,對數(shù)據(jù)的精確重現(xiàn)造成了破壞。
于是科學(xué)家決定采用三進制手段,讓前一位堿基成為后一位堿基的決定條件。假如前一位堿基為A,則下一位就把A排除,用C、G、T來代表0、1、2,以此類推。解決了堿基問題后,分子生物學(xué)家開始嘗試把各類信息數(shù)據(jù)導(dǎo)入DNA里,比如有一位哈佛大學(xué)的研究者就成功把一本書的電子數(shù)據(jù)編輯成了DNA形式。
如今這項技術(shù)雖然比50年前有了飛躍式的進步,但還遠(yuǎn)未實現(xiàn)在活體細(xì)胞基因組中存儲信息這一目標(biāo),因而距離真正的應(yīng)用、普及還尚有距離。然而,DNA巨大的儲存潛力和大數(shù)據(jù)信息爆炸的時代緊迫性,無時無刻不在激勵著分子生物學(xué)家們開展更多的探究。想象一下,未來你抽屜里的移動硬盤,可能會被一只小小的細(xì)菌所替代,所以當(dāng)下的一切嘗試都是值得的!
●梁衍軍 薦稿