国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

從數(shù)字圖書到DNA圖書

2014-03-17 10:04林森
百科知識(shí) 2014年6期
關(guān)鍵詞:數(shù)字圖書堿基莎士比亞

林森

聯(lián)合國教科文組織對圖書的定義是:凡由出版社(商)出版的不包括封面和封底在內(nèi)49頁以上的印刷品,具有特定的書名和著者名,編有國際標(biāo)準(zhǔn)書號(hào),有定價(jià)并取得版權(quán)保護(hù)的出版物。

然而,圖書的內(nèi)涵是,它是信息和知識(shí)的載體。因?yàn)閳D書是人類用來記錄一切成就的主要工具,也是人類交流感情,取得知識(shí),傳承經(jīng)驗(yàn)的重要媒介。從形式上看,圖書經(jīng)歷了石書、龜甲書、竹簡書、布書(養(yǎng)蠶業(yè)與織布提供了布料)、紙書(蔡倫發(fā)明紙之后)和數(shù)字圖書的歷程。不過,現(xiàn)在一種新的圖書——DNA(脫氧核糖核酸)圖書已經(jīng)進(jìn)入人們的生活。

信息技術(shù)和生物技術(shù)結(jié)合的圖書

DNA圖書是數(shù)字(信息)技術(shù)與生物遺傳技術(shù)結(jié)合的新結(jié)晶。

數(shù)字圖書是用數(shù)字技術(shù)處理和存儲(chǔ)各種文字、圖片和音頻的圖書。數(shù)字圖書是當(dāng)今最先進(jìn)的圖書,是由數(shù)字技術(shù)編輯加工而成。數(shù)字技術(shù)的本質(zhì)是電子計(jì)算機(jī)和網(wǎng)絡(luò)信息技術(shù),借助這些技術(shù)和設(shè)備可以將各種信息,包括圖、文、聲、像等轉(zhuǎn)化為電子計(jì)算機(jī)能識(shí)別的二進(jìn)制數(shù)字0和1,再進(jìn)行加工、制作、存儲(chǔ)、傳送、傳播、還原和出版。

在加工、存儲(chǔ)和出版等環(huán)節(jié)中要借助計(jì)算機(jī)對信息進(jìn)行編碼、壓縮、解碼等,因此稱為數(shù)碼技術(shù)、計(jì)算機(jī)數(shù)字技術(shù)、數(shù)字控制技術(shù)等。依靠這些技術(shù)出版的圖書稱為數(shù)字圖書。

DNA是包括人在內(nèi)的高級(jí)生物的細(xì)胞的細(xì)胞核,其蘊(yùn)藏的遺傳信息不僅是海量的,而且也是有序的。這種有序就是其中的4個(gè)堿基的互補(bǔ)排序。DNA的穩(wěn)定雙螺旋結(jié)構(gòu)是由4種不同的堿基來支撐的。它們英文名稱的首字母分別稱之為A(腺嘌呤)、T(胸腺嘧啶)、G(鳥嘌呤)和C(胞嘧啶)。

根據(jù)DNA的這種穩(wěn)定搭配,研究人員設(shè)想,可以把數(shù)字技術(shù)與生物技術(shù)結(jié)合起來,編撰一種全新的圖書——DNA圖書。編撰DNA圖書的可行性在于,可以利用計(jì)算機(jī)的二進(jìn)制數(shù)字0和1與4種堿基進(jìn)行轉(zhuǎn)化編碼、編程,把數(shù)字圖書所編碼的所有文字、圖像、符號(hào)等再編碼到DNA中,制作成DNA圖書。在閱讀時(shí),再利用DNA測序技術(shù)把DNA密碼還原為數(shù)字編碼,就可以解碼和閱讀。

當(dāng)然,DNA圖書最吸引人的還是它與傳統(tǒng)圖書和數(shù)字圖書相比的巨大優(yōu)勢。它的蘊(yùn)藏量是無限的,其體積更小,遠(yuǎn)比光盤、U盤、硬盤更小,而且信息可以長久地在DNA中保存。根據(jù)DNA的半衰期,如果在零下5攝氏度的理想條件下保存,DNA的4個(gè)堿基可以保存680萬年。這也意味著,制成的DNA圖書至少可以保存上百萬年。

比較起來,數(shù)字圖書保存信息的弱點(diǎn)之一是存儲(chǔ)時(shí)間較短。目前數(shù)字信息的載體都是磁盤(軟盤、硬盤)和光盤。雖然數(shù)字生產(chǎn)廠商號(hào)稱硬盤保存信息、數(shù)據(jù)的壽命不低于10萬小時(shí),但這只是理論值,在實(shí)際使用過程中,有許多因素會(huì)縮短這個(gè)時(shí)間。一般而言,硬盤保存信息比較保險(xiǎn)的時(shí)限是3~5年,讀寫頻繁的硬盤保存信息時(shí)間3年多一點(diǎn),負(fù)荷不重的硬盤保存信息時(shí)間5年左右。光盤據(jù)說可以保存信息100年,但也是理論值。保險(xiǎn)的做法是,10年左右要把光盤拿出來讀一讀,如果發(fā)現(xiàn)讀取困難時(shí),要及時(shí)翻刻一次。

同時(shí),因特網(wǎng)上的信息儲(chǔ)存更有時(shí)限。數(shù)字信息容易創(chuàng)建,也容易修改、刪除,并消失。目前網(wǎng)上有超過40億個(gè)公共網(wǎng)頁,平均每天還有700多萬新的網(wǎng)頁出現(xiàn),但是,網(wǎng)頁的平均壽命為44天。所以,DNA圖書在保存信息和數(shù)據(jù)上具有空間大、保存時(shí)間長的更大優(yōu)勢。

第一本DNA圖書《再生》

美國哈佛大學(xué)維斯生物工程研究所的喬治·丘奇等人在2012年9月28日的美國《科學(xué)》雜志上發(fā)表文章稱,他們成功地編撰出一本5.27兆比特的DNA圖書,這本書不僅有文字,還有圖,是圖文并茂的DNA圖書,書名叫作《再生》。這本書有5.34萬個(gè)單詞,還有11張JPG格式的圖片和一段Java Script程序(Java Script又稱爪哇腳本,是一種程序設(shè)計(jì)語言,即依據(jù)一定的格式編寫的可執(zhí)行文件,又稱作宏或批處理文件)。

DNA圖書編撰的原理是,把需要編撰的內(nèi)容先轉(zhuǎn)化為數(shù)字信息(電子文件),然后把數(shù)字信息按DNA的堿基順序編碼并合成,讀取時(shí)再用DNA測序儀按編碼規(guī)則將DNA圖書轉(zhuǎn)換解讀為數(shù)字文件,就能在電腦上閱讀和使用了。

根據(jù)這個(gè)原理,研究人員編撰了DNA圖書《再生》后,再利用DNA測序儀來閱讀這本書,內(nèi)容可以成功地讀出,這證明DNA能夠被用來長期儲(chǔ)存數(shù)字信息,也即可以用DNA來生產(chǎn)圖書。這種新圖書所儲(chǔ)存的信息量是DNA原來儲(chǔ)存的生物遺傳信息量的1000多倍。也就是說,DNA圖書不僅比傳統(tǒng)的紙質(zhì)圖書儲(chǔ)存的信息要多得多,也比DNA本身儲(chǔ)存的遺傳信息要多很多。

DNA圖書的具體制作是,首先將《再生》這本書的文字內(nèi)容和圖片轉(zhuǎn)化為HTML格式的文件,然后將這些文件編譯為由0和1組成的大小為5.27兆比特的二進(jìn)制序列。然后再用DNA的一個(gè)核苷酸(一個(gè)堿基)對應(yīng)一個(gè)比特,把這個(gè)5.27兆比特的二進(jìn)制序列按照順序分配到多個(gè)96比特長的核苷酸片段中。

研究人員用的是短DNA序列而不是長DNA序列來編碼數(shù)據(jù),因?yàn)檫@可以降低寫入和讀取數(shù)據(jù)的困難和成本。在DNA上編碼數(shù)據(jù)也相似于把數(shù)據(jù)儲(chǔ)存到硬盤上,只不過在硬盤中數(shù)據(jù)是被寫入被稱作扇區(qū)的小硬盤塊中。

用于編碼和儲(chǔ)存信息的DNA不過是一滴DNA液滴,當(dāng)《再生》的全部信息(數(shù)據(jù))和其他信息被編碼到DNA之中后,DNA液滴被放置到微陣列芯片上儲(chǔ)存。這些芯片在4攝氏度下保存3個(gè)月,然后溶解它們并測序,以便降低儲(chǔ)存信息時(shí)的錯(cuò)誤。每個(gè)核苷酸片段的每個(gè)拷貝被測序高達(dá)3000次,利用這種方式可以把這個(gè)5.27兆比特內(nèi)容的書籍中的錯(cuò)誤降低到只有12個(gè)。也即是說,存儲(chǔ)在DNA中的內(nèi)容能被準(zhǔn)確無誤地讀取出來。

《再生》這本DNA圖書的優(yōu)勢在于,它能長期存儲(chǔ)信息,它的內(nèi)容至少在1000年時(shí)間內(nèi)也能夠被讀出。而且,由于DNA能儲(chǔ)存更多信息,理論上計(jì)算,1克DNA即能儲(chǔ)存上千億個(gè)千兆字節(jié),相當(dāng)于1000億張DVD光盤的內(nèi)存。全世界一年的數(shù)碼信息總量約為1.8ZB信息,可以被存儲(chǔ)在約4克的DNA中(ZB是信息量單位,等于10的21次方,常見的GB是10的9次方)。紙質(zhì)和磁盤存儲(chǔ)信息是平面的,但DNA能折疊變化,即可以立體存儲(chǔ)信息,存儲(chǔ)密度非常高。當(dāng)然,DNA圖書也容易保存,因?yàn)镈NA在室溫下就非常穩(wěn)定。endprint

但是,《再生》這種DNA圖書也有明顯的缺點(diǎn)。一是制作時(shí)存儲(chǔ)數(shù)據(jù)過程比較緩慢。二是合成和測序DNA的技術(shù)非常昂貴,即把文字和圖片等信息按計(jì)算機(jī)的二進(jìn)制原理與DNA的4個(gè)堿基對應(yīng)編碼時(shí),比較昂貴。相應(yīng)地,對DNA圖書的讀取也比較緩慢,這也可能限制它成為一種普通的圖書讓人們在生活中簡單而方便地閱讀。當(dāng)然,這種DNA圖書還有一個(gè)缺點(diǎn),只能讀出信息和數(shù)據(jù),不能改寫數(shù)據(jù)。

改進(jìn)的DNA圖書——《莎士比亞詩集》

在《再生》問世后一年,另一本DNA圖書《莎士比亞詩集》也誕生了。這本DNA圖書是由歐洲生物信息研究所(EBI)的尼克·戈?duì)柕侣热司幾?。該書編入了莎士比亞所有?54首十四行詩、一篇沃森和克里克DNA雙螺旋論文的副本(沃森和克里克因此而獲1962年的諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng))、一張戈?duì)柕侣热怂谘芯繖C(jī)構(gòu)EBI大樓的彩色照片,一段這次試驗(yàn)使用的軟件算法,還有一段26秒來自馬丁·路德·金著名演講《我有一個(gè)夢想》的剪輯音頻,信息總量約739千字節(jié)。

顯然,這本DNA《莎士比亞詩集》的內(nèi)容更豐富,而且包含了一個(gè)音頻文件,也更符合數(shù)字圖書的標(biāo)準(zhǔn)。與《再生》相比,DNA《莎士比亞詩集》的編撰更優(yōu)化、更完善、操作性更強(qiáng),也更實(shí)用。

戈?duì)柕侣热说木幋a比丘奇等人的編碼更進(jìn)了一步,他們把數(shù)字內(nèi)容的二進(jìn)制碼(0,1)改成三進(jìn)制碼(0,1,2);然后用這種三進(jìn)制碼來對應(yīng)DNA的4個(gè)堿基(A、T、C、G),從而將三進(jìn)制碼編寫成一個(gè)DNA序列。一般情況下,每500個(gè)堿基的序列可能會(huì)出現(xiàn)一個(gè)錯(cuò)誤。為了防止出錯(cuò)和漏掉內(nèi)容,研究人員以每25個(gè)堿基向后錯(cuò)位的方式把這個(gè)DNA序列切割成若干個(gè)含100個(gè)堿基的等長片段,這就能使整個(gè)序列的所有內(nèi)容都獲得4個(gè)副本,例如,1、2、3、4;2、3、4、1;3、4、1、2;4、1、2、3。

當(dāng)數(shù)字內(nèi)容編寫進(jìn)DNA后,再用專門設(shè)備合成為DNA《莎士比亞詩集》。在讀取或閱讀DNA《莎士比亞詩集》時(shí),先把合成的DNA《莎士比亞詩集》放入標(biāo)準(zhǔn)化學(xué)試劑,然后用DNA測序儀根據(jù)索引標(biāo)識(shí),將各個(gè)DNA片段依順序粘貼成原來的DNA序列,再轉(zhuǎn)譯到數(shù)字文件的二進(jìn)制碼,從而形成電子文件,就可閱讀了。

合成的DNA《莎士比亞詩集》只有砂粒般大小,靜靜地躺在試管的底部,連戈?duì)柕侣€是經(jīng)同事指點(diǎn)才發(fā)現(xiàn)了這本DNA《莎士比亞詩集》。在閱讀時(shí),研究人員用DNA測序儀把DNA《莎士比亞詩集》中的信息還原為數(shù)字文件,結(jié)果它與原始數(shù)字文件的內(nèi)容百分之百重合。這種從DNA程序到數(shù)字程序百分之百的重合靠的是巧妙的設(shè)計(jì)。

在閱讀DNA《莎士比亞詩集》時(shí),研究人員發(fā)現(xiàn)有兩個(gè)25個(gè)堿基對的序列不見了。缺了它們,這本DNA《莎士比亞詩集》的內(nèi)容要么不全,要么會(huì)出現(xiàn)偏差,甚至難以讀出。不過,由于在設(shè)計(jì)時(shí)就考慮到這一點(diǎn),拷貝了4個(gè)副本,利用這4個(gè)副本完全還原了漏掉的數(shù)字文件的內(nèi)容。而且,戈?duì)柕侣热艘舶l(fā)現(xiàn)了堿基對丟失的原因,在未來只要修改一下程序,就不會(huì)發(fā)生類似丟失內(nèi)容的問題。

DNA《莎士比亞詩集》的誕生也獲得了丘奇等人的好評,他認(rèn)為,戈?duì)柕侣热说难芯孔尅拔覀兘K于有了一個(gè)真實(shí)的領(lǐng)域”。而且,類似DNA《莎士比亞詩集》的圖書非常穩(wěn)定,更容易保存,只需放在冷、暗、干燥處,沒有恒溫恒濕的苛刻要求。同時(shí),DNA《莎士比亞詩集》的編撰使用的設(shè)備和方法都是生物學(xué)研究的常規(guī)工具,這可以讓DNA圖書的存儲(chǔ)有效避開因設(shè)備技術(shù)更新?lián)Q代而產(chǎn)生的許多麻煩,儲(chǔ)存和閱讀也更方便。

不過,與丘奇等人制作的DNA《再生》圖書一樣,DNA《莎士比亞詩集》同樣有費(fèi)時(shí)費(fèi)力和成本高昂的弱點(diǎn)。數(shù)碼信息編入DNA目前只能由專門的DNA合成設(shè)備來做,而從DNA中讀取信息并還原為數(shù)碼文件,也很費(fèi)時(shí)。戈?duì)柕侣热擞昧苏麅蓚€(gè)星期才完成DNA《莎士比亞詩集》中5個(gè)文件739千字節(jié)的還原。

另外,戈?duì)柕侣热酥谱鱀NA《莎士比亞詩集》的存儲(chǔ)費(fèi)是,每一兆(MB,10的6次方)字節(jié)的錢是12400美元,并且在閱讀時(shí)還要測序解讀,需要再花220美元。這是常規(guī)磁盤儲(chǔ)存費(fèi)用的100多萬倍。

同時(shí),DNA《莎士比亞詩集》與DNA《再生》一樣,編撰后就不能修改。這與數(shù)字文件的常規(guī)存儲(chǔ)(硬盤和U盤)的便捷差了十萬八千里?,F(xiàn)在,人們只需花幾十元或上百元人民幣買一個(gè)16GB儲(chǔ)存量的U盤,插入電腦,就能反復(fù)使用,包括下載文件、寫文章、聽音樂、看錄像、做計(jì)算等。

由于不能重復(fù)使用、昂貴和讀取時(shí)間長,DNA圖書目前顯然還不可能像數(shù)字圖書一樣被人們廣泛使用,因此,其市場化也需要時(shí)日。不過,當(dāng)有一天,研究人員通過新的技術(shù)攻克了DNA圖書這些弱點(diǎn)之后,DNA圖書也將走進(jìn)人們的生活。那時(shí),DNA圖書將成為比數(shù)字圖書更先進(jìn)更實(shí)用的圖書。

【責(zé)任編輯】張?zhí)锟眅ndprint

猜你喜歡
數(shù)字圖書堿基莎士比亞
區(qū)塊鏈在數(shù)字圖書侵權(quán)中的司法救濟(jì)作用分析
莎士比亞(素描)
向威廉·莎士比亞致敬
應(yīng)用思維進(jìn)階構(gòu)建模型 例談培養(yǎng)學(xué)生創(chuàng)造性思維
中國科學(xué)家創(chuàng)建出新型糖基化酶堿基編輯器
生命“字母表”迎來4名新成員
生命“字母表”迎來4名新成員
你在引用莎士比亞的話
數(shù)字圖書營銷方法探究
莎士比亞十四行詩選譯30首
乌拉特前旗| 望城县| 克东县| 伊川县| 运城市| 新龙县| 河东区| 会同县| 安康市| 延庆县| 淮南市| 开远市| 宁蒗| 宽城| 手游| 赞皇县| 运城市| 开鲁县| 天镇县| 达日县| 米林县| 双柏县| 鄱阳县| 西乌珠穆沁旗| 武义县| 五大连池市| 通化县| 天峻县| 莱州市| 榆树市| 青海省| 沅陵县| 康乐县| 石台县| 策勒县| 商都县| 通榆县| 霍林郭勒市| 邓州市| 进贤县| 渑池县|