邱東茹
中國科學院水生生物研究所,湖北 武漢 430072
分子生物學和基因組學為探索生命的起源和進化帶來全新的視角和方法。依據(jù)核糖體RNA序列,現(xiàn)存的生命形式被分為3個域 (Domain),即真細菌、古菌和真核生物。這些生物的遺傳物質(zhì)都是核酸,其基因組大小變化很大,從數(shù)十萬堿基對到幾十億堿基對不等;所含基因數(shù)目則為數(shù)百乃至數(shù)萬。原核生物的基因組較小,基因結(jié)構(gòu)和基因調(diào)控網(wǎng)絡相對簡單。目前有2 000余個原核生物的基因組序列被測定和注釋。許多真核生物包括酵母、秀麗線蟲、果蠅、擬南芥、楊樹、水稻、斑馬魚、小鼠、猩猩和人類自身的基因組測序也已完成。第2代測序技術(shù)更大大提高測序的速度和通量并降低了測序成本,如DNA雙螺旋結(jié)構(gòu)的發(fā)現(xiàn)者、諾貝爾獎得主James Watson和基因組學家J. Craig Venter的個人基因組被測序,個性化醫(yī)療很有可能成為現(xiàn)實。這些基因組序列揭開了生命天書的本來面目,但是解讀這些天書的意義尚需時日、任重道遠。隨著技術(shù)的進步,以大規(guī)模高通量分析為特征的各種組學應運而生,包括基因組學、轉(zhuǎn)錄組學、蛋白組學、相互作用組學和代謝組學,將揭示基因組復制、基因轉(zhuǎn)錄、翻譯和基因調(diào)控網(wǎng)絡、蛋白質(zhì)相互作用和物質(zhì)能量代謝等不同層次的相互關(guān)聯(lián)、錯綜復雜的生命活動。生物信息學、計算生物學和系統(tǒng)生物學就是為整合和詮釋這些海量的數(shù)據(jù)而產(chǎn)生的,其重要性日益突出。
細胞是生命活動的基本單位,細胞生命的3大特征是維持正常代謝平衡、進行繁殖 (自我復制) 以及進化。早在上世紀上葉DNA雙螺旋結(jié)構(gòu)揭示之前,著名物理學家薛定諤 (Erwin Schr?dinger) 在《生命是什么?》一書[1]中提出了有關(guān)生命的本質(zhì)的問題,試圖從物理學的角度來理解生命現(xiàn)象。在當今的后基因組時代,這個有關(guān)生命本質(zhì)的問題依然存在,也更為直觀,即維持細胞生命所必需的物質(zhì)基礎和過程是什么?所需的最小基因群 (Minimal gene-sets)、或者說最小基因組 (Minimal genome) 有多大?初步的答案是維持自由生活細胞的必需基因數(shù)目大約為 300個左右,相應的基因組大小約為300~400 kb。不僅如此,人工建立最小基因組或最小化細菌 (Minimal bacteria) 的工作已經(jīng)開始進行嘗試,其中最為突出的成果是最近美國科學家成功用人工合成的細菌染色體制造出合成細胞。未來所建成的具有最小基因組工程菌可能用作人工細胞工廠的“底盤”(Chassis)細胞。
有些基因?qū)毎哂兄陵P(guān)重要的作用,稱為必需基因 (Essential gene),其突變通常是致死性的。細菌特定基因的必要性還取決于環(huán)境條件。因為寄主細胞內(nèi)環(huán)境條件穩(wěn)定,營養(yǎng)供應充足,細胞內(nèi)共 (寄) 生細菌細胞結(jié)構(gòu)和代謝途徑通常極度簡化,細胞壁退化乃至消失。相應地,胞內(nèi)細菌如支原體和蚜蟲內(nèi)共生菌 Buchnera基因組大為縮減,所測序的胞內(nèi)共生細菌基因組大小的下限紀錄不斷降低[2]。目前發(fā)現(xiàn)細菌Carsonella ruddii的基因組最小,僅為160 kb,基因分布非常致密,有182個開放閱讀框,90%的相鄰開放閱讀框間有所重疊[3]。更為特別的是缺乏許多必需基因,包括細胞外被膜生成和核酸、脂類代謝基因。作者推測有些必需基因已像細胞器基因一樣轉(zhuǎn)移到寄主的核基因組中。這些細胞內(nèi)共生細菌的基因組進化證據(jù)也印證了線粒體和葉綠體的內(nèi)共生學說,即真核生物的線粒體和植物的葉綠體分別來源于細胞內(nèi)寄生的細菌和藍細菌[4]。目前可用人工培養(yǎng)基培養(yǎng)的細菌是生殖支原體Mycoplasma genitalium,基因組僅為580 kb,可自由生活細菌的最小基因組應該與此接近。
然而,絕大多數(shù)自由生活的細菌往往處在營養(yǎng)缺乏、環(huán)境條件多變的生境中。通常意義上的必需基因是指在豐富培養(yǎng)基中細菌生長繁殖所必需的基因。例如,大腸桿菌野生型可在以單糖作為碳源和能源、含無機鹽氮源和磷源及微量元素的簡單培養(yǎng)基中正常生長,亦即大腸桿菌可利用單糖和無機鹽合成自身所需的氨基酸、脂類、多糖類和核酸。但是在豐富培養(yǎng)基上,合成氨基酸的基因?qū)τ诖竽c桿菌而言是非必需基因??傮w而言,細菌的必需基因是合成細胞結(jié)構(gòu)成分、信息傳遞和加工不可或缺的基因。確定必需基因和最小基因組的方法主要有比較基因組學和系統(tǒng)性基因失活法。
相對而言,原核生物基因組簡單,重復序列較少,因此短槍測序法適合于微生物基因組測序。1995年,流感嗜血桿菌 Haemophilus influenzae基因組測序完成,這是第一個細菌全基因組序列。如前所述,目前已有多個細菌基因組序列已知,而且某些重要的病原細菌如炭疽菌、大腸桿菌和工業(yè)細菌有多個菌株的基因組序列被測定;有些細菌菌株的基因組序列甚至被不同機構(gòu)重復測定。我國也完成了鉤端螺旋體、表皮葡萄球菌、野油菜黃單胞菌、騰沖熱泉菌等細菌基因組的測序。這些基因組序列為比較基因組學分析提供了很好的機會,可以用來預測必需基因和最小基因組。其基本思路是必需基因應該是在細菌基因組中非常保守的基因,而非必需基因則不會在所有基因組中出現(xiàn)。美國國家生物技術(shù)信息中心 (NCBI) 的Mushegian和Koonin[5]通過對流感嗜血桿菌和生殖支原體基因組的比較分析,發(fā)現(xiàn)大約256個基因為兩者所共有的保守基因,應是細菌的必需基因。稍后 Koonin等[6]對21個細菌、古細菌和真核生物的基因組進行了比較基因組學分析,認為150個基因可以維持基本的轉(zhuǎn)錄、翻譯和復制系統(tǒng)以及簡化的修復系統(tǒng)和一小群分子伴侶,這個最小化細菌的中間代謝簡化成糖酵解,擁有原始的跨膜運輸體,沒有細胞壁。Koonin[7]進一步發(fā)現(xiàn)僅有60個蛋白質(zhì)為所有生物所共有,其中大部分參與蛋白質(zhì)翻譯,推測現(xiàn)存生物的最后共同祖先 (Simple last universal common ancestor,LUCA) 僅有500~600個基因。Gil等[8]對自由生活型細菌和胞內(nèi)共生細菌的基因組進行比較分析,總結(jié)出含206個編碼蛋白質(zhì)的必需基因核心群。
經(jīng)典遺傳學的研究是基于基因突變和表型變化的相關(guān)關(guān)系的分析來確定基因的功能,在細菌遺傳學中營養(yǎng)缺陷型的研究曾經(jīng)扮演了重要的角色。直到今天,剔除特定基因以分析其功能依然是常用的手段,不過分析和檢測的手段更為多樣和快捷,如應用基因芯片技術(shù)。這個方法也被用來確定必需基因和最小基因組。理論上講,因為剔除必需基因通常是致死性的,必需基因不可能剔除,所以可被剔除的基因是非必需基因。筆者的導師——日本慶應大學先端生命科學研究所和三菱生命科學研究所的板谷光泰教授 10余年前率先利用枯草芽胞桿菌Bacillus subtilis的自然感受態(tài)特性 (Natural competence),采用基因插入失活的實驗方法來估計最小基因組大小,他隨機挑選了79個基因位點,發(fā)現(xiàn)僅有6個位點不能被抗抗生素基因標識插入,因而得不到相關(guān)突變株。然后通過統(tǒng)計分析方法估算最小基因組大小約為562 kb[9]。此后J. Craig Venter實驗室的Hutchinson等[10]在生殖支原體和肺炎支原體中利用轉(zhuǎn)座子進行了系統(tǒng)的基因插入失活分析,即分離大量的轉(zhuǎn)座子插入突變株并測序鑒定轉(zhuǎn)座子插入位點,能被轉(zhuǎn)座子插入所破壞的基因是非必需基因。生殖支原體染色體為580 kb,僅有482個編碼蛋白質(zhì)的基因,是已知能用人工培養(yǎng)基培養(yǎng)的基因組最小的細菌[11]。他們共定位了2 200個轉(zhuǎn)座子插入位點,鑒定出130個生殖支原體基因為非必需基因。據(jù)此他們估計必需基因的數(shù)目為265~350個。后來該實驗室進一步分離僅含單個轉(zhuǎn)座子插入位點的細菌單克隆并加以定位,確認482個蛋白質(zhì)編碼基因中的382個為實驗室培養(yǎng)條件下的必需基因,還有5個必需基因有重復基因,而且43個RNA編碼基因都沒有發(fā)現(xiàn)轉(zhuǎn)座子插入。這樣他們確認387個蛋白質(zhì)編碼基因和43個RNA基因足以維持細胞的生長繁殖。即便如此,其中占28%的必需基因的功能依然未知。此后利用轉(zhuǎn)座子插入突變分析對其他細菌也進行了必需基因的鑒定工作,如霍亂弧菌 Vibrio cholerae[12]和流感嗜血桿菌[13]。在金黃葡萄球菌Staphylococcus aureus中則用反義RNA干擾法鑒定必需基因[14]。日本和歐盟的多個研究組長期分工合作對枯草芽胞桿菌進行了系統(tǒng)的研究,包括測序和功能基因組的研究,在系統(tǒng)性的定位基因插入失活基礎上,預測芽胞桿菌的必需基因為271個,這些基因大多是細胞生長、分裂、染色體復制、轉(zhuǎn)錄、翻譯、蛋白質(zhì)折疊、能量轉(zhuǎn)化和物質(zhì)代謝所需的持家基因[15]。
就目前研究最為深入的大腸桿菌而言,依然有近一半的基因功能未明,即所謂的Y基因。這些 Y基因可能多為特定生境條件下起作用的基因,而不是維持最基本的細胞代謝和繁殖所需的基因。不過需要指出的是在各種細菌中所鑒定的必需基因僅有少數(shù)功能不明,這說明我們對原核生物細胞的基本生命過程理解的空白不像以前想象的那么大。
必需基因群 (Essential gene sets) 和最小基因組是相似而有所不同的概念,最小基因組基因數(shù)目應該略大于必需基因數(shù)。細菌很多基因在功能上互補,這些基因可以分別加以剔除而不影響細胞存活,因此都是非必需基因。然而2個功能重疊的基因不可能同時加以剔除,在甲基因失活后,非必需的乙基因成為必需基因;反之亦然。這種基因突變之間關(guān)系被稱相互排斥 (Mutually exclusive),即2個基因的失活不可能同時發(fā)生。與此相反,有時某個基因不能被剔除,該基因失活對細菌是致死性的,似乎該基因是必需基因。然而在另一個基因被先行剔除的情況下,該基因可以被剔除,因此實際上是非必需基因。這種基因突變間關(guān)系被稱為相互包容 (Mutually inclusive),即2個基因可以被同時剔除。以細菌毒素基因和相應的抗毒素基因以及限制性內(nèi)切酶基因和相應的DNA修飾酶基因為例,毒素基因和內(nèi)切酶基因可以被剔除;但單獨剔除抗毒素基因或修飾酶基因是致死性的。理論上講,確定必需基因和最小基因組更可靠方法的是逐一剔除非必需基因,這需要極大的工作量,而且存在技術(shù)上的困難。
即通過逐步剔除現(xiàn)存細菌的非必需基因來縮減基因組大小直至制造出最小基因組。我們知道目前用于基因克隆的大腸桿菌菌株都進行過基因改造和優(yōu)化,失活了很多與基因重組相關(guān)的基因和限制性內(nèi)切酶-修飾酶系統(tǒng)基因,使得基因工程質(zhì)粒更加穩(wěn)定。如剔除工程菌株的非必需基因如原噬菌體、轉(zhuǎn)座子、插入序列、毒性因子基因和經(jīng)水平轉(zhuǎn)移而來的外源基因簇,可使其在實驗室和工業(yè)應用中更加有效、穩(wěn)定、安全。例如,有些原噬菌體的活化可造成工程菌的溶菌反應,轉(zhuǎn)座子和插入序列的活動也造成一些關(guān)鍵基因的失活和菌株退化。目前已有一些初步的嘗試來降低細菌基因組大小,如歐盟學者利用同源重組剔除了枯草芽胞桿菌Marburg 168株的332個非必需基因,使其基因組縮減了7.7%[16],其中包括一些原噬菌體、高AT島和大型的抗生素合成基因簇。在大腸桿菌中則有更多的嘗試[17-19],可利用的技術(shù)有噬菌體λ Red重組酶切除技術(shù),I-SceI內(nèi)切酶切除技術(shù)和Cre/loxP切除技術(shù)。在其他一些細菌中,也有相應的技術(shù)可以利用,原理大同小異,即利用細菌本身的同源重組系統(tǒng)(例如枯草芽胞桿菌) 或外源的同源重組系統(tǒng)(如λ Red噬菌體),首先人為向染色體中插入重復序列 (如Tn5轉(zhuǎn)座子),經(jīng)染色體內(nèi)部的同源重組可以切除兩段重復序列之間的染色體DNA序列。威斯康星大學Fredrick R. Blattner教授領(lǐng)導的研究組逐步剔除了大腸桿菌K-12株15%的非必需基因,發(fā)現(xiàn)基因組簡化后的細菌不僅生理正常、還具有一些明顯的優(yōu)點,如電穿孔轉(zhuǎn)化效率提高、質(zhì)粒更為穩(wěn)定[20]。
2002年美國紐約州立大學石溪分校 Eckard Wimmer教授實驗室成功利用化學方法從頭 (de novo) 合成了有感染活力的小兒麻痹癥病毒RNA[21]。2003年Venter和合作者諾貝爾化學獎得主Hamilton O. Smith等也合成了長5 386堿基對的FX-174噬菌體基因組。對Venter等而言合成小型的病毒基因組只不過是牛刀小試,他們試圖設計并合成新型細菌基因組,創(chuàng)造全新的細胞生命。具體方法是首先合成小片段核酸,再將核酸片段綴合起來形成人工染色體,然后將這條人工染色體注入本身 DNA已被破壞的細菌細胞中,人工染色體可以接管、利用現(xiàn)有的細胞機器進行基本的生命活動并合成新的細胞成分,以逐步取代原先的成分,最終變成全新的細胞,為特定的應用目標服務[22]。這種設想類似于克隆動物所用的核移植技術(shù)和計算機軟件啟動 (Boot up)計算機硬件系統(tǒng)運行。雖然這個項目受到生物倫理學家一定程度的批評和質(zhì)疑[23],還是獲得美國能源部 (DOE) 的資助和風險投資家的青睞。2007年他們成功將絲狀支原體 Mycoplasma mycoides染色體移植到另一個近緣種山羊支原體Mycoplasma capricolum細胞中[24],他們事先剔除了受體菌的修飾-限制系統(tǒng)基因。2008年初Venter和Smith小組報道成功人工設計和化學合成生殖支原體 Mycoplasma genitalium的染色體[25],他們稱之為Mycoplasma laboratorium (實驗室支原體) JCVI-1.0 (J. Craig Venter 研究所版本1.0)。但是染色體組裝的最后幾個步驟未能完全在體外試管中完成,還是借助了細菌和酵母人工染色體技術(shù),因此并非全化學合成,他們也未能將這個人工染色體轉(zhuǎn)植到山羊支原體M. capricolum受體細胞中。他們有意在人工染色體上缺失天然染色體的幾個毒素基因并在添加了供鑒定之用的水印 (Watermarks) 序列,未對基因組做其他重大修改。2009年Venter研究組利用酵母克隆了絲狀支原體M. mycoides的染色體并將之移植到山羊支原體受體細胞中[26]。2010年Venter研究所報道人工合成絲狀支原體的染色體 (JCVI-syn1.0) 并將之轉(zhuǎn)入聚二乙醇處理過的山羊支原體受體細胞[27]。在受體細胞分裂時,宿主的天然染色體和轉(zhuǎn)入的人工染色體分配到不同的子細胞。從人工染色體轉(zhuǎn)錄、翻譯的蛋白質(zhì)和合成的細胞成分逐漸取代原有的細胞成分,成為全新的絲狀支原體細胞,他們稱之為合成細胞 (Synthetic cell)。這一途徑類似強化的基因克隆,并非像他們最初設計的那樣將合成的染色體轉(zhuǎn)入去除本身DNA的空細菌細胞中并使其接管細胞機器、合成全新細胞所需的組分。這一成就在世界范圍內(nèi)引起很大的反響,但大多數(shù)同行生物學家對聲稱創(chuàng)造“合成細胞”的說法大多不以為然,因為這個人工染色體絕大部分信息來自天然細胞而且大部分工作的完成也需借助天然細胞。一般認為人造細菌因缺乏抗逆基因和機制,非常脆弱,不可能獨立在自然條件下生存,應該不會帶來很大的環(huán)境和生態(tài)風險。
正如常規(guī)的工程和制造項目一樣,為制造最優(yōu)人工細胞,利用計算機模擬來輔助藍圖設計是必要的一步。當今生物學也從描述性向定量化發(fā)展,生物信息學和系統(tǒng)生物學將遺傳發(fā)育和細胞物質(zhì)能量代謝等生命活動信息化、數(shù)字化,以整體性、全方位角度來模擬、詮釋生命活動的動態(tài)性質(zhì)。筆者的導師——慶應大學富田勝教授領(lǐng)導的研究室與Venter實驗室合作,根據(jù)支原體測序和基因組分析的結(jié)果,1997年率先成功利用所開發(fā)的電子細胞 (E-Cell) 軟件包建立了包括 127個必需基因的計算機細胞模型[28]。這個高度簡化的虛擬細胞 (Virtual cell) 能進行轉(zhuǎn)錄和翻譯,利用糖酵解途徑分解葡萄糖產(chǎn)生ATP,從環(huán)境中吸收脂肪酸和甘油合成細胞膜所需的磷脂,但它不能繁殖和進化。后來他們又建立了紅血球細胞和線粒體等模型。大腸桿菌是已有百年研究歷史、研究最為深入的模型生物,時至今日也是最常用的生物工程菌和工具。相關(guān)生理生化和代謝物定量數(shù)據(jù)也最為豐富,代謝網(wǎng)絡和代謝物流束(Metabolite fluxes) 分析與模擬已經(jīng)有較長的歷史。富田實驗室計劃用10~20年時間建立大腸桿菌的全細胞計算機模型。數(shù)年前即建立先端生命科學研究所,組織了包括生物學、分析化學和生物信息學等多學科的專家群體,采取“干”、“濕”并舉的策略,不但廣泛收集文獻中的現(xiàn)有數(shù)據(jù),并進行大量的分析測試工作,大規(guī)模采集包括大腸桿菌的轉(zhuǎn)錄組學、蛋白組學、相互作用組學和代謝組學的數(shù)據(jù)。其代謝組學分析以毛細管電泳-質(zhì)譜聯(lián)用分析為主,也利用碳同位素標記分析大腸桿菌代謝物質(zhì)流束,規(guī)模居世界之冠。同時也為味精、釀酒、食品和制藥等企業(yè)及大學和研究開發(fā)機構(gòu)提供代謝組學分析服務。最近他們在美國Science雜志上報道了大規(guī)模、多層次、高通量的分析結(jié)果,表明大腸桿菌的代謝物質(zhì)網(wǎng)絡非常健壯 (Robust),個別能量代謝酶基因的剔除 (遺傳擾動) 對基因表達、核糖核酸、蛋白質(zhì)和代謝物質(zhì)水平的干擾很小,因為代謝流束可能轉(zhuǎn)向進入其他代謝途徑。雖然為響應環(huán)境條件的變化,大腸桿菌可非?;钴S地調(diào)節(jié)基因的表達(核糖核酸和蛋白質(zhì)) 來維持穩(wěn)定代謝物水平,代謝物質(zhì)量變化很小[29]。此外,加拿大阿爾伯塔大學生物分子設計研究院的 Gordon Broderick和Michael Ellison教授所建立的模型成為網(wǎng)絡細胞 (Cyber Cell),不同于常用的基于微分方程的代謝網(wǎng)絡和流束分析模型,他們致力于高清晰度的原子分子水平細胞活動的模擬。美國加州大學圣迭戈分校的Bernard Palsson教授領(lǐng)導的實驗室建立了包括大腸桿菌模型在內(nèi)的一系列硅片上生物 (In silico organisms) 和模擬平臺SimPheny。歐洲方面,荷蘭阿姆斯特丹自由大學的 Hans Westerhoff教授也發(fā)起了硅片細胞(Silicon cell) 項目。美國由普渡大學的 Barry Wanner教授牽頭發(fā)起了大腸桿菌模型細胞協(xié)作組 (E. coli model cell consortium, Emc2,源自愛因斯坦質(zhì)能方程E=mc2)。2002年相關(guān)學者組成了國際大腸桿菌聯(lián)盟 (International E. coli Alliance, IECA),有北美、日本和歐洲的多位科學家參與合作。1999年美國康涅狄格大學健康科學中心的Leslie Loew博士在國立衛(wèi)生研究院的支持下建立虛擬細胞 (Virtual cell) 和 NRCAM項目 (National resource for cell analysis and modelling)。他們主要以真核細胞為模擬對象,如建立神經(jīng)細胞鈣離子轉(zhuǎn)運的模型。目前這些計算機建模工作遇到的最大問題是缺乏統(tǒng)一、可靠的定量數(shù)據(jù),最完備的生物代謝途徑和代謝物質(zhì)數(shù)據(jù)庫是日本京都大學化學研究所金久實教授領(lǐng)導建立的京都基因和基因組百科全書(KEGG),包括KEGG LIGAND數(shù)據(jù)庫和KEGG PATHWAY數(shù)據(jù)庫[30-31]。
前幾年由德國、英國和匈牙利學者組成的研究組利用大腸桿菌代謝物流束平衡模型來模擬昆蟲細胞內(nèi)共生細菌 Buchnera aphidicola和Wigglesworthia glossinidia的進化過程。大腸桿菌是這兩種細菌的遠源祖先。模擬結(jié)果表明連續(xù)性的基因丟失可導致最小核心代謝網(wǎng)絡的形成,并可根據(jù)兩種胞內(nèi)共生細菌各自的環(huán)境條件預測出其基因組成上的差異[32]。另外,他們認為單個基因失活法大大低估了自由生活型細菌所需的最小基因組大小,可能達45%之多,即實際上可能的最小基因組應為該方法所估計的2倍。這樣實際的最小基因組就接近現(xiàn)存可以用培養(yǎng)基培養(yǎng) (亦即能脫離宿主細胞自由生長) 的細菌支原體的基因組大小。
必需基因和最小基因組的研究不僅具有理論意義,即探討生命的本質(zhì)和生命的起源和進化問題,而且具有重要的實用價值。病原細菌抗藥性是愈來愈嚴重的問題之一,而篩選、開發(fā)新型抗生素的努力還遠遠不夠,鑒定細菌必需基因可以提供新的藥物靶標?,F(xiàn)存藥用抗生素的作用靶標僅集中在 15個必需基因所編碼的細菌正常生長和繁殖所必需的細胞成分,如細胞壁和核糖體[10]。
人類利用細菌發(fā)酵已經(jīng)有很長的歷史,如乳酸菌和醋酸菌。目前經(jīng)篩選和基因改造的工程菌在工業(yè)產(chǎn)品生產(chǎn)、新材料、能源和環(huán)境污染凈化等多個領(lǐng)域具有更加廣泛的應用。最近日本學者將阿維鏈霉菌Streptomyces avermitlis 8.2 Mb (百萬堿基對) 的線狀染色體中約1.4 Mb的片段切除后可以作為異源基因簇的表達宿主高效合成多種抗生素[33]。
美國和日本均投入巨資進行微生物基因組和功能基因組學的研究,美國有關(guān)研究由能源部支持和管理,日本方面的研究則由經(jīng)產(chǎn)省新能源開發(fā)機構(gòu) (NEDO) 支持,日本也特別重視極端微生物如深海微生物的研究。DOE和世界各國其他機構(gòu)已支持完成超過1 000個細菌基因組的測序,目前主要進行功能基因組學研究。另外,環(huán)境基因組學也為微生物的開發(fā)利用帶來新的機遇。目前可分離培養(yǎng)的微生物不到1%,絕大多數(shù)的細菌難以人工培養(yǎng),阻礙了研究開發(fā)和應用。以前某些分子生物學技術(shù)已被應用于環(huán)境微生物學研究和微生物檢測等?,F(xiàn)在環(huán)境宏基因組學 (Metagenomics) 方興未艾,可直接分離環(huán)境中的DNA利用短槍法和第二代測序技術(shù)進行大規(guī)模測序,以計算機組裝、重建還不能分離純培養(yǎng)的細菌完整的基因組序列,從中可以發(fā)現(xiàn)有用的遺傳資源,如變形菌視紫紅質(zhì)(Proteorhodopsin) 基因,并確定特定生境的微生物群落結(jié)構(gòu)。還可以提供可用的遺傳資源信息,有朝一日可以通過合成細菌直接組裝利用這些遺傳資源。
人工建立最小基因組具有應用潛力,工程細菌的基因組越簡單,細胞的結(jié)構(gòu)和代謝途徑也越簡化,用于維持自身生長繁殖所需的資源和能量越少,細菌可更為有效地將資源轉(zhuǎn)化為人類所需的特定產(chǎn)品,減少資源浪費。另一方面,由于工程菌本身的代謝物成分較為簡單,目標產(chǎn)物如重組蛋白的分離和純化更為容易。日本經(jīng)產(chǎn)省新能源開發(fā)機構(gòu)于2001年啟動“最小基因組工廠”(Minimum genome factory) 研究計劃,旨在構(gòu)建基因組的工程菌用于工業(yè)生產(chǎn)。另外未來人工細菌或工程菌也可能用作疫苗和藥物的載體??梢匀斯ず铣蓽p毒菌以獲得更安全的疫苗,目前美國已有公司在開展這一方面的研發(fā)工作。
另外,與縮減基因組的努力相反,日本慶應大學的板谷光泰教授和同事在NEDO的支持下,經(jīng)過數(shù)年的努力,成功將藍藻集胞藻Synechocystis PCC6803的整個基因組逐漸轉(zhuǎn)入并分成4個大片段整合到枯草芽胞桿菌的染色體中,創(chuàng)造了前所未有的雜種細菌[34]。這個細菌中大部分藍藻基因沉默,也沒有光合活性,因為藍藻核糖體RNA操縱子基因不能成功轉(zhuǎn)入芽胞桿菌,正因為如此,藍藻染色體才能保持穩(wěn)定。與此類似,在人工合成生殖支原體染色體工作中所克隆DNA序列上的基因產(chǎn)物可能大都是不完整的斷片而毒性很小,因為其色氨酸密碼子(UGA) 在宿主中是翻譯終止密碼子[25]。后來,板谷小組又成功將水稻的葉綠體基因組和小鼠的線粒體基因組轉(zhuǎn)入芽胞桿菌[35]。這說明除縮減細菌基因組規(guī)模外,目前微生物學家已經(jīng)有能力大規(guī)模操縱和改造細菌基因組,可以將分散在適應不同生境和生態(tài)位的不同細菌中的基因資源加以整合和集成,提高資源和能源轉(zhuǎn)化效率,創(chuàng)造用于分解難降解污染物或合成新型化合物的生物代謝途徑和能源轉(zhuǎn)化的生物。此外微生物燃料電池和微藻產(chǎn)油、產(chǎn)氫技術(shù)雖然尚不能大規(guī)模應用,但歐洲、美國和日本的相關(guān)研究并沒有中斷。微生物基因組工程、代謝工程和剛剛起步的合成生物學 (Synthetic biology) 也許是解決未來世界能源、資源和環(huán)境問題的關(guān)鍵所在。
[1] Schr?dinger E. What Is Life? The Physical Aspect of the Living Cell. 1st ed. Cambridge: The University Press, 1944: 1?92.
[2] Pérez-Brocal V, Gil R, Ramos S, et al. A small microbial genome: the end of a long symbiotic relationship? Science, 2006, 314(5797): 312?313. [3] Nakabachi A, Yamashita A, Toh H, et al. The 160-kilobase genome of the bacterial endosymbiont Carsonella. Science, 2006, 314(5797): 267.
[4] Andersson SGE. The bacterial world gets smaller. Science, 2006, 314(5797): 259?260.
[5] Mushegian AR, Koonin EV. A minimal gene set for cellular life derived by comparison of complete bacterial genomes. Proc Natl Acad Sci USA, 1996, 93(19): 10268?10273.
[6] Koonin EV. How many genes can make a cell: the minimal-gene-set concept. Annu Rev Genomics Hum Genet, 2000, 1(1): 99?116.
[7] Koonin EV. Comparative genomics, minimal gene-sets and the last universal common ancestor. Nature Rev Microbiol, 2003, 1(2): 127?136.
[8] Gil R, Silva FJ, Peretó J, et al. Determination of the core of a minimal bacterial gene set. Microbiol Mol Biol Rev, 2004, 68(3): 518?537.
[9] Itaya M. An estimation of minimal genome size required for life. FEBS Lett, 1995, 362(3): 257?260.
[10] Hutchison CA, Peterson SN, Gill SR, et al. Global transposon mutagenesis and a minimal Mycoplasma genome. Science, 1999, 286(5447): 2165?2169.
[11] Fraser CM, Gocayne JD, White O, et al. The minimal gene complement of Mycoplasma genitalium. Science, 1995, 270(5235): 397?404.
[12] Judson N, Mekalanos JJ. TnAraOut, a transposon-based approach to identify and characterize essential bacterial genes. Nat Biotechnol, 2000, 18(7): 740?745.
[13] Akerley BJ, Rubin EJ, Novick VL, et al. A genome-scale analysis for identification of genes required for growth or survival of Haemophilus influenzae. Proc Natl Acad Sci USA, 2002, 99(2): 966?971.
[14] Forsyth RA, Haselbeck RJ, Ohlsen KL, et al. A genome-wide strategy for the identification of essential genes in Staphylococcus aureus. Mol Microbiol, 2002, 43(6): 1387?1400.
[15] Kobayashi K, Ehrlich SD, Albertini A, et al. Essential Bacillus subtilis genes. Proc Natl Acad Sci USA, 2003, 100(8): 4678?4683.
[16] Westers H, Dorenbos R, Van Dijl JM, et al. Genome engineering reveals large dispensable regions in Bacillus subtilis. Mol Biol Evol, 2003, 20(12): 2076?2090.
[17] Yu BJ, Sung BH, Koob MD, et al. Minimization of the Escherichia coli genome using a Tn 5-targeted Cre/loxP excision system. Nat Biotechnol, 2002, 20(10): 1018?1023.
[18] Kolisnychenko V, Plunkett G, Herring CD, et al. Engineering a reduced Escherichia coli genome. Genome Res, 2002, 12(4): 640?647.
[19] Goryshin IY, Naumann TA, Apodaca J, et al. Chromosomal deletion formation system based on Tn5 double transposition: use for making minimal genomes and essential gene analysis. Genome Res, 2003, 13(4): 644?653.
[20] Pósfai G, Plunkett G III, Fehér T, et al. Emergent properties of reduced-genome Escherichia coli. Science, 2006, 312(5776): 1044?1046.
[21] Cello J, Paul AV, Wimmer E. Chemical synthesis of poliovirus cDNA: generation of infectious virus in the absence of natural template. Science, 2002, 297(5583): 1016?1018.
[22] Zimmer C. Tinker, tailor: can Venter stitch together a genome from scratch? Science, 2003, 299(5609): 1006?1007.
[23] Cho MK, Magnus D, Caplan AL, et al. Ethical considerations in synthesizing a minimal genome. Science, 1999, 286(5447): 2087?2090.
[24] Lartigue C, Glass JI, Alperovich N, et al. Genome transplantation in bacteria: changing one species to another. Science, 2007, 317(5838): 632?638.
[25] Gibson DG, Benders GA, Andrews-Pfannkoch C, et al. Complete chemical synthesis, assembly, and cloning of a Mycoplasma genitalium genome. Science, 2008, 319(5867): 1215?1220.
[26] Lartigue C, Vashee S, Algire MA, et al. Creating bacterial strains from genomes that have been cloned and engineered in yeast. Science, 2009, 325(5948): 1693?1696.
[27] Gibson DG, Glass JI, Lartigue C, et al. Creation of a bacterial cell controlled by a chemically synthesized genome. Science, 2010, 329(5987): 52?56.
[28] Tomita M, Hashimoto K, Takahashi K, et al. E-CELL: software environment for whole-cell simulation. Bioinformatics, 1999, 15(1): 72?84.
[29] Ishii N, Nakahigashi K, Baba T, et al. Multiple high-throughput analyses monitor the response of E. coli to perturbations. Science, 2007, 316(5824): 593?597.
[30] Kanehisa M. A database for post-genome analysis. Trends Genet, 1997, 13(9): 375?376.
[31] Kanehisa M, Goto S, Hattori M, et al. From genomics to chemical genomics: new developments in KEGG. Nucleic Acids Res, 2006, 34(Suppl 1): D354?D357.
[32] Pál C, Papp B, Lercher MJ, et al. Chance and necessity in the evolution of minimal metabolic networks. Nature, 2006, 440(7084): 667?670.
[33] Komatsu M, Uchiyama T, ōmura S, et al. Genome-minimized Streptomyces host for the heterologous expression of secondary metabolism. Proc Natl Acad Sci USA, 2010, 107(6): 2646?2651.
[34] Itaya M, Tsuge K, Koizumi M, et al. Combining two genomes in one cell: stable cloning of the Synechocystis PCC6803 genome in the Bacillus subtilis 168 genome. Proc. Natl Acad Sci USA, 2005, 102(44): 15971?15976.
[35] Itaya M, Fujita K, Kuroki A, et al. Bottom-up genome assembly using the Bacillus subtilis genome vector. Nat Methods, 2007, 5(1): 41?43.