李司宇 劉雪 王文婧 盧松霖 郝雪萌 張杰
摘要 ? ?進(jìn)化樹(shù)的構(gòu)建是當(dāng)代生命科學(xué)技術(shù)中最為重要的技術(shù)之一,可以分析未知微生物和已知微生物的親疏關(guān)系,從而進(jìn)一步獲取微生物進(jìn)化關(guān)系的重要證據(jù)。本文對(duì)微生物進(jìn)化樹(shù)的構(gòu)建進(jìn)行了研究,闡述了進(jìn)化樹(shù)的原理,梳理了相關(guān)的理論,同時(shí)全面地介紹了最常用的構(gòu)建進(jìn)化樹(shù)的軟件及其功能,詳細(xì)地介紹了微生物進(jìn)化樹(shù)的構(gòu)建方法,以期為更便捷地開(kāi)展后續(xù)研究提供參考。
關(guān)鍵詞 ? ?微生物;進(jìn)化樹(shù);構(gòu)建
中圖分類號(hào) ? ?Q393 ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼 ? ?A
文章編號(hào) ? 1007-5739(2019)19-0249-02 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID)
Construction ?of ?Microbial ?Evolutionary ?Trees
LI Si-yu ? ?Liu Xue ? ?WANG Wen-jing ? ?LU Song-lin ? ?HAO Xue-meng ? ?ZHANG Jie *
(The College of Life Science,Northeast Forestry University,Haerbin Heilongjiang 150040)
Abstract ? ?The construction of evolutionary tree is one of the most important technologies in modern life science and technology,which can analyze the affinity between unknown microorganisms and known microorganisms,so as to further obtain important evidence of microbial evolutionary relationship. In this paper,the construction of the microbial evolutionary tree was studied,the principle of the evolutionary tree was expounded,the rel-evant theories were sorted out,the most commonly used software and functions of the construction of the evolutionary tree were introduced,and the construction method of the microbial evolutionary tree was introduced in detail,so as to provide references for the convenient follow-up research.
Key words ? ?microorganism;evolutionary tree;construction
在人類的生產(chǎn)和生活中,微生物必不可少,其影響著人類生活的方方面面。微生物在人類的健康和疾病中都發(fā)揮了重要作用,因而科學(xué)家們和研究者對(duì)微生物的研究和探索日益增多[1]。微生物和地球上其他生物都像樹(shù)一樣的分化生長(zhǎng)[2],而微生物的分布通常以物種的成分或者相對(duì)豐度進(jìn)行衡量。劉娜[3]認(rèn)為在進(jìn)化樹(shù)的框架中,分支越近,物種的進(jìn)化關(guān)系越近。將微生物進(jìn)化樹(shù)的信息進(jìn)行整合,可以高效地分析微生物組的數(shù)據(jù)信息,從而確定微生物的進(jìn)化方向[4]。
1 ? ?進(jìn)化樹(shù)的概述
微生物的多樣性通常用進(jìn)化樹(shù)來(lái)表現(xiàn)。進(jìn)化樹(shù)從本質(zhì)上講是對(duì)某一物種的發(fā)育進(jìn)行分析,根據(jù)相同物種的不同性狀來(lái)分析二者之間的進(jìn)化關(guān)系。構(gòu)建進(jìn)化樹(shù)需多個(gè)學(xué)科融合,不僅包括分子生物學(xué)、遺傳學(xué)、生態(tài)學(xué)等生命科學(xué)學(xué)科,還包括統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)等數(shù)學(xué)學(xué)科,是一門交叉學(xué)科[5]。微生物進(jìn)化樹(shù)的構(gòu)建過(guò)程主要有獲取序列數(shù)據(jù)、進(jìn)化距離模型的確定、多個(gè)序列的對(duì)比、再提取對(duì)比后的結(jié)果、算法和參數(shù)的選擇[6]。目前,進(jìn)化樹(shù)的信息構(gòu)建包括了數(shù)據(jù)庫(kù)的建立、進(jìn)化樹(shù)構(gòu)建方法、進(jìn)化樹(shù)信息數(shù)據(jù)挖掘等。進(jìn)化樹(shù)數(shù)據(jù)庫(kù)的建立實(shí)際是2級(jí)數(shù)據(jù)庫(kù)的構(gòu)建,即初級(jí)數(shù)據(jù)庫(kù)和次級(jí)數(shù)據(jù)庫(kù)。構(gòu)建進(jìn)化樹(shù)方法有最小進(jìn)化法、鄰接法、最大簡(jiǎn)約法、最大似然法等[7]。
1.1 ? ?進(jìn)化樹(shù)形式
進(jìn)化樹(shù)有2種形式,無(wú)根樹(shù)和有根樹(shù)。其中,有根樹(shù)可以表現(xiàn)進(jìn)化的順序;無(wú)根樹(shù)功能單一,只能表示微生物之間的發(fā)育關(guān)系,無(wú)法說(shuō)明進(jìn)化的途徑。簡(jiǎn)單來(lái)說(shuō),就是甲、乙、丙、丁4種生物,從無(wú)根樹(shù)中可以看出甲與乙較甲與丙、丁具有更近的親緣關(guān)系;而從有根樹(shù)中不僅能夠表示出甲、乙、丙、丁的親疏關(guān)系,更能看出4種生物的起源和進(jìn)化的方向[8]。在解決現(xiàn)實(shí)的進(jìn)化樹(shù)的問(wèn)題中,常因?yàn)闊o(wú)法獲取足夠的信息來(lái)確定進(jìn)行方向,沒(méi)有足夠的證據(jù)來(lái)證明進(jìn)化樹(shù)的節(jié)點(diǎn),所以一般獲得的進(jìn)化樹(shù)都是無(wú)根的。李建伏[6]在研究中認(rèn)為,在分析進(jìn)化樹(shù)時(shí)有2個(gè)重量級(jí)的參考量即拓?fù)浣Y(jié)構(gòu)和根支長(zhǎng)度。其中,拓?fù)浣Y(jié)構(gòu)更為重要,更加受到科學(xué)家的關(guān)注。在進(jìn)化樹(shù)研究的初期,可以通過(guò)微生物的表觀特征進(jìn)行進(jìn)化分析,但是該方法具有缺陷、可信度較低。劉娜[3]曾經(jīng)在研究中表明,現(xiàn)今對(duì)于進(jìn)化分析方法的研究已經(jīng)達(dá)到了分子水平,即從蛋白質(zhì)序列出發(fā),通過(guò)進(jìn)化分析的方法,研究分析進(jìn)化的關(guān)系,得到進(jìn)化樹(shù)。這種方法從生命遺傳的角度出發(fā),使得研究結(jié)果更為可信[7]。郝柏林[9]構(gòu)建了一種新的方法,即對(duì)物種進(jìn)行矢量刻畫(huà),無(wú)需序列對(duì)比構(gòu)建進(jìn)化樹(shù)[10]。
1.2 ? ?進(jìn)化樹(shù)分析
一般采用以下幾個(gè)步驟分析進(jìn)化樹(shù):首先,對(duì)分析的進(jìn)化樹(shù)的序列目標(biāo)進(jìn)行排列,常用的排序?qū)Ρ裙ぞ邽镃LUSTALX[11]。其次,構(gòu)建完整的進(jìn)化樹(shù)。通常來(lái)說(shuō),構(gòu)建進(jìn)化樹(shù)常用的算法為獨(dú)立元素法和距離依靠法。獨(dú)立元素算法是指排列好的序列上每個(gè)堿基或者氨基酸的性狀決定了進(jìn)化樹(shù)的拓?fù)湫螤頪12]。例如,序列上的堿基狀態(tài)決定了序列上的酶切位點(diǎn)的存在和個(gè)數(shù),換言之,當(dāng)對(duì)進(jìn)化樹(shù)進(jìn)行序列分析時(shí),進(jìn)化樹(shù)的拓?fù)湫螤钜灿蓧A基的狀態(tài)來(lái)決定。距離依靠法相對(duì)于獨(dú)立元素算法來(lái)說(shuō)較為宏觀,序列間距離決定進(jìn)化樹(shù)的拓?fù)湫螤?。最后,評(píng)估進(jìn)化樹(shù)的可信度,慣用方法為自舉法,經(jīng)過(guò)反復(fù)多次的采集數(shù)據(jù),再進(jìn)行進(jìn)化樹(shù)的構(gòu)建,檢驗(yàn)結(jié)果是否穩(wěn)定。故而,自舉法通常用來(lái)檢驗(yàn)一個(gè)完整進(jìn)化樹(shù)的樹(shù)枝出現(xiàn)頻率的穩(wěn)定性以及檢驗(yàn)其可信程度。
2 ? ?構(gòu)建常用軟件
微生物進(jìn)化樹(shù)構(gòu)建采用的軟件都已成熟,例如PHYLIP、MEGA、ARB、PAML等。本文列出了常用的進(jìn)化樹(shù)構(gòu)建軟件、算法及特點(diǎn),見(jiàn)表1。
2.1 ? ?PHYLIP軟件介紹
PHYLIP是微生物進(jìn)化樹(shù)構(gòu)建最為常用的軟件,是一種多平臺(tái)的操作系統(tǒng),由Joseph Felsenstein開(kāi)發(fā)研究。它的功能極為強(qiáng)大,它可以分析蛋白質(zhì)和基因的序列,可以對(duì)酶切位點(diǎn)進(jìn)行分析,同時(shí)可以分析進(jìn)化樹(shù)的距離矩陣以及基因頻率。其具備進(jìn)化樹(shù)繪制功能,可以精準(zhǔn)的分析控制過(guò)程。PHYLIP在官網(wǎng)下載,解壓后可以看到多個(gè)軟件的壓縮包,下載后可以實(shí)現(xiàn)雙擊后自動(dòng)解壓,具有完整的進(jìn)化樹(shù)的構(gòu)建功能,主要的程序功能:①蛋白質(zhì)序列數(shù)據(jù)和DNA基因序列的分析功能,有4個(gè)不同的程序,分別為DNADIST、DNAPARS、DNAML和DNAMLK程序,共同完成進(jìn)化樹(shù)的構(gòu)建;②將序列數(shù)據(jù)進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換為距離數(shù)據(jù),再分析距離數(shù)據(jù);③可以分析基因頻率,同時(shí)進(jìn)行連續(xù)元素的分析;④可以繪制、分析和修改進(jìn)化樹(shù)的圖。
2.2 ? ?MEGA軟件介紹
MEGA軟件可以對(duì)序列進(jìn)行對(duì)比分析,同時(shí)進(jìn)行統(tǒng)計(jì)分析。在這個(gè)軟件中,進(jìn)行對(duì)比分析的方法是距離建樹(shù)法和MP建樹(shù)法,可以對(duì)序列進(jìn)行自動(dòng)或者手動(dòng)的對(duì)比。繪制進(jìn)化樹(shù)時(shí)對(duì)進(jìn)化率進(jìn)行估算,同時(shí)對(duì)結(jié)果進(jìn)行驗(yàn)證,另外其還可以連接網(wǎng)絡(luò),進(jìn)行數(shù)據(jù)庫(kù)檢索。MEGA軟件中包含的功能模塊主要有幾個(gè)功能:①對(duì)蛋白質(zhì)序列和DNA序列數(shù)據(jù)進(jìn)行分析的功能模塊;②將序列數(shù)據(jù)進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換為距離數(shù)據(jù),再分析距離數(shù)據(jù)的功能模塊;③可以分析基因頻率,同時(shí)進(jìn)行連續(xù)元素的分析的功能模塊;④將每個(gè)堿基或者氨基酸進(jìn)行獨(dú)立對(duì)待,進(jìn)行序列分析的功能模塊;⑤可以繪制、分析和修改進(jìn)化樹(shù)的圖,進(jìn)行網(wǎng)上blast搜索。
3 ? ?構(gòu)建
對(duì)一個(gè)完整的進(jìn)化樹(shù)進(jìn)行分析,主要進(jìn)行以下步驟分析。首先,鎖定目標(biāo)序列,并排列多序列目標(biāo);其次,構(gòu)建完整的進(jìn)化樹(shù)雛形;最后,評(píng)估所得到的進(jìn)化樹(shù)的可信程度。
在微生物進(jìn)化樹(shù)的構(gòu)建中最常用的軟件就是PHYLIP和MEGA 2種軟件。對(duì)這2種軟件構(gòu)建的進(jìn)化樹(shù)進(jìn)行對(duì)比和分析,可以非常清楚地了解微生物的進(jìn)化關(guān)系。
3.1 ? ?通過(guò)PHYLIP軟件進(jìn)行進(jìn)化樹(shù)的構(gòu)建
通過(guò)PHYLIP軟件構(gòu)建進(jìn)化樹(shù)的具體過(guò)程見(jiàn)圖1。
3.2 ? ?利用MEGA3.1軟件構(gòu)建菌株的系統(tǒng)發(fā)育樹(shù)
利用MEGA3.1軟件構(gòu)建進(jìn)化樹(shù)的具體過(guò)程見(jiàn)圖2。由此可知,構(gòu)建進(jìn)化樹(shù)的時(shí)間和序列的數(shù)量正相關(guān),樹(shù)枝上的數(shù)字所表示的是進(jìn)化樹(shù)可信度的比例。
4 ? ?結(jié)語(yǔ)
隨著工業(yè)化的發(fā)展、科技發(fā)展的進(jìn)步,人們?cè)絹?lái)越關(guān)注對(duì)微生物資源的利用,如微生物對(duì)重金屬離子污染的治理、微生物制藥等。對(duì)微生物進(jìn)化樹(shù)的原理進(jìn)行解釋、對(duì)進(jìn)化樹(shù)的構(gòu)建軟件工具進(jìn)行介紹、對(duì)進(jìn)化樹(shù)的構(gòu)建方法進(jìn)行詳細(xì)的描述等具有重要意義。以理論和實(shí)踐相結(jié)合的方式對(duì)進(jìn)化樹(shù)的構(gòu)建進(jìn)行研究,有利于人們對(duì)微生物的進(jìn)化關(guān)系有更深刻的理解,從而更好地進(jìn)行研究。
5 ? ?參考文獻(xiàn)
[1] 張璇.利用共生微生物研究河豚毒素的生物合成途徑[D].青島:國(guó)家海洋局第一海洋研究所,2013.
[2] 李宗瑋.基于高通量測(cè)序的微生物辨識(shí)、進(jìn)化與耐藥性生物信息學(xué)分析[D].北京:中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院,2016.
[3] 劉娜.生物序列/結(jié)構(gòu)的比較及進(jìn)化樹(shù)的構(gòu)建[D].大連:大連理工大學(xué),2007.
[4] 鄧元慧,王國(guó)強(qiáng).人類對(duì)微生物的發(fā)現(xiàn)與探索之路[J].張江科技評(píng)論,2019(2):72-77.
[5] 張晨曦.分子生物學(xué)方法在微生物多樣性研究中的應(yīng)用[J].化工管理,2017(11):124-125.
[6] 李建伏.基于DNA序列的進(jìn)化樹(shù)構(gòu)建算法的研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2008.
[7] 郭園,趙仲麟.微生物系統(tǒng)定向進(jìn)化與合成生物學(xué)應(yīng)用研究進(jìn)展[J].生物技術(shù)通報(bào),2017,33(1):76-82.
[8] 肖勇,肖長(zhǎng)燁.微生物在不同環(huán)境下的進(jìn)化機(jī)制研究進(jìn)展[J].華僑大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,40(1):1-8.
[9] 郝柏林.生物信息學(xué)[J].中國(guó)科學(xué)院院刊,2000(4):260-264.
[10]龍瑞軍,趙方慶,施鵬.高原哺乳動(dòng)物瘤胃微生物組的趨同進(jìn)化[J].科學(xué)新聞,2017(4):120.
[11] 張?jiān)?整合進(jìn)化樹(shù)信息的微生物組數(shù)據(jù)分析方法研究[D].武漢:華中師范大學(xué),2018.
[12] 朱晁誼,朱牧孜,李爽.微生物實(shí)驗(yàn)室進(jìn)化的研究進(jìn)展[J].生物加工過(guò)程,2019,17(1):8-14.