国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基因組時(shí)代的植物系統(tǒng)發(fā)育研究進(jìn)展

2023-03-09 14:54:04賀文闖向坤莉武志強(qiáng)顧翠花
關(guān)鍵詞:基因組學(xué)葉綠體類群

王 杰,賀文闖,向坤莉,武志強(qiáng),3,顧翠花

(1.浙江農(nóng)林大學(xué) 風(fēng)景園林與建筑學(xué)院 浙江省園林植物種質(zhì)創(chuàng)新與利用重點(diǎn)實(shí)驗(yàn)室/南方園林植物種質(zhì)創(chuàng)新與利用國家林業(yè)和草原局重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 311300;2.中國農(nóng)業(yè)科學(xué)研究院 深圳農(nóng)業(yè)基因組研究所,廣東 深圳 518120;3.佛山鯤鵬現(xiàn)代農(nóng)業(yè)研究院,廣東 佛山 528200)

系統(tǒng)發(fā)育(phylogeny)的雛形最早出自達(dá)爾文在《物種起源》中手繪的代表物種進(jìn)化關(guān)系的“生命之樹”。達(dá)爾文認(rèn)為:地球上所有的生物都起源于一個(gè)共同的祖先,所有生命之間的譜系關(guān)系都可以通過生命之樹的“枝條”進(jìn)行展示,無論是現(xiàn)存的還是已經(jīng)滅絕的生物,都可以在這棵樹上找到屬于自己的位置[1?2]。盡管生命形式多樣化,但不同生命之間擁有共同的祖先和進(jìn)化歷史,因而存在著緊密或疏遠(yuǎn)的聯(lián)系和淵源。開展進(jìn)化生物學(xué)研究的重要前提之一就是要正確構(gòu)建和理解不同生物類群之間的親緣關(guān)系,這是界定和命名物種的依據(jù),也是開展其他生物學(xué)學(xué)科研究的理論基礎(chǔ)[3]。因此,如何通過建立科學(xué)可靠的系統(tǒng)發(fā)育樹,從而將各生物類群之間的親緣關(guān)系清晰形象地展示出來,不僅是系統(tǒng)發(fā)育研究的重點(diǎn),也是解析生物類群起源擴(kuò)散、性狀演化和成種機(jī)制的前提,是生物學(xué)研究的重要內(nèi)容[3]。

伴隨著測(cè)序技術(shù)的發(fā)展和測(cè)序成本的降低,不同物種的全部基因序列,即基因組數(shù)據(jù)能夠被獲取和研究,使得基因組學(xué)(genomics)得到了快速的發(fā)展,也使得大規(guī)模的分子數(shù)據(jù)集能夠被應(yīng)用于系統(tǒng)發(fā)育學(xué)(phylogenetics)的研究領(lǐng)域,成為系統(tǒng)發(fā)育基因組學(xué)(phylogenomics)。對(duì)于大部分植物類群而言,除了2套半自主性遺傳的細(xì)胞器基因組?葉綠體基因組(chloroplast DNA,cpDNA)與線粒體基因組(mitochondrial DNA,mtDNA)外,遺傳信息龐大的核基因組(nuclear DNA,ncDNA)包含了大量的信息位點(diǎn),因此,不同基因組數(shù)據(jù)集根據(jù)其自身特點(diǎn)能被整合應(yīng)用于不同水平的植物類群系統(tǒng)發(fā)育學(xué)研究。本研究綜述了基因組時(shí)代植物系統(tǒng)發(fā)育基因組學(xué)研究進(jìn)展,對(duì)不同基因組數(shù)據(jù)特征及其在植物系統(tǒng)發(fā)育研究應(yīng)用中的前景和局限進(jìn)行了探討,以期為研究植物系統(tǒng)發(fā)育關(guān)系提供參考。

1 系統(tǒng)發(fā)育研究發(fā)展

在核苷酸序列和蛋白序列等分子證據(jù)被大規(guī)模開發(fā)和應(yīng)用之前,早期的系統(tǒng)發(fā)育研究都是建立在化石記錄、物種形態(tài)學(xué)和生理學(xué)特征比較的基礎(chǔ)上,如花部結(jié)構(gòu)、果實(shí)類型、花粉性狀、葉片形狀及表皮解剖性狀等,從而構(gòu)建出物種進(jìn)化歷史的主要框架[4?5],但這種方法極大依賴于生物學(xué)家自身對(duì)物種的認(rèn)識(shí)和對(duì)不同分類特征的把握,無法得到客觀方法的有效驗(yàn)證,也很難獲得統(tǒng)一的結(jié)論,不同學(xué)者之間的意見常有沖突。隨著分子DNA證據(jù)的不斷加入,系統(tǒng)發(fā)育研究能被程序化、可檢驗(yàn)的分析方法所重建,極大提高了系統(tǒng)發(fā)育關(guān)系的穩(wěn)定性。相對(duì)于形態(tài)性狀,分子性狀具有可遺傳、容易確定同源性、系統(tǒng)發(fā)育信息豐富等優(yōu)點(diǎn),因此,根據(jù)分子數(shù)據(jù)所建立的系統(tǒng)發(fā)育關(guān)系更能真實(shí)地反映類群的進(jìn)化歷史[2]。分子數(shù)據(jù)用于系統(tǒng)發(fā)育研究同樣經(jīng)歷了從利用1,5-二磷酸核酮糖羧化酶/加氧酶大亞基(ribulose-1,5-bisphosphate carboxylase/oxygenase large subunit,rbcL)或成熟酶 K(maturase K,matK)等單個(gè)編碼基因以及細(xì)胞核內(nèi)轉(zhuǎn)錄間隔區(qū) (internal transcribed spacer,ITS)[6?7],到多基因或分子片段聯(lián)合[8?9],再到整合利用大規(guī)?;蚪M數(shù)據(jù)[10?12],即系統(tǒng)發(fā)育基因組學(xué)的發(fā)展過程。由于利用單基因或聯(lián)合少數(shù)基因所構(gòu)建的系統(tǒng)發(fā)育樹會(huì)受到信息位點(diǎn)不足、水平基因轉(zhuǎn)移(horizontal gene transfer,HGT)、旁同源基因(paralog)以及基因進(jìn)化速率異質(zhì)性等因素的影響,缺乏高分辨率,因此全基因組數(shù)據(jù)成為更優(yōu)選擇,尤其是測(cè)序手段的發(fā)展和測(cè)序成本的降低使得越來越多的基因組資源被提供,系統(tǒng)發(fā)育研究也正式進(jìn)入了基因組學(xué)的“黃金時(shí)代”。

系統(tǒng)發(fā)育基因組學(xué)是進(jìn)化生物學(xué)領(lǐng)域中由系統(tǒng)發(fā)育學(xué)和基因組學(xué)交叉結(jié)合所形成的,研究個(gè)體間、群體間或物種間進(jìn)化關(guān)系的學(xué)科,主要研究?jī)?nèi)容不僅包括在基因組水平上用大規(guī)模的分子數(shù)據(jù)研究生物之間的系統(tǒng)發(fā)育關(guān)系,也可以反過來利用進(jìn)化關(guān)系研究基因組的進(jìn)化機(jī)制[3]。系統(tǒng)發(fā)育基因組學(xué)以包含生物所有遺傳信息的基因組為研究基礎(chǔ),利用不同類型的基因組(核基因組、線粒體基因組,以及植物中存在的葉綠體基因組)數(shù)據(jù)來構(gòu)建系統(tǒng)發(fā)育樹,以解析分類單元的系統(tǒng)發(fā)育關(guān)系,研究物種類群的進(jìn)化歷史(表1)。由于基因組能提供更多的分子性狀,系統(tǒng)發(fā)育基因組學(xué)在解決疑難系統(tǒng)發(fā)育關(guān)系,如快速輻射類群的系統(tǒng)關(guān)系、孑遺類群的系統(tǒng)位置等應(yīng)用廣泛。

表 1 基于不同基因組數(shù)據(jù)集的植物系統(tǒng)發(fā)育相關(guān)研究Table 1 Research on phylogenetics of plants based on various genome datasets

2 植物系統(tǒng)發(fā)育研究的主要基因組數(shù)據(jù)

2.1 葉綠體基因組特征及其在系統(tǒng)發(fā)育基因組學(xué)中的應(yīng)用

葉綠體(chloroplast)是植物細(xì)胞中特有的半自主細(xì)胞器,是植物進(jìn)行光合作用將無機(jī)碳固定為有機(jī)碳的場(chǎng)所,同時(shí)承擔(dān)生物體內(nèi)脂類等有機(jī)物的合成與儲(chǔ)藏功能,為植物提供生命活動(dòng)所需的基本物質(zhì),在植物生長中發(fā)揮十分重要的作用[28]。目前普遍被接受的內(nèi)共生起源學(xué)說認(rèn)為:葉綠體起源于約12億年前古核生物吞噬的光合藍(lán)細(xì)菌,藍(lán)細(xì)菌通過內(nèi)共生將其絕大部分基因轉(zhuǎn)移到了宿主細(xì)胞內(nèi)[29]。雖然葉綠體擁有獨(dú)立的遺傳物質(zhì),但是由于大量基因轉(zhuǎn)移到古核生物細(xì)胞內(nèi),使其正常功能的行使需要依賴于大量的核編碼蛋白,因此葉綠體是一種半自主性細(xì)胞器[9]。葉綠體基因組以很高的拷貝數(shù)存在于植物細(xì)胞中,被子植物的葉綠體基因組大小通常為120~160 kb,編碼約110個(gè)基因,結(jié)構(gòu)上通常是雙鏈環(huán)狀DNA 分子,由大單拷貝區(qū) (large single-copy region,LSC)、小單拷貝區(qū) (small single-copy region,SSC)和1對(duì)反向重復(fù)區(qū)(inverted repeats,IRs)構(gòu)成,也存在少數(shù)的線性結(jié)構(gòu)和分支形等其他多態(tài)構(gòu)型[30]。同時(shí),葉綠體基因組內(nèi)的基因數(shù)目和順序相對(duì)保守,且不容易發(fā)生重組,在大多數(shù)物種中又是單親遺傳(主要為母系遺傳),保留了很多進(jìn)化歷史中的遺傳信息,使得其成為在系統(tǒng)發(fā)育研究中很有價(jià)值的分子工具,不僅僅是基因序列,其中一些結(jié)構(gòu)特征如反向重復(fù)區(qū)邊界滑動(dòng)等在研究大尺度的進(jìn)化上也具有系統(tǒng)發(fā)育的信號(hào)[31?32]。由于具有以上特點(diǎn),葉綠體基因組已被當(dāng)作研究遺傳變異的理想分子數(shù)據(jù)資源,廣泛應(yīng)用于系統(tǒng)發(fā)育學(xué)和進(jìn)化生物學(xué)等研究領(lǐng)域[12, 14, 33?34]。

研究者通過對(duì)不同物種的葉綠體基因組進(jìn)行測(cè)序、組裝和注釋,從而得到完整的葉綠體基因組圖譜,并利用多序列比對(duì)方法獲得多物種的葉綠體基因組矩陣用于系統(tǒng)發(fā)育分析,為解決一些分類困難類群的系統(tǒng)發(fā)育關(guān)系提出了解決方案。ZHANG等[35]基于葉綠體基因組數(shù)據(jù)構(gòu)建了薔薇科系統(tǒng)發(fā)育樹,解析了薔薇科亞科間的系統(tǒng)發(fā)育關(guān)系;BARKALOV等[36]基于葉綠體基因組序列對(duì)蕨類植物系統(tǒng)發(fā)育關(guān)系進(jìn)行解析,揭示了Equisetum是蕨類植物的基部群;LI等[14]利用來自2 881種物種的葉綠體基因組的80個(gè)直系同源(ortholog)的蛋白編碼基因,構(gòu)建了迄今為止最完備的被子植物系統(tǒng)發(fā)育樹,確認(rèn)了被子植物8個(gè)主要分支和22個(gè)分支的系統(tǒng)框架,解決了諸多類群的歸屬問題;LI等[10]又利用來自4 792種開花植物的80個(gè)葉綠體直系同源基因,構(gòu)建了科級(jí)水平最為全面的開花植物系統(tǒng)發(fā)育樹,在爭(zhēng)議類群的系統(tǒng)發(fā)育關(guān)系解析上提供了更大的支持。此外,葉綠體基因組的一些基本特征,如基因含量、基因順序、內(nèi)含子有無、基因組大小、核苷酸組成和密碼子使用等也可在傳統(tǒng)分子系統(tǒng)發(fā)育基礎(chǔ)上提供一些重要的系統(tǒng)發(fā)育信息[37?38]。葉綠體上的一些結(jié)構(gòu)變化,特別是一些多基因倒置,雖比起序列信息具有較少的同源性,但同樣可以在一些難處理的系統(tǒng)發(fā)育問題中提供重要證據(jù)[39?40]。

2.2 線粒體基因組特征及其在系統(tǒng)發(fā)育基因組學(xué)中的應(yīng)用

線粒體(mitochondrion)同樣被認(rèn)為是內(nèi)共生起源的一種半自主性細(xì)胞器,源于早期的α-古蛋白菌[41]。線粒體承擔(dān)細(xì)胞生命活動(dòng)的能量供應(yīng),參與細(xì)胞內(nèi)的三羧酸循環(huán)、氧化磷酸化和磷脂合成等生物過程,具有十分重要的生理生化功能[42]。與葉綠體類似,線粒體也擁有獨(dú)立遺傳物質(zhì),能夠編碼部分與自身相關(guān)的蛋白,但仍要受到核編碼基因的調(diào)控。高等陸地植物的線粒體基因組一般包含50~60個(gè)基因,絕大部分是單親母系遺傳[43?44]。在高等植物中,線粒體基因組分子量比葉綠體基因組大,且變化范圍很大,從208 kb的油菜Brassica juncea[45]到大于2 400 kb的甜瓜Cucumis melo[46],再到目前已知最大的將近12 Mb的新疆落葉松Larix sibirica[47]。這種差異主要是由于線粒體蛋白質(zhì)編碼冗余(多拷貝)和線粒體基因組頻繁重組整合外源DNA導(dǎo)致的[48]。線粒體基因組的基因順序、基因組結(jié)構(gòu)和基因組大小在植物中是高度可變的[49]?!斑M(jìn)化悖論”是植物線粒體的一個(gè)重要進(jìn)化特征,即植物線粒體基因組序列突變率非常低,但其基因組結(jié)構(gòu)重排率卻很高[50?51]。植物線粒體基因組的序列進(jìn)化非常緩慢,核苷酸同義替代速率比植物葉綠體與核基因組分別低了幾倍到幾十倍不等,比哺乳動(dòng)物線粒體基因組甚至低了50~100倍[52]。部分物種線粒體的物理作圖和測(cè)序表明:線粒體的復(fù)雜結(jié)構(gòu)是通過自身主動(dòng)重組基因轉(zhuǎn)移到細(xì)胞核,以及其他尚不清楚的因素來塑造的。結(jié)構(gòu)分析揭示了分子內(nèi)和分子間重組的高頻率,從而形成了基因組構(gòu)型的結(jié)構(gòu)動(dòng)態(tài)組合。植物線粒體基因組的這種動(dòng)態(tài)組合為基因組結(jié)構(gòu)和進(jìn)化的研究提供了強(qiáng)有力的模型。這些線粒體基因組展示了保守的核苷酸替代速率和動(dòng)態(tài)進(jìn)化模式[53]。植物線粒體基因組在蛋白編碼基因等方面保守性高,但在基因組結(jié)構(gòu)方面變異大,對(duì)研究植物群體遺傳學(xué)和進(jìn)化具有重要的意義[54]。

低等植物如藻類和苔蘚的線粒體基因組結(jié)構(gòu)相對(duì)簡(jiǎn)單,而隨后早期的維管束植物如石松科Lycopodiaceae植物線粒體基因組就經(jīng)歷了大量的重排,但是仍然可以組裝成單分子的環(huán)形構(gòu)象,基因含量沒有太大變化。但水韭科Isoetaceae和卷柏科Selaginellaceae植物的線粒體基因組結(jié)構(gòu)則比較復(fù)雜,經(jīng)歷了大量的重排,丟失了很多基因尤其是轉(zhuǎn)運(yùn)RNA(transfer RNA,tRNA)基因,也沒有穩(wěn)定的廣譜性構(gòu)象。這種由簡(jiǎn)單趨向復(fù)雜的變異模式使得線粒體基因組通常用于高階分類單元的植物類群系統(tǒng)發(fā)育研究,如LIU等[21]利用60種苔蘚的41個(gè)線粒體基因重建了早期陸地植物間的系統(tǒng)關(guān)系。DONG等[20]基于91種被子植物代表物種的38個(gè)保守的線粒體基因進(jìn)行系統(tǒng)發(fā)育分析,結(jié)果支持木蘭類(magnoliids)植物與單子葉植物+真雙子葉植物的姐妹群關(guān)系。一般而言,植物線粒體基因組因其進(jìn)化速率較慢,在系統(tǒng)發(fā)育中應(yīng)用較少,但線粒體基因組非常適合動(dòng)物類群中的系統(tǒng)發(fā)育研究[55?56]。

2.3 核基因組特征及其在系統(tǒng)發(fā)育基因組學(xué)中的應(yīng)用

在植物細(xì)胞的3套基因組中,核基因組占據(jù)主導(dǎo)地位,其遺傳信息總量十分龐大,決定著植物大部分的生理生化功能及形態(tài)性狀特征,蘊(yùn)含豐富的遺傳變異。對(duì)于各植物類群,核基因組在大小、數(shù)量、排列以及基因組的拷貝數(shù)等方面均存在較大差異,如擬南芥Arabidopsis thaliana的基因組大小約130 Mb,油菜基因組大小1 008 Mb,而貝母屬Fritillaria物種基因組大小則達(dá)100 Gb[57]。此外,核基因組為雙親遺傳,可綜合揭示雙親譜系及系統(tǒng)網(wǎng)狀進(jìn)化關(guān)系,即使對(duì)于近緣種或種下類群,核基因組也具有一定的區(qū)分能力,因此,核基因組在系統(tǒng)發(fā)育研究中具有更大的應(yīng)用潛力,是未來植物系統(tǒng)學(xué)研究的主要發(fā)展方向[2, 58?59]。

盡管細(xì)胞器基因組(cpDNA和mtDNA)對(duì)于各植物類群的系統(tǒng)發(fā)育研究有重要的價(jià)值,但同樣也是受限于其自身的單親遺傳特性,只能體現(xiàn)單親的譜系歷史,在一些類群的系統(tǒng)發(fā)育研究中作用相對(duì)有限[60],因此包含雙親大量遺傳信息的核基因組在一些類群的系統(tǒng)發(fā)育研究中價(jià)值更大。但核基因組的測(cè)序和組裝的技術(shù)要求較高,且核基因組數(shù)據(jù)龐大,對(duì)于計(jì)算機(jī)運(yùn)算能力要求高,同時(shí)由于物種核基因組復(fù)雜的遺傳背景和遺傳特性,合適可靠的建樹方法也是限制其大規(guī)模應(yīng)用于系統(tǒng)發(fā)育研究的重要因素。目前,基于核基因組的系統(tǒng)發(fā)育研究不僅集中在解析單個(gè)物種或特定類群的系統(tǒng)位置[61],對(duì)于更高類群系統(tǒng)發(fā)育關(guān)系的解析也逐漸豐富,如金粟蘭Chloranthus spicatus[62]、睡蓮Nymphaea tetragona[63]等早期被子植物類群的核基因組解決了基部類群系統(tǒng)發(fā)育關(guān)系和物種演化的爭(zhēng)議[23]。早期核糖體RNA(ribosomal RNA,rDNA)內(nèi)的重復(fù)區(qū)序列尤其是ITS序列作為植物系統(tǒng)發(fā)育研究的主要核基因組數(shù)據(jù)被廣泛使用[64]。隨后越來越多的研究者開始使用單拷貝或低拷貝核基因。與細(xì)胞器基因組相比,單拷貝核基因不僅數(shù)量較多,還含有相對(duì)保守的外顯子以及較高堿基替換率的內(nèi)含子,可以提供較為豐富的位點(diǎn)變異信息[65]。除基因組測(cè)序外,基于轉(zhuǎn)錄組(transcriptome)、基因組淺層(genome skimming)測(cè)序、靶向富集 (target enrichment)和簡(jiǎn)化基因組測(cè)序 (reduced-representation genome sequencing,RRGS)等技術(shù)數(shù)據(jù)獲得的大量低拷貝或單拷貝基因,也可以為系統(tǒng)發(fā)育分析提供更加充足的信息位點(diǎn)[16]。單拷貝核基因或低拷貝核基因是指核基因組中僅有1份或少數(shù)拷貝的基因,可以有效避免旁系同源的干擾。轉(zhuǎn)錄組測(cè)序數(shù)據(jù)可以通過無參組裝一次性獲得批量直系同源序列(orthologous sequences),因而在種及種以上水平的系統(tǒng)發(fā)育基因組學(xué)研究中被越來越多地應(yīng)用[66]。例如“千種植物轉(zhuǎn)錄組計(jì)劃(1kP)”利用轉(zhuǎn)錄組獲得同源低拷貝基因來推斷綠色植物的系統(tǒng)發(fā)育關(guān)系,對(duì)不同植物類群的全基因組加倍(whole genome duplication, WGD)事件進(jìn)行分析,推斷了許多基因家族進(jìn)化歷史[67]。劉勉等[68]從29種物種的轉(zhuǎn)錄組數(shù)據(jù)中篩選出直系同源低拷貝核基因,對(duì)菊科Asteraceae紫菀亞科Asteroideae的系統(tǒng)發(fā)育關(guān)系進(jìn)行研究,重新界定了新的紫菀亞科族間系統(tǒng)發(fā)育關(guān)系,并揭示了多個(gè)類群雜交起源的可能性。

3 系統(tǒng)發(fā)育基因組學(xué)的主要研究方法

3.1 主要建樹算法

目前主流的建樹算法主要包括鄰接法 (neighbor joining, NJ)、最大簡(jiǎn)約法 (maximum parsimony, MP)、最大似然法 (maximum likelihood, ML)和貝葉斯推斷法 (bayesian inference, BI)。鄰接法基于最小進(jìn)化距離的假設(shè),常用于群體水平上基于單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)或單核苷酸變異(single nucleotide variant, SNV)的遺傳結(jié)構(gòu)劃分,如水稻Oryza sativa[69]、大豆Glycine max[70]、蓮Nelumbo nucifera[12]、梅花Prunus mume[71]等,鮮少獨(dú)立支撐物種以上水平進(jìn)化關(guān)系為核心的系統(tǒng)發(fā)育研究。最大簡(jiǎn)約法基于進(jìn)化過程中堿基替代數(shù)目最少這一假設(shè),適用于序列堿基差異小、變異速率近似、信息位點(diǎn)較多的序列矩陣。AMAR等[72]基于ITS序列,通過最大簡(jiǎn)約法探討了柑橘屬Citrus的系統(tǒng)發(fā)育關(guān)系,將柑橘屬解析為7個(gè)進(jìn)化枝。無論鄰接法還是最大簡(jiǎn)約法,都比較適用于較小的數(shù)據(jù)集,且由于遵循“最小最簡(jiǎn)”原則,因此當(dāng)存在堿基替換飽和、回復(fù)突變或序列差異過大時(shí),有可能產(chǎn)生如長枝吸引(long branch attraction, LBA)的問題,從而錯(cuò)誤地將枝長較長的進(jìn)化枝聚在一起。SOLTIS等[73]在利用最大簡(jiǎn)約法對(duì)被子植物的系統(tǒng)發(fā)育關(guān)系構(gòu)建時(shí)發(fā)現(xiàn):無油樟Amborella trichopoda被錯(cuò)誤地解析為比單子葉植物距離核心真雙子葉植物更近的分支,但通過增加蘭科Orchidaceae植物作為外類群后則恢復(fù)到了正常位置,指出可以通過增加合適的外類群來打破長枝吸引現(xiàn)象。最大似然法是目前為止應(yīng)用最為廣泛的系統(tǒng)發(fā)育研究方法,在解決被子植物[10]、裸子植物[74]以及科屬水平[11?12, 34]等不同階元的進(jìn)化關(guān)系中發(fā)揮重要作用。上述3種方法都需要通過自舉法(bootstrap)進(jìn)行檢驗(yàn)以確保分支可信度。

貝葉斯推斷法[75]是基于模型的統(tǒng)計(jì)推論法,可以處理復(fù)雜的進(jìn)化模型,通過后驗(yàn)概率(post probability)直觀反映出各分支的可靠程度,而不需要通過自舉法進(jìn)行檢驗(yàn)。在系統(tǒng)發(fā)育研究中,通常會(huì)綜合使用多種建樹方法推定系統(tǒng)發(fā)育關(guān)系,如WU 等[76]使用葉綠體基因組數(shù)據(jù),基于最大似然法和最大簡(jiǎn)約法對(duì)禾本科中竹亞科Bambusoideae、稻亞科Oryzoideae和早熟禾亞科Pooideae分支(BEP Clade)的系統(tǒng)發(fā)育關(guān)系進(jìn)行解析,得到了2種方法的一致支持;MU等[16]基于最大似然法和貝葉斯推斷法明確了胡桃科物種的系統(tǒng)發(fā)育位置和種間關(guān)系。

3.2 串聯(lián)法和溯祖法

目前大部分系統(tǒng)發(fā)育基因組學(xué),尤其是葉綠體系統(tǒng)發(fā)育基因組學(xué)研究采用的矩陣構(gòu)建方法是多基因串聯(lián)法(concatenate method),即將多個(gè)基因首尾串聯(lián)后經(jīng)過序列比對(duì)和處理后構(gòu)建數(shù)據(jù)矩陣,利用相應(yīng)的建樹軟件構(gòu)建系統(tǒng)發(fā)育樹[34, 65]。盡管串聯(lián)法在許多類群中取得了較好的效果,但在一定程度上仍會(huì)由于信息量不足而無法反映真實(shí)的系統(tǒng)發(fā)育關(guān)系?;蜷g的GC含量差異、進(jìn)化速率差異、堿基替換飽和度等系統(tǒng)偏差也會(huì)導(dǎo)致一系列問題,從而對(duì)最終建樹結(jié)果產(chǎn)生影響甚至誤導(dǎo)[30]。此外,當(dāng)使用大量基因進(jìn)行串聯(lián)時(shí),基因間進(jìn)化速率異質(zhì)性和直系同源的誤判、不完全譜系分選(incomplete lineage sorting,ILS)等會(huì)導(dǎo)致基因包含的系統(tǒng)發(fā)育信號(hào)彼此存在沖突,進(jìn)而影響系統(tǒng)發(fā)育重建,導(dǎo)致基因樹沖突(genetree conflict)。如 MU 等[16]基于限制性核酸內(nèi)切酶 DNA 序列 (restriction-site-associated DNA sequencing,RAD-Seq)數(shù)據(jù)和葉綠體基因組數(shù)據(jù),研究了胡桃科系統(tǒng)發(fā)育關(guān)系,在幾個(gè)關(guān)鍵節(jié)點(diǎn)上檢測(cè)到了信號(hào)沖突,需要注意基因樹沖突問題。不同于串聯(lián)法將所有基因合并為整體,溯祖法(coalescent method)首先基于單個(gè)基因構(gòu)建單基因樹,然后根據(jù)所有基因樹整合推斷最可能的系統(tǒng)發(fā)育樹[77],因此可以很好地避免不完全譜系分選導(dǎo)致的基因樹沖突。尤其是在基于核基因組的系統(tǒng)發(fā)育研究中,相比于串聯(lián)法,溯祖法能夠更好地反映真實(shí)的系統(tǒng)發(fā)育關(guān)系。ZHAO等[78]挖掘利用了全基因組和轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行薔薇類(rosids)的系統(tǒng)發(fā)育關(guān)系探索,綜合比較基于串聯(lián)法和溯祖法的系統(tǒng)發(fā)育樹后發(fā)現(xiàn):在蒺藜目Zygophyllales的位置上存在結(jié)構(gòu)沖突,且通過進(jìn)一步分析表明,串聯(lián)法可能是錯(cuò)誤的結(jié)果,而溯祖法則較好地解決了基因樹沖突問題。也有研究表明:串聯(lián)法雖然能構(gòu)建較高支持率的系統(tǒng)發(fā)育樹,但往往可能不是正確的系統(tǒng)發(fā)育關(guān)系[76]。

4 總結(jié)與展望

植物的3套基因組都可用于系統(tǒng)發(fā)育研究,但具備各自的優(yōu)勢(shì)和局限性。相較于核基因組,葉綠體基因組易于測(cè)序和組裝的特性使其在數(shù)據(jù)資源豐富度方面要遠(yuǎn)遠(yuǎn)勝過基因組數(shù)據(jù),因而目前仍是植物系統(tǒng)發(fā)育研究的主流手段。由于線粒體基因組具有高度保守性和劇烈的結(jié)構(gòu)變異,使其在大尺度以及早期綠色植物如苔蘚的系統(tǒng)發(fā)育研究中具有重要價(jià)值。但細(xì)胞器基因組的單親遺傳特性不能反映物種形成歷史過程中的雜交和基因組滲入等事件,核基因組的雙親遺傳特性能夠?yàn)榇祟悊栴}提供充分的見解,但其測(cè)序和分析成本的高昂、計(jì)算機(jī)運(yùn)行能力和方法學(xué)等因素限制了核基因組數(shù)據(jù)資源的開發(fā)和利用。但不可否認(rèn)的是,隨著測(cè)序技術(shù)的發(fā)展和成本的降低,核基因組將來會(huì)成為系統(tǒng)發(fā)育研究的主流方向。同時(shí),隨著越來越多的類群系統(tǒng)位置被確定,物種形成和進(jìn)化過程中的雜交、回交等雙親遺傳以及核質(zhì)互作、多倍化、功能適應(yīng)以及趨同進(jìn)化等問題將會(huì)成為系統(tǒng)發(fā)育研究的重點(diǎn)內(nèi)容。

猜你喜歡
基因組學(xué)葉綠體類群
基于基因組學(xué)數(shù)據(jù)分析構(gòu)建腎上腺皮質(zhì)癌預(yù)后模型
系統(tǒng)基因組學(xué)解碼反芻動(dòng)物的演化
科學(xué)(2020年2期)2020-08-24 07:56:44
薏苡種質(zhì)資源ISSR分子標(biāo)記篩選及親緣關(guān)系分析
黑石頂自然保護(hù)區(qū)土壤動(dòng)物功能類群對(duì)季節(jié)動(dòng)態(tài)的響應(yīng)
南方紅豆杉葉綠體非編碼序列PCR體系優(yōu)化及引物篩選
2011年春夏季黃海和東海微型浮游動(dòng)物類群組成及其攝食的研究
營養(yǎng)基因組學(xué)——我們可以吃得更健康
龍灣自然保護(hù)區(qū)森林土壤動(dòng)物群落多樣性及功能類群
茶樹葉綠體DNA的PCR-RFLP反應(yīng)體系優(yōu)化
煙草葉綠體密碼子的偏好性及聚類分析
陵水| 旅游| 富蕴县| 中卫市| 合作市| 板桥市| 高雄县| 浦城县| 临汾市| 饶阳县| 象州县| 舒城县| 武强县| 沂源县| 宁强县| 河源市| 乌鲁木齐市| 德令哈市| 永嘉县| 诏安县| 无棣县| 华阴市| 慈溪市| 克什克腾旗| 阿荣旗| 石嘴山市| 清镇市| 称多县| 蕲春县| 达拉特旗| 邯郸市| 麦盖提县| 蕉岭县| 乡宁县| 绥阳县| 稷山县| 铜陵市| 福海县| 多伦县| 石楼县| 喀喇沁旗|