周安佩 陳曦顏 梁堅(jiān)坤
(1九江學(xué)院江西油茶研究中心 江西九江 332000;2江西農(nóng)業(yè)大學(xué)園林與藝術(shù)學(xué)院 江西南昌 330000;3凱里學(xué)院建筑工程學(xué)院 貴州凱里 556011)
山茶屬是山茶科中種類最多的一個(gè)屬,共約20個(gè)組超280種[1]。中國(guó)是山茶屬植物的主要富集區(qū)域,包含4個(gè)亞屬(茶亞屬、山茶亞屬、原始山茶亞屬、后生山茶亞屬)238個(gè)種,其屬內(nèi)許多植株具有較高的觀賞和經(jīng)濟(jì)價(jià)值[1-3]。油茶是山茶屬中具有生產(chǎn)價(jià)值的油用物種的統(tǒng)稱,是世界四大木本油料植物之一,油茶種子的不飽和脂肪酸達(dá)90%以上,其中油酸含量約80%,亞油酸8%,高于目前市場(chǎng)中其他常見食用油,是世人所公認(rèn)為優(yōu)質(zhì)的食用油之一[4-6]。然而,油茶的系統(tǒng)進(jìn)化關(guān)系尚不明確,僅依賴于形態(tài)學(xué)特征確定其進(jìn)化關(guān)系。
葉綠體為植物特有的細(xì)胞器,內(nèi)含一個(gè)雙鏈共價(jià)閉合環(huán)狀DNA(Chloroplast DNA,cpDNA),但缺乏組蛋白包裹和超螺旋結(jié)構(gòu)[7-8]。cpDNA由一個(gè)長(zhǎng)單拷貝序列(LSC)、短單拷貝序列(SSC),以及連接他們的兩個(gè)反向重復(fù)序列(IRa和IRb)構(gòu)成,盡管cpDNA大小不同,但基因組結(jié)構(gòu)十分保守,所含基因的數(shù)目差異較小[9-10]。早期利用葉綠體若干基因片段作為植物分類的條形碼,可作為科及以上分類單元的有效分類工具,而以整個(gè)葉綠體基因組作為植物分類的超級(jí)條形碼,已逐漸應(yīng)用于屬和種的分子輔助分類[11-12]?;诖?,該研究利用普通油茶DNA全基因組高通量測(cè)序數(shù)據(jù)組裝成完整的葉綠體基因組,解析其基因組特征,并構(gòu)建山茶屬的葉綠體基因組進(jìn)化樹,探討油茶的系統(tǒng)分類位置。
普通油茶DNA高通量reads數(shù)據(jù)來(lái)自于NCBI的SRA公共數(shù)據(jù)庫(kù)(SRP216592),采用Bowtie2軟件[13]建立reads比對(duì)索引,通過(guò)GetOrganelle軟件[14]進(jìn)行reads比對(duì)過(guò)濾,獲得葉綠體基因組相關(guān)reads,并通過(guò)SPAdes軟件[15]進(jìn)行序列組裝,獲得的fastg序列導(dǎo)入Bandage軟件[16]進(jìn)行數(shù)據(jù)篩選,獲得LSC、SSC和雙向重復(fù)的IR區(qū)域,組裝出葉綠體基因組fasta序列。根據(jù)參考基因組的注釋信息(GenBank登錄號(hào):KY406750.1),用Geneious軟件(Biomatters Ltd, Auckland, New Zealand)對(duì)油茶進(jìn)行注釋,獲得完整的葉綠體基因組序列和注釋信息。
在NCBI中下載茶屬物種的葉綠體基因組,包含4個(gè)亞屬13個(gè)組44個(gè)種共46份樣。以石筆木的葉綠體基因組(GenBank登錄號(hào):KY406765.1)為外類群,采用MrBayes軟件[17]的Bayes模型構(gòu)建系統(tǒng)發(fā)育樹,其進(jìn)化模型通過(guò)JModeltest[18]比較分析,以AIC為準(zhǔn)則進(jìn)行篩選,采用馬兒科夫鏈(Markov Chain Monte Carlo Process)的蒙特卡洛法,以隨機(jī)樹為起始,運(yùn)行1000000代,每100代抽樣1次,舍棄掉2500個(gè)老化樣本(占25%)后,以剩余樣本構(gòu)建一致樹。
如表1所示,組裝出來(lái)的油茶葉綠體基因組大小為156,939 bp,GC含量為37.3%。其中大環(huán)LSC長(zhǎng)86 644bp,小環(huán)SSC長(zhǎng)18 407bp,反向重復(fù)序列區(qū)域IR長(zhǎng)25 944bp。整個(gè)基因組共檢測(cè)到132個(gè)基因,其中蛋白編碼基因數(shù)為87個(gè)(15個(gè)含有內(nèi)含子),tRNA的數(shù)量為37個(gè)(8個(gè)含有內(nèi)含子),rRNA數(shù)為8個(gè),葉綠體基因組特征見圖1。
比較已公布的油茶葉綠體基因組,其基因組長(zhǎng)度變幅為156939~156995bp,僅相差56 bp。除NC 023084.1外,3株油茶樣本的葉綠體基因組LSC區(qū)域的長(zhǎng)度差異較小,僅為9 bp、而SSC區(qū)域和IR區(qū)域的長(zhǎng)度差異較大,分別為111 bp和83 bp。樣本NC 023084.1的SSC長(zhǎng)度偏大(>5041bp),IRa和IRb區(qū)域的長(zhǎng)度不相等,表明其基因組序列和注釋有誤。4株油茶樣本的基因數(shù)量變幅為132~136,主要表現(xiàn)于tRNA數(shù)量的變化。
表1 不同油茶葉綠體基因組特征的比較
圖1 油茶葉綠體基因組的基因分布圖
基于葉綠體全基因組序列的Bayes系統(tǒng)發(fā)育樹顯示,山茶屬物種的進(jìn)化關(guān)系十分復(fù)雜。除疏齒大廠茶(金花茶組)外,茶亞屬中的茶組與金花茶組具有明顯不同的分類位置。金花茶組物種可分為2個(gè)組,其中金花茶、龍州金花茶、中東金花茶3個(gè)種組成第1個(gè)組,且與五柱滇山茶(原始山茶亞屬)的構(gòu)成一個(gè)大組,其余金花茶組物種全部歸為第2個(gè)組。山茶亞屬的分類較為混亂,分布于進(jìn)化樹的各級(jí)分支,其中毛藥山茶(紅山茶組,山茶亞屬)與后生山茶亞屬的尖連蕊茶和長(zhǎng)管連蕊茶聚為一個(gè)分支,而紅山茶組的毛蕊紅山茶、怒江紅山茶、西南紅山茶與毛柄連蕊茶(后生山茶亞屬)和丹寨禿茶(禿茶組,茶亞屬)具為一個(gè)分支。小黃花茶屬山茶亞屬的小黃花茶組,但卻與茶亞屬茶組植物親緣關(guān)系較近。山茶亞屬的油茶組的分類位置較為明確,其所有物種和紅山茶組少數(shù)物種能聚集在一個(gè)大分支中,越南抱莖茶(未分類)、皺葉瘤果茶(未分類)和大苞山茶(原始山茶亞屬)也可歸入該分支。4份油茶樣本中,除MF541730.2外,其余三株均與落瓣油茶的親緣關(guān)系最近。
高等植物體內(nèi)含有3套基因組信息,分別為核基因組、線粒體基因組和葉綠體基因組。其中線粒體基因組進(jìn)化速率較慢,分子內(nèi)重組現(xiàn)象廣泛,并不適合用于系統(tǒng)分類進(jìn)化研究[19]。而核基因組的結(jié)構(gòu)復(fù)雜,需大量篩選單拷貝或低拷貝的直系同源基因,限制了其在系統(tǒng)發(fā)育研究中的應(yīng)用[20]。葉綠體基因組進(jìn)化速度適中,其基因幾乎不受旁系同源基因的干擾,且均單系遺傳,避免了基因重組現(xiàn)象,十分適合用于物種的系統(tǒng)發(fā)育和分類位置研究[21]。Shi等[22]首先鑒定出了油茶的葉綠體基因組(NC023084.1),并分析了其中ycf15基因的進(jìn)化模式。Zhang等[23]對(duì)栽培于海南的普通油茶葉綠體基因組(MF541730.1)進(jìn)行了特征描述。Yu等[24]在對(duì)山茶科多樣化歷史研究中也組裝獲得了普通油茶的葉綠體基因組(KY406750.1)。該研究組裝獲得的葉綠體基因組與以上3份基因組的特征相似,其總長(zhǎng)度和LSC區(qū)域長(zhǎng)度的差異較小,分別為56 bp和9 bp,而SSC區(qū)域和IR區(qū)域的長(zhǎng)度差異則較大,分別為111 bp和83 bp。4份樣本的CDS數(shù)和tRNA數(shù)均無(wú)差異,分別為87個(gè)和8個(gè),其gene數(shù)差異主要在于tRNA的數(shù)量不同,該研究的tRNA數(shù)為37個(gè),與樣本KY406750.1和NC023084.1的一致,但少于樣本MF541730.1的39個(gè),此不同結(jié)果可能與基因組的組裝注釋分析方法有關(guān)。
中國(guó)具有悠久的油茶栽培和利用歷史,在南方各省市縣均有廣泛的人工栽培林,相應(yīng)的加工利用也越來(lái)越深入和廣泛,是中國(guó)大力發(fā)展的脫貧攻堅(jiān)產(chǎn)業(yè)[25-26]。然而,山茶屬的系統(tǒng)進(jìn)化研究較為落后,主要基于形態(tài)特征進(jìn)行劃分,而基于分子數(shù)據(jù)的系統(tǒng)發(fā)育分析較少。普通油茶為山茶屬中分布最廣的物種之一,其分類位置尚不明確,秦聲遠(yuǎn)[27]對(duì)油茶系統(tǒng)發(fā)育進(jìn)行了分析,結(jié)果顯示,來(lái)自于比較轉(zhuǎn)錄組的450個(gè)直系同源基因支持油茶組獨(dú)立,將油茶組物種劃分為一個(gè)單獨(dú)的分支,部分短柱油茶組物種可以歸并入油茶組。本研究基于葉綠體全基因組構(gòu)建的Bayes樹支持油茶組的獨(dú)立,且與同亞屬紅山茶組的山茶(C. japonica)、浙江紅山茶(C. chekiangoleosa)、杜鵑紅山茶(C. azalea),以及短柱茶(C. brevistyla,山茶亞屬短柱茶組)、紅皮糙果茶(C.crapnelliana,山茶亞屬糙果茶組)和大苞山茶(C.granthamiana,原始山茶亞屬古茶組)聚為一個(gè)大分支。落瓣油茶(C.kissii)與普通油茶具有最近的親緣關(guān)系,其葉綠體基因組序列差異小于普通油茶種內(nèi)不同個(gè)體的差異,可考慮進(jìn)行種的合并。