伍明理, 晏融融, 代朝霞, 徐 雪, 茍光前
(1.貴州大學(xué)生命科學(xué)學(xué)院/農(nóng)業(yè)生物工程研究院,山地植物資源保護與保護種質(zhì)創(chuàng)新教育部重點實驗室, 貴陽 550025;2.貴州大學(xué)林學(xué)院, 貴陽 550025)
小篷竹(AmpelocalamusluodianensisT. P. Yi &R. S. Wang)為禾本科(Poaceae)竹亞科(Bambusoideae)懸竹屬(Ampelocalamus)植物,是1984年在貴州省羅甸縣發(fā)現(xiàn)的一竹種,其俗名為藤竹[1]。小篷竹為貴州省特有種,主要分布于羅甸縣、長順縣、冊亨縣、望謨縣、紫云縣等喀斯特(石漠化)地區(qū),生長于海拔600~1 000 m的石灰?guī)r裸露山地[2]。小篷竹多分布于喀斯特地區(qū),對土層淺薄的喀斯特石山(甚至懸崖)環(huán)境具有較高的適應(yīng)性和較強的抗逆性,對石灰?guī)r有破碎化作用,可改善土壤的理化性質(zhì);此外,其復(fù)雜的地下竹鞭可有效減少水土流失,為喀斯特地區(qū)保水固土的優(yōu)良物種[3-4]。小篷竹外形美觀,沿巖壁下垂如簾,有很好的栽培觀賞和園林綠化功能,具有一定栽培價值。小篷竹在生態(tài)、經(jīng)濟以及觀賞方面具較高的價值,與貴州特有的爬竹、乳紋方竹、多毛箬竹一樣[5-7],該物種目前種群數(shù)量銳減,野外分布受到威脅,在《中國物種紅色名錄》和《IUCN紅色名錄》中均被列為極危種[2]。
葉綠體是半自主細胞器,具有獨立的遺傳信息傳遞體系,是環(huán)狀的DNA雙螺旋結(jié)構(gòu),其可編碼與光合作用有關(guān)蛋白[8-9]。隨著高通量測序技術(shù)的發(fā)展,為葉綠體基因組的測序提供了極大的便捷,葉綠體基因組研究得以快速發(fā)展。葉綠體基因組是單性遺傳,主要通過母系遺傳,保守性較高[10-11]。植物的葉綠體基因組具有典型四分體結(jié)構(gòu),由一個大的單拷貝區(qū)(Large Single Copy,LSC)、一個小的單拷貝區(qū)(Small Single Copy,SSC)和兩個反向重復(fù)區(qū)(Inverted Repeats,IRa和IRb)組成[10,12]。目前,葉綠體基因組廣泛運用于物種鑒定、分子標(biāo)記、遺傳多樣性分析和種質(zhì)資源保護等方面,尤其在系統(tǒng)發(fā)育與進化方面的研究更為顯著[13-14]。
本研究利用高通量測序技術(shù)對小篷竹進行測序,獲得了小篷竹的葉綠體全基因組,對其進行組裝和注釋。隨后,對葉綠體基因組(cpDNA)進行結(jié)構(gòu)特征分析與系統(tǒng)發(fā)育研究,以期為小篷竹的遺傳育種與分子進化研究提供理論依據(jù),還可為懸竹屬的系統(tǒng)發(fā)育與進化研究提供分子數(shù)據(jù)信息。
小篷竹鮮葉片樣本于2020年10月采自貴州省羅甸縣(海拔837 m,106°45′43″E,25°32′42″N),將新鮮的葉片樣本放入硅膠中保存,憑證標(biāo)本保存于貴州大學(xué)自然博物館標(biāo)本室(標(biāo)本號:GB 303)。利用植物DNA提取試劑盒(天根生化科技有限公司)提取葉片DNA。
依托商業(yè)化平臺(北京擎科生物科技有限公司)進行文庫構(gòu)建,在Illumin NovaSeq 6000測序儀上測序,獲得質(zhì)控過濾后的Clean data 4.55 Gb數(shù)據(jù)。在GetOrganelle v1.7.5軟件進行組裝[15],在PGA程序?qū)M裝好的序列進行注釋[16],隨后將注釋好的序列于Genious 9.0.2軟件中進行手動校正[17]。
使用CodonW 1.4.4軟件檢測小篷竹葉綠體基因組中用于蛋白質(zhì)編碼基因的密碼子使用頻率和相對密碼子使用頻率。
利用REPuter[18]在線軟件檢測散在重復(fù)序列,包括正向重復(fù)(Forward Repeats,F)、反向重復(fù)(Reverse Repeats,R)、回文重復(fù)(Palindromic Repeats,P)和互補重復(fù)(Complement Repeats,C),參數(shù)設(shè)置如下:最大重復(fù)長度(Maximum Computed Repeats)為100,最小重復(fù)長度(Minimal Repeat Size)為30,漢明距離(Hamming Distance)為3,未設(shè)置編輯距離(Edit Distance)。
簡單重復(fù)序列(Simple Sequence Repeats, SSR)是利用在線軟件MISA[19]進行檢測,參數(shù)設(shè)置為:單核苷酸重復(fù)單元不少于10個,二核苷酸重復(fù)序列不少于5個,三核苷酸以上重復(fù)序列不少于4個,四核苷酸以上重復(fù)序列不少于3個,五核苷酸以上重復(fù)序列不少于3個,六核苷酸以上重復(fù)序列不少于3個。
使用IRscope工具對小篷竹和懸竹屬其他11個物種的葉綠體基因組進行比較,分析葉綠體基因組結(jié)構(gòu)中的IR邊界變化情況。在Genious軟件中利用Mauve進行比對比較。使用在線軟件mVISTA對小篷竹和懸竹屬其他11種的葉綠體全基因組序列進行差異性比較。
本研究選取禾本科葉綠體基因組序列22條,其中懸竹屬11種(MH 410123、MK 393365、MK 393366、MK 393368、MK 393374、MK 393369、KX 372537、MK 393370、MK 393371、MK 393372、MK 393373)、簕竹屬4種(HQ 337797、KJ 722536、FJ 970915、MH 410121)、牡竹屬3種(MK 679785、NC 050753、MK 679780)、箬竹屬2種(JX 513421、JX 513422)和單枝竹屬1種(MK 679779),以稻屬的野生稻(NC 017835)作為外類群。使用MAFFT v 7.503軟件進行多序列比對,基于IQtree的最大似然法(Maximum Likelihood,ML)構(gòu)建系統(tǒng)發(fā)育樹,同時在CIPRES網(wǎng)站的MrBayes on XSEDE v 3.2.7 a基于貝葉斯法(Bayesian Inference,BI)構(gòu)建系統(tǒng)發(fā)育樹,ML樹和BI樹在TreeGraph軟件進行合并。
小篷竹葉綠體基因組結(jié)構(gòu)呈典型的四分體結(jié)構(gòu),包括大單拷貝區(qū)(Large Sinsle Copy,LSC)、小單拷貝區(qū)(Small Single Copy,SSC)和兩個反向重復(fù)區(qū)(Inverte Repeat,IR)。基因組序列全長139 547 bp,GC含量為38.9%,其中LSC區(qū)長83 145 bp,GC含量為37.0%;SSC區(qū)長12 808 bp,GC含量為33.2%;IRb和IRa區(qū)長21 797 bp,GC含量均為44.2%,IR區(qū)的GC含量明顯高于LSC區(qū)與SSC區(qū)(圖1)。
圖1 小篷竹葉綠體全基因組圖譜Fig.1 The whole genome map of the A. luodianensis chloroplast
對小篷竹葉綠體基因組進行注釋,并對其基因信息進行統(tǒng)計,去掉重復(fù)基因,注釋到129個獨立基因,包括83個編碼蛋白基因、8個rRNA基因,38個tRNA基因。其中,14個基因(ndhB、ndhA、rpl16、rpl2、petB、atpF、petD、rps16、trnK-UUU、trnI-GAU、trnA-UGC、trnG-UCC、trnV-UAC、trnL-UAA)有1個內(nèi)含子,2個基因(rps12、ycf3)有2個內(nèi)含子(表1)。
表1 小篷竹葉綠體基因組注釋基因Table 1 Genes annotated in the chloroplast genome of A. luodianensis
注:柱形圖表示氨基酸代碼的數(shù)量,紅色線表示氨基酸代碼的比例。圖2 葉綠體基因組蛋白質(zhì)編碼序列中的氨基酸頻率Fig.2 Amino acid frequencies in A. luodianensis chloroplast genome protein coding sequences
小篷竹葉綠體基因組密碼子使用頻次統(tǒng)計結(jié)果顯示,所有蛋白編碼序列共有19 956個密碼子,由64種不同類型組成,包含20種氨基酸和3種終止密碼子(UUA、UAG、UGA)(表2,圖2)。其中,亮氨酸(Leu)是20種氨基酸中使用頻率最高的氨基酸,共有2 136個(10.70%)編碼亮氨酸,半胱氨酸(Cys)使用頻率最低,密碼子使用數(shù)量為220個(1.10%),分別為編碼最多和最少的氨基酸。甲硫氨酸(Met)和色氨酸(Trp)僅有一種類型的密碼子,密碼子分別為472個和345個。所有密碼子中,AUU最多,UGC最少,分別為817個和49個,RSCU值分別為1.5和0.45。小篷竹葉綠體基因組的64種密碼子中,RSCU(相對同義密碼子)值超過1.0的有31種,除UUG(Leu)和UCC(Ser)兩種密碼子外,其余29種均以A/U結(jié)尾,31種密碼子具有明顯偏向性;而AUG(Met)和UGG(Trp)的RSCU值為1.0,這兩種密碼子無偏向性。
表2 小篷竹葉綠體基因組的密碼子使用度Table 2 Codon usage in chloroplast genome of A. luodianensis
注:A為不同重復(fù)類型數(shù)量;B為不同區(qū)域的重復(fù)數(shù)量。圖4 小篷竹葉綠體基因組重復(fù)序列分析Fig.4 Repeat sequences analysis on A. luodianensis chloroplast genome
對小篷竹的葉綠體基因組進行SSR位點篩選分析,共鑒定出了84個SSR位點,其中單核苷酸重復(fù)類型28個,二核苷酸重復(fù)類型4個,三核苷酸重復(fù)類型41個,四核苷酸重復(fù)類型11個(圖3)。SSR位點主要分布于LSC區(qū)(64,76%),其次是分布在IR區(qū)(14,17%),SSC區(qū)最少(6,7%)。所檢測到4種類型的SSR位點中,數(shù)量最多的是A/T,占比31.0%。SSR位點絕大多數(shù)位于基因間隔區(qū)(IGS)和編碼區(qū)(CDS),占89.0%,而位于內(nèi)含子(Intron)僅有9個,占11.0%。
圖3 小篷竹葉綠體基因組SSRs類型及數(shù)量Fig.3 The SSRs types and numbers of A. luodianensis chloroplase genome
利用REPuter軟件對小篷竹葉綠體基因組進行重復(fù)序列分析。結(jié)果顯示,共檢測到正向重復(fù)、反向重復(fù)、回文重復(fù)3種類型,未檢測出互補重復(fù);正向重復(fù)序列有49個,反向重復(fù)序列有1個,回文重復(fù)序列有15個;重復(fù)序列長度在30~100 bp之間,重復(fù)序列全部位于LSC區(qū)和IR區(qū)(圖4)。
對懸竹屬12種植物的葉綠體基因組IR邊界進行比較分析。結(jié)果(圖5)顯示,所有類群IR大小范圍在21 792~21 822 bp之間;rpl22基因LSC/IRb邊界右側(cè),距邊界24~37 bp之間;IRb/SSC邊界無基因跨越;SSC/IRa邊界位于ndhH基因內(nèi),基因大小為1 181 bp,間隙為187~192 bp;rps19基因較為保守,全位于IRa區(qū)域,距離IRa/LSC邊界長度大小僅相差1 bp;psbA基因全位于IRa/LSC邊界右側(cè),A.breviligulatu向IRa/LSC邊界擴張,距邊界27 bp。
圖5 懸竹屬12種植物葉綠體基因組的LSC、IRs和SSC區(qū)邊界的比較Fig.5 Comparison of LSC, IRs, and SSC border regions for chloroplast genome of twelve Ampelocalamus species
將小篷竹與同屬的釣竹(A.breviligulatus)、永善懸竹(A.yongshanensis)進行葉綠體基因組比較。
使用DnaSP 6.12軟件分析懸竹屬3個種的核苷酸多態(tài)性位點(圖6)。結(jié)果表明,懸竹屬3個種的核苷酸多態(tài)性(Pi)值在0~0.008 89之間變化,Pi平均值為0.001 04。共檢測到10個高變異區(qū)(Pi>0.005),包括8個基因(trnS、trnT、trnL、rbcL、ycf4、rpl14、ndhF、rpl32)和兩個基因間隔區(qū)(psbE-petL、rps15-ndhF);在這些高變區(qū)中,有7個位于LSC區(qū),3個位于SSC區(qū),IR區(qū)沒有發(fā)現(xiàn)高變區(qū);rpl14是最容易異變的區(qū)域。
圖6 懸竹屬3種植物葉綠體全基因組的核苷酸多樣性滑動窗圖Fig.6 Sliding window plots of nucleotide diversity across the complete chloroplast genome of three Ampelocalamus species
采用Mauve對懸竹屬3個竹種進行比對比較,以小篷竹為參考序列(圖7)。結(jié)果表明,所有序列都呈共線性關(guān)系,未發(fā)生易位和倒位。
圖7 懸竹屬3種植物葉綠體全基因組的排列比較Fig.7 Ranging comprisons of chloroplast genom of three Ampelocalamus species
采用在線基因組比對工具mVISTA對懸竹屬3個種序列進行全局比對(圖8)。結(jié)果顯示,3條序列葉綠體基因組具有較高的相似性,其大部分區(qū)域較為保守,IR區(qū)比LSC和SSC更為保守,非編碼區(qū)變異性高于編碼區(qū),rpoC2、rps19等基因在蛋白編碼區(qū)存在差異。
圖8 懸竹屬3種植物葉綠體全基因組全局比對Fig.8 Global alignment on chloroplast genomes of three Ampelocalamus species
為確定小篷竹的系統(tǒng)發(fā)育位置,從NCBI獲取禾本科6屬22種的完整葉綠體基因組序列,以稻亞科稻屬的野生稻作為外類群,采用最大似然法(ML)和貝葉斯法(BI)對其葉綠體基因組進行了系統(tǒng)發(fā)育分析(圖9)。ML和BI建樹所得系統(tǒng)樹的拓撲結(jié)構(gòu)一致,故將兩者合并,同時標(biāo)注支持率。系統(tǒng)發(fā)育結(jié)果顯示,小篷竹與釣竹(A.breviligulatus)和南川竹(A.melicoideus)的親緣關(guān)系最近(支持率均為100%),互為姐妹類群。
本研究對小篷竹的葉綠體基因組進行測序、組裝和注釋,并進行一系列的結(jié)構(gòu)特征分析。結(jié)果表明,小篷竹葉綠體基因組為一環(huán)狀DNA分子,呈典型的四分體結(jié)構(gòu),由一個大單拷貝區(qū)(LSC)、一個小單拷貝區(qū)(SSC)和兩個反向重復(fù)區(qū)(IRb和IRa)組成,與大多數(shù)被子植物的葉綠體基因組結(jié)構(gòu)相似[20]。小篷竹葉綠體基因組全長139 547 bp,其GC含量為38.9%,AT含量為61.1%,共編碼129個基因,其16個編碼蛋白基因含有內(nèi)含子,與爬竹(A.scandens)葉綠體基因組結(jié)構(gòu)相似[21]。分析編碼區(qū)密碼子的使用偏好性,對研究物種的基因功能和系統(tǒng)進化具有重要意義[22]。小篷竹葉綠體基因組的31種密碼子具有明顯的偏向性,大部分以A/U結(jié)尾,這與大多數(shù)被子植物密碼子使用偏好類似。
葉綠體基因組的SSR是一種高效標(biāo)記工具,廣泛應(yīng)用于物種鑒定、屬間分類、群體遺傳以及系統(tǒng)發(fā)育關(guān)系等方面的研究[23]。在小篷竹葉綠體基因組中檢測到84個SSR,包含4種重復(fù)類型,主要由A/T組成,大部分位于LSC區(qū)。重復(fù)序列主要來源于葉綠體基因組中的重復(fù)、缺失和重排,分析重復(fù)序列對研究基因組的重組和重排具有重要意義[24-25]。在小篷竹中葉綠體基因組中,共鑒定出65個重復(fù)序列,最常見的是正向重復(fù)(49個),重復(fù)序列長度在30~100 bp之間。小篷竹的重復(fù)序列與毛環(huán)方竹類似[26]。將小篷竹與同屬的釣竹(A.breviligulatus)、永善懸竹(A.yongshanensis)進行比較,核苷酸多態(tài)性位點結(jié)果顯示,總檢測到10個高變異區(qū)(Pi>0.005),rpl14是最容易異變的區(qū)域。這些高變區(qū)的序列在其他種也有報道,且在IR區(qū)沒有發(fā)現(xiàn)高變異區(qū),是高度保守的區(qū)域[27-28]。mVISTA全局比對結(jié)果也表明,IR區(qū)比LSC和SSC更為保守。
注:A為具有時間標(biāo)尺的系統(tǒng)發(fā)育樹;B為無時間標(biāo)尺的系統(tǒng)發(fā)育樹。圖9 基于葉綠體全基因組用ML和BI構(gòu)建的系統(tǒng)進化樹Fig.9 Phylogenetic tree inferred from maximum likelihood and bayesian inference based on complete chloroplast genome
目前,依據(jù)形態(tài)特征分類,小篷竹的系統(tǒng)位置有爭議[29-30]。已有研究表明,葉綠體全基因組比葉綠體片段構(gòu)建的系統(tǒng)發(fā)育關(guān)系較好[27],本研究使用ML和BI法對葉綠體全基因組進行建樹。結(jié)果顯示,小篷竹與釣竹(A.breviligulatus)和南川竹(A.melicoideus)的親緣關(guān)系最近,互為姐妹類群。此外,懸竹屬與箬竹屬互為姐妹類群,表明兩者的關(guān)系較近,這與Liu等[22]和Fan等[8]的結(jié)果一致。
本研究通過對小篷竹葉綠體進行測序,并對其葉綠體基因組進行密碼子偏好性、長重復(fù)序列、SSR位點、IR邊界收縮與擴張、核苷酸多態(tài)性位點、系統(tǒng)發(fā)育的分析。研究結(jié)果可為小篷竹種質(zhì)資源保護、分子標(biāo)記和物種進化等提供基礎(chǔ)資料,還對石漠化地區(qū)植物遺傳多樣性研究具有重要意義。