王小薇 陳世品
摘 要:為了探究油茶閩43與山茶屬近緣物種間葉綠體基因組的差異以及進化關系,利用基因組學分析方法,對油茶閩43與其他近緣山茶屬物種葉綠體基因組進行比較分析。葉綠體基因組結構特征分析結果顯示:9種山茶屬物種的葉綠體基因組大小為156 902~157 567 bp,有130~136個基因。REPuter分析發(fā)現,這9種山茶屬物種的長重復序列類型均為P和F,通過MISA軟件確定9種山茶屬物種的SSR數量為52~71 個,其中閩43的SSR數量為65 個。通過IR邊界分析,白毛茶和油茶閩43與其他3種屬內物種的邊界基因有較為明顯差異,同時通過核苷酸多態(tài)性分析,檢測出葉綠體基因組共有5個高變區(qū),分別為psbK~atpA、rpoB~psbD、rps4~ndhJ、ycf1、ndhF~rps12~exon1。并從系統(tǒng)發(fā)育樹的結果得出,油茶閩43與落瓣油茶的親緣關系最近。該研究可為普通油茶種群遺傳結構提供基礎,為提高普通油茶的產油量以及優(yōu)良品種的選育提供理論依據。
關鍵詞:油茶;葉綠體基因組;長重復序列;系統(tǒng)發(fā)育樹
中圖分類號:S 794.4 ??文獻標志碼:A ??文章編號:0253-2301(2023)01-0009-09
DOI: 10.13651/j.cnki.fjnykj.2023.01.002
Analysis of the Sequence Characteristics of Chloroplast Genome and theGenetic Relationship of Closely Related Species of Camellia oleifera Min 43
WANG Xiao-wei, CHEN Shi-pin*
(College of Forestry, Fujian Agriculture and Forestry University, Fuzhou, Fujian 350002, China)
Abstract: In order to explore the differences and evolutionary relationships of chloroplast genomes between Camellia oleifera Min 43 and the closely related species of Camellia L., the chloroplast genomes of Camellia oleifera Min 43 and other closely related species we compared and analyzed by using the genomics analysis. The results of the structure characteristic analysis of chloroplast genome showed that the chloroplast genome size of 9 Camellia L. species ranged from 156 902 to 157 567 bp, with 130-136 genes. The REPuter analysis showed that the long repetitive sequence types of these 9 Camellia L. species were P and F. The SSR number of 9 Camellia L. species was determined to be 52-71 by using the MISA software, among which the SSR number of Min 43 was 65. Through the IR boundary analysis, the boundary genes of Camellia sinensis and Camellia oleifera Min 43 were significantly different from those of the other three genus species. At the same time, by using the nucleotide polymorphism analysis, five hypervariable regions were detected in the chloroplast genome, which were psbK-atpA, rpoB-psbD, rps4-ndhJ, ycf1, and ndhF-rps12-exon1. According to the results of phylogenetic tree, the relationship between Camellia oleifera Min 43 and Camellia kissii was the closest. This study could provide a basis for the genetic structure of Camellia oleifera population, and also provide a theoretical basis for improving the oil production of Camellia oleifera and the breeding of excellent varieties.
Key words: Camellia oleifera; Chloroplast genome; Long repetitive sequence; Phylogenetic tree
葉綠體是植物進行光合作用的細胞器,光合作用的全部過程都發(fā)生在葉綠體內。此外, 葉綠體中還發(fā)生著多種與植物生命活動相關的代謝過程,在植物的能量代謝和物質循環(huán)中起著非常重要的作用
[1]。葉綠體含有自己的基因組和一套獨特的遺傳系統(tǒng),其基因表達調節(jié)非常復雜[2]。葉綠體的遺傳方式大多是母系遺傳[3],基因組結構組成相對保守,適用于植物系統(tǒng)發(fā)育方面的研究。目前已經廣泛應用于植物的遺傳多樣性分析,構建和分析系統(tǒng)發(fā)育樹,進行不同物種間的比較研究[4-5]。
油茶C.oleifera屬于山茶科山茶屬常綠小喬木或灌木,與油棕、油橄欖、椰子并稱為“世界四大木本食用油料植物” [6-7]。福建是油茶的中心產區(qū)之一,目前擁有閩43、閩48和閩60等優(yōu)良無性系,為全省推廣的主栽品種,其產油量超過國內優(yōu)良無性系標準[8]。目前,油茶雖已選育出一批優(yōu)良無性系或家系良種,但具有產量穩(wěn)定、抗性強、廣適性好等優(yōu)良性狀的品種仍舊不多。當前,油茶在常規(guī)育種及優(yōu)良栽培技術等方面的研究已處于瓶頸期,很難有新的突破?,F階段可以將分子育種技術應用于油茶育種研究[9]。同時,近幾年,有關油茶親緣關系的報道文獻迅速增加。劉佳潔[10]對75份油茶優(yōu)良種質資源材料的親緣關系進行了分析;蔣鶯[11]通過ISSR、SIRP兩種分子標記揭示了不同油茶材料間的親緣關系。但是,關于山茶屬物種間的親緣關系分析的相關報道較少。山茶屬植物形狀相似,通過形態(tài)鑒定十分困難,而植物DNA中的一些序列具有種間差異,因此可以利用山茶屬不同物種有特定的DNA序列這一性質作為油茶閩43相似種的鑒定依據。本研究通過分析油茶閩43的葉綠體基因組序列特征及與近緣種的關系,可為普通油茶種群遺傳結構提供基礎,為研究提高普通油茶的產油量以及優(yōu)良品種的選育提供理論基礎。
1 材料與方法
1.1 ?試驗材料
普通油茶無性系閩43是福建省審定的優(yōu)良品種。試驗材料種植于福建省閩侯白沙國有林場(桐口工區(qū))(119.17°E,26.05°N),采集葉片,-80℃儲存在福建農林大學植物標本室備用(FJFC)。
閩43的葉片樣品送至華大基因股份有限公司,采用illumina高通量測序方法提取葉綠體基因組,測序儀為MGI2000。閩43葉綠體基因組的序列已經上傳至NCBI數據庫,并釋放數據,獲得序列號OP036120.1。
1.2 試驗方法
1.2.1 閩43葉綠體基因組組裝與注釋
通過GetOrangelle軟件對閩43葉綠體基因組進行組裝,使用CPGAVAS2軟件完成葉綠體基因組的注釋工作,并通過Geneious Basic軟件對注釋后的數據進行校正。再將閩43葉綠體基因組的GenBank格式文件用DRAW Organel Genome Maps(OGDRAW)在線繪圖工具繪制出葉綠體基因組物理圖譜。
1.2.2 9種山茶屬物種葉綠體結構特征比較
從NCBI上下載已公布的8種山茶屬物種的葉綠體基因組序列用作結構特征比較分析。其中4種主要分布于廣東、福建等地區(qū),分別為:白毛茶Camellia sinensis var.Pubilimba(KJ806280.1)、落瓣油茶Camellia kissii(NC_053915.1)、紅皮糙果茶Camellia crapnelliana(KF753632.1)、毛柄連蕊茶Camellia fraterna(NC_050388.1)。另外4種主要分布于廣西等地區(qū),分別為:多齒山紅茶Camellia polyodonta(NC_060777.1)、金花茶Camellia nitidissima var. Nitidissima(MT157618.1)、龍州金花茶Camellia lungzhouensis(MN579509.2)、南山茶Camellia semiserrata(MT317096.1)。
1.2.3 9種山茶屬物種葉綠體長重復序列和微衛(wèi)星分析
長重復序列有4種類型,即正向(forward)、反向(reverse)、互補 (complement)、回文(palindromic),利用REPuter 軟件對9種山茶屬物種的長重復序列進行分析,并利用Perl語言在軟件 MISA(http://pgrc.ipk~gatersleben.de/misa/)中對葉綠體基因組的SSR(simple~sequence~repeat)序列進行微衛(wèi)星分析,設置單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的重復參數分別為10、6、5、5、5和5。
1.2.4 5種山茶屬物種葉綠體核苷酸多態(tài)性分析
采用mVISTA軟件以注釋過的閩43葉綠體基因組為參考,對4種主要分布于福建、廣東等地區(qū)的山茶屬物種白毛茶、紅皮糙果茶、落瓣油茶、毛柄連蕊茶進行葉綠體基因組序列同源性的比較,以及對這5種物種進行核苷酸多態(tài)性分析。
1.2.5 5種山茶屬物種葉綠體基因組共線性分析
通過Mauve軟件對閩43以及4種主要分布于福建、廣東等地區(qū)的山茶屬物種白毛茶、紅皮糙果茶、落瓣油茶、毛柄連蕊茶的葉綠體基因組進行共線性比較。
1.2.6 5種山茶屬物種IR邊界分析
通過JSHYCloud在線工具集分析閩43和4種主要分布于福建、廣東等地區(qū)的山茶屬物種白毛茶、紅皮糙果茶、落瓣油茶、毛柄連蕊茶的葉綠體基因組IR區(qū)邊界結構差異。
1.2.7 9種山茶屬物種系統(tǒng)發(fā)育樹構建
選用9種物種的葉綠體基因組序列,在Geneious中校正這9個目標序列,以木荷屬的木荷Schima superba作為外類群,于MAFFT軟件中進行序列比對,再進行手工校對。使用軟件MEGA11對齊9條葉綠體基因組序列并構建ML系統(tǒng)發(fā)育樹,Bootstrap support(BS)值設置為1000。
2 結果與分析
2.1 閩43的葉綠體基因組注釋結果
由圖1可知,閩43葉綠體基因組結構為雙鏈環(huán)狀結構,具有典型的四分體結構,包括2個反向重復區(qū)IRs(inverted repeats)、大的單拷貝區(qū)LSC(large single copy)和小的單拷貝區(qū)SSC(small single copy)。葉綠體基因組長度為156 975 bp,IR長度為51 908 bp,LSC長度為86 659 bp,SSC長度為18 408 bp?;蚪MGC含量37.29%。注釋基因有132個,其中包括87個蛋白編碼基因、37個tRNA基因和8個rRNA基因。
2.2 閩43與8種山茶屬物種葉綠體基因組特征比較分析
2.2.1 9種山茶屬物種葉綠體結構特征比較
由表1可知,山茶屬9種物種的基因組長度為156 902~157 567 bp,LSC、SSC、IR區(qū)長度分別為56 640~110 062 、17 735~22 659、24 265~53 200 bp。其中金花茶的葉綠體基因組序列最長,毛柄連蕊茶的最短。且9種物種的GC含量變化不大,差異不超過0.05%,AT含量為62.67%~62.71%,具有明顯的AT偏向性。
這9種山茶屬物種的基因數量差異較小,數量都在130~136個,其中紅皮糙果茶的蛋白編碼基因和tRNA最多,分別為89、39個,其余8種物種的蛋白編碼基因數量為86~88個,tRNA數量為37個。9種物種的rRNA數量都一樣,都為8個,說明這9種山茶屬近緣物種葉綠體進化較為保守。
2.2.2 9種山茶屬物種葉綠體長重復序列和微衛(wèi)星分析
由表2可知,9種山茶屬物種長重復序列均只存在正向重復、回文重復,總數為37~57個。其中白毛茶的長重復序列最多,為57個,回文重復有36個,正向重復有21個。
由表3可知,9種山茶屬物種的葉綠體基因組中,占比最多的是單核苷酸重復,其次是四核苷酸重復。閩43和落瓣油茶、白毛茶的SSR總數一致,均為65個,并且閩43的微衛(wèi)星序列情況與落瓣油茶的完全一致,說明油茶閩43 與落瓣油茶這兩個物種葉綠體的進化關系可能更為相近。
2.2.3 5種山茶屬物種葉綠體核苷酸多態(tài)性分析
由圖2可知,5種山茶屬物種的基因組相似度很高,其中4種物種與閩43中基因有較大差異的是rps16,基因相似度僅在70%左右。同時,閩43與落瓣油茶的psbM基因的相似度極低,僅在50%左右。說明閩43與這4種近緣物種的葉綠體基因組進化程度雖然相似,但是可以通過個別基因的特性,鑒別閩43。
計算以閩43為參考序列的核苷酸多態(tài)性值。從圖3可知,這5種物種的葉綠體基因組有5個高變區(qū),分別為psbK~atpA、rpoB~psbD、rps4~ndhJ、ycf1、ndhF~rps12~exon1。其中3個熱點高變區(qū)位于LSC區(qū),2個位于SSC區(qū),說明IR區(qū)的變異低于LSC區(qū)和SSC區(qū)。這些變異較高的區(qū)域可用于設計特定的DNA條形碼。
2.2.4 5種山茶屬物種葉綠體基因組共線性分析
由圖4可知,5種山茶屬物種葉綠體基因組之間具有高度的相似性,沒有發(fā)生重排或倒置現象。但在區(qū)域(87 000~110 000 bp)中觀察到高頻變異,其中閩43的基因組序列高度保守。
2.2.5 5種山茶屬物種IR邊界分析
由圖5可知,IR/LSC和IR/SSC邊界分布的基因包括rps19、rpl22、rpl2、trnN、ycf1、rps12、ndhF、rpl23、trnH、psbA。JSA(SSC~IRa)區(qū)包括基因rps12、trnH、rpl23、psbA。以上分析結果表明,閩43 IR邊界基因位置和種類與另外4種近緣物種均有較明顯差異。說明不同分布地區(qū)同屬不同物種的葉綠體基因組IR邊界區(qū)的基因類型和分布情況存在一定差異,但相對比較保守。
2.2.6 9種山茶屬物種系統(tǒng)發(fā)育關系分析
由圖6可知,9種物種共有7個節(jié)點。總體聚為一支,從上到下分別為南山茶、紅皮糙果茶、油茶閩43、落瓣油茶、多齒山紅茶、白毛茶、金花茶、龍州金花茶、毛柄連蕊茶。在系統(tǒng)發(fā)育樹中,油茶閩43與落瓣油茶聚為一支,支持率為100,親緣關系最近。
3 結論與討論
通過對9種山茶屬物種的葉綠體基因組結構的比較發(fā)現,閩43的葉綠體基因組序列長度、GC含量以及基因數量與同屬的8種物種的差異較小,說明同屬物種間的葉綠體基因組相似度較高,這與葉綠體進化相對保守有關。簡單重復序列(SSR)在植物葉綠體基因組中分布廣泛,信息含量大,具有高多態(tài)性,葉綠體基因組SSR以其獨特的母系遺傳優(yōu)勢被利用于鑒定親緣關系和系統(tǒng)發(fā)育研究中[12-13]。近年來,SSR分子標記在植物系統(tǒng)進化[14]、遺傳多樣性[15-16]、群體遺傳結構[17]及動態(tài)進化歷史[18]等領域應用廣泛。通過微衛(wèi)星分析發(fā)現,9種山茶屬物種中,占比最多的是單核苷酸重復,其次是四核苷酸重復,均未檢測到五核苷酸的重復類型。
葉綠體基因組是由SSC、LSC、IRa、IRb 4個區(qū)間構成的環(huán)狀結構。其中IR區(qū)域相對保守,其收縮和擴張的現象在植物演化過程中起重要作用[19],代表著植物的進化。同時也會引起葉綠體基因的GC含量變化,不同的植物的葉綠體基因組大小也與其有關[20]。根據IR邊界分析結果表明,閩43與同分布區(qū)的4種屬內物種的IR邊界基因有較為明顯差異,閩43的ycf1基因出現在IRb~SSC(JSB)區(qū),而其余4種屬內物種的ycf1基因都僅出現在SSC~IRa(JSA)區(qū),且油茶閩43在IRa~LSC(JLA)和IRb~LSC(JLB)均有與其余4種對比物種不同的基因,說明閩43的IR邊界出現了擴張或收縮,可以為物種分類提供良好依據。
葉綠體基因組構建的進化樹顯示,油茶閩43與落瓣油茶聚為一支,二者親緣關系最近,但二者的葉綠體基因組長度有明顯差異。且通過IR邊界分析可以得知,閩43與落瓣油茶在JSA區(qū)的基因種類不盡相同,說明二者的葉綠體基因組存在相對較大差異,可以反映出種間差異。且從mVISTA結果來看,閩43和落瓣油茶的psbM基因相似度很低,這可以作為閩43與落瓣油茶之間的分類與鑒定依據。
從核苷酸多樣性值結果得出,共有5個高變區(qū),分別為psbK~atpA、rpoB~psbD、rps4~ndhJ、ycf1、ndhF~rps12~exon1。其中3個熱點高變區(qū)位于LSC區(qū),2個位于SSC區(qū),IR區(qū)沒有,說明IR區(qū)的變異程度低于LSC區(qū)和SSC區(qū),這可能與IR區(qū)域進化的保守性有關[21]。有一個熱點高變區(qū)為ycf1,ycf1基因是具有未知功能的開放閱讀框[22-23],煙草基因敲除試驗證明ycf1基因編碼對細胞存活至關重要的產物[24],這可能是油茶閩43的產油量較高[25]的原因。與其他基因相比,ycf1基因進化速度快[26],能夠揭示低分類水平上的系統(tǒng)發(fā)育關系。因此對于油茶閩43的鑒定,可以通過個別特殊基因進行快速準確的鑒定。
參考文獻:
[1]于惠敏,石竹,邵洪偉.植物細胞核與葉綠體基因的雙向調控作用[J].生物學通報,2011,46(6):11-14.
[2]于惠敏.植物的葉綠體基因組[J].植物生理學通訊,2001(5):483-488.
[3]原曉龍,劉音,康洪梅,等.蒜頭果葉綠體基因組密碼子偏好性分析[J].西南林業(yè)大學學報(自然科學版),2021,41(3):15-22.
[4]張慶瀅,陳璇,郭孟璧,等.野生大麻葉綠體基因組分子多態(tài)標記的篩選與開發(fā)[J].分子植物育種,2017,15(3):979-985.
[5]NIE X J,LV S Z,ZHANG Y X.Complete chloroplast genome sequence of a major invasive species, crofton weed (Ageratina adenophora)[J].PLoS ONE,2018,7(5):e36869.
[6]馬小煥.油茶的研究現狀及其應用前景[J].綠色科技,2013,(12):116-117.
[7]莊瑞林.中國油茶(第2版) [M].北京:中國林業(yè)出版社,2008.
[8]陳永忠,王湘南,彭邵鋒,等.植物生長調節(jié)劑對油茶果實含油率的影響[J].中南林業(yè)科技大學學報(自然科學版),2007,27(1):25-29.
[9]田仟仟,黃建建,溫強,等.油茶分子育種現狀與趨勢[J].南方林業(yè)科學,2021,49(5):53-59,73.
[10]劉佳潔.油茶優(yōu)良種質資源的收集保存與遺傳關系的分子鑒別[D].福州:福建農林大學,2010.
[11]蔣鶯.油茶雜交后代及其親本的遺傳關系分析與鑒別選育[D].福州:福建農林大學,2011.
[12]曹瑞蘭,胡冬南,周增亮,等.芳樟葉片轉錄組測序及萜類合成調控相關基因表達分析[J].西南林業(yè)大學學報(自然科學),2021,41(5):49-57.
[13]魏瀟,章秋平,劉威生,等.基于葉綠體SSR單倍型分析普通杏演化關系[J].植物遺傳資源學報,2018,19(4):705-712.
[14]尹航,李冰,張明智,等.短芒大麥草轉錄組SSR序列特征分析[J].分子植物育種,2021(8):1-9.
[15]李正玲,胡琳,王會偉,等.河南省同名小麥地方品種SSR遺傳多樣性分析[J].麥類作物學報,2016,36(5):564-570.
[16]黃海燕,杜紅巖,烏云塔娜,等.基于杜仲轉錄組序列的SSR分子標記的開發(fā)[J].林業(yè)科學,2013,49(5):176-181.
[17]徐金青,夏騰飛,王蕾,等.青稞轉錄組SSR位點及其基因功能分析[J].麥類作物學報,2017,37(2):175-184.
[18]王恒波,祁舒婷,陳姝琦,等.甘蔗栽培種單倍體基因組SSR位點的發(fā)掘與應用[J].作物學報,2020,46(4):631-642.
[19]LI X,LI Y F,ZANG M Y,et al.Complete Chloroplast Genome Sequence and Phylogenetic Analysis of Quercus acutissima[J].International Journal of Molecular Sciences,2018,19(8):2443-2443.
[20]LIU Y.Thirteen Camellia chloroplast genome sequences determined by high-throughput sequencing:Genome structure and phylogenetic relationships[J].BMC Evolutionary Biology,2014,14:151.
[21]沈立群.唇形科三種藥用植物葉綠體全基因組及科內的比較與進化分析[D].杭州:浙江大學,2018.
[22]RAINER M M,KAI N,GABOR L I,et al.Complete Sequence of the Maize Chloroplast Genome:Gene Content,Hotspots of Divergence and Fine Tuning of Genetic Information by Transcript Editing[J].Journal of Molecular Biology,1995,251(5):614-628.
[23]DOUGLAS S E,PENNY S L.The plastid genome of the cryptophyte alga,Guillardia theta: complete sequence and conserved synteny groups confirm its common ancestry with red algae[J].Journal of Molecular Evolution,1999,48(2),236-244.
[24]DRESCHER A,RUF S,CALSA T,et al.The two largest chloroplast genome-encoded open reading frames of higher plants are essential genes[J].The Plant Journal,2000,22(2):97-104.
[25]熊年康,任恢康,陳祥平.油茶閩43、閩48、閩60三個優(yōu)良無性系的選育[J].福建林業(yè)科技,1986,1(1):1-6.
[26]吳勁松,張宇思,劉薇,等.白及屬藥用植物DNA條形碼的確立及其應用[J].藥學學報,2014,49(10):1466-1474.
(責任編輯:柯文輝)