王星璐,李慧娟,趙 偉,李彥青,秦雪梅,張福生*
1. 山西大學(xué) 中醫(yī)藥現(xiàn)代研究中心,山西 太原 030006
2. 山西中醫(yī)藥大學(xué)基礎(chǔ)醫(yī)學(xué)院,山西 晉中 030619
在植物中核基因組的復(fù)雜性使得低拷貝基因的篩選比較困難,目前僅局限在基因組相對(duì)較小的模式物種或具有重要經(jīng)濟(jì)生態(tài)價(jià)值的物種中,整體應(yīng)用范圍較為有限。植物線粒體基因組具有在植物類群中變異很大、存在基因組之間水平轉(zhuǎn)移的外源基因和進(jìn)化速率較慢等特性,使其在系統(tǒng)發(fā)育研究中的應(yīng)用受到了限制[1]。葉綠體基因組作為第2 大基因組,屬于相對(duì)獨(dú)立于核基因組之外的基因組[2],其基因組完整且相對(duì)獨(dú)立。大多數(shù)被子植物的葉綠體含有大量遺傳信息,同時(shí)具有相對(duì)分子質(zhì)量小、結(jié)構(gòu)簡單,進(jìn)化速率中等、突變率較低、遺傳穩(wěn)定、成本低及開發(fā)難度低、廣泛分布著微衛(wèi)星序列和線粒體 DNA 等特點(diǎn)[3-4],在一定程度上彌補(bǔ)了線粒體和核基因組的部分缺點(diǎn)與不足。
葉綠體起源于古細(xì)菌入侵植物細(xì)胞[5],是一種擁有自身遺傳物質(zhì)的多功能細(xì)胞器[6],為質(zhì)體中的一種類型。葉綠體基因組的結(jié)構(gòu)大部分為共價(jià)閉合的雙鏈狀環(huán)形分子,也有少部分是線性分子或者多聚體。對(duì)于高等植物而言,葉綠體存在于細(xì)胞質(zhì)的基質(zhì)中,其形狀呈現(xiàn)為綠色橢圓球型或者是圓球形[7]。典型的環(huán)式雙鏈葉綠體基因組結(jié)構(gòu),包括4 個(gè)部分,即大單拷貝區(qū)(large single copy,LSC),小單拷貝區(qū)(small single copy,SSC)和2 個(gè)反向重復(fù)區(qū)(inverted repeats,IRs);其中,2 個(gè)反向重復(fù)區(qū)把基因組分隔為大單拷貝區(qū)和小單拷貝區(qū)[8]。LSC 區(qū)長81~90 kb,SSC 區(qū)介于18~20 kb;2 個(gè)IR 區(qū)序列基本一致,大小介于20~30 kb,是葉綠體基因組進(jìn)化過程中延展或縮小的區(qū)域[9]。大多數(shù)陸生植物的葉綠體基因組中有110~130 個(gè)基因[10]。近年來,由于葉綠體基因組大小、結(jié)構(gòu)和基因種類一般較為保守,葉綠體全基因組的物種鑒定及系統(tǒng)進(jìn)化研究成為植物系統(tǒng)分類學(xué)的一個(gè)新趨勢,為研究藥用植物系統(tǒng)進(jìn)化及進(jìn)行物種鑒定提供可靠工具[11]。目前,葉綠體基因組技術(shù)已經(jīng)廣泛應(yīng)用于藥用植物的研究中[12-14]。
遠(yuǎn)志植物為雙子葉植物蕓香目遠(yuǎn)志科一種一年生或多年生草本、灌木或小喬木,約500 種,廣布于全世界,我國有42 種8 變種,廣布于全國各地,而以西南和華南地區(qū)最盛[15]。遠(yuǎn)志屬遠(yuǎn)志PolygalatenuifoliaWilld.最早記載于《華氏中藏經(jīng)》[16],藥用價(jià)值廣泛,歷史悠久,具有較大的藥用研究和開發(fā)利用價(jià)值。近年來由于過度采挖遠(yuǎn)志藥材,導(dǎo)致野生藥材資源嚴(yán)重不足,遠(yuǎn)志已被收入《國家重點(diǎn)保護(hù)野生藥材物種名錄》,保護(hù)級(jí)別為Ⅲ級(jí)。目前關(guān)于遠(yuǎn)志的研究主要集中于其化學(xué)成分與藥理作用等方面。研究發(fā)現(xiàn),遠(yuǎn)志具有改善學(xué)習(xí)記憶、抗氧化、抗抑郁、抗衰老、鎮(zhèn)靜催眠、益智和抗腫瘤以及祛痰鎮(zhèn)咳、影響藥物代謝以及抗炎等[17-24]作用。分子生物方面研究主要集中在遠(yuǎn)志隨機(jī)擴(kuò)增多態(tài)性DNA 分析[25]、遺傳多樣性[26]、遠(yuǎn)志譜系地理學(xué)[27-28]、序列鑒定[29-30]等方面;對(duì)葉綠體基因組的研究報(bào)道較少,雖有對(duì)西南遠(yuǎn)志P.crotalarioidesBuch.-Ham. ex DC.[31]和遠(yuǎn)志P.tenuifoliaWilld.[32]葉綠體基因組進(jìn)行測序、拼裝和注釋的報(bào)道,但是報(bào)道的遠(yuǎn)志[32]僅限于描述了序列全長和系統(tǒng)發(fā)育位置等一些基本信息,未對(duì)其展開詳細(xì)的分析描述。
目前,遠(yuǎn)志屬物種的葉綠體基因組研究十分缺乏,其相關(guān)的親緣關(guān)系值得深入研究,NCBI 數(shù)據(jù)庫中有遠(yuǎn)志P.tenuifoliaWilld.(NC_050829.1)[32]完整葉綠體基因組數(shù)據(jù),但是僅記載了葉綠體基因組總長(165 423 bp)等基礎(chǔ)信息,也未進(jìn)行深入挖掘研究,相關(guān)信息依舊不清楚。本研究利用生物信息學(xué)相關(guān)軟件,分析其葉綠體基因組的構(gòu)成,并對(duì)其進(jìn)行基因組裝和注釋,分析序列特征,密碼子偏好性以及系統(tǒng)發(fā)育,闡明遠(yuǎn)志葉綠體基因組結(jié)構(gòu)特征以及其物種之間的親緣關(guān)系。遠(yuǎn)志葉綠體基因組的研究是對(duì)遠(yuǎn)志藥材種質(zhì)資源遺傳多樣性的進(jìn)一步了解,有利于遠(yuǎn)志藥材優(yōu)良品種的選育和種質(zhì)資源的評(píng)價(jià)及其有效保護(hù)與合理利用。
從美國國立生物技術(shù)信息中心(National Center of Biotechnology Information,NCBI)數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/)檢索遠(yuǎn)志科遠(yuǎn)志屬物種的葉綠體全基因組序列信息。檢索到遠(yuǎn)志科遠(yuǎn)志屬8 個(gè)物種以及齒果草屬1 個(gè)葉綠體全基因組序列信息,遠(yuǎn)志科親緣關(guān)系較近的蕓香目苦木科鴉膽子Bruceajavanica(L.) Merr.和蕓香科九里香MurrayaexoticaL. Mant.完整葉綠體全基因組序列。下載檢索到的物種的葉綠體基因組名稱、基因組登錄號(hào)(表1)。
表1 遠(yuǎn)志科、苦木科和蕓香科葉綠體GenBank 登錄號(hào)Table 1 GenBank accession number of chloroplast in Polygalaceae, Simaroubaceae and Rutaceae
遠(yuǎn)志屬遠(yuǎn)志的葉綠體全基因組序列(登錄號(hào)為NC_050829.1 ) 通 過 GeSeq :( https://chlorobox.mpimp-golm.mpg.de/geseq.htm)[33]和Plastid Genome Annotator(PGA)[34]軟件進(jìn)行基因注釋,將結(jié)果對(duì)比矯正,去除錯(cuò)誤及冗余注釋。通過 Chloroplot(https://irscope.shinyapps.io/Chloroplot/)[35]在線繪制工具繪制。通過GeSeq 初步注釋和Chloroplot 畫圖相結(jié)合對(duì)葉綠體基因組的總長度及各個(gè)區(qū)域(LSC、SSC、IR)的長度、基因組成(蛋白編碼基因、tRNA基因、rRNA 基因)、堿基組成、GC(AT)含量進(jìn)行統(tǒng)計(jì)和比較分析,解析遠(yuǎn)志葉綠體基因組序列的基本特征。
利用Perl 語言通過MISA 軟件(http://pgrc.ipk-gatersleben.de/misa/misa.html)[36]完成簡單重復(fù)序列(simple sequence repeats,SSRs)檢測,參數(shù)設(shè)置為單核苷酸重復(fù)單元不少于10 個(gè),二核苷酸重復(fù)單元不少于5 個(gè),三核苷酸和四核苷酸重復(fù)單元不少于4 個(gè),五核苷酸和六核苷酸重復(fù)單元不少于3 個(gè),且2 個(gè)SSRs 之間的最小距離為100 bp[37]。
葉綠體全基因組中的散在重復(fù)序列(dispersed repeats)利用REPute 軟件(https://bibiserv.cebitec.uni-bielefeld.de/reputer)[38]進(jìn)行檢測,正向重復(fù)(forward repeats,F(xiàn))、反向重復(fù)(reverse repeats,R)、互補(bǔ)重復(fù)(complement repeats,C)、回文重復(fù)(palindromic repeats,P)。參數(shù)設(shè)置最小重復(fù)長度(minimal repeat size)設(shè)置為30,hamming 距離(hamming distance)為 3,最大計(jì)算重復(fù)次數(shù)(maximum computed P repeats)5000[39]。串聯(lián)重復(fù)序列(tandem repeats)利用Tandem repeats finder軟件(https://tandem.bu.edu/trf/trf.html)進(jìn)行檢測。參數(shù)設(shè)置選擇默認(rèn)值[40]。
采用CodonW(http://codonw.sourceforge.net)軟件[41]分析密碼子使用情況。對(duì)遠(yuǎn)志的葉綠體基因組同義密碼子相對(duì)使用頻次( relative synonymous codon usage,RSCU)進(jìn)行分析和統(tǒng)計(jì)。當(dāng)RSCU>1 時(shí),表明該密碼子使用頻率較高;RSCU=1 時(shí),說明該密碼子無偏好性;RSCU<1時(shí),表明該密碼子使用頻率較低[42]。
采用Geneious[43]軟件統(tǒng)計(jì)遠(yuǎn)志屬8 個(gè)物種的葉綠體基因組序列的4 個(gè)邊界(SSC、LSC、IRa和IRb 區(qū)域)長度和基因數(shù)目類型、GC 含量等信息,并用EXCEL 計(jì)算各自的GC 值。使用IRscope(https://irscope.shinyapps.io/irapp/)[44]可視化工具,比較遠(yuǎn)志屬葉綠體基因組4 個(gè)區(qū)域邊界的差異。并采用mVISTA 對(duì)其進(jìn)行全基因組比對(duì)分析。
為了確定遠(yuǎn)志的系統(tǒng)發(fā)育位置,下載NCBI 數(shù)據(jù)庫中收錄的遠(yuǎn)志科上述所有9 種植物的葉綠體全基因組序列。與本研究遠(yuǎn)志葉綠體全基因組序列共同構(gòu)建序列矩陣,同時(shí)選擇遠(yuǎn)志屬的近緣類鴉膽子和九里香作為外類群。利用MAFFT 7 軟件(https:// mafft.cbrc.jp/alignment/software/)[45]完成序列比對(duì)。利用IQtree2.0.5(http://www.iqtree.org/)[46]以最大似然法(maximum likelihood,ML)進(jìn)行系統(tǒng)發(fā)育關(guān)系重建分析,核苷酸替換模型選擇GTR+G,其他參數(shù)選擇默認(rèn)設(shè)置,進(jìn)行1000 次自展重復(fù)分析,計(jì)算系統(tǒng)發(fā)育樹各節(jié)點(diǎn)的靴帶支持率(bootstrap values,BS)。并利用MEGA X 軟件,使用鄰接法(neighbor-joining,NJ)構(gòu)建系統(tǒng)進(jìn)化樹,并進(jìn)行系統(tǒng)發(fā)育樹的比較。
遠(yuǎn)志的葉綠體基因組與典型的陸地植物葉綠體基因組基本特征一樣,均為典型的四分體結(jié)構(gòu),遠(yuǎn)志屬遠(yuǎn)志葉綠體基因組呈雙鏈環(huán)狀四分體結(jié)構(gòu)(圖1),大小為165 423 bp,包括大單拷貝區(qū)、小單拷貝區(qū)以及2 個(gè)反向重復(fù)區(qū),各區(qū)長度分別為83 699、8044、36 840 bp。遠(yuǎn)志葉綠體基因組的總GC 量為36.7%,IR 區(qū)的GC 量為39.7%,高于LSC 區(qū)(34.7%)及SSC 區(qū)(29.4%)。整體而言,IR 區(qū)的保守性高于LSC 區(qū)和SSC 區(qū),這可能是IR 區(qū)的GC 量高于LSC 區(qū)和SSC 區(qū)而造成的。計(jì)算各分區(qū)的堿基組成(表2)。
圖1 遠(yuǎn)志葉綠體基因組圖譜Fig. 1 Chloroplast genome map of P. tenuifolia
表2 遠(yuǎn)志葉綠體基因組堿基組成Table 2 Base composition of chloroplast genome of P. tenuifolia
遠(yuǎn)志葉綠體基因組共注釋得到135 個(gè)基因,包括8 個(gè)rRNA 基因、38 個(gè)tRNA 基因和89 個(gè)蛋白編碼基因。根據(jù)其功能可分為以下4 個(gè)大類(表3)。第1 類:48 個(gè)與光合作用相關(guān)的基因,包括5 個(gè)光合系統(tǒng)I基因、15 個(gè)光合系統(tǒng)II 基因、6 個(gè)細(xì)胞色素b/f復(fù)合體基因、6 個(gè)ATP 合酶基因、1 個(gè)二磷酸核糖體羧化酶、15 個(gè)NADH 氧化還原酶基因。第2 類:除rRNA 基因和tRNA 基因外,有30 個(gè)與自我復(fù)制相關(guān)的基因,包括10 個(gè)核糖體蛋白大亞基基因、16 個(gè)核糖體蛋白小亞基基因和4 個(gè)RNA 聚合酶亞基基因。第3 類:6 個(gè)其他編碼蛋白質(zhì)的基因。第4 類:6 個(gè)功能未知的基因。在這些基因中,有12 個(gè)蛋白編碼基因(rpl2、rpl23、ycf2、rps12、rps7、rps15、ycf1、ndhA、ndhB、ndhH、ndhI、ndhN)、7 個(gè)tRNA 編碼基因(trnQ、trnI、trnL、trnV、TrnA、trnN、trnR)和4 個(gè)rRNA 編碼基因(rrn4.5、rrn5、rrn16、rrn23)位于IR 區(qū)。
表3 遠(yuǎn)志葉綠體基因組基因功能注釋與分類Table 3 Gene functional annotation and classification of P. tenuifolia chloroplast genome
葉綠體基因組SSR 分析在遠(yuǎn)志葉綠體基因組中搜索到161 個(gè)SSR 位點(diǎn)。其中,29 個(gè)為復(fù)合型SSRs;單核苷酸重復(fù)Motif 位點(diǎn)最多為113 個(gè),二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重復(fù)基序分別有30、3、9、4、2 個(gè)(表4)。SSR的類型以A/T 為主,無含有G/C 組成的位點(diǎn),占總重復(fù)類型的70.18%;其次為AT/AT,共有25 個(gè)(15.52%),AG/CT(3.11%),其余總數(shù)占總重復(fù)類型的11.18%。A/T 和AT/AT 占簡單重復(fù)序列位點(diǎn)重復(fù)單元總數(shù)量的85.71%,因此遠(yuǎn)志葉綠體基因組富含AT。從分布區(qū)段上看,34 個(gè)位點(diǎn)位于IR區(qū)段,115 個(gè)位于LSC 區(qū)段,12 個(gè)位于SSC 區(qū)段,說明遠(yuǎn)志葉綠體基因組SSRs 分布的不均勻性。
表4 遠(yuǎn)志葉綠體基因組SSRs 位點(diǎn)類型及數(shù)量Table 4 Type and number of SSRs of P. tenuifolia chloroplast genome
使用REPuter 軟件在遠(yuǎn)志葉綠體基因組中共檢測到223 個(gè)散在重復(fù)序列,包括正向重復(fù)序列(F型)、反向重復(fù)(R 型)、回文重復(fù)序列(P 型)和互補(bǔ)重復(fù)(C 型)4 種類型。其中,正向重復(fù)序列(F 型)89 個(gè),反向重復(fù)(R 型)13 個(gè),回文重復(fù)序列(P 型)109 個(gè)和互補(bǔ)重復(fù)(C 型)12 個(gè)。長度為30~39 bp 的重復(fù)序列中包括61 個(gè)正向重復(fù),12 個(gè)反向重復(fù),72 個(gè)回文重復(fù)和12 個(gè)互補(bǔ)重復(fù)。其分布數(shù)量相對(duì)較多(圖2)。發(fā)現(xiàn)90 條長度范圍在2~54 bp 的串聯(lián)重復(fù)序列。串聯(lián)重復(fù)序列,4個(gè)區(qū)域均有分布,其中,LSC 區(qū)35 條,重復(fù)次數(shù)1.9~26.8 次,TRB 區(qū)24 條,重復(fù)次數(shù)由1.9~12.2次,SSC 區(qū)1 條,重復(fù)次數(shù)由2 次,TRA 區(qū)30 條,重復(fù)次數(shù)由1.9~8.1 次。
圖2 遠(yuǎn)志葉綠體基因組散在重復(fù)序列類型與數(shù)量Fig. 2 Type and number of long repeats in P. tenuifolia chloroplast genome
用CodonW 軟件分析遠(yuǎn)志葉綠體基因組蛋白編碼序列密碼子的使用偏好性(圖3),共預(yù)測了55 141 個(gè)密碼子,其中編碼亮氨酸(Leu)的密碼子數(shù)量最多(5629 個(gè),10.21%),編碼色氨酸(Trp)的密碼子數(shù)量最少(705 個(gè),1.28%)。在遠(yuǎn)志葉綠體基因組中有20 種氨基酸,除甲硫氨酸(Met)和色氨酸(Trp)使用1 個(gè)密碼子AUG 和UGG 外,其余氨基酸均有 2~6 個(gè)同義密碼子。亮氨酸(Leu)、精氨酸(Arg)、絲氨酸(Ser)使用6 個(gè)同義密碼子,使用頻率最高的密碼子分別為UUA、UCU、AGA;丙氨酸(Ala)、甘氨酸(Gly)、脯氨酸(Pro)、蘇氨酸(Thr)、纈氨酸(Val)分別使用4 個(gè)同義密碼子,使用頻率最高的密碼子分別為GGA、CCA、GUU、CCU、ACU;異亮氨酸(lle)使用3 個(gè)同義密碼子,使用頻率最高的密碼子是AUU;半胱氨酸(Cys)、天冬氨酸(Asp)、谷氨酸(Glu)、苯丙氨酸(Phe)、組氨酸(His)、賴氨酸(Lys)、天冬酰胺(Asn)、谷氨酰胺(Gln)、酪氨酸(Tyr)均使用2 個(gè)同義密碼子,但使用頻率并不相同,這9 個(gè)氨基酸使用頻率較高的密碼子分別為UUU、AAA、AAU、UAU、UUC、GAA、GAU、AAG、CAA。結(jié)果表明,遠(yuǎn)志葉綠體基因偏好使用含有A、U 堿基的密碼子,密碼子第3 位也偏好以A 和U 結(jié)尾。
圖3 遠(yuǎn)志葉綠體基因組的密碼子使用頻率Fig. 3 Codon usage frequency in chloroplast genome of P. tenuifolia
相對(duì)同義密碼子使用度(RSCU)分析表明,在所有被編碼的密碼子中,RSCU>1 的密碼子共有35 個(gè)(AGA、UCU、UUA 等),其中27 個(gè)密碼子以A/U 堿基結(jié)尾,以A 結(jié)尾的占51.85%,以U 結(jié)尾的占48.15%,故這些密碼子的結(jié)尾具有A/U 偏好性。RSCU<1 的密碼子共有29 個(gè)(CGC、AAC、GAC 等),以G/C 結(jié)尾的共有23 個(gè),且以C 結(jié)尾占52.13%和以G 結(jié)尾的占47.83%(表5)。
表5 遠(yuǎn)志綠體基因組蛋白編碼序列RSCU 分析Table 5 RSCU of protein coding region in chloroplast genome of P. tenuifolia
從NCBI 下載了遠(yuǎn)志、瓜子金、卵葉遠(yuǎn)志、黃花倒水蓮、黃花遠(yuǎn)志、西南遠(yuǎn)志、香港遠(yuǎn)志和密花遠(yuǎn)志8種遠(yuǎn)志屬植物的葉綠體基因組,它們的全長分別為165 423、165 439、165 397、164 687、164 947、164 268、165 296、171 893 bp。黃花倒水蓮葉綠體基因組的GC 值最大,為36.9%,其余GC 含量均在36.7%~36.9%(表6)。瓜子金的LSC 最長,為83 722 bp、密花遠(yuǎn)志的SSC 最長為8409 bp。
表6 8 種遠(yuǎn)志屬植物葉綠體基因組的特征Table 6 Chloroplast genome characteristics of eight Polygala plants
在遠(yuǎn)志屬8 種植物的葉綠體基因組邊界區(qū)域中,遠(yuǎn)志葉綠體基因組共存在4 個(gè)邊界,遠(yuǎn)志與其他7種植物的LSC/IRb、IRb/SSC、SSC/IRa 和IRa/LSC邊界及基因分布(圖4)。除密花遠(yuǎn)志和西南遠(yuǎn)志外,JLB(LSC/IRb)邊界兩側(cè)分布均有rpsl2和rps19基因,密花遠(yuǎn)志邊界位于petB基因中,是其獨(dú)有的基因,該基因的保守長度為1390 bp,西南遠(yuǎn)志JLB 邊界有rpl23基因存在,距離邊界184 bp。其中遠(yuǎn)志中的rps19基因距離JLB(LSC/IRb)邊界長度為1 bp,其位于LSC 區(qū)域內(nèi),rps12位于IRb 區(qū)域內(nèi)。
圖4 遠(yuǎn)志屬8 個(gè)物種葉綠體基因組的IR 與SC 邊界比較Fig. 4 Boubdary comparison of IR and SC region of chloroplast genomes in nine species of Polygala
ndhF基因位于JSB(IRb/SSC)的邊界,8 種植物在該位置與基因存在間隙或重疊存在。其中該基因在遠(yuǎn)志中距SSC 區(qū)僅21 bp,其中香港遠(yuǎn)志和卵葉遠(yuǎn)志ndhF擴(kuò)張最大。香港遠(yuǎn)志、黃花遠(yuǎn)志和卵葉遠(yuǎn)志的JSB(IRb/SSC)邊界均位于ndhF,其余遠(yuǎn)志屬物種均在SSC 區(qū)域,該基因相對(duì)保守長度均為2240 bp。另一個(gè)ndhG基因位于JSA(SSC/IR)交界處,均位于SSC 區(qū)域中。除了黃花遠(yuǎn)志距離邊界24 bp,其余距離邊界60~74 bp。
ndhI基因位于JSB(IRb/SSC)的邊界,均位于IRa 區(qū)域中。西南遠(yuǎn)志JLA(IRa/LSC)邊界分布有ycf2基因,密花遠(yuǎn)志分布有trnH基因。而其他6 種植物在該處均為trnH和rpl2基因。其中,trnH基因均分布在LSC 區(qū)域,rpl2基因均分布在IRa 區(qū)域。IRA-LSC 邊界均與trnH基因存在著48~86 bp 的間隙??傮w來說,遠(yuǎn)志屬的西南遠(yuǎn)志和密花遠(yuǎn)志葉綠體基因組和邊界基因與其余6 個(gè)葉綠體基因組相互之間具有明顯的差異。
利用最大似然法構(gòu)建系統(tǒng)發(fā)育分析結(jié)果顯示,11 種植物被分為2 大類,即遠(yuǎn)志科和外類群(苦木科和蕓香科),見圖5。包括遠(yuǎn)志在內(nèi)的遠(yuǎn)志屬8 個(gè)物種和一個(gè)齒果草屬以100%的支持率構(gòu)成一個(gè)單系分支與蕓香科和苦木科區(qū)分開來。同時(shí),這9 個(gè)物種可以進(jìn)一步劃分為2 個(gè)次級(jí)單系分支,其中,同來自遠(yuǎn)志屬的黃花遠(yuǎn)志、黃花倒水蓮、密花遠(yuǎn)志和齒果草屬齒果草4 個(gè)物種構(gòu)成一個(gè)單系的支持率為100%,齒果草屬和部分遠(yuǎn)志屬聚類到一塊值得進(jìn)一步研究,側(cè)面說明葉綠體基因組序列也并不能完全解決遠(yuǎn)志屬內(nèi)部網(wǎng)狀進(jìn)化等問題,仍需和其他基因組學(xué)聯(lián)合分析。結(jié)合IR 邊界分析可知遠(yuǎn)志、瓜子金、卵葉遠(yuǎn)志和香港遠(yuǎn)志的親緣關(guān)系最近。本研究的遠(yuǎn)志葉綠體基因組序列可為遠(yuǎn)志科后續(xù)開展遺傳多樣性研究提供重要信息。
圖5 基于葉綠體全基因組序列構(gòu)建ML 系統(tǒng)進(jìn)化樹Fig. 5 Phylogenetic analysis based on chloroplast genome sequences by maximum likelihood (ML) tree
鄰接法的結(jié)果與最大似然法構(gòu)樹除了齒果草和密花遠(yuǎn)志位置互換外,其余結(jié)果一致,見圖6。遠(yuǎn)志科仍分為2 大類同來自遠(yuǎn)志屬的遠(yuǎn)志和卵葉遠(yuǎn)志、瓜子金和香港遠(yuǎn)志4 個(gè)物種分為一類,黃花倒水蓮、黃花遠(yuǎn)志、密花遠(yuǎn)志和齒果草屬齒果草聚到一類。仍然可以說明遠(yuǎn)志和卵葉遠(yuǎn)志、瓜子金和香港遠(yuǎn)志關(guān)系密切。
圖6 基于葉綠體全基因組序列構(gòu)建NJ 系統(tǒng)進(jìn)化樹Fig. 6 Phylogenetic analysis based on chloroplast genome sequences by neighbor-joining (NJ) tree
《中國藥典》2020 年版中將遠(yuǎn)志科植物遠(yuǎn)志P.tenuifoliaL.的干燥根作為遠(yuǎn)志的主流基原藥材[47]進(jìn)行商品流通,其藥用價(jià)值顯著。近年來,面臨遠(yuǎn)志的野生資源狀況不容樂觀,植物資源日益貧乏的危險(xiǎn)。本實(shí)驗(yàn)基于葉綠體基因組技術(shù)進(jìn)行序列分析、密碼子偏好分析、遠(yuǎn)志屬基因組比較分析以及遠(yuǎn)志屬植物系統(tǒng)發(fā)育關(guān)系研究為遠(yuǎn)志在野生資源保護(hù)、分子育種及遠(yuǎn)志屬藥用植物的物種鑒定等領(lǐng)域提供了寶貴的基因資源。
本實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),遠(yuǎn)志葉綠體基因組長為165 423 bp,GC 含量為36.7%,共編碼135 個(gè)基因,這與先前報(bào)道的遠(yuǎn)志屬其他植物西南遠(yuǎn)志[31]的葉綠體基因組結(jié)構(gòu)特征類似,表明遠(yuǎn)志的葉綠體基因組結(jié)構(gòu)相對(duì)保守。與韓國學(xué)者Lee 等[32]發(fā)表的文章相比較,本研究將系統(tǒng)發(fā)育樹聚焦到遠(yuǎn)志科植物上,且增加對(duì)其重復(fù)序列,密碼子偏好性,遠(yuǎn)志屬基因組比較,IR 邊界內(nèi)容的分析,補(bǔ)充和完善前者文章分析量少的缺點(diǎn),從而對(duì)其葉綠體基因組有了更加全面的了解。
SSR 在植物葉綠體基因組中十分常見,其類型、數(shù)目及分布都因植物不同而異,被廣泛應(yīng)用于植物群體遺傳多樣性和系統(tǒng)發(fā)育研究以及分子標(biāo)記研究等內(nèi)容[48-49]。本研究通過分析遠(yuǎn)志葉綠體基因組,共檢測到161 個(gè)SSR 位點(diǎn),其主要位于LSC 區(qū)域;并且單核苷酸A/T 堿基在SSR 位點(diǎn)中出現(xiàn)頻率最高,調(diào)研文獻(xiàn)推測原因是在大部分植物中A/T 含量均高于G/C 含量,即A/T 類型的SSR 在植物中最多[37,39,42]。本研究通過對(duì)遠(yuǎn)志葉綠體基因組中SSR 的數(shù)量、組成進(jìn)行分析,為后續(xù)進(jìn)一步研究分子標(biāo)記、群體遺傳分析以及作物育種提供參考。
CUB 是基因組中重要的進(jìn)化特征,RSCU 是作為密碼子偏好性的指標(biāo)之一[50]。研究表明,自然界存在的20 種氨基酸中,除Met 和Trp 由唯一密碼子編碼外,其他氨基酸均對(duì)應(yīng)2~6 個(gè)同義密碼子,由于同義密碼子在機(jī)體內(nèi)的使用頻率存在差異,導(dǎo)致植物密碼子的出現(xiàn)頻率不同,在不同物種翻譯的過程中。存在突變和自然選擇等多種因素,表現(xiàn)出一定的偏好性[51]。本研究中密碼子偏好性分析表明,亮氨酸(Leu)是遠(yuǎn)志葉綠體基因組中占比最高的氨基酸,并且RSCU>1 的27 種密碼子均以A/U 結(jié)尾,這與其他高等植物相似。
通過對(duì)遠(yuǎn)志屬基因組特征分析,可知黃花倒水蓮葉綠體基因組的GC 值最大,為36.9%,其余GC 含量均在36.7%~36.9%。瓜子金的LSC 最長為83 722 bp、密花遠(yuǎn)志的SSC 最長為8409 bp,通過IR 邊界分析遠(yuǎn)志、卵葉遠(yuǎn)志、瓜子金、香港遠(yuǎn)志、黃花遠(yuǎn)志、黃花倒水蓮親緣關(guān)系較近,其物種結(jié)構(gòu)更加相似。相對(duì)保守的IR 區(qū)域的收縮與擴(kuò)張現(xiàn)象代表著植物的進(jìn)化,不同植物的葉綠體基因組大小與其密切相關(guān)。分析IR-LSC/SSC 區(qū)域的邊界信息,對(duì)葉綠體基因組結(jié)構(gòu)的差異、物種進(jìn)化等有進(jìn)一步了解[52]。通過對(duì)8 個(gè)物種的IR 邊界研究發(fā)現(xiàn),在密花遠(yuǎn)志葉綠體基因組的IR 長度最大,其葉綠體基因組長度8 個(gè)物種中也最大,遠(yuǎn)志屬植物葉綠體基因組除了西南遠(yuǎn)志和密花遠(yuǎn)志外,基本邊界變化呈現(xiàn)規(guī)律性。
基于遠(yuǎn)志科9 個(gè)物種的葉綠體基因組數(shù)據(jù)構(gòu)建最大似然樹和鄰接法兩種構(gòu)建系統(tǒng)發(fā)育樹,支持率均為100,其進(jìn)化樹的拓?fù)浣Y(jié)構(gòu)略有不同,與Ma 等[31]構(gòu)建的進(jìn)化樹存在一些差異,分析其系統(tǒng)發(fā)育關(guān)系可知,遠(yuǎn)志、卵葉遠(yuǎn)志、瓜子金和香港遠(yuǎn)志為姊妹類群,表明四者親緣關(guān)系最近,另外遠(yuǎn)志科與外類群其他屬能夠很好的區(qū)分。原因首先基于葉綠體不同數(shù)據(jù)集構(gòu)建的進(jìn)化樹,本研究相比其數(shù)據(jù)量更為豐富些。其次葉綠體基因片段可能會(huì)丟失某些重要的信息,難以解決物種多、分類較難的大科的系統(tǒng)進(jìn)化問題。并且基于葉綠體的不同數(shù)據(jù)集構(gòu)建的進(jìn)化樹相比于其他方法構(gòu)建的進(jìn)化樹支持率更高,可靠性更強(qiáng),為遠(yuǎn)志的系統(tǒng)分類地位和種間進(jìn)化關(guān)系研究奠定一定的理論基礎(chǔ)。
本研究對(duì)遠(yuǎn)志葉綠體基因組進(jìn)行研究,并分析了其葉綠體基因組結(jié)構(gòu)特征,挖掘其葉綠體基因組的重復(fù)序列位點(diǎn)、分析其密碼子偏好性和遠(yuǎn)志屬葉綠體基因組IR 與SC 邊界分析并利用葉綠體基因組數(shù)據(jù)構(gòu)建系統(tǒng)發(fā)育樹,有助于后續(xù)分子標(biāo)記、DNA條形碼技術(shù)等研究的深入進(jìn)展,提供了遠(yuǎn)志葉綠體基因組信息支持。揭示遠(yuǎn)志屬物種之間的系統(tǒng)關(guān)系,為藥用遠(yuǎn)志的資源篩選、鑒定、保存及遺傳多樣性分析等后續(xù)研究提供了分子依據(jù),為產(chǎn)業(yè)化應(yīng)用奠定基礎(chǔ),進(jìn)而為保護(hù)遠(yuǎn)志物種資源提供有力保障。
利益沖突所有作者均聲明不存在利益沖突