李 娟, 童家赟, 范智超, 童 毅
( 廣州中醫(yī)藥大學(xué) 中藥學(xué)院, 廣州 510006 )
桃葉珊瑚屬(AucubaThunb.),隸屬于絲纓花科(Garryaceae)(Angiosperm Phylogeny Group et al., 2016),為常綠小喬木或灌木。該屬植物四季常青,冬季紅果,為庭園綠化的優(yōu)良觀葉觀果樹種(Xiang &Boufford, 2005)。本屬部分種類民間藥用,主要以根、葉和果實入藥,具有清熱解毒、祛風除濕、活血化瘀等功效(國家中醫(yī)藥管理局中華本草編委會,1997;江紀武,2005;南京中醫(yī)藥大學(xué),2006;艾鐵民,2013)。最先從桃葉珊瑚屬植物中發(fā)現(xiàn)的桃葉珊瑚苷(aucubin, AU)具有廣泛藥理活性,包括抗氧化、抗衰老、抗炎、保肝等(Zeng et al., 2020)。
然而,桃葉珊瑚屬植物基礎(chǔ)的分類修訂和物種劃分遠未完成,這直接影響今后桃葉珊瑚屬植物的化學(xué)和藥理研究,也給藥用桃葉珊瑚新資源的開發(fā)、推廣、生產(chǎn)指導(dǎo)等帶來困難。雖然桃葉珊瑚屬的花、果實或全株體態(tài)使其很容易與其他類群區(qū)別,但由于可用作桃葉珊瑚屬屬下物種鑒定的形態(tài)特征較為復(fù)雜(如葉形、葉緣、毛被等),種間缺乏有效區(qū)分的形態(tài)分類性狀且可能存在廣泛的雜交和多倍化事件,導(dǎo)致屬內(nèi)物種劃分存在很大困難,該屬系統(tǒng)而全面的種間系統(tǒng)發(fā)育關(guān)系亟待建立(Xiang &Boufford, 2005)。
在植物進化過程中,葉綠體基因組的結(jié)構(gòu)和序列相對保守,編碼基因的數(shù)量、結(jié)構(gòu)、組成和排列順序基本一致,極少發(fā)生重組等變異,被廣泛應(yīng)用于植物的物種鑒定、系統(tǒng)發(fā)育和物種起源研究中(劉昶和黃林芳,2020)。目前,在美國國家生物信息中心(NCBI)上共收錄了7條桃葉珊瑚屬植物葉綠體基因組序列,黃媛等(2022)基于這7條葉綠體基因組的68個蛋白質(zhì)編碼基因?qū)μ胰~珊瑚屬進行系統(tǒng)發(fā)育分析,結(jié)果支持了絲纓花目、絲纓花科和桃葉珊瑚屬的單系性。
本研究通過淺層基因組測序技術(shù),以已發(fā)表的青木(A.japonica)的葉綠體基因組(序列號NC_058874.1)作為參考,組裝注釋了花葉青木(A.japonicavar.variegata)、峨眉桃葉珊瑚(A.omeiensis)、桃葉珊瑚(A.chinensis)、密花桃葉珊瑚(A.confertiflora)、纖尾桃葉珊瑚(A.filicauda)、窄斑葉珊瑚(A.albopunctifoliavar.angustula)以及黃楊葉絲纓花(Garryabuxifolia)的葉綠體基因組。通過對桃葉珊瑚屬植物的葉綠體基因組進行序列比較及系統(tǒng)發(fā)育分析,擬探討以下問題:(1)6種桃葉珊瑚屬植物葉綠體基因組序列有何結(jié)構(gòu)特征;(2)這些序列之間有何差異;(3)桃葉珊瑚屬的系統(tǒng)發(fā)育地位如何,6種桃葉珊瑚屬植物之間有何親緣關(guān)系。以期為今后深入研究桃葉珊瑚屬植物的分類修訂、系統(tǒng)發(fā)育、生物地理、分子鑒定和物種進化等研究提供葉綠體基因組信息的參考資料。
桃葉珊瑚屬植物的分子材料主要來源于西南和華南分布地野外采集的新鮮葉片,每個個體采集2~3片新鮮健康葉片,分別用濕紙巾和吸水紙擦去表面的污漬和水,剪碎后放入茶包袋,用硅膠進行快速干燥。所有憑證標本均保存在廣州中醫(yī)藥大學(xué)標本室(GUCM),經(jīng)該文作者分類鑒定,確定這6種桃葉珊瑚屬植物分別為峨眉桃葉珊瑚、桃葉珊瑚、密花桃葉珊瑚、花葉青木、纖尾桃葉珊瑚和窄斑葉珊瑚(圖1)。黃楊葉絲纓花的干燥葉片取自加州大學(xué)伯克利分校植物園(UC Botanical Garden)栽培植物(分子標本采集號SZ5417)。青木的葉綠體全基因組序列(序列號NC_058874.1)從NCBI數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/)下載,用作葉綠體基因組組裝及注釋的參考,所有新測序的葉綠體基因組序列以及注釋信息均已上傳至NCBI數(shù)據(jù)庫,并獲得登錄號。采集信息及GenBank登錄號見表1。
表 1 桃葉珊瑚屬6種植物采集信息及GenBank登錄號Table 1 Collected informations and GenBank accession numbers of six Aucuba species
采用改良的CTAB方法(Doyle &Doyle, 1987),從硅膠干燥的葉片中提取桃葉珊瑚屬植物的總DNA;提取總DNA后,使用B-500超微量分光光度計(上海元析儀器有限公司)以及瓊脂糖凝膠電泳檢測所提DNA的質(zhì)量和濃度,檢測合格的DNA測序工作委托深圳華大基因科技有限公司使用DNBSEQ測序平臺進行二代測序;最終每個樣品獲得3 Gb的clean data。
首先,使用GetOrganelle-1.7.3.5.(Jin et al., 2020)軟件進行葉綠體基因組拼接組裝,k-mer值設(shè)置65、105、127,線程t設(shè)置24,其他命令使用默認參數(shù),最終的組裝命令為get_organelle_from_reads.py -1 sample_1.fastq.gz -2 sample_2.fastq.gz -F embplant pt -o output-plastome -R 10 -t 24 -k 65,105,127;然后,以青木的葉綠體全基因組序列作為參考,利用PGA-master(Qu et al., 2019)軟件對組裝出的葉綠體基因組進行注釋,使用Geneious R 9.0.2(Basic, 2012)軟件對PGA-master的注釋結(jié)果進行手動校正;最后,使用在線軟件OGDraw(Lohse et al., 2013)繪制葉綠體基因組物理圖譜。
使用Geneious R 9.0.2軟件分別統(tǒng)計6種桃葉珊瑚屬葉綠體全基因組序列、兩個單拷貝區(qū)以及一對反向重復(fù)區(qū)的長度、各區(qū)GC含量以及基因注釋結(jié)果等信息。
對6種桃葉珊瑚植物葉綠體基因組中的蛋白編碼基因序列(CDS)進行篩選,剔除重復(fù)基因以及長度小于300 bp的基因,序列中堿基類型僅包含A、T、C、G,每條序列均含有起始密碼子(ATG)和終止密碼子(TAG、TGA和TAA),序列中間沒有終止密碼子。最終每個葉綠體基因組序列均獲得52條符合條件的CDS,使用CodonW(Peden,2005)軟件計算這些序列的同義密碼子相對使用度(RSCU)以及有效密碼子數(shù)(ENC),所得數(shù)據(jù)在Excel進行整理,并用TBtools(Chen et al., 2020)軟件繪制熱圖。密碼子中RSCU值大于1的被確定為高頻密碼子(Wang et al., 2018)。同時滿足高頻及高表達條件的密碼子被認定為最優(yōu)密碼子(Sharp &Li, 1987)。高表達基因具有較低的ENC值,低表達基因具有較高的ENC值,按照ENC值的大小對每個物種的基因進行排序,選取高低兩端各10%的基因分別作為低表達基因組和高表達基因組,計算高表達基因組和低表達基因組每個密碼子的差值ΔRSCU,ΔRSCU大于0.08則定為高表達密碼子,篩選出高達表密碼子中RSCU值大于1的高頻密碼子,即得最優(yōu)密碼子(Sharp &Li, 1987)。
A. 峨眉桃葉珊瑚; B. 桃葉珊瑚; C. 密花桃葉珊瑚; D. 花葉青木; E. 纖尾桃葉珊瑚; F. 窄斑葉珊瑚。A. A. omeiensis; B. A. chinensis; C. A. confertiflora; D. A. japonica var. variegata; E. A. filicauda; F. A. albopunctifolia var. angustula.圖 1 6種桃葉珊瑚屬植物圖Fig. 1 Pictures of six Aucuba species
圖 2 桃葉珊瑚屬6種植物葉綠體基因組的物理圖譜Fig. 2 Chloroplast genome map of six Aucuba species
通過REPuter(Stefan et al., 2001)在線軟件查找葉綠體基因組的重復(fù)序列,包括正向重復(fù)序列(forward repeats)、反向重復(fù)序列(reverse repeats)、互補重復(fù)序列(complement repeats)以及回文序列(palindromic repeats)4種重復(fù)類型,參數(shù)設(shè)定為重復(fù)堿基單元n≥30 bp,漢明距離(Hamming distance)為3。此外,使用Tandem Repeats Finder(TRF)(Benson, 1999)串聯(lián)重復(fù)序列查找工具的默認參數(shù)檢測串聯(lián)重復(fù)序列(tandem repeats)。使用MISA(Beier et al., 2017)軟件的Perl腳本檢測葉綠體基因組的SSR,從單核苷酸到六核苷酸的重復(fù)次數(shù)閾值設(shè)定依次為 10、5、4、3、3,即1個堿基重復(fù)≥10次,2個堿基重復(fù)≥5次,3個堿基重復(fù)≥4次,4個、5個、6個堿基重復(fù)≥3次。
使用在線軟件IRscope(Ali et al., 2018)對6條序列進行IR 邊界收縮和擴張的可視化分析,得到葉綠體基因組的簡化示意圖。
以峨眉桃葉珊瑚作為參考序列,利用在線軟件mVISTA(Frazer et al., 2004)對6個葉綠體基因組進行序列一致性比較分析,采用Shuffle-LAGAN運行模式,生成6個葉綠體基因組差異的可視化結(jié)果。
基因數(shù)量及基因順序的保守性稱為共線性,使用Geneious R 9.0.2軟件里的Mauve插件(Darling et al., 2004),對6條序列進行共線性分析,用于可視化該屬各物種基因排列順序的一致性和基因重排與倒位現(xiàn)象。
使用DnaSP v6.0(Rozas et al., 2017)軟件對6條序列進行滑動窗口分析,檢測葉綠體基因組的高變熱點區(qū)及其大小、變異位點數(shù)等信息,并計算核苷酸多樣性(nucleotide diversity,Pi)。將比對好的序列導(dǎo)入DnaSP v6.0,運行參數(shù)設(shè)定步長(step size)為200 bp,窗口長度(window length)為600 bp,篩選出Pi值大于0.01且片段長度不小于150 bp的片段作為桃葉珊瑚屬植物葉綠體基因組高變區(qū)域,并根據(jù)基因注釋的結(jié)果確定它們在葉綠體基因組上的位置。
為了揭示桃葉珊瑚屬的系統(tǒng)發(fā)育關(guān)系,從NCBI下載了絲纓花目下的杜仲科杜仲(序列號NC_037948),加上本次組裝所得的黃楊葉絲纓花(序列號OQ348517),作為外類群,共計9條葉綠體基因組序列構(gòu)建桃葉珊瑚屬的系統(tǒng)發(fā)育樹。使用Geneious R 9.0.2里的MAFFT(Rozewicki et al., 2019)插件進行多序列比較,切掉序列頭尾不一樣長的堿基后用于系統(tǒng)發(fā)育樹的構(gòu)建。通過最大似然法(ML)和貝葉斯推斷法(BI)重建桃葉珊瑚屬系統(tǒng)發(fā)育關(guān)系。使用IQtree(Minh et al., 2020)構(gòu)建ML樹;使用JModeltest(Posada, 2020)軟件進行比對后核酸序列替代模型的選擇,以貝葉斯信息準則(Bayesian information criterion, BIC)為標準選出最佳建樹模型,使用MrBayes(Ronquist &Huelsenbeck, 2003)構(gòu)建BI樹。
6條桃葉珊瑚屬葉綠體全基因組的物理圖譜見圖2。由圖2可知,6條序列均為典型的雙鏈環(huán)狀DNA,分子序列全長為157 891~158 325 bp,其總GC含量為37.7%~37.8%。LSC區(qū)的序列長度為87 210~87 563 bp,GC含量為35.8%~35.9%,SSC區(qū)的序列長度為18 531~18 580 bp, GC含量為31.5%~31.6%,IR區(qū)的序列長度為26 067~26 143 bp,GC含量為43.0%~43.1%(表2)。6條序列均編碼114個基因(不含IR區(qū)重復(fù)的基因),包括80個蛋白編碼基因(CDS)、30個轉(zhuǎn)運RNA(tRNA)、4個核糖體RNA(rRNA)(表3)。
6條桃葉珊瑚屬葉綠體基因組CDS的相對同義密碼子使用度(RSCU)見圖3。 RSCU>1,表明該密碼子是偏好密碼子,使用較頻繁;RSCU=1表明該密碼子無使用偏好性;RSCU<1表明該密碼子使用頻率較低。在分析時剔除終止密碼子UAA、UGA和UAG,以及色氨酸的唯一密碼子UGG和蛋氨酸的唯一密碼子AUG, 因為這些密碼子不存在偏好性。由圖3可知,6條序列均有59個同義密碼子,RSCU>1的高頻密碼子數(shù)均為29個,其中,有28個以A或U結(jié)尾,有1個以G結(jié)尾,說明桃葉珊瑚屬植物葉綠體基因組的密碼子偏好以A或U結(jié)尾。
表 2 桃葉珊瑚屬6種植物葉綠體基因組基本特征Table 2 Basic characteristics of chloroplast genomes in six Aucuba species
6條序列共篩選出100個最優(yōu)密碼子(表4),其中,除了窄斑葉珊瑚、花葉青木、纖尾桃葉珊瑚和密花桃葉珊瑚共同擁有的UUG以G結(jié)尾之外,其余最優(yōu)密碼子皆為A/U結(jié)尾,6條序列共有的12個最優(yōu)密碼子,分別為AAA、ACU、AGU、CAA、CCU、CGU、GAA、GCU、GGU、GUU、UCU、UGU。其中,峨眉桃葉珊瑚、花葉青木和密花桃葉珊瑚分別特有的最優(yōu)密碼子為CAU、CUU和GAU。
利用軟件REPuter共鑒定出6條序列共270個散在重復(fù)序列,包括133個正向重復(fù)序列、8個反向重復(fù)序列、2個互補重復(fù)序列、127個回文重復(fù)序列(表5)。6條序列中,正向重復(fù)序列最多,回文重復(fù)序列次之,反向重復(fù)序列和互補重復(fù)序列較少,僅在桃葉珊瑚和窄斑葉珊瑚中分別檢測到了一條互補重復(fù)序列,其他4種植物均未檢測到。
通過TRF對串聯(lián)重復(fù)序列進行檢測,統(tǒng)計情況見表6。由表6可知,6條序列中串聯(lián)重復(fù)序列共133個,其中檢測到串聯(lián)重復(fù)序列最少的是密花桃葉珊瑚,為20個,而花葉青木最多,達25個。桃葉珊瑚屬植物葉綠體基因組的串聯(lián)重復(fù)序列在LSC區(qū)和IR 區(qū)的分布明顯多于SSC區(qū)。
MISA軟件檢測結(jié)果(表7)顯示,6條序列共檢測到412個SSR位點,共識別出4種SSR,包括單核苷酸 SSR(367個)、二核苷酸 SSR(26個)、三核苷酸 SSR(9個)、四核苷酸 SSR(10個)。SSR的類型以單核苷酸A/T重復(fù)為主,占比所有SSR位點數(shù)的86.88%~99.41%,其中,纖尾桃葉珊瑚和花葉青木被識別出最多的SSR個數(shù),均為73個,桃葉珊瑚被識別出最少的SSR個數(shù),為61個。
桃葉珊瑚屬植物葉綠體全基因組的2個IR區(qū)在LSC及SSC之間存在LSC/IRb、SSC/IRb、SSC/IRa以及LSC/IRa 4這4個邊界(圖4)。4個邊界相對保守,但各種之間仍具較小差異。LSC/IRb的邊界均位于rps19基因內(nèi)部,6條序列的rps19基因均向IRb區(qū)擴張了33 bp;SSC/IRb邊界均位于ndhF基因內(nèi)部,6條序列的ndhF基因均向IRb區(qū)擴張了42 bp;SSC/IRa邊界均位于ycf1基因內(nèi)部,密花桃葉珊瑚和花葉青木的ycf1基因向IRa區(qū)擴張了1 082 bp,纖尾桃葉珊瑚、窄斑葉珊瑚和峨眉桃葉珊瑚的ycf1基因向IRa區(qū)擴張了1 079 bp,桃葉珊瑚的ycf1基因向IRa區(qū)擴張了1 061 bp;LSC/IRa邊界位于trnH附近,峨眉桃葉珊瑚與密花桃葉珊瑚的LSC/IRa邊界與trnH的距離為14 bp,其余4種的LSC/IRa邊界與trnH的距離均為7 bp。
顏色越深表示該密碼子的RSCU值越高;高頻密碼子(RSCU>1)已用紅色字體標出。The darker color in the figure indicates the higher RSCU value of the codon; high-frequency codons (RSCU>1) marked in red.圖 3 桃葉珊瑚屬6種植物葉綠體基因組RSCU熱圖Fig. 3 RSCU heat map of chloroplast genomes of six Aucuba species
表 3 桃葉珊瑚屬6種植物葉綠體基因組的基因組成Table 3 Chloroplast genome compositions of six Aucuba species
為了比較桃葉珊瑚屬內(nèi)物種間葉綠體基因組序列的差異,以峨眉桃葉珊瑚的葉綠體基因組序列為參考,將該6條序列進行全局對比,mVISTA圖的結(jié)果(圖5)顯示了桃葉珊瑚屬6條序列的高度相似性,單拷貝區(qū)比反向重復(fù)區(qū)更保守,編碼區(qū)比非編碼區(qū)(non-coding sequences, NCS)相對更保守。位于LSC區(qū)的trnC-GCA-petN以及位于IR區(qū)的rps7-trnV-GAC均為基因間隔區(qū),在這些區(qū)域相似度較低,存在不同程度的變異。此外,rRNA基因和tRNA基因區(qū)域的一致度最高,序列最為保守。LSC和SSC區(qū)序列相比于IR區(qū)有更多的變異,表明IR區(qū)在進化過程中更為保守。
葉綠體基因組的多重基因組比對法檢測出6條序列之間只有一個局部共線區(qū)(locally collinear blocks, LCBs)(圖6),所有基因的種類、數(shù)量和排列順序在屬內(nèi)均高度一致,葉綠體基因組完全共線,沒有重排重組現(xiàn)象發(fā)生,進一步說明該屬葉綠體基因組具有較高的保守性。
滑窗分析結(jié)果(圖7)顯示,6條序列的核苷酸多樣性(Pi)在0~0.018 89之間,平均Pi值為0.003 51,表明6種植物的葉綠體基因組高度相似,序列非常保守;其中IR區(qū)的核苷酸多樣性(Pi=0.000 85)明顯低于LSC區(qū)(Pi=0.004 47)和SSC(Pi=0.006 14)區(qū),SSC顯示出最高的核苷酸多樣性,而IR區(qū)在整個葉綠體基因組中更為保守。共篩選出10個高變片段(表8),包括位于LSC區(qū)的rps16、rps16-trnQ-UUG、rpoB-trnC-GCA、petN-psbM、trnC-GCA-petN、psbM-trnD-GUC和accD-psaI 7個片段,以及位于SSC區(qū)的ndhE、ndhE-ndhG和ycf1 3個片段,其中,ycf1的分化程度最高。在這些高變區(qū)域中,僅有rps16、ndhE和ycf1 3個片段是編碼序列,其他高變片段均位于基因間隔區(qū)(intergenic spacer,IGS),這些高變片段可作為桃葉珊瑚屬植物物種鑒定的條形碼候選片段。
目前,葉綠體基因組中被廣泛應(yīng)用于植物鑒定的3條通用的條形碼為matK、rbcL和trnH-GUG-psbA,但是在本研究中,這3個片段在桃葉珊瑚屬葉綠體基因組序列中均顯示了較低的Pi值,變異程度不理想,從Pi值的角度分析不適合做分子標記。
根據(jù)BIC方法用JModeltest篩選出核苷酸的最佳替代模型均為GTR+G。分別使用軟件MrBayes和IQtree構(gòu)建BI樹和ML樹。系統(tǒng)發(fā)育分析結(jié)果(圖8)表明,基于葉綠體全基因組構(gòu)建的BI樹和ML樹展現(xiàn)出了完全一致的拓撲結(jié)構(gòu),桃葉珊瑚屬所有物種形成一個支持率高的單系(BS=100%,PP=1),與絲纓花屬構(gòu)成姊妹類群,共同組成絲纓花科。桃葉珊瑚屬屬內(nèi)分化為兩個進化支,峨眉桃葉珊瑚、密花桃葉珊瑚以及桃葉珊瑚共同組成進化支Ⅰ(Clade Ⅰ, BS=100%, PP=1),花葉青木、青木、纖尾桃葉珊瑚以及窄斑葉珊瑚共同組成進化支Ⅱ(Clade Ⅱ, BS=100%, PP=1)。
表 5 桃葉珊瑚屬6種植物葉綠體基因組中散在重復(fù)序列的類型和數(shù)量Table 5 Types and numbers of interspersed repeats in chloroplast genomes of six Aucuba species
表 6 桃葉珊瑚屬6種植物葉綠體基因組中串聯(lián)重復(fù)序列統(tǒng)計Table 6 Total counts of tandem repeats in chloroplast genomes of six Aucuba species
本研究組裝注釋了桃葉珊瑚屬6種植物的葉綠體基因組,并進行了序列比較分析,結(jié)果顯示6條序列高度相似,無論是基因組結(jié)構(gòu)及大小,還是基因的含量及組成,皆是相對保守。桃葉珊瑚屬葉綠體基因組擁有典型的環(huán)狀四分體結(jié)構(gòu),6條序列全長157 891~158 325 bp,6條序列均編碼114個基因,包括80個蛋白質(zhì)編碼基因、30個tRNA基因以及4個rRNA基因,總GC量為37.7%~37.8%。LSC、SSC、IR區(qū)的GC含量分別為35.8%~35.9%、31.5%~31.6%、43.0%~43.1%,與大多數(shù)被子植物一樣,桃葉珊瑚屬葉綠體基因組的IR區(qū)相較于LSC區(qū)和SSC區(qū)都更為穩(wěn)定,有著最高的GC含量。
密碼子對于遺傳信息的正確表達至關(guān)重要,密碼子的使用偏好在不同物種甚至某一物種內(nèi)的不同基因都具有特異性,這是由于基因與物種長期進化過程中選擇、突變以及漂變等因素的綜合作用,親緣關(guān)系越近或者生存環(huán)境越相似的物種越有可能采用相似的密碼子選擇策略(Romero, et al., 2000; Xu, et al., 2011),通過比較密碼子偏好性差異可以推斷基因是否受到不同程度的翻譯選擇,對于探討桃葉珊瑚屬物種的進化模式有著重要的作用。6條序列均有59個同義密碼子,RSCU>1的高頻密碼子數(shù)均為29個,其中,除了UUG以G結(jié)尾之外,其余28個高頻密碼子均以A/U結(jié)尾,這表明桃葉珊瑚屬葉綠體基因組的密碼子偏好以A/U結(jié)尾;在6條序列中共篩選出100個最優(yōu)密碼子,包含12個共有最優(yōu)密碼子,分別為AAA、ACU、AGU、CAA、CCU、CGU、GAA、GCU、GGU、GUU、UCU、UGU,均是以A/U結(jié)尾,尤其是以U結(jié)尾較多,這與雙子葉植物偏好使用A/U結(jié)尾密碼子的研究結(jié)果一致(Kawabe &Miyashita, 2003)。
葉綠體重復(fù)序列的存在和豐富程度可增加生物種群遺傳多樣性,并且與多種系統(tǒng)發(fā)育信號有關(guān)(Adeyemo et al., 2021),SSR和重復(fù)序列在葉綠體基因組中廣泛存在,具有豐富的多態(tài)性位點,易復(fù)制、遺傳信息含量高等優(yōu)點,在研究物種遺傳多樣性、親緣關(guān)系、品種鑒定和標記輔助育種中具有較高的可靠性(Adeyemo et al., 2021;賈守寧等,2023)。6條葉綠體基因組序列共檢測到412個SSR位點,SSR的類型以單核苷酸A/T重復(fù)為主且主要位于LSC區(qū); 6條序列共檢測到270條散在重復(fù)序列以及133條串聯(lián)重復(fù)序列。該屬葉綠體基因組上的重復(fù)序列的功能還需進一步深入研究。
圖 4 桃葉珊瑚屬6種植物葉綠體基因組LSC、IR和SSC邊界比較示意圖Fig. 4 Comparison of the LSC, IR and SSC boundaries in chloroplast genomes of six Aucuba species
表 7 桃葉珊瑚屬6種植物葉綠體基因組SSR在不同區(qū)域的數(shù)量分布Table 7 Number and distribution of SSR in chloroplast genomes of six Aucuba species
比較基因組學(xué)分析結(jié)果表明,桃葉珊瑚屬葉綠體基因組序列具有高度的相似性,單拷貝區(qū)比反向重復(fù)區(qū)更為保守,編碼區(qū)比非編碼區(qū)更為保守;葉綠體基因組IR/SC邊界分布的基因類型完全相同;基因組基因結(jié)構(gòu)和排列順序整體上相似,所有基因的種類、數(shù)量和排列順序均高度一致,6條序列完全共線,沒有重排重組現(xiàn)象發(fā)生;根據(jù)課題組前期研究(未發(fā)表)發(fā)現(xiàn),目前通用的DNA條形碼片段(psbA-trnH,rbcL,matK,ITS,ITS2)及其片段組合的變異程度不理想,對桃葉珊瑚屬植物的物種分辨率不高,不適合作為該屬植物的通用條形碼,本文從桃葉珊瑚屬葉綠體基因組LSC區(qū)和SSC區(qū)共篩選出10個變異率較高,長度適中的高變片段,這些高變區(qū)可作為桃葉珊瑚屬物種鑒定的潛在條形碼,可以進一步結(jié)合雙親遺傳的核基因片段聯(lián)合分析,為桃葉珊瑚屬植物的物種鑒定,雜交起源,多倍體物種的形成和系統(tǒng)進化分析提供可靠的分子標記。
系統(tǒng)發(fā)育分析結(jié)果表明,桃葉珊瑚屬為一個支持率高的單系(BS=100%, PP=1),與絲纓花屬親緣關(guān)系較近,共同構(gòu)成絲纓花科;絲纓花科與杜仲科關(guān)系較近,這與分類系統(tǒng)APG Ⅳ和Huang等(2022)的研究結(jié)果一致。
桃葉珊瑚屬屬內(nèi)分化為兩個支持率高的進化支,峨眉桃葉珊瑚、密花桃葉珊瑚以及桃葉珊瑚共同組成進化支Ⅰ,共同的特征為喬木、花綠色;花葉青木、青木、纖尾桃葉珊瑚以及窄斑葉珊瑚共同組成進化支Ⅱ,共同的特征為灌木、花紅色。這兩組特征是否分別穩(wěn)定地成為兩個進化支的共衍特征,還需該屬更多種類和居群的支持。在進化支Ⅱ內(nèi)部,花葉青木和青木聚為一支,親緣關(guān)系較近。通過回溯花葉青木與青木的葉綠體全基因組序列,發(fā)現(xiàn)這兩條葉綠體基因組序列,無論是基因數(shù)量還是基因位置,都保持高度一致,僅在基因間隔區(qū)存在4個堿基位點的變異。這也在一定程度上印證了Ranney的觀點——青木中表達的斑點葉性狀很可能是一個具有多重等位基因和數(shù)量遺傳的核基因,而不是嚴格的母系遺傳,可能有多個具有不同遺傳模式的基因可以產(chǎn)生桃葉珊瑚屬植物帶斑葉的性狀(Ranney et al.,2018)。因此,“花葉”表現(xiàn)型,在桃葉珊瑚屬類群中并不是一個穩(wěn)定可靠的性狀,基于“花葉”特征建立的變種或新種劃分需格外謹慎。
向秋云在FOC中將峨眉桃葉珊瑚歸并入原變種桃葉珊瑚(Xiang &Boufford, 2005),本研究系統(tǒng)發(fā)育分析結(jié)果表明峨眉桃葉珊瑚與密花桃葉珊瑚關(guān)系更近,二者再與桃葉珊瑚構(gòu)成姐妹群。Ranney使用流式細胞儀對桃葉珊瑚屬植物的相對基因組大小進行了研究,發(fā)現(xiàn)峨眉桃葉珊瑚的1Cx值 (10.6 pg)顯著高于包括桃葉珊瑚 (7.37 pg)在內(nèi)的其他種類(6.8~7.5 pg),表明峨眉桃葉珊瑚經(jīng)歷了比其他類群更顯著的倍性不變的基因組擴張(即基因組擴張非染色體加倍引起)(Ranney et al., 2018);結(jié)合標本與野外宏觀形態(tài)性狀分析,三者構(gòu)成了物種關(guān)系復(fù)雜的復(fù)合種群。因此,關(guān)于峨眉桃葉珊瑚的物種劃分問題,還需要綜合更多形態(tài)特征和細胞學(xué)證據(jù),以及核基因數(shù)據(jù)的分析,特別是共線性單拷貝核基因,方能得到較為清楚的解析。此外,一方面,桃葉珊瑚屬植物很可能存在廣泛的雜交和多倍化事件;另一方面,傳統(tǒng)用以種間鑒別的葉形態(tài)特征在本屬中變異極大,導(dǎo)致該屬植物種間區(qū)別特征存在過渡變異和交叉類型,缺乏穩(wěn)定可靠的區(qū)別特征,諸多種類難以準確辨別。并且,目前我們對于該屬植物形態(tài)特征仍未有足夠的把握,因此,對于物種鑒定不確切和物種劃分明顯不合理的種類,本研究未予囊括。對桃葉珊瑚屬植物系統(tǒng)全面的屬下分類系統(tǒng)的構(gòu)建和屬下種間關(guān)系的解決有賴于更廣泛的采樣,更多的性狀證據(jù)(尤其是染色體數(shù)據(jù))和更豐富的具足夠變異位點的單拷貝核基因和葉綠體基因組的聯(lián)合分析建樹,來共同厘清桃葉珊瑚屬的屬下分類問題,為以后深入研究桃葉珊瑚屬植物的藥用和園藝用途等奠定分類學(xué)基礎(chǔ)。
灰色箭頭表示基因的方向; 深藍色表示編碼區(qū); 紅色區(qū)域表示非編碼序列; 淺藍色區(qū)域表示tRNA或rRNA; Y軸表示從50%到100%序列之間的相似性。Gray arrows indicate gene orientation; dark blue indicates coding region; red regions indicate non-coding sequences; light-blue regions indicate tRNA or rRNA; Y axis indicates the similarity among sequences, ranging from 50% to 100%.圖 5 桃葉珊瑚屬6種植物葉綠體基因組序列可視化比對分析Fig. 5 Plastome comparison of six Aucuba species
圖 6 桃葉珊瑚屬6種植物葉綠體全基因組Mauve共線性分析Fig. 6 Mauve genome alignments of the whole chloroplast genomes of six Aucuba species
窗口長度600 bp, 步長200 bp。10個高變區(qū)(高Pi 值)均被標記。Window lengths is 600 bp, step size is 200 bp. Ten regions with the highest Pi values are marked out.圖 7 基于滑窗分析檢測桃葉珊瑚屬植物葉綠體全基因組的高變區(qū)Fig. 7 Hypervariable regions within the chloroplast genomes of six Aucuba species using a sliding window analysis
表 8 桃葉珊瑚屬6種植物葉綠體基因組10個高變區(qū)信息Table 8 Ten hypervariable regions information of chloroplast genomes of six Aucuba species
致謝特別感謝河北師范大學(xué)石碩老師在黃楊葉絲纓花分子樣品收集工作中給予的大力幫助。