龔意輝, 謝雪陽(yáng), 魏媛媛, 周桂花, 李麗梅, 曾永賢
(湖南人文科技學(xué)院農(nóng)業(yè)與生物技術(shù)學(xué)院,湖南婁底 417000)
葉綠體是普遍存在于高等植物中的一種重要質(zhì)體,通過(guò)光合作用合成植物正常生長(zhǎng)所需的營(yíng)養(yǎng)物質(zhì)和能量。葉綠體作為半自主的細(xì)胞器,具有完整的遺傳信息表達(dá)系統(tǒng)。高等植物的葉綠體基因組高度保守,是一個(gè)典型的四分體結(jié)構(gòu),包括1個(gè)大單拷貝區(qū)(large single copy region,LSC),1個(gè)小單拷貝區(qū)(small single copy region,SSC),反向重復(fù)區(qū) a(inverted repeat region a,IRa)和反向重復(fù)區(qū) b(inverted repeat region b,IRb)[1]。葉綠體基因組遺傳特性與核基因組不一樣,常表現(xiàn)出單親遺傳;葉綠體基因組相比于核基因組和線粒體基因組在基因類型、基因結(jié)構(gòu)上更加保守[2]。因此,葉綠體基因組已成為分析植物系統(tǒng)發(fā)育地位的重要研究手段之一[3-5]。隨著生物信息學(xué)技術(shù)和三代測(cè)序技術(shù)的快速發(fā)展,已有較多學(xué)者利用葉綠體基因組開展植物進(jìn)化分析,例如在蘋果(Malusdomestica)、芒果(Mangiferaindica)、草莓(Fragaria×ananassa)、藍(lán)莓(Vacciniumspp.)、葡萄(Vitisvinifera)、辣椒(Capsicumannuum)、露兜樹(Pandanustectorius)、高粱泡(Rubuslambertianus)、沙棗(Elaeagnusangustifolia)等物種中開展了植物葉綠體基因組結(jié)構(gòu)和進(jìn)化分析,為研究植物物種鑒定、性狀改良、優(yōu)化外源基因表達(dá)效率等方面提供重要的分子依據(jù)[6-14]。
油桃(Prunuspersica)屬薔薇科(Rosaceae)桃屬,是普通桃的一個(gè)變種,已有2 000多年的種植歷史[15]。油桃具有味道鮮美、香氣撲鼻、色澤鮮艷、質(zhì)地脆甜等特點(diǎn)而深受國(guó)內(nèi)外消費(fèi)者的青睞[16]。其果實(shí)含有大量的胡蘿卜素、花青素、多種人體必需氨基酸種類、維生素C等營(yíng)養(yǎng)物質(zhì),在國(guó)內(nèi)外市場(chǎng)中具有較高的營(yíng)養(yǎng)保健價(jià)值和經(jīng)濟(jì)價(jià)值。金冠8-18是近年來(lái)培育出的油桃新品種,其果實(shí)近圓形、扁平、微凹、茸毛少、果肉堅(jiān)硬、耐貯藏、果實(shí)套袋后色澤金黃,單果質(zhì)量約200~250 g,最大果實(shí)可達(dá)400 g。目前,國(guó)內(nèi)外學(xué)者主要從果實(shí)裂果、綠色高效栽培技術(shù)、果實(shí)品質(zhì)調(diào)控等方面開展油桃相關(guān)研究[17-19],但對(duì)金冠8-18油桃的研究相對(duì)較少,尤其是有關(guān)金冠8-18葉綠體基因組研究尚未見報(bào)道,開展金冠8-18葉綠體基因組分析不僅可以豐富油桃品種的遺傳信息,而且還可通過(guò)分子標(biāo)記開展金冠8-18品種改良研究。本研究對(duì)金冠8-18葉片進(jìn)行基因組 DNA 提取,采用Illumina NovaSeq 6000 對(duì)金冠8-18葉綠體基因組進(jìn)行測(cè)序、組裝和注釋,并采用生物信息學(xué)軟件對(duì)金冠8-18葉綠體基因組特征、簡(jiǎn)單重復(fù)序列(SSR)位點(diǎn)及其系統(tǒng)發(fā)育進(jìn)行分析,以期為油桃品種鑒定、遺傳育種和系統(tǒng)發(fā)育研究提供分子依據(jù)和理論支撐。
2021年6月20日在湖南水云峰農(nóng)業(yè)科技股份有限公司基地采集金冠8-18新鮮幼葉,采用寶日醫(yī)生物技術(shù)(北京)有限公司提供的DNA試劑盒(D9194)對(duì)金冠8-18全基因組DNA 進(jìn)行提取,利用凝膠電泳檢測(cè)DNA樣品的純度和質(zhì)量。
挑選金冠8-18DNA純度和含量符合要求的樣品送至南京集思慧遠(yuǎn)生物科技有限公司,采用Illumina NovaSeq 6000 對(duì)其葉綠體基因組進(jìn)行測(cè)序、組裝和注釋分析。以與金冠8-18親緣關(guān)系相近的桃樹葉綠體基因組(MZ673795.1)為參考序列。首先采用SPAdesv3.10.1軟件對(duì)金冠8-18葉綠體基因組序列進(jìn)行組裝[20],然后分別使用Prodigal v2.6.3(https://www.github.com/hyattpd/Prodigal)、RNAmmer 1.2 Server (http://www.cbs.dtu.dk/services/RNAmmer/)、tRNAscan-SE(http://lowelab.ucsc.edu/tRNAscan-SE/)對(duì)金冠8-18葉綠體的CDS、rRNA、tRNA進(jìn)行預(yù)測(cè)分析,并使用BLAST v2.6軟件(https://blast.ncbi.nlm.nih.gov/Blast.cgi)對(duì)注釋結(jié)果進(jìn)行校正,并將校正后的結(jié)果采用OGDRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)制圖分析。再使用MISA v1.0(http://pgrc.ipk-gatersleben.de/misa/misa.html)分析金冠8-18葉綠體全基因組 SSR 位點(diǎn),Find repeats工具獲得桃樹、梨樹、楊梅、蘋果等 8種基因組的 IR、LSC、SSC序列,最后使用MAFFT 7.427軟件(auto模式)進(jìn)行多序列比對(duì),將比對(duì)結(jié)果用RAxML 8.2.10(https://cme.h-its.org/exelixis/software.html)軟件,選用GTRGAMMA模型進(jìn)行rapid bootstrap分析,bootstrap=1 000,構(gòu)建最大似然進(jìn)化樹。金冠8-18葉綠體基因組序列在NCBI數(shù)據(jù)庫(kù)中已公布,其登錄號(hào)為OL449945.1。
本研究以桃樹MZ673795.1葉綠體基因組為參考,對(duì)金冠8-18葉綠體基因組序列進(jìn)行組裝和注釋,獲得金冠8-18葉綠體基因組大小為153 754 bp的全長(zhǎng)序列(圖1、表1)。金冠8-18葉綠體基因組含有1 個(gè) LSC、1 個(gè)SSC和1對(duì)IR(IRa 和 IRb)的4分體結(jié)構(gòu),其長(zhǎng)度分別為 85 923、19 100、26 381 bp。A、T、C、G在金冠8-18葉綠體基因組中的含量分別為31.12%、32.11%、18.78%、17.99%,AT 含量占?jí)A基總數(shù)的 63.23%,遠(yuǎn)高于GC含量(36.77%)。在金冠8-18葉綠體基因組中共注釋到 133 個(gè)基因,包括 84 個(gè)蛋白編碼基因(CDS),37個(gè)轉(zhuǎn)運(yùn) RNA 基因(tRNAs),8 個(gè)核糖體 RNA基因(rRNAs ),4個(gè)假基因(pesudo)。GC堿基含量在LSC、SSC 和 IR 區(qū)中所占比重分別為 34.61%、30.40%和 42.58%,AT 含量分別為 65.39%、69.60%和 57.42%。并且LSC和SSC區(qū)域中的GC 比重明顯低于 IR 區(qū)。
表1 金冠8-18葉綠體基因組的詳細(xì)特征
對(duì)金冠8-18注釋到的基因進(jìn)行功能分類,包括44個(gè)光合作用相關(guān)基因(photosynthesis genes)、58 個(gè)自我復(fù)制基因(self-replication genes)、 5個(gè)其他基因(other genes)、6個(gè)未知功能基因(genes ofunknown function)(表2)。在金冠8-18葉綠體全基因組中共有17個(gè)雙拷貝基因和1個(gè)四拷貝基因。包括 1 個(gè) NADH 脫氫酶亞基基因(ndhB)、4 個(gè)自我復(fù)制基因(rpl2、rpl23、rps12、rps7)、4 個(gè)rRNA 基因(rrn16、rrn23、rrn4.5、rrn5)、6個(gè) tRNA 基因(trnA-UGC、trnI、trnL-CAA、trnN-GUU、trnR-ACG、trnV-GAC)、 2 個(gè)未知功能蛋白基因(ycf15、ycf2),四拷貝基因?yàn)閠rnM-CAU。在金冠8-18葉綠體全基因組中所注釋到大部分基因不含內(nèi)含子,只有少數(shù)基因含有1個(gè)和2個(gè)內(nèi)含子。其中ndhA、petB、petD、atpF、rpl2、rpl22、rps16、rpoC1、trnA-UGC、trnI、trnK-UUU、trnL-UAA、trnS-CGA、trnV基因只有1個(gè)內(nèi)含子,含2個(gè)內(nèi)含子的基因分別為rps12、clpP、ycf3。共在金冠8-18葉綠體全基因組中檢測(cè)出4個(gè)假基因,分別為rps19、ycf1、ycf15(2)。值得注意的是,需進(jìn)一步利用分子技術(shù)手段對(duì)金冠8-18葉綠體基因組中鑒定出的6個(gè)未知功能基因進(jìn)行功能分析。
表2 金冠 8-18葉綠體基因組編碼的基因
使用MISA v1.0軟件對(duì)金冠8-18的SSR 位點(diǎn)進(jìn)行分析(表3)??偣苍诮鸸?-18葉綠體基因組中找到251個(gè)符合條件的SSR 位點(diǎn)。分布在 LSC、SSC、IR區(qū)域的 SSR位點(diǎn)數(shù)量分別為168、44、39個(gè),分別占總SSR位點(diǎn)數(shù)比例為66.9%、17.5%、15.5%。在LSC區(qū)域中,分別位于外顯子區(qū)(exon)、內(nèi)含子區(qū)(intron)、基因間隔區(qū)(intergenic)的SSR 位點(diǎn)數(shù)為36、33、99個(gè),在SSC區(qū)域中,分別位于外顯子、內(nèi)含子、基因間隔區(qū)有28、4、12個(gè),在IR區(qū)域中,分別位于外顯子、內(nèi)含子、基因間隔區(qū)的有21、4、14個(gè);單堿基重復(fù)、復(fù)合堿基重復(fù)分別為158、93個(gè)。
表3 金冠8-18葉綠體基因組 SSR 位點(diǎn)分布 個(gè)
將金冠8-18通過(guò)與2個(gè)桃樹品種(Prunuspersica,MH169125.1、HQ336405.1)、 李樹(Prunus
armeniaca,MK645899.1)、楊梅(Prunussalicina,MW406460.1)、梨樹(Pyruspyrifolia,AP012207.1 )、石斑木(Rhaphiolepisbibas,MN577877.1)、土庫(kù)曼斯坦蘋果(Malussieversiivar.turkmenorum,NW018864.1)等不同植物進(jìn)行葉綠體基因組IR區(qū)邊界比較分析(圖2),發(fā)現(xiàn)這8種植物葉綠體基因組全長(zhǎng)范圍為157 566~160 139 bp,基因具有相對(duì)保守性。rpl22基因完全位于LSC區(qū)域,金冠 8-18、2個(gè)桃樹品種、李樹、楊梅距離連接區(qū)域的長(zhǎng)度分別為226、426、426、426、426 bp。rps19基因在金冠8-18、2個(gè)桃樹品種、李樹、楊梅、梨樹、石斑木、土庫(kù)曼斯坦蘋果中LSC區(qū)分別擴(kuò)增并產(chǎn)生97、97、97、89、93、159、156、165 bp,而在IRb區(qū)域內(nèi)分別擴(kuò)增并產(chǎn)生182、182、182、190、186、120、123、114 bp;金冠8-18中的ycf1基因在IRa、IRb區(qū)域內(nèi)擴(kuò)增 1 051 bp,在SSC區(qū)域內(nèi)擴(kuò)增5 bp。ndhf基因在金冠8-18、2個(gè)桃樹品種、李樹、楊梅、梨樹、石斑木中IRb區(qū)域分別擴(kuò)增10、10、10、18、19、12、12 bp,而在SSC區(qū)域分別擴(kuò)增2 219、2 219、2 219、2 220、2 228、2 244、 2 244 bp;金冠8-18、2個(gè)桃樹品種、李樹、楊梅、梨樹、石斑木中的trnN基因全部位于IRa區(qū)域。8個(gè)物種中的trnH基因全部位于LSC區(qū)域內(nèi)。
挑選30個(gè)薔薇科物種的葉綠體基因組與金冠8-18進(jìn)行系統(tǒng)發(fā)育分析(圖3)。進(jìn)化樹分析表明,金冠8-18與桃樹(MH169125.1)處于同一分支,說(shuō)明金冠8-18與桃樹的親緣關(guān)系最近,并與桃屬聚為大類,說(shuō)明金冠8-18屬于薔薇科桃屬植物。此外,金冠8-18與薔薇科其他屬相距較遠(yuǎn),說(shuō)明其親緣關(guān)系較遠(yuǎn)。
本研究采用 Illumina NovaSeq 6000測(cè)序平臺(tái)首次完成了金冠8-18的葉綠體基因組測(cè)序,采用SPAdes v3.10.1 軟件對(duì)金冠8-18的原始數(shù)據(jù)進(jìn)行組裝。金冠8-18葉綠體基因組結(jié)構(gòu)與枇杷(Eriobotryajaponica)、瑞冠18油桃品種、黃晶果(Pouteriacaimito)等植物葉綠體基因組結(jié)構(gòu)相似,具有典型的 LSC、SSC、IRa、IRb結(jié)構(gòu)[21-23]。金冠 8-18 葉綠體基因組大小屬于薔薇科植物葉綠體基因組全長(zhǎng)范圍之內(nèi)。一般來(lái)說(shuō),大多數(shù)高等植物的葉綠體基因組大小介于120~180 kb之間,注釋到的基因數(shù)介于100~200個(gè)之間,其中含70~80 個(gè)CDS基因,30~32個(gè)tRNA基因,4個(gè)rRNA基因。例如,枇杷葉綠體基因組全長(zhǎng)為 157 494 bp,共編碼129個(gè)基因,其中CDS基因、 tRNA基因、 rRNA基因分別為84、37、8個(gè)[21]。甘藍(lán)型油菜(Brassicanapus)葉綠體基因組全長(zhǎng)為152 860 bp,注釋到113個(gè)基因,其中含79個(gè)CDS基因、30個(gè)tRNA基因和4個(gè) rRNA基因[24]。金冠8-18全長(zhǎng)介于甘藍(lán)型油菜和枇杷之間,為153 754 bp,共注釋到133個(gè)基因,其中CDS基因、 tRNA基因、 rRNA基因、假基因分別為84、37、8、4個(gè)。本研究中金冠8-18的IRa和IRb區(qū)為26 381 bp,其GC含量比LSC和SSC中的含量均高,為42.58%,與歐地筍(LycopuseuropaeusLinn.)、萹蓄(Polygonumaviculare)等植物葉綠體基因組相一致[25-26],可能是AT在IR區(qū)域中rRNA序列中含量低而導(dǎo)致該區(qū)域中的GC所占比例均高于LSC和SSC。
SSR位點(diǎn)分析在輔助植物育種、種群分析、多態(tài)性分析等方面的研究起著很好的應(yīng)用價(jià)值[27-28]。目前,已在石榴(Punicagranatum)、龍眼(DimocarpuslonganLour)、棗(ZiziphusjujubaMill.)、芒果(Mangiferaindica)、香蕉(Musaacuminata)等果樹品種中開展了SSR位點(diǎn)分析[29-33]。本研究發(fā)現(xiàn)金冠8-18葉綠體基因組共有251個(gè)SSR 位點(diǎn),有158個(gè)單堿基重復(fù),以 A/T堿基重復(fù)為主,說(shuō)明SSR位點(diǎn)偏好使用A/T,這與荷花玉蘭(Magnoliagrandiflora)、狗棗獼猴桃(Actinidiakolomikta)、草果(Amomumtsaoko)、金花茶(Camelliapetelotii)等植物葉綠體基因組中的SSR位點(diǎn)分析結(jié)果相符[34-37]。復(fù)合核苷酸有93個(gè), 以ATA、TAT、TTA、TAA為主。而Yan等研究發(fā)現(xiàn),石榴葉綠體基因組中的SSR位點(diǎn)主要以TAA、TTC重復(fù)單元為主[29]。金冠8-18大部分SSR位點(diǎn)位于LSC區(qū)中的基因間隔區(qū),少數(shù)位于SSC和IR區(qū)中,這與露兜樹葉綠體基因組SSR分析[12]相符,表明 SSR 位點(diǎn)長(zhǎng)度發(fā)生變異時(shí),對(duì)金冠 8-18 葉綠體蛋白質(zhì)影響較小,幾乎不發(fā)生性狀變異。金冠8-18葉綠體 SSR 位點(diǎn)的獲得對(duì)進(jìn)一步研究薔薇科相關(guān)物種鑒定、遺傳多樣性分析和植物進(jìn)化等方面具有重要的應(yīng)用價(jià)值。
為進(jìn)一步了解金冠8-18在薔薇科中的系統(tǒng)發(fā)育地位,對(duì)已報(bào)道的30種薔薇科葉綠體基因組與金冠8-18進(jìn)行系統(tǒng)發(fā)育分析,其結(jié)果顯示,金冠8-18與桃樹(MH169125.1)親緣關(guān)系最近,說(shuō)明金冠8-18屬于薔薇科桃屬植物。這一研究結(jié)果與Liu等研究發(fā)現(xiàn)的瑞冠18號(hào)油桃品種與桃樹聚為一類,親緣關(guān)系較近的結(jié)論[22]相一致。本研究獲得了金冠 8-18 的葉綠體基因組大小、結(jié)構(gòu)、基因數(shù)量、SSR、系統(tǒng)發(fā)育樹等特征信息,為今后開展油桃品種鑒定、性狀改良和進(jìn)化等研究提供了分子依據(jù)和理論支撐。