徐世榮 陳燕瓊 潘東明 潘鶴立
摘 ?要:‘六月早蜜柚(Citrus maxima ‘Liuyuezao)為國內(nèi)重要的柚品種琯溪蜜柚早熟芽變品種。以‘六月早蜜柚為材料,利用二代測(cè)序進(jìn)行全基因組重測(cè)序,從中組裝獲取葉綠體基因組并對(duì)其進(jìn)行注釋。結(jié)果表明:組裝獲得的‘六月早蜜柚的葉綠體基因組全長160 186 bp,四分體結(jié)構(gòu)由大單拷貝區(qū)(large single copy, LSC)、小單拷貝區(qū)(small single copy, SSC)和反向重復(fù)區(qū)(inverted repeat, IR)組成,3個(gè)分區(qū)的長度分別為87 939、18 395、26 926 bp。注釋得到133個(gè)基因,其中包含89個(gè)編碼基因,37個(gè)tRNA和8個(gè)rRNA。共識(shí)別到31個(gè)短串聯(lián)重復(fù)序列,101個(gè)SSR位點(diǎn)。將已公開發(fā)表的29個(gè)蕓香科葉綠體基因組使用最大似然法進(jìn)行系統(tǒng)發(fā)育關(guān)系的構(gòu)建,結(jié)果表明,‘六月早蜜柚與甜橙(C. sinensis)、檸檬(C. limon)和C. platymamma的親緣關(guān)系較近。
關(guān)鍵詞:琯溪蜜柚;葉綠體基因組;SSR;系統(tǒng)發(fā)育
中圖分類號(hào):S961.6 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
Abstract: Citrus maxima ‘Liuyuezao is a precocious bud mutation of Guanximiyou, an important pomelo variety of China. In this study, the whole genome resequencing of C. maxima ‘Liuyuezao was conducted using next-generation sequencing. The chloroplast (cp) genome was assembled and annotated. The cp genome had a total length of 160 186 bp, the tetrad structed was consisted with large single copy (LSC), small single copy (SSC) and inverted repeat (IR), with the length in 87 939 bp, 18 395 bp and 26 926 bp respectively. The cp genome contained a total of 133 genes, including 89 protein-coding genes, 37 tRNA genes and 8 tRNA genes. We identified 31 tandem repeat and 101 SSRs. Combined with 29 published cp genome sequences of Rutaceae, we used the maximum likelihood method to reconstruct the phylogenetic relationship of Rutaceae. The result showed that C. maxima ‘Liuyuezao had a close relationship with C. sinensis, C. limon and C. platymamma.
Keywords: Guanximiyou; chloroplast genome; SSR; phylogeny
DOI: 10.3969/j.issn.1000-2561.2021.05.004
葉綠體在維持地球生命中起著至關(guān)重要的作用,通過光合作用和氧氣再釋放將太陽能轉(zhuǎn)化為碳水化合物。葉綠體基因組編碼許多參與光合作用和其他代謝過程的關(guān)鍵蛋白質(zhì)[1]。在被子植物中,葉綠體為母系遺傳,且具有結(jié)構(gòu)穩(wěn)定、序列高度保守和遺傳重組率低等特點(diǎn),被廣泛應(yīng)用于重建系統(tǒng)發(fā)育關(guān)系,揭示物種內(nèi)部和物種之間的巨大差異[2–4]。對(duì)葉綠體基因組數(shù)據(jù)的了解可提高我們對(duì)植物生物學(xué)和多樣性的認(rèn)識(shí)。
柚[Citrus maxima (Burm.) Merr.]是我國特產(chǎn)果樹,為蕓香科(Rutaceae)柑橘屬(Citrus)常綠喬木果樹,而柑橘屬水果是世界上種植最廣泛的水果之一,與蘋果、葡萄、香蕉并稱為世界四大水果。柚作為一個(gè)古老的品種,在歷史的繁衍進(jìn)化過程中通過自身芽變或者與其它柑橘雜交產(chǎn)生了許多果實(shí)大小和酸度不同的新品種,如葡萄柚、酸橙等,極大的豐富了柑橘家族[5]。國內(nèi)的柚類品種主要為琯溪蜜柚、沙田柚、四季柚、度尾文旦、強(qiáng)德勒柚、坪山柚和暹羅柚等。其中栽培面積最大的品種為福建平和的琯溪蜜柚,僅福建地區(qū)產(chǎn)量就約占全國柚類總產(chǎn)量的2/3、世界的1/3。
琯溪蜜柚因其果大皮薄、肉嫩汁多無核、營養(yǎng)物質(zhì)豐富及具有獨(dú)特的香氣而廣受消費(fèi)者的喜愛,目前產(chǎn)品不僅占據(jù)了國內(nèi)的大小商場,還遠(yuǎn)銷至歐盟、美國、加拿大等國家。近10多年已逐漸發(fā)展成為柑橘類果樹中最具市場競爭力和發(fā)展?jié)摿Φ乃弧5涑墒炱谠诿磕甑?0—12月,上市的時(shí)間過于集中,導(dǎo)致貨架長時(shí)間空缺,因此培育不同成熟的琯溪蜜柚是市場的需求。福建平和果農(nóng)于2007年發(fā)現(xiàn)了1株琯溪蜜柚發(fā)生了早熟芽變,經(jīng)過對(duì)母樹及突變枝嫁接子代的連續(xù)多年觀察,發(fā)現(xiàn)其性狀穩(wěn)定,成熟期比琯溪蜜柚早約45 d,由于在農(nóng)歷6月就能成熟,故命名為‘六月早。
本研究利用高通量測(cè)序技術(shù)對(duì)‘六月早蜜柚進(jìn)行測(cè)序,以已發(fā)表的柚的葉綠體基因組為參考,獲取‘六月早蜜柚的葉綠體基因組序列,進(jìn)行注釋和序列特征分析,并與其他的蕓香科的物種進(jìn)行比較分析和系統(tǒng)發(fā)育關(guān)系推斷,以期為蕓香科的分子標(biāo)記開發(fā)和系統(tǒng)發(fā)育研究提供參考。
1 ?材料與方法
1.1 ?材料
以‘六月早琯溪蜜柚為材料,其幼嫩的葉片組織采于福建平和縣小溪鎮(zhèn)果園。
1.2 ?方法
1.2.1 ?總DNA的提取和測(cè)序 ?利用TIANGEN試劑盒提取‘六月早琯溪蜜柚的總DNA,用瓊脂糖凝膠電泳確定總DNA具有較好的完整性,并用分光光度計(jì)檢測(cè)DNA的質(zhì)量。檢測(cè)的DNA濃度>50 ng/μL,無色素污染、無明顯RNA、無蛋白質(zhì)等雜質(zhì)污染的樣品視為合格樣品。將檢測(cè)合格的DNA樣品送至深圳華大基因科技服務(wù)有限公司進(jìn)行文庫的構(gòu)建,最后在Illumina HiSeq平臺(tái)上機(jī)測(cè)序,獲得質(zhì)控過濾后的Clean data 12 Gb的數(shù)據(jù)量,覆蓋該物種測(cè)序深度37×。
1.2.2 ?葉綠體基因組的組裝與注釋 ?對(duì)下機(jī)的數(shù)據(jù)進(jìn)行過濾,包括去除低質(zhì)量的序列和接頭。從GenBank中下載已發(fā)表的柚葉綠體基因組序列(GenBank登錄號(hào):KY055833.1)作為參考序列,使用GetOrganelle toolkit[6]初步組裝出葉綠體基因組的序列,再使用Bandage[7]根據(jù)葉綠體基因組的機(jī)構(gòu)特征手動(dòng)拼接出完整的質(zhì)體基因組。
使用Geneirous primer v2019.03[8]對(duì)組裝好的序列進(jìn)行注釋,注釋使用已發(fā)表的柚作為注釋參考,再人工校正基因的起始和終止密碼的位置。序列的注釋可視化在OrganellarGenomeDRAW(OGDRAW)v1.3.1(https://chlorobox.mpimp-golm. mpg.de/OGDraw.html)進(jìn)行[9]。將組裝注釋好的‘六月早蜜柚的葉綠體基因組上傳至GenBank數(shù)據(jù)庫,獲得登錄號(hào):MT527726。
1.2.3 ?葉綠體基因組的特征分析 ?串聯(lián)重復(fù)序列的識(shí)別用Tandem repeat finder軟件[10],使用默認(rèn)參數(shù)。簡單重復(fù)序列(simple sequence repeat,SSR)的識(shí)別使用Perl腳本MISA(microSAtellite identification tool),參數(shù)設(shè)置為單核苷酸(mononucleotide)、二核苷酸(dinucleotide)、三核苷酸(trinucleotide)、四核苷酸(tetranucleotide)、五核苷酸(pentanucleotide)和六核苷酸(hexanucleotide)的重復(fù)數(shù)閾值分別為10、5、4、3、3和3。使用在線分析軟件CodonW 1.4.4(https:// galaxy.pasteur.fr/?form=codonw)對(duì)葉綠體基因組內(nèi)的編碼基因進(jìn)行密碼子的使用偏好性分析。
1.2.4 ?蕓香科物種葉綠體基因組比較分析 ?從GenBank數(shù)據(jù)庫中下載檸檬(Citrus limon)、山小橘(Glycosmis pentaphylla)、假黃皮(Clausena excavata)、蕓香(Ruta graveolens)、花椒(Zanthoxylum bungeanum)、黃檗(Phellodendron amurense)、香肉果(Casimiroa edulis)等29個(gè)蕓香科隸屬于11個(gè)屬的其他物種的葉綠體基因組。每個(gè)屬選1個(gè)代表種共11個(gè)種進(jìn)行邊界的擴(kuò)張與收縮分析,使用在線程序Irscope(https:// irscope.shinyapps.io/irapp/)對(duì)IR、SSC和LSC區(qū)域進(jìn)行邊界變化分析[11]。
以無患子科(Sapindaceae)欒樹(Koelreuteria paniculata)為外類群,與其他29個(gè)蕓香科物種進(jìn)行系統(tǒng)發(fā)育樹的構(gòu)建。將30個(gè)葉綠體基因組序列使用Homblock軟件進(jìn)行同源共線性的比對(duì)[12],識(shí)別出的共線性區(qū)域用于系統(tǒng)發(fā)育樹的構(gòu)建。使用IQ-tree對(duì)數(shù)據(jù)集進(jìn)行系統(tǒng)發(fā)育樹的構(gòu)建[13]。
2 ?結(jié)果與分析
2.1 ?‘六月早蜜柚葉綠體基因組的基本特征
‘六月早蜜柚的葉綠體基因組結(jié)構(gòu)為經(jīng)典四段式結(jié)構(gòu),包含大單拷貝區(qū)(large single copy,LSC),2個(gè)反向重復(fù)區(qū)(inverted repeat,IR)和小單拷貝區(qū)(small single copy,SSC)(圖1)。葉綠體基因組的總長度為160 186 bp,GC含量為38.5%,其中LSC區(qū)長87 939 bp,IR區(qū)長26 926 bp,SSC區(qū)長18 395 bp。共有基因133個(gè),包括編碼基因89個(gè),tRNA 37個(gè),rRNA8個(gè)。其中20個(gè)基因含有2個(gè)拷貝,包括8個(gè)蛋白編碼基因(rpl2、rpl23、rps7、rps19、ndhB、ycf1、ycf2和ycf15),8個(gè)tRNA(trnA-UGC、trnG-GCC、trnI-CAU、trnI-GAU、trnL-CAA、trnN-GUU、trnR-ACG和trnV-GAC)和4個(gè)rRNA(rrn4.5、rrn5、rrn16和rrn23)。
2.2 ?‘六月早蜜柚葉綠體基因組的重復(fù)序列
識(shí)別葉綠體基因組的重復(fù)序列,特別是SSR對(duì)于分子標(biāo)記的開發(fā),有助于為物種的遺傳發(fā)育及分子育種研究提供參考。對(duì)‘六月早的重復(fù)序列進(jìn)行檢測(cè),共識(shí)別出31個(gè)短串聯(lián)重復(fù)序列的區(qū)域,絕大部分分布在基因間隔區(qū)(IGS),長度范圍在25~75 bp之間,占基因組序列的0.81%(表1)。共檢測(cè)到101個(gè)SSR,其中包括5個(gè)復(fù)合型SSR、68個(gè)單堿基重復(fù)、3個(gè)二堿基重復(fù)、13個(gè)三堿基重復(fù)、11個(gè)四堿基重復(fù)和1個(gè)五堿基重復(fù)(表2,圖2)。SSR序列長度為10~35 bp,大部分SSR均分布在基因組的大單拷貝區(qū)(占74.26%)和基因間隔區(qū)(占76.34%,圖2)。
2.3 ?‘六月早蜜柚葉綠體基因組的密碼子偏好性
密碼子是基因編碼區(qū)蛋白翻譯的核心元件,分析編碼區(qū)密碼子的使用特征,對(duì)基因功能和系統(tǒng)進(jìn)化研究具有重要意義,為后續(xù)研究提供基礎(chǔ)資料。將‘六月早蜜柚葉綠體基因組中得到的88個(gè)編碼基因(coding DNA sequence,CDS)用于分析,為了保證結(jié)果的準(zhǔn)確性,去除了重復(fù)的基因序列和長度小于300 bp序列,將剩下的52條CDS用于密碼子的偏好性分析。RSCU值大于1.00的密碼子為30個(gè),其中29個(gè)以A或U結(jié)尾,1個(gè)以G或C結(jié)尾(表3),表明這些密碼子偏向A/U結(jié)尾,‘六月早蜜柚與大多數(shù)被子植物的密碼子偏好性類似。
2.4 ?IR邊界的收縮與擴(kuò)張
選擇了11個(gè)物種代表蕓香科的11個(gè)屬進(jìn)行IR邊界的比較分析。從圖3可見,蕓香科植物具有相似的基因結(jié)構(gòu)和基因順序,差異主要發(fā)生在JLB(LSC與IRb邊界)和JSB(IRb與SSC邊界)邊界。在JLB邊界表現(xiàn)出2種類型,第1種類型為無基因橫跨邊界,僅見黃皮屬的假黃皮Clausena excavata和小蕓木屬的Micromelum minutum,位于LSC的rps3為離邊界最近的基因分別距JLB 38 bp和115 bp;第2種類型是rpl22基因橫跨了JLB邊界,其余9個(gè)種均為這種類型,其中跨到LSC邊界的長度為67~295 bp。JSB邊界則表現(xiàn)出了3種類型,第1種類型為無基因處于邊界上,僅表現(xiàn)在酒餅簕屬廣東酒餅簕(Atalantia kwangtungensis)中;第2種類型為ycf1基因橫跨JSB邊界,在黃檗屬黃檗(Phellodendron amurense)、花椒屬(Zanthoxylum tragodes)、蕓香屬蕓香(Ruta graveolens)和‘六月早蜜柚4個(gè)種中表現(xiàn)有1~35 bp跨到SSC區(qū);第3種類型為ndhF基因橫跨JSB邊界,其余的6個(gè)種、蕓香和‘六月早蜜柚有1~31 bp跨越IRa區(qū)域。JLA邊界也表現(xiàn)出3種類型,表現(xiàn)為不同的種在邊界處trnH和rpl22基因的位置不同,第1種為邊界無基因;第2種為trnH跨越邊界;第3種為rpl22跨越邊界。JSA則非常保守,均為ycf1基因跨越了邊界,有1080~1130 bp位于IRa。
2.5 ?系統(tǒng)發(fā)育分析
為了確定‘六月早蜜柚在蕓香科中的進(jìn)化地位,基于葉綠體基因組序列構(gòu)建29個(gè)的蕓香科物種系統(tǒng)發(fā)育關(guān)系,其中柑橘屬10種,酒餅簕屬1種,Merrillia屬1種,山小橘屬2種,小蕓木屬1種,咖喱樹屬1種,黃皮屬1種,蕓香屬1種,花椒屬9種,黃檗屬1種和香肉果屬1種,以無患子科欒樹為外類群。由圖4可知,蕓香科由兩大進(jìn)化支組成,各分支均獲得很高的自展值(BSML均為100);花椒屬、黃檗屬和香肉果屬聚為一支,為最先分化的分支,且均屬于Amyridoideae亞科;柑橘屬、酒餅簕屬、Merrillia屬、山小橘屬、小蕓木屬、咖喱樹屬、黃皮屬和蕓香屬聚為一支,其中蕓香屬為最先分化的屬,其他的7個(gè)屬聚為一支;‘六月早蜜柚與其他柑橘屬聚為一支,與Citrus platymamma、檸檬和甜橙分支成姐妹關(guān)系。
3 ?討論
‘六月早蜜柚同其他被子植物一樣,具有四分結(jié)構(gòu)環(huán)狀的葉綠體基因組,其基因順序、GC含量也同其他柑橘屬的植物基本一樣[14–16],這也說明了在柑橘屬內(nèi)葉綠體基因組非常保守。植物的葉綠體基因組長度在100~220 kb之間,蕓香科內(nèi)葉綠體基因組長度在157 434 bp(蕓香)~161 172 bp(假黃皮)之間,而差異主要表現(xiàn)在反向重復(fù)(IR)區(qū)的收縮、擴(kuò)張或缺失,因此,IR區(qū)對(duì)于葉綠體基因組的結(jié)構(gòu)穩(wěn)定性和決定葉綠體基因組大小方面的作用不可忽視[17-18]。重復(fù)序列的存在從原核生物到真核生物的進(jìn)化過程中呈遞增趨勢(shì),具有保護(hù)編碼基因和作為進(jìn)化的動(dòng)力促進(jìn)形成新基因的作用,是進(jìn)化的必然結(jié)果[19]。‘六月早蜜柚的重復(fù)序列大部分分布于IGS區(qū),且超過一半(16/31)分布于LSC區(qū),這表明重復(fù)序列對(duì)該物種不具有特定功能。SSR廣泛存在于基因組中,長度在1~6 bp短的重復(fù)基序(motif),具有高多態(tài)性、多等位性、共顯性等特點(diǎn),同時(shí)因其具有良好的種間甚至種內(nèi)的遺傳變異區(qū)分精度,一直被廣泛用于植物資源研究[20–23],本研究從‘六月早蜜柚葉綠體基因組中識(shí)別到的SSR可提供該品種的種間多態(tài)性,為柑橘屬品種間的親緣關(guān)系和分子鑒定提供可靠的遺傳標(biāo)記。
本研究將已公開發(fā)表的所有蕓香科植物的葉綠體基因組從GenBank中獲取,包含29個(gè)種,隸屬于11個(gè)屬,3個(gè)亞科,對(duì)其進(jìn)行蕓香科的系統(tǒng)發(fā)育關(guān)系的重建。在前人的研究中,僅使用葉綠體基因片段進(jìn)行蕓香科的構(gòu)建,如使用rps16內(nèi)含子和trnL-trnF基因間隔區(qū)對(duì)65個(gè)蕓香科物種進(jìn)行分析,發(fā)現(xiàn)亞科與族的關(guān)系都需要重新評(píng)估[24]。本研究結(jié)果獲得了穩(wěn)固的系統(tǒng)發(fā)育關(guān)系,各亞科和各屬的單系性均得到了很好的支持,其中柑橘亞科與蕓香亞科成姐妹關(guān)系,構(gòu)成的分支與最早分化的脂檀亞科成姐妹關(guān)系。但由于本研究使用的物種序列有限,構(gòu)建的系統(tǒng)發(fā)育關(guān)系仍不夠全面,有待進(jìn)一步完善。
參考文獻(xiàn)
[1] Daniell H, Lin C S, Yu M, et al. Chloroplast genomes: diversity, evolution, and applications in genetic engineering[J]. Genome Biology, 2016, 17(1): 134.
[2] Jansen R K, Cai Z, Raubeson L A, et al. Analysis of 81 genes from 64 plastid genomes resolves relationships in angiosperms and identifies genome-scale evolutionary patterns[J]. Proceedings of the National Academy of Sciences, 2007, 104(49): 19 369-19 374.
[3] Song Y, Yu W B, Tan Y, et al. Evolutionary comparisons of the chloroplast genome in Lauraceae and insights into loss events in the Magnoliids[J]. Genome Biology and Evo-lution, 2017, 9(9): 2354-2364.
[4] Gao C, Deng Y, Wang J. The complete chloroplast genomes of Echinacanthus species (Acanthaceae): phylogenetic relationships, adaptive evolution, and screening of mo-lecular markers[J]. Frontiers in Plant Science, 2018, 9: 1989.
[5] Wu G A, Terol J, Ibanez V, et al. Genomics of the origin and evolution of Citrus[J]. Nature, 2018, 554(7692): 311-316.
[6] Jin J J, Yu W B, Yang J B, et al. GetOrganelle: a fast and versatile toolkit for accurate de novo assembly of organelle genomes[J]. Genome Biology, 2020, 21(1): 1-31.
[7] Wick R R, Schultz M B, Zobel J, et al. Bandage: interactive visualization of de novo genome assemblies[J]. Bioinformatics, 2015, 31(20): 3350-3352.
[8] Kearse M, Moir R, Wilson A, et al. Geneious basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data[J]. Bioinformatics, 2012, 28(12): 1647-1649.
[9] Greiner S, Lehwark P, Bock R. OrganellarGenomeDRAW (OGDRAW) version 1.3.1: expanded toolkit for the graphical visualization of organellar genomes[J]. Nucleic Acids Research, 2019, 47(W1): 59-64.
[10] Benson G. Tandem repeats finder: a program to analyze DNA sequences[J]. Nucleic Acids Research, 1999, 27(2): 573-580.
[11] Amiryousefi A, Hyv?nen J, Poczai P. Irscope: an online program to visualize the junction sites of chloroplast genomes[J]. Bioinformatics, 2018, 34(17): 3030-3031.
[12] Bi G, Mao Y, Xing Q, et al. Homblocks: a multiple-alignment construction pipeline for organelle phylogenomics based on locally collinear block searching[J]. Genomics, 2018, 110(1): 18-22.
[13] Nguyen L T, Schmidt H A, Von Haeseler A, et al. IQ-TREE: a fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies[J]. Molecular Biology and Evolution, 2015, 32(1): 268-274.
[14] Bausher M G, Singh N D, Lee S B, et al. The complete chloroplast genome sequence of Citrus sinensis (L.) Osbeck var ‘Ridge Pineapple: organization and phylogenetic relationships to other angiosperms[J]. BMC Plant Biology, 2006, 6(1): 725-730.
[15] Su H J, Hogenhout S A, Al-Sadi A M, et al. Complete chloroplast genome sequence of Omani lime (Citrus aurantiifolia) and comparative analysis within the rosids[J]. PLoS One, 2014, 9(11): 113049.
[16] Xu S R, Huang C Y, Deng Y T, et al. The complete chloroplast genome sequence of Citrus maxima (Burm.) Merr. ‘Guanximiyou[J]. Mitochondrial DNA Part B, 2020, 5(1): 482-483.
[17] Palmer J D, Thompson W F. Chloroplast DNA rearrangements are more frequent when a large inverted repeat sequence is lost[J]. Cell, 1982, 29(2): 537-550.
[18] Wang R J, Cheng C L, Chang C C, et al. Dynamics and evolution of the inverted repeat-large single copy junctions in the chloroplast genomes of monocots[J]. BMC Evolutionary Biology, 2008, 8(1): 1-14.
[19] 艾對(duì)元. 基因組中重復(fù)序列的意義[J]. 生命的化學(xué), 2008(3): 343-345.
[20] Provan J, Powell W, Hollingsworth P M. Chloroplast microsatellites: new tools for studies in plant ecology and evolution[J]. Trends in Ecology & Evolution, 2001, 16(3): 142-147.
[21] Kantety R V, La Rota M, Matthews D E, et al. Data mining for simple sequence repeats in expressed sequence tags from barley, maize, rice, sorghum and wheat[J]. Plant Molecular Biology, 2002, 48(5-6): 501-510.
[22] Lassois L, Denancé C, Ravon E, et al. Genetic diversity, population structure, parentage analysis, and construction of core collections in the French apple germplasm based on SSR markers[J]. Plant Molecular Biology Reporter, 2016, 34(4): 827-844.
[23] Singh G, Aulakh P S, Sarao N K, et al. Molecular verification of putative zygotic seedlings in different intra-specific crosses in Mandarins (Citrus reticulata) by SSR markers[J]. Agricultural Eesearch, 2019, 8(1): 21-26.
[24] Groppo M, Pirani J R, Salatino M L F, et al. Phylogeny of Rutaceae based on twononcoding regions from cpDNA[J]. American Journal of Botany, 2008, 95(8): 985-1005.
責(zé)任編輯:黃東杰