吳朝昕, 劉雪薇, 李祖軍, 龍武華, 宮彥龍, 朱速松
(貴州省農(nóng)業(yè)科學(xué)院 水稻研究所, 貴陽(yáng) 550006 )
葉綠體是植物獲取能量的重要細(xì)胞器,具有獨(dú)立于核基因組的遺傳體系。因?yàn)槠浠蛐蛄斜J?,基因結(jié)構(gòu)重排事件遠(yuǎn)低于核基因組,結(jié)構(gòu)簡(jiǎn)單,一般為母系遺傳,所以被用來(lái)揭示物種的進(jìn)化與親緣關(guān)系(李緒英等,2011;Li et al., 2018; Zhang et al., 2018; Jeon & Kim, 2019;朱斌等,2021)。由于發(fā)達(dá)的測(cè)序科技使不少生物實(shí)現(xiàn)了葉綠體基因組(cpDNA)測(cè)序,因此NCBI中收錄的葉綠體基因逐漸增多,利用葉綠體基因研究親緣關(guān)系的報(bào)道也不斷增多。在水稻中,F(xiàn)an等(2020)利用cpDNA分析了33個(gè)稻屬物種的親緣關(guān)系,結(jié)果顯示OryzasativavoucherHSAGSDYD1802與O.sativacultivar TN1、O.sativacultivar RP Bio-226和O.sativacultivar IR8的親緣關(guān)系最近。Fang等(2017)通過(guò)分析cpDNA探討了根莖野生稻與其他13個(gè)稻屬物種的親緣關(guān)系,結(jié)果顯示與根莖野生稻關(guān)系較近的是藥用野生稻且屬于CC基因類(lèi)型。在其他物種中,張慧等(2018)利用cpDNA分析了益母草及其他16個(gè)物種的親緣關(guān)系,研究結(jié)果很好地解決了野芝麻亞科的進(jìn)化關(guān)系。鄭祎等(2020)用大花君子蘭葉綠體基因序列與10個(gè)百合科、5個(gè)蘭科、4個(gè)鳶尾科及5個(gè)石蒜科共24個(gè)物種的葉綠體基因組序列進(jìn)行系統(tǒng)發(fā)育分析,研究結(jié)果支持大花君子蘭屬于石蒜科,并使用其中23個(gè)物種葉綠體基因組中ycf2進(jìn)行親緣關(guān)系分析發(fā)現(xiàn),葉綠體基因組中ycf2可以代替葉綠體基因組全長(zhǎng)進(jìn)行親緣關(guān)系分析。
大粒香是貴州省水稻研究所選育,具有稻米粒大且香的特點(diǎn),并且大粒香在鄉(xiāng)村振興過(guò)程中為社會(huì)帶來(lái)了較高的經(jīng)濟(jì)效益(蔣志謙,2008;羅仁發(fā)等,2012)。目前,對(duì)大粒香基因組學(xué)、品質(zhì)形成等理論研究的文獻(xiàn)報(bào)道不多?;诖罅O阍谫F州優(yōu)質(zhì)稻發(fā)展過(guò)程中的重要性,為進(jìn)一步從基因組水平認(rèn)識(shí)和改良大粒香,本研究以大粒香DNA為材料進(jìn)行測(cè)序,構(gòu)建大粒香cpDNA圖譜,分析密碼子的使用和重復(fù)序列,并分析其親緣關(guān)系,擬解決大粒香葉綠體基因組以下問(wèn)題:(1)大粒香cpDNA的基本特征大??;(2)大粒香cpDNA密碼子偏好情況;(3)大粒香cpDNA系統(tǒng)發(fā)育所屬分支。
以大粒香為材料,2019年冬季種植于海南三亞師部農(nóng)場(chǎng)基地,2020年2月選取無(wú)病蟲(chóng)害、長(zhǎng)勢(shì)良好的水稻葉片,沖洗、擦干液氮速凍暫存,用干冰保存寄回貴州,置于-80 ℃保存,用于提取大粒香DNA。
1.2.1 大粒香DNA 提取及測(cè)序 使用TIANGEN植物DNA試劑盒提取大粒香總DNA,測(cè)序公司檢測(cè)合格后,構(gòu)建文庫(kù),進(jìn)行測(cè)序。
1.2.2 cpDNA序列組裝與注釋 將原始數(shù)據(jù),除去有污染、低質(zhì)量的片段,使用SPAdes軟件拼接后組裝。使用CPGAVAS2進(jìn)行基因注釋?zhuān)肙GDRAW繪制大粒香的cpDNA圖譜。
圖 1 大粒香葉綠體基因組圖譜Fig. 1 Gene map of Dalixiang chloroplast genome
1.2.3 密碼子使用分析 使用CodonW進(jìn)行密碼子使用分析。
1.2.4 重復(fù)序列分析 使用Vmatch完成大粒香cpDNA的長(zhǎng)重復(fù)序列的查找。大粒香cpDNA的SSR篩選則使用MISA軟件,該軟件的檢測(cè)參數(shù):?jiǎn)魏塑账岽笥?時(shí)被檢測(cè);二核苷酸和三核苷酸大于4時(shí)被檢測(cè)。
1.2.5 系統(tǒng)進(jìn)化分析 為探究大粒香與其他稻屬物種的親緣關(guān)系,從NCBI中下載了12個(gè)稻屬物種和2種禾本科近源物種的cpDNA(綠竹和高粱),使用RaxML軟件構(gòu)建系統(tǒng)發(fā)育樹(shù)。
大粒香cpDNA全長(zhǎng)為134 563 bp,分為3個(gè)區(qū):大單拷貝區(qū)(large single copy,LSC)(80 864 bp),GC含量為37.09%;小單拷貝區(qū)(small single copy,SSC)(12 347 bp),GC含量為33.37%;反向重復(fù)序列區(qū)(inverted repeats,IRs)(20 676 bp),GC含量為44.41%。在大粒香cpDNA中注釋129個(gè)基因(表1),可分為三類(lèi),即蛋白編碼基因、tRNA基因和rRNA基因,其數(shù)量分別為85、36和8。其基因功能主要為與自身復(fù)制能力有關(guān)、與光合作用有關(guān)、與其他基因和與未知功能有關(guān)4種。在蛋白編碼基因中,rps基因的數(shù)量最多有16個(gè),而cemA、infA、ccsA、rbcL、matK、accD、clpP等基因數(shù)量?jī)H有1個(gè)。其中,有20個(gè)基因出現(xiàn)在IR重復(fù)區(qū)內(nèi),分別為ndhB、ycf1、rps12、rps7、rps15、rps9、rpl2、rpl23 8個(gè)蛋白編碼基因,rrn23S、rrn4.5S、rrn16S、rrn5S4個(gè)核糖體RNA,trnN-GUU、trnH-GUG、trnA-UGC、trnL-CAA、trnT-CGU、trnV-GAC、trnR-ACG、trnM-CAU8個(gè)轉(zhuǎn)運(yùn)RNA(表1)。統(tǒng)計(jì)結(jié)果顯示,大粒香cpDNA中有內(nèi)含子的基因共17個(gè),其中ycf3有2個(gè),剩余16個(gè)基因只有1個(gè)。trnK-UUU的內(nèi)含子堿基數(shù)最多,而trnL-UAA的最少(表2)。
表 1 大粒香cpDNA注釋基因列表Table 1 List of genes found in Dalixiang cpDNA
表 2 大粒香cpDNA含有內(nèi)含子的基因Table 2 Genes with introns in cpDNA of Dalixiang
在大粒香cpDNA密碼子中,亮氨酸密碼子使用了1 944次,為最多;半胱氨酸的密碼子僅使用198次,為最少。在編碼大粒香cpDNA的密碼子中有30個(gè)密碼子偏好性>1,其中以A結(jié)尾的有12個(gè),以U(T)結(jié)尾的有16個(gè),這表明大粒香cpDNA密碼子偏好A/U(T)堿基,這種情況常出現(xiàn)在杜梨、益母草等多種高等植物中(張慧等,2018;李泳潭等,2020;鄭祎等,2020)(表3)。
表 3 大粒香cpDNA密碼子使用Table 3 Codon usage in cpDNA of Dalixiang
在大粒香cpDNA中檢測(cè)到19個(gè)長(zhǎng)重復(fù)序列,包含了8個(gè)正向重復(fù),長(zhǎng)度范圍為30~52 bp,以及11個(gè)回文重復(fù),其長(zhǎng)度范圍為30~127 bp。最長(zhǎng)的127 bp的重復(fù)序列位于rps19-psbK的基因間隔區(qū)內(nèi),而含有最多長(zhǎng)重復(fù)序列的區(qū)間為racL-accD。區(qū)域位置分布顯示,絕大多數(shù)分布在基因間隔區(qū)內(nèi)(表4)。
表 4 大粒香cpDNA的重復(fù)序列Table 4 cpDNA repeat sequence of Dalixiang
在大粒香cpDNA的129個(gè)SSR位點(diǎn)中有95個(gè)單核苷酸重復(fù),并且70.07%的SSR由A或T組成,表明SSR位點(diǎn)有使用A/T堿基的偏好。同時(shí),研究表明SSR位點(diǎn)在大粒香cpDNA上分布不均,在LSC區(qū)、SSC區(qū)以及IRs區(qū)分別分布了95個(gè)、18個(gè)和16個(gè)SSR位點(diǎn)(表5)。
表 5 大粒香cpDNA中的簡(jiǎn)單重復(fù)序列Table 5 SSR in the cpDNA of Dalixiang
續(xù)表5
將大粒香與粳稻、秈稻、野生稻及2個(gè)外類(lèi)物種等共15個(gè)cpDNA序列構(gòu)建發(fā)育樹(shù)。發(fā)育樹(shù)分析表明,15個(gè)物種可分為三類(lèi),即第一類(lèi)為Bambusaoldhamii,第二類(lèi)為Sorghumbicolor,第三類(lèi)為13個(gè)稻屬物種組成。在第三類(lèi)群中又可分為4個(gè)小類(lèi)群,其中3種野生稻(O.australiensis300316、O.meridionalis、O.ruifipogon)各為一類(lèi),其余10種栽培稻為一類(lèi)。在栽培稻類(lèi)群中,粳稻與秈稻分別處于不同進(jìn)化分支。并且,大粒香水稻與粳稻Tropical Japonica在同一分支,表明兩者的進(jìn)化關(guān)系比其他水稻品種近(圖2)。
圖 2 15種植物的cpDNA序列的系統(tǒng)進(jìn)化樹(shù)Fig. 2 Phylogenetic tree constructed using cpDNA of 15 plants
本研究測(cè)得大粒香cpDNA全長(zhǎng)為134 563 bp,GC含量為39%,LSC為80 864 bp,SSC為12 347 bp,IR為20 676 bp,并注釋到129個(gè)基因,與已報(bào)道的禾本科數(shù)據(jù)相符(李裕華等,2020)。前人通過(guò)比對(duì)不同禾本科植物cpDNA序列表明,雖然葉綠體基因保守程度較高,但一些基因在進(jìn)化過(guò)程中仍然出現(xiàn)退化缺失現(xiàn)象(唐萍等,2011;付濤等,2016)。本研究將大粒香cpDNA與Wang等(2016)報(bào)道的熱帶粳稻葉綠體基因組進(jìn)行比對(duì)結(jié)果顯示,雖然二者在細(xì)胞色素b/f復(fù)合體相關(guān)基因、光系統(tǒng)Ⅰ、Ⅱ相關(guān)基因、核糖體蛋白大和小亞基相關(guān)基因、tRNA和未知功能基因等基因差異較少,但在大粒香葉綠體基因中不存在lhbA基因。lhbA基因是和光合作用過(guò)程中光系統(tǒng)Ⅱ有關(guān)的基因,在熱帶粳稻中存在lhbA基因,并且在喜好溫暖的禾本科植物毛竹中同樣也存在lhbA基因(Yao et al., 2016),這可能是熱帶粳稻為適應(yīng)熱帶光溫生長(zhǎng)環(huán)境中逐漸進(jìn)化而得。
SSR位點(diǎn)可被用于輔助育種和遺傳連鎖作圖等方面的研究,而cpDNA具有序列保守、結(jié)構(gòu)穩(wěn)定、易測(cè)序等優(yōu)點(diǎn),有助于解決類(lèi)群間的遺傳多樣性(Powell et al., 1995; Pugh et al., 2004;Song et al., 2019)。本研究結(jié)果表明,大粒香cpDNA的SSR位點(diǎn)對(duì)A/U(T)堿基有著明顯偏好,這與前人研究結(jié)論相一致(張慧等,2018;李泳潭等,2020;鄭祎等,2020;王一麾等,2021;吳朝昕等,2021)。此外,大粒香cpDNA的密碼子也偏好A/U(T)堿基,這種密碼子使用情況也存在于其他物種中(Shinozaki et al., 1986;Ohyama et al., 1988;鄭祎等,2020;朱斌等,2021;吳朝昕等,2021)。大粒香cpDNA編碼蛋白質(zhì)的密碼子和SSR位點(diǎn)都偏好A堿基或者U(T)堿基,可能是造成大粒香cpDNA總A/U(T)含量大于總GC含量的原因。根據(jù)Niu等(2007)的研究報(bào)道,因?yàn)锳/T核苷酸含有7個(gè)氮原子,比G/C核苷酸少一個(gè), 所以富含A/T核苷酸耗能更少,有利于cpDNA的復(fù)制。這可能是大粒香cpDNA富含A/U(T)的原因。
系統(tǒng)發(fā)育基因組學(xué)是利用分子數(shù)據(jù)來(lái)研究生物間發(fā)育關(guān)系的。由于cpDNA具有序列保守、結(jié)構(gòu)穩(wěn)定、易測(cè)序等優(yōu)點(diǎn),因此基于cpDNA進(jìn)行的系統(tǒng)發(fā)育研究得到了很好的發(fā)展(Eisen,1998; Eisen & Hanawalt,1999; Delsuc et al., 2005)。本研究對(duì)優(yōu)質(zhì)稻大粒香cpDNA測(cè)序數(shù)據(jù)進(jìn)行了系統(tǒng)發(fā)育分析,研究結(jié)果表明大粒香與熱帶粳稻聚為一類(lèi);粳稻與秈稻不為一類(lèi),這一結(jié)果與林張翔等(2014)的研究結(jié)果相同,支持了Huang等(2012)的秈粳稻起源假說(shuō)。
綜上所述,本研究所獲得的大粒香的cpDNA大小、結(jié)構(gòu)、基因數(shù)量、重復(fù)序列、密碼子偏好、系統(tǒng)發(fā)育樹(shù)等特征信息,為進(jìn)一步研究大粒香的系統(tǒng)進(jìn)化和育種研究提供了理論依據(jù)。