蘇丹丹 劉玉萍 劉 濤 鄭長遠(yuǎn) 張 雨 王亞男 秦 娜 蘇 旭,3*
(1. 青海師范大學(xué)生命科學(xué)學(xué)院,西寧 810008;2. 青海師范大學(xué)青海省青藏高原藥用動(dòng)植物資源重點(diǎn)實(shí)驗(yàn)室,西寧 810008;3. 高原科學(xué)與可持續(xù)發(fā)展研究院,西寧 810016)
葉綠體普遍存在于高等植物細(xì)胞中,是光合作用的主要場所,也是一種半自主性細(xì)胞器,擁有自身獨(dú)立的遺傳物質(zhì),即葉綠體基因組。葉綠體基因組編碼與光合作用相關(guān)的上百種基因,大小介于120~180 kB,一般為共價(jià)閉合的環(huán)狀四組分結(jié)構(gòu)。典型的環(huán)狀葉綠體基因組結(jié)構(gòu)包括長單拷貝區(qū)(large single copy,LSC)、短單拷貝區(qū)(small single copy,SSC)及2 個(gè)反向重復(fù)序列(inverted re?peats,IRS)。研究表明,葉綠體基因組在物種分類、系統(tǒng)發(fā)育、遺傳多樣性、物種形成、適應(yīng)性進(jìn)化等諸多研究中具有重要作用。隨著高通量測序技術(shù)的發(fā)展、組裝軟件的推陳出新和測序成本的降低,NCBI上葉綠體基因組的數(shù)量也在逐年增加。目前,大量豆科植物的葉綠體基因組得到研究報(bào)道,并且主要集中在蝶形花亞科(Papilionoideae)植物中,如木豆()、苦豆子()、沙冬青()、瓜兒豆()、蟲豆()等。該亞科植物的葉綠體基因組發(fā)生了較大變異,如IR 區(qū)缺失、基因組倒置、內(nèi)含子丟失等。
苦馬豆()是豆科(Fabace?ae)、蝶形花亞科苦馬豆屬()的一種多年生草本植物,也是我國特有種??囫R豆主要分布于中國吉林、遼寧、內(nèi)蒙古、河北、山西、陜西、寧夏、甘肅、青海和新疆等地;全草入藥,具有利尿、止血、消腫等藥用價(jià)值,對(duì)治療腎炎、肝硬化、慢性肝炎、浮腫等有較好療效。近年來,許多學(xué)者對(duì)苦馬豆的外部形態(tài)特征、化學(xué)成分、內(nèi)生微生物、病理和藥理作用等進(jìn)行大量研究,然而有關(guān)苦馬豆葉綠體基因組結(jié)構(gòu)和特征分析的研究未見報(bào)道。據(jù)此,本文利用高通量測序技術(shù)文對(duì)苦馬豆的葉綠體基因組進(jìn)行測序,并對(duì)其密碼子偏好性、SSR 位點(diǎn)、系統(tǒng)親緣關(guān)系等分析,以期為今后苦馬豆群體遺傳多樣性、種群歷史動(dòng)態(tài)乃至豆科植物系統(tǒng)發(fā)育與親緣關(guān)系研究奠定基礎(chǔ)。
苦馬豆新鮮葉片采自青海省格爾木市烏圖美仁鄉(xiāng)幸福村(36°47′24″N,93°39′36″E,海拔2 702 m),野外采摘后立即放置于變性硅膠中干燥,憑證標(biāo)本保存于中國科學(xué)院西北高原生物研究所青藏高原生物標(biāo)本館(HNWP)。
采用改良的CTAB 法從硅膠干燥的苦馬豆葉片中提取基因組DNA,用1%的瓊脂糖凝膠電泳分析DNA 的純度和完整性、Nanodrop 檢測DNA 的純度(OD/OD比值)以及Qubit 2.0 熒光定量儀檢測DNA的濃度。
DNA 樣品檢測合格后,利用Covaris 超聲波破碎儀隨機(jī)打斷,經(jīng)序列末端修復(fù)、加A尾、加測序接頭、純化、PCR擴(kuò)增等完成整個(gè)文庫制備;建好的文庫質(zhì)檢后,使用Illumina 高通量測序平臺(tái)NovaSeq 6000(天津諾和致源科技有限公司)進(jìn)行測序。
在NCBI 上下載苦豆子葉綠體基因組序列(Genbank 登錄號(hào):NC036102.1)為參考序列,采用NOVOPlasty軟件對(duì)苦馬豆葉綠體基因組進(jìn)行組裝,參數(shù)采用默認(rèn)設(shè)置;序列注釋前首先進(jìn)行BLAST比對(duì)確認(rèn)基因邊界,然后利用軟件GeSeq對(duì)葉綠體基因組進(jìn)行注釋,采用默認(rèn)參數(shù);注釋完成后,采用在線工具OGDRAW(http://ogdraw.mpimp-golm.mgp.de/cgi-bin/ogdraw.pl)對(duì)苦馬豆葉綠體基因組圖譜繪制。
運(yùn) 用CodonW1.4.2 軟 件(http://mobyle.pas?teur/fr/cgi-bin/portal.py?from=codonw)對(duì)苦馬豆葉綠體基因組的密碼子偏好性RSCU(relative synon?ymous codon usage)進(jìn)行統(tǒng)計(jì)分析;采用在線網(wǎng)站(https://webblast. ipk-gatersleben. de/misa/index.php?action=1)對(duì)苦馬豆葉綠體基因組序列進(jìn)行微衛(wèi)星掃描分析,設(shè)置參數(shù)單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的重復(fù)數(shù)分別為10、5、4、4、4和4。
在 NCBI 數(shù) 據(jù) 庫 中 下 載 駱 駝 刺(MW349013.1)、苦 豆 子(NC036102.1)、苦 參(MH748034.1)、沙 冬 青(MK704436.1)、木 豆(KU729879.1)等21 個(gè)豆科、不同屬植物的葉綠體基因組序列,同時(shí)以遠(yuǎn)志科(Polygalaceae)遠(yuǎn)志(,NC050829.1)作為外類群,將所有參試物種的葉綠體基因組序列選擇MAFFT進(jìn)行多序列比對(duì),并將比對(duì)后的序列進(jìn)行手動(dòng)校正,使用PhyloSuite 軟件中的RAxML 構(gòu)建系統(tǒng)發(fā)育樹,bootstrap值設(shè)為1000。
苦馬豆葉綠體基因組全長為123 327 bp,GC含量為34%,與大多數(shù)蝶形花亞科植物相似,存在IR 序列丟失現(xiàn)象(見圖1)。苦馬豆葉綠體基因組共編碼108個(gè)基因,包括74個(gè)蛋白編碼基因、30個(gè)tRNA 基因和4 個(gè)rRNA 基因(見表1)。根據(jù)不同功能可以將苦馬豆葉綠體基因組劃分為3大類,即基因表達(dá)相關(guān)基因57 個(gè)、光合作用相關(guān)基因44個(gè)、開放閱讀和其它蛋白編碼基因5個(gè)以及未知功能基因2 個(gè);同時(shí),基因表達(dá)相關(guān)基因又可再被劃分為6個(gè)小類,其中數(shù)量最多的基因?yàn)檗D(zhuǎn)運(yùn)RNA基因,翻譯起始因子數(shù)量最少、僅有1個(gè)(見表1)。
圖1 苦馬豆葉綠體基因組環(huán)形圖譜Fig.1 Circularized map of the chloroplast genome of S.salsula
表1 苦馬豆葉綠體基因組注釋信息Table 1 Gene annotation of the chloroplast genome of S.salsula
通過對(duì)苦馬豆葉綠體基因組密碼子研究表明,苦馬豆共檢測出411 09 個(gè)密碼子。其中,編碼亮氨酸(Leu)的密碼子4 184 個(gè),占總密碼子數(shù)的10.18%,數(shù)量最多;色氨酸(Trp)密碼子的使用頻率最低,僅為1.23%;異亮氨酸Ile(9.24%)和絲氨酸Ser(9.34%)介于前兩者之間(見圖2)。相對(duì)同義密碼子(RSCU)大于1的有31個(gè),其中有28個(gè)密碼子的堿基構(gòu)成以A/U結(jié)尾,其余3個(gè)以G和C結(jié)尾。
圖2 苦馬豆各氨基酸的RSCU分析Fig.2 RSCU analysis of each amino acid in S.salsula
從苦馬豆葉綠體基因組中共鑒定出3 種不同類型的99 個(gè)SSR 位點(diǎn)(見表2)。其中,單核苷酸重復(fù)序列最多,共75 個(gè),僅有A(37SSRs)和T(38SSRs)2種重復(fù)類型;AT/TA/TC組成的2種二核苷酸類型共17 個(gè);三核苷酸重復(fù)序列最少,僅有7個(gè)(見表2)。非編碼區(qū)包括內(nèi)含子(Intron)和基因間隔區(qū)(intergenic spacer,IGS),絕大多數(shù)SSR 分布于非編碼區(qū)(見表3)。
表2 苦馬豆葉綠體基因組簡單重復(fù)序列(SSR)信息Table 2 Number of SSRs identified in the chloroplast ge‐nome of S.salsula
表3 苦馬豆葉綠體基因組SSR信息Table 3 Distribution of SSR in the chloroplast genome of S.salsula
續(xù)表3 Continued table 3
基于苦馬豆及其近緣種葉綠體基因組數(shù)據(jù)構(gòu)建的系統(tǒng)發(fā)育樹表明,豆科21 個(gè)物種構(gòu)成一個(gè)單系類群,靴帶支持率(bootstrap)高達(dá)100%(見圖3)。進(jìn)一步分析顯示,豆科植物又可劃分為兩大類群(Clade Ⅰ和Clade Ⅱ),同樣得到100%的支持率;其中Clade I 由苦馬豆、駱駝刺()、湖 北 紫 荊()、鞍 葉 羊 蹄 甲()、紅花羊 蹄甲()、緬茄()和梭梭()物種組成,且苦馬豆與姊妹種駱駝刺關(guān)系最近;Clade Ⅱ由苦豆子、苦參、沙冬青、美麗相思子()、刀豆()、鼎湖魚藤()、瓜兒豆、木豆、蟲豆、長角豆()、鏈莢豆()、單節(jié)假木豆()、美國土圞兒()、距瓣豆()、落花生()物種組成(見圖3)。
圖3 基于22個(gè)葉綠體基因組構(gòu)建的豆科系統(tǒng)發(fā)育樹“★”代表分支節(jié)點(diǎn)的靴帶支持率為100%Fig.3 Phylogenetic tree constructed based on data of 22 chloroplast genomes“★”represents the bootstrap support rate of 100%on the branch
葉綠體是高等綠色植物最重要的細(xì)胞器之一,也是光合作用的場所,擁有獨(dú)立完整的基因組,絕大多數(shù)植物為單親遺傳。近年來,隨著測序技術(shù)的提高及測序成本的降低,植物葉綠體基因組數(shù)據(jù)庫越來越完善。研究表明,被子植物葉綠體基因組長度通常介于120~180 kB,編碼基因常為100~130 個(gè),其中蛋白編碼基因至多80 個(gè)、tRNA 編碼基因30~32 個(gè),rRNA 編碼基因數(shù)穩(wěn)定,常有4種。本研究發(fā)現(xiàn),苦馬豆葉綠體基因組在基因種類、組成和結(jié)構(gòu)上具有高度保守性,與絕大多數(shù)豆科物種基本一致;同時(shí),依據(jù)基因功能不同葉綠體基因組可被劃分為基因表達(dá)相關(guān)基因、光合作用相關(guān)基因及其他未知功能基因。苦馬豆葉綠體基因組大小、編碼基因數(shù)目和種類等與上述研究結(jié)果一致。通常情況下,被子植物的葉綠體基因組為雙鏈環(huán)狀DNA 分子,由LSC、SSC 和2 個(gè)IRs 構(gòu)成。然而,研究發(fā)現(xiàn)蝶形花科95 種植物中,有24個(gè)物種存在IR區(qū)丟失,認(rèn)為IR序列丟失是蝶形花亞科植物葉綠體基因組結(jié)構(gòu)缺失的一種常見現(xiàn)象??囫R豆作為蝶形花亞科的一種重要旱生植物,我們同樣發(fā)現(xiàn)其葉綠體基因組也存在IR 區(qū)丟失現(xiàn)象,進(jìn)一步驗(yàn)證了先前研究的正確性和合理性。
在許多植物中,存在某一或幾種特定密碼子頻率高于其他同義密碼子(RSCU)的現(xiàn)象,即密碼子偏好性。密碼子偏好性在一定程度上能夠反映基因乃至物種的起源和進(jìn)化方式,并對(duì)基因功能及其編碼蛋白表達(dá)有一定影響。本文通過對(duì)苦馬豆葉綠體基因組密碼子偏好性分析表明,大于1的相對(duì)同義密碼子有31 個(gè),其中28 個(gè)密碼子的堿基構(gòu)成以A/T結(jié)尾,與大多數(shù)被子植物同義密碼子相似。簡單重復(fù)序列(SSR)是整個(gè)基因組中1~6 bp 的重復(fù)序列,也是高等真核生物基因組的重要組成部分,在植物物種鑒定、群體遺傳多態(tài)性和遺傳分析研究中具有重要作用。本研究表明,苦馬豆葉綠體基因組中檢測到75 個(gè)單核苷酸、17個(gè)雙核苷酸和7 個(gè)三核苷酸SSRs。其中,雙核苷酸SSRs的重復(fù)單元以AT/TA/TC為主,而三核苷酸SSRs的重復(fù)單元?jiǎng)t由AAT/ATA/TAA/TTA 構(gòu)成,這與先前報(bào)道的其他被子植物葉綠體基因組的SSRs序列構(gòu)成一致,從而驗(yàn)證了葉綠體基因組的SSRs 主要由短的poly A 和poly T 構(gòu)成,而不是由C或G 串聯(lián)重復(fù)。葉綠體基因組數(shù)據(jù)能有效進(jìn)行植物物種鑒定和系統(tǒng)親緣關(guān)系分析。尤其在近緣物種間具有更理想的效果。本文基于葉綠體基因組序列通過對(duì)豆科21 個(gè)物種系統(tǒng)發(fā)育樹的構(gòu)建,發(fā)現(xiàn)豆科植物是一個(gè)單系類群且靴帶支持率高達(dá)100%;苦馬豆與駱駝刺屬于姊妹群,具有最近的親緣關(guān)系,并且BV 值為100%,這為以后苦馬豆豆系統(tǒng)位置和親緣關(guān)系確定,遺傳多樣性分析和群體遺傳結(jié)構(gòu)研究提供了基礎(chǔ)數(shù)據(jù)。