国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

刺果甘草全基因組Survey及葉綠體基因組特征分析*

2022-09-29 15:19向如雙段寶忠BotirKhaitovAtiatulWahab孟祥霄
關(guān)鍵詞:密碼子雜合葉綠體

向如雙,孫 偉,段寶忠,王 艷,Botir Khaitov,Atia tul Wahab,孟祥霄**

(1. 大理大學(xué)藥學(xué)院 大理 671000;2. 中國中醫(yī)科學(xué)院中藥研究所中藥鑒定與安全性評估北京市重點(diǎn)實(shí)驗(yàn)室北京 100700;3. 卡拉奇大學(xué)國際化學(xué)與生命科學(xué)研究院化學(xué)研究所 卡拉奇 75270;4. 國際生物鹽農(nóng)業(yè)中心塔什干 100084;5. 卡拉奇大學(xué)國際化學(xué)與生命科學(xué)研究院分子醫(yī)學(xué)與藥物研究所 卡拉奇 75270)

甘草屬GlycyrrhizaL.全球約有20 余種,我國約有8種[1],該屬多數(shù)植物具有藥用價(jià)值。但近年來隨著生態(tài)環(huán)境的破壞及無節(jié)制的采挖,該屬植物資源狀況日益嚴(yán)峻,如何保護(hù)及高效利用甘草屬藥用植物資源已成為急需解決的關(guān)鍵問題[2]。刺果甘草G. pallidiflora主要分布于中國東北和東部地區(qū),在阿穆爾河流域和西伯利亞也有發(fā)現(xiàn),其根常用于緩解咳嗽、疼痛、潰瘍和癌癥等[3]。刺果甘草與2020版《中國藥典》收載的甘草藥材基原植物相比,其生物量較大,抗性較強(qiáng),根部活性成分含量和植物生長發(fā)育具有物種的獨(dú)特性[4]。

目前,有關(guān)刺果甘草的研究主要集中于化學(xué)成分[5-7]、易混偽品鑒別[8-10]、核型及染色體倍性[11-13]等方面。現(xiàn)代研究表明,刺果甘草化學(xué)成分有三萜皂苷類、黃酮類、香豆素類、二萜類、二苯乙烯類及多糖等成分[5]。由于形態(tài)相似,市場上刺果甘草常與烏拉爾甘草、苦參、黃芪等藥材相混淆,DNA 分子標(biāo)記是中藥材鑒定的一種有力工具[9],當(dāng)前DNA 條形碼,SSR,RAPD 等技術(shù)已運(yùn)用于甘草屬植物的鑒定,但主要研究目標(biāo)以《中國藥典》中甘草藥材的三個(gè)基原物種居多。有關(guān)學(xué)者開展了刺果甘草G.pallidiflora的核型研究,結(jié)果顯示其體細(xì)胞染色體數(shù)目2n=16[11],與烏拉爾甘草G. uralensisFisch.、光果甘草G. glabraL.、脹果甘草G. inflataBatal.等相比,刺果甘草為最原始的一類[12]。全基因組序列的組裝是研究植物代謝調(diào)控、藥物活性成分積累和形成機(jī)制的重要基礎(chǔ)[14],基因組Survey 分析可為基因組測序及組裝策略提供重要參考,減少盲目性[15]。對刺果甘草葉綠體全基因組的簡單重復(fù)序列、密碼子偏好性、系統(tǒng)發(fā)育學(xué)等進(jìn)行分析,有助于對刺果甘草表型產(chǎn)生的遺傳背景及系統(tǒng)發(fā)育進(jìn)化方面的解析。

鑒于此,本研究使用Illumina 測序技術(shù)及生物信息學(xué)方法對刺果甘草進(jìn)行了基因組Survey 和葉綠體基因組特征分析,以期從基因組學(xué)層面對甘草屬藥用植物資源的開發(fā)、保護(hù)與利用提供理論與數(shù)據(jù)基礎(chǔ)。

1 材料

樣品的新鮮葉片采自黑龍江中醫(yī)藥大學(xué)(N45°43′32.71″,E126°38′55.44″),經(jīng)昆明采智生物技術(shù)有限公司鑒定為刺果甘草G. pallidiflora(標(biāo)本號:HBGPCGGC),新鮮葉片液氮速凍研磨后于-80℃超低溫冰箱保存?zhèn)溆谩?/p>

2 方法

2.1 基因組DNA的提取

葉片基因組DNA 使用天根植物基因組DNA 提取試劑盒(DP305)提取,DNA 濃度使用紫外分光光度計(jì)測定、完整性使用瓊脂糖凝膠電泳檢測。

2.2 文庫構(gòu)建及測序

DNA 樣品檢測合格后,使用超聲波破碎儀(Covaris,美國)隨機(jī)打斷,再經(jīng)末端修復(fù)、加A尾、加測序接頭、純化、PCR 擴(kuò)增等步驟完成整個(gè)文庫制備工作。采用Agilent 2100(安捷倫,美國)對文庫的插入片段進(jìn)行檢測,采用Q-PCR 方法對文庫的有效濃度進(jìn)行準(zhǔn)確定量,以保證文庫質(zhì)量[14]。文庫檢測合格后,通過諾禾致源科技股份有限公司高通量測序平臺(tái)Illumina NovaSeq(Illumina,美國)[16]進(jìn)行雙末端150 bp 測序。對雙端測序數(shù)據(jù)進(jìn)行統(tǒng)計(jì)與質(zhì)量評估(質(zhì)量值Q20、Q30評估),采用fastp(版本:0.20.0)軟件對原始數(shù)據(jù)進(jìn)行過濾后得到高質(zhì)量數(shù)據(jù),原始測序數(shù)據(jù)已上傳至NCBI 序列讀取檔案(SRA,登錄號:SRR17594212)。采 用blastn(版 本:2.9.0;參 數(shù):-evalue 1e-5 -max_target_seqs 1-bitscore 270)軟件對測序reads進(jìn)行NT 庫比對,然后采用MEGAN(版本:6.16.4)軟件進(jìn)行物種分類,以判斷測序數(shù)據(jù)是否存在污染,質(zhì)控后數(shù)據(jù)用于基因組Survey及葉綠體全基因組分析。

2.3 19-mer分析及基因組大小估計(jì)

采用基于K-mer[17]的分析方法,對刺果甘草的基因組大小和雜合率等進(jìn)行估計(jì);采用Jellyfish(版本:2.2.10)軟件,統(tǒng)計(jì)K-mer頻數(shù)分布(K=19),獲得K-mer分布圖和深度估計(jì)值[15]:采用GCE[18](版本:1.0.0)軟件對K-mer 頻數(shù)分布數(shù)據(jù)進(jìn)行分析,獲得刺果甘草的基因組大小、雜合度和重復(fù)序列比例等。

2.4 葉綠體基因組的組裝與注釋

采用SPAdes(版本:3.14.0;參數(shù):-k 127)軟件[19]進(jìn)行基因組拼接,將拼接結(jié)果與近緣參考基因組進(jìn)行blastn(版本:BLAST 2.2.30+;參數(shù):-evalue 1e-5)比對,基于比對情況并確定候選序列組裝結(jié)果。采用PGA(版本:1)軟件[20]對葉綠體全基因組序列進(jìn)行注釋并繪圖,組裝、注釋的葉綠體基因組已上傳至GenBank(登錄號:MZ052084)。

2.5 葉綠體基因組重復(fù)序列和密碼子偏好性分析

采用CodonW(版本:1.4.4)軟件對葉綠體全基因組密碼子偏好性進(jìn)行分析,統(tǒng)計(jì)同義密碼子相對使用度(Relative Synonymous Codon Usage,RSCU)的值。采用VMATCH(http://www. vmatch. de/)軟 件(參 數(shù):minimal repeat size 30 bp)分析葉綠體基因組中的散在長重復(fù)序列片段。簡單重復(fù)序列(Simple Sequence Repeats, SSR)分析采用MISA(版本:1.0;參數(shù):默認(rèn);unit size:1-8 2-4 3-4 4-3 5-3 6-3)軟件分析。

2.6 葉綠體全基因組比對分析

以刺果甘草葉綠體基因組序列作為參考,采用mVISTA 對本文組裝的刺果甘草G. pallidiflora(MZ052084)葉綠體基因組序列與烏拉爾甘草G.uralensis(KU862308)、光果甘草G.glabra(NC_024038)和脹果甘草G.inflata(NC_042146)的葉綠體基因組序列進(jìn)行全基因組比對及差異性分析。

2.7 葉綠體基因組系統(tǒng)進(jìn)化分析

采用MAFFT(版本:7.471)軟件[21]對葉綠體基因組序列進(jìn)行比對。采用RAxML[22](版本:8.2.12;核苷酸模型:GTRGAMMA;重復(fù)迭代次數(shù):1000)軟件使用最大似然法(Maximum Likelihood,ML)構(gòu)建系統(tǒng)發(fā)育樹。采用FigTree(版本:1.4.4)軟件對系統(tǒng)發(fā)育樹進(jìn)行美化。

3 結(jié)果與討論

3.1 測序數(shù)據(jù)質(zhì)量評估

利用Illumina NovaSeq 平臺(tái)進(jìn)行測序,經(jīng)過濾后,獲得有效測序數(shù)據(jù)213,823,950 reads,約31.6G,原始數(shù)據(jù)及質(zhì)控后數(shù)據(jù)質(zhì)量Q20 值均大于90%、Q30 值均大于85%(表1),表明測序質(zhì)量較好。在測序的reads中提取前50,000 條與NT 數(shù)據(jù)庫進(jìn)行blastn 比對,物種分類結(jié)果顯示,比對上最多的是甘草屬Glycyrrhiza,reads數(shù)占比對上NT庫reads數(shù)的39.25%,無異常比對結(jié)果,表明基因組測序數(shù)據(jù)不存在污染。

表1 刺果甘草二代測序數(shù)據(jù)量信息統(tǒng)計(jì)表

3.2 19-mer分析及基因組大小估計(jì)

測序reads 的K-mer 分布結(jié)果見圖1,可見分布曲線成峰情況較好,有一個(gè)主峰,K-mer深度分布主峰約為25。K-mer 分布計(jì)算結(jié)果表明,全基因組大小約為577.82 Mb,重復(fù)序列比例約53.72%,雜合度約0.31%(表2),根據(jù)估測的基因組大小,測序深度約為55X。根據(jù)基因組可以劃分為微雜合基因組(0.5%≤雜合率<0.8%)、高雜合基因組(雜合率≥0.8%)以及高重復(fù)基因組(重復(fù)序列比例≥50%)[23],表明本研究中刺果甘草材料存在低雜合且重復(fù)序列較多的特點(diǎn),為二倍體基因組。

圖1 K-mer=19時(shí)K-mer深度和頻率分布圖

表2 刺果甘草K-mer分析統(tǒng)計(jì)表

3.3 葉綠體基因組組裝與注釋

刺果甘草葉綠體基因組全長為127,267 bp,GC 含量為34.32%,其雙鏈環(huán)狀DNA 見圖2,不具有典型的四分體結(jié)構(gòu),一對反向重復(fù)區(qū)(Inverted Repeat Regions,IRa 和IRb)丟失,僅含1 個(gè)大單拷貝區(qū)(Large Single Copy,LSC)和1個(gè)小單拷貝區(qū)(Small Single Copy,SSC)。經(jīng)PGA 注釋結(jié)果顯示,其葉綠體基因組共包含110 個(gè)基因,其中76 個(gè)蛋白質(zhì)編碼基因,30 個(gè)tRNA 基因和4 個(gè)rRNA 基因(表3)。經(jīng)與同屬物種比較,結(jié)果顯示刺果甘草的葉綠體基因組結(jié)構(gòu)、基因功能分類與其它甘草屬物種一致[24]。

圖2 刺果甘草葉綠體基因組圖譜

表3 刺果甘草葉綠體基因組基因列表

3.4 葉綠體基因組重復(fù)序列分析

在刺果甘草葉綠體基因組中檢測到的散在長重復(fù)序列片段共有37條,包括3種類型:正向(24條)、回文(8 條)和串聯(lián)(5 條),其片段的長度范圍均為30-224 bp。根據(jù)刺果甘草葉綠體基因組簡單重復(fù)序列(SSR)分析表明,共有243 個(gè)SSR 位點(diǎn)(表4),其中包括單核苷酸重復(fù)基序(141 個(gè))、二核苷酸重復(fù)基序(86個(gè))、三核苷酸重復(fù)基序(4 個(gè))、四核苷酸重復(fù)基序(11個(gè))和六核苷酸重復(fù)基序(1 個(gè)),未發(fā)現(xiàn)五核苷酸重復(fù)基序。在所檢測的SSR 中,SSR 的類型以A/T(139 個(gè))、AT/TA(76 個(gè))為主,表明SSR 偏好使用A 和T 堿基。據(jù)報(bào)道SSR 在甘草屬植物DNA 分子標(biāo)記技術(shù)中應(yīng)用較少,若將SSR 分析與多種分子技術(shù)相結(jié)合能夠更好地反應(yīng)甘草屬植物的演化歷程和進(jìn)化趨勢[25],為甘草屬植物分子鑒定的標(biāo)記開發(fā)提供基礎(chǔ)。

表4 刺果甘草葉綠體基因組SSRs類型及數(shù)量

3.5 葉綠體基因組密碼子偏好性分析

根據(jù)刺果甘草葉綠體基因組密碼子RSCU 值的統(tǒng)計(jì)結(jié)果顯示(圖3),檢測到共有63種密碼子編碼20個(gè)氨基酸,RSCU 值與編碼單個(gè)氨基酸的密碼子數(shù)量呈正相關(guān),RSCU 的最小值為0.31,最大值為2.01。RSCU值最大的是UUA編碼的Leu(亮氨酸)。最不常見的氨基酸是Met(蛋氨酸)和Trp(色氨酸),最常見的氨基酸是Leu(亮氨酸)、Arg(精氨酸)和Ser(絲氨酸)。在RSCU 值>1 即使用更頻繁的密碼子中,大多數(shù)密碼子第三位均以A/U 結(jié)尾,表明刺果甘草葉綠體基因組主要偏好以第三位堿基為A 和U 為主的密碼子,這與已報(bào)道的大多數(shù)藥用植物的葉綠體基因密碼子偏性分析的結(jié)果相似[26-27]。

圖3 刺果甘草蛋白質(zhì)編碼基因中20個(gè)氨基酸和終止密碼子的密碼子含量

3.6 葉綠體基因組序列變異分析

葉綠體全基因組比對分析結(jié)果見圖4,可見刺果甘草、烏拉爾甘草、光果甘草和脹果甘草葉綠體基因組序列之間相似性很高,非編碼區(qū)域序列變異高于編碼區(qū)域,LSC 區(qū)明顯大于SSC 區(qū)。由圖可見,變異較大的基因有clpP、ycf2,其他基因保守程度非常高,絕大多數(shù)基因的相似度均在90%以上。4個(gè)甘草屬植物的基因間區(qū)變異大于基因區(qū),如:psbA-trnK-UUU、trnLUAA-trnT-UGU、trnC-GCA-rpoB、 atpA-trnR-UCU、trnQ-UUG-accD、rbcL-atpB、ycf3-psaA、trnG-psbZ、atpH-atpF等,這些位點(diǎn)可以作為甘草屬植物分子鑒定標(biāo)記的候選區(qū)段。其中有4 個(gè)基因間區(qū)區(qū)域(trnLUAA-trnT-UGU、 trnC-GCA-rpoB、 atpA-trnR-UCU、trnQ-UUG-accD)和1 個(gè)蛋白編碼區(qū)域(ycf2)在烏拉爾甘草、光果甘草和脹果甘草滑動(dòng)窗分析中已被識(shí)別為熱點(diǎn)區(qū)域[28]。

圖4 4種甘草屬植物葉綠體基因組全局比對圖

3.7 葉綠體基因組系統(tǒng)發(fā)育分析

為確定刺果甘草的系統(tǒng)發(fā)育位置,使用11條葉綠體基因組序列(包括1 條豆科苜蓿屬蒺藜苜蓿Medicago truncatulaGaertn.序列作為外類群,10 條豆科甘草屬序列)構(gòu)建ML 系統(tǒng)發(fā)育樹,結(jié)果顯示刺果甘草G.pallidiflora與其他甘草屬物種聚為一支(圖5),且親緣關(guān)系與圓果甘草G.squamulosa的親緣關(guān)系較近,研究結(jié)果與楊萍[12]的甘草核型分析結(jié)果一致。本研究的刺果甘草葉綠體基因組序列可為豆科后續(xù)開展遺傳多樣性研究提供重要信息。

圖5 基于葉綠體全基因組序列構(gòu)建ML系統(tǒng)進(jìn)化樹

4 結(jié)語

據(jù)報(bào)道,基因組Survey 分析方法已經(jīng)成功應(yīng)用于三島柴胡[29]、地黃[14]、羅漢果[15]等藥用植物的基因組大小測定。基于基因組Survey 分析方法來估測物種基因組大小,不僅對物種基因組測序及組裝策略提供重要參考,還可以對相關(guān)蛋白組、轉(zhuǎn)錄組以及代謝產(chǎn)物研究提供理論基礎(chǔ)[30],促進(jìn)分子生物學(xué)在藥用植物保護(hù)及培育優(yōu)良品種方面的研究進(jìn)展。葉綠體是與光合作用直接相關(guān)的細(xì)胞器,普遍存在于植物中[31],葉綠體基因組多為母系遺傳、信息位點(diǎn)豐富、基因組成及結(jié)構(gòu)相對保守[31-33],具有四分體結(jié)構(gòu),但少數(shù)植物如豆科的地車軸草Trifolium subterraneumL.、蒺藜苜蓿M.truncatula和鷹嘴豆Cicer arietinumL.等因一個(gè)反向重復(fù)區(qū)完全丟失而具有特殊的葉綠體基因組結(jié)構(gòu)[31]。葉綠體基因組學(xué)研究現(xiàn)已廣泛應(yīng)用于植物物種鑒定、系統(tǒng)進(jìn)化、遺傳多樣性等多個(gè)領(lǐng)域[34]。豆科是被子植物中三大科之一[35],目前有關(guān)豆科植物的葉綠體基因組結(jié)構(gòu)研究主要集中在蝶形花亞科(Papilionoideae)[36]。

本研究利用Illumina NovaSeq 平臺(tái),完成了刺果甘草全基因組Survey 分析、葉綠體基因組組裝、注釋、密碼子的偏好性、簡單重復(fù)序列及系統(tǒng)發(fā)育分析等。研究結(jié)果表明刺果甘草基因組K-mer 深度分布主峰約為25,基因組大小約為577.82 Mb,基因組大小與豆科紅車軸草Trifolium pratenseL.、菜豆Phaseolus vulgarisL.和綠豆Vigna radiata(L.) Wilczek 等植物較接近,符合豆科植物基因組的大小在高等植物中處于中游水平的特點(diǎn)[35]。K-mer 曲線服從泊松分布,雜合度約為0.31%,重復(fù)序列比例約53.72%,這與豆科沙冬青Ammopiptanthus mongolicus(Maxim.ex Kom.)Cheng f.[37]基因組特征相近,存在低雜合和重復(fù)序列較多的特點(diǎn)。同屬的烏拉爾甘草基因組約400.95 Mb,雜合度約0.36%,重復(fù)序列比例約36.48%[38]。刺果甘草與烏拉爾甘草相比雜合度略低,更高的重復(fù)序列比例也導(dǎo)致了更大的基因組。刺果甘草基因組研究,有助于推動(dòng)甘草屬植物遺傳多樣性的解析,以及比較基因組和泛基因組學(xué)的研究。通過基因組、轉(zhuǎn)錄組、代謝組學(xué)的聯(lián)合分析,可輔助解析甘草藥材品質(zhì)的形成機(jī)制[39]。為了更好地對刺果甘草全基因組進(jìn)行序列拼接和組裝,可嘗試采用三代測序結(jié)合二代測序的分析策略進(jìn)行基因組組裝[30],本研究產(chǎn)生的Illumina測序數(shù)據(jù)還可用于基因組初步組裝與注釋等工作,解析刺果甘草的基本生物學(xué)信息,為后續(xù)開展基因克隆等分子遺傳研究提供數(shù)據(jù)基礎(chǔ)。葉綠體全基因組分析結(jié)果顯示,刺果甘草葉綠體基因組具有典型的環(huán)狀DNA雙鏈結(jié)構(gòu),無反向重復(fù)(IR)區(qū)域,與已發(fā)表的豆科蝶形花亞科甘草屬物種葉綠體基因組一致,都發(fā)生了IR 區(qū)域的丟失,因此豆科蝶形花亞科中的甘草屬物種也可以被命名為IRLC(Inverted Repeat-Lacking Clade)分支[24,36,40];重復(fù)序列分析結(jié)果顯示,刺果甘草葉綠體基因組中共檢測到243個(gè)SSR,37條長重復(fù)序列,這可為甘草屬植物分子標(biāo)記開發(fā)、系統(tǒng)發(fā)育研究和相關(guān)物種鑒定提供相應(yīng)的理論基礎(chǔ)。葉綠體基因組序列變異分析結(jié)果顯示,刺果甘草、烏拉爾甘草、脹果甘草和光果甘草的psbA-trnK-UUU、rbcL-atpB、ycf3-psaA、trnG-psbZ、atpH-atpF等基因間區(qū)變異較大,這些位點(diǎn)為甘草屬植物的分子鑒定提供了新的位點(diǎn)資源。系統(tǒng)發(fā)育分析顯示,刺果甘草與圓果甘草G.squamulosa的親緣關(guān)系最近,為后續(xù)開展遺傳多樣性研究奠定了科學(xué)基礎(chǔ)。

猜你喜歡
密碼子雜合葉綠體
鐮翅羊耳蒜葉綠體基因組密碼子偏好性分析
共生
人不吃飯行嗎
新型密碼子、反密碼子、氨基酸對應(yīng)盤
對“翻譯”過程中幾個(gè)問題的探討
2種果蠅(Drosophila melanogaster與D.sechellia)線粒體及NADH dehydrogenase subunit基因的密碼子偏好性分析
“雜合”理論觀照下的賽珍珠《水滸傳》譯本章回題目翻譯策略研究
文化趨同下的翻譯視角
淺析英語文學(xué)漢譯中雜合現(xiàn)象的成因
兩對基因自由組合變形歸類例析