摘 要:為探究酸模葉蓼(Persicaria lapathifolia)的葉綠體基因組特征及其系統(tǒng)位置,本研究采用Illumina平臺對酸模葉蓼的葉綠體全基因組進行測序。結(jié)果表明,酸模葉蓼葉綠體基因組由4部分組成,總長度為159 052 bp,其中,大單拷貝區(qū)(LSC)長度為83 621 bp,小單拷貝區(qū)(SSC)長度為13 149 bp,2個反向重復(fù)區(qū)長度均為31 141 bp。基因組序列總的鳥嘌呤(G)和胞嘧啶(C)含量為38%,共注釋得到128個獨特基因,包含83個蛋白質(zhì)編碼基因、8個rRNA基因和37個tRNA基因。酸模葉蓼葉綠體基因組相對同義密碼子使用度大于1.00的密碼子共有32個,其中,有29個以A/U結(jié)尾,有3個以G結(jié)尾。在酸模葉蓼葉綠體基因組中共檢測209個符合條件的SSR位點,以單核苷酸重復(fù)占絕對優(yōu)勢,主要是A/T堿基。系統(tǒng)發(fā)育分析表明,酸模葉蓼與香蓼(Persicaria viscosa)的親緣關(guān)系最近。本研究可為蓼科(Polygonaceae)葉綠體基因組及系統(tǒng)發(fā)育分析提供基礎(chǔ)參考資料。
關(guān)鍵詞:酸模葉蓼;葉綠體基因組;重復(fù)序列;密碼子偏好性;系統(tǒng)發(fā)育分析
中圖分類號:Q943.2
文獻標志碼:A
收稿日期:2024-04-09
基金項目:湖南省自然科學基金項目(2024JJ7509);湖南省教育廳重點項目(20A451);國家級大學生創(chuàng)新創(chuàng)業(yè)項目(202210547014)
作者簡介:楊賢均,男,教授,碩士,從事植物多樣性研究;E-mail:29785074@qq.com
Analyses on chloroplast genomes characteristiscs and phylogeny of Persicaria lapathifolia
YANG Xianjun, KUANG Juan, QUAN Zhixin, XIE Jinyu, XIAO Jiawei, OU Longyan, LI Yinghui
(Agriculture Forestry Ecology College, Shaoyang University, Shaoyang 422004, China)
Abstract: To explore the structural features of Persicaria lapathifolia chloroplast genome and its systematic position, this study used Illumina platform to sequence the whole chloroplast genomes of Persicaria lapathifolia. The results show that the length of chloroplast genomes of Persicaria lapathifolia is 159 052 bp, which is composed of four regions. The length of large single copy region is 83 621 bp, small single copy region is 13 149 bp, and the lengths of two inverted repeats regions are both 31 141bp. The total guanine (G) and cytosine (C) content is 38%. A total of 128 unique genes are annotated, including 83 protein coding genes, 8 rRNA genes and 37 tRNA genes. There are 32 codons with the relative synonymous codon usage higher than 1.00 in chloroplast genomes of Persicaria lapathifolia, in which, 29 codons are ended with A/U, and 3 codons are ended with G. SSR site analysis reveals that the chloroplast genomes sequence contains 209 SSR loci in total, The SSRs are mononucleotides, especially for A/T. Phylogenetic analysis shows that Persicaria lapathifolia exhibits the closest genetic relationshipwith Persicaria viscosa. This study can provide basic reference data for the chloroplast genome and systematics analyses of Polygonaceae.
Key words: Persicaria lapathifolia; chloroplast genomes; repeating sequence; codon bias; phylogenetic analysis
酸模葉蓼(Persicaria lapathifolia)隸屬于蓼科(Polygonaceae)蓼屬(Persicaria),一年生草本,莖直立,高達90 cm,為蓼屬的模式物種,該種分布范圍廣,我國南北各省區(qū)均有分布,常生于水邊、路旁、荒地等[1]。酸模葉蓼藥用價值高,具有除濕化滯、殺蟲解毒、活血等功效[2]。此外,還具有抗氧化、抗菌、抑制α-葡萄糖苷酶活性等[3-4]。
葉綠體是部分植物特有的進行能量轉(zhuǎn)換的細胞器,可將水和二氧化碳轉(zhuǎn)化成氧氣和碳水化合物[5]。葉綠體全基因組序列在煙草(Nicotiana tabacum)[6]和地錢(Marchantia polymorpha)[7]中獲得,近年來,葉綠體基因組的研究發(fā)展迅速,廣泛應(yīng)用于系統(tǒng)發(fā)育、物種保護和分子進化研究,但酸模葉蓼的葉綠體基因組研究尚屬空白。本研究以酸模葉蓼為實驗材料,利用Illumina測序技術(shù)獲取酸模葉蓼的葉綠體基因組序列,并運用生物信息學軟件對其進行分析。本研究可為蓼科植物分子育種、物種鑒定、分子標記開發(fā)、進化歷程及資源開發(fā)利用以及蓼屬植物種內(nèi)及種間品種鑒定提供參考。
1 材料與方法
1.1 實驗材料
本研究所使用的新鮮植物葉片采集于邵陽學院七里坪校區(qū)園林基地(111°26′21″N,27°11′32″E),通過硅膠將葉片進行干燥,憑證標本保存在邵陽學院園林實驗室標本儲藏分室(標本號:YXJamp;XJW2021060101)。DNA提取、葉綠體基因組測序等由天津諾禾致源生物科技有限公司完成。
1.2 葉綠體基因組的提取與測序
采用CTAB[8]法提取酸模葉蓼的DNA,利用北京諾禾致源生物科技有限公司測序平臺的Illumina NovaSeq 6000測序儀測序,使用fastp 0.20.0軟件對原始數(shù)據(jù)進行過濾以獲得高質(zhì)量reads,共得到9.14 Gb原始數(shù)據(jù)(Q20為97.49%,Q30為93.11%)用于后續(xù)組裝和注釋。
1.3 葉綠體基因組的組裝與注釋
在對Raw Reads數(shù)據(jù)進行測序后,使用NGS QC Tool-Kit軟件過濾低質(zhì)量序列并獲得4.54 Gb Clean reads。使用SPAdes[9]軟件拼接二代測序數(shù)據(jù),利用GapFiller得到的contig補充GAP[10],使用PrInSeS-G進行序列矯正,得到組裝后的葉綠體全基因組。利用CPGAVAS2[11]在線軟件對序列進行注釋,在Geneious[12]軟件中手動校正存在問題的位點后,注釋基因組[13];最后,利用Chloroplot[14]在線軟件繪制基因組物理圖譜。
1.4 密碼子偏好性與重復(fù)序列、SSR分析
使用Codon W 1.4.2(http://codonw.sourceforge.net/),統(tǒng)計分析所含的蛋白質(zhì)編碼基因序列的相對同義密碼子使用度,并通過Ggplot軟件將其可視化[15]。
利用MISA[16]在線軟件檢測簡單重復(fù)序列,設(shè)置相應(yīng)參數(shù)如下:單核苷酸重復(fù)≥8,二核苷酸重復(fù)≥5,三、四、五和六核苷酸重復(fù)≥3。采用REPute[17]在線軟件驗證酸模葉蓼的重復(fù)序列,設(shè)置最小重復(fù)長度為30 bp,漢明距離為3 bp,最大計算重復(fù)次數(shù)為5 000 bp[18]。
1.5 蓼屬植物種間基因組比較與IR區(qū)邊界分析
取本研究系統(tǒng)發(fā)育樹上與酸模葉蓼最接近的8個物種(含酸模葉蓼)進行IR結(jié)構(gòu)變異分析,利用IR scope[19]軟件繪制IR邊界對比圖。
1.6 系統(tǒng)進化分析
利用從NCBI數(shù)據(jù)庫中下載的17個已上傳的葉綠體全基因組序列,包括15個蓼科植物和2個石竹科(Caryophyllaceae)植物(外類群),分別為蠶繭草(Persicaria japonica,NC 056952.1)、伏毛蓼(Persicaria pubescens,MK 234901.1)、紅蓼(Persicaria orientalis,NC 065785.1)、水蓼(Persicaria hydropiper,MK 234902.1)、香蓼(Persicaria viscosa,NC 071834.1)、兩棲蓼(Persicaria amphibia,NC 071233.1)、短毛金線草(Antenoron filiforme var. neofiliforme,NC 068870.1)、金線草(Antenoron filiforme,NC 058319.1)、刺蓼(Persicaria senticosa,NC 067968.1)、扛板歸(Persicaria perfoliata,NC 060649.1)、長戟葉蓼(Persicaria maackiana,NC 061657.1)、火炭母(Persicaria chinensis,NC 050358.1)、雞爪大黃(Rheum tanguticum,NC 046695.1)、藥用大黃(Rheum officinale,NC 058627.1)、中華山蓼(Oxyria sinensis,NC 032031.1)、石竹(Dianthus chinensis,NC 053731.1)和長萼瞿麥(Dianthus longicalyx,NC 050834.1),對這些植物和本文測的酸模葉蓼(NC 000000.1)葉綠體基因進行系統(tǒng)進化分析。使用Phylosuite v 1.2.2[20]軟件包,使用葉綠體全基因組序列,經(jīng)MAFFT[21]進行多序列比對后,利用ModelFinder[22]計算最佳堿基替換模型,采用IQ-TREE[23]軟件構(gòu)建最大似然法(maximum likelihood, ML)系統(tǒng)發(fā)育樹,系統(tǒng)發(fā)育樹分支的支持率基于自展法檢測自展值,自展值設(shè)置為5 000,重復(fù)次數(shù)設(shè)置為1 000次,其他參數(shù)設(shè)為默認值,最后使用iTOL v5[24]在線工具和ChiPlot網(wǎng)站調(diào)整系統(tǒng)發(fā)育樹。
2 結(jié)果與分析
2.1 酸模葉蓼葉綠體基因組結(jié)構(gòu)與特征
酸模葉蓼葉綠體基因組具有典型的四分體結(jié)構(gòu)(圖1),全長159 052 bp,基因組序列總的鳥嘌呤(G)和胞嘧啶(C)含量為38%。其中,大單拷貝區(qū)(LSC)長83 621 bp,小單拷貝區(qū)(SSC)長13 149 bp,二者被兩段31 141 bp的反向重復(fù)序列IRa、IRb區(qū)分隔。酸模葉蓼葉綠體基因組蛋白質(zhì)編碼基因數(shù)、核糖體RNA基因數(shù)和轉(zhuǎn)運RNA基因數(shù)分別是83個、8個和37個(表1)。
2.2 酸模葉蓼葉綠體基因組的密碼子偏好性
提取酸模葉蓼葉綠體基因組CDS序列進行密碼子偏好性分析(圖2),酸模葉蓼葉綠體DNA(cpDNA)編碼序列共編碼21種氨基酸(含終止密碼子,下同)。其中,亮氨酸L(Leu)、精氨酸R(Arg)和絲氨酸S(Ser)最多,均達到6個;甲硫氨酸M(Met)和色氨酸W(Trp)的密碼子最少,僅1個。丙氨酸A(Ala)的偏好密碼子為GCU,苯丙氨酸F(Phe)的偏好密碼子為UUU。亮氨酸L對UUA的偏好性值最大(1.74),其次為*終止密碼子對UAA的偏好性(1.71)。酸模葉蓼cpDNA的32個偏好密碼子中有29個以A/U堿基結(jié)尾的密碼子,僅有3個以G堿基結(jié)尾,說明酸模葉蓼葉綠體基因組偏好使用以A/U堿基結(jié)尾的密碼子。
2.3 酸模葉蓼葉綠體基因組的重復(fù)序列與SSR分析
在酸模葉蓼葉綠體基因組中查找到209個符合條件的SSR位點(圖3),包含了142個單核苷酸重復(fù)單元,16個雙核苷酸重復(fù)單元,99個三核苷酸重復(fù)單元,12個四核苷酸重復(fù)單元。簡單重復(fù)序列A/T出現(xiàn)頻次最高,達102個,其次是C/G,有40個。由此可見,SSR基因的堿基組成偏好A/T。
酸模葉蓼的葉綠體基因組中,長度大于30 bp的散在重復(fù)序列共有21個,其中最長的達到31 141 bp,位置1在83 620 bp處,位置2在127 910 bp處;整個葉綠體基因組存在的重復(fù)類型僅有正向重復(fù)和回文重復(fù)2種。
2.4 蓼屬植物種間基因組比較與IR區(qū)邊界分析
對葉綠體中IR區(qū)邊界的結(jié)構(gòu)分析發(fā)現(xiàn):8種蓼科植物葉綠體,LSC區(qū)、SSC區(qū)、IR區(qū)大小分別為83 621~85 524 bp、12 876~13 262 bp、30 872~31 184 bp(圖4),由圖4可知,葉綠體四分體結(jié)構(gòu)LSC、SSC、IRa和IRb之間存在4個邊界,分別是JLB、JSB、JSA和JLA。選取了水蓼、兩棲蓼、金線草、火炭母、扛板歸、伏毛蓼、刺蓼、酸模葉蓼共8個蓼科物種,對IR和SSC邊界區(qū)域堿基分布的分析表明,這8個物種基因組序列長度、邊界基因的位置和類型均存在一定差異。LSC/IRb邊界附近的基因是rps3、rpl22、rps 19和rpl2,7個物種的rps3、rpl22、rp12與rps19基因分布在LSC/IRb(JLB)邊界兩側(cè),只有火炭母缺少rps3,且rps19橫跨邊界,位于LSC區(qū)長171 bp,IRb區(qū)內(nèi)長108 bp。ndhF均橫跨IRb/SSC(JSB)邊界,但扛板歸的ndhF基因在IRb區(qū)域長度為3 bp,明顯低于其他物種。在LSC/IRa(JLA)邊界處,出現(xiàn)了rps19相缺失,trnH均位于LSC/IRa(JLA)邊界,與邊界存在2~9 bp距離。
2.5 系統(tǒng)進化分析
通過ModelFinder[22]計算最佳堿基替換模型為TVM+F+I+I+R3?;?6個蓼科(Polygonaceae)物種和2個石竹科物種的葉綠體全基因組構(gòu)建最大似然樹(圖5)。結(jié)果顯示,蓼科的植物均在一個分支上且自展值為100,酸模葉蓼嵌入其中,與香蓼的親緣關(guān)系最為接近。
3 討論
酸模葉蓼的相對同義密碼子使用度(RSCU)大于1.00(包括1)的密碼子共有32個,其中29個以A/U結(jié)尾,3個以G結(jié)尾,這一結(jié)果與閉鞘姜[25]、蕁麻[26]、闊葉獼猴桃[27]桑葉葡萄[28]等類似,都偏好使用以A/U結(jié)尾的密碼子。
被子植物葉綠體基因組基本為母系遺傳,而SSR位點的鑒定對于群體遺傳進化和研究具有一定意義[29-30]。酸模葉蓼葉綠體基因組的SSR分析中,一共檢測到209個符合條件的SSR位點。在所有SSR中,單核苷酸重復(fù)序列占有明顯優(yōu)勢,共142個,且主要以A/T的形式存在,由此可見酸模葉蓼SSR基因的堿基組成偏好。
在本研究的IR分析中,與酸模葉蓼同科的8個物種的trnH和psbA均位于LSC區(qū)域,這在一定程度上驗證了被子植物葉綠體基因組的保守性。在LSC/IRa邊界的trnH基因發(fā)生了明顯的邊界擴張和收縮,所有的trnH基因均處于LSC區(qū),同時出現(xiàn)了與核糖體蛋白rps19相關(guān)基因的缺失,這可以在一定程度上增強光合作用效能且降低蛋白質(zhì)的合成效率[31]。
文獻[32]和中國植物志[1]將蓼科分為蓼亞科和酸模亞科,將蓼屬分為5個組,包括蓼組、刺蓼組、分叉蓼組、頭狀蓼組和拳參組,酸模葉蓼歸于蓼組?;谌~綠體全基因組序列的最大似然樹分析,研究表明,蓼組的植物在一個分支Ⅰ上(PP=1.0),酸模葉蓼嵌入其中,與香蓼互為姐妹類群(PP=1.0),因此,F(xiàn)lora of China將酸模葉蓼歸于蓼組的處理是合理的。值得注意的是,F(xiàn)lora of China定義的蓼屬并非是單系類群,基于葉綠體全基因組序列的最大似然樹顯示金線草屬嵌入在蓼屬中,這與許崇梅等[33]基于ITS構(gòu)建的最大似然樹的結(jié)果是一致的。因此,蓼屬的分類系統(tǒng)和金線草屬的分類地位均有待進一步探討。
4 結(jié)論
酸模葉蓼葉綠體基因組全長159 052 bp,包含128個基因,呈現(xiàn)典型的四分體結(jié)構(gòu);酸模葉蓼的簡單重復(fù)序列組成偏好A/T;酸模葉蓼的葉綠體基因組具有保守性,其trnH和psbA位于LSC區(qū)域;系統(tǒng)進化分析表明,酸模葉蓼與香蓼(Persicaria viscosa)的親緣關(guān)系最接近。
參考文獻:
[1]中國科學院中國植物志編輯委員會. 中國植物志: 第四十卷[M]. 北京: 科學出版社, 1994: 126.
[2]國家中醫(yī)藥管理局《中華本草》編委會. 中華本草-9[M]. 上海: 上??茖W技術(shù)出版社, 1999.
[3]李昌勤, 劉瑜新, 康文藝. 酸模葉蓼和綿毛酸模葉蓼中脂肪酸的研究[J]. 精細化工, 2009, 26(3): 266-268, 287.
[4]魏金鳳, 李昌勤, 常星, 等. 酸模葉蓼提取物對α-葡萄糖苷酶活性影響的研究[J]. 中國藥房, 2010, 21(19): 1731-1733.
[5]趙敏, 王久利, 馬錄花, 等. 桃兒七葉綠體基因組特征及系統(tǒng)發(fā)育分析[J/OL]. 分子植物育種: 1-12[2024-04-30]. https://kns.cnki.net/kcms/detail/46.1068.S.20230221.1122.002.html.
[6]SHINOZAKI K, OHME M, TANAKA M, et al. The complete nucleotide sequence of the tobacco chloroplast genome: its gene organization and expression[J].Embo Journal, 1986, 5(9): 2043-2049.
[7]OHYAMA K, FUKUZAWA H, KOHCHI T, et al. Chloroplast gene organization deduced from complete sequence of liverwort Marchantia polymorpha chloroplast DNA[J]. Nature, 1986, 322: 572-574.
[8]ATTITALLA I H. Modified CTAB method for high quality genomic DNA extraction from medicinal plants[J]. Pakistan Journal of Biological Sciences, 2011, 14(21): 998-999.
[9]BANKEVICH A, NURK S, ANTIPOV D, et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing[J]. Journal of Computational Biology, 2012, 19(5): 455-477.
[10]BOETZER M, PIROVANO W. Toward almost closed genomes with GapFiller[J]. Genome Biology," 2012, 13(6): R56.
[11]SHI L C, CHEN H M, JIANG M, et al. CPGAVAS2, an integrated plastome sequence annotator and analyzer[J]. Nucleic Acids Research, 2019, 47(W1): W65-W73.
[12]KEARSE M, MOIR R, WILSON A, et al. Geneious Basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data[J]. Bioinformatics, 2012, 28(12): 1647-1649.
[13]ALTSCHUL S F, MADDEN T L, SCHFFER A A, et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs[J]. Nucleic Acids Research, 1997, 25(17): 3389-3402.
[14]ZHENG S Y, POCZAI P, HYVNEN J, et al. Chloroplot: an online program for the versatile plotting of organelle genomes[J]. Front Genet, 2020, 11: 576124.
[15]WICKHAM H, NAVARRO D, PEDERSEN T L. Ggplot2: elegant graphics for data analysis[M]. Berlin: Springer Publishing Company, 2009.
[16]BEIER S, THIEL T, MNCH T, et al. MISA-web: a web server for microsatellite prediction[J]. Bioinformatics, 2017, 33(16): 2583-2585.
[17]KURTZ S, CHOUDHURI J V, OHLEBUSCH E, et al. REPuter: the manifold applications of repeat analysis on a genomic scale[J]. Nucleic Acids Research, 2001, 29(22): 4633-4642.
[18]王星璐, 李慧娟, 趙偉, 等. 遠志葉綠體基因組序列特征與系統(tǒng)發(fā)育分析[J]. 中草藥, 2023, 54(11): 3655-3665.
[19]AMIRYOUSEFI A, HYVNEN J, POCAI P. IRscope: an online program to visualize the junction sites of chloroplast genomes[J]. Bioinformatics, 2018, 34(17):3030-3031.
[20]ZHANG D, GAO F L, JAKOVLIC' I, et al. PhyloSuite: an integrated and scalable desktop platform for streamlined molecular sequence data management and evolutionary phylogenetics studies[J]. Molecular Ecology Resources, 2020, 20(1): 348-355.
[21]KURAKU S, ZMASEK C M, NISHIMURA O, et al. ALeaves facilitates on-demand exploration of metazoan gene family trees on MAFFT sequence alignment server with enhanced interactivity[J]. Nucleic Acids Research, 2013, 41(Web Server issue): W22-W28.
[22]KALYAANAMOORTHY S, MINH B Q, WONG T K F, et al. ModelFinder: fast model selection for accurate phylogenetic estimates[J]. Nature Methods, 2017, 14(6): 587-589.
[23]NGUYEN L-T, SCHMIDT H A, VON HAESELER A, et al. IQ-TREE: a fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies[J]. Molecular Biology amp; Evolution, 2015, 32(1): 268-274.
[24]LETUNIC I, BORK P. Interactive Tree Of Life (iTOL) v5: an online tool for phylogenetic tree display and annotation[J]. Nucleic Acids Research, 2021, 49(W1): W293-W296.
[25]吳永飛, 楊雪蓮, 顏麗, 等. 閉鞘姜葉綠體基因組特征及其系統(tǒng)發(fā)育分析[J]. 種子, 2023, 42(4): 10-17, 24, 2.
[26]李魁印, 張海玲, 張鴻, 等. 蕁麻葉綠體基因組密碼子偏好性分析[J]. 種子, 2022, 41(2): 51-58.
[27]王宇, 周俊良, 唐冬梅, 等. 闊葉獼猴桃葉綠體基因組特征及密碼子偏好性分析[J]. 種子, 2020, 39(5): 13-19.
[28]楊亞蒙, 焦健, 樊秀彩, 等. 桑葉葡萄葉綠體基因組及其特征分析[J]. 園藝學報, 2019, 46(4): 635-648.
[29]李倩, 郭其強, 高超, 等. 貴州威寧紅花油茶的葉綠體基因組特征分析[J]. 園藝學報, 2020, 47(4): 779-787.
[30]楊欣超, 張凱權(quán), 王靜, 等. 基于SSR分子標記的刺槐遺傳多樣性分析及核心種質(zhì)的構(gòu)建[J]. 分子植物育種, 2020, 18(9): 3086-3097.
[31]李文勝, 俞樹良, 李志敏, 等. 高山植物擬耬斗菜(Paraquilegia microphylla)的葉綠體全基因組結(jié)構(gòu)特征及其系統(tǒng)地位分析[J/OL]. 分子植物育種: 1-20[2024-04-30]. http://kns.cnki.net/kcms/detail/46.1068.S.20230506.1049.020.html.
[32]ANJEN L, BOJIAN B, ALISA E, et al. Flora of China[M]. Beijing: Science Press, 2003.
[33]許崇梅, 曲暢游, 于文光, 等. 基于ITS序列探討金線草的系統(tǒng)學位置[J]. 廣西植物, 2011, 31(3): 300-303.