李 瀅,姚 輝,宋經(jīng)元,任風(fēng)鳴,李西文,孫 超**
(1.中國(guó)醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院 藥用植物研究所 北京 100193;2.中國(guó)中醫(yī)科學(xué)院中藥研究所 北京 100700)
基于葉綠體全基因組的貝母屬特異性DNA條形碼的篩選*
李 瀅1,姚 輝1,宋經(jīng)元1,任風(fēng)鳴1,李西文2,孫 超1**
(1.中國(guó)醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院 藥用植物研究所 北京 100193;2.中國(guó)中醫(yī)科學(xué)院中藥研究所 北京 100700)
本研究通過(guò)對(duì)貝母屬4個(gè)物種葉綠體基因組進(jìn)行全局分析,分別查找基因區(qū)域和基因間區(qū)的高變異區(qū)域,篩選用于高效鑒別貝母屬植物的新DNA條形碼序列。相關(guān)研究發(fā)現(xiàn)貝母屬植物的基因區(qū)域序列相似度極高,不適用于DNA條形碼鑒定研究;共有7個(gè)基因間區(qū)可以作為潛在的貝母屬植物鑒定的特異性DNA條形碼。本研究所構(gòu)建的DNA條形碼篩選方法,為篩選用于難鑒定科屬的新的DNA條形碼提供了通用的方法體系。
貝母屬 葉綠體基因組 DNA條形碼 分子鑒定
貝母屬Fritillaria是百合科Liliaceae中的一個(gè)大屬,據(jù)電子植物志***記載,貝母屬共有約130個(gè)物種,主要分布在亞洲和地中海等北半球溫帶地區(qū)。中國(guó)有貝母屬植物24種及其4個(gè)變種,其中15個(gè)種為中國(guó)的特有物種。貝母屬藥材以干燥鱗莖入藥,具有“清熱潤(rùn)肺、化痰止咳”的功效,藥用歷史悠久[1]。2010版《中國(guó)藥典》收錄的貝母屬藥材包括川貝母、平貝母、浙貝母、伊貝母、湖北貝母[1]。貝母是典型的多基源藥材,以川貝母FRITILLARIAE CIRRHOSAE BULBUS為例,藥典共收錄的6個(gè)物種分別為川貝母F. cirrhosa,暗紫貝母F. unibracteata,甘肅貝母F. przewalskii,梭砂貝母F. delavayi,太白貝母F. taipaiensis,和瓦布貝母F. unibracteata var. wabuensis。據(jù)統(tǒng)計(jì),《中國(guó)藥典》涉及貝母屬物種共11個(gè)。目前,已有研究表明,貝母屬植物可能是處于激烈分化的物種形成階段,部分物種的分類存在很多爭(zhēng)議,同一物種在不同地區(qū)因植物形態(tài)和花部特征出現(xiàn)差異,而被劃分為不同物種[2,3]。由于貝母屬植物的這些特性,其形態(tài)學(xué)鑒定和現(xiàn)有分子鑒定都存在一定的困難。另外,由于貝母屬藥材市場(chǎng)需求量大,川貝母的價(jià)格昂貴等原因,貝母屬藥材的使用長(zhǎng)期存在混偽品濫用的情況,這直接影響了貝母屬植物臨床用藥的安全和療效。因此,開展貝母屬藥材的鑒定研究,篩選高效鑒定貝母屬植物的DNA條形碼序列,對(duì)于貝母屬藥材的臨床用藥、質(zhì)量控制以及合理開發(fā)利用具有重要意義。
DNA條形碼(DNA Barcode)是指生物體內(nèi)能夠代表該物種的、標(biāo)準(zhǔn)的、有足夠變異的、易擴(kuò)增且相對(duì)較短的DNA片段[4-6]。目前,公認(rèn)較為高效的植物DNA條形碼序列包括核基因組的ITS和ITS2序列與葉綠體基因組的psbA-trnH,rbcL,matK,psbK-psbI,atpF-atpH等[7,8]。已有研究表明,在藥用植物豐富的多個(gè)大科中,DNA 條形碼具有良好鑒定效果的有菊科[9]、薔薇科[10]、豆科[11]等。但對(duì)貝母屬植物DNA條形碼的研究顯示,ITS2序列不能將貝母屬植物準(zhǔn)確鑒定到“種”[3]。因此,篩選高效的貝母屬特異性DNA條形碼對(duì)貝母屬藥材的鑒定具有重要的應(yīng)用價(jià)值。
國(guó)際條形碼協(xié)會(huì)認(rèn)可核基因組序列ITS和ITS2在植物DNA條形碼鑒定中的潛力,但同時(shí)指出要警惕操作過(guò)程中的真菌污染問(wèn)題[12]。采用葉綠體基因組片段作為植物DNA條形碼可以很好的避免此問(wèn)題。因此,篩選葉綠體基因片段作為新的DNA條形碼仍然是植物分子鑒定的研究熱點(diǎn)之一。隨著新一代測(cè)序技術(shù)不斷發(fā)展,獲得葉綠體全基因組序列的技術(shù)不斷改進(jìn)[13]。本文從葉綠體全基因組角度,篩選貝母屬潛在的特異性DNA條碼序列,該研究結(jié)果可較大提高篩選效率。
1.1 葉綠體基因組前期研究數(shù)據(jù)
本課題組前期工作獲得4條貝母屬植物葉綠體全基因組數(shù)據(jù),分別為川貝母F. cirrhosa(KF769143)[13]、湖北貝母F. hupehensis(KF712486)[13]、太白貝母 F. taipaiensis(KF769144)[13]和瓦 布貝 母 F. unibracteata var. wabuensis(KF769142)[14]。后續(xù)的分析采用GenBank格式序列及注釋文件。
1.2 數(shù)據(jù)分析
編寫本地程序,提取4條貝母屬植物葉綠體基因組的基因和基因間區(qū)序列,比較4個(gè)物種葉綠體基因在葉綠體基因組上的排列順序是否一致,應(yīng)用clustalw2對(duì)每個(gè)相同的基因區(qū)域和基因間區(qū)分別做多序列比對(duì)(Multiple Sequence Alignment),分別計(jì)算每個(gè)基因區(qū)域和基因間區(qū)的序列相似度,篩選序列相似度較低的區(qū)域,即高變異區(qū)域作為潛在的新DNA條形碼,人工檢查新DNA條形碼比對(duì)結(jié)果,最終確定適合貝母屬鑒定的特異性DNA條形碼。
2.1 葉綠體基因組基因區(qū)域和基因間區(qū)序列的獲取
4條貝母屬葉綠體基因組上基因順序是一致的,每個(gè)葉綠體基因組編碼136個(gè)基因,包括編碼基因90個(gè)、tRNA基因38個(gè)和rRNA基因8個(gè),基因區(qū)總長(zhǎng)約110 kb(包含內(nèi)含子序列)。
根據(jù)基因在葉綠體基因組上的排列順序,獲取基因間區(qū)序列。序列提取過(guò)程中可發(fā)現(xiàn)兩種特例:①一些包含多個(gè)外顯子的基因,其內(nèi)含子區(qū)域包含其他基因,如trnK基因的兩個(gè)外顯子被matK基因間隔成兩段;rps12基因的兩個(gè)區(qū)段分別位于葉綠體基因組的大拷貝區(qū)域和反向重復(fù)區(qū),中間包含了多個(gè)其他的基因。此種情況需提取外顯子區(qū)域間的序列做后續(xù)比對(duì)分析;②兩個(gè)相鄰的基因中間沒有間隔或者有部分重疊,這種情況下就會(huì)缺少該位點(diǎn)的基因間區(qū)。例如ycf1和ndhF兩個(gè)基因之間為0 bp。最后,每個(gè)葉綠體基因組各獲得130個(gè)基因間區(qū)域序列片段,總長(zhǎng)約為42 kb。
2.2 葉綠體基因組基因區(qū)域比對(duì)結(jié)果
應(yīng)用clustalw2軟件對(duì)4個(gè)物種同一基因序列進(jìn)行多序列比對(duì)分析,共得到136個(gè)比對(duì)結(jié)果。其中,56個(gè)基因?qū)?yīng)的比對(duì)結(jié)果相似性為100%,21個(gè)基因?qū)?yīng)的比對(duì)結(jié)果只有一個(gè)位點(diǎn)的差異,無(wú)法用于篩選DNA條形碼。將剩余比對(duì)結(jié)果按照序列相似性由小到大排列,表1展示的是貝母屬植物變異度最高的20個(gè)葉綠體基因,由表中數(shù)據(jù)可以看出,除了ycf15基因外,貝母屬物種的葉綠體基因區(qū)序列高度相似。ycf15基因差異較大的原因是瓦布貝母的ycf15(231 bp)基因有一個(gè)140 bp片段的丟失,剩余91 bp片段在4個(gè)物種中的相似度為100%。綜上所述,在葉綠體基因區(qū)域很難篩選到鑒定貝母屬物種的特異性DNA條形碼。
2.3 葉綠體基因組基因間區(qū)比對(duì)結(jié)果
應(yīng)用clustalw2分別對(duì)130個(gè)基因間區(qū)序列做多序列比對(duì)分析,去除相似性為100%、只有1個(gè)位點(diǎn)差異的比對(duì)結(jié)果,剩余79個(gè)比對(duì)結(jié)果可用于篩選DNA條形碼。將備選基因間區(qū)序列按照序列的相似性排列,發(fā)現(xiàn)基因間區(qū)的序列相似性比基因區(qū)域序列相似性低,但可能由于貝母屬各物種間親緣關(guān)系很近,或者由于貝母屬植物葉綠體進(jìn)化緩慢,整體比對(duì)結(jié)果的相似性仍較高(表2)。
表2 貝母屬植物變異度最高的20個(gè)葉綠體基因間區(qū)
表3 貝母屬特異性DNA條形碼候選片段
2.4 根據(jù)比對(duì)結(jié)果篩選貝母屬特異性DNA條形碼
對(duì)于一個(gè)高效的DNA條形碼序列,除了需要滿足變異度足以區(qū)分不同物種的需求之外,還需要滿足PCR擴(kuò)增和PCR產(chǎn)物測(cè)序的實(shí)驗(yàn)要求。因此,序列長(zhǎng)度也是需要考慮的篩選因素之一。本研究篩選出7個(gè)比對(duì)長(zhǎng)度在300-700 bp之間,序列相似性< 97%的基因間區(qū)作為貝母屬特異性DNA條形碼的候選片段(表3)。對(duì)這7個(gè)區(qū)域的多序列比對(duì)結(jié)果逐一人工查看,檢測(cè)是否存在其中2條序列相似性為100%的情況。如圖1所示,trnP-psaJ基因間區(qū)比對(duì)結(jié)果顯示每個(gè)物種的該段序列都存在其特異性變異位點(diǎn),僅從生物信息分析的角度,該序列片段能很好的區(qū)分已有4種貝母屬植物。因基因區(qū)序列保守性非常高,可在基因間區(qū)兩段的保守序列上設(shè)計(jì)擴(kuò)增引物。
貝母屬植物是清熱潤(rùn)肺的傳統(tǒng)名貴藥材,具有十分重要的臨床應(yīng)用價(jià)值和商業(yè)價(jià)值。雖然,電子植物志efloras.org目前收錄貝母屬植物“種”數(shù)和“變種”僅為28種。但是,最近的研究發(fā)現(xiàn)了貝母屬眾多新種和新變種,中國(guó)的國(guó)產(chǎn)貝母屬植物種數(shù)已達(dá)80個(gè),“變種”數(shù)已達(dá)52個(gè)[2]。由于多種貝母屬植物藥材含多個(gè)基源且貝母屬物種基數(shù)龐大,使得貝母類藥材在使用、質(zhì)量控制乃至生產(chǎn)流通等諸多領(lǐng)域面臨困難。貝母屬植物形態(tài)學(xué)鑒定和DNA條形碼鑒定研究表明,目前的鑒定方法還不能將貝母屬植物準(zhǔn)確鑒定到“種”[3]。
本研究從葉綠體基因組的全局角度分析,篩選葉綠體上的高變異區(qū)段作為DNA條形碼篩選的候選區(qū)段。在圖2展示了根據(jù)4個(gè)貝母屬植物葉綠體基因組多序列比對(duì)結(jié)果獲得的高變異區(qū)域??梢园l(fā)現(xiàn),葉綠體基因組上存在多個(gè)高變異區(qū)域。對(duì)于篩選DNA條形碼,不僅需要考慮序列的變異程度,還需要綜合多方面因素,如序列長(zhǎng)度、PCR擴(kuò)增成功率、測(cè)序成功率、序列中是否含有poly結(jié)構(gòu)等。為了驗(yàn)證本研究所篩選的DNA條形碼在貝母屬物種中的鑒定效率,還需收集更多的貝母屬物種,再通過(guò)常規(guī)DNA條形碼研究方法,確定最終的貝母屬特異性DNA條形碼。常規(guī)DNA條形碼研究方法包括引物設(shè)計(jì)、DNA提取、PCR擴(kuò)增、測(cè)序、計(jì)算種內(nèi)種間變異、構(gòu)建系統(tǒng)聚類樹等一系列的步驟。本研究所建立的方法體系,不僅適用于貝母屬植物的DNA條形碼篩選研究,對(duì)于其他難鑒定科屬也同樣適用。
圖1 使用clustalw 2對(duì)trnP-psaJ基因間區(qū)進(jìn)行多序列比對(duì)
圖2 4個(gè)貝母屬葉綠體基因組高變異區(qū)域分布
1 國(guó)家藥典委員會(huì).中華人民共和國(guó)藥典(一部). 北京:中國(guó)醫(yī)藥科技出版社, 2010: 72-73.
2 肖培根,姜艷,李萍,等.中藥貝母的基原植物和藥用親緣學(xué)的研究.植物分類學(xué)報(bào), 2007, 45(4): 473-487.
3 羅焜,馬培,姚輝,等.基于ITS2序列鑒定川貝母及其混偽品基原植物.世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化, 2012, 14(1): 1153-1158.
4 陳士林,姚輝,宋經(jīng)元,等.基于DNA barcoding(條形碼)技術(shù)的中藥材鑒定.世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化, 2007, 9(3): 7-12.
5 Li D Z, Liu J Q, Chen Z D, et al. Plant DNA barcoding in China. J Syst Evol, 2011, 49(3): 165-168.
6 Li M, Cao H, But P P, et al. Identification of herbal medicinal materials using DNA barcodes. J Syst Evol, 2011, 49(3): 271-283.
7 CBOL Plant Working Group. A DNA barcode for land plants. Proc Natl Acad Sci USA, 2009, 106(31): 12794-12797.
8 陳士林,龐曉慧,姚輝,等.中藥DNA條形碼鑒定體系及研究方向.世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化, 2011, 13(5): 747-754.
9 Gao T, Yao H, Song J Y, et al. Evaluating the feasibility of using candidate DNA barcodes in discriminating species of the large Asteraceae family. BMC Evol Biol, 2010, 10: 324.
10 Pang X H, Song J Y, Zhu Y J, et al. Applying plant DNA barcodes for Rosaceae species identification. Cladistics, 2011, 27: 165-170.
11 Gao T, Yao H, Song J Y, et al. Identification of medicinal plants in the family Fabaceae using a potential DNA Barcode ITS2. J Ethnopharmacol, 2010, 130(1): 116-121.
12 劉宇婧,劉越,黃耀江,等.植物DNA條形碼技術(shù)的發(fā)展及應(yīng)用.植物資源與環(huán)境學(xué)報(bào), 2011, 20(1): 74-82,93.
13 Li Q, Li Y, Song J, et al. High-accuracy de novo assembly and SNP detection of chloroplast genomes using a SMRT circular consensus sequencing strategy. New Phytol, 2014, 204(4): 1041-1049.
14 Li Y, Li Q, Li X, et al. Complete chloroplast genome sequence of Fritillaria unibracteata var. wabuensis based on SMRT Sequencing Technology. Mitochondrial DNA, 2015, 15: 1-2.
參考文獻(xiàn)
Screening Fritillaria Genus-specific DNA Barcodes Based on Complete Chloroplast Genome Sequences
Li Ying1, Yao Hui1, Song Jingyuan1, Ren Fengming1, Li Xiwen2, Sun Chao1
(1. Institute of Medicinal Plant Development, Chinese Academy of Medical Sciences & Peking Union Medical College, Beijing 100193, China; 2. Institute of Chinese Materia Medica, China Academy of Chinese Medical Sciences, Beijing 100700, China)
This study was aimed to find the Fritillaria genus-specific DNA barcodes through the comparison of the complete chloroplast genomes of 4 Fritillaria species. According to the results of multiple sequencing alignment (MSA), the high variation regions were located, which could be used as the potential DNA barcodes. The study showed that there were high similarities on the identities of gene regions, which were not applicable to the DNA barcoding identification. There were 7 intergenic regions, which can be used as the potential Fritillaria genus-s pecific DNA barcodes. The method established in this study for screening new DNA barcodes was a universal method. It can be used in the screening of other new DNA barcoding for the genera and families containing species which were difficult to be identified.
Fritillaria, chloroplast genome, DNA barcoding, molecular identification
10.11842/wst.2016.01.004
R931.5
A
(責(zé)任編輯:馬雅靜 張志華,責(zé)任譯審:王 晶)
2015-06-16
修回日期:2015-12-01
* 國(guó)家自然科學(xué)基金委青年科學(xué)基金項(xiàng)目(81503199):基于第三代單分子測(cè)序技術(shù)的科屬特異性DNA條形碼研究,負(fù)責(zé)人:李瀅;中國(guó)醫(yī)學(xué)科學(xué)院協(xié)和青年基金中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目(3332015144):基于單分子測(cè)序技術(shù)的增強(qiáng)型DNA條形碼研究,負(fù)責(zé)人:李瀅。
** 通訊作者:孫超,研究員,博士生導(dǎo)師,主要研究方向:藥用植物功能基因組學(xué)。
*** http://efloras.org/