閆海霞 羅紅梅 李瀅 孫永珍 孫超 錢忠直 陳士林
[摘要] 該研究應用454 GS FLX Titanium高通量測序技術(shù)對5年生草麻黃Ephedra sinica的草質(zhì)莖進行轉(zhuǎn)錄組測序,共獲得48 389條表達序列標簽(express sequence tags,ESTs),序列平均長度為373 bp。所得序列與GenBank中麻黃的EST合并拼接,獲得18 801條一致性序列(unigene)。通過與公共數(shù)據(jù)庫中的序列進行同源性比較分析對所得轉(zhuǎn)錄本進行功能注釋,結(jié)果表明其中56.0%(10 531條)的unigenes與其他生物的已知基因具有一定程度的同源性。進一步分析獲得了19條可能參與麻黃生物堿生物合成的序列(共編碼9個關(guān)鍵酶),97條細胞色素P450序列,以及大量轉(zhuǎn)錄因子序列。該研究為麻黃生物堿類化合物的生物合成研究奠定了基礎,同時為麻黃轉(zhuǎn)錄組學的研究提供了海量數(shù)據(jù),對于麻黃的功能基因組學研究具有重要意義。
[關(guān)鍵詞] 草麻黃; 454 GS FLX; 表達序列標簽(EST); 轉(zhuǎn)錄組
Transcriptome characterization of Ephedra sinica with 454 ESTs
YAN Haixia1,4, LUO Hongmei1, LI Ying1, SUN Yongzhen1, SUN Chao1, QIAN Zhongzhi2*, CHEN Shilin3*
(1. Institute of Medicinal Plant Development, Chinese Academy of Medical Sciences and Peking Union Medical College, Beijing 100193, China;
2. Chinese Pharmacopoeia Commission, Beijing 100061, China;
3. Institute of Chinese Materia Medica, China Academy of Chinese Medical Sciences, Beijing 100700, China;
4. Beijing Institute for Drug Control, Beijing 102206, China)
[Abstract] Using the latest 454 GS FLX platform and Titanium regent, a substantial expressed sequence tag (ESTs) dataset of Ephedra sinica was produced, and the profile of gene expression and function gene of which were investigated. A total of 48 389 reads with an average length of 373 bp were generated. These 454 reads were assembled into 18 801 unigenes, which were all 454 sequencing identified. A total number of 10 531 unigenes(56.0%) were annotated using BLAST searches (Evalue≤1×10-5) against the Nr, Nt, TAIR, SwissProt and KEGG databases. With respect to genes related to ephedrine biosynthesis, 19 unigenes(encoding 9 enzymes) were found. A total of 97 putative genes encoding cytochrome P450s were also discovered. Data presented in this study will provide an important resource for the scientific community that is interested in the functional genomics and secondary metabolism of E. sinica.
[Key word] Ephedra sinica; 454 GS FLX; expressed sequence tags; transcriptome
doi:10.4268/cjcmm20162212
麻黃Ephedra sinica為裸子植物門買麻藤綱Gnetopsida麻黃科Ephedraceae麻黃屬草本狀小灌木。麻黃屬是一類古老的種子植物,自古生代泥盆紀演化至今,繁衍出在形態(tài)結(jié)構(gòu)等方面高度特化的一些類型,同時產(chǎn)生了很多結(jié)構(gòu)特異、生理活性顯著的次生代謝產(chǎn)物。麻黃屬為麻黃科僅有的一個屬,全世界共有67個種,我國有15個種及2個變種,主要分布于我國的內(nèi)蒙古、甘肅、山西、河北、四川、青海等地,生長在沙丘、干草原、丘陵山地、荒灘等干燥地區(qū)。常見的有草麻黃E. sinica、木賊麻黃E. equisetina、中麻黃E. intermedia等[1]。據(jù)藥典記載,麻黃以干燥草質(zhì)莖入藥,具有發(fā)汗平喘宣肺的功效,而麻黃根具有固表止汗的功效[2]。麻黃也是我國特產(chǎn)且聞名世界的一種中藥,早在2 000多年前就用作發(fā)汗和止咳平喘藥,并沿用至今[3]。麻黃堿是麻黃中主要活性成分之一,具有收縮支氣管平滑肌、收縮血管、興奮大腦皮層等作用,因此,對麻黃堿的分析方法及化學合成、麻黃的組織培養(yǎng)等研究較多[49],但對麻黃堿生物合成途徑的研究較為有限。
麻黃基因組及轉(zhuǎn)錄組數(shù)據(jù)的缺乏制約了麻黃堿類化合物的次生代謝研究。表達序列標簽(expressed sequence tags, EST)代表了特定組織和特定時期的基因表達特征,廣泛用于基因識別、新基因的發(fā)現(xiàn)、基因克隆、功能分析、基因作圖等方面[1013]。最近幾年,EST技術(shù)也被應用于藥用植物次生代謝相關(guān)基因的發(fā)掘中,一些重要的藥用植物已建立了EST文庫,如西洋參、丹參、蛇足石杉、甘草等[1417]。以454 GS FLX(454 Life of Science, Roche)為代表的新一代高通量測序技術(shù)應用于轉(zhuǎn)錄組研究,大大降低了測序時間和成本,促進藥用植物轉(zhuǎn)錄組和次生代謝相關(guān)基因的研究高效率開展。
本研究利用454 GS FLX Titanium測序技術(shù)應用于藥用植物麻黃的轉(zhuǎn)錄組研究,試圖從功能基因組水平研究麻黃重要基因的表達并從中發(fā)掘重要的功能基因,旨在為闡明麻黃堿生物合成途徑提供研究基礎,同時也為麻黃生物堿類化合物的生物合成研究奠定了基礎。
1 材料與方法
1.1 材料 草麻黃采自中國醫(yī)學科學院藥用植物研究所藥用植物園,經(jīng)中國醫(yī)學科學院藥用植物研究所林余霖教授鑒定。流水洗凈其草質(zhì)莖,用吸水紙吸干表面水分,迅速將其切成結(jié)節(jié),立即用液氮冷凍,保存于-80 ℃?zhèn)溆谩?/p>
1.2 RNA提取和反轉(zhuǎn)錄 采用通用植物總RNA提取試劑盒(百泰克公司)提取麻黃草質(zhì)莖總RNA,Oligotex mRNA kit(Qiagen)分離純化mRNA。以2 μg mRNA為模板,SMARTTM PCR cDNA Synthesis kit(Clontech)反轉(zhuǎn)錄合成cDNA。采用PCR Advantage Ⅱ polymerase(Clontech)對cDNA進行擴增獲得雙鏈cDNA(ds cDNA),擴增條件為95 ℃,1 min;94 ℃,15 s,65 ℃,30 s;68 ℃,6 min,13個循環(huán)。采用PureLinkTM PCR Purification kit(Invitrogen)去除體系中小于300 bp的ds cDNA片段。
1.3 454文庫構(gòu)建和測序 應用454 GS FLX Titanium對cDNA樣品測序,取5 μg ds cDNA打斷為300~800 bp的片段后,兩端添加特異性銜接子A和B,變性為單鏈連接到磁珠上,經(jīng)油包水 PCR(emPCR)富集后,置于Pico Titer Plate板上,上機測序。
1.4 序列拼接 采用GSFLX Software去除銜接子區(qū)域和低質(zhì)量序列,屏蔽SMART PCR引物。將測序序列與GenBank中的一條麻黃EST序列合并,經(jīng)GS De Novo Assembler Software進行序列拼接。所有分析使用默認參數(shù)。
1.5 功能注釋、分類和代謝途徑分析 使用BLAST程序?qū)⑵唇铀靡恢滦孕蛄校╱nigene)與核酸、蛋白質(zhì)序列數(shù)據(jù)庫比對(E≤1×10-5),并選取最佳注釋。蛋白質(zhì)數(shù)據(jù)庫包括SwissProt,KEGG,擬南芥蛋白質(zhì)組數(shù)據(jù)庫TAIR9和NCBI 非冗余蛋白數(shù)據(jù)庫Nr;核酸數(shù)據(jù)庫為NCBI非冗余核酸數(shù)據(jù)庫Nt。
根據(jù)TAIR9注釋所含Gene Ontology(GO)信息,對序列(按照分子功能、細胞組分、生物學過程)進行分類。根據(jù)KEGG注釋的基因功能信息,對參與次生代謝的序列(按照次生代謝物種類)進行分類。
對所有注釋信息進行整理、搜索麻黃堿類化合物生物合成途徑中的關(guān)鍵酶基因,以及可能參與或調(diào)控次生代謝的細胞色素P450和轉(zhuǎn)錄因子等基因。
2 結(jié)果
2.1 454測序和EST序列拼接 采用454 GS FLX Titanium高通量測序技術(shù)對5年生麻黃草質(zhì)莖的轉(zhuǎn)錄組進行測序,見表1,從1/8 run的測序反應即獲得48 389條讀長序列(reads),序列平均長度為373 bp。將實驗中所得的454 ESTs與GenBank dbEST數(shù)據(jù)庫中的麻黃EST合并,經(jīng)過軟件拼接,共獲得18 801條unigene,包括5 753個序列重疊群(contig)和13 048條單一序列(singleton),unigene總長7.46 Mb,均為由454測序新鑒定的unigene(因為Genbank中只有1條麻黃的EST序列)。
2.2 序列功能注釋 通過BLAST搜索比對,見表2,共有10 531條unigene獲得了基因注釋。根據(jù)擬南芥蛋白質(zhì)組數(shù)據(jù)庫的注釋結(jié)果,被注釋序列大約包含9 752個轉(zhuǎn)錄本。另有8 270條unigene(44.0%)未被注釋。
2.3 EST文庫中的高表達轉(zhuǎn)錄本 Unigene所包含的EST數(shù)目代表了其表達豐度,麻黃草質(zhì)莖中表達豐度最高的前10個轉(zhuǎn)錄本見表3。表達豐度最高的轉(zhuǎn)錄本編碼過氧化氫酶(Catalase3 sp|Q42547|CATA3_ARATH),該酶在藥用植物體內(nèi)參與氨基酸、色氨酸代謝及能量代謝等。表達豐度排在第二位的轉(zhuǎn)錄本編碼碳酸酐酶(Carbonic anhydrase sp|P27141|CAHC_TOBAC),它參與能量代謝和氮代謝,與植物的光合成有關(guān)。其他高表達轉(zhuǎn)錄本包括氧化還原酶家族蛋白、參與糖酵解的果糖二磷酸醛縮酶、半胱氨酸蛋白酶、谷氨酰胺合成酶、硫基蛋白酶、絲氨酸乙醛酸氨基轉(zhuǎn)移酶等。表達豐度最高的前10個轉(zhuǎn)錄本中有4個注釋到已知的酶類。表達豐度位于第8位的轉(zhuǎn)錄本未得到注釋,可能是新基因。
2.4 功能分類研究 通過與擬南芥的蛋白質(zhì)組序列比對,獲得麻黃unigene的GO分類信息。其中,8 926條unigene歸入“分子功能”(molecular function),8 743條歸入“生物學過程”(biological process),8 693條歸入“細胞組分”(cellular component)。在GO分類體系中,分子功能、生物學過程和細胞組分三大類別被劃分為更詳細的45個小類別,這一分類結(jié)果顯示了麻黃草質(zhì)莖基因表達譜的總體特征,見圖1。
2.5 代謝途徑分析 在麻黃草質(zhì)莖EST文庫中,與次生代謝相關(guān)的unigene共130條。根據(jù)KEGG注釋結(jié)果,可將次生代謝途徑按照代謝物分為15類,包括生物堿(alkaloid biosynthesis)、油菜甾醇類(brassinosteroid biosynthesis)、咖啡因(caffeine metabolism)、類胡蘿卜素(carotenoid biosynthesis)、二萜類化合物(diterpenoid biosynthesis)、黃酮和黃酮醇(flavone and flavonol biosynthesis)、類黃酮(flavonoid biosynthesis)、吲哚和吐根生物堿(indole and ipecac alkaloid biosynthesis)、檸檬烯和蒎烯降解(limonene and pinene degradation)、新生霉素生物合成(novobiocin biosynthesis)、苯丙烷類生物合成(phenylpropanoid biosynthesis)、鏈霉素生物合成(streptomycin biosynthesis)、萜類生物合成(terpenoid biosynthesis)、四環(huán)素生物合成(tetracycline biosynthesis)、玉米素生物合成(zeatin biosynthesis)。參與各類次生代謝的unigene數(shù)目見圖2。
麻黃主要藥理活性成分麻黃堿類化合物的生物合成途徑見圖3,麻黃生物堿的生物合成途徑屬于苯丙氨酸/酪氨酸途徑,在圖中以苯丙氨酸的合成及其代謝為麻黃生物堿為例,展示了麻黃生物堿的可能生源途徑。麻黃堿生物合成過程目前仍有幾個關(guān)鍵步驟和相關(guān)酶類未得到闡明,在作者所得到的麻黃EST數(shù)據(jù)中,通過同源性搜索,找到19條unigene可能編碼麻黃堿生物合成途徑的9個關(guān)鍵酶。
2.6 轉(zhuǎn)錄因子分析 轉(zhuǎn)錄因子是一種序列特異的DNA結(jié)合蛋白,在調(diào)節(jié)響應植物發(fā)育和環(huán)境變化過程中的基因表達發(fā)揮了重要作用。在對TAIR9自動預測結(jié)果進行搜索之后,得到109條麻黃的unigene,見表4,它們代表了屬于不同轉(zhuǎn)錄因子家族的同源染色體,包括ARF,AUX/IAA,B3,MYB,basic HelixLoopHelix(bHLH),bZIP,Homeobox,Homeodomainlike/related,pathogenesisrelated/ERF,WRKY和Zinc finger家族蛋白。在麻黃的EST數(shù)據(jù)集中,表達豐度最高的轉(zhuǎn)錄因子家族是CCCH型鋅指蛋白aroD.3脫氫奎尼酸脫水酶 I;aroE.莽草酸脫氫酶;aroK.莽草酸激酶;aroA.3磷酸化莽草1羧基乙烯基轉(zhuǎn)移酶;aroC.分支酸合成酶;E5.4.99.5.分支酸變位酶;E4.2.1.91.羧基環(huán)己二烯基脫水酶;E2.6.1.1.天冬氨酸轉(zhuǎn)氨酶;hisC.組氨酸磷酸轉(zhuǎn)氨酶;E4.3.1.24.笨丙氨酸轉(zhuǎn)氨酶;PTAL.苯丙氨酸/酪氨酸轉(zhuǎn)氨酶。
(zinc finger CCCH)家族,鋅指蛋白是在生物體中廣泛存在的具有典型鋅指結(jié)構(gòu)特征的超蛋白家族,幾乎參與了生物體生長發(fā)育的各個階段,主要分為9類,其中CCCH型鋅指蛋白約占所有鋅指蛋白的0.8%,CCCH鋅指蛋白在生物與非生物脅迫、生長發(fā)育、疾病方面都行使著不同的功能,表明CCCH是一類極具研究價值的鋅指蛋白。此外,在麻黃的EST數(shù)據(jù)集中,生長素響應因子(ARF)的表達豐度也比較高,ARF能夠與生長素反應原件特異性地結(jié)合并調(diào)節(jié)生長素響應基因的表達,在激素介導的生長刺激響應中具有關(guān)鍵作用,這為深入研究生長素的作用機制提供了分子層面的著眼點。從麻黃454EST數(shù)據(jù)集中發(fā)現(xiàn)的這些候選轉(zhuǎn)錄因子將有助于麻黃生長發(fā)育及環(huán)境應答相關(guān)轉(zhuǎn)錄因子的進一步研究。
3 討論
本研究采用454 GS FLX Titanium高通量測序技術(shù)對草麻黃5年生草質(zhì)莖的轉(zhuǎn)錄組進行了測序和功能分析,發(fā)掘其活性次生代謝物生物合成相關(guān)基因。GeneBank已有麻黃EST僅為1條,拼接得到的18 801條unigene,全部為本實驗454測序所得。表明高通測序技術(shù)是大量發(fā)現(xiàn)麻黃功能基因的有效手段。
通過同源性搜索,獲得麻黃堿生物合成相關(guān)轉(zhuǎn)錄本19條,編碼9個關(guān)鍵酶。由于對麻黃堿生物合成研究較少,其生物合成途徑中的2步關(guān)鍵反應(反式肉桂酸鹽苯甲酸酯苯基丙烷二酮)的反應機制及相關(guān)催化酶類尚未得到闡明,因此對麻黃EST文庫的深入研究,將為麻黃堿生物合成研究提供良好的分子生物學研究基礎和研究線索。此外,細胞色素P450家族在麻黃堿類生物合成途徑中具有非常重要的作用,從麻黃EST文庫中,找到97條可能編碼細胞色素P450的unigene,這為篩選參與次生代謝的細胞色素P450酶相關(guān)基因提供了足夠的候選序列。
在麻黃草質(zhì)莖EST文庫中,與次生代謝相關(guān)的unigene共130條,其中與苯丙烷類次生代謝相關(guān)的unigene多達47條,苯丙烷次生代謝途徑通過合成木質(zhì)素、類黃酮等多種次生物質(zhì)而影響植物的許多重要性狀[18],由此推測,麻黃草質(zhì)莖中,除了生物堿類活性成分外,還可能含有較大量的黃酮類和/或木質(zhì)素類;與檸檬烯和蒎烯降解相關(guān)的unigene多達23條,由此推測,麻黃中可能含有揮發(fā)油類。以上推論,得到了麻黃相關(guān)化學成分研究的證明[1921]。表明EST數(shù)據(jù)從分子生物學角度為藥用植物有效成分的研究提供了依據(jù)和研究基礎,這不僅為藥用植物有效成分生物合成途徑關(guān)鍵酶基因的發(fā)現(xiàn)和克隆提供基礎數(shù)據(jù),為麻黃堿生物合成途徑和調(diào)控機制研究奠定基礎,從而使采用生物技術(shù)手段進行有效成分的在體或離體合成成為可能,也可為有效成分的分離分析提供佐證,減少藥用植物化學成分研究的盲目性,并促進其生物學上的復雜行為的進一步深入研究。
[參考文獻]
[1] 南京中醫(yī)藥大學. 中藥大辭典[M]. 2版.上海:上海科學技術(shù)出版社,2006:3092.
[2] 中國藥典.一部[S]. 2010:300.
[3] 洪浩,陳虎彪,徐風,等. 麻黃藥材原植物資源和市場品種調(diào)查[J].中國中藥雜志,2010,38(2):51.
[5] 沈少林,陳勇. 麻黃生物堿類化合物電噴霧電離質(zhì)譜[J]. 湖北大學學報:自然科學版,2004,26(4):330.
[6] 劉罡,陳德軍,王吉德,等. 鹽酸L麻黃堿異構(gòu)化為鹽酸D偽麻黃堿的反應機理探討[J]. 應用化學,2008,25(2):173.
[7] 胥秀英,鄭一敏,溫壽禎,等. 左旋麻黃素半生物合成研究(Ⅰ) L2苯基乙酰基甲醇生物合成條件研究[J]. 中國中藥雜志,2001,26(2):119.
[8] 賴陳武,劉穎,李艾蓮. 麻黃離體培養(yǎng)研究進展[J]. 世界科學技術(shù)——中醫(yī)藥現(xiàn)代化,2003,5(2):37.
[9] 陳書安,趙兵. 麻黃植物細胞工程的關(guān)健技術(shù)及研究進展[J]. 世界科學技術(shù)——中醫(yī)藥現(xiàn)代化,2006,8(5):54.
[11] 陳求全,詹先進,藍家祥. EST分子標記在基因組學中應用的研究進展[J]. 中國農(nóng)學通報,2010,26(3):59.
[12] 呂桂云,張海英,郭紹貴. 表達序列標簽(EST)分析方法及在植物抗病研究中的應用[J]. 中國農(nóng)學通報,2010,26(8):56.
[13] 吳春穎,宋經(jīng)元,陳士林. 表達序列標簽在藥用植物研究中的應用[J]. 中草藥, 2008, 39(5):778.
[14] Sun C, Li Y, Wu Q, et al. De novo sequencing and analysis of the American ginseng root transcriptome using a GS FLX Titanium platform to discover putative genes involved in ginsenosidebiosynthesis[J]. BMC Genomics, 2010, 11:262.
[15] 李瀅,孫超,羅紅梅, 等. 基于高通量測序454 GS FLX的丹參轉(zhuǎn)錄組學研究[J]. 藥學學報,45(4):524.
[16] Luo H, Li Y, Sun C, et al. Comparison of 454ESTs from Huperzia serrata and Phlegmariurus carinatus reveals putative genes involved in lycopodium alkaloid biosynthesis and developmental regulation[J]. BMC Plant Biology, 2010, 10:209 .
[17] Li Y, Luo HM, Sun C, et al. EST analysis reveals putative genes involved in glycyrrhizin biosynthesis[J]. BMC Genomics, 2010, 11:268.
[18] 鐘巍然, 柴友榮, 張凱, 等. 苯丙烷代謝途徑中細胞色素 P450的研究[J]. 安徽農(nóng)業(yè)科學. 2008, 36(13):5285.
[19] 周玲, 吳德康, 唐于平, 等. 麻黃中化學成分研究進展[J]. 南京中醫(yī)藥大學學報, 2008, 24(1):71.
[20] 吳海, 易倫朝, 高敬銘, 等. 野生與人工栽培麻黃不同部位成分的比較研究[J]. 中草藥,2007, 38(9):1298.
[21] 張連茹, 鄒國林, 楊天鳴. 麻黃的化學研究進展[J]. 中南民族學院學報:自然科學版, 2000, 19(3):87.
[責任編輯 孔晶晶]