徐志超,浦香東,宋經(jīng)元
(中國(guó)醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院 藥用植物研究所/國(guó)家中醫(yī)藥管理局 中藥資源保護(hù)重點(diǎn)研究室,北京 100193)
蛋白激酶和蛋白磷酸酶所介導(dǎo)的可逆磷酸化反應(yīng)在植物信號(hào)傳遞和逆境脅迫響應(yīng)進(jìn)程中發(fā)揮重要調(diào)控作用。蛋白磷酸酶按照底物特異性分為絲氨酸/蘇氨酸蛋白磷酸酶類和酪氨酸蛋白磷酸酶類,PP2蛋白磷酸酶作為絲氨酸/蘇氨酸蛋白磷酸酶類的代表,根據(jù)亞基結(jié)構(gòu)等分為PP2A、PP2B和PP2C 3類[1]。擬南芥Arabidopsisthaliana的PP2CA亞家族已證實(shí)負(fù)調(diào)控ABA信號(hào)通路。化學(xué)遺傳學(xué)和蛋白互作研究揭示PYR/PYL/RCAR復(fù)合體為ABA的受體,當(dāng)ABA信號(hào)缺失時(shí),PP2C通過去磷酸化使SnRK2激酶失去活性;而響應(yīng)ABA信號(hào)時(shí),受體PYR/PYL/RCAR與ABA結(jié)合后抑制PP2C的活性,SnRK2激酶活性釋放并磷酸化下游因子實(shí)現(xiàn)信號(hào)的傳遞及細(xì)胞對(duì)ABA脅迫的響應(yīng)[2-3]。除了ABA信號(hào)途徑,PP2C還參與多種植物信號(hào)轉(zhuǎn)導(dǎo)途徑的調(diào)控,如鉀通道蛋白、MAPK創(chuàng)傷信號(hào)途徑等。擬南芥和水稻基因組分別注釋到80和78個(gè)PP2C家族成員,劃分為13和11個(gè)亞家族,負(fù)調(diào)控的PP2CA亞家族基因響應(yīng)不同的脅迫刺激,如ABA脅迫響應(yīng),而PP2CD亞家族可能正調(diào)控ABA介導(dǎo)的信號(hào)通路[4]?;诨蚪M系統(tǒng)鑒定植物PP2C基因家族,有助于揭示其在植物逆境脅迫下的響應(yīng)機(jī)制。
次生代謝產(chǎn)物是藥用植物主要的藥效成分,同時(shí)次生代謝產(chǎn)物的產(chǎn)生和積累也是植物對(duì)環(huán)境脅迫響應(yīng)的一種適應(yīng)。環(huán)境脅迫影響藥用植物的品質(zhì),因此藥用植物逆境脅迫的分子機(jī)制解析將為中藥材種植環(huán)境及栽培技術(shù)的規(guī)范提供依據(jù),推動(dòng)中藥材可持續(xù)發(fā)展。研究證實(shí)逆境脅迫雖抑制植物生長(zhǎng),但促進(jìn)藥用植物次生代謝產(chǎn)物的合成和積累,適當(dāng)?shù)哪婢趁{迫提升藥用植物的品質(zhì)[5-6]。如適度的干旱脅迫誘導(dǎo)甘草酸合成途徑關(guān)鍵酶基因的上調(diào),并促進(jìn)甘草酸和甘草苷的積累[7];輕度干旱可顯著提高丹參活性成分丹參酮類和丹酚酸類化合物的合成與積累,同時(shí)增強(qiáng)植株對(duì)磷、鉀、鈣、等礦質(zhì)元素的吸收與積累[8]。
丹參為常用大宗藥材,遺傳多樣性豐富,是藥用植物次生代謝研究理想的模式植物[9-12]。不同產(chǎn)地丹參品質(zhì)參差不齊,研究逆境脅迫影響丹參品質(zhì)的分子機(jī)制,將有助于丹參優(yōu)良品種的種植農(nóng)藝措施的改良。本研究基于丹參基因組注釋PP2C基因家族,揭示PP2C在丹參不同組織部位的差異表達(dá)及對(duì)茉莉酸甲酯MeJA信號(hào)的響應(yīng),為丹參逆境脅迫分子機(jī)制的研究奠定基礎(chǔ)。
丹參基因組組裝、注釋及轉(zhuǎn)錄組測(cè)序工作由本課題組完成并已釋放[10]。丹參基因組測(cè)序原始數(shù)據(jù)(Roche 454、PacBio RS、Illumina平臺(tái))以及不同組織器官及處理的轉(zhuǎn)錄組數(shù)據(jù)(Illumina HiSeq2500測(cè)序平臺(tái))已上傳至NCBI的SRA數(shù)據(jù)庫,登錄號(hào):SRX753381、SRR1640458、SRP028388、SRP051564[10-11,13]。
下載擬南芥PP2C基因家族A-L亞家族的蛋白,采用BLASTP比對(duì)丹參基因組蛋白序列,Evalue設(shè)置為1E-5。從基因組數(shù)據(jù)庫中提取所有PP2C序列,根據(jù)NCBI 網(wǎng)站BLASTP比對(duì)的結(jié)果,利用APOLLO軟件校正PP2C成員的CDS、DNA、蛋白序列信息。在蛋白質(zhì)數(shù)據(jù)庫PROSITE(http://prosite.expasy.org/)中分析所有蛋白的保守結(jié)構(gòu)域序列。
將丹參和擬南芥PP2C家族成員的全長(zhǎng)蛋白序列采用MUSCLE做多序列比對(duì),構(gòu)建NJ(Neighbour-Joining)樹,選擇Jones-Taylor-Thornton(JTT)模型,重復(fù)次數(shù)1000次?;贑DS序列及對(duì)應(yīng)基因組序列,利用在線服務(wù)器Gene Structure Display Server(GSDS 2.0)(http://gsds.cbi.pku.edu.cn/index.php)對(duì)基因結(jié)構(gòu)進(jìn)行分析。利用MEME(Suite version 4.9.1)(http://meme-suite.org/)分析PP2C基因家族成員的保守基序,具體參數(shù):E值小于2×10-30,基序重復(fù)次數(shù)不限,氨基酸個(gè)數(shù)10~200個(gè)。提取PP2C家族成員啟動(dòng)子區(qū)1500 bp通過NEW PLACE在線軟件(https://sogo.dna.affrc.go.jp/cgi-bin/)分析順式作用元件。
采用已報(bào)道[10-11,13]的丹參根組織(周皮、韌皮部、木質(zhì)部)、根、莖、葉、花以及MeJA處理的轉(zhuǎn)錄組數(shù)據(jù),通過HISAT2比對(duì)到丹參基因組,通過cufflinks計(jì)算丹參編碼基因的FPKM(Fragments Per Kilobase of exon model per Million mapped reads)值,篩選出PP2C基因的表達(dá)量。FPKM值通過Z-score(Standard score)標(biāo)準(zhǔn)化處理后,采用R語言的gplots下的heatmap來繪制熱圖。采用皮爾森相關(guān)系數(shù)(Pearson’s Correlation Tests,r)分析基因在不同組織部位的共表達(dá)情況。
在丹參基因組中共預(yù)測(cè)到83個(gè)PP2C基因成員,基因數(shù)量與高等植物中已報(bào)道的PP2C基因數(shù)量近乎一致,如擬南芥(80)[4]、水稻Oryzasativa(78)[4]、二穗短柄草Brachypodiumdistachyon(86)[14]、谷子Setariaitalica(80)[15]。丹參PP2C的長(zhǎng)度范圍在145 aa(SMil_00028881)到1048 aa(SMil_00011829),覆蓋基因組的長(zhǎng)度在698 bp(SMil_00028881)到8891 kb(SMil_00011829)。
用丹參和擬南芥PP2C的氨基酸序列構(gòu)建系統(tǒng)發(fā)育樹,根據(jù)擬南芥的亞家族分類,丹參PP2C基因家族被分為13個(gè)亞家族A~L(A、B、C、D、E、F1、F2、G、H、I、J、K、L),各亞家族成員個(gè)數(shù)分別為11、7、6、8、9、6、4、9、5、2、1、7、2個(gè),其中PP2CA亞家族成員數(shù)量最多,如圖1所示。除此之外,6個(gè)成員聚為其他獨(dú)立的分枝,暫未命名。丹參PP2C基因家族成員兩兩比對(duì)計(jì)算同源關(guān)系,發(fā)現(xiàn)PP2CF1亞家族的SMil_00030307和SMil_00028881的同源關(guān)系最近為98.57%,而SMil_00011829(PP2CL)與SMil_00021239(PP2CC)的同源關(guān)系最低為16.46%。
PP2C基因家族的基因結(jié)構(gòu)顯示亞家族內(nèi)和不同亞家族間基因結(jié)構(gòu)差異較大,內(nèi)含子數(shù)量變異較大,其中PP2CL亞家族的SMil_00011829內(nèi)含子數(shù)量最多,為15個(gè)。丹參PP2CA亞家族的11個(gè)成員,命名為SmPP2CA1-SmPP2CA11,內(nèi)含子數(shù)量為2~7個(gè),多數(shù)為3個(gè)內(nèi)含子,基因結(jié)構(gòu)相似,如圖2所示。
PP2CA亞家族各基因氨基酸大小在286~541 aa,等電點(diǎn)在4.78~6.84,分子量大小31~58 kD。對(duì)PP2CA亞家族的11個(gè)基序motif進(jìn)行預(yù)測(cè),Motif 1在11個(gè)亞家族成員中保守存在,大部分PP2CA成員保守存在motif 2、4、5、6、7。PP2A亞家族的系統(tǒng)進(jìn)化分析顯示3個(gè)同源分枝,其中同源分枝2和3的兩對(duì)亞家族成員的基因結(jié)構(gòu)和保守結(jié)構(gòu)域基本相同。
丹參酮是丹參重要的脂溶性活性成分,丹參根及根周皮是丹參酮的合成和積累部位[11]。本研究對(duì)丹參不同組織部位,如根、莖、葉、花、根周皮、根韌皮部和根木質(zhì)部的轉(zhuǎn)錄組數(shù)據(jù)比對(duì)到丹參基因組,計(jì)算FPKM值,將FPKM值用scale函數(shù)做Z-score標(biāo)準(zhǔn)化處理并聚類,如圖3所示。
圖1 丹參PP2C基因家族系統(tǒng)進(jìn)化分析
差異表達(dá)結(jié)果顯示28.91%(24)的基因低表達(dá)(FPKM<10),其中7個(gè)基因顯示沉默表達(dá)(FPKM<1)。丹參根3個(gè)組織部位(周皮、韌皮部、木質(zhì)部)的PP2C基因表達(dá)聚在一起。組織特異性表達(dá)分析發(fā)現(xiàn):PP2CE亞家族的SMil_00028462和SMil_00013051兩個(gè)基因在花中特異表達(dá),可能與花發(fā)育的調(diào)控相關(guān);PP2CE亞家族的SMil_00004715在丹參根周皮特異高表達(dá),在莖、葉、花等器官表達(dá)極低,推測(cè)間接調(diào)控丹參酮的生物合成。3個(gè)PP2CA亞家族基因在丹參組織器官中表達(dá)低(FPKM<10),PP2CA亞家族的同源分枝3的兩個(gè)基因在丹參不同組織部位中表達(dá)最高,且在根、莖、葉、花中表達(dá)差異不顯著,呈共表達(dá)(r=0.81)。茉莉酸甲酯MeJA作為重要的信號(hào)轉(zhuǎn)導(dǎo)因子能夠誘導(dǎo)植物次生代謝產(chǎn)物的產(chǎn)生,在丹參中MeJA能夠正調(diào)控丹參酮的生物合成。對(duì)于丹參葉片MeJA處理12 h后的轉(zhuǎn)錄組數(shù)據(jù),分析丹參PP2C家族成員編碼基因的表達(dá),發(fā)現(xiàn)13個(gè)PP2C基因在MeJA處理下顯著降低,其中包含6個(gè)PP2CA和3個(gè)PP2CK亞家族的基因。PP2CA亞家族同源分枝2的兩個(gè)基因在丹參所有轉(zhuǎn)錄組(不同組織器官及MeJA處理)的表達(dá)中呈顯著共表達(dá)(r=0.95)。
分析丹參PP2CA基因的啟動(dòng)子中的順式作用元件發(fā)現(xiàn):PP2CA的啟動(dòng)子中ABA響應(yīng)元件(ABRE,ACGTGG)均有分布(見表1),大部分啟動(dòng)子區(qū)呈密集分布,與響應(yīng)ABA信號(hào)密切相關(guān);在PP2CA的啟動(dòng)子中富含WRKY、MYB和MYC 3類轉(zhuǎn)錄因子的作用元件(見表1),推測(cè)在響應(yīng)逆境脅迫時(shí)受轉(zhuǎn)錄因子的調(diào)控;干旱和低溫響應(yīng)的元件部分分布。
表1 丹參PP2CA亞家族成員啟動(dòng)子區(qū)順式作用元件分析
注:ABRE、DRE、LTRE代表響應(yīng)ABA信號(hào)、干旱、低溫的作用元件;WRKY、MYB、MYC、GCC代表轉(zhuǎn)錄因子WRKY、MYB、MYC、AP2的結(jié)合元件。
本研究基于丹參全基因組測(cè)序,系統(tǒng)鑒定蛋白磷酸激酶PP2C家族成員,丹參基因組注釋的PP2C基因數(shù)量(83)與已報(bào)道的植物中相似;丹參與擬南芥PP2C序列的系統(tǒng)進(jìn)化顯示丹參PP2C亞組的分類與擬南芥相似,亞家族成員數(shù)量也大多相似,保守結(jié)構(gòu)域相似度高,證明PP2C基因家族及其基因結(jié)構(gòu)在植物中進(jìn)化較為保守。低等維管植物(石松綱)卷柏Selaginellatamariscina[16]中的PP2C基因家族鑒定到46個(gè)成員(未發(fā)表),遠(yuǎn)少于已報(bào)道的高等植物,PP2C在進(jìn)化過程中應(yīng)對(duì)復(fù)雜逆境環(huán)境時(shí)顯著的基因擴(kuò)張反映PP2C基因家族在植物逆境響應(yīng)進(jìn)程中重要的調(diào)控作用。
PP2CA亞家族成員作為ABA的受體之一,負(fù)調(diào)控ABA信號(hào)轉(zhuǎn)導(dǎo)途徑,響應(yīng)多種逆境脅迫,如干旱、低溫等[17-19]。丹參PP2CA基因啟動(dòng)子含有多種逆境脅迫應(yīng)答的順式作用元件如ABRE、DRE、LTRE等,大多數(shù)的PP2CA基因響應(yīng)MeJA信號(hào)轉(zhuǎn)導(dǎo)因子。PP2CA的同源分枝2、3的基因結(jié)構(gòu)相似,motif高度保守,且顯著共表達(dá),推測(cè)為基因組復(fù)制導(dǎo)致的相似或相同功能基因的分化。有報(bào)道指出植物中ABA信號(hào)與花發(fā)育相關(guān),如ABA信號(hào)途徑中一個(gè)正調(diào)控因子ABI4(乙烯響應(yīng)的轉(zhuǎn)錄因子)正調(diào)控開花關(guān)鍵基因FLC的轉(zhuǎn)錄,進(jìn)而負(fù)調(diào)控開花時(shí)間[20]。丹參PP2CE亞家族的兩個(gè)基因在花中特異表達(dá),一個(gè)基因在根中特異高表達(dá),預(yù)測(cè)PP2CE亞家族與植物組織器官發(fā)育相關(guān),如根和花的發(fā)育,但需要進(jìn)一步的實(shí)驗(yàn)驗(yàn)證。
丹參是最常用的大宗藥材之一,生態(tài)適應(yīng)性較強(qiáng),種植面積廣泛分布在華東、華北、西北、西南、中南等地區(qū),野生資源大幅減少,主要來源于人工栽培品,然而不同產(chǎn)地的丹參品質(zhì)差異明顯。研究指出輕度干旱可顯著提高丹參活性成分丹參酮類和丹酚酸類化合物的合成與積累,同時(shí)增強(qiáng)植株對(duì)礦質(zhì)元素的吸收,因此丹參對(duì)不同環(huán)境的適應(yīng)導(dǎo)致活性成分合成和積累的差異,揭示丹參對(duì)逆境脅迫的分子機(jī)制有助于指導(dǎo)丹參優(yōu)良品種的栽培與繁育。丹參PP2C基因家族的系統(tǒng)分析將為丹參響應(yīng)逆境脅迫分子機(jī)制的解析奠定基礎(chǔ),同時(shí)丹參作為藥用模式植物,將對(duì)其他藥用植物的栽培育種及道地性的理解具有指導(dǎo)意義。
[1] Shi Y.Serine/Threonine Phosphatases:Mechanism through Structure[J].Cell,2009,139(3):468-484.
[2] Zhu J K.Abiotic Stress Signaling and Responses in Plants[J].Cell,2016,167(2):313.
[3] Danquah A,Zelicourt A D,Colcombet J,et al.The role of ABA and MAPK signaling pathways in plant abiotic stress responses[J].Biotechnol Adv,2014,32(1):40.
[4] Xue T,Wang D,Zhang S,et al.Genome-wide and expression analysis of protein phosphatase 2C in rice and Arabidopsis[J].BMC Genomics,2008,9(1):550.
[5] 司燦,張君毅,徐護(hù)朝.藥用植物在干旱脅迫下生長(zhǎng)代謝變化規(guī)律及應(yīng)答機(jī)制的研究進(jìn)展[J].中國(guó)中藥雜志,2014,39(13):2432-2437.
[6] 楊枝中,馬逾英,盧曉琳,等.干旱和溫度脅迫在藥用植物研究中的應(yīng)用現(xiàn)狀與展望[J].時(shí)珍國(guó)醫(yī)國(guó)藥,2010,21(5):1223-1225.
[7] 張春榮,桑雪雨,渠萌,等.基于轉(zhuǎn)錄組測(cè)序揭示適度干旱脅迫對(duì)甘草根基因表達(dá)的調(diào)控[J].中國(guó)中藥雜志,2015,40(24):4817-4823.
[8] 劉大會(huì),郭蘭萍,黃璐琦,等.土壤水分含量對(duì)丹參幼苗生長(zhǎng)及有效成分的影響[J].中國(guó)中藥雜志,2011,36(3):321-325.
[9] 宋經(jīng)元,羅紅梅,李春芳,等.丹參藥用模式植物研究探討[J].藥學(xué)學(xué)報(bào),2013(7):1099-1106.
[10] Xu H,Song J,Luo H,et al.Analysis of the genome sequence of the medicinal plantSalviamiltiorrhiza[J].Mol Plant,2016,9(6):949.
[11] Xu Z,Peters R J,Weirather J,et al.Full-length transcriptome sequences and splice variants obtained by a combination of sequencing platforms applied to different root tissues ofSalviamiltiorrhizaand tanshinone biosynthesis[J].Plant J,2015,82(6):951.
[12] Xu Z,Song J.The 2-oxoglutarate-dependent dioxygenase superfamily participates in tanshinone production inSalviamiltiorrhiza[J].J Exp Bot,2017,68(9):2299-2308.
[13] Luo H,Zhu Y,Song J,et al.Transcriptional data mining ofSalviamiltiorrhizain response to methyl jasmonate to examine the mechanism of bioactive compound biosynthesis and regulation[J].Physiol Plantarum,2014,152(2):241.
[14] Cao J,Jiang M,Li P,et al.Genome-wide identification and evolutionary analyses of the PP2C gene family with their expression profiling in response to multiple stresses inBrachypodiumdistachyon[J].BMC Genomics,2016,17(1):175.
[15] 閔東紅,薛飛洋,馬亞男,等.谷子PP2C基因家族的特性[J].作物學(xué)報(bào),2013,39(12):2135-2144.
[16] Banks J A.Selaginella and 400 million years of separation.[J].Annu Rev Plant Biol,2009,60(60):223.
[17] Zelicourt A D,Colcombet J,Hirt H.The Role of MAPK Modules and ABA during Abiotic Stress Signaling[J].Trends Plant Sci,2016,21(8):677.
[18] Zhu J K.Salt and Drought Stress Signal Transduction in Plants[J].Annu Rev Plant Biol,2002,53(53):247.
[19] Schweighofer A,Hirt H,Meskiene I.Plant PP2C phosphatases:emerging functions in stress signaling.[J].Trends Plant Sci,2004,9(5):236-243.
[20] Shu K,Chen Q,Wu Y,et al.ABSCISIC ACID-INSENSITIVE 4 negatively regulates flowering through directly promoting Arabidopsis FLOWERING LOCUS C transcription[J].J Exp Bot,2016,67(1):195.