張傳明,張寶會,姚新轉(zhuǎn),呂立堂,※
(1.貴州大學(xué)生命科學(xué)學(xué)院,貴州 貴陽 550025;2.農(nóng)業(yè)生物工程研究院,山地植物資源保護與保護種質(zhì)創(chuàng)新教育部重點實驗室,山地生態(tài)與農(nóng)業(yè)生物工程協(xié)同創(chuàng)新中心,貴州 貴陽 550025;3.貴州大學(xué)茶學(xué)院,貴州 貴陽 550025)
杜仲(Eucommia ulmoides)是杜仲科(Eucommiaceae)杜仲屬(Eucommia)多年生落葉喬木,具有豐富的藥用價值和研究價值[1]。研究發(fā)現(xiàn),杜仲的根須、幼莖、嫩葉、雌雄花、果皮、果肉和樹皮等組織器官含有種類繁多的活性物質(zhì),是一種用途廣泛的中藥材,具有滋肝養(yǎng)腎、調(diào)節(jié)血壓和降脂減肥等作用[2-5]。杜仲抵御外界環(huán)境脅迫和生物脅迫從第三紀(jì)存活至今[6],可能與其獨特的代謝產(chǎn)物和逆境下基因選擇表達(dá)密切相關(guān),而轉(zhuǎn)錄因子是調(diào)控這些作用機制的重要途徑。目前已經(jīng)發(fā)現(xiàn)許多與植物生長調(diào)節(jié)和抗逆性相關(guān)的轉(zhuǎn)錄因子[7],其中GRAS(gibberellic acid insensitive-repressor of gibberellic acid insensitive-scarecrow)基因作為與植物生長調(diào)控和抗逆性調(diào)節(jié)相關(guān)的古老轉(zhuǎn)錄因子[4],已在水稻(Oryza sativa L.)[8]、擬南芥[Arabidopsis thaliana(L.)Heynh.][9]、大麥(Hordeum vulgare L.)[10]、陸地棉(Gossypium hirsutum Linn.)[11]、黃瓜(Cucumis sativus L.)[12]、煙草(Nicotiana tabacum L.)[13]、楊樹(Populus L.)[14]、玉米(Zea mays Linn.)[15]、大豆[Glycine max(Linn.)Merr.][16]和番茄(Solanum lycopersicum Mill)[17]等植物中進(jìn)行了基因家族分析,但其在杜仲中的功能作用尚待研究。
GRAS基因家族成員其蛋白序列的C端高度同源,根據(jù)GRAS基因家族成員N端的長度和序列的差異性可將其劃分為多個亞族,包括調(diào)控根輻射形態(tài)的形成與發(fā)育及葉、芽發(fā)育的互作蛋白SCR(scarecrow)和SHR(short-root)[18],受赤霉素、茉莉酸和光信號影響調(diào)控植物生長發(fā)育并對植物逆境脅迫起重要調(diào)節(jié)作用的DELLA[19],參與赤霉素/DELLA調(diào)控途徑并和SHR/SCR協(xié)同調(diào)控根部細(xì)胞的伸長與分裂的SCL3(scarecrow-like 3)[20],調(diào)控植物頂端分生組織分化的SCL4/7(scarecrow-like 4/7)[21],影響植物發(fā)育并提高抗旱性的LAS(lateral suppressor)[22]、控制分生組織發(fā)育及調(diào)控干細(xì)胞穩(wěn)態(tài)的HAM(hairy meristem)[23],受DELLA蛋白調(diào)控參與赤霉素信號介導(dǎo)并與SCL蛋白互作調(diào)控光敏色素信號通路轉(zhuǎn)導(dǎo)的PAT1(phyto-chrome a signal transduction 1)[24],在水稻中發(fā)現(xiàn)的Os4(osgras4)和可以調(diào)節(jié)籽粒形態(tài)的Os19(osgras19)[25],調(diào)控有絲分裂周期和分裂平面取向的SCL28(scarecrow-like 28)[26]、干旱/滲透脅迫有關(guān)的SCL9(scarecrow-like 9)[27]以及楊樹中特有的Pt20(ptgras20)[14]等多個亞族,同時發(fā)現(xiàn),在不同植物中GRAS基因家族的成員具有明顯差異。例如在擬南芥中鑒定到分布在5條染色體上8個分支的33個家族成員,其表現(xiàn)出明顯的組織特異性;在陸地棉中鑒定到隸屬于14個亞族中的150個家族成員,其家族成員在逆境條件下的表達(dá)出現(xiàn)了差異;在黃瓜中鑒定到分屬10個類群的37個家族成員,其部分家族成員對低溫脅迫具有明顯的響應(yīng);在煙草中鑒定到了8個亞族中的21個家族成員;在楊樹中鑒定到了13個亞族中的106個家族成員;在玉米中鑒定到了8個亞族中的86個家族成員,其表達(dá)量在不同組織出現(xiàn)了明顯的差異性;在大豆中鑒定到了位于20條染色體上,隸屬于11個亞族的117個家族成員,其過表達(dá)可以提高大豆抵御干旱和鹽脅迫的能力;在番茄中則鑒定到了位于19條染色體上,隸屬于13個亞族的53個家族成員[9-17],同時,研究發(fā)現(xiàn)VHIID結(jié)構(gòu)域是GRAS基因家族高度保守的結(jié)構(gòu)域[28],其可能在細(xì)胞信號傳遞中起重要作用[29]。
通過對杜仲中GRAS基因家族進(jìn)行系統(tǒng)性的分析,為探索杜仲抵御外界生存壓力的作用機制奠定了基礎(chǔ),這對于杜仲種質(zhì)資源的利用和其他瀕危植物的保護具有重要意義。
首先,從杜仲基因組數(shù)據(jù)庫(https://bigd.big.ac.cn/gwh/Assembly/13/show)、擬南芥基因組數(shù)據(jù)庫(https://www.arabidopsis.org)、番茄基因組數(shù)據(jù)庫(https://solgenomics.net)和植物基因組數(shù)據(jù)庫(http://www.phytozome.net)獲得杜仲、擬南芥和番茄的全基因組信息,包括CDS序列、蛋白序列及相應(yīng)的注釋文件等數(shù)據(jù),隨后,通過軟件TBtools使用擬南芥、番茄的GRAS蛋白與杜仲的蛋白序列數(shù)據(jù)庫進(jìn)行本地BLASTp比對(閾值為E<10-5),從Pfam(http://pfam.xfam.org)中下載GRAS基因特有的保守結(jié)構(gòu)域模型(PF03514),接著利用保守結(jié)構(gòu)域(PF03514)隱馬爾可夫模型進(jìn)行二次搜索鑒定,同時刪除長度低于100 aa的氨基酸序列后將蛋白序列信息提交至NCBI-CDD(https://www.ncbi.nlm.nih.gov/cdd/)以及Pfam(http://pfam.xfam.org)進(jìn)行保守結(jié)構(gòu)域的鑒定,隨后利用ExPASy(https://web.expasy.org/protparam/)網(wǎng)站對杜仲GRAS基因蛋白質(zhì)的分子質(zhì)量、等電點和氨基酸長度等理化信息進(jìn)行分析預(yù)測。
重新命名獲得的杜仲GRAS基因家族成員,使用Muscle程序,采用默認(rèn)設(shè)置進(jìn)行多序列比對。使用MEGA7.0的ML(maximum likelihood)方法構(gòu)建了GRAS基因家族的系統(tǒng)發(fā)育樹,設(shè)置為1000次自舉測試。
將杜仲GRAS與擬南芥中的32種GRAS蛋白和番茄中53種GRAS蛋白同時使用Muscle程序,采用默認(rèn)設(shè)置進(jìn)行多序列比對,隨后通過NJ(neighbourjoining)方法使用MEGA7.0構(gòu)建了GRAS基因家族的系統(tǒng)發(fā)育樹,并進(jìn)行了1 000次自舉測試[17],使用R語言的ggtree包可視化進(jìn)化樹。
基因保守基序(motif)通過在線軟件MEME5.2分析獲得,基因結(jié)構(gòu)使用TBtools從杜仲注釋文件中獲得,使用TBtools將進(jìn)化樹,保守結(jié)構(gòu)域,保守基序,基因結(jié)構(gòu)可視化。
通過Muscle程序?qū)﹁b定到的杜仲的GRAS基因家族蛋白的VHIID結(jié)構(gòu)域進(jìn)行了比較分析,使用Jalview軟件可視化。
本研究中一共獲得47個符合要求的杜仲GRAS基因,由于杜仲基因組尚未進(jìn)行染色體定位,無法獲得相應(yīng)的染色體組信息,因此按照軟件輸出結(jié)果順序依次命名為EuGRAS1~EuGRAS47。
GRAS基因家族成員蛋白理化信息(表1)分析顯示,47個EuGRAS基因家族成員全部為親水性蛋白,除EuGRAS28、EuGRAS35和EuGRAS3外其余蛋白穩(wěn)定性較差,其等電點分布在4.49~9.67之間,其中有40個蛋白呈酸性(蛋白長度為388~803 aa),7個蛋白呈堿性(蛋白長度為419~631 aa)。進(jìn)一步的分析發(fā)現(xiàn)預(yù)測為酸性的蛋白中有6個表現(xiàn)為較強的酸性(EuGRAS9、EuGRAS11、EuGRAS15、EuGRAS23、EuGRAS38、EuGRAS42),其蛋白長度為454~666 aa;預(yù)測為堿性的蛋白中有3個表現(xiàn)為較強的堿性(EuGRAS20、EuGRAS29、EuGRAS36),其蛋白長度為502~598 aa。EuGRAS蛋白親水性、不穩(wěn)定性和酸堿差異性可能是杜仲抵御外界脅迫的體現(xiàn)。
表1 杜仲基因家族蛋白理化性質(zhì)預(yù)測Table 1 Prediction of physicochemical properties offamily proteins in
表1 杜仲基因家族蛋白理化性質(zhì)預(yù)測Table 1 Prediction of physicochemical properties offamily proteins in
總平均親水性(GRAVY)Grand average of hydropathicity EUC18214-RA EuGRAS1 1 388 42 987 5.6 42.69 90.28 -0.15 EUC13097-RA EuGRAS2 1 400 45 133.8 6.42 51.00 94.69 -0.21 EUC16448-RA EuGRAS3 1 413 46 743.6 5.05 38.43 84.05 -0.29 EUC25867-RA EuGRAS4 1 419 47 200.2 7.97 47.24 91.70 -0.21 EUC03957-RA EuGRAS5 1 426 46 338.2 5.32 53.46 96.24 -0.05 EUC21002-RA EuGRAS6 1 431 48 052.3 6.09 45.31 91.67 -0.12 EUC12459-RA EuGRAS7 2 432 47 812.7 5.67 50.35 90.28 -0.20 EUC00991-RA EuGRAS8 1 447 50 054.6 5.04 49.86 94.69 -0.05 EUC16090-RA EuGRAS9 4 454 50 900.3 4.83 47.33 63.93 -0.70 EUC01903-RA EuGRAS10 1 463 52 992 7.8 41.54 87.21 -0.45 EUC03251-RA EuGRAS11 1 469 53 277.6 4.67 53.82 85.85 -0.25 ID基因名稱Gene name外顯子數(shù)目Numbers of exons蛋白長度(aa)Protein length蛋白質(zhì)分子量(Da)Molecular weight of portein等電點Isoelectric point不穩(wěn)定系數(shù)Instability index脂肪族氨基酸指數(shù)Aliphatic index
EuGRAS基因的外顯子預(yù)測結(jié)果顯示有34條Eu-GRAS基因只含有1個外顯子,6條EuGRAS基因(EuGRAS7、EuGRAS13、EuGRAS29、EuGRAS40、Eu-GRAS46、EuGRAS47)含有2個外顯子,5條EuGRAS基因(EuGRAS12、EuGRAS20、EuGRAS34、EuGRAS42、EuGRAS43)含有3個外顯子,2條EuGRAS基因(EuGRAS9、EuGRAS45)含有4個外顯子,這表明EuGRAS基因家族具有一定的進(jìn)化保守性[17]。
續(xù)表1
將擬南芥中的33條GRAS家族成員序列、番茄中的53條GRAS家族成員序列和鑒定得到的47條杜仲GRAS家族成員序列進(jìn)行比對后,采用鄰近法構(gòu)建進(jìn)化樹(圖1),聚類分析結(jié)果顯示,杜仲GRAS基因家族成員分屬于13個亞家族。其中AtSCL3亞家族成員1個(EuGRAS4);AtSCL4/7亞家族成員1個(Eu-GRAS15);AtSCL28亞家族成員1個(EuGRAS39);AtLAS亞家族成員1個(EuGRAS2);Os19亞家族成員1個(EuGRAS10);Os4亞家族成員2個(EuGRAS43、EuGRAS12);DELLA亞家族成員2個(EuGRAS37、EuGRAS38);AtSCR亞家族成員3個(EuGRAS13、EuGRAS5、EuGRAS46);HAM亞家族成員6個聚為2類(EuGRAS18、EuGRAS11、EuGRAS23和EuGRAS25、EuGRAS44、EuGRAS41);AtSHR亞家族成員6個(EuGRAS3、EuGRAS16、EuGRAS26、EuGRAS27、EuGRAS8、EuGRAS6);Pt20亞家族成員6個(EuGRAS28、EuGRAS19、EuGRAS32、EuGRAS35、EuGRAS33、EuGRAS30);AtPAT1亞家族成員8個(EuGRAS17、EuGRAS7、EuGRAS24、EuGRAS21、Eu-GRAS22、EuGRAS14、EuGRAS1、EuGRAS36);At-SCL9亞家族成員9個(EuGRAS31、EuGRAS40、EuGRAS47、EuGRAS42、EuGRAS9、EuGRAS34、EuGRAS45、EuGRAS20、EuGRAS29)。其中除了在10個亞族中杜仲GRAS基因家族均含有與擬南芥GRAS基因家族高度同源的蛋白,在Os4、Os19和Pt20 3個新亞族也存在杜仲GRAS基因,這3個亞族分別是在水稻和楊樹中發(fā)現(xiàn)的新的亞族,說明盡管GRAS家族具有一定的保守性,但是在發(fā)育進(jìn)化時為了適應(yīng)也產(chǎn)生了擴展。
圖1 杜仲、擬南芥與番茄基因家族進(jìn)化樹Fig.1 The phylogenetic tree of gene family in ,Arabidopsis thaliana and Solanum lycopersicum
通過在線軟件GSDS 2.0對杜仲中47個GRAS成員序列的基因結(jié)構(gòu)和Motif基序進(jìn)行了分析。結(jié)果顯示(圖2),其結(jié)構(gòu)域基本Motif骨架按Motif 6、Motif 7、Motif 2、Motif 9、Motif 4、Motif 5、Motif 3、Motif 1、Motif 10、Motif 8的順序組成,通過在骨架基礎(chǔ)上增添或缺失Motif基序形成不同的亞家族,同時其相應(yīng)的Motif基序組成預(yù)測結(jié)果顯示(圖3),Motif 2基序是基因家族結(jié)構(gòu)域中最為保守的。隨后對13個亞家族中的47個EuGRAS蛋白的保守結(jié)構(gòu)域Motif基序組成進(jìn)行了統(tǒng)計分析(表2),發(fā)現(xiàn)未出現(xiàn)Motif基序增添或缺失的4個亞家族中的12個EuGRAS基因均不含有內(nèi)含子,其余不含內(nèi)含子的EuGRAS基因其蛋白結(jié)構(gòu)域都發(fā)生了不同程度的基序缺失;而含有內(nèi)含子的4個亞家族中的13個成員均發(fā)生了Motif基序缺失,同時Os4和AtSCL9亞家族還出現(xiàn)了Motif基序增添的現(xiàn)象。
表2 杜仲基因家族蛋白保守結(jié)構(gòu)域Motif基序預(yù)測Table 2 Prediction of motif modules ofgene family protein conserved domain in
表2 杜仲基因家族蛋白保守結(jié)構(gòu)域Motif基序預(yù)測Table 2 Prediction of motif modules ofgene family protein conserved domain in
亞家族(成員數(shù)量)Subfamily(number of members)亞家族成員數(shù)量Number of subfamily members AtSCL3(1) 0 9 1 At SCL4/7(1) 0 1 1 AtSCL28(1) 0 9 1 AtLAS(1) 0 9,1 1 Os19(1) 0 9 8 1 Os4(2) 2 4 1 6,9,10 7 1 DELLA(2) 0 2 AtSCR(3) 0 9,5,1 1 1 9,5,1 2內(nèi)含子數(shù)量Number of introns缺失Motif基序Deletion of Motif modules增添Motif基序Reinforce of Motif modules HAM(6) 0 6,4,5,1 1 5,1 1 9,5,1 2 9,1 1 9,5,1 10 1 9,5,1 1 3 3,1 2 Pt20(6) 0 9 5 9,5 1 AtPAT1(8) 0 6 9,10,8 1 1 10,8 1 AtSHR(6) 0 AtSCL9(9)1 10,8 8.7.2.4 1 2 1,10,8 8 1 3 7,2,5,3,10,8 10,8 1 2 10,8 8 1 2 10,8 8 1 1 10,8 8 1 3 10,8 1 1 8 8 1 0 1
圖2 杜仲基因家族Motif基序、保守結(jié)構(gòu)域及基因結(jié)構(gòu)組成分析Fig.2 The analysis of motif,conserved domain and gene structure ofgene family in
杜仲EuGRAS基因家族成員VHIID結(jié)構(gòu)域的序列比對結(jié)果顯示(圖4),VHIID結(jié)構(gòu)域中天冬氨酸(D)極度穩(wěn)定,沒有發(fā)生氨基酸的替換,其余VHIID結(jié)構(gòu)域基序氨基酸均發(fā)生了替換。統(tǒng)計結(jié)果顯示(表3),氨基酸替換方式為V→I或L,I→V或L,僅有極少數(shù)發(fā)生了其他類型的氨基酸替換,同時,還發(fā)現(xiàn)AtSCL28、AtSCR、AtPAT1和AtSCL9亞家族中共有8個成員未發(fā)生氨基酸的替換,這可能是這些EuGRAS基因家族成員進(jìn)化上保守性的一種體現(xiàn)。
表3 杜仲基因家族成員VHIID結(jié)構(gòu)域氨基酸替換統(tǒng)計Table 3 The amino acid substitution statistic of VHIIDdomain infamily members of
亞家族Subfamily genes VHIID結(jié)構(gòu)域基序VHIID domain motif V H I I D 成員數(shù)量Member's quantity AtLAS I L 1 AtSCL28 1 At SCL3 I 1 AtSCL4/7 I V 1 Os19 L V 1 DELLA V 2 Os4 V 2 V V 1 AtSCR 2 V V 1 HAM I V 2 I V V 1 R 1 V 1 V 1 I L 1 AtSHR L 1 L V 4 Pt20 I F 1 I L 1 I V 2 M 1 V 1 I 4 AtPAT1 I V 1 L V V 1 2 I 1 I V 1 At SCL9 L 3 3缺失 1
圖4 杜仲基因家族成員VHIID結(jié)構(gòu)域序列比較Fig.4 The sequence comparison of VHIID domain forgenes family members in
隨著高通量測序技術(shù)的日趨成熟,利用生物信息學(xué)技術(shù)從植物基因組中篩選基因,而后進(jìn)行基因的功能驗證分析已成為目前植物基因研究領(lǐng)域的重要手段[5]。杜仲作為我國特有的古老樹種,其基因組數(shù)據(jù)等信息早已公布,但其抵御外界環(huán)境脅迫和生物脅迫的機制尚不清楚。GRAS基因作為與植物生長和抗逆性密接相關(guān)的基因,已在多個物種中進(jìn)行了功能驗證和基因家族分析[4,27],但其在杜仲中的功能作用還尚待研究。
本研究從杜仲基因組中鑒定出47個GRAS基因家族成員,并對其蛋白理化性質(zhì)、系統(tǒng)發(fā)育、基因結(jié)構(gòu)以及保守基序進(jìn)行了分析。結(jié)果表明僅有AtPAT1亞家族中的EuGRAS1和EuGRAS17未出現(xiàn)Motif基序的缺失和VHIID結(jié)構(gòu)域的氨基酸替換,進(jìn)一步的分析發(fā)現(xiàn)EuGRAS1蛋白長度為388 aa,EuGRAS17蛋白長度為499 aa,兩者均為酸性親水不穩(wěn)定蛋白,不含有內(nèi)含子,EuGRAS1和EuGRAS17基因的相對保守性表明其可能是赤霉素的信號轉(zhuǎn)導(dǎo)和光敏色素的信號傳遞中的管家基因[20];而同樣保持Motif骨架完整的4個AtPAT1亞家族成員的VHIID結(jié)構(gòu)域發(fā)生了V→I的氨基酸替換,僅有一個增加了I→V的替換,這可能是AtPAT1亞家族的緩慢進(jìn)化的體現(xiàn),而AtPAT1亞家族中另外2個成員的Motif基序缺失,并且其中一個成員為堿性蛋白質(zhì),可能是杜仲適應(yīng)外界環(huán)境變化的結(jié)果;此外DELLA亞家族中的2個成員均未發(fā)生Motif骨架的缺失,其保守性可能是由于其調(diào)控杜仲響應(yīng)逆境脅迫和赤霉素、茉莉酸和光信號的需要[15]。與生長發(fā)育有關(guān)的AtSHR亞家族和與干旱、滲透脅迫有關(guān)的AtSCL9亞家族中出現(xiàn)的Motif骨架的缺失、增加和無變化的結(jié)果表明,杜仲可能為了適應(yīng)外界條件的變化而對自身的基因進(jìn)行調(diào)整[14,23]。
在杜仲漫長的進(jìn)化過程中,既需要基因的進(jìn)化以適應(yīng)變化的環(huán)境,同樣需要基因的保守以維持正常的生長發(fā)育。通過生物信息學(xué)的手段,篩選杜仲與環(huán)境適應(yīng)相關(guān)的基因進(jìn)行試驗,一方面可以提高試驗效率,另一方面也可以在控制基因表達(dá)的情況下探究其對杜仲生長發(fā)育的作用機制,這對于開展有關(guān)杜仲環(huán)境適應(yīng)性機制的研究并將其應(yīng)用于瀕危植物的保護等方面具有重要意義。