蘭曉天,胡 淞,馮 磊,田英男,和鳳美
(云南農(nóng)業(yè)大學(xué) 園林園藝學(xué)院,云南 昆明 650601)
鐵皮石斛(Dendrobiumcandidum),屬蘭科石斛屬多年生附生草本植物,是石斛屬藥用植物中珍稀名貴的品種[1]。鐵皮石斛多糖含量和纖維素含量的高低是判斷其品質(zhì)優(yōu)良與否的關(guān)鍵,其中,纖維素含量越少品質(zhì)越高[2]。研究鐵皮石斛纖維素的合成過(guò)程,挖掘纖維素合成過(guò)程中的重要基因,進(jìn)而通過(guò)植物基因工程方式減少纖維素含量,可為培養(yǎng)優(yōu)良鐵皮石斛品種提供重要理論支持。
纖維素是植物細(xì)胞壁的主要成分,植物纖維素的合成是多個(gè)基因共同作用的結(jié)果,主要包含纖維素合成酶基因(CESA)和類纖維素合成酶基因(CSL)2個(gè)基因家族成員[3-5]。纖維素合成酶的主要功能是負(fù)責(zé)在質(zhì)膜上催化纖維素的生物合成;高爾基體體腔中的半纖維素合成則主要由類纖維素合成酶來(lái)完成。隨著基因組學(xué)的發(fā)展,已有1 400多個(gè)[6]不同物種的CESA基因序列被克隆并報(bào)道出來(lái)。鐵皮石斛中已有89個(gè)CESA基因被鑒定出來(lái),此外,還發(fā)現(xiàn)DoCSLA6基因不僅直接參與鐵皮石斛多糖合成的代謝途徑,還與鐵皮石斛的抗逆性有關(guān)[7]。近年來(lái),人們對(duì)水稻、擬南芥、棉花、毛果楊和煙草等[8-11]植物的CESA基因家族進(jìn)行了生物信息學(xué)分析和比較。雖然CESA一直是植物纖維素合成研究的一個(gè)熱點(diǎn),但相關(guān)研究主要集中在模式植物中,關(guān)于鐵皮石斛CESA/CSL基因家族的研究尚未見(jiàn)報(bào)道。本研究利用鐵皮石斛的轉(zhuǎn)錄組數(shù)據(jù),挖掘在鐵皮石斛莖中表達(dá)量高的纖維素合成酶家族基因,構(gòu)建鐵皮石斛CESA基因家族和CSL基因家族的系統(tǒng)進(jìn)化樹(shù),并對(duì)它們的基因結(jié)構(gòu)、保守結(jié)構(gòu)域、亞細(xì)胞定位等進(jìn)行分析,為鐵皮石斛CESA/CSL蛋白的功能研究和鐵皮石斛新品種的培育奠定基礎(chǔ)。
鐵皮石斛取于云南農(nóng)業(yè)大學(xué)溫室大棚內(nèi)。在花朵初開(kāi)時(shí),取下整株鐵皮石斛包括根、莖、葉和花進(jìn)行轉(zhuǎn)錄組測(cè)序。從鐵皮石斛轉(zhuǎn)錄組數(shù)據(jù)中獲得CESA、CSL基因的表達(dá)數(shù)據(jù),分析其根、莖、葉和花中表達(dá)量的差異。
分別下載擬南芥(http://www.Arabidopsis.org/) 和水稻(http://rice.plantbiology.msu.edu/index.shtml)基因組中所有的CESA、CSL基因序列以及對(duì)應(yīng)的蛋白質(zhì)序列數(shù)據(jù)。從鐵皮石斛轉(zhuǎn)錄組NR注釋中獲取鐵皮石斛的纖維素合成酶家族基因,并選擇在鐵皮石斛莖中表達(dá)量高(FPKM>1)的基因序列。將獲得的鐵皮石斛CESA/CSL基因在Clustal W中進(jìn)行比對(duì),去除同源性高的基因。
將獲得的鐵皮石斛、擬南芥和水稻的CESA基因和CSL基因用軟件ClustalX 進(jìn)行氨基酸序列比對(duì),去除同源性較高和距離遠(yuǎn)的基因,再用MEGA 5.0軟件構(gòu)建進(jìn)化樹(shù)。
選取在鐵皮石斛莖中表達(dá)量較高的CESA和CSL基因,通過(guò)在線分析工具GSDS 2.0(http://gsds.cbi.pku.edu.cn/)對(duì)基因序列和CDS序列進(jìn)行基因結(jié)構(gòu)分析[12]。
利用在線分析系統(tǒng)SMART analysis service(http://smart.Emblheidelberg.de/)[13]對(duì)鐵皮石斛CESA、CSL蛋白保守結(jié)構(gòu)域進(jìn)行分析;通過(guò)在線 TMHMM Server V.2.0分析系統(tǒng)(http://www.cbs.dtu.dk /services/TMHMM)[14]預(yù)測(cè)鐵皮石斛CESA、CSL蛋白的跨膜結(jié)構(gòu);通過(guò)在線 WoLF PSORT系統(tǒng)(http://wolfpsort.org/)對(duì)蛋白質(zhì)的亞細(xì)胞定位進(jìn)行預(yù)測(cè)[15]。
從鐵皮石斛轉(zhuǎn)錄組中鑒定出62個(gè)CESA/CSL基因,這些基因在根、莖、葉、花中表達(dá)量的FPKM值見(jiàn)圖1。其中,有19個(gè)基因的FPKM值均小于1,說(shuō)明這些基因在鐵皮石斛中表達(dá)量較低或不表達(dá)。有36個(gè)基因在4個(gè)組織中均有表達(dá)。其中,De10015261、De10044519和De10126237基因只在鐵皮石斛的根中表達(dá),De10015633和De10018596僅在莖中表達(dá),De10061728僅在葉片中表達(dá);De10002879在根和莖2個(gè)部位進(jìn)行表達(dá),De10070863、De10045267和De10016931只在地上組織中表達(dá)。De10085680、De10044516在莖和花中表達(dá),De10032436在根和花中表達(dá),De10002966在莖中無(wú)表達(dá)而在根、葉、花中均有表達(dá)。
圖1 鐵皮石斛轉(zhuǎn)錄組中CESA、CSL基因的FPKM值Fig.1 FPKM of CESA and CSL genes in the transcription group of Dendrobium candidum
在鐵皮石斛轉(zhuǎn)錄組中選出在莖中表達(dá)量(FPKM值)>1的CESA/CSL基因,將獲得的這些序列在Clustal W中進(jìn)行比對(duì),去除同源性高的基因,最終獲得32個(gè)在莖中高表達(dá)量的CESA/CSL基因。采用MEGA 5.0對(duì)這些基因與水稻和擬南芥的CESA/CSL基因家族構(gòu)建系統(tǒng)進(jìn)化樹(shù)(圖2)。結(jié)果表明,鐵皮石斛CESA/CSL基因主要聚為6個(gè)明顯的分支??蓪ESA/CSL基因分為CESA、CSL2類,而CSL基因又被細(xì)分為5亞族,分別命名為CSLA、CSLG、CSLD、CSLE與CSLH。其中,De10069041、De10040587、De10044972、De10083985、De10040239、De110044623屬于CESA家族;De10085679、De10085680、De10085688、De10127097、De10127099屬于CSLA家族;De10101415、De10101413、De10070864、De10070863、De10070859、De10070849、De10046345、De10012016聚類于CSLG家族;De10006938、De10013367、De10015166、De10016276聚類于CSLE家族;De10082462聚類于CSLH家族;De10005136、De10033113、De10013676、De10013675、De10032947、De10065574、De10105279、De10058146聚類于CSLD家族。
圖2 鐵皮石斛、水稻和擬南芥纖維素合成酶基因家族系統(tǒng)進(jìn)化樹(shù)Fig.2 Phylogenetic tree of CESA/CSL family genes in Oryza,Arabidopsis and Dendrobium
基因結(jié)構(gòu)分析(圖3)表明,鐵皮石斛CESA基因家族中具有13、14個(gè)外顯子的基因各2個(gè),具有20、21個(gè)外顯子的基因各1個(gè)。鐵皮石斛CESA基因家族在外顯子數(shù)目上的差異較大。通過(guò)對(duì)擬南芥CESA基因序列進(jìn)行分析發(fā)現(xiàn),基因之間的差異性在于某些區(qū)域是否存在內(nèi)含子,鐵皮石斛的6個(gè)CESA基因之間差別較大。在鐵皮石斛26個(gè)CSL基因中,外顯子數(shù)量為1~13個(gè)。在CSLA基因家族中含7個(gè)外顯子和6個(gè)外顯子的基因各有2個(gè),5個(gè)外顯子的基因有1個(gè)。在CSLG基因家族中外顯子數(shù)目為1~7個(gè),差異很大。在CSLE基因家族中,3個(gè)基因含有6個(gè)外顯子,1個(gè)基因含有13個(gè)外顯子。CSLH基因家族中De10082462含有9個(gè)外顯子。CSLD家族中,除了De10105279有7個(gè)外顯子,其余7個(gè)基因的外顯子數(shù)為1~4個(gè)。
鐵皮石斛CESA、CSL蛋白的保守結(jié)構(gòu)域分析(表1)表明,鐵皮石斛的CESA蛋白都含有該家族的保守結(jié)構(gòu)域RING 和Cellulose synthase;CSL蛋白中除CSLA外,其余各組均含有保守結(jié)構(gòu)域Cellulose synthase。根據(jù)蛋白質(zhì)跨膜預(yù)測(cè)系統(tǒng)TMHMMServer V.2.0分析,鐵皮石斛CESA/CSL蛋白大部分都含有跨膜結(jié)構(gòu),跨膜結(jié)構(gòu)域數(shù)量0~12個(gè)。蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)結(jié)果表明,鐵皮石斛CESA/CSL蛋白大部分位于質(zhì)膜上(24個(gè));De10013676、De10070863、De10070864、De10070849和De10127099編碼的蛋白質(zhì)位于葉綠體上;De10005136、De10070859、De10012016編碼的蛋白質(zhì)位于細(xì)胞核。
圖3 鐵皮石斛CESA和CSL基因的結(jié)構(gòu)分析 Fig.3 Structure analysis of CESA and CSL family genes in Dendrobium candidum
表1 鐵皮石斛CESA和CSL蛋白特性 Tab.1 CESA and CSL characteristics of Dendrobium candidum
續(xù)表1 鐵皮石斛CESA和CSL蛋白特性 Tab.1(Continued) CESA and CSL characteristics of Dendrobium candidum
近年來(lái),人們對(duì)于CESA/CSL基因家族的研究主要集中于CESA基因且集中于水稻、擬南芥、棉花、毛竹和煙草等經(jīng)典植物上,而對(duì)于鐵皮石斛CESA/CSL基因家族的研究鮮見(jiàn)報(bào)道。通過(guò)生物信息學(xué)分析可以預(yù)測(cè)纖維素合成酶基因的作用原理,推測(cè)基因家族的進(jìn)化機(jī)制,減少試驗(yàn)的工作量和盲目性。通過(guò)構(gòu)建系統(tǒng)發(fā)育樹(shù),利用進(jìn)化樹(shù)中已知功能的基因可以預(yù)測(cè)同一分支基因的功能。已知擬南芥中的纖維素合成酶基因ATCESA6、ATCESA1[16]參與初生細(xì)胞壁的纖維素合成,ATCESA4、ATCESA7、ATCESA8與次生細(xì)胞壁合成相關(guān)[17]。水稻中[18]纖維素合成酶基因OsCesA4、OsCesA7、OsCesA9與細(xì)胞次生壁纖維素合成有關(guān)。根據(jù)本研究結(jié)果可以推測(cè),De10040587、De10044972、De10083985、De10040239基因與初生細(xì)胞壁的纖維素合成有關(guān),De110044623、De10069041基因與次生細(xì)胞壁合成相關(guān)。CSL基因家族與CESA基因家族具有很高的相似性,但功能各不相同。其中,CSLA基因家族成員參與甘露聚糖和葡甘露聚糖的合成[19];CSLG基因家族[20]主要參與細(xì)胞壁內(nèi)多糖合成;CSLD基因家族[21]影響細(xì)胞的延伸和擴(kuò)張,細(xì)胞的擴(kuò)增和分裂也與之有關(guān)系;葡聚糖的合成則與CSLH基因家族有關(guān)[22]。由此可以推測(cè),De10085679、De10085680、De10085688、De10127097和De10127099可能與甘露聚糖和葡甘露聚糖的合成相關(guān);De10101415、De10101413、De10070864、De10070863、De10070859、De10070849、De10046345、De10012016與細(xì)胞壁內(nèi)多糖合成有關(guān);De10005136、De10033113、De10013676、De10013675、De10032947、De10065574、De10105279、De10058146可能影響植株的高矮和分蘗;De10082462與細(xì)胞壁的延伸有關(guān)。
植物體內(nèi)存在多種纖維素合成酶,不同的纖維素合成酶基因在植物不同部位表達(dá),一種纖維素合成酶基因可能參與多個(gè)組織或多種細(xì)胞壁結(jié)構(gòu)中纖維素的合成,也有可能只參與某一特定部位的合成,具有組織表達(dá)的特異性[23-24]。楊樹(shù)[25]PtrCesA2和PtrCesA1基因都是在木質(zhì)部次生壁形成期表達(dá)。阮維程等[26]對(duì)馬尾松纖維素合成酶基因PmCesA1進(jìn)行定量PCR分析,得出PmCesA1基因在馬尾松的嫩枝、葉、根中均有表達(dá),但表達(dá)量卻各不相同,其在嫩枝中的相對(duì)表達(dá)量最高(2.53),在葉中的相對(duì)表達(dá)量最低(1.25),在根中的相對(duì)表達(dá)量居中(1.82)。本研究發(fā)現(xiàn),從鐵皮石斛轉(zhuǎn)錄組中鑒定出的62個(gè)纖維素合成酶基因在根、莖、葉、花中表達(dá)的個(gè)數(shù)不同,表達(dá)量也不相同。
本研究通過(guò)對(duì)鐵皮石斛轉(zhuǎn)錄組中高表達(dá)量的CESA/CSL基因進(jìn)行生物信息學(xué)分析,共鑒定出32個(gè)基因,可分為兩大類,6個(gè)亞族。該基因家族各成員之間的外顯子數(shù)目和基因全長(zhǎng)具有很大差異,可能是因?yàn)椴煌蓡T之間的功能差別較大。對(duì)保守結(jié)構(gòu)進(jìn)行分析發(fā)現(xiàn),鐵皮石斛CSL家族蛋白質(zhì)除CSLA外均含有保守結(jié)構(gòu)域Cellulose synthase,而CESA家族蛋白質(zhì)均含有保守結(jié)構(gòu)域 RING。鐵皮石斛CESA/CSL蛋白主要分布于質(zhì)膜上,大部分具有跨膜結(jié)構(gòu)域,跨膜結(jié)構(gòu)域數(shù)量0~12個(gè)。