朱延明,朱毅,端木慧子,肖佳雷,于洋,劉艾林
(東北農(nóng)業(yè)大學(xué)農(nóng)業(yè)生物功能基因重點(diǎn)實(shí)驗(yàn)室,哈爾濱150030)
大豆GmUGD基因家族生物信息學(xué)分析
朱延明,朱毅,端木慧子,肖佳雷,于洋,劉艾林
(東北農(nóng)業(yè)大學(xué)農(nóng)業(yè)生物功能基因重點(diǎn)實(shí)驗(yàn)室,哈爾濱150030)
尿苷二磷酸葡萄糖脫氫酶(UGD)是多糖合成中的一個(gè)關(guān)鍵酶,廣泛參與植物生長發(fā)育與非生物脅迫響應(yīng)過程。采用生物信息學(xué)方法,在全基因組水平預(yù)測出10個(gè)大豆GmUGD基因;序列分析結(jié)果顯示,GmUGD基因均具有UDP-葡萄糖/GDP-甘露糖脫氫酶家族的3個(gè)典型結(jié)構(gòu)域;基因復(fù)制分析表明,80%GmUGD基因存在復(fù)制事件;系統(tǒng)發(fā)生分析結(jié)果顯示,GmUGD基因分為三類,分類結(jié)果與基因復(fù)制分析結(jié)果基本吻合;基于UniGene數(shù)據(jù)庫與GEO數(shù)據(jù)庫的表達(dá)模式分析顯示,根中GmUGD基因的ESTs最多,上胚軸中最少;另外,GmUGD基因能夠響應(yīng)鹽堿脅迫誘導(dǎo),在大豆根和葉中表達(dá)模式不同。結(jié)果可為進(jìn)一步研究大豆GmUGD基因功能提供理論依據(jù)。
GmUGD基因;大豆;生物信息學(xué);序列分析;表達(dá)分析
尿苷二磷酸-葡萄糖6-脫氫酶(UDP-glucose 6-dehydrogenase,UGD)是一種以NAD+或NADP+為受體、作用于供體CH-OH基團(tuán)上的氧化還原酶,參與多種糖代謝過程。UGD能催化產(chǎn)生多糖合成過程中的關(guān)鍵前體物質(zhì)——UDP-葡萄糖醛酸,因此在多糖合成過程中起重要作用[1]。Samac等研究將大豆UGD基因的cDNA轉(zhuǎn)入到紫花苜蓿中,轉(zhuǎn)基因植株中UGD活性和非轉(zhuǎn)基因植株相比顯著增強(qiáng),且木質(zhì)素和木糖含量明顯增高[2]。在玉米中,UGD基因突變導(dǎo)致酶活性顯著下降,抑制下游多糖合成[3]。半纖維素是植物細(xì)胞壁主要組成部分,半纖維素中大部分糖來自于UGD催化產(chǎn)生的UDP-葡萄糖醛酸,因此UGD與植物細(xì)胞壁形成密切相關(guān)[4-5]。研究表明UGD基因在植物非生物脅迫應(yīng)答中起重要作用。賀順姬等發(fā)現(xiàn),高鹽脅迫培養(yǎng)條件對鹽藻DsUGD基因在mRNA水平上的表達(dá)具有明顯誘導(dǎo)作用[6];Plomion等證明白楊中UGD蛋白響應(yīng)干旱脅迫[7];Lata等研究指出粟米UGD蛋白在脫水脅迫中上調(diào)表達(dá)[8]。
大豆是我國主要糧食作物之一,是植物蛋白和植物油主要來源,主產(chǎn)于我國東北地區(qū)。大豆產(chǎn)量和品質(zhì)易受低溫、鹽堿等非生物脅迫影響。因此,研究UGD基因?qū)ρ芯看蠖股L發(fā)育和非生物脅迫響應(yīng)機(jī)制具有重要意義。
目前在基因組水平上大豆GmUGD基因家族的生物信息學(xué)分析及功能研究尚未見報(bào)道。本研究利用已公布的大豆基因組序列信息,采用生物信息學(xué)方法,在基因組水平上對GmUGD基因進(jìn)行預(yù)測,通過序列分析、進(jìn)化分析、組織表達(dá)特異性分析及鹽堿脅迫下表達(dá)模式分析等,以期為進(jìn)一步研究GmUGD基因功能提供參考及理論依據(jù)。
1.1GmUGD基因篩選與序列分析
根據(jù)GmUGD基因Glyma18g50000蛋白保守結(jié)構(gòu)域的氨基酸序列,利用BLASTP程序在大豆基因組注釋數(shù)據(jù)庫Phytozome(http://www.phytozome.net/)中進(jìn)行序列相似性搜索。利用ClustalX2.0[9]軟件對GmUGD同源蛋白進(jìn)行序列比對,利用蛋白質(zhì)家族數(shù)據(jù)庫PFAM(http://pfam.xfam.org/)分析蛋白保守結(jié)構(gòu)域,利用MEME(http://meme.nbcr.net/meme/cgibin/meme.cgi)對其進(jìn)行序列基序(Motif)分析,所用參數(shù)為軟件默認(rèn)值。
1.2GmUGD基因復(fù)制分析
基因染色體定位信息在大豆基因組數(shù)據(jù)庫(www.phytozome.com)中通過BLASTP程序比對確認(rèn),染色體物理定位圖使用MapInspect繪制。根據(jù)Yang等方法判斷旁系同源基因的復(fù)制事件[10],判定標(biāo)準(zhǔn)如下:①在不同染色體上,兩個(gè)基因序列比對部分長度占較長序列的80%以上;②比對部分相似性大于70%。
1.3GmUGD基因系統(tǒng)發(fā)生分析
根據(jù)序列比對結(jié)果,利用MEGA5.0軟件[11]中的鄰接法(Neighbor-Joining,NJ)構(gòu)建GmUGD基因家族系統(tǒng)發(fā)生樹,隨機(jī)檢驗(yàn)參數(shù)Bootstrap設(shè)為1 000次,其他參數(shù)為軟件默認(rèn)值。
1.4GmUGD基因表達(dá)特性分析
GmUGD基因組織表達(dá)EST數(shù)據(jù)下載自NCBI上的UniGene(http://www.ncbi.nlm.nih.gov/unigene)數(shù)據(jù)庫;大豆根、葉GmUGD基因鹽堿脅迫表達(dá)譜下載自NCBI上的基因表達(dá)倉庫GEO(http://www.ncbi.nlm. nih.gov/geo/)數(shù)據(jù)庫,數(shù)據(jù)編號分別為GSE17883[12]和GSE20323[13],并利用MATLAB軟件分別對其進(jìn)行層次聚類及熱圖繪制。
2.1GmUGD基因獲取與序列分析
2.1.1GmUGD基因獲取
通過序列相似性搜索,獲得12個(gè)GmUGD基因,剔除相同基因的不同轉(zhuǎn)錄本,最終獲得10個(gè)GmUGD基因,分別為Glyma01g06970、Glyma02g 12870、Glyma05g00590、Glyma08g26520、Glyma13g 06050、Glyma14g14161、Glyma17g08491、Glyma18g 50000、Glyma19g03500和Glyma20g03221。
2.1.2GmUGD基因保守結(jié)構(gòu)域分析
下載大豆UGD蛋白序列,利用ClustalX進(jìn)行比對分析,發(fā)現(xiàn)這些蛋白序列均具有3個(gè)高度保守的蛋白結(jié)構(gòu)域,分屬于PFAM數(shù)據(jù)庫中UDP-葡萄糖/ GDP-甘露糖脫氫酶家族的3個(gè)典型區(qū)域:N端NAD結(jié)合區(qū)UDPG-MGDP-dh-N(Pfam:03721)、C端UDP結(jié)合區(qū)UDPG-MGDP-dh-C(Pfam:03720)及中間部分的UDP-葡萄糖/GDP-甘露糖脫氫酶家族區(qū)UDPG-MGDP-dh(Pfam:00984)(見圖1)。
圖1GmUGD家族蛋白的保守結(jié)構(gòu)域Fig.1Conserved domain of GmUGD proteins
結(jié)果證實(shí)這10個(gè)基因均屬于UDP-葡萄糖脫氫酶家族基因,而3個(gè)保守結(jié)構(gòu)域可能是GmUGD基因參與糖代謝過程中主要功能區(qū)域。
2.1.3GmUGD基因的motif分析
利用MEME網(wǎng)站進(jìn)行蛋白motif預(yù)測。結(jié)果見圖2,除Glyma14g14161和Glyma20g03221,其他GmUGD基因具有相同的motif。在預(yù)測所得的10個(gè)motif中,motif7和motif10功能未知,其他8個(gè)motif均為UDP-葡萄糖/GDP-甘露糖脫氫酶家族的3個(gè)典型保守結(jié)構(gòu)域的組成部分,進(jìn)一步證實(shí)GmUGD基因的保守性。
2.2GmUGD基因的復(fù)制分析及系統(tǒng)發(fā)生分析
2.2.1GmUGD基因的復(fù)制分析
GmUGD基因序列具有高度保守性,為研究進(jìn)化關(guān)系,對其進(jìn)行旁系同源基因復(fù)制判定。結(jié)果顯示,除Glyma14g14161和Glyma20g03221,其他8個(gè)基因兩兩之間均滿足基因復(fù)制的判定標(biāo)準(zhǔn)。因此,推測GmUGD基因進(jìn)化中存在多次基因復(fù)制現(xiàn)象。為直觀顯示GmUGD基因復(fù)制事件,對其進(jìn)行染色體定位,標(biāo)注復(fù)制事件(見圖3)。
由圖3可知,基因間實(shí)線表示基因間序列相似性大于90%,虛線表示基因間相似性在80%~90%。結(jié)果顯示,Glyma01g06970和Glyma02g12870,Glyma05g00590和Glyma17g08491,Glyma08g26520、Glyma13g06050、Glyma18g50000和Glyma19g03500序列高度相似,可能存在復(fù)制事件,具有較近進(jìn)化關(guān)系。
圖2GmUGD家族蛋白基序分布Fig.2Distribution of GmUGD proteins motifs
圖3GmUGD基因染色體分布及基因復(fù)制事件Fig.3Chromosome distribution and gene duplications of GmUGD genes
2.2.2GmUGD基因系統(tǒng)發(fā)生分析
為進(jìn)一步研究GmUGD基因進(jìn)化關(guān)系,采用鄰近法(NJ)構(gòu)建GmUGD基因家族系統(tǒng)發(fā)生樹。結(jié)果表明,所構(gòu)建系統(tǒng)發(fā)生樹中基因間隨機(jī)檢驗(yàn)(Bootstrap)得分均>80,即系統(tǒng)發(fā)生樹中代表進(jìn)化關(guān)系可靠。GmUGD基因家族系統(tǒng)發(fā)生樹顯示,GmUGD基因分三類:Glyma08g26520、Glyma13g06050、Glyma18g50000和Glyma19g03500為一類,且基因間遺傳距離較近;Glyma01g06970、Glyma02g12 870和Glyma20g03221為一類,其中Glyma01g06970和Glyma02g12870間遺傳距離較近,而Glyma20g03 221與其遺傳距離較遠(yuǎn);其余3個(gè)基因聚為一類,基因間遺傳距離相對較遠(yuǎn)(見圖4)。這個(gè)結(jié)果與基因復(fù)制分析結(jié)果基本吻合。由于蛋白序列與其功能具有一定相關(guān)性。進(jìn)化關(guān)系較近基因如Glyma08g26520和Glyma18g50000、Glyma13g 06050和Glyma19g03500可能具有相同或相似功能。
2.3GmUGD基因表達(dá)模式分析
2.3.1GmUGD基因組織表達(dá)特異性分析
表達(dá)序列標(biāo)簽EST是研究基因表達(dá)模式有效方法之一。為研究GmUGD基因在不同組織中表達(dá)模式,利用NCBI的UniGene數(shù)據(jù)庫篩選GmUGD基因在不同組織和器官中的ESTs。結(jié)果顯示,有6個(gè)GmUGD基因(Glyma01g06970、Glyma02g12870、Glyma08g26520、Glyma13g06050、Glyma18g50000和Glyma19g03500)在根、莖、葉等不同組織器官中具有ESTs(見表1)。其中,根中ESTs最多,其次是下胚軸與葉;上胚軸中ESTs最少,子葉、豆莢中次之。在具有ESTs的GmUGD基因中,Glyma18g 50000的ESTs最多,其次是Glyma08g26520。
2.3.2GmUGD基因鹽堿脅迫表達(dá)模式分析
為進(jìn)一步研究GmUGD基因組織表達(dá)特異性及其是否響應(yīng)鹽堿脅迫,本研究從GEO數(shù)據(jù)庫中下載大豆根、葉鹽堿脅迫(NaHCO3處理)基因表達(dá)譜數(shù)據(jù),從中獲得GmUGD基因家族表達(dá)譜并進(jìn)行聚類分析。由圖5可知,有4個(gè)GmUGD基因在鹽堿脅迫下表達(dá)發(fā)生改變,分別為Glyma01g 06970、Glyma08g26520、Glyma18g50000和Glyma 19g03500。鹽堿脅迫下,這些基因在根和葉中的表達(dá)模式存在差異,如Glyma01g06970在鹽堿脅迫的大豆葉中表達(dá)下調(diào),而在根中表達(dá)上調(diào);Glyma 19g03500在鹽堿脅迫的大豆葉中表達(dá)始終呈上調(diào)趨勢,而在根中表達(dá)水平先降低后升高;Glyma08g26520和Glyma18g50000在根中顯著下調(diào)表達(dá),表達(dá)量變化顯著高于葉中。結(jié)果說明GmUGD基因在堿脅迫下的表達(dá)模式具有組織特異性。另外,和其他GmUGD基因相比,Glyma08g26520和Glyma18g50000在鹽堿脅迫各時(shí)間點(diǎn)的表達(dá)變化顯著,表達(dá)模式相似,說明其可能在大豆鹽堿脅迫響應(yīng)過程中發(fā)揮重要作用,行使相同或相似功能。與之前系統(tǒng)發(fā)生分析和組織表達(dá)分析結(jié)果相符。
圖4GmUGD基因家族系統(tǒng)發(fā)生樹Fig.4Phylogenetic tree of GmUGD genes
表1GmUGD基因組織表達(dá)特異性Table 1Expression patterns of GmUGD genes in tissues
圖5GmUGD家族基因表達(dá)模式聚類Fig.5Hierarchical cluster of expression pattern of GmUGD genes
大豆全基因測序完成,為研究人員從全基因組水平研究基因功能奠定基礎(chǔ)。生物信息學(xué)是全基因組數(shù)據(jù)分析的有效工具,已廣泛用于多個(gè)基因家族鑒定、基因結(jié)構(gòu)分析與功能預(yù)測[14-16]。但是,大豆中UGD家族基因及其功能研究尚未見報(bào)道。
本研究利用生物信息學(xué)方法,從大豆基因組中鑒定10個(gè)GmUGD家族基因。通過氨基酸序列分析,發(fā)現(xiàn)大部分GmUGD基因序列高度保守,均具有UDP-葡萄糖/GDP-甘露糖脫氫酶家族的3個(gè)典型區(qū)域:N端的NAD結(jié)合區(qū)、C端的UDP結(jié)合區(qū)及中間部分的UDP-葡萄糖/GDP-甘露糖脫氫酶家族區(qū),說明這些高度保守的結(jié)構(gòu)域可能是GmUGD基因參與糖代謝過程的主要功能區(qū)域。
基因復(fù)制是基因組擴(kuò)增的原因之一。GmUGD家族基因80%基因之間存在基因復(fù)制事件,系統(tǒng)發(fā)生分析結(jié)果與基因復(fù)制分析結(jié)果相吻合:存在復(fù)制事件基因在系統(tǒng)發(fā)生樹中處于同一分枝。這些基因可能在植物生長發(fā)育或脅迫應(yīng)答過程中行使相同或相似功能。
研究表明,UGD基因在不同植物中組織表達(dá)情況不同。在擬南芥幼苗期,UGD基因主要在根部表達(dá),而成熟期主要在維管束中表達(dá)[17-18]。而在苧麻中,UGD基因在莖中表達(dá)量最高,其次是種皮、葉和根[19]。本研究顯示,GmUGD基因主要在根部表達(dá),其次是下胚軸、葉等營養(yǎng)器官,在豆莢和葉芽中數(shù)量較少,此結(jié)果與之前研究結(jié)果一致[5]。因此,推測GmUGD基因在不同植物生長發(fā)育過程中發(fā)揮不同功能。
GmUGD基因鹽堿脅迫表達(dá)模式分析同樣顯示其在不同組織表達(dá)具有較大差異。在鹽堿脅迫下,4個(gè)GmUGD基因表達(dá)水平發(fā)生顯著變化,說明這些GmUGD基因可能在大豆鹽堿脅迫響應(yīng)過程中發(fā)揮作用。但是,其在堿脅迫下的具體功能和響應(yīng)模式還需進(jìn)一步驗(yàn)證。
本研究利用生物信息學(xué)方法,從基因組水平系統(tǒng)篩選大豆GmUGD,并對其進(jìn)行保守結(jié)構(gòu)域分析、序列motif分析、基因復(fù)制分析、系統(tǒng)發(fā)生分析、組織表達(dá)模式分析及鹽堿脅迫表達(dá)模式分析。從大豆基因組中共預(yù)測10個(gè)GmUGD家族基因,這些GmUGD基因高度保守,均具有UDP-葡萄糖/GDP-甘露糖脫氫酶家族典型區(qū)域。GmUGD家族基因間存在大量基因復(fù)制事件,存在復(fù)制事件的GmUGD基因間具有較近進(jìn)化距離。GmUGD基因在根、莖、葉等不同組織器官中均有表達(dá),其中,根中ESTs最多,上胚軸中ESTs最少。GmUGD基因在鹽堿脅迫下表達(dá)水平發(fā)生顯著變化,在鹽堿脅迫下的表達(dá)模式具有組織特異性。本研究闡明了GmUGD基因基本特點(diǎn),可為后期該家族基因功能分析提供參考與理論依據(jù)。
[1]Lei L M,Song L R.Cloning and characterization of the gene for UDPGlc dehydrogenase from the cyanobacterium,Microcystis aeruginosa FACHB 905[J].Acta Botanica Sinica,2004,46(11):1373-1382.
[2]Samac D A,Litterer L,Temple G,et al.Expression of UDP-glu-cose dehydrogenase reduces cell-wall polysaccharide concentration and increases xylose content in alfalfa stems[J].Appl Biochem Biotechnol,2004,113-116:1167-1182.
[3]Karkonen A,Murigneux A,Martinant J P,et al.UDP-glucose dehydrogenases of maize:A role in cell wall pentose biosynthesis[J]. Biochem J,2005,391(Pt 2):409-415.
[4]Johansson H,Sterky F,Amini B,et al.Molecular cloning and characterization of a cDNA encoding poplar UDP-glucose dehydrogenase,a key gene of hemicellulose/pectin formation[J].Biochim Biophys Acta,2002,1576(1-2):53-58.
[5]Tenhaken R,Thulke O.Cloning of an enzyme that synthesizes a key nucleotide-sugar precursor of hemicellulose biosynthesis from soybean:UDP-glucose dehydrogenase[J].Plant Physiol, 1996,112(3):1127-1134.
[6]賀順姬,趙向麗,韓銳,等.鹽藻多糖合成關(guān)鍵酶—尿苷二磷酸葡萄糖脫氫酶(DsUGD)基因分析及耐鹽相關(guān)性研究[J].四川大學(xué)學(xué)報(bào),2006,43(3):713-716.
[7]Plomion C,Lalanne C,Claverol S,et al.Mapping the proteome of poplar and application to the discovery of drought-stress responsive proteins[J].Proteomics,2006,6(24):6509-6527.
[8]Lata C,Sahu P P,Prasad M.Comparative transcriptome analysis of differentially expressed genes in foxtail millet(Setaria italica L.)during dehydration stress[J].Biochem Biophys Res Commun, 2010,393(4):720-727.
[9]Larkin M A,Blackshields G,Brown N P,et al.Clustal W and ClustalXversion2.0[J].Bioinformatics,2007,23(21):2947-2948.
[10]Yang S,Zhang X,Yue J X,et al.Recent duplications dominate NBS-encoding gene expansion in two woody species[J].Mol Genet Genomics,2008,280(3):187-198.
[11]Tamura K,Peterson D,Peterson N,et al.MEGA5:Molecular evolutionary genetics analysis using maximum likelihood,evolutionary distance,and maximum parsimony methods[J].Mol Biol Evol, 2011,28(10):2731-2739.
[12]Ge Y,Li Y,Zhu Y M,et al.Global transcriptome profiling of wild soybean(Glycine soja)roots under NaHCO3treatment[J].BMC Plant Biol,2010(10):153.
[13]Ge Y,Li Y,Lv D K,et al.Alkaline-stress response in Glycine soja leaf identifies specific transcription factors and ABA-mediated signalingfactors[J].FunctIntegrGenomics,2011,11(2):369-379.
[14]王志坤,常健敏,李丹丹,等.大豆GmWRI1a基因克隆及生物信息學(xué)分析[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2013,44(7):11-16.
[15]朱紅霞,胡利宗,鄧小莉,等.大豆SBP基因家族的序列特征、表達(dá)及進(jìn)化分析[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2012,43(7):26-33.
[16]羅曉,曹蕾,王明超,等.野生大豆鹽堿脅迫響應(yīng)基因GsZFP1的克隆及序列分析[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2012,43(4):20-26.
[17]Seitz B,Klos C,Wurm M,et al.Matrix polysaccharide precursors in Arabidopsis cell walls are synthesized by alternate pathways with organ-specific expression patterns[J].Plant J,2000,21(6):537-546.
[18]Kanter U,Usadel B,Guerineau F,et al.The inositol oxygenase gene family of Arabidopsis is involved in the biosynthesis of nucleotide sugar precursors for cell-wall matrix polysaccharides[J]. Planta,2005,221(2):243-254.
[19]劉峰,黃妤,郭清泉,等.苧麻UDPGDH基因的cDNA克隆及表達(dá)分析[J].中國農(nóng)業(yè)科學(xué),2008(11):3542-3548.
Bioinformatics analysis ofGmUGDgene family in soybean genome/
ZHU Yanming,ZHU Yi,DUANMU Huizi,XIAO Jialei,YU Yang,LIU Ailin
(Key Laboratory of Agricultural Biological Functional Genes,NortheastAgricultural University,Harbin 150030,China)
UDP-glucose 6-dehydrogenase(UGD)is the key enzyme of polysaccharide biosynthesis, which plays important roles in the development and response to abiotic stresses of plant.A genome-wide analysis was conducted using bioinformatics and tenGmUGDgenes of soybean were identified.Sequence analysis showed that all theGmUGDgenes had three conserved domains which were typical in UDP-glucose/GDP-mannose dehydrogenase family.Gene duplication analysis indicated eighty percent of GmUGDgenes were duplicated.Phylogenetic analysis showed thatGmUGDgenes were classified into three clusters,and the result was similar with gene duplication analysis.Expression pattern analysis which based on UniGene and GEO database indicated that more ESTs ofGmUGDswere found in root than other tissues and none were found in epicotyls.In addition,theGmUGDgenes responded to salinity-alkalinity stress and showed differential expression pattern under salinity-alkalinity stress.These results provide theoretical basis for further research ofGmUGDgenes function in soybean.
GmUGDgenes;soybean;bioinformatics;sequence analysis;expression analysis
Q945.78;S565.1
A
1005-9369(2015)09-0023-07
時(shí)間2015-9-23 10:43:33[URL]http://www.cnki.net/kcms/detail/23.1391.S.20150923.1043.028.html
朱延明,朱毅,端木慧子,等.大豆GmUGD基因家族生物信息學(xué)分析[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2015,46(9):23-29.
Zhu Yanming,Zhu Yi,Duanmu Huizi,et al.Bioinformatics analysis ofGmUGDgene family in soybean genome[J].Journal of Northeast Agricultural University,2015,46(9):23-29.(in Chinese with English abstract)
2015-03-08
國家自然科學(xué)基金項(xiàng)目(31171578);轉(zhuǎn)基因生物新品種培育重大專項(xiàng)(2011ZX08004-002);黑龍江省高??萍紕?chuàng)新團(tuán)隊(duì)建設(shè)計(jì)劃(2011TD055)
朱延明(1955-),男,教授,博士,博士生導(dǎo)師,研究方向?yàn)榉肿由飳W(xué)與基因工程。E-mail:ymzhu2001@neau.edu.cn