国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

桑樹(shù)WRKY轉(zhuǎn)錄因子的全基因組鑒定及生物信息學(xué)分析

2017-05-30 16:04:25劉潮韓利紅宋培兵王德琴王海波唐利洲
關(guān)鍵詞:生物信息學(xué)桑樹(shù)

劉潮 韓利紅 宋培兵 王德琴 王海波 唐利洲

摘要:[目的]明確桑樹(shù)基因組中WRKY轉(zhuǎn)錄因子家族結(jié)構(gòu)及其功能特征,為進(jìn)一步揭示W(wǎng)RKY轉(zhuǎn)錄因子家族生物學(xué)功能提供科學(xué)依據(jù)。[方法]利用生物信息學(xué)方法對(duì)桑樹(shù)WRKY轉(zhuǎn)錄因子的數(shù)目、類型、結(jié)構(gòu)、系統(tǒng)進(jìn)化關(guān)系、保守結(jié)構(gòu)域和密碼子使用偏性等進(jìn)行全面分析。[結(jié)果]基于桑樹(shù)全基因組蛋白數(shù)據(jù)庫(kù),共鑒定出55個(gè)桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因,占桑樹(shù)基因總數(shù)(29261)的1.88%。桑樹(shù)WRKY轉(zhuǎn)錄因子存在6種內(nèi)含子數(shù)量類型及15種內(nèi)含子相位類型,其中27個(gè)基因含有2個(gè)內(nèi)含子,25個(gè)基因的相位類型為2-2型。保守結(jié)構(gòu)域系統(tǒng)進(jìn)化分析結(jié)果顯示,桑樹(shù)WRKY轉(zhuǎn)錄因子家族蛋白主要分為三大類(Ⅰ、Ⅱ和Ⅲ),I類可分為IN和Ic兩個(gè)亞組,Ⅱ類根據(jù)聚類情況又可分為Ⅱa、Ⅱb、Ⅱc、Ⅱd和Ⅱe等5個(gè)亞組。桑樹(shù)WRKY轉(zhuǎn)錄因子蛋白保守結(jié)構(gòu)域分析發(fā)現(xiàn)有五類Motif的保守性較強(qiáng),桑樹(shù)WRKY轉(zhuǎn)錄因子蛋白中均包含c端Motif 1,I類蛋白同時(shí)含有N端Motif 3。桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因啟動(dòng)子區(qū)富含PBF(C2H2鋅指因子)和AHL(擬南芥hook因子)元件。密碼子使用偏性分析結(jié)果顯示,桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因的有效密碼子數(shù)(ENC)介于48.00-60.00,密碼子第3位GC含量(GC3s)介于0.330-0.722,平均親水性值(Gravy)均為負(fù)值;同義密碼子相對(duì)使用度(RSCU)>I.000的密碼子有29個(gè),且以A(6個(gè))或T(11個(gè))結(jié)尾較G(4個(gè))或c(8個(gè))結(jié)尾的略多。[結(jié)論]桑樹(shù)WRKY轉(zhuǎn)錄因子家族包含55個(gè)成員,內(nèi)含子相位類型一致的同組成員可能來(lái)源于同一祖先基因,且與基因復(fù)制和基因組重排有關(guān);蛋白序列高度保守,在植物抵御環(huán)境脅迫過(guò)程中發(fā)揮作用;基因密碼子使用偏性較弱,主要受堿基突變選擇壓力影響。

關(guān)鍵詞:桑樹(shù);WRKY轉(zhuǎn)錄因子;密碼子使用偏性;系統(tǒng)進(jìn)化;生物信息學(xué)

0引言

[研究意義]WRKY轉(zhuǎn)錄因子家族是僅存于高等植物中的一類鋅指蛋白,參與植物的生長(zhǎng)發(fā)育,能對(duì)環(huán)境脅迫和病原侵染作出響應(yīng)。首先,WRKY轉(zhuǎn)錄因子蛋白在植物免疫反應(yīng)中發(fā)揮重要作用,是植物免疫系統(tǒng)各通路的中心組件,包括MTI、PTI、ETI、基本防御及系統(tǒng)獲得抗性(Birkenbihl et al.,2016)。其次,WRKY轉(zhuǎn)錄因子在植物的應(yīng)激反應(yīng)中也起關(guān)鍵作用,其網(wǎng)絡(luò)涉及生物和非生物脅迫的各組成部分(Eulgem,2006;Zhu et al.,2013)。WRKY轉(zhuǎn)錄因子家族基因過(guò)表達(dá)能增強(qiáng)植物對(duì)鹽和干旱脅迫的耐受性,同時(shí)增強(qiáng)抗病性(Oiu and Yu,2009)。此外,WRKY轉(zhuǎn)錄因子還在植物種子發(fā)芽、衰老及其他發(fā)育反應(yīng)中發(fā)揮重要作用(Rushton et al.,2010;Verweij et al.,2016)。密碼子使用偏性是指各種生物體偏愛(ài)使用三聯(lián)密碼子(編碼相同氨基酸的同義密碼子)的現(xiàn)象,普遍存在于生物界中,且物種的親緣關(guān)系越近密碼子使用偏性越相似;密碼子使用偏性還與基因表達(dá)、蛋白質(zhì)功能等密切相關(guān)。因此,研究密碼子使用偏性對(duì)開(kāi)展基因進(jìn)化壓力研究、基因表達(dá)水平預(yù)測(cè)及外源基因改良等均具有重要意義。[前人研究進(jìn)展]WRKY轉(zhuǎn)錄因子家族含有60個(gè)高度保守的氨基酸WRKY功能域,包含N端的WRKYGQK保守的氨基酸和C端非典型的鋅指結(jié)構(gòu)(Rushton et al.,2010)。根據(jù)WRKY結(jié)構(gòu)域數(shù)量和鋅指結(jié)構(gòu)氨基酸組成的不同,可將WRKY轉(zhuǎn)錄因子家族蛋白分為三大類:第1類含有2個(gè)WRKY結(jié)構(gòu)域,具有Cys2-His2型(CX46CX22-23HX1H)鋅指結(jié)構(gòu);第Ⅱ類和第Ⅲ類僅含有1個(gè)WRKY結(jié)構(gòu)域,其中第Ⅱ類的鋅指結(jié)構(gòu)與第1類的類似,第Ⅲ類的鋅指結(jié)構(gòu)為Cys2-His-Cys型(CXvCXE3HTC),根據(jù)保守氨基酸殘基的差異,第Ⅱ類又可分為5個(gè)亞類(Eulgem et al.,2000)。至今,已有多種植物WRKY轉(zhuǎn)錄因子家族基因被鑒定(Wu et al.,2005;Ross et al.,2007;Ling et al.,2011;Huang et aL,2012;Dmg et aL,2015;Song et al,2016;Zhang et al.,2016),并證實(shí)WRKY轉(zhuǎn)錄因子家族參與植物的多種生理生化過(guò)程,包括衰老(zhang et al.,2016)、纖維發(fā)育(Ding et al.,2015)、生物和非生物脅迫(Song et al.,2016;Wei et al.,2016)等。不同物種或同一物種不同基因問(wèn)的密碼子使用偏性不同,與基因在進(jìn)化過(guò)程中所面對(duì)的選擇壓力不同有關(guān)。物種在進(jìn)化過(guò)程中受基因突變壓力和自然選擇壓力的雙重影響,但由于二者在基因進(jìn)化過(guò)程中所發(fā)揮作用的權(quán)重不同,導(dǎo)致密碼子使用偏性具有物種特異性(趙洋等,2016;曲俊杰等,2017)。密碼子使用偏性與GC含量有關(guān)時(shí)表示受突變壓力影響(Chen et al.,2004),與翻譯過(guò)程有關(guān)時(shí)表示受正向選擇壓力影響(Sharp et al.,2010)。因此,通過(guò)優(yōu)化密碼子可提高外源基因在寄主細(xì)胞中的表達(dá)水平(周宗梁等,2012;Zelasko et al.,2013)。[本研究切入點(diǎn)]桑樹(shù)(Morus notabilis)是一種常見(jiàn)的落葉喬木,其葉片是桑蠶的主要飼料,桑皮可用作造紙?jiān)?,桑果可供食用或釀酒,在我?guó)多個(gè)省份均有栽培,但目前針對(duì)桑樹(shù)WRKY轉(zhuǎn)錄因子基因及其蛋白的研究鮮見(jiàn)報(bào)道。[擬解決的關(guān)鍵問(wèn)題]在桑樹(shù)基因組測(cè)序工作的基礎(chǔ)上,利用生物信息學(xué)方法全面預(yù)測(cè)分析桑樹(shù)基因組中WRKY轉(zhuǎn)錄因子家族結(jié)構(gòu)及其功能特征,為進(jìn)一步揭示W(wǎng)RKY轉(zhuǎn)錄因子家族生物學(xué)功能提供科學(xué)依據(jù)。

1材料與方法

1.1蛋白序列獲取與鑒定

桑樹(shù)全基因組蛋白序列從GenBank數(shù)據(jù)庫(kù)中搜索獲得,以擬南芥WRKY轉(zhuǎn)錄因子蛋白序列為探針,在桑樹(shù)全基因組蛋白數(shù)據(jù)庫(kù)中進(jìn)行BLASTp同源序列比對(duì)分析,通過(guò)NCBI在線工具CDD(https://www.ncbi.nlm.nih.gov/cdd)和Pfam數(shù)據(jù)庫(kù)(http://pfam.xfam.org/)進(jìn)行蛋白結(jié)構(gòu)域分析,并剔除無(wú)WRKY結(jié)構(gòu)域的蛋白序列。

1.2基因及其蛋白結(jié)構(gòu)分析

從NCBI中獲得桑樹(shù)WRKY轉(zhuǎn)錄因子基因序列和CDS序列,使用基因結(jié)構(gòu)顯示系統(tǒng)(http://gsds.cbi.pku.edu.cn/index.php)繪制基因結(jié)構(gòu)示意圖;通過(guò)MEME SUITE(http://meme-suite.org/tools/meme)預(yù)測(cè)桑樹(shù)WRKY轉(zhuǎn)錄因子蛋白序列保守氨基酸Motif,參數(shù)設(shè)為默認(rèn)值。

1.3基因啟動(dòng)子區(qū)特征分析

通過(guò)GenBank數(shù)據(jù)庫(kù)獲取桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因轉(zhuǎn)錄起始位點(diǎn)上游的2 kb序列,以JASPAR(http://iaspar.genereg.net/)數(shù)據(jù)庫(kù)分析啟動(dòng)子區(qū)富含轉(zhuǎn)錄調(diào)控基序。選擇植物啟動(dòng)子基序數(shù)據(jù)庫(kù)作為搜索數(shù)據(jù)庫(kù),相對(duì)閾值分?jǐn)?shù)選擇100%。

1.4蛋白系統(tǒng)進(jìn)化分析

所有桑樹(shù)WRKY家族蛋白通過(guò)Clustal x進(jìn)行比對(duì)分析,選取WRKY和鋅指結(jié)構(gòu)域保守序列,采用MEGA 5.0中的NJ(Neighbor-jioining)法構(gòu)建系統(tǒng)發(fā)育進(jìn)化樹(shù),參數(shù)選擇Bootstrap為1000。系統(tǒng)發(fā)育進(jìn)化樹(shù)的繪制與優(yōu)化使用Itol在線工具(http://itol.embl.de/)完成。

1.5基因密碼子使用偏性分析

利用CodonW 1.4.4對(duì)桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因CDS序列密碼子的使用偏性進(jìn)行分析,包括密碼子適應(yīng)指數(shù)(CAI)、有效密碼子數(shù)(ENC)、密碼子第3位GC含量(GC3s)和平均親水性值(Gravy)等參數(shù)。以GC3s為橫坐標(biāo)、ENC為縱坐標(biāo)繪制ENC-plot圖譜。圖譜中的曲線為ENC預(yù)期值,表示密碼子使用偏性僅由堿基組成決定,計(jì)算公式為:ENC=2+GC3s+29/[GC3s2+(1-GC3s)2]。分布點(diǎn)越靠近標(biāo)準(zhǔn)曲線表示密碼子使用偏性受堿基突變影響越大,越遠(yuǎn)離標(biāo)準(zhǔn)曲線表示密碼子使用偏性受自然選擇影響越大。使用EMBOSS explorer網(wǎng)站(http://emboss.toulouse.inra.fr/)在線軟件Cusp對(duì)同義密碼子的相對(duì)使用度(Relative synonymous codon usage,RSCU)進(jìn)行分析。

2結(jié)果與分析

2.1桑樹(shù)WRKY轉(zhuǎn)錄因子家族成員鑒定及其序列分析結(jié)果

基于桑樹(shù)全基因組蛋白數(shù)據(jù)庫(kù),經(jīng)BLASTp同源搜索和SMART保守結(jié)構(gòu)域鑒定,共獲得55個(gè)桑樹(shù)WRKV~錄因子基因(表1),占桑樹(shù)基因總數(shù)(29261)的1.88%。其中,蛋白氨基酸殘基數(shù)小于300 aa的基因序列占24%,介于300-650 aa的基因序列占71%,大于650 aa的基因序列占5%。

桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因存在6種內(nèi)含子數(shù)量類型(圖1)。其中,有27個(gè)基因含有2個(gè)內(nèi)含子,為數(shù)量最多的類型;有10個(gè)基因含有4個(gè)內(nèi)含子;WRKY9基因的內(nèi)含子數(shù)量達(dá)14個(gè),為內(nèi)含子數(shù)量最多的類型。桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因內(nèi)含子相位類型有15種,呈多樣性。其中,有25個(gè)基因的內(nèi)含子相位為2-2型,是基因數(shù)量最多的類型;有6個(gè)基因的內(nèi)含子相位為2型。進(jìn)化組Ⅰ和進(jìn)化組Ⅱc中的基因內(nèi)含子數(shù)量和相位類型較多樣,說(shuō)明組內(nèi)基因來(lái)源較復(fù)雜;進(jìn)化組Ⅱa、進(jìn)化組Ⅱb、進(jìn)化組Ⅱd、進(jìn)化組Ⅱe和進(jìn)化組Ⅲ中的基因結(jié)構(gòu)和內(nèi)含子相位類型高度一致,內(nèi)含子相位為2—2型,可能是由同一祖先基因復(fù)制而來(lái)。

2.2桑樹(shù)WRKY家族蛋白的系統(tǒng)進(jìn)化分析結(jié)果

利用MEGA 5.05對(duì)72個(gè)擬南芥WRKY轉(zhuǎn)錄因子蛋白和55個(gè)桑樹(shù)WRKY轉(zhuǎn)錄因子蛋白的保守結(jié)構(gòu)域序列進(jìn)行系統(tǒng)進(jìn)化分析,結(jié)果顯示,桑樹(shù)WRKY轉(zhuǎn)錄因子蛋白主要分為三大類(Ⅰ、Ⅱ和Ⅲ),其中,第Ⅰ類根據(jù)WRKY保守結(jié)構(gòu)域處于N端或C端,可分為ⅠN和ⅠC兩個(gè)亞組;第Ⅱ類根據(jù)聚類情況又可分為Ⅱa、Ⅱb、Ⅱc、Ⅱd和Ⅱe等5個(gè)亞組(圖2)。但MnWRKY49和MnWRKYlC未歸入以上分組。

2.3桑樹(shù)WRKY轉(zhuǎn)錄因子蛋白保守結(jié)構(gòu)域分析結(jié)果

使用MEME SUITE對(duì)桑樹(shù)WRKY轉(zhuǎn)錄因子保守氨基酸Motif進(jìn)行分析,結(jié)果發(fā)現(xiàn)有五類Moti啪保守性較強(qiáng),其正則表達(dá)式如圖3所示。其中,Motif 1是WRKY Motif,在桑樹(shù)WRKY轉(zhuǎn)錄因子家族中高度保守;Motif 3為進(jìn)化組I N端的WRKY保守結(jié)構(gòu)域;Motif 2為鋅指結(jié)構(gòu),僅MnWRKY28、MnWRKY43和MnWRKY54缺少該結(jié)構(gòu)域。55個(gè)WRKY轉(zhuǎn)錄因子蛋白均具有Motif 1,所有I類基因蛋白均具有Motif 1和Motif 3。Motif 4為未知結(jié)構(gòu)域,Motif 5為L(zhǎng)XsLXgLX3L基序,類似LRR結(jié)構(gòu)域,進(jìn)化組I、進(jìn)化組Ⅱa和進(jìn)化組Ⅱc的基因蛋白結(jié)構(gòu)包含Motif4,進(jìn)化組Ⅱa、進(jìn)化組Ⅱb和進(jìn)化組Ⅲ的基因蛋白結(jié)構(gòu)包含Motif 5。部分桑樹(shù)WRKY轉(zhuǎn)錄因子保守結(jié)構(gòu)域和鋅指結(jié)構(gòu)存在變異,如進(jìn)化組Ⅱc中MnWRKY50和MnWRKY51的保守結(jié)構(gòu)域?yàn)閃RKYGKK,MnWRKY28和MnWRKY54的鋅指結(jié)構(gòu)缺少CX.sCX22.23部分,進(jìn)化組Ⅲ中MnWRKYl9和MnWRKY23的鋅指結(jié)構(gòu)分別為CX7CX23HRC和CX7CX23HIC,保守氨基酸殘基發(fā)生變異。

2.4桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因啟動(dòng)子區(qū)特征分析結(jié)果

桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因啟動(dòng)子區(qū)均含有PBF結(jié)合元件(AAAGC),每個(gè)基因啟動(dòng)子平均含有4.8個(gè)元件(表2),PBF屬于Dof家族C2H2鋅指因子類,有助于bZIP轉(zhuǎn)錄因子結(jié)合DNA(Vicente-Carb aiosaet al.,1997);另外兩種C2H2鋅指因子類(DOF2.4和DOF5.3)含量也較高。55個(gè)桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因中有28個(gè)基因的啟動(dòng)子區(qū)含有AHL20結(jié)合元件(AATTAAAT),AHLl2與AHL20轉(zhuǎn)錄因子均屬于擬南芥hook因子,能特異性結(jié)合與核基質(zhì)附著相關(guān)且富含AT的DNA序列,通過(guò)下調(diào)PAMP引發(fā)的NH01和FRKl可負(fù)調(diào)控植物對(duì)病原菌的先天性免疫作用(Lu et al.,2010)。此外,部分桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因啟動(dòng)子區(qū)含有bZIP、ERF、GT-1、MYB、TGA和WRKY轉(zhuǎn)錄因子結(jié)合序列。

2.5桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因密碼子使用偏性分析結(jié)果

為了解桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因密碼子使用偏性,對(duì)ENC、GC3s和Gravy等參數(shù)進(jìn)行分析,結(jié)果發(fā)現(xiàn),桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因ENC介于48.00-60.00,GC3s介于0.330-0.722,Gravy均為負(fù)值(表3),表明桑樹(shù)WRKY轉(zhuǎn)錄因子蛋白均為親水性蛋白,且多數(shù)具有強(qiáng)親水性。

ENC與GC3s的關(guān)聯(lián)分析結(jié)果顯示,基因分布越靠近ENC-plot圖譜標(biāo)準(zhǔn)曲線表示密碼子使用受堿基突變壓力影響越大,基因分布在標(biāo)準(zhǔn)曲線下方或遠(yuǎn)離曲線,表示基因受自然選擇壓力影響越大。GC3s分布則反映植物所受的選擇壓力,GC3s分布越廣泛,表明密碼子使用偏性受堿基突變壓力越大,GC3s分布范圍越小,表明密碼子使用偏性受正向選擇壓力影響越大(Kawabe and Mivashita,2003)。由圖4可知,桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因的GC3s介于0.330-0.722,分布較廣泛,且多數(shù)基因ENC分布在標(biāo)準(zhǔn)曲線下方,表明桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因同時(shí)受到堿基突變和正向選擇壓力的影響。

RSCU是同義密碼子實(shí)際使用量與理論使用量的比值。RSCU>1.000,表示密碼子使用頻率高于其他同義密碼子;反之則使用頻率低。由表4可知,RSCU>I.000的密碼子有29個(gè),且以A(6個(gè))或T(11個(gè))結(jié)尾較G(4個(gè))或C(8個(gè))結(jié)尾的略多,說(shuō)明桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因的密碼子使用偏性較弱,略偏好A或T結(jié)尾。

3討論

WRKY轉(zhuǎn)錄因子蛋白為植物特有轉(zhuǎn)錄因子家族,廣泛參與植物多種生物學(xué)進(jìn)程的調(diào)控。至今,多個(gè)已完成基因組測(cè)序植物的WRKY轉(zhuǎn)錄因子家族基因被鑒定,番茄基因組中有81個(gè)WRKY轉(zhuǎn)錄因子家族基因(Wu et al.,2005),黃瓜有55個(gè)WRKY轉(zhuǎn)錄因子家族基因(Ross et al.,2007),大豆有176個(gè)WRKY轉(zhuǎn)錄因子家族基因(Ling et al.,2011),棉花有113個(gè)WRKY轉(zhuǎn)錄因子家族基因(Huang et al.,2012),粳稻有98個(gè)WRKY轉(zhuǎn)錄因子基因(周宗梁等,2012),擬南芥有72個(gè)WRKY轉(zhuǎn)錄因子家族基因(Zelasko et al.,2013),蘋(píng)果有132個(gè)WRKY家族基因(谷彥冰等,2015)。Baranwal等(2016)研究發(fā)現(xiàn),桑樹(shù)基因組中含有54個(gè)WRKY轉(zhuǎn)錄因子基因。同一家族基因的數(shù)量與植物進(jìn)化過(guò)程中基因復(fù)制、基因組重排等有關(guān),如水稻、番茄、蘋(píng)果和棉花的WRKY轉(zhuǎn)錄因子家族均存在基因復(fù)制現(xiàn)象(Wu et al.,2005;Huang et al.,2012;周宗梁等,2012),但在WRKY轉(zhuǎn)錄因子數(shù)量較少的黃瓜中未發(fā)現(xiàn)基因復(fù)制現(xiàn)象(Ross et al.,2007)。WRKY轉(zhuǎn)錄因子基因數(shù)目除了與物種基因組有關(guān)外,還與植物進(jìn)化過(guò)程中所受的環(huán)境壓力有關(guān)。本研究結(jié)果顯示,桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因數(shù)量為55個(gè),屬于WRKY轉(zhuǎn)錄因子家族基因相對(duì)較少的物種類型,說(shuō)明進(jìn)化過(guò)程中該家族基因受到的環(huán)境壓力較小。

基因結(jié)構(gòu)中內(nèi)含子數(shù)量及相位類型是研究基因進(jìn)化的重要證據(jù)。根據(jù)剪接中位置的不同,內(nèi)含子分為3種相位類型,0型內(nèi)含子位于2個(gè)密碼子之間,1型內(nèi)含子位于密碼子的第1和第2堿基之間,2型內(nèi)含子位于密碼子的第2和第3堿基之間(Sharp,1981)。內(nèi)含子相位的改變會(huì)導(dǎo)致后續(xù)閱讀框發(fā)生變化,因此內(nèi)含子的相位通常比較保守。本研究中,桑樹(shù)WRKY家族蛋白主要分為三大類(Ⅰ、Ⅱ和Ⅲ),且有2個(gè)蛋白(MnWRKY49和MnWRKYlC)未進(jìn)行分組,與Baranwal等(2016)將桑樹(shù)WRKY轉(zhuǎn)錄因子家族分為四類的研究結(jié)果基本一致。本研究還發(fā)現(xiàn),同一進(jìn)化組的基因結(jié)構(gòu)內(nèi)含子數(shù)量和相位類型高度一致,進(jìn)化組Ⅱa和進(jìn)化組Ⅱb的內(nèi)含子相位類型全部為0型,進(jìn)化組Ⅱd、進(jìn)化組Ⅱe和進(jìn)化組Ⅲ全部為2型。約50%桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因包含2個(gè)內(nèi)含子,其中有25個(gè)基因的內(nèi)含子相位為2-2型,分別屬于進(jìn)化組Ⅱc、進(jìn)化組Ⅱd、進(jìn)化組Ⅱe和進(jìn)化組Ⅲ,推測(cè)其來(lái)源于共同的祖先基因。

本研究的系統(tǒng)進(jìn)化分析結(jié)果顯示,桑樹(shù)WRKY家族蛋白主要分為三大類,Ⅱ類又分為5個(gè)亞組。所有成員均含有保守基序WRKYGQK(MnWRKY50和MnWRKY51為WRKYGKK外),Ⅰ類和Ⅱ類還包含有保守的鋅指結(jié)構(gòu)C2H2(除MnWRKY28和Mn-WRKY54缺少外),Ⅲ類的鋅指結(jié)構(gòu)為C2HC。Rinerson等(2015)研究認(rèn)為,植物中WRKY轉(zhuǎn)錄因子家族基因存在兩種可能的起源方式,一種起源于Ⅰ類蛋白C端WRKY結(jié)構(gòu)域,一種起源于藻類Ⅱa或Ⅱb的某一蛋白結(jié)構(gòu)域。桑樹(shù)WRKY轉(zhuǎn)錄因子蛋白保守結(jié)構(gòu)域分析發(fā)現(xiàn)有五類Motif的保守性較強(qiáng),所有桑樹(shù)WRKY蛋白中均包含C端Motif 1,Ⅰ類蛋白同時(shí)含有N端Motif 3。進(jìn)化組Ⅱa、進(jìn)化組Ⅱb和進(jìn)化組Ⅲ中含有類似LRR結(jié)構(gòu)域的Motif 5??梢?jiàn),植物WRKY轉(zhuǎn)錄因子基因家族結(jié)構(gòu)上高度保守,桑樹(shù)WRKY轉(zhuǎn)錄因子可能起源于I類基因蛋白C端WRKY結(jié)構(gòu)域。

WRKY蛋白特異性結(jié)合DNA的最小基序TTGAC(C/T)稱作W-box。多數(shù)WRKY轉(zhuǎn)錄因子的目標(biāo)基因啟動(dòng)子中均含有數(shù)量不定的W-box,彼此間或同向排列或形成回文結(jié)構(gòu),WRKY轉(zhuǎn)錄因子與其結(jié)合,而調(diào)節(jié)下游功能基因或其他轉(zhuǎn)錄因子的表達(dá)(Eulgem et al.,2000)。一些植物WRKY轉(zhuǎn)錄因子家族基因啟動(dòng)子中也存在W-box,如擬南芥WRKYl8啟動(dòng)子中的W-box是起負(fù)調(diào)控作用的順式作用元件,能阻止擬南芥WRKYl8在抗病期間的過(guò)量表達(dá),從而緩解該基因?qū)χ参锷L(zhǎng)造成的影響(Chen andChen,2002)。多種WRKY轉(zhuǎn)錄因子可形成復(fù)合物以調(diào)控植物的抗病性。Baranwal等(2016)研究發(fā)現(xiàn),桑樹(shù)WRKY基因上游啟動(dòng)子區(qū)富含AAAG、GAAAA和AGAAA等序列。本研究也發(fā)現(xiàn)桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因啟動(dòng)子區(qū)的AAAGC、AAAAAGT和GAAAAAG數(shù)量較多,且部分桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因啟動(dòng)子區(qū)含有bZIP、ERF、GT-1、MYB、TGA和WRKY轉(zhuǎn)錄因子結(jié)合序列,而這些轉(zhuǎn)錄因子大多與逆境脅迫有關(guān)。

桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因同時(shí)受堿基突變和正向選擇壓力的影響,其中以堿基突變選擇壓力占主導(dǎo)地位?;蛎艽a子使用偏性與植物基因組組成及其所處的脅迫環(huán)境有直接關(guān)系(宋輝等,2015)。雙子葉植物偏好A/T結(jié)尾的密碼子,單子葉植物偏好G/C結(jié)尾的密碼子(Tatarinova et al.,2010),偏性強(qiáng)的基因偏好使用G/C結(jié)尾的密碼子(Gu0 et al.,2007)。桑樹(shù)屬于雙子葉植物,雖然RSCU>1.000的密碼子中以A/T結(jié)尾的略多,但密碼子使用偏性并不強(qiáng),多數(shù)屬于低表達(dá)基因。Baranwal等(2016)研究發(fā)現(xiàn),桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因表達(dá)具有器官特異性,在54個(gè)WRKY轉(zhuǎn)錄因子家族基因中有13個(gè)基因在根部表達(dá),25個(gè)基因在樹(shù)皮中表達(dá),10個(gè)在雄蕊中表達(dá),但總體來(lái)看,檢測(cè)到的表達(dá)基因數(shù)目較少,基因相對(duì)表達(dá)倍數(shù)不高。這在本研究中得到進(jìn)一步證實(shí),即桑樹(shù)WRKY轉(zhuǎn)錄因子家族基因密碼子使用偏性較弱。

4結(jié)論

桑樹(shù)WRKY轉(zhuǎn)錄因子家族包含55個(gè)成員,內(nèi)含子相位類型一致的同組成員可能來(lái)源于同一祖先基因,且與基因復(fù)制和基因組重排事件有關(guān);蛋白序列高度保守,多數(shù)含有完整的WRKYGQK和鋅指結(jié)構(gòu),在植物抵御環(huán)境脅迫過(guò)程中發(fā)揮作用;基因密碼子使用偏性較弱,主要受堿基突變選擇壓力影響,多數(shù)屬于低表達(dá)基因,表明桑樹(shù)受環(huán)境脅迫壓力較小。

猜你喜歡
生物信息學(xué)桑樹(shù)
馬桑樹(shù)兒搭燈臺(tái)
桑樹(shù)變身增收“搖錢(qián)樹(shù)”
會(huì)東縣桑樹(shù)快速豐產(chǎn)栽培技術(shù)探索
奶奶家的桑樹(shù)
淺談醫(yī)學(xué)院校生物信息學(xué)專業(yè)青年教師規(guī)范培訓(xùn)模式的建立
“PBL+E—learning”教學(xué)模式探索
移動(dòng)教學(xué)在生物信息學(xué)課程改革中的應(yīng)用
今傳媒(2016年11期)2016-12-19 11:35:50
中醫(yī)大數(shù)據(jù)下生物信息學(xué)的發(fā)展及教育模式淺析
數(shù)據(jù)挖掘技術(shù)在生物信息學(xué)中的應(yīng)用
生物信息學(xué)課堂危機(jī)及對(duì)策研究
科技視界(2016年23期)2016-11-04 10:07:53
盘山县| 洛南县| 雷山县| 策勒县| 灵山县| 庄河市| 奇台县| 龙山县| 海林市| 岫岩| 忻城县| 灌云县| 安溪县| 从江县| 昭苏县| 隆尧县| 阜宁县| 朔州市| 苏尼特右旗| 华坪县| 怀化市| 江永县| 都昌县| 肇源县| 梅河口市| 辽阳市| 工布江达县| 砚山县| 射阳县| 松桃| 孝感市| 丹东市| 江北区| 治县。| 门源| 沁源县| 民权县| 兴义市| 苍梧县| 临武县| 泗水县|