宋輝,南志標(biāo)
蘭州大學(xué)草地農(nóng)業(yè)科技學(xué)院,蘭州 730020
WRKY基因家族是一類只存在于植物的轉(zhuǎn)錄因子,主要參與植物體內(nèi)轉(zhuǎn)錄調(diào)控和許多信號轉(zhuǎn)導(dǎo)過程[1]。WRKY通常含有長約60個氨基酸序列的保守區(qū)域,該區(qū)域內(nèi)一般含有保守的WRKYGQK七肽序列和緊隨其后的保守鋅指基序(Zinc finger motif)[2]。正是由于WRKYGQK保守七肽序列的存在,人們習(xí)慣上把含有這段保守序列的轉(zhuǎn)錄因子稱為 WRKY轉(zhuǎn)錄因子或WRKY基因[3]。目前的研究發(fā)現(xiàn),WRKY結(jié)構(gòu)域的C末端主要存在兩種不同類型的保守鋅指基序[4],即C-X4-5-C-X22-23-H-X-H(C2H2)和C-X5-8-CX25-28-H-X1-2-C(C2HC)。根據(jù)WRKY結(jié)構(gòu)域的數(shù)量和兩種不同類型的保守鋅指基序,一般將WRKY基因分為3種類型,即含有2個WRKY結(jié)構(gòu)域的Ⅰ型基因、含有1個WRKY結(jié)構(gòu)域和C2H2基序(Motif)的Ⅱ型基因和含有1個WRKY結(jié)構(gòu)域和C2HC基序的Ⅲ型基因[2]。另外,WRKY轉(zhuǎn)錄因子通常與目標(biāo)基因上游啟動子區(qū)域的順式作用元件W-box相結(jié)合起到轉(zhuǎn)錄調(diào)控的作用[2,3,5]。但是,有研究表明[6,7],WRKY轉(zhuǎn)錄因子還與SURE順式作用元件結(jié)合發(fā)揮作用,因此推測SURE可能是另一類與WRKY轉(zhuǎn)錄因子相結(jié)合的重要順式作用元件。
自 1994年 Ishiguro 和 Nakamura[8]從甘薯(Ipomoea batatasL.) 基因組中分離出WRKY基因的cDNA序列以來,研究者們相繼從擬南芥(Arabidopsis thaliana)[2,9]、馬鈴薯(Solanum tuberosumL.)[10]、亞洲棉(Gossypium arboretumL.)[11]、水稻(Oryza sativaL.)[12]、大麥(Hordeum vulgareL.)[6]、小立碗蘚(Physcomitrella patens)[13]、楊樹(Populus tremula×Populus alba)[14]、向日葵(Helianthus annuusL.)[15]、黃瓜(Cucumis sativusL.)[16]和二穗短柄草(Brachypodium distachyonL.)[17]等植物基因組中鑒定出WRKY基因。在對這些WRKY基因進(jìn)行功能驗證的過程中,研究者們發(fā)現(xiàn)WRKY基因廣泛參與各種生理生化反應(yīng),包括生物脅迫和非生物脅迫以及植物的發(fā)育[1,2]。例如,當(dāng)植物受到傷害[18]、紫外線照射[19]、干旱、鹽害、低溫和高溫[20,21]以及病原菌侵染[22]等脅迫時,WRKY基因的表達(dá)量都會上調(diào)。同時,WRKY基因家族在植物種子發(fā)芽[23]、植株衰老[24]、休眠[25]等方面也具有重要的生理應(yīng)答。
既然WRKY基因家族參與如此多的調(diào)控,勢必要求WRKY原始基因在漫長的進(jìn)化過程中分化出不同功能的基因。基因重復(fù)(Gene duplication) 是植物在長期的進(jìn)化過程中逐步形成的一種機制,主要是通過基因不等交換、逆轉(zhuǎn)錄轉(zhuǎn)座或全基因組重復(fù)等途徑產(chǎn)生一個與原基因相似的基因或堿基序列[26]?;驈?fù)制主要分為兩種形式,一種是串聯(lián)重復(fù)(Tandem duplication),一種是片段重復(fù)(Segmental duplication)。基因重復(fù)事件在基因擴張中具有重要的作用,尤其是串聯(lián)重復(fù),基因家族中一些不同功能的基因很有可能是由于串聯(lián)重復(fù)產(chǎn)生的[27]。例如,對大豆(Glycine maxL.)[28]和毛果楊(Populus trichocarpa)[29]WRKY基因家族進(jìn)行分析時發(fā)現(xiàn),其數(shù)量眾多的WRKY基因是通過串聯(lián)重復(fù)產(chǎn)生的。
蒺藜苜蓿(Medicago truncatulaL.)作為優(yōu)良的牧草在全世界范圍內(nèi)被廣泛地種植。由于其具有基因組較小、二倍體、自花授粉、易于轉(zhuǎn)化、再生時間較短等特點被作為豆科模式植物進(jìn)行研究[30]。本研究利用生物信息學(xué)方法對蒺藜苜蓿全基因組中的WRKY基因家族的基因重復(fù)、染色體定位、系統(tǒng)發(fā)生、保守基序和 EST表達(dá)模式等進(jìn)行分析,希望該研究結(jié)果能為以后在豆科植物的育種過程中提供重要的理論依據(jù)。
本研究以蒺藜苜蓿全基因組序列(Mt3.5v5) 為研究對象,基因組序列從蒺藜苜蓿公布測序結(jié)果的網(wǎng)站獲得(http://www.medicago.org)。將下載到的蒺藜苜蓿蛋白質(zhì)序列使用BLAST構(gòu)建本地數(shù)據(jù)庫,以Pfam數(shù)據(jù)庫(http://pfam.janelia.org) 中WRKY結(jié)構(gòu)域(PF03106)為查詢序列進(jìn)行BLAST搜索(P-value=10-3)[31,32]。利用 Clustal W 程序[33]對所確定的 WRKY序列進(jìn)行多序列比對(Multiple sequence alignment),手工去除冗余序列和不完整讀碼框的序列。使用Pfam數(shù)據(jù)庫對WRKY蛋白質(zhì)序列進(jìn)行結(jié)構(gòu)域檢測,去除不含WRKY結(jié)構(gòu)域的序列。
利用本地 BLAST程序(P-value=10-10) 對蒺藜苜蓿WRKY基因家族進(jìn)行基因重復(fù)分析[31,34]?;蛑貜?fù)事件必須同時滿足以下條件[35]:(1) 在核苷酸序列比對區(qū)域中,相對短的核苷酸序列必須覆蓋相對長的核苷酸序列的70%以上;(2) 在氨基酸序列比對區(qū)域中,兩條氨基酸的相似度要達(dá)到70%以上。
蒺藜苜蓿WRKY基因在每條染色體上的定位信息由蒺藜苜蓿公布基因組序列網(wǎng)站中的 BLAST程序進(jìn)行確認(rèn),其染色體物理定位圖使用 MapInspect程序進(jìn)行繪制。
為了解蒺藜苜蓿WRKY基因的系統(tǒng)發(fā)生關(guān)系,通過Clustal X程序[36]對蒺藜苜蓿WRKY結(jié)構(gòu)域進(jìn)行多序列比對,使用 MEGA 4.0程序[37]構(gòu)建系統(tǒng)進(jìn)化樹。系統(tǒng)進(jìn)化樹采用鄰接法(NJ),Bootstrap值設(shè)置為1 000。
使用在線程序 PAL2NAL計算蒺藜苜蓿WRKYⅢ基因在進(jìn)化中的選擇壓力。如果Ka/Ks>1,表示基因經(jīng)受正選擇壓力;Ka/Ks=1,表示基因經(jīng)受中性選擇壓力;Ka/Ks<1,表示基因受純化選擇壓力。
先前的研究表明,WRKY結(jié)構(gòu)域中主要含有兩種不同類型的保守內(nèi)含子[2]。本研究采用在線程序GSDS分析蒺藜苜蓿WRKY結(jié)構(gòu)域的基因結(jié)構(gòu)。
在線程序 MEME[38]可以很好的分析基因的基序。本研究將蒺藜苜蓿 WRKY蛋白質(zhì)序列提交到MEME網(wǎng)站預(yù)測WRKY基因的基序。在線程序MEME的參數(shù)設(shè)置為:(1) 基序重復(fù)的數(shù)量為“any”;(2) 基序的長度為6~200;(3) 預(yù)測基序的數(shù)量為20。
為了預(yù)測蒺藜苜蓿WRKY基因的表達(dá)情況,本研究從NCBI網(wǎng)站的GenBank中下載了所有蒺藜苜蓿的EST序列。通過構(gòu)建蒺藜苜蓿EST本地數(shù)據(jù)庫,以蒺藜苜蓿WRKY基因為查詢序列進(jìn)行本地BLAST搜索(P-value=10-10)[34]。比對結(jié)果符合以下條件的被認(rèn)為是假定的EST表達(dá)模式(EST expression profile):(1)在比對區(qū)域內(nèi),兩序列的相似度在 96%以上;(2)在比對區(qū)域內(nèi),核苷酸序列的長度在200 bp以上。
通過使用本地 BLAST程序?qū)疝架俎H蚪M進(jìn)行篩選,共分離到93條含有完整讀碼框的候選WRKY序列。經(jīng)過Pfam數(shù)據(jù)庫檢測發(fā)現(xiàn),這93條候選序列均含有 WRKY結(jié)構(gòu)域。但是,其中 12個WRKY結(jié)構(gòu)域中含不完整的WRKYGQK七肽序列或不完整的保守鋅指基序。因此,本文把這些基因定義為非標(biāo)準(zhǔn)WRKY類型基因。與此相對,其他的WRKY基因(81個) 定義為標(biāo)準(zhǔn)WRKY類型基因。
依據(jù)對WRKY基因分類的標(biāo)準(zhǔn)[2],本研究發(fā)現(xiàn),這93條候選序列中有20條序列含有2個WRKY結(jié)構(gòu)域。其中,19個屬于標(biāo)準(zhǔn)WRKY基因,定義為Ⅰ型,1個含有非標(biāo)準(zhǔn)的WRKY結(jié)構(gòu)域。此外,其他73條候選序列均只含有一個WRKY結(jié)構(gòu)域。其中,11個基因含有非標(biāo)準(zhǔn) WRKY結(jié)構(gòu)域,而另外 62個基因中有49個基因含有C2H2保守鋅指基序,13個含有C2HC保守鋅指基序,分別將其定義為Ⅱ型和Ⅲ型基因(表1,表 2)。
研究表明[2],Ⅱ型的WRKY基因可以細(xì)分為 5個亞組,即Ⅱa、Ⅱb、Ⅱc、Ⅱd和Ⅱe。本文以已公布的擬南芥WRKYⅡ型基因作為參考序列與蒺藜苜蓿WRKYⅡ型基因共同構(gòu)建系統(tǒng)發(fā)育樹,從而鑒別出蒺藜苜蓿WRKYⅡ型基因的5個亞組。由圖1可知,蒺藜苜蓿WRKY基因(MtWRKY) 包括6個Ⅱa、8個Ⅱb、19個Ⅱc、8個Ⅱd和8個Ⅱe,其中Ⅱc被分為Ⅱc1(5個) 和Ⅱc2(14個) 兩個分支。
表1 蒺藜苜蓿WRKY基因的特征
續(xù)表1
表2 7種植物中WRKY基因的分類和數(shù)目
蒺藜苜蓿93個WRKY基因在8條染色體上的物理定位信息見圖2。由于蒺藜苜?,F(xiàn)在尚未完成全基因組測序,所以有些基因暫時無法定位在具體的染色體上,本研究暫時將這些基因定位在假設(shè)的 0號染色體上。
由圖2可知,蒺藜苜蓿WRKY基因在染色體上呈不均等分布。其中7號染色體上所含的WRKY基因最多,多達(dá)18個,而6號染色體上分布的WRKY基因最少,僅有2個。值得注意的是,分布在1號染色體上的6個WRKY基因均為Ⅱ型。另外,6個WRKYⅡ型基因和1個WRKYⅢ型基因分布在8號染色體上。有研究表明[4],Ⅲ型的WRKY基因的起源晚于Ⅱ型的WRKY基因?;谶@種觀點,結(jié)合蒺藜苜蓿WRKY基因在8號染色體上的物理定位,推測WRKYⅢ型基因可能是由于Ⅱ型基因經(jīng)過基因突變而形成的。
根據(jù)Holub[39]對基因簇(Gene cluster) 的定義:在200 kb核苷酸序列區(qū)域內(nèi),含有3個或3個以上的基因定義為一個基因簇。最終,本研究在蒺藜苜蓿WRKY基因中發(fā)現(xiàn)了 6個基因簇共包括17個基因。其中,最大的一個基因簇含有5個基因分布在2號染色體上。此外,每個基因簇平均含有3.4個基因(表3)。
在蒺藜苜蓿WRKY基因中共檢測到11個基因復(fù)制事件,涉及24個基因,占全部WRKY基因的26%。其中,4個基因?qū)儆谄沃貜?fù),20個基因?qū)儆诖?lián)重復(fù)(圖2,表3)。另外,單基因占全部基因的74%,表明在蒺藜苜蓿中這些WRKY基因的形成可能主要不是依賴基因重復(fù)完成的。
分別對蒺藜苜蓿3種類型的WRKY結(jié)構(gòu)域進(jìn)行多序列比對,結(jié)果顯示,除了Ⅰc、Ⅱc和Ⅱd型的結(jié)構(gòu)域在 WRKYGQK七肽序列結(jié)構(gòu)上呈現(xiàn)多樣性之外,其他類型的 WRKY結(jié)構(gòu)域均含有一致序列WRKYGQK。其中,在Ⅰc型結(jié)構(gòu)域中發(fā)現(xiàn) Q突變成 R,形成 WRKYGRK七肽序列; 而在Ⅱd型結(jié)構(gòu)域中Q突變成S,形成WRKYGSK七肽序列。除此之外,在Ⅱc型結(jié)構(gòu)域中WRKYGQK七肽序列的一致性最差,該序列分別突變成以下 6種類型,即WKKYGEE、WRKYGEQ、WRKYGEK、WRKYGKK、WKKYEEK 和 WLKYDRK(圖 3)。
眾所周知,在WRKY結(jié)構(gòu)域中除了含有保守的七肽序列WRKYGQK之外,在該七肽序列之后還包括一個保守的鋅指基序(C2H2或者 C2HC)[2]。本研究結(jié)果表明,只有在Ⅲ型的 WRKY結(jié)構(gòu)域中存在C2HC基序,在其他類型的 WRKY結(jié)構(gòu)域中只含有C2H2基序。該結(jié)果與之前對水稻的研究結(jié)果略有不同,在水稻中發(fā)現(xiàn)個別In型的氨基酸序列中除了含有 C2H2之外還具有C2HC基序[12,40]。這或許與不同植物中該類型基因發(fā)揮不同的作用有關(guān)系。
蒺藜苜蓿WRKY基因系統(tǒng)發(fā)育樹顯示(圖 4a),雖然系統(tǒng)發(fā)育樹中有些自舉值(Bootstrap) 偏低,但是系統(tǒng)發(fā)育樹根據(jù) WRKY結(jié)構(gòu)域的分類可以明顯的分為 6個分支,這說明此系統(tǒng)發(fā)育樹的拓?fù)浣Y(jié)構(gòu)基本正確。其中,Ⅰn和Ⅰc分支分別是Ⅰ型WRKY結(jié)構(gòu)域兩種類型的聚類(n表示多肽鏈N端的WRKY結(jié)構(gòu)域,c表示多肽鏈C端的WRKY結(jié)構(gòu)域),Ⅱ型結(jié)構(gòu)域分別在Ⅱa、Ⅱb、Ⅱc、Ⅱd和Ⅱe分支上。此外,Ⅲ型的成員比較保守,全部分布在Ⅲ分支上(圖4a)。
圖1 擬南芥與蒺藜苜蓿WRKY結(jié)構(gòu)域系統(tǒng)進(jìn)化樹
圖2 蒺藜苜蓿WRKY基因在染色體上的定位信息
表3 蒺藜苜?;蚪M中WRKY基因的組成
Zhang等[4]通過研究 5種植物WRKY基因的系統(tǒng)發(fā)育關(guān)系發(fā)現(xiàn),Ⅱa和Ⅱb聚集在一個大分支上,而Ⅱd和Ⅱe聚集在另一個大分支上。這個結(jié)果與本文分析蒺藜苜蓿 WRKY結(jié)構(gòu)域構(gòu)建的系統(tǒng)發(fā)育樹相同。此外,本研究中Ⅱc與Ⅰc聚集在一個大分支上,甚至有一個Ⅱc型的基因(MtWRKY4) 聚集在Ⅰc分支上(圖4a),這表明它們可能有共同的起源。但是,也有部分Ⅱc型的基因(MtWRKY2、29、53和60) 并沒有聚集在Ⅱc分支上。其中,MtWRKY2、29和60聚集在Ⅰn分支上,而MtWRKY60聚集在Ⅱd和Ⅱe的大分支上(圖4a),這表明Ⅱc型的基因可能存在不同的起源。
圖3 蒺藜苜蓿WRKY結(jié)構(gòu)域的氨基酸多序列比對
蒺藜苜蓿 WRKY結(jié)構(gòu)域的基因結(jié)構(gòu)主要分為兩種類型:一種含有內(nèi)含子,另一種不含內(nèi)含子。由圖4b可知,在系統(tǒng)進(jìn)化樹中聚集在Ⅰn的WRKY結(jié)構(gòu)域均不含有內(nèi)含子結(jié)構(gòu),這進(jìn)一步支持了作為Ⅱc型的MtWRKY2、29 和60基因聚集在Ⅰn的結(jié)果。此外,雖然其他WRKY結(jié)構(gòu)域含有不同長度的內(nèi)含子,但是,根據(jù)內(nèi)含子的類型可將其分為兩大類。其中,Ⅱa和Ⅱb型的WRKY結(jié)構(gòu)域具有同一個保守的內(nèi)含子結(jié)構(gòu),而Ⅰc、Ⅱc、Ⅱe和Ⅲ擁有另外一種類型的保守內(nèi)含子結(jié)構(gòu)(圖 4b)。但是,在Ⅱe中,MtWRKY9 卻不含有內(nèi)含子結(jié)構(gòu),這可能是由于其 WRKY結(jié)構(gòu)域中的內(nèi)含子在進(jìn)化過程中丟失造成的。
WRKY基因家族中Ⅲ型基因被認(rèn)為是這3種類型的基因中最“年輕”的成員。為了檢測哪種選擇壓力影響了蒺藜苜蓿WRKY基因家族中Ⅲ型基因的產(chǎn)生,本文對這些基因分別進(jìn)行了同義替換率(Ka)和非同義替換率(Ks) 的計算。由圖5可知,Ka/Ks<1,表示蒺藜苜蓿WRKY基因家族中Ⅲ型基因的進(jìn)化經(jīng)受純化選擇壓力。由此可知,Ⅲ型的基因在結(jié)構(gòu)上比較保守。
通過對81個標(biāo)準(zhǔn)WRKY基序預(yù)測的結(jié)果顯示,每一個類型的 WRKY所包含基序的類型各不相同(圖6,表4)。通過使用pfam數(shù)據(jù)庫檢測這些基序的功能發(fā)現(xiàn),只有motif1~6是WRKY結(jié)構(gòu)域的組成部分,而其他的基序在數(shù)據(jù)庫中暫無功能記錄。進(jìn)一步分析這些基序發(fā)現(xiàn),在Ⅰn和Ⅰc型氨基酸序列中,含有WRKYGQK七肽序列的基序(motif1或motif2)兩側(cè)的基序的類型各不相同。這表明,雖然Ⅰ型氨基酸序列中存在兩個WRKY結(jié)構(gòu)域,但它們在起源或功能分化上可能完全不同。另外,雖然Ⅱa-e隸屬于Ⅱ型基因的 5個亞型,但是每一個亞型的基序數(shù)量卻不相同。例如,在Ⅱa和Ⅱb中均含有較多的基序,而Ⅱc和Ⅱe中卻含有較少的基序(圖6)。值得注意的是,在Ⅲ型氨基酸序列中存在一個有趣的現(xiàn)象,MtWRKY22、23、24和75這4個基因中的N末端和C末端分別存在一個相同的基序(motif20)。這種結(jié)構(gòu)在其他類型的WRKY中尚未發(fā)現(xiàn),這可能在功能域發(fā)揮作用時具有重要作用。
圖4 蒺藜苜蓿中WRKY基因的系統(tǒng)發(fā)育樹和基因結(jié)構(gòu)
圖5 WRKY基因家族中Ⅲ類型Ka/Ks與Ka的關(guān)系
表達(dá)序列標(biāo)簽(Expressing sequence tag,EST)被認(rèn)為是一種研究基因表達(dá)模式最為有效的方法[41]。本文從GenBank中下載了全部250 000條蒺藜苜蓿的EST序列。通過使用蒺藜苜蓿93個WRKY基因與這些EST進(jìn)行比對,結(jié)果發(fā)現(xiàn),有60個WRKY基因在EST數(shù)據(jù)庫的種子、芽、莖、腺毛、葉、根、組培細(xì)胞和組織或器官中找到了支持的表達(dá)模式(表5)。其中,WRKY基因與組織或器官中EST相匹配的表達(dá)模式最多,多達(dá)51個,而在種子的EST中只檢測到3個相匹配的WRKY基因。值得注意的是,此處的組織或器官可能包括種子、芽、莖、腺毛、葉、根和組培細(xì)胞,但還可能包括未列出的組織或器官,如花等。此外,在這60個有表達(dá)模式的WRKY基因中,包含Ⅱ型的基因最多,高達(dá) 32個(53%),其次是15個( 25%)Ⅰ型的基因,再次是7個(12%)非標(biāo)準(zhǔn)的基因,而Ⅲ型的基因最少,只有 6個(10%)。這 3種類型的基因在 EST表達(dá)模式中所占的比例與這3種類型的基因在WRKY基因中所占的比例基本一致,這表明,在蒺藜苜蓿中,Ⅱ型的WRKY基因可能在植物體內(nèi)生理生化反應(yīng)過程中起主要作用。
隨著分子生物學(xué)尤其是測序技術(shù)的不斷發(fā)展,越來越多的植物完成了全基因組序列的測定,如擬南芥[42]、水稻[43]和大豆[27]等。2011年,研究人員公布了作為主要豆科牧草的蒺藜苜蓿全基因組序列(Mt3.5v5) 的草圖[30],這為人們從基因組水平上研究蒺藜苜蓿和進(jìn)行分子育種提供了便利條件。
表4 蒺藜苜蓿中預(yù)測的WRKY基序的一致序列
圖6 蒺藜苜蓿WRKY中預(yù)測的基序
本研究最終從蒺藜苜?;蚪M中鑒定出 81個標(biāo)準(zhǔn)的WRKY基因。與其他植物相比較發(fā)現(xiàn),植物基因組所含有WRKY基因的多少并不與其基因組的大小呈正比例關(guān)系。例如,葡萄(Vitis viniferaL.)的基因組大小為487 Mb,含有55個WRKY基因; 但是在蒺藜苜蓿 375 Mb的基因組中卻分布有 81個WRKY基因; 而從二穗短柄草 272 Mb的基因組中共鑒定出86個WRKY基因(表2)。
基因重復(fù)事件是基因擴張的主要原因之一。在對水稻W(wǎng)RKY基因家族的研究中發(fā)現(xiàn),80%的WRKY基因是由基因重復(fù)而來[44]。但是,本研究對蒺藜苜蓿WRKY基因家族的研究發(fā)現(xiàn),只有24個WRKY基因發(fā)生了基因重復(fù),僅占全部WRKY基因的26%,這個比例遠(yuǎn)低于水稻中發(fā)生基因重復(fù)的比率。我們推測,蒺藜苜蓿中WRKY基因家族出現(xiàn)這種現(xiàn)象的主要原因可能有以下3點:(1) 蒺藜苜蓿尚未完成全基因組序列的測定,因此,許多基因重復(fù)事件還無法進(jìn)行檢測;(2) 蒺藜苜蓿WRKY基因家族的成員可能不是通過基因重復(fù)事件進(jìn)行擴張的。在對黃瓜的研究中已經(jīng)發(fā)現(xiàn),黃瓜WRKY基因家族中沒有發(fā)現(xiàn)基因重復(fù)事件[16]。因此,在蒺藜苜蓿WRKY基因家族中可能僅存在低頻率的基因重復(fù)事件;(3) 在面對各種生物和非生物脅迫過程時,蒺藜苜蓿WRKY基因家族為了降低能量的消耗,可能自行“消滅”體內(nèi)冗余而沒有功能的WRKY基因,基于這種保護(hù)體制可能使自身獲得更有利的相對適合度。同樣,在漫長的進(jìn)化歷史中,蒺藜苜??梢皂樌拇婊畹浆F(xiàn)在也表明其體內(nèi)數(shù)量有限的WRKY基因足夠應(yīng)付各種生物和非生物脅迫。
表5 WRKY基因的表達(dá)模式分析
(續(xù)表5)
另外,蒺藜苜蓿WRKY基因在染色體上的物理定位的研究表明,WRKY基因在蒺藜苜蓿染色體上呈不均勻分布。但是,在對水稻[40]和毛果楊[29]的研究已經(jīng)證實,WRKY基因主要分別集中在水稻的1號染色體和毛果楊的14號染色體上。這表明在水稻和毛果楊中這兩條染色體上可能發(fā)生了高頻率的基因重復(fù)事件。
通過分析蒺藜苜蓿 WRKY結(jié)構(gòu)域的基因結(jié)構(gòu)發(fā)現(xiàn),蒺藜苜蓿WRKY結(jié)構(gòu)域含有保守的內(nèi)含子。2005年,Wu等[9]對水稻W(wǎng)RKY結(jié)構(gòu)域研究發(fā)現(xiàn),在Ⅰc、Ⅱc-e和Ⅲ型的結(jié)構(gòu)域中,鋅指結(jié)構(gòu)第一個 C前面第5個氨基酸殘基處(R) 是內(nèi)含子的插入位點,并將這種內(nèi)含子命名為R類型內(nèi)含子,然而,在Ⅱa和Ⅱb型的結(jié)構(gòu)域中,內(nèi)含子的插入位點在鋅指結(jié)構(gòu)第2個C后的第6個氨基酸殘基處(V),將其命名為V類型的內(nèi)含子。但是,Ⅱa和Ⅱb型結(jié)構(gòu)域中內(nèi)含子的插入位點存在另外一種發(fā)現(xiàn)。在擬南芥和黃瓜的研究中發(fā)現(xiàn)[2,16],Ⅱa和Ⅱb型結(jié)構(gòu)域內(nèi)含子的插入位點位于鋅指結(jié)構(gòu)第2個C后的第4個氨基酸殘基處(K)。本文對蒺藜苜蓿WRKY結(jié)構(gòu)域的研究結(jié)果與在水稻中的研究結(jié)果一致(圖 3)。對于這種保守內(nèi)含子在 WRKY結(jié)構(gòu)域不同位點的插入是否對WRKY基因的功能造成不同影響的研究尚未見報道。WRKY基因家族成員在調(diào)節(jié)植物體生理生化作用時各有分工,因此,保守內(nèi)含子在WRKY結(jié)構(gòu)域不同位點的插入是否影響WRKY基因的功能,可能是下一步研究的熱點。
WRKY基因家族依據(jù)WRKY結(jié)構(gòu)域的不同可以分為3種類型。目前研究者普遍認(rèn)為[2,4],Ⅱ和Ⅲ型的WRKY結(jié)構(gòu)域起源于Ⅰ型C端的結(jié)構(gòu)域。Ⅱ型的C2H2保守鋅指結(jié)構(gòu)基序中的組氨酸(H) 被半胱氨酸(C) 替換后形成Ⅲ型中的C2HC保守鋅指結(jié)構(gòu)基序[40]。但是,本文在分析WRKY基序時發(fā)現(xiàn),有些Ⅱ或Ⅲ型的結(jié)構(gòu)域可能起源于Ⅰ型N端的結(jié)構(gòu)域。例如,Ⅰ型N端3個基序(motif3,5和6) 出現(xiàn)在Ⅱ(MtWRKY2、29、60、88、89和 90) 和Ⅲ(MtWRKY 21、22、23、24、25、59、75、76 和 87) 型的基因中,而且更為重要的是在這些Ⅱ和Ⅲ型的基因中沒有出現(xiàn)Ⅰ類型C端的結(jié)構(gòu)域(圖6,表4)。
更為有趣的是,在研究擬南芥WRKY結(jié)構(gòu)域時發(fā)現(xiàn),擬南芥Ⅲ型AtWRKY52/RRS1基因的WRKY結(jié)構(gòu)域的 C末端含有 TIR-NBS-LRR基因(Toll/interleukin-receptor-nucleotide-binding site-leucine-rich repeat) 的結(jié)構(gòu)域,而 TIR-NBS-LRR基因被證實參與植物對病原菌的免疫反應(yīng)過程[45]。但是,本研究并沒有發(fā)現(xiàn)類似的現(xiàn)象。為了嘗試解釋這種區(qū)別,本文一方面研究了蒺藜苜蓿WRKYⅢ型基因在進(jìn)化過程中所受選擇壓力對基因進(jìn)化的影響。通過計算Ka/Ks發(fā)現(xiàn),蒺藜苜蓿Ⅲ型的WRKY基因在進(jìn)化的過程中受純化選擇。這個結(jié)果與在黃瓜中的研究結(jié)果一致[16]。但是,在擬南芥中卻發(fā)現(xiàn),正選擇壓力在Ⅲ型基因的進(jìn)化過程中起主導(dǎo)作用[16]。一般情況下,正選擇壓力更有益于基因的擴張或功能的分化,而純化選擇壓力往往使基因變的更保守。因此,不難得出,在擬南芥中發(fā)生兩種結(jié)構(gòu)域的融合可能正是由于正選擇壓力的結(jié)果,相反,在蒺藜苜?;螯S瓜中,“消極”的純凈化選擇壓力沒有給該基因一個自我發(fā)展的機會,反而使該基因變的越來越保守。
另一方面,本文推測,相比與蒺藜苜蓿或黃瓜,擬南芥在生長周期中可能經(jīng)歷更多的病害。這勢必要求在擬南芥中,抗病的基因在抵御病原菌的侵染過程中發(fā)揮更為重要的作用。由于病原菌的不斷變異,同樣會使抗病基因在結(jié)構(gòu)上產(chǎn)生相應(yīng)的變化,最終抗病基因與病原菌形成了協(xié)同進(jìn)化,或許WRKYⅢ型的基因與 TIR-NBS-LRR基因的融合正是為了增強自身的抗病能力以適應(yīng)不斷變異的病原菌。
本研究利用EST序列分析了蒺藜苜蓿WRKY基因在生物和非生物脅迫下的表達(dá)模式,結(jié)果顯示W(wǎng)RKY基因在蒺藜苜蓿體內(nèi)具有廣泛的表達(dá),在組織或器官中的表達(dá)量最大,而在種子中的表達(dá)量最少,這可能與組織或器官經(jīng)受比較多的脅迫而種子經(jīng)受的脅迫比較少有關(guān)。但是,有報道證實,WRKY基因與種子發(fā)育有密切關(guān)系[22,46]。因此,本文推測,種子中的WRKY基因更傾向參與種子發(fā)芽的調(diào)控。
[1]Rushton PJ,Somssich IE,Ringler P,Shen QJ.WRKY transcription factors.Trends Plant Sci,2010,15(5):247– 258.
[2]Eulgem T,Rushton PJ,Robatzek S,Somssich IE.The WRKY superfamily of plant transcription factors.Trends Plant Sci,2000,5(5):199–206.
[3]Rushton PJ,Torres JT,Parniske M,Wernert P,Hahlbrock K,Somssich IE.Interaction of elicitor-induced DNA-binding proteins with elicitor response elements in the promoters of parsley PR1 genes.EMBO J,1996,15(20):5690–5700.
[4]Zhang YJ,Wang LJ.The WRKY transcription factor superfamily:its origin in eukaryotes and expansion in plants.BMC Evol Biol,2005,5:1.
[5]Ciolkowski I,Wanke D,Birkenbihl RP,Somssich IE.Studies on DNA-binding selectivity of WRKY transcription factors lend structural clues into WRKY-domain function.Plant Mol Biol,2008,68(1-2):81–92.
[6]Mangelsen E,Kilian J,Berendzen KW,Kolukisaoglu UH,Harter K,Jansson C,Wanke D.Phylogenetic and comparative gene expression analysis of barley(Hordeum vulgare) WRKY transcription factor family reveals putatively retained functions between monocots and dicots.BMC Genomics,2008,9:194.
[7]Sun C,Palmqvist S,Olsson H,Borén M,Ahlandsberg S,Jansson C.A novel WRKY transcription factor,SUSIBA2,participates in sugar signaling in barley by binding to the sugar-responsive elements of theiso1promoter.Plant Cell,2003,15(9):2076–2092.
[8]Ishiguro S,Nakamura K.Characterization of a cDNA encoding a novel DNA-binding protein,SPF1,that recognizes SP8 sequences in the 5’ upstream regions of genes coding for sporamin and beta-amylase from sweet potato.Mol Gen Genet,1994,244(6):563–571.
[9]Wu KL,Guo ZJ,Wang HH,Li J.The WRKY family of transcription factors in rice andArabidopsisand their origins.DNA Res,2005,12(1):9–26.
[10]Dellagi A,Helibronn J,Avrova AO,Montesano M,Palva ET,Stewart HE,Toth IK,Cooke DEL,Lyon GD,Birch PRJ.A potato gene encoding a WRKY-like transcription factor is induced in interactins withErwinia carotovora subsp.atrosepticaandPhytophthora infestansand is coregulated with class I endochitinase expression.Mol Plant Microbe Interact,2000,13(10):1092–1101.
[11]Xu YH,Wang JW,Wang S,Wang JY,Chen XY.Characterization of GaWRKY1,a cotton transcription factor that regulates the sesquiterpene synthase gene(+)-deltacadinene synthase-A1.Plant Physiol,2004,135(1):507–515.
[12]Ross CA,Liu Y,Shen QJ.TheWRKYgene family in Rice(Oryza sativa).J Integr Plant Biol,2007,49(6):827–842.
[13]Rensing SA,Lang D,Zimmer AD,Terry A,Salamov A,Shapiro H,Nishiyama T,Perroud PF,Lindquist EA,Kamisugi Y,Tanahashi T,Sakakibara K,Fujita T,Oishi K,Shin IT,Kuroki Y,Toyoda A,Suzuki Y,Hashimoto S,Yamaguchi K,Sugano S,Kohara Y,Fujiyama A,Anterola A,Aoki S,Ashton N,Barbazuk WB,Barker E,Bennetzen JL,Blankenship R,Cho SH,Dutcher SK,Estelle M,Fawcett JA,Gundlach H,Hanada K,Heyl A,Hicks KA,Hughes J,Lohr M,Mayer K,Melkozernov A,Murata T,Nelson DR,Pils B,Prigge M,Reiss B,Renner T,Rombauts S,Rushton PJ,Sanderfoot A,Schween G,Shiu SH,Stueber K,Theodoulou FL,Tu H,Van de Peer Y,Verrier PJ,Waters E,Wood A,Yang L,Cove D,Cuming AC,Hasebe M,Lucas S,Mishler BD,Reski R,Grigoriev IV,Quatrano RS,Boore JL.ThePhyscomitrellagenome reveals evolutionary insights into the conquest of land by plants.Science,2008,319(5859):64–69.
[14]Levée V,Major I,Levasseur C,Tremblay L,MacKay J,Séguin A.Expression profiling and functional analysis ofPopulusWRKY23reveals a regulatory role in defense.New Phytol,2009,184(1):48–70.
[15]Guillaumie S,Mzid R,Mechin V,Léon C,Hichri I,Destrac-Irvine A,Trossat-Magnin C,Delrot S,Lauvergeat V.The grapevine transcription factor WRKY2 influences the lignin pathway and xylem development in tobacco.Plant Mol Biol2010,72(1–2):215–234.
[16]Ling J,Jiang WJ,Zhang Y,Yu HJ,Mao ZC,Gu XF,Huang SW,Xie BY.Genome-wide analysis of WRKY gene family inCucumis sativus.BMC Genomics,2011,12:471.
[17]Tripathi P,Rabara RC,Langum TJ,Boken AK,Rushton DL,Boomsma DD,Rinerson CI,Rabara J,Reese RN,Chen XF,Rohila JS,Rushton PJ.The WRKY transcription factor family inBrachypodium distachyon.BMC Genomics,2012,13:270.
[18]Hara K,Yagi T,Kusano T,Sano H.Rapid systemic accumulation of transcripts encoding a tobacco WRKY transcription factor upon wounding.Mol Gen Genet,2000,263(1):30–37.
[19]Izaguirre MM,Scopel AL,Baldwin IT,Ballaré CL.Convergent responses to stress.Solar ultraviolet-B radiation andManduca sextaherbivory elicit overlapping transcriptional responses in field-grown plants ofNicotiana longiflora.Plant Physiol,2003,132(4):1755–1767.
[20]Seki M,Narusaka M,Ishida J,Nanjo T,Fujita M,Oono Y,Kamiya A,Nakajima M,Enju A,Sakurai T,Satou M,Akiyama K,Taji T,Yamaguchi-Shinozaki K,Carninci P,Kawai J,Hayashizaki Y,Shinozaki K.Monitoring the expression profiles of 7000Arabidopsisgenes under drought,cold and high-salinity stresses using a full-length cDNA microarray.Plant J,2002,31(3):279–292.
[21]付乾堂,余迪求.擬南芥AtWRKY25、AtWRKY26和AtWRKY33在非生物脅迫條件下的表達(dá)分析.遺傳,2010,32(8):848–856.
[22]Li J,Brader G,Palva ET.The WRKY70 transcription factor:a node of convergence for jasmonate-mediated and salicylate-mediated signals in plant defense.Plant Cell,2004,16(2):319–331.
[23]Johnson CS,Kolevski B,Smyth DR.TRANSPARENT TESTA GLABRA2,a trichome and seed coat development gene of Arabidopsis,encodes a WRKY transcription factor.Plant Cell,2002,14(6):1359–1375.
[24]Hinderhofer K,Zentgraf U.Identification of a transcription factor specifically expressed at the onset of leaf senescence.Planta,2001,213(3):469–473.
[25]Pnueli L,Hallak-Herr E,Rozenberg M,Cohen M,Goloubinoff P,Kaplan A,Mittler R.Molecular and biochemical mechanisms associated with dormancy and drought tolerance in the desert legumeRetama raetam.Plant J,2002,31(3):319–330.
[26]Nei M.Gene duplication and nucleotide substitution in evolution.Nature,1969,221(5175):40–42.
[27]Tan SL,Wu S.Genome wide analysis of nucleotide-binding site disease resistance genes inBrachypodium distachyon.Comp Funct Genomics,2012,2012:418208.
[28]Schmutz J,Cannon SB,Schlueter J,Ma J,Mitros T,Nelson W,Hyten D L,Song Q,Thelen JJ,Cheng J,Xu D,Hellsten U,May GD,Yu Y,Sakurai T,Umezawa T,Bhattacharyya MK,Sandhu D,Valliyodan B,Lindquist E,Peto M,Grant D,Shu S,Goodstein D,Barry K,Futrell-Griggs M,Abernathy B,Du J,Tian Z,Zhu L,Gill N,Joshi T,Libault M,Sethuraman A,Zhang XC,Shinozaki K,Nguyen HT,Wing RA,Cregan P,Specht J,Grimwood J,Rokhsar D,Stacey G,Shoemaker RC,Jackson SA.Genome sequence of the palaeopolyploid soybean.Nature,2010,463(7278):178–183.
[29]He HS,Dong Q,Shao YH,Jiang HJ,Zhu SW,Cheng BJ,Xiang Y.Genome-wide survey and characterization of theWRKYgene family inPopulus trichocarpa.Plant Cell Rep,2012,31(7):1199–1217.
[30]Young ND,Debelle F,Oldroyd GE,Geurts R,Cannon SB,Udvardi MK,Benedito VA,Mayer KF,Gouzy J,Schoof H,Van de Peer Y,Proost S,Cook DR,Meyers BC,Spannagl M,Cheung F,De Mita S,Krishnakumar V,Gundlach H,Zhou S,Mudge J,Bharti AK,Murray JD,Naoumkina MA,Rosen B,Silverstein KA,Tang H,Rombauts S,Zhao PX,Zhou P,Barbe V,Bardou P,Bechner M,Bellec A,Berger A,Berges H,Bidwell S,Bisseling T,Choisne N,Couloux A,Denny R,Deshpande S,Dai X,Doyle JJ,Dudez AM,Farmer AD,Fouteau S,Franken C,Gibelin C,Gish J,Goldstein S,Gonzalez AJ,Green PJ,Hallab A,Hartog M,Hua A,Humphray SJ,Jeong DH,Jing Y,Jocker A,Kenton SM,Kim DJ,Klee K,Lai H,Lang C,Lin S,Macmil SL,Magdelenat G,Matthews L,McCorrison J,Monaghan EL,Mun JH,Najar FZ,Nicholson C,Noirot C,O'Bleness M,Paule CR,Poulain J,Prion F,Qin B,Qu C,Retzel EF,Riddle C,Sallet E,Samain S,Samson N,Sanders I,Saurat O,Scarpelli C,Schiex T,Segurens B,Severin AJ,Sherrier DJ,Shi R,Sims S,Singer SR,Sinharoy S,Sterck L,Viollet A,Wang BB,Wang K,Wang M,Wang X,Warfsmann J,Weissenbach J,White DD,White JD,Wiley GB,Wincker P,Xing Y,Yang L,Yao Z,Ying F,Zhai J,Zhou L,Zuber A,Denarie J,Dixon RA,May GD,Schwartz DC,Rogers J,Quetier F,Town CD,Roe BA.TheMedicagogenome provides insight into the evolution of rhizobial symbioses.Nature,2011,480(7378):520–524.
[31]Altschul SF,Madden TL,Sch?ffer AA,Zhang J,Zhang Z,Miller W,Lipman DJ.Gapped BLAST and PSI-BLAST:a new generation of protein database search programs.Nucleic Acids Res,1997,25(17):3389–3402.
[32]Finn RD,Mistry J,Schuster-B?ckler B,Griffiths-Jones S,Hollich V,Lassmann T,Moxon S,Marshall M,Khanna A,Durbin R,Eddy SR,Sonnhammer EL,Bateman A.Pfam:clans,web tools and services.Nucleic Acids Res,2006,34(1):D247–D251.
[33]Thompson JD,Higgings DG,Gibson TJ.CLUSTAL W:improving the sensitivity of progressive multiple sequence alignment through sequence weighting,position-specific gap penalties and weight matrix choice.Nucleic Acids Res,1994,22(22):4673–4680.
[34]Zhang Z,Schwartz S,Wagner L,Miller W.A greedy algorithm for aligning DNA sequences.J Comput Biol2000,7(1-2):203–214.
[35]Zhou T,Wang Y,Chen JQ,Araki H,Jing Z,Jiang K,Shen J,Tian D.Genome-wide identification of NBS genes injaponicarice reveals significant expansion of divergent non-TIR NBS-LRR genes.Mol Genet Genomics,2004,271(4):402–415.
[36]Thompson JD,Gibson TJ,Plewniak F,Jeanmougin F,Higgings DG.The CLUSTAL_X windows interface:flexible strategies for multiple sequence alignment aided by quality analysis tools.Nucleic Acids Res,1997,25(24):4876–4882.
[37]Tamura K,Dudley J,Nei M,Kumar S.MEGA4:Molecular evolutionary genetics analysis(MEGA) software version 4.0.Mol Biol Evol,2007,24(8):1596–1599.
[38]Bailey TL,Elkan C.The value of prior knowledge in discovering motifs with MEME.Proc Int Conf Intell Syst Mol Biol,1995,3:21–29.
[39]Holub EB.The arms race is ancient history in Arabidopsis,the wildflower.Nat Rev Genet,2001,2(7):516–527.
[40]Xie Z,Zhang ZL,Zou X,Huang J,Ruas P,Thompson D,Shen QJ.Annotations and functional analyses of the riceWRKYgene superfamily reveal positive and negative regulators of abscisic acid signaling in aleurone cells.Plant Physiol,2005,137(1):176–189.
[41]Ohlrogge J,Benning C.Unraveling plant metabolism by EST analysis.Curr Opin Plant Biol,2000,3(3):224–228.
[42]Arabidopsis Genome Initiative.Analysis of the genome sequence of the flowering plantArabidopsis thaliana.Nature,2000,408(6814):796–815.
[43]Goff S A,Ricke D,Lan TH,Presting G,Wang R,Dunn M,Glazebrook J,Sessions A,Oeller P,Varma H,Hadley D,Hutchison D,Martin C,Katagiri F,Lange BM,Moughamer T,Xia Y,Budworth P,Zhong J,Miguel T,Paszkowski U,Zhang S,Colbert M,Sun WL,Chen L,Cooper B,Park S,Wood TC,Mao L,Quail P,Wing R,Dean R,Yu Y,Zharkikh A,Shen R,Sahasrabudhe S,Thomas A,Cannings R,Gutin A,Pruss D,Reid J,Tavtigian S,Mitchell J,Eldredge G,Scholl T,Miller RM,Bhatnagar S,Adey N,Rubano T,Tusneem N,Robinson R,Feldhaus J,Macalma T,Oliphant A,Briggs S.A draft sequence of the rice genome(Oryza sativaL.ssp.japonica).Science,2002,296(5565):92–100.
[44]Ramamoorthy R,Jiang SY,Kumar N,Venkatesh PN,Ramachandran S.A comprehensive transcriptional profiling of the WRKY gene family in rice under various abiotic and phytohormone treatments.Plant Cell Physiol,2008,49(6):865–879.
[45]Deslandes L,Olivier J,Peeters N,Feng DX,Khounlotham M,Boucher C,Somssich I,Genin S,Marco Y.Physical interaction between RRS1-R,a protein conferring resistance to bacterial wilt,and PopP2,a type Ⅲ effector targeted to the plant nucleus.Proc Natl Acad Sci USA,2003,100(13):8024–8029.
[46]Wenck AR,Conger BV,Trigiano RN,Sams CE.Inhibition of somatic embryogenesis in orchardgrass by endogenous cytokinins.Plant Physiol,1988,88(4):990–992.