江騰,林勇祥,劉雪,江海洋,朱蘇文
(安徽農(nóng)業(yè)大學(xué)生命科學(xué)學(xué)院 安徽省作物生物學(xué)重點(diǎn)實(shí)驗(yàn)室,安徽 合肥230036)
轉(zhuǎn)錄因子在高等植物的生長發(fā)育及其對外界環(huán)境的反應(yīng)中起著重要的調(diào)控作用,典型的高等植物轉(zhuǎn)錄因子含有DNA結(jié)合域、轉(zhuǎn)錄調(diào)控域、寡聚化位點(diǎn)和核定位信號,轉(zhuǎn)錄因子通過這些結(jié)構(gòu)域與順式元件相互作用調(diào)控基因的表達(dá)。轉(zhuǎn)錄因子也稱反式作用因子,其主要功能是激活或抑制基因的轉(zhuǎn)錄效應(yīng)[1,2]。WRKY蛋白是植物所特有的轉(zhuǎn)錄因子家族。因WRKY結(jié)構(gòu)域是一個60個氨基酸左右的保守結(jié)構(gòu),所有結(jié)構(gòu)域均含有高度保守的WRJKYGQK氨基酸序列而得名[3,4]。WRKY基因是首先從植物中分離得到的一類調(diào)節(jié)蛋白質(zhì)。至今已從多種植物中分離,如甜土豆(Ipomoea batatas)、野燕麥(Avena sativa)、皺葉歐芹(Petroselinum crispum)、擬南芥(Arabidopsisthaliana)、煙草(Nicotiana tabacum)、水稻(Oryza sativa)等[5-9]。WRKY 基因家族的名字來源于這類蛋白質(zhì)的一個主要特征即含有WRKY結(jié)構(gòu)域。
在擬南芥、煙草和水稻中,已有大量的文獻(xiàn)報(bào)道WRKY轉(zhuǎn)錄因子參與了水楊酸和茉莉酸信號傳導(dǎo)相關(guān)基因的調(diào)控和抗病性[10-12]。水稻的一個WRKY45基因被證實(shí)與稻瘟病的抗性相關(guān),過量表達(dá)WRKY45基因?qū)е滤镜目沟疚敛∧芰υ鰪?qiáng)[13]。擬南芥中的WRKY18,WRKY40和WRKY60基因與灰霉菌(Streptomyces griseus)和假單孢菌(Pseudomonasaeruginosa)的抗性密切相關(guān)[14]。近年來,隨著多種植物全基因組數(shù)據(jù)的公布,利用全基因組數(shù)據(jù)分析某一基因家族基因的特征越來越多,最早是擬南芥中抗病基因的全基因組分析,利用生物信息學(xué)方法從擬南芥中共發(fā)現(xiàn)149個NBS(nucleotide binding site)基因,并對該基因家族進(jìn)行染色體定位,分類,保守的基序(motif)分析[15],該研究對近幾年擬南芥NBS抗病基因的克隆和功能驗(yàn)證起著重要的作用。隨后利用生物信息學(xué)方法對其他基因家族的全基因分析的報(bào)道也日益增多,而WRKY基因作為一類較為重要的基因家族,一直是分子生物學(xué)中研究的重點(diǎn),在擬南芥全基因組中有72個WRKY基因,共含有85個WRKY結(jié)構(gòu)域,其中有13個WRKY蛋白包含著2個WRKY結(jié)構(gòu)域,對水稻全基因組WRKY基因研究表明,水稻中共有102個WRKY轉(zhuǎn)錄因子基因[16],對擬南芥和水稻W(wǎng)RKY基因的研究大大加速了對這類基因的了解。
蒺藜苜蓿(Medicago truncatula),豆科蝶形花亞科苜蓿屬一年生黃花苜蓿,耐旱,已經(jīng)成為研究豆科植物的模式植物[17,18],基因組小(全基因組470 Mb),因其轉(zhuǎn)化和培養(yǎng)較為容易,目前,在豆科植物功能基因的研究中應(yīng)用較多[19-21]。苜蓿全基因組的精細(xì)序列(Mt2.0)已經(jīng)公布,目前,利用生物信息學(xué)方法分析基因家族的特征、進(jìn)化關(guān)系成為熱點(diǎn)[22,23]。本研究利用生物信息學(xué)方法分析了苜蓿全基因組WRKY基因的種類、數(shù)目和進(jìn)化特點(diǎn),對促進(jìn)苜蓿WRKY基因家族功能基因組學(xué)的進(jìn)一步研究具有重要意義。
本研究以苜蓿最新的全基因組數(shù)據(jù)庫(Mt2.0)為對象,苜蓿全基因組數(shù)據(jù)和蛋白質(zhì)數(shù)據(jù)下載于苜蓿基因組測序網(wǎng)站(http://www.medicago.org)。
1.2.1 WRKY基因的確定 因?yàn)檐俎;蚪M的注釋并不完全,因此利用蛋白家族數(shù)據(jù)庫(Pfam)中選取的WRKY蛋白家族序列(PF03106),利用序列的同源性搜索工具(Blastp)篩選苜蓿全部基因,P值設(shè)為10-3[24],把候選WRKY基因進(jìn)行Pfam分析,以證實(shí)其蛋白含有保守的WRKY結(jié)構(gòu)域。而水稻的WRKY基因已經(jīng)在基因組中有較好的注釋,直接從水稻基因組網(wǎng)站中下載全基因序列,獲取水稻的102條WRKY基因序列。
1.2.2 WRKY類型基因分類 對基因家族進(jìn)行分組是功能分析的一項(xiàng)重要內(nèi)容,轉(zhuǎn)錄因子基因家族常含有高度保守的功能域或有DNA結(jié)合功能的保守域。根據(jù)預(yù)測得到的WRKY域的氨基酸序列對苜蓿WRKY基因進(jìn)行分組。參照Eulgem和Somssich[3]的分組原則及結(jié)合系統(tǒng)發(fā)育分析的結(jié)果進(jìn)一步分組,含有2個WRKY保守結(jié)構(gòu)域的定義為Ⅰ類,含有1個WRKY保守結(jié)構(gòu)域且含有C2H2保守鋅指基序(motif)的定義為Ⅱ類,含有1個WRKY保守結(jié)構(gòu)域且含有C2HC保守的鋅指motif的定義為Ⅲ類。這樣WRKY域可以分為3個大組(Ⅰ、Ⅱ、Ⅲ)。
1.2.3 WRKY類型基因的染色體定位 WRKY類型基因通過苜?;蚪M數(shù)據(jù)庫(http://www.medicago.org/genome/)提供的染色體BLAST工具進(jìn)行苜蓿染色體物理定位,首先將每個WRKY基因與苜蓿全基因組進(jìn)行BLAST搜索,尋找最匹配的染色體位置,從而確定每個WRKY類型基因在染色體上的具體位置。
1.2.4 WRKY類型基因系統(tǒng)發(fā)生學(xué)分析 選取苜蓿中所有的WRKY類型基因與水稻102個已鑒定的WRKY基因利用CLUSTALW軟件進(jìn)行序列比對[25],然后利用MEGA 4.0軟件進(jìn)行系統(tǒng)進(jìn)化樹的構(gòu)建,分析苜蓿與水稻W(wǎng)RKY基因間的進(jìn)化關(guān)系[26]。此外,對所有WRKY基因中的所有WRKY結(jié)構(gòu)域進(jìn)行序列比對,然后根據(jù)結(jié)構(gòu)域的比對結(jié)果繪制WRKY結(jié)構(gòu)域的系統(tǒng)進(jìn)化樹。
1.2.5 WRKY結(jié)構(gòu)域(domain)的motif分析 苜蓿WRKY類型基因的預(yù)測motif分析通過MEME(multiple expectation maximization for motif elicitation)在線分析[27],MEME是美國圣地亞哥超級計(jì)算機(jī)中心(SDSC)開發(fā)的一套用來尋找一組相關(guān)的DNA序列或者蛋白質(zhì)序列基序的程序。利用此軟件來預(yù)測苜蓿WRKY基因中的保守motif以及WRKY結(jié)構(gòu)域上的保守motif。
利用Pfam數(shù)據(jù)庫的WRKY結(jié)構(gòu)域的標(biāo)準(zhǔn)序列,在苜蓿全基因組中進(jìn)行BLAST搜索,P值設(shè)為10-3,然后把候選序列進(jìn)行序列比對。通過這種方法,從苜?;蚪M中共找到28個WRKY候選基因,分別命名為Mt-WRKY1-MtWRKY 28(表1)。水稻已經(jīng)報(bào)道共有102個WRKY基因,即使是同為雙子葉植物的擬南芥中也發(fā)現(xiàn)了72個WRKY基因,苜蓿的基因組大小與水稻相當(dāng),這說明了WRKY基因家族并不與基因組大小有直接的對應(yīng)關(guān)系,擬南芥的基因組是苜蓿的1/4左右,但是其WRKY基因總數(shù)是苜蓿的3倍左右。進(jìn)一步把28個苜蓿的WRKY進(jìn)行染色體定位,發(fā)現(xiàn)WRKY基因并沒有均勻的分布在染色體上,其中,5號染色體分布最多,共含有8個WRKY基因,1號染色體有4個基因,3和4號染色體都有3個基因,7號染色體有2個基因,8號染色體有6個基因,而2和6號染色體上不含有WRKY基因,水稻、擬南芥等植物的WRKY基因分布也有此特點(diǎn)。此外,26個WRKY基因都已經(jīng)精確定位到染色體上,而MtWRKY14和MtWRKY15兩個基因并沒有定位在任何染色體上,主要是因?yàn)槠渌诘腂AC(細(xì)菌人工染色體,bacterial artificial chromosome)克隆目前沒有被定位,導(dǎo)致基因不能夠與拼接的染色體序列匹配。
擬南芥和水稻W(wǎng)RKY基因的研究已經(jīng)對這個基因家族有了一些理解,一般而言該基因可以分為3個大類和若干小類,采用了文獻(xiàn)的方法將苜蓿的28個WRKY基因進(jìn)行了分類,也可以分為3類,其中MtWRKY1-MtWRKY 5因?yàn)槠浜?個保守的WRKY結(jié)構(gòu)域而劃分為Ⅰ類。MtWRKY27與Mt-WRKY28因?yàn)槠涑撕?個WRKY結(jié)構(gòu)域外,還含有C2HC的保守motif,而劃分為Ⅲ類,其他的WRKY基因含有1個WRKY結(jié)構(gòu)域且在C端包含C2H2的保守motif而劃分為Ⅱ類。此外,把所有基因的WRKY保守結(jié)構(gòu)域的氨基酸序列進(jìn)行比對分析,其中含有2個WRKY結(jié)構(gòu)域的Ⅱ類基因,把N端的結(jié)構(gòu)域命名為NW,發(fā)現(xiàn)WRKY結(jié)構(gòu)域長度為51~63個氨基酸(圖1),相對于 C端的WRKY結(jié)構(gòu)域,其N端WRKY結(jié)構(gòu)域之間具有相似的序列構(gòu)成。對WRKY結(jié)構(gòu)域進(jìn)行系統(tǒng)發(fā)生學(xué)分析,可以明顯的分為3個分枝(圖2),且所有基因的NW結(jié)構(gòu)域基本上在同一進(jìn)化分枝上,說明它們與C端的WRKY結(jié)構(gòu)域并不是簡單的復(fù)制現(xiàn)象造成,有其單獨(dú)的起源和進(jìn)化關(guān)系。此外,WRKYGQK 7個氨基酸被視為WRKY基因最保守的結(jié)構(gòu),從結(jié)構(gòu)域的序列比較可以發(fā)現(xiàn),第1組和第3組基本上比較保守,WRKYGQK基本上沒有變異,而第2組中WRKYGQK中的Q殘基變異較大,說明了不同類型的WRKY基因的選擇壓力和進(jìn)化模式是不同的。
利用苜蓿的28個WRKY基因氨基酸序列與水稻102個WRKY基因氨基酸序列進(jìn)行序列比對,然后進(jìn)行系統(tǒng)進(jìn)化樹繪制(圖3)??梢悦黠@的看出苜蓿的WRKY基因集中分布在幾個分枝上,共有17個基因是單獨(dú)位于分枝上,說明了苜蓿與水稻W(wǎng)RKY基因的起源和進(jìn)化關(guān)系不同。如MtWRKY8-11單獨(dú)在一分枝上,與水稻W(wǎng)RKY具有較遠(yuǎn)的進(jìn)化距離。此外,可以明顯的看出水稻的WRKY基因分布在外圍分枝的基因較多,而且一些基因與苜蓿的WRKY基因差異較多,證實(shí)水稻的WRKY基因變異較多,苜蓿的WRKY基因更加保守。
表1 苜蓿WRKY基因的分類和定位信息Table 1 Classification and location of WRKY genes in M.truncatula
對28個WRKY基因的氨基酸進(jìn)行MEME軟件在線分析,結(jié)果顯示,在苜蓿WRKY基因中共找到46個預(yù)測的motif,可以看出不同類型的WRKY基因含有的motif數(shù)目和種類有所差異,如Ⅰ組WRKY基本上都含有2個motif 1,這是WRKY結(jié)構(gòu)域的特征,motif的多樣化也說明了WRKY基因廣泛參與細(xì)胞內(nèi)的多樣代謝途徑和反應(yīng)。此外選取28個基因的33個WRKY結(jié)構(gòu)域序列進(jìn)行motif分析,結(jié)果共發(fā)現(xiàn)5個motif(表2),其中最長的motif長度為26個氨基酸,最短的為10個氨基酸,其中motif 1最為保守,是WRKY基因最保守的motif(圖4)。
圖1 苜蓿WRKY結(jié)構(gòu)域的氨基酸比對Fig.1 Amino acid alignment of M.truncatula WRKY domain
圖2 苜蓿WRKY結(jié)構(gòu)域的系統(tǒng)發(fā)生樹Fig.2 Phylogenetic tree of M.truncatula WRKY domain
圖3 苜蓿和水稻W(wǎng)RKY基因的的系統(tǒng)發(fā)生樹Fig.3 Phylogenetic tree of rice and M.truncatula WRKY genes
圖4 苜蓿WRKY蛋白推測的保守motifFig.4 Forty six putative motifs identified in the WRKY family
WRKY基因家族是植物特有的一類重要的轉(zhuǎn)錄因子基因,已經(jīng)克隆的基因表明該基因廣泛參與植物的抗病、抗旱等逆境的調(diào)控,在細(xì)胞代謝和防衛(wèi)反應(yīng)中具有重要的作用。但是目前對WRKY基因的研究還處在一個初步認(rèn)識的階段,大大地限制了人們對該類基因家族完全功能的認(rèn)識和了解[28]。隨著眾多模式植物全基因組測序的完成,利用全基因組數(shù)據(jù)分析基因家族成為可能。本研究利用苜蓿最新的基因組數(shù)據(jù)(Mt2.0)進(jìn)行WRKY基因家族的分析,詳細(xì)研究了該基因家族的特點(diǎn)和進(jìn)化關(guān)系,并發(fā)現(xiàn)其與水稻、擬南芥WRKY基因具有一定的差異。
表2 苜蓿推測的WRKY結(jié)構(gòu)域的motifTable 2 M.truncatula putative WRKY domain motif
在苜蓿全基因組中共有28個WRKY基因被確認(rèn),占整個基因總數(shù)的0.072%,而在擬南芥中這一比例為0.199%,水稻中這一比例為0.407%,無論是基因的總數(shù)還是所占比例,苜蓿都遠(yuǎn)遠(yuǎn)少于模式植物擬南芥和水稻。已經(jīng)有研究表明,水稻和擬南芥WRKY基因家族存在較明顯的基因復(fù)制現(xiàn)象,而苜蓿中這一現(xiàn)象并不是很明顯,此外,苜蓿28個基因在7條染色體都有分布,相對于擬南芥和水稻而言分布不集中,說明了苜?;蚪M中WRKY基因復(fù)制事件較少,這可能是苜蓿WRKY基因較少的原因之一[29]。此外,苜蓿WRKY基因的同源性較高,在進(jìn)化樹上分布相對集中,而水稻W(wǎng)RKY基因差異較大,不少基因分布在進(jìn)化樹外圍,苜蓿相對水稻而言,WRKY基因較為保守。
對苜蓿和水稻W(wǎng)RKY基因的系統(tǒng)發(fā)生學(xué)分析證實(shí)了水稻和苜蓿的大部分WRKY基因并不在同一分枝上,說明了水稻和苜蓿的WRKY基因在進(jìn)化上具有較大差異,進(jìn)一步證實(shí)了這些差異可能早在單子葉與雙子葉植物分化前就已經(jīng)產(chǎn)生,這也進(jìn)一步說明了苜蓿的WRKY基因在進(jìn)化上比較保守,而水稻的WRKY在進(jìn)化上發(fā)生了更多的基因復(fù)制,導(dǎo)致WRKY基因的快速擴(kuò)張。對苜蓿WRKY結(jié)構(gòu)域的系統(tǒng)進(jìn)化樹分析證實(shí)了位于N端的WRKY結(jié)構(gòu)域與C端具有較大的差異,并不是結(jié)構(gòu)域的簡單復(fù)制而來,可能起源于不同的結(jié)構(gòu)域,特別是第1組5個基因的N端WRKY在一個分枝上,C端WRKY也在同一分枝上,說明了N端與C端WRKY結(jié)構(gòu)域的起源不同。
[1]Arce A L,Cabello J V,Chan R L.Patents on plant transcription factors[J].Recent Patents on Biotechnology,2008,2(3):209-217.
[2]Jain M,Tyagi A K,Khurana J P.Genome-wide identification,classification,evolutionary expansion and expression analyses of homeobox genes in rice[J].Febs Journal,2008,275(11):2845-2861.
[3]Eulgem T,Somssich I E.Networks of WRKY transcription factors in defense signaling[J].Current Opinion in Plant Biology,2007,10:366-371.
[4]張秋平,楊宇紅,謝丙炎,等.植物轉(zhuǎn)錄因子的超表達(dá)及其在分子育種中的應(yīng)用[J].分子植物育種,2005,3(3):401-408.
[5]Chujo T,Takai R,Akimoto-Tomiyama C,et al.Involvement of the elicitor-induced gene OsWRKY53 in the expression of defense-related genes in rice[J].Biochemica et Biophysica Acta,2007,1769:497-505.
[6]Li J,Brader G,Palva E T.The WRKY70 transcription factor:A node of convergence for jasmonate-mediated and salicylatemediated signals in plant defense[J].Plant Cell,2004,16:319-331.
[7]Liu X,Bai X,Wang X,et al.OsWRKY71,a rice transcription factor,is involved in rice defense response[J].Journal of Plant Physiology,2007,164:969-979.
[8]Peng Y,Laura E B,Chen X W,et al.OsWRKY62 is a negative regulator of basal and Xa21-mediated defense against Xanthomonas oryzae pv.oryzae in rice[J].Molecular Plant,2009,1:446-458.
[9]Qiu D,Xiao J,Ding X H,et al.OsWRKY13 mediates rice disease resistance by regulating defense-related genes in salicylateand jasmonate-dependent signaling[J].Molecular Plant-microbe Interactions,2007,20:492-499.
[10]Eulgem T,Rushton P J,Robatzek S,et al.The WRKY superfamily of plant transcription factors[J].T rends in Plant Science,2000,5:199-206.
[11]田云,盧向陽,彭麗莎,等.植物WRKY轉(zhuǎn)錄因子結(jié)構(gòu)特點(diǎn)及其生物學(xué)功能[J].遺傳,2006,28(12):1607-1612.
[12]Shimono M,Sugano S,Nakayama A,et al.Rice WRKY45 plays a crucial role in benzothiadiazole-inducible blast resistance[J].Plant Cell,2007,19:2064-2076.
[13]Xu X,Chen C,Fan B,et al.Physical and functional interactions between pathogen-induced arabidopsis WRKY18,WRKY40,and WRKY60 transcription factors[J].Plant Cell,2006,18:1310-1326.
[14]Hara K,Yagi M,Kusano T,et al.Rapid systemic accumulation of transcripts encoding a tobacco WRKY transcription factor upon wounding[J].Molecular and General Genetics,2000,263:30-37.
[15]M eyersa B,Kozika A,Griego A,et al.Genome-wide analysis of NBS-LRR-encoding genes in arabidopsis[J].Plant Cell,2003,15:809-834.
[16]Wu K L,Guo Z J,Wang H H,et al.The WRKY Family of transcription factors in rice and arabidopsis and their origins[J].DNA Research,2005,12:9-26.
[17]張改娜,賈敬芬.豌豆清蛋白1(PA1)基因的克隆及對苜蓿的轉(zhuǎn)化[J].草業(yè)學(xué)報(bào),2009,18(3):117-125.
[18]劉圈煒,王成章,嚴(yán)學(xué)兵,等.苜蓿青飼對波爾山羊屠宰性狀及肉品質(zhì)的影響[J].草業(yè)學(xué)報(bào),2010,19(1):158-165.
[19]何樹斌,劉國利,楊惠敏.不同水分處理下紫花苜蓿刈割后殘茬的光合變化及其機(jī)制[J].草業(yè)學(xué)報(bào),2010,18(6):192-197.
[20]燕麗萍,夏陽,梁慧敏,等.轉(zhuǎn)BADH基因苜蓿T1代遺傳穩(wěn)定性和抗鹽性研究[J].草業(yè)學(xué)報(bào),2010,18(6):65-71.
[21]馮毓琴,曹致中.天藍(lán)苜蓿野生種質(zhì)的品質(zhì)分析研究[J].草業(yè)科學(xué),2009,26(10):80-84.
[22]Boutrot F,Chantret N,Gautier M F.Genome-wide analysis of the rice and arabidopsis non-specific lipid transfer protein(nsLtp)gene families and identification of wheat nsLtp genes by EST data mining[J].BioMed Central Genomics,2008,9:86.
[23]Wang D,Guo Y,Wu C,et al.Genome-wide analysis of CCCH zinc finger family in arabidopsis and rice[J].BioMed Central Genomics,2008,9:44.
[24]Zhou T,Wang Y,Chen J Q.Genome-wide identification of NBS genes in japonica rice reveals significant expansion of divergent non-TIR NBS-LRR genes[J].Molecular Genetics and Genomics,2004,271(4):402-415.
[25]Higgins D G,Thompson J D,Gibson T J.CLUSTAL W:Improving the sensitivity of progressive multiple sequence alignment through sequence weighting,position-specific gap penalties and weight matrix choice[J].Nucleic Acids Research,1994,22:4673-4680.
[26]Tamura K,Dudley J,Nei M,et al.MEGA4:molecular evolutionary genetics analysis(M EGA)software version 4.0[J].M olecular Biology and Evolution,2007,24:1596-1599.
[27]Bailey T L,Elkan C.The value of prior knowledge in discovering motifs with MEME[J].Proceedings International Conference on Intelligent Systems for Molecular Biology,1995,3:21-29.
[28]Pandey S P,Somssich I E.The role of WRKY transcription factors in plant immunity[J].Plant Physiology,2009,150(4):1648-1655.
[29]Lai Z,Vinod K,Zheng Z.Roles of arabidopsis WRKY3 and WRKY4 transcription factors in plant responses to pathogens[J].BioMed Central Plant Biology,2008,8:68.