卞云迪,張 馳,王雪晴,楊晨曉,王光鈺,劉曉穎,王 穎,方 芳,王振英
(1.天津師范大學(xué)生命科學(xué)學(xué)院,天津 300387;2.天津市動(dòng)植物抗性重點(diǎn)實(shí)驗(yàn)室,天津 300387;3.天津市寶坻區(qū)林業(yè)發(fā)展服務(wù)中心,天津 301899)
植物在適應(yīng)各種逆境脅迫的過程中進(jìn)化出了復(fù)雜的調(diào)控網(wǎng)絡(luò)系統(tǒng)[1],其中,轉(zhuǎn)錄因子可以通過識(shí)別不同的順式作用元件來調(diào)控下游一系列相關(guān)基因的表達(dá),進(jìn)而提高植物的抗逆性[2].APETALA2/乙烯響應(yīng)因子(APETALA2/ethylene-responsive factor,AP2/ERF)是植物特有的轉(zhuǎn)錄因子,一般包含一個(gè)或多個(gè)AP2保守結(jié)構(gòu)域[3],該家族在植物的生長發(fā)育、生物和非生物逆境響應(yīng)等過程中發(fā)揮了極其關(guān)鍵的調(diào)控作用[4-7].AP2/ERF超家族可以分為DREB(dehydration-responsive element binding protein)、ERF(ethylene-responsive element binding factors)、AP2(AP-ETALA 2)、RAV(related to ABI3/VP1)以及Soloist 5個(gè)亞族[8].隨著測序技術(shù)的發(fā)展,在多種植物中鑒定出了AP2/ERF家族成員[9-13].小麥基因組約為16 Gb,重復(fù)序列達(dá)85%.目前,高質(zhì)量的中國春小麥基因組序列已釋放(http://www.wheat genome.org/)[14],但關(guān)于小麥TaAP2/ERF轉(zhuǎn)錄因子家族生物信息學(xué)方面的研究報(bào)道相對(duì)較少.本研究利用小麥全基因組數(shù)據(jù)庫信息,在全基因組范圍內(nèi)鑒定小麥AP2/ERF轉(zhuǎn)錄因子家族成員,分析該家族成員的基因結(jié)構(gòu)、順式作用元件及其可能調(diào)控的下游基因,為小麥轉(zhuǎn)錄因子的功能研究和利用提供參考.
從Ensembl Plants數(shù)據(jù)庫(http://plants.ensembl.org/index.html)下載小麥的全基因組數(shù)據(jù)、開放閱讀框、染色體定位信息等.從Pfam數(shù)據(jù)庫(http://pfam.xfam.org)下載AP2/ERF基因特有的保守結(jié)構(gòu)域模型(PF09425和PF06200),利用該模型在小麥蛋白數(shù)據(jù)庫Blastp中進(jìn)行比對(duì),得到候選基因,將其提交到Hmmer、NCBI-CDD等在線網(wǎng)站進(jìn)行保守域的結(jié)構(gòu)分析,最終得到TaAP2/ERF基因.利用在線工具ExPASy(http://web.expasy.org/protparam/)預(yù)測TaAP2/ERF基因編碼蛋白的等電點(diǎn)(pI)、相對(duì)分子質(zhì)量、氨基酸長度和染色體定位信息等屬性,利用CELLO V.2.5(http://cello.life.nctu.edu.tw/)在線網(wǎng)站進(jìn)行亞細(xì)胞定位分析.
利用在線數(shù)據(jù)庫MEME(http://meme-suite.org/)預(yù)測TaAP2/ERF基因家族成員的保守結(jié)構(gòu)域.按照WebLogo(http://weblogo.berkeley.edu/)默認(rèn)設(shè)置獲取序列標(biāo)識(shí)進(jìn)行基因結(jié)構(gòu)分析.
選取TaAP2/ERF基因上游1 500 bp基因序列,利用PlantCare(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)進(jìn)行啟動(dòng)子的順式作用元件分析.把具有類似功能的啟動(dòng)子元件歸為一類,再用TBtools軟件匯總歸類.
利用在線數(shù)據(jù)庫expVIP(http://www.wheat-expression.com/)分析TaAP2/ERF家族各基因的表達(dá)量,分析基因在不同生物/非生物脅迫下的表達(dá)水平,繪制基因表達(dá)熱圖.
以小麥全基因組數(shù)據(jù)為基礎(chǔ),共鑒定出74個(gè)TaAP2/ERF基因,根據(jù)基因的同源關(guān)系進(jìn)行命名.利用ExPASY網(wǎng)站分析TaAP2/ERF基因編碼蛋白質(zhì)的基本理化性質(zhì),具體如表1所示.預(yù)測TaAP2/ERF基因家族編碼蛋白質(zhì)在180~484個(gè)氨基酸之間,相對(duì)分子質(zhì)量為18.77×103~51.07×103,等電點(diǎn)為4.62~10.79.TaAP2/ERF家族編碼的氨基酸多數(shù)為酸性,其中47個(gè)蛋白的等電點(diǎn)小于7,偏酸性;其余27個(gè)蛋白的等電點(diǎn)大于7,偏堿性.利用CELLO在線預(yù)測亞細(xì)胞定位,發(fā)現(xiàn)53個(gè)TaAP2/ERF蛋白定位在細(xì)胞核中,這與多數(shù)轉(zhuǎn)錄因子的報(bào)道相一致;而定位在其他部位的蛋白則需通過實(shí)驗(yàn)確定其功能.
表1 小麥AP2/ERF轉(zhuǎn)錄因子家族基因的基本信息Tab.1 Basic information of AP2/ERF transcription family genes in wheat
續(xù)表
對(duì)小麥的74個(gè)TaAP2/ERF蛋白序列進(jìn)行分析,結(jié)果如圖1所示.TaAP2/ERF基因家族共有10個(gè)保守基序,利用TBtools軟件結(jié)合進(jìn)化樹對(duì)得到的結(jié)果進(jìn)行可視化分析(圖1(b)),結(jié)果發(fā)現(xiàn),鑒定出的TaAP2/ERF蛋白中保守基序的數(shù)量和類型略有不同.所有蛋白均含有Motif1和Motif3,這2個(gè)結(jié)構(gòu)共同組成了較為保守的AP2/ERF結(jié)構(gòu)域,大多數(shù)的保守結(jié)構(gòu)域位于蛋白N端,表明這些Motif對(duì)于TaAP2/ERF蛋白行使功能特別重要.相鄰蛋白之間的Motif分布雖然有較高相似性,但在保守基序的種類、數(shù)量以及分布上存在差異,暗示TaAP2/ERF家族蛋白各亞家族成員之間可能存在功能上的分化,而保守基序的功能尚待研究.
圖1 小麥TaAP2/ERF基因的系統(tǒng)進(jìn)化、保守結(jié)構(gòu)域和基因結(jié)構(gòu)Fig.1 Phylogenetic evolution of TaAP2/ERF genes,conservative structure domain and genetic structure
對(duì)TaAP2/ERF家族成員結(jié)構(gòu)進(jìn)行分析,繪制基因結(jié)構(gòu)示意圖,如圖1(c)所示.在鑒定到的74個(gè)TaAP2/ERF基因中,外顯子數(shù)量從0到4個(gè)不等,內(nèi)含子數(shù)量從0到10個(gè)不等.少數(shù)家族成員含有多個(gè)內(nèi)含子插入,如AP2-B含有10個(gè)外顯子和9個(gè)內(nèi)含子;CBF亞家族成員沒有內(nèi)含子,如CBF-5C、CBF-2A、CBF11等.由此可見,不同分類群間內(nèi)含子的數(shù)量差異較大,相同亞族中內(nèi)含子數(shù)量的差異較小,即具有相似的結(jié)構(gòu),如ERF061-like、ERF071-like等.TaAP2/ERF成員之間的內(nèi)含子長度、外顯子位置和數(shù)目存在差異,說明小麥TaAP2/ERF家族在進(jìn)化過程中產(chǎn)生了較強(qiáng)的分化,可能也是導(dǎo)致其成員功能不同的原因之一.
選取小麥TaAP2/ERF基因上游1 500 bp的基因組序列,分析小麥TaAP2/ERF基因的順式作用元件,整理出與激素和非生物脅迫相關(guān)的順式作用元件,結(jié)果如圖2所示.
圖2 小麥TaAP2/ERF基因的激素和非生物脅迫響應(yīng)相關(guān)的順式作用元件分析Fig.2 Analysis of cis-acting elements related to hormone and abiotic stress response of wheat TaAP2/ERF genes
由圖2可知,TaAP2/ERF啟動(dòng)子區(qū)域包含多種應(yīng)答元件,包括光、干旱、激素等逆境相關(guān)的應(yīng)答元件.另外,還發(fā)現(xiàn)了厭氧誘導(dǎo)、創(chuàng)傷響應(yīng)、晝夜節(jié)律調(diào)控、細(xì)胞周期調(diào)控、低溫響應(yīng)的應(yīng)答元件.其中,光應(yīng)答元件分布在所有TaAP2/ERF基因家族成員中,推測光在誘導(dǎo)TaAP2/ERF表達(dá)調(diào)控中可能發(fā)揮著重要作用.激素響應(yīng)元件分布也較為廣泛,如48.64%的家族成員啟動(dòng)子序列中存在生長素響應(yīng)元件,44.59%存在赤霉素響應(yīng)元件,83.78%存在茉莉酸甲酯響應(yīng)元件,91.89%存在脫落酸響應(yīng)元件,這說明激素與TaAP2/ERF的表達(dá)有密切關(guān)系.與非生物逆境脅迫相關(guān)的元件有3種,如83.78%的家族成員具有厭氧誘導(dǎo)響應(yīng)元件,48.64%的家族成員含有干旱誘導(dǎo)的響應(yīng)元件,43.24%的家族成員含有低溫響應(yīng)元件.除鑒定到參與干旱、厭氧、低溫等逆境損傷的應(yīng)答元件外,還鑒定到了參與創(chuàng)傷的響應(yīng)元件(CBF2A、CBFIIId-16.1)、參與晝夜節(jié)律調(diào)控的響應(yīng)元件(ERFVII.2-2B、CBFIIId-B19、CBFIVd-26.1、CBFII-5.1b、CBF5).這 些 結(jié) 果 表 明,TaAP2/ERF基因可能在植物光合作用、逆境脅迫響應(yīng)以及激素調(diào)控途徑中發(fā)揮了重要作用.
利用expVIP數(shù)據(jù)庫分析TaAP2/ERF家族各基因的表達(dá),部分基因的熱圖分析如圖3所示.
圖3 小麥部分TaAP2/ERF基因的熱圖分析Fig.3 Heat map analysis of partial TaAP2/ERF genes of wheat
由圖3可以看出,不同生長發(fā)育時(shí)期和生長條件下,各基因的表達(dá)水平呈現(xiàn)多樣化:ERFL2c、ERFL2a、ERFL1c和ERFL1a基因在所有條件下均保持較高表達(dá)水平;CBFIVa-25.3等16個(gè)基因在所有條件下均未檢測到表達(dá);CBFIVd-D9等16個(gè)基因在生物或非生物脅迫下的表達(dá)量呈現(xiàn)波動(dòng),其中,AP2-S、CBFIIId-B19、CBFIIId-D19和CBFIIId-24.1響應(yīng)非生物脅迫的基因在小麥葉片和根中表達(dá)上調(diào),CBFIVb-D21和CBF2基因在病原菌侵染后的幼苗期葉片中平均表達(dá)量下調(diào),營養(yǎng)生長期平均表達(dá)量上調(diào).雖然不同生長時(shí)期的CBFIVb-D21和CBF2基因表達(dá)模式不同,但二者均能夠?qū)Σ≡秩咀龀鲰憫?yīng).
隨著水稻、玉米、小麥等重要農(nóng)作物基因組數(shù)據(jù)的釋放,利用生物信息學(xué)技術(shù)分析基因家族序列的特征和進(jìn)化關(guān)系,為作物基因功能的研究提供了很多幫助[15-16].AP2/ERF轉(zhuǎn)錄因子通常參與植物生長發(fā)育、細(xì)胞周期調(diào)控及逆境脅迫響應(yīng)等重要生物過程[17].本研究對(duì)小麥基因組中的TaAP2/ERF轉(zhuǎn)錄因子進(jìn)行了全基因組鑒定,對(duì)家族成員進(jìn)行了系統(tǒng)的生物信息學(xué)分析.以中國春小麥基因組信息為基礎(chǔ),共鑒定到74個(gè)小麥TaAP2/ERF轉(zhuǎn)錄因子基因,不規(guī)則分布在1~7染色體上.與多數(shù)轉(zhuǎn)錄因子的亞細(xì)胞定位情況一樣,大部分TaAP2/ERF蛋白位于細(xì)胞核內(nèi),少部分存在于葉綠體、細(xì)胞質(zhì)和細(xì)胞膜,表明TaAP2/ERF蛋白的多個(gè)成員可能在小麥的生長發(fā)育過程中行使不同功能.TaAP2/ERF蛋白的等電點(diǎn)范圍為4.62~10.79,超過63%的TaAP2/ERF蛋白為酸性蛋白.進(jìn)化分析結(jié)果表明,TaAP2/ERF轉(zhuǎn)錄因子家族保守基序較多且較為復(fù)雜,基因結(jié)構(gòu)相似的轉(zhuǎn)錄因子親緣關(guān)系相近,如CBFIIIc-B10和CBFIIId-D19、ERFL1a和ERFL2a、AP2-B和AP2-S等.TaAP2/ERF轉(zhuǎn)錄因子的順式作用元件分析結(jié)果表明,所有TaAP2/ERF基因家族成員的啟動(dòng)子區(qū)均含有光響應(yīng)元件和不同的激素響應(yīng)元件(如赤霉素和生長素順式作用元件[18-19])、非生物脅迫響應(yīng)順式作用元件(如干旱脅迫和低溫脅迫響應(yīng)元件等[20]).這說明TaAP2/ERF家族基因通過自身順式作用元件的差異響應(yīng)小麥的多個(gè)生長發(fā)育過程.進(jìn)一步分析TaAP2/ERF家族基因在生物和非生物脅迫下的表達(dá)量變化,結(jié)果發(fā)現(xiàn),AP2-S、CBFIIId-B19、CBFIIId-D19和CBFIIId-24.1在非生物脅迫下發(fā)生特異表達(dá),且CBFIIId-B19、CBFIIId-D19和CBFIIId-24.1這3個(gè)基因結(jié)構(gòu)相同,推測CBFIIId亞家族基因可能在小麥響應(yīng)非生物脅迫的過程中發(fā)揮了重要作用;CBFIVb-D21和CBF2為病原菌侵染后的特異表達(dá)基因,基因結(jié)構(gòu)相似度也很高.因此,可將這些基因作為后續(xù)研究的切入點(diǎn),分析TaAP2/ERF在小麥響應(yīng)生物和非生物脅迫中的功能.
綜上所述,本研究利用多個(gè)生物學(xué)網(wǎng)站和軟件系統(tǒng),分析了小麥TaAP2/ERF基因家族的定位、基因結(jié)構(gòu)、順式作用元件以及表達(dá)模式,篩選獲得6個(gè)在生物脅迫或非生物脅迫下特異表達(dá)的基因作為備選基因,為后續(xù)研究基因功能及其在小麥生長發(fā)育和脅迫應(yīng)答過程中的調(diào)控機(jī)制提供參考.