丁祥青, 胡敏杰, 向 雙, 賴興凱, 樂(lè)易迅, 劉仲健, 鄒雙全
(1.福建農(nóng)林大學(xué)園林學(xué)院,福建福州,350002; 2.福建師范大學(xué)地理科學(xué)學(xué)院,福建福州 350007;3.福建農(nóng)林大學(xué)林學(xué)院,福建福州 350002; 4.泉州灣河口濕地自然保護(hù)區(qū)管理處,福建泉州 362000)
WRKY 轉(zhuǎn)錄因子是植物中所特有的基因家族,也是植物中最大的轉(zhuǎn)錄因子家族之一,在植物生長(zhǎng)發(fā)育、抵御生物脅迫和非生物脅迫中起著至關(guān)重要的作用。在結(jié)構(gòu)方面,WRKY轉(zhuǎn)錄因子的結(jié)構(gòu)域有一段約60個(gè)氨基酸構(gòu)成的高度保守的區(qū)域。所有已知的WRKY蛋白都含有1個(gè)或2個(gè)WRKY結(jié)構(gòu)域。根據(jù)WRKY 結(jié)構(gòu)域的數(shù)量和鋅指結(jié)構(gòu)的特征可對(duì)WRKY蛋白進(jìn)行分類:含有2個(gè)WRKY結(jié)構(gòu)域的WRKY蛋白屬于Ⅰ組,含有1個(gè)WRKY結(jié)構(gòu)域且鋅指結(jié)構(gòu)為CH(CCHH)的蛋白屬于Ⅱ組,而含有1個(gè)WRKY結(jié)構(gòu)域且鋅指結(jié)構(gòu)為CHC(CCHC)的蛋白屬于Ⅲ組。在功能方面,WRKY結(jié)構(gòu)域與目標(biāo)基因的啟動(dòng)子中的W-box 順式作用元件[共有序列:(T)(T)TGAC(C/T)]結(jié)合將會(huì)對(duì)調(diào)控有積極或消極的作用。研究表明,非生物脅迫會(huì)誘導(dǎo)某些WRKY轉(zhuǎn)錄因子的大量表達(dá),從而提高植物對(duì)非生物脅迫的耐受性。如的過(guò)度表達(dá)不僅增強(qiáng)了水稻的抗病性還提高了耐鹽性和耐旱性;或的過(guò)表達(dá)會(huì)增加擬南芥的耐鹽性;大豆可以抑制基因的表達(dá),并通過(guò)正向調(diào)控介導(dǎo)途徑,實(shí)現(xiàn)對(duì)鹽脅迫的響應(yīng);番茄基因能夠正調(diào)控抗逆性相關(guān)基因,顯著增強(qiáng)番茄的耐鹽性。
秋茄()隸屬紅樹(shù)科(Rhizophoraceae)秋茄屬(),屬于典型的非泌鹽紅樹(shù)植物,是我國(guó)境內(nèi)天然分布最廣和紅樹(shù)林重建和修復(fù)的主要造林樹(shù)種。秋茄多生長(zhǎng)在淺海和河流入海口沖積形成的鹽灘上,生長(zhǎng)環(huán)境惡劣,生存壓力使其不斷進(jìn)化以提高其抗逆境能力。秋茄是紅樹(shù)植物中最耐寒的樹(shù)種,也是紅樹(shù)植物中抗逆性最好的樹(shù)種之一,蘊(yùn)含著豐富的抗逆基因資源。秋茄是否有其特殊的耐鹽與抗逆機(jī)制,基因家族如何發(fā)揮重要作用尚不清楚。盡管基因家族已經(jīng)在許多植物中被廣泛的研究,然而到目前為止,沒(méi)有秋茄基因結(jié)構(gòu)和功能方面的研究報(bào)道。本研究應(yīng)用生物信息學(xué)方法挖掘秋茄全基因組WKRY轉(zhuǎn)錄因子并對(duì)其進(jìn)行分析,以期為秋茄潛在功能研究奠定基礎(chǔ),為解析基因在秋茄特殊的耐鹽與抗逆機(jī)制中的作用提供參考。
秋茄基因組由筆者所在課題組測(cè)序所得。在Pfam 數(shù)據(jù)庫(kù)(http://pfam.xfam.org/)中下載WRKY 轉(zhuǎn)錄因子家族的隱馬爾科夫模型(PF03106)。利用HMMER 3.0軟件(http://www.hmmer.org)的hmmsearch 命令和結(jié)構(gòu)域模型對(duì)秋茄基因組pep文件進(jìn)行搜索,從搜索結(jié)果中篩選基因結(jié)構(gòu)域E-value<0.001的基因共71個(gè),將這初步鑒定的秋茄WRKY 轉(zhuǎn)錄因子家族成員提交NCBI上的Batch CD-Search (https://www.ncbi.nlm.nih.gov/cdd)網(wǎng)站進(jìn)行結(jié)構(gòu)域分析,確認(rèn)WRKY結(jié)構(gòu)域準(zhǔn)確后,所得基因即為后續(xù)要分析的秋茄WRKY轉(zhuǎn)錄因子家族成員。將它們重新命名為~。
利用Expasy(https://web.expasy.org/compute_pi/)網(wǎng)站預(yù)測(cè)家族成員的等電點(diǎn)、相對(duì)分子質(zhì)量、氨基酸長(zhǎng)度等性質(zhì);通過(guò)http://www.csbio.sjtu.edu.cn/bioinf/euk-multi-2/網(wǎng)絡(luò)預(yù)測(cè)家族成員在細(xì)胞中的位置分布;通過(guò)SignalP(http://www.cbs.dtu.dk/services/SignalP-4.1/)預(yù)測(cè)信號(hào)肽。
從TAIR(http://www.arabidopsis.org/)網(wǎng)站下載擬南芥WRKY蛋白序列,利用 MEGA 7 軟件采用clustalW方法對(duì)擬南芥和秋茄的基因家族成員進(jìn)行多序列比對(duì)分析,比對(duì)過(guò)程選擇默認(rèn)參數(shù),并通過(guò)保守序列構(gòu)建系統(tǒng)發(fā)育樹(shù),采用遺傳距離算法中的鄰接法(neighbor-joining,NJ)算法,校驗(yàn)參數(shù)Bootstrap設(shè)置為重復(fù)1 000次。得到系統(tǒng)進(jìn)化樹(shù)后,再利用 Figtree 軟件對(duì)聚類后的進(jìn)化樹(shù)進(jìn)行修飾和標(biāo)注。
使用MEME(http://meme-suite.org/tools/meme)對(duì)71個(gè)秋茄WRKY蛋白進(jìn)行保守基序預(yù)測(cè),允許保守結(jié)構(gòu)域重復(fù)出現(xiàn),保守性基序的數(shù)量限制為10,分別命名為基序1~基序10。利用 Tbtools工具繪制KcWRKY蛋白保守基序、基因結(jié)構(gòu)和基因染色體定位圖。
將秋茄WRKY蛋白作為研究對(duì)象,選定模式植物擬南芥作為物種參數(shù),在 STRING( https://www.string-db.org/) 網(wǎng)站進(jìn)行蛋白互作網(wǎng)絡(luò)分析。
提取基因蛋白質(zhì)編碼區(qū)(CDS)序列上游 2 000 bp 區(qū)段,提交到PlantCare網(wǎng)站進(jìn)行順式作用元件預(yù)測(cè)(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/),篩選其中的激素響應(yīng)元件、抗逆元件進(jìn)行分析,Tbtools工具繪圖。
利用轉(zhuǎn)錄組測(cè)序獲得秋茄不同部位包括花、莖、葉、果實(shí)以及果實(shí)不同發(fā)育時(shí)期的表達(dá)量數(shù)據(jù),利用 Tbtools 工具繪制表達(dá)熱圖。
在秋茄基因組數(shù)據(jù)中共鑒定出71個(gè)基因,重新命名為~(表1)。KcWRKY蛋白氨基酸長(zhǎng)度范圍為61()~726()aa,分子量范圍為7.05()~78.60()ku,等電點(diǎn)范圍為4.46()~10.26(),除了定位于細(xì)胞核和細(xì)胞質(zhì),其余70個(gè)KcWRKY轉(zhuǎn)錄因子均定位于細(xì)胞核。所有基因均無(wú)信號(hào)肽產(chǎn)生。
表1 KcWRKY轉(zhuǎn)錄因子理化性質(zhì)分析
表1(續(xù))
表1(續(xù))
利用ClustalW對(duì)KcWRKY蛋白進(jìn)行保守結(jié)構(gòu)域分析,同時(shí)根據(jù)WRKY 結(jié)構(gòu)域的數(shù)量和鋅指結(jié)構(gòu)的特征對(duì)WRKY蛋白進(jìn)行分類(圖1)。在Ⅰ組蛋白的保守序列中,除了(Ⅰ組中靠近C端的結(jié)構(gòu)域)含有WRKYGEK和含有WRK七肽缺失序列外其余基因均為保守的WRKYGQK型的七肽;除鋅指結(jié)構(gòu)變異為HXN和缺失鋅指結(jié)構(gòu)外,其余均為CH型。此外,Ⅰ組中的只有1個(gè)WRKY結(jié)構(gòu)域,在擬南芥中也出現(xiàn)過(guò)類似情況,但是在擬南芥中出現(xiàn)的是N端WRKY結(jié)構(gòu)域缺失而秋茄中缺失出現(xiàn)在C端。在Ⅱ組蛋白的保守序列中,除了和結(jié)構(gòu)域中的七肽部分缺失,的七肽序列是WRKYGKK外,其余基因均為保守的WRKYGQK型的七肽;鋅指結(jié)構(gòu)除了、、缺失和缺失HNH外,其余均為保守的 CH型。Ⅲ組蛋白均含有典型的WRKYGQK七肽和CHC型鋅指結(jié)構(gòu)??傮w上秋茄WRKY成員的WRKYGQK七肽和鋅指結(jié)構(gòu)都很保守,少量成員結(jié)構(gòu)域變異的原因可能是在進(jìn)化過(guò)程中基因突變所導(dǎo)致的。由于七肽序列和鋅指基序都是WRKYTFs與W-box的高結(jié)合親和力所必需的,它們的缺失可能會(huì)導(dǎo)致其功能的喪失。
通過(guò)對(duì)擬南芥基因()和秋茄()基因結(jié)構(gòu)域進(jìn)行多序列比對(duì),構(gòu)建了它們共同的系統(tǒng)發(fā)育樹(shù)(圖2)。根據(jù)擬南芥基因的劃分情況將進(jìn)化樹(shù)分為三大類,Ⅰ組包含19個(gè)基因,Ⅱ組包含45個(gè)基因(其中Ⅱa 2個(gè)、Ⅱb 7個(gè)、Ⅱc 18個(gè)、Ⅱd 10個(gè)、Ⅱe 8個(gè)),Ⅲ組包含7個(gè)基因。由進(jìn)化樹(shù)可以看出,秋茄和擬南芥的基因在各個(gè)分支中均勻分布,表明他們具有相似的進(jìn)化方式;N 端和 C 端 WRKY 結(jié)構(gòu)域聚集在不同的進(jìn)化枝中,這可能反映了2個(gè)結(jié)構(gòu)域的平行進(jìn)化;Ⅱa和Ⅱb蛋白屬于同一分支、Ⅱd和Ⅱe蛋白屬于同一分支,表明它們之間的進(jìn)化關(guān)系較近。
通過(guò)對(duì)基因的保守基序進(jìn)行分析(圖3、圖4)發(fā)現(xiàn)同組的家族基因的基序比較一致,而組間存在一定的差異性,表明秋茄基因家族的分類是可靠的。10個(gè)保守基序(motif)的序列長(zhǎng)度在21~50 bp之間,所有成員幾乎都具有保守基序1,表明保守基序1是基因家族的核心保守基序。由圖3可知,保守基序1和保守基序3屬于WRKY保守七肽;保守基序2和保守基序4屬于鋅指結(jié)構(gòu)。保守基序1和保守基序2在Ⅰ組 C端、Ⅱ組和Ⅲ組中都有出現(xiàn),唯獨(dú)Ⅰ組 N 端沒(méi)有,而保守基序3和保守基序4只出現(xiàn)在Ⅰ組N端,已有研究表明,在基因家族中Ⅰ組成員是Ⅱ組和Ⅲ組成員的原始祖先,這種分布特征表明Ⅱ組和Ⅲ組中的WRKY結(jié)構(gòu)域可能來(lái)源于Ⅰ組C端結(jié)構(gòu)域,且它們可能具有相似的功能?;蛲怙@子數(shù)量為2~9 個(gè),內(nèi)含子數(shù)量為1~8個(gè),少數(shù)成員無(wú) UTR區(qū)域,的基因結(jié)構(gòu)是多樣的,保守基序和外顯子的差異可能會(huì)賦予基因功能多樣性。
染色體定位結(jié)果表明,71個(gè)秋茄基因不均勻分布在秋茄基因組18條染色體上(圖5),其中,Chr12上基因分布最多,有10個(gè),Chr18上分布的基因最少,只有1個(gè)?;蚍植寂c染色體長(zhǎng)度沒(méi)有明顯的相關(guān)性。根據(jù)Holub等的研究,在200 kb內(nèi)包含2個(gè)或多個(gè)基因的染色體區(qū)域被定義為串聯(lián)重復(fù)事件,在秋茄基因組中共發(fā)現(xiàn)4對(duì)串聯(lián)重復(fù)基因?qū)?、和、),分別位于Chr10、Chr12和Chr13上。另外,基因存在大量片段復(fù)制基因,這些基因在秋茄基因家族進(jìn)化中發(fā)揮了重要作用,是基因擴(kuò)張的主要驅(qū)動(dòng)力。為了更好地理解作用于基因家族的進(jìn)化約束條件,計(jì)算了基因?qū)Φ?,所有串聯(lián)重復(fù)和片段復(fù)制的基因?qū)Φ?<1,表明基因家族在進(jìn)化過(guò)程中可能經(jīng)歷了很強(qiáng)的純化選擇壓力。
蛋白互作網(wǎng)絡(luò)分析結(jié)果(圖6)表明,KcWRKY轉(zhuǎn)錄因子之間關(guān)聯(lián)緊密,KcWRKY66、KcWRKY68、KcWRKY70、KcWRKY71是互作網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn),在蛋白互作網(wǎng)絡(luò)中可能會(huì)發(fā)揮關(guān)鍵作用。且主要與鎂離子螯合酶ChlH(magnesium-chelatase subunit ChlH,簡(jiǎn)稱GUN)、細(xì)胞分裂原激活蛋白質(zhì)激酶(MAP kinase substrate,簡(jiǎn)稱MKS)、絲裂原活化蛋白激酶(mitogen-activated protein kinase,簡(jiǎn)稱MPK)、sigma factor binding protein(SIB)存在網(wǎng)絡(luò)相互作用。SIB作為激活劑在植物防御壞死營(yíng)養(yǎng)病原體中發(fā)揮作用,MPK可能使WRKY轉(zhuǎn)錄因子的調(diào)控因子磷酸化,介導(dǎo)脅迫基因轉(zhuǎn)錄,MKS與WRKY轉(zhuǎn)錄調(diào)節(jié)因子相互作用調(diào)控脅迫響應(yīng)。這些蛋白間的相互作用可能在秋茄獨(dú)特的抗逆機(jī)制中發(fā)揮了關(guān)鍵作用。
基因家族啟動(dòng)子的順式作用元件分析結(jié)果見(jiàn)圖7,主要關(guān)注植物生長(zhǎng)發(fā)育,激素調(diào)控和逆境脅迫有關(guān)的作用元件。家族成員啟動(dòng)子含有大量茉莉酸甲酯響應(yīng)(MeJA responsiveness)元件和脫落酸響應(yīng)(abscisic acid responsiveness)元件,含有較多的低溫響應(yīng)(low-temperature responsiveness)元件、赤霉素響應(yīng)(gibberellin responsiveness)元件和水楊酸響應(yīng)(salicylic acid responsiveness)元件,這可能意味著KcWRKY蛋白是通過(guò)激素調(diào)控介導(dǎo)途徑響應(yīng)脅迫的。其中和包含8種順式元件,這可能意味著這2個(gè)基因在秋茄生長(zhǎng)發(fā)育和抗逆脅迫中發(fā)揮著十分重要的作用。
表達(dá)模式分析結(jié)果如圖8所示,所有的基因都至少在1個(gè)器官中表達(dá),其中、、、和在所有器官中均有高水平的表達(dá)。花、根和莖中表達(dá)量最高的是,在葉和果實(shí)發(fā)育前期均具有最高表達(dá),、、、和在果實(shí)發(fā)育后期具有較高表達(dá)。隨著果實(shí)的不斷發(fā)育,4、24、50、68在果實(shí)中的表達(dá)量提高。
本研究在秋茄基因組中鑒定了71個(gè)基因,與擬南芥中(72個(gè))的基因數(shù)量差不多,但比水稻(102個(gè))和楊樹(shù)(104個(gè))的少。通過(guò)對(duì)KcWRKY蛋白保守結(jié)構(gòu)域進(jìn)行序列分析發(fā)現(xiàn),和這2個(gè)WRKY家族成員的核心結(jié)構(gòu)域發(fā)生了變異(WRKYGEK、WRKYGKK),與水稻中常見(jiàn)的突變形式一致。相關(guān)研究表明,在大豆中具有WRKYGKK變型的和失去了對(duì)W-box的結(jié)合能力,而在煙草中,具有 WRKYGKK變型的特異識(shí)別WK box(TTTCCAC),當(dāng)WRKYGKK 突變?yōu)閃RKYGEK后,便失去了對(duì) WK box的結(jié)合能力。推測(cè)和的WRKY七肽結(jié)構(gòu)域發(fā)生變型可能使其無(wú)法識(shí)別并結(jié)合W-box,或識(shí)別其他基序,產(chǎn)生新功能。的C端WRKYGQK七肽結(jié)構(gòu)域出現(xiàn)缺失,形成了WRK的缺失變型,而同樣的情況出現(xiàn)在香石竹的N端。啟動(dòng)子順式元件分析結(jié)果顯示,家族成員含有激素調(diào)控和逆境脅迫相關(guān)的順式作用元件,其中響應(yīng)脫落酸應(yīng)答的順式作用元件最多,推測(cè)KcWRKY蛋白在植物激素調(diào)控植物的生物過(guò)程及逆境響應(yīng)過(guò)程中起著重要作用且功能復(fù)雜,這可能與秋茄能夠適應(yīng)復(fù)雜的潮間帶環(huán)境有關(guān)。
系統(tǒng)發(fā)育分析發(fā)現(xiàn),家族成員符合基因家族的一貫分類,除少數(shù)幾個(gè)KcWRKY蛋白結(jié)構(gòu)域部分缺失和變異之外,其他蛋白均具有完整準(zhǔn)確的結(jié)構(gòu)域,一定程度上說(shuō)明家族在進(jìn)化上相對(duì)保守。在基序組成上,秋茄的Ⅰ組C端WRKY結(jié)構(gòu)域與Ⅱ組、Ⅲ組WRKY結(jié)構(gòu)域含有相同的保守基序,和三淺裂野牽牛的結(jié)論一致,支持Ⅱ組、Ⅲ組WRKY成員的結(jié)構(gòu)域可能由Ⅰ組C端結(jié)構(gòu)域進(jìn)化而來(lái)的假設(shè);Ⅱ組是基因數(shù)量最多的一組,占基因家族的63.3%,表明Ⅱ組可能在進(jìn)化過(guò)程中發(fā)生了顯著擴(kuò)張,與大多數(shù)物種研究結(jié)果一致;Ⅱa組基因數(shù)量最少(2個(gè)),可能是因?yàn)樗倪M(jìn)化時(shí)間相對(duì)其他組較短,是基因家族中所有組中最后演化出來(lái)的。家族成員中出現(xiàn)保守基序的缺失,并未全部形成保守基序1-保守基序2的穩(wěn)定結(jié)構(gòu),解釋了秋茄WRKY 保守結(jié)構(gòu)域部分發(fā)生變異和缺失的原因,表明秋茄可能在變異中不斷獲得進(jìn)化。
基因在不同器官的表達(dá)模式分析結(jié)果表明,在花、根、莖、葉和果實(shí)前中后期均有表達(dá),是的同源基因,參與調(diào)節(jié)編碼線粒體和葉綠體蛋白的脅迫響應(yīng)基因,說(shuō)明可能也具有此功能。在葉和果實(shí)發(fā)育后期表達(dá)量較高,和互為同源基因,的表達(dá)會(huì)誘導(dǎo)葉片的衰老,表明可能參與秋茄葉和果實(shí)衰老的調(diào)節(jié)。