安爽, 劉金蓮, 占曉慧, 李永強,2, 宗宇,2*
(1.浙江師范大學(xué) 化學(xué)與生命科學(xué)學(xué)院,浙江 金華 321004; 2.浙江省特色經(jīng)濟植物生物技術(shù)研究重點實驗室,浙江 金華 321004)
藍莓(Vacciniumspp.)是杜鵑花科越橘屬植物,富含花青素及其他營養(yǎng)成分,具有多種功效,被世界糧農(nóng)組織推薦為五大健康水果之一,因此,在國內(nèi)也有大量種植,在研究利用方面也越來越受科學(xué)家的關(guān)注,各種關(guān)于藍莓的性狀標記、基因克隆及系譜分析等也得到廣泛研究。
藍莓適應(yīng)性強,喜弱酸性土壤,一般要求土壤pH值為4.5~5.5,但國內(nèi)土壤性質(zhì)差異較大,藍莓在種植過程中易受到土壤酸堿性的影響[1],這也是藍莓得不到廣泛種植的原因之一。為了加快我國藍莓產(chǎn)業(yè)的發(fā)展,擴大藍莓的栽培地域,了解藍莓在生長發(fā)育過程中能夠響應(yīng)土壤pH脅迫的相關(guān)基因是至關(guān)重要的,可以為進一步研究藍莓相關(guān)基因奠定基礎(chǔ),提高藍莓對土壤pH脅迫的適應(yīng)能力,從而可以利用國內(nèi)鹽堿地、酸性土壤等進行藍莓栽培,進而提高我國的藍莓經(jīng)濟效益。
轉(zhuǎn)錄因子基因家族中,堿性亮氨酸拉鏈(basic region/leucine zipper motif,bZIP)類轉(zhuǎn)錄因子廣泛存在于所有真核生物。bZIP類轉(zhuǎn)錄因子參與植物生長、發(fā)育、成熟、衰老、損傷、防御以及對各種環(huán)境脅迫的響應(yīng)過程,因此,bZIP轉(zhuǎn)錄因子基因在植物生長過程中對抗寒性、耐鹽性、耐pH脅迫等都具有較重要的調(diào)控抗逆作用[2-3]。藍莓的種植普遍受土壤pH的影響,因此,研究藍莓bZIP轉(zhuǎn)錄因子基因以及其在根系pH脅迫條件下的表達模式,對藍莓在中國不同酸堿度土壤成功并高效率培育種植具有重要意義。
擬南芥數(shù)據(jù)庫中下載氨基酸序列,在北京大學(xué)轉(zhuǎn)錄因子數(shù)據(jù)庫,從家族列表中選擇要找的家族名,使用makeblastdb建立藍莓氨基酸序列blastp本地數(shù)據(jù)庫,利用擬南芥的氨基酸序列對藍莓氨基酸本地數(shù)據(jù)庫進行blastp比對,同時利用HMMER進行模塊化檢索。
從Pfam蛋白家族數(shù)據(jù)庫(http://pfam. sanger.ac.uk/)下載bZIP轉(zhuǎn)錄因子家族相關(guān)結(jié)構(gòu)域bZIP_1(PF00170)、bZIP_2(PF07716)、bZIP_Maf(PF03131)的HMMER索引文件[4],執(zhí)行hmmsearch利用索引文件從藍莓氨基酸序列中進行搜索,調(diào)取blastp和hmmsearch檢索到的序列ID,根據(jù)ID利用Excel腳本去除重復(fù)序列;從藍莓氨基酸序列中調(diào)取出來進行CDD(conserve domain database)分析。將調(diào)取出來的gff文件上傳到http://gsds.cbi.pku.edu.cn/進行基因結(jié)構(gòu)分析,經(jīng)過鑒別之后獲取最終的氨基酸序列ID,進一步篩選調(diào)取出藍莓bZIP家族氨基酸序列,再根據(jù)人工去冗余得到最終的序列。
下載鑒定到的藍莓bZIP蛋白質(zhì)序列,利用ExPASy提供的在線工具ProtParam (http://web.expasy.org/protparam/)對得到的藍莓bZIP蛋白質(zhì)序列進行氨基酸數(shù)目、理論分子量、理論等電點、脂肪指數(shù)、親水性的平均值等理化性質(zhì)基本參數(shù)的分析,亞細胞定位則采用CELLO服務(wù)器V2.5進行鑒定[5]。了解藍莓bZIP轉(zhuǎn)錄因子基因的一些理化性質(zhì),為之后的基因家族分類等提供重要依據(jù)。
利用生物學(xué)軟件MEGA 7.0中的Clustal W程序?qū)㈣b定到的bZIP氨基酸序列進行多重序列比對,生成.meg格式文件,用鄰近法(neighbor-joining)進行聚類分析并將所得到的比對結(jié)果構(gòu)建系統(tǒng)發(fā)育進化樹,具體參數(shù)為:Model為p-distance,Bootstrap值為1 000,其余參數(shù)為默認[6-11]。將北大基因庫下載的擬南芥序列與得到的序列進行整合,利用MEGA軟件中的Clustal W程序?qū)喜⑿蛄羞M行alignment處理,進行序列聯(lián)配操作,最后利用IQ-tree進行建樹。將IQ-tree得到的結(jié)果利用Fig-Tree軟件打開,在Fig-Tree中對得到的進化樹進行分枝粗細、樣本名大小及顏色調(diào)整等處理,同時對比mega和Fig-Tree生成的進化樹,選擇能夠更直觀地展現(xiàn)基因進化趨勢及特點的進化樹。根據(jù)擬南芥的分類標準[12]對結(jié)果進行分類,分析藍莓轉(zhuǎn)錄因子和擬南芥轉(zhuǎn)錄因子之間的同源進化關(guān)系。
將調(diào)取出來的氨基酸序列上傳到http://meme-suite.org/tools/meme,使用MEME在線分析工具對蛋白質(zhì)序列進行motif保守結(jié)構(gòu)域分析(具體參數(shù)默認)[13],預(yù)測藍莓bZIP蛋白的保守基序序列。利用MEGA將藍莓氨基酸序列以nwk文件形式導(dǎo)出,同時利用TB-tools(TB-tools:https://github.com/CJ-Chen/TBtools)軟件,導(dǎo)入之前所得到的MEGA構(gòu)建進化樹的nwk文件、相關(guān)基因的gff或者gff3文件、MEME的分析結(jié)果文件:meme.xml,繪制三圖合一,并進行位置、顏色、距離等的調(diào)整,得到一張合適的進化樹、基因結(jié)構(gòu)與motif結(jié)合的圖片,觀察分析轉(zhuǎn)錄因子序列的保守結(jié)構(gòu)域、基因結(jié)構(gòu)等。
下載藍莓不同組織各個基因的表達量FPKM(fragments per kilobase per million)以及藍莓根系在不同pH下不同基因的表達量FPKM[14]。通過linux系統(tǒng)將鑒定到的藍莓bZIP轉(zhuǎn)錄因子家族基因與2個測序數(shù)據(jù)分別進行比對,得到不同組織bZIP轉(zhuǎn)錄因子基因的表達Reads數(shù)據(jù)以及藍莓根系在不同pH下bZIP轉(zhuǎn)錄因子基因的表達數(shù)據(jù)。下載安裝R軟件和RStudio軟件,利用RStudio軟件繪制各組織器官以及不同pH下根系的表達熱圖。
利用bZIP相關(guān)結(jié)構(gòu)域的HMM文件,通過HMMER軟件對藍莓基因組序列進行比對搜索后,共得到131個含bZIP結(jié)構(gòu)域的bZIP轉(zhuǎn)錄因子。由序列ID可知,131個藍莓bZIP家族基因分散在藍莓的多條染色體上。因藍莓是四倍體植物,為方便之后與擬南芥轉(zhuǎn)錄因子一同構(gòu)建系統(tǒng)進化樹,并進行同源序列比對,對得到的131個藍莓bZIP轉(zhuǎn)錄因子基因進行人工去冗余,最后得到31個bZIP轉(zhuǎn)錄因子基因,分別命名為VcbZIP1-VcbZIP31。根據(jù)序列ID對應(yīng)的染色體位置進行分組編號,發(fā)現(xiàn)在2號染色體以及12號染色體上的基因序列最多,有6條,在5號、8號以及10號染色體上的基因序列最少,只有一條。
將藍莓中bZIP基因家族成員按照其所在的染色體位置進行排序,將每條序列通過ExPASy處理進行理化性質(zhì)分析,分析結(jié)果如表1。由理化參數(shù)分析結(jié)果可知,藍莓bZIP轉(zhuǎn)錄因子家族基因中最長的bZIP蛋白(VcbZIP10)有916個氨基酸,最短的bZIP蛋白(VcbZIP5)有197個氨基酸,分子量從22 325.03(VcbZIP5)到100 534.47(VcbZIP10)不等,等電點從5.19(VcbZIP28)到9.70(VcbZIP30)不等,脂肪指數(shù)從52.48(VcbZIP18)到90.83(VcbZIP24)不等,親水性的平均值在-0.941(VcbZIP20)到-0.199(VcbZIP10)不等。根據(jù)CELLO的預(yù)測顯示,藍莓bZIP基因大部分位于細胞外(extracellular)及細胞外膜(outer membrane),少部分定位于細胞質(zhì)(漿)(cytoplasmic)以及內(nèi)膜周質(zhì)(periplasmic)。由于ExPASy在線工具上的藍莓基因組數(shù)據(jù)并不完善,因此,目前尚存在一些轉(zhuǎn)錄因子(VcbZIP15)的相對分子質(zhì)量、等電點等基本參數(shù)信息還不明確。
表1 藍莓bZIP家族基因基本參數(shù)
藍莓bZIP轉(zhuǎn)錄因子家族成員的基因比對擬南芥基因組數(shù)據(jù)庫,得到擬南芥中同源性最高的基因和E值,這為研究藍莓bZIP基因家族提供了參考。為更深入地了解藍莓bZIP轉(zhuǎn)錄因子與擬南芥bZIP轉(zhuǎn)錄因子的同源進化關(guān)系,構(gòu)建了藍莓與擬南芥的系統(tǒng)進化樹。由圖1以及根據(jù)Jakoby等[15-16]對擬南芥bZIP基因家族的分類標準,再依據(jù)基因的聚類特點及bZIP結(jié)構(gòu)域的一些特性,可以將藍莓bZIP基因家族分為A組(9個)、B組(3個)、C組(1個)、D組(6個)、E組(3個)、F組(0個)、G組(3個)、H組(0個)、I組(4個)、J組(0個)、K組(1個)、M組(0個)及S(1個),共13組。其中A組所含有的成員最多,有9個;C組、K組和S組成員中所含的藍莓bZIP基因成員數(shù)目最少,只有1個;F組、H組、J組、M組成員中雖然有擬南芥bZIP轉(zhuǎn)錄因子,但是沒有藍莓bZIP轉(zhuǎn)錄因子家族成員,因此,忽略這4組,只保留9個組(表2)。其余B組、D組、E組、G組、I組所含成員在3、4、6個數(shù)目不等。
表2 藍莓bZIP家族的分類
圖1 藍莓bZIP與擬南芥bZIP轉(zhuǎn)錄因子系統(tǒng)進化樹比較
圖2所示,每個基因的基因結(jié)構(gòu)、氨基酸長度特別是內(nèi)含子、外顯子等的數(shù)量和分布,都與進化有密切關(guān)系。VcbZIP25蛋白序列最長,一些蛋白序列很短,大部分基因都存在于5′-UTR和3′-UTR區(qū)域;另外,從圖中可知每條蛋白序列所含有的保守基序的數(shù)量以及類型都存在差異,其在分布上的差異,可能表明每個基序的功能有所差異。VcbZIP29保守域最多,有4個保守域,VcbZIP31、VcbZIP13、VcbZIP4、VcbZIP27有3個保守域,分別是motif1、motif2、motif3,這5個家族基因都屬于D組,其余序列都只含一個保守域(motif1)。motif1基序分布較廣泛,在植物的生長發(fā)育或者逆境脅迫下發(fā)揮著巨大的作用??傮w而言,大部分保守域位于3′端,少部分位于5′端。
圖2 藍莓bZIP轉(zhuǎn)錄因子構(gòu)建樹、基因結(jié)構(gòu)和保守域三合一圖
由圖3可看出,大部分基因在植物各個組織在一天不同時間段以及果實發(fā)育的不同時期都有一定量的表達,并且不同bZIP轉(zhuǎn)錄基因在同一組織中的表達量不同,同一轉(zhuǎn)錄基因在不同組織器官中的表達量也有所不同,位于系統(tǒng)進化樹中同一組的不同轉(zhuǎn)錄基因其表達模式相似,這說明該組成員中的基因在藍莓的某個組織器官或者是在某個特定時期發(fā)揮著重要作用。VcbZIP27在藍莓根部發(fā)育過程或是根部受到鹽脅迫時其表達量明顯高于其他基因,說明該組基因有可能參與藍莓生長發(fā)育過程中根部的發(fā)育以及在非生物脅迫尤其是鹽脅迫中發(fā)揮巨大作用,能夠增強根部對鹽的耐受性;VcbZIP20在藍莓花期時的花、處于花瓣掉落期的花以及不同時期果實中表達量相對較高,而在根、葉等部位表達量相對較低;VcbZIP21、VcbZIP10、VcbZIP19在不同溫度處理下的藍莓、不同時間段的葉片、茉莉酸甲酯處理后1 h、茉莉酸處理后8 h表達量相對較高,而在根、葉、不同時期果實中表達量相對較少;VcbZIP28除了在根部表達量相對較低,在其他階段表達量都相對較高,說明這些基因在藍莓發(fā)育過程中參與多種生理生化的轉(zhuǎn)錄調(diào)控,發(fā)揮重要作用。VcbZIP6、VcbZIP30在茉莉酸甲酯處理后24 h的藍莓、花瓣掉落時期的花、不同時期的果實中表達量相對于其他時期較高,說明這些基因在果實生長發(fā)育方面發(fā)揮著一定的作用;VcbZIP1、VcbZIP24、VcbZIP22、VcbZIP25、VcbZIP7、VcbZIP5、VcbZIP31、VcbZIP17、VcbZIP14、VcbZIP16、VcbZIP15、VcbZIP13、VcbZIP18、VcbZIP11、VcbZIP26、VcbZIP23、VcbZIP8、VcbZIP29基因相對其他基因表達量較低,在藍莓全生長發(fā)育過程表達量相差不大;VcbZIP2、VcbZIP12、VcbZIP3基因在藍莓生長發(fā)育過程中幾乎不表達,推測其在藍莓生長發(fā)育階段沒有參與一些生理生化過程,也可能是這些基因的轉(zhuǎn)錄活性太低;VcbZIP9、VcbZIP4在藍莓花芽期表達量相對較高,而在其他時期幾乎不表達,說明這些基因?qū)λ{莓的開花具有一定的作用。
圖3 bZIP轉(zhuǎn)錄因子在藍莓不同組織的表達量
藍莓bZIP轉(zhuǎn)錄因子基因在根系pH 4.5和pH 6.5下表達量存在差異(圖4),VcbZIP10在pH 4.5和pH 6.5表達量都很高,說明藍莓根系在受到pH脅迫時,VcbZIP10的表達不受影響;VcbZIP27、VcbZIP31、VcbZIP1、VcbZIP19、VcbZIP28、VcbZIP13在受到pH 6.5的脅迫下相對于其他基因表達量較高;其余的bZIP轉(zhuǎn)錄因子基因在抗酸堿性過程中幾乎不表達,可能是在抗逆過程中沒有參與相關(guān)的生理生化過程,也可能是因為其活性較低。
圖4 藍莓bZIP轉(zhuǎn)錄因子基因在根系不同pH脅迫下的表達量
藍莓bZIP轉(zhuǎn)錄因子基因預(yù)測已經(jīng)完成,但關(guān)于藍莓轉(zhuǎn)錄因子的研究仍較少,本研究主要運用生物信息學(xué)的方法,從藍莓中鑒定出131個bZIP轉(zhuǎn)錄因子基因,經(jīng)過人工去冗余得到31個轉(zhuǎn)錄因子基因,這些基因分布在10條染色體上。根據(jù)構(gòu)建藍莓與擬南芥bZIP轉(zhuǎn)錄因子基因的同源進化關(guān)系,將31個轉(zhuǎn)錄因子基因分為9組,分別是A組(9個)、B組(3個)、C組(1個)、D組(6個)、E組(3個)、G組(3個)、I組(4個)、K組(1個)及S組(1個),不同組內(nèi)成員具有不同的功能。
據(jù)文獻報道,一些基因家族成員的功能特征已在擬南芥中得到驗證,如:A組bZIP轉(zhuǎn)錄因子基因的信號傳遞主要是依賴于ABA信號,在非生物脅迫(如寒冷、鹽度或干旱等)下發(fā)揮激活作用,比如擬南芥A亞族中的ABA響應(yīng)元件ABRE(ABA response element)、脫落酸應(yīng)答元件結(jié)合因子ABFs(ABA-responsive element binding proteins)等;B組和K組成員主要是作為進化保守內(nèi)質(zhì)網(wǎng)(ER)應(yīng)力響應(yīng)的重要調(diào)控因子,增強對鹽處理的耐受性;C組和S組成員形成一種C/S1-bZIP網(wǎng)絡(luò),作為信號中樞,以促進能量、營養(yǎng)饑餓導(dǎo)致的新陳代謝適應(yīng)與生存;D組包括TGA因子(TGAs),受水楊酸(SA)誘導(dǎo),NPR1是其轉(zhuǎn)錄共激活因子,在遇到生物營養(yǎng)病原體時依賴于SA的防御,激素茉莉酸(JA)和乙烯(ET)則協(xié)調(diào)對壞死因子的防御。除了參與防御反應(yīng)外,也參與控制解毒陽離子過程,因此,大多數(shù)D組bZIP提高了植物存活病原體和異生物脅迫的能力;E組成員與花粉萌發(fā)和花粉管生長有一定的聯(lián)系;G組成員中GBF1是藍光依賴性下胚軸擴張的負調(diào)節(jié)因子,對HY5和HYH具有拮抗作用,此外還能促進側(cè)根發(fā)育和自然衰老;I組成員中VIP1作為T-DNA轉(zhuǎn)移的宿主因子,具有低硫耐受性、感受信號等功能。在bZIP轉(zhuǎn)錄因子基因家族中,A、B、H及S亞族bZIP基因主要參與植物非生物脅迫響應(yīng)及激素信號轉(zhuǎn)導(dǎo)過程,根據(jù)同源進化關(guān)系,推測與擬南芥同一組的藍莓直系同源基因也可能參與藍莓生長發(fā)育的生理生化作用。
根據(jù)RStudio軟件制作熱圖,發(fā)現(xiàn)相同轉(zhuǎn)錄因子基因在藍莓不同組織器官中表達量有所差異,不同基因在藍莓同一部位表達量也存在差異。研究結(jié)果表明,bZIP轉(zhuǎn)錄因子在藍莓生長發(fā)育過程中表現(xiàn)出組織特異性表達,但VcbZIP2、VcbZIP12、VcbZIP3等在藍莓生長發(fā)育過程中幾乎不表達,其余基因在藍莓不同組織器官的表達量幾乎無差異。
研究發(fā)現(xiàn),在藍莓bZIP轉(zhuǎn)錄因子基因中,VcbZIP10、VcbZIP27、VcbZIP31、VcbZIP1、VcbZIP19、VcbZIP28、VcbZIP13、VcbZIP12在藍莓受到pH脅迫條件下的表達量相對于正常pH時較高,推測上述基因所在的B組、C組、D組、E組等基因在植物抗pH脅迫條件下參與調(diào)控作用。