唐學(xué)璽,尚 帥,2,臧 宇,陳 軍,薛 頌
(1. 中國海洋大學(xué)海洋生命學(xué)院,山東 青島 266003; 2. 濱州學(xué)院黃河三角洲生態(tài)環(huán)境研究中心,山東 濱州 256600;3. 自然資源部第一海洋研究,山東 青島 266061)
植物的發(fā)育受到多種非生物脅迫的影響,例如溫度,干旱和鹽堿化;在漫長的進(jìn)化過程中,植物進(jìn)化出了復(fù)雜多樣的方式以適應(yīng)溫度變化。其中,熱應(yīng)激響應(yīng)蛋白(Heat shock proteins,HSP)作為熱反應(yīng)的重要響應(yīng)分子,在植物細(xì)胞的修復(fù)、蛋白的轉(zhuǎn)錄修飾以及信號轉(zhuǎn)導(dǎo)中具有重要的作用[1]。熱激轉(zhuǎn)錄因子(Heat shock transcription factors,HSF)作為熱激反應(yīng)的主要調(diào)控因子,通過上調(diào)HSP17,HSP70和HSP90等各種HSP家族的活性[2],參與植物對脅迫反應(yīng)的轉(zhuǎn)錄調(diào)控[3-4],也參與植物的生長發(fā)育過程[5-6],在熱應(yīng)激反應(yīng)以及其他非生物和生物脅迫中起重要作用。在植物中,HSF蛋白結(jié)構(gòu)非常保守,通常包括N-端DNA結(jié)構(gòu)域(DBD),寡聚化功能域(OD),核定位信號(NLS)和核輸出信號(NES)[7]。HSF基因家族可分為A,B和C三類[7]。其中,A類主要參與熱激基因表達(dá),B類沒有熱激誘導(dǎo)的轉(zhuǎn)錄激活活性,可能與A類協(xié)同發(fā)揮作用,C類的作用尚不清楚[7]。迄今為止,植物HSF基因的研究主要集中于各類作物植物,例如小麥(Triticumaestivum)[8]、水稻[9]、玉米(Zeamays)[10]、番茄(Solanumlycopersicum)[11]和豆類[12]等,但在海洋高等植物中研究較少。
海草(Seagrasses) 是一種生長于熱帶和溫帶沿海地區(qū)的單子葉被子植物,能夠在海水中完成種子萌發(fā)、生長和繁殖過程[13]。由海草構(gòu)成的海草床是典型的近海生態(tài)系統(tǒng)之一,在穩(wěn)定沉積物和為海洋生物提供天然的棲息、索餌、育幼和庇護(hù)場所發(fā)揮著關(guān)鍵作用,其生態(tài)價值可與紅樹林和珊瑚礁生態(tài)系統(tǒng)相媲美[13-14]。近年來,由于全球海洋環(huán)境變化和人為活動的影響,導(dǎo)致世界范圍內(nèi)海草床嚴(yán)重衰退。海草床的退化消失將直接導(dǎo)致生物棲息生境喪失、生物多樣性銳減以及生物地球化學(xué)過程失衡,加劇近海生態(tài)系統(tǒng)的脆弱性。鰻草(Zosteramarina) 是一種溫帶廣泛分布的海草類群[15],也是為數(shù)不多生活在海洋中的高等植物之一[16],在中國主要分布于遼寧至山東的潮間帶和潮下帶[17]。鰻草是陸生植物向海洋逐漸遷移進(jìn)化而來,能夠在陸海過渡地帶的潮間帶地區(qū)生存和繁殖,受到潮汐變化的影響,其生長環(huán)境存在光照、鹽度和溫度等環(huán)境因子的劇烈變化。在長期進(jìn)化過程中,鰻草至少經(jīng)歷了三次并行演化[18],進(jìn)化出多種形態(tài)和生理功能,從而能夠適應(yīng)海水的高滲、低光強和光質(zhì)變化。
為了探究HSF在鰻草適應(yīng)海洋環(huán)境過程中的轉(zhuǎn)錄調(diào)控作用,有必要采用生物信息學(xué)手段,深入研究HSF家族信息及其分子進(jìn)化特征。基于上述目的,本研究以鰻草基因組以及轉(zhuǎn)錄組測序結(jié)果為基礎(chǔ)[19],對鰻草HSF家族進(jìn)行序列特征、基因結(jié)構(gòu)、系統(tǒng)發(fā)育關(guān)系、順式作用元件和表達(dá)情況分析,以期為鰻草HSF基因家族功能研究奠定基礎(chǔ),本研究結(jié)果對揭示海洋高等植物的環(huán)境適應(yīng)分子機(jī)制具有重要的理論意義。
鰻草的基因組序列、編碼蛋白氨基酸序列和cDNA序列來源于phytozome v12.1數(shù)據(jù)庫(https://phytozome.jgi.doe.gov)和NCBI(https://www.ncbi.nlm.nih.gov)。下載至本地電腦后,基于本地Blast軟件,構(gòu)建本地數(shù)據(jù)庫。以擬南芥(Arabidopsisthaliana)21個HSFs家族的氨基酸作為種子序列,搜索鰻草基因組和蛋白質(zhì)數(shù)據(jù)庫,篩選獲取e值小于-20的序列作為ZmHSFs候選基因。為更好確定獲取基因的準(zhǔn)確性,本研究結(jié)合Pfam蛋白結(jié)構(gòu)域數(shù)據(jù)中HSF家族的DNA結(jié)構(gòu)域(PF00447),利用HMMER軟件構(gòu)建隱馬爾可夫模型,并以此作為種子序列檢索鰻草蛋白質(zhì)數(shù)據(jù)庫,獲取HSFs的候選基因。綜合兩種篩選方式所獲取基因,利用SMART軟件對候選基因進(jìn)行保守結(jié)構(gòu)域的鑒定。此外,利用 ExPasy(https://web.expasy.org/protparam)對蛋白質(zhì)的理化性質(zhì)進(jìn)行分析。
使用基因結(jié)構(gòu)顯示系統(tǒng)GSDS 2.0(http://gsds.cbi.pku.edu.cn)[20]繪制鰻草HSF基因家族的基因結(jié)構(gòu)示意圖。使用MEME(http://meme-suite.org/doc/download.html)對所篩選的鰻草HSF蛋白的保守基序進(jìn)行分析[21],基序搜索數(shù)目為5,其他參數(shù)為默認(rèn)設(shè)置。
為探究鰻草HSF基因家族的系統(tǒng)發(fā)生關(guān)系,使用MEGA 6.0軟件,利用鄰接法構(gòu)建鰻草、同屬的Zosteramuelleri和擬南芥(模式種)3個物種的HSF基因家族的系統(tǒng)發(fā)育樹,自檢值設(shè)置為1 000,并使用iTOL在線軟件分析(http://itol2.embl.de)。
從鰻草基因組數(shù)據(jù)庫中獲取HSF基因家族成員轉(zhuǎn)錄起始位點上游2 000 bp序列,并利用PlantCARE在線數(shù)據(jù)(http://bioinformatics.psb.ugent.be/webtools/plantcare/html)[22]對啟動子區(qū)的順式作用元件進(jìn)行分析。
鰻草HSF基因家族在不同器官中的表達(dá)情況數(shù)據(jù)來源于NCBI數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/sra),SRX978554-SRX978576[19],對下載數(shù)據(jù)核對后,利用TBtool程序分析這些HSF基因的表達(dá)數(shù)據(jù)并制作基因表達(dá)熱圖[23]。
利用phytozome v12.1數(shù)據(jù)庫和NCBI數(shù)據(jù)中鰻草的基因組數(shù)據(jù),共鑒定出了12個鰻草HSF轉(zhuǎn)錄因子,經(jīng)過Pfam數(shù)據(jù)庫和SMART功能結(jié)構(gòu)域的鑒定,最終確定了11個鰻草HSF基因。根據(jù)擬南芥HSF轉(zhuǎn)錄因子亞家族的劃分和命名,結(jié)合鰻草拉丁名縮寫Zm(Z.marina),對鰻草HSF轉(zhuǎn)錄因子進(jìn)行分類和命名,共劃分出了7個HSFA亞家族成員和4個HSFB亞家族成員,在鰻草基因組中并未鑒定出HSFC亞家族成員。其中,HSFA包含五個亞家族,HSFB包含兩個亞家族;HSFA7亞家族所包含的數(shù)目最多,共有3個亞家族成員。
ZmHSFs大小差異較大,最小的ZmHsfA2a僅編碼123個氨基酸,最大的是ZmHsfA5,編碼416個氨基酸,其分子量也最大(43.06 kD)。ZmHSFs理化性質(zhì)分析結(jié)果顯示(見表1),大部分的等電點小于7,只有4個大于7,分別是ZmHsfA7a、ZmHsfA7b、ZmHsfB2a和ZmHsfB2b。蛋白親疏預(yù)測結(jié)果顯示,11個HSF蛋白總平均疏水指數(shù)均小于0,均為親水性蛋白。亞細(xì)胞定位結(jié)果顯示,有10個HSF蛋白定位于核膜中,僅有一個定位于細(xì)胞質(zhì)中。
ZmHSFs基因結(jié)構(gòu)分析結(jié)果表明,11個ZmHSFs基因結(jié)構(gòu)中均不含有內(nèi)含子,相同的ZmHSFs亞家族具有相似的基因結(jié)構(gòu)(見圖1)。
圖1 鰻草HSF基因結(jié)構(gòu)示意圖
ZmHSFs蛋白的保守基序分析結(jié)果顯示(見圖2),同一亞家族的HSF基因的保守基序較為相似,如ZmHsfA7a/ZmHsfA7b/ZmHsfA7c、ZmHsfB2a和ZmHsfB2b、ZmHsfB4h和ZmHsfB4b每組基因親緣關(guān)系較近,它們的基序也相似。11個HSF蛋白基序中均含有Motif 1和Motif 2,Motif 3存在于10個鰻草ZmHSFs蛋白中,由此推測上述3個Motif在鰻草蛋白基序中分布較廣,具有較強的保守性。
表1 鰻草11個HSF基因家族成員及其理化性質(zhì)
圖2 鰻草HSF蛋白保守基序分析
系統(tǒng)發(fā)育樹分析結(jié)果顯示,HSF基因可以劃分為兩大分支,其中HSFB基因組成一支,HSFA和HSFC組成一支(見圖3)。其中,AtHSFC1與HSFA基因家族聚到一起,并未單獨聚為一支;鰻草各HSF基因與擬南芥和Z.muelleri各亞家族基因聚到一起;在各亞家族內(nèi)部,大部分鰻草HSF基因與ZmuHSF聚到一起,部分ZmuHSF與AtHSF聚到一起。
圖3 基于鰻草、擬南芥和Zostera muelleri HSF的氨基酸序列系統(tǒng)進(jìn)化分析結(jié)果
ZmHSFs的順式啟動子元件分析結(jié)果表明,各ZmHSF均含有CAAT-box和TATA-box,主要為啟動子和增強子區(qū)共有順式作用元件;CGTCA-motif元件和TGACG-motif元件存在于大部分的鰻草HSF基因中,為MeJA響應(yīng)相關(guān)順式作用調(diào)控元件。光反應(yīng)響應(yīng)模塊相關(guān)的元件普遍存在于鰻草HSF基因中,例如AE-box,Box4,GT1-motif,G-box,GA-motif和TCT-motif等;參與抗逆相關(guān)的調(diào)控元件例如ARE、LTR和MBS等也存在于多個鰻草HSF基因中;參與激素調(diào)節(jié)的相關(guān)調(diào)控元件,例如TCA-element和ABRE存在于多個ZmHSFs基因中(見表2、3)。
通過已報道轉(zhuǎn)錄組數(shù)據(jù),分析ZmHSFs基因在不同器官中的表達(dá)情況(見圖4)。結(jié)果顯示,在各器官中均檢測到HSF基因的表達(dá)。其中,鰻草雌花發(fā)育前期和后期的表達(dá)結(jié)果表明,ZmHsfA5、ZmHsfB2a和ZmHsfB4b在雌花發(fā)育前后存在表達(dá)差異,其余ZmHSFs差異不明顯。通過比較HSF基因在不同器官中的表達(dá)情況發(fā)現(xiàn),ZmHsfA4b、ZmHsfA1和ZmHsfB2a在各個器官中均有較高水平的表達(dá);ZmHsfA7b和ZmHsfB2b雖有表達(dá),但相比于其他HSF基因,其表達(dá)水平較低。此外,同一基因在不同器官中存在表達(dá)差異,例如ZmHsfA7b在雄花和營養(yǎng)枝中相對表達(dá)水平較高,但在根中表達(dá)水平較低;ZmHsfA5和ZmHsfA4b在營養(yǎng)枝和根中表達(dá)較高,在雌花與雄花中表達(dá)較低;ZmHsfA2a在雄花中表達(dá)水平較高,而在其他器官中表達(dá)較低。
表2 鰻草HSF基因啟動子順式作用元件的種類與數(shù)量
表3 鰻草HSF基因啟動子順式作用元件核心序列與功能
本研究基于已發(fā)表的鰻草基因組信息,共鑒定出11個鰻草HSF基因,僅包含HSFA和HSFB兩個亞家族,并未鑒定出HSFC亞家族。自然條件下,高溫、鹽堿和干旱等非生物脅迫對植物的生長、發(fā)育和繁殖會產(chǎn)生不利影響。研究表明,植物HSF基因可響應(yīng)多種非生物脅迫,在植物應(yīng)對各種非生物脅迫中起著重要的作用,近年來引起了廣泛關(guān)注[3-4]。HSF基因家族成員在多個物種已被鑒定,但在海洋生物中,尤其是在對近岸海洋生態(tài)具有重要作用的海草中研究較少。鰻草作為適應(yīng)在海洋環(huán)境中生長和繁殖的多年生被子植物[19],分析其HSF基因家族對研究海洋高等植物適應(yīng)海洋環(huán)境的分子機(jī)制具有重要意義。前人研究發(fā)現(xiàn),植物在進(jìn)化過程中出現(xiàn)了單、雙子葉植物特有成員,例如HSFA8和HSFB3為雙子葉植物所特有,HSFA9和HSFC2為單子也植物所特有[24],本研究發(fā)現(xiàn)鰻草中缺少上述四種亞家族基因,推測可能是與其二次入海相關(guān)的進(jìn)化過程有關(guān),導(dǎo)致了部分HSF基因的缺失。系統(tǒng)發(fā)育分析表明,鰻草、擬南芥和Zosteramuelleri的HSF基因系統(tǒng)發(fā)育樹分為兩大分支,HSFB單獨一支,HSFA和HSFC聚為一支。前人結(jié)果發(fā)現(xiàn),HSFB亞家族通常單獨形成一支,而HSFC在一些物種中單獨一支,但在許多物種中,HSFC和HSFA可以聚到一起[25],與本研究結(jié)果一致。為更好的探究植物HSF基因的數(shù)目規(guī)律,本研究匯總HSF基因家族在35個物種中的數(shù)目特征(見表4)。結(jié)果表明所有物種中HSF基因數(shù)目存在一定的差異性,與高等植物相比,HSF基因在三種藻類植物、苔蘚植物(小立碗蘚)和蕨類植物(江南卷柏)等低等植物中數(shù)目較少。大量研究表明,基因復(fù)制不僅可以增加基因的數(shù)量,而且是產(chǎn)生新基因的途徑,有利于植物適應(yīng)各種環(huán)境[47-48]。HSF基因家族成員的數(shù)量與基因組復(fù)制事件有關(guān)之外,植物進(jìn)化過程中所受的選擇壓力也會影響HSF基因家族的數(shù)目,鰻草在演化過程中經(jīng)歷了至少三次并行演化事件,適應(yīng)陸地生活后又返回海洋環(huán)境中[26],我們推測鰻草HSF基因數(shù)目相對其它高等植物較少的原因是由于其在進(jìn)化過程中的二次入海,導(dǎo)致部分基因數(shù)目在進(jìn)化中丟失,從而使鰻草的HSF基因家族數(shù)目少于其他陸生高等植物。
圖4 鰻草HSF基因在不同器官中表達(dá)分析
表4 35個物種HSF基因家族家族匯總
續(xù)表4
植物體內(nèi)信號傳遞過程較為復(fù)雜,同一轉(zhuǎn)錄因子可能參與多種信號的表達(dá)。前人研究發(fā)現(xiàn),多種信號通路可能參與植物應(yīng)對溫度等非生物脅迫[24,49]。ZmHSFs基因順式作用元件分析結(jié)果顯示,ABRE、AE-box,Box4,GT1-motif,G-box,GA-motif、TCT-motif和LTR等普遍存在,說明ZmHSFs很可能同時受到溫度和光照等多種非生物因素的調(diào)控[24];我們推測在海草生存環(huán)境中,光照的變化可能對鰻草生長造成很大的影響,因此在其調(diào)控元件中,存在多個與光反應(yīng)模塊相關(guān)的順式作用元件?;虻谋磉_(dá)模式與其功能密切相關(guān)。近年來,人們對鰻草抗逆基因響應(yīng)環(huán)境脅迫的轉(zhuǎn)錄表達(dá)特征進(jìn)行了廣泛的研究,特別是溫度[50]和鹽度[51-52]影響下的基因表達(dá)特征,但是圍繞HSF基因家族的研究較少。本研究分析了11個ZmHSFs在三種器官中的表達(dá)模式,結(jié)果表明大部分ZmHSFs存在一定的器官表達(dá)差異性,如營養(yǎng)枝和根中的ZmHsfA5和ZmHsfA4b,及雄花中的ZmHsfA2a。HSF基因在不同器官中表達(dá)模式存在較大差異,這在其他植物也存在類似的研究結(jié)果。Guo等[53]研究了辣椒(Capsicumannuum)HSF基因在不同器官和不同發(fā)育時期的表達(dá)譜,發(fā)現(xiàn)CaHsfs存在組織表達(dá)特異性和時期表達(dá)特異性,推測CaHsfs廣泛參與了辣椒的生長發(fā)育過程。王云等對龍眼(Dimocarpuslongan)HSF基因家族不同成員在不同組織器官的表達(dá)分析,發(fā)現(xiàn)花芽和花蕾的表達(dá)量明顯高于其他器官,推測DlHsf可能參與龍眼花的發(fā)育過程[54]。而在鰻草中,以其他器官相比,ZmHSFs主要在營養(yǎng)枝中相對表達(dá)量較高,推測ZmHSFs可能與營養(yǎng)枝的生長發(fā)育過程相關(guān)。
本研究基于已發(fā)表的鰻草基因組信息,鑒定出了11個ZmHSFs,包含HSFA和HSFB兩個亞家族,并未鑒定出HSFC亞家族,基因數(shù)目明顯少于其他高等植物,推測二次入海導(dǎo)致鰻草HSF基因數(shù)目在進(jìn)化過程中丟失。鰻草HSF基因順式作用元件中存在ABRE、AE-box,Box4,GT1-motif,G-box,GA-motif、TCT-motif和LTR等,其表達(dá)調(diào)控很可能同時受到溫度和光照等多種非生物因素的影響。轉(zhuǎn)錄表達(dá)數(shù)據(jù)顯示,鰻草HSF基因存在基因表達(dá)差異和器官表達(dá)差異。本研究對ZmHSFs基因進(jìn)行了生物信息學(xué)分析,可為今后深入研究該家族在海草中基因的結(jié)構(gòu)特征和功能提供參考。