楊玄松,謝雯榕,顧 鋼,宋江雨,趙云飛,林曉路,謝小芳,張炳輝*
1. 福建農林大學生命科學學院, 福州市倉山區(qū)上下店路15 號 350002
2. 福建省煙草專賣局煙草科學研究所,福州市鼓樓區(qū)北環(huán)中路133 號 350003
3. 福建省煙草公司南平市公司,福建省南平市延平區(qū)江濱中路389 號 364200
4. 福建省煙草公司三明市公司,福建省三明市三元區(qū)崇桂新村100 幢 365000
5. 福建省煙草公司龍巖市公司,福建省龍巖市新羅區(qū)龍巖大道288 號 364000
GATA 轉錄因子是真核生物中一種含有高度保守的Ⅳ類鋅指基序的DNA結合蛋白,這類反式作用因子能夠特異性地結合含有WGATAR 的DNA 序列(其中:W對應A或T,R對應A或G),從而調控相關基因的表達。該轉錄因子最初在動物和真菌中被證實,之后發(fā)現GATA轉錄因子也大量存在于植物中[1]。
動物中GATA 轉錄因子的DNA 結合域表現為C-X2-C-X17-C-X2-C的形式[2],同時GATA蛋白有兩個功能不同的鋅指結構[3-4]。目前發(fā)現動物GATA家族有6個成員,依次為GATA1-6,根據其結構特征可分為兩個亞族,其中GATA1-3 為一個亞族,GATA4-6為另一亞族[5]。有研究表明,動物中GATA轉錄因子與細胞的增殖分化以及動物個體的生長發(fā)育有著密切聯(lián)系[2],其中GATA1-3與動物細胞的造血功能密切相關[6],而GATA4-6在動物心臟形成過程中發(fā)揮重要作用[7-8]。與動物的GATA轉錄因子家族不同,真菌中大多數的GATA蛋白僅包含單個鋅指結構域,通常分為兩大類:一類GATA蛋白是帶有17個殘基的Ⅳa 型鋅指(C-X2-C-X17-C-X2-C);另一類則是帶有18 個殘基的Ⅳb 型鋅指(C-X2-C-X18-C-X 2-C)[9],此外,在極少數真菌中也發(fā)現帶有19個或20個殘基鋅指環(huán)的GATA蛋白。GATA轉錄因子在真菌中參與調控氮代謝、鐵載體的生物合成、光誘導以及晝夜節(jié)律等過程[10]。
植物中的第1個GATA 轉錄因子NTL1克隆于煙草,揭示了高等植物GATA轉錄因子的存在,該轉錄因子被證實參與了氮代謝途徑[11]。大多數植物GATA轉錄因子通常只包含1個帶有18或20個殘基的鋅指結構域(C-X2-C-X18-C-X2-C 或C-X2-C-X20-C-X2-C),但也存在兩個鋅指結構域的特殊情況[12]。已有研究表明,植物中GATA 轉錄因子通過與啟動子上的WGATAR序列結合,從而啟動或抑制轉錄過程而調控植物的生長發(fā)育[13],包括調控花器官、莖尖分生組織的發(fā)育以及細胞的增殖與分化[14],促進種子萌發(fā)[15],調控葉綠體的形成[16],參與葉綠素的合成和葡萄糖信號傳導[17],光保護反應[18],干旱、冷害、黑暗等非生物脅迫響應過程[19-22]和植物激素的合成(如細胞分裂素等)[23],以及碳、氮代謝等生物學過程[11,17]。同時研究還發(fā)現GATA轉錄因子對葉片衰老也起著重要的調控作用[24]。
煙草收獲的主要器官為煙葉,而葉片的生長發(fā)育、葉色的轉換以及衰老成熟與煙葉品質密切相關[25]。此外,在生產過程中,煙葉常常受高溫和冷害等各種逆境脅迫的影響,從而影響煙葉產量。已有研究表明:GATA 轉錄因子在植物葉片衰老[24]和逆境脅迫過程中起著重要的調控作用[19-22]。鑒于該家族的重要性,近年來在許多植物中開展了GATA基因家族成員的鑒定和系統(tǒng)分析,包括水稻[1]、擬南芥[1]、大豆[26]、沙冬青[22]、蘋果[23]、毛竹[27]和蓖麻[28]等。然而,目前有關煙草GATA 基因家族及其成員表達情況尚鮮見報道。為此,通過生物信息學分析在煙草全基因組范圍內全面鑒定煙草GATA 轉錄因子家族成員,并分析GATA 家族成員在不同逆境脅迫和不同成熟時期煙葉中的表達情況,旨在為煙草GATA 轉錄因子的功能研究提供依據。
供試品種為翠碧1 號。反轉錄試劑盒由福建佰孟醫(yī)學科技有限公司生產;多糖多酚植物總RNA快速提取試劑盒由北京百泰克生物技術有限公司生產;引物由生工生物工程(上海)股份有限公司合成;其他常規(guī)試劑均為國產分析純。
ETC811型基因擴增儀(東勝創(chuàng)新生物科技有限公司);Thermofisher ABI QuantStudio1 實時熒光定量PCR儀(QS1型,美國應用生物系統(tǒng)公司)。
1.2.1 低溫、干旱和鹽脅迫處理
以培養(yǎng)45 d 的煙苗為材料,將幼苗移植到裝有營養(yǎng)液的托盤中,分別進行低溫脅迫(4 ℃)、干旱脅迫(托盤營養(yǎng)液中加入260 mmol/L 甘露醇溶液)和鹽脅迫(托盤營養(yǎng)液中加入150 mmol/L NaCl 溶液)處理[29],并以常溫(25 ℃)下托盤營養(yǎng)液中未添加甘露醇和NaCl為對照。在處理6 h后采集處理和對照煙苗葉片,迅速冷凍于-80 ℃冰箱中。每個樣品3次生物學重復。
1.2.2 生物信息學分析
將前人已鑒定的30 個擬南芥GATA 家族成員的蛋白序列作為種子序列[1,9],利用植物數據庫Phytozome(http://www.phytozome.net/)下載 30 個擬南芥GATA基因的蛋白序列。利用茄科數據庫(https://solgenomics.net/)進行 BLASTP 搜索,將滿足相似度≥30%,且 E 取值≤E-10的序列初篩為煙草GATA候選蛋白,隨后利用在線工具CDD(https://www.ncbi.nlm.nih.gov/cdd/)對候選蛋白進行結構域鑒定,將具有GATA 蛋白典型的鋅指結構域(pfam00320)的序列作為最終的候選蛋白,下載對應的基因序列并重新命名(NtGATA)。利用Protparam(http://web.expasy.org/ptotparam/)對煙草GATA蛋白的氨基酸數目、分子量、等電點和親疏水性進行分析。
利用軟件ClustalX 以及MEGA7 采用鄰接法(Neighbor-Joining,NJ)進行系統(tǒng)發(fā)育樹構建,設置1 000 次自舉重復[30-31],用軟件 DNAMAN 對煙草GATA蛋白進行多重序列比對[32]。
使用煙草品種K326 更新版本的基因組數據庫(Edwards 2017 版本)(https://solgenomics.net/organis m/Nicotiana_tabacum/genome),從數據庫中下載煙草GATA 基因結構的文件(包含GFF、核酸和蛋白序列等),利用 GSDS(Gene Structure Display Server;http://gsds.cbi.pku.edu.cn/)軟件分析煙草 GATA 基因結構并繪圖。利用DNAman 6.0 軟件對煙草GATA基因家族成員的GATA保守域組成進行分析。利用MEME(http://meme-suite.org/tools/meme)工具獲取煙草GATA 蛋白的保守基序(motif),motif 個數設置為10個。
1.2.3 基因表達分析
利用不同成熟期中部葉(M1~M5)的轉錄組數據[33],獲取NtGATA 的表達值(FPKM 值)。不同成熟期煙葉(M1~M5)的判斷主要基于葉色、葉脈和絨毛等外觀特征[34]。其中:M1 葉色翠綠,茸毛多;M2葉緣泛黃,茸毛部分脫落,主脈半白;M3葉片黃多綠少,葉面出現黃色凸起,主脈和支脈有部分發(fā)白,茸毛脫落;M4 葉面80%以上變黃,茸毛脫落,主脈全白;M5 煙葉片黃白色,葉尖卷曲干枯。利用R 語言中gplots 包的Heatmap 功能分析不同成熟時期煙葉中NtGATA 基因表達量的變化。采用植物總RNA 提取試劑盒分別提取經各脅迫處理樣品的總RNA。采用 SYBR Premix Ex Taq(Takara)兩 步 法 進 行qRT-PCR 測定,qRT-PCR 引物序列和內參基因引物見表1。設置3次重復,以對照煙葉基因表達量為參照,采用 2-△△Ct方法[35]計算煙草 GATA 家族各個成員的相對表達量。
表1 煙草NtGATA 基因qRT-PCR 引物Tab.1 Primers for qRT-PCR analysis of NtGATA genes in tobacco
通過相似性搜索,在煙草基因組中共獲得64 個初步的GATA 候選蛋白(去除重復),利用CDD 工具分析這些序列的保守結構域,發(fā)現其中7個蛋白不含該家族典型的鋅指結構域(pfam00320),將這些序列剔除,最終在煙草全基因組中確定了57 個GATA 基因家族成員。對57個煙草GATA蛋白的理化性質分析(表2)發(fā)現,氨基酸長度從77 到681 不等,其中NtGATA51 的氨基酸長度最短為 77 aa,NtGATA28 的氨基酸長度最大為681 aa,說明各成員之間的氨基酸保守性較差。分子量從8 251.34 Da(NtGATA51)到 73 703.62 Da(NtGATA28)不等,等電點在 4.93~9.99 之間。所有成員的疏水性指數均為負值(-0.367~ -1.008),可見煙草GATA 蛋白均為不同程度的親水蛋白[28]。
表2 煙草GATA 基因信息Tab.2 Information on GATA genes in tobacco
表2(續(xù))
將57個NtGATA分成4個亞族(Ⅰ~Ⅳ)(圖1A),其中第Ⅰ亞族成員數量最多,達到29個(約50.9%);第Ⅱ亞族次之,包含14個成員(約24.6%);第Ⅲ亞族有8個成員(約占14.0%);第Ⅳ亞族成員最少,僅6個成員(約10.5%)。煙草GATA基因家族成員的外顯子個數差異較大(圖1B),變化區(qū)間在1(NtGATA16)到17(NtGATA28)之間;每個亞族具有相似的基因結構,同一亞族的外顯子數量與長度大體相似;值得注意的是,第Ⅱ亞族中的NtGATA3 的基因結構與亞族中的其他成員差異較大,可能是進化過程中發(fā)生了內含子的插入;第Ⅰ亞族和第Ⅱ亞族外顯子長度較長,外顯子個數相對較少,大多在1~3個之間;第Ⅲ亞族和第Ⅳ亞族的NtGATAs 外顯子長度較短,但是外顯子個數較多,大多在8~10個之間。
圖1 煙草GATA家族基因結構分布與進化Fig.1 Structure and evolution of tobacco GATA gene family
利用MEME 工具獲取了煙草GATA 蛋白的10個保守基序(motif),見表3?;蚍治鼋Y果(圖2)表明:同一亞族中大部分成員具有相似的基序組成。第Ⅰ亞族成員較多,其保守基序數量在1~5個之間,其中motif 2、7、9為第Ⅰ亞族特有的保守基序。第Ⅱ亞族成員只含有motif 1,是4 個亞族中motif 種類最少的亞族。第Ⅲ亞族的8 個成員中均有motif 1 和motif 4,其中兩個成員(NtGATA4 與NtGATA47)還具備第Ⅲ亞族特有的保守基序motif 3 和motif 4。第Ⅳ亞族含有6種保守基序,是保守基序種類最豐富的亞族,其中motif 5、6、8、10 為第Ⅳ亞族特有的保守基序。
圖2 NtGATA蛋白質保守基序分布Fig.2 Distribution of conserved motifs of NtGATA proteins
表3 煙草GATA蛋白的保守基序信息Tab.3 Conserved motifs of tobacco NtGATA proteins
通過 DNAMAN 對 57 個 GATA 蛋白序列(圖 3)的聯(lián)配分析發(fā)現,除第Ⅱ亞族的NtGATA44 和NtGATA51以及第Ⅳ亞族的NtGATA8、NtGATA49和NtGATA56 外的52 個煙草GATA 基因均含有完整的鋅指結構域。NtGATA44 與NtGATA51 丟失了第2個 半 胱 氨 酸 對 ,而 NtGATA8、NtGATA49 和NtGATA56丟失了第1個半胱氨酸對,可能是在進化過程中造成了丟失。57個GATA蛋白鋅指結構域的形式分為兩大類,分別為C-X2-C-X18-C-X2-C 和C-X2-C-X20-C-X2-C。 其 中 結 構 域 為C-X2-C-X20-C-X2-C 的8 個成員均來自第Ⅲ亞族。其余49 個第Ⅰ、Ⅱ、Ⅳ亞族成員結構域均為C-X2-C-X18-C-X2-C。4 個的亞族中的結構域氨基酸組成高度保守,如鋅指結構域的第13、14、17、19和20號位點上的氨基酸,依次為蘇氨酸、脯氨酸、精氨酸、甘氨酸和脯氨酸(圖中第1 個氨基酸作為第1個位點)。但各亞族也存在個別特異的氨基酸,如第Ⅰ亞族煙草GATA蛋白特有的保守氨基酸為鋅指結構域第15 號位點上的谷氨酰胺以及第25 號位點上的蘇氨酸;第Ⅲ亞族特有的保守氨基酸為第16號位點上的甲硫氨酸、第18號位點上的精氨酸以及第32號位點上的亮氨酸;第Ⅳ亞族特有的保守氨基酸為第22 號位點上的谷氨酸。此外,第Ⅲ亞族NtGATA蛋白還具有一個顯著特征,即在鋅指結構域的第11和12號位點上插入了兩個氨基酸。
圖3 煙草GATA蛋白成員保守結構域Fig.3 Conserved domains of tobacco GATA family proteins
參照 Reyes 等[1]在擬南芥中 GATA 家族的分組,整合57 條煙草的GATA 蛋白序列和30 條擬南芥的GATA 蛋白序列構建系統(tǒng)發(fā)育樹并進行分類,將GATA 蛋白聚類成4 個亞族,見圖4。各個亞族成員數量分布與擬南芥基本吻合[1,29],其中第Ⅰ亞族的成員最多,擁有29個煙草的GATA家族成員和14個擬南芥的GATA 成員,約占所有GATA 成員的50%,而第Ⅳ家族的成員最少,僅含有6個煙草GATA成員和2 個擬南芥的GATA 成員。此外,4 個分支中均含有煙草和擬南芥的GATA 家族成員,說明這兩個物種的GATA家族成員并未因物種差異而進化出單獨的分支,推測GATA 家族的基本特征在這兩個物種分化之前就已經形成,而且在進化上較為保守。所構建的進化樹中共鑒定出38對同源蛋白,其中直系同源蛋白較少,僅有1 對(NtGATA35 與AtGATA7),其余37 對均為旁系同源蛋白(煙草27 對,擬南芥10對)。煙草的旁系同源蛋白對的數量遠多于擬南芥的旁系同源蛋白對的數量,推測是由于普通煙草為異源四倍體,從而產生大量的同源基因所致。
圖4 煙草與擬南芥GATA基因家族系統(tǒng)進化樹Fig.4 Phylogenetic tree of GATA gene family in Nicotiana tabacum and Arabidopsis thaliana
根據成熟期(M1~M5)煙葉的轉錄組數據,從中獲取NtbGATA 基因的表達量數據,整合表達量較高的46 個NtGATA 基因(PFKM≥0.5)并繪制熱圖(圖5)。結果發(fā)現:第Ⅲ組的9個基因在不同成熟時期中的表達均較高,而第Ⅱ組的10個基因的表達量較低;第Ⅰ組的家族成員表達量居中,其中有部分基因表達表現出明顯的時空特異性,例如NtGATA55、NtGATA52、NtGATA11 和 NtGATA1 等在 M2 和 M3 時期有較高的表達量;NtGATA32 基因在煙葉M5 時期的表達量遠高于其他時期。值得注意的是,部分基因的表達與成熟度呈現出較高的相關性,例如第Ⅲ組中的NtGATA25和NtGATA35在葉片成熟過程中的基因表達量隨著煙葉成熟度的提高逐漸降低;第Ⅰ組中的NtGATA44 在葉片成熟過程中的表達量則呈現 上 升 趨 勢 ;NtGATA1、NtGATA11、NtGATA52 和NtGATA55隨著煙葉成熟度的提高,表達量先升高后下降,在M2時期表達量最高。這暗示著在煙葉衰老過程中,NtGATA 基因家族成員的功能可能存在多樣性。
圖5 NtGATA基因在不同成熟期煙葉中的表達分析Fig.5 Expression of NtGATA in tobacco leaves at different maturity stages
隨機挑選了 10 個基因(NtGATA1、NtGATA5、NtGATA6、NtGATA7、NtGATA11、NtGATA25、NtGATA27、NtGATA48、NtGATA54 和 NtGATA55),利用 qRT-PCR分析10個基因在干旱、低溫和鹽脅迫下的表達量變化。由圖 6A 可知,在干旱脅迫下,NtGATA1 表達量輕微上調,其余9 個NtGATA 基因均表現出不同程度的下調;而在低溫脅迫條件下(圖6B),NtGATA1基因表達量明顯上調,暗示該基因可能在抗低溫脅迫中發(fā)揮重要作用;其余9 個基因(尤其NtGATA6、NtGATA11、NtGATA25、NtGATA54 和 NtGATA55)表現為明顯下調;在鹽脅迫條件下(圖 6C),10 個NtGATA 基因的表達量均明顯低于對照,其中NtGATA54 的表達量幾乎下降了20 倍。推測大多數煙草GATA基因可能在干旱、低溫和鹽脅迫中起負向調控作用。
圖6 NtGATA基因在低溫、鹽和干旱脅迫條件下的表達分析Fig.6 Expressions of NtGATA genes under cold, salt and drought stresses
利用生物信息學方法,在煙草全基因組中鑒定出57個GATA基因家族成員,與擬南芥(30個)、水稻(29 個)中的GATA 家族相比,煙草中GATA 家族成員數量明顯較多。這可能與煙草是異源四倍體的性質相關,煙草異源四倍體分別來源于林煙草與絨毛狀煙草[36]。研究表明,基因在發(fā)生倍增現象后,往往會出現兩個相同的基因,即同一基因的兩個拷貝,隨后在自然選擇的作用下,由于一個拷貝就能維持基因原有的功能,因此,當另一個基因拷貝上發(fā)生的突變時便很容易被積累,從而演變成假基因或進化出具有新功能的同源基因[37],所以,基因組多倍化后,容易進化出大量的新基因。煙草基因組的異源多倍化可能是煙草GATA基因家族成員擴增的重要原因。
植物的衰老過程中,一些轉錄因子會激活或抑制逆境基因的表達,其實質是細胞的程序性死亡[38]。煙葉成熟過程中葉色的轉換是關鍵環(huán)節(jié),包含了葉綠體的降解和一系列物質能量的轉變,實際上也是一種衰老的過程。本研究中發(fā)現NtGATA 基因在煙葉中廣泛表達,而且大多數NtGATA基因在煙葉的不同成熟時期呈現出差異性表達;在水稻中GATA基因家族成員的過量表達可以延緩其衰老[39];這與王志敏等[25]研究提出的GATA 轉錄因子對植物葉片衰老起調控作用的結論相符。此外,還有部分NtGATA基因隨著煙葉成熟程度的提高表達量表現出規(guī)律性的變化,例如NtGATA25 和 NtGATA35 基因表達量隨著煙葉成熟度的增加逐漸降低,NtGATA44隨成熟度提高呈現上升趨勢,我們推測這些基因可能在煙葉成熟衰老過程中發(fā)揮重要作用,可進一步開發(fā)為煙葉成熟鑒定的標記基因。
本研究中還發(fā)現,在干旱、低溫和鹽脅迫條件下,NtGATA 基因家族成員表達量大多呈現下調趨勢,其中NtGATA54 在鹽脅迫條件下,表達量下降了近20 倍,說明煙草GATA 基因家族成員對逆境響應敏感,這與王娟等[13]得出的GATA 轉錄因子響應植物在非生物脅迫下的調節(jié)機制相同。在玉米的GATA基因家族研究中,玉米GATA基因家族成員在熱脅迫過程中響應各異,有些基因呈現上調表達,有些基因則表現出下調表達[40]。這說明GATA基因家族在長期進化過程發(fā)生了功能分化,各物種中的不同成員在不同逆境脅迫環(huán)境下存在響應程度的差異。
通過生物信息學分析的方法在煙草基因組中共鑒定出57個GATA基因,分為4個亞族。NtbZIP成員基因結構多樣,各GATA 蛋白成員具有典型的鋅指結構域;大多數NtGATA基因在不同成熟時期的煙葉中均有表達,且不同成員的表達模式存在差異;其中大部分NtGATA基因對冷、鹽和干旱等非生物脅迫存在不同程度的響應。說明煙草GATA 基因家族成員在煙葉成熟衰老及逆境脅迫響應中可能具有重要的調控作用。