高原,程紫涵,姜嘉慧,劉霖,樊高峰,周博如,姜廷波
(東北林業(yè)大學(xué) 林學(xué)院/林木遺傳育種國(guó)家重點(diǎn)實(shí)驗(yàn)室,黑龍江 哈爾濱 150040)
植物在生長(zhǎng)發(fā)育過(guò)程中經(jīng)常受到如低溫、干旱和高鹽等環(huán)境脅迫的影響[1]。根據(jù)目前的氣候預(yù)測(cè)模型,全球氣候的惡化不可避免地導(dǎo)致干旱、熱浪和鹽漬化[2]。為了適應(yīng)極端外界環(huán)境的影響,植物體內(nèi)逐漸形成了復(fù)雜的生理生化調(diào)控機(jī)制,從而快速對(duì)外界環(huán)境變化做出響應(yīng)[3]。研究植物對(duì)逆境信號(hào)的感知、傳遞以及適應(yīng)性響應(yīng)的分子機(jī)制,對(duì)闡明植物適應(yīng)脅迫機(jī)制,提高作物的抗逆性具有重要意義[4]。轉(zhuǎn)錄因子是一類轉(zhuǎn)錄調(diào)控蛋白,在植物生長(zhǎng)發(fā)育的過(guò)程中起著重要作用[5]。另外,轉(zhuǎn)錄因子在應(yīng)答外界環(huán)境變化以及調(diào)節(jié)植物生理活動(dòng)中發(fā)揮重要的調(diào)控作用。近年來(lái),人們從植物中分離出許多調(diào)控干旱、高鹽、低溫及與發(fā)育相關(guān)的轉(zhuǎn)錄因子,這些轉(zhuǎn)錄因子的過(guò)量表達(dá)可以增強(qiáng)植物對(duì)環(huán)境脅迫的抗逆能力[6-7]。因此,轉(zhuǎn)錄調(diào)控也已經(jīng)成為植物逆境脅迫調(diào)控中的研究熱點(diǎn)。
LBD 家族基因是植物特有的一類轉(zhuǎn)錄因子,在植物生長(zhǎng)發(fā)育和逆境脅迫響應(yīng)過(guò)程中起著重要作用[8-9]。LBD 家族基因包含1 個(gè)類似鋅指結(jié)構(gòu)的保守結(jié)構(gòu)域CX2CX6CX3C、1 個(gè)類似亮氨酸拉鏈LX6LX3LX6L 和1 個(gè)甘氨酸-丙氨酸-絲氨酸(GAS-block)區(qū) 域[10-11]。其 中,CX2CX6CX3C 保守結(jié)構(gòu)域在DNA 結(jié)合過(guò)程中發(fā)揮作用,而LX6LX3LX6L 結(jié)構(gòu)域可能參與蛋白質(zhì)的互作[12-15]。LBD 家族基因能夠參與調(diào)控植物側(cè)生器官發(fā)育、激素積累、花青素和氮素代謝等[13-14],例如,在84K 楊中,TcLBD6過(guò)表達(dá)通過(guò)促進(jìn)葉片L-多巴生物合成從而抑制84K 楊的生長(zhǎng)發(fā)育[16];楊樹(shù)LBD1-30的過(guò)表達(dá)導(dǎo)致轉(zhuǎn)基因株系次生韌皮纖維木質(zhì)化增加,次生木質(zhì)部分化被抑制,甚至有明顯的不規(guī)則木質(zhì)化出現(xiàn)[17];在擬南芥中,LBD28的過(guò)表達(dá)導(dǎo)致轉(zhuǎn)基因株系葉片變狹長(zhǎng)[18]。
楊樹(shù)分布廣、適應(yīng)性強(qiáng)、生長(zhǎng)速度快,是我國(guó)重要的造林和用材樹(shù)種,也是研究林木生理和基因 工 程 的 模 式 植 物[19-21]。 小 黑 楊(Populus simonii×P. nigra)是小葉楊和歐洲黑楊的雜交后代,其因耐鹽堿干旱以及抗病蟲(chóng)害而被作為研究的模式植物[22-24]。目前有關(guān)楊樹(shù)LBD 轉(zhuǎn)錄因子家族的研究報(bào)道還不夠全面,本研究通過(guò)生物信息學(xué)的方法對(duì)楊樹(shù)LBD 基因家族進(jìn)行了全基因組鑒定,并對(duì)其基因結(jié)構(gòu)、保守結(jié)構(gòu)域、染色體分布、基因重復(fù)事件、啟動(dòng)子順式作用元件以及鹽脅迫下基因的表達(dá)模式進(jìn)行了分析,旨在為楊樹(shù)LBD 家族基因的功能以及小黑楊耐鹽脅迫能力進(jìn)行鑒定并提供理論依據(jù)。
利用Phytozome 植物基因組數(shù)據(jù)庫(kù)(https://phytozome-next.jgi.doe.gov/)中下載楊樹(shù)的蛋白序列以及全基因序列。從Pfam 數(shù)據(jù)庫(kù)(http://pfam. xfam. org/)中下載典型的LBD 家族蛋白結(jié)構(gòu)(PF03195)的隱馬爾科夫模型。利用HMMER3.0[25]搜 索 楊 樹(shù) 中 含 有PF03195 蛋 白 結(jié) 構(gòu) 的特有蛋白。利用SMART 在線網(wǎng)站(http://smart.embl-heidelberg.de/)對(duì)搜索到的蛋白進(jìn)行進(jìn)一步的篩選。利用MEGA7 對(duì)楊樹(shù)LBD 家族蛋白進(jìn)行進(jìn)化樹(shù)分析,構(gòu)建進(jìn)化樹(shù)的方法為鄰接法,設(shè)置bootstrap 為1000 次重復(fù)[26]。
利用GSDS(http://gsds.cbi.pku.edu.cn/)在線軟件分析LBD 家族基因的蛋白結(jié)構(gòu),利用MEME 在線軟件(http://meme-suite. org/tools/meme)分析LBD 家族基因的保守基序。通過(guò)TBtools 軟件進(jìn)行圖片的可視化[27]。
通過(guò)Phytozome12.1(https://phytozome. jgi.doe. gov/pz/portal.html)在線軟件提取LBD 家族基因上游2000 bp 的啟動(dòng)子區(qū)域,利用Plant CARE網(wǎng) 站(http://bioinformatics. psb. ugent. be/webtools/plantcare/html/)識(shí)別順式作用元件,通過(guò)TBtools 進(jìn)行圖片的可視化[27]。
參考楊樹(shù)基因組中LBD 家族蛋白的位置信息,將每個(gè)蛋白映射到相應(yīng)的染色體位置。利用MCscan[27]計(jì) 算 楊 樹(shù)LBD 家 族 蛋 白 之 間 的 重 復(fù) 事件。利用TBtools 軟件中的Ka/Ks Calculator 功能,計(jì)算重復(fù)基因?qū)Φ腒a/Ks 值[28]。采用blaxtp 軟件對(duì)楊樹(shù)和其它物種(水稻、擬南芥、桉樹(shù)、番茄、大豆)進(jìn)行基因組比較,并利用TBtools 軟件中的Dual Synteny Plotter 功能計(jì)算楊樹(shù)LBD 蛋白與其它5 個(gè)物種之間的重復(fù)事件,并進(jìn)行可視化[27]。
本試驗(yàn)所用的植物材料為雙單倍體小黑楊(Populus simonii×P. nigra),長(zhǎng)期保存于東北林業(yè)大學(xué)林木遺傳育種重點(diǎn)實(shí)驗(yàn)室。幼苗在1/2 MS培養(yǎng)基中生長(zhǎng)。對(duì)1 個(gè)月大的小黑楊幼苗進(jìn)行水培處理,待長(zhǎng)出新鮮的幼根后進(jìn)行鹽脅迫(150 mM NaCl)處理。取鹽脅迫0 h 和24 h 的葉片送往金唯智生物公司進(jìn)行轉(zhuǎn)錄組測(cè)序[29]。采用DESeq2 的方法[30]挑選差異基因,篩選的標(biāo)準(zhǔn)為log2(差異倍數(shù))的絕對(duì)值≥1,且p 值≤0.05。接著,選取小黑楊葉片進(jìn)行RT-qPCR 對(duì)轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行驗(yàn)證。RT-qPCR 的步驟采用了之前的研究[31]。所有樣品均采用3 個(gè)生物學(xué)重復(fù)制備。
在研究中共發(fā)現(xiàn)58 個(gè)LBD 家族成員。系統(tǒng)進(jìn)化樹(shù)分析表明,58 個(gè)LBD 家族成員可分成ClassⅠ、ClassⅡ和ClassⅢ3 類,分別含有22 個(gè)、20 個(gè)和16 個(gè)LBD 基因(圖1A)。
利用MEME 在 線 網(wǎng)站(http://meme-suite.org/tools/meme)對(duì)楊樹(shù)LBD 家族蛋白的保守基序進(jìn)行分析,共找到15 個(gè)高度保守基序。從圖1B中可以看出,除Potri. 015G135900.1 只有Motif1和Motif2 外,其它LBD 蛋白的N 末端均含有保守基序(Motif1、Motif2 和Motif4)。且分布在350 氨基酸以內(nèi),且大多數(shù)LBD 蛋白序列保守性較高,推測(cè)它們功能相似。
另外分析LBD 家族成員的基因結(jié)構(gòu),發(fā)現(xiàn)LBD 家族基因結(jié)構(gòu)簡(jiǎn)單,大多數(shù)基因的外顯子數(shù)目小于3,其中只有1 個(gè)基因含有3 個(gè)外顯子,14 個(gè)基因有1 個(gè)外顯子,其余均有2 個(gè)外顯子。此外,16 個(gè)基因沒(méi)有UTR 結(jié)構(gòu)(圖1C)。
圖1 楊樹(shù)LBD 基因的基因結(jié)構(gòu)、保守蛋白結(jié)構(gòu)域和基序的表征Fig.1 Characterization of gene structure,conserved protein domains and motifs of poplar LBD gene
從Phytozome 在線軟件中提取楊樹(shù)所有LBD家族基因起始密碼子上游2000 bp 的啟動(dòng)子序列,并對(duì)啟動(dòng)子序列的順勢(shì)作用元件進(jìn)行了分析。如圖2 所示,發(fā)現(xiàn)楊樹(shù)LBD 基因啟動(dòng)子區(qū)域含有與水楊酸、脫落酸、茉莉酸甲酯等激素相關(guān)的元件,另外我們發(fā)現(xiàn)了與光、防御和壓力、低溫等逆境脅迫相關(guān)的順式作用元件,同樣,LBD 家族基因啟動(dòng)子上也含有大量與生長(zhǎng)發(fā)育相關(guān)的元件,如胚乳表達(dá)、分生組織表達(dá)、細(xì)胞周期調(diào)節(jié)等,這些結(jié)果表明LBD 基因可能在楊樹(shù)的應(yīng)答脅迫和生長(zhǎng)發(fā)育方面發(fā)揮著重要作用。
圖2 楊樹(shù)LBD 基因啟動(dòng)子中的順式元件Fig.2 Cis-elements in poplar LBD gene promoter
通過(guò)對(duì)LBD 家族基因染色體定位分析,發(fā)現(xiàn)LBD 基因在染色體上均勻分布,除了第16 條染色體沒(méi)有基因分布外,其它染色體上均有分布(圖3)。其中有2 個(gè)LBD 基因分別位于Scaffold-65 和Scaffold-86 上。其中,在第4、6、11、17、18 條染色體上各有1 個(gè)基因,第10 條染色體上含有7 個(gè)基因,其數(shù)量最多(圖3),然而并沒(méi)有在第16 條染色體上發(fā)現(xiàn)LBD 基因。
圖3 LBD 基因的染色體定位Fig.3 Chromosomal location of LBD gene
串聯(lián)重復(fù)和片段重復(fù)是基因家族擴(kuò)張的主要機(jī)制[32]。如圖3 所示,LBD 家族含有3 個(gè)串聯(lián)重復(fù)基因?qū)?,其? 號(hào)染色體上包含2 個(gè)串聯(lián)重復(fù)基因?qū)?,分別是Potri. 002G041100.1 和Potri. 002G041 200.1,Potri. 002G148900.1 和Potri. 002G14900 0.1,14 號(hào)染色體上有1 個(gè)串聯(lián)重復(fù)基因?qū)Γ瑸镻otri.014G070300.1 和Potri.014G070400.1。
另外發(fā)現(xiàn)共有23 對(duì)LBD 基因片段重復(fù)基因?qū)Γ@些基因分布在不同的染色體上(圖4),表明LBD 基因的擴(kuò)張存在串聯(lián)重復(fù)和片段重復(fù)現(xiàn)象。
圖4 LBD 基因的基因復(fù)制事件Fig.4 Gene duplication events of LBD gene
利用TBtools 計(jì)算了重復(fù)基因?qū)χg的Ka/Ks 值(表1),這19 對(duì)基因的Ka/Ks 值均小于1,推測(cè)這些基因可能受到純化選擇。
表1 重復(fù)基因?qū)χg的Ka/Ks 值Table 1 Ka/Ks values between duplicate gene pairs
為了進(jìn)一步研究LBD 家族與其它物種之間的進(jìn)化關(guān)系,構(gòu)建了楊樹(shù)LBD 基因和其它5 種物種之間的進(jìn)化關(guān)系圖譜,其中包括4 種雙子葉植物(擬南芥、桉樹(shù)、番茄和大豆)和1 種單子葉植物(水稻)。在水稻中,楊樹(shù)LBD 家族基因與其并沒(méi)有存在共線性基因?qū)?;而在擬南芥中,共發(fā)現(xiàn)5 對(duì)共線性基因?qū)?;在桉?shù)中,共有17 對(duì)共線性基因?qū)?;在番茄中,共?9 對(duì)共線性基因?qū)?;在大豆中,共?4 對(duì)共線性基因?qū)Γ▓D5)。因此推測(cè)楊樹(shù)LBD 基因與雙子葉植物中存在較近的進(jìn)化關(guān)系。
圖5 小黑楊LBD 基因與其它物種的共線性分析Fig.5 collinearity analysis between LBD gene of Populus deltoides and other species
為了探索LBD 基因的表達(dá)模式,通過(guò)RNASeq 分析LBD 家族基因鹽脅迫下的表達(dá)水平,共鑒定了10 個(gè)顯著差異基因(DEG),差異基因分為2 組,其中Ⅰ組代表鹽脅迫下調(diào)的4 個(gè)基因,分別為Potri. 014G017400.1、 Potri. 008G071500.1、Potri. 010G186000.1、Potri. 017G114500.1。Ⅱ組為鹽脅迫上調(diào)的6 個(gè)基因,分別是Potri.005G1455 00.1、Potri. 010G177100.1、Potri. 002G119400.1、Potri. 012G056800.1、 Potri. 004G100100.1、Potri.009G089600.1(圖6)。
圖6 鹽脅迫下葉片中差異表達(dá)基因(DEGs)的分析Fig.6 Analysis of differentially expressed genes(DEGs)in leaves under Salt Stress
為了驗(yàn)證RNA-Seq 數(shù)據(jù)的準(zhǔn)確性,隨機(jī)挑選8 個(gè)DEG 進(jìn)行了RT-qPCR 分析(圖7)。RT-qPCR 驗(yàn)證的相對(duì)表達(dá)水平與RNA-Seq 分析的mRNA 豐度基本一致。因此可以斷定RNA-Seq的數(shù)據(jù)可靠。
LBD 基因家族是植物特有的一類轉(zhuǎn)錄因子,在植物生長(zhǎng)發(fā)育調(diào)控和逆境脅迫響應(yīng)過(guò)程中起著重要作用[8-9]。目前,越來(lái)越多的LBD 家族基因被報(bào)道,例如,在葡萄中共鑒定出30 個(gè)LBD 基因[33];在大麥中共鑒定出24 個(gè)LBD 基因[34];而在蘿卜中共鑒定出59 個(gè)LBD 基因[35]。本研究中,通過(guò)對(duì)楊樹(shù)全基因組進(jìn)行生物信息學(xué)分析,共有58 個(gè)LBD蛋白家族成員被鑒定出。發(fā)現(xiàn)大多數(shù)楊樹(shù)LBD 蛋白的序列保守性較高,除Potri.015G135900.1 外,其它LBD 蛋白的N 末端均含有保守基序Motif1、Motif2 和Motif4,且分布在350 氨基酸以內(nèi),我們推測(cè)它們功能相似。
串聯(lián)重復(fù)和片段重復(fù)是基因家族擴(kuò)張的主要機(jī)制[36],本研究中共有19 對(duì)重復(fù)基因?qū)Ρ话l(fā)現(xiàn),其中串聯(lián)重復(fù)基因?qū)τ? 對(duì),而片段重復(fù)基因?qū)τ?6對(duì),因此,猜測(cè)在LBD 家族的進(jìn)化過(guò)程中由片段重復(fù)機(jī)制作為主導(dǎo),而串聯(lián)重復(fù)機(jī)制作為輔助。在遺傳學(xué)中,Ka/Ks 的比值是異義替換和同義替換的比值,用于表示進(jìn)化過(guò)程中是否受到自然選擇的作用,當(dāng)Ka/Ks 的比值小于1,則認(rèn)為是純化選擇,當(dāng)Ka/Ks 的比值等于1,則認(rèn)為是中性選擇,而當(dāng)Ka/Ks 的比值大于1,則認(rèn)為是正向選擇[37]。而本研究結(jié)果中,重復(fù)基因?qū)Φ腒a/Ks 值均小于1,因此推測(cè)這些基因可能受到純化選擇。另外,探索了LBD 家族基因與不同物種之間的進(jìn)化關(guān)系,發(fā)現(xiàn)LBD 家族基因與雙子葉植物中大豆的親緣關(guān)系最好,共發(fā)現(xiàn)34 對(duì)共線性基因?qū)?;而與單子葉植物中水稻的親緣關(guān)系最差,并沒(méi)有存在共線性基因?qū)?。因此,推測(cè)與單子葉植物相比,LBD 家族基因與雙子葉植物的親緣關(guān)系更為緊密。在蘿卜中,與擬南芥中同源基因功能相似,Rsa10025702可能參與角果或種子的發(fā)育過(guò)程,且LBD 家族多個(gè)基因可能參與角果或種子的發(fā)育過(guò)程[35];在雷蒙德氏棉中,與擬南芥中同源基因功能相似,Gorai. 006G033100、Gorai. 007G075700和Gorai. 012G063800可能參與葉發(fā)育過(guò)程的調(diào)控,Gorai. 007G056300、Gorai. 007G222000和Gorai. 008G081100可能參與了花青素合成和氮代謝途徑的調(diào)控[38];在普通煙草中,與擬南芥中同源基因功能相似,NtLBD86~93、NtLBD95、NtLBD97可能參與氮素代謝以及積累花青苷,NtLBD05、NtLBD58~59等6 個(gè)基因可能參與葉極性建立、花器官發(fā)育及形態(tài)建成[14]。因此,推測(cè)LBD 家族基因在楊樹(shù)生長(zhǎng)發(fā)育過(guò)程中也發(fā)揮重要作用。此外,LBD 家族基因在應(yīng)答非生物脅迫中發(fā)揮著重要作用,例如,在玉米中LBD5和LBD33可參與調(diào)控玉米GAs 及ABA 的合成,同時(shí)影響幼苗發(fā)育及對(duì)干旱的應(yīng)答[39];在擬南芥中LBD15能夠直接調(diào)控下游靶基因ABI4基因的表達(dá),通過(guò)參與ABA信號(hào)通路提高轉(zhuǎn)基因株系的耐旱性[40];在大麥中HvLBD19基因受激素NAA 的誘導(dǎo),過(guò)量表達(dá)Hv-LBD19基 因 能 提 高 耐 濕 性[34]。因 此,我 們 推 測(cè)LBD 家族基因在楊樹(shù)應(yīng)答非生物脅迫中也發(fā)揮重要作用。
啟動(dòng)子區(qū)域中的順式作用元件在基因調(diào)控和表達(dá)中起重要作用[41]。在辣椒CaMAPK7的啟動(dòng)子中,發(fā)現(xiàn)W-box,TCA,ERF 等多種與生物及非生物逆境脅迫相關(guān)的順式作用元件,且CaMAPK7在青枯病菌攻擊和熱應(yīng)激等脅迫下轉(zhuǎn)錄上調(diào)[42];在家蠶絲素P25蛋白基因啟動(dòng)子中,PSGF 元件對(duì)A3啟動(dòng)子在后部絲腺的活性具有一定的增強(qiáng)作用,進(jìn)一步驗(yàn)證了PSGF 調(diào)控元件的功能[43];在白樺BpBEE1基因啟動(dòng)子中含有與多種激素應(yīng)答相關(guān)的元件,且經(jīng)MeJA、SA、BL 和ABA 處理后,白樺葉脈和根中GUS 活性增加,啟動(dòng)子活性也顯著增強(qiáng)[44]。本研究中,我們發(fā)現(xiàn)楊樹(shù)LBD 基因啟動(dòng)子區(qū)域含有大量與激素相關(guān)的響應(yīng)元件,另外,也發(fā)現(xiàn)了與生長(zhǎng)發(fā)育以及應(yīng)答非生物脅迫相關(guān)的元件,這些結(jié)果表明LBD 基因可能在楊樹(shù)的生長(zhǎng)發(fā)育以及應(yīng)答非生物脅迫方面發(fā)揮著重要作用。
利用RNA-Seq 鑒定基因的表達(dá),進(jìn)而篩選出關(guān)鍵基因已經(jīng)成為現(xiàn)階段研究的熱點(diǎn)。本試驗(yàn)中,利用RNA-Seq 共鑒定了10 個(gè)與鹽脅迫相關(guān)的LBD 家族基因,而RT-qPCR 與RNA-Seq 分析的mRNA 豐度基本一致,這也證明轉(zhuǎn)錄組數(shù)據(jù)的可靠性,說(shuō)明這些基因能夠受到鹽脅迫的誘導(dǎo),因此,猜測(cè)這些基因有可能在鹽脅迫中也發(fā)揮重要的作用,后續(xù)會(huì)通過(guò)獲取轉(zhuǎn)基因植物進(jìn)一步分析這些基因是否具有應(yīng)答鹽脅迫的能力。
本研究在楊樹(shù)中共鑒定了58 個(gè)LBD 基因,這些基因均勻分布在16 條染色體和2 個(gè)支架上。并發(fā)現(xiàn)楊樹(shù)LBD 家族基因之間的重復(fù)事件多達(dá)19對(duì),其中片段重復(fù)16 對(duì),串聯(lián)重復(fù)3 對(duì)。此外,分析了楊樹(shù)與其它5 個(gè)物種之間LBD 基因的同源進(jìn)化關(guān)系,結(jié)果表明與單子葉植物相比,LBD 與雙子葉植物具有更強(qiáng)的同源關(guān)系。另外對(duì)其啟動(dòng)子分析發(fā)現(xiàn)了大量與激素、非生物脅迫和生長(zhǎng)發(fā)育相關(guān)的順式作用元件,還通過(guò)RNA-Seq 和RT-qPCR 分析了鹽脅迫下LBD 家族基因的表達(dá)模式。本研究結(jié)果為小黑楊LBD 基因的功能鑒定以及耐鹽脅迫基因的篩選提供了理論依據(jù)。