楊溥原,梁紅凱,殷叢培,崔江慧,常金華
(河北農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院, 河北 保定 071001)
高粱(Sorghum bicolorL.)是我國五大糧食作物之一,廣泛應(yīng)用于釀造、畜牧、制糖等多個產(chǎn)業(yè)。隨著農(nóng)業(yè)結(jié)構(gòu)調(diào)整,高粱地位愈發(fā)重要。近年來復(fù)雜多變的氣候條件,對高粱產(chǎn)量和品質(zhì)造成較大影響[1]。有研究表明烯效唑通過調(diào)節(jié)植株內(nèi)源激素平衡,使植物的生理特性、形態(tài)指標產(chǎn)生變化,從而達到調(diào)節(jié)植株生長和改善植株生理特性,減輕植株在逆境脅迫下受損害的目的[2]。GRAS轉(zhuǎn)錄因子是植物生長發(fā)育中不可或缺的一類蛋白,利用生物信息學(xué)技術(shù)對高粱GRAS家族基因進行分析,旨在探索高粱GRAS基因功能,并挖掘與激素調(diào)節(jié)相關(guān)的GRAS基因,探索其在植物生長調(diào)控中的作用。GRAS轉(zhuǎn)錄因子最先鑒定出的3個家族成員分別是 Gibberellic acid insensitive(GAI),Repressor of GA1(RGA)和 Scarecrow(SCR)[3],從而定義了GRAS轉(zhuǎn)錄因子。一般來說,GRAS蛋白C末端含有多個高度保守的基序,即為GRAS結(jié)構(gòu)域,而特異性主要表現(xiàn)在可變的N末端,不同的N端基序可使該類蛋白與不同靶蛋白結(jié)合,即增加了基因功能的多樣性[4-5]。自2004年第一個GRAS家族鑒定以來[6],玉米(Zea maysL.)、小麥(Triticum aestivumL.)、大豆(Glycine maxL.)以及棉花(Gossypium hirsutumL.)等約300種作物中分別鑒定出GRAS蛋白[7-10]。不同物種之間,GRAS亞族分類不同,如早期擬南芥(Arabidopsis thaliana)、水稻和玉米的GRAS蛋白可根據(jù)結(jié)構(gòu)差異分為8個亞家族[4],即DELLA、SCR、LS、PAT1、HAM、SCL3、SHR和LISCL亞家族,后來隨著基因組學(xué)研究的深入,GRAS家族又被分為10~16個亞族[11-12]。不同的亞族參與的生理生化反應(yīng)各不相同,如DELLA是赤霉素(GA)信號通路的負調(diào)控因子,當接收到細胞外GA信號時會在細胞核降解,并傳遞出GA正常的信號維持植株正常發(fā)育,DELLA突變體則表現(xiàn)為因GA不敏感性導(dǎo)致植株矮小[13];SCL3位于GA信號轉(zhuǎn)導(dǎo)通路下游,對GA其正向調(diào)節(jié)作用,維持植物體內(nèi)赤霉素平衡,與DELLA蛋白互為拮抗作用[14];LS和HAM蛋白被證實在多個物種中參與分生組織形成;SCR與SHR蛋白可正向調(diào)控根系生長,但當SCR與SHR蛋白正常代謝時,葉片生長受到抑制[15];PATI光信號轉(zhuǎn)導(dǎo)通路中重要的一環(huán),擬南芥AtPAT1被證實對光敏色素A信號傳導(dǎo)起正向調(diào)節(jié)作用[16];LISCL亞族在植物響應(yīng)逆境脅迫時發(fā)揮重要作用且會參加生長素反應(yīng)中不定根形成的過程[17]。因此,GRAS蛋白可以廣泛參與激素信號轉(zhuǎn)導(dǎo)、分生組織發(fā)育及脅迫應(yīng)答等多種生理反應(yīng)。目前,本研究對高粱全基因組進行GRAS家族鑒定,對其理化性質(zhì)、進化關(guān)系、基因結(jié)構(gòu)等進行分析;以烯效唑處理下的高粱轉(zhuǎn)錄組數(shù)據(jù),篩選出部分差異表達基因,并利用qRT-PCR分析差異基因的表達模式,鑒定該家族中潛在響應(yīng)激素調(diào)節(jié)的基因。
本試驗所用高粱材料為‘紅1號’,于2019年種植在河北農(nóng)業(yè)大學(xué)育種中心,待高粱長到七葉期時,對其噴施濃度為1.1 g/L的烯效唑,分別于處理后0、3、7和14 d取旗葉,每組處理連續(xù)取3株,樣品迅速放置于-80℃冰箱。利用TRNzol法提取高粱總RNA,用Nandorop One超微量分光光度計測定濃度和質(zhì)量(OD260/280),高質(zhì)量樣品RNA用于構(gòu)建文庫并進行Illumina測序,獲得轉(zhuǎn)錄組數(shù)據(jù),后續(xù)分析基于此轉(zhuǎn)錄組數(shù)據(jù)。
為挖掘鑒定高粱GRAS蛋白,本研究于Ensembl Plants網(wǎng) 站(http://plants.ensembl.org/index.html)下載高粱全基因組數(shù)據(jù);pfam數(shù)據(jù)庫(http://pfam.xfam.org/)下載GRAS隱馬克夫模型[18],并利用Linux版本的HMMER軟件進行鑒定,E值設(shè)置小于10-5,去除冗余的序列,初步得到高粱GRAS蛋白序列[19];利用pfam-search(http://pfam.xfam.org/search#tabview=tab1)與Smart(http://smart.embl.de/)對GRAS蛋白序列進行驗證,最終保留含有GRAS結(jié)構(gòu)域的蛋白。
利用ExPASy-ProParam網(wǎng)站(https://web.expasy.org/protparam/)對高粱GRAS蛋白的氨基酸數(shù)、分子量和等電點進行預(yù)測。提取高粱GRAS基因的位置,通過Mapchart高粱GRAS基因在染色體上的分布情況可視化。
參照上述方法鑒定出擬南芥和谷子(Setaria italica)的GRAS蛋白,將3個物種的GRAS蛋白序列使用MEGA7.0的Muscle進行多序列比對,選擇鄰接法(Neighbor-Joining),Bootstrap method設(shè)置為1 000,構(gòu)建系統(tǒng)發(fā)育樹[20],并根據(jù)GRAS基因結(jié)構(gòu)進行亞家族分類。利用在線網(wǎng)站MEME(http://meme-suite.org) 及 GSDS2.0(http://gsds.gao-lab.org/)對高粱GRAS基因進行保守結(jié)構(gòu)域及基因結(jié)構(gòu)預(yù)測。
利用Blast對高粱全基因組數(shù)據(jù)進行比對,McscanX軟件對其進行共線性分析及篩選同源基因,通過Circos軟件繪制共線性關(guān)系圖譜[21];利用相同方法處理擬南芥和谷子的全基因組數(shù)據(jù),通過McscanX軟件將高粱與擬南芥和谷子之間的同源關(guān)系可視化。
截取高粱GRAS基因上游啟動子的1 500 bp序列,提交至在線網(wǎng)站Plant CARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/),篩選與植物生長發(fā)育、激素代謝和脅迫應(yīng)答相關(guān)的元件進行分析。
將高粱GRAS基因提交至GO數(shù)據(jù)庫(http://geneontology.org/)進行BP、MF、CC注釋分類;利用KEGG(https://www.kegg.jp/)對GRAS蛋白參與的pathway通路進行注釋[22]。
采用 FPKM(Fragments per kilobase million)法計算烯效唑處理下高粱轉(zhuǎn)錄組測序文庫各基因表達量,利用Tbtools繪制不同時期GRAS基因表達熱圖。
利用轉(zhuǎn)錄組同批RNA,選取高粱glactin作為內(nèi)參基因,利用Primer 5.0設(shè)計引物(表1),反轉(zhuǎn)錄后進行熒光實時定量(qRT-PCR, Quantitative Realtime PCR),采用2-△△Ct法計算相對表達量,每組處理樣品設(shè)置3次生物學(xué)重復(fù)和3次技術(shù)重復(fù)。
表1 實時熒光定量所用引物序列Table 1 Primer sequences used for qRT-PCR
利用SPSS25對熒光實時定量結(jié)果進行方差分析,采用鄧肯方法進行多重比較。
利用GRAS的隱馬克夫模型從高粱全基因組序列中鑒定出80個GRAS轉(zhuǎn)錄因子,通過ExPASy-ProParam在線網(wǎng)站預(yù)測其理化性質(zhì)。如表2所示,80個高粱GRAS轉(zhuǎn)錄因子氨基酸數(shù)為295~967個,分子量大小為31 529.21~107 470.03 kD;等電點介于4.82~9.05之間,平均等電點為6.01,其中91.25%為酸性蛋白;不穩(wěn)定系數(shù)介于34.19~63.88,根據(jù)Sarikaya等人的研究[23],不穩(wěn)定系數(shù)高于40為不穩(wěn)定蛋白,即高粱GRAS蛋白中96.25%為不穩(wěn)定蛋白;脂肪系數(shù)介于60.62~97.14;平均親水性為-0.264,其中95%為親水性蛋白,由此可知高粱GRAS家族成員內(nèi)的理化性質(zhì)也存在一定差異。圖1為高粱GRAS基因染色體定位圖,由圖所示,除7號染色體外,80個GRAS基因全部定位于高粱9條染色體上,且全部定位到染色體兩端;其中5號染色體GRAS基因最多(25個),10號染色體GRAS基因最少,僅3個。
表2 高粱GRAS基因一級結(jié)構(gòu)及理化性質(zhì)分析Table 2 Analysis of primary structure and physicochemical property of GRAS genes in sorghum
續(xù)表:
續(xù)表:
圖1 高粱GRAS家族基因染色體定位圖Fig.1 Chromosomal mapping of sorghum GRAS family genes
利用MEGA7.0將篩選得到的高粱(80個)、擬南芥(34個)、谷子(56個)的GRAS蛋白序列構(gòu)建系統(tǒng)發(fā)育樹。根據(jù)親緣關(guān)系遠近,170個GRAS蛋白序列可劃分為8個亞家族,分別為HAM、LS、SCR、DELLA、SCL3、SHR、PAT1和LISCL。其中LS、SCR和DELLA亞族高粱GRAS成員最少,僅4個;SHR和PAT1亞族成員各7個;HAM亞族成員9個;LISCL是高粱GRAS家族中最大的亞家族,與玉米相似[5],成員達38個,占全部高粱GRAS家族的47.5%。
通過MEME和GSDS在線網(wǎng)站對高粱80個GRAS家族成員進行分析,利用TBtools將GRAS基因的保守結(jié)構(gòu)域和基因結(jié)構(gòu)可視化(圖3)。如圖所示,利用MEME在高粱GRAS基因預(yù)測了20個Motif,80個GRAS基因之間包含的Motif種類及數(shù)量具有一定差異,但同一亞族之間具有相似的保守結(jié)構(gòu)域,說明相同亞族之間可能具有相似的功能。某些亞族中還具備特定的Motif,如LISCL亞族相對于其他亞族,C端有特定的4個motif,即motif10、motif13、motif16和motif19,這與前人研究相似,且除SbGRAS43和SbGRAS53外,其余基因N端都具有1個特定保守結(jié)構(gòu)域(Motif5)等。通過基因結(jié)構(gòu)分析可以看出,所有高粱GRAS基因都含有1~5個編碼區(qū)(CDS);22個基因無非編碼區(qū)(UTR),占全部高粱GRAS基因的27.5%;24個基因分別有1~4個內(nèi)含子,其余GRAS基因無內(nèi)含子;相同亞族內(nèi)的基因大多具有相似的基因結(jié)構(gòu),SbGRAS53和SbGRAS54與其他GRAS基因具有明顯不同的基因結(jié)構(gòu),推測其在進化過程中曾發(fā)生變異。
圖2 GRAS基因家族系統(tǒng)發(fā)育樹Fig.2 Phylogenetic trees of GRAS gene family
圖3 高粱GRAS基因家族保守結(jié)構(gòu)域及基因結(jié)構(gòu)Fig.3 Conserved components and gene structure of GRAS gene family in sorghum
基因復(fù)制對物種基因組進化、擴張及功能分化有重要意義[24]。通過對高粱GRAS基因繪制共線性圖譜(圖4),結(jié)果顯示高粱11個GRAS基因存在6對共線性關(guān)系,無串聯(lián)重復(fù)基因,其中SHR、PAT1、SCL3和HAM亞族各一對同源基因,SCR亞族存在2對同源基因。5號和8號染色體中存在3對同源基因,2個同源基因位于9號染色體,其余3個分別位于1號、2號與3號染色體。對高粱、擬南芥和谷子構(gòu)建物種間GRAS共線性圖譜(圖5),由圖可知,高粱與擬南芥存在7對共線性關(guān)系,與谷子存在46對共線性關(guān)系。因此,GRAS基因存在早于單子葉植物與雙子葉植物的分化時間。
圖4 高粱GRAS基因家族共線性分析Fig.4 Collinearity analysis of sorghum GRAS gene family
圖5 高粱與擬南芥、谷子GRAS基因家族共線性分析Fig.5 Collinearity analysis of GRAS gene family in sorghum with Arabidopsis and foxtail millet
利用在線網(wǎng)站Plant CARE預(yù)測高粱GRAS基因上游 1 500 bp啟動子的順式作用元件[25],篩選出與生長發(fā)育、激素調(diào)節(jié)及逆境脅迫應(yīng)答相關(guān)的順式作用元件進行分析。如圖6所示,搜索出大量與生長發(fā)育相關(guān)的元件,如光響應(yīng)元件與種子特異性調(diào)節(jié)元件等、與激素調(diào)節(jié)相關(guān)的有ABA響應(yīng)元件、GA響應(yīng)元件及IAA響應(yīng)元件等、與逆境脅迫相關(guān)的包括抗氧化逆境脅迫元件、生物及非生物脅迫應(yīng)答元件、防御脅迫響應(yīng)元件,以及與鹽、干旱、低溫脅迫相關(guān)的一系列順式作用元件。67個GRAS基因含有不同的激素相關(guān)響應(yīng)元件,其中34個基因存在GA響應(yīng)元件;77個GRAS基因存在響應(yīng)不同脅迫應(yīng)答的相關(guān)元件;23個GRAS基因存在與種子特異性調(diào)節(jié)相關(guān)的元件;全部GRAS基因均含有光響應(yīng)相關(guān)元件。因此,推測高粱GRAS基因可能廣泛參與植物生長發(fā)育過程中的多種生理生化反應(yīng)。
圖6 高粱GRAS基因家族順式作用元件Fig.6 Cis-acting elements of sorghum GRAS gene family
對高粱GRAS基因進行GO分析(圖7),80個GRAS基因全部得到Biological process(BP)、Cellular component(CC)及Molecular function(MF)注釋,發(fā)現(xiàn)GRAS基因參與20種生物過程(BP),其中全部基因均參與調(diào)控種子休眠過程;細胞成分(CC)全部為細胞核;注釋到3種分子功能(MF),其中全部基因均注釋到DNA結(jié)合轉(zhuǎn)錄因子活性與特異性DNA結(jié)合中。通過KEGG注釋高粱GRAS基因參與的代謝通路,發(fā)現(xiàn)大部分基因均參與植物激素信號轉(zhuǎn)導(dǎo)(K14494)與核糖體生物合成(K14777)途徑。
圖7 高粱GRAS基因GO注釋信息Fig.7 The GO annotations of sorghum GRAS genes
本研究以外源生長調(diào)節(jié)劑烯效唑處理7葉期高粱幼苗,并設(shè)置對照組(CK)和處理組(T),分別于處理后0、3、7和14 d取新生展開第一片葉,進行轉(zhuǎn)錄組測序分析,經(jīng)過濾分析得到32 423個表達基因,其中66個GRAS基因有所表達。
基于此轉(zhuǎn)錄組數(shù)據(jù)繪制高粱GRAS基因表達熱圖(圖7),分析GRAS基因在不同時期的表達量變化規(guī)律。根據(jù)聚類情況,可將66個GRAS基因分為5類,Ⅰ中GRAS在對照和處理下表達量變化趨勢基本一致,大多基因的表達量均先降低,在7 d時顯著升高,隨后降低,但對照組和處理組的表達量之間無顯著差異;Ⅱ中表達趨勢大多呈現(xiàn)先升高,在3 d時達到頂峰,之后表達量下降,對照組和處理組之間的表達趨勢相同,且無顯著差異,推測在烯效唑處理下該類基因無明顯作用;Ⅲ中GRAS基因最多,且大多基因均呈現(xiàn)表達量持續(xù)升高的趨勢,其中SbGRAS7、SbGRAS15、SbGRAS16及SbGRAS29在烯效唑處理下14 d表達量顯著高于對照組14 d表達量;Ⅳ中各基因在處理和對照下表達趨勢一致,均呈現(xiàn)先升高后降低最后再升高的趨勢,其中僅SbGRAS44在7 d時表達量顯著降低,但CK7與T7之間無顯著差異;Ⅴ中基因表達量大多表現(xiàn)出先降低,在14 d時有升高的趨勢,但各個時期間的表達量變化不顯著,且對照組與處理組間的表達量變化差異不顯著。
為進一步驗證烯效唑處理下高粱GRAS基因表達模式,挑選了8個表達量較高且差異顯著的GRAS基因,進行qRT-PCR分析(圖9)。由于該8個基因在3 d時的表達量與0 d時相比基本無變化,所以僅對其在0、7、14 d 3個時期進行qRT-PCR。結(jié)果顯示,6個基因表達趨勢與轉(zhuǎn)錄組數(shù)據(jù)基本吻合,其中5個基因的表達量存在顯著差異。SbGRAS2與SbGRAS13呈現(xiàn)先升高后降低的趨勢,且在烯效唑處理7 d時達到顯著;SbGRAS7與SbGRAS15表達量持續(xù)升高,14 d時處理組表達量顯著高于對照組;SbGRAS58表達量也表現(xiàn)出持續(xù)升高的趨勢,但7 d和14 d時處理組表達量顯著低于對照組。
圖8 高粱GRAS基因在烯效唑處理下的表達模式Fig.8 The expression pattern of sorghum GRAS genes under uniconazole treatment
圖9 烯效唑處理下高粱GRAS基因的表達水平Fig.9 Expression level of sorghum GRAS genes under Uniconazole treatment
GRAS轉(zhuǎn)錄因子廣泛存在于植物體中,參與植物生長發(fā)育中的多個代謝途徑。2009年高粱全基因組序列公布,為高粱基因功能挖掘提供理論基礎(chǔ)。本研究基于烯效唑處理下不同時期高粱轉(zhuǎn)錄組數(shù)據(jù),結(jié)合生物信息學(xué)鑒定高粱GRAS基因,并通過qRT-PCR驗證功能。
本研究從高粱全基因組序列中鑒定出80個GRAS轉(zhuǎn)錄因子,與玉米(86個)相差不多,且同樣可以分為8個亞族。通過系統(tǒng)發(fā)育樹,根據(jù)親緣關(guān)系遠近,預(yù)測相同亞族間臨近分枝的蛋白功能可能相似,如AtGAI與AtRGA1的研究較為透徹[8],他們可以參與GA信號轉(zhuǎn)導(dǎo),抑制植株的生長與開花,而與其同源性較高的SbGRAS3和StGRAS3也可能存在類似功能;不同亞族之間結(jié)構(gòu)差異較大,如motif5、motif10和motif19僅存在于LISCL亞族中,推測這些保守結(jié)構(gòu)域?qū)е翷ISCL亞族具有特異性功能;相同亞族之間結(jié)構(gòu)相似,可能在基因功能方面存在一定相似性[26],但在基因進化過程可能存在一定變異,如SbGRAS53和SbGRAS54與LISCL亞族其他基因的保守結(jié)構(gòu)域極為相似,但基因結(jié)構(gòu)存在明顯不同,這種變異可能使基因功能發(fā)生改變,對基因進化及功能分化有重要意義。相較于擬南芥,高粱與谷子的同源性更高,可以根據(jù)谷子GRAS基因預(yù)測高粱中同源基因的功能。通過對高粱GRAS基因染色體定位,發(fā)現(xiàn)16個GRAS基因聚集在5號染色體末端極小的一段區(qū)域內(nèi),且都屬于LISCL亞族,因此可以推測這段局域可能發(fā)生過小規(guī)?;驈?fù)制事件,前人研究表明,玉米GRAS家族也曾發(fā)生類似事件[5]。70%的高粱GRAS轉(zhuǎn)錄因子的內(nèi)含子丟失,此現(xiàn)象在F-box與SAUR等大型基因家族中也經(jīng)常發(fā)生,真核生物將出現(xiàn)此現(xiàn)象的原因歸結(jié)于無內(nèi)含子基因復(fù)制、無內(nèi)含子基因逆轉(zhuǎn)錄以及水平基因轉(zhuǎn)移。此外,在進化過程中高粱GRAS轉(zhuǎn)錄因子存在6對直系同源基因,這些基因的理化性質(zhì)、基因結(jié)構(gòu)和基因表達均極其相似。
根據(jù)GO和KEGG注釋,發(fā)現(xiàn)高粱GRAS基因全部注釋到種子休眠調(diào)控,并且大多參與激素信號轉(zhuǎn)導(dǎo)通路。赤霉素是植物體內(nèi)最重要的激素之一,對植物生長、種子萌發(fā)以及提高產(chǎn)量有重要意義,烯效唑是赤霉素合成抑制劑,對赤霉素起負向調(diào)控作用[27]。前人多項研究表明,GRAS轉(zhuǎn)錄因子可以參與赤霉素代謝通路[28],影響植株正常發(fā)育,如擬南芥中AtGAI可以參與并影響GA代謝通路[9];DELLA與SCL3蛋白對SHR/SCR復(fù)合體的調(diào)控作用,揭示了GRAS轉(zhuǎn)錄因子保持植物體內(nèi)赤霉素穩(wěn)態(tài)的代謝過程,從而維持根系正常生長發(fā)育[29]。
基因的表達模式在一定程度上決定著基因功能,GRAS基因家族功能十分廣泛,除上述與激素調(diào)節(jié)相關(guān)外,水稻LISCL亞族的OsGRAS23轉(zhuǎn)錄因子可以受到一些應(yīng)激反應(yīng)基因誘導(dǎo),正向調(diào)控水稻抗旱性[30];逆境下抗霉素A與L-半胱氨酸等通過誘導(dǎo)LISCL亞族NtGRAS1上調(diào)表達,進而增加細胞內(nèi)活性氧含量,參與脅迫應(yīng)答[31],水稻GRAS家族基因D26可以通過參與調(diào)控油菜素內(nèi)酯代謝途徑,進而調(diào)控水稻分蘗生成[32]。結(jié)合轉(zhuǎn)錄組數(shù)據(jù),80個高粱GRAS基因根據(jù)表達變化可以分為5組,其中III組GRAS基因最多,部分基因的表達量變化差異十分顯著,如SbGRAS15在14 d時基因表達量明顯上調(diào),且處理組表達量顯著高于對照組,說明該基因可能參與激素調(diào)控網(wǎng)絡(luò)。挑選出8個具有顯著差異的高粱GRAS基因進一步通過q-PCR驗證,結(jié)果發(fā)現(xiàn)存在4個上調(diào)基因和1個下調(diào)基因,說明這些GRAS基因可能在高粱烯效唑的處理下發(fā)揮某種作用,這些基因在對外源生長調(diào)節(jié)劑的響應(yīng)機制有待進一步研究。