劉浩瑞,徐寅楠,任雪梅
(山西農(nóng)業(yè)大學(xué) 生命科學(xué)學(xué)院,山西 太谷 030801)
谷子(Setaria italica)屬于1 年生草本植物,是 禾本科狗尾草屬小型二倍體(2n=18)C4糧食作物,其生命周期短,屬于近交系,起源于我國[1],是亞洲和非洲部分地區(qū)廣泛用作食物和飼料的一種主要作物。在其漫長的栽培歷史中,已經(jīng)適應(yīng)了亞洲、北非、南美和北美的干旱和半干旱地區(qū)。谷子具有耐干旱、耐貧瘠、耐貯存等生物學(xué)特性[2],其籽粒中含有豐富的必需氨基酸,如賴氨酸、色氨酸、蛋氨酸等,對于成功地開發(fā)低成本、富含蛋白成分的功能性食品有很大的潛能,這些食品有助于預(yù)防和管理與生活方式相關(guān)的慢性疾病。我國作為最大的發(fā)展中國家,農(nóng)業(yè)資源的匱乏加劇了蛋白質(zhì)缺乏,種植谷子是保障大眾營養(yǎng)健康的最佳方式[3]。所以,如何提高谷子的產(chǎn)量和品質(zhì)受到人們的廣泛關(guān)注。
轉(zhuǎn)錄因子對于調(diào)控植物生長發(fā)育具有重要意義,它們在發(fā)育和信號轉(zhuǎn)導(dǎo)中發(fā)揮著關(guān)鍵作用[4-6]。比如,轉(zhuǎn)錄因子在調(diào)節(jié)植物對環(huán)境脅迫的反應(yīng)中起著重要的作用,可能為提高作物對病害和環(huán)境脅迫的耐受性提供新的途徑[7-11];轉(zhuǎn)錄因子在植物氣孔運動中也發(fā)揮不可或缺的作用,各種轉(zhuǎn)錄因子共同保證了植物的生長發(fā)育[12-13]。目前,已經(jīng)有許多轉(zhuǎn)錄因子家族的功能通過生物信息學(xué)的方法被研究報道,比如谷子bZIP 轉(zhuǎn)錄因子家族[1]、谷子NF-YB轉(zhuǎn)錄因子家族[14]、谷子和狗尾草WOX 轉(zhuǎn)錄因子家族[15]等。GRAS 家族蛋白是植物中廣泛存在的一種轉(zhuǎn)錄調(diào)節(jié)因子,近年來的結(jié)構(gòu)研究揭示了其在結(jié)構(gòu)水平上的分子功能。大多數(shù)GRAS 蛋白包括一個N 端不保守的可變區(qū)域和一個C 端保守的GRAS 結(jié)構(gòu)域[16]。GRAS 家族成員幾乎均為單基因,編碼蛋白質(zhì)長度為360~850 個氨基酸[17],通過亞細(xì)胞定位,發(fā)現(xiàn)該家族的蛋白多數(shù)在細(xì)胞核、細(xì)胞質(zhì)及葉綠體基質(zhì)中表達(dá),可能與腋芽的發(fā)育與光合作用有關(guān)。在其C 端發(fā)現(xiàn)了幾個基序:亮氨酸七肽重復(fù)序列I(LHRⅠ)、VHIID、亮氨酸七核苷酸重復(fù)序列Ⅱ(LHRⅡ)、PFYRE 和SAW 基序。相比之下,GRAS 蛋白的N 末端呈現(xiàn)高變異性,由涉及分子識別的內(nèi)在無序結(jié)構(gòu)組成[18]。GRAS 家族基因參與植物的生長發(fā)育調(diào)控,在植物根及腋芽發(fā)育、分生組織形成、信號傳導(dǎo)等過程中發(fā)揮重要作用[19]?,F(xiàn) 階 段,GRAS 家 族 已 經(jīng) 在 擬 南 芥[20]、水稻[21]、番 茄[22]、葡 萄[23]、荷 花[24]、蓖 麻[25]、黃 瓜[26]等 多個物種中研究報道,但在谷子中還未曾研究。
谷子基因組相對較小,約為500 Mb,易于研究和觀察,被認(rèn)為是一種理想的模式植物[27]。本研究以xiaomi為試驗材料,主要鑒定了SiGRAS基因家族成員,對其進行了基因定位、系統(tǒng)進化、結(jié)構(gòu)域、基因表達(dá)、啟動子順式作用元件分析等系統(tǒng)的生物信息學(xué)分析,發(fā)現(xiàn)SiGRAS基因家族可能在谷子抗逆性、抗病原菌及生長發(fā)育方面發(fā)揮著重要的作用,該研究結(jié)果可為提高谷子產(chǎn)量及品質(zhì)提供理論支持。
從MDSi: Multi-omics Database forSetaria italica(http://foxtail-millet.biocloud.net/page/util/extendDetail?page=species&name=xiaomi%20)數(shù)據(jù)庫中獲取谷子(xiaomiannotation V1.0)的基因組數(shù)據(jù)、CDS序列數(shù)據(jù)、gff基因注釋文件、總蛋白序列。
利用Pfam 數(shù)據(jù)庫(http://pfam.xfam.org/)下載含有GRAS 類結(jié)構(gòu)域的隱馬爾可夫模型。通過TBtools 軟件中的Simple HMM Search 命令對谷子全基因組蛋白數(shù)據(jù)進行搜索,篩選SiGRAS基因家族的候選基因。通過TBtools 軟件中的Blast 功能對水稻和擬南芥蛋白質(zhì)序列與谷子全基因組進行比對,篩選E-value<1e-5的基因為SiGRAS基因家族的候選基因。用韋恩圖比較2 種方法的基因數(shù)量差別,最終鑒定出SiGRAS基因家族的候選基因。利用谷子基因組注釋gff 文件,對篩選到的SiGRAS基因家族進行位置信息提取,使用TBtools 中的Graphics功能進行可視化操作,進行基因定位分析。
通過在線網(wǎng)站ExPaSyProtparam(http://web.expasy.org/protparam)分析SiGRAS 家族編碼的氨基酸組成及理化性質(zhì)。利用PSORT Prediction數(shù)據(jù)庫(http://psort1.hgc.jp/form.html)對該家族的蛋白序列進行亞細(xì)胞定位分析。
將篩選到的60 條SiGRAS 蛋白家族長度完整的氨基酸序列進行比對,利用MEGA 7.0 構(gòu)建臨近樹(NJ)分析該家族與水稻、擬南芥同源家族的進化關(guān)系,使用iTOL 在線工具(https://itol.embl.de/login.cgi)美化進化樹。
使用Pfam 數(shù)據(jù)庫中的Batch search(http://pfam.xfam.org/search#tabview=tab1)進一步驗證前幾步得到的候選基因。取Blast 和HMMER 結(jié)果的交集驗證蛋白序列結(jié)構(gòu)域,最后用TBtools 中的Graphics 功能進行可視化操作。
利用在線工具MEME(https://meme-suite.org/)對60 個基因編碼的氨基酸序列進行motif 預(yù)測,使用TBtools 進行可視化操作。
在TBtools 軟件中利用谷子基因組注釋gff 文件、基因序列文件、CDS 序列文件提取啟動子,在PlantCARE 在線數(shù)據(jù)庫(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)中對該家族的順式作用元件進行分析,并利用TBtools 軟件對得到的數(shù)據(jù)進行可視化操作。
在MDSi: Multi-omics Database forSetaria italica(http://foxtail-millet. biocloud. net/page/tools/expressionVisualization)數(shù)據(jù)庫中下載并整理SiGRAS基因家族在不同器官中的表達(dá)量,包括晉谷21(JG21)在不同組織不同生長時期表達(dá)的數(shù)據(jù),利用TBtools 軟件繪制表達(dá)熱圖。
使用HMMER 模型總共鑒定到GRAS 家族的60 個候選基因,利用Blastp 比對鑒定到了61 個候選基因,通過Pfam 數(shù)據(jù)庫分析,最終篩選出含有GRAS 結(jié) 構(gòu) 域 的基因60 個,如圖1 所 示,除6 號 染色體外,這60 個基因不均勻分布于8 條染色體上;其中9 號染色體上分布最多,有13 個基因,依據(jù)在染色體上排列順序,命名為SiGRAS1~SiGRAS60。
圖1 SiGRAS 基因家族成員染色體定位Fig.1 Chromosome location of SiGRAS gene family members
為了更清楚該家族蛋白的性質(zhì),對其理化性質(zhì) 及亞細(xì)胞定位進行了分析,結(jié)果列于表1。
表1 SiGRAS 家族理化性質(zhì)分析Tab.1 Analysis of physical and chemical properties of SiGRAS family
續(xù)表1 SiGRAS 家族理化性質(zhì)分析Tab.1(Continued) Analysis of physical and chemical properties of SiGRAS family
由表1 可知,不同SiGRAS 蛋白的氨基酸數(shù)目差異較大,SiGRAS46 蛋白的氨基酸數(shù)目最多,為1 394 個,SiGRAS17 蛋白的氨基酸數(shù)目最少,僅為295 個。SiGRAS 蛋白氨基酸序列的理論等電點在4.87~9.53,但是總體看SiGRAS 家族氨基酸序列的等電點大多數(shù)在酸性范圍,蛋白質(zhì)分子中富含酸性氨基酸。不穩(wěn)定指數(shù)、脂溶指數(shù)及總平均疏水指數(shù)信息如表1 所示,該家族成員多為親水性蛋白,在細(xì)胞質(zhì)、細(xì)胞核、葉綠體基質(zhì)3 個位置上的定位最多,與其他植物中的報道一致。
為了清楚SiGRAS 家族的進化情況,利用MEGA 7.0 中的NJ 法對谷子(60 個)、擬南芥(32 個)和水稻(53 個)3 個物種的GRAS 基因家族構(gòu)建進化樹,其結(jié)果如圖2 所示。
圖2 SiGRAS 家族系統(tǒng)進化樹分析Fig.2 Phylogenetic tree analysis of SiGRAS family
從圖2 可以看出,60 個SiGRAS基因家族成員被分為12 個亞族,命名為Ⅰ~Ⅻ,整體來看,SiGRAS基因家族與擬南芥、水稻有共同的祖先。Ⅻ亞族中,OsGRAS44 與SiGRAS49 聚為一個小支;Ⅺ亞 族 中,OsGRAS24 與SiGRAS21 具 有 很強的同源性;Ⅹ亞族中,AtGRAS1、AtGRAS7、AtGRAS14、OsGRAS1 與SiGRAS50 親緣關(guān)系近;Ⅵ亞 族 中,SiGRAS6 與OsGRAS15 同 源;Ⅱ亞 族中,編碼SiGRAS48 蛋白的基因與水稻GRAS 家族OsGRAS28基因親緣關(guān)系更近;Ⅰ亞族中,OsGRAS37 與SiGRAS24 聚為一小支,說明谷子中該基因與水稻GRAS 家族OsGRAS37基因同源。
如圖3 所示,SiGRAS 家族基因編碼的蛋白均含有GRAS 結(jié)構(gòu)域。值得注意的是,SiGRAS50、SiGRAS46、SiGRAS45、SiGRAS43、SiGRAS17、SiGRAS10 含有2 個結(jié)構(gòu) 域,其中,SiGRAS50基 因編碼產(chǎn)物的N 端還存在DELLA 結(jié)構(gòu)域,SiGRAS43的C 端還含有NB-ARC 結(jié)構(gòu)域;其余蛋白含有2 個GRAS 結(jié)構(gòu)域,可能存在基因串聯(lián)。
圖3 SiGRAS 家族結(jié)構(gòu)域分析Fig.3 Domain analysis of SiGRAS family
利用Multiple EM for Elicitation(MEME)在線分析預(yù)測SiGRAS基因家族60 條序列的潛在功能域,共預(yù)測到8 個不同的motif。結(jié)果顯示,所編碼的大多數(shù)GRAS 類蛋白 中motif 以motif8、motif6、motif2、motif7、motif5、motif3、motif1、motif4 的順序排列,其中motif5、motif7、motif6、motif2 容易發(fā)生易位,在每個GRAS 類蛋白中,motif4 都存在于C端 的 末 尾。motif1、motif2、motif5 含 有VHIID 基序,motif1、motif3、motif5、motif8 含 有PFYRE 基序,motif1、motif4 含 有SAW 基 序,可 以 看 出,motif1 保守性更好。SiGRAS46、SiGRAS10這2 個基因含有的功能域數(shù)目最多,分別含有17、15 個motif(圖4),與結(jié)構(gòu)域分析結(jié)果保持一致。
圖4 SiGRAS 家族motif 分析Fig.4 Motif analysis of SiGRAS family
利用PlantCARE 網(wǎng)站分析SiGRAS 類基因的順式作用元件(圖5),發(fā)現(xiàn)該家族含有調(diào)節(jié)赤霉素(GA)相關(guān)信號通路的順式作用元件,GA 能促進谷子莖的伸長、花的發(fā)育和籽粒的萌發(fā);絕大多數(shù)基因含有光響應(yīng)元件,參與光敏色素信號的轉(zhuǎn)導(dǎo);根特異性調(diào)控順式作用元件對植物根和莖的輻射性生長起重要作用;分生組織調(diào)控元件,調(diào)節(jié)分生組織活動,促進植物體生長;生長素響應(yīng)順式作用調(diào)控元件對葉、芽的發(fā)育起促進作用;該家族還含有低溫響應(yīng)順式作用元件,可以提高植物抗冷能力[28]。
圖5 SiGRAS 家族順式作用元件分析Fig.5 Cis-acting element analysis of SiGRAS family
利用SiGRAS家族(JG21)中基因在不同組織(根、莖、葉、葉肉、不同時期未成熟的籽粒和穗)基因表達(dá)量的數(shù)據(jù)繪制熱圖,結(jié)果如圖6 所示,60 個SiGRAS基因的表達(dá)模式呈現(xiàn)多樣化,發(fā)現(xiàn)SiGRAS基因家族在JG21 未成熟籽粒的5 個不同時期表達(dá)量偏低,僅有幾個基因在籽粒中特異性表達(dá),如SiGRAS25、SiGRAS6等,通過熱圖可以觀察到SiGRAS25在籽粒中的表達(dá)量高于其他基因,且S2 期表達(dá)量高于其余4 個時期,推測該基因在谷子成熟轉(zhuǎn)變過程中發(fā)揮作用,可促進籽粒營養(yǎng)物質(zhì)的積累。SiGRAS6在根、莖、葉中均有表達(dá),表達(dá)量大小依次為葉>莖>根;SiGRAS50、SiGRAS6、SiGRAS3在莖中表達(dá)量高,而SiGRAS50具有組織表達(dá)特異性,僅在莖中特異性高表達(dá);其余基因在不同時期的籽粒和穗中均表現(xiàn)為低表達(dá)或不表達(dá),該家族基因在根、莖、葉、葉肉中基因表達(dá)的數(shù)目較多,在籽粒和穗中表達(dá)較少,推測SiGRAS基因家族在基因表達(dá)上存在組織特異性。
圖6 SiGRAS 家族基因表達(dá)譜Fig.6 The gene expression pattern of SiGRAS family genes
GRAS 家族在植物生長發(fā)育、光信號傳導(dǎo)等方面發(fā)揮著重要作用[28-29]。目前,許多植物中都已報道了該家族的相關(guān)功能。GRAS 基因家族成員最初被認(rèn)為是植物生物學(xué)中的關(guān)鍵調(diào)控因子,以其最先發(fā)現(xiàn)的3 個成員Gibbereillin-Acid Intensive(GAI)、REPRESSOR of GAI(RGA)和SCARECROW(SCR)的特征字母命名[30-31]。本研究進化樹顯示,SiGRAS50 與AtGRAS1、AtGRAS7、AtGRAS14、OsGRAS1聚為一個小支。已有研究證明,AtGRAS7參與調(diào)控GA 信號通路,可有效延緩葉片衰老[32-33];OsGRAS1(SLR1)編碼一個DELLA 蛋白,是GA信號傳導(dǎo)的負(fù)調(diào)控因子,可以整合并放大水楊酸(SA)和茉莉酸(JA)介導(dǎo)的防衛(wèi)信號、調(diào)控水稻的生長和免疫應(yīng)答[34-35]。SiGRAS50 的N 端同樣具有DELLA 結(jié)構(gòu)域,含有赤霉素響應(yīng)元件、生長素響應(yīng)元件、低溫響應(yīng)元件,且在莖中特異性高表達(dá)。已有研究表明,DELLA 蛋白在擬南芥的GA 信號轉(zhuǎn)導(dǎo)中起負(fù)調(diào)控作用[36];DELLA 蛋白不表達(dá)時,根莖會過度伸長[37],故推測SiGRAS50 蛋白在莖的生長發(fā)育中起關(guān)鍵性作用并參與GA 信號轉(zhuǎn)導(dǎo)與調(diào)節(jié)逆境脅迫;此外,DELLA 蛋白調(diào)控的過程影響其籽粒產(chǎn)量或質(zhì)量[38-39],也會影響作物開花時間[40]。
同樣,SiGRAS6與OsGRAS15同源,OsGRAS15由CIGR2(chitin-inducible gibberellin-responsive 2)即幾丁質(zhì)誘導(dǎo)的赤霉素應(yīng)答基因編碼,水稻GRAS家族的2 個成員(CIGR1和CIGR2)由強效誘導(dǎo)子N-乙酰殼寡糖(GN)誘導(dǎo),被外源GA 快速誘導(dǎo)。進一步表明,CIGR1和CIGR2在防御和發(fā)育中發(fā)揮作用。CIGR1和CIGR2以劑量依賴的方式對生物活性GA 產(chǎn)生反應(yīng)[41],由此推測,SiGRAS6 在調(diào)控GA 信號轉(zhuǎn)導(dǎo)方面發(fā)揮作用。SiGRAS6 在根、莖、葉中表達(dá)量均高,順式作用元件和同源性分析可知,該蛋白具有生長素、脫落酸響應(yīng)等順式作用元件并參與GA 信號轉(zhuǎn)導(dǎo),推測SiGRAS6 通過調(diào)節(jié)激素響應(yīng)影響根、莖、葉的生長發(fā)育,在谷子生長發(fā)育過程中起關(guān)鍵性作用,對谷子光合作用積累養(yǎng)分及谷子籽粒發(fā)育有調(diào)控作用。
此外,從進化樹可知,SiGRAS49與OsGRAS44、SiGRAS21與OsGRAS24、SiGRAS48與OsGRAS28分別聚為一支,故推測SiGRAS49 能夠與DNA 結(jié)合并發(fā)揮相應(yīng)的功能[42],SiGRAS21 在耐旱方面發(fā)揮 著 重 要作用[43],SiGRAS48基 因 響應(yīng)GA 及BR 信號,從而影響谷子發(fā)育和抵抗環(huán)境脅迫[44]。與SiGRAS24 同源的OsGRAS37 因位于水稻11 號染色體,預(yù)測其可能參與抵抗病原菌的侵染[45]。由結(jié)構(gòu)分析可知,SiGRAS43 的C 端含有NB-ARC 結(jié) 構(gòu)域,該結(jié)構(gòu)域在蘋果[46]、山葡萄[47]、陸地棉[48]等植物中已經(jīng)被克隆到,該結(jié)構(gòu)域含有抗病基因,可抵御病原菌侵染[49-50],可以通過調(diào)節(jié)SA、JA、ABA 等信號途徑調(diào)節(jié)防御反應(yīng),推測SiGRAS43基因在谷子抵御病蟲害方面可能發(fā)揮著重要作用。
本研究通過生物信息學(xué)對SiGRAS 家族成員進行染色體定位、進化樹、結(jié)構(gòu)域、基因表達(dá)、啟動子順式作用元件等的分析,共鑒定出60 個SiGRAS基因。經(jīng)結(jié)構(gòu)和功能分析可知,定位于9號染色體上的SiGRAS50 與OsGRAS1 親緣關(guān)系最近,因含有DELLA 結(jié)構(gòu)域,且在莖中特異性高表達(dá),推測該蛋白對防御病蟲害有關(guān)鍵作用并影響莖的發(fā)育。同樣,位于9 號染色體的SiGRAS43 蛋白含有NB-ARC結(jié)構(gòu)域,推測其參與病蟲害防御。SiGRAS6在2 號染色體上,該蛋白與OsGRAS15 同源性高,在根、莖、葉中有高表達(dá),推測該基因參與GA 信號傳導(dǎo)并對谷子生長發(fā)育有關(guān)鍵作用。該家族對于谷子根、莖、葉的發(fā)育及信號通路的調(diào)控起關(guān)鍵性作用,可提高谷子的抗逆性、抗病原菌侵襲的能力,進而影響谷子的生長發(fā)育及光合作用過程,研究該家族可為進一步提高谷子產(chǎn)量及品質(zhì)提供參考。