胡萌萌,張麗玲,張雅坤,郄倩茹,任碧云,侯思宇,朱喆標(biāo),高建華,王海崗,李旭凱*,韓淵懷*
(1.山西農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院,山西 太谷030801;2.山西農(nóng)業(yè)大學(xué) 生命科學(xué)學(xué)院,山西 太谷030801;3.山西省農(nóng)業(yè)科學(xué)院 農(nóng)作物品種資源研究所,山西 太原030000)
谷子屬于禾本科狗尾草屬,具有耐旱、耐貧瘠、耐貯藏的優(yōu)點,去皮后稱為小米,以其優(yōu)良的營養(yǎng)價值和口感風(fēng)味廣受歡迎[1]。小麥、水稻、玉米、谷子等谷類作物以淀粉為主要成分,因此成為目前最主要的幾種糧食作物。
Waxy基因(簡寫為Wx)編碼植物淀粉合成的關(guān)鍵酶即顆粒結(jié)合型淀粉合成酶(Granule-Bound Starch SynthaseⅠ,GBSSⅠ),控制作物籽粒胚乳中直鏈淀粉的合成。其中直鏈淀粉含量(Amylose content,AC)是決定作物籽粒食味和蒸煮品質(zhì)的最重要因素之一[2~5],AC 過高的谷物其食味品質(zhì)往往較差。研究表明,在水稻馴化過程中,全球范圍內(nèi)存在著從高到低的AC 選擇趨勢[6]。最新研究發(fā)現(xiàn)通過微調(diào)Waxy基因可以不同程度上調(diào)節(jié)水稻的AC,為進一步改良水稻品質(zhì)提供支撐。李加瑞等人利用RNA 沉默技術(shù)對從小麥中分離得到的Waxy基因進行轉(zhuǎn)化,驗證了Waxy基因直接影響小麥直鏈淀粉的含量[7]。目前在多種植物中的Waxy基因 已被克?。?~10],但對谷子的Waxy基因卻缺乏研究。
WGCNA(Weighted Gene Co-Expression Network Analysis,加權(quán)基因共表達網(wǎng)絡(luò)分析),是一種分析多樣本基因表達模式的分析方法,可將表達模式相似的基因聚類,并分析模塊與特定性狀或表型之間的關(guān)聯(lián)關(guān)系。在實際應(yīng)用層面,由于基因共表達網(wǎng)絡(luò)分析作為一種挖掘和呈現(xiàn)基因在不同樣本中表達形式的有效方法,可以鑒定高度共表達的基因模塊,模塊的特征值或模塊中包含的關(guān)鍵基因(hub genes:即與基因網(wǎng)絡(luò)中的其它基因聯(lián)系最緊密,在基因網(wǎng)中起關(guān)鍵作用的基因)可用于提煉模塊信息,以此深入探討基因模塊或模塊中的關(guān)鍵基因和關(guān)注的樣本特征間的關(guān)聯(lián)關(guān)系[11]。
本試驗對谷子Waxy基因特征與蛋白質(zhì)特性進行分析,并與其它5 種禾本科糧食作物的Waxy基因進行聚類比較。對Waxy基因在谷子中的表達模式進行分析,并以名優(yōu)谷子品種晉谷21 為材料,構(gòu)建淀粉合成相關(guān)基因的共表達網(wǎng)絡(luò)。本研究結(jié)果可為進一步選育優(yōu)質(zhì)谷子提供一定的理論參考與依據(jù)。
轉(zhuǎn)錄組數(shù)據(jù):2019 年4 月24 日于山西農(nóng)業(yè)大學(xué)谷子研究試驗基地(山西省太谷區(qū),北緯37°25′13″,東經(jīng)112°35′26″)種植25 m2晉谷21,2019年8 月27 日采集晉谷21 的灌漿5 個時期籽粒(S1:灌漿初期,外觀呈鮮綠色,內(nèi)含物呈水乳狀;S2:灌漿前期,谷子外觀呈暗綠色,胚形成且處于乳狀內(nèi)含物中;S3:灌漿中期,谷子外觀呈黃綠色,營養(yǎng)物質(zhì)積累,內(nèi)含物固化,胚與粉狀內(nèi)含物可分離;S4:灌漿后期,外觀呈暗黃色,籽粒質(zhì)地硬化,內(nèi)含物較充實,胚與內(nèi)含物難分離;S5:灌漿末期:外光呈深黃色,谷殼干燥變脆,籽粒成熟),采集方法為,辨別每粒谷子所處灌漿時期,用鑷子夾取放入置于液氮中的離心管中,每5 個單株為一個重復(fù),每個重復(fù)取3 個離心管。灌漿中期的根、莖、旗葉、倒3 葉及萌發(fā)期芽長2 mm 的整顆幼苗各取3 個重復(fù)。RNA 提取及轉(zhuǎn)錄組測序由諾禾致源公司完成。
1.2.1 谷子Waxy基因獲取
在國家水稻數(shù)據(jù)中心(http://www.ricedata.cn/)下載水稻W(wǎng)axy基因序列、CDS 序列、蛋白序列和轉(zhuǎn)錄起始位點上游2 000 bp 序列。基于谷子多組學(xué)數(shù)據(jù)庫(http://sky. sxau. edu. cn/MDSi.htm),比對出谷子的Waxy基因信息并下載相應(yīng)的序列。
1.2.2Waxy同源基因獲取
利用NCBI(https://www.ncbi.nlm.nih.gov)分別獲取糜子(Panicum miliaceum)、高粱(Sorghum bicolor)、玉米(Zea mays)、小麥(Triticumaestivum)的蛋白序列文件、注釋文件以及基因組文 件,通 過Tbtools[12]將 水稻 的Waxy 蛋白序列比對到該4 個物種蛋白序列文件獲取Waxy基因的基因序列、CDS 序列、蛋白質(zhì)序列、轉(zhuǎn)錄起始位點上游2 000 bp 序列。
1.2.3Waxy同源基因聚類分析
利用Clustal X2[13]對6 個物種的Waxy基因蛋白序列進行多重序列比對,并在MEGA 7[14]中以Neighbor-Joining 方法構(gòu)建系統(tǒng)發(fā)育樹。以GSDS2.0 工具[15]對Waxy基因的基因結(jié)構(gòu)進行分析。將Waxy 蛋白序列提交至Multiple Em for Motif Elicitation 工具(MEME,Version 5.0.3)[16]分析其蛋白質(zhì)基序。用PFAM 數(shù)據(jù)庫對Waxy 蛋白的保守結(jié)構(gòu)域進行分析,并使用Tbtools 工具進行可視化。
1.2.4Waxy基因啟動子順式作用元件分析
將Waxy基因轉(zhuǎn)錄起始位點上游2 000 bp 序列作為啟動子區(qū)域提交至PlantCARE(http://bioinformatics. psb. ugent. be/webtools/plantcare/html/)分析啟動子作用元件,基于Tbtools 軟件進行定位預(yù)測。
1.2.5 谷子Waxy基因表達模式分析
將谷子Waxy基因信息輸入谷子多組學(xué)數(shù)據(jù)庫(http://sky. sxau. edu. cn/MDSi. htm),得到Waxy基因在谷子各組織時期的表達模式。
1.2.6 淀粉基因共表達網(wǎng)絡(luò)
對轉(zhuǎn)錄組數(shù)據(jù)進行篩選過濾,將得到的clean reads 與參考基因組進行序列比對,基于比對結(jié)果進行基因表達量分析,根據(jù)各樣本中基因差異表達規(guī)律來進行聚類,根據(jù)無尺度網(wǎng)格確定軟閾值(Soft thresholding power)從而劃分模塊,提取出含淀粉合成基因最多的模塊,利用Cytoscape(3.7.1)[17]對該模塊進行加權(quán)基因共表達網(wǎng)絡(luò)的繪制。
在phytozome 數(shù)據(jù)庫、NCBI 數(shù)據(jù)庫及MDSi數(shù)據(jù)庫比對共得到13 條Waxy基因,其中包括水稻(LOC_Os06g04200),高粱(Sobic. 010G022600、Sobic. 002G116000),谷子(Si4g02980、Si2g12020),玉米(GRMZM2G024993、GRMZM2G008263),小麥(Traes_2DL_E4B86D0C3、Traes_2AL_06AD35739、
Traes_2BL_25DAD57C9、Traes_4AL_4B9D56131)、糜子(PM09G01630、PM10G01650)。Waxy 蛋白系統(tǒng)進化樹如圖1(左)所示,主要分為2 部分。多序列比對結(jié)果表明,氨基酸序列均在600 aa 左右,13 條氨基酸序列均高度相似。Waxy基因結(jié)構(gòu)(圖1左)分析顯示,多數(shù)基因包含有內(nèi)含子和外顯子結(jié)構(gòu),呈現(xiàn)斷裂基因特征,其中多數(shù)基因含有13 個外顯子,且基因結(jié)構(gòu)均相似。
Waxy 蛋白質(zhì)保守基序結(jié)果(圖1 中)表明,Waxy 蛋 白 共10 個motif,其 中Traes_4AL_4B9D56131和PM10G01650 不含有motif9,其余均含有motif 1-motif 10,且排列高度一致,基序的保守性表明這些Waxy 蛋白在功能上具有較高的相似性。
保守結(jié)構(gòu)域分析結(jié)果(圖1 右)顯示,共有2 個保守結(jié)構(gòu)域,分別為Glyco_transf_5(淀粉合成酶催 化 區(qū),Starch synthase catalytic region)和Glycos_transf_1(糖基轉(zhuǎn)移酶,glycosyl transferase)。保守結(jié)構(gòu)域的排列同樣相似,其中Traes_4AL_4B9D56131和PM10G01650不 含 有Glycos_transf_1結(jié)構(gòu)域,但含有Glycos_transf_1_4,與GT_1 為同一家族,具有相同功能。Waxy 蛋白具有如上特征,表明其序列上具有植物顆粒結(jié)合型淀粉合成酶特征。綜上所述,Waxy 蛋白在各物種間的保守性很強,在進化過程中幾乎不受影響。
圖1 Waxy 基因結(jié)構(gòu)及蛋白質(zhì)特征Fig.1 Structure and protein characteristics of Waxy gene
對轉(zhuǎn)錄起始位點上游2 000 bp 的啟動子順式元件分析發(fā)現(xiàn)(圖2),13 個Waxy基因啟動子中與淀粉合成相關(guān)的元件主要有:參與胚乳表達順勢調(diào)控元件(GCN4_motif)、植物激素響應(yīng)元件(ABRE、P-box、TCA-element)。不同基因的調(diào)控元件種類和數(shù)目不同,其中水稻LOC_Os06g04200的啟動子元件最多,高達20 個,小麥Traes_2AL_06AD35739基因最少,僅含有9 個。此外,每個Waxy基因都包含較多植物激素響應(yīng)順式作用元件,表明植物在淀粉合成中存在多種植物激素的參與和調(diào)節(jié)。
對谷子2 個Waxy基因表達模式分析發(fā)現(xiàn)(圖3,圖4),基因Si4g02980在谷子灌漿期及成熟后的籽粒中表達量很高,說明其在籽粒淀粉合成中可能起重要作用,而基因Si2g12020在抽穗期的倒二葉片中的表達量較高,而在籽粒中的表達較低,說明其可能在谷子功能葉片淀粉合成中起重要作用。
2.4.1 基因共表達網(wǎng)絡(luò)構(gòu)建
對RNA-Seq 數(shù)據(jù)進行篩選,過濾掉在超過半數(shù)樣本中沒有表達的低質(zhì)量的基因后,共獲得31659 個有效基因用于創(chuàng)建基因表達矩陣。設(shè)置R2為0.9,選取power=9 來計算兩兩基因間的TOM 矩陣,結(jié)果共得到37 個模塊,模塊中基因個數(shù)2~5 586 不等(圖1~圖4)。
2.4.2 模塊的GO 富集分析
選取含淀粉合成基因數(shù)目多的2 個模塊,對2個模塊進行GO 功能富集分析,富集結(jié)果涉及到了生物學(xué)過程(biological process),細胞組分(cellular component)和分子功能(molecular function)。部分富集結(jié)果(表1)顯示,bisque4 模塊富集到了葡聚糖生物合成的過程(GO:0009250)、丙酮酸生物合成的過程(GO:0042866)、糖酵解過程(GO:0006096)等相關(guān)的調(diào)控通路。skyblue 模塊富集到多糖生物合成的過程(GO:0000271)、丙酮酸生物合成的過程(GO:0042866)和淀粉生物合成的過程(GO:0019252)等相關(guān)的調(diào)控通路。
圖2 Waxy 基因啟動子順式作用元件Fig.2 Waxy gene promoter cis acting element
圖3 谷子Si4g02980 基因表達模式Fig.3 Expression pattern of Si4g02980 gene in foxtail millet
圖4 谷子Si2g12020 基因表達模式Fig.4 Expression pattern of Si2g12020 gene in foxtail millet
2.4.3 互作網(wǎng)絡(luò)的構(gòu)建及核心基因功能注釋
利用Cytoscape 軟件對bisque4 和skyblue 模塊進行網(wǎng)絡(luò)可視化(圖5),選取網(wǎng)絡(luò)中心權(quán)重值較高的基因作為核心基因共得到17 個,在水稻數(shù)據(jù)庫及擬南芥數(shù)據(jù)庫中對其進行功能注釋(表1),其中含有8 個淀粉合成酶基因,3 個葡萄糖合成酶基因及一些蛋白激酶和調(diào)控蛋白基因。谷子Waxy基因Si4g02980也作為核心基因存在于網(wǎng)絡(luò)中,證明了WGCNA 方法在對數(shù)據(jù)分析中具有較高的可靠性。
2.4.4 模塊候選基因及功能注釋
表1 模塊核心基因功能注釋Table 1 Functional annotation of modular hub genes
續(xù)表
圖5 bisque4、skyblue 模塊相關(guān)基因網(wǎng)絡(luò)圖Fig.5 Genetic network diagram of bisque4 and skyblue module
篩選與核心基因高連通性的基因,得到候選基因,在bisque4 模塊中找到10 個候選基因,skyblue 中有7 個,對這17 個候選基因在水稻及擬南芥數(shù)據(jù)庫中進行功能注釋。注釋結(jié)果如表2 所示,這些基因主要編碼蛋白質(zhì)鋅指結(jié)構(gòu)域和結(jié)合蛋白,其中,谷子Si8g15270基因與水稻中的LOC_Os02g15350基因同源,其編碼醇溶谷蛋白框結(jié)合蛋白(Rice prolamin box binding factor,RPBF),該蛋白可調(diào)節(jié)種子貯藏蛋白基因的表達,調(diào)節(jié)種子中蛋白、淀粉和脂類含量,在水稻籽粒灌漿期中發(fā)揮重要作用[18]。其它候選基因的研究報道較少,需進一步功能驗證。
通過對谷子及其它5 種禾本科作物Waxy同源基因及同源蛋白質(zhì)基序的研究發(fā)現(xiàn),雖然基因結(jié)構(gòu)的差異較大,氨基酸序列有所不同,但基本的結(jié)構(gòu)域是保守的,這說明在進化過程中盡管基因結(jié)構(gòu)有一定的變化,但其蛋白質(zhì)的變化較小。2 個保守結(jié)構(gòu)域與其它物種的研究結(jié)果一致[19,20]。
目前對于Waxy基因在水稻種的研究已較為深入。最新研究通過CRISPR/Cas9 技術(shù)編輯水稻W(wǎng)axy基因啟動子上的關(guān)鍵順式作用元件,明確了一個可定量調(diào)節(jié)Waxy基因表達的啟動子靶位點,創(chuàng)建了新的Waxy等位基因,在不同Waxy等位基因中編輯該位點將有機會獲得更多微調(diào)AC 的新Waxy等位基因。研究也表明編輯基因的核心啟動子可能是一種適度調(diào)節(jié)目的基因表達的通用型方法,同樣也可以應(yīng)用于其他作物中,為分子育種工作提供了新穎的思路。
本文通過對谷子與其它5 種禾本科作物Waxy基因的分析,明確了禾本科作物Waxy基因結(jié)構(gòu)的多樣性及其氨基酸序列的保守性;基于不同組織表達模式分析推斷Si4g02980是谷子籽粒淀粉合成的主效基因;利用27 份轉(zhuǎn)錄組數(shù)據(jù)進行的WGCNA分別獲得一批包括轉(zhuǎn)錄因子的關(guān)鍵基因,可為深入探索谷子及禾谷類淀粉合成調(diào)控提供一定的理論依據(jù)。
表2 候選基因功能注釋Table 2 Functional annotations of candidate genes