陳紫巖,林 參,2,尹 航,張豪杰,魏真真,余希文,吳傳萬*,李 茹
(1.江蘇徐淮地區(qū)淮陰農(nóng)業(yè)科學(xué)研究所,江蘇 淮安 223000;2.江蘇天豐種業(yè)有限公司,江蘇 淮安 223000;3.四川省農(nóng)業(yè)科學(xué)院 植物保護(hù)研究所,四川 成都 610066;4.蘇州市農(nóng)業(yè)科學(xué)院,江蘇 蘇州 215000)
蔗糖是高等植物光合作用的主要最終產(chǎn)物,同時其作為主要形式參與植物體內(nèi)碳水化合物的長距離運(yùn)輸[4]。蔗糖代謝在植物對非生物脅迫(如干旱、高溫等脅迫)中扮演重要角色,對植物生長和產(chǎn)量形成有重要影響[5]。高等植物中蔗糖的生物合成由2步反應(yīng)組成:第一步蔗糖磷酸合成酶(Sucrose Phosphate Synthase,SPS;EC 2.4.1.14)催化尿苷二磷酸葡萄糖和6-磷酸果糖形成蔗糖-6-磷酸;第二步則是磷酸蔗糖磷酸酶(Sucrose Phosphate Phosphatase,SPP;EC 3.1.3.24)進(jìn)一步水解蔗糖-6-磷酸形成蔗糖[6]。人們在對于SPP基因的研究日益深入的同時,對于SPP家族基因報道卻少之又少[7]。前期的研究已經(jīng)證明,SPP相關(guān)家族基因可以影響光合碳在不同儲能物質(zhì)間的分配[8]。2005年,研究者用RNAi技術(shù)降低煙草中SPP基因的表達(dá)水平,結(jié)果顯示隨著SPP基因表達(dá)水平的下降,植株中各類糖的含量大幅下降[9]。作為蔗糖合成的關(guān)鍵基因,有關(guān)SPPs參與藜麥發(fā)育的研究十分欠缺。
為了進(jìn)一步研究調(diào)控藜麥蔗糖代謝的分子機(jī)制,本研究利用藜麥基因組數(shù)據(jù)庫,首先鑒定出SPP基因家族全部4個成員,然后對其蛋白的理化性質(zhì)、模體、啟動子元件、基因結(jié)構(gòu)、進(jìn)化以及表達(dá)模式等進(jìn)行了分析,以期為后續(xù)的藜麥育種工作提供新的思路。
通過藜麥基因組數(shù)據(jù)庫(https://www.cbrc.kaust. edu.sa/chenopodiumdb)下載藜麥基因組數(shù)據(jù)及注釋文件。從Pfam數(shù)據(jù)庫(http://pfam.xfam.org)下 載S6PP結(jié) 構(gòu) 域(PF05116)和S6PP_C結(jié) 構(gòu) 域(PF08472)的隱馬爾科夫模型(.hmm)文件[10-11],并通過HMMER軟件對藜麥的蛋白序列進(jìn)行比對,獲得同時擁有S6PP結(jié)構(gòu)域和S6PP_C結(jié)構(gòu)域的候選序列。手動剔除冗余序列后,將獲得的候選序列提交至NCBI網(wǎng)站的CDD軟件(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)進(jìn)行結(jié)構(gòu)域驗(yàn)證。
使用在線分析網(wǎng)站SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page= npsa_sopma.html)對藜麥SPP蛋白序列進(jìn)行二級結(jié)構(gòu)分析[12]。使用ExPASy 網(wǎng)站的在線預(yù)測工具(https://web.expasy.org/protparam/)對藜麥SPP家族成員蛋白質(zhì)的分子量、理論等電點(diǎn)和親水性等理化性質(zhì)進(jìn)行預(yù)測[13]。
使用在線工具PlantmPLoc(http://www.csbio.sjtu.edu.cn/cgi-bin/PlantmPLoc.cgi)進(jìn)行亞細(xì)胞定位預(yù)測[14]。使用在線工具TMHMM-2.0(https://services.healthtech.dtu.dk/)進(jìn)行蛋白跨膜結(jié)構(gòu)域預(yù)測[15]。
利用TBtools對CqSPP家族的染色體定位及基因結(jié)構(gòu)進(jìn)行可視化處理,處理后得到圖片[16]。利用MEME(https://meme-suite.org/meme/doc/meme.html?man_type=web)網(wǎng)站對SPP家族的蛋白保守基序進(jìn)行分析,獲得的結(jié)果用TBtools進(jìn)行可視化[17]。
為了闡述藜麥SPP基因家族各成員的系統(tǒng)進(jìn)化關(guān)系,將獲得的6個物種(擬南芥、番茄、藜麥、水稻、高粱和玉米)的基因的候選序列存為Fasta格式,使用ClustalW軟件對其進(jìn)行氨基酸序列比對,然后利用軟件MEGA 7.0 將多序列比對結(jié)果選用鄰接法(neighbor-joining, NJ)構(gòu)建系統(tǒng)發(fā)育樹,其中bootstrap設(shè)置為1000,其余參數(shù)設(shè)置為默認(rèn)參數(shù)。
取各成員基因序列中轉(zhuǎn)錄起始點(diǎn)上游2000 bp序列,將其儲存為Fasta格式,使用PlantCARE進(jìn)行順式轉(zhuǎn)錄元件預(yù)測。預(yù)測結(jié)果用TBtools進(jìn)行可視化。
兩組在進(jìn)行治療過后,臨床癥狀都得到一定改善,但觀察組的改善程度高于對照組,據(jù)統(tǒng)計觀察組的有效率為96.00%,對照組有效率為76.00%,兩組差異具有統(tǒng)計學(xué)意義(P<0.05),詳見表1。
藜麥花、葉片、種子、幼苗和莖的RNA-seq數(shù)據(jù)下載于NCBI轉(zhuǎn)錄組數(shù)據(jù)庫(項(xiàng)目號:PRJNA 394651),以此來分析藜麥各組織的表達(dá)情況[18]。使用TBtools軟件繪制藜麥SPP基因表達(dá)的熱圖(表達(dá)量取log2FPKM 值)。
供試藜麥品種為蘇藜1號。對出苗30 d的藜麥幼苗進(jìn)行逆境脅迫處理,設(shè)置3種試驗(yàn)處理:T1為幼苗噴施5.0 mg/L ABA后置于常溫下種植;T2為將幼苗置于4 ℃培養(yǎng)箱中模擬冷處理;T3為幼苗噴施200 mmol/L濃度甘露醇模擬干旱處理。處理48 h后,取葉片進(jìn)行qPCR檢測,內(nèi)參選取藜麥基因EF1-a,引物信息見表1。設(shè)3次重復(fù),試驗(yàn)數(shù)據(jù)用2-ΔΔCt法處理。試驗(yàn)完成后,用Graphpad 8.0軟件繪制柱狀圖。
表1 qPCR試驗(yàn)中用到的引物信息
通過Hmmer軟件從藜麥基因組中共鑒定到4個SPP家族成員,按隱馬爾科夫模型匹配度分別命名為CqSPP1、CqSPP2、CqSPP3和CqSPP4 (表2)。其氨基酸數(shù)目在399~623之間;分子量介于45.24 ~70.77 kDa之間;理論等電點(diǎn)在5.64~6.93之間,均小于7,顯酸性;不穩(wěn)定指數(shù)介于35.25~41.73,除CqSPP3外均為大于40的不穩(wěn)定蛋白。利用ProtScale在線工具分析藜麥SPP蛋白氨基酸序列的親/疏水性,發(fā)現(xiàn)4個SPP家族蛋白均有多個達(dá)-2以下的親水峰,且大于1的疏水峰較少,同時每個SPP家族蛋白親水性氨基酸數(shù)量多于疏水性氨基酸數(shù)目,因此判斷藜麥SPP家族蛋白表現(xiàn)為親水性(圖1)。
圖1 藜麥SPP蛋白的親水性預(yù)測結(jié)果
表2 藜麥SPP基因家族成員的基本信息和理化性質(zhì)
利用在線網(wǎng)站Swiss-model和SOPMA對藜麥SPP蛋白序列進(jìn)行結(jié)構(gòu)建模與分析,結(jié)果(圖2、表3)顯示,藜麥SPP基因家族蛋白都含有α-螺旋、β-轉(zhuǎn)角、無規(guī)則卷曲及延伸鏈等部分,但各部分所占比例明顯不同。藜麥SPP蛋白主要由無規(guī)則卷曲以及α-螺旋組成,兩者之和超過空間結(jié)構(gòu)總數(shù)的70%;其次為延伸鏈,而β-轉(zhuǎn)角所占比例最低,在4個蛋白中占比均不超過10%。
表3 擬南芥、番茄、水稻、高粱和玉米SPPs的命名
圖2 藜麥SPP蛋白三維結(jié)構(gòu)的預(yù)測結(jié)果
表3 藜麥SPP蛋白的二級結(jié)構(gòu) %
利用TBtools軟件繪制基因在染色體上的位置(圖3),4個CqSPP基因分別定位于4條不同的染色體上。
圖3 藜麥SPP基因家族染色體定位結(jié)果
通過在線軟件Plant-mPLoc對藜麥SPP基因家族4個成員的氨基酸序列進(jìn)行亞細(xì)胞定位預(yù)測。結(jié)果顯示,除了藜麥SPP2蛋白預(yù)測結(jié)果為不確定外,其余蛋白主要定位在葉綠體上(表4),這與預(yù)測的調(diào)控蔗糖合成功能是相吻合的。利用TMHMM在線工具對藜麥SPP蛋白的跨膜結(jié)構(gòu)進(jìn)行分析,結(jié)果表明藜麥SPP家族蛋白中只有CqSPP4蛋白存在跨膜結(jié)構(gòu)域。
表4 藜麥SPP基因亞細(xì)胞定位及蛋白跨膜結(jié)構(gòu)域預(yù)測
利用TBtools對CqSPP家族的基因結(jié)構(gòu)作圖(圖4),結(jié)果顯示,4個CqSPP基因均由外顯子和內(nèi)含子組成,并且每個基因所含的數(shù)量各不相同。其中CqSPP4的外顯子數(shù)量最多,為11個,內(nèi)含子數(shù)量為10個。對CqSPP家族模體分析發(fā)現(xiàn)(圖5、圖6),4個CqSPP蛋白均有8個排列順序相同的模體,CqSPP1、CqSPP2、CqSPP這3個蛋白在模體2之前多了1個模體9,CqSPP3和CqSPP4蛋白在模體8后面多了1個模體10。
圖4 藜麥SPP基因家族的基因結(jié)構(gòu)
圖5 藜麥SPP基因家族的模體
圖6 模體信息
為了分析CqSPP與其他植物SPP基因(表5)之間的進(jìn)化關(guān)系,我們構(gòu)建了藜麥SPP家族與其他物種SPP基因的進(jìn)化樹(圖7),結(jié)果表明,植物SPP基因可分為5個組,4個CqSPP成員被聚類到2個組,其中CqSPP1和CqSPP2被聚類到第5組(該家族包含最多的SPP成員),這2個基因與擬南芥AtSPP1、AtSPP2以及AtSPP3a的親緣關(guān)系最近;CqSPP3和CqSPP4被聚到第4組,其與擬南芥AtSPP3b聚類在一起。系統(tǒng)發(fā)育樹顯示藜麥SPP家族基因與擬南芥相關(guān)基因的親緣關(guān)系更接近。
圖7 SPP基因家族的進(jìn)化樹
本研究根據(jù)公開的基因組數(shù)據(jù),獲取SPP各成員轉(zhuǎn)錄起始點(diǎn)上游2000 bp的序列進(jìn)行分析(圖8)。結(jié)果表明,各成員啟動子上均有多個與逆境響應(yīng)相關(guān)的順式轉(zhuǎn)錄元件,如MYB、MYC、G-BOX等。從數(shù)量上來看,CqSPP4啟動子上的逆境響應(yīng)轉(zhuǎn)錄元件明顯比其他成員要多,這也預(yù)示著CqSPP4可能與其他成員有著完全不同的逆境響應(yīng)模式。
圖8 SPP基因的啟動子分析結(jié)果
本研究利用藜麥的RNA測序數(shù)據(jù)分析藜麥SPP基因的表達(dá)模式。以熱圖(Heatmap)表示CqSPP基因在5個不同部位的表達(dá)情況。CqSPP家族基因表達(dá)模式迥異(圖9)。CqSPP1在所有測試組織中的表達(dá)量均較高,而CqSPP4的表達(dá)量則相對較低。CqSPP1、CqSPP2和CqSPP3這3個基因表現(xiàn)出相同的表達(dá)模式,即在種子(Seed)中表達(dá)量最高,這可能與SPP家族基因主要控制蔗糖合成的功能有關(guān)。
圖9 藜麥CqSPP基因在不同組織中的表達(dá)模式
本研究分析了藜麥SPP基因在ABA處理、低溫處理和模擬干旱處理下葉片的表達(dá)水平(圖10),結(jié)果顯示:藜麥葉片中的SPP基因在受到不同脅迫時,表現(xiàn)出不同的響應(yīng)模式。SPP家族基因在受到ABA脅迫時,表達(dá)量均有所下調(diào)。而當(dāng)受到冷害脅迫時,CqSPP1和CqSPP2的表達(dá)量上調(diào),CqSPP4的表達(dá)量下降,CqSPP3的表達(dá)量并未發(fā)生明顯變化。在模擬干旱實(shí)驗(yàn)中,CqSPP1和CqSPP3的表達(dá)量下降,CqSPP2和CqSPP4則表現(xiàn)為上調(diào)。
圖10 藜麥CqSPP基因在不同逆境脅迫下的表達(dá)量
2017年藜麥高質(zhì)量基因組數(shù)據(jù)的公布,為藜麥基因家族鑒定、功能基因挖掘和研究提供了便利。本研究通過生物信息學(xué)分析,共鑒定出4個藜麥SPP蛋白,多于已報道的水稻、玉米等作物的[19-20]。在4個藜麥SPP蛋白中,CqSPP1、CqSPP2、CqSPP3擁有類似的分子量等理化性質(zhì),而CqSPP4則顯得有些特殊:其序列長度、分子量比其他的家族成員均更長、更大,但在各組織中的表達(dá)水平上明顯低于其他成員。這可能是因?yàn)榧易宄蓡T在執(zhí)行功能上存在一定的分化。除CqSPP2外,其余SPP基因家族成員亞細(xì)胞定位均位于葉綠體上,這與在玉米、甜菜等作物上的研究結(jié)論定位在細(xì)胞質(zhì)上有所不同[21]。這意味著藜麥SPP家族成員在調(diào)控蔗糖合成時與其他植物的功能模式并不相同。
對系統(tǒng)進(jìn)化樹進(jìn)行分析發(fā)現(xiàn),源自6種植物的17個SPP家族基因被分為1~5組。其中第1、2組包含單子葉植物水稻、玉米和高粱,第3~5組為雙子葉植物藜麥、擬南芥和番茄。這樣的結(jié)果證實(shí)了被子植物自單雙子葉分化后,SPP家族發(fā)生了基因的擴(kuò)張。同時,在結(jié)構(gòu)上有著相似保守基序的序列分布在同一支上,從側(cè)面也證明了本研究所建系統(tǒng)發(fā)育樹的可靠性。
通過分析藜麥SPP基因家族在不同組織中的表達(dá)數(shù)據(jù),發(fā)現(xiàn)藜麥SPP家族的基因在花、葉、種子、苗期和莖中均有表達(dá),并且在種子中的表達(dá)量高于其他部位。這樣的結(jié)果與先前其他植物的報道類似,也從側(cè)面驗(yàn)證了SPP家族調(diào)控種子蔗糖合成的重要作用。同時,CqSPP1基因的表達(dá)量明顯高于其他家族成員,推測其在調(diào)控蔗糖合成中發(fā)揮重要作用。
植物的蔗糖合成受不同的內(nèi)、外在因素的影響。本研究分析藜麥SPP家族各成員的啟動子序列發(fā)現(xiàn),在轉(zhuǎn)錄起始點(diǎn)上游存在大量與環(huán)境響應(yīng)有關(guān)的順式轉(zhuǎn)錄元件,這預(yù)示著各成員的表達(dá)可能受外界環(huán)境的影響。隨后對藜麥幼苗進(jìn)行了不同類型的脅迫處理,發(fā)現(xiàn):在受到ABA的影響后,SPP基因均表現(xiàn)出表達(dá)量下調(diào)的情況,這與脫落酸影響植物光合作用的認(rèn)知是相符的。而當(dāng)幼苗受到低溫和干旱影響時,SPP基因家族成員表現(xiàn)出各不相同的響應(yīng)模式,這從側(cè)面說明了SPP基因在執(zhí)行生物學(xué)功能上并不完全相同。后續(xù)擬通過過表達(dá)、基因敲除以及染色質(zhì)共沉淀等體內(nèi)、外的驗(yàn)證方式更加深入地研究該基因家族成員的功能。