程運河,程麗莉,曹慶昌,蘭彥平*
(1.北京市林業(yè)果樹科學研究院,北京 100093;2.國家林業(yè)局板栗工程技術(shù)研究中心,北京 100093)
【研究意義】板栗(Castaneamollissima)是原產(chǎn)于我國的重要闊葉經(jīng)濟林,雌雄同株異花,且雌、雄花比例嚴重失衡(1∶2400~4∶500)[1]。根據(jù)形態(tài)發(fā)生順序,板栗花芽分化階段可分為:生理分化期、花序原基分化期、苞片原基分化期、花簇原基分化期和雄(雌)蕊原基分化期。目前研究認為營養(yǎng)和激素是影響板栗花芽性別分化的重要原因[2]。徐娟[3]和陳在新等[4]的研究表明,結(jié)果母枝中的蔗糖含量高于雄花枝。生產(chǎn)中常通過修剪、施肥等方式改善樹體營養(yǎng),促進雌花分化,增加產(chǎn)量[5]。因此研究板栗的糖的分配對于調(diào)控板栗花芽性別分化、增加雌花比例具有重要意義?!厩叭搜芯窟M展】糖是主要的能量來源,也是重要的信號物質(zhì),廣泛參與植物的生長發(fā)育和脅迫響應[6-8]。高等植物中,碳水化合物由源組織-葉片通過光合作用產(chǎn)生后,被運輸?shù)接啄廴~片、根、花、果實等庫組織,為正常生命-活動和生長發(fā)育提供能量[9-10]。糖主要以蔗糖形式通過韌皮部從源組織運輸?shù)綆旖M織[11]。蔗糖運輸?shù)綆旖M織時先在細胞外被分解成單糖,再由STP(SUGAR TRANSPORT PROTEIN)蛋白將單糖提取到庫細胞中[12-13]。擬南芥(Arabidopsisthaliana)中的STP1(SUGAR TRANSPORT PROTEIN 1)基因是植物中第一個被鑒定到的單糖轉(zhuǎn)運蛋白基因[14]。目前已在擬南芥基因組中鑒定到14個STP基因(STP1-14),且這些基因均屬于MONOSACCHARIDE TRANSPORTER (MST)-like superfamily[15-16]。近年來,高粱(Sorghumbicolor)[17]、梨(PyrusbretschneideriRehd)[18]等植物中的STP基因也相繼被鑒定。STP基因的表達具有時空特異性。擬南芥中AtSTP8在配子體中均高表達。AtSTP12與內(nèi)珠皮的發(fā)育和側(cè)根的發(fā)生有關(guān)。AtSTP1和AtSTP5則在種皮中表達[13, 19]。在擬南芥中,AtSTP3和AtSTP14主要在成熟葉片中表達[20-21]。此外,STPs的表達受其轉(zhuǎn)運底物、生物脅迫和非生物脅迫的影響[8, 13, 22]。不同的STP轉(zhuǎn)運單糖的種類和能力各異[16, 20-21]。STP蛋白轉(zhuǎn)運的單糖主要包括葡萄糖、果糖、半乳糖、木糖和甘露糖等[11, 23]。大多STP家族成員能夠轉(zhuǎn)運多種單糖。少數(shù)STP蛋白對單糖的轉(zhuǎn)運具有特異性。如木薯中的MeSTP4和MeSTP10只能轉(zhuǎn)運麥芽糖[11]。STP蛋白對糖的轉(zhuǎn)運是通過其跨膜結(jié)構(gòu)域和疏水片段實現(xiàn)的[12, 24]。典型的STP蛋白均存在12個跨膜結(jié)構(gòu)域[11, 13, 25]??缒そY(jié)構(gòu)域能將STP蛋白定位于細胞質(zhì)膜上[24-25]。STP蛋白細胞質(zhì)膜外側(cè)的均疏水片段能夠形成一個Lid區(qū)域,將糖和質(zhì)子與質(zhì)外體隔離,形成特殊的微環(huán)境,以實現(xiàn)糖的跨膜轉(zhuǎn)運[12]。隨著高通量測序技術(shù)的進步和成本的降低,基因組測序已在植物研究中廣泛應用。北京農(nóng)學院秦嶺研究團隊基于二代和三代測序,完成了中國板栗基因組測序、組裝和注釋。該研究組裝的板栗基因組大小為785.53 Mb,Contig N50為944 Kb,能夠覆蓋96.7 %的基因組,注釋了36 479個基因。該基因組圖譜的繪制為板栗的進化起源、分子生物學研究和遺傳改良提供了重要的參考依據(jù)?!颈狙芯壳腥朦c】本研究利用生物信息學方法,在板栗基因組中鑒定STP家族成員,并對其基因結(jié)構(gòu)、蛋白保守結(jié)構(gòu)域、表達模式等進行分析?!緮M解決的關(guān)鍵問題】旨在提供板栗STP基本信息,解析STP的功能,為進一步研究STP家族成員在板栗花芽性別分化過程中的作用提供參考。
首先在gigaScience網(wǎng)站下載板栗基因組數(shù)據(jù)。從Pfam網(wǎng)站下載STP蛋白保守domain的隱馬爾科夫(HMM)模型文件,標號為PF00083。利用HMM3.0軟件,基于隱馬爾科夫模型,在板栗基因組數(shù)據(jù)中搜索含有STP結(jié)構(gòu)域的蛋白序列,閾值為E-value < e-10。將搜索到的蛋白序列放到NCBI網(wǎng)站,在CDD數(shù)據(jù)庫中尋找保守的STP結(jié)構(gòu)域,閾值設為E-value < 0.01。
TBtools軟件用于CmSTP家族基因結(jié)構(gòu)分析。利用MEME(http://meme-suite.org/tools/meme)在線網(wǎng)站,輸入CmSTP家族的氨基酸序列,搜索保守基序,參數(shù)設置為:基序的重復數(shù)“any”。基序長度6~200 aa,預測基序數(shù)量10個。將得到的保守基序在Pfam(http://pfam.xfam.org/)網(wǎng)站進行功能注釋。從Phytozome數(shù)據(jù)庫下載擬南芥(Arabidopsisthaliana)、木薯(Manihotesculenta)的STP氨基酸序列,并將其與篩選到的板栗CmSTP氨基酸序列用Clustal W進行多重比對后導入MEGAX,用臨接法(NEIGHBOR-joining)構(gòu)建進化樹,校驗參數(shù)為bootsrap=1000。
利用在線工具ExPASy(http://web.expasy.org/protparam)分析板栗STP家族成員的等電點、長度和分子量等屬性。利用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)預測CmSTP家族蛋白質(zhì)二級結(jié)構(gòu)。用Plant-mPLoc軟件(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)進行亞細胞定位預測。使用TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)預測跨膜結(jié)構(gòu)域。
混合芽是板栗形成產(chǎn)量的基礎。檢測STP在板栗混合芽早期發(fā)育中的表達量,對于研究糖代謝與板栗花發(fā)育和產(chǎn)量形成具有重要意義。本研究利用北京市林業(yè)果樹科學研究院板栗研究室的前期研究中板栗不同時期混合花芽轉(zhuǎn)錄組數(shù)據(jù),對板栗STP家族基因表達量進行分析。其取樣方法如下:以北京市密云縣板栗標準化栽培示范園10年生板栗優(yōu)系‘YH-1’為材料,在春季萌動后,分別于2017年3月9日,2017年3月16日,2017年3月30日,2017年4月7日和2017年4月13日,取混合芽,進行轉(zhuǎn)錄組測序。設置3個生物學重復,每重復1株板栗。利用百邁客云平臺(http://www.biocloud.net/)從5個發(fā)育時期的RNASeq數(shù)據(jù)中提取CmSTP家族成員的表達量,并利用HemI1.0軟件繪制表達模式熱圖。
利用HMM3.0軟件,在板栗基因組數(shù)據(jù)庫中共搜索到17個STP家族成員(表1)。依據(jù)各基因在染色體上的位置信息,依次命名為CmSTP1~CmSTP17。CmSTP開放閱讀框長度范圍為843~1584 bp,其中CmSTP14開放閱讀框最短,為843 bp,CmSTP6開放閱讀框最長,為1584 bp。CmSTP蛋白分子量相對較大,介于32 122.5~57 788.3 kDa,等電點介于5.46(CmSTP3)~10.46(CmSTP17),其中只有CmSTP3蛋白偏酸性,其余CmSTP成員蛋白均呈堿性或弱堿性。
表1 板栗CmSTP基因家族信息
2.2.1 板栗STP基因結(jié)構(gòu)分析 在鑒定得到的17個CmSTP基因中,只有CmSTP17沒有內(nèi)含子(圖1)。其余CmSTP基因中內(nèi)含子數(shù)量介于1~4個。其中CmSTP14有1個內(nèi)含子,CmSTP8、CmSTP9、CmSTP12均有2個內(nèi)含子,CmSTP3內(nèi)含子數(shù)量最多,為4個。CmSTP13、CmSTP6、CmSTP15和CmSTP8內(nèi)含子的長度明顯長于其它CmSTP基因。
圖1 板栗STP家族基因結(jié)構(gòu)Fig.1 The structure of STP gene family in Chinese chestnut
2.2.2 板栗STP蛋白保守基序分析 使用MEME軟件分析了CmSTP蛋白序列,共鑒定到10個保守基序:Motif1~Motif10(圖2)。將得到的Motif序列在Pfam網(wǎng)站注釋,結(jié)果顯示除Motif5沒有得到注釋信息外,其余Motif均為Sugar_tr家族(PF00083)結(jié)構(gòu)域(表2)。17個CmSTP蛋白保守基序數(shù)量和類型不同。CmSTP14、CmSTP3和CmSTP17保守基序數(shù)量較少,分別只有5、6、7個Motif。CmSTP2、CmSTP8和CmSTP12均有9個Motif。在所有保守基序中,只有Motif1、Motif3和Motif5同時存在于17個CmSTP蛋白中。
表2 板栗STP蛋白保守基序注釋
圖2 板栗STP蛋白保守基序分布Fig.2 The prediction of conserved motifs in Chinese chestnut STP proteins
2.2.3 板栗STP蛋白二級結(jié)構(gòu)分析 利用在線二級結(jié)構(gòu)預測軟件SOPMA對板栗STP家族蛋白的二級結(jié)構(gòu)進行分析(表3)。17個板栗STP蛋白二級結(jié)構(gòu)均包含α-螺旋、延伸主鏈、無規(guī)則卷曲和β-轉(zhuǎn)角。其中α-螺旋比例最高,介于46.00 %~52.95 %,其次為無規(guī)則卷曲26.68 %~31.52 %,再者為延伸主鏈14.59 %~19.38 %,最低的是β-轉(zhuǎn)角3.44 %~5.86 %。
表3 板栗STP家族蛋白二級結(jié)構(gòu)基本特征
2.2.4 板栗STP蛋白跨膜結(jié)構(gòu)域及亞細胞定位預測 使用TMHMM在線工具預測板栗STP蛋白跨膜結(jié)構(gòu)域(表4)。CmSTP1, CmSTP4-7,CmSTP9, CmSTP13跨膜結(jié)構(gòu)域數(shù)量最多,為12個;CmSTP3, CmSTP14, CmSTP17的跨膜結(jié)構(gòu)域較少,分別為5,6和8個。進一步對CmSTP蛋白N端和C端跨膜結(jié)構(gòu)域進行統(tǒng)計,發(fā)現(xiàn)C端跨膜蛋白的數(shù)量較N端穩(wěn)定。在C端,CmSTP3和CmSTP14的有2個跨膜結(jié)構(gòu)域,CmSTP10和CmSTP16有5個跨膜結(jié)構(gòu)域,其余13個CmSTP均有6個跨膜結(jié)構(gòu)域。亞細胞定位預測結(jié)果顯示,所有CmSTP均定位于細胞膜(表4)。
表4 板栗STP蛋白跨膜結(jié)構(gòu)域及亞細胞定位信息
利用17個板栗(Castaneamollissima)STP家族成員、20個木薯(Manihotesculenta)STP家族成員和14個擬南芥(Arabidopsisthaliana)STP家族成員的蛋白序列構(gòu)建系統(tǒng)發(fā)育樹(表5)。52個STP蛋白聚為4個類群(Group I~Group IV,圖3)。類群I和類群II中以木薯STP蛋白為主,且均只包含2個CmSTP蛋白(Group I: CmSTP5和CmSTP6;Group II: CmSTP12和CmSTP15)。Group III的STP成員最多(19個),以板栗STP成員為主(8個),其次為擬南芥(6個),木薯最少(5個)。類群IV中STP數(shù)量較少(9個),其中板栗STP成員為5個,木薯STP成員為3個,擬南芥STP成員為2個。從整體來看,不同物種STP成員在類群中的分布具有差別。板栗STP家族成員主要分布在類群III和IV中,木薯STP家族成員主要分布在類群I,II和III中,而擬南芥STP家族成員主要分布在類群III和IV中。
表5 木薯和擬南芥CmSTP蛋白名稱及對應的基因登錄號
圖3 板栗(★)、木薯(●)和擬南芥(▲)STP蛋白系統(tǒng)進化樹Fig.3 The phylogenetic tree of STP proteins from Chinese chestnut (★), Manihot esculenta (●) and Arabidopsis thaliana(▲)
對不同時期(S1:2017年3月9日,S2:2017年3月16日,S3:2017年3月30日,S4:2017年4月7日,S5:2017年4月13日)板栗混合芽轉(zhuǎn)錄組數(shù)據(jù)中CmSTP基因的表達量進行分析(圖4),未檢測到CmSTP1,CmSTP3,CmSTP9,CmSTP11,CmSTP14和CmSTP17表達數(shù)據(jù),說明該6個基因可能在混合芽中不表達。其余CmSTP基因中CmSTP6,CmSTP12和CmSTP15的表達量相對較高,并且高表達主要發(fā)生在混合芽發(fā)育的早期(S1,S2)。在S3期三者的表達量急劇降低,隨后維持在較低水平。CmSTP6的高表達由S1期持續(xù)到S2期,并且略有上升。而CmSTP12和CmSTP15的高表達主要發(fā)生在S1期,隨后其表達量逐漸降低。雖然CmSTP2,CmST8和CmSTP13的表達量相對較低,但與CmSTP6,CmSTP12和CmSTP15的表達量變化趨勢一致。
S1,2017年3月9日;S2,2017年3月16日;S3,2017年3月30日;S4,2017年4月7日;S5,2017年4月13日;S1, March 9, 2017; S2, March 16, 2017; S3, March 30, 2017; S4, April 7, 2017; S5, April 13, 2017
在板栗基因組數(shù)據(jù)中共鑒定到17個STP家族成員,與擬南芥(Arabidopsisthaliana, 14個)[16]、番茄(Solanumlycopersicum, 18個)[26]、木薯(Manihotesculenta, 20個)[11]中STP的數(shù)量相近。板栗中14個CmSTP蛋白氨基酸長度介于463~528(表1),與其它物種的STP蛋白相近[11, 16, 26]。CmSTP3、CmSTP14和CmSTP17的氨基酸序列明顯短于其它CmSTP(表1),但其C端均有保守的Sugar_tr家族(PF00083)結(jié)構(gòu)域基序Motif1和Motif3(圖2)。注釋到的其它6個Sugar_tr家族結(jié)構(gòu)域基序在N端和C端均有分布,但在CmSTP成員中存在不同程度的丟失,這與番茄[26]、甘藍[25]等物種上的研究結(jié)果一致。
17個CmSTP的亞細胞定位預測均位于細胞膜,符合STP蛋白從細胞外將單糖轉(zhuǎn)運到庫細胞的功能[27-28]。但各CmSTP蛋白跨膜結(jié)構(gòu)域的數(shù)量不盡相同。板栗中含12個跨膜結(jié)構(gòu)域的STP蛋白最多,有7個,占總CmSTP數(shù)量的41.2 %。其余CmSTP蛋白均有不同程度缺失,其中N端跨膜結(jié)構(gòu)域的缺失較為嚴重與木薯中的研究一致[11]。在其它物種上的研究推測,N端保守結(jié)構(gòu)域的丟失可能是STP進化的標志[24-25, 29]。這可能是CmSTP中最保守的Motif1和Motif3均位于C端的原因(圖2)。最近對擬南芥AtSTP13的研究證明,C端基序是STP蛋白細胞膜定位的核心結(jié)構(gòu)域[24]。上述結(jié)果暗示,Motif1和Motif3可能是STP家族的核心結(jié)構(gòu)域,在STP的細胞膜定位中發(fā)揮著關(guān)鍵作用。根據(jù)進化關(guān)系,板栗(Castaneamollissima)、木薯(Manihotesculenta)和擬南芥(Arabidopsisthaliana)的STP家族成員均可分成4組(圖3)。禾本科植物中STP也有相似的分類[29],說明不同物種的STP在進化上具有相似性。
板栗轉(zhuǎn)錄組數(shù)據(jù)分析結(jié)果顯示,混合芽中CmSTP6、CmSTP12和CmSTP15表達較高,CmSTP2和CmSTP8次之,其他CmSTP表達量較低或不表達(圖4)。并且CmSTP6、CmSTP12、CmSTP15、CmSTP2和CmSTP8均在混合芽春季萌動期高表達,隨后逐漸降低,具有時空特異性(圖4)。STP基因的表達能夠調(diào)控碳水化合物代謝[6, 30-31]。在植物中,通??蓪⒔M織的發(fā)育過程分為生理分化期和形態(tài)分化期。在早春,混合芽雖然未進行形態(tài)分化,但其內(nèi)部的生理生化進程已經(jīng)比較活躍,此時的混合芽處于生理分化期。CmSTP6、CmSTP12和CmSTP15在早春的高表達,暗示三者可能負責將樹體中貯藏的糖運輸?shù)窖恐?,為新生組織的分化和發(fā)育提供能量和結(jié)構(gòu)物質(zhì)。值得注意的是CmSTP6的高表達持續(xù)到S2期,該時期是本研究材料 ‘YH-1’響應修剪、促進結(jié)果枝形成的臨界時期。在擬南芥中,與CmSTP6同源關(guān)系較近的AtSTP13與碳、氮代謝有關(guān)。AtSTP13能與AtCWIN1蛋白協(xié)同作用,將質(zhì)外體的蔗糖分解成葡萄糖和果糖,并以sugar/H+共運輸?shù)男问娇缒み\輸?shù)郊毎麅?nèi)[31]。在擬南芥中過表達AtSTP13可提高植株氮素利用率,促進植株生長[19]。而蒿柳(Salixviminalis)中的研究表明,碳水化合物的代謝有利于雌花的分化[32]。蘋果中,扭捎可以增加尾梢的碳氮比,促進花芽形成,提高花芽比例[33]。上述結(jié)果暗示CmSTP6可能通過調(diào)控混合芽的碳氮比,參與板栗混合芽的早期發(fā)育,但其具體機制仍需進一步研究。STP的生物學功能具有多樣性,本研究提供了板栗STP家族基本信息,為后續(xù)CmSTP家族成員的功能驗證提供了參考。
本研究在板栗基因組數(shù)據(jù)庫中共篩選到17個STP家族成員。保守結(jié)構(gòu)域分析表明,板栗STP家族成員中共有10個保守motif,其中Motif1,Motif3和Motif5保守程度最高,存在于所有板栗STP蛋白中,其余motif在板栗STP家族進化過程中存在不同程度的丟失。進化分析結(jié)果顯示,板栗與擬南芥、木薯的STP家族均可分為4類,板栗STP家族成員主要分布在Group III和Group IV中。板栗STP基因表達分析結(jié)果顯示,CmSTP6、CmSTP12和CmSTP15在混合芽萌動早期的表達量較高,而其它成員表達量較低或不表達,說明STP家族基因的表達可能具有組織特異性,參與不同的生物學進程。