徐煲鏵 劉瑞彬 余紹東 張應(yīng)中
摘要通過EST序列電子克隆技術(shù),獲得參與茶樹光合作用的SBPase基因的eDNA拼接序列,對序列進(jìn)行了生物信息學(xué)分析和功能預(yù)測,構(gòu)建了系統(tǒng)進(jìn)化樹。本研究結(jié)果可為今后開展山茶屬植物光合基因的功能研究奠定重要基礎(chǔ)。
關(guān)鍵詞 茶樹;SBPase基因;生物信息學(xué)
中圖分類號 S571.1
文獻(xiàn)標(biāo)識碼 A
文章編號 1007-5739(2019)07-0017-03
茶樹(Camellia?sinensis)屬山茶科山茶屬,為多年生常綠木本植物。葉子呈橢圓形,邊緣有鋸齒,葉間開五瓣白花;果實扁圓,呈三角形,果實開裂后露出種子。春、秋2季可采摘茶樹嫩葉制茶。
目前對主要經(jīng)濟(jì)作物和糧食作物的光合作用研究較多,對茶樹光合作用的研究相對較少,且研究主要集中在影響茶樹光合作用的生理生態(tài)因素及茶樹品種、樹齡.葉位及冠層間光合特性比較等方面",與光合作用相關(guān)的分子生物學(xué)研究,例如酶的基因序列和蛋白質(zhì)結(jié)構(gòu)等分子水平上的研究就更少。
光合生物固定CO2的限速步主要集中在暗反應(yīng),而其中的Calvin循環(huán)(也稱C3循環(huán))是所有光合生物碳素光合流動過程的中心環(huán)節(jié)。SBPase基因的表達(dá)產(chǎn)物為景天庚酮糖-1,7-二磷酸酶(sedoheptulose-bisphosphatase,SBPase)。該酶是卡爾文循環(huán)過程中的關(guān)鍵酶,不可逆地催化景天庚酮糖-1,7-二磷酸去磷酸化,生成景天庚酮糖-7-磷酸。景天庚酮糖-7-磷酸經(jīng)過一系列酶促反應(yīng)轉(zhuǎn)變?yōu)镃O2的受體核酮糖-1,5-二磷酸。因此,SBPase是植物光合作用途徑的主要限速酶之一(231。
電子克?。╥n?silico?cloning)是近幾年伴隨著基因組計劃和表達(dá)序列標(biāo)簽EST(expressed?sequence?tag)計劃發(fā)展起來的基因克隆新方法。但是數(shù)據(jù)庫中的EST數(shù)據(jù)最高精確度為97%1。許多植物物種的ESTs數(shù)據(jù)庫還沒有建立起來,實現(xiàn)全長cDNA的電子克隆還有一定的難度。
1材料與方法
1.1生物信息學(xué)數(shù)據(jù)庫
本研究使用的數(shù)據(jù)庫為美國生物技術(shù)信息中心(NCBI:http://www.ncbi.nlm.nih.gov)。
1.2分析工具
基本BLAST檢索:ttp://www.ncbi.nlm.nih.gov/blast;開放閱讀框分析:http:/www.ncbinm.ih.gvgorflorfig.gi;氨基酸序列翻譯:http://web.expasyorg/translate/;
酶切圖譜分析:http://ools.neb.com/NEBeutter2/;亞細(xì)胞定位分析:http://www.genscript.com/wolf-psorthtml;蛋白質(zhì)序列理化性質(zhì)分析:http://web.expasy.org/protparam/;
跨膜區(qū)域分析:http://www.cbs.dtu.dk/services/TMHMM/;蛋白質(zhì)卷曲螺旋分析:http://embnet.vital-it.ch/software/COILS_form.html;
信號肽分析工具:http://www.cbs.dtu.dk/service/SignalP-3.0/;
蛋白質(zhì)三級結(jié)構(gòu)預(yù)測:Swiss-Model:http:/wissmodel.expasy.org/;
蛋白質(zhì)二級結(jié)構(gòu)預(yù)測:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html。
1.3生物信息學(xué)分析軟件
本研究使用的生物信息學(xué)分析軟件主要包括BIOEDIT、MEGACLUSTALX等。
1.4電子克隆
在NCBI數(shù)據(jù)庫中分別以擬南芥光合作用酶SBPase的氨基酸序列作為探針序列,采用tBLASTn程序在茶樹EST數(shù)據(jù)庫中進(jìn)行比對,獲得與探針序列相似性較高的EST序列,然后進(jìn)行序列裝配,得到重疊群contig。再將裝配結(jié)果在NCBI的茶樹EST數(shù)據(jù)庫中進(jìn)行反復(fù)檢索與裝配,直到?jīng)]有發(fā)現(xiàn)更多的EST序列出現(xiàn)后,停止裝配,通過結(jié)構(gòu)分析,最終得到完整的茶樹SBPase基因電子克隆eDNA序列。
1.5生物信息學(xué)分析
運(yùn)用BIOEDIT軟件分析基因序列的組成和特征。運(yùn)用NCBI在線ORF分析工具ORFFinder分析序列的開放閱讀框。運(yùn)用EXPASY網(wǎng)站translatetools工具將待查詢的基因序列的編碼區(qū)翻譯成氨基酸序列,然后對其進(jìn)行結(jié)構(gòu)和功能預(yù)測。運(yùn)用在線的NEBecutterV2.0工具對基因序列進(jìn)行酶切圖譜分析。
將待測的氨基酸序列提交至Expasy數(shù)據(jù)庫中的ProtParam工具中,得到序列的氨基酸分子式、半衰期、不穩(wěn)定性指數(shù)等值。利用BIOEDIT軟件,對編碼蛋白質(zhì)的氨基酸組成特點和分子量進(jìn)行分析和疏水性預(yù)測。運(yùn)用Expasy中的TMHMMServerV.2.0程序?qū)Φ鞍走M(jìn)行跨膜結(jié)構(gòu)預(yù)測。數(shù)值≤0.5表示該區(qū)域為跨膜區(qū)域的可能性很小,數(shù)值>0.5表示該區(qū)域為跨膜區(qū)域的可能性較大。
本研究采用SOMPA算法對編碼蛋白質(zhì)的二級結(jié)構(gòu)進(jìn)行了預(yù)測。將待測的氨基酸序列提交至在線的COILS?Server服務(wù)器中,分析蛋白質(zhì)卷曲螺旋。運(yùn)用在線的服務(wù)器SignalP?3.0?Server對蛋白質(zhì)序列進(jìn)行信號肽分析。將序列提交到在線服務(wù)器SWISS-MODEL進(jìn)行蛋白質(zhì)的三級結(jié)構(gòu)預(yù)測。本研究使用NetPhos3.1軟件進(jìn)行serine、threonine和tyrosine磷酸化位點預(yù)測。運(yùn)用在線服務(wù)器WoLFPSORT,進(jìn)行蛋白質(zhì)的亞細(xì)胞定位分析。
運(yùn)用NCBI上的BLAST檢索工具搜索序列的同源性序列,將具有較高同源性的序列用ClustalX程序進(jìn)行序列比對。再將比對結(jié)果,使用Mega程序構(gòu)建系統(tǒng)進(jìn)化樹。
2結(jié)果與分析
2.1茶樹SBPase基因cDNA序列及編碼氨基酸序列
通過數(shù)據(jù)庫檢索與裝配,得到茶樹SBPase基因的eDNA電子克隆序列(圖1)。序列分析結(jié)果顯示,SBPase基因全長為1621bp,132~1301為該基因的編碼區(qū),編碼框長度為1170bp,共編碼389個氨基酸。ATG為起始密碼子,TAA為終止密碼子(圖2)。
2.2翻譯后修飾位點預(yù)測及信號肽與跨膜結(jié)構(gòu)分析
翻譯,后修飾位點預(yù)測結(jié)果顯示,SBPase蛋白磷酸化位點共有48個,其中Ser磷酸化位點有32個、Thr磷酸化位點有12個,Tyr磷酸化位點有4個。Ser磷酸化位點分別位于19、24、272930、32、3436、37、3942、44、49、57、61、66、67、77、106、110、120、148、166、176、255、308、310、311.336、341、360、376.Thr磷酸化位點分別位于23、63、7086、186、197、216、217、281.307、354371。Tyr磷酸化位點分別位于268、280、334、372。
蛋白信號肽分析結(jié)果顯示,由神經(jīng)網(wǎng)絡(luò)模型分析得出的C(0.370)、Y(0.200)、S(0.636)值可知SBPase編碼蛋白的Y、C值不太高,信號肽曲線不典型,表明該蛋白質(zhì)沒有信號肽。同時,隱馬爾夫模型分析結(jié)果也進(jìn)一步證明了該結(jié)論??缒そY(jié)構(gòu)分析結(jié)果顯示,SBPase跨膜區(qū)域存在的可能性較小,預(yù)測SBPase蛋白不存在跨膜區(qū)域,屬于非跨膜蛋白。2.3蛋白質(zhì)二級與三級結(jié)構(gòu)預(yù)測
本研究運(yùn)用了SOMPA算法對蛋白二級結(jié)構(gòu)進(jìn)行了預(yù)測,結(jié)果如表1所示。
將蛋白序列提交到SWISS-MODEL,得到蛋白質(zhì)的三維預(yù)測結(jié)構(gòu)模型(圖3)。其中,深紅色表示為a螺旋,黃色表示為β折疊,淡藍(lán)色表示為轉(zhuǎn)角,其他殘基為白色。得到的結(jié)果與二級結(jié)構(gòu)預(yù)測基本吻合。蛋白質(zhì)卷曲螺旋分析顯示,沒有較明顯的卷曲螺旋結(jié)構(gòu),45~70、100~110等處有不太明顯的卷曲螺旋結(jié)構(gòu)。
2.4編碼蛋白質(zhì)的理化性質(zhì)分析與亞細(xì)胞定位
SBPase基因編碼的蛋白質(zhì)分子式為Cr121299N4g9OsS17,原子總數(shù)為5959,分子量為42227.40,不穩(wěn)定性指數(shù)為34.83,為穩(wěn)定性蛋白,主要氨基酸殘基數(shù)為Ser40、Leu38、Gly35,堿性氨基酸殘基數(shù)為43,酸性氨基酸殘基數(shù)為44;等電點為6.55,平均疏水性為-0.085。
利用BIOEDIT軟件對基因編碼的蛋白質(zhì)理化性質(zhì)進(jìn)行分析,根據(jù)負(fù)值越大表示蛋白親水性越強(qiáng)、正值越大表示蛋白疏水性越強(qiáng)、介于-0.5~0.5的主要為兩性氨基酸的規(guī)律問,預(yù)測結(jié)果(圖4)為SBPase酶的最高值為1.7,位于第322位,表示疏水性最強(qiáng);最低值-1.8出現(xiàn)在第358位,親水性最強(qiáng)。結(jié)合ProtPram預(yù)測結(jié)果,可推測茶樹SBPase酶為親水性蛋白。
根據(jù)亞細(xì)胞定位分析結(jié)果,預(yù)測SBPase蛋白分布在葉綠體內(nèi)。
2.5系統(tǒng)進(jìn)化分析
將SBPase氨基酸序列提交到數(shù)據(jù)庫中,構(gòu)建系統(tǒng)進(jìn)化樹(圖5),可以看到有多條氨基酸序列與SBPase氨基酸序列有較高的相似性,其中茶樹SBPase氨基酸序列與番茄(Solanum?lycopersicum)、毛果楊(Populus?trichocarpa)、可可(Theobroma?cacao)、長蒴黃麻(Corchorus?olitorius,')、煙草(Nicotianatabacum)相似性較高,分別為82%、80%、82%、82%、81%。經(jīng)比對發(fā)現(xiàn),SBPase蛋白屬于FIG家族,具有1個典型的PLN02462保守結(jié)構(gòu)域。
3結(jié)論與討論
通過EST序列電子拼接技術(shù),獲得茶樹SBPase基因cDNA序列,序列全長為1681bp,開放閱讀框長度為1170bp,可編碼389個氨基酸,理論分子量為42227.40,平均疏水性為-0.085,預(yù)測等電點為6.55,不穩(wěn)定性指數(shù)為34.83。SBPase為穩(wěn)定性蛋白,在細(xì)胞內(nèi)有較好的穩(wěn)定性,能參與植物的光合作用。從蛋白質(zhì)跨膜結(jié)構(gòu)分析上看,SBPase蛋白不含有明顯的跨膜區(qū),屬于非跨膜蛋白。SBPase蛋白的二級結(jié)構(gòu)主要由螺旋、折疊和線圈構(gòu)成,卷曲占少量比例,屬于mixed型。SWISS-MODEL預(yù)測的三級結(jié)構(gòu)主要由螺旋、折疊和線圈構(gòu)成,卷曲占少量比例。由蛋白質(zhì)信號肽分析可知,SBPase蛋白信號肽曲線不典型,所以推測該蛋白沒有明顯的信號肽。該蛋白不是分泌蛋白,只在細(xì)胞內(nèi)參與反應(yīng)。結(jié)果顯示,茶樹SBPase酶在系統(tǒng)進(jìn)化上與煙草SBPase酶關(guān)系較近。
劉遜亮發(fā)現(xiàn),SBPase蛋白的結(jié)構(gòu)變化可以抑制植物的光合碳同化效率,進(jìn)而影響植物的生長發(fā)育葉綠體生成和結(jié)實率。轉(zhuǎn)基因結(jié)果顯示,超表達(dá)楊樹SBPase基因,可以促進(jìn)擬南芥碳水化合物的積累,利于RuBP的形成和淀粉等多糖的合成,增強(qiáng)植物的光合作用8。開展茶樹SBPase基因的電子克隆與生物信息學(xué)分析,可以為山茶屬植物相關(guān)光合作用基因的克隆及結(jié)構(gòu)與功能研究提供支撐。
4參考文獻(xiàn)
[1]孫君,朱留剛,林志坤,等.茶樹光合作用研究進(jìn)展[J].福建農(nóng)業(yè)學(xué)報,2015,30(12):1231-1237.
[2]冀憲領(lǐng),蓋英萍,馬建平,等.桑樹景天庚酮糖-1,7-二磷酸酶基因的
克隆原核表達(dá)與植物表達(dá)載體的構(gòu)建[J].林業(yè)科學(xué),2008,44(3):62-69.
[3]袁傳忠,韓雪娟,李軼群,等.桑樹景天庚酮糖-1,7-二磷酸酶基因的遺傳轉(zhuǎn)化及生物學(xué)功能分析[J].蠶業(yè)科學(xué),2013(3):413-419.
[4]何志穎,姚玉成.EST技術(shù)及其在基因全長eDNA克隆上的應(yīng)用策略[J].國際遺傳學(xué)雜志,2002,25(2):67-69.
[5]孫淼,趙茂林.利用表達(dá)序列標(biāo)簽電子克隆cDNA全序列的策略[J].生物技術(shù)通報,2010(1):49-52.
[6]張開雪,任偉超,閆嵩,等軟棗獼猴桃GDP-L半乳糖磷酸酶電子克隆與生物信息學(xué)分析[J].中國藥師,2016,19(11):2066-2069.
[7]劉遜亮.氧化脅迫下擬南芥卡爾文循環(huán)關(guān)鍵酶SBPase的羰基化修飾及其功能研究[D].北京:中國科學(xué)院大學(xué),2012.
[8]王俊秀,周揚(yáng)顏,韓瀟,等.超表達(dá)楊樹SBPase基因促進(jìn)擬南芥光合作用及營養(yǎng)生長[J].北京林業(yè)大學(xué)學(xué)報,2018(3):26-33.