王 敬 王 鵬 王 暉 楊貴明 周 玲*
(1.承德醫(yī)學(xué)院蠶業(yè)研究所/河北省高校特產(chǎn)蠶桑技術(shù)應(yīng)用研發(fā)中心,河北承德 067000; 2.承德應(yīng)用技術(shù)職業(yè)學(xué)院,河北承德 067000)
psbA基因存在于桑屬植物的葉綠體,堿基序列位于葉綠體外顯子全部堿基序列中的第333—1 394位,全長(zhǎng)1 062 bp。高等植物的葉綠體基因在遺傳中為母系遺傳,序列具有極高度的保守性[1]。這使其在植物的進(jìn)化過(guò)程中變異率低,因此,psbA成為研究植物進(jìn)化過(guò)程的重要標(biāo)記基因之一[2]。郭亮亮對(duì)桑屬植物葉綠體psbA基因序列和進(jìn)化進(jìn)行分析[3],林琳對(duì)29種桃金娘目植物psbA基因進(jìn)行密碼子偏好及聚類(lèi)分析[4],發(fā)現(xiàn)結(jié)合RSCU的值和CDS序列的聚類(lèi)分析可更好地對(duì)物種進(jìn)行高精度的分類(lèi),獲得psbA基因的進(jìn)化的內(nèi)在規(guī)律。當(dāng)下,尚無(wú)對(duì)桑樹(shù)psbA基因進(jìn)行生物信息學(xué)分析的報(bào)道,本研究擬對(duì)其氨基酸序列的基礎(chǔ)生物信息學(xué)進(jìn)行分析及預(yù)測(cè),為基于psbA基因研究植物的分類(lèi)提供理論基礎(chǔ)。
psbA基因(登錄號(hào):NC_008359.1,333-1394),其氨基酸序列(登錄號(hào):YP_762241.1)。使用開(kāi)放閱讀框OFR Finder(https://www.ncbi.nlm.nih.gov/orffinder/)對(duì)桑樹(shù)psbA基因進(jìn)行分析;對(duì)桑樹(shù)氨基酸psbA序列的理化性質(zhì)使用Prot Param(https://www.expasy.org/resources/protparam)推斷;用Prot Scale(https://web.expasy.org/protscale/)對(duì)其氨基酸序列的疏水性/親水性預(yù)測(cè);使用SignalP-5.0(https://services.healthtech.dtu.dk/service.php?SignalP-5.0)對(duì)其氨基酸序列信號(hào)肽分析;TMHMM Server.v.2.0(https://services.healthtech.dtu.dk/service.php?TMHMM-2.0)分析氨基酸序列的跨膜結(jié)構(gòu)域;PBIL(https://npsa-pbil.ibcp.fr/)分析氨基酸序列的二級(jí)結(jié)構(gòu);通過(guò)使用PredictProtein(https://predictprotein.org/)對(duì)其進(jìn)行亞細(xì)胞定位、聚類(lèi)分析、靶位點(diǎn)預(yù)測(cè),并使用構(gòu)建同源樹(shù)的DNAman對(duì)桑、白果樹(shù)、箭毒木、榕樹(shù)、騰構(gòu)等11個(gè)物種進(jìn)行同源樹(shù)構(gòu)建。
DNA序列中所具備編碼蛋白質(zhì)潛質(zhì)的序列被稱(chēng)為開(kāi)放閱讀框。用OFR Finder在線(xiàn)軟件對(duì)其基因序列分析得出(圖1)psbA基因有7條開(kāi)放閱讀框,這7條開(kāi)放閱讀框的長(zhǎng)度依次為:1 062 bp、87 bp、90 bp、123 bp、129 bp、111 bp和84 bp;psbA基因的起始密碼子及終止密碼子的位置依次為:1 bp處、182 bp處、93 bp處、1 011 bp處、756 bp處、869 bp處、575 bp處及1 062 bp處、268 bp處、182 bp處、889 bp處、628 bp處、759 bp處和492 bp處;所翻譯的氨基酸數(shù)目依次是353個(gè)、28個(gè)、29個(gè)、40個(gè)、42個(gè)、36個(gè)和27個(gè)。
圖1 psbA基因的開(kāi)放閱讀框特征
經(jīng)Prot Param在線(xiàn)軟件分析得出,psbA序列由353個(gè)氨基酸構(gòu)成,根據(jù)其所含元素的數(shù)量推算其分子式C1789H2676N456O492S14,分子量38892.53,等電點(diǎn)為5.21,由于其不穩(wěn)定指數(shù)為34.66(34.66<40),因此屬穩(wěn)定蛋白。N末端為甲硫氨酸。其所含的氨基酸中,甘氨酸(Gly)占比最高為9.6%,其次為亮氨酸(Leu)、異亮氨酸(Ile)、絲氨酸(Ser),谷氨酰胺(Gln)含量最少(圖2)。
圖2 psbA基因各氨基酸的種類(lèi)及含量推斷
經(jīng)軟件Prot Scale分析得出(圖3),由圖可看出負(fù)值峰少于正值峰,表現(xiàn)為疏水性。
圖3 psbA氨基酸序列的疏水性/親水性預(yù)測(cè)
經(jīng)軟件SignalP-5.0預(yù)測(cè)得出圖4。由圖4可看出信號(hào)肽存在的幾率為0.002 1,趨近于0,不存在信號(hào)肽,可推斷為非分泌蛋白。
圖4 桑樹(shù)psbA氨基酸序列的信號(hào)肽分析
經(jīng)TMHMM Server.v.2.0分析得出膜內(nèi)區(qū)域的概率趨近于0%,膜外的概率接近于100%,不存在跨膜結(jié)構(gòu)域(圖5)。
表示為跨膜區(qū)域;表示為膜內(nèi)區(qū)域;表示膜外區(qū)域圖5 桑樹(shù)psbA氨基酸序列跨膜結(jié)構(gòu)域的推測(cè)
經(jīng)PBIL分析的結(jié)果顯示,氨基酸序列的組成中包括:12.75%的延伸鏈、58.64%的無(wú)規(guī)則卷曲和28.61%螺旋(圖6)。
圖6 psbA氨基酸序列二級(jí)結(jié)構(gòu)的預(yù)判
經(jīng)PredictProtein分析得出:psbA氨基酸序列存在真核生物細(xì)胞的葉綠體中,與當(dāng)前文獻(xiàn)的查詢(xún)結(jié)果相同。蛋白結(jié)合位點(diǎn)為13個(gè),依次位于:59-64、129-134、188-192、193-193、194-197、251-251、253-253、267-270、297-302、317-321、323-324、327-327、329-340位(圖7)。
圖7 psbA氨基酸序列二級(jí)結(jié)構(gòu)的預(yù)判
psbA氨基酸序列的GO功能注釋包括細(xì)胞組分、生物學(xué)進(jìn)程、分子功能。細(xì)胞組成包括膜的整體組成、葉綠體類(lèi)囊體膜、類(lèi)囊體、葉綠體、光系統(tǒng)II;生物學(xué)進(jìn)程有光合作用、蛋白質(zhì)-發(fā)色團(tuán)連鎖、對(duì)除草劑反應(yīng)、光合電子傳輸系統(tǒng)II;分子功能包括輔酶綁定、鐵離子結(jié)合、氧化還原酶活性、陰離子結(jié)合和電子傳送器(圖8)。
圖8 psbA氨基酸序列GO功能
經(jīng)使用軟件DNAMAN對(duì)桑、白果樹(shù)、箭毒木等共11個(gè)物種構(gòu)建同源樹(shù),(圖9)所示。桑與其余10個(gè)物種的psbA氨基酸序列相似度極高,其最低相似度是98%,說(shuō)明psbA氨基酸序列保守性極高。
圖9 11個(gè)物種psbA氨基酸序列同源樹(shù)
psbA作為葉綠體中的關(guān)鍵調(diào)控基因,在光合作用中起傳遞電子到編碼光合系統(tǒng) II 反應(yīng)蛋白的作用[5]。高等植物葉綠體psbA基因的啟動(dòng)子作為葉綠體基因工程中常用的啟動(dòng)子[6],經(jīng)常用于分子發(fā)育關(guān)系的比較[7]。由于葉綠體基因?yàn)槟赶颠z傳,變異程度低,常被運(yùn)用于物種的發(fā)育及進(jìn)化領(lǐng)域研究[8]。
通過(guò)利用生物信息學(xué)對(duì)桑樹(shù)psbA基因進(jìn)行預(yù)測(cè),psbA基因存在于真核生物細(xì)胞的葉綠體中,和侯世昌[9]等人的研究相同。psbA基因存在7條開(kāi)放閱讀框,含有353個(gè)氨基酸。氨基酸序列具有疏水性,無(wú)信號(hào)肽。psbA的結(jié)構(gòu)以無(wú)規(guī)則卷曲為主要方式。GO功能分為三類(lèi),序列分布有13個(gè)蛋白結(jié)合位點(diǎn)。桑與白果樹(shù)、箭毒木等11個(gè)物種的psbA氨基酸序列具有極高的同源性,說(shuō)明psbA在生物進(jìn)化中保守性極高。本文使用生物信息學(xué)手段對(duì)桑樹(shù)psbA基因進(jìn)行預(yù)測(cè)分析,與常見(jiàn)的對(duì)于桑屬植物的分類(lèi)研究方式略有不同。對(duì)于桑屬植物的分類(lèi)研究還有更多的方法,本文僅對(duì)psbA基因進(jìn)行了初步的生物信息學(xué)分析,對(duì)于psbA基因功能的探索還需要進(jìn)一步進(jìn)行實(shí)驗(yàn)研究。