◎ 賈一真,王久星,賈 峰,王金水
(1.鄭州市第十六中學(xué)高三(1)班,河南 鄭州 450000;2.河南工業(yè)大學(xué)生物工程學(xué)院,河南 鄭州 450000)
小麥?zhǔn)侵袊?guó)第二大口糧作物,為北方人民的生活主食,隨著人們生活水平的提高,人們不僅重視其產(chǎn)量,也開(kāi)始更加重視其內(nèi)在品質(zhì)[1-2]。小麥醇溶蛋白是面筋的主要組成成分之一,醇溶蛋白的相對(duì)分子質(zhì)量小,溶于乙醇溶液,能賦予面筋延展性,醇溶蛋白與麥谷蛋白相互作用會(huì)形成網(wǎng)狀結(jié)構(gòu),使面筋具有彈性等[3];醇溶蛋白也是影響面包烘烤[4-5]及饅頭品質(zhì)[6]的重要成分,醇溶蛋白的含量與質(zhì)量決定著面筋的延展性及品質(zhì)[7]。醇溶蛋白含量高的面粉適合做蛋糕和餅干等食品;醇溶蛋白可分為α、β、γ和ω4類,或者按照韋恩分類方法分為8類[7];醇溶蛋白的基因位于小麥的第1、6號(hào)染色體上,由于染色體會(huì)出現(xiàn)易位的現(xiàn)象,所以基因也會(huì)隨著染色體的移動(dòng)而移動(dòng),從而出現(xiàn)醇溶蛋白的遺傳多樣性[8-9]。
生物信息學(xué)是隨著基因組學(xué)和蛋白質(zhì)組學(xué)的不斷發(fā)展而產(chǎn)生的交叉性的新興學(xué)科[10],依賴計(jì)算機(jī)軟件和硬件的發(fā)展[11-12],應(yīng)用數(shù)學(xué)的相關(guān)思維,在“序列決定結(jié)構(gòu),結(jié)構(gòu)決定功能”這一重要理論的指導(dǎo)下[13],生物信息學(xué)研究?jī)?nèi)容主要是基因組學(xué)和蛋白質(zhì)組學(xué)的數(shù)據(jù)分析,通過(guò)對(duì)已知的生物學(xué)實(shí)驗(yàn)數(shù)據(jù)的一系列分析,解釋目標(biāo)數(shù)據(jù)所具有的生物學(xué)意義。
本文利用Protparam、Clustalw、MEME program3、PSIPRED version 3.3等軟件工具對(duì)小麥醇溶蛋白的理化性質(zhì)及結(jié)構(gòu)等進(jìn)行預(yù)測(cè)分析,可得到目標(biāo)蛋白的分子質(zhì)量、理論等電點(diǎn)、總平均親水性、不穩(wěn)定系數(shù)和脂肪系數(shù)等基本理化數(shù)據(jù),為蛋白質(zhì)的深入研究提供了一點(diǎn)借鑒。
從NCBI Protein數(shù)據(jù)庫(kù)將小麥醇溶蛋白序列的氨基酸數(shù)目在300 AA左右、且不同源的序列挑選出來(lái),從中隨機(jī)選擇α/β-醇溶蛋白3條序列、γ-醇溶蛋白3條序列和ω-醇溶蛋白4條序列,序列的格式采用FASTA格式。
利用ExPASy的Protparam與Protscale軟件預(yù)測(cè)醇溶蛋白的主要理化性質(zhì)及蛋白質(zhì)親水性/疏水性,具體步驟參考Flynn等方法[14]。
利用Clustalw軟件在線分析小麥醇溶蛋白多序列對(duì)比和系統(tǒng)進(jìn)化樹(shù)的構(gòu)建。從Launch Clustal Omega進(jìn)入界面,點(diǎn)擊“選擇文件”按鈕,選擇要比對(duì)的10條小麥醇溶蛋白的文本文檔FASTA格式,點(diǎn)擊最下方的“Submit”按鈕,會(huì)彈出序列比對(duì)圖,點(diǎn)擊上方的“Phylogenetic Tree”按鈕生成系統(tǒng)進(jìn)化樹(shù)。
利用MEME program3軟件(http://meme-suite.org/)在線分析小麥醇溶蛋白的類型和排列順序。在“Input the primary sequences”選擇“Type in sequences”將 10條小麥醇溶蛋白序列用FASTA格式輸入,motif數(shù)量設(shè)置為10,點(diǎn)擊“Start Search”開(kāi)始基序分析。
采用PSIPRED version 3.3軟件在線預(yù)測(cè)工具對(duì)小麥醇溶蛋白的二級(jí)結(jié)構(gòu)(α-螺旋和β-折疊)、域和折疊域識(shí)別進(jìn)行預(yù)測(cè)分析。
對(duì)10條小麥醇溶蛋白序列基本理化性質(zhì)的分析結(jié)果如表1所示。由表1可以看出,醇溶蛋白氨基酸長(zhǎng)度在279~328 AA,分子質(zhì)量在32.04~39.63 kU,理論等電點(diǎn)在6.04~8.91,其中,α/β和γ-醇溶蛋白的理論等電點(diǎn)大于7.00,為堿性蛋白質(zhì),而ω-醇溶蛋白的理論等電點(diǎn)小于7.00,為酸性蛋白質(zhì)。該10條醇溶蛋白的平均疏水指數(shù)均為負(fù)值,在-1.585~-0.595,表明都有一定的親水性,ω-醇溶蛋白的親水性最大,平均疏水指數(shù)是-1.433,α/β-醇溶蛋白的親水性次之,平均疏水指數(shù)是-0.802,γ-醇溶蛋白的親水性最小,平均疏水指數(shù)是-0.694。10條小麥醇溶蛋白的不穩(wěn)定系數(shù)均大于40,屬于不穩(wěn)定蛋白質(zhì),其中ω-醇溶蛋白的平均不穩(wěn)定系數(shù)最大,為155.03;其次是α/β-醇溶蛋白,平均不穩(wěn)定系數(shù)為110.80,最小是γ-醇溶蛋白的平均不穩(wěn)定系數(shù)為103.60。α/β-醇溶蛋白的脂肪系數(shù)平均為71.35,γ-醇溶蛋白的脂肪系數(shù)平均為67.20,ω-醇溶蛋白的脂肪系數(shù)平均為35.74。
表1 小麥醇溶蛋白的主要理化性質(zhì)分析表
對(duì)10條小麥醇溶蛋白的氨基酸序列分析結(jié)果如圖1所示。由圖1可以看出,醇溶蛋白氨基酸序列都含有保守位點(diǎn)脯氨酸P(Pro)和谷氨酰胺Q(Gln),除CAC94871.1、ACN62214.1和ATD83895.1之外,醇溶蛋白N端起始部分具有相似的氨基酸序列;小麥醇溶蛋白序列大致分為10個(gè)片段,同基序照應(yīng);“*”表示比對(duì)的位置全部相同,相同率分別為0.037、0.037、0.038、0.039、0.036、0.037、0.034、0.034、0.036 和0.038,表明醇溶蛋白的相似性非常低。
圖1 小麥醇溶蛋白序列比對(duì)圖
對(duì)10條小麥醇溶蛋白序列構(gòu)建系統(tǒng)進(jìn)化樹(shù)分析結(jié)果如圖2所示。由圖2可以看出,根據(jù)小麥醇溶蛋白同源關(guān)系,10條小麥醇溶蛋白序列被聚類在4個(gè)組,γ-醇溶蛋白AAA34272.1、ACX37115.1和CAC94871.1的分布比較遠(yuǎn),在Group1和Group2兩組內(nèi);說(shuō)明γ-醇溶蛋白同源性較遠(yuǎn);α/β-醇溶蛋白A27319、CAA10257.1和SCW25770.1的分布較近,在Group3組內(nèi),ω-醇溶蛋白 ACN62214.1、ATD83895.1、AGZ20254.1和AJG03093.1的分布較近,在Group4組內(nèi),說(shuō)明α/β-和ω-醇溶蛋白的同源性較近。
圖2 小麥醇溶蛋白的系統(tǒng)進(jìn)化樹(shù)圖
對(duì)10條小麥醇溶蛋白序列基序分析結(jié)果如圖3所示。由圖3可以看出,基序Motif 1是最明顯的基序,10條小麥醇溶蛋白序列中都含有,除AJG03093.1在末尾之外,其余均在序列中間部位;基序Motif 2的含量較多,除AJG03093.1和ACN62214.1序列在中部,剩余8條序列位于開(kāi)頭部分;10條醇溶蛋白序列都含有基序Motif 3,γ-醇溶蛋白(ACX37115.1、CAC94871.1和AAA34272.1) 和 α-醇 溶 蛋 白(SCW25770.1、CAA10257.1和A27319)在序列末尾,ω-醇溶蛋白(AJG03093.1、ACN62214.1、ATD83895.1和AGZ20254.1)在序列開(kāi)頭。10條醇溶蛋白序列都含有基序Motif 4,但相對(duì)位置不集中,α/β-醇溶蛋白在前部,CAC94871.1、CAA10257.1和A27319沒(méi)有重疊。醇溶蛋白的保守域結(jié)構(gòu)為Motif 1、Motif 2、Motif 3和Motif 4,可能在維持醇溶蛋白結(jié)構(gòu)和功能方面有重要作用。
圖3 小麥醇溶蛋白的基序分析圖
利用PSIPRED version 3.3軟件在線預(yù)測(cè)10條醇溶蛋白序列的二級(jí)結(jié)構(gòu)結(jié)果如圖4所示。圖4A為α/β-醇溶蛋白域結(jié)構(gòu)和折疊域結(jié)構(gòu)分析結(jié)果圖,在α/β-醇溶蛋白序列中,有淺色陰影的小方塊代表α-螺旋且位置和數(shù)量大致在相同的區(qū)域,表明其二級(jí)結(jié)構(gòu)的α-螺旋含量較多且螺旋位置相似度高;其折疊域結(jié)構(gòu)均為一高峰和一低峰,高峰在146左右,低峰在230左右,表明3條α/β-醇溶蛋白的空間結(jié)構(gòu)是相似的。圖4B為γ-醇溶蛋白域結(jié)構(gòu)和折疊域結(jié)構(gòu)分析結(jié)果圖,在γ-醇溶蛋白中有淺色陰影的小方塊的數(shù)量比α/β-醇溶蛋白的數(shù)量有所降低,且相對(duì)位置有所偏移,表明其二級(jí)結(jié)構(gòu)的α-螺旋含量較少;其折疊域結(jié)構(gòu)表現(xiàn)為單峰,峰高在140~160,表明3條γ-醇溶蛋白的空間結(jié)構(gòu)也是相似的。ω-醇溶蛋白域結(jié)構(gòu)和折疊域結(jié)構(gòu)分析結(jié)果如圖4C所示,在ω-醇溶蛋白中有淺色陰影的小方框的數(shù)量明顯減少,且位置均不相同,表明該蛋白中幾乎沒(méi)有α-螺旋的二級(jí)結(jié)構(gòu);該4條ω-醇溶蛋白的折疊域結(jié)構(gòu)呈現(xiàn)出M型峰,表明4條ω-醇溶蛋白的結(jié)構(gòu)相同但結(jié)構(gòu)混亂無(wú)序。
圖4 醇溶蛋白的域結(jié)構(gòu)和折疊域結(jié)構(gòu)圖
對(duì)10條氨基酸數(shù)目在300左右的醇溶蛋白分析結(jié)果表明:醇溶白質(zhì)的平均疏水指數(shù)均為負(fù)值,均為親水性蛋白質(zhì);醇溶蛋白的不穩(wěn)定系數(shù)均大于40,屬于不穩(wěn)定蛋白質(zhì);多序列比對(duì)分析均含有P(Pro)和Q(Gln)醇溶蛋白,且重復(fù)出現(xiàn)率較高;對(duì)10條麥醇溶蛋白序列系統(tǒng)進(jìn)化樹(shù)構(gòu)建可以看出α/β-和ω-醇溶蛋白的同源性較近,與γ-醇溶蛋白同源性較遠(yuǎn);醇溶蛋白均含有基序Motif 1、Motif 2、Motif 3和Motif 4,這些域結(jié)構(gòu)可能在維持麥醇溶蛋白結(jié)構(gòu)和功能方面有重要作用;醇溶蛋白的二級(jí)結(jié)構(gòu)由α-螺旋、β-折疊和無(wú)規(guī)則卷曲等結(jié)構(gòu)元件組成,α/β-和γ-醇溶蛋白中α-螺旋含量較多,且結(jié)構(gòu)有序,而ω-醇溶蛋白中α-螺旋含量較少,而結(jié)構(gòu)混亂無(wú)序。