劉洋
摘要:為提高信號肽以及識別信號肽拼接精度,在結(jié)構(gòu)融合度特征的基礎(chǔ)上,構(gòu)建氨基酸綜合替代矩陣和馬爾科夫轉(zhuǎn)移矩陣,對不分泌/極低分泌的信號肽序列進行人工調(diào)整和優(yōu)化設(shè)計。結(jié)果表明:通過尋找信號肽中不同位置氨基酸的偏向性選取趨勢,能夠確定影響蛋白質(zhì)分泌水平的關(guān)鍵氨基酸,提高了外源蛋白質(zhì)高分泌表達信號肽拼接準確度。
關(guān)鍵詞:信號肽;馬爾科夫轉(zhuǎn)移矩陣;特征向量;人工優(yōu)化序列;遺傳算法
0 引言
隨著科研水平的提高,發(fā)現(xiàn)信號肽對于蛋白質(zhì)的定位有著非常重要的作用,使得信號肽的研究成為各大科研工作者的研究熱點。例如,使用枯草芽孢桿菌進行過分泌試驗的外源蛋白試驗時,出現(xiàn)不同水平分泌表達,通過構(gòu)建重組質(zhì)粒并轉(zhuǎn)化到枯草芽孢桿菌WB800N中進行誘導表達[1]。此外,宮悅等[2]研究表明影響蛋白質(zhì)分泌水平一般為信號肽中的幾個關(guān)鍵氨基酸。陳龍冠等[3]認為通過對信號肽序列進行調(diào)整或重新設(shè)計可在一定程度上提高外源蛋白質(zhì)的分泌表達量。因此,本文在信號肽序列的優(yōu)化設(shè)計范圍內(nèi),嘗試對信號肽SacB中H-domain的部分氨基酸進行調(diào)整和替換,再拼接地衣芽孢桿菌α-淀粉酶的蛋白質(zhì)主鏈,然后提取拼接序列的結(jié)構(gòu)融合度特征與可分泌蛋白進行相似性比較,從中找出相似性較高的優(yōu)化序列。
1 基于遺傳算法的人工信號肽設(shè)計研究
1.1 構(gòu)建氨基酸綜合替代矩陣
根據(jù)Blosum62氨基酸替代矩陣[4],盡可能不改變氨基酸的疏水性進行構(gòu)建氨基酸綜合替代矩陣。首先對氨基酸替代矩陣和疏水性矩陣進行標準化處理,過程如下
1.2 構(gòu)建Markov轉(zhuǎn)移矩陣
本文把信號肽序列上的狀態(tài)分布轉(zhuǎn)移行為用20 × 20的轉(zhuǎn)移頻次矩陣M描述,依次以鏈上兩個相鄰的氨基酸為行和列,可構(gòu)造反映二肽組成情況的鄰接矩陣。設(shè)Lij = { ( X,U,z) }表示序列上的一系列狀態(tài)關(guān)系,其中X是前一個氨基酸,U是后一個氨基酸,z是從X到U的轉(zhuǎn)移次數(shù),即在轉(zhuǎn)移頻次矩陣中,第i行(對應氨基酸X)第j列(對應氨基酸U)的元素值是z,這樣一條序列中的所有二肽都會顯示在矩陣中,將大量同一種屬的信號肽序列的轉(zhuǎn)移行為全部統(tǒng)計出來,就得到馬爾科夫轉(zhuǎn)移頻次矩陣。
由于枯草芽孢桿菌屬于屬于革蘭氏陽性真細菌,因此在信號肽標準數(shù)據(jù)集(http://www.cbs.dtu.dk/ftp/signalp)中選擇Gram + bacteria的140個分泌蛋白信號肽序列,計算得到馬爾科夫頻次矩陣如表2所示。
1.3 基于遺傳算法的人工序列設(shè)計
使用signalP3.0-HMM(http://www.cbs.dtu.dk/services/SignalP/)分析枯草芽孢桿菌果聚糖蔗糖酶(SacB)天然信號肽中三個區(qū)域的分布范圍,根據(jù)分析結(jié)果,信號肽SacB的H區(qū)包括位于第11~22的氨基酸殘基,然后對H區(qū)的12個氨基酸殘基進行替換。運用遺傳算法結(jié)合適應值函數(shù),實現(xiàn)對信號肽的人工優(yōu)化設(shè)計。最終得到信號肽SacB的H區(qū)不同位置可能替代的氨基酸,如表3所示。
根據(jù)表3進行替換后共得到432(3 × 4 × 3 × 4 × 3)條未知信號肽序列。這樣就把優(yōu)化候選信號肽的序列數(shù)量大大縮減,然后通過數(shù)值實驗分析和尋找關(guān)鍵氨基酸的位置。
1.4 SacB酶活性測定
枯草芽孢桿菌果聚糖蔗糖酶信號肽(SacB)和優(yōu)化后基因序列克隆體(SacB2)委托生工生物工程(上海)有限公司進行全基因合成,連接到地衣芽孢桿菌α-淀粉酶主鏈,分別得到菌載體amy-SacB和amy-SacB2。將兩桿菌載體接種于LB培養(yǎng)基試管中30 ℃培養(yǎng),8 h后轉(zhuǎn)移至MMCH培養(yǎng)基中,加入5%蔗糖溶液,24 h后取樣,在4 000 rpm下離心,取上清液根據(jù)還原糖DNS法在540 nm處測定酶活(OD值)。
2 實驗與結(jié)果分析
2.1 蛋白序列特征提取
針對拼接蛋白序列作為研究對象的特殊性,使用432條信號肽序列分別與地衣芽孢桿菌α-淀粉酶主鏈拼接得到實驗樣本,然后按照以上的方法提取SFD特征,最后分析尋找信號肽中不同位置氨基酸的偏向性趨勢。
2.2 人工序列設(shè)計的相似性分析
使用核度量標準[5]式(1)來計算實驗樣本與高分泌蛋白的相似性距離,這里參考的高分泌蛋白是文獻[6]中所有高分泌蛋白的類中心。
計算得到的相似性距離越小,則未知樣本實現(xiàn)高水平分泌的可能性越大。
人工樣本與分泌蛋白類中心的相似性分析如圖1所示。
由圖1可知,發(fā)現(xiàn)不同位置的氨基酸有明顯的偏向選取趨勢。其中第12個位置的偏向取值為L(亮氨酸),第22個位置的偏向取值為S(絲氨酸)和N(天冬酰胺),特別是第12個位置替換為L時,未知樣本與分泌蛋白有明顯的相似性趨勢。而其它幾個位置的氨基酸選取偏向性不太明顯。通過替換第12個位置和第22個位置的氨基酸種類,結(jié)合高斯核函數(shù)計算得到氨基酸組合的相似性距離。對比發(fā)現(xiàn):當?shù)?2個位置為L(亮氨酸)和第22個位置為S(絲氨酸)時,相似性距離數(shù)值最小,約為0.237,說明該優(yōu)化結(jié)果更能實現(xiàn)外源蛋白質(zhì)高分泌表達。因此,在上述2個位置用偏向性選取的氨基酸代替原有的氨基酸,得到偏向性序列SacB-2,然后進一步分析SacB-2的序列特征。
2.3 偏向性序列的結(jié)構(gòu)分析
小波變換是一種信號的時間—頻率分析方法,具有“數(shù)學顯微鏡”的功能,蛋白質(zhì)序列的結(jié)構(gòu)信息能從小波分解系數(shù)中反映出來,可用來分析和估計信號肽的H區(qū)。使用db2濾波器在尺度(1:30)下對分別對天然信號肽SacB和人工序列SacB-2的信號肽疏水序列進行一維連續(xù)小波分解,得到信號肽的結(jié)構(gòu)信息如圖2所示。
信號肽作為蛋白質(zhì)的起始序列,具有一定的序列特點,因此調(diào)整和優(yōu)化以后的序列也應該符合作為信號肽的序列特點。從圖2中的結(jié)果可以看出,人工序列SacB-2與天然高分泌信號肽SacB的序列特點基本一致,因此在很大程度上SacB-2能與枯草芽孢桿菌的轉(zhuǎn)移通道相容,同時根據(jù)特征向量的相似性分析,SacB-2又能與地衣芽孢桿菌α-淀粉酶的成熟蛋白相容,是可能實現(xiàn)外源蛋白質(zhì)高分泌表達的優(yōu)化候選信號肽。
2.4 信號肽分泌蛋白的表達量分析
SacB基因編碼分泌型蔗糖果聚糖酶,能夠催化蔗糖水解成葡萄糖和果糖等還原性糖。根據(jù)該特性測定樣品中的葡萄糖含量換算信號肽分泌蛋白的表達量,結(jié)果如圖3所示。
由圖3可知,菌載體amy-SacB和amy-SacB2在5%蔗糖溶液中培養(yǎng)10 h后,α淀粉酶的酶活性比空白(CK)高,說明SacB基因片段能有效的調(diào)控菌體在蔗糖的誘導下將還原糖產(chǎn)物分泌到細胞外。此外,菌載體amy-SacB2的α淀粉酶的酶活性比菌載體amy-SacB高,說明優(yōu)化基因片段SacB2比天然肽段SacB具有更高的分泌蛋白表達,與偏向性序列測試結(jié)果一致。
3 結(jié)論
本文從理論上嘗試對信號肽序列的H端進行調(diào)整和重新設(shè)計,從中篩選可能實現(xiàn)外源蛋白質(zhì)高分泌表達的優(yōu)化候選信號肽。該方法以氨基酸替代綜合得分矩陣和馬爾科夫轉(zhuǎn)移矩陣為替換依據(jù),可使替換以后的人工序列具有信號肽的特征結(jié)構(gòu)和原有極性。針對拼接蛋白序列作為研究對象的特殊性,提取SFD特征向量,通過與高分泌蛋白的相似性比較,得到不同位置的氨基酸有明顯的偏向性選取趨勢,優(yōu)化基因片段SacB2比天然肽段SacB具有更高的分泌蛋白表達。
參考文獻:
[1] 楊何寶,胡美榮,鄭翔,等.不同信號肽及分子伴侶對中性蛋白酶在枯草芽孢桿菌中分泌表達的影響[J].生物技術(shù)通報,2018,34(6):134-140.
[2] 宮悅,陳晨,李亞東,等.不同信號肽對重組B群腦膜炎奈瑟菌H因子結(jié)合蛋白表達的影響[J].中國生物制品學雜志,2017(2):141-145,149.
[3] 陳龍冠,覃錦紅,黃云娜,等.信號肽優(yōu)化對重組抗體分泌表達的影響及研究進展[J].中國生物工程雜志,2016,36(3):77-81.
[4] 孟翔燕,孟軍,葛家麒.一種基于親疏水性的替代矩陣[J].數(shù)學的實踐與認識,2009,39(7):105-112.
[5] Zhang D Q,Chen S C. Clustering Incomplete Data Using Kernel Based Fuzzy C-means Algorithm[J].Neural Processing Letter,2003,18(3):155-162.
[6] 高翠芳,吳小俊,田豐偉,等.一種表征蛋白質(zhì)可分泌性的結(jié)構(gòu)融合度特征[J].生物工程學報,2010,26(5):687-695.
[責任編輯:許立群]