陳胤熹,黎菁菁,羅佳偉,鄭少鵬,余潔婷,黃嘉惠,李鑫堯,余銘怡,郝錦亨,黎佩瑜,古偉明,吳易達(dá),曹詩林,,賴林浩
(1.佛山科學(xué)技術(shù)學(xué)院食品科學(xué)與工程學(xué)院,廣東佛山 528000)(2.華南農(nóng)業(yè)大學(xué)食品學(xué)院,廣東廣州 510641)(3.廣東工業(yè)大學(xué)輕工化工學(xué)院,廣東廣州 510006)(4.暨南大學(xué)理工學(xué)院,廣東廣州 510640)(5.華南理工大學(xué)食品科學(xué)與工程學(xué)院,廣東廣州 510640)
碳酸酐酶(Carbonic Anhydrase,碳酸酐酶)是一種重要的含鋅金屬酶,廣泛存在于動、植物及微生物體中。碳酸酐酶不僅能夠快速、高效地催化二氧化碳和碳酸氫鹽的可逆轉(zhuǎn)化而且還具有維持生物體內(nèi)環(huán)境穩(wěn)態(tài)、參與光合作用、鈣化作用、CO2及碳酸鹽的轉(zhuǎn)運(yùn)等生命功能[1]。由于碳酸酐酶的這些特性,它既可被應(yīng)用于生物檢測,CO2捕集和生理診斷等領(lǐng)域,也被廣泛應(yīng)用于食品和藥品工業(yè)中,因此具有良好的經(jīng)濟(jì)價(jià)值和應(yīng)用前景[2-3]。
根據(jù)碳酸酐酶的氨基酸序列不同,一般可分為α、β、γ、δ、ε、η、θ和ι等八種類型[4],游離的碳酸酐酶普遍存在著容易失活、熱穩(wěn)定性低、可重復(fù)利用率低等問題,難以得到大規(guī)模應(yīng)用[5],因此,開拓更多來源的碳酸酐酶酶,并對其進(jìn)行分子改造和設(shè)計(jì),是解決該問題的潛在途徑。獲得準(zhǔn)確的碳酸酐酶的三維結(jié)構(gòu)是理性改造的基礎(chǔ)。
目前已知的獲得蛋白質(zhì)結(jié)構(gòu)的方法有很多,例如:核磁共振,X射線單晶衍射、冷凍電鏡等實(shí)驗(yàn)方法,但是這些方法成本高,耗時(shí)長,難以得到更廣泛的應(yīng)用。另一方面,可以使用蛋白質(zhì)建模技術(shù)預(yù)測蛋白質(zhì)的結(jié)構(gòu)信息。蛋白質(zhì)建模的方法包括同源建模和非同源建模。若在現(xiàn)有蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫可檢索出與目的蛋白具有序列同源性的模板,則可進(jìn)行同源建模。若無法得到同源模板,或同源模板無法覆蓋蛋白全序列,則需要通過穿針引線、從頭算或分段建模和結(jié)構(gòu)域組裝等方法進(jìn)行建模。通過從NCBI與SilkDB3.0中獲得大量的數(shù)據(jù)[6,7],使用同源建模將已知結(jié)構(gòu)的蛋白質(zhì)的序列與同源蛋白質(zhì)序列進(jìn)行比對,通過分析蛋白質(zhì)序列中的保守區(qū)域來識別蛋白質(zhì)活性區(qū)域,可望快速預(yù)測出蛋白質(zhì)的結(jié)構(gòu)信息[8]。
家蠶(Bombyxmori,Bm)的第五齡幼蟲的絲腺中存在著四種不同的上皮細(xì)胞,其中一種產(chǎn)生活性碳酸酐酶,用于調(diào)節(jié)家蠶內(nèi)環(huán)境的 pH,維持管腔內(nèi)的pH梯度[9]。本文以家蠶碳酸酐酶為研究的對象,通過蛋白建模、結(jié)構(gòu)分析、分子動力學(xué)模擬、分子對接等手段,建立和分析了家蠶碳酸酐酶的蛋白質(zhì)結(jié)構(gòu)模型、活性區(qū)域和催化作用機(jī)制,并對所建立的模型進(jìn)行了一系列的計(jì)算評分,最后采用分子動力學(xué)模擬對結(jié)果進(jìn)行了驗(yàn)證。本文研究為家蠶碳酸酐酶后續(xù)的分子改造提供了理論基礎(chǔ)。
1.1 數(shù)據(jù)庫與軟件
家蠶碳酸酐酶的基因和蛋白質(zhì)序列信息來源于NCBI與SilkDB3.0數(shù)據(jù)庫[10]。NCBI是美國國家分子生物學(xué)信息資源中心,具有廣大的公共數(shù)據(jù)庫,可被用于檢索和分析基因組數(shù)據(jù)等。而SilkDB3.0是由西南大學(xué)蠶絲科學(xué)與技術(shù)研究團(tuán)隊(duì)維護(hù)的家蠶的多組學(xué)數(shù)據(jù)庫,可進(jìn)行可視化的多組學(xué)分析。蛋白質(zhì)立體結(jié)構(gòu)信息從蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫RCSB PDB獲得,該數(shù)據(jù)庫保存了通過X射線衍射、核磁共振、冷凍電鏡等實(shí)驗(yàn)手段獲得蛋白質(zhì)等生物大分子的三維結(jié)構(gòu)數(shù)據(jù)。利用SWISS-MODEL計(jì)算平臺和Modeller軟件進(jìn)行蛋白質(zhì)建模。其中SWISS-MODEL是一個(gè)自動化的蛋白質(zhì)比較建模服務(wù)器。Modeller是一款同源建模軟件,主要用于家蠶碳酸酐酶的優(yōu)化與評價(jià)[11]。利用PROCHECK評價(jià)蛋白質(zhì)結(jié)構(gòu)合理性[12]。利用分子三維結(jié)構(gòu)顯示軟件PyMol對蛋白質(zhì)三維結(jié)構(gòu)進(jìn)行可視化分析[13]。通過Gromacs軟件[14]考察酶在催化過程中結(jié)構(gòu)變化及反應(yīng)體系的狀態(tài)變化。AutoDock-Vina是由Scripps研究所的Olson實(shí)驗(yàn)室開發(fā)與維護(hù)的分子對接的開源軟件[15],用于對乙酸對硝基苯酯底物與家蠶碳酸酐酶分子對接計(jì)算,獲得最優(yōu)的對接結(jié)果,獲得對接模型后,結(jié)合gromacs的MM/PBSA分析插件,共同分析家蠶碳酸酐酶與底物間相互作用的具體數(shù)值和具體部位。MM/PBSA[16]是利用分子力學(xué)和連續(xù)介質(zhì)模型來計(jì)算蛋白和配體之間存在的結(jié)合自由能,其中配體可以是蛋白、小分子或者多肽,在該方法中,計(jì)算分子力學(xué)(MM)、極性溶劑化能(PB)、非極性溶劑化能(SA)的相關(guān)能量得以被分解計(jì)算及分析。其中PROCHECK、AutoDock-Vina以及Modeller已經(jīng)被本團(tuán)隊(duì)進(jìn)行二次開發(fā)并部署于互聯(lián)網(wǎng)在線平臺中(https://atomevo.com/),開放給研究人員免費(fèi)使用。
1.2 方法
1.2.1 碳酸酐酶同源建模
在NCBI數(shù)據(jù)庫和SilkDB3.0中獲得家蠶碳酸酐酶的信息(XP_004922882.1)序列為:MDNRTVKID PKFLSAQPKKTSSDAEHISRLRPSQSPIAISLSRCPT WSSLDPLKFKGYWDSNANAILLNNGSTAYFTFND ASVRPTLSGGPLIGEYIFEQMHFHWSVDDFTGCEH VLDGHGYAAECHFVHYNSKYESLETAVGHPDGLA VVGFLLETVDAPNPRFDRLVQGLEGIQKRESVMN VTSESLLWMDREDLQIGNYVTYKGSLTTPPYTEC VTWIIYEKPVQIGSEQLGLLRQLEGPDSQPIERNVR PTQRHPPGHSVIYVKQVRSKL。
首先使用 SWISS-MODEL[17]對所得到的家蠶碳酸酐酶蛋白質(zhì)序列進(jìn)行模板搜索,篩選出酶種類接近、同源性高、序列覆蓋度高的模板,并進(jìn)行同源建模,其中SWISS-MODEL服務(wù)器模板數(shù)據(jù)庫ExPDB是從PDB中提取的[18]。
如出現(xiàn)單個(gè)模板無法覆蓋整個(gè)目標(biāo)序列的情況,則先進(jìn)行分段建模,再進(jìn)行穿針引線拼接。具體方法是:(1)若結(jié)構(gòu)域存在同源性高的模板,則利用SWISS-MODEL進(jìn)行同源建模,若部分結(jié)構(gòu)域無同源模板,則使用trrosetta進(jìn)行建模。(2)將得到的各結(jié)構(gòu)域模型作為模板,使用本團(tuán)隊(duì)自行開發(fā)的Modeller軟件的穿針引線拼接程序進(jìn)行拼接,從而得到目標(biāo)蛋白的結(jié)構(gòu)。
1.2.2 碳酸酐酶潛在活性區(qū)域
綜合分析RCSB PDB數(shù)據(jù)庫中的模板,以及對應(yīng)結(jié)構(gòu)的參考文獻(xiàn)中的活性區(qū)域信息進(jìn)行分析。利用活性區(qū)域的信息包括:易形成疏水口袋、組氨酸聚集、活性中心金屬離子臨近區(qū)域。再通過比對 SWISSMODEL中最優(yōu)結(jié)果酶蛋白氨基酸序列與RCSB PDB得到同樣種屬的酶蛋白的氨基酸序列,得出酶潛在的活性區(qū)域。
1.2.3 碳酸酐酶活性區(qū)域與底物的分子對接
以乙酸對硝基苯酯作為模型底物,以碳酸酐酶模型作為受體結(jié)構(gòu),利用Auto Dock-Vina模塊中將受體與配體進(jìn)行對接。根據(jù)1.2.2得到碳酸酐酶活性區(qū)域的空間位置確立一個(gè)長方形盒子限制計(jì)算范圍,計(jì)算得到盒子參數(shù)后與受體的PDB文件、配體的PDB文件共同上傳至 Auto Dock-Vina模塊進(jìn)行計(jì)算,并利用Vina-XScore連用模塊,對分子對接結(jié)果進(jìn)行評分,找出受體與配體結(jié)合模式[15]。
1.2.4 家蠶碳酸酐酶的分子動力學(xué)模擬
本課題利用 Gromacs軟件進(jìn)行分子動力學(xué)模擬[19],以Amber03力場。模擬步驟如下:首先,輸入在1.2.3中對接后所輸出的蛋白結(jié)構(gòu)和力場參數(shù)的相關(guān)文件(電荷,鍵合參數(shù)和非鍵參數(shù)等勢能函數(shù))。隨后,確定其體系的大小并且對體系進(jìn)行能量最小化,再進(jìn)行NVT與NPT平衡。隨后開始100 ns分子模擬,并且分析模擬輸出關(guān)于溶劑可及面積、氫鍵數(shù)目和徑向分布函數(shù)的數(shù)據(jù),并進(jìn)行MM/PBSA分析。
2.1 家蠶碳酸酐酶同源建模及結(jié)構(gòu)評價(jià)
首先通過SWISS-MODEL進(jìn)行同源建模,結(jié)果顯示家蠶碳酸酐酶的主要區(qū)域(25E-268K)可以利用Protein Data Bank中4ZX1模型為模板進(jìn)行建模,但是1M-24A以及269Q-274L這兩個(gè)區(qū)域缺少模板。因此先通過SWISS-MODEL同源建模得到主體結(jié)構(gòu)區(qū)域。1M-24A以及269Q-274L區(qū)域通過trRosetta進(jìn)行非同源建模。隨后利用本課題組自行開發(fā)的基于Modeller的穿針引線建模方法,將三個(gè)模板進(jìn)行穿針引線拼接,得到家蠶碳酸酐酶模型。
Ramachandran plot用于描述蛋白質(zhì)結(jié)構(gòu)中氨基酸殘基二面角φ和Ψ是否處于合理區(qū)域,可用于表征同源建模結(jié)果的合理性[20]。結(jié)果表明(圖 1)其完全允許區(qū)域(89.3%)與允許區(qū)域(10.3%),總和超過了99%[21],表明本研究所得的家蠶碳酸酐酶結(jié)構(gòu)合理。
2.2 家蠶碳酸酐酶潛在活性部位分析
通過前人對與家蠶碳酸酐酶同種屬的碳酸酐酶 IX(PDB代號:4XZ1)的研究表明[22],4ZX1的活性區(qū)域?yàn)?62N~65S,89L~91Q,120L~122H,131V~143V,198L~206C。利用分子疊合技術(shù)對家蠶碳酸酐酶與4ZX1的蛋白結(jié)構(gòu)進(jìn)行疊合對比(圖 2a),確定家蠶碳酸酐酶活性口袋的空間位置。通過蛋白序列進(jìn)行比對分析(圖2b),得到家蠶碳酸酐酶的潛在活性口袋為:70N~72S(區(qū)域A),98F~100Q(區(qū)域B),128F~130H(區(qū)域C),138L~150V(區(qū)域D),209L~217C(區(qū)域E)。
以家蠶碳酸酐酶蛋白的活性口袋周邊(空間中心坐標(biāo)為 X=0.1、Y=1.4、Z=88)為對接位點(diǎn),通過Autodock-Vina進(jìn)行蛋白與對乙酸對硝基苯酯之間的分子對接。對接后得到最優(yōu)對接結(jié)果表明,家蠶碳酸酐酶與底物結(jié)合能為-6.1 Kcal/mol。
2.3 家蠶碳酸酐酶的分子動力學(xué)模擬數(shù)據(jù)分析
均方根偏差(RMSD)分析可以揭示家蠶碳酸酐酶整體構(gòu)象的穩(wěn)定性。該結(jié)果顯示(圖 3a),在模擬的前10 ns,家蠶碳酸酐酶的RMSD迅速從0 nm上升至0.3 nm,隨后在0.3 nm~0.35 nm左右波動。家蠶碳酸酐酶最后50 ns的RMSD值約為0.35 nm,表明該酶的結(jié)構(gòu)穩(wěn)定。家蠶碳酸酐酶最后50 ns的平均可及面積(圖3b)為142 nm2。家蠶碳酸酐酶蛋白分子內(nèi)平均氫鍵數(shù)(HBN)為181,家蠶碳酸酐酶與水溶液間的平均氫鍵數(shù)為587。
徑向分布函數(shù)可以揭示酶蛋白與水的分布距離以及對應(yīng)的概率密度,對模擬輸出的數(shù)據(jù)作圖分析,研究表明水與家蠶碳酸酐酶在距離<0.35 nm區(qū)間形成一個(gè)聚集峰,該峰主要?dú)w因于水和蛋白之間的氫鍵作用(圖4)。
2.4 家蠶碳酸酐酶MM/PBSA分析
在動力學(xué)分子模擬后,通過MM/PBSA法進(jìn)一步分析對接模型的結(jié)合自由能,得到總結(jié)合能為-40.72 kJ/mol。其中,對自由能的貢獻(xiàn)主要是范德華力的相互作用-57.86 kJ/mol。而極性溶劑化21.39 kJ/mol,對結(jié)合有顯著的反作用。通過分析蛋白質(zhì)氨基酸殘基結(jié)合能(圖4),得知家蠶碳酸酐酶對接后的模型中,分子間相互作用力主要存在于家蠶碳酸酐酶活性口袋中的D、E區(qū)域。
表1 家蠶碳酸酐酶的主要氨基酸殘基與底物乙酸對硝基苯酯的g_mmpbsa分析結(jié)果Table 1 The g_mmpbsa analysis of 4-nitrophenyl acetate and the main residues of BmCA
3.1 本文通過同源建模建立結(jié)構(gòu)合理的家蠶碳酸酐酶模型,結(jié)果顯示其氨基酸殘基處于完全允許區(qū)域(89.3%)與允許區(qū)域(10.3%)的總和超過了99%。2010年鄧秋紅等預(yù)測甘藍(lán)型油菜碳酸酐酶結(jié)構(gòu),其模型的完全允許區(qū)域(87.0%)與允許區(qū)域(12.4%)總和超過99%[23],通過Ramachandran plot分析的結(jié)果與前人的研究數(shù)據(jù)對比,證明該酶結(jié)構(gòu)模型可靠性良好。2015年Mahon Brian P等研究碳酸酐酶IX(PDB代號:4ZX1),獲得了潛在活性區(qū)域?yàn)椋?2N~65S、89L~92Q、120L~122H、131V~143V、198L~206C。利用分子疊合技術(shù)對家蠶碳酸酐酶與 4ZX1的蛋白結(jié)構(gòu)疊合對比,獲得了家蠶碳酸酐酶潛在的活性口袋:70N~72S、98F~100Q、128F~130H、138L~150V、209L~217C。結(jié)果表明同源建模所得的家蠶碳酸酐酶潛在活性區(qū)域與4ZX1號蛋白活性區(qū)域是相吻合的。
3.2 隨后,利用Autodock-Vina將家蠶碳酸酐酶與乙酸對硝基苯酯進(jìn)行對接,發(fā)現(xiàn)最優(yōu)對接結(jié)果的家蠶碳酸酐酶與底物的結(jié)合能為-6.1 kcal/mol,2007年向福利用分子對接技術(shù)研究與本文同種屬的碳酸酐酶(PDB:2CAB)與乙酰唑胺進(jìn)行分子對接,得到對接結(jié)合能為-2.1 Kcal/mol[24],經(jīng)對比表明家蠶碳酸酐酶與底物乙酸對硝基苯酯經(jīng)對接得到的結(jié)果較為穩(wěn)定。通過MM/PBSA探究家蠶碳酸酐酶與乙酸對硝基苯酯的相互作用,其結(jié)果表明:(1)范德華力在結(jié)合中占主導(dǎo)地位,而極性溶劑化對結(jié)合有顯著的反作用;(2)家蠶碳酸酐酶和底物相互作用的區(qū)域?yàn)?38L~150V(區(qū)域D)和209L~217C(區(qū)域E)。2013年孫維琦等運(yùn)用分子動力學(xué)模擬和自由能計(jì)算方法,研究了苯磺酰胺分子從碳酸酐酶II的活性位點(diǎn)的相互作用,顯示關(guān)鍵殘基198L、199T和200T(該區(qū)域相當(dāng)于本研究中的區(qū)域E)與苯磺酰胺的氫鍵作用阻礙了底物從酶中的脫離[25]。
3.3 綜上所述,本文通過同源建模獲得了一個(gè)良好的蛋白質(zhì)結(jié)構(gòu)模型,并通過分子模擬與分子對接技術(shù)探究其潛在活性位點(diǎn)與催化機(jī)制,為家蠶碳酸酐酶進(jìn)一步改造探究以及實(shí)際生產(chǎn)應(yīng)用提供理論依據(jù)。