蒙海林 汪建峰 王勇 張嗣良 王小寧
(1.華南理工大學(xué)生物科學(xué)與工程學(xué)院,廣東廣州510006;2.中國科學(xué)院上海生命科學(xué)研究院合成生物學(xué)重點實驗室,上海200032;3.華東理工大學(xué)生物反應(yīng)器工程國家重點實驗室,上海200237)
植物來源的細胞色素P450酶在大腸桿菌等原核宿主中很難實現(xiàn)功能表達,從而給異源合成紫杉醇等高附加值天然產(chǎn)物帶來困難[1-2].紫杉醇生物合成途徑中涉及到多步P450酶催化的羥基化反應(yīng),其中P450725A4(由CYP725A4)催化的第1步羥基化反應(yīng)已經(jīng)成為制約紫杉醇異源合成研究的瓶頸[2-4].目前這步反應(yīng)在異源宿主中得到的基本上是副產(chǎn)物[5],這可能與酶分子結(jié)構(gòu)改變所引起的催化活性變化有關(guān).因為疏水性很強的P450膜蛋白在缺乏內(nèi)質(zhì)網(wǎng)的原核宿主中實現(xiàn)功能表達通常需要切除其疏水的跨膜端,可能會對蛋白的最終構(gòu)象產(chǎn)生一定影響.因此,尋求一種能有效去除P450蛋白疏水特性而又不影響其催化活性的分子改造方案是在原核宿主中實現(xiàn)植物P450蛋白功能表達并最終獲取目標(biāo)產(chǎn)物的有效途徑,而該方案的工作基礎(chǔ)是已知P450蛋白的結(jié)構(gòu)數(shù)據(jù).但遺憾的是,由于實驗技術(shù)所限,目前通過實驗測定所得到的蛋白質(zhì)數(shù)據(jù)庫(PDB,http:∥www.rcsb.org/pdb/home/home.do)中膜蛋白所占比例極小,而屬于P450超家族的結(jié)構(gòu)數(shù)據(jù)更為缺乏,因而目前尚不能基于目標(biāo)P450蛋白的真實結(jié)構(gòu)進行理性的分子設(shè)計從而更好地實現(xiàn)其功能;但是,在少數(shù)已知蛋白結(jié)構(gòu)的基礎(chǔ)上可以通過同源結(jié)構(gòu)建模而得到未知的P450蛋白結(jié)構(gòu)模型.這些模型在現(xiàn)階段的研究工作中是具有指導(dǎo)意義的.然而,目前有關(guān)CYP725A4分子結(jié)構(gòu)建模的研究鮮見報道.本研究以CYP725A4為例,通過序列分析和結(jié)構(gòu)建模工作,在P450蛋白結(jié)構(gòu)建模方面進行初步探索,為后續(xù)的紫杉醇等萜類化合物異源合成研究中的P450酶分子改造和功能表達奠定基礎(chǔ).
CYP725A4的原始基因和蛋白序列在美國國家生物信息技術(shù)中心(NCBI,http:∥www.ncbi.nlm.nih.gov/)中檢索獲得,同源模板的結(jié)構(gòu)信息通過檢索PDB數(shù)據(jù)庫獲得.
采用 ProtScale工具(http:∥www.expasy.ch/tools/prot scale.html)中的 Kyte and Doolittle算法對CYP725A4進行疏水性分析.分析圖中正值越大表示疏水性越強,而負值越大表示親水性越強.疏水值介于-0.5~+0.5之間的為兩性氨基酸.
分別用工具 HMMTOP(http:∥www.enzim.hu/hmmtop/html/submit.html)和 TMHMM Server v.2.0(http:∥www.cbs.dtu.dk/services/TMHMM/)來在線預(yù)測CYP725A4的跨膜區(qū)[6-7].
在NCBI上進行protein blast(選擇nr數(shù)據(jù)庫)得到相似序列,進行序列比對并構(gòu)建進化樹.
在 expasy 網(wǎng)站(http:∥au.expasy.Org/tools)上選擇swiss-model工具的Automated模式進行同源建模[8],用 Pymol(http:∥ pymol.org/)查看結(jié)構(gòu)模型[9].對建模結(jié)果用 PROCHECK程序進行合理性驗證[10].
CYP725A4疏水性分析的結(jié)果如圖1所示.由圖1可見,29~40區(qū)具有很強的疏水性,很可能是CYP725A4的跨膜區(qū).其余區(qū)域的疏水性較弱或親水性較強,可能是折疊區(qū).
圖1 CYP725A4的疏水性分析Fig.1 Hydrophobic profile analysis of CYP725A4
首先用HMMTOP工具在線進行CYP725A4的跨膜區(qū)預(yù)測,結(jié)果顯示CYP725A4在N端有兩個跨膜螺旋,分別位于25~42區(qū)和57~74區(qū).然后用TMHMM工具在線進行預(yù)測,預(yù)測結(jié)果如圖2(a)所示.結(jié)果表明,CYP 725A4只有一個跨膜區(qū)(20~42),在此之前的區(qū)域(1~19)位于膜內(nèi)側(cè),之后的區(qū)域(43~499)位于膜外側(cè),與HMMTOP所預(yù)測的兩個跨膜區(qū)有所不同.TMHMM所得結(jié)果與圖1所示的疏水區(qū)分析結(jié)果頗為吻合,預(yù)示著前40位左右的區(qū)域?qū)儆诳缒^(qū),在原核宿主中表達時可將其切掉.但為保險起見,也可按照HMMTOP的預(yù)測結(jié)果盡可能地切掉跨膜端(去掉前74個氨基酸殘基甚至更多)以實現(xiàn)可溶表達.
圖2 由TMHMM方法預(yù)測的蛋白跨膜區(qū)Fig.2 Protein transmembrane regions predicted by TMHMM method
在NCBI上檢索CYP725A4的相似序列并構(gòu)建進化樹(見圖3).由圖3可見,CYP725A4與紫杉醇途徑上其它P450酶分子的相似性最高.這是因為它們都在執(zhí)行非常相似的功能——對紫杉烷骨架上的不同位點進行羥基化.它們可能具有十分相似的空間結(jié)構(gòu).因此,對CYP725A4的結(jié)構(gòu)進行建模也有助于研究該途徑上其它P450酶分子的結(jié)構(gòu)和功能.
圖3 CYP725A4的相似序列進化樹Fig.3 Phylogenetic tree of similar sequences of CYP725A4
在PDB結(jié)構(gòu)數(shù)據(jù)庫中進行CYP725A4同源模板的篩選,發(fā)現(xiàn)只有3個蛋白與CYP725A4的同源性超過30%,最高的也只有36%(CYP120A1).
用swiss-model在線進行CYP725A4的結(jié)構(gòu)建模.在Automated模式下將自動選擇同源性最高的CYP120A1為模板.圖4(a)為swiss-model所建立的CYP725A4天然態(tài)三級結(jié)構(gòu)模型圖.
用PROCHECK程序?qū)YP725A4天然態(tài)三級結(jié)構(gòu)模型進行Ramachandran分析,見圖5(a),圖中Ψ表示N-Cα-C-N原子間的二面角,Φ表示C-N-Cα-C原子間的二面角,A、B、L 為最合理區(qū)域,a、b、l、p 為較合理區(qū)域,~a、~b、~l、~p為次合理區(qū)域.由圖5(a)可知,有89.1%的氨基酸殘基二面角位于合理區(qū)域,說明模型具有較好的可靠性.
在P450中,半胱氨酸以十分保守的方式與亞鐵血紅素(HEM)中的鐵元素形成硫醇鹽鍵,從而形成P450的活性中心[11].天然態(tài) CYP725A4共有4個半胱氨酸殘基(Cys20、Cys105、Cys328、Cys445),根據(jù)前面的跨膜區(qū)分析結(jié)果,推測Cys20位于跨膜區(qū)內(nèi),其余3個位于折疊區(qū)組成活性中心,負責(zé)催化紫杉烷5α位碳氫鍵的羥基化.
圖4 CYP725A4的三級結(jié)構(gòu)建模結(jié)果Fig.4 Tertiary structure modeling results of CYP725A4
此外,為構(gòu)建可溶表達蛋白,可按照前面的預(yù)測結(jié)果把疏水N端跨膜區(qū)切掉.分別考慮切除74個氨基酸殘基(74 aa)和42個氨基酸殘基(42 aa)兩種情況,并按照文獻[12]加上小牛P45017α的前8個氨基酸殘基(MALLLAVF)從而得到兩個新序列,其長度分別為433 aa(記為 CYP725A4-M1)和465 aa(記為CYP725A4-M2).用swiss-model工具的Automated模式對新設(shè)計的兩個序列進行同源建模,所得結(jié)構(gòu)如圖4(b)和(c)所示.結(jié)果表明,兩種切除方式所得到的蛋白折疊結(jié)構(gòu)基本維持了天然態(tài)CYP725A4的高級結(jié)構(gòu),對蛋白催化活性的影響似乎不大.而CYP725A4-M2比CYP725A4-M1更接近于天然態(tài)CYP725A4的結(jié)構(gòu),可能是由于它被切除的N端長度更短的緣故.
圖5 天然態(tài)CYP725A4和CPR結(jié)構(gòu)模型的Ramachandran圖Fig.5 Ramachandran plots of structure models of native CYP725A4 and CPR
由于大腸桿菌缺乏P450蛋白催化所必需的細胞色素P450還原酶(CPR),在表達P450蛋白的同時必須一起表達CPR才能實現(xiàn)功能表達.因此本研究還構(gòu)建了CPR的結(jié)構(gòu)模型.
首先用TMHMM方法預(yù)測了CPR的跨膜區(qū),(見圖2(b)).預(yù)測結(jié)果顯示,CPR有兩個跨膜區(qū),分別為26~48區(qū)和55~74區(qū).其余的區(qū)域中,49~54區(qū)位于膜內(nèi)側(cè),1~25區(qū)和75~717區(qū)位于膜外側(cè).參考文獻[12],本研究將N端的前74個氨基酸殘基切掉并加上小牛P45017α前8個氨基酸殘基(MALLLAVF)而構(gòu)建一個新序列.對CPR原序列(天然序列)和新設(shè)計序列用swiss-model分別進行三級結(jié)構(gòu)建模(見圖6),并用PROCHECK對天然態(tài)結(jié)構(gòu)模型進行驗證(見圖5(b)).
圖6 CPR的三級結(jié)構(gòu)建模結(jié)果Fig.6 Tertiary structure modeling results of CPR
由圖6可見,切除N端跨膜區(qū)似乎對CPR的高級結(jié)構(gòu)影響不大.據(jù)此可以用重新設(shè)計的CPR與上述重新設(shè)計的CYP725A4-M1或CYP725A4-M2聯(lián)合構(gòu)建一個融合表達蛋白,以實現(xiàn)異源可溶表達.
由于蛋白質(zhì)的序列、結(jié)構(gòu)以及功能之間的關(guān)系極其復(fù)雜,目前還沒有一種可靠的算法能由序列預(yù)測出完全正確的結(jié)構(gòu).二級結(jié)構(gòu)預(yù)測的平均準(zhǔn)確度通常在75%~80%之間,而三級結(jié)構(gòu)預(yù)測的準(zhǔn)確度更低[13].由同源建模方法預(yù)測的三級結(jié)構(gòu)與模板的選擇有很大的關(guān)系[14],通常目標(biāo)序列與模板之間的同源性越高其預(yù)測準(zhǔn)確度就越高.遺憾的是,目前已知三級結(jié)構(gòu)的蛋白中與CYP725A4同源性最高的僅為36%.這是由于實驗技術(shù)難以測定膜蛋白結(jié)構(gòu)而造成PDB數(shù)據(jù)庫中P450結(jié)構(gòu)數(shù)據(jù)嚴重不足的緣故.因此,盡管本研究所建立的CYP725A4三級結(jié)構(gòu)模型與實際情況相比有一定的偏差,但在實驗難以獲取CYP725A4真實結(jié)構(gòu)的情況下,分子建模結(jié)果對CYP725A4乃至更多P450蛋白在大腸桿菌等異源宿主中更好地實現(xiàn)功能表達仍然是有指導(dǎo)意義的.后續(xù)的工作可在此基礎(chǔ)上進行分子改造模擬與實驗,以實現(xiàn)蛋白分子的再設(shè)計.
此外,在大腸桿菌等原核宿主中進行植物細胞色素P450蛋白表達時需要考慮到宿主自身并沒有任何P450蛋白的相關(guān)基因,因而缺乏P450蛋白催化所必需的輔助還原酶CPR.為解決這個問題,通常需要實現(xiàn)P450和CPR在大腸桿菌中的共表達.而由于CPR本身也是一個跨膜蛋白,因此應(yīng)先將其跨膜區(qū)切除,或者再加上小牛P45017α的前8個密碼子以增強可溶表達效果[12].此外,盡可能地減少5'端和3'端非翻譯序列對5'末端的修飾,盡量選擇大腸桿菌偏好的密碼子,并通過同義突變增加5'端A、T的含量以降低與核糖體結(jié)合或翻譯時mRNA二級結(jié)構(gòu)的形成,將有助于P450及其CPR更好地實現(xiàn)功能性表達,獲取下游的中間產(chǎn)物或終產(chǎn)物.
本研究對紫杉醇生物合成途徑上的首個P450酶分子CYP725A4(CYP725A4)及其還原酶CPR進行了序列特性分析以及三級結(jié)構(gòu)建模,并提出了實現(xiàn)功能表達的一些策略.在現(xiàn)階段實驗數(shù)據(jù)缺乏的情況下,這些工作可為CYP725A4等P450蛋白在大腸桿菌等異源宿主中更好地實現(xiàn)功能表達提供指導(dǎo).
[1] Chau M,Croteau R.Molecular cloning and characterization of a cytochrome P450 taxoid 2α-hydroxylase involved in taxol biosynthesis[J].Archives of Biochemistry and Biophysics,2004,427(1):48-57.
[2] Chau M,Jennewein S,Walker K,et al.Taxol biosynthesis:molecular cloning and characterization of a cytochrome P450 taxoid 7 beta-hydroxylase[J].Biochemistry& Biology,2004,11(5):663-672.
[3] Jennewein S,Croteau R.Taxol:biosynthesis,molecular genetics,and biotechnological applications[J].Applied Microbiology and Biotechnology,2001,57(1/2):13-19.
[4] Jennewein S,Long R M,Williams R M,et al.Cytochrome P450 taxadiene 5α-hydroxylase,a mechanistically unusual monooxygenase catalyzing the first oxygenation step of taxol biosynthesis[J].Biochemistry & Biology,2004,11(3):379-387.
[5] Rontein D,Onillon S,Herbette G,et al.CYP725A4 from yew catalyzes complex structural rearrangement of taxa-4(5),11(12)-diene into the cyclic ether 5(12)-oxa-3(11)-cyclotaxane[J].Journal of Biological Chemistry,2008,283(10):6067-6075.
[6] Tusnady G E,Simon I.The HMMTOP transmembrane topology prediction server[J].Bioinformatics,2001,17(9):849-850.
[7] Chen Y J,Yu P,Luo J C,et al.Secreted protein prediction system combining CJ-SPHMM,TMHMM,and PSORT[J].Mammalian Genome,2003,14(12):859-865.
[8] Schwede T,Kopp J,Guex N,et al.SWISS-MODEL:an automated protein homology-modeling server[J].Nucleic Acids Research,2003,31(13):3381-3385.
[9] DeLano W L,Lam J W.PyMOL:a communications tool for computational models[J].Abstracts of Papers of the American Chemical Society,2005,230(1):1371-1372.
[10] Laskowski R A,Macarthur M W,Moss D S,et al.PROCHECK:a program to check the stereochemical quality of protein structures[J].Journal of Applied Crystallography,1993,26(1):283-291.
[11] Yoshioka S,Takahashi S,Hori H,et al.Proximal cysteine residue is essential for the enzymatic activities of cytochrome P450(cam)[J].European Journal of Biochemistry,2001,268(2):252-259.
[12] Chang M C,Eachus R A,Trieu W,et al.Engineering Escherichia coli for production of functionalized terpenoids using plant P450s[J].Nature Chemical Biology,2007,3(5):274-277.
[13] Floudas C A.Computational methods in protein structure prediction[J].Biotechnology and Bioengineering,2007,97(2):207-213.
[14] 熊盛,王一飛,錢垂文,等.抗HBsAg單鏈抗體的等電點測定和結(jié)構(gòu)模擬[J].華南理工大學(xué)學(xué)報:自然科學(xué)版,2003,31(11):73-76.Xiong Sheng,Wang Yi-fei,Qian Chui-wen,et al.Isoelectric point determination and structure modeling of a single chain Fv against HBsAg[J].Journal of South China University of Technology:Natural Science Edition,2003,31(11):73-76.