楊 晴,馮承濤
(安徽理工大學(xué)化學(xué)工程學(xué)院,安徽淮南 233100)
肝臟因具有較多的代謝酶而附有解毒和代謝等功能,是脊椎動(dòng)物的主要代謝器官,參與物質(zhì)代謝過程。細(xì)胞色素P450 酶(CYP450)存在于肝微粒體中,對(duì)體溫調(diào)節(jié)有重要影響,同時(shí)在藥物代謝的過程中起關(guān)鍵作用。CYP450亞家族種類繁多,CYP3A4
是亞家族種類之一。CYP3A4
是一種含有附帶一個(gè)鐵原子的亞鐵血紅素基團(tuán)的蛋白,也是參與黃曲霉毒素代謝的主要I 相代謝酶,在人體肝臟中含量豐富,具有致癌活性的AFB18、9-環(huán)氧化合物就是在該酶的作用下由黃曲霉毒素B1(AFB1)活化而成的。Ng等測(cè)量了肝癌患者、其他慢性肝病患者和健康對(duì)照者的CYP3A4酶活性,以尿中的6β-羥基氫化可的松為研究指標(biāo),結(jié)果顯示:健康對(duì)照和其他慢性肝病患者尿中的6β-羥基氫化可的松水平明顯低于肝癌患者;肝癌的危險(xiǎn)性與CYP3A4酶活性有一定的關(guān)系。楊立群等研究表明:相較于正常肝,肝炎后肝硬化患者CYP3A4
的P450 含量幾乎沒有變化,其微粒蛋白也無明顯改變;但其蛋白表達(dá)與活性明顯下降,基因表達(dá)也有所下降。生物信息學(xué)是一門集生命科學(xué)及相關(guān)學(xué)科交叉融合的前沿科學(xué),可依托蛋白質(zhì)和基因組學(xué)序列信息分析序列的結(jié)構(gòu)功能。伴隨著計(jì)算機(jī)儲(chǔ)存的快速發(fā)展,大數(shù)據(jù)及相關(guān)軟件和生物信息學(xué)數(shù)據(jù)庫在生命科學(xué)研究中發(fā)揮越來越重要的作用。鑒于此,綜合利用生物信息學(xué)方法,選用DNASTAR、ProtParam、SignalP5.0、MEGA 等生物信息學(xué)平臺(tái),進(jìn)一步探究人源肝臟細(xì)胞色素代謝酶CYP3A4
基因的生物學(xué)特性,以期為肝癌、肝炎等疾病機(jī)制及其藥物研發(fā)提供參考。CYP3A4
基因的mRNA 序列(登錄號(hào):NM_001202855.3)及其編碼的蛋白質(zhì)序列(登錄號(hào):NP-001189784.1),備用。1.2.1 基因編碼區(qū)堿基序列組成和蛋白理化特性分析
用DNASTAR 系統(tǒng)的EditSeq 模塊,以及ExPASy 數(shù)據(jù)庫中的ProtParam(http://www.exPasy.org/tools/protparam)分別對(duì)人源CYP3A4
基因編碼區(qū)堿基序列組成和蛋白理化特性進(jìn)行分析。1.2.2 蛋白結(jié)構(gòu)分析
用SOPMA 軟件分析人源CYP3A4 蛋白二級(jí)結(jié)構(gòu),用SWISS-MODEL(https://swissmodel.expasy.org/)軟件構(gòu)建蛋白三級(jí)結(jié)構(gòu)。
1.2.3 蛋白親/疏水性分析
用Protscale(https://web.expasy.org/protscale)軟件預(yù)測(cè)人源CYP3A4蛋白的親/疏水性。
1.2.4 蛋白信號(hào)肽及跨膜結(jié)構(gòu)分析
分別用SignalP5.0(http://www.cbs.dtu.dk/services/SignalP-5.0)和TMHMM 2.0(http://www.cbs.dtu.dk/services/TMHMM2.0)軟件對(duì)人源CYP3A4蛋白的信號(hào)肽和跨膜結(jié)構(gòu)進(jìn)行分析。
1.2.5 蛋白N-糖基化位點(diǎn)和磷酸化位點(diǎn)分析
用NetNGlyc 1.0 (http://www.cbs.dtu.dk/services/ NetNGlyc 1.0)和NetPhos 3.1 (http://www.cbs.dtu.dk/services/NetPhos 3.1)分別預(yù)測(cè)人源CYP3A4蛋白的N-糖基化位點(diǎn)及其磷酸化位點(diǎn)。
1.2.6 B細(xì)胞抗原表位分析
用IEDB(http://www.iedb.org/)提供的蛋白質(zhì)抗原表位在線分析工具預(yù)測(cè)人源CYP3A4 蛋白的B 細(xì)胞抗原表位。
1.2.7 蛋白相互作用關(guān)系網(wǎng)絡(luò)的構(gòu)建及通路分析
主要通過String 數(shù)據(jù)庫完成有關(guān)CYP3A4 蛋白信號(hào)通路分析,以排列靠前10 位蛋白交互內(nèi)為檢索條件,構(gòu)建蛋白相互作用PPI 網(wǎng)絡(luò),進(jìn)行GO 功能注釋和KEGG 通路富集分析。選擇homo sapiens,將閾值調(diào)至高置信度0.700。
1.2.8 蛋白氨基酸序列同源性分析及系統(tǒng)進(jìn)化樹的構(gòu)建
選用MEGA5.0 軟件中的鄰接法(Neighbor-Joining)對(duì)CYP3A4
氨基酸序列進(jìn)行同源性分析,構(gòu)建與之同源性相關(guān)聯(lián)的不同物種的CYP3A4
氨基酸序列的系統(tǒng)進(jìn)化樹,其中自展值(Bootstrap)設(shè)為1 000 次。選用DNASTAR 軟件中的MegAlign 模塊(Jotun Hein 法,PAM 設(shè)為250)分析人源CYP3A4
氨基酸序列和其他相關(guān)物種與人源CYP3A4
氨基酸序列的同源性差異。CYP3A4
基因mRNA 序列的編碼區(qū)長為1 509(位于104~1 612 處),共編碼502 個(gè)氨基酸。人源CYP3A4
基因編碼區(qū)的A,G,T,C 體積分?jǐn)?shù)分別為29.16%,21.80%,27.24%,21.80%,其中A+T 體積分?jǐn)?shù)(56.40%)高于C+G體積分?jǐn)?shù)(43.60%)。經(jīng)ProtParam軟件分析人源CYP3A4蛋白的理化性質(zhì),結(jié)果顯示CYP3A4 蛋白相對(duì)分子質(zhì)量為57 256.10,分子式為CHNOS,理論等電點(diǎn)為8.27,脂肪系數(shù)為95.86,平均親水系數(shù)為-0.038(親水),不穩(wěn)定系數(shù)為41.25,略高于閾值40,CYP3A4 蛋白在體外不穩(wěn)定。序列N-末端是甲硫氨酸,在酵母和大腸桿菌體內(nèi)表達(dá)半衰期分別為20,10 h,在哺乳動(dòng)物網(wǎng)狀紅細(xì)胞體外表達(dá)的半衰期為30 h。CYP3A4蛋白氨基酸組成如表1。由表1可看出:CYP3A4蛋白氨基酸組成中,色氨酸(Trp)占比最低(占0.8%),亮氨酸(Leu)占比最高(占11.8%);帶正電荷的氨基酸(精氨酸(Arg)和賴氨酸(Lys))殘基數(shù)為60 個(gè),帶負(fù)電荷的氨基酸(天冬氨酸(Asp)和谷氨酸(Glu))殘基數(shù)為57個(gè)。
表1 CYP3A4蛋白氨基酸組成Tab.1 Amino acid composition of CYP3A4 protein
預(yù)測(cè)結(jié)果顯示,人源CYP3A4 蛋白的二級(jí)結(jié)構(gòu)包 含223 個(gè)α 螺 旋(占44.42%)、27 個(gè)β 轉(zhuǎn) 角(占5.38%)、72 個(gè)延伸鏈(占14.34%)和180 個(gè)無規(guī)卷曲(占35.86%)。經(jīng)程序分析人源CYP3A4 蛋白的三級(jí)結(jié)構(gòu)與二級(jí)結(jié)構(gòu)分析結(jié)果完全一致。
人源CYP3A4 蛋白的親/疏水性結(jié)果如圖1。由圖1 可看出:人源CYP3A4 蛋白疏水性最強(qiáng)位于第18 位點(diǎn)處,得分為3.156;在第420,421 位點(diǎn)處親水性最強(qiáng),得分為-2.744。通過比較疏水性和親水性區(qū)域可知,人源CYP3A4蛋白為一種親水性蛋白質(zhì)。
圖1 CYP3A4蛋白疏水性分析Fig.1 Hydrophobicity analysis of human CYP3A4 protein
人源CYP3A4信號(hào)肽的酶切位點(diǎn)是根據(jù)綜合剪切位點(diǎn)分值的最大值來判斷的,信號(hào)肽分值可用于辨別有無蛋白分泌。預(yù)測(cè)結(jié)果顯示:CYP3A4 蛋白信號(hào)肽的酶切位點(diǎn)位于第28~29 bp處;CYP3A4蛋白存在2個(gè)跨膜結(jié)構(gòu)。
人源CYP3A4 蛋白N-糖基化位點(diǎn)分析結(jié)果如圖2。由圖2 可得,人源CYP3A4 蛋白分別在第360 和461 處含有2 個(gè)N-糖基化位點(diǎn)。蛋白磷酸化位點(diǎn)結(jié)果顯示,人源CYP3A4 蛋白含47 個(gè)磷酸化位點(diǎn),分別為19 個(gè)蘇氨酸位點(diǎn)(位于27,42,92,103,136,138,166,171,187,207,263,283,309,322,362,408,432,470和 498 處)、22 個(gè)絲氨酸位點(diǎn)(位于18,29,119,131,134,139,186,188,251,258,277,280,285,290,311,314,397,419,463,477,494和500處)和6 個(gè)酪氨酸位點(diǎn)(位于68,75,346,406,429和431處)。
圖2 CYP3A4蛋白N-糖基化位點(diǎn)分析Fig.2 N-glycosylation sites analysis of CYP3A4 protein
CYP3A4
基因的B 細(xì)胞抗原表位分析結(jié)果如圖3。由圖3 可看出,該基因B細(xì)胞抗原表位有20 處,分別位于37~45 位氨基酸(aa),75~84 aa,88~89 aa,106~109 aa,120~126 aa,137~140 aa,162~171 aa,195~205 aa,258~265 aa,278~287 aa,307~309 aa,323~331 aa,337~347 aa,400~402 aa,404~413 aa,418~429 aa,431~440 aa,467~471 aa,482~485 aa和487 aa處。圖3 CYP3A4蛋白B細(xì)胞抗原表位分析Fig.3 Epitopes analysis CYP3A4 protein B cell antigen
P
值分別為4.91和7.76E-06。圖4 CYP3A4相互關(guān)聯(lián)蛋白網(wǎng)絡(luò)Fig.4 CYP3A4 interrelated protein network map
對(duì)CYP3A4
生物學(xué)過程(biologiccal process,BP)、分子功能(molecular function,MF)、細(xì)胞組分(cellular component,CC)及KEGG 通路進(jìn)行分析,結(jié)果見表2。由表2 可看出:CYP3A4 蛋白主要涉及聯(lián)苯分解、膽紅素結(jié)合、黃酮代謝、單帖代謝、葡萄糖醛酸基轉(zhuǎn)移酶活性的負(fù)調(diào)控等系列生物過程,據(jù)文獻(xiàn)[14-15]可知中藥黃酮類成分具有廣泛的藥理及生物活性,很多中藥黃酮提取物及黃酮單體化合物對(duì)CYP3A4 酶具有明顯的抑制作用或誘導(dǎo)作用;CYP3A4蛋白在咖啡因氧化酶活性、N,N-二甲基苯胺單氧酶活性、葡萄糖醛酸基轉(zhuǎn)移酶活性、類固醇羥化酶活性等方面發(fā)揮重要作用;細(xì)胞組分主要集中在膜、質(zhì)膜和細(xì)胞體中;蛋白網(wǎng)絡(luò)主要涉及的KEGG 信號(hào)通路包括抗壞血酸和阿爾尿酸代謝、藥物代謝-細(xì)胞色素P450、戊糖、葡萄糖醛酸轉(zhuǎn)換、視黃醇的新陳代謝和膽汁分泌等。該結(jié)果也在一定程度上印證了細(xì)胞色素P450體系是藥物氧化代謝的核心體系,其中含量最豐富的是CYP3A亞家族,該酶系能催化大多數(shù)的處方藥、環(huán)境致癌物、類固醇激素等的代謝。表2 CYP3A4及相關(guān)基因GO功能注釋和KEGG通路富集Tab.2 GO functional annotation and KEGG pathway enrichment of CYP3A4 and related genes
續(xù)表2
CYP3A4
氨基酸序列進(jìn)化樹如圖5。由圖5可得,人源CYP3A4蛋白與同屬靈長類的Pan troglodytes(黑猩猩)處在同一個(gè)分支,其親緣關(guān)系最近,其次是Macaca mulatta (獼猴)、Macaca fascicularis (食蟹猴)、Papio anubis (東非狒狒),與Xenopus tropicalis (熱帶爪蟾)、Gallus gallus (雞)的親緣關(guān)系最遠(yuǎn),實(shí)驗(yàn)結(jié)果可信度整體高。圖5 CYP3A4蛋白進(jìn)化樹Fig.5 Phylogenetic tree of CYP3A4 protein
由DNASTAR 軟件中的MegAlign 模塊對(duì)選取的9個(gè)物種進(jìn)行氨基酸序列對(duì)比分析,結(jié)果如圖6。
圖6 人和其他物種CYP3A4蛋白的氨基酸序列同源性分析Fig.6 Amino acid sequence homology of CYP3A4 protein of homology with other species
由圖6 可看出,人源CYP3A4 蛋白(NP_001189784.1) 與獼猴(NP_001035504.1)、食蟹猴(NP_001271463.1)、黑 猩 猩(NP_001116247.1)、東 非 狒 狒(XP_003895805.1)、牛(NP_024840513.1)、狗(XP_038524063.1)、雞(NP_001316437.1)、熱帶爪蟾(NP_001015786.1)的氨基酸序列同源性分別為93.4%,93.6%,98.6%,94.4%,76.9%,80.1%,60.0%和60.5%。由此可知:人源CYP3A4 蛋白在不同物種中同源性較高,在進(jìn)化中則比較保守,該結(jié)果由CYP3A4蛋白氨基酸序列得到;人源CYP3A4蛋白氨基酸序列與熱帶爪蟾和雞的同源性最低,狗和牛次之,在黑猩猩、東非狒狒、食蟹猴、獼猴中同源性最高,與進(jìn)化樹比對(duì)結(jié)果一致。
CYP3A4
基因的生物學(xué)特性,得到如下主要結(jié)論:1)人源CYP3A4
基因的編碼區(qū)長1 509 bp,編碼502個(gè)氨基酸,CYP3A4蛋白分子式為CHNOS,相對(duì)分子質(zhì)量為57 256.10,脂肪系數(shù)為95.86,CYP3A4 蛋白二級(jí)結(jié)構(gòu)主要由α 螺旋(44.42%)、β 轉(zhuǎn)角(5.38%)、延伸鏈(14.34%)和無規(guī)卷曲(35.86%)構(gòu)成,該蛋白存在2個(gè)跨膜結(jié)構(gòu),信號(hào)肽位于第28~29 bp處,是親水性蛋白,有2個(gè)N—糖基化位點(diǎn)和47個(gè)磷酸化位點(diǎn),存在20個(gè)B細(xì)胞抗原表位。2)通過String數(shù)據(jù)庫得到人源CYP3A4蛋白相關(guān)功能和通路,CYP3A4蛋白在聯(lián)苯分解、黃酮代謝、葡萄糖醛酸基轉(zhuǎn)移酶活性的負(fù)調(diào)控、視黃醇的新陳代謝和膽汁分泌等系列信號(hào)通路中發(fā)揮重要作用,是藥物氧化代謝的核心體系。
3)經(jīng)同源性分析和進(jìn)化樹顯示,黑猩猩、東非狒狒和獼猴與人源CYP3A4 蛋白相似性最高,親緣關(guān)系最近。