馮唐鍇 雷 群 羅麗萍 藍(lán) 玉
(1景德鎮(zhèn)學(xué)院生物與環(huán)境工程學(xué)院,江西景德鎮(zhèn) 333499;2景德鎮(zhèn)市第十二小學(xué),江西景德鎮(zhèn) 333000)
金銀花在抗菌消炎和對(duì)抗病毒性疾病方面有一定作用,常用于中藥方劑中。綠原酸(Chlorogenic acid,CGA)是金銀花重要的藥用成分之一,具有多種藥用功效[1]。植物綠原酸合成途徑有3 條:一是咖啡酰輔酶A 和奎寧酸由羥基化肉桂酸輔酶A或奎寧酸肉桂酸羥基化轉(zhuǎn)移酶催化生成綠原酸;二是在羥基肉桂?;D(zhuǎn)移酶等作用下生成p-香豆酰奎寧酸,再由p-香豆酸3-羥化酶(p-coumarate3-hydroxylase,C3H)羥基化生成綠原酸;三是咖啡酰葡萄糖苷作為中間產(chǎn)物,和奎寧酸在羥基化肉桂酰D-葡萄糖、奎寧酸羥基化肉桂酰轉(zhuǎn)移酶催化作用下生成綠原酸。C3H 是綠原酸合成代謝過程中的關(guān)鍵酶,該酶催化咖啡酸的生物合成,這個(gè)過程是合成綠原酸的重要步驟。C3H 屬于細(xì)胞色素P450家族,與各類植物的CYP450 98A 亞家族蛋白具有高度同源性。在植物苯丙素代謝中能催化苯環(huán)C3位置的羥基化反應(yīng),是綠原酸生物合成的關(guān)鍵酶之一。金銀花基因組中有兩個(gè)C3H拷貝,2013年第一個(gè)C3H 基因拷貝(LjC3H)被克隆,亓希武等[2]對(duì)另外一個(gè)C3H 基因拷貝(LjC3H2)進(jìn)行了研究。其他植物C3H 也有相關(guān)研究,王漫青等[3]的研究表明,當(dāng)歸C3H 基因開放閱讀框長1 530 bp,編碼509 個(gè)氨基酸。周美娟等[4]克隆了慈竹C3H 基因并進(jìn)行了分析。李高等[5]的研究表明檸條錦雞兒C3H 與擬南芥C3H 具有部分相同的功能。本文從各類數(shù)據(jù)庫收集了37 種植物40 個(gè)C3H 蛋白序列,利用多種生物信息學(xué)分析工具,以LjC3H2為研究對(duì)象,對(duì)該基因表達(dá)酶的結(jié)構(gòu)、功能和分類等特點(diǎn)進(jìn)行了進(jìn)一步的分析研究。
LjC3HL2酶蛋白在NCBI 蛋白質(zhì)數(shù)據(jù)庫中的序號(hào)為ART33341.1。以該蛋白氨基酸序列為樣本進(jìn)行Blast 比對(duì),在NCBI 蛋白質(zhì)數(shù)據(jù)庫找到37 種植物40個(gè)C3H蛋白氨基酸序列,用來對(duì)LjC3H2進(jìn)行分子進(jìn)化分析。相關(guān)植物蛋白序列號(hào)如下:金銀花(ART33341.1、AGQ48118)、桔梗(AEM63674.1)、夏威夷金合歡(AOX49220.1)、西樺(QGX89943.1)、擰條錦雞兒(AEV93473.1)、薊(QQH14908.1)、矮牽牛(AVA30528.1)、毛白楊(AFZ78540.1、APR63682.1)、中??Х龋ˋBB83677.1)、苦蕎麥(AHA14499.1)、芝麻(AAL47545.1)、黃水仙(AUG71937.1)、藍(lán)星睡蓮(XP_031473498.1)、鮑氏文殊蘭(WGU11329.1)、粗壯女貞(WEX29781.1)、紅花釣鐘柳(WEX29779.1)、沙蓬(WBR79877.1)、茄子(UXQ89629.1)、蓖麻(XP_002511566.3)、圓葉黃山藥(XP_039114632.1)、龍葵(QIC52992.1)、缸豆(QCD97092.1)、桃兒七(AIA24412.1) 、水 仙(AGI97941.1) 、 慈 竹(AFD29885.1)、杉木(AFX98060.1)、火炬松(AAL47685.1)、歐洲云杉(CAK22403.1)、地黃(QJS39421.1)、箭葉淫羊藿(AIS92508.1)、陸地棉(ALH21661.1)、南非醉茄(ADM47799.1)、大麻槿(AGA60530.1)、藥蜀葵(UOI87846.1)、巨芒草(ANB43566.1、ANB43567.1)、黃芩(BAJ09387.1)和辣椒(ACF17644.1)。這40 個(gè)植物C3H 蛋白中,除了沙蓬和歐洲云杉的酶蛋白序列不夠完整以外,其他植物的酶蛋白氨基酸數(shù)都在510 左右,最少的為503(杉木),最多的為517(西樺、矮牽牛和茄子)。
使用的生物信息學(xué)工具包括各類在線數(shù)據(jù)庫、在線數(shù)據(jù)分析網(wǎng)站以及離線分析軟件,具體名稱、網(wǎng)址及功能如表1所示。
表1 使用的生物信息學(xué)分析軟件和在線程序
美國國家生物信息中心(NCBI)可用于獲得、提交和分析各類生物信息數(shù)據(jù)。BLAST是其中的一個(gè)分析工具,可對(duì)不同氨基酸或核酸序列進(jìn)行同源比較。DNAMAN 是一款高度集成化的序列分析軟件,本文利用該軟件進(jìn)行金銀花C3H蛋白的輔助序列處理和分析。MEGA 是對(duì)物種和種群DNA 和蛋白質(zhì)序列進(jìn)行分子進(jìn)化遺傳分析的軟件套裝,本文利用該軟件對(duì)不同植物C3H蛋白氨基酸序列進(jìn)行比較和進(jìn)化樹的構(gòu)建。ProtParam 是對(duì)蛋白質(zhì)進(jìn)行理化性質(zhì)分析的軟件,可計(jì)算蛋白質(zhì)的各種物化參數(shù),包括分子量、理論pI 和氨基酸組成等。ProtScale 是對(duì)蛋白質(zhì)進(jìn)行親疏水性分析的在線軟件。SignalP 6.0能夠預(yù)測信號(hào)肽的存在及其在蛋白質(zhì)中的切割位點(diǎn)的位置[6]。TMHMM 是對(duì)蛋白質(zhì)進(jìn)行跨膜螺旋區(qū)分析的服務(wù)器,用隱馬爾可夫模型預(yù)測跨膜蛋白拓?fù)浣Y(jié)構(gòu)[7]。Euk-mPLOC是真核蛋白質(zhì)亞細(xì)胞定位分析工具,包括具有多個(gè)亞細(xì)胞位點(diǎn)的真核蛋白質(zhì)也能預(yù)測[8]。SOPMA 是一種蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測方法,分析蛋白質(zhì)中α-螺旋、β-折疊和無規(guī)卷曲等主要二級(jí)結(jié)構(gòu)的存在情況[9]。SWISS-MODEL 得到了Alpha-Fold 蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫等資源工具的支撐,能高效精準(zhǔn)的自動(dòng)對(duì)蛋白質(zhì)結(jié)構(gòu)進(jìn)行同源性建模[10]。Prot-Param、ProtScale、SignalP6.0、TMHMM、Euk-mPLOC、SOPMA和SWISS-MODEL這些在線程序都有功能強(qiáng)大,簡單易用的特點(diǎn)。對(duì)該基因的生物信息學(xué)進(jìn)行分析,將下載好的LjC3H2氨基酸序列導(dǎo)入其輸入界面中,再點(diǎn)擊提交即可得到相關(guān)蛋白信號(hào)肽、跨膜結(jié)構(gòu)域、亞細(xì)胞定位以及蛋白質(zhì)二級(jí)和三級(jí)空間結(jié)構(gòu)的預(yù)測分析結(jié)果。
通過程序EXPASY 的ProtParam 分析金銀花LjC3H2編碼蛋白的理化性質(zhì)。結(jié)果顯示,LjC3H2編碼蛋白質(zhì)原子總數(shù)8 133,分子式為C2601H4083N715O715S19;分子量57 419.53;等電點(diǎn)pI 為8.92;序列的N 末端是M(Met)時(shí)估計(jì)半衰期為30 h(哺乳動(dòng)物網(wǎng)織紅細(xì)胞)>20 h(酵母)>10 h(大腸桿菌)。不穩(wěn)定性指數(shù)計(jì)算為38.41,即該蛋白質(zhì)應(yīng)歸類為穩(wěn)定蛋白質(zhì)。脂肪指數(shù)92.33,親水性總平均值(重力)-0.231,偏親水性蛋白。LjC3H2蛋白共含氨基酸殘基506 個(gè),包括蛋白質(zhì)中常見的20 種氨基酸,其中亮氨酸(Leu,11.7%),丙氨酸(Ala,8.3%),精氨酸(Arg,6.9%),纈氨酸(Val,6.9%),脯胺酸(Pro,6.9%),谷氨酸(Glu,6.3%),甘氨酸(Gly,6.1%),賴氨酸(Lys,5.7%),天冬氨酸(Asp,5.1%)含量相對(duì)較多,半胱氨酸(Cys,0.8%)最少,帶負(fù)電荷的殘基總數(shù)(天冬氨酸+谷氨酸)為58,帶正電的殘基總數(shù)(精氨酸+賴氨酸)為64(表2)。
表2 LjC3H2蛋白質(zhì)的氨基酸組成
預(yù)測LjC3H2在水中280 nm處的消光系數(shù),若假設(shè)所有的半胱氨酸殘基都形成胱氨酸,則消光系數(shù)為80 120,吸光度值(0.1%濃度)為1.395。假設(shè)所有的半胱氨酸殘基都不形成胱氨酸,則消光系數(shù)為79 870,吸光度值(0.1%濃度)為1.391。用DNAMAN軟件對(duì)LjC3H2做胰蛋白酶的酶切分析,結(jié)果表明胰蛋白酶對(duì)LjC3H2做酶切分析可得39 個(gè)片段。用DNAMNA 軟件預(yù)測LjC3H2抗原位點(diǎn)的結(jié)果表明,在LjC3H2中存在的抗原位點(diǎn)有8個(gè)(表3)。
表3 LjC3H2抗原位點(diǎn)預(yù)測
用ProtScale 軟件對(duì)LjC3H2做親水性和疏水性預(yù)測分析,得到的結(jié)果如圖1 所示。其中以LjC3H2中的氨基酸(aa)序列號(hào)作橫坐標(biāo),親水性分值作為縱坐標(biāo),負(fù)值越高表示親水性越強(qiáng),正值越高表示疏水性越強(qiáng)。結(jié)果表明,除了起始的少數(shù)幾個(gè)氨基酸疏水性較高以外,整個(gè)蛋白質(zhì)沒有特別明顯的“峰頂”和“谷底”,親/疏水性相對(duì)均勻,整體來看親水性略高。
圖1 LjC3H2親水性分析
用DNAMAN 軟件對(duì)LjC3H2進(jìn)行信號(hào)肽預(yù)測分析,結(jié)果表明該蛋白自然分裂位點(diǎn)CS 的峰值為0.134 778,在第22 位;OTHER 的峰值為0.999 885,在第70 位;而信號(hào)肽峰值為0.262,無明顯峰值,即LjC3H2無信號(hào)肽。
運(yùn)用程序工具TMHMM 對(duì)LjC3H2蛋白質(zhì)進(jìn)行跨膜區(qū)分析。結(jié)果表明,該蛋白質(zhì)氨基酸序列長度506,預(yù)測出的跨膜螺旋數(shù)量為0,跨膜螺旋氨基酸殘基數(shù)量的期望值為4.674 93,蛋白前60 個(gè)氨基酸中,跨膜螺旋的氨基酸量的期望值為4.430 10,位于膜細(xì)胞質(zhì)側(cè)的總概率為0.221 44,預(yù)測結(jié)果表明LjC3H2沒有跨膜結(jié)構(gòu)域。通常蛋白質(zhì)跨膜螺旋中的氨基酸殘基多為疏水性氨基酸殘基,親/疏水性分析結(jié)果表明該蛋白偏親水,這與該蛋白缺乏跨膜螺旋結(jié)果是吻合的。
利用Euk-mPLOC對(duì)LjC3H2蛋白進(jìn)行亞細(xì)胞定位分析,結(jié)果顯示LjC3H2蛋白可能在內(nèi)質(zhì)網(wǎng)上發(fā)揮作用。
采用SOPMA 對(duì)LjC3H2的二級(jí)結(jié)構(gòu)進(jìn)行分析,結(jié)果表明,α-螺旋(Alpha helix)占比50.20%;無規(guī)則卷曲(Random coil)占比33.00%;β-折疊也稱延伸鏈結(jié)構(gòu)(Extended strand)占比11.66%;β 轉(zhuǎn)角(Beta turn)占比5.14%。表明LjC3H2的二級(jí)結(jié)構(gòu)是以α-螺旋為主要類型,無規(guī)則卷曲較多,β-折疊即延伸鏈結(jié)構(gòu)數(shù)量較少。在SWISS-MODEL對(duì)LjC3H2進(jìn)行三級(jí)結(jié)構(gòu)的比較建模分析,結(jié)果表明,LjC3H2與細(xì)胞色素P450的三級(jí)結(jié)構(gòu)較相似(圖2)。
圖2 LjC3H2和細(xì)胞色素P450建模預(yù)測的三級(jí)結(jié)構(gòu)比較
以LjC3H2氨基酸序列為樣本進(jìn)行Blast 比對(duì),獲得了37 種植物40 個(gè)C3H 蛋白氨基酸序列樣本,對(duì)這些樣本進(jìn)行同源比較和分子進(jìn)化分析。結(jié)果表明,LjC3H2基因編碼蛋白的氨基酸序列與薊、桔梗的C3H 親緣關(guān)系較近,而金銀花另一個(gè)C3H 蛋白則與龍葵、粗壯女貞、黃芩、芝麻、紅花釣鐘柳、地黃以及桃兒七等植物的進(jìn)化關(guān)系較近(圖3),這表明金銀花中兩個(gè)C3H 拷貝的分子進(jìn)化路線可能略有不同。此外,這兩個(gè)蛋白質(zhì)在數(shù)據(jù)庫中的命名和作用對(duì)象也略有不同,其中LjC3H可能更多作用于香豆?;ヮ悾琇jC3H2則多作用于香豆酸。
圖3 37種植物中的40個(gè)C3H蛋白的系統(tǒng)進(jìn)化情況
LjC3H2作為細(xì)胞色素P450 CYP98A 亞家族成員,具有該亞家族蛋白高度相似的空間結(jié)構(gòu),該蛋白分子偏親水,沒有跨膜結(jié)構(gòu)域,沒有信號(hào)肽,二級(jí)結(jié)構(gòu)以α-螺旋為主,無規(guī)則卷曲較多,定位于內(nèi)質(zhì)網(wǎng)。分子進(jìn)化方面,與薊、桔梗的C3H 親緣關(guān)系較近,與同屬于金銀花的LjC3H親緣關(guān)系較遠(yuǎn)。
金銀花中有2 個(gè)C3H 蛋白的基因拷貝[11-12],對(duì)LjC3H2的研究相對(duì)成熟,因此本文選擇以LjC3H2作為研究對(duì)象,進(jìn)行深入分析。結(jié)果表明,該酶沒有跨膜結(jié)構(gòu)域、沒有信號(hào)肽,位于內(nèi)質(zhì)網(wǎng)上,關(guān)于該酶的各類分析表明,該酶主要在細(xì)胞內(nèi)起作用。
對(duì)多種植物的C3H 進(jìn)行系統(tǒng)進(jìn)化分析,結(jié)果表明金銀花已知的2 種C3H 蛋白在進(jìn)化上的親緣關(guān)系并不接近,表明這2 個(gè)拷貝的基因在進(jìn)化上可能分屬兩條不同的路線,有一定的區(qū)別。即這2 個(gè)基因拷貝表達(dá)的酶蛋白在功能上可能存在細(xì)微的差異。后續(xù)研究可進(jìn)一步對(duì)這2個(gè)基因表達(dá)的酶蛋白結(jié)構(gòu)進(jìn)行精細(xì)分析和比較,并通過試驗(yàn)方法研究兩者的差異。
本文從數(shù)據(jù)庫收集了37 種植物40 個(gè)C3H 蛋白序列,利用生物信息學(xué)分析工具,以LjC3H2為研究對(duì)象,對(duì)該基因表達(dá)酶的結(jié)構(gòu)、功能和分類等特點(diǎn)進(jìn)行了分析研究,為今后繼續(xù)研究金銀花C3H 蛋白酶提供參考。