吳欣園,朱晨陽(yáng),薛永常
(大連工業(yè)大學(xué)生物工程學(xué)院,遼寧大連 116034)
放線菌是諸多天然生物活性物質(zhì)的重要來(lái)源,目前已從放線菌中發(fā)現(xiàn)了10 000 多種生物活性化合物[1],具有廣泛實(shí)際用途和巨大經(jīng)濟(jì)價(jià)值。海洋放線菌尤其是鏈霉菌具有陸地微生物所不具備的適應(yīng)性[2,3],能在高鹽、高壓、低溫和寡營(yíng)養(yǎng)等條件下產(chǎn)生具有特殊化學(xué)結(jié)構(gòu)的次級(jí)代謝產(chǎn)物[4,5],其大都是通過(guò)非核糖體肽合成酶(Non-Ribosomal Peptide Synthetase,NRPS)和聚酮合酶途徑產(chǎn)生[6]。NRRS 是一種多功能大型合成酶,由執(zhí)行不同功能的結(jié)構(gòu)域組成的模塊按特定順序排列而成[7-10](圖 1),NRPS 體系除了腺苷化(Adenylation,A)結(jié)構(gòu)域、肽基載體蛋白(Peptidyl Carrier Protein Domain,PCP)、縮合(Condensation,C)結(jié)構(gòu)域等三個(gè)必需的核心結(jié)構(gòu)域外,還有差向異構(gòu)(Epimerization,E)結(jié)構(gòu)域、硫酯酶(Thioesterase,TE)等修飾性結(jié)構(gòu)域[11],共同完成非核糖多肽(Non-Ribosomal Peptide,NRP)的生物合成及組裝。在細(xì)菌、藍(lán)藻和真菌中NRPs 具有抗真菌、抗病毒、抗腫瘤和免疫抑制劑等非常重要的藥理活性[12-14],廣泛應(yīng)用于醫(yī)藥領(lǐng)域。
圖1 NRPS 模塊組成及合成機(jī)制[10]Fig.1 Module composition and synthetic mechanism of NRPS
E 結(jié)構(gòu)域作為NRPS 組成模塊中常見(jiàn)的修飾性結(jié)構(gòu)域,能將連接在PCP 結(jié)構(gòu)域上的L-氨基酸(L-Amino Acid,L-AA)立體異構(gòu)化為D-氨基酸(D-Amino Acid,D-AA),摻入到正在延伸的NRP 上,從而增加了NRP組成的多樣性[15]。由E 結(jié)構(gòu)域催化引入的D-AAs 不僅影響產(chǎn)物肽的最終構(gòu)象以及下游加工單元模塊(如硫酯酶結(jié)構(gòu)域)的接受性[16],還在確保延伸模塊的正常工作方面發(fā)揮重要作用[17]。在增加NRP 功能和結(jié)構(gòu)多樣性的同時(shí)還降低其蛋白水解敏感性,提高了NRP 的抗癌抑菌活性[18]。目前,在E 結(jié)構(gòu)域異構(gòu)化機(jī)制及其晶體結(jié)構(gòu)已有所研究,Stachelhaus 等[19]研究短桿菌素S合成酶GrsA E 結(jié)構(gòu)域的突變時(shí)發(fā)現(xiàn)753His 和892Glu 影響異構(gòu)化活性。而Samel 等[16]解析了酪氨酸合成酶的E結(jié)構(gòu)域晶體結(jié)構(gòu),發(fā)現(xiàn)822Glu 可能作為酸堿催化劑起作用,743His 則是用來(lái)穩(wěn)定異構(gòu)化過(guò)程中產(chǎn)生的瞬時(shí)烯醇中間體。在GrsA 的PCP-E 雙結(jié)構(gòu)域中,753His 的咪唑側(cè)鏈與磷酸泛酰巰基乙胺基(4′-Phosphopantetheinyl,Ppant)的硫原子相連[20]。Kim 等[21]則在研究GrsA 的E結(jié)構(gòu)域催化機(jī)制發(fā)現(xiàn),只有753His 能與氯乙烯基甘氨酸形成穩(wěn)定的酶探針加合物,進(jìn)一步證實(shí)了His 在異構(gòu)化過(guò)程中的重要地位。隨著對(duì)NRPS 高級(jí)結(jié)構(gòu)研究的深入,各結(jié)構(gòu)域間的相互作用機(jī)制受到廣泛關(guān)注。Chen等[20]研究GrsA 的PCP-E 雙結(jié)構(gòu)域時(shí)首次提出了PCP與E 結(jié)構(gòu)域之間是通過(guò)613Arg/788Asp、614Arg/785Glu 兩個(gè)鹽橋提供的靜電相互作用發(fā)生結(jié)合的。由于E 結(jié)構(gòu)域與上下游結(jié)構(gòu)域的供體位置相互作用以及其底物識(shí)別和催化機(jī)理尚不透徹,E 結(jié)構(gòu)域與PCP 結(jié)構(gòu)域的具體作用還需進(jìn)一步剖析。而對(duì)E 結(jié)構(gòu)域的分子機(jī)理和生物學(xué)作用的研究,對(duì)揭示NRPS 模塊間的通信機(jī)制、NRPS 的結(jié)構(gòu)域操縱和重排以及新藥的研發(fā)都有重要意義。本研究通過(guò)從實(shí)驗(yàn)室保存的具有完整NRPS 基因簇的海洋鏈霉菌基因組DNA 中擴(kuò)增E結(jié)構(gòu)域基因,并進(jìn)行生物信息學(xué)分析,以期對(duì)隨后深入研究其結(jié)構(gòu)與功能提供參考。
1.1.1 菌株與質(zhì)粒
本文鏈霉菌Streptomycessp.X66 是由實(shí)驗(yàn)室保藏菌株[22],大腸埃希菌(Escherichia coli)DH5α、BL21(DE3),表達(dá)載體pET-32a(+)均為實(shí)驗(yàn)室保存。pMDTM19-T 載體購(gòu)自寶生物工程(大連)有限公司。
1.1.2 培養(yǎng)基
LB 液體培養(yǎng)基、LB 固體培養(yǎng)基、高氏一號(hào)固體培養(yǎng)基配置參考文獻(xiàn)[23]。
1.1.3 試劑與儀器
細(xì)菌基因組DNA 提取試劑盒、柱式DNA 膠回收試劑盒,生工生物工程(上海)有限公司;FastPure 質(zhì)粒提取試劑盒、DNA Marker DL2000,南京諾唯贊生物科技有限公司;QuickCutTMEcoRⅠ(15 U/μL)、QuickCutTMHind Ⅲ(15 U/μL)、PrimeSTAR?Max DNA Polymerase,寶生物工程(大連)有限公司;DNA MarkerⅣ,天根生化科技(北京)有限公司;PCR Thermal Cycler Dice TP610,日本TaKaRa。
1.2.1 引物設(shè)計(jì)
參考GenBank 數(shù)據(jù)庫(kù)中Streptomyces albidoflavusstrain W68(登錄號(hào):CP064783.1)NRPS 中E 結(jié)構(gòu)域基因序列,使用Primer Premier 5.0 軟件設(shè)計(jì)特異性引物。同時(shí)在引物的5′端添加EcoR Ⅰ、Hind Ⅲ酶切位點(diǎn),所設(shè)計(jì)引物為:
E-F:5′-CGGAATTCATGCTGCGCGCCGTCTAC-3′
E-R:5′-CCAAGCTTACTGAGCGCGGGAGTAGGAC-3′
由北京六合華大基因科技有限公司合成。
1.2.2 E 結(jié)構(gòu)域基因克隆及鑒定
以Streptomycessp.X66 基因組DNA 為模板,E-F和E-R為特異引物進(jìn)行PCR擴(kuò)增。PCR擴(kuò)增體系為20 μL:ddH2O 8.5 μL、E-F(10 μmol/L)及E-R(10 μmol/L)各0.5 μL,PrimeSTAR?Max Premix 10 μL,基因組DNA 0.5 μL。1wt%瓊脂糖凝膠電泳檢測(cè)擴(kuò)增產(chǎn)物,回收目的片段與pMDTM19-T載體連接,并轉(zhuǎn)化大腸桿菌DH5α感受態(tài)細(xì)胞。陽(yáng)性重組質(zhì)粒經(jīng)特異引物PCR、雙酶切及測(cè)序鑒定。
1.2.3 E 結(jié)構(gòu)域基因生物信息學(xué)分析
利用NCBI(http://www.ncbi.nlm.nih.gov/)數(shù)據(jù)庫(kù)Nucleotide Blast 對(duì)測(cè)序結(jié)果進(jìn)行比對(duì);ORF Finder對(duì)該擴(kuò)增序列進(jìn)行翻譯,獲得其擬編碼的氨基酸序列;使用ExPASy ProtParam[24]和Protscale[25]對(duì)擬編碼的氨基酸序列的理化性質(zhì)及親/疏水性分析;采用TMHMM 2.0 Server[26]、SignalP 6.0 Server[27]在線工具對(duì)蛋白的跨膜結(jié)構(gòu)域、信號(hào)肽進(jìn)行預(yù)測(cè);采用SOPMA[28]和SWISS-MODEL[29]預(yù)測(cè)其二級(jí)結(jié)構(gòu)以及三級(jí)結(jié)構(gòu)模型;NCBI 數(shù)據(jù)庫(kù)中的CDD 工具預(yù)測(cè)該蛋白的保守區(qū)域;Protein Blast 搜索E 結(jié)構(gòu)域的同源蛋白,選取相似性>85%的蛋白利用DNAMAN 軟件進(jìn)行氨基酸多重序列比對(duì)分析;利用MEGA X[30]軟件基于鄰接法分析E結(jié)構(gòu)域蛋白和其他物種E結(jié)構(gòu)域蛋白的系統(tǒng)發(fā)生關(guān)系。
1.2.4 E 結(jié)構(gòu)域蛋白的異源表達(dá)
利用QuickCutTMEcoR Ⅰ和QuickCutTMHind Ⅲ對(duì)pET-32a(+)及構(gòu)建的重組質(zhì)粒pMDTM19-T-E進(jìn)行雙酶切,回收目的片段,連接并轉(zhuǎn)入大腸桿菌BL21(DE3)感受態(tài)細(xì)胞。分別培養(yǎng)只含pET-32a(+)單克隆菌及含有重組子pET-32a(+)-E單克隆菌落,待OD600為0.6 時(shí),加入IPTG 使反應(yīng)終濃度達(dá)到0.5 mmol/L,16 ℃誘導(dǎo)12 h 后,進(jìn)行SDS-PAGE 分析目的基因的表達(dá)。
以Streptomycessp.X66 基因組DNA 為模板,E-F和E-R 為特異引物擴(kuò)增目的基因片段。經(jīng)1%瓊脂糖凝膠電泳檢測(cè)(圖2),在1 100 bp 左右有單一清晰擴(kuò)增條帶,與預(yù)期的E 結(jié)構(gòu)域基因片段大小基本一致。
圖2 E 結(jié)構(gòu)域基因擴(kuò)增產(chǎn)物凝膠電泳圖Fig.2 Agarose gel electrophoresis of E domain gene fragment
回收目的片段與pMDTM19-T 載體連接,轉(zhuǎn)化大腸桿菌DH5α感受態(tài)細(xì)胞,選取陽(yáng)性菌落提取質(zhì)粒。電泳發(fā)現(xiàn)能夠在3 500 bp 左右出現(xiàn)了一條清晰明亮條帶(圖3),這與預(yù)期的質(zhì)粒大小一致。
圖3 質(zhì)粒DNA 電泳圖Fig.3 Agarose gel electrophoresis of recombinant plasmid
以重組質(zhì)粒DNA 為模板進(jìn)行特異性擴(kuò)增(圖4),擴(kuò)增的條帶大小在1 100 bp 左右,與目的條帶的大小相符,說(shuō)明該重組質(zhì)粒含有目的片段。將該重組質(zhì)粒命名為pMDTM19-T-E。
圖4 質(zhì)粒DNA 中擴(kuò)增E 結(jié)構(gòu)域基因電泳圖Fig.4 Agarose gel electrophoresis of E domain gene amplified from recombinant plasmid DNA
用限制性核酸內(nèi)切酶EcoR Ⅰ、Hind Ⅲ雙酶切重組質(zhì)粒(圖5),在3 000 bp 左右與1 100 bp 左右各得到一條清晰條帶,符合預(yù)期的結(jié)果,證明目的基因成功插入T-載體中。將重組質(zhì)粒送至生工生物工程(上海)股份有限公司測(cè)序。
圖5 重組質(zhì)粒雙酶切電泳圖Fig.5 Recombinant plasmid cut by Hind III and EcoR I
測(cè)序結(jié)果得知,該插入片段為1 099 bp。Blast 序列比對(duì)表明其與Yao 等[31]公布的Streptomyces albidoflavusstrain W68 的E 結(jié)構(gòu)域基因序列相似度達(dá)99%以上(圖6),證明擴(kuò)增的基因片段為E 結(jié)構(gòu)域基因序列。
通過(guò)ProtParam 工具對(duì)該擴(kuò)增序列編碼的氨基酸進(jìn)行分析,該E 結(jié)構(gòu)域基因共擬編碼366 個(gè)氨基酸,分子式為C1752H2738N510O523S3,理論等電點(diǎn)為5.69,不穩(wěn)定指數(shù)為32.68,平均親水系數(shù)為-0.15。該E 結(jié)構(gòu)域蛋白的等電點(diǎn)小于7,不穩(wěn)定指數(shù)小于40 且平均親水系數(shù)為負(fù)值,推測(cè)該蛋白可能是一個(gè)酸性親水穩(wěn)定蛋白。
蛋白質(zhì)的親疏水性決定了它在水中的可溶解性,高度可溶的蛋白質(zhì)一般都是親水性的部分裸露在最外面,而疏水性氨基酸在內(nèi)部。利用Protscale 軟件,選用默認(rèn)Kyte & Doolittle 計(jì)算方法分析該蛋白的親疏水性(圖7),發(fā)現(xiàn)在E 結(jié)構(gòu)域蛋白序列中,在第143位氨基酸處存在最小值-2.25,此處親水性最強(qiáng),疏水區(qū)在第204 位氨基酸處有最大值2.33,親水區(qū)域比疏水區(qū)域稍多一些,整體呈現(xiàn)親水性,預(yù)測(cè)該蛋白為可溶性蛋白,這也與ProtParam 中的分析結(jié)果相吻合。
圖7 E 結(jié)構(gòu)域蛋白親水性/疏水性預(yù)測(cè)Fig.7 Prediction of hydrophobicity/hydrophilicity of E domain protein
跨膜結(jié)構(gòu)域多為強(qiáng)疏水性氨基酸組成,根據(jù)氨基酸親疏水性結(jié)果推測(cè),擬翻譯的蛋白不具備跨膜結(jié)構(gòu)。為進(jìn)一步驗(yàn)證該猜想,利用TMHMM 軟件預(yù)測(cè)E結(jié)構(gòu)域蛋白跨膜結(jié)構(gòu)域(圖8),跨膜信號(hào)沒(méi)有波動(dòng),編碼產(chǎn)物中不存在跨膜螺旋結(jié)構(gòu),故該蛋白為非跨膜類蛋白質(zhì)。
圖8 E 結(jié)構(gòu)域蛋白跨膜結(jié)構(gòu)域預(yù)測(cè)Fig.8 Transmembrane domain prediction of E domain protein
信號(hào)肽通常用于指導(dǎo)蛋白質(zhì)的跨膜轉(zhuǎn)移或定位,運(yùn)用SignalP 預(yù)測(cè)該蛋白信號(hào)肽(圖9),結(jié)果顯示該蛋白不具備信號(hào)肽。據(jù)此猜測(cè)可能是因?yàn)槠洳皇欠置诘鞍谆蛘弋悩?gòu)化反應(yīng)中不涉及蛋白質(zhì)的轉(zhuǎn)移,所以也不會(huì)存在跨膜結(jié)構(gòu)。這一結(jié)果與E結(jié)構(gòu)域基因擬表達(dá)蛋白的跨膜結(jié)構(gòu)預(yù)測(cè)結(jié)果相符合。
圖9 E 結(jié)構(gòu)域蛋白的信號(hào)肽預(yù)測(cè)Fig.9 Signal peptide prediction of E domain protein
應(yīng)用SOPM 軟件對(duì)該蛋白的二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)(圖10)。該蛋白的二級(jí)結(jié)構(gòu)由41.69%的α-螺旋、17.44%的延伸鏈、3.81%的β轉(zhuǎn)角和37.06%無(wú)規(guī)則卷曲組成。其中以穩(wěn)定的α-螺旋結(jié)構(gòu)為主,說(shuō)明E 結(jié)構(gòu)域基因擬表達(dá)蛋白的二級(jí)結(jié)構(gòu)較為穩(wěn)定,這也與ProtParam 中的理化性質(zhì)結(jié)果相吻合。以酪氨酸合成酶B 第三個(gè)模塊的差向異構(gòu)化結(jié)構(gòu)域TycB3(E)的晶體結(jié)構(gòu)為模板構(gòu)建E 結(jié)構(gòu)域蛋白的三維結(jié)構(gòu),運(yùn)用SWISS-MODEL 進(jìn)一步分析其三級(jí)結(jié)構(gòu)(圖11),發(fā)現(xiàn)序列相似性為0.37,這與Samel 等[16]和Chen 等[20]的結(jié)果基本一致,左右兩個(gè)與氯霉素乙酰轉(zhuǎn)移酶結(jié)構(gòu)類似的亞域構(gòu)成E 結(jié)構(gòu)域的主體部分,活性位點(diǎn)位于兩個(gè)亞域的交界處,整體均呈“V”字型結(jié)構(gòu)。該蛋白結(jié)構(gòu)整體以α-螺旋為主,還包含少量的無(wú)規(guī)卷曲和延伸鏈,符合二級(jí)結(jié)構(gòu)的預(yù)測(cè)結(jié)果。
圖10 E 結(jié)構(gòu)域蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)Fig.10 Prediction of the secondary structure of E domain protein
圖11 E 結(jié)構(gòu)域蛋白三級(jí)結(jié)構(gòu)預(yù)測(cè)Fig.11 The tertiary structure prediction of E domain protein
通過(guò)CDD 工具預(yù)測(cè)了E 結(jié)構(gòu)域的保守區(qū)域(圖12),可以看出該序列中含有E 結(jié)構(gòu)域催化的特有結(jié)構(gòu)域,屬于C 結(jié)構(gòu)域超家族成員,該超家族還包括環(huán)化結(jié)構(gòu)域,雙重E/C 結(jié)構(gòu)域,因此可以判定克隆的目的基因片段屬于E 結(jié)構(gòu)域基因。
圖12 E 結(jié)構(gòu)域蛋白保守結(jié)構(gòu)域分析Fig.12 Domain analysis of E domain protein
用NCBI Blast 檢索工具比對(duì)E 結(jié)構(gòu)域基因擬編碼的氨基酸序列,選取數(shù)據(jù)庫(kù)中相似性較高的9 個(gè)蛋白質(zhì)序列,使用DNAMAN 進(jìn)行多重序列比對(duì)分析(圖13),發(fā)現(xiàn)該E 結(jié)構(gòu)域的氨基酸序列與同屬其他物種的相似度較高,氨基酸序列較為保守,且含有一段E 結(jié)構(gòu)域保守基序HHxxxD。
圖13 氨基酸多序列比對(duì)Fig.13 Alignment of the predicted amino acid sequences
MEGA X 構(gòu)建的E 結(jié)構(gòu)域蛋白的系統(tǒng)發(fā)育進(jìn)化樹(shù)(圖14)顯示該E 結(jié)構(gòu)域蛋白質(zhì)序列與Streptomyces albidoflavus的NRPS 處于同一分支,同源性達(dá)到95%,親緣關(guān)系較近;與Streptomyces scopuliridisRB72的E結(jié)構(gòu)域蛋白序列同源性較低,親緣關(guān)系相對(duì)較遠(yuǎn)。
圖14 E 結(jié)構(gòu)域蛋白進(jìn)化樹(shù)分析Fig.14 Phylogenetic tree of E domain protein
選取含 pET-32a(+)的單菌落及構(gòu)建成功的pET-32a(+)-E陽(yáng)性表達(dá)質(zhì)粒的單菌落進(jìn)行低溫誘導(dǎo)培養(yǎng),樣品處理后用SDS-PAGE 進(jìn)行檢測(cè),結(jié)果如圖15。
圖15 E 結(jié)構(gòu)域基因擬表達(dá)蛋白SDS-PAGE 分析Fig.15 SDS-PAGE analysis of E domain gene expression
作為對(duì)照的pET-32a(+)質(zhì)粒對(duì)誘導(dǎo)物IPTG添加與否對(duì)其表達(dá)沒(méi)有影響。而含有pET-32a(+)-E的菌株在未加入IPTG 時(shí),沒(méi)有目的蛋白的表達(dá);在加入IPTG低溫誘導(dǎo)12 h 后,在55 ku 左右出現(xiàn)明顯的條帶,這與預(yù)測(cè)的融合蛋白大小相近,說(shuō)明E結(jié)構(gòu)域基因在大腸桿菌BL21(DE3)中能夠表達(dá)。
本研究從海洋鏈霉菌Streptomycessp.X66 的基因組中擴(kuò)增獲得1 099 bp 的E結(jié)構(gòu)域基因序列,其編碼366 個(gè)氨基酸,生物信息學(xué)分析發(fā)現(xiàn)它具有差向異構(gòu)結(jié)構(gòu)域特有的保守基序HHxxxD,理論等電點(diǎn)為5.69,不穩(wěn)定指數(shù)為32.68,故該基因擬翻譯的蛋白為酸性穩(wěn)定的非分泌型蛋白質(zhì)。平均親水系數(shù)為-0.15,結(jié)合其親疏水性預(yù)測(cè)結(jié)果來(lái)看,該蛋白為親水性蛋白,不存在信號(hào)肽和跨膜結(jié)構(gòu)域;其二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu)顯示主要以α-螺旋和無(wú)規(guī)則卷曲結(jié)構(gòu)為主,與已報(bào)道的酪氨酸合成酶B(PDB ID:6TA8)的E 結(jié)構(gòu)域晶體結(jié)構(gòu)具有高度相似性。同源比對(duì)和系統(tǒng)發(fā)育進(jìn)化樹(shù)發(fā)現(xiàn),在鏈霉菌屬中E 結(jié)構(gòu)域基因編碼的氨基酸序列相似性較高,能看出E 結(jié)構(gòu)域基因在不同種屬內(nèi)具有極高的保守性,這也對(duì)應(yīng)了E 結(jié)構(gòu)域蛋白保守的立體異構(gòu)功能。在0.5 mmol/L 的IPTG 誘導(dǎo)下,目的基因能表達(dá)得到大小為55 ku 左右的融合蛋白,這為深入開(kāi)展E 結(jié)構(gòu)域蛋白的功能研究提供參考。