薛永常, 張成鎖, 李 根
(大連工業(yè)大學 生物工程學院,遼寧 大連 116034)
微生物在次級代謝過程中產生豐富的活性天然產物。除以核糖體途徑,還能以非核糖體途徑合成一系列低分子量的具藥用價值的多肽類活性次級代謝產物[1],可被用于抗生素、免疫抑制劑、抗癌和抗病毒因子、鐵載體及生物表面活性劑等[2],已成為近幾年研究的熱點[3]。在微生物中非核糖體肽類次生代謝產物的生物合成是由非核糖體肽合成酶(NRPS)催化的。NRPS屬于模塊化酶,各相互獨立的模塊按特定空間、順序排列,在合成新生肽鏈的過程中具有不同的功能[4]。NRPSs至少含有腺苷?;Y構域(A)、肽酰基載體蛋白結構域(PCP)和縮合結構域(C) 等3個核心結構域。而A結構域負責合適的底物選擇并活化[5], A結構域10個氨基酸殘基呈口袋形狀,為底物結合處,同時擔任底物的特異性識別,是非核糖體多肽合成開始的起始處。NRPS基因常存在于合成次級代謝產物的基因簇中,通過克隆NRPS基因,利用探針或已有生物學軟件能夠對NRPS基因簇結構域進行分析、結構和功能預測,有助于尋找新型抗生素或生物活性物質[6-9],為相關新藥的研發(fā)提供新靶點和新思路。本研究是在前期已從海洋鏈霉菌L1基因組DNA克隆了NRPS縮合結構域(即C結構域)基因片段[10]的基礎上,開展NRPS腺苷?;Y構域的基因克隆,通過對所得基因序列及擬翻譯氨基酸序列的組成成分、理化性質、結構特征等進行預測和分析,為后續(xù)研究A結構域特異性和NRPS生物合成基因簇提供了理論依據,也為尋找新基因簇提供參考。
1.1.1 菌種來源StreptomycesglobisporusL1為本實驗室分離鑒定并保存;大腸埃希菌(Escherichiacoli) DH5 為大連工業(yè)大學分子實驗室保存菌株。
1.1.2 培養(yǎng)基 ①高氏一號培養(yǎng)基:可溶性淀粉20 g,NaCl 0.5 g,K2HPO4·3H2O 0.5 g,KNO31.0 g,MgSO4·7H2O 0.5 g,FeSO4·7H2O 0.01 g,陳海水定容至1 L,重鉻酸鉀0.025 g,瓊脂20 g,pH 7.4~7.6,121 ℃滅菌20 min。②種子液培養(yǎng)基:葡萄糖10 g,蛋白胨1.2 g,酵母提取物2 g,陳海水定容至1 L,pH 7.2,121 ℃滅菌20 min。
1.1.3 試劑與儀器TaqDNA聚合酶、DNA Marker、2×GC-rich PCR MasterMix、細菌基因組DNA提取試劑盒,普通瓊脂糖凝膠DNA回收試劑盒均購自天根生化科技有限公司;限制性內切酶Hind Ⅲ和BamH I、pMD 19-T載體購自寶生物工程(大連)有限公司;引物合成及序列測定由北京六合華大基因科技有限公司完成。TaKaRa TP 600 PCR儀,日本TaKaRa公司;Chemi System UVP Bio-imaging System凝膠成像系統(tǒng), 美國UVP公司; Himac CR-21G高速冰凍離心機, 日本日立公司。
1.2.1 NRPS基因引物設計和合成 參考Gontang等[11]發(fā)布NRPS通用引物設計了用于克隆A結構域基因片段的帶有酶切位點的引物:A2:5′-CGGGATCCTATCTACACCTCGGGATC-3′,下劃線部分為添加的BamH I酶切位點序列;A4:5′-CCAAGCTTGACGTCCCCCGTCCGGTAC-3′,下劃線部分為添加的Hind Ⅲ酶切位點序列。
1.2.2 NRPS基因克隆及測序 以細菌基因組DNA提取試劑盒提取的L1菌株基因組DNA為模板,以A2、A4為特異引物進行目的片段擴增,通過梯度PCR確定最適退火溫度。PCR擴增體系為2×GC-rich PCR MasterMix 10 μL,上下游引物各1 μL,模板DNA 1 μL,ddH2O補足20 μL。PCR擴增程序:94 ℃預變性3 min;94 ℃變性35 s,63 ℃退火35 s,72 ℃延伸45 s,擴增反應30個循環(huán);72 ℃延伸10 min,4 ℃保存。擴增產物經1%瓊脂糖凝膠電泳檢測,回收目的片段與pMD19-T連接,轉化DH5 感受態(tài)細胞,陽性單克隆進行特異引物PCR和質粒雙酶切檢測。重組質粒送北京六合華大基因科技有限公司測序。
1.2.3 目的基因生物信息學分析 將測序的擴增序列進行BLAST搜索,確定擴增序列正確性。利用ORF Finder進行閱讀框查找與翻譯。利用BioEdit和ExPASy ProtParam在線工具預測其理化性質。SOPMA數據庫對擬翻譯氨基酸序列進行二級結構組成特點分析。利用Swiss-Model工具進行同源建模,分析其三維模擬結構。
以L1基因組DNA為模板,以A2、A4為特異引物進行PCR的退火溫度優(yōu)化。當退火溫度為63 ℃時能夠擴增出一條750 bp左右的單一清晰條帶,與預期大小一致,因此確定63 ℃為擴增的最適退火溫度?;厥漳康钠闻cpMD19-T連接,轉化大腸埃希菌DH5 感受態(tài)細胞。提取重組質粒,進行特異引物的PCR,在大約750 bp左右能夠擴增出一條清晰整齊條帶(圖1)。
對重組質粒進行Hind III和BamH I雙酶切,同樣能夠得到約750 bp目的片段(圖2),酶切片段與克隆目的片段大小相近,證明目的片段插入了pMD19-T克隆載體中。從測序結果得知,插入片段大小為715 bp,反向插入到pMD19-T載體中。在線BLAST比對表明,其與已發(fā)布的StreptomycesglobisporusC-1027的NRPS基因序列相似度達93%,證明擴增的基因片段屬于NRPS基因的部分序列。
圖1 NRPS基因PCR擴增電泳Fig.1 Agarose gel electrophoresis of amplified NRPS gene1:DNA Marker IV;2:擴增片段1: DNA Marker IV;2: amplified fragment from genomic DNA
圖2 NRPS重組質粒雙酶切電泳圖Fig.2 Agarose gel electrophoresis of the recombinant plasmid cut by Hind III and BamH I1: DNA Marker IV; 2: 重組質粒; 3: Hind III和BamH I雙酶切質粒1: DNA Marker IV; 2: recombinant plasmid; 3: the recombinant plasmid cut by Hind III and BamH I
利用ORF Finder對擴增序列進行開放閱讀框分析,擬翻譯氨基酸序列為IYTSGSTGKPKGV-VTEYAGLTNMLINHQRRIFEPVLAEHGHRTFRIA-HTVSFAFDMSWEELLWLADGHEVHICDEELRRD-APRLVDYCLRHGIDVINVTPTYAQQLVAEGLLED-PERRPALVLLGGEAVTPTLWQRLAETEGTVGYN-LYGPTEYTINTLGVGTFECQDPVVGVAIDNTEVY-VLDPWLRPLPDGVPGELYVSGIGIARGYLGRSAQ-TAHRFVACPFGAPGERMYRTGDV
該序列含有238個氨基酸,屬于NRPS腺苷酰化結構域序列的一部分,將此片段命名為A1。利用Blast比對發(fā)現,該氨基酸序列中含有一個A結構域特有的AFD_class_I superfamily核心結合區(qū),此家族包括?;?、酰基-CoA連接酶、非核糖體肽合成酶腺苷?;Y構域和螢火蟲熒光素酶(圖3),在非核糖體肽合成酶腺苷?;Y構域中,催化ATP依賴反應。
選取與A1同源性較高的9個氨基酸序列構建NJ進化樹,結果見圖4。結果顯示A1與Streptomycessp. EN27含有的NRPS處于同一分支,證明該序列為NRPS基因序列。
將該擬翻譯氨基酸序列與Streptomycessp. EN27的非核糖體肽合成酶進行序列比對,同源性達到99%以上,證明擴增序列的翻譯產物即為NRPS(圖5)。
利用在線網站PKS/NRPS Analysis Web-site (http://nrps.igs.umaryland.edu/)分析得出,該氨基酸片段A1屬于NRPS的A結構域,這與在NCBI中Blast結果相一致,說明A1片段確實屬于NRPS的A結構域(圖6)。
通過模擬在其綁定位點中心區(qū)域,發(fā)現有8個氨基酸殘基發(fā)揮催化作用,分別為DMWNLGLI。利用NRPS Predictive Blast工具(http://nrps.igs.umaryland.edu/blast.html)搜索具有該活性位點的NRPS,發(fā)現A1與含有SyrB-M1-Thr活性位點的NRPS相似度達到62%,說明擴增的基因片段為NRPS的A結構域部分序列。
圖3 擴增序列擬翻譯氨基酸結構域分析Fig.3 The putative amino acid domain analysis from amplified sequences
圖4 A結構域進化樹構建Fig.4 Construction of Adenylation domain evolutionary tree
圖5 A1擬翻譯氨基酸序列與Streptomyces sp. EN27 NRPS的比對Fig.5 The alignment of A1 amino acid sequence with Streptomyces sp. EN27 NRPS
跨膜結構域一般由20個左右的疏水氨基酸殘基構成,在膜中形成α-螺旋,其外部疏水側鏈通過范德華力與脂雙層分子脂肪酸鏈相互作用,是膜中蛋白與膜脂相結合的主要部位。對跨膜結構域的預測和分析,對于推斷其在細胞中的作用部位具有重要意義。本研究應用在線工具TMPred對A1進行跨膜結構域分析(圖7),推斷出A1不存在跨膜結構域。
采用Bioedit軟件預測NRPS基因編碼氨基酸序列理化性質,得出該片段為親水性蛋白質(圖8)。
根據ExPASy ProtParam在線分析得出:A1的氨基酸組成個數為238,理論分子量為26.36 kDa,等電點pI為5.06,帶負電荷的氨基酸殘基數(Asp+Glu) 31,帶正點荷的氨基酸殘基數(Arg+Lys) 19。在280 nm波長下,測得其水溶液消光系數為38 640 M-1cm-1,0.1%濃度的Abs為1.465。當成熟肽N端為Ile時,半衰期在酵母體內約為30 min,在大腸埃希菌體內大于10 h。該蛋白不穩(wěn)定系數為42.43,脂肪指數91.30;平均親水性系數(GRVAY)為-0.132。綜上,A1的不穩(wěn)定指數達到42.43,大于閾值40,表明A1為不穩(wěn)定蛋白。其負電荷氨基酸殘基數較多,故判斷為酸性蛋白質。根據GRVAY數值-0.132推測A1為親水性蛋白質,這與BioEdit軟件預測結構一致。
圖8 A1親水性/疏水性分析Fig.8 Hydrophilicity/Hydrophobicity analysis results of A1
蛋白質的二級結構是多肽鏈中相鄰多個氨基酸殘基形成的局部肽鏈空間,包括α-螺旋、β-轉角、β-折疊片、延伸鏈及無規(guī)則卷曲等二級結構元件組成。
A1氨基酸序列的SOPMA二級結構預測顯示其α-螺旋占26.89%,β-轉角占10.50%,無規(guī)則卷曲占31.51%,伸展鏈占31.09%??芍?螺旋和無規(guī)則卷曲是A1二級結構的主要元件,而β-轉角和伸展鏈則散布于整個蛋白質中(圖9)。
圖9 A1二級結構預測Fig.9 The secondary structure prediction results of A1
應用SWISS-MODEL在線對其三級結構進行同源建模(圖10)。A1三維空間結構中α-螺旋、β-轉角和無規(guī)則卷曲與二級結構預測基本一致。其中5t3d.1.A模板與靶蛋白的相似性評估得分為35.22%,靶蛋白三維模型與數據庫中Enterobactin synthase component F的結構相似。GMQE分值為0.71,QMEAN分值為-3.04,說明靶蛋白模型與模板擬合度較高,靶蛋白模型可靠。靶蛋白與模板氨基酸的對應序列(圖11)。初步判斷擴增的腺苷?;Y構域片段與Enterobactin synthase component F同源。為今后研究A1特異性與功能提供了重要參考,也為獲取相應NRPS基因全長提供了實驗依據。
圖10 A1氨基酸片段3D結構預測Fig.10 3D structure prediction of A1 amino acid fragment
圖11 A1三維建模序列Fig.11 The 3D modeling sequence of A1
A結構域對于整個NRPS是不可或缺的部分,在底物激活期間,A結構域的小亞結構域靠近大亞結構域,形成閉合狀態(tài)[12],旋轉140°為PCP硫醇化作用暴露出活性位點[13]。經1/3催化周期完成后,A結構域由閉合狀態(tài)轉變?yōu)殚_放狀態(tài),此時允許底物進行綁定[14]。Miller等[15]證明PCP結構域與A結構域相連區(qū)域,保守基序LPxP與A小亞結構域形成穩(wěn)定的相互作用,從而縮短了連接區(qū)域的有效長度。構象改變驅使A結構域運動到PCP結構域。在PCP結構域的存在下,A結構域催化效率大大提高[16-17]。而A結構域在催化同時進一步引導PCP結構域移動到A和C結構域活性位點上。這個周期運動由A結構域更迭周期所調節(jié)。有證據表明在一個完整的NRPS模塊中,A結構域能夠催化2個活化周期,其中一個加載到PCP結構域,另一個用于激活下一個氨基酸。當上游缺少供體底物時,催化即刻停止[14]。結合觀察A結構域狀態(tài)變化,如果非核糖體肽在C結構域供體位點不可用,PCP結構域與上游C結構域相互作用的同時,會“凍結”A結構域的腺苷?;饔谩T摍C制有很重要的調節(jié)意義,因為被綁定的底物從PCP結構域釋放之前,下一周期PCP是不可能成為巰基化狀態(tài)的[18]。鑒于A結構域所具有的保守結構,克隆NRPS的A結構域序列對于探測NRPS基因的存在,并根據A結構域序列信息預測肽骨架的結構具有重要意義。本研究克隆了非核糖體肽合成酶A結構域基因,為研究NRPS全序列乃至整個基因簇功能結構提供參考。