胡黔楠吳 玲涂偉忠丁邵珍張紅雨( 中國科學(xué)院天津工業(yè)生物技術(shù)研究所,天津 0008; 武漢大學(xué)藥學(xué)院,武漢 4007; 華中農(nóng)業(yè)大學(xué)信息學(xué)院,武漢 40070)
微生物藥物生物合成知識庫研究進(jìn)展
胡黔楠1吳 玲1涂偉忠2丁邵珍2張紅雨3
(1 中國科學(xué)院天津工業(yè)生物技術(shù)研究所,天津 300308;2 武漢大學(xué)藥學(xué)院,武漢 430071;3 華中農(nóng)業(yè)大學(xué)信息學(xué)院,武漢 430070)
胡黔楠,中國科學(xué)院天津工業(yè)生物技術(shù)研究所研究員,一直致力于構(gòu)建微生物細(xì)胞工廠設(shè)計(jì)系統(tǒng),初步建立了“生物合成反應(yīng)數(shù)據(jù)-信息化工具-生物合成知識規(guī)律發(fā)現(xiàn)-生物合成途徑設(shè)計(jì)”的技術(shù)體系。
E-mail:hu_qn@tib.cas.cn
微生物藥物是由微生物在生命活動(dòng)過程中產(chǎn)生的、具有生物活性的代謝產(chǎn)物及其衍生物,如青霉素類、頭孢類、碳青霉烯類、大環(huán)內(nèi)酯類、氨基糖苷類、他汀類、四環(huán)類、林可霉素類、多肽類等。微生物藥物目前已廣泛應(yīng)用于臨床和農(nóng)牧漁業(yè),在治療細(xì)菌和真菌引起的感染性疾病、病毒感染性疾病、腫瘤、免疫相關(guān)性疾病、高血脂和高血糖等疾病中發(fā)揮著重要作用。微生物藥物因其所具有的近乎無窮的分子結(jié)構(gòu)多樣性和良好的成藥性特點(diǎn),一直是新藥研發(fā)的熱點(diǎn)~。
微生物藥物生物合成是以微生物作為“細(xì)胞工廠”,通過對天然產(chǎn)物代謝途徑的控制來合成目標(biāo)化合物,并采用微生物發(fā)酵的方式達(dá)到大量生產(chǎn)的目的 ??v觀整個(gè)流程,微生物藥物的合成首先是從簡單小分子前體開始,經(jīng)過順序協(xié)作的系列酶催化反應(yīng)最終形成。該過程包括很多復(fù)雜的生物合成反應(yīng)、合成途徑和代謝網(wǎng)絡(luò),而這些反應(yīng)、途徑和網(wǎng)絡(luò)又涉及一系列的化學(xué)結(jié)構(gòu)的生物轉(zhuǎn)化~。在合成生物學(xué)的生物功能元件設(shè)計(jì)研究中,化合物的生物合成是根據(jù)目標(biāo)代謝產(chǎn)物的結(jié)構(gòu)特征,設(shè)計(jì)生物合成途徑,確定相應(yīng)的生化反應(yīng)類型,尋找相關(guān)的元件和功能模塊 。這其中,合成途徑是由一系列改變化學(xué)結(jié)構(gòu)的生化反應(yīng)構(gòu)成,不同的生化反應(yīng)類型涉及不同的結(jié)構(gòu)轉(zhuǎn)化類型。因此,要進(jìn)行微生物藥物的生物合成途徑設(shè)計(jì),就需要收集大量不同類型的生物合成反應(yīng)類型。
目前,針對上述問題,已有多個(gè)研究小組開發(fā)了不同的生物合成轉(zhuǎn)化數(shù)據(jù)庫。如日本京都大學(xué)Kanehisa教授小組的KEGG數(shù)據(jù)庫 ,使用可視化的代謝網(wǎng)絡(luò)和代謝途徑來收集基因組、酶促途徑以及生化反應(yīng)等數(shù)據(jù)信息,多個(gè)酶促反應(yīng)組成一個(gè)代謝途徑,眾多代謝途徑又交織成錯(cuò)綜復(fù)雜的代謝網(wǎng)絡(luò),整個(gè)數(shù)據(jù)庫囊括了8000多個(gè)生化反應(yīng)。與前者相比,Reactome數(shù)據(jù)庫 則更側(cè)重于收集人類的有關(guān)反應(yīng)數(shù)據(jù),該數(shù)據(jù)庫共收集了1000多個(gè)代謝途徑,涵蓋了3000多個(gè)生物轉(zhuǎn)化反應(yīng),同時(shí)還整合有大量功能基因組的信息。還有MetaCyc數(shù)據(jù)庫 ,該數(shù)據(jù)收集有數(shù)千種物種的1800多種代謝途徑,涉及大量的反應(yīng)信息,但是其中4000多種反應(yīng)和KEGG是重疊的?;贐RENDA數(shù)據(jù)庫 ,德國Schomburg小組也開發(fā)了類似的反應(yīng)數(shù)據(jù)庫BKM-react,據(jù)統(tǒng)計(jì)該數(shù)據(jù)庫包含的生化反應(yīng)多達(dá)18 000個(gè)。而MetRxn數(shù)據(jù)庫 則是融合BRENDA、KEGG、MetaCyc、Reactome,以及44個(gè)代謝網(wǎng)絡(luò)模型,共提取出了76 000多個(gè)反應(yīng)。除此之外,UM-BBD數(shù)據(jù)庫 也收集有1000多個(gè)與生物催化和生物降解相關(guān)
Newman D J, Cragg G M. Natural products as sources of new drugs over the 30 years from 1981 to 2010. J Nat Prod, 2012, in press.
Carter G T. Natural products and pharma 2011: strategic changes spur new opportunities. Nat Prod Rep, 2011, 28(11):1783-1789.
Li J W, Vederas J C. Drug discovery and natural products: end of an era or an endless frontier? Science, 2009, 325(5937):161-165.
Dossey A T. Insects and their chemical weaponry: new potential for drug discovery. Nat Prod Rep, 2010, 27(12):1737-1757.
Peric-Concha N, Long P F. Mining the microbial metabolome: a new frontier for natural product lead discovery. Drug Discov Today, 2003, 8(23):1078-1084.
Park J W, Park S R, Nepal K K, et al. Discovery of parallel pathways of kanamycin biosynthesis allows antibiotic manipulation. Nat Chem Biol, 2011,7(11):843-852.
Weber W, Fussenegger M. Emerging biomedical applications of synthetic biology. Nat Rev Genet, 2011,13(1):21-35.
Kanehisa M, Goto S, Sato Y, et al. KEGG for integration and interpretation of large-scale molecular data sets. Nucleic Acids Res, 2012, 40:109-114.的生化反應(yīng)數(shù)據(jù)。
遺憾的是,在生物合成領(lǐng)域目前還沒有發(fā)表與Richard Larock的“Comprehensive Organic Transformations”類似的文獻(xiàn) ,盡管前面列舉的一些數(shù)據(jù)庫可以被用于逆向生物合成分析,但絕大多數(shù)這一類型的數(shù)據(jù)庫只著重于初級代謝或者降解途徑,那些潛在有用的次級代謝生物合成轉(zhuǎn)化反應(yīng)仍然分散在眾多的生化文獻(xiàn)中。因此,大多數(shù)由微生物次級代謝物衍生而來的微生物藥物的生物合成轉(zhuǎn)化數(shù)據(jù)庫依舊很匱乏。
目前,微生物藥物生物合成相關(guān)的元件種類的匱乏和缺乏標(biāo)準(zhǔn)化是生物合成途徑設(shè)計(jì)體系構(gòu)建的瓶頸問題 。針對這一問題,筆者課題組在已開發(fā)的生化反應(yīng)數(shù)據(jù)挖掘系統(tǒng)的基礎(chǔ)上 ,針對重要微生物藥物次級代謝生物合成過程的關(guān)鍵模塊進(jìn)行相關(guān)的數(shù)據(jù)收集、挖掘、分類,收集了微生物藥物、合成前體小分子、生物合成反應(yīng)、途徑、網(wǎng)絡(luò)、催化酶、基因簇等數(shù)據(jù);同時(shí),也嵌入了已成功開發(fā)的一些目標(biāo)分子、關(guān)鍵分子片段、合成反應(yīng)相似性等生物合成要素的搜索技術(shù),集成了生物轉(zhuǎn)化反應(yīng)的原子-原子映射、反應(yīng)中心獲取、生物合成轉(zhuǎn)化模式自動(dòng)化挖掘和標(biāo)準(zhǔn)化分類的軟件,建立了有特色的微生物藥物生物合成的生物轉(zhuǎn)化反應(yīng)數(shù)據(jù)庫、生物合成轉(zhuǎn)化模式數(shù)據(jù)庫和逆向微生物藥物合成途徑設(shè)計(jì)應(yīng)用平臺。
細(xì)胞工廠設(shè)計(jì)系統(tǒng)是一個(gè)模塊化的體系,從功能上可以分為以下6個(gè)模塊 :①目標(biāo)化合物選擇;②數(shù)據(jù)庫搜索生物合成信息;③生物合成途徑預(yù)測;④新酶發(fā)現(xiàn);⑤實(shí)驗(yàn)驗(yàn)證;⑥菌株優(yōu)化等。
首先,在目標(biāo)化合物選擇方面,研究人員可以根據(jù)自己的需求而定。生物合成的一個(gè)重要應(yīng)用是合成特定的天然藥物分子及其衍生化合物庫,由于這些化合物作用于不同的生物靶標(biāo),因此構(gòu)建藥物與藥物作用的靶標(biāo)之間的相互關(guān)系至關(guān)重要。在前期構(gòu)建和開發(fā)的網(wǎng)絡(luò)藥理模型 、小分子描述軟件 ,以及藥物-靶標(biāo)相互作用模型 基礎(chǔ)上,筆者課題組進(jìn)一步開發(fā)了基于靶標(biāo)結(jié)合位點(diǎn)以及小分子片段之間的Fragment Interaction Model(FIM)模型 ,F(xiàn)IM模型可以通過幫助研究人員了解靶標(biāo)-藥物之間的作用機(jī)制,來指導(dǎo)目標(biāo)化合物的選擇。
在選定了某個(gè)或者某一類的目標(biāo)化合物后,接下來就需要搜集與目標(biāo)化合物相關(guān)的生物合成信息。當(dāng)目標(biāo)化合物參與了某些初級代謝或者復(fù)雜化合物的降解途徑時(shí),前面列舉的多個(gè)研究小組開發(fā)的各種類型的生物合成相關(guān)數(shù)據(jù)庫均可以給予一定的參考。在前期的生物合成關(guān)鍵要素的精確搜索技術(shù)體系RxnFinder基礎(chǔ)上,筆者建立的RxnFinder數(shù)據(jù)庫收集、整理了10多萬篇生物合成文獻(xiàn)。截至目前,該數(shù)據(jù)庫包含有60 000多條生物合成反應(yīng)、7000多個(gè)生物合成途徑。同時(shí),根據(jù)酶催化反應(yīng)的標(biāo)準(zhǔn)分類方法EC Number也對收集的海量生物合成轉(zhuǎn)化反應(yīng)進(jìn)行了分類,如氧化還原反應(yīng)、轉(zhuǎn)移反應(yīng)、水解反應(yīng)、裂合反應(yīng)、異構(gòu)酶反應(yīng)、連接反應(yīng)等,以及更多細(xì)致的分類(參見KEGG小組反應(yīng)分類工作)。
在生物合成途徑預(yù)測方面,如BNICE、RetroPath、FMM、DESHARKY等軟件均可以用于輔助研究人員基于不同的數(shù)據(jù)庫進(jìn)行途徑預(yù)測。研究人員可以通過高得率、高轉(zhuǎn)化率、高反應(yīng)速度、低底物毒性等作為途徑設(shè)計(jì)的目標(biāo)函數(shù)來預(yù)測可行的生物合成途經(jīng)。在微生物細(xì)胞工廠設(shè)計(jì)系統(tǒng)中同樣也提供了相應(yīng)的途經(jīng)預(yù)測模塊BioSynther,該工具可用以輔助生物學(xué)家開展生物合成途徑設(shè)計(jì)工作。
對于新酶發(fā)現(xiàn),一方面,BioSynther在途徑預(yù)測的同時(shí),也可以挖掘能催化特定底物的酶的前三位酶號信息。另一方面,也可以通過在線預(yù)測服務(wù)器ECAssigner基于生物合成反應(yīng)結(jié)構(gòu)催化該反應(yīng)的類型預(yù)測可能的生物合成酶號。
Croft D, O'Kelly G, Wu G, et al. Reactome: a database of reactions, pathways and biological processes. Nucleic Acids Res, 2011,39:691-697.
Caspi R, Altman T, Dreher K, et al. The MetaCyc database of metabolic pathways and enzymes and the BioCyc collection of pathway/genome databases. Nucleic Acids Res, 2012,40:742-753.
Scheer M, Grote A, Chang A, et al. BRENDA, the enzyme information system in 2011. Nucleic Acids Res, 2011, 39:670-676.
熊燕, 陳大明, 楊琛, 等. 合成生物學(xué)發(fā)展現(xiàn)狀與前景. 生命科學(xué), 2011, 23(9):826-837.
Lang M, Stelzer M, Schomburg D. BKM-react, an integrated biochemical reaction database. BMC Biochem, 2011, 12:42.
Kumar A, Suthers P F, Maranas C D. MetRxn: a knowledgebase of metabolites and reactions spanning metabolic models and databases. BMC Bioinformatics, 2012, 13(1):6.
Gao J, Ellis L B, Wackett L P. The university of minnesota biocatalysis/biodegradation database: improving public access. Nucleic Acids Res, 2010, 38:488-491.
Bachmann B O. Biosynthesis: is it time to go retro? Nat Chem Biol, 2010, 6(6):390-393.
Kwok R. Five hard truths for synthetic biology. Nature, 2010, 463(7279):288-290.
后期的生物學(xué)實(shí)驗(yàn)驗(yàn)證部分,細(xì)胞工廠設(shè)計(jì)系統(tǒng)還包含一項(xiàng)大腸桿菌大規(guī)模全細(xì)胞代謝網(wǎng)絡(luò)的重構(gòu)技術(shù),筆者課題組將在后續(xù)研究中基于這些數(shù)據(jù),構(gòu)建虛擬的大腸桿菌細(xì)胞,并設(shè)計(jì)全細(xì)胞模型的菌株優(yōu)化算法,對科研人員菌株優(yōu)化予以計(jì)算輔助。
微生物藥物合成相關(guān)的生物轉(zhuǎn)化反應(yīng)數(shù)據(jù)以及基于生物轉(zhuǎn)化反應(yīng)建立的標(biāo)準(zhǔn)化生物合成轉(zhuǎn)化模式的匱乏一直是微生物藥物生物合成途徑設(shè)計(jì)的瓶頸。在生物合成過程中,無論是單一的生物合成反應(yīng),還是某一條具體的代謝途徑,乃至整個(gè)代謝網(wǎng)絡(luò),都涉及一系列化學(xué)結(jié)構(gòu)的生物轉(zhuǎn)化,包含多種結(jié)構(gòu)轉(zhuǎn)化的反應(yīng)類型。因此,要進(jìn)行合成途徑的設(shè)計(jì),勢必要參考已經(jīng)存在的生化轉(zhuǎn)化反應(yīng)類型,這也就需要將分散在海量文獻(xiàn)中的生化反應(yīng)收集建庫。目前已經(jīng)開發(fā)并投入使用的這一類型數(shù)據(jù)庫有很多,如KEGG、Reactom、Metacyc、BRENDA等數(shù)據(jù)庫均各有其優(yōu)勢應(yīng)用。但總體上看,對微生物次級代謝中的生化反應(yīng)挖掘還遠(yuǎn)遠(yuǎn)不能滿足研究人員的需求。
筆者課題組針對以上問題,致力于發(fā)展生物合成的數(shù)據(jù)集成,在微生物藥物特有生物合成轉(zhuǎn)化反應(yīng)數(shù)據(jù)庫的基礎(chǔ)上,集成生化反應(yīng)搜索、注釋、模式化、應(yīng)用于一體的生化反應(yīng)信息化系統(tǒng),自動(dòng)挖掘反應(yīng)轉(zhuǎn)化模式,構(gòu)建標(biāo)準(zhǔn)化、系統(tǒng)化的微生物藥物特有生物合成轉(zhuǎn)化模式庫,借鑒逆向有機(jī)合成途徑設(shè)計(jì)方法,綜合應(yīng)用化學(xué)信息學(xué)、生物信息學(xué)、圖論、計(jì)算機(jī)和信息科學(xué)等多種學(xué)科的方法和技術(shù),建立微生物藥物生物合成途徑設(shè)計(jì)平臺。目前也已初步建立了“生物合成數(shù)據(jù)-信息化軟件-生物合成知識規(guī)律發(fā)現(xiàn)-生物合成途徑設(shè)計(jì)”的技術(shù)體系,搭建了較為完整的微生物細(xì)胞工廠設(shè)計(jì)系統(tǒng)(http://www.lifemodules. org/)。
微生物藥物生物合成轉(zhuǎn)化反應(yīng)數(shù)據(jù)庫的構(gòu)建是微生物藥物生物合成途徑設(shè)計(jì)的基礎(chǔ)步驟。目前發(fā)達(dá)國家在該研究方向已經(jīng)占領(lǐng)先機(jī),投入大量人員資金構(gòu)建了多種類型的高質(zhì)量數(shù)據(jù)庫,并獲得了相應(yīng)的認(rèn)可。由于構(gòu)建生物合成數(shù)據(jù)庫,不僅需要投入大量的科學(xué)研究者從文獻(xiàn)中挖掘反應(yīng)數(shù)據(jù),也需要大量的人員進(jìn)行手工數(shù)據(jù)輸入與審核,希望有關(guān)科研管理部門對于這些有較大科研需求和市場價(jià)值的數(shù)據(jù)庫進(jìn)行持續(xù)投入以謀求長遠(yuǎn)可持續(xù)的發(fā)展。
目前,分散在專利中的生物合成途徑數(shù)據(jù),很少有人收集整理;缺乏集成廣泛化學(xué)結(jié)構(gòu)轉(zhuǎn)化以及催化元件的數(shù)據(jù)庫系統(tǒng);基于這些大量的生物合成數(shù)據(jù),缺乏系統(tǒng)性進(jìn)行生物合成數(shù)據(jù)挖掘的軟件工具;如何利用已有的生物合成知識規(guī)律來進(jìn)行生物合成途徑設(shè)計(jì)急需進(jìn)行有關(guān)的研究;同時(shí),如何在理性設(shè)計(jì)指導(dǎo)下高效開展生物合成的實(shí)驗(yàn)驗(yàn)證也是亟待解決的難點(diǎn)。
Hu Q N, Deng Z, Hu H, et al. RxnFinder: biochemical reaction search engines using molecular structures, molecular fragments and reaction similarity. Bioinformatics, 2011, 27(17): 2465-2467.
Shin J H, Kim H U, Kim D I, et al. Production of bulk chemicals via novel metabolic pathways in microorganisms. Biotechnology Advances, 2013, 31:925-935.
Hu Q N, Deng Z, Tu W, et al. VNP: interactive visual network pharmacology of diseases, targets, and drugs. CPT Pharmacometrics Syst Pharmacol, 2014, 3:e105.
Cao D S, Xu Q S, Hu Q N, et al. ChemoPy: freely available python package for computational biology and chemoinformatics. Bioinformatics, 2013, 29(8):1092-1094.
Cao D S, Liang Y Z, Deng Z, et al. Genomescale screening of drug-target associations relevant to Ki using a chemogenomics approach. PLoS One, 2013, 8(4):e57680.
Wang C, Liu J, Luo F, et al. Predicting targetligand interactions using protein ligand-binding site and ligand substructures. BMC Syst Biol, 2015, 9(1):1417.
Tu W, Zhang H, Liu J, et al.Biosynther. a customized biosynthesis.
Hu Q N, Zhu H, Li X, et al. Assignment of EC numbers to enzymatic reactions with reaction difference fingerprints. PLoS One, 2012, 7(12):e52901.
■ 反饋服務(wù)編碼 W3619
10.3969/j.issn.1674-0319.2015.06.008
微生物次級代謝途徑是微生物藥物生物合成的內(nèi)在基礎(chǔ),微生物藥物生物合成涉及一系列的生物轉(zhuǎn)化反應(yīng)、途徑和網(wǎng)絡(luò)。目前,大多數(shù)潛在有用的次級代謝生物轉(zhuǎn)化反應(yīng)還分散在海量的文獻(xiàn)中,因此,生物轉(zhuǎn)化反應(yīng)的數(shù)據(jù)集成以及基于生物轉(zhuǎn)化反應(yīng)建立的生物合成轉(zhuǎn)化模式的數(shù)據(jù)庫匱乏已成為生物合成途徑體系構(gòu)建的瓶頸。文章闡述了微生物利用次級代謝反應(yīng)進(jìn)行生物合成過程的一些關(guān)鍵模塊在相關(guān)研究領(lǐng)域取得的進(jìn)展。