趙靜,方海洋,張衛(wèi)東
(1. 解放軍后勤工程學(xué)院基礎(chǔ)部,重慶 401311;2. 解放軍第二軍醫(yī)大學(xué)藥學(xué)院,上海 200433)
中藥網(wǎng)絡(luò)藥理學(xué)研究中的生物信息學(xué)方法
趙靜1*,方海洋1,張衛(wèi)東2
(1. 解放軍后勤工程學(xué)院基礎(chǔ)部,重慶 401311;2. 解放軍第二軍醫(yī)大學(xué)藥學(xué)院,上海 200433)
為了更有效地治療癌癥、心血管疾病、免疫系統(tǒng)疾病等復(fù)雜疾病,基于分子網(wǎng)絡(luò)的多靶點(diǎn)藥物發(fā)現(xiàn)理念逐漸成為一種新的趨勢,而中藥整體、辨證、協(xié)同的用藥觀再一次引起了藥物發(fā)現(xiàn)領(lǐng)域的極大興趣。中藥在治療復(fù)雜慢性疾病方面有確切的療效和較小的毒副作用。中藥網(wǎng)絡(luò)藥理學(xué)從分子網(wǎng)絡(luò)調(diào)控的水平上闡明中藥的作用機(jī)制,為多靶點(diǎn)藥物發(fā)現(xiàn)提供有益的啟示和借鑒,并有可能從臨床有效的中藥反向開發(fā)現(xiàn)代多組分、多靶點(diǎn)新藥。針對基于生物分子網(wǎng)絡(luò)的中藥藥理學(xué)研究路線中的4個(gè)步驟,介紹近年來中藥網(wǎng)絡(luò)藥理學(xué)研究中相關(guān)的生物信息學(xué)方法。
網(wǎng)絡(luò)藥理學(xué);中藥;疾病基因;藥物靶點(diǎn);信號通路;分子網(wǎng)絡(luò)
中藥(traditional Chinese medicine,TCM)治病歷史悠久,在治療復(fù)雜慢性疾病方面具有確切的藥效和較小的毒副作用。然而,與西藥相比,中藥存在成分復(fù)雜、靶點(diǎn)和機(jī)制不清的問題。因此,在現(xiàn)代生物科學(xué)背景下闡明中藥的作用機(jī)制仍是一個(gè)巨大的挑戰(zhàn)。近年來,隨著多靶點(diǎn)藥物發(fā)現(xiàn)理念的興起以及網(wǎng)絡(luò)生物學(xué)研究的深入,網(wǎng)絡(luò)藥理學(xué)[1]、網(wǎng)絡(luò)醫(yī)學(xué)[2]等新的科學(xué)概念相繼涌現(xiàn)出來,逐漸成為一個(gè)熱門的研究模式,這對當(dāng)代藥物研究及新藥發(fā)現(xiàn)產(chǎn)生了深入、全面且長遠(yuǎn)的影響。同時(shí),將網(wǎng)絡(luò)生物學(xué)的思想和方法應(yīng)用于中藥藥理學(xué)研究,在分子網(wǎng)絡(luò)調(diào)控的背景中研究中藥的作用機(jī)制,也成為一種新的趨勢,并產(chǎn)生了一系列新的數(shù)據(jù)、方法和成果。
中藥網(wǎng)絡(luò)藥理學(xué)的核心問題之一,是評價(jià)中藥的多個(gè)靶點(diǎn)的協(xié)同作用對疾病相關(guān)分子網(wǎng)絡(luò)的綜合影響問題。針對中藥成分復(fù)雜、靶點(diǎn)不清的特點(diǎn)以及復(fù)雜疾病的網(wǎng)絡(luò)調(diào)控特性,我們提出了基于生物分子網(wǎng)絡(luò)的中藥藥理學(xué)研究路線[3],將基于分子網(wǎng)絡(luò)的中藥作用機(jī)制研究問題分解成4個(gè)步驟:1)識別中藥的有效活性成分;2)識別各活性成分的作用靶標(biāo);3)識別中藥所治療疾病的相關(guān)基因并構(gòu)建疾病網(wǎng)絡(luò);4)確定中藥作用靶點(diǎn)所調(diào)控的信號通路和網(wǎng)絡(luò),評價(jià)中藥對疾病網(wǎng)絡(luò)的影響。本文將從生物信息學(xué)的角度,簡要綜述這4個(gè)方面相關(guān)的研究方法和進(jìn)展。
盡管中藥方劑通常含有成百上千種成分,真正起到治療作用的是其中少數(shù)的活性成分。識別中藥方劑中的有效活性成分,是了解整個(gè)方劑作用機(jī)制的基礎(chǔ)。
中藥研究及生物信息學(xué)領(lǐng)域的科學(xué)家在中藥信息化建設(shè)方面進(jìn)行了大量工作,構(gòu)建了大量中藥數(shù)據(jù)庫。TCM數(shù)據(jù)庫[4]、3D-MSDT[5]、TCMID[6]和 TCM Database@Taiwan數(shù)據(jù)庫[7]等,均收錄了中藥及其主要化學(xué)成分的內(nèi)容。其中TCM數(shù)據(jù)庫根據(jù)《植物活性成分辭典》、《植物藥有效成分手冊》和《中藥有效成分藥理與應(yīng)用》及相關(guān)文獻(xiàn)編制,共收錄相關(guān)的中藥化學(xué)成分27 593種,包含每種成分的化學(xué)結(jié)構(gòu)式、立體結(jié)構(gòu)圖、來源、藥理作用、功效、臨床應(yīng)用、毒性、不良反應(yīng)等信息[4]。3D-MSDT提供6 500種中草藥有效成分的二維和三維結(jié)構(gòu)以及其他各類相關(guān)信息,查詢得到的分子可以直接在北京大學(xué)藥物設(shè)計(jì)系統(tǒng)(PKUDDS)中進(jìn)行三維結(jié)構(gòu)的顯示和分析[5]。TCMID收錄了46 914種中藥復(fù)方、8 159種中草藥及25 210種中草藥化學(xué)成分的相關(guān)信息[6]。TCM Database@Taiwan收錄了453種中草藥及它們所包含的2萬多種化學(xué)成分的信息[7]。通過查詢這些數(shù)據(jù)庫,可以獲得相關(guān)中藥活性成分的信息。
藥物分子通過與特定的蛋白或核酸靶標(biāo)相結(jié)合,調(diào)節(jié)其生物活性,從而發(fā)揮其治療作用。因此識別中藥有效活性成分所影響的分子,是認(rèn)識中藥方劑的作用機(jī)制必不可少的步驟。當(dāng)前識別藥物靶標(biāo)的生物信息學(xué)方法主要有計(jì)算預(yù)測法和數(shù)據(jù)庫查詢法。
2.1 計(jì)算預(yù)測
計(jì)算預(yù)測方法采用計(jì)算機(jī)輔助藥物設(shè)計(jì)技術(shù),通過對藥物分子和蛋白分子三維空間結(jié)構(gòu)的模擬計(jì)算,預(yù)測藥物的潛在靶標(biāo)。當(dāng)前流行的計(jì)算預(yù)測方法主要有反向分子對接、化學(xué)相似性搜索等。
反向分子對接(inverse docking)以小分子化合物為探針,在已知結(jié)構(gòu)的候選靶點(diǎn)數(shù)據(jù)庫內(nèi),搜尋可能與之結(jié)合的生物大分子,通過空間和能量匹配,識別可能形成的分子復(fù)合物,進(jìn)而預(yù)測藥物潛在的作用靶點(diǎn)[8]。2013年11月26日Nature雜志報(bào)道,紐約大學(xué)朗格醫(yī)學(xué)中心的藥理學(xué)家Timothy Cardozo近期在美國國立衛(wèi)生研究院舉辦的“高風(fēng)險(xiǎn)-高回報(bào)”研討會(huì)上,展現(xiàn)了他們所開展的人類有史以來最大規(guī)模的藥物對接計(jì)算機(jī)模擬工作[9]。Cardozo研究團(tuán)隊(duì)從PubChem數(shù)據(jù)庫和ChEMBL數(shù)據(jù)庫中選擇了大約60萬種化合物分子,評價(jià)了這些分子與570種人類蛋白質(zhì)的7 000多個(gè)結(jié)構(gòu)“口袋”的結(jié)合能力的強(qiáng)弱。這項(xiàng)工作最終創(chuàng)建了一個(gè)名為Drugable的網(wǎng)站(網(wǎng)址:Drugable.com)并對公眾開放。此數(shù)據(jù)庫將極大地幫助對化合物靶標(biāo)的識別。我們在研究黃芪的主要活性成分黃芪甲苷治療心肌缺血的機(jī)制時(shí),采用反向分子對接軟件INVDOCK預(yù)測到黃芪甲苷的39個(gè)潛在作用靶點(diǎn)[10]。接著選擇了預(yù)測的3個(gè)靶蛋白CN、ACE和JNK蛋白進(jìn)行蛋白水平的實(shí)驗(yàn)驗(yàn)證,證實(shí)了黃芪甲苷確實(shí)對它們都具有抑制作用,但抑制的強(qiáng)度比對應(yīng)的西藥低。我們進(jìn)一步開展了細(xì)胞水平的實(shí)驗(yàn),比較黃芪甲苷和西藥環(huán)孢菌素A對阿霉素誘導(dǎo)的心肌細(xì)胞損傷的修復(fù)作用。實(shí)驗(yàn)證實(shí),黃芪甲苷與環(huán)孢菌素A均通過抑制乳酸脫氫酶(LDH)活性而產(chǎn)生對阿霉素誘導(dǎo)的心肌細(xì)胞損傷的修復(fù)作用,而黃芪甲苷的抑制作用低于環(huán)孢菌素A,但卻顯著高于蛋白水平的抑制作用。說明在細(xì)胞水平,黃芪甲苷可能通過作用于多個(gè)靶蛋白產(chǎn)生協(xié)同作用而使其作用顯著增強(qiáng)。
化學(xué)相似性搜索(chemical similarity searching)[11]的基本假設(shè)是結(jié)構(gòu)相似的分子傾向于與相似的靶標(biāo)相結(jié)合。對于靶標(biāo)未知的化合物,通過搜索與其結(jié)構(gòu)相似而靶標(biāo)已知的化合物,可以預(yù)測該化合物的靶標(biāo)。2012年,美國諾華生物醫(yī)學(xué)研究所的科學(xué)家用化學(xué)相似性搜索算法 (similarity ensemble approach,SEA),針對已知的73個(gè)藥物副作用靶標(biāo)蛋白,系統(tǒng)地研究了656種已獲批準(zhǔn)使用的藥物的副作用靶標(biāo),他們預(yù)測到幾百種以前未知的藥物-蛋白相互作用,其中大約一半得到驗(yàn)證[12]。Zhang等[13]在研究烏頭湯對類風(fēng)濕關(guān)節(jié)炎的作用機(jī)制時(shí),首先通過查詢TCM Database@Taiwan數(shù)據(jù)庫,獲得烏頭湯中165種化合物的化學(xué)結(jié)構(gòu),然后使用TTD(therapeutic targets database)數(shù)據(jù)庫[14]所提供的藥物相似性搜索工具,搜索到烏頭湯中的化合物與153種藥物有相似結(jié)構(gòu),從而預(yù)測了它的56個(gè)潛在作用靶點(diǎn)。李梢課題組[15]提出的靶標(biāo)預(yù)測算法drugCIPHER將藥物的化學(xué)相似性、治療相似性相結(jié)合,在網(wǎng)絡(luò)背景下預(yù)測藥物靶標(biāo)。利用其中的化學(xué)相似性預(yù)測模塊,他們預(yù)測了清洛飲中235種活性成分分別對應(yīng)的靶標(biāo)。
2.2 數(shù)據(jù)庫查詢
基于前期大量的實(shí)驗(yàn)和計(jì)算方法產(chǎn)生的藥物化學(xué)成分的靶標(biāo)信息,近幾年開發(fā)了大量靶標(biāo)數(shù)據(jù)庫,如DrugBank[16]、TTD、STITCH(Search Tool for Interactions of Chemicals)[17]以及PDTD[18]等;其中針對中藥成分的靶標(biāo)數(shù)據(jù)庫有HIT (Herbal Ingredients' Targets Database)[19],TCM-PTD數(shù)據(jù)庫(The Potential Target Database of Traditional Chinese Medicine,網(wǎng)址:http://tcm.zju.edu.cn/ptd/),TCM Database@Taiwan數(shù)據(jù)庫等。這些數(shù)據(jù)庫各有其側(cè)重點(diǎn),例如,DrugBank數(shù)據(jù)庫收錄了FDA批準(zhǔn)的西藥、實(shí)驗(yàn)階段及研究階段的西藥的靶標(biāo)信息;STITCH數(shù)據(jù)庫收錄了30萬個(gè)小分子和1 133個(gè)物種中260萬種蛋白質(zhì)之間的相互作用信息,這些信息來自實(shí)驗(yàn)、數(shù)據(jù)庫以及文獻(xiàn)挖掘;HIT數(shù)據(jù)庫包含了1 300種中藥的586種成分與1 301種已知靶蛋白間的相互作用信息,這些信息是通過人工閱讀文獻(xiàn)收集的。通過查詢這些數(shù)據(jù)庫,可以獲取中藥有效成分的靶點(diǎn)信息,同時(shí)在研究中藥時(shí)可以選取合適的西藥作為對照。
筆者所在課題組在研究黃連解毒湯的抗類風(fēng)濕機(jī)制時(shí),針對前期實(shí)驗(yàn)識別的該復(fù)方的14種活性化合物,通過搜索HIT數(shù)據(jù)庫獲得91個(gè)靶標(biāo)信息;同時(shí)從DrugBank數(shù)據(jù)庫提取了FDA批準(zhǔn)的4類抗類風(fēng)濕關(guān)節(jié)炎西藥32種,以及它們對應(yīng)的51個(gè)靶標(biāo)的信息,作為黃連解毒湯的對照組。我們發(fā)現(xiàn),黃連解毒湯有5個(gè)靶蛋白與3類西藥的靶蛋白一致,這在一定程度上解釋了該方劑的抗類風(fēng)濕作用[20]。
直觀看來,參與疾病發(fā)生發(fā)展過程的基因和蛋白應(yīng)當(dāng)是治療此疾病的藥靶,然而事實(shí)并不盡如此。Barabási課題組[21]通過構(gòu)建和分析藥靶與疾病基因間的關(guān)系網(wǎng)絡(luò)發(fā)現(xiàn),某些類別的疾病如內(nèi)分泌、血液、心血管和精神類疾病的藥靶偏好于疾病基因,而癌癥、肌肉、骨骼、胃腸道和皮膚類疾病的藥靶只有少部分是疾病基因。對于后一種情況,一般選擇靶向與疾病基因相互作用的蛋白,或直接靶向該相互作用[22]。因此,識別疾病相關(guān)基因和構(gòu)建疾病相關(guān)網(wǎng)絡(luò),是網(wǎng)絡(luò)藥理學(xué)研究的重要內(nèi)容之一。
3.1 疾病相關(guān)基因信息獲取
特定疾病相關(guān)基因的信息可通過數(shù)據(jù)庫查詢及文獻(xiàn)挖掘的方法獲取。目前已有許多數(shù)據(jù)庫記錄了疾病相關(guān)基因的信息,如在線人類孟德爾遺傳數(shù)據(jù)庫OMIM(Online Mendelian Inheritance in Man)[23]、遺傳關(guān)聯(lián)數(shù)據(jù)庫GAD(Genetic Association Database)[24],GeneCard[25]等。OMIM數(shù)據(jù)庫收錄了迄今已知的人類孟德爾遺傳性疾病、遺傳決定的性狀及其致病基因,并提供已知有關(guān)致病基因的連鎖關(guān)系、染色體定位、組成結(jié)構(gòu)和功能等信息。與孟德爾遺傳性疾病不同,常見的復(fù)雜疾病,如心血管疾病、癌癥、自身免疫性疾病、代謝性疾病等,是多因素的疾病,其特異的遺傳基因并不清楚,幾個(gè)基因的改變對特定個(gè)體的易感性也只有微小的貢獻(xiàn)。GAD數(shù)據(jù)庫則重點(diǎn)收錄常見非遺傳性復(fù)雜疾病以及與疾病關(guān)聯(lián)的基因的信息,其信息主要來自文獻(xiàn)報(bào)道。DisGeNET數(shù)據(jù)庫[26]則收錄了包括孟德爾遺傳性疾病和復(fù)雜疾病的疾病-基因關(guān)聯(lián)信息,該數(shù)據(jù)庫是通過整合多個(gè)專家注釋的數(shù)據(jù)庫和文獻(xiàn)挖掘的結(jié)果所構(gòu)建的。通過查詢這些數(shù)據(jù)庫,可以獲取疾病相關(guān)基因的信息。
3.2 疾病網(wǎng)絡(luò)構(gòu)建
與同一疾病相關(guān)的基因所編碼的蛋白往往發(fā)生相互作用而形成疾病網(wǎng)絡(luò)。然而,由于人類目前對復(fù)雜疾病的認(rèn)識還遠(yuǎn)遠(yuǎn)不夠,即目前已知的疾病基因的信息還只是很少的一部分,這些基因在人類全基因組背景網(wǎng)絡(luò)中不一定連成一個(gè)連通的網(wǎng)絡(luò)。由于在網(wǎng)絡(luò)中,結(jié)點(diǎn)首先會(huì)影響它的直接鄰居,最直觀的方法是,將已知疾病基因連同它們在背景網(wǎng)絡(luò)中的直接鄰居,以及這些基因間的相互作用全部提取出來,構(gòu)建成疾病網(wǎng)絡(luò)。例如,Hwang等[27]研究哮喘病時(shí),通過搜索OMIM數(shù)據(jù)庫及分析GEO(Gene Expression Omnibus)數(shù)據(jù)庫中哮喘病的基因芯片數(shù)據(jù),獲得606個(gè)哮喘病相關(guān)基因。將這些基因從由HPRD數(shù)據(jù)庫[28]構(gòu)建的人類全基因組蛋白相互作用網(wǎng)絡(luò)中提取出來,獲得的網(wǎng)絡(luò)由297個(gè)互不相連的子網(wǎng)絡(luò)構(gòu)成,其中有269個(gè)孤立結(jié)點(diǎn)。而他們將這606個(gè)結(jié)點(diǎn)及它們在HPRD網(wǎng)絡(luò)中的直接鄰居提取出來,所構(gòu)建的網(wǎng)絡(luò)含2 438個(gè)結(jié)點(diǎn),其中2 256個(gè)結(jié)點(diǎn)是互相連通的。相比而言,后一個(gè)網(wǎng)絡(luò)更能反映哮喘病基因間的相互作用關(guān)系。但是,已知疾病基因的直接鄰居,與疾病的相關(guān)程度并不一定是相同的。例如,基因A和B分別是1個(gè)和5個(gè)已知疾病基因的直接鄰居,顯然基因B與該疾病的相關(guān)程度更高;在全基因組背景網(wǎng)絡(luò)中,若基因B和C都與5個(gè)已知疾病基因相連,但基因B的其他鄰居個(gè)數(shù)顯著比基因C的多,這2個(gè)基因與該疾病的關(guān)聯(lián)程度也不同。因此,構(gòu)建疾病網(wǎng)絡(luò)需要對背景網(wǎng)絡(luò)中的結(jié)點(diǎn)與已知疾病基因的關(guān)系作更深入的分析。
近年來,人們設(shè)計(jì)了一些算法,在已知疾病基因的基礎(chǔ)上預(yù)測更多的疾病相關(guān)基因。其中,基于蛋白網(wǎng)絡(luò)的算法的基本思想是,將已知疾病基因作為種子,在人類全基因組背景網(wǎng)絡(luò)中,將結(jié)點(diǎn)按照它們在網(wǎng)絡(luò)中與種子結(jié)點(diǎn)的鄰近程度打分排序,排序靠前的基因則預(yù)測為疾病相關(guān)基因。這類算法可以用于疾病網(wǎng)絡(luò)構(gòu)建。即從背景網(wǎng)絡(luò)中將已知疾病基因、預(yù)測的疾病基因,以及這些基因間的相互作用全部提取出來,構(gòu)建成疾病網(wǎng)絡(luò)。
不同的疾病基因預(yù)測算法從不同的角度量化網(wǎng)絡(luò)中結(jié)點(diǎn)與種子結(jié)點(diǎn)的鄰近程度。早期的算法如最近鄰居法[29]、最短路徑法[30]等采用局部網(wǎng)絡(luò)鄰近信息,后來的算法則應(yīng)用全局網(wǎng)絡(luò)鄰近信息,如隨機(jī)漫步法[31]、PageRank法[32]、k步馬爾科夫法(k-step Markov method)[32]、網(wǎng)絡(luò)傳播法[33]、Katz-中心性法[34]等。Navlakha等[35]比較了不同算法,結(jié)果顯示全局算法的結(jié)果顯著優(yōu)于局部算法。李梢課題組[36]提出的疾病基因預(yù)測算法CIPHER則將疾病間的相關(guān)性與網(wǎng)絡(luò)結(jié)點(diǎn)的鄰近性相結(jié)合,利用此算法,他們以O(shè)MIM中類風(fēng)濕關(guān)節(jié)炎基因?yàn)榉N子,預(yù)測了更多類風(fēng)濕關(guān)節(jié)炎相關(guān)的基因,從而構(gòu)建了該疾病的網(wǎng)絡(luò)。
為了理解免疫系統(tǒng)疾病脊柱性關(guān)節(jié)炎的病理機(jī)制,筆者所在課題組收集了GEO數(shù)據(jù)庫中脊柱性關(guān)節(jié)炎的相關(guān)基因芯片數(shù)據(jù)并用統(tǒng)計(jì)方法找出顯著表達(dá)的基因,同時(shí)收集了蛋白組學(xué)實(shí)驗(yàn)獲得的該疾病狀態(tài)下的顯著表達(dá)蛋白,以及OMIM數(shù)據(jù)庫中的脊柱性關(guān)節(jié)炎相關(guān)基因[37]。以這3個(gè)途徑獲得的168個(gè)疾病相關(guān)基因作為種子,利用筆者所在課題組提出的Katz-中心性算法[34],預(yù)測出更多的與該疾病相關(guān)的基因。所有這些基因編碼的蛋白及它們間的相互作用,構(gòu)成了與脊柱性關(guān)節(jié)炎相關(guān)的蛋白相互作用網(wǎng)絡(luò)。該網(wǎng)絡(luò)包含了大量自身免疫系統(tǒng)蛋白以及在骨髓中表達(dá)的蛋白,反映了該疾病是免疫系統(tǒng)紊亂導(dǎo)致的并損害骨骼關(guān)節(jié)系統(tǒng)的特性。
確定藥物所調(diào)控的信號通路或子網(wǎng)絡(luò)是藥理學(xué)研究的核心問題。利用網(wǎng)絡(luò)生物學(xué)的方法和技術(shù),識別中藥活性成分所調(diào)控的信號通路和影響的網(wǎng)絡(luò),并分析靶蛋白間的相互作用關(guān)系、靶蛋白在網(wǎng)絡(luò)中所處的地位和起到的作用,可以幫助我們評價(jià)中藥對疾病網(wǎng)絡(luò)的影響,認(rèn)識中藥的作用機(jī)制。
4.1 藥靶蛋白富集的信號通路識別
信號通路是執(zhí)行重要的生物學(xué)任務(wù)和復(fù)雜的分子信息處理的、由分子間相互作用而形成的生物分子子系統(tǒng)或子網(wǎng)絡(luò)。現(xiàn)有的信號通路數(shù)據(jù)庫如KEGG[38]、Biocarta等收錄了已知的信號通路、構(gòu)成這些信號通路的基因及基因間相互作用的信息。如KEGG數(shù)據(jù)庫收錄了代謝、遺傳信息處理、環(huán)境信息處理、細(xì)胞過程、有機(jī)體系統(tǒng)、人類疾病六大方面約500個(gè)信號通路。簡單地將藥靶蛋白直接映射到這些信號通路的基因集中,可以找到包含這些靶蛋白的通路。通常將藥靶蛋白顯著富集的通路認(rèn)為是受藥物調(diào)控的通路。
統(tǒng)計(jì)方法可以確定藥靶蛋白富集的通路。超幾何累計(jì)概率分布即是一種簡單實(shí)用的方法。具體地講,假設(shè)我們所研究的通路數(shù)據(jù)庫中共有N個(gè)不同的基因,而某中藥的藥靶蛋白共有K個(gè)被映射到不同的通路上,那么,對于某個(gè)包含n個(gè)基因的通路,要衡量其上所映射到的k個(gè)藥靶蛋白是否具有統(tǒng)計(jì)意義上的顯著富集性,可用超幾何累計(jì)概率分布所定義的P值來衡量。公式如下:
對給定的顯著性水平a,若P值小于a,說明這k個(gè)藥靶蛋白存在于這個(gè)含有n個(gè)基因的通路上是隨機(jī)現(xiàn)象的概率小于a。因此可以將P值小于a的通路確定為藥靶蛋白富集的通路。我們在研究黃連解毒湯對類風(fēng)濕性關(guān)節(jié)炎的作用機(jī)制時(shí)[20],使用超幾何累計(jì)分布方法找到了黃連解毒湯的靶標(biāo)富集的32個(gè)信號通路,包括免疫相關(guān)信號通路、破骨細(xì)胞分化通路、細(xì)胞因子受體相互作用通路等。根據(jù)這些通路的功能,結(jié)合李梢課題組[39]對中醫(yī)寒癥、熱癥所對應(yīng)的分子網(wǎng)絡(luò)研究結(jié)果,可推斷黃連解毒湯主要通過調(diào)節(jié)免疫和骨平衡,達(dá)到對熱癥型類風(fēng)濕關(guān)節(jié)炎的治療效果。Li等[40]使用纈草蜘蛛香的主要活性化合物異戊酸基二氫纈草素作用于卵巢癌A2780和OVCAR-3細(xì)胞系,發(fā)現(xiàn)該化合物對卵巢癌細(xì)胞的增長和繁殖起著劑量依賴的抑制作用,并通過基因芯片實(shí)驗(yàn),識別到392和183個(gè)基因分別在該化合物作用后的A2780和OVCAR-3卵巢癌細(xì)胞系中差異表達(dá),這些基因可看成卵巢癌細(xì)胞中受異戊酸基二氫纈草素所影響的基因。用超幾何累計(jì)分布方法找出了該化合物調(diào)控的主要信號通路,其中有3個(gè)信號通路是在2種卵巢癌細(xì)胞系中都被顯著調(diào)控的,其中包括p53信號通路。進(jìn)一步的實(shí)驗(yàn)結(jié)果顯示,纈草蜘蛛香通過激活p53的信號轉(zhuǎn)導(dǎo)通路,誘導(dǎo)卵巢癌細(xì)胞凋亡和抑制卵巢癌細(xì)胞生長及其細(xì)胞周期進(jìn)程。
基因集富集分析法(gene set enrichment analysis,GSEA)則定義了更有針對性的統(tǒng)計(jì)指標(biāo),包括富集分(ES)、標(biāo)準(zhǔn)化富集分(NES)、假陽性發(fā)現(xiàn)率(FDR)、標(biāo)稱P值(nominal P-value),用于識別某基因集所富集的通路[41]。GSEA軟件包可免費(fèi)下載使用,其中集成了常用通路數(shù)據(jù)庫中的數(shù)據(jù)。
4.2 藥物所影響的子網(wǎng)絡(luò)的構(gòu)建及治療效應(yīng)的評價(jià)
藥物的靶標(biāo)蛋白間相互作用的網(wǎng)絡(luò)被認(rèn)為是藥物所影響的子網(wǎng)絡(luò)。與構(gòu)建疾病網(wǎng)絡(luò)的情況類似,靶標(biāo)蛋白在全基因組背景網(wǎng)絡(luò)中不一定連在一起,因此需要建立一些合理的算法,確定網(wǎng)絡(luò)中的結(jié)點(diǎn)和邊。
最簡單直觀的方法,仍然是將靶標(biāo)蛋白及其在背景網(wǎng)絡(luò)中的直接鄰居和相互作用全部提取出來,構(gòu)建子網(wǎng)絡(luò)。但這樣的網(wǎng)絡(luò)含有太多多余的結(jié)點(diǎn)和邊,需要一定的簡化。例如Huang等[42]構(gòu)建青蒿素所影響的蛋白間的相互作用網(wǎng)絡(luò)時(shí),就先采用此方法得到一個(gè)初步的網(wǎng)絡(luò),然后再經(jīng)過兩步簡化:1)刪除連接蛋白之間的邊;2)若2個(gè)靶標(biāo)蛋白之間有多個(gè)連接蛋白,則刪除連接度小的連接蛋白,最終獲得一個(gè)簡化的靶標(biāo)蛋白間相互作用網(wǎng)絡(luò)。筆者所在課題組在構(gòu)建藥靶間相互作用網(wǎng)絡(luò)時(shí),采用了圖論中Steiner最小樹算法,確定最少的靶標(biāo)蛋白間的連接蛋白[10,43]。Antonov等[44]使用隨機(jī)模擬的方法解決此問題,編寫的軟件PPI spider可自由下載使用。
如前所述,基于網(wǎng)絡(luò)的疾病基因預(yù)測方法的原理,是量化網(wǎng)絡(luò)中的結(jié)點(diǎn)與作為種子結(jié)點(diǎn)的疾病基因的鄰近程度,從而可用于構(gòu)建疾病網(wǎng)絡(luò)。同理,當(dāng)把藥物的靶標(biāo)蛋白取為種子結(jié)點(diǎn)時(shí),這類方法同樣可用于構(gòu)建藥物所影響的子網(wǎng)絡(luò)。這類方法的優(yōu)點(diǎn)在于,它可以用預(yù)測算法的所給的分值,來近似量化靶標(biāo)蛋白對網(wǎng)絡(luò)中其他蛋白的影響程度,從而得到藥物對網(wǎng)絡(luò)中各個(gè)蛋白影響程度的近似值??梢詫⒂绊懛指哂谀硞€(gè)給定閾值的蛋白及其相互作用提取出來,構(gòu)建藥物所影響的子網(wǎng)絡(luò)。
復(fù)方中藥中不同成分間通過多靶標(biāo)協(xié)同作用,形成集團(tuán)作戰(zhàn)的態(tài)勢,進(jìn)而發(fā)揮療效。如何確定這種協(xié)同作用、量化評價(jià)藥物作用于多靶標(biāo)所達(dá)成的終極治療效應(yīng),仍然是中藥藥理學(xué)研究中的難題。李梢課題組[45]提出的基于網(wǎng)絡(luò)靶標(biāo)的多成分協(xié)同作用識別法NIMS,將不同成分的靶標(biāo)在疾病網(wǎng)絡(luò)上的位置關(guān)系、與靶標(biāo)對應(yīng)的疾病譜的關(guān)系結(jié)合起來,確定存在協(xié)同作用的成分組合。筆者所在課題組在研究黃連解毒湯抗類風(fēng)濕作用機(jī)制時(shí),應(yīng)用隨機(jī)漫步算法,分別計(jì)算了類風(fēng)濕關(guān)節(jié)炎的疾病基因和黃連解毒湯的靶標(biāo)蛋白對全基因組網(wǎng)絡(luò)中各蛋白的影響分,獲得疾病影響向量和藥物影響向量。用這2個(gè)向量的內(nèi)積,分別量化評價(jià)黃連解毒湯的每個(gè)靶標(biāo)、以及全體靶標(biāo)對風(fēng)濕關(guān)節(jié)炎疾病網(wǎng)絡(luò)的總體影響水平,并與FDA批準(zhǔn)的4種抗風(fēng)濕西藥以及隨機(jī)對照進(jìn)行了對比研究[20]。這些方法,代表了網(wǎng)絡(luò)中藥藥理學(xué)研究從定性向定量研究的努力嘗試。
通過多種化學(xué)成分的組合用藥,中藥可以實(shí)現(xiàn)在遠(yuǎn)低于正常單一化學(xué)成分有效劑量下的同等藥效。低劑量、多靶點(diǎn)、耐藥性和毒副作用小這些用藥特色,使得中藥在治療多基因調(diào)控的某些復(fù)雜疾病和需要長期用藥的慢性疾病時(shí),有著獨(dú)特優(yōu)勢。當(dāng)前,基于分子網(wǎng)絡(luò)的“多靶點(diǎn)藥物”發(fā)現(xiàn)的理念正逐漸成為一種新的趨勢[1],并成為生物學(xué)、藥物學(xué)和化學(xué)界的學(xué)術(shù)熱點(diǎn),且藥物發(fā)現(xiàn)領(lǐng)域有一種向傳統(tǒng)藥物、民族藥物獲取資源和靈感的潮流[46]。近年來中藥網(wǎng)絡(luò)藥理學(xué)研究證明,在細(xì)胞網(wǎng)絡(luò)的背景下研究中藥的主要成分及其靶點(diǎn)的作用,能幫助我們從本質(zhì)上了解中藥的整體、辨證、協(xié)調(diào)的用藥觀點(diǎn)。我們相信,在分子網(wǎng)絡(luò)調(diào)控的水平上闡明中藥的作用機(jī)制,將給多靶點(diǎn)藥物發(fā)現(xiàn)提供有益的啟示和借鑒,并有可能從臨床有效的中藥反向開發(fā)現(xiàn)代多組分新藥,對中藥現(xiàn)代化也將起著積極的推動(dòng)作用。
[1]Hopkins A L. Network pharmacology: the next paradigm in drug discovery[J]. Nat Chem Biol, 2008, 4 (11): 682-690.
[2]Barabasi A L, Gulbahce N, Loscalzo J. Network medicine: a networkbased approach to human disease[J]. Nat Rev Genet, 2011, 12 (1): 56-68.
[3]Zhao J, Jiang P, Zhang W. Molecular networks for the study of TCM pharmacology [J]. Brief Bioinform, 2010, 11 (4): 417-430.
[4]任廷革, 劉曉峰, 高劍波. 中醫(yī)藥基礎(chǔ)數(shù)據(jù)庫系統(tǒng)介紹[J]. 中國中醫(yī)藥信息雜志, 2001, 8 (11): 90-91.
[5]Qiao X, Hou T, Zhang W, et al. A 3D structure database of components from Chinese traditional medicinal herbs [J]. J Chem Inf Comput Sci, 2002, 42 (3): 481-489.
[6]Xue R, Fang Z, Zhang M, et al. TCMID: traditional Chinese medicine integrative database for herb molecular mechanism analysis [J]. Nucleic Acids Res, 2013, 41 (D1): D1089-D1095.
[7]Chen C Y. TCM Database@ Taiwan: the world's largest traditional Chinese medicine database for drug screening in silico [J]. PLoS One, 2011, 6 (1): e15939.
[8]Lybrand T P. Ligand-protein docking and rational drug design [J]. Curr Opin Struct Biol , 1995, 5 (2): 224-228.
[9]Reardon S. Project ranks billions of drug interactions [J]. Nature, 2013, 503: 449-450.
[10]Zhao J, Yang P, Li F, et al. Therapeutic effects of astragaloside IV on myocardial injuries: multi-target identification and network analysis [J]. PLoS One, 7 (9): e44938.
[11]Willett P, Barnard J M, Downs G M. Chemical similarity searching [J]. J Chem Inf Comput Sci, 1998, 38 (6): 983-996.
[12]Lounkine E, Keiser M, Whitebread S, et al. Large-scale prediction and testing of drug activity on side-effect targets [J]. Nature, 2012, 486: 361-367.
[13]Zhang Y, Wang D, Tan S, et al. A systems biology-based investigation into the pharmacological mechanisms of Wu Tou Tang acting on rheumatoid arthritis by integrating network analysis [J]. Evid Based Complement Alternat Med, 2013, 2013: 548498.
[14]Chen X, Ji Z L, Chen Y Z. TTD: therapeutic target database [J]. Nucleic Acids Res, 2002, 30: 412-415.
[15]Zhao S, Li S. Network-based relating pharmacological and genomic spaces for drug target identification [J]. PLoS One, 2010, 5 (7): e11764.
[16]Wishart D S, Knox C, Guo A C, et al. DrugBank: a comprehensive resource for in silico drug discovery and exploration [J]. Nucleic Acids Res, 2006, 34: 668-672.
[17]Kuhn M, von Mering C, Campillos M, et al. STITCH: interaction networks of chemicals and proteins [J]. Nucleic Acids Res, 2008, 36 (Suppl 1): D684-D688.
[18]Gao Z, Li H, Zhang H, et al. PDTD: a web-accessible protein database for drug target identification [J]. BMC Bioinformatics, 2008, 9: 104.
[19]Ye H, Ye L, Kang H, et al. HIT: linking herbal active ingredients to targets [J]. Nucleic Acids Res, 2011, 39 (Suppl 1): D1055-D1059.
[20]Fang H, Wang Y, Yang T, et al. Bioinformatics analysis for the antirheumatic effects of Huang-Lian-Jie-Du-Tang from a network perspective [J]. Evid Based Complement Alternat Med, 2013, 2013: 245357.
[21]Yildirim M A, Goh K I, Cusick M E, et al. Drug-target network [J]. Nat Biotechnol, 2007, 25 (10): 1119-1126.
[22]Vassilev L, Vu B, Graves B, et al. In vivo activation of the p53 pathway by small-molecule antagonists of MDM2 [J]. Science, 2004, 303: 844-848.
[23]Hamosh A, Scott A F, Amberger J S, et al. Online mendelian inheritance in man (OMIM), a knowledgebase of human genes and genetic disorders [J]. Nucleic Acids Res, 2005, 33 (Suppl 1): D514-D517.
[24]Becker K G., Barnes K C, Bright T J, et al. The genetic association database [J]. Nat Genet, 2004, 36: 431-432.
[25]Safran M, Dalah I, Alexander J, et al. GeneCards Version 3: the human gene integrator [J]. Database (Oxford), 2010: baq020.
[26]Bauer-Mehren A, Bundschus M, Rautschka M, et al. Gene-disease network analysis reveals functional modules in mendelian, complex and environmental diseases [J]. PLoS One, 2011, 6 (6): e20284.
[27]Hwang S, Son S W, Kim S C, et al. A protein interaction network associated with asthma [J]. J Theor Biol, 2008, 252 (4): 722-731.
[28]Keshava Prasad T S, Goel R, Kandasamy K, et al. Human protein reference database——2009 update[J]. Nucleic Acids Res, 2009, 37 (Suppl 1): D767-D772.
[29]Oti M, Snel B, Huynen M A, et al. Predicting disease genes using protein-protein interactions [J]. J Med Genet, 2006, 43 (8): 691-698.
[30]Krauthammer M, Kaufmann C A, Gilliam T C, et al. Molecular triangulation: bridging linkage and molecular-network information for identifying candidate genes in Alzheimer's disease [J]. Proc Natl Acad Sci USA, 2004, 101 (42): 15148-15153.
[31]K?hler S, Bauer S, Horn D, et al. Walking the interactome for prioritization of candidate disease genes [J]. Am J Hum Genet, 2008, 82 (4): 949-958.
[32]Chen J, Aronow B, Jegga A. Disease candidate gene identification and prioritization using protein interaction networks [J]. BMC Bioinformatics, 2009, 10 (1): 73.
[33]Vanunu O, Magger O, Ruppin E, et al. Associating genes and protein complexes with disease via network propagation [J]. PLoS Comput Biol, 2010, 6 (1): e1000641.
[34]Zhao J, Yang T H, Huang Y, et al. Ranking candidate disease genes from gene expression and protein interaction: a Katz-centrality based approach [J]. PLoS One, 2011, 6 (9): e24306.
[35]Navlakha S, Kingsford C. The power of protein interaction networks for associating genes with diseases [J]. Bioinformatics, 2010, 26 (8): 1057-1063.
[36]Wu X, Jiang R, Zhang M Q, et al. Network-based global inference of human disease genes [J]. Mol Syst Biol, 2008, 4: 189.
[37]Zhao J, Chen J, Yang T H, et al. Insights into the pathogenesis of axial spondyloarthropathy from network and pathway analysis [J]. BMC Syst Biol, 2012, 6 (Suppl 1): S4.
[38]Kanehisa M, Goto S. KEGG: Kyoto encyclopedia of genes and genomes [J]. Nucleic Acids Res, 2000, 28 (1): 27-30.
[39]Li S, Zhang Z, Wu L, et al. Understanding ZHENG in traditional Chinese medicine in the context of neuro-endocrine-immune network [J]. IET Syst Biol, 2007, 1 (1): 51-60.
[40]Li X, Chen T, Lin S, et al. Valeriana jatamansi constituent IVHD-valtrate as a novel therapeutic agent to human ovarian cancer: in vitro and in vivo activities and mechanisms [J]. Curr Cancer Drug Targets, 2013, 13 (4): 472-483.
[41]Subramanian A, Tamayo P, Mootha V K, et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles [J]. Proc Natl Acad Sci USA, 2005, 102 (43): 15545-15550.
[42]Huang C, Ba Q, Yue Q, et al. Artemisinin rewires the protein interaction network in cancer cells: network analysis, pathway identification, and target prediction [J]. Mol Biosyst, 2013, 9 (12): 3091-3100.
[43]Lu B, Zhao J, Xu L, et al. Identification of molecular target proteins in berberine-treated cervix adenocarcinoma HeLa cells by proteomic and bioinformatic analyses [J]. Phytother Res, 2011, 26 (5): 646-656.
[44]Antonov A V, Dietmann S, Rodchenkov I, et al. PPI spider: a tool for the interpretation of proteomics data in the context of protein–protein interaction networks [J]. Proteomics, 2009, 9 (10): 2740-2749.
[45]Li S, Zhang B, Zhang N. Network target for screening synergistic drug combinations with application to traditional Chinese medicine [J]. BMC Syst Biol, 2011, 5 (Suppl 1): S10.
[46]Verpoorte R, Crommelin D, Danhof M, et al. Commentary: "A systems view on the future of medicine: inspiration from Chinese medicine?"[J]. J Ethnopharmacol, 2009, 121 (3): 479-481.
[專家介紹] 趙靜:女,1965年8月生。博士,解放軍后勤工程學(xué)院教授,碩士生導(dǎo)師,應(yīng)用數(shù)學(xué)學(xué)科帶頭人。先后于1985年、1988年在重慶大學(xué)應(yīng)用數(shù)學(xué)系獲應(yīng)用數(shù)學(xué)學(xué)士、碩士學(xué)位,2008年在上海交通大學(xué)生命科學(xué)技術(shù)學(xué)院獲生物信息學(xué)博士學(xué)位。1988年至今在解放軍后勤工程學(xué)院基礎(chǔ)部數(shù)學(xué)教研室工作。主要從事復(fù)雜網(wǎng)絡(luò)理論在生物學(xué)、生物醫(yī)學(xué)及中藥藥理學(xué)方面的應(yīng)用研究。主持承擔(dān)4項(xiàng)國家自然科學(xué)基金、2項(xiàng)863項(xiàng)目、多項(xiàng)省部級及軍隊(duì)級科研項(xiàng)目,獲得重慶市自然科學(xué)二等獎(jiǎng)一項(xiàng)、軍隊(duì)科技進(jìn)步二等獎(jiǎng)、三等獎(jiǎng)各一項(xiàng),獲中國人民解放軍院校育才獎(jiǎng)銀獎(jiǎng),榮立三等功一次。近年來在國內(nèi)外學(xué)術(shù)期刊上發(fā)表相關(guān)論文30余篇,其中SCI論文20余篇。任多家國際學(xué)術(shù)期刊編委會(huì)成員和審稿人。
趙靜教授課題組從2008年起與第二軍醫(yī)大學(xué)藥學(xué)院張衛(wèi)東教授實(shí)驗(yàn)室合作,用基于分子網(wǎng)絡(luò)的系統(tǒng)生物學(xué)方法開展中藥藥理學(xué)的研究。開發(fā)了基于分子網(wǎng)絡(luò)拓?fù)涮匦缘乃惴?,預(yù)測疾病致病基因、構(gòu)建疾病相關(guān)的和藥物干預(yù)的分子網(wǎng)絡(luò),用以分析復(fù)雜疾病的生物學(xué)過程及藥物作用機(jī)制。應(yīng)用所提出的研究路線和開發(fā)的算法,開展了一系列復(fù)雜疾病的病理以及特定的中藥活性成分治療相應(yīng)的復(fù)雜疾病的機(jī)制研究,初步揭示了這些復(fù)雜疾病的分子網(wǎng)絡(luò)特性,以及闡明所研究的中藥活性成分的作用機(jī)制。在此領(lǐng)域已完成一項(xiàng)國家自然科學(xué)基金項(xiàng)目“基于網(wǎng)絡(luò)生物學(xué)的藥物分子作用機(jī)理研究”,相關(guān)研究成果發(fā)表在“Briefings in Bioinformatics”、“Journal of Proteomics Research”、“Journal of Ethnopharmacology”和“BMC Systems Biology”等知名期刊上。
Bioinformatics Approaches in Research on Network Pharmacology of Traditional Chinese Medicine
ZHAO Jing1, FANG Haiyang1, ZHANG Weidong2
(1. Department of Basic Science, Logistical Engineering University of PLA, Chongqing 401311, China; 2. Pharmacology School, No.2 Military Medical University, Shanghai 200433, China)
In order to treat complex diseases such as cancer, cardiovascular diseases and immune system disorders more effectively, the philosophy of molecular network-based multi-target drug discovery has gradually become a new trend. The holistic and synergetic medication mode of traditional Chinese medicine (TCM) has once again attracted a great interest in the field of drug discovery. TCM has shown exact therapeutic efficacy and low side effects in the treatment of chronic complex diseases. TCM network pharmacology seeks to clarify the action mode of TCM in the context of molecular networks. It may provide useful inspiration for drug discovery and develop the effective multi-component and multi-target drugs from clinically effective TCM along a reverse drug discovery path. Focusing on the four steps for network-based TCM pharmacology study, this review introduced the recent bioinformatics approaches applied in the research field of TCM network pharmacology.
network pharmacology; traditional Chinese medicine; disease gene; drug target; signaling pathway; molecular network
Q811.4
A
1001-5094(2014)02-0097-07
*接受日期:2013-12-21
項(xiàng)目資助:國家自然科學(xué)基金資助項(xiàng)目(No.61372194;No.10971227; No.81260672;No.81230090)
趙靜,教授;
研究方向:系統(tǒng)生物學(xué),中藥藥理學(xué);
Tel:023-86730938;E-mail:zhaojanne@gmail.com