国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

生物信息學在藥物研究和開發(fā)中的應用

2014-03-23 11:50:31王可鑒
中國藥理學與毒理學雜志 2014年1期
關(guān)鍵詞:信息學基因組生物

王可鑒,賀 林,楊 侖,2,3

(1.上海交通大學Bio-X研究院,上海200030;2.Glaxosmithkline,Systematic Drug Repositioning,Philadelphia 19406,USA;3.School of Pharmacy,Medical School,University of South Florida,Tampa 33620,USA)

生物信息學在藥物研究和開發(fā)中的應用

王可鑒1,賀 林1,楊 侖1,2,3

(1.上海交通大學Bio-X研究院,上海200030;2.Glaxosmithkline,Systematic Drug Repositioning,Philadelphia 19406,USA;3.School of Pharmacy,Medical School,University of South Florida,Tampa 33620,USA)

生物信息學作為一門綜合計算機科學、信息技術(shù)和數(shù)學理論開發(fā)新的算法和統(tǒng)計方法的學科,對生物實驗數(shù)據(jù)進行分析從而確定數(shù)據(jù)中所隱含的生物學意義,并開發(fā)新的數(shù)據(jù)分析工具以實現(xiàn)對各種信息的獲取和管理的交叉學科。其主要優(yōu)勢在于以低成本和高通量的方式對大量生物學和醫(yī)學數(shù)據(jù)進行管理和分析,側(cè)重于從中進一步挖掘與藥物療效、作用機制和副作用等相關(guān)的有價值的信息,為藥物研究提供參考和指導?;诘屯克幚砘蚨纠韺W實驗的傳統(tǒng)新藥研發(fā)流程具有周期長、成本高和失敗率高的局限性。結(jié)合其成功運用藥物生物信息學進行新藥研發(fā)和舊藥新用的經(jīng)驗,本綜述介紹了藥物生物信息學在新藥研發(fā)中的新進展,表明在我國建設(shè)藥物生物信息學平臺的重要性和必要性。

新藥;生物信息學;藥物不良反應

DOl:10.3867/j.issn.1000-3002.2014.01.018

新藥研發(fā)過程中需要解決的一個十分重要卻又異常復雜的問題是:藥物以何種方式影響了哪些通路以及通路中的哪些基因,進而如何產(chǎn)生藥效或毒性。通常情況下,藥理學、毒理學或分子生物學實驗是主要的探究方法。然而,考慮到這些方法或平臺所需的資金和人力往往難以達到最佳的投入產(chǎn)出比,生物信息學方法則能體現(xiàn)出其特有的優(yōu)勢。例如在計算機輔助下,通過對基因組學和其他組學數(shù)據(jù)進行分析,能夠以較小資金投入實現(xiàn)對“藥物-基因”關(guān)系的高通量篩選,從而降低了科研風險。應當說,在當前新藥研發(fā)的各種主流策略中,生物信息學越來越受到重視,分析高通量組學數(shù)據(jù)的生物信息學方法發(fā)揮著重要的作用。

1 藥物生物信息學研究的基本原理

生物信息學在生命科學研究中,是一門綜合計算機科學、信息技術(shù)和數(shù)學理論開發(fā)新的算法和統(tǒng)計方法的交叉學科,對生物實驗數(shù)據(jù)進行分析從而確定數(shù)據(jù)中所隱含的生物學意義,并開發(fā)新的數(shù)據(jù)分析工具以實現(xiàn)對各種信息的獲取和管理[1]。生物信息學是隨著人類基因組計劃的啟動而興起的,其研究范圍涵蓋了生物學數(shù)據(jù)的整理、存檔、顯示、計算和模擬,基因遺傳和物理圖譜的處理,核苷酸和氨基酸序列分析,新基因的發(fā)現(xiàn)和蛋白質(zhì)結(jié)構(gòu)的預測等方面。而藥物生物信息學作為生物信息學的一個重要獨立分支學科,則更側(cè)重于處理與藥物直接相關(guān)的知識和數(shù)據(jù),如舊藥新用、不良反應、藥物作用機制、藥物相互作用和電子病歷等信息,并在臨床轉(zhuǎn)化和新藥研發(fā)中發(fā)揮著重要作用[2]。當前,藥物相關(guān)的研發(fā)受益于生物技術(shù)和計算機技術(shù)的進步,并不斷產(chǎn)生著大量的與藥物作用和藥物反應相關(guān)的高通量數(shù)據(jù),例如基因組學[3]、轉(zhuǎn)錄組學、蛋白質(zhì)組學和代謝組學等等[4]。因此,當今藥物研發(fā)在信息處理層面上的主要瓶頸不再是數(shù)據(jù)的匱乏,而是數(shù)據(jù)過剩帶來的信息解讀的不充分。也就是說,藥理學和毒理學研究的發(fā)展和進步不僅要依靠更新更快的硬件平臺來產(chǎn)生數(shù)據(jù),也要依靠更有效更可靠的各種算法、軟件和工具來對大量抽象的實驗數(shù)據(jù)進行清晰而準確的分析。而藥物生物信息學就是挖掘和利用實驗數(shù)據(jù)中的信息,從眾多的數(shù)值、文本和序列中去偽存真,發(fā)現(xiàn)統(tǒng)一的、系統(tǒng)性的藥理或臨床規(guī)律,并將這些規(guī)律總結(jié)成可讀可視可用的格式(如圖表、公式和軟件等)以供后續(xù)的研究參考和使用,從而促進高效和安全的藥物研發(fā)。可以預見,隨著生命科學的研究方向不斷向系統(tǒng)生物學的思維靠攏,藥物研發(fā)也將越來越多地遵循系統(tǒng)藥理和毒理學的研究思路,其中藥物生物信息學必將發(fā)揮越來越重要的作用[5]。

2 藥物生物信息學的新發(fā)展

從理論上講,藥理學、毒理學以及其他與藥物的結(jié)構(gòu)、作用和反應相關(guān)的研究都與生物信息學的研究范疇存在交叉。所以,生物信息學方法在藥物相關(guān)的研究中也得到了越來越深入和廣泛的應用[6]。并且,伴隨著基因組學的進步和藥物研發(fā)的升級,逐漸演化出了藥物生物信息學這一門應用性、實踐性很強的學科分支。它綜合應用生命科學、數(shù)學、計算機科學等多學科的理論和方法,對伴隨基因組計劃產(chǎn)生的海量生物信息進行整理和分析,然后將結(jié)果應用于藥物的設(shè)計、優(yōu)化和開發(fā),以實現(xiàn)更加合理的藥物設(shè)計與使用作為最終目的。

在新藥研發(fā)的流程中,幾乎每一個主要步驟都有生物信息學發(fā)揮的重要作用[7](圖1)。①先導化合物篩選:藥物研發(fā)的本質(zhì)就是發(fā)現(xiàn)具有特定生物學和藥理學活性的化合物分子。而這類分子的前身就是通常所說的“先導化合物”[8],以往需要在海量的化合物分子中通過生物化學方法進行大規(guī)模的篩選,其成本極其高昂。在生物信息學定量構(gòu)效關(guān)系模型(QSAR)的幫助下,可以總結(jié)出某些規(guī)律,指示具有特定化學結(jié)構(gòu)的分子更傾向于具有特定的藥理作用。比如運用藥物分子與靶蛋白模擬對接法[9]和以藥效團作為提問結(jié)構(gòu)的三維結(jié)構(gòu)搜索法[10]能夠從數(shù)據(jù)庫中搜索所需的先導化合物。當直接從數(shù)據(jù)庫中搜索不到所需的化合物分子時,可運用化合物設(shè)計方面的生物信息學工具重新對先導化合物分子進行構(gòu)建[11],這些方法從多個角度提高了化合物篩選的效率并降低了成本,業(yè)已成為現(xiàn)代藥物研發(fā)的常規(guī)必要手段。② 靶蛋白發(fā)現(xiàn):藥靶發(fā)現(xiàn)歷來是藥物開發(fā)的先決條件,人類基因組測序的不斷完善為藥物研究提供了大量的潛在靶基因,但如何在眾多的基因和序列中找到真正有效的藥物靶標是一個制藥業(yè)必須面對的嚴峻考驗[12]。應用生物信息學方法可以對已知有效的靶基因進行量化分析,比如總結(jié)其在核苷酸和氨基酸序列方面的特性,并將其他一系列人類基因與經(jīng)典靶基因進行基因結(jié)構(gòu)上的同源性對比,從而快速確定新基因是否有潛力成為新藥靶[13],這樣就可以避免盲目而草率地進行相對昂貴的實驗驗證。而最近各種新興的脫靶(o ff-target)挖掘技術(shù)的產(chǎn)生[14-22],又為新靶點的發(fā)現(xiàn)提供新的候選。比如,通過計算機模擬可實現(xiàn)數(shù)百個化合物分子和數(shù)百個人類蛋白之間的模擬對接,得到了一個大規(guī)模的“藥物-蛋白互作組”(CPI)矩陣,從中挖掘出一系列與舊藥新用或不良反應相關(guān)的藥物脫靶現(xiàn)象[19,22-26]。如果要通過傳統(tǒng)的化學方法分析如此數(shù)量的藥物和藥靶之間的未知關(guān)系,將需要投入大量的人力物力且必須經(jīng)過一個較長的研究周期。③藥物作用機制:在確定了藥物分子的化學結(jié)構(gòu)和靶蛋白之后,通常還需要進一步研究藥物與機體不同組織和細胞之間相互作用的結(jié)果,從而確定藥物可通過何種方式對潛在適應證產(chǎn)生療效以及可產(chǎn)生的副作用。在傳統(tǒng)的藥物研發(fā)中,這一階段的研究主要基于動物模型實驗。由于動物培養(yǎng)和藥物處理通常所需的時間很長且成本極高,所以數(shù)據(jù)規(guī)模有限,難以進行不同藥物之間橫向的對比,影響了研究結(jié)論的系統(tǒng)性和可靠性。通過結(jié)合大規(guī)模的微陣列和創(chuàng)新的生物信息學分析方法(詳見本文第3部分),可以在基因組表達層面上比較不同藥物在作用機制上的相似性,在很大程度上促進了藥物機制的研究。④臨床統(tǒng)計分析:經(jīng)過不斷優(yōu)化和測試的化合物究竟是否成為一個成功的藥物,其最終的評價標準還在于臨床應用的效果,在這一方面生物信息學的參與也極具重要性[24]。眾所周知,動輒涉及數(shù)千患者的臨床試驗是藥物開發(fā)流程中成本最高的步驟,如果由于患者樣本的選擇不合理而引起統(tǒng)計學上的偏差,則無異于拿患者寶貴的生命和巨大的資源投入來冒險。而使用生物信息學工具在基因組水平對臨床受試的患者群體進行有效的劃分和甄別,可以大大提高新藥開發(fā)的效率并節(jié)省大量的時間和經(jīng)費。比如,美國斯坦福大學的Tatonetti等[25-26]收集了大量的臨床試驗數(shù)據(jù)和電子醫(yī)療記錄并進行整理,在分析中有效消除了其中性別年齡等協(xié)變量的干擾。通過觀察藥物在大的人群樣本中傾向于引起那些特定的藥物反應,可以從中發(fā)現(xiàn)未知的新藥靶、藥物適應證和藥物聯(lián)用。

圖1 藥物生物信息學方法在藥物研發(fā)中的應用.

隨著生物技術(shù)的進步和數(shù)據(jù)生成的爆炸式增長,上述的越來越多數(shù)據(jù)都將需要生物信息學加以組織和分析[27],從而實現(xiàn)對藥物與適應證關(guān)系的總結(jié)、藥物不良反應事件的監(jiān)測、藥物未知作用機制研究以及舊藥新用(藥物重定位)[28-30]和不良反應的預測等。大型醫(yī)療信息數(shù)據(jù)庫是生物信息學在臨床藥理研究中最早的應用方向,即利用計算機把服藥者分散的醫(yī)療信息匯總并重新組織,從而建立可供記錄和查詢大型數(shù)據(jù)庫。迄今,已經(jīng)有一系列數(shù)據(jù)庫成功地應用于相關(guān)研究。利用信息學在標準化評價上的優(yōu)勢,研究者得以對服藥者對藥物的反應進行客觀的因果關(guān)系分析并以概率定量的形式全面準確評價所有可能的影響因素[31]。在數(shù)據(jù)庫的高效框架下,生物信息學通過對藥物數(shù)據(jù)的儲存、處理、分析來“提煉”包含在海量數(shù)據(jù)中的相關(guān)知識,及其生物學和藥理學意義,從而為破解藥物作用的內(nèi)在機制提供線索。研究機制的最終目的是實現(xiàn)準確的預測,即最大限度地避免不良反應導致的人身傷害和經(jīng)濟損失,或者最大限度地抓住對舊藥物進行重新定位的機會。單純依靠分子生物學實驗的研究方法通常耗資大,周期長;而對生物信息學工具[32]加以充分利用,使其與生物學實驗驗證相配合,則能夠取長補短、發(fā)揮合力。研究表明,現(xiàn)有的預測工具雖然在預測效率方面仍然有提高的空間,但至少能夠在一定程度上為化學、藥理、毒理學家和制藥公司等提供決策支持[33-34]。這說明藥物生物信息學方法作為一種與傳統(tǒng)生物學實驗和臨床試驗方法互補的新研究途徑,有望為藥物開發(fā)開拓出一條新路。

3 藥物生物信息學在新藥研發(fā)中的應用:基于表達譜的藥物研究

雖然許多研究都致力于解釋藥物分子在上游結(jié)合靶蛋白之后,間接地影響了哪些下游基因,以及這些下游基因之間又發(fā)生了怎樣的相互作用和形成了怎樣的網(wǎng)絡[25,35],但是想要通過可視化的圖表和可定量的數(shù)據(jù)來描述每一個受到藥物影響的下游基因卻是件十分艱巨的任務。一方面,生物體內(nèi)基因與基因之間的關(guān)系是一個有機的整體,當上游的藥物作用影響到了第一批下游基因后,受影響的基因又會繼續(xù)調(diào)控第二批、第三批基因,而且這種波浪式擴散中往往還包含著正反饋[36]和負反饋[37]效應,因此任何一個藥物對體內(nèi)基因的作用都可謂“牽一發(fā)而動全身”。另一方面,對于如此復雜的藥物作用,如果單純依靠分子生物學實驗來進行逐個基因的驗證無疑將耗費大量的資源和時間。按照生物學發(fā)展的現(xiàn)有條件來說,要同時確定一大批基因的表達變化的方式和程度,可行性和可靠性最高的方案就是通過基因芯片平臺對整個基因組的表達水平進行高通量的檢測。

由于基因芯片技術(shù)的普及,在生物學領(lǐng)域的各大公共數(shù)據(jù)庫中已經(jīng)公開了大量藥物相關(guān)的基因組表達數(shù)據(jù)。其中對基因芯片比較典型的應用方式是使用各種藥物處理人類或動物組織的細胞[38],通過比較藥物處理前后細胞內(nèi)基因表達譜可以得到差異表達基因(differentially expressed gene),用來代表藥物的藥效特征信號,或者稱為基因組中的特征基因。假設(shè)藥物A引起一部分基因表達上調(diào)和另一部分基因表達下調(diào);同時某個治療另一種適應證與A不同的藥物B處理細胞后,A引起上調(diào)(或下調(diào))的基因在B處理的細胞中也普遍傾向于表達升高(或降低)。這種情況表明A和B調(diào)控的基因具有高度正相關(guān)的表達變化,也就是說兩種藥物影響下游基因的方式高度相似,則A和B很可能在作用機制方面存在某種未知的重疊或關(guān)聯(lián)。從類似A和B這樣的“藥物-藥物”配對中尋找新的適應證定位即檢驗A是否能夠治療B的適應證,或B治療A的適應證顯然比隨機的篩選或經(jīng)驗型地摸索具有更高的效率和成功率?;谝陨线壿嫷囊幌盗醒芯慷既〉昧肆钊诵欧慕Y(jié)果[39],足見通過計算藥物之間在基因組表達譜上的相關(guān)度來對比它們在作用機制上的相似性是一條完全可行的研究道路[40]。然而,由于不同的基因芯片、不同的實驗設(shè)計甚至不同的實驗人員操作習慣都能對基因芯片實驗的結(jié)果產(chǎn)生一定程度的影響,因此相互獨立的小規(guī)模實驗所產(chǎn)出的藥物特征基因表達譜往往不具備足夠的相互之間的可比性,也就難以進行統(tǒng)一的數(shù)據(jù)分析來實現(xiàn)大規(guī)模的新藥研發(fā)。

2006年,美國Broad研究所的Lamb等[41-42]在美國《Science》上發(fā)表了其建立的大規(guī)模藥物處理人類細胞的數(shù)據(jù)庫以及相關(guān)研究成果。在這個被被命名為“聯(lián)系圖”(connectivity map,CMap)的藥物基因組學研究項目中,研究人員首先使用1309種藥物對6100個人類細胞系進行了處理(圖2)。處理之后的細胞相對于未經(jīng)處理的對照細胞必定產(chǎn)生了某種程度的基因表達變化。其后,研究人員利用Affymetrix公司的微陣列技術(shù)平臺對所有細胞中的20 000余個基因進行了定量檢驗,從而明確地測量出每個細胞系在特定藥物處理后有哪些基因發(fā)生了表達水平的上調(diào)或下調(diào),這些信息即構(gòu)成了該藥物特有的“基因組表達譜”。最后,通過對比不同藥物之間在基因組表達譜上的相關(guān)程度即可判斷藥物在調(diào)控下游基因的方式上的相似程度,也就間接反映了不同藥物是否影響了相近的或部分重疊的下游基因。例如,如果某個治療糖尿病的藥物在CMap中的基因組表達譜體現(xiàn)出與多個抗癌藥物的顯著正向相關(guān)性,則預示著該糖尿病藥物很可能調(diào)控了癌癥相關(guān)基因并具有潛在的抗癌作用。

圖2 聯(lián)系圖的設(shè)計原理.

為了定量衡量一對藥物表達譜之間正向或負向的相關(guān)程度,CMap根據(jù)特定的計算方法能夠給出一個介于-1和+1之間的“聯(lián)系分值”,用以定量衡量各藥物表達譜之間的相似程度。首先在藥物A的基因組中選擇表達差異最大的一部分基因探針(比如上調(diào)和下調(diào)各500個,合計1000個探針)作為其“特征基因”。隨后,將藥物B的基因組中所有22 283個基因探針與藥物的特征基因進行比對。如果A的上調(diào)特征基因(下調(diào)同理)在B中更多地傾向于過表達,則代表兩藥在基因調(diào)控方面的相似程度越高。該程度可以量化為以下分值:

第i個(i為1~500之間的某個數(shù)值)在B表達譜中的上調(diào)排名(介于1~22 283之間)?;诖擞嬎愎剑梢詫崿F(xiàn)不同藥物之間高效率的基因組表達定量比對。在過往以CMap為基礎(chǔ)的眾多研究中,主要的思路就是以某個藥物的基因組表達譜為參照,將其在整個CMap數(shù)據(jù)中進行“查詢”(即將所有的CMap基因組表達譜與之進行比對),最終正向聯(lián)系分值最高(最接近于+1)的一部分藥物便被認為可能與參照藥物之間存在下游基因調(diào)控和臨床藥物反應層面上的潛在關(guān)聯(lián)。

對于每個細胞樣本來說,其中一部分加入特定藥物而成為“處理組”,而另一部分未作任何處理便作為“對照組”。處理組相對于對照組細胞來說,各個基因的表達水平應當都發(fā)生了某種程度的變化,而整個基因組的整體變化水平就是該處理藥物特有的基因組表達譜。當把某個藥物作為參照標準時,其基因組表達譜中上調(diào)和下調(diào)倍數(shù)最高的一部分基因就被選為該藥物的特征基因。如果要查詢某個其他藥物與參照藥物在基因組表達譜上的相似程度,只需計算參照藥物的特征基因在查詢藥物的表達譜中的上調(diào)和下調(diào)水平。如果參照藥物的上調(diào)(或下調(diào))基因在查詢藥物處理的細胞中也普遍傾向于上調(diào)(或下調(diào)),則兩者的表達譜呈正向相關(guān);反之,如果參照藥物的上調(diào)(或下調(diào))基因卻在查詢藥物處理的細胞中呈現(xiàn)出普遍下調(diào)(或上調(diào))的趨勢,則兩者為反向相關(guān)。

自從發(fā)表以來,各方基于CMap數(shù)據(jù)的研究主要集中在舊藥新用方面,而且取得了一系列不同程度的進展[43-44]。還有研究以改進CMap基本分析方法為切入點,通過一定的預處理程序提高CMap數(shù)據(jù)的質(zhì)量[45-46],再用升級后的CMap發(fā)掘出之前被埋沒在數(shù)據(jù)噪聲中的信號,從而展示了數(shù)據(jù)預處理對藥物研發(fā)的重要性。在此對若干最具代表性的應用性研究加以詳細介紹。

發(fā)現(xiàn)具有抗癌活性的新藥物,是生命科學的熱點領(lǐng)域之一。而如何以低投入和高效率的方式發(fā)現(xiàn)抗癌新藥始終是一個難點問題。意大利Tele Thon研究所的Isacchi研究組廣泛分析了所有1309個CMap藥物之間的表達譜相似度,并從中發(fā)現(xiàn)了一系列相互緊密聯(lián)系并具有相似療效的的“藥物群”[47]。比如,2DOG(2-deoxy-D-glucose)分子已知能夠引發(fā)細胞自噬作用,一種與癌癥、感染和神經(jīng)退行性疾病廣泛相關(guān)的生物學過程。而在藥物群中,2DOG和降血壓藥物法舒地爾體現(xiàn)出了顯著的強聯(lián)系,表明法舒地爾具有潛在的引發(fā)細胞自噬的能力。為了驗證這一CMap生成的線索,分別以人類成纖維細胞和HeLa細胞為模型,該研究組檢測了法舒地爾對細胞自噬作用標志物LC3-Ⅱ水平變化的影響。免疫印跡和抗體免疫染色的雙重證據(jù)都證實,法舒地爾引發(fā)了明顯的細胞自噬,從而通過低成本和高通量的數(shù)據(jù)分析精準發(fā)現(xiàn)了法舒地爾的潛在抗癌療效。

美國斯坦福大學的Butte研究組基于CMap方法進行了成功的老藥新用研究,并在《Nature Transl Med》上發(fā)表了2篇系列文章。該研究組首先從美國國立衛(wèi)生研究院(NIH)的Gene Expression Omnibus數(shù)據(jù)庫中收集了大量數(shù)據(jù),最終提取出100個疾病模型和164個化合物小分子的基因組表達譜信息。通過CMap的分析方法,可以計算藥物分子與疾病模型的反向聯(lián)系。比如疾病模型中上調(diào)(或下調(diào))的基因在藥物處理中普遍下調(diào)或(上調(diào)),則很可能提示了未知的“藥物-適應證”關(guān)系。比如,抗驚厥藥托吡酯被發(fā)現(xiàn)可能具有治療炎癥性腸病的作用[48],而在硝基苯磺酸引發(fā)的炎癥性腸病動物模型中,口服托吡酯顯著減輕了總體病理特征和受感染結(jié)腸組織的為損傷。同時,抗?jié)兯幬镂鬟涮娑。浊柽潆遥┚哂袧撛诘目拱┋熜У睦纤幮掠眉僭O(shè)也在動物疾病模型中得到了有效驗證[49]。

美國愛荷華大學的Adams研究組通過反向比對的方法,提出了針對肌肉萎縮這一常見疑難疾病的新療法。該研究組首先從人類和大鼠的肌肉樣本中定位出63個與肌肉萎縮顯著相關(guān)的m RNA片段,用以表征相關(guān)的體內(nèi)病理環(huán)境。隨后,通過將疾病特征m RNA與CMap藥物的基因組表達模式進行對比,尋找到了包括熊果酸在內(nèi)的一部分與疾病樣本顯著相反的藥物。該研究組認為,那些與病理樣本相反的藥物有可能扭轉(zhuǎn)肌肉萎縮的體內(nèi)環(huán)境,從而實現(xiàn)對疾病的治療。最后,動物模型實驗證明熊果酸確實刺激了與肌肉生長相關(guān)的信號通路,并且有效提升了動物體內(nèi)的肌肉重量。相關(guān)結(jié)果發(fā)表在《Cell Metabolism》上,為肌肉萎縮的治療提供全新的臨床研究方向。

在積極應用藥物基因組表達數(shù)據(jù)同時,研究者們也注意到以CMap為代表的大規(guī)模表達數(shù)據(jù)在數(shù)據(jù)質(zhì)量上可能存在著一些不容忽視的問題。其中最主要的問題就是大規(guī)模生物學實驗中常見的“批次效應”,即數(shù)據(jù)信號的主要決定因素并非樣本本身的生物學特征,而是樣本在獲取、培養(yǎng)或測量過程中周圍環(huán)境的微小差異。具體到CMap數(shù)據(jù)中,由于全部6100個細胞樣本是在302個不同批次中培養(yǎng)出來,研究人員發(fā)現(xiàn),同一批次不同藥物處理的樣本之間的表達相似度甚至高于同一藥物不同批次的細胞樣本(即細胞培養(yǎng)條件的噪聲掩蓋了藥物作用的信號)。為了克服這一不足,生物信息學家們從不同角度提出了多個解決方案。研究者發(fā)現(xiàn),對于同一藥物處理的不同批次細胞來說,其差異主要體現(xiàn)在細胞條件而非藥物作用,所以其表達譜的差異基本能夠反映細胞批次間的差異。通過對此差異進行定量計算,可以對整個CMap進行系統(tǒng)性的校正。結(jié)果表明,校正后的CMap表達譜更真實地反映了藥物作用的特性,并成功地被用來研究藥物藥靶的表達[50]。美國葛蘭素史克制藥公司的科學家也發(fā)現(xiàn),通過對CMap聯(lián)系分值的計算方法進行改進,以基因表達向量之間的“余弦值”作為衡量相似度的標準,可以有效突出藥物作用在表達譜中的信號,并借此成功地預測了舊藥新用的機會[51]??梢灶A見,通過不斷的優(yōu)化實驗設(shè)計和生物信息學方法,CMap及其他大規(guī)模基因組表達數(shù)據(jù)受到批次效應的影響將越來越弱,并越來越有力地促進基于生物信息學的藥物研發(fā)。

4 展望

綜合以上眾多的理論性和應用性研究,可以發(fā)現(xiàn)在系統(tǒng)生物學理論的指導下,基于藥物生物信息學方法對藥物相關(guān)的高通量數(shù)據(jù)進行分析和挖掘,能夠在傳統(tǒng)的經(jīng)驗性臨床摸索和低通量實驗之外,建立一套更高效的新藥研發(fā)的方法論。較之實驗藥理、毒理學和臨床醫(yī)學研究,藥物生物信息學方法在研究成本具有優(yōu)勢,研發(fā)周期也相對更短,特別是在臨床樣本收集和動物模型建立十分困難的研究“初級階段”,可采用系統(tǒng)生物學理論和生物信息學方法摸清大致脈絡,從而實現(xiàn)在前期較少經(jīng)費的基礎(chǔ)上,為后續(xù)實驗提供可行可靠的假說,也就為后續(xù)長期大額經(jīng)費的投入指明了正確的方向。因此,建立并完善我國藥物生物信息學平臺,對于研發(fā)適合我國國情的舊藥新用(藥物新組合),或預測并預防藥物不良反應具有重大意義,是我國新藥創(chuàng)制不可缺少的重大平臺。

但同時我們也必須認識到,單純依靠藥物生物信息學分析并不能直接得到新的藥物和療法,而是最終要落實到生物化學和臨床醫(yī)學實驗當中。單純依靠實驗而忽視了在計算層面上對信息和數(shù)據(jù)的深入分析,則難以有效地降低藥物研發(fā)成本和提高研發(fā)效率。因此,未來藥物生物信息學乃至整個制藥工業(yè)的發(fā)展方向必將是信息學、藥理、毒理學和醫(yī)學的高度協(xié)作。

[1] Wada A.Bioinformatics-the necessity of the quest for″first principles″in life[J].Bioinformatics,2000,16(8):663-664.

[2] Altman RB.Introduction to translational bioinformatics collection[J].PLoS Comput Biol,2012,8(12):e1002796.

[3] Xiao L,Zhang J,Sirois P,He N,Li K.A new strategy for next generation sequencing:merging the Sanger′s method and the sequencing by synthesis through rep lacing extension[J].J Biomed Nanotechnol,2011,7(4):568-571.

[4] Schneider MV,Orchard S.Omics technologies,data and bioinformatics principles[J].Methods Mol Biol,2011,719:3-30.

[5] Kumar S,Dudley J.Bioinformatics software for biologists in the genomics era[J].Bioinformatics,2007,23(14):1713-1717.

[6] Whittaker PA.What is the relevance of bioinformatics to pharmacology?[J].Trends Pharmacol Sci,2003,24(8):434-439.

[7] Terstappen GC,Reggiani A.In silico research in drug discovery[J].Trends Pharmacol Sci,2001,22(1):23-26.

[8] Lewell XQ,Jones AC,Bruce CL,Harper G,Jones MM,McLay IM,et al.Drug rings database with web interface.A tool for identifying alternative chemical rings in lead discovery programs[J].J Med Chem,2003,46(15):3257-3274.

[9] Chakraborty B,Roy AS,Dasgupta S,Basu S.Magnetic field effect corroborated with docking study to explore photoinduced electron transfer in drug-protein interaction[J].J Phys Chem A,2010,114(51):13313-13325.

[10] Huang D,Lüthi U,Kolb P,Edler K,Cecchini M,Audetat S,et al.Discovery of cell-permeable nonpeptide inhibitors of beta-secretase by highthroughput docking and continuum electrostatics calculations[J].J Med Chem,2005,48(16):5108-5111.

[11] Yang J,Zhan CY,Dong XC,Yang K,Wang FX.Interaction of human fibrinogen receptor(GPⅡb-Ⅲa)with decorsin[J].Acta Pharmacol Sin,2004,25(8):1096-1104.

[12] Berry S.Drug discovery in the wake of genomics[J].Trends Biotechnol,2001,19(7):239-240.

[13] FerrariS,Losasso V,CostiMP.Sequence-based identification of specific drug target regions in the thymidylate synthase enzyme family[J].Chem Med Chem,2008,3(3):392-401.

[14] Xie L,Wang J,Bourne PE.In silico elucidation of the molecular mechanism defining the adverse effect of selective estrogen receptor modulators[J].PLoS Com put Biol,2007,3(11):e217.

[15] Campillos M,Kuhn M,Gavin AC,Jensen LJ,Bork P.Drug target identification using side-effect similarity[J].Science,2008,321(5886):263-266.

[16] Keiser MJ,Setola V,Irwin JJ,Laggner C,Abbas AI,Hufeisen SJ,et a l.Predicting new molecular targets for known drugs[J].Nature,2009,462(7270):175-181.

[17] Yang L,Chen J,He L.Harvesting candidate genes responsible for serious adverse drug reactions from a chemical-protein interactome[J].PLoS Com put Biol,2009,5(7):e1000441.

[18] Luo H,Chen J,Shi L,Mikailov M,Zhu H,Wang K,et al.DRAR-CPI:a server for identifying drug repositioning potential and adverse drug reactions via the chemical-protein interactome[J].Nucleic Acids Res,2011,39(Web Server issue):W492-W 498.

[19] Yang L,Luo H,Chen J,Xing Q,He L.SePreSA:a server for the prediction of populations susceptible to serious adverse drug reactions implementing the methodology of a chemical-protein interactome[J].Nucleic Acids Res,2009,37(Web Server issue):W 406-W412.

[20] Yang L,Wang K,Chen J,Jegga AG,Luo H,Shi L,et al.Exploring off-targets and off-systems for adverse drug reactions via chemical-protein in teractome-clozapine-induced agranulocytosis as a case study[J].PLoS Comput Biol,2011,7(3):e1002016.

[21] Yang L,Chen J,Shi L,Hudock MP,Wang K,He L.Identifying unexpected therapeutic targets via chemical-protein interactome[J].PLoS One,2010,5(3):e9568.

[22] Yang L,W ang KJ,Wang LS,Jegga AG,Qin SY,He G,et al.Chemical-protein interactome and its application in o ff-target identification[J].Interdiscip Sci,2011,3(1):22-30.

[23] Luo H,Chen J,Shi L,Mikailov M,Zhu H,Wang K,et a l.DRAR-CPI:a serve r for identifying drug repositioning potential and adverse drug reactions via the chemical-protein interactome[J].Nucleic Acids Res,2011,39(Web Server issue):W492-W498.

[24] ZvárováJ.IMIA Conference″Statistical Methodology in Bioinformatics and Clinical Trials″[J].Methods In f Med,2006,45(2):137-138.

[25] Tatonetti NP,Denny JC,Murphy SN,F(xiàn)ernald GH,Krishnan G,Castro V,et al.Detecting drug interactions from adverse-event reports:interaction between paroxetine and pravastatin increases blood glucose levels[J].Clin Pharmacol Ther,2011,90(1):133-142.

[26] Tatonetti NP,Liu T,Altman RB.Predicting d rug side-effects by chemical system s biology[J].Genome Biol,2009,10(9):238.

[27] Qu XA,Gud ivada RC,Jegga AG,Neumann EK,Aronow BJ.Inferring novel disease indications for known drugs by semantically linking drug action and disease mechanism relationships[J].BMC Bioinformatics,2009,10(Suppl5):S4.

[28] Zhang YX,Cheng XR,Zhou WX.Drug repositioning:an important application of network pharmacology[J].Chin J Pharmacol Toxicol(中國藥理學與毒理學雜志),2012,26(6):779-786.

[29] Yang L,Agarwal P.Systematic drug repositioning based on clinical side-effects[J].PLoS One,2011,6(12):e28025.

[30] Sardana D,Zhu C,Zhang M,Gudivada RC,Yang L,Jegga AG.Drug repositioning for orphan diseases[J].Brief Bioinform,2011,12(4):346-356.

[31] Kramer MS,Leventhal JM,Hutchinson TA,F(xiàn)einstein AR.An algorithm for the operational assessment of adverse drug reactions.Ⅰ.Background,description,and instructions for use[J].JAMA,1979,242(7):623-632.

[32] Vroling B,Sanders M,Baakman C,Borrmann A,Verhoeven S,Klomp J,et al.GPCRDB:information system for G protein-coup led receptors[J].Nucleic Acids Res,2011,39(Database issue):D309-D319.

[33] von Eichborn J,Murgueitio MS,DunkelM,Koerner S,Bourne PE,Preissner R.PROMISCUOUS:a database fo r network-based drug-repositioning[J].Nucleic Acids Res,2011,39(Database issue):D1060-D1066.

[34] Tan NX,Rao HB,Li ZR,Li XY.Prediction of chemical carcinogenicity by machine learning approaches[J].SAR QSAR Environ Res,2009,20(1-2):27-75.

[35] Yang L,Xu L,He L.A CitationRank algorithm inheriting Google technology designed to highlight genes responsible for serious adverse drug reaction[J].Bioinformatics,2009,25(17):2244-2250.

[36] Veelken H,Leutgeb B,Kulmburg P,F(xiàn)iebig HH,Mackensen A,Lindemann A.Enhancement of a constitutively active promoter for gene therapy by a positive feed-back transcriptional activator mechanism[J].Int J Mol Med,1998,2(4):423-428.

[37] Lombardi L,Grignani F,Sternas L,Cechova K,Inghirami G,Dalla-Favera R.Mechanism of negative feed-back regulation of c-myc gene expression in B-cells and its inactivation in tum or cells[J].Curr Top Microbiol Immunol,1990,166:293-301.

[38] Zhou M,Liu Z,Zhao Y,Ding Y,Liu H,Xi Y,et al.MicroRNA-125b confers the resistance of breast cancer cells to paclitaxel through suppression of pro-apoptotic Bcl-2 antagonist killer 1(Bak1)expression[J].J Biol Chem,2010,285(28):21496-21507.

[39] Covell DG,Wallqvist A,Huang R,ThankiN,Rabow AA,Lu XJ.Linking tum or cell cytotoxicity to mechanism of d rug action:an integ rated analysis of gene expression,small-molecule screening and structural databases[J].Proteins,2005,59(3):403-433.

[40] Wen Z,Wang Z,Wang S,Ravula R,Yang L,Xu J,et al.Discovery of molecular mechanism s of traditional Chinese medicinal formula Si-Wu-Tang using gene expression microarray and connectivity map[J].PLoS One,2011,6(3):e18278.

[41] Lamb J.The connectivity map:a new tool for biomedical research[J].Nat Rev Cancer,2007,7(1):54-60.

[42] Lamb J,Craw ford ED,Peck D,Modell JW,Blat IC,Wrobel MJ,et al.The connectivity map:using gene-expression signatures to connect small molecules,genes,and disease[J].Science,2006,313(5795):1929-1935.

[43] Wang G,Ye Y,Yang X,Liao H,Zhao C,Liang S.Expression-based in silico screening of candidate therapeutic com pounds for lung adenocarcinoma[J].PLoS One,2011,6(1):e14573.

[44] McArt DG,Zhang SD.Identification of candidate small-molecule therapeutics to cancer by gene-sig-nature perturbation in connectivity mapping[J].PLoS One,2011,6(1):e16382.

[45] Kadota K,Shimizu K.Evaluating methods for ranking differentially expressed genes applied to microArray quality control data[J].BMC Bioinformatics,2011,12:227.

[46] Iskar M,Campillos M,Kuhn M,Jensen LJ,van Noort V,Bork P.Drug-induced regulation of target expression[J].PLoS Comput Biol,2010,6(9):e1000925.

[47] Iorio F,Bosotti R,Scacheri E,Belcastro V,Mithbaokar P,F(xiàn)erriero R,et al.Discovery of d rug mode of action and drug repositioning from transcriptional responses[J].Proc Natl Acad Sci USA,2010,107(33):14621-14626.

[48] Dudley JT,Sirota M,Shenoy M,Pai RK,Roedder S,Chiang AP,et al.Computational repositioning of the anticonvulsant topiramate for inflammatory bowel disease[J].Sci Transl Med,2011,3(96):96 ra76.

[49] Sirota M,Dudley JT,Kim J,Chiang AP,Morgan AA,Sweet-Cordero A,et al.Discovery and preclinical validation of drug indications using compendia of public gene expression data[J].Sci Transl Med,2011,3(96):96ra77.

[50] Chen C,Grennan K,Badner J,Zhang D,Gershon E,Jin L,et al.Removing batch effects in analysis of expression microarray data:an evaluation of six batch adjustment methods[J].PLoS One,2011,6(2):e17238.

[51] Cheng J,Xie Q,Kumar V,Hurle M,F(xiàn)reudenberg JM,Yang L,et al.Evaluation of analytical methods for connectivity map data[J].Pac Symp Biocomput,2013:5-16.

Application of bioinformatics in pharmaceutical research and development

WANG Ke-jian1,HE Lin1,YANG Lung1,2,3
(1.Bio-X Institutes,Shanghai Jiao Tong University,Shanghai 200030,China;2.Glaxosmithkline,Systematic Drug Repositioning,Philadelphia 19406,USA;3.School of Pharmacy,Medical School,University of South Florida,Tam pa 33620,USA)

New drug development is a hot point in life sciences.For a developing country like China,it is always economically and socially important to deliver a series of new drugs or repurposed drugs in order to provide people with safe,effective and affordable therapies.Because of low throughput pharmacology/toxicology assays and clinical trials,traditional drug development pipelines are subject to long cycles,high cost and failure risk.As an interdisciplinary subject,bioinformatics shows specific advantage in management and processing of large-scale biological and medical data,at relatively low cost and high throughput.In drug development,bioinformatics is more often used to discover drug efficacy,mechanisms of action and side effects and to guide research and development.Based on the experience of d rug development and drug repositioning in international pharmaceutical enterprises,the authors proposed the application of bioinformatics to new drug development and illustrated the importance and necessity of bioinformatics platforms in China.

new drugs;bioinformatics;adverse d rug reaction

YANG Lun,E-mail:Lun.Yang@gm ail.com;HE Lin,E-mail:helin@bio-x.cn,Tel:(021)62933338

R318.04

A

1000-3002(2014)01-0118-08

2013-05-24 接受日期:2013-10-18)

(本文編輯:付良青)

王可鑒(1984-),男,博士研究生,主要從事生物信息學研究;楊 侖(1981-),博士,研究員,主要從事藥物生物信息學、舊藥新用和個性化用藥的信息學研究;賀 林(1953-),男,博士,教授,主要從事轉(zhuǎn)化醫(yī)學研究。

楊 侖,E-mail:Lun.Yang@gmail.com;賀 林,E-mail:helin@bio-x.cn,Tel:(021)62933338

猜你喜歡
信息學基因組生物
生物多樣性
天天愛科學(2022年9期)2022-09-15 01:12:54
生物多樣性
天天愛科學(2022年4期)2022-05-23 12:41:48
上上生物
牛參考基因組中發(fā)現(xiàn)被忽視基因
雞NRF1基因啟動子區(qū)生物信息學分析
第12話 完美生物
航空世界(2020年10期)2020-01-19 14:36:20
初論博物館信息學的形成
中國博物館(2018年2期)2018-12-05 05:28:50
miRNA-148a在膀胱癌組織中的表達及生物信息學分析
基因組DNA甲基化及組蛋白甲基化
遺傳(2014年3期)2014-02-28 20:58:49
有趣的植物基因組
世界科學(2014年8期)2014-02-28 14:58:31
乌兰察布市| 砀山县| 苍南县| 沐川县| 扶绥县| 江永县| 上林县| 清远市| 玉山县| 定陶县| 顺平县| 茶陵县| 嘉义县| 武平县| 常德市| 宣化县| 诏安县| 宁德市| 琼海市| 海南省| 惠州市| 成都市| 吴川市| 四会市| 文登市| 贺州市| 凤凰县| 崇阳县| 临安市| 澎湖县| 彝良县| 烟台市| 兴隆县| 九龙县| 桦甸市| 博湖县| 聊城市| 报价| 锡林郭勒盟| 永城市| 长葛市|