国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

藥物-靶標(biāo)相互作用預(yù)測(cè)平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)

2023-05-15 07:27:46任浩然鄧博韜李建華孝大宇
現(xiàn)代計(jì)算機(jī) 2023年5期
關(guān)鍵詞:子集靶標(biāo)內(nèi)核

任浩然,鄧博韜,李建華,孝大宇

(東北大學(xué)醫(yī)學(xué)與生物信息工程學(xué)院, 沈陽(yáng) 110169)

0 引言

藥物在疾病的預(yù)防和治療中發(fā)揮著重要作用,不斷開發(fā)新的藥物是人類戰(zhàn)勝疾病的必要手段。新藥開發(fā)成本高昂,從抽象概念到市場(chǎng)產(chǎn)品,一種新藥研究和開發(fā)成本估計(jì)為1.61~45.4 億美元[1]。舊藥新用,也稱為藥物重定向,是對(duì)現(xiàn)有藥物發(fā)現(xiàn)新的適應(yīng)癥[2]。藥物重定向極大減少了藥物開發(fā)的時(shí)間與成本,目前已經(jīng)取得一些突破性的成果。例如,研究發(fā)現(xiàn),傳統(tǒng)的止痛藥阿司匹林具有降低腦卒中復(fù)發(fā)、預(yù)防心肌梗死等功效。

自新冠肺炎疫情暴發(fā)以來,藥物重定向成為國(guó)內(nèi)外諸多科學(xué)家與研究機(jī)構(gòu)的關(guān)注焦點(diǎn)。2022 年7 月25 日,中國(guó)國(guó)家藥監(jiān)局應(yīng)急附條件批準(zhǔn)阿茲夫定用于治療普通型新冠肺炎成年患者,這是我國(guó)首個(gè)國(guó)產(chǎn)新冠口服藥,而該藥原本用于治療艾滋病。

利用計(jì)算機(jī)發(fā)現(xiàn)潛在的藥物-靶標(biāo)相互作用(drug-target interaction,DTI)是藥物重定向的一種重要方法。設(shè)計(jì)和開發(fā)一款藥物-靶標(biāo)相互作用預(yù)測(cè)平臺(tái),對(duì)相關(guān)生物醫(yī)學(xué)知識(shí)的科學(xué)普及、學(xué)生科研訓(xùn)練及藥物重定向研發(fā)具有重要意義。

1 平臺(tái)框架

在藥物重定向的過程中,可以先利用計(jì)算機(jī)預(yù)測(cè)出可能的藥物-靶標(biāo)相互作用,然后在實(shí)驗(yàn)室和臨床驗(yàn)證這些相互作用的真實(shí)性。所設(shè)計(jì)的藥物重定向平臺(tái)將實(shí)現(xiàn)篩選潛在藥物-靶標(biāo)相互作用的功能,為了評(píng)估平臺(tái)的有效性,需要確定實(shí)驗(yàn)的數(shù)據(jù)集、數(shù)據(jù)處理、預(yù)測(cè)方法、評(píng)估標(biāo)準(zhǔn)及測(cè)試流程等。預(yù)測(cè)方法決定著平臺(tái)的預(yù)測(cè)性能,將在第2節(jié)專門介紹。

1.1 標(biāo)準(zhǔn)數(shù)據(jù)集

本平臺(tái)采用文獻(xiàn)報(bào)道的標(biāo)準(zhǔn)數(shù)據(jù)集[3],根據(jù)藥物-靶標(biāo)相互作用類型數(shù)據(jù)集分為Enzyme、IC、GPCR 和NR 四個(gè)子集。每個(gè)子集中包括藥物名稱、靶標(biāo)名稱、藥物-靶標(biāo)相互作用的信息。同時(shí),對(duì)于每種藥物計(jì)算了該藥物與其他藥物的化學(xué)結(jié)構(gòu)相似性(DS_CS),對(duì)于每種靶標(biāo)計(jì)算了該靶標(biāo)與其他靶標(biāo)的蛋白質(zhì)序列相似性(TS_Seq)。表1列出了標(biāo)準(zhǔn)數(shù)據(jù)集中各子集包含的藥物、靶標(biāo)及相互作用的數(shù)量。

表1 藥物-靶標(biāo)相互作用預(yù)測(cè)標(biāo)準(zhǔn)數(shù)據(jù)集

1.2 相似性計(jì)算與Logistic變換

目前很多藥物是通過靶標(biāo)蛋白發(fā)揮治療作用的。因此,基于藥物-藥物相似性、靶標(biāo)蛋白-靶標(biāo)蛋白相似性及藥物-靶標(biāo)相互作用可以推測(cè)尚未發(fā)現(xiàn)的藥物-靶標(biāo)關(guān)聯(lián)。除了前述標(biāo)準(zhǔn)數(shù)據(jù)集中的DS_CS和TS_Seq,基于藥物-靶標(biāo)相互作用能夠計(jì)算出新的藥物相似性和靶標(biāo)相似性數(shù)據(jù)。

藥物-靶標(biāo)相互作用可以視為由0 和1 組成的矩陣。藥物和靶標(biāo)分別構(gòu)成矩陣的行和列,如果藥物與靶標(biāo)相互作用,那么相應(yīng)的位置為1,否則為0。藥物di與所有靶標(biāo)的相互作用情況可用一維向量IP(di)表示,靶標(biāo)ti與所有藥物的相互作用情況可用一維向量IP(ti)表示。

根據(jù)向量夾角余弦公式,可得到兩種藥物di和dj的余弦相似性:

同理,可得到兩種靶標(biāo)ti和tj的余弦相似性:

根據(jù)文獻(xiàn)報(bào)道的高斯內(nèi)核方法[4],可以計(jì)算兩種藥物di和dj的高斯內(nèi)核相似性:

其中

類似地,也可以獲得兩種靶標(biāo)ti和tj的高斯內(nèi)核相似性:

其中

一般地,設(shè)γd′=1,γt′=1,nd表示藥物的數(shù)量,nt表示靶標(biāo)的數(shù)量。

最終,獲得3 種藥物相似性數(shù)據(jù):DS_CS、DS_Cos和DS_Gauss,以及3種靶標(biāo)相似性數(shù)據(jù):TS_CS、TS_Cos 和TS_Gauss。各種相似性數(shù)據(jù)值域?yàn)椋?,1]。表2 列出了從Type1 到Type4 共4種組合類型,不同組合對(duì)預(yù)測(cè)結(jié)果的影響將在后文闡述,更復(fù)雜的組合可按照相同的思路研究。相似性數(shù)據(jù)本質(zhì)上是一個(gè)方陣,因此也稱之為相似性矩陣。

表2 藥物和靶標(biāo)相似性數(shù)據(jù)的組合

表2 中的第二、三列是DS和TS,可以選擇是否經(jīng)過Logistic 變換處理,通過對(duì)比預(yù)測(cè)結(jié)果,可以確定這種變換的作用。藥物和靶標(biāo)的Logistic變換如下面公式所示:

其中,C為常數(shù),可以通過交叉驗(yàn)證確定,本研究取C=-20。為了處理相似性數(shù)據(jù)為0的情況,設(shè)d=log(9999)。

1.3 驗(yàn)證方法

本平臺(tái)采用網(wǎng)絡(luò)一致性投影(network consistency projection,NCP)法預(yù)測(cè)潛在的藥物-靶標(biāo)關(guān)聯(lián)[5]。為了評(píng)估NCP方法的預(yù)測(cè)性能,采用5折交叉驗(yàn)證。將已知的DTI數(shù)據(jù)隨機(jī)分為5份,每次取4 份作為訓(xùn)練集,剩余的1 份作為驗(yàn)證集,循環(huán)5次,每份都將作一次驗(yàn)證集。

將預(yù)測(cè)結(jié)果與驗(yàn)證集比較,可以得到真陽(yáng)性率和假陽(yáng)性率,進(jìn)而繪制接受者操作特性曲線(receiver operating characteristic curve,ROC)。ROC 曲線下的面積為AUC 值,該值越大,性能越好。本文以AUC值作為評(píng)估標(biāo)準(zhǔn)。

1.4 預(yù)測(cè)流程圖

本平臺(tái)預(yù)測(cè)流程如圖1 所示?;谒幬?靶標(biāo)相互作用可以獲得藥物和靶標(biāo)的余弦相似性數(shù)據(jù)和高斯內(nèi)核相似性數(shù)據(jù)。將相似性數(shù)據(jù)組合,獲得4種組合類型。每種類型在實(shí)驗(yàn)時(shí)選擇是否采用Logistic 變換。然后,藥物相似性數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)一致性投影(DNCP),靶標(biāo)相似性數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)一致性投影(TNCP),將兩種投影數(shù)據(jù)合成(DTNCP),獲得預(yù)測(cè)的藥物-靶標(biāo)關(guān)聯(lián)。在每種組合類型下,分別5 折交叉驗(yàn)證,以AUC值評(píng)判預(yù)測(cè)性能。

圖1 藥物-靶標(biāo)相互作用平臺(tái)預(yù)測(cè)流程

2 預(yù)測(cè)方法

每種組合都包含了藥物相似性矩陣DS和靶標(biāo)相似性矩陣TS。DS中行向量DS(i, :)表示藥物i與其他藥物的相似性,TS中列向量TS(:,j)表示靶標(biāo)j與其他靶標(biāo)的相似性。矩陣A表示藥物-靶標(biāo)相互作用,A中各行表示藥物,各列表示靶標(biāo),A(i,:)表示藥物i與各靶標(biāo)的相互作用信息,A(:,j)表示靶標(biāo)j與各藥物的相互作用信息。網(wǎng)絡(luò)一致性投影預(yù)測(cè)藥物-靶標(biāo)關(guān)聯(lián)分為三步。

第一步,通過藥物相似性,計(jì)算藥物i和靶標(biāo)j之間的關(guān)聯(lián)值DNCP(i,j):

第二步,通過靶標(biāo)相似性,計(jì)算藥物i和靶標(biāo)j之間的關(guān)聯(lián)值TNCP(i,j):

第三步,通過DNCP(i,j)和TNCP(i,j),計(jì)算藥物i和靶標(biāo)j之間的預(yù)測(cè)關(guān)聯(lián)值DTNCP(i,j):

在上述公式中,對(duì)于向量x,‖x‖表示對(duì)x取模運(yùn)算。當(dāng)采用Logistic變換時(shí),將公式(9)~(11)中的DS和TS分別替換為從公式(7)和(8)得到的DS_L和TS_L。

3 系統(tǒng)測(cè)試與分析

本系統(tǒng)以Matlab為開發(fā)和運(yùn)行環(huán)境。Matlab具有強(qiáng)大的矩陣運(yùn)算能力,適于計(jì)算藥物相似性矩陣DS、靶標(biāo)相似性矩陣TS,并結(jié)合藥物-靶標(biāo)相互作用矩陣A,實(shí)現(xiàn)NCP 預(yù)測(cè)算法。首先,基于原始相似矩陣預(yù)測(cè);然后,選擇Logistic變換對(duì)原始相似矩陣處理后再進(jìn)行預(yù)測(cè)。

3.1 基于原始相似數(shù)據(jù)的預(yù)測(cè)

首先,從Type1 到Type4 組合,4 種組合中DS和TS不采用Logistic 變換,對(duì)Enzyme、IC、GPCR 和NR 中藥物-靶標(biāo)相互作用矩陣A進(jìn)行5折交叉驗(yàn)證,實(shí)驗(yàn)結(jié)果如表3所示。

表3 不同相似性組合預(yù)測(cè)AUC比較

從表3可見,對(duì)于每種標(biāo)準(zhǔn)數(shù)據(jù)子集,采用余弦相似性的Type1 和Type2 總體優(yōu)于采用高斯內(nèi)核相似性的Type3和Type4。Enzyme和IC中包含更多的藥物和靶標(biāo),AUC 值高于0.9,GPCR和NR中包含藥物和靶標(biāo)較少,AUC值低于0.9。

對(duì)于每種標(biāo)準(zhǔn)數(shù)據(jù)子集,Type1對(duì)應(yīng)的AUC值大于Type3的值,意味著僅基于藥物-靶標(biāo)相互作用數(shù)據(jù),余弦相似性變換優(yōu)于高斯內(nèi)核相似性變換。例如,GPCR 數(shù)據(jù)子集中,Type1 的AUC值為0.8992,而Type3 對(duì)應(yīng)的為0.7641,前者比后者高出17.68%。對(duì)于每種標(biāo)準(zhǔn)數(shù)據(jù)子集,Type2 對(duì)應(yīng)的AUC 值均大于Type4 的值,意味著結(jié)合藥物化學(xué)結(jié)構(gòu)相似性和靶標(biāo)序列相似性,余弦相似性變換依然優(yōu)于高斯內(nèi)核相似性變換。

進(jìn)一步分析發(fā)現(xiàn),對(duì)應(yīng)每種數(shù)據(jù)子集,基于藥物-靶標(biāo)相互作用獲得的藥物相似性和靶標(biāo)相似性,在分別結(jié)合藥物化學(xué)結(jié)構(gòu)相似性和靶標(biāo)序列相似性后,AUC 提高并不明顯,有些反而下降。例如,在Type1 下,IC 對(duì)應(yīng)的AUC 為0.9340,而在Type2 下,AUC 為0.9356,增加很小;對(duì)于Enzyme 和GPCR,AUC 反而有所降低。比較Type4 和Type3,IC、GPCR 和NR 的AUC 提高,只有Enzyme 的AUC 值略有降低,表明采用高斯內(nèi)核相似性變換時(shí),結(jié)合藥物化學(xué)結(jié)構(gòu)相似性和靶標(biāo)序列相似性總體上是有利的。

3.2 基于Logistic變換的預(yù)測(cè)

為了對(duì)比分析,4 種組合中DS和TS采用Logistic 變換,對(duì)Enzyme、IC、GPCR 和NR 中藥物-靶標(biāo)相互作用矩陣A進(jìn)行5 折交叉驗(yàn)證。Logistic 變換中參數(shù)C對(duì)結(jié)果有影響,為了避免過擬合,實(shí)驗(yàn)中C=-20,實(shí)驗(yàn)結(jié)果如表4所示。

表4 不同組合Logistic變換后預(yù)測(cè)的AUC比較(C=-20)

比較表4 和表3,采用余弦相似性的Type1和Type2,經(jīng)過Logistic變換后,8個(gè)AUC值中的6 個(gè)有所增加,Type2 條件下增加更加明顯,2個(gè)降低的值出現(xiàn)在GPCR 中Type1、NR 中Type2。NR 中僅包含54 個(gè)藥物,26 個(gè)靶標(biāo),90個(gè)相互作用,因數(shù)據(jù)量小結(jié)果不穩(wěn)定。Type2條件下,GPCR 對(duì)應(yīng)的AUC 增加最多,從0.8854增至0.9222,提高了4.16%。就4 個(gè)數(shù)據(jù)子集平均而言,對(duì)應(yīng)Type1,AUC 值提高0.65%;對(duì)應(yīng)Type2,AUC 值提高了1.78%,后者的增量是前者的近3倍。

在表4 中,采用高斯內(nèi)核相似性的Type3 和Type4 與相應(yīng)表3 中的數(shù)據(jù)比較,Type3 條件下除NR 數(shù)據(jù)子集外,AUC 值反而降低,而Type4條件下AUC值全部提高??傮w上,對(duì)于Type3,4個(gè)數(shù)據(jù)子集AUC值平均降低3.78%;對(duì)于Type4,AUC值平均提高了2.00%。

由表4數(shù)據(jù)可知,對(duì)應(yīng)任意一種標(biāo)準(zhǔn)數(shù)據(jù)子集,Type2 條件下的AUC 值高于Type1 條件下的,平均提高1.73%。Type4 條件下的AUC 值高于Type3 條件下的,平均提高10.51%。這表明藥物-靶標(biāo)相互作用矩陣無論采用余弦變換還是高斯內(nèi)核變換,融合藥物化學(xué)結(jié)構(gòu)相似數(shù)據(jù)DS_CS 和靶標(biāo)序列相似數(shù)據(jù)TS_Seq 后,預(yù)測(cè)性能明顯提高。

3.3 對(duì)比分析

從上述分析可見,在Type2 條件下,經(jīng)過Logistic 變換后NCP 方法性能最高。將NCP 方法與文獻(xiàn)報(bào)道的DVM方法比較[6],除NR數(shù)據(jù)子集外,在其他3 個(gè)子集上AUC 值都高于DVM,顯示本方法具有一定的優(yōu)越性。

表5 NCP與DVM預(yù)測(cè)結(jié)果的AUC比較

4 結(jié)語(yǔ)

通過計(jì)算方法篩選潛在的藥物-靶標(biāo)相互作用有利于節(jié)約藥物重定向的成本。本研究基于Matlab 語(yǔ)言開發(fā)一個(gè)藥物-靶標(biāo)相互作用預(yù)測(cè)平臺(tái),實(shí)驗(yàn)證明該平臺(tái)是穩(wěn)定、可行的。平臺(tái)采用的NCP 預(yù)測(cè)方法具有一定優(yōu)越性,對(duì)于如何更合理設(shè)置各種參數(shù)需要深入研究。該平臺(tái)基于模塊化思想設(shè)計(jì),可靈活替換不同預(yù)測(cè)方法,快速獲得實(shí)驗(yàn)結(jié)果。因此,該平臺(tái)的開發(fā)對(duì)生物醫(yī)學(xué)知識(shí)科普、學(xué)生科研訓(xùn)練和藥物重定向研究都是有益的。

猜你喜歡
子集靶標(biāo)內(nèi)核
由一道有關(guān)集合的子集個(gè)數(shù)題引發(fā)的思考
萬(wàn)物皆可IP的時(shí)代,我們當(dāng)夯實(shí)的IP內(nèi)核是什么?
拓?fù)淇臻g中緊致子集的性質(zhì)研究
強(qiáng)化『高新』內(nèi)核 打造農(nóng)業(yè)『硅谷』
“百靈”一號(hào)超音速大機(jī)動(dòng)靶標(biāo)
關(guān)于奇數(shù)階二元子集的分離序列
納米除草劑和靶標(biāo)生物的相互作用
基于嵌入式Linux內(nèi)核的自恢復(fù)設(shè)計(jì)
Linux內(nèi)核mmap保護(hù)機(jī)制研究
復(fù)雜場(chǎng)景中航天器靶標(biāo)的快速識(shí)別
北票市| 当阳市| 廉江市| 重庆市| 旌德县| 邯郸县| 仁布县| 扎鲁特旗| 宣武区| 会理县| 延边| 兴山县| 桓仁| 通州市| 大悟县| 汉川市| 新宁县| 蓬溪县| 竹溪县| 上犹县| 建德市| 玛纳斯县| 蓬安县| 屏南县| 辽阳市| 宜川县| 睢宁县| 南郑县| 利辛县| 和政县| 汕尾市| 穆棱市| 广南县| 德惠市| 石阡县| 丹阳市| 邛崃市| 华坪县| 富蕴县| 策勒县| 宁陕县|