国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的miRNA與疾病關(guān)系預(yù)測系統(tǒng)的設(shè)計與實現(xiàn)

2023-06-04 08:32夏岱婷彭熒熒
黑龍江科學(xué) 2023年8期
關(guān)鍵詞:相似性高斯關(guān)聯(lián)

夏岱婷,彭熒熒

(湖南中醫(yī)藥大學(xué),長沙 410001)

MicroRNA(以下簡稱miRNA)是一類由22~24個核苷酸組成的非編碼RNA[1],可通過對miRNA的研究來進(jìn)一步了解疾病的發(fā)病機(jī)制,區(qū)分疾病類型,還可根據(jù)其與疾病之間的相關(guān)性來預(yù)測和防治疾病。越來越多的人開始使用生物信息學(xué)的計算方法對miRNA-疾病關(guān)聯(lián)關(guān)系進(jìn)行預(yù)測。基于“功能相似的miRNA往往與相似的疾病相關(guān)且反之亦然”[2]的假設(shè),研究人員提出了許多模型。

盡管已出現(xiàn)了不少先進(jìn)的預(yù)測方法,但對潛在的miRNA-疾病關(guān)聯(lián)關(guān)系進(jìn)行預(yù)測時,部分方法利用高斯核函數(shù)計算高斯核相互作用譜相似性,未對狀態(tài)相同但意義相反的情況[(0,0)和(1,1)]進(jìn)行區(qū)分,缺少預(yù)測系統(tǒng)進(jìn)行展示。

1 數(shù)據(jù)

miRNA-疾病關(guān)聯(lián)數(shù)據(jù)。人類miRNA疾病關(guān)聯(lián)數(shù)據(jù)庫(the Human microRNA Disease Database,HMDD)[3]始建于2007年(Lu等[4]),本研究采用V 2.0版本數(shù)據(jù)。

1)miRNA功能相似性數(shù)據(jù)。Wang等在計算miRNA之間功能相似性時分別考慮了與miRNA相關(guān)的相似疾病的影響,提出了MISIM計算方法[5],將其應(yīng)用于HMDD中記錄的miRNA,計算出所有miRNA之間的功能相似性,并建立了對應(yīng)的網(wǎng)站。miRNA功能相似性數(shù)據(jù)可直接從網(wǎng)站上下載(http://www.cuilab.cn/files/images/cuilab/misim.zip)。

2)疾病語義相似性數(shù)據(jù)。Wang等根據(jù)美國國家醫(yī)學(xué)圖書館MeSH(https://www.ncbi.nlm.nih.gov/)中對疾病類別的描述信息,提出基于疾病關(guān)系結(jié)構(gòu)的疾病語義相似性度量方法[5],用有向無環(huán)圖(DAG)描述疾病之間的關(guān)系,節(jié)點表示疾病術(shù)語,分為表示更寬泛的父節(jié)點和表示更具體的子節(jié)點,邊表示疾病之間存在關(guān)聯(lián)。

2 miRNA-疾病關(guān)聯(lián)預(yù)測模型

提出了一個半監(jiān)督學(xué)習(xí)的預(yù)測模型(RGM)。對已知的關(guān)聯(lián)關(guān)系進(jìn)行預(yù)處理,去除冗余數(shù)據(jù),得到只含有miRNA信息和疾病信息的關(guān)聯(lián)矩陣。針對部分方法存在的問題,運(yùn)用高斯核函數(shù)獲取高斯核相互作用譜相似性信息時,區(qū)分了狀態(tài)相同但意義相反的情況,利用譜相似性矩陣,結(jié)合miRNA功能相似性矩陣和疾病語義相似性矩陣得到新的矩陣。在新的矩陣和miRNA-疾病關(guān)系矩陣中,利用標(biāo)簽傳播算法得到最終的預(yù)測結(jié)果。以下主要對獲取高斯核相互作用譜相似性進(jìn)行說明。

基于“功能相似的miRNA往往與相似的疾病存在關(guān)聯(lián)關(guān)系”的假設(shè)[6],根據(jù)Liu[6]等的方法,從關(guān)聯(lián)矩陣中獲取高斯核相互作用譜相似性時,對狀態(tài)相同但意義相反的情況加以區(qū)分。以疾病信息為例,關(guān)聯(lián)矩陣A作為高斯核相互作用分布圖,矩陣中的每一列看作表示每一個疾病的特征向量D,D可以表示疾病與miRNA之間的關(guān)聯(lián)關(guān)系,D中僅包含0和1兩種數(shù)值,0表示疾病與對應(yīng)的miRNA存在未知的關(guān)聯(lián)關(guān)系,1表示疾病與對應(yīng)的miRNA存在已知的、經(jīng)實驗驗證的關(guān)聯(lián)關(guān)系,因此可以通過式(1)和式(2)獲取疾病的高斯核相互作用譜相似性矩陣KD。

(1)

其中,γd用來控制高斯核的帶寬參數(shù),計算方法如下:

其中

(2)

式中,δd[6]是一個新的帶寬參數(shù),原則上可以通過交叉驗證實驗來進(jìn)行設(shè)置,根據(jù)Liu等的研究,將δd簡單地設(shè)置為1。nm表示關(guān)聯(lián)矩陣中miRNA的種類數(shù),yik表示第i列疾病與第k行miRNA對應(yīng)的數(shù)值,yik表示第j列疾病與第k行miRNA對應(yīng)的值。

同理,根據(jù)公式(3)、(4)可以得到miRNA的高斯核相互作用譜相似性矩陣KM。

(3)

其中

(4)

基于HMDD v2.0版本數(shù)據(jù)庫中已知的miRNA-疾病關(guān)聯(lián)關(guān)系,采用全局留一法對模型性能進(jìn)行評估。為了排除實驗數(shù)據(jù)的偶然性,使實驗數(shù)據(jù)更具說服力,取5次全局留一法實驗的數(shù)據(jù)平均值作為最后的實驗結(jié)果,結(jié)果顯示,新模型的AUC值高于其他模型。

如圖1所示,在全局留一法實驗中,IMCMDA[7]、QIMCMDA[8]、MCLPMDA[9]和RGM,分別取得了0.839、0.924、0.966和0.972的AUC值。

圖1 全局留一法實驗中各模型的ROC曲線及AUC值Fig.1 ROC curve and AUC value of each model in the experiment of global leave-one method

3 預(yù)測系統(tǒng)的設(shè)計與實現(xiàn)

3.1 需求分析

本系統(tǒng)將用戶分為普通用戶和管理員兩大類。

1)功能性需求。用戶可查看系統(tǒng)中收錄的疾病、miRNA、miRNA-疾病預(yù)測結(jié)果,可根據(jù)miRNA名稱或疾病名稱進(jìn)行模糊查詢,也可通過疾病和miRNA的組合進(jìn)行精確查詢。上傳頭像、更新昵稱、修改密碼等功能需打開“個人中心”頁面,點擊頁面中的頭像,實現(xiàn)上述功能。管理員可根據(jù)用戶名對用戶進(jìn)行查詢、新增、修改、刪除等操作,對疾病信息和miRNA信息進(jìn)行查詢、收錄、新增、修改等操作,對預(yù)測結(jié)果進(jìn)行管理,預(yù)測結(jié)果以關(guān)系圖形式進(jìn)行可視化展示。

2)非功能性需求??煽啃?系統(tǒng)前后端均采用成熟的開發(fā)框架,同時考慮了響應(yīng)速度,避免出現(xiàn)長時間不響應(yīng)導(dǎo)致不滿足用戶需求的情況。安全性:采用路由攔截,用戶無法在未登錄狀態(tài)下通過路由地址訪問系統(tǒng)。用戶密碼在前端采用SHA256進(jìn)行加密,數(shù)據(jù)庫中存儲加密后的密碼。易用性:采用成熟的組件庫進(jìn)行開發(fā),風(fēng)格統(tǒng)一,界面美觀,用戶視覺感官好。界面中包含操作說明,可操作性強(qiáng)。

3.2 系統(tǒng)總體設(shè)計

系統(tǒng)架構(gòu)采用前后端分離技術(shù),耦合程度低,前端基于Vue框架進(jìn)行開發(fā),后端基于SpringBoot和MyBatis實現(xiàn),主要包括表示層、業(yè)務(wù)層、數(shù)據(jù)層。

系統(tǒng)功能模塊劃分為普通用戶模塊和管理員模塊。普通用戶可對系統(tǒng)收錄疾病、miRNA和miRNA-疾病關(guān)聯(lián)關(guān)系的預(yù)測結(jié)果進(jìn)行查詢,還可對個人信息進(jìn)行修改。管理員可對普通用戶、疾病、miRNA及miRNA-疾病關(guān)聯(lián)關(guān)系預(yù)測結(jié)果進(jìn)行管理,實現(xiàn)對相關(guān)數(shù)據(jù)的新增、修改和刪除。

數(shù)據(jù)庫設(shè)計。采用MySQL數(shù)據(jù)庫,主要存儲用戶個人信息、疾病信息、miRNA信息、miRNA-疾病關(guān)聯(lián)關(guān)系預(yù)測結(jié)果信息等。

3.3 系統(tǒng)實現(xiàn)

系統(tǒng)開發(fā)環(huán)境如下:操作系統(tǒng):windows10;開發(fā)語言:Java、JavaScript、Matlab;開發(fā)環(huán)境:Visual Studio Code、IntelliJ IDEA;數(shù)據(jù)庫:MySQL;數(shù)據(jù)庫可視化工具:Navicat Premium。通過Navicat Premium對存儲系統(tǒng)數(shù)據(jù)的MySQL數(shù)據(jù)庫進(jìn)行可視化管理。Matlab主要用來進(jìn)行數(shù)據(jù)處理,通過預(yù)測模型從已知的少量miRNA-疾病關(guān)聯(lián)關(guān)系、miRNA功能相似性信息及疾病語義相似性信息得到潛在的miRNA-疾病關(guān)聯(lián)關(guān)系預(yù)測結(jié)果。

目前系統(tǒng)已成功部署在阿里云服務(wù)器上,可通過http://47.106.112.145:8080/login進(jìn)行訪問。部分關(guān)鍵界面如下:

1)系統(tǒng)收錄疾病頁面。主要用于展示系統(tǒng)中收錄的所有miRNA,包括miRNA編號及miRNA名稱。用戶可在輸入框中輸入某一特定的 miRNA名稱,點擊“搜索”按鈕。若系統(tǒng)中存在該種miRNA,則在表格中顯示相關(guān)信息,否則不進(jìn)行顯示。也可在輸入框中輸入miRNA的部分名稱信息,點擊“搜索”按鈕,查詢系統(tǒng)中所有包含該部分的miRNA信息。也可不進(jìn)行輸入,直接點擊“搜索”按鈕,查詢系統(tǒng)中所有miRNA的信息。圖2為系統(tǒng)收錄疾病頁面截圖。

圖2 系統(tǒng)收錄miRNA頁面截圖Fig.2 MiRNA page snapshots included in the system

2)預(yù)測結(jié)果展示頁面。主要用于展示系統(tǒng)中收錄的所有預(yù)測結(jié)果,包括預(yù)測結(jié)果編號、疾病名稱及miRNA名稱。以本模型中3種疾病的部分預(yù)測結(jié)果為例進(jìn)行可視化展示,使用戶更直觀地感受miRNA-疾病關(guān)聯(lián)關(guān)系??筛鶕?jù)疾病或miRNA名稱對預(yù)測結(jié)果進(jìn)行模糊查詢,也可通過輸入疾病與miRNA的組合對預(yù)測結(jié)果進(jìn)行精確查詢。圖3為預(yù)測結(jié)果可視化截圖。

圖3 預(yù)測結(jié)果可視化截圖Fig.3 Visual screenshot of prediction results

3.4 系統(tǒng)測試

對本系統(tǒng)進(jìn)行業(yè)務(wù)功能和性能測試,均達(dá)到預(yù)期。

猜你喜歡
相似性高斯關(guān)聯(lián)
一類上三角算子矩陣的相似性與酉相似性
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
淺析當(dāng)代中西方繪畫的相似性
數(shù)學(xué)王子高斯
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
天才數(shù)學(xué)家——高斯
奇趣搭配
智趣
低滲透黏土中氯離子彌散作用離心模擬相似性
有限域上高斯正規(guī)基的一個注記