馮熙然 李思婷 趙娜
摘 要:惡性胰腺癌(pancreaticcancer)其實(shí)是一種消化道惡性腫瘤,具有很高的惡性癌變程度,診斷和早期治療困難很大。近幾年來(lái),發(fā)病率和患者死亡率顯著提高。胰腺癌的早期手術(shù)確診死亡率一般較低,手術(shù)晚期死亡率高,治愈性能也較低。胰腺癌是否發(fā)生的尚不清楚??蒲袡C(jī)構(gòu)希望利用與人工智能相關(guān)的大數(shù)據(jù)技術(shù)輔助放射科醫(yī)生進(jìn)行醫(yī)學(xué)圖像識(shí)別,提高醫(yī)療成像數(shù)據(jù)的準(zhǔn)確性,降低放射科醫(yī)生的壓力,達(dá)到早發(fā)現(xiàn)和治療疾病的目標(biāo)。本課題采用大數(shù)據(jù)技術(shù)分布存儲(chǔ)胰腺光影像數(shù)據(jù),利用深度學(xué)習(xí)技術(shù)將大量胰腺X光圖像從自動(dòng)特征中提取,并通過(guò)大數(shù)據(jù)技術(shù)研究了癌癥藥物。
關(guān)鍵詞:胰腺癌;X光影像;大數(shù)據(jù)技術(shù);對(duì)比治療機(jī)制
前言:
近幾年來(lái),隨著大數(shù)據(jù)技術(shù)的迅速發(fā)展,基因組拷貝變化、突變、甲基化數(shù)據(jù)和轉(zhuǎn)錄組、蛋白質(zhì)組、代謝群等與癌癥有關(guān)的組學(xué)數(shù)據(jù)也在迅速積累,為癌癥的研究和精確醫(yī)學(xué)的發(fā)展提供了大量的機(jī)會(huì)。通過(guò)前期的調(diào)查,胰腺癌是最差預(yù)后的惡性腫瘤之一,被稱為"癌中的王子",在前期難以發(fā)現(xiàn),藥物作用也不理想。針對(duì)目前存在的問(wèn)題,我們對(duì)于胰腺癌前期X光片及藥物治療效果進(jìn)行了大數(shù)據(jù)處理并構(gòu)建了對(duì)比治療機(jī)制。
1.設(shè)計(jì)思路
對(duì)比 alexnet 神經(jīng)網(wǎng)絡(luò), mobilenets 神經(jīng)網(wǎng)絡(luò), vgg16 神經(jīng)網(wǎng)絡(luò)模型,以及胰腺 x 光圖像識(shí)別的精確度,根據(jù)分析效果優(yōu)劣,選擇 vgg16 網(wǎng)絡(luò)模型對(duì)算法進(jìn)行改進(jìn),分別命名 vggy 和 vgg y1 ,標(biāo)準(zhǔn)卷在 vgg16 網(wǎng)絡(luò)上。積被 vggy 網(wǎng)絡(luò)模型改為深度分離的卷積,并將改進(jìn)的網(wǎng)絡(luò)模型應(yīng)用于胰腺梗阻性慢性胰腺炎,癥狀糖尿病,血栓型靜脈炎,黃疸性肝炎,膽石癥,膽囊病和正常七種類型的識(shí)別。
2.設(shè)計(jì)原理
2.1基于轉(zhuǎn)錄組大數(shù)據(jù)和深度學(xué)習(xí)的藥物重定位預(yù)測(cè)
在這部分研究中,基于 lincs 計(jì)劃的藥物刺激下細(xì)胞反應(yīng)轉(zhuǎn)錄組的大數(shù)據(jù),構(gòu)建了一個(gè)基因共表達(dá)網(wǎng),它由不同的治療性質(zhì)組成,并由此基因共表達(dá)網(wǎng)絡(luò)構(gòu)成,并由此基因共表達(dá)網(wǎng)絡(luò)的核心成分 dgcn 組成。 dgcn 基因共表達(dá)關(guān)系的聯(lián)結(jié)可以被用來(lái)探究基因誘導(dǎo)的藥物表達(dá)方式,從而使研究人員更深入地理解藥物作用的機(jī)制。接下來(lái),利用 lincs 計(jì)劃的 l1000 數(shù)據(jù)集中的藥物擾動(dòng)和基因沉默轉(zhuǎn)錄組中的大數(shù)據(jù)以及深度學(xué)習(xí),構(gòu)建了一個(gè)深度神經(jīng)網(wǎng)絡(luò) dnn 模型,系統(tǒng)進(jìn)行了藥物靶標(biāo)的關(guān)聯(lián)預(yù)測(cè)。通過(guò)交叉驗(yàn)證,發(fā)現(xiàn) dnn 模型的精確度比其他預(yù)測(cè)算法要高,而且所預(yù)測(cè)的藥物靶標(biāo)相關(guān)聯(lián)系在其他相關(guān)的數(shù)據(jù)庫(kù)中明顯集合。
2.2基于多組學(xué)數(shù)據(jù)融合的癌癥共識(shí)分子亞型辨識(shí)的Web計(jì)算實(shí)現(xiàn)
在第二個(gè)部分的研究中,使用 tcga 、 icgc 和 target 國(guó)際大型項(xiàng)目的癌癥多組學(xué)資料和多聚類算法,建立了 comsuc 癌癥認(rèn)識(shí)分子亞型的 web 計(jì)算工具。 comsuc 彌補(bǔ)了由不同測(cè)序平臺(tái),預(yù)處理過(guò)程和聚類法等因素引起的分子亞型不一致缺陷,這是 comsuc 彌補(bǔ)的。 comsuc 實(shí)現(xiàn)了多個(gè)應(yīng)用場(chǎng)景,多種聚類算法,可以展示并輸出分析的發(fā)表等級(jí)。以辨別腎上腺皮質(zhì)癌 acc 的共識(shí)分子亞型為例,展示了 comsuc 在癌癥分子亞型識(shí)別方面的實(shí)用性。本研究展示了轉(zhuǎn)錄組和多組學(xué)數(shù)據(jù)融合的計(jì)算分析,并在藥物重定位預(yù)測(cè)和癌癥分子亞型識(shí)別方面的應(yīng)用。
3.設(shè)計(jì)優(yōu)勢(shì)分析
3.1 構(gòu)建了藥物誘導(dǎo)的基因共表達(dá)網(wǎng)絡(luò)
經(jīng)過(guò)一系列預(yù)處理的數(shù)據(jù),構(gòu)建了藥物擾動(dòng)轉(zhuǎn)錄反應(yīng)的表達(dá)譜數(shù)據(jù)。計(jì)算不同的藥物刺激細(xì)胞系中所有基因之間的 pearson 相關(guān)系數(shù)和 p 值,按一定篩選規(guī)則進(jìn)行合并,構(gòu)成了不同的治療性藥物刺激下基因共表達(dá)網(wǎng),從而形成了一個(gè)核心藥物引導(dǎo)基因共表達(dá)網(wǎng)。該網(wǎng)絡(luò)幫助研究者更深入地理解了藥物作用的機(jī)制。
3.2 將深度學(xué)習(xí)方法引入到藥物重定位領(lǐng)域
相對(duì)傳統(tǒng)新藥研發(fā)模式,藥物重定位策略發(fā)現(xiàn)藥物新用途具有顯著的成本效益優(yōu)勢(shì),能加快藥物上市步伐,滿足惡性腫瘤、罕見(jiàn)病、個(gè)性化醫(yī)療等特定領(lǐng)域藥物臨床用藥需求。而深度學(xué)習(xí)可以有效提取圖像隱含特征,在醫(yī)學(xué)影像識(shí)別方面的應(yīng)用快速發(fā)展。采用遞增擴(kuò)充卷積并且融合批量標(biāo)準(zhǔn)化和LeaklyReLU函數(shù)對(duì)輸入胰腺癌早期X光片及藥物效果數(shù)據(jù)進(jìn)行特征提取與學(xué)習(xí);然后通過(guò)結(jié)合遞減擴(kuò)充卷積和ReLU函數(shù)對(duì)提取的特征進(jìn)行圖像重構(gòu);二者結(jié)合,將深度學(xué)習(xí)方法引入到藥物重定位領(lǐng)域,可以提高藥物-靶標(biāo)關(guān)聯(lián)關(guān)系預(yù)測(cè)的準(zhǔn)確率。
3.3 搭建了包含多個(gè)組學(xué)數(shù)據(jù)和多個(gè)聚類方法的癌癥共識(shí)分子亞型Web計(jì)算工具
復(fù)雜性疾病常由環(huán)境因素和遺傳性因素(多組學(xué)層次)共同作用引起。對(duì)認(rèn)知疾病發(fā)生的全面分析,對(duì)認(rèn)知疾病發(fā)生的進(jìn)程至關(guān)重要。多組學(xué)數(shù)據(jù)整合分析可以提高特征檢查的效率,提高疾病的預(yù)測(cè)精確度。癌癥共識(shí)分子亞型網(wǎng)絡(luò)計(jì)算工具可以將不一致的聚類方法融合到多個(gè)組學(xué)和聚類方法中,從而發(fā)現(xiàn)與癌癥共識(shí)分子亞型相關(guān)的生物標(biāo)志和相關(guān)診斷,有助于對(duì)醫(yī)療進(jìn)行針對(duì)性診斷。
4.可行性
近幾年來(lái),隨著惡性功能腫瘤基因組學(xué)的迅速研究發(fā)展,與各種癌癥發(fā)病有關(guān)的基因組織科學(xué)分析數(shù)據(jù)也在迅速發(fā)展積累,這些基因組的科學(xué)分析數(shù)據(jù)與各種癌癥發(fā)病有關(guān)。為癌癥藥物的研發(fā)和精確醫(yī)學(xué)的發(fā)展創(chuàng)造了大量的機(jī)會(huì)。轉(zhuǎn)錄組數(shù)據(jù)是生物醫(yī)學(xué)的一個(gè)重要組成成分,在生物醫(yī)學(xué)和臨床應(yīng)用中得到了廣泛的應(yīng)用。而細(xì)胞擾動(dòng)表達(dá)譜測(cè)量的轉(zhuǎn)錄組在各種擾動(dòng)情況下的變化,通過(guò)對(duì)組織細(xì)胞不同的生理,病學(xué),藥物作用等基因表達(dá)譜印記的對(duì)比分析,可以在不同的生理,病學(xué)作用和藥物作用中建立聯(lián)系。
5. 推廣前景
近幾年來(lái),機(jī)器學(xué)習(xí)尤其是深度學(xué)習(xí)技術(shù)的發(fā)展,使得深度學(xué)習(xí)成為計(jì)算機(jī)視覺(jué),語(yǔ)音識(shí)別,自然語(yǔ)言處理的成功。藥物大數(shù)據(jù)與深度學(xué)習(xí)相結(jié)合,將為生物醫(yī)學(xué)在包括藥物開(kāi)發(fā)在內(nèi)的各個(gè)領(lǐng)域帶來(lái)新的發(fā)展機(jī)會(huì)。隨著基因測(cè)序、高通量基因芯片和低成本轉(zhuǎn)錄組技術(shù)的迅速發(fā)展,積累了大量關(guān)于藥物擾動(dòng)、基因沉默和癌癥的多組學(xué)資料,這些大量數(shù)據(jù)不僅對(duì)生物學(xué)基礎(chǔ)研究產(chǎn)生了深遠(yuǎn)的影響,而且對(duì)藥物重定位、癌癥分子的分型等應(yīng)用研究也產(chǎn)生了深遠(yuǎn)的影響并為癌癥大數(shù)據(jù)提供重要的機(jī)遇。
參考文獻(xiàn):
[1]宋欣雨,文昱琦,劉禎,何松,伯曉晨 基于LINCS轉(zhuǎn)錄組大數(shù)據(jù)的藥物誘導(dǎo)基因共表達(dá)網(wǎng)絡(luò)構(gòu)建【J】軍事科學(xué)院軍事醫(yī)學(xué)研究院 2018(06)
[2]宋欣雨 基于組學(xué)大數(shù)據(jù)的藥物重定位預(yù)測(cè)和癌癥共識(shí)分子亞型辨識(shí)【J】軍事科學(xué)院 2019
[3]熊阿珍,孟光興 藥物重定位候選藥物篩選路徑【J】中國(guó)醫(yī)藥工業(yè)雜志 2020(02)
作者簡(jiǎn)介:
姓名:馮熙然,性別:女,籍貫:云南省昆明市西山區(qū),出生年月:2002年10月28日,學(xué)歷:本科;研究方向:醫(yī)學(xué)影像技術(shù)
姓名:李思婷,性別:女,籍貫:福建省漳州市薌城區(qū),出生年月:2001年11月12日,
學(xué)歷:本科;研究方向:醫(yī)學(xué)影像技術(shù)
姓名:趙娜,性別:女,籍貫:山東省威海市環(huán)翠區(qū),出生年月:1991年10月10日,學(xué)歷:本科,職稱:講師,研究方向:臨床醫(yī)學(xué)