史斌,王建立
解放軍總醫(yī)院第三醫(yī)學(xué)中心器官移植科,北京 100039
肝癌是全球第五大惡性腫瘤,近20年來(lái)肝癌的病死率呈上升趨勢(shì),在中國(guó)惡性腫瘤致死原因中居第2位,嚴(yán)重影響人們的身體健康。常見(jiàn)的高危因素是病毒性肝炎(如乙型肝炎、丙型肝炎)肝硬化、酒精性肝硬化、膽汁性肝硬化(如Caroli?。?、布加綜合征、原發(fā)性鐵過(guò)載、糖原代謝性疾病等。肝癌的診斷主要依據(jù)臨床表現(xiàn)、甲胎蛋白和影像學(xué)特征,外科手術(shù)仍然是治療肝癌的有效方法。然而,肝癌復(fù)發(fā)與轉(zhuǎn)移是影響預(yù)后的主要因素,是肝癌外科治療中的世紀(jì)性難題,也是最終攻克肝癌的關(guān)鍵所在。因此,如何預(yù)測(cè)肝癌術(shù)后復(fù)發(fā)和轉(zhuǎn)移是亟待解決的重大健康問(wèn)題。人工智能技術(shù)在醫(yī)療領(lǐng)域已應(yīng)用了40多年,其可通過(guò)協(xié)助醫(yī)務(wù)人員提高工作效率,進(jìn)一步提升醫(yī)療保健水平。人工智能主要應(yīng)用于傳統(tǒng)醫(yī)學(xué)診斷、疾病治療、自動(dòng)分類(lèi)和患者康復(fù)等。隨著醫(yī)療行業(yè)的飛速發(fā)展,人工智能也進(jìn)入了最好的時(shí)代。與傳統(tǒng)醫(yī)療相比,人工智能為開(kāi)展疾病診斷、制訂治療方案、提高醫(yī)學(xué)研究和臨床試驗(yàn)的效率、規(guī)范醫(yī)師操作提供了全新的思路和方法。人工智能的發(fā)展經(jīng)歷了早期的邏輯推理到中期的專(zhuān)家系統(tǒng),直至機(jī)器學(xué)習(xí)出現(xiàn)后,人工智能研究終于找對(duì)了方向。從廣義上來(lái)說(shuō),機(jī)器學(xué)習(xí)是一種能夠賦予機(jī)器學(xué)習(xí)的能力以此讓它完成直接編程無(wú)法完成的功能的方法。從實(shí)踐意義上來(lái)說(shuō),機(jī)器學(xué)習(xí)是一種利用數(shù)據(jù)、訓(xùn)練模型、使用模型預(yù)測(cè)的方法。主要方法如下:①回歸算法,包括線性回歸和邏輯回歸;②人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN);③支持向量機(jī)(support vector machine,SVM);④聚類(lèi)算法;⑤降維算法;⑥推薦算法。ANN的概念可以追溯到20世紀(jì)初期,然而,它最早始于19世紀(jì)80年代,當(dāng)時(shí)主要應(yīng)用于識(shí)別、控制和優(yōu)化模式等。神經(jīng)系統(tǒng)應(yīng)用腫瘤標(biāo)志物作為輸入神經(jīng)元,并提供輸入信號(hào)的理想方法以便輸出神經(jīng)元可以提供患者治療過(guò)程的預(yù)測(cè)依據(jù)。本質(zhì)上,決定神經(jīng)網(wǎng)絡(luò)可靠性的兩個(gè)特征是對(duì)輸入變量的判斷分析和關(guān)于預(yù)測(cè)輸出準(zhǔn)確性的分類(lèi)方法。本文就ANN在肝癌血清學(xué)、影像學(xué)、病理學(xué)、蛋白質(zhì)組學(xué)、基因?qū)W診斷和預(yù)后預(yù)測(cè)中的應(yīng)用進(jìn)展作一綜述。
在過(guò)去幾十年中,ANN在生物學(xué)和醫(yī)學(xué)研究中的應(yīng)用大大增加。ANN的醫(yī)學(xué)應(yīng)用涉及麻醉學(xué)、放射學(xué)、心臟病學(xué)、精神病學(xué)和神經(jīng)病學(xué)。腫瘤的治療與管理具有一定的模式化,大多數(shù)腫瘤的診斷通常是通過(guò)穿刺活檢完成的,但具有一定的創(chuàng)傷性。從患者和醫(yī)師的角度來(lái)看,智能化、可靠且無(wú)創(chuàng)的診斷程序?qū)?huì)非常有利,同時(shí)對(duì)于評(píng)估腫瘤的進(jìn)展至關(guān)重要。這就促使研究人員尋找一種簡(jiǎn)單有效的測(cè)量方法來(lái)評(píng)估患者預(yù)后,了解腫瘤的生物學(xué)特征及其相關(guān)信息。神經(jīng)網(wǎng)絡(luò)分析已被證明對(duì)解決這些問(wèn)題具有重要作用。
ANN是平行的信息處理結(jié)構(gòu),試圖模仿生物神經(jīng)系統(tǒng)的某些性能特征。生物神經(jīng)元具有3種類(lèi)型的組件,即樹(shù)突、體細(xì)胞和軸突。樹(shù)突通過(guò)軸突從其他神經(jīng)元接收起源于化學(xué)、電或溫度變化的信號(hào),并且通過(guò)化學(xué)過(guò)程穿越突觸間隙,使傳入的信息累積在體細(xì)胞中。然后體細(xì)胞通過(guò)簡(jiǎn)單的求和過(guò)程作用于各種輸入信號(hào),當(dāng)接收到足夠量的輸入時(shí),該單元將觸發(fā),即通過(guò)輸出軸突將信號(hào)傳輸?shù)狡渌麊卧?/p>
典型的神經(jīng)網(wǎng)絡(luò)由一系列通過(guò)完全隨機(jī)連接的層組成,通常有兩層與外界連接:輸入層,將數(shù)據(jù)提供給網(wǎng)絡(luò);輸出層,網(wǎng)絡(luò)對(duì)輸入數(shù)據(jù)的響應(yīng)。另外,隱藏層處于輸入層和輸出層之間。訓(xùn)練過(guò)程需要反復(fù)呈現(xiàn)數(shù)據(jù)的輸入與輸出對(duì),然后網(wǎng)絡(luò)研究數(shù)據(jù)中的模式或功能,這些模式或功能最終將有助于達(dá)成“正確的”決策。在每次迭代時(shí),將網(wǎng)絡(luò)輸出與所需的輸出進(jìn)行比較,并生成誤差函數(shù)。當(dāng)誤差值超過(guò)設(shè)計(jì)人員設(shè)置的某個(gè)閾值時(shí),將重新修改各層神經(jīng)元的權(quán)值,最終使得誤差信號(hào)最小,并為后續(xù)的迭代進(jìn)行更新。只有當(dāng)誤差等于或低于該閾值時(shí),該網(wǎng)絡(luò)才認(rèn)為輸出的誤差可以接受。當(dāng)出現(xiàn)一組新的輸入數(shù)據(jù)時(shí),網(wǎng)絡(luò)能夠基于其先前的學(xué)習(xí)積累獲得正確的決策。從這個(gè)意義上說(shuō),網(wǎng)絡(luò)可以進(jìn)行概括,即合理地插入新的輸入模式,這無(wú)疑是神經(jīng)系統(tǒng)的獨(dú)特優(yōu)勢(shì)之一。
血清學(xué)標(biāo)志物可用于肝癌的早期診斷,其方便快捷,成本相對(duì)較低,還可用于動(dòng)態(tài)監(jiān)測(cè)。研究表明,血清學(xué)指標(biāo)聯(lián)合ANN可以提高肝癌診斷的準(zhǔn)確性[1-2]。王運(yùn)九等[3]將甲胎蛋白、總膽汁酸、活化部分凝血活酶時(shí)間、堿性磷酸酶和血小板分別納入ANN和邏輯回歸模型,結(jié)果發(fā)現(xiàn),ANN的診斷效率優(yōu)于邏輯回歸模型。Xie等[4]基于GeXP系統(tǒng)構(gòu)建了一個(gè)9種基因(GPC3、HGF、ANXA1、FOS、SPAG9、HSPA1B、CXCR4、PFN1和CALR)表達(dá)檢測(cè)系統(tǒng),采用Logistic回歸分析、判別分析、分類(lèi)樹(shù)分析和ANN等方法建立診斷模型,對(duì)肝癌患者與健康者進(jìn)行分類(lèi)。結(jié)果顯示,ANN對(duì)9種基因的診斷價(jià)值最高,其靈敏度和特異度分別為98%和85%。另有研究發(fā)現(xiàn),使用單盲試驗(yàn)驗(yàn)證的徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法建立診斷模型,成功鑒定了 7種質(zhì)荷比分別為 1780.7、1866.5、2131.6、2880.4、1532.4、2489.8和2234.3的肽序列?;?個(gè)重要肽段(質(zhì)荷比分別為1535.4、1780.7、1866.5、2131.6、2880.4和2901.9)建立的診斷模型的識(shí)別率和預(yù)測(cè)能力分別為89.47%和82.89%,基于單盲試驗(yàn)的該模型的靈敏度和特異度分別為85.29%和85.71%[5]。Wang等[6]利用蛋白質(zhì)芯片技術(shù)檢測(cè)ANN的血清蛋白質(zhì)指紋圖譜,該模型診斷肝癌的靈敏度和特異度分別為88.2%和94.6%。這些研究結(jié)果表明,為了提高血清學(xué)診斷早期肝癌的準(zhǔn)確性,可以聯(lián)合ANN方法,這為提高肝癌的診斷率提供了新的思路。
2.2.1 磁共振成像(MRI) MRI在臨床中可用于診斷肝癌及評(píng)估治療效果。卷積神經(jīng)網(wǎng)絡(luò)是一種類(lèi)似于深度學(xué)習(xí)的機(jī)器學(xué)習(xí)算法,能夠識(shí)別和檢測(cè)病變的特征。已有研究證實(shí),多通道融合三維卷積神經(jīng)網(wǎng)絡(luò)(multichannel fusion three-dimensional convolutional neural network,MCF-3DCNN)對(duì)高分化肝細(xì)胞癌的鑒別診斷價(jià)值最高,曲線下面積(area under the curve,AUC)、準(zhǔn)確度、靈敏度和特異度分別為0.96、91.00%、96.88%和89.62%[7]。此外,卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)Ω渭?xì)胞癌多b值彌散加權(quán)成像(diffusion weighted imaging,DWI)的深層特征進(jìn)行有效分級(jí),準(zhǔn)確度高達(dá)80%[8]。另有研究發(fā)現(xiàn),三維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可以在磁共振-DWI中很好地鑒別肝臟腫瘤的來(lái)源[9]。Le等[10]采用三維快速推進(jìn)算法和單層前饋神經(jīng)網(wǎng)絡(luò)對(duì)肝臟腫瘤進(jìn)行分割,選取25個(gè)腫瘤病變進(jìn)行評(píng)價(jià),結(jié)果表明,與人工分割方法相比,該方法提升了準(zhǔn)確度,縮短了分割時(shí)間,提高了工作效率。另有研究表明,應(yīng)用肝癌切除術(shù)前核磁共振的紋理特征來(lái)推測(cè)術(shù)后復(fù)發(fā)情況,可為臨床醫(yī)師下一步治療方案的制訂提供思路[11]。
2.2.2 計(jì)算機(jī)斷層掃描(CT) CT檢查是肝癌診斷的重要方法。劉建華和王建偉[12]通過(guò)分析CT圖像特征,采取反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)方法對(duì)肝癌進(jìn)行識(shí)別,識(shí)別率為83.33%。郝濤和張智[13]尋找適合識(shí)別肝癌CT圖像的特征向量,建立BP神經(jīng)網(wǎng)絡(luò)模型,其對(duì)原發(fā)性肝癌的識(shí)別率為(91.08±6.96)%,說(shuō)明ANN對(duì)于肝癌的影像學(xué)診斷具有非常重要的價(jià)值。Ouhmich等[14]采用深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)方法在多期CT圖像上實(shí)現(xiàn)正常肝組織和肝癌組織的自動(dòng)分割,能夠有效地評(píng)估腫瘤組織的壞死率。Yamada等[15]研究結(jié)果表明,三相動(dòng)態(tài)增強(qiáng)CT對(duì)原發(fā)性肝癌組織學(xué)分型和分化程度的平均診斷性能分別為39.1%和47.9%。在像素偏移、旋轉(zhuǎn)和傾斜失調(diào)的轉(zhuǎn)移學(xué)習(xí)(transfer learning,TL)后,卷積神經(jīng)網(wǎng)絡(luò)的最高平均診斷性能分別為44.1%、44.2%和43.7%。這些研究均說(shuō)明,應(yīng)用ANN結(jié)合傳統(tǒng)的CT檢查,能夠大大提高肝癌的診斷準(zhǔn)確率。
2.2.3 超聲 目前超聲檢查是肝癌診斷的最佳方法,容易操作且價(jià)格低廉。Hwang等[16]為了提高超聲診斷肝臟惡性病變的準(zhǔn)確度,選取29個(gè)關(guān)鍵特征作為前饋神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),采用陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值、靈敏度、特異度和準(zhǔn)確度評(píng)價(jià)診斷效能,結(jié)果提示診斷準(zhǔn)確度高達(dá)96%以上。Streba等[17]論證了時(shí)間強(qiáng)度曲線(time-intensity curve,TIC)分析參數(shù)在肝臟腫瘤ANN診斷系統(tǒng)中的作用,結(jié)果提示ANN具有94.45%(95%CI:89.31%~97.21%)的訓(xùn)練準(zhǔn)確度和87.12%(95%CI:86.83%~93.17%)的測(cè)試準(zhǔn)確度,并對(duì)不同類(lèi)型的病灶進(jìn)行了分類(lèi),分類(lèi)過(guò)程的靈敏度為93.2%,特異度為89.7%,陽(yáng)性預(yù)測(cè)值為94.42%,陰性預(yù)測(cè)值為87.57%。
腫瘤組織學(xué)反映了潛在的分子和疾病進(jìn)展過(guò)程,包含豐富的表型信息,可以預(yù)測(cè)患者預(yù)后[18]。病理診斷在肝細(xì)胞癌的診斷和治療中具有重要作用。大多數(shù)腫瘤的傳統(tǒng)病理診斷方法需要冷凍、切片、蘇木精染色,并進(jìn)行人工分析,從而限制了診斷的速度。卷積神經(jīng)網(wǎng)絡(luò)是一種類(lèi)似于深度學(xué)習(xí)的機(jī)器學(xué)習(xí)算法,它能夠識(shí)別與檢測(cè)病變的特定特征。已有研究證實(shí),卷積神經(jīng)網(wǎng)絡(luò)極限學(xué)習(xí)法(connected convolutional neural network with extreme learning machine,CNN-ELM)模型能夠?qū)Ω伟┘?xì)胞核進(jìn)行有效分級(jí)[19]。另有一些研究表明,卷積神經(jīng)網(wǎng)絡(luò)可準(zhǔn)確地用于肝癌圖像的分割和分類(lèi)[20-22]。Gheonea等[23]將一種新的形態(tài)測(cè)量技術(shù)——分形維數(shù)(fractal dimension,F(xiàn)D)運(yùn)用到肝細(xì)胞癌診斷的ANN中,收集了21例肝細(xì)胞癌患者和28例肝轉(zhuǎn)移瘤患者的組織標(biāo)本,進(jìn)行蘇木精和免疫組化染色。ANN正確分類(lèi)了肝細(xì)胞癌圖像(90.20%)和正常組織圖像(97.23%)、肝轉(zhuǎn)移瘤(86.78%)和正常組織(98.00%)。該研究成功地將FD用作決策系統(tǒng)中的形態(tài)計(jì)量標(biāo)記,這是一組ANN的集合,旨在區(qū)分正常實(shí)質(zhì)的組織學(xué)圖像與惡性腫瘤,并對(duì)肝細(xì)胞癌和肝轉(zhuǎn)移瘤進(jìn)行分類(lèi)。
為了提高血清蛋白質(zhì)組學(xué)診斷肝細(xì)胞癌的準(zhǔn)確性,研究人員做了一些研究工作。Ward等[24]的研究探討了丙型肝炎相關(guān)性肝硬化的肝細(xì)胞癌的血清蛋白質(zhì)組學(xué)變化情況,建立基于表面增強(qiáng)激光解吸/電離飛行時(shí)間質(zhì)譜的ANN,顯著提高了血清蛋白質(zhì)組學(xué)診斷肝細(xì)胞癌的靈敏度。Luk等[25]通過(guò)二維凝膠電泳(two-dimensional gel electrophoresis,2-DE)研究肝細(xì)胞癌患者的蛋白質(zhì)組學(xué)表達(dá)情況,采用ANN和分類(lèi)回歸樹(shù)(classification and regression tree,CART)數(shù)據(jù)挖掘方法分析數(shù)據(jù),結(jié)果表明ANN檢測(cè)的靈敏度和特異度分別為96.97%和87.88%,而CART檢測(cè)的靈敏度和特異度分別為81.82%和78.79%。Wang等[26]運(yùn)用血清蛋白指紋圖譜結(jié)合ANN模型診斷肝癌,靈敏度為88.2%,特異度為100%。
鑒定腫瘤預(yù)后基因十分重要,有助于更好地預(yù)測(cè)預(yù)后。ANN通過(guò)對(duì)預(yù)測(cè)肝癌復(fù)發(fā)的基因表達(dá)譜的訓(xùn)練,能夠?qū)λ袠颖具M(jìn)行正確的分類(lèi),識(shí)別出最適合該組織的基因。與單因素分析相比,采用ANN進(jìn)行多參數(shù)分析具有更好的診斷價(jià)值[4,27-28]。Chaudhary等[29]基于RNA測(cè)序、miRNA測(cè)序和癌癥基因組的甲基化數(shù)據(jù)建立深度學(xué)習(xí)模型,可準(zhǔn)確、有效地預(yù)測(cè)肝細(xì)胞癌患者的生存情況。Marsh等[30]研究了一組等位基因缺失的抑癌基因是否可以作為基因損傷的標(biāo)志物以預(yù)測(cè)肝移植患者的預(yù)后,并評(píng)估了組織樣品在10個(gè)基因組位點(diǎn)1p、3p、5q、7q、8q、9p、10q、17p、17q、18q上的信息狀態(tài)。采用ANN模型結(jié)合基因分型結(jié)果進(jìn)行預(yù)測(cè),結(jié)果表明,組合模型可以完全準(zhǔn)確地預(yù)測(cè)肝癌的復(fù)發(fā)情況,基因分型為無(wú)瘤生存時(shí)間提供了有力的判斷依據(jù)。Choi等[31]運(yùn)用基于網(wǎng)絡(luò)的深度學(xué)習(xí)方法,通過(guò)G2Vec獲得的基因分布鑒定預(yù)后情況,結(jié)果顯示,由G2Vec鑒定的生物標(biāo)志物可用于發(fā)現(xiàn)與肝細(xì)胞癌相關(guān)的重要預(yù)后基因。
大量研究表明,ANN對(duì)于肝癌切除術(shù)后的預(yù)后預(yù)測(cè)越來(lái)越重要。Qiao等[32]研究發(fā)現(xiàn),ANN在預(yù)測(cè)肝癌切除術(shù)后患者生存率方面明顯優(yōu)于其他模型。Shi等[33-34]驗(yàn)證了ANN模型和邏輯回歸模型預(yù)測(cè)原發(fā)性肝癌手術(shù)后的住院死亡率和5年死亡率,結(jié)果均顯示,與邏輯回歸模型相比,ANN模型具有更高的準(zhǔn)確率。Ho等[35]采用ANN方法評(píng)估肝癌患者肝切除術(shù)后的無(wú)病生存情況,結(jié)果提示,在預(yù)測(cè)精度方面,ANN模型優(yōu)于邏輯回歸和決策樹(shù)(decision tree,DT)。Chiu等[36]前瞻性地運(yùn)用ANN、SVM、高斯過(guò)程回歸(gaussian process regression,GPR)模型研究肝切除術(shù)后患者的生活質(zhì)量,結(jié)果顯示,與SVM、GPR模型相比,ANN模型具有更好的性能,術(shù)前功能狀態(tài)是影響第6個(gè)月生活質(zhì)量的敏感指標(biāo)。Chiu等[36-37]通過(guò)ANN預(yù)測(cè)肝癌患者肝切除術(shù)后的死亡風(fēng)險(xiǎn)和生活質(zhì)量,其結(jié)果均表明,ANN不僅具有大量的死亡率變量預(yù)測(cè)因子,而且還能夠提供準(zhǔn)確的預(yù)測(cè)。
ANN還可用于肝癌射頻消融、經(jīng)肝動(dòng)脈化療栓塞及肝移植術(shù)后的預(yù)后評(píng)估。為預(yù)測(cè)接受射頻消融治療的肝細(xì)胞癌患者的1年和2年無(wú)病生存期(disease-free survival,DFS),Wu等[38]選取了15個(gè)臨床指標(biāo),構(gòu)建DFS預(yù)測(cè)的ANN模型,結(jié)果表明,通過(guò)15個(gè)臨床指標(biāo)構(gòu)建的ANN模型可以很好地預(yù)測(cè)DFS,可為臨床醫(yī)師做出治療決策提供依據(jù)。研究表明,對(duì)于經(jīng)肝動(dòng)脈化療栓塞治療后的療效及生存情況的評(píng)估,ANN均具有良好的性能[39-41]。Zhang等[42]采用非線性方法建立一個(gè)腫瘤特異性預(yù)后模型,通過(guò)構(gòu)建多層感知器(multilayer perceptron,MLP)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)肝移植術(shù)后的死亡風(fēng)險(xiǎn),利用受試者工作特征曲線評(píng)估移植后1、2和5年的預(yù)測(cè)性能,結(jié)果發(fā)現(xiàn),特異性MLP在預(yù)測(cè)肝細(xì)胞癌患者肝移植后的死亡率方面具有較高的準(zhǔn)確性。MLP模式識(shí)別方法有望解決肝移植術(shù)后的預(yù)后預(yù)測(cè)問(wèn)題。
ANN在肝癌診斷及預(yù)后預(yù)測(cè)中具有重要意義,這主要得益于自身的性能優(yōu)勢(shì)。傳統(tǒng)的肝癌診療和預(yù)后預(yù)測(cè)方法結(jié)合ANN技術(shù),可以達(dá)到精準(zhǔn)的診斷、精細(xì)的治療和精確的預(yù)測(cè),使患者獲益最大化。