陳瓊英
(自貢市第三人民醫(yī)院放射科 四川 自貢 643000)
AI是研發(fā)用于模擬人類大腦學(xué)習(xí)并延伸人類能力的新型智能技術(shù)科學(xué),在某些領(lǐng)域能夠匹敵甚至超越人類的能力[1]。近年來,AI在醫(yī)學(xué)圖像的自動(dòng)定量圖像表征中取得了極大的進(jìn)展,它的代表之一是深度學(xué)習(xí)(DL)模型算法,目前已廣泛應(yīng)用于肺結(jié)節(jié)良惡性鑒別及隨訪、肺癌的早期檢測、分子亞型分析以及療效預(yù)測等。
DL在肺結(jié)節(jié)檢出上表現(xiàn)出巨大的潛力及后勁,可以彌補(bǔ)圖像處理法檢出肺結(jié)節(jié)假陽性率的偏高的不足,同時(shí)改善了經(jīng)典機(jī)器學(xué)習(xí)法因一般采用人為設(shè)計(jì)的特征提取器進(jìn)行特征選擇造成部分結(jié)節(jié)信息的丟失。
Liu 等[2]采用DL模型自動(dòng)檢測肺結(jié)節(jié),并與放射科醫(yī)生的診斷效能進(jìn)行比較,結(jié)果表明DL模型顯示出更高的診斷敏感性,且不受CT檢查機(jī)型、輻射劑量或患者年齡的顯著影響;且當(dāng)放射科醫(yī)生聯(lián)合DL模型進(jìn)行輔助診斷時(shí),可提高整體診斷效能,明顯減少診斷時(shí)間。
Setio等[3]采用DL模型對肺結(jié)節(jié)進(jìn)行檢測,結(jié)果顯示肺結(jié)節(jié)的檢測受結(jié)節(jié)類型、大小、形態(tài)等多個(gè)因素的影響:實(shí)性結(jié)節(jié)的檢出敏感度明顯高于磨玻璃結(jié)節(jié)的檢出;結(jié)節(jié)體積越小,總檢出率越低,而>10mm實(shí)性結(jié)節(jié)檢出敏感度明顯低于3~10mm的實(shí)性結(jié)檢出敏感度;此外結(jié)節(jié)形態(tài)的不規(guī)則是造成假陽性率高的主要因素之一。
DL的神經(jīng)網(wǎng)絡(luò)算法有很多,包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)、基于大規(guī)模訓(xùn)練神經(jīng)網(wǎng)絡(luò)(MTANN)、深度神經(jīng)網(wǎng)絡(luò)(DNN)等。
1.3.1 CNN CNN系統(tǒng)最早于2005年[4]便運(yùn)用于肺結(jié)節(jié)的檢測,有學(xué)者[5]基于DL模型CNN算法運(yùn)用于胸部X片,以對肺結(jié)節(jié)及惡性肺結(jié)節(jié)自動(dòng)檢測,均顯示與之前報(bào)道的傳統(tǒng)計(jì)算機(jī)輔助診斷及醫(yī)師診斷假陽性率、特異性、敏感性等具有明顯優(yōu)勢。CNN在CT肺結(jié)節(jié)篩查中的應(yīng)用也非常廣泛,Setio等[3]對實(shí)性結(jié)節(jié)及亞實(shí)性結(jié)節(jié)進(jìn)行檢測,發(fā)現(xiàn)對實(shí)性結(jié)節(jié)的檢出敏感度明顯高于磨玻璃結(jié)節(jié),混合磨玻璃結(jié)節(jié)的敏感度高于純磨玻璃結(jié)節(jié)。
1.3.2 MTANN MTANN多用于圖像的分割、模式分類、目標(biāo)的檢測、圖像質(zhì)量減噪等,它的運(yùn)用有一定的局限性,適用于訓(xùn)練集較小的數(shù)據(jù)處理。Suzuki等[6]采用該算法進(jìn)行肺結(jié)節(jié)檢出,其檢出敏感度為80.3%,假陽性率為4.8 FPs/Scan。
1.3.3 DNN DNN在肺結(jié)節(jié)檢出上應(yīng)用相對較少。Tan等[7]采用CNN和DNN結(jié)合的方法來降低結(jié)節(jié)檢出的假陽性率,取得了很好的效果。
臨床上鑒別肺結(jié)節(jié)良惡性至關(guān)重要。有學(xué)者[8]把基于常規(guī)肺CT掃描數(shù)據(jù)訓(xùn)練的DL肺結(jié)節(jié)良惡性鑒別模型應(yīng)用于超高分辨率靶掃描,結(jié)果顯示:常規(guī)掃描數(shù)據(jù)集良惡性鑒別曲線下面積、準(zhǔn)確率、敏感度和特異度均低于靶掃描診斷效能。
肺小結(jié)節(jié)的診斷存在困難,通常需要影像隨訪確定其良惡性,但隨訪時(shí)間的延長會(huì)使患者產(chǎn)生焦慮,也可能治療延誤,因此早期判斷結(jié)節(jié)良惡性尤為重要。研究表明AI在基線檢查(第1次影像檢查)可以有效判斷良惡性[9],基線掃描與隨訪掃描鑒別肺結(jié)節(jié)良惡性效能接近或AUC略高于隨訪掃描。
在醫(yī)學(xué)圖像分析中,主要運(yùn)用MTANN和CNN兩大類端到端機(jī)器學(xué)習(xí)方法,而運(yùn)用在肺結(jié)節(jié)良惡性鑒別診斷較為常見的是CNN。Tajbakhsh等[10]比較了MTANN和CNN對肺結(jié)節(jié)良惡性鑒別模型的性能中結(jié)果顯示:當(dāng)使用有限訓(xùn)練數(shù)據(jù)集時(shí),在肺結(jié)節(jié)檢測和鑒別中MTANN的性能高于CNN;訓(xùn)練數(shù)據(jù)集擴(kuò)大時(shí),兩種模式的性能差距縮小,但仍然有顯著差距。
肺腫瘤隨訪受多種因素的影像:不同影像專家間存在診斷差異、圖像質(zhì)量及完整性、檢測設(shè)備的不同、腫瘤只發(fā)生質(zhì)地改變或瘤內(nèi)異質(zhì)性改變等,這些均會(huì)導(dǎo)致診斷的準(zhǔn)確性下降[11],AI深度學(xué)習(xí)模型能很好的彌補(bǔ)這些不足。呂文暉等[12]采用基于細(xì)粒度特征的DL模型對肺結(jié)節(jié)良惡性判斷隨訪,結(jié)果顯示:對于實(shí)性結(jié)節(jié),DL模型在最終隨訪檢查預(yù)測為惡性結(jié)節(jié)的的AUC大于第一次基線檢測。
定量成像數(shù)據(jù)的AI分析可能提高對靶向治療反應(yīng)的評估,對治療效果的評判優(yōu)于常規(guī)CT[13];也可以顯著預(yù)測基因突變狀態(tài)、腫瘤的不同基因表達(dá),從而避免了反復(fù)多次的有創(chuàng)性穿刺,便于患者長時(shí)間縱向隨訪。宋蘭等[14]采用基于圖像和特征金字塔網(wǎng)絡(luò)結(jié)合的兩級(jí)網(wǎng)絡(luò)的深度學(xué)習(xí)模型預(yù)測肺腺癌ALK融合基因的表達(dá),結(jié)果顯示深度學(xué)習(xí)模型影像組學(xué)定量特征在肺腺癌ALK基因預(yù)測中有較大價(jià)值。
DL在肺結(jié)節(jié)檢出上表現(xiàn)出巨大的潛力及后勁,它克服因結(jié)節(jié)體積較小、位置多變而導(dǎo)致檢出率下降問題,可以消除經(jīng)典機(jī)器學(xué)習(xí)法因手工設(shè)計(jì)特征對最終分類的影響,同時(shí)還可以自動(dòng)地學(xué)習(xí)提取潛在的圖像特征。
AI深度學(xué)習(xí)在肺結(jié)節(jié)應(yīng)用中也存在著不足,例如:(1)DL絕大部分模型對數(shù)據(jù)依賴較高,需要全面、高質(zhì)量、大規(guī)模的數(shù)據(jù)作為支撐;(2)醫(yī)師對病灶標(biāo)注的質(zhì)量高低決定著DL質(zhì)量的好壞及模型的效能,而目前金標(biāo)準(zhǔn)及標(biāo)注仍然缺乏;(3)醫(yī)學(xué)影像AI的算法像黑匣子,可解釋性較差,這將降低醫(yī)師的認(rèn)同率。
因此提高AI數(shù)據(jù)量、提高醫(yī)師的標(biāo)注、制定金標(biāo)準(zhǔn)、AI算法的可視化和可解釋性這都將成為AI未來取得醫(yī)師和監(jiān)管部門信任的關(guān)鍵。