XUE Song SHI Kuang-yu
近十年來,人工智能(artificial intelligence,AI)在醫(yī)學(xué)領(lǐng)域發(fā)展迅速,很大程度上得益于機器學(xué)習(xí)(machine learning,ML)技術(shù)的發(fā)展與進步,而機器學(xué)習(xí)也成為醫(yī)學(xué)領(lǐng)域創(chuàng)新的新引擎。醫(yī)學(xué)成像領(lǐng)域中,機器學(xué)習(xí)對圖像重組、病變分割、計算機輔助檢測(computer-aided detection,CADe)和診斷(computer-aided diagnosis,CADx)等方面的優(yōu)化產(chǎn)生了積極影響[1,2]。與傳統(tǒng)的醫(yī)學(xué)圖像分析技術(shù)相比,機器學(xué)習(xí)技術(shù)不需要由醫(yī)學(xué)及技術(shù)領(lǐng)域?qū)<覟樘囟ǚ治鲋贫鞔_相關(guān)的功能。相反,機器學(xué)習(xí)開發(fā)了一種自學(xué)模式,可從培訓(xùn)數(shù)據(jù)集中自動查找或?qū)W習(xí)相關(guān)技術(shù)要素[3]。此外,計算機深度學(xué)習(xí)(deep learning,DL)算法的開發(fā)[4]促進了機器學(xué)習(xí)在醫(yī)學(xué)領(lǐng)域的應(yīng)用并擴大了其應(yīng)用規(guī)模[5]。三個融合技術(shù)的進步促使深度學(xué)習(xí)開發(fā):(1)海量數(shù)據(jù)(大數(shù)據(jù))的可用性;(2)中央處理單元(central processing units,CPU)和圖形處理單元(graphics processing units,GPU)的進步;(3)學(xué)習(xí)算法的創(chuàng)新[6,7]。與傳統(tǒng)機器學(xué)習(xí)技術(shù)的功能很大程度上受其淺層結(jié)構(gòu)的限制不同,深度學(xué)習(xí)模仿人腦的深層組織結(jié)構(gòu)可處理并表達來自多層面的信息。因此,深度學(xué)習(xí)能夠從輸入的原始數(shù)據(jù)中總結(jié)出其特征性的表現(xiàn)形式,也就是通過構(gòu)建這種可總結(jié)并分析多層次原始輸入數(shù)據(jù)功能的深層結(jié)構(gòu)體系,使深度學(xué)習(xí)具有似類網(wǎng)絡(luò)學(xué)習(xí)能力的高度復(fù)雜功能,目前常用的深度學(xué)習(xí)技術(shù)包括:深層神經(jīng)網(wǎng)絡(luò)[卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)]、深層生成網(wǎng)絡(luò)[如生成對抗網(wǎng)絡(luò)(generative adversarial network,GAN)、堆疊自動編碼器(stacked auto-encoder,SAE)、深度玻爾茲曼計算機(deep Boltzmann machine,DBM)和深度信仰網(wǎng)絡(luò)(deep belief network,DBN)][8]。深度學(xué)習(xí)技術(shù)已在多種醫(yī)學(xué)影像技術(shù)中被應(yīng)用,如MRI[9]、淀粉樣蛋白PET到結(jié)構(gòu)MR 圖像的交叉模態(tài)轉(zhuǎn)換[10]、肺CT 圖像分析[11]、低劑量CT 降噪等[12]。
由于上述技術(shù)的發(fā)展,深度學(xué)習(xí)在醫(yī)學(xué)圖像分析領(lǐng)域得到了廣泛應(yīng)用,特別在圖像分類中深度學(xué)習(xí)技術(shù)表現(xiàn)突出。圖像分類主要應(yīng)用包括:顯像/檢測分類[13]和病變分期[14],圖像檢測(包括解剖學(xué)定位及病變定位),其中解剖結(jié)構(gòu)(如器官或標(biāo)靶)的定位一直是臨床工作的關(guān)鍵步驟[15]。深度學(xué)習(xí)還能自動檢測圖像內(nèi)的異常或可疑區(qū)域,幫助放射科醫(yī)生對病變定位[16,17];圖像分割是定量分析臨床參數(shù)(如體積和形狀)的前提,特別是在心臟或神經(jīng)成像及分析中。圖像分割通過識別目標(biāo)的輪廓或內(nèi)部的像素或空間域從而減少圖像中需要分析的區(qū)域,使深度學(xué)習(xí)相關(guān)的方法得以廣泛應(yīng)用[18];圖像配準(zhǔn)是圖像分析的常見預(yù)處理步驟,可確保不同模式的圖像都與相同的坐標(biāo)系一致[19];醫(yī)學(xué)圖像重組是一項具有挑戰(zhàn)性的技術(shù),主要難點包括:缺乏對反轉(zhuǎn)變換函數(shù)的準(zhǔn)確定義和噪點或偽影的干擾。深度學(xué)習(xí)可通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練將感官輸入傳輸?shù)脑紨?shù)據(jù)到轉(zhuǎn)化且輸出圖像[20-22];精確重組對于醫(yī)學(xué)圖像校正來說至關(guān)重要,尤其是在PET 定量重組時需要光子衰減校正的情況下,深度學(xué)習(xí)使用MR 圖像來評估校正的結(jié)果[23],甚至不需額外數(shù)據(jù)輸入[24];醫(yī)學(xué)圖像合成為由隱私問題帶來的對數(shù)據(jù)安全的要求及診斷的醫(yī)療圖像缺失引起的數(shù)據(jù)稀缺提供了解決方案,AI 可能有助于跨模態(tài)影像合成[10]或數(shù)據(jù)擴增[25];深度學(xué)習(xí)還可能有利于其他醫(yī)療應(yīng)用,如基于內(nèi)容的圖像檢索[26]和手術(shù)機器人[27]。
AI 有助于各種醫(yī)學(xué)成像模式和應(yīng)用領(lǐng)域的發(fā)展,深度學(xué)習(xí)技術(shù)已應(yīng)用于:MRI[28,29]、顯微鏡[30]、CT[31,32]、超聲[33]、X 線[34]、乳腺檢查[35,36]、彩色胃鏡[37]、多模態(tài)顯像[38]等。同時,在不同的醫(yī)學(xué)領(lǐng)域也有應(yīng)用:如神經(jīng)[39-41]、眼科[37,42]、肺部[43,44]、胸[36,45]、心臟[29,46]、腹部[47-49]和肌肉骨骼[50,51]等。
在未來幾十年內(nèi),深度學(xué)習(xí)技術(shù)可能對醫(yī)學(xué)圖像分析的進步有著積極影響,然而仍有若干挑戰(zhàn)有待解決。由于監(jiān)督性學(xué)習(xí)在深度學(xué)習(xí)技術(shù)突破中起重要作用,因此培訓(xùn)數(shù)據(jù)集的嚴(yán)重不足往往是深度學(xué)習(xí)技術(shù)發(fā)展的主要障礙,而且其應(yīng)用具有黑盒子的特征,在不了解內(nèi)部表性情況下很難解釋其工作方式。