竇瑞欣
當(dāng)前,數(shù)據(jù)已經(jīng)滲透到每一個(gè)行業(yè)領(lǐng)域,且每時(shí)每刻都會(huì)產(chǎn)新的數(shù)據(jù),人們對(duì)于海量數(shù)據(jù)的挖掘、運(yùn)用以及決策,比以往更加緊迫。生物醫(yī)學(xué)也正加速進(jìn)入大數(shù)據(jù)時(shí)代,而醫(yī)學(xué)影像大數(shù)據(jù)則是量級(jí)最大的,主要是由DR、CT、MR等醫(yī)學(xué)影像設(shè)備所產(chǎn)生并存儲(chǔ)在PACS系統(tǒng)內(nèi)的大規(guī)模、高增速、多結(jié)構(gòu)、高價(jià)值和真實(shí)準(zhǔn)確的影像數(shù)據(jù)集合,并與醫(yī)院信息系統(tǒng)(HIS)大數(shù)據(jù)、檢驗(yàn)信息系統(tǒng)(LIS)大數(shù)據(jù)和電子病歷(EMR)等組成醫(yī)療大數(shù)據(jù)[1]。
隨著技術(shù)的發(fā)展,醫(yī)學(xué)影像設(shè)備能以更快地速率和更強(qiáng)大的分辨率來收集數(shù)據(jù),這些數(shù)據(jù)大多要進(jìn)行人工分析,人工分析的缺點(diǎn)很明顯,容易導(dǎo)致漏診和誤診,同時(shí)也意味著放射科醫(yī)師在未來處理影像數(shù)據(jù)的壓力會(huì)越來越大,甚至遠(yuǎn)遠(yuǎn)超過負(fù)荷[2]。利用分析工具對(duì)許多診斷任務(wù)進(jìn)行初始過濾來篩選異常,并可以量化測(cè)量值和時(shí)間的變化,對(duì)改善診斷質(zhì)量和減輕醫(yī)生負(fù)擔(dān)起到至關(guān)重要的作用,在這些工具當(dāng)中,深度學(xué)習(xí)被迅速地證實(shí)了其優(yōu)越性及準(zhǔn)確性,并以一種前所未有的速度不斷發(fā)展[3]。
本文首先介紹深度學(xué)習(xí)算法的模型、框架及其在醫(yī)學(xué)影像學(xué)中的應(yīng)用,并從深度學(xué)習(xí)應(yīng)用最多的幾個(gè)類型及領(lǐng)域具體分析研究進(jìn)展,最后,總結(jié)研究動(dòng)向,預(yù)測(cè)研究趨勢(shì),并提出深度學(xué)習(xí)在醫(yī)學(xué)影像研究中可能存在的問題及建議。
深度學(xué)習(xí)算法是對(duì)神經(jīng)網(wǎng)絡(luò)的進(jìn)一步改進(jìn),包含了更多的計(jì)算層,在醫(yī)學(xué)影像處理中使用到的深度學(xué)習(xí)模型主要有SAE、RBM、DBN、CNN、U-net及FCNN。
神經(jīng)網(wǎng)絡(luò)屬于一種數(shù)學(xué)模型,其目的在于對(duì)生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能模仿,是深度學(xué)習(xí)算法的基礎(chǔ)架構(gòu)。神經(jīng)網(wǎng)絡(luò)由很多節(jié)點(diǎn)(也可以叫做神經(jīng)元)通過互相聯(lián)接構(gòu)成,每個(gè)節(jié)點(diǎn)使用一種特定的輸出函數(shù),名為激勵(lì)函數(shù)(activation function),一個(gè)用于調(diào)整該連接信號(hào)強(qiáng)度的加權(quán)值,名為權(quán)重[4]。1986年由Rumelhart和McClelland為首的科學(xué)家提出的BP神經(jīng)網(wǎng)絡(luò),即多層前饋型神經(jīng)網(wǎng)絡(luò),是最經(jīng)典、使用最廣泛的神經(jīng)網(wǎng)絡(luò)模型。神經(jīng)網(wǎng)絡(luò)應(yīng)用非常廣泛,比如語音識(shí)別和機(jī)器視覺,想要通過傳統(tǒng)基于規(guī)則的編程解決這些問題基本上很難做到。
自動(dòng)編碼器(AE)、限制玻爾茲曼機(jī)(RBM)以及RBM堆疊后得到的深度信念網(wǎng)絡(luò)(DBN)都是在深度學(xué)習(xí)領(lǐng)域廣泛使用的基礎(chǔ)性結(jié)構(gòu)[5-6]。它們都作為無監(jiān)督學(xué)習(xí)的模型,利用最小化實(shí)現(xiàn)誤差的重構(gòu),對(duì)系統(tǒng)的重要特征加以提取,自動(dòng)分類輸入的相關(guān)數(shù)據(jù);尤為關(guān)鍵的是,以逐層的預(yù)訓(xùn)練和多層的堆疊為依托,在后續(xù)監(jiān)督學(xué)習(xí)的時(shí)候,深度信念網(wǎng)絡(luò)和層疊式自動(dòng)編碼器都能夠幫助整個(gè)神經(jīng)網(wǎng)絡(luò)收斂到最小值點(diǎn),并且更好、更快的完成分類任務(wù)。
1998年基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的LeNet誕生,它是由一個(gè)或多個(gè)卷積層和全連接層(經(jīng)典的神經(jīng)網(wǎng)絡(luò))組成,之后CNN的鋒芒開始被SVM等手工設(shè)計(jì)的特征蓋過,隨著激活函數(shù)ReLU和防止過擬合Dropout函數(shù)的提出,另外受GPU和大數(shù)據(jù)歷史機(jī)遇的影響,在2012年,CNN的歷史性突破出現(xiàn)了,在圖像分類和檢測(cè)等方面碩果累累,于是開始廣泛被人們所接受。對(duì)于卷積神經(jīng)網(wǎng)絡(luò)來說,它也屬于前饋型神經(jīng)網(wǎng)絡(luò),最大的優(yōu)點(diǎn)是它的多層結(jié)構(gòu)具有自動(dòng)學(xué)習(xí)的特點(diǎn),另外能夠?qū)W到多個(gè)層次的特征。卷積層較淺的話,其感知域也不大,只能實(shí)現(xiàn)一些局部區(qū)域特征的學(xué)習(xí)。而卷積層較深的話,其具備的感知域也較大,從而能夠?qū)崿F(xiàn)更加抽象特征的學(xué)習(xí)。在分類的時(shí)候這些抽象的特征作用非常大,對(duì)于一幅圖像中包含什么類別的物體它能夠很好地判斷出來,然而由于一些物體的細(xì)節(jié)丟失,對(duì)于物體的具體輪廓不能很好地分割[7]。在隨后的幾年里,使用相關(guān)技術(shù)但更深的神經(jīng)網(wǎng)絡(luò)架構(gòu)得到迅速發(fā)展,在計(jì)算機(jī)視覺領(lǐng)域,深度卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)成為了必不可少的技術(shù)。
2015年,加利福尼亞大學(xué)伯克利分校的Long等人提出全卷積神經(jīng)網(wǎng)絡(luò)(FCNN)。FCNN是將傳統(tǒng)CNN中的全連接層轉(zhuǎn)化成一個(gè)個(gè)的卷積層,并利用卷積神經(jīng)網(wǎng)絡(luò)的反向傳播原理及學(xué)習(xí)能力,得到較準(zhǔn)確的圖像分割結(jié)果[7]。FCNN無需全連接層即可進(jìn)行密集的像素預(yù)測(cè),使用這種方法可以生成任意大小的圖像分割圖。之后,圖像語義分割領(lǐng)域幾乎所有的先進(jìn)方法都以該模型為基礎(chǔ)。
U-net是Ronneberger等在2015年提出的網(wǎng)絡(luò)結(jié)構(gòu),并在2015年世界細(xì)胞跟蹤與識(shí)別挑戰(zhàn)賽中取得了第一名[8]。U-net的基礎(chǔ)就是全卷積神經(jīng)網(wǎng)絡(luò),不同于FCNN,U-net較淺的高分辨率層用來解決像素定位的問題,較深的層用來解決像素分類的問題,將淺層特征圖與深層特征圖結(jié)合,用于圖像分割及邊緣檢測(cè)。
在醫(yī)學(xué)方面,深度學(xué)習(xí)的一個(gè)典型應(yīng)用就是疾病診斷。它以疾病的相關(guān)數(shù)據(jù)為依據(jù),通過深度學(xué)習(xí)模型能夠?qū)崿F(xiàn)發(fā)病風(fēng)險(xiǎn)或者異常病變準(zhǔn)確的預(yù)測(cè)。在醫(yī)學(xué)影像方面,通過對(duì)圖像的分類、定位以及分割和檢測(cè)等方法的組合應(yīng)用,可以對(duì)2D和3D醫(yī)學(xué)影像數(shù)據(jù)加以輔助分析和診斷[9]。疾病輔助診斷的自動(dòng)化在數(shù)據(jù)處理方面速度更快,把可信的數(shù)據(jù)提供給醫(yī)師參考,同時(shí)主觀因素不會(huì)對(duì)其判斷產(chǎn)生影響,在醫(yī)師工作負(fù)擔(dān)減輕的同時(shí),也使得效率和診斷準(zhǔn)確率得到提升。目前,應(yīng)用深度學(xué)習(xí)算法進(jìn)行輔助診斷已經(jīng)涉及到了多個(gè)解剖領(lǐng)域,如腦、眼、肺、乳腺、心臟、腹部等。
腦部的解剖圖像主要來源于CT、MRI、功能MRI以及正電子發(fā)射斷層掃描(PET),不少生物醫(yī)學(xué)工程的科學(xué)家以這些成像工具為依托,并結(jié)合深度學(xué)習(xí)模型從圖像中提取特征。目前,大量的研究涉及阿爾茨海默病的分類、腦組織和解剖結(jié)構(gòu)(如海馬體)的分類,以及其他重要病變的識(shí)別和分割,如神經(jīng)膠質(zhì)瘤、白質(zhì)病變、腦梗死及腦出血。阿爾茨海默病(AD)又屬于起病隱匿的一種進(jìn)行性發(fā)展神經(jīng)系統(tǒng)退行性方面的疾病,患者陷入癡呆狀態(tài)是其最常見的臨床特征[10]。我國(guó)已經(jīng)進(jìn)入老齡化社會(huì),而在即將到來的二十年里,估計(jì)將增加一倍的患者,到2050年,大約每85個(gè)人中就有一人患此病。因?yàn)榛疾∪藬?shù)越來越多,也極大地提升了AD患者的護(hù)理費(fèi)用,這種情況下早期診斷和治療AD越來越重要,而深度學(xué)習(xí)成為輔助診斷的重要手段。以SAE進(jìn)行預(yù)訓(xùn)練為依據(jù),Hosseini-Asl等[11]提出了一種新的深度監(jiān)督自適應(yīng)3D-CNN網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)可以對(duì)AD特征實(shí)現(xiàn)自動(dòng)提取識(shí)別,把由AD引起的變化加以捕獲,包括腦室大小、海馬形狀及皮質(zhì)厚度,利用這些特征對(duì)腦部MRI影像進(jìn)行分析和識(shí)別。
乳腺的輔助診斷是神經(jīng)網(wǎng)絡(luò)應(yīng)用最早的領(lǐng)域之一,最近,科學(xué)家們的興趣又開始回歸,使得乳腺影像的分割與識(shí)別技術(shù)顯著提高,幾乎實(shí)現(xiàn)了人類專家對(duì)乳腺影像感興趣區(qū)域進(jìn)行分割的表現(xiàn)。由于大多數(shù)乳腺成像技術(shù)都是二維的,所以在自然圖像分割和識(shí)別中已經(jīng)成功的方法很容易被轉(zhuǎn)移到對(duì)乳腺圖像的分析和識(shí)別上。但仍面臨三個(gè)巨大挑戰(zhàn):①對(duì)類腫瘤病變的檢測(cè)和分類;②檢測(cè)和分類微鈣化點(diǎn);③乳腺癌風(fēng)險(xiǎn)評(píng)分。
目前,國(guó)內(nèi)外都有針對(duì)乳腺癌的篩查措施,應(yīng)該有大量的數(shù)據(jù)可供使用。但不幸的是,公共醫(yī)學(xué)影像數(shù)據(jù)并不完全可用,因此,依托大量訓(xùn)練樣本的監(jiān)督式深度學(xué)習(xí)模型很難快速發(fā)展,許多論文使用的是小數(shù)據(jù)集,導(dǎo)致了性能不高。一些項(xiàng)目通過探索半監(jiān)督學(xué)習(xí)、弱監(jiān)督學(xué)習(xí)以及轉(zhuǎn)移學(xué)習(xí),來改善模型性能。
當(dāng)大數(shù)據(jù)集可用時(shí),可以獲得更好的結(jié)果。在2016年的SPIE醫(yī)學(xué)影像會(huì)議上,乳腺X線成像CAD領(lǐng)域一家領(lǐng)先公司的研究人員宣布,他們使用AlexNet,在公司專有的大型數(shù)據(jù)庫(kù)上進(jìn)行訓(xùn)練,多年前就已經(jīng)獲得了一個(gè)性能優(yōu)于手工提取特征的乳腺影像輔助診斷系統(tǒng)。
從當(dāng)前來看,毫無疑問肺癌是世界上發(fā)病率和死亡率都非常高的惡性腫瘤之一,每年死亡人數(shù)高達(dá)140萬,它在所有惡性腫瘤死亡人數(shù)能夠占到18%。每年新發(fā)肺癌患者,預(yù)計(jì)中國(guó)到2025年甚至要超過100萬人。肺癌早期沒有任何臨床癥狀,對(duì)于約75%的肺癌患者而言,在診斷的時(shí)候即處于中晚期,5年生存率為15.6%,因此肺癌的早期診斷十分重要。痰脫落細(xì)胞及纖維支氣管鏡、傳統(tǒng)的X線胸片和CT等是篩查肺癌主要的方法,而胸部X線及CT是最常見的放射學(xué)檢查。肺結(jié)節(jié)的輔助診斷是神經(jīng)網(wǎng)絡(luò)最早涉及的領(lǐng)域之一,一些研究對(duì)CT影像上孤立性肺結(jié)節(jié)的輔助診斷正確率已經(jīng)達(dá)到81.3%,還有一些研究使用大量的X線胸片和文本報(bào)告來訓(xùn)練系統(tǒng)[12]。在最近的一項(xiàng)針對(duì)肺結(jié)節(jié)CT檢測(cè)的挑戰(zhàn)中,基于CNN架構(gòu)的LUNA16模型被所有的頂級(jí)深度學(xué)習(xí)系統(tǒng)所使用,這個(gè)系統(tǒng)仍然依賴于傳統(tǒng)的基于規(guī)則的圖像處理系統(tǒng)對(duì)結(jié)節(jié)進(jìn)行候選,但是使用深層神經(jīng)網(wǎng)絡(luò)進(jìn)行候選檢測(cè)的系統(tǒng)譬如U-net,執(zhí)行得也很好。目前,完全由計(jì)算機(jī)通過CT來估計(jì)個(gè)體是否患有肺癌的概率仍然是一個(gè)重要的課題,在2017年Kaggle的數(shù)據(jù)科學(xué)大賽中,就有超過1000個(gè)參賽隊(duì)伍,針對(duì)這個(gè)主題來爭(zhēng)奪100萬美金的獎(jiǎng)勵(lì)。
深度學(xué)習(xí)已經(jīng)應(yīng)用到心臟圖像分析的許多方面,MRI是最常見的研究形式,左心室分割是最常見的任務(wù),還包括冠狀動(dòng)脈中心線跟蹤、圖像質(zhì)量評(píng)估以及自動(dòng)鈣化積分。大多數(shù)論文涉及的都是簡(jiǎn)單的2D CNN,Poudel等[13]人將CNN和RNN(Recurrent Neural Network 遞歸神經(jīng)網(wǎng)絡(luò))結(jié)合,在U-net模型中引入了一種重復(fù)的連接,通過切片來分割左心室,并不斷學(xué)習(xí)用于下次分割。這一領(lǐng)域最大的挑戰(zhàn)是2015年的Kaggle數(shù)據(jù)科學(xué)大賽中,目標(biāo)是在心臟MRI中自動(dòng)測(cè)量收縮壓和舒張壓。192個(gè)參賽隊(duì)參加了20萬美元的獎(jiǎng)金競(jìng)賽,排名最高的參賽隊(duì)伍都使用了深度學(xué)習(xí),特別是CNN或U-net。
由于腹部臟器形狀多變、位置不固定,因此深度學(xué)習(xí)在腹部的應(yīng)用主要是對(duì)肝臟、胰腺、腎臟、膀胱和前列腺等臟器進(jìn)行定位和分割,成像形式仍然是CT和MRI,有兩個(gè)腹部分割的挑戰(zhàn)賽值得關(guān)注,一個(gè)是肝臟分割挑戰(zhàn)賽SLIVER07,一個(gè)是前列腺分割挑戰(zhàn)賽PROMISE12。在PROMISE12挑戰(zhàn)賽上排名第一的是使用類似U-net的3D 全卷積網(wǎng)絡(luò),而在SLIVER07上,對(duì)一個(gè)10歲小孩的肝臟分割挑戰(zhàn)賽上則使用了CNN[14]。目前,絕大部分應(yīng)用仍然使用半自動(dòng)或交互的方式進(jìn)行分割,直到2016年CNN才開始在腹部臟器的定位和分割中逐漸大量應(yīng)用。
綜上所述,基于人工智能的深度學(xué)習(xí)算法已經(jīng)滲透到了醫(yī)學(xué)影像學(xué)中的各個(gè)方面,基于深度學(xué)習(xí)算法的應(yīng)用不僅可以快速進(jìn)行疾病的篩查,還能輔助放射科醫(yī)生對(duì)疾病進(jìn)行診斷,從而提高診斷正確率及工作效率。
但深度學(xué)習(xí)應(yīng)用于醫(yī)學(xué)影像領(lǐng)域的分析和診斷也存在一些問題:①模型提取影像大數(shù)據(jù)的特征不可見,對(duì)于分析不同特征的重要性很困難;②在有監(jiān)督的深度學(xué)習(xí)算法中,為了提高擬合的精確度,訓(xùn)練樣本和測(cè)試樣本的數(shù)據(jù)量巨大,增加了模型的訓(xùn)練難度;③由于運(yùn)算量大,深度學(xué)習(xí)訓(xùn)練時(shí)對(duì)內(nèi)存、CPU及GPU都有較高要求,且訓(xùn)練時(shí)間長(zhǎng),對(duì)計(jì)算機(jī)硬件要求較高;④深度學(xué)習(xí)并沒有實(shí)現(xiàn)全智能,它必須依賴已有大量的數(shù)據(jù)樣本,才能對(duì)新數(shù)據(jù)進(jìn)行分析和預(yù)測(cè),而從疾病方面分析,往往我們不能夠控制它的變異性。
雖然困難非常大,然而通過目前醫(yī)療改革的趨勢(shì),能夠預(yù)想在醫(yī)學(xué)影像學(xué)中深度學(xué)習(xí)將會(huì)獲得更為廣泛的應(yīng)用;另外由于深度學(xué)習(xí)方法更加趨于完善和精確,我們有理由相信,未來這些困難一定會(huì)被以深度學(xué)習(xí)為依托的醫(yī)學(xué)影像輔助診斷技術(shù)所克服。
中國(guó)醫(yī)學(xué)計(jì)算機(jī)成像雜志2018年5期