朱映璇,馮 巍,郭秀花
(首都醫(yī)科大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計學(xué)系,北京 100069)
神經(jīng)影像學(xué)是診斷阿爾茨海默病(Alzheimer′s disease,AD)及輕度認(rèn)知功能障礙(mild cognitive impairment,MCI)的重要方法。運用于AD診斷的成像方法通常包括磁共振成像(magnetic resonance imaging,MRI)、正電子發(fā)射計算機斷層顯像(positron emission tomography,PET)、功能MRI(functional magnetic resonance imaging,fMRI)等。在與AD有關(guān)的多項研究中都會使用到網(wǎng)絡(luò)公開數(shù)據(jù)庫“阿爾茨海默病神經(jīng)影像學(xué)計劃”(Alzheimer′s Disease Neuroimaging Initiative,ADNI) 的數(shù)據(jù)庫。該計劃建立了合作研究和數(shù)據(jù)共享平臺[1]。深度學(xué)習(xí)是機器學(xué)習(xí)的一部分,在各個領(lǐng)域,包括醫(yī)學(xué)影像學(xué)中已經(jīng)取得了令人矚目的成果并且具有巨大的發(fā)展?jié)摿2]。在AD的影像學(xué)診斷方面,有研究者評估了大腦不同區(qū)域的圖像在診斷上的不同意義[3]。也有研究者致力于設(shè)計一些方法將AD圖像與其他腦疾病圖像區(qū)分開,如Morabito等[4]提出了運用深度學(xué)習(xí)方法將克雅病和AD區(qū)分開。現(xiàn)就深度學(xué)習(xí)方法在AD腦圖像分析方面的應(yīng)用實踐進行綜述。
自動編碼器是由輸入層、隱含層和輸出層3層結(jié)構(gòu)構(gòu)成的人工神經(jīng)網(wǎng)絡(luò)[5]。堆疊自動編碼器是由多個自動動編碼器串聯(lián)堆疊構(gòu)成。堆疊自動編碼器的目的是為了逐層提取輸入數(shù)據(jù)的高階特征,在此過程中逐層降低輸入數(shù)據(jù)的維度,將一個復(fù)雜的輸入數(shù)據(jù)轉(zhuǎn)化成一系列簡單的高階的特征,然后再將這些高階特征輸入一個分類器或聚類器中進行分類或聚類。
Liu等[6]運用堆疊自動編碼器的方法對數(shù)據(jù)進行預(yù)訓(xùn)練,在運用ADNI數(shù)據(jù)庫中758名受試者[包括180例AD患者,160例轉(zhuǎn)化型MCI(converted mild cognitive impairment,cMCI)患者,214例非轉(zhuǎn)化型MCI(non- converted mild cognitive impairment,ncMCI)患者和204名正常老化對照受試者]MRI圖像數(shù)據(jù)的試驗中,對二分類任務(wù)的總體準(zhǔn)確度達82.59%,總靈敏度為86.83%;對多分類任務(wù)的總體準(zhǔn)確度為77.78%,總靈敏度為75.00%。另外,該團隊對ADNI數(shù)據(jù)庫中的331名受試者(包括77例正常對照,102例ncMCI,67例cMCI,85例AD患者)的MRI和PET數(shù)據(jù)進行多數(shù)據(jù)模式融合分析也得到較好的試驗結(jié)果。
Suk等[7]認(rèn)為以往的圖像分析方法存在一個主要的局限性,即只考慮簡單淺層特征,而他們于2013年提出的堆疊自動編碼器的新方法突破了這一局限性,提高了分類準(zhǔn)確性。在借助ADNI數(shù)據(jù)庫進行的試驗中,上述方法對AD、MCI和cMCI的診斷準(zhǔn)確度分別為 95.9%、85.0%和75.8%。2015年,Suk等[7]對該方法進行了改進。由于深度學(xué)習(xí)的預(yù)訓(xùn)練具有無監(jiān)督的特點,可以通過目標(biāo)以外的樣本對堆疊自動編碼器參數(shù)進行初始化,以此找到適應(yīng)目標(biāo)樣本的最佳參數(shù),從而進一步優(yōu)化該方法在二分類任務(wù)中的性能。與Liu等[6]的研究結(jié)果相比,Suk等[7]的方法準(zhǔn)確度和靈敏度更高。
深度學(xué)習(xí)方法在AD圖像的分類上雖然顯示了優(yōu)越的性能,但是往往需要大量的數(shù)據(jù)來進行模型訓(xùn)練和參數(shù)調(diào)整。針對這一點,Adel等[8]提出了使用三維散射變換的方法,這是一種類似于深度學(xué)習(xí)但又無需各種學(xué)習(xí)性參數(shù)的方法。另外,Arbabshirani等[9]提出這種由于有限的樣本量造成的問題可能通過“現(xiàn)代數(shù)據(jù)共享模型”來解決。數(shù)據(jù)共享的實現(xiàn)在當(dāng)前的社會環(huán)境中必定會遇到多方面的困難,機構(gòu)之間的數(shù)據(jù)管理體系不同,數(shù)據(jù)共享觀念的不普及,缺乏共享平臺等均是落實數(shù)據(jù)共享的不利因素,建議可以建立多中心數(shù)據(jù)共享平臺。
降噪自動編碼器是在自動編碼器的基礎(chǔ)上,為了防止過擬合問題而對輸入的數(shù)據(jù)(網(wǎng)絡(luò)的輸入層)加入噪音,使學(xué)習(xí)得到的編碼器具有較強的魯棒性,從而增強模型的泛化能力。Ithapu等[10]提出了一種新的深度學(xué)習(xí)模型,隨機降噪自編碼器,可以通過影像學(xué)生物標(biāo)志物對MCI階段的患者未來的認(rèn)知和神經(jīng)退行情況進行預(yù)測。MCI階段的患者往往是有關(guān)AD療法臨床試驗中的最佳選擇。然而,MCI患者具有很大的異質(zhì)性,并非每一個病例都會在試驗時間內(nèi)發(fā)展為AD,部分甚至不會發(fā)展為AD。如果能將這些最有可能在試驗期內(nèi)發(fā)展為AD,也因此最有可能從這些針對AD的療法中獲益的MCI病例鑒別出來,那么臨床試驗的效率將會大大提高,該治療方法療效評估的準(zhǔn)確性和可靠性也會提升。
Ithapu等[11]對該方法進行了優(yōu)化,新的方法基于隨機降噪自編碼器標(biāo)記對PET和fMRI的圖像進行了病變的鑒別。該團隊運用改進后的方法對ADNI數(shù)據(jù)庫中的516例患者的腦圖像(其中包括101例AD患者、148例健康對照、131例早期MCI患者和136例晚期MCI患者)進行了試驗,與現(xiàn)有的其他方法相比,該方法可以有效減少評估所需的樣本量,使小規(guī)模的評估具有更高的準(zhǔn)確性。2017年,該團隊又提出了一種稱之為隨機神經(jīng)網(wǎng)絡(luò)的新模型來解決這一問題[12]。
總之,應(yīng)以更加開闊的思維來看待深度學(xué)習(xí)在腦圖像方面的應(yīng)用,除對腦圖像的神經(jīng)影像學(xué)診斷外,在疾病的研究、治療、預(yù)后等方面深度學(xué)習(xí)方法也具有廣闊的應(yīng)用前景。
深度信念網(wǎng)絡(luò)是一種生成模型,通過訓(xùn)練其神經(jīng)元間的權(quán)重,可以讓整個神經(jīng)網(wǎng)絡(luò)按照最大概率生成訓(xùn)練數(shù)據(jù)。流形學(xué)習(xí)方法是模式識別中的基本方法,其中等距映射[13]和拉普拉斯特征映射是醫(yī)學(xué)圖像分析中最常用的。這兩種方法都需要一個預(yù)制鄰近圖。
Brosch和Tam[14]提出了一種基于深度信念網(wǎng)絡(luò)的新型流形學(xué)習(xí)方法對3D腦圖像進行分析。深度信念網(wǎng)絡(luò)的組成元件是受限玻爾茲曼機,其訓(xùn)練是逐層進行的[15]。Brosch和Tam[14]的方法與大多數(shù)現(xiàn)有的流形學(xué)習(xí)方法不同,不需要多邊形空間是局部線性的,并且不需要預(yù)先建立鄰近圖。該團隊對ADNI數(shù)據(jù)庫中的300名受試者MRI圖像(包括AD和正常者)進行試驗,結(jié)果表明基于深度信念網(wǎng)絡(luò)的方法較傳統(tǒng)基于卷積的方法更有效。Ortiz等[16]研究了用于AD早期診斷的圖像分類方法,他們提出通過自動解剖標(biāo)記方法劃分出大腦區(qū)域,然后根據(jù)這些區(qū)域?qū)⒏鞑糠值幕屹|(zhì)圖像分割成為3D補丁。這些補丁將被用于訓(xùn)練不同的深度信念網(wǎng)絡(luò)。集成這些網(wǎng)絡(luò),通過投票機制做出最終的預(yù)測。該團隊對ADNI數(shù)據(jù)集的試驗中,健康對照與AD分類準(zhǔn)確度為90%,ncMCI與AD分類準(zhǔn)確度為84%,健康對照與cMCI分類準(zhǔn)確度達83%。
深度學(xué)習(xí)方法對AD腦圖像分類的臨床意義不僅在于確診已經(jīng)發(fā)生的AD,在疾病的早期診斷和篩查方面也有很好的應(yīng)用前景,尤其是深度信念網(wǎng)絡(luò)通過對ncMCI和cMCI的分類,對于疾病的預(yù)后、轉(zhuǎn)歸具有較好的提示意義。
卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),其人工神經(jīng)元可以響應(yīng)一部分覆蓋范圍內(nèi)的周圍單元,在大型圖像處理中表現(xiàn)出優(yōu)異的性能,包括一維卷積神經(jīng)網(wǎng)絡(luò)、二維卷積神經(jīng)網(wǎng)絡(luò)以及三維卷積神經(jīng)網(wǎng)絡(luò)。
在AD圖像方面,有關(guān)卷積神經(jīng)網(wǎng)絡(luò)方法的研究較多。Sarraf和Tofighi[17]利用卷積神經(jīng)網(wǎng)絡(luò)成功地將AD受試者的fMRI數(shù)據(jù)與正常對照區(qū)分開來,檢測數(shù)據(jù)準(zhǔn)確度達96.85%。在二維卷積的基礎(chǔ)上,很多研究者發(fā)現(xiàn)了三維卷積的優(yōu)勢。Payan和Montana[18]將稀疏自動編碼器和卷積神經(jīng)網(wǎng)絡(luò)組合,在整個MRI圖像上使用三維卷積,產(chǎn)生了較二維卷積更好的性能。Gao等[19]提出一種運用卷積神經(jīng)網(wǎng)絡(luò)對CT圖像進行分析從而輔助診斷AD的方法。該方法的創(chuàng)新點在于同時融入二維和三維卷積神經(jīng)網(wǎng)絡(luò)。Hosseini- Asl等[20]提出了深度三維卷積神經(jīng)網(wǎng)絡(luò)模型。該方法對AD、病變以及正常3種CT圖像識別的準(zhǔn)確度分別為85.2%、80%和95.3%,平均為87.6%。
此外,卷積神經(jīng)網(wǎng)絡(luò)在腦圖像方面的應(yīng)用潛力也引起國內(nèi)許多研究者的興趣。呂鴻蒙等[21]對卷積神經(jīng)網(wǎng)絡(luò)的模型進行了改進,使之在醫(yī)學(xué)圖像方面的應(yīng)用更有針對性。林偉銘等[22]提出一種使用卷積神經(jīng)網(wǎng)絡(luò)對MRI腦圖像的海馬體區(qū)域進行識別的方法。程俊龍和趙越[23]提出一種基于深度學(xué)習(xí)的腦部MRI的灰質(zhì)和白質(zhì)分割算法。劉暢[24]搭建了一個深度卷積網(wǎng)絡(luò),用其進行MRI腦影像的分割,然后對分割的結(jié)果進行斷層重建,并將其立體顯示。
對多種影像學(xué)圖像數(shù)據(jù)進行綜合分析有利于提高診斷的準(zhǔn)確性,但這種方法面臨的一大挑戰(zhàn)是并非所有受試者都有分析需要的所有影像學(xué)資料。卷積神經(jīng)網(wǎng)絡(luò)方法可能彌補這一數(shù)據(jù)上的缺陷,從而有效提高疾病診斷的準(zhǔn)確性。Li等[25]提出了運用卷積神經(jīng)網(wǎng)絡(luò)評估AD腦圖像成像數(shù)據(jù)缺失部分的方法,他們采用三維卷積神經(jīng)網(wǎng)絡(luò)捕獲輸入與輸出數(shù)據(jù)間的關(guān)系。
雖然卷積神經(jīng)網(wǎng)絡(luò)具有上述諸多優(yōu)勢和應(yīng)用、發(fā)展價值,但大規(guī)模的神經(jīng)網(wǎng)絡(luò)往往容易出現(xiàn)過擬合問題。Dropout是防止過擬合的一大有力手段。Dropout是指在深度學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練過程中,對于神經(jīng)網(wǎng)絡(luò)單元按照一定的概率將其暫時從網(wǎng)絡(luò)中丟棄[26]。Li等[27]提出了基于MRI以及PET圖像的魯棒性深度學(xué)習(xí)系統(tǒng)對AD患者病情的不同進展階段進行鑒別并使用Dropout技術(shù)對經(jīng)典的深度學(xué)習(xí)方法進行優(yōu)化,從而防止過擬合的出現(xiàn)。
稀疏回歸可以避免回歸系數(shù)過大,防止過擬合,達到提取特征的目的。在各種引入AD影像學(xué)診斷的深度學(xué)習(xí)方法中,稀疏回歸是其中效果較好的一種。
Suk等[28]認(rèn)為,現(xiàn)有的稀疏回歸方法往往基于最優(yōu)回歸系數(shù),這種方法僅用一個步驟就完成了對圖像特征的提取,這就可能使最優(yōu)回歸系數(shù)受到非有效信息或有效性低的特征干擾。為了解決這一問題,他們提出了一種新型的深度學(xué)習(xí)模型,通過分層的方式進行稀疏多任務(wù)學(xué)習(xí),從而達到遞歸性丟棄非有效信息的目的。然而,最優(yōu)回歸系數(shù)確實能夠反映一個特征的相對重要性,他們將在上一個層級中得到的最優(yōu)回歸系數(shù)作為在下一個層級中的特征加權(quán)因子。該團隊還考慮了每一類樣本的分布特點,使用聚類誘導(dǎo)亞類別標(biāo)簽向量作為稀疏回歸模型中的目標(biāo)響應(yīng)值。上述方法在二分類或多分類任務(wù)中均表現(xiàn)良好。除了對方法的改進,Suk等[29]針對AD的診斷和預(yù)后開創(chuàng)性地將稀疏回歸和神經(jīng)網(wǎng)絡(luò)這兩種方法結(jié)合,構(gòu)建了一個用于臨床決策的深度卷積神經(jīng)網(wǎng)絡(luò),稱為“深度組合稀疏回歸網(wǎng)絡(luò)”。提示方法學(xué)的創(chuàng)新不僅在于構(gòu)建全新的模型,對現(xiàn)有方法進行有針對性的改進或?qū)⒉煌椒ㄟM行巧妙有機的結(jié)合也是具有應(yīng)用價值和前景的研究思路。
基于多種影像學(xué)數(shù)據(jù)的多模態(tài)分析,也引起許多研究者的興趣。多模態(tài)分析雖然具有更好的可靠性,但也對算法設(shè)計提出了更高的要求。
深度多項式網(wǎng)絡(luò)在針對大型數(shù)據(jù)集和小型數(shù)據(jù)集的試驗中都表現(xiàn)出了具有較好的準(zhǔn)確性和敏感性。Shi等[30]和Zheng等[31]提出了一種多模態(tài)堆疊深度多項式網(wǎng)絡(luò)算法,這種算法先使用了2個堆疊深度多項式網(wǎng)絡(luò)來學(xué)習(xí)MRI以及PET圖像的高級特征,然后分別反饋到另一個堆疊深度多項式網(wǎng)絡(luò)對多模態(tài)神經(jīng)影像學(xué)信息進行融合分析。利用ANDI數(shù)據(jù)集對該算法進行二分類任務(wù)和多分類任務(wù)的試驗,結(jié)果表明該算法優(yōu)于許多現(xiàn)有的基于多模態(tài)特征學(xué)習(xí)的AD診斷算法。
Suk等[32]使用深波爾茲曼機作為構(gòu)建塊,從3D補丁中尋找潛在的分層特征,從配對的MRI和PET 補丁中獲取聯(lián)合特征,并為其配置一種基于多模態(tài)深波爾茲曼機的系統(tǒng)方法。該團隊的研究成果在實際應(yīng)用中具有較好的結(jié)果,對ADNI數(shù)據(jù)集中共398名受試者的影像學(xué)資料進行試驗,在AD與健康對照、MCI與健康對照、cMCI與ncMCI的3個二分類任務(wù)中,最大精確度分別為95.35%、85.67%和74.58%。與同類針對多模態(tài)數(shù)據(jù)分析的方法相比,精確度較高,但是缺少在多分類上任務(wù)的試驗。
腦圖像結(jié)構(gòu)的分割是深度學(xué)習(xí)方法對腦圖像分析的第一步,特征的檢出和提取則是診斷的關(guān)鍵步驟和最終做出圖像分類決策的前提條件。與傳統(tǒng)計算機輔助診斷方法運用固有算法的模式相比,深度學(xué)習(xí)方法運用基于大量現(xiàn)實數(shù)據(jù)的訓(xùn)練從而得出的模型對感興趣區(qū)進行檢出,該過程更加可靠,從而在臨床實際工作中也能真正減少臨床醫(yī)師人工讀取的工作量。
在人工智能蓬勃發(fā)展的大背景下,深度學(xué)習(xí)方法的運用有望進一步提高計算機輔助醫(yī)學(xué)影像學(xué)診斷的效率和準(zhǔn)確性,無疑具有巨大的發(fā)展?jié)摿Γ杂兄T多問題亟待進一步探索和解決。在腦圖像分類上,從傳統(tǒng)的二分類轉(zhuǎn)向多分類,提高各種深度學(xué)習(xí)方法在腦圖像多分類方面的準(zhǔn)確度和靈敏度是深度學(xué)習(xí)方法在該領(lǐng)域進展的方向之一。針對多種影像學(xué)資料的多模態(tài)分析,可以有效提高疾病診斷的可靠性,如何為多模態(tài)分析設(shè)計和優(yōu)化相關(guān)的深度學(xué)習(xí)方法也需要研究者進一步探索。此外,除構(gòu)建新的模型,如何將已有的模型進行優(yōu)化或進行有機的結(jié)合,從而運用于數(shù)據(jù)處理、圖像診斷的不同方面也是一個有效的思路。除對方法進行改進,鼓勵放射科醫(yī)師積極參與數(shù)據(jù)庫的建設(shè)、規(guī)范相關(guān)的法律問題等都將是重要的議題。
基于已有數(shù)據(jù)訓(xùn)練出的模型,一方面可以避免個人決策的失誤和局限性,另一方面卻具有保留和固化現(xiàn)有的普遍錯誤,尤其是未被人類注意到的潛在錯誤的風(fēng)險。在醫(yī)學(xué)決策中,結(jié)合基礎(chǔ)研究、流行病學(xué)研究、臨床表現(xiàn)、輔助檢查等進行綜合的判斷和基于多種證據(jù)的決策仍需要由醫(yī)師做出。