張巧麗,遲學(xué)斌,趙 地
1(中國科學(xué)院 計(jì)算機(jī)網(wǎng)絡(luò)信息中心,北京 100190)
2(中國科學(xué)院大學(xué),北京 100049)
帕金森疾病(Parkinson’s Disease,PD)又名震顫麻痹,老年人中樞神經(jīng)系統(tǒng)第二大常見退行性疾病,其特點(diǎn)是黑質(zhì)致密部多巴胺能神經(jīng)元逐漸喪失,運(yùn)動(dòng)功能受損[1],并且表現(xiàn)為多巴胺能(DopAminergic,DA)神經(jīng)元進(jìn)行性喪失的特征[2].該病癥的平均發(fā)病年齡大概在60歲左右,40歲以下發(fā)病的青年帕金森病較少見.據(jù)統(tǒng)計(jì),在全世界大約有七百萬到一千萬的老年人正在承受著該疾病的困擾.我國65歲以上人群PD的患病率大約是1.7%[3],大部分帕金森患者為散發(fā)病例,僅有不到10%的患者有家族史,所以到目前為止PD的病因和發(fā)病機(jī)制還未明確.
多系統(tǒng)萎縮癥(Multiple System Atrophy,MSA)是一種緩慢進(jìn)行性的神經(jīng)退行性疾病[4],其特征在于以帕金森綜合征為主的MSA-P亞型運(yùn)動(dòng)減退性障礙和以小腦性共濟(jì)失調(diào)(cerebellar ataxi)為主的MSA-C亞型肢體共濟(jì)失調(diào).
核磁共振成像(Magnetic Resonance Imaging,MRI)是斷層成像的一種,它利用磁共振現(xiàn)象從人體中獲得電磁信號(hào),并重建出人體信息.目前該方法已經(jīng)被廣泛的應(yīng)用于醫(yī)學(xué)成像.并且在核磁共振圖像中我們可以獲取物質(zhì)的多種物理特性參數(shù),如質(zhì)子密度,自旋-晶格馳豫時(shí)間T1,自旋-自旋馳豫時(shí)間T2,擴(kuò)散系數(shù),磁化系數(shù),化學(xué)位移等等.在本實(shí)驗(yàn)中根據(jù)醫(yī)生建議采用磁共振擴(kuò)散加權(quán)成像(Diffusion Weighted Imaging,DWI)、T2和冠狀面T2水抑制序列(CorT2)三種MRI圖像.
目前醫(yī)學(xué)科技發(fā)展迅速,但是對于帕金森疾病的診斷多數(shù)通過病人的臨床癥狀才能確診;然而,國內(nèi)外專家通過大量臨床經(jīng)驗(yàn)及實(shí)驗(yàn)證明,帕金森的主要病理改變是黑質(zhì)紋狀細(xì)胞的進(jìn)行性損失和細(xì)胞內(nèi)路易斯小體的聚集,從黑質(zhì)、紋狀體DA能神經(jīng)元變性-丟失-出現(xiàn)臨床癥狀要經(jīng)歷一個(gè)漫長的臨床前過程,潛伏期約5年,黑質(zhì)DA能神經(jīng)元丟失<50%的患者臨床癥狀不明顯.當(dāng)患者出現(xiàn)PD臨床癥狀時(shí),腦內(nèi)DA能神經(jīng)元丟失70%~80%[5].
在MR高分辨率T2WI加權(quán)像/磁敏感加權(quán)成像(SWI)上正常黑質(zhì)核團(tuán)-1軸位形似燕尾,稱為燕尾征.PD病理特點(diǎn)是存在于黑質(zhì)中的多巴胺能神經(jīng)元進(jìn)行性缺失.先前研究發(fā)現(xiàn)黑質(zhì)種存在5個(gè)黑質(zhì)小體,且最大的黑質(zhì)小體-1是主要影響PD病理改變的結(jié)構(gòu).黑質(zhì)小體-1位于黑質(zhì)后1/3,軸位SWI上表現(xiàn)為條狀或者逗號(hào)形的高信號(hào),形似燕尾.黑質(zhì)小體所表現(xiàn)的“燕尾”前方、側(cè)面和內(nèi)側(cè)被SWI低信號(hào)圍繞,可見分叉.“燕尾征”消失用于診斷帕金森病準(zhǔn)確率大約為90%,對于帕金森患者而言,黑質(zhì)小體-1信號(hào)較低,表現(xiàn)為燕尾征消失[6],如圖1所示.
圖1 PD患者腦圖(中心標(biāo)注“燕尾癥”區(qū))
常規(guī)MRI檢查可見:1)腦萎縮:主要是錐體外系萎縮引起第三腦室增寬,彌漫性腦皮層萎縮所致的腦溝增寬.2)黑質(zhì)致密帶萎縮:在T2加權(quán)像/質(zhì)子密度加權(quán)像上,猶豫正常腦組織黑痣網(wǎng)狀帶和紅核中存在高濃度鐵,呈低信號(hào);致密帶鐵濃度較低音器局部呈等信號(hào).此外,還可見PD患者因黑質(zhì)細(xì)胞變性壞死和鐵代謝已成引起的致密帶變窄、邊緣模糊等表現(xiàn).通過觀察黑質(zhì)致密帶形態(tài)、信號(hào)變化、測量黑質(zhì)致密帶寬度以及黑質(zhì)致密帶寬度與中腦的比值,為診斷PD和鑒別診斷PD與血管性帕金森綜合征提供客觀依據(jù).3)由殼核后外側(cè)部鐵沉積引起T2加權(quán)像上紋狀體區(qū)呈低信號(hào)[7].
到目前為止,將深度學(xué)習(xí)方法和帕金森病癥診斷相結(jié)合的研究主要在以下方面.Al-Fatlawi和Jabardi等提出使用深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)[8]進(jìn)行帕金森病癥診斷,其中分析的信息為病人的語音信號(hào).該深度信念網(wǎng)絡(luò)由兩個(gè)受限玻爾茲曼機(jī)[9]和一個(gè)輸出層構(gòu)成,第一個(gè)進(jìn)行無監(jiān)督學(xué)習(xí),第二個(gè)是進(jìn)行反向傳播微調(diào)的監(jiān)督學(xué)習(xí).在該研究中測試的準(zhǔn)確度達(dá)到94%.Shamir和Dolber[10]等提出使用深度學(xué)習(xí)方法檢測病人的肢體遲緩程度,然后進(jìn)行分類診斷.在比較傳統(tǒng)機(jī)器學(xué)習(xí)方法和基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法中,深度學(xué)習(xí)在準(zhǔn)確率方面優(yōu)于其他機(jī)器學(xué)習(xí)方法4.6個(gè)百分點(diǎn).以上研究均是基于將深度學(xué)習(xí)方法和帕金森診斷相結(jié)合的.然而本實(shí)驗(yàn)采用帕金森患者的腦圖作為病癥診斷依據(jù)在以上帕金森病癥病理診斷中已經(jīng)做了充分調(diào)查研究,實(shí)際效果也體現(xiàn)了實(shí)驗(yàn)可行性.這也是本實(shí)驗(yàn)得創(chuàng)新之處.
本實(shí)驗(yàn)采用對圖像識(shí)別有良好效果的深度學(xué)習(xí)(Deep Learning,DL)方法,通過深度神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練大批量的MRI圖像,并學(xué)習(xí)圖像的特征,然后進(jìn)行病癥的預(yù)測和診斷.實(shí)驗(yàn)中采用的網(wǎng)絡(luò)是基于AlexNet網(wǎng)絡(luò)的優(yōu)化網(wǎng)絡(luò).AlexNet是2012年在ImageNet比賽中脫穎而出的網(wǎng)絡(luò),其良好的分類效果斬獲了當(dāng)年的比賽冠軍.GoogleNet是2014年ImageNet的比賽冠軍.本實(shí)驗(yàn)采用的基礎(chǔ)對照模型為AlexNet和GoogleNet,然后基于AlexNet模型進(jìn)行優(yōu)化,優(yōu)化后的模型在實(shí)驗(yàn)中獲得優(yōu)于原始模型的效果,并且也優(yōu)于經(jīng)典網(wǎng)絡(luò)GoogleNet.
2006年,深度學(xué)習(xí)以機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)分支呈現(xiàn)給人們,它采用多層復(fù)雜結(jié)構(gòu)或者采用多重非線性變換構(gòu)成的多個(gè)層進(jìn)行數(shù)據(jù)處理[11].到目前為止,深度學(xué)習(xí)在自然語言處理、語音識(shí)別特別是計(jì)算機(jī)視覺方面取得了突破性進(jìn)展[12].深度學(xué)習(xí)的優(yōu)點(diǎn)在于應(yīng)用分層的高效特征提取方法來代替手工獲取特征,這有效的解決了大批量的人工標(biāo)注工作.深度神經(jīng)網(wǎng)絡(luò)層次結(jié)構(gòu)如圖2.
圖2 深度神經(jīng)網(wǎng)絡(luò)多層結(jié)構(gòu)
深度學(xué)習(xí)的基本思想是通過構(gòu)建如上圖所示多層次神經(jīng)網(wǎng)絡(luò),從底層向高層逐步學(xué)習(xí)提取特征,最終通過大批量數(shù)據(jù)的訓(xùn)練學(xué)習(xí),構(gòu)建對應(yīng)的網(wǎng)絡(luò)模型,學(xué)習(xí)訓(xùn)練對象的相關(guān)特征.
目前常見深度神經(jīng)網(wǎng)絡(luò)主要包括:卷積層、池化層、激活層等.
1962年,Hubel和Wiesel通過研究貓眼的瞳孔區(qū)域和大腦皮層神經(jīng)元,提出了感受野(receptive field)的概念[13].后來學(xué)者Fukushima又基于此概念提出神經(jīng)認(rèn)知機(jī)(neocognitron),這是感受野概念在人工神經(jīng)網(wǎng)絡(luò)領(lǐng)域的第一次應(yīng)用.
含有卷積層的神經(jīng)網(wǎng)絡(luò)為多層神經(jīng)網(wǎng)絡(luò),該卷積層有多個(gè)二維矩陣構(gòu)成,每個(gè)矩陣有多個(gè)獨(dú)立神經(jīng)元構(gòu)成.卷積層的核心在于通過感受野和權(quán)值共享的應(yīng)用減少了深度神經(jīng)網(wǎng)絡(luò)要訓(xùn)練的參數(shù)個(gè)數(shù).如圖3所示.
圖3 全連接和局部連接
權(quán)值共享為設(shè)每個(gè)神經(jīng)元的參數(shù)相同,感受野即對應(yīng)卷積核局部學(xué)習(xí)的概念,通過上圖參數(shù)對比可知該計(jì)算減少了4個(gè)數(shù)量級[14].
池化層包含兩種:一種是平均值池化,另一種是最大值池化.
池化操作是特征圖縮小操作,會(huì)在原特征圖中提取主要特征.
因?yàn)榫€性模型的表達(dá)能力不夠,所以引入了非線性模型.激活層實(shí)現(xiàn)的是對輸入數(shù)據(jù)的激活即非線性函數(shù)變換.常用的激活函數(shù)有Sigmoid,tanh,ReLU[15]等,可以根據(jù)模型效果選擇不同的激活,通過激活層可以實(shí)現(xiàn)數(shù)據(jù)的更好分類.
圖4 最大值池化
圖5 平均值池化
本實(shí)驗(yàn)數(shù)據(jù)來自北京301醫(yī)院,其原始數(shù)據(jù)為DICOM(Digital Imaging and Communications in Medicine)圖像,通過RadiAntDICOMViewer軟件將病人信息刪除并導(dǎo)出img格式.其中詳細(xì)為:訓(xùn)練集:13 571;驗(yàn)證集:2396(占訓(xùn)練集的15%);測試集:2237(占總數(shù)據(jù)的10%).
圖6分別為PD、MSA和Normal(正常人)腦圖.
圖6 PD,MSA和Normal的腦圖
由于深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練需要批量數(shù)據(jù)學(xué)習(xí)特征,所以實(shí)驗(yàn)時(shí)需要將原始數(shù)據(jù)進(jìn)行擴(kuò)充,本實(shí)驗(yàn)采用以下兩種方式進(jìn)行數(shù)據(jù)擴(kuò)充.
3.2.1 圖像的旋轉(zhuǎn)
圖像旋轉(zhuǎn)是指圖像以某一點(diǎn)為中心旋轉(zhuǎn)一定的角度形成一幅新的圖像的過程,并且旋轉(zhuǎn)前后的點(diǎn)離中心的位置不變.假設(shè)點(diǎn)(x0,y0)距離原點(diǎn)的距離為r,點(diǎn)與原點(diǎn)之間的連線與x軸的夾角為b,旋轉(zhuǎn)的角度為a旋轉(zhuǎn)后的點(diǎn)為(x1,y1),那么:
原始點(diǎn)的位置:
旋轉(zhuǎn)后點(diǎn)的位置:
得到旋轉(zhuǎn)后的坐標(biāo),旋轉(zhuǎn)后的圖像的長和寬會(huì)發(fā)生變化,要重新計(jì)算新圖像的長和寬,計(jì)算方法如下:設(shè)原始圖像長為srcH,寬為srcW,以圖像中心為原點(diǎn)左上角,右上角,左下角和右下角的坐標(biāo)用于計(jì)算旋轉(zhuǎn)后的圖像的高和寬,它們大小分別為:
旋轉(zhuǎn)之后的坐標(biāo)分別設(shè)為pLTN,pRTN,pLBN,pRBN,大小分別為:
旋轉(zhuǎn)后的長和寬分別設(shè)為desHeight,desWidth,大小為:
原始圖和旋轉(zhuǎn)90°后的圖像如圖7所示.
3.2.2 圖像的鏡像處理
圖像的鏡像分為水平鏡像和垂直鏡像.設(shè)圖像的寬為width,長度為height,(x,y)為變換后的坐標(biāo),(x0,y0)為原圖像的坐標(biāo),
垂直鏡像變換:
其逆變換:
水平鏡像:
其逆變換:
圖7 原始圖(左)旋轉(zhuǎn) 90°后(右)
在本實(shí)驗(yàn)中采用的是垂直鏡像,實(shí)現(xiàn)左右腦圖像的對稱交換.垂直鏡像圖像對比如圖8.
圖8 原始圖(左)鏡像處理后(右)
AlexNet神經(jīng)網(wǎng)絡(luò)主要包括八個(gè)網(wǎng)絡(luò)層,5個(gè)卷積層,3個(gè)全連接,在每個(gè)卷積層內(nèi)部有更加細(xì)致的層次劃分,如圖9所示.優(yōu)化后網(wǎng)絡(luò)如圖10.
在第五層的池化層后,添加歸一層:
圖9 AlexNet神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖10 優(yōu)化的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
對比如上網(wǎng)絡(luò)結(jié)構(gòu)可知在原有AlexNet神經(jīng)網(wǎng)絡(luò)的第五層,本實(shí)驗(yàn)添加了norm5網(wǎng)絡(luò)層結(jié)構(gòu).對于加norm5實(shí)現(xiàn)的是Batch Normalization操作,在訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的過程中,其復(fù)雜性在于隨著前幾層參數(shù)的變化,每層輸入的分布在訓(xùn)練過程中也發(fā)生改變,所以導(dǎo)致了在訓(xùn)練的過程中學(xué)習(xí)率(learning rate)要設(shè)置的非常小,減慢了訓(xùn)練速度,該現(xiàn)象被稱為internal covariate shift[16],由于本實(shí)驗(yàn)圖像的多樣性(腦部的不同位置截圖),所以通過在第五層連接全連接層的位置添加歸一化層,通過歸一化輸入全連接層的數(shù)據(jù),將其規(guī)范化為模型架構(gòu)的一部分,使得模型可以使用更高的學(xué)習(xí)率,加速收斂,并且提升了模型效果.算法實(shí)現(xiàn)如下.
以上算法實(shí)現(xiàn)了對x的小批量激活轉(zhuǎn)換.
2015年Ioffe和Szegedy,將該方法應(yīng)用在Inception network[17]用來進(jìn)行ImageNet classification分類,取得了第五名4.82%的錯(cuò)誤率,超出了人類的準(zhǔn)確率.
GoogleNet以其較深且復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)在2014年脫穎而出,其主要?jiǎng)?chuàng)新在于根據(jù)深度和寬度受限設(shè)計(jì)的,并且設(shè)計(jì)了兩個(gè)輔助loss,是當(dāng)下比較成熟的深度神經(jīng)網(wǎng)絡(luò),所以以其作為對照實(shí)驗(yàn).
針對以上兩種模型進(jìn)行了四組實(shí)驗(yàn),分別是PD vs Normal,PD vs MSA,MSA vs Normal 和PD vs MSA vs Normal.以上模型訓(xùn)練的GPU設(shè)備配置了13塊NVIDIA Tesla K80,Intel(R)Xeon(R)CPU E5-2640 v4 6核處理器(2.40 GHz).四組實(shí)驗(yàn)12個(gè)模型可以同時(shí)訓(xùn)練,所有模型訓(xùn)練完成不超過20 min.實(shí)驗(yàn)結(jié)果如圖11至圖22.
4.2.1 PD vs Normal(PN)
對于PD和Normal即帕金森病癥和正常人進(jìn)行分類實(shí)驗(yàn)中(如圖11至圖13),在原有AlexNet實(shí)驗(yàn)的基礎(chǔ)上準(zhǔn)確率獲得了0.2%的提升,驗(yàn)證集損失獲得了0.01的降低,訓(xùn)練集損失獲得了0.04的降低.
圖11 優(yōu)化網(wǎng)絡(luò)結(jié)果
圖12 原AlexNet網(wǎng)絡(luò)結(jié)果
圖13 GoogleNet網(wǎng)絡(luò)結(jié)果
圖14 優(yōu)化網(wǎng)絡(luò)結(jié)果
4.2.2 PD vs MSA(PM)
對于PD和MSA即帕金森病癥和多系統(tǒng)萎縮進(jìn)行分類實(shí)驗(yàn)中(如圖14至圖16),在原有AlexNet實(shí)驗(yàn)得基礎(chǔ)上準(zhǔn)確率獲得了1%的提升,驗(yàn)證集損失保持持平,訓(xùn)練集損失獲得了0.01的降低.
圖15 原AlexNet網(wǎng)絡(luò)結(jié)果
圖16 GoogleNet網(wǎng)絡(luò)結(jié)果
圖17 原AlexNet網(wǎng)絡(luò)結(jié)果
圖18 優(yōu)化網(wǎng)絡(luò)結(jié)果
圖19 GoogleNet網(wǎng)絡(luò)結(jié)果
圖20 優(yōu)化網(wǎng)絡(luò)結(jié)果
4.2.3 MSA vs Normal(MN)
對于MSA和Normal即多系統(tǒng)萎縮病癥和正常人進(jìn)行分類驗(yàn)證的實(shí)驗(yàn)中(如圖17至圖19),在原有AlexNet的實(shí)驗(yàn)基礎(chǔ)上準(zhǔn)確率獲得了0.3%的提升,驗(yàn)證集損失獲得了0.01的降低,訓(xùn)練集損失獲得了0.03的降低.
圖21 原AlexNet網(wǎng)絡(luò)結(jié)果
圖22 GoogleNet網(wǎng)絡(luò)結(jié)果
4.2.4 PD vs MSA vs Normal(PMN)
對于PD、MAS和Normal即帕金森病癥、多系統(tǒng)萎縮癥和正常病人三種圖像分類的實(shí)驗(yàn)中(如圖20至圖22),在原有AlexNet的實(shí)驗(yàn)基礎(chǔ)上準(zhǔn)確率獲得了0.6%的提升,驗(yàn)證集損失獲得了0.12的降低,訓(xùn)練集損失與原實(shí)驗(yàn)保持持平.
對照原AlexNet實(shí)驗(yàn)結(jié)果和優(yōu)化網(wǎng)絡(luò)的實(shí)驗(yàn)結(jié)果以及GoogleNet實(shí)驗(yàn)結(jié)果匯總?cè)绫?至表3.
由上表數(shù)據(jù)分析,優(yōu)化的網(wǎng)絡(luò)結(jié)構(gòu)除了比原AlexNet網(wǎng)絡(luò)結(jié)構(gòu)較好之外,通過和GoogleNet的Acc和Loss的相關(guān)數(shù)據(jù)對比可知,優(yōu)化的網(wǎng)絡(luò)依然優(yōu)于GoogleNet.
表1 原AlexNet實(shí)驗(yàn)指標(biāo)匯總
表2 優(yōu)化網(wǎng)絡(luò)實(shí)驗(yàn)指標(biāo)匯總
表3 GoogleNet實(shí)驗(yàn)指標(biāo)匯總
本實(shí)驗(yàn)基于AlexNet神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)了優(yōu)化版的神經(jīng)網(wǎng)絡(luò).通過對改進(jìn)的AlexNet網(wǎng)絡(luò)和原始網(wǎng)絡(luò)分別在四組數(shù)據(jù)中的實(shí)驗(yàn)結(jié)果進(jìn)行分析,改進(jìn)版的AlexNet展示出了較好的分類效果,并且優(yōu)化版的神經(jīng)網(wǎng)絡(luò)和GoogleNet實(shí)驗(yàn)結(jié)果指標(biāo)對比中依然占優(yōu)勢.由于本實(shí)驗(yàn)數(shù)據(jù)量有限,可能存在些許誤差,但本實(shí)驗(yàn)為今后的網(wǎng)絡(luò)優(yōu)化提供了參考因素,并且對于醫(yī)學(xué)圖像的分類實(shí)現(xiàn)了全自動(dòng)化,避免了人工篩選造成的誤差.并且對PD的早期診斷和區(qū)別PD和MSA病癥提供了研究意義.
致謝
特別感謝北京301醫(yī)院提供的實(shí)驗(yàn)數(shù)據(jù)以及相關(guān)指導(dǎo).