惠瑞,高小紅,田增民
1.中國人民解放軍海軍總醫(yī)院 神經(jīng)外科,北京 100048;2.布萊根婦女醫(yī)院 神經(jīng)外科,波士頓 02115;3.密德薩斯大學(xué) 計算機(jī)科學(xué)部,倫敦 NW4 4BT,英國
基于深度學(xué)習(xí)的CT腦影像分類方法用于阿爾茨海默病的初步篩查
惠瑞1,2,高小紅3,田增民1
1.中國人民解放軍海軍總醫(yī)院 神經(jīng)外科,北京 100048;2.布萊根婦女醫(yī)院 神經(jīng)外科,波士頓 02115;3.密德薩斯大學(xué) 計算機(jī)科學(xué)部,倫敦 NW4 4BT,英國
目的本研究旨在探討卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)深度學(xué)習(xí)在腦CT影像分類中的應(yīng)用,達(dá)到提高影像分類智能化程度的目的,為臨床篩查阿爾茨海默?。ˋlzheimer Disease,AD)提供便利。方法收集2014~2016年3個類別的腦CT影像資料,其中包含AD、器質(zhì)性病變(如腫瘤、腦出血等)和正常老年化的受試者的數(shù)據(jù)。由于本組CT腦圖像高度方向(z軸,層厚5 mm)單位長度相對水平方向大的特點(diǎn),本研究將CT二維軸位CNN圖像和三維分割組塊進(jìn)行融合運(yùn)算分類后對照已有的診斷。結(jié)果AD、器質(zhì)性病變和正常老年化的分類準(zhǔn)確率分別為84.2%、73.9%和88.9%,平均為82.3%。結(jié)論本研究為初篩AD提供了新的方法。
卷積神經(jīng)網(wǎng)絡(luò);圖像分類;CT影像;阿爾茨海默病
阿爾茨海默氏癥(Alzheimer’s Disease,AD)在全世界65歲以上老年人的發(fā)病率約為4%~6%,最近統(tǒng)計數(shù)據(jù)表明全球已有將近4000萬名AD患者[1]。事實(shí)上,估計有60%的老年人有類似AD的表現(xiàn)但無法得到確診[2]。此外,患者到達(dá)AD中晚期后治療手段非常有限,因此AD的早期診斷顯得尤為重要。
計算機(jī)斷層掃描(CT)因其快速、簡單、廉價,同時又具備較好的成像質(zhì)量的特點(diǎn),幾乎在每一家醫(yī)院使用。此外,CT還可能是第一個被引入到人類大腦研究的成像工具[3]。然而,雖然大多數(shù)可疑的腦病患者雖都需要進(jìn)行CT檢查,但就功能性腦病患者而言,其主要目的為排除其他可能的器質(zhì)性疾?。ɡ纾B內(nèi)腫瘤、腦出血、腦梗死等)。因?yàn)镃T影像對軟組織的對比度較差,且檢查人員在手工測量腦結(jié)構(gòu)(例如內(nèi)側(cè)顳葉、海馬結(jié)構(gòu)等)時會出現(xiàn)一些誤差,所以對于AD等功能性疾病,CT并沒有作為主要診斷工具[4]。
另外,在CT腦影像對AD的輔助診斷方面,特定的腦萎縮不僅與AD有關(guān),也與正常老化和腦血管疾病有關(guān)。比如,內(nèi)側(cè)顳葉萎縮已被證明是AD最重要的診斷標(biāo)志物,但這不具備很強(qiáng)的特異性。此外,AD患者中也發(fā)現(xiàn)了海馬(尤其是左側(cè)海馬)的萎縮,這也會出現(xiàn)在健康的老年人身上[5]。然而,通過精確測量CT影像中顳角和鞍上池萎縮比率可以提高90.2%的診斷準(zhǔn)確性[5]。因此,基于CT影像的線性測量在AD患者診斷過程工作是很有價值的。
目前已有利用核磁共振影像(MRI)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型以早期診斷AD的文獻(xiàn)報道,例如利用基于改進(jìn)的AlexNet神經(jīng)網(wǎng)絡(luò)模型進(jìn)行MRI數(shù)據(jù)訓(xùn)練,已取得了較好的測試結(jié)果[6]。但在實(shí)際臨床工作中CT較MRI更易獲得,所以本研究以CT影像為主要研究對象。為了降低在人工測量過程中可能出現(xiàn)的較大誤差[4],本研究是利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的最新技術(shù),對阿爾茨海默病的CT影像數(shù)據(jù)的分類、分割和測量進(jìn)行非監(jiān)督的自動處理。在本研究中,對AD患者CT影像的分類,即對健康(正常)老年化和腦內(nèi)病變CT影像的識別是本研究的重點(diǎn)。
深層學(xué)習(xí)模型是一類機(jī)器學(xué)習(xí)層次結(jié)構(gòu),通過從低層級構(gòu)建高級特性[8-9],從而進(jìn)行自動化特征構(gòu)建。這些結(jié)構(gòu)模型中應(yīng)用較廣的是卷積神經(jīng)網(wǎng)絡(luò)[9]。CNN由一組機(jī)器學(xué)習(xí)算法構(gòu)成,包括涉及學(xué)習(xí)的算子處理層(線性和非線性)等多個層級(深層),因此必須通過從低層級數(shù)據(jù)構(gòu)建高層級的數(shù)據(jù),從而實(shí)現(xiàn)信息或特征的自動化構(gòu)建[10]。已經(jīng)證明,在適當(dāng)?shù)囊?guī)則下訓(xùn)練,神經(jīng)網(wǎng)絡(luò)在不依賴手工采集特征的條件下可以很好的實(shí)現(xiàn)對物體的識別,如尺度不變特征變換、加速穩(wěn)健特征[11-12]。此外,神經(jīng)網(wǎng)絡(luò)已被證明對存在一定變量的輸入數(shù)據(jù)相對不敏感[10]。
受生物視覺信號處理機(jī)制的啟發(fā),CNN運(yùn)用前饋人工神經(jīng)網(wǎng)絡(luò)來模擬變化的多層感知器[13]。利用此特性,它被廣泛地用于圖像和視頻的識別。目前,CNN已經(jīng)被證明是理解圖像內(nèi)容的有效模型,在圖像識別、圖形分割、圖像檢測與提取等方面可以得到很好的結(jié)果[14]。Liu等[15]利用了5個卷積層的CNN結(jié)構(gòu)設(shè)計,采用最大池化的方法進(jìn)行了3次降采樣取得預(yù)訓(xùn)練網(wǎng)絡(luò)來計算MRI圖像在各層的特征,從而對AD等不同疾病進(jìn)行分類。此外,計算機(jī)硬件技術(shù)的進(jìn)步已經(jīng)使CNN在圖像處理方面的應(yīng)用成為現(xiàn)實(shí)。
然而,CNN在計算機(jī)視覺信息處理領(lǐng)域的成功應(yīng)用主要基于二維圖像的處理。雖有少數(shù)研究報道CNN可以在處理二維視頻中發(fā)揮作用[13],但在一定程度上對三維圖像進(jìn)行處理卻與此不同。在本研究中,我們使用二維和三維模式的CNN來處理CT腦影像。
本研究共收集了342位受試者的CT數(shù)據(jù),其中71人為AD患者,138人患有各種類型的器質(zhì)性病變,133人為老年正常受試者。在我們的資料中,每位受試者CT數(shù)據(jù)的層數(shù)和像素有所不同,層數(shù)為26到35層,像素為512×512 或 912×912(圖 1)。
圖1 本研究受試者的CT影像
對于二維影像,每個層面都進(jìn)行圖像分割并標(biāo)準(zhǔn)化為360×360像素。對于正常人和AD患者的CT影像數(shù)據(jù),取中間的20個層面作為此類影像的研究數(shù)據(jù)庫。而對于有器質(zhì)性病變的CT影像數(shù)據(jù),只選取包含可見病變(例如腫瘤)的層面作為研究數(shù)據(jù)庫。結(jié)果顯示,雖然而對于有器質(zhì)性病變的CT影像研究數(shù)據(jù)庫是3類中最大的,但其層面的總數(shù)與其他數(shù)據(jù)相近。
同時,對于三維影像,每個受試者的CT影像數(shù)據(jù)分別進(jìn)行注冊、圖像分割并標(biāo)準(zhǔn)化為200×200×20像素的三維圖像。這樣,CT數(shù)據(jù)相對層厚為5 mm。由于CT可很好地顯示腦周圍的骨性結(jié)構(gòu),我們選擇剛體幾何變換如公式(1)所示。
其中,T為需要確定的包含平移、旋轉(zhuǎn)和縮放參數(shù)的變換矩陣,Imoving為要注冊的源圖像,I fixed為圖像模板。因此,為了實(shí)現(xiàn)T中各參數(shù)的確定,公式(2)需被最小化。
其中,xi指從圖像模板(作為參考)和源圖像(作為源)圖像中選擇的若干對應(yīng)點(diǎn)。為了補(bǔ)償每個圖像可能因強(qiáng)度不同而出現(xiàn)的縮放,增加了一個額外的強(qiáng)度縮放因子sa。
為了實(shí)現(xiàn)公式(2),我們選擇一個有30個層面的CT數(shù)據(jù)模版作為圖像模版,其他CT圖像數(shù)據(jù)則與之對齊。
完成標(biāo)準(zhǔn)化后,每個三維CT圖像數(shù)據(jù)被分解為40×40×10像素的組塊。與處理二維CT圖像類似,對于AD患者和正常人的數(shù)據(jù),所有組塊都被用于數(shù)據(jù)訓(xùn)練,而對于有器質(zhì)性病變CT圖像數(shù)據(jù),只使用含有可見病變的組塊。
在本研究中,二維CNN是沿大腦軸位方向使用基于MatConvNet[16-17]的Matlab軟件實(shí)現(xiàn)的。圖2顯示二維和三維CNN的融合過程。具體來說,針于訓(xùn)練圖像數(shù)據(jù)[(x(i),y(i))],圖像x(i)為三維圖像,y(i)為圖像x(i)的指示符向量,圖像的特征參數(shù),即w1……wL,將通過處理基于CNN的公式(3)來完成數(shù)據(jù)訓(xùn)練。
圖2 二維和三維CNN的融合過程
其中,?為適當(dāng)?shù)膿p失函數(shù)(如hinge損失函數(shù)或log損失函數(shù))。
為獲得這些特征參數(shù),二維CNN使用二維卷積算法在同層面的卷積層提取上一層面的特征參數(shù),然后應(yīng)用疊加性偏差,結(jié)果通過S函數(shù)傳遞,如公式(4)中所示。
在公式(4)中,tanh(.)表示雙曲正切函數(shù);m為上一層(i-1)th的數(shù)據(jù)參數(shù)指數(shù);bij指特征參數(shù)的偏差;是指在位置(p,q)的內(nèi)核連接到的第k個特征參數(shù);pi,Qi是指內(nèi)核的高和寬。
在二次采樣層,通過池化上一層面提取的特征參數(shù)使該層特征參數(shù)的分辨率降低,從而增加不變扭曲的輸入。CNN的架構(gòu)可以通過交替的方式堆疊多層卷積和二次采樣來實(shí)現(xiàn)。在CNN的參數(shù)中,如偏差參數(shù)bij和權(quán)重參數(shù)通常使用監(jiān)督或無監(jiān)督的訓(xùn)練方法[8,17-18]。
另外,為了保留CT影像Z軸方向的信息,人們對三維CNN進(jìn)行了探索。在三維CNN中,通過三維內(nèi)核向x-y軸方向(即二維)及z軸方向的卷積來實(shí)現(xiàn),在這里公式(4)可以擴(kuò)展為公式(5)用來計算在ith層面上jth特征參數(shù)中某點(diǎn)位置的值。
其中Ri為三維內(nèi)核在z軸方向的數(shù)值,為內(nèi)核(p,q,r)th連接到上一層的特征參數(shù)mth的數(shù)值。此外,三維池化也被引入以增加輸入圖像中失真和噪聲中的不變參數(shù)[19]。
在二維CNN模型中,每個層面的二維圖像應(yīng)用于訓(xùn)練模型,而三維CNN模型則使用立方體組塊(40×40×10)。因此,分類是在整體數(shù)據(jù)的級別上進(jìn)行的,且均結(jié)合了這兩個模型。對于正常老年化組,使用二維和三維數(shù)據(jù)分別對模型進(jìn)行訓(xùn)練后,其95%以上的二維層面數(shù)據(jù)和全部的三維組塊被標(biāo)記為“正常老年化”。因AD或病變通常表現(xiàn)于一個以上的層面,雖然有5%的二維數(shù)據(jù)(即一個層面)沒有被標(biāo)記,但并不影響最終結(jié)果。而對于AD組和器質(zhì)性病變組,因某CT影像可能同時具有AD組和器質(zhì)性病變組的特征,經(jīng)二維和三維模型訓(xùn)練后,在用于測試的CT數(shù)據(jù)時,如果標(biāo)記為AD的層面或組塊多,則分類為AD組,反之則分類為器質(zhì)性病變組。
表1為圖像處理過程中的數(shù)據(jù)信息。一個受試者的CT影像通常包含26到35個層面,共有342個三維影像數(shù)據(jù),5876個二維層面。這些數(shù)據(jù)被分為3組,應(yīng)用CNN完成訓(xùn)練、驗(yàn)證(避免過度擬合)和數(shù)據(jù)測試。
表1 每個運(yùn)算過程中使用影像數(shù)據(jù)的數(shù)量(n)
總共有180組數(shù)據(jù)被隨機(jī)抽選用來測試CNN分類系統(tǒng),其中包含2700個二維圖像和3795個三維組塊。每個組之間的數(shù)據(jù)的劃分是隨機(jī)選擇的,測試的混淆矩陣,見表2。CNN分類完成后,對照受試者的診斷計算分類準(zhǔn)確率。
表2 3個類別測試結(jié)果的混淆矩陣及準(zhǔn)確率(例)
最終,經(jīng)過CNN分類運(yùn)算及與原診斷對照,3類CT影像AD組、腦器質(zhì)性病變組和正常老年化組的分類準(zhǔn)確率分別為84.2%、73.9%和88.9%,平均為82.3%。
本研究應(yīng)用了目前流行的CNN深度學(xué)習(xí)的方法為一組腦CT影像分類,該組CT影像的受試者已明確診斷為AD、腦器質(zhì)性病變和正常老年化,CNN完成了自動分類運(yùn)算并具有很高的準(zhǔn)確性。
在本組數(shù)據(jù)中,雖然屬于腦器質(zhì)性病變的類別中包含最多的影像數(shù)據(jù)(n=138),但并非每個二維層面或三維組塊都包含病變信息。因此,腦器質(zhì)性病變組圖像數(shù)目實(shí)際最少,只有1717個層面,AD組和正常老年化組分別為1430和2729個層面。雖然3個類別的數(shù)據(jù)總量差異不顯著,特別是AD和腦器質(zhì)性病變組數(shù)據(jù)量十分接近,分類準(zhǔn)確率的結(jié)果似乎與每組數(shù)據(jù)的數(shù)量有相關(guān)性。例如,正常老年化組的數(shù)據(jù)量最大,總共有2729個層面,其分類準(zhǔn)確率88.9%也在3類中是最高的。所以,可以得到的結(jié)論是,更多的數(shù)據(jù)將獲得更好的分類結(jié)果。
此外,雖然CT影像實(shí)際為三維影像,但因其層厚較大(5 mm)導(dǎo)致三維CT影像的分類不如二維影像分類精確。因此,本研究融合使用二維和三維CT影像數(shù)據(jù),以獲得更好的結(jié)果。結(jié)果顯示,對AD患者的CT影像分類準(zhǔn)確率達(dá)到84.2%,其高準(zhǔn)確性使該方法可以作為AD的初篩工具使用,為早期診斷AD提供重要保證。
[1] Querfurth HW,Laferla FM.Alzheimer’s disease[J].New Engl J Med,2010,362(4):329.
[2] Dementia: https://www.gov.uk/government/news/[EB/OL].[2015-03].
[3] Waldemar G,H?gh P,Paulson OB.Functional brain imaging with single-photon emission computed tomography in the diagnosis of Alzheimer’s disease[J].Int Psychogeriatrics,1997,91(1):223.2.
[4] Jobst KA,Smith AD,Szatmari M,et al.Detection in life of confirmed Alzheimer’s disease using a simple measurement of medial temporal lobe atrophy by computed tomography[J].Lancet,1992,340(8829):1179-1183.3.
[5] Zhang Y,Londos E,Minthon L,et al.Usefulness of computed tomography linear measurements in diagnosing Alzheimer’s disease[J].Acta Radiologica,2008,49(1):91-97.
[6] 呂鴻蒙,趙地,吃學(xué)斌.基于增強(qiáng)AlexNet的深度學(xué)習(xí)的阿爾茨海默病的早期診斷[J].計算機(jī)科學(xué),44(6):50-60.
[7] Oksengaard AR,Haakonsen M,Dullerud R,et al.Accuracy of CT scan measurements of the medial temporal lobe in routine dementia diagnostics[J].Int J Geriatr Psych,2003,18(4):308-12.
[8] Fukushima, K.Neocognitron:A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position[J].Biol Cyb,1980,36:193-202.
[9] Lécun Y,Bottou L,Bengio Y,et al.Gradient-based learning applied to document recognition[J].P IEEE,1998,86(11):2278-2324.
[10] Lecun Y,Huang FJ,Bottou L.Learning methods for generic object recognition with invariance to pose and lighting[A].Computer Vision and Pattern Recognition[C].Washington:Proceedings of the 2004 IEEE Computer Society Conference on IEEE,2004,2:97-104.
[11] Kumar P,Henikoff S,Ng PC.Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm[J].Nat Protoc,2009,4(7):1073-1081.
[12] Feng Q,Xu W,Zhang X,et al.Research of image matching based on improved SURF algorithm[J].Telk Indon J Elec Engin,2013,12(2):1395-1402.
[13] Lecun Y.LeNet-5, convolutional neural networks[J].
[14] 張柏雯,林嵐,吳水才.深度學(xué)習(xí)在輕度認(rèn)知障礙轉(zhuǎn)化與分類中的應(yīng)用分析[J].醫(yī)療衛(wèi)生裝備,2017,38(9):105-111.
[15] Liu F,Shen C.Learning deep convolutional features for MRI based Alzheimer’s disease classification[EB/OL].https://www.researchgate.net/publication/261636125_Learning_Deep_Convolutional_Features_for_MRI_Based_Alzh- eimer’s_Disease_Classification.
[16] Xu W,Xu W,Yang M,et al.3D Convolutional Neural Networks for Human Action Recognition[J].IEEE T Pattern Anal,2012,35(1):221-231.
[17] Vedaldi A,Lenc K.MatConvNet: Convolutional neural networks for MATLAB[J].2014:689-692.
[18] Marc,Huang FJ,Boureau Y,et al.Unsupervised learning of invariant feature hierarchies with applications to object recognition[A].Columbus:Computer Vision and Pattern Recognition[C],2007:1-8.
[19] Lazar NA,Luna B,Sweeney JA,et al.Combining brains: a survey of methods for statistical pooling of information[J].Neuroimage,2002,16(2):538-550.
CT Brain Image Classification Based on Deep Learning in Application of Screening of Alzheimer Disease
HUI Rui1,2, GAO Xiaohong3, TIAN Zengmin1
1.Department of Neurosurgery, Navy General Hospital of the Chinese People’s Liberation Army, Beijing 100048, China;2.Neurosurgery Department, Brigham and Women’s Hospital, Boston 02115, US;3.Department of Computer Science, Middlesex University, London, NW4 4BT, UK
ObjectiveThe study aims to discuss the application of deep leaning based on the convolutional neural network (CNN) in the CT imaging classification, so as to improve the intelligent image classification for clinical screening of Alzheimer disease (AD).MethodsThree categories of brain CT image data, including the data from AD patients, organic lesion patients (eg. tumor, cerebral hemorrhage) and normal aging patients were collected. For the reason that the relative horizontal direction in CT brain image was high (z axis, seam thickness 5 mm), we fused the two dimensional and three dimensional CNN data in this study, and the results were compared with the diagnostic results. Results The accuracy rates of diagnosis for AD patients, organic lesion patients and normal aging patients were 84.2%, 73.9% and 88.9% respectively, with mean rate of 82.3%. Conclusion Our results supply a new method for preliminary screen of AD.
convolutional neural network; image classification; CT image; Alzheimer disease
R814.42
A
10.3969/j.issn.1674-1633.2017.12.004
1674-1633(2017)012-0015-05
2017-11-08
2017-11-26
國家863計劃(2007AA420100-1);European Union’s Framework 7 research program under grant agreement (PIRSESGA-2010-269124)。
作者郵箱:huirui2002@163.com
本文編輯 王靜