王中陽,信俊昌,汪新蕾,王之瓊,4 ,趙 越
1(東北大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,沈陽 110169) 2(東北大學(xué) 醫(yī)學(xué)與生物信息工程學(xué)院,沈陽 110169) 3(遼寧省大數(shù)據(jù)管理與分析重點(diǎn)實(shí)驗(yàn)室,沈陽 110169) 4(沈陽東軟智能醫(yī)療科技研究院有限公司,沈陽 110179)
阿爾茨海默病(Alzheimer′s Disease,AD)是繼心臟病、腫瘤和腦血管疾病之后一種老年人較多發(fā)的疾病[1].有研究表明了AD患者大腦網(wǎng)絡(luò)的功能和結(jié)構(gòu)可以利用靜息態(tài)核磁共振(Resting-state functional Magnetic Resonance Imaging,rs-fMRI)研究,并且研究結(jié)果顯示患者的腦功能網(wǎng)絡(luò)連接發(fā)生了改變.這些研究主要是通過一定的腦模板將患者的大腦分成多個(gè)感興趣區(qū)域(Region of Interest,ROI),并計(jì)算這些ROI間的血氧飽和依賴信號(Blood Oxygen Level Dependent,BOLD)信號相關(guān)系數(shù)來建立一個(gè)功能網(wǎng)絡(luò).而后利用圖論的方法實(shí)現(xiàn)這個(gè)功能網(wǎng)絡(luò)的拓?fù)涮卣鞣治鯷2,3].這些研究認(rèn)為腦功能網(wǎng)絡(luò)揭示了不同大腦區(qū)域間功能的傳遞,可以為AD的研究提供新的視角.在此基礎(chǔ)上,已有研究將網(wǎng)絡(luò)拓?fù)涮卣髋c機(jī)器學(xué)習(xí)方法相結(jié)合,以實(shí)現(xiàn)AD的計(jì)算機(jī)輔助診斷.
而現(xiàn)階段BOLD信號相關(guān)性的計(jì)算通常是基于濾波去噪后的全頻信號計(jì)算的.在通常的研究中把這個(gè)范圍保留在0.01 Hz-0.1 Hz之間,然而這個(gè)頻率范圍較為寬泛[4-6].而Achard等人[4]利用離散小波變換應(yīng)用于fMRI時(shí)間序列,分析發(fā)現(xiàn),在0.007-0.45Hz的頻率范圍內(nèi),不同的大腦功能網(wǎng)絡(luò)的“小世界”屬性都有著顯著的不同[5].研究發(fā)現(xiàn)利用分頻的方式建立不同下的腦功能網(wǎng)絡(luò),可以實(shí)現(xiàn)對大腦功能網(wǎng)絡(luò)結(jié)構(gòu)特征的多樣化描述,并且這種多頻段的利用可以提高AD分類的準(zhǔn)確性[6].
因此,本文提出了基于多頻體網(wǎng)絡(luò)融合模型的AD患者與健康對照組(Healthy Control,HC)間的分類研究.通過建立大腦多頻段的體素級網(wǎng)絡(luò)模型結(jié)構(gòu),并將計(jì)算得到的不同頻段下的拓?fù)涮卣鬟M(jìn)行整合,并將整合后的特征用于機(jī)器學(xué)習(xí)方法進(jìn)行分類.首先,對數(shù)據(jù)進(jìn)行預(yù)處理,對于每一個(gè)受試者,保留0.01-0.2Hz信號;其次將離散小波變換用于fMRI時(shí)間序列,得到體素在不同頻域下的信號,而后計(jì)算信號的相關(guān)性得到不同頻段下的相關(guān)性矩陣;接著,通過圖論方法計(jì)算所有矩陣的特征;最后將這些特征進(jìn)行選擇與整合,并將其用于支持向量機(jī)(Support Vector Machine,SVM)來實(shí)現(xiàn)不同患者的分類研究.通過ADNI(Alzheimer′s Disease Neuroimaging Initiative)數(shù)據(jù)庫中獲取的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證結(jié)果了所提出方法的效率和有效性.
本文的主要貢獻(xiàn)如下:
1) 將腦功能網(wǎng)絡(luò)的規(guī)模從腦區(qū)級變?yōu)轶w素級,將小規(guī)模的腦網(wǎng)絡(luò)分析轉(zhuǎn)變?yōu)榇笠?guī)模的腦網(wǎng)絡(luò)分析充分利用了全腦體素的特征信息;
2) 提出了一種多頻段的網(wǎng)絡(luò)模型,考慮了腦功能網(wǎng)絡(luò)特征在不同頻段下的變化;
3) 通過整合不同頻段下體素的拓?fù)涮卣髯兓瑢?shí)現(xiàn)了阿茲海默癥患者與正常對照組間的分類.
在腦功能網(wǎng)絡(luò)分析中,2005年,Salvador等人[7]通過一個(gè)先驗(yàn)的腦圖譜(Anatomical Automatic Labeling,AAL)將大腦分成 90 個(gè)區(qū)域,首次構(gòu)建了靜息狀態(tài)下正常被試的大腦功能網(wǎng)絡(luò).
而后在利用腦區(qū)信息進(jìn)行換分的腦功能網(wǎng)絡(luò)研究受到了很大的關(guān)注,如Wang等人[8]采用圖論分析和統(tǒng)計(jì)分析的方式研究了檳郎成癮者、煙酒成癮者與健康人群間的腦功能網(wǎng)絡(luò)差異.而隨著神經(jīng)影像技術(shù)的最新進(jìn)展,腦功能網(wǎng)絡(luò)的規(guī)模也在不斷增加,研究從較大的腦區(qū)發(fā)展到了體素級.網(wǎng)絡(luò)中定義的節(jié)點(diǎn)數(shù)量隨著腦功能網(wǎng)絡(luò)尺度的定義從幾十發(fā)展到了幾萬.如Zweerings等人[9]從體素級的角度分了抑郁癥患者的腦功能我拿過來差異,發(fā)現(xiàn)患者聽覺皮層和丘腦以及后扣帶回之間的連接減弱.Lusher等人[10]構(gòu)建了一種快速生成高分辨率腦連接性圖的新方法,降低了體素級網(wǎng)絡(luò)構(gòu)建的難度,使得建立具有幾百萬節(jié)點(diǎn)的腦網(wǎng)絡(luò)成為了可能.
研究中發(fā)現(xiàn)隨著功能網(wǎng)絡(luò)尺度的逐漸增大,腦功能網(wǎng)絡(luò)中表現(xiàn)出來的特性也越來越豐富,這些特性為人類腦功能網(wǎng)絡(luò)中新的連接模式研究提供了更多支撐.
當(dāng)腦疾病產(chǎn)生后,這些拓?fù)鋵傩詴?huì)產(chǎn)生哪些變化,以及網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的變化能否為神經(jīng)疾病的診斷提供新的參考等已經(jīng)成為了腦功能網(wǎng)絡(luò)在疾病中研究中的重要內(nèi)容.計(jì)算機(jī)輔助診斷(Computer-aided Diagnosis,CADx)方法[11]為腦功能網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的變化提供了新的方式.該方法通常利用機(jī)器學(xué)習(xí)算法分類.將單個(gè)腦區(qū)的功能拓?fù)涮卣骰蛘吣X區(qū)間的相關(guān)性特征作為分類特征.如Zhu等人[12]提出了一種新的非負(fù)判別功能連接性選擇方法,以提取精神分裂癥患者與健康對照者之間腦功能連接性的變化,實(shí)現(xiàn)了精神障礙患者的分類.Yang等人[13]認(rèn)為如果將多個(gè)時(shí)間點(diǎn)數(shù)據(jù)添加到腦成像應(yīng)用中,可以更好地揭示縱向分析中的疾病進(jìn)展模式.因此提出了一種基于多任務(wù)學(xué)習(xí)的功能認(rèn)知障礙縱向分類方法.可見基于腦功能網(wǎng)絡(luò)的CADx方法有著一定的使用價(jià)值和研究價(jià)值.
對獲取到的fMRI數(shù)據(jù)使用統(tǒng)計(jì)參數(shù)映射軟件包(Statistical Parametric Mapping Software Package,SPM12)[14].進(jìn)行時(shí)間片校正和頭動(dòng)校正來完成預(yù)處理.首先,對每個(gè)樣本中的序列圖進(jìn)行掃描層間采集時(shí)間延遲的校正,使一個(gè)TR中各層的獲取時(shí)間相同.而后進(jìn)行頭動(dòng)校正,消除頭部不由自主的輕微運(yùn)動(dòng)帶來的影響.接著對BOLD信號進(jìn)行濾波處理,在盡可能降低干擾的同時(shí)保留較多的信息,因此,保留0.01-0.2Hz內(nèi)的信號作為有效信號.
在以往的網(wǎng)絡(luò)模型建立中,通常利用BOLD時(shí)域信號間的相似性,然而由于已知的研究中不同頻段下的BOLD信號有著明顯的差異.因此本文利用多頻段網(wǎng)絡(luò)模型來實(shí)現(xiàn)更加有效的腦功能網(wǎng)絡(luò)的連接模式描述[15].
利用離散小波變換將預(yù)處理后的BOLD信號逐層分解[16].將這些rs-fMRI圖像經(jīng)小波變換后得到的不同頻段下的信號x1,H[n],x2,H[n],…,xK,H[n],也就是對fMRI 圖像進(jìn)行分頻段處理所產(chǎn)生的一組每個(gè)頻段下所有腦區(qū)的信號頻域圖,記為:
φ={x1,H[n],x2,H[n],…,xK,H[n]}={φ1,φ2,…,φK}
(1)
φ中的每個(gè)矩陣描述了一幅圖像在不同的區(qū)域間信號的功能連接.其中,將rs-fMRI圖像小波變換產(chǎn)生的第m個(gè)的結(jié)果為:
(2)
根據(jù)每個(gè)rs-fMRI圖像在第m個(gè)上得到的分頻結(jié)果,對分頻得到圖像的各個(gè)節(jié)點(diǎn)之間的匹配關(guān)系進(jìn)行計(jì)算,確定在該下的腦網(wǎng)絡(luò)中邊的表示,采用互信息的方法來計(jì)算各個(gè)節(jié)點(diǎn)之間的相關(guān)關(guān)系,即:
(3)
其中,p(x,y)是圖像φ中X和Y兩個(gè)節(jié)點(diǎn)產(chǎn)生的序列的聯(lián)合概率分布函數(shù),而p(x)和p(y)分別是節(jié)點(diǎn)X和Y產(chǎn)生的序列的邊緣概率分布函數(shù).
同時(shí)可以將式(3)等價(jià)表示為兩個(gè)序列的熵的形式,即:
M(X,Y)=H(X,Y)-H(X|Y)-H(Y|X)
(4)
其中,H(X,Y)為X,Y兩個(gè)序列的聯(lián)合熵,H(X|Y)和H(Y|X)為條件熵.
通過上式計(jì)算出任意兩個(gè)節(jié)點(diǎn)序列之間的互信息值后,設(shè)定閾值k來判斷兩個(gè)節(jié)點(diǎn)之間的匹配關(guān)系,建立每個(gè)下的腦功能網(wǎng)絡(luò).因此圖像中每兩個(gè)節(jié)點(diǎn)之間的關(guān)系有著多個(gè)的描述,即得到的腦網(wǎng)絡(luò)中任意兩個(gè)節(jié)點(diǎn)之間存在著多條邊,因此構(gòu)成了一個(gè)可以描述多頻信息的多頻腦網(wǎng)絡(luò).
對于每一個(gè)受試者,利用腦連接工具箱(Brain Connectivity Toolbox,BCT)計(jì)算不同下的拓?fù)涮卣鱗17].這些特征包含兩部分,分別是圖像的全局特征和局部特征[18].其分類情況如表1所示.
表1 腦網(wǎng)絡(luò)全局特征和局部特征Table 1 Global and local features of brain networks
特征提取后得到的特征模型中可能存在某些特征受其他特征制約的現(xiàn)象.因此,通過特征選擇算法從已提取的特征中選出較優(yōu)的組合來提升分類的效果.由于每一個(gè)受試者用于機(jī)器學(xué)習(xí)的特征向量中包含了多個(gè)網(wǎng)絡(luò)下的多個(gè)特征,因此需要能處理較大維度特征的特征選擇方法.
在多頻網(wǎng)絡(luò)模型中,利用Khazaee等人[18]采用的Filter 和wrapper用于特征的選擇,首先,利用特征選擇Filter算法,即fisher算法,根據(jù)個(gè)體識(shí)別能力對所有特征進(jìn)行分類.然后選取識(shí)別能力最強(qiáng)的前一半特征,并應(yīng)用wrapper特征選擇算法對其進(jìn)行識(shí)別.采用前序特征選擇法和10折交叉驗(yàn)證實(shí)現(xiàn)了wrapper算法.
而后然后通過K個(gè)下特征的線性組合來整合出一個(gè)多特征向量,即
(5)
本實(shí)驗(yàn)基于MATLAB R2017b進(jìn)行,實(shí)現(xiàn)fMRI圖像的預(yù)處理及AAL模板匹配、多頻腦網(wǎng)絡(luò)的構(gòu)建以及AD分類準(zhǔn)確率參數(shù)分析等,通過實(shí)驗(yàn)驗(yàn)證了提出方法的準(zhǔn)確性和有效性.
表2 ADNI數(shù)據(jù)集詳情Table 2 Details of ADNI data set
實(shí)驗(yàn)數(shù)據(jù)來自ADNI數(shù)據(jù)庫,共獲取了184例靜息態(tài)功能性磁共振數(shù)據(jù)樣本,其中包含92例AD病人數(shù)據(jù)和92例正常對照組(Normal control)數(shù)據(jù).數(shù)據(jù)詳情如表2所示.
表3 實(shí)驗(yàn)參數(shù)取值Table 3 Values of experimental parameters
在實(shí)驗(yàn)中通過與未分頻網(wǎng)絡(luò)模型進(jìn)行對比來驗(yàn)證算法的有效性.實(shí)驗(yàn)參數(shù)如表3所示,表中加黑參數(shù)為實(shí)驗(yàn)中的最優(yōu)參數(shù).每次實(shí)驗(yàn)只改變表中一種參數(shù).
實(shí)驗(yàn)中對比了分頻與未分頻的網(wǎng)絡(luò)模型,并且為了對比體素級腦網(wǎng)絡(luò)與腦區(qū)級的差異,將每個(gè)受試者的采集數(shù)據(jù)匹配到了AAL腦模板上,同時(shí)根據(jù)數(shù)據(jù)分析,從每個(gè)fMRI數(shù)據(jù)中提取了15000個(gè)體素點(diǎn)作為對比.對比結(jié)果如表4所示:
表4 模型對比結(jié)果Table 4 Classification performance of proposed methods
如表4所示,所提出的分頻模型的分類性能比未分頻模型好得多.體素級多頻腦功能網(wǎng)絡(luò)的分類準(zhǔn)確率為85.5%,而對比的未分頻體素級腦功能網(wǎng)絡(luò)的分類準(zhǔn)確率分別為73.4%.結(jié)果表明,所提出的腦網(wǎng)絡(luò)分頻模型在計(jì)算腦網(wǎng)絡(luò)相似度時(shí)能取得較好的結(jié)果,從而能更好地輔助AD患者的診斷.
此外,通過實(shí)驗(yàn)可知,未分頻模型的AUC值為0.69,而所提出模型的AUC值為0.82,也說明了所提方法在輔助診斷阿爾茨海默病中的準(zhǔn)確性和有效性.
為了驗(yàn)證提出方法中將rs-fMRI圖像分所產(chǎn)生的最優(yōu)結(jié)果,分別將rs-fMRI圖像分成1-9個(gè)用于腦網(wǎng)絡(luò)分類的計(jì)算(1為未分頻),并分別將不同個(gè)數(shù)得到的模型用于SVM分類器中進(jìn)行AD和NC的分類,圖1表示不同個(gè)數(shù)對分類準(zhǔn)確性的影響.
圖1 分頻數(shù)量對分類準(zhǔn)確率的影響Fig.1 Classification accuracy of frequency bands
如圖1所示,在選擇其他參數(shù)的最佳值的前提下,當(dāng)頻段數(shù)為5時(shí),AD的診斷準(zhǔn)確率最高,分類準(zhǔn)確率為85.5%.當(dāng)頻段數(shù)為4時(shí),分類準(zhǔn)確率略小于最高值,為83%.
k表示構(gòu)建多頻腦網(wǎng)絡(luò)過程中比較互信息值時(shí)的閾值,為了評價(jià)這個(gè)參數(shù)對分類性能的影響,分別使用不同的參數(shù)值來計(jì)算分類精度.已知研究中通常的連接密度在[20%,70%]時(shí)分類效果最好,因此設(shè)置閾值k=[0.2-0.7]的連接網(wǎng)絡(luò)來獲取多頻腦網(wǎng)絡(luò).其結(jié)果如圖2所示.
圖2 網(wǎng)絡(luò)連接密度對分類準(zhǔn)確率的影響Fig.2 Classification accuracy of network density coefficient k
可知,k取0.4時(shí)診斷結(jié)果最優(yōu).
由上述實(shí)驗(yàn)可知,最優(yōu)的分頻數(shù)量為5.目前已有的的研究證明了腦功能的網(wǎng)絡(luò)中存在著小世界屬性,因此需要討論獲取的5個(gè)頻段下是否存在屬性的變化[19].
表5 不同頻段下正常人群的小世界屬性Table 5 Small world properties under different frequency bands of HC
表6 不同頻段下AD患者的小世界屬性Table 6 Small world properties under different frequency bands of AD
本文使用了Khazaee等[17]提出的局部特征和全局特征等多種圖特征結(jié)果如表7所示.
表7 分頻模型在不同特征下的準(zhǔn)確率Table 7 Accuracy of multiband under different features
實(shí)驗(yàn)中,每個(gè)局部特征包含多個(gè)值,全局特征包含一個(gè)值.通過特征的選擇,可以看到不同的特征對分類的準(zhǔn)確性有較大的影響.利用上述參數(shù)對每一組特征測試分類的性能.在每個(gè)分類中,除了只使用一個(gè)圖度量作為特征集外,算法的所有步驟都被執(zhí)行.特征集包含5個(gè)頻段的特征.為了考察分類能力,每次僅使用一種圖尺度進(jìn)行分類.由表5中可知局部特征略優(yōu)于全局特征,而局部和全局特征的組合經(jīng)過選擇可以達(dá)到最優(yōu)的組合.
為了研究圖特征對分類準(zhǔn)確性的影響,每次利用一個(gè)特征分析其分類準(zhǔn)確性,如表7所示中.采用Betweenness centrality時(shí),腦區(qū)級分類準(zhǔn)確度為77.3%,腦區(qū)級為78.7%.其次是Pagerank centrality,腦區(qū)級分類準(zhǔn)確度為76.2%,腦區(qū)級為78.2%,這兩種特征達(dá)到了單一特征的最高值.分類的準(zhǔn)確與否是特征的重要度量指標(biāo).一個(gè)網(wǎng)絡(luò)特征的分類性能代表了網(wǎng)絡(luò)的節(jié)點(diǎn)與其他具有相似程度的節(jié)點(diǎn)連接的趨勢.雖然沒有一個(gè)單獨(dú)的特征在分類中達(dá)到較高的準(zhǔn)確性,但所有特征的集合提供了85.5%的準(zhǔn)確度.這一結(jié)果表明,單獨(dú)使用一個(gè)圖特征可能不足以描述腦網(wǎng)絡(luò)變化的各個(gè)方面.
實(shí)驗(yàn)結(jié)果表明,網(wǎng)絡(luò)的中心度特征(Betweenness centrality,Pagerank centrality等)在作為單個(gè)特征進(jìn)行識(shí)別時(shí),取得了最佳的性能.AD患者的Betweenness centrality或Pagerank centralityd等特征表現(xiàn)出腦功能網(wǎng)絡(luò)的中心性發(fā)生了顯著變化.而由于阿爾茲海默患者腦功能網(wǎng)絡(luò)變化的復(fù)雜性使得需要利用多個(gè)特征來實(shí)現(xiàn)網(wǎng)絡(luò)的全方位描述.
現(xiàn)有的腦功能網(wǎng)絡(luò)基于時(shí)域信號匹配,忽略了不同頻段下腦信號的差異.本文從多頻段融合的角度構(gòu)建了體素級腦功能網(wǎng)絡(luò),充分考慮了不同頻段下的頻域信息以及腦區(qū)內(nèi)部信息.腦網(wǎng)絡(luò)的局部拓?fù)浣Y(jié)構(gòu)證明,分頻下的腦功能網(wǎng)絡(luò)特征與未分頻網(wǎng)絡(luò)相比能在一定程度上提高分類的準(zhǔn)確性.并且體素級腦網(wǎng)絡(luò)由于有著更高的維度,更多的特征以及更多的腦區(qū)內(nèi)傳遞結(jié)構(gòu)也有著更好的分類效果.