梁 紅,相 潔
(太原理工大學(xué)計算機科學(xué)與技術(shù)學(xué)院,山西太原030024)
阿爾茨海默?。ˋlzheimer’s disease,AD)是一種神經(jīng)退行性疾病,發(fā)病率高,病因和發(fā)病機制尚不明確,目前還沒有有效的治療方法。輕度認知障礙(mild cognitive impairment,MCI)是AD的前期階段,每年以10%-l5%的高轉(zhuǎn)化率發(fā)展為AD,而正常老年人每年的轉(zhuǎn)化率僅為1%-2%。因此,對MCI的早期診斷或預(yù)測對延遲疾病進展至關(guān)重要[1,2]。然而,相比于AD患者,MCI患者的認知損傷程度較輕微,并沒有明顯的認知下降癥狀,采用目前的神經(jīng)心理學(xué)測驗和影像學(xué)檢查等臨床診斷方法難以確診。如何識別出能用于早期發(fā)現(xiàn)的診斷標志物,盡可能地延遲MCI到AD的轉(zhuǎn)化是目前的一個重要問題。
隨著磁共振技術(shù)的發(fā)展,機器學(xué)習(xí)的方法已逐步應(yīng)用于MCI功能磁共振(functional magnetic resonance imaging,f MRI)數(shù)據(jù)的研究中。已有研究表明,MCI與正常老年人的腦網(wǎng)絡(luò)拓撲結(jié)構(gòu)之間存在差異,全局屬性表現(xiàn)為MCI的特征路徑長度比正常人有所增加[3],聚類系數(shù)也有所不同,局部屬性表現(xiàn)為單個閾值下一些腦區(qū)的節(jié)點屬性值顯著高于或低于正常人[4]。一些學(xué)者將異常的聚類系數(shù)和功能連接值作為分類特征,運用支持向量機(support vector machine,SVM)算法,對MCI和正常人進行了分類研究[5,6]。
但目前MCI腦功能網(wǎng)絡(luò)的研究都是對全局屬性或者單一閾值下的局部屬性進行的,尚沒有在連續(xù)閾值空間下對MCI腦功能網(wǎng)絡(luò)節(jié)點屬性的相關(guān)研究。
本文分析了不同病程的MCI及正常人在連續(xù)閾值空間內(nèi)腦功能網(wǎng)絡(luò)節(jié)點屬性的差異,將具有顯著差異的節(jié)點屬性作為分類特征,運用SVM分類算法進行了分類研究,以此來輔助MCI的診斷,為MCI的診斷提供新的視角。
支持向量機是由Vapnik等提出的一種機器學(xué)習(xí)算法,以統(tǒng)計學(xué)和結(jié)構(gòu)風(fēng)險最小化為理論基礎(chǔ),不存在一般神經(jīng)網(wǎng)絡(luò)的局部極值問題,能很好的解決小樣本、非線性和高維學(xué)習(xí)問題,在f MRI數(shù)據(jù)分析中表現(xiàn)出很大的優(yōu)勢,是當(dāng)前比較主流的機器學(xué)習(xí)方法之一[7]。其基本思想是:將輸入向量通過核函數(shù)映射到一個高維特征空間,然后在特征空間求最優(yōu)分類面,即找到能把兩類樣本正確分開且分類間隔最大的分類面。
對于線性可分問題,設(shè)樣本集為{(xi,yi),xi∈Rm,yi∈{1,-1},i=1,2,…n},SVM的線性判別函數(shù)為g(x)=(w·xi)+b,對應(yīng)的分類面為w·x+b=0。求最優(yōu)分類面即找到滿足條件
該函數(shù)為一個不等式約束下的二次函數(shù)尋優(yōu)問題,有唯一解。求解上述問題后可得到最優(yōu)分類函數(shù)
對于線性不可分問題,可以增加懲罰參數(shù)c(c為一個大于零的常數(shù))和松弛變量ξi≥0,將約束條件(1)放松到
在條件(4)下求解下式
對于非線性問題,可通過非線性變換將輸入空間變換到一個高維特征空間,繼而在此空間中構(gòu)造最優(yōu)分類面。上述對偶問題只涉及樣本間的內(nèi)積運算(·xj),可以引入核函數(shù)K(x,y)替代上述的內(nèi)積運算,因此,SVM的最優(yōu)決策函數(shù)為
不同的核函數(shù)可以構(gòu)造不同的支持向量機算法。目前比較常用的核函數(shù)有4類,包括線性核函數(shù),徑向基(ra-dial basis function,RBF)核函數(shù),多項式核函數(shù)和S型核函數(shù)。
本實驗的所有數(shù)據(jù)來源于ADNI(Alzheimer’s disease neuroimaging initiative)數(shù)據(jù)庫。ADNI是由美國國立老年研究所(national institute on aging,NIA)于2003年創(chuàng)建的,旨在通過分析各種醫(yī)學(xué)成像數(shù)據(jù)來研究老年癡呆疾病的發(fā)病機理及預(yù)防治療手段。該數(shù)據(jù)庫首次引入了早期輕度認知障礙(Early MCI,EMCI)和晚期輕度認知障礙(late MCI,LMCI)的概念,兩者都是AD的早期階段,區(qū)別在于邏輯記憶延遲回憶的損傷程度,目的是能在AD的更早期階段就發(fā)現(xiàn)病情并給予有效的干預(yù)治療。
參與實驗的所有被試的年齡均介于55-90歲,有精神藥物治療的被試已排除在外。被試的入組標準描述如下:①正常對照(normal controls,NC):簡明精神量表(minimental state examination,MMSE)得分介于24-30,臨床老年癡呆量表(clinical dementia rating,CDR)得分為0,非抑郁,非MCI,非癡呆;②EMCI:MMSE得分介于24-30,CDR為0.5,由韋氏記憶量表的延遲記憶部分測得客觀的記憶喪失為(教育年限得分:(16年:9-11分;8-15年:5-9分;0-7年:3-6分),基本日常生活能力正常,無癡呆;③LMCI:除了韋氏記憶量表的延遲記憶部分測得的客觀記憶喪失得分與EMCI不同(教育年限得分:(16年:(8分;8-15年:(4分;0-7年:(2分),其余標準同EMCI[8,9]。
本實驗總共收集了70名被試,包括25名LMCI患者,16名EMCI患者和29名正常對照。被試的基本信息見表1。
表1 被試基本信息
本實驗的所有靜息態(tài)f MRI數(shù)據(jù)及其對應(yīng)的T1結(jié)構(gòu)像數(shù)據(jù)均采用Philips 3.0T磁共振設(shè)備完成。整個掃描過程中,被試需睜眼保持清醒,放松,盡量不要動。為了便于預(yù)處理,下載的數(shù)據(jù)均為Analysis格式,具體采集過程及掃描參數(shù)詳見ADNI網(wǎng)站(http://www.loni.ucla.edu/ADNI)。
對獲得的原始數(shù)據(jù)采用DPARSF(data processing assis-tant for resting-state f MRI)[10]軟件進行數(shù)據(jù)預(yù)處理。首先去除每個被試的前10個時間點,然后對剩余的130幅圖像進行時間片校正和頭動校正,去除水平頭動大于3mm且轉(zhuǎn)動大于3度的被試。接著對頭動校正后的f MRI圖像進行空間標準化,圖像進行12維度的優(yōu)化仿射變換,將其標準化到3mm體素的MNI標準空間中。之后對圖像數(shù)據(jù)以4mm的全寬半高(full-width at half maxi-mum,F(xiàn)WHM)進行高斯平滑,以提高圖像的信噪比。最后進行低頻濾波(0.01-0.08Hz),以降低低頻漂移及高頻的生物噪音。
預(yù)處理完的f MRI圖像,采用國際腦成像領(lǐng)域廣泛使用的AAL(automated anatomical labeling)[11]模板,將大腦分割為90個(左右半腦各45個)感興趣區(qū)(regions of interest,ROI),每個ROI定義為一個節(jié)點。一個ROI內(nèi)所有體素的時間序列的均值定義為該節(jié)點的時間序列。計算任意兩節(jié)點的平均時間序列之間的偏相關(guān)系數(shù),得到90×90的關(guān)聯(lián)矩陣。通常,根據(jù)設(shè)定的閾值,將關(guān)聯(lián)矩陣轉(zhuǎn)化為二值矩陣。即當(dāng)相關(guān)系數(shù)大于該閾值時,二值矩陣的對應(yīng)元素為1,否則為0。但如果對每個被試設(shè)置相同的閾值,被試網(wǎng)絡(luò)中邊的數(shù)量可能會不一致,這將導(dǎo)致腦功能網(wǎng)絡(luò)的節(jié)點屬性分析上存在差異。因此,本文采用稀疏度來確定閾值。稀疏度是指網(wǎng)絡(luò)中實際存在的邊數(shù)與可能存在的最大邊數(shù)的比值。本實驗選擇一個較寬的連續(xù)的稀疏度范圍8%~40%(間隔0.01),該范圍內(nèi)每個被試的網(wǎng)絡(luò)都是連通的[12,13]。
完成網(wǎng)絡(luò)的構(gòu)建后,針對每個選定的稀疏度,計算每個被試的節(jié)點屬性值,包括度、中間中心度及節(jié)點效率[14,15]。
節(jié)點i的度定義為與該節(jié)點相連的邊的數(shù)目,其公式可表示為
式中:aij——網(wǎng)絡(luò)中第i個節(jié)點與第j個節(jié)點之間的連接數(shù)。
節(jié)點i的中間中心度定義為網(wǎng)絡(luò)中所有的其它節(jié)點對之間最短路徑中通過該節(jié)點的最短路徑數(shù),其公式可表示為
式中:σmn——節(jié)點m和n之間的最短路徑數(shù),σmn(i)——節(jié)點m到n經(jīng)過的最短路徑數(shù),反映了節(jié)點i在網(wǎng)絡(luò)中的重要性。
節(jié)點i的節(jié)點效率定義為該節(jié)點與網(wǎng)絡(luò)中其它節(jié)點的最短路徑倒數(shù)之和的平均值,其公式可表示為
式中:dij——節(jié)點i和j之間的最短路徑長度,反映了該節(jié)點到網(wǎng)絡(luò)中其它節(jié)點的難易程度。這里的最短路徑長度是指兩個節(jié)點之間最短的那條路徑的長度。
為表征這3個節(jié)點屬性在所選的連續(xù)閾值空間內(nèi)的整體特性,對每個節(jié)點特征計算其稀疏度空間下的曲線下面積(area under the curve,AUC),AUC是在特定的稀疏度空間內(nèi)某個網(wǎng)絡(luò)屬性值的曲線下面積,其公式可表示為
式中:S1、Sn——稀疏度的上下邊界,ΔS——稀疏度間隔。本文中S1為0.08,Sn為0.40,ΔS為0.01。已有研究已證實該特征對腦網(wǎng)絡(luò)拓撲屬性的改變是非常敏感的[16,17]。
采用非參數(shù)置換檢驗方法對任意兩組被試的每個節(jié)點屬性的AUC值進行統(tǒng)計分析。與參數(shù)檢驗方法相比,這種檢驗方法可以不用對AUC值的分布作任何的假設(shè)。各組間具有顯著差異(p<0.05)的腦區(qū)如圖1所示。該圖采用了Brain Net Viewer(http://www.nitrc.org/projects/bnv)軟件繪制。表2為圖1對應(yīng)的腦區(qū)的英文名稱和中文名稱。具有顯著組間差異的節(jié)點屬性的AUC值作為這兩組待分類樣本的特征。
圖1 組間差異腦區(qū)
本實驗包括3個任務(wù),分別為采用SVM算法對EMCI和NC,LMCI和NC及EMCI和LMCI進行分類判別,具體過程如下:
首先,從待分類樣本中隨機抽取2/3的被試作為訓(xùn)練集,剩余的1/3作為測試集。對訓(xùn)練集和測試集的特征數(shù)據(jù)進行歸一化處理,取值范圍為[-1,1]。
其次,選取RBF函數(shù)作為SVM算法的核函數(shù)。關(guān)于核函數(shù)參數(shù)的優(yōu)化,國際上并沒有公認統(tǒng)一的最好的方法,目前常用的是網(wǎng)格搜索和交叉驗證相結(jié)合的方法,即讓懲罰因子c和核函數(shù)參數(shù)g在一定范圍內(nèi)取值,對于每一組取定的c和g,在訓(xùn)練集上采用交叉驗證的方法得到在此組c和g下訓(xùn)練集的分類正確率,最終選取使得訓(xùn)練集分類正確率最高的那組c和g作為最佳參數(shù)。本文中取c=[2-10,2-9,…,29,210],g=[2-10,2-9,…,29,210],交叉驗證取10-Fold交叉驗證。
最后,在訓(xùn)練集上用得到的最佳參數(shù)c和g進行樣本訓(xùn)練,得到SVM分類模型,之后將測試樣本輸入到SVM分類模型中進行判別。實驗結(jié)果見表3。
表2 腦區(qū)名稱
表3 分類正確率
本文以復(fù)雜網(wǎng)絡(luò)理論為基礎(chǔ),構(gòu)建了EMCI,LMCI和NC三組被試在連續(xù)閾值空間下的靜息態(tài)腦功能網(wǎng)絡(luò),利用統(tǒng)計學(xué)方法對該閾值范圍內(nèi)的節(jié)點屬性的AUC值進行了差異分析,將具有顯著組間差異的AUC值作為分類特征,運用SVM機器學(xué)習(xí)算法對任意兩組被試進行了分類研究。實驗結(jié)果表明,具有顯著組間差異的腦區(qū),包括扣帶回,顳葉,額葉,頂葉的一些區(qū)域,與前人的研究結(jié)論一致[3,4],這些異常的腦功能網(wǎng)絡(luò)節(jié)點屬性作為分類特征可以區(qū)分不同病程的MCI患者和正常被試,及不同病程的MCI患者。因此,該方法可以用于MCI的輔助診斷,以及時發(fā)現(xiàn)早期病情。
[1]Misra C,F(xiàn)an Y,Davatzikos C.Baseline and longitudinal patterns of brain atrophy in MCI patients,and their use in prediction of short-term conversion to AD:Results from ADNI[J].NeuroImage,2009,44(4):1415-1422.
[2]Ron B,Elizabeth J,Kathryn Z G,et al.Forecasting the global burden of Alzheimer's disease[J].Alzheimer's and Dementia,2007,3(3):186-191.
[3]Wang J H,Zuo X N,Dai Z J,et al.Disrupted functional brain connectome in individuals at risk for Alzheimer's disease[J].Biological Psychiatry,2013,73(5):472-481.
[4]Liu Zhenyu,Zhang Yumei,Yan Hao,et al.Altered topological patterns of brain networks in mild cognitive impairment and Alzheimer's disease:A resting-state f MRI study[J].Psychiatry Research:Neuroimaging,2012,202(2):118-125.
[5]Li Y,Wang Y,Wu G,et al.Discriminant analysis of longitudinal cortical thickness changes in Alzheimer's diseaseusing dynamic and network features[J].Neurobiology of Aging,2012,33(2):427.e15-427.e30.
[6]Wee Chong-Yaw,Yap Pew-Thian,Zhang Daoqiang,et al.Identification of MCI individuals using structural and functional connectivity networks[J].NeuroImage,2012,59(3):2045-2056.
[7]Kohannim Omid,Hua Xue,Hibar Derrek P,et al.Boosting power for clinical trials using classifiers based on multiple biomarkers[J].Neurobiology of Aging,2010,31(8):1429-1442.
[8]Aisen P S,Petersen R C,Donohue M C,et al.Clinical core of the Alzheimer's disease neuroimaging initiative:Progress and plans[J].Alzheimer's Dementia,2010,6(3):239-246.
[9]Michael W Weiner,Paul S Aisen,Clifford R Jack Jr,et al.The Alzheimer's disease neuroimaging initiative:Progress report and future plans[J].Alzheimer's Dementia,2010,6(3):202-211.
[10]Yan C G,Zang Y F.DPARSF:A MATLAB toolbox for“Pipeline”data analysis of resting-state f MRI[J].Front Syst Neurosci,2010,4:13.
[11]XUE Shaowei,TANG Yiyuan,LI Jian,et al.Method for constructing brain functional networks based on f MRI data[J].Application Research of Computers,2010,27(11):4505-4507(in Chinese).[薛紹偉,唐一源,李健,等.一種基于f MRI數(shù)據(jù)的腦功能網(wǎng)絡(luò)構(gòu)建方法[J].計算機應(yīng)用研究,2010,27(11):4405-4407.]
[12]Yao Zhijun,Zhang Yuanchao,Lei Lin,et al.Abnormal cor-tical networks in mild cognitive impairment and Alzheimer's disease[J].PLoS Computational Biology,2010,6(11):e1001006.
[13]He Y,Chen Z,Evans A.Structural insights into aberrant topological patterns of large-scale cortical networks in Alzheimer's disease[J].The Journal of Neuroscience,2008,28(18):4756-4766.
[14]TIAN Lixia.Analysis of complex brain networks based on graph theory[J].Beijing Biomedical Engineering,2010,29(1):1-7(in Chinese).[田麗霞.基于圖論的復(fù)雜腦網(wǎng)絡(luò)分析[J].北京生物醫(yī)學(xué)工程,2010,29(1):1-7.]
[15]Sophie Achard,Ed Bullmore.Efficiency and cost of economical brain functional networks[J].PLoS Computational Biology,2007,3(2):e17.
[16]Zhang Junran,Wang Jinhui,Wu Qizhu,et al.Disrupted brain connectivity networks in drug-naive,first-episode major depressive disorder[J].Biological Psychiatry,2011,70(4):334-342.
[17]Wang Jinhui,Wang Liang,Zang Yufeng,et al.Parcellation-dependent small-world brain functional networks:A resting-state f MRI study[J].Human Brain Mapping,2009,30(5):1511-1523.