曹敏娜,陳俊杰,郭 浩
(太原理工大學(xué) 計算機(jī)科學(xué)與技術(shù)學(xué)院,山西 晉中 030600)
為了輔助抑郁癥的臨床診斷,通過使用腦網(wǎng)絡(luò)對功能磁共振成像(functional magnetic resonance imaging,fMRI)得到的影像數(shù)據(jù)進(jìn)行處理并分類作為其中一種診斷方式被廣泛使用?,F(xiàn)有對腦網(wǎng)絡(luò)中節(jié)點(diǎn)的定義,包括神經(jīng)元、神經(jīng)元集群、腦區(qū)[1]等不同粒度。使用的節(jié)點(diǎn)粒度不同會得到不同尺度的腦網(wǎng)絡(luò),進(jìn)而影響最后的分類診斷結(jié)果。然而現(xiàn)有研究中,將抑郁癥影像數(shù)據(jù)結(jié)合復(fù)雜網(wǎng)絡(luò)的知識處理為腦網(wǎng)絡(luò)數(shù)據(jù)的過程,往往是在單一大規(guī)模腦網(wǎng)絡(luò)的空間尺度下進(jìn)行的[2-4];Jiaolong Qin等[5]雖然細(xì)分了腦區(qū),但并沒有將空間尺度作為重點(diǎn)進(jìn)行分類比較;少數(shù)使用了多尺度腦網(wǎng)絡(luò)來分類對比的研究,也沒有探索抑郁癥[6-8]。
針對先前的臨床分類研究中對腦網(wǎng)絡(luò)空間尺度劃分上考慮的不足,本文從多個腦網(wǎng)絡(luò)空間尺度的角度入手,對腦網(wǎng)絡(luò)局部特征的抑郁癥分類進(jìn)行了研究。根據(jù)預(yù)定義腦圖譜將抑郁癥患者的靜息態(tài)磁共振影像數(shù)據(jù)處理為不同空間尺度下的腦網(wǎng)絡(luò)數(shù)據(jù),使用統(tǒng)計分析對不同尺度網(wǎng)絡(luò)下的局部屬性進(jìn)行特征選擇,采取支持向量機(jī)(support vector machine,SVM)方法來實現(xiàn)分類,進(jìn)一步分析分類結(jié)果來判斷腦網(wǎng)絡(luò)的空間尺度對使用腦網(wǎng)絡(luò)特征進(jìn)行抑郁癥分類診斷的影響。
本次研究總共收集被試66名,包括無用藥首發(fā)的抑郁癥患者38名,以及對照組中年齡與性別匹配的28名健康人。被試都是具有中國國籍的漢族人,抑郁組被試全部由山西醫(yī)科大第一附屬醫(yī)院精神科確診,并且為美國精神障礙診斷與統(tǒng)計學(xué)手冊第四版(DSM-IV)和24項漢密爾頓抑郁量表(hamilton depressive rating scale,HAMD)為依據(jù)評定的重度抑郁癥患者,無神經(jīng)紊亂史。把人格障礙的定式訪談(SCID-II)作為健康組被試的判定依據(jù),該組被試亦無神經(jīng)紊亂史。實驗采用嚴(yán)格的標(biāo)準(zhǔn)排除其它疾病及異常情況,并與每位被試均達(dá)成了書面協(xié)議。被試信息見表1。
表1 被試基本信息
表1使用最小數(shù)值-最大數(shù)值(平均數(shù)±標(biāo)準(zhǔn)差)的數(shù)據(jù)形式表示年齡范圍,HAMD是漢密爾頓24項抑郁表的英文縮寫。帶有上標(biāo)a的P值由雙尾雙樣本的T檢驗的方式獲取,帶有上標(biāo)b的P值是通過雙尾皮爾遜卡方檢驗的方式獲取。
本文中的數(shù)據(jù)采集工作是和山西醫(yī)科大學(xué)第一醫(yī)院共同完成的,并由具有豐富磁共振掃描經(jīng)驗的放射科醫(yī)生對所有被試的腦部進(jìn)行掃描。靜息態(tài)功能核磁共振的腦部掃描任務(wù)全是使用德國強(qiáng)度為3T的核磁共振掃描設(shè)備(siemens trio 3-tesla scanner, erlangen, germany)操作的。過程中,為了防止被試主觀進(jìn)行頭部運(yùn)動,采取海綿固定頭部,以減少垃圾數(shù)據(jù)。靜息態(tài)的限定則需要參與者在掃描全過程閉眼放松,要求大腦不進(jìn)行思考活動的同時又不能進(jìn)入睡眠。還需要對設(shè)備的掃描參數(shù)進(jìn)行以下配置:
射頻重復(fù)時間(repetition time,TR)為2 s,存儲矩陣為64*64,回波時間(echo time,TE)為30 ms,層間間隔(slice gap)為0,層厚(slice thickness)為4.0 mm,成像視野(field of view,F(xiàn)OV)為192*192 mm。
研究中的數(shù)據(jù)預(yù)處理是通過MATLAB平臺的SPM(statistical parametric mapping) 工具對采到的圖像進(jìn)行時間層校正、頭動校正、聯(lián)合配準(zhǔn)、空間標(biāo)準(zhǔn)化、低頻濾波。
腦網(wǎng)絡(luò)是使用圖論的知識構(gòu)建的,定義與屬性與圖論中的理論相統(tǒng)一。針對每個被試構(gòu)建腦網(wǎng)絡(luò),涉及網(wǎng)絡(luò)中節(jié)點(diǎn)和邊的定義。
便于研究,節(jié)點(diǎn)的定義多根據(jù)某一預(yù)定義模板進(jìn)行,常用的是AAL(automated anatomical labeling)腦圖譜。首先根據(jù)AAL模板對腦部影像區(qū)域進(jìn)行分割,共劃分出90個腦區(qū)(包括左半腦45個區(qū)域和右半腦對應(yīng)的45個區(qū)域)。每個腦區(qū)定義為腦網(wǎng)絡(luò)中的一個節(jié)點(diǎn),各節(jié)點(diǎn)的值是通過計算各腦區(qū)全部體素的血氧含量濃度時間序列的算術(shù)平均值得到的,以此完成90個節(jié)點(diǎn)的定義。
節(jié)點(diǎn)的規(guī)模會決定空間尺度的大小,腦網(wǎng)絡(luò)中節(jié)點(diǎn)規(guī)模定義的越大,即空間尺度越大,整個腦網(wǎng)絡(luò)中的節(jié)點(diǎn)個數(shù)就越少。本文定義了5個不同尺度的節(jié)點(diǎn)個數(shù),分別是90、256、497、1003、1501[1]。90個節(jié)點(diǎn)對應(yīng)90的尺度,對于256,497,1003,1501這4個不同小尺度的節(jié)點(diǎn)定義,是基于AAL模板的獨(dú)立腦區(qū)進(jìn)一步劃分得到的。具體方法為:
設(shè)置預(yù)期節(jié)點(diǎn)定義數(shù)為250、500、1000、1500,按AAL模板中每個腦區(qū)占所有腦區(qū)的體素比例計算得到AAL原有腦區(qū)在相應(yīng)的小尺度下應(yīng)細(xì)分的子區(qū)域個數(shù)。使用動態(tài)隨機(jī)種子點(diǎn)[1]的設(shè)置方法形成子區(qū)域,即對每個子區(qū)域隨機(jī)設(shè)置種子體素,對所有剩余體素與種子體素的距離進(jìn)行順序計算,接下來需要選出和目前體素最近距離的體素,并把該體素和種子體素進(jìn)行合并,組成一個新的子區(qū)域,該新子區(qū)域內(nèi)含此新體素。接下來計算得出此新子區(qū)域的物理中心位置,把該點(diǎn)設(shè)置成新的種子體素,然后計算得到各體素和新種子體素間距。重復(fù)循環(huán)此過程,一直到此區(qū)域中全部的無歸屬體素被劃至其中。至全部AAL獨(dú)立腦區(qū)劃分完畢就可以得出一個小的尺度。由于子區(qū)域個數(shù)不是整數(shù),故四舍五入,最后得到256、497、1003、1501這4個節(jié)點(diǎn)個數(shù)對應(yīng)的空間尺度。
2.2.1 皮爾遜相關(guān)
本文使用皮爾遜相關(guān)(Pearson correlation)計算得到兩個腦區(qū)之間的無向功能連接。皮爾遜相關(guān)系數(shù)用于計算兩個變量間的線性相關(guān),針對5個不同節(jié)點(diǎn)規(guī)模的空間尺度,分別計算該尺度下腦區(qū)平均時間序列兩兩之間的皮爾遜相關(guān)系數(shù),得到不同尺度下的相關(guān)系數(shù)矩陣,即加權(quán)腦網(wǎng)絡(luò)。該系數(shù)矩陣為對稱方陣,階數(shù)分別為90,256,497,1003,1501。皮爾遜相關(guān)系數(shù)計算方式如下
(1)
2.2.2 閾值選擇
為便于分析與計算,設(shè)置閾值將網(wǎng)絡(luò)轉(zhuǎn)化為二值網(wǎng)絡(luò),即把不同尺度下關(guān)聯(lián)矩陣中的權(quán)值轉(zhuǎn)化為無權(quán)二值鄰接矩陣中的值。若關(guān)聯(lián)矩陣中的元素值rij大于該閾值,則元素值設(shè)為1,表示節(jié)點(diǎn)i與節(jié)點(diǎn)j之間有邊,否則設(shè)為0,表示節(jié)點(diǎn)i與節(jié)點(diǎn)j間無邊。
由于閾值的大小會影響腦網(wǎng)絡(luò)中連接的密度,本文使用稀疏度來進(jìn)行閾值選擇。稀疏度描述的是在當(dāng)前腦網(wǎng)絡(luò)中存在邊的數(shù)目與該腦網(wǎng)絡(luò)對應(yīng)的完全圖中全部邊的數(shù)目的比值。當(dāng)稀疏度的值大于0.5時,腦網(wǎng)絡(luò)會變?yōu)殡S機(jī)網(wǎng)絡(luò)[1]。故為了得到有小世界屬性的腦網(wǎng)絡(luò),設(shè)置稀疏度范圍為0.05到0.4,以0.05為步長,以此對于每個被試得到8個不同稀疏度下的二值網(wǎng)絡(luò)。
本文針對不同尺度下的二值網(wǎng)絡(luò),計算網(wǎng)絡(luò)中常見的3個局部屬性作為分類的特征,分別為度,中間中心度,節(jié)點(diǎn)效率[9]。
二值網(wǎng)絡(luò)里一個節(jié)點(diǎn)的度是與此節(jié)點(diǎn)能通過一條線直連的節(jié)點(diǎn)個數(shù),衡量此節(jié)點(diǎn)和網(wǎng)絡(luò)中剩余節(jié)點(diǎn)的連通性。網(wǎng)絡(luò)中節(jié)點(diǎn)i的度k(i)定義[9]為
(2)
式中:aij為二值網(wǎng)絡(luò)對應(yīng)的二值矩陣中第i行第j列元素,表示i節(jié)點(diǎn)與j節(jié)點(diǎn)之間的邊。
一個節(jié)點(diǎn)中間中心度的值越大,此節(jié)點(diǎn)越處在中心位置,其對于網(wǎng)絡(luò)中其余節(jié)點(diǎn)間傳遞的消息會產(chǎn)生關(guān)鍵影響。在二值網(wǎng)絡(luò)中,節(jié)點(diǎn)i的中間中心度bi定義[9]為
(3)
網(wǎng)絡(luò)中,節(jié)點(diǎn)m到達(dá)n有許多途徑,上式中σmn是這許多途徑里的最短路徑條數(shù),σmn(i)是m到n中的最短路徑會經(jīng)過某節(jié)點(diǎn)i的路徑條數(shù)。
節(jié)點(diǎn)效率衡量了節(jié)點(diǎn)和網(wǎng)絡(luò)中其它節(jié)點(diǎn)間的信息傳遞能力,二值網(wǎng)絡(luò)中任一節(jié)點(diǎn)i的節(jié)點(diǎn)效率ei可描述[9]為
(4)
式中:N表示腦網(wǎng)絡(luò)中總的節(jié)點(diǎn)數(shù)量,dij代表節(jié)點(diǎn)i距離j的最短路徑長度。對于二值網(wǎng)絡(luò),最短路徑長度等于兩節(jié)點(diǎn)間各不同途徑里距離最短的一條中所含元素1的個數(shù)。
由于不同尺度下每個被試有8個不同稀疏度的二值網(wǎng)絡(luò),故不同尺度網(wǎng)絡(luò)的每個局部屬性可以得到8個稀疏度下的值。為了衡量網(wǎng)絡(luò)的局部屬性在不同稀疏度下總的變化強(qiáng)度[9],使用AUC值來將不同稀疏度下的各局部屬性值進(jìn)行統(tǒng)一。對于每一個被試,90空間尺度下得到270個AUC值(一個節(jié)點(diǎn)對應(yīng)一個屬性的AUC值,則90個節(jié)點(diǎn)90個局部屬性,3個局部屬性即270個),同理,256尺度得到768個AUC值,497尺度得到1491個AUC值,1003尺度得到3009個AUC值,1501尺度得到4503個AUC值。
AUC的計算方式如下
(5)
其中,YAUC表示AUC值,Y(Sk)是閾值Sk對應(yīng)的局部屬性值,ΔS是兩個閾值之間的間隔。
本文使用特征選擇的傳統(tǒng)方法統(tǒng)計分析對3種局部屬性進(jìn)行特征選擇,然后使用SVM對正常組被試和抑郁癥患者進(jìn)行分類。
為從特征全集中找到最優(yōu)特征子集,進(jìn)一步防止過度擬合現(xiàn)象發(fā)生、優(yōu)化模型性能、高效訓(xùn)練分類器[10],分類開始前做特征選擇是很有必要的。特征選擇有很多種方法,本文采用特征選擇方法之一的過濾方法,并選取其中最常見的統(tǒng)計分析法[11]進(jìn)行特征選擇。對兩組被試的所有AUC值做雙樣本T檢驗,選取具有統(tǒng)計顯著性(即P<0.05)的AUC值作為有效特征。
在眾多分類算法中,SVM在解決小樣本二分類、非線性及高維模式識別,特別是在fMRI數(shù)據(jù)分析中很有優(yōu)勢[9],并得到了廣泛的應(yīng)用[2,6,7]。本文通過MATLAB平臺下導(dǎo)入臺灣大學(xué)林智仁博士等開發(fā)的LIBSVM工具包來用SVM完成分類。訓(xùn)練分類器時,使用徑向基核函數(shù)(radial basis function,RBF)進(jìn)行10次10折交叉驗證。對于其中每一次的分類,決策函數(shù)中懲罰因子與核參數(shù)的參數(shù)尋優(yōu)使用基于網(wǎng)格的搜索算法來實現(xiàn)[12]。
為了確定有效特征數(shù)量對最終的分類結(jié)果是否有影響,驗證腦網(wǎng)絡(luò)空間尺度、有效特征數(shù)與分類結(jié)果三者之間的關(guān)系,設(shè)計在有效特征數(shù)量不變的情況下,比較不同尺度腦網(wǎng)絡(luò)的分類結(jié)果。具體實驗從各個小尺度腦網(wǎng)絡(luò)的有效特征中隨機(jī)抽取與大尺度腦網(wǎng)絡(luò)有效特征相同數(shù)量的特征,隨機(jī)抽取10次,對每次抽取出的特征進(jìn)行分類,每次的分類都進(jìn)行10次10折交叉驗證,得到每個小尺度下相應(yīng)特征數(shù)的平均分類準(zhǔn)確率后,比較不同尺度下相同數(shù)量的特征分類后的準(zhǔn)確率。
在特征選擇后,具有統(tǒng)計顯著性的特征在90空間尺度下有16個(270個AUC值中選出16個),256尺度下有48個,497尺度下有95個,1003尺度下有186個,1501尺度下有240個。不同尺度與局部屬性對應(yīng)的特征數(shù)如圖1所示。
圖1 各尺度下不同局部屬性的有效特征數(shù)
從圖1中可以看出,特征選擇得到的每個局部屬性的特征數(shù)隨腦網(wǎng)絡(luò)空間尺度減小而增長,總的有效特征數(shù)也隨之增長,即不同的空間尺度能影響特征選擇得到的有效特征數(shù)量。
對每個尺度的兩組被試使用特征選擇后得到的有效特征進(jìn)行分類,分類結(jié)果如圖2所示。
圖2 不同尺度下有效特征的分類結(jié)果
從圖2中可以看出,伴隨腦網(wǎng)絡(luò)空間尺度減小,分類效果明顯上升,結(jié)合圖1對空間尺度與有效特征數(shù)的分析結(jié)果,可以推論不同的空間尺度是通過影響有效特征數(shù)量而影響最后分類結(jié)果的。由于90的節(jié)點(diǎn)數(shù)為傳統(tǒng)用AAL模板分割腦區(qū)的方法,故本實驗結(jié)果表明細(xì)分AAL模板中腦區(qū)得到小空間尺度的分類準(zhǔn)確率顯然優(yōu)于傳統(tǒng)根據(jù)AAL模板分割腦區(qū)方法的分類。
對90尺度下對應(yīng)的有效特征數(shù)的值16,實驗中分別從較小尺度256對應(yīng)的48個有效特征,以及尺度497對應(yīng)的95個、1003對應(yīng)的186個、1501對應(yīng)的240個有效特征里邊隨機(jī)抽取和尺度90對應(yīng)有效特征數(shù)值(即16)相同的特征數(shù)量,每個較小的尺度都隨機(jī)抽取10次并對這些有效特征訓(xùn)練分類并比較結(jié)果[13]。用這種方法,對256尺度下對應(yīng)的有效特征數(shù)值48,分別從比256尺度小的尺度497的有效特征里隨機(jī)抽48個分類,尺度1003的有效特征里亦隨機(jī)抽48個分類,尺度1501的有效特征里也隨機(jī)抽48個分類,得出分類結(jié)果后將三者與圖2中初始256尺度下48個有效特征的分類結(jié)果相互比較;對497對應(yīng)的數(shù)95,從比其相對小的尺度1003、尺度1501分別對應(yīng)的不同數(shù)量有效特征里邊都隨機(jī)抽95個訓(xùn)練分類、比較結(jié)果;對1003對應(yīng)的數(shù)186,從比其相對小的尺度1501對應(yīng)的有效特征里邊隨機(jī)抽186個訓(xùn)練分類、比較結(jié)果[13]。每個尺度都選擇比其相對小的尺度比較,在對各尺度下數(shù)目一樣的特征分類后,其分類準(zhǔn)確率如圖3所示。
圖3 各有效特征數(shù)下不同尺度的分類準(zhǔn)確率注:每個尺度下的準(zhǔn)確率為當(dāng)前尺度下隨機(jī)抽取10次特征后的平均值
通過對圖3的分析能夠看出在相同特征數(shù)量的維度下,分類準(zhǔn)確率基本不受腦網(wǎng)絡(luò)的空間尺度變化的影響,并且準(zhǔn)確率的值與5.2節(jié)中相應(yīng)尺度下的初始分類結(jié)果的值相似。此處特征數(shù)指的是有效特征,顯然,只有增加有效特征數(shù),才能提升分類效果,說明分類準(zhǔn)確率的提升本質(zhì)上是由有效特征數(shù)的遞增帶來的。綜合對圖1關(guān)于空間尺度與有效特征數(shù)間關(guān)系和圖2關(guān)于空間尺度與分類準(zhǔn)確率間關(guān)系的分析,更加體現(xiàn)出隨腦網(wǎng)絡(luò)的空間尺度縮小而引發(fā)的有效特征數(shù)量增多,是導(dǎo)致最終分類準(zhǔn)確率變化的根本原因,闡明了腦網(wǎng)絡(luò)空間尺度對分類結(jié)果的影響因素。
本文針對先前研究中對于空間尺度劃分方面考慮的不足,用分類的方法來分析空間尺度對于使用腦網(wǎng)絡(luò)分析精神疾病的研究。基于傳統(tǒng)AAL模板,將AAL模板對應(yīng)的腦區(qū)繼續(xù)拆分,以小尺度構(gòu)建腦網(wǎng)絡(luò),分類比較。本次研究的實驗結(jié)果表明,和傳統(tǒng)AAL模板定義的節(jié)點(diǎn)相比,細(xì)分后的腦區(qū)節(jié)點(diǎn)對于分類結(jié)果有明顯提升;在特征選擇方面,特征選擇后的有效特征數(shù)隨空間尺度的減小而增加,而有效特征數(shù)的增加會提升分類準(zhǔn)確率,進(jìn)一步說明空間尺度在使用腦網(wǎng)絡(luò)屬性進(jìn)行分類研究中的重要性,也為以后使用腦網(wǎng)絡(luò)對精神疾病進(jìn)行分類診斷提供了新思路。然而,空間尺度是否越小越好?分類準(zhǔn)確率提升的同時,可能引起其它方面的變化還有待進(jìn)一步研究。