張英,王駿,鮑國(guó)強(qiáng),張春香,王士同
(江南大學(xué) 數(shù)字媒體學(xué)院,江蘇 無(wú)錫 214122)
自閉癥又叫孤獨(dú)癥,是一種廣泛性神經(jīng)失調(diào)的發(fā)展障礙疾病,其臨床表現(xiàn)主要為社會(huì)交往障礙、言語(yǔ)交流障礙和動(dòng)作刻板重復(fù)等[1-3]。自1943年利奧·坎納醫(yī)生首次對(duì)自閉癥做出經(jīng)典性描述以來(lái),該疾病因其病因不明確,又集多種障礙于一身,已經(jīng)得到了廣泛的關(guān)注。目前,在美國(guó)平均每68名兒童中就有1名自閉癥兒童;在世界范圍內(nèi),自閉癥患者超過1%。據(jù)統(tǒng)計(jì),約2/3孤獨(dú)癥患兒成年后無(wú)法獨(dú)立生活,需要終生照顧和看護(hù)。為此,人們迫切希望尋找科學(xué)而高效的手段對(duì)自閉癥進(jìn)行準(zhǔn)確診斷以達(dá)到早發(fā)現(xiàn)早治療的目的。
已有研究表明,自閉癥患者行為和認(rèn)知缺陷與潛在的腦功能異常有關(guān)。靜息態(tài)fMRI技術(shù)[4-9]通過使用血氧水平依賴(blood oxygenation level dependent, BOLD)信號(hào)可以有效地反映患者在靜息狀態(tài)下腦部血流和代謝活動(dòng)等功能性變化,因此在自閉癥的輔助診斷中起著重要的作用?;陟o息態(tài)的醫(yī)學(xué)影像診斷大致可分為特征提取和分類器設(shè)計(jì)這兩個(gè)階段。在特征提取階段,通過使用相關(guān)性特征選擇等方法從高維醫(yī)學(xué)影像特征中得到有鑒別意義的特征;在分類器設(shè)計(jì)階段,通過使用線性或非線性分類器進(jìn)行分類。但是目前多采用線性特征學(xué)習(xí)方法,雖然具有簡(jiǎn)單高效等優(yōu)點(diǎn),但是尚不能有效挖掘出醫(yī)學(xué)影像數(shù)據(jù)中的復(fù)雜信息。
本文基于靜息態(tài)fMRI提出了一種新型的無(wú)監(jiān)督模糊特征學(xué)習(xí)方法,并在此基礎(chǔ)上構(gòu)造多視角分類器從而實(shí)現(xiàn)自閉癥的輔助診斷。其技術(shù)路線可概括為:首先,將靜息態(tài)fMRI經(jīng)過預(yù)處理后,基于Pearson相關(guān)系數(shù)構(gòu)造低階功能連接矩陣,并使用文獻(xiàn)[7]的方法構(gòu)造高階功能連接矩陣;然后,提出新型的無(wú)監(jiān)督模糊特征學(xué)習(xí)方法,將2種功能連接矩陣分別映射到不同的低維嵌入空間中;最后,以低階和高階功能連接在腦疾病診斷中的互補(bǔ)性為出發(fā)點(diǎn),設(shè)計(jì)多視角SVM[10]分類器進(jìn)行分類。
本文使用的數(shù)據(jù)集來(lái)自ABIDE(autism brain imaging datae xchange)數(shù)據(jù)庫(kù)(http://preprocessedconnectomes-project.org/abide/download.html)的NYU子集和USM子集,采集對(duì)象的FIQ(full-scale intelligence quotient)范圍為65~150。實(shí)驗(yàn)所處理對(duì)象的相關(guān)信息如表1和表2所示。
表1 NYU實(shí)驗(yàn)對(duì)象信息Table 1 The information of NYU experimental object
表2 USM實(shí)驗(yàn)對(duì)象信息Table 2 The information of USM experimental object
每個(gè)對(duì)象的fMRI數(shù)據(jù)使用DPARSF(data processing assistant for resting-state fMRI)[11]工具進(jìn)行處理。處理步驟主要包括:1)去除功能磁共振圖像序列前10個(gè)時(shí)間點(diǎn)的數(shù)據(jù);2)時(shí)間層校正和頭部運(yùn)動(dòng)校正;3)數(shù)據(jù)通過統(tǒng)一使用T1加權(quán)圖像分割并將其歸一化到MNI152(montreal neurological institute 152)標(biāo)準(zhǔn)空間中;4)使用AAL (anatomical automatic labeling)模板將大腦劃分成116個(gè)腦區(qū),每個(gè)區(qū)域重新采樣3×3×3 mm3的體素;5)使用半高全寬高斯核進(jìn)行空間平滑處理;6)應(yīng)用帶通濾波(0.01~0.1 Hz)去除噪聲;7)去線性漂移并進(jìn)行全局信號(hào)校正去干擾變量;8)計(jì)算每個(gè)腦區(qū)的平均時(shí)間序列。
基于靜息態(tài)fMRI進(jìn)行自閉癥輔助診斷包括訓(xùn)練和測(cè)試兩個(gè)階段。本文所采用的訓(xùn)練過程如圖1所示,各步驟包括:
1)根據(jù)預(yù)處理后的靜息態(tài)功能磁共振成像數(shù)據(jù),提取出各腦區(qū)的平均時(shí)間序列信號(hào),計(jì)算腦區(qū)之間的Pearson系數(shù),得到低階功能連接矩陣。
2)將低階功能連接矩陣的每一行作為各腦區(qū)的特征描述,再次計(jì)算腦區(qū)之間的Pearson系數(shù),得到高階功能連接矩陣。
4)使用無(wú)監(jiān)督模糊特征映射方法對(duì)低階和高階功能連接的特征矩陣進(jìn)行特征學(xué)習(xí),得到相應(yīng)的變換矩陣,并將和變換到低維空間中得到相應(yīng)的嵌入矩陣和。
6)將2種不同的核矩陣進(jìn)行線性組合得到復(fù)合核矩陣。
7)構(gòu)造相應(yīng)的SVM分類器。
圖1 無(wú)監(jiān)督模糊特征學(xué)習(xí)方法的框架流程圖Fig. 1 The framework of an unsupervised fuzzy feature learning method
雖然大腦各腦區(qū)在空間上相互隔離,但它們之間的神經(jīng)活動(dòng)相互影響,通常使用功能連接矩陣來(lái)表示腦區(qū)之間的時(shí)間相關(guān)性[12]。本文使用文獻(xiàn)[8]中的方法,基于每個(gè)腦區(qū)fMRI時(shí)間序列來(lái)計(jì)算每個(gè)對(duì)象各腦區(qū)之間的Pearson相關(guān)系數(shù),得到低階功能連接矩陣。將低階功能連接矩陣的每一行作為一個(gè)腦區(qū)的特征描述,使用同樣的方法再次計(jì)算腦區(qū)之間的Pearson相關(guān)系數(shù),從而得到高階功能連接矩陣。
為了在無(wú)監(jiān)督環(huán)境中將高維空間中的樣本點(diǎn)映射到S維的低維空間,本文引入多輸出TSK模糊建模方法。TSK模糊系統(tǒng)是由形式為“IFTHEN”的模糊規(guī)則組成的,對(duì)于多輸出TSK模糊系統(tǒng),給定任意一個(gè)D維輸入向量
本文采用高斯函數(shù)表示模糊規(guī)則的模糊集,即
并使用式(2)、式(3)來(lái)計(jì)算每個(gè)樣本相對(duì)于每條模糊規(guī)則的點(diǎn)火強(qiáng)度:
令,1為全1列向量,多輸出TSK模糊系統(tǒng)的建模過程可用式(7)~ (13)的計(jì)算方法表述[15]:
式(7)~(13)表述的多輸出TSK模糊系統(tǒng)建模過程可以看作將維空間中的數(shù)據(jù)通過變換矩陣降維到S維數(shù)據(jù)空間的過程,通常。為了學(xué)習(xí)得到適合的,本文構(gòu)造的目標(biāo)學(xué)習(xí)準(zhǔn)則為
無(wú)監(jiān)督模型模糊特征學(xué)習(xí)的過程如圖2所示。
圖2 無(wú)監(jiān)督模糊特征學(xué)習(xí)流程圖Fig. 2 Flowchart of unsupervised fuzzy feature learning
使用式(21)對(duì)核矩陣進(jìn)行線性組合,得到最終的復(fù)合核矩陣:
本節(jié)通過實(shí)驗(yàn)驗(yàn)證本文方法的有效性并與已有方法進(jìn)行比較。本文選取精確度(ACC)、AUC值、敏感度(SEN)、特異性(SPE)作為實(shí)驗(yàn)的評(píng)價(jià)指標(biāo),實(shí)驗(yàn)的參數(shù)設(shè)置使用嵌套五折交叉驗(yàn)證來(lái)進(jìn)行尋優(yōu)。相關(guān)方法的表述及各參數(shù)的詳細(xì)設(shè)置等信息如表3所示。
表3 各算法說(shuō)明及參數(shù)詳細(xì)設(shè)置Table 3 Details and parameter settings of algorithms
本文采用式(22)~(24)計(jì)算性能指標(biāo),以此進(jìn)行算法性能評(píng)估:
式中:TP和TN分別代表正確分類為自閉癥患者的人數(shù)和正確分類為正常對(duì)照組的人數(shù);FP和FN分別代表正常個(gè)體被分類為自閉癥患者的人數(shù)以及自閉癥患者被分類為正常對(duì)照組的人數(shù)[17];靈敏度SEN作為衡量該方法準(zhǔn)確預(yù)測(cè)出自閉癥患者的能力的指標(biāo);特異性SPE是衡量該方法準(zhǔn)確預(yù)測(cè)出健康個(gè)體的能力指標(biāo)。本文實(shí)驗(yàn)使用LIBSVM[18]工具包中的高斯核SVM。
從表4和表5中可以看到,UFFM-M2SVC使用無(wú)監(jiān)督模糊特征映射算法UFFM進(jìn)行特征學(xué)習(xí),在此基礎(chǔ)上構(gòu)造分類器M2SVC,可以取得比LOFCC、HOFCC及M2SVC等傳統(tǒng)分類器更好的性能。
M2SVC算法聯(lián)合使用兩個(gè)視角的數(shù)據(jù)進(jìn)行分類,其分類結(jié)果要明顯優(yōu)于基于單視角的分類器LOFCC和HOFCC;而本文方法采用新型的模糊特征學(xué)習(xí)技術(shù)進(jìn)行特征學(xué)習(xí),在此基礎(chǔ)上使用M2SVC進(jìn)行分類,從而取得了比僅使用M2SVC更好的效果,這表明本文所使用的模糊特征學(xué)習(xí)技術(shù)能夠得到更有鑒別能力的特征,這對(duì)自閉癥的診斷具有更優(yōu)的判別能力。
表4 各算法在自閉癥分類中的性能比較(NYU)Table 4 The performance comparison of each algorithm in the classification of autism(NYU)
表5 各算法在自閉癥分類中的性能比較(USM)Table 5 The performance comparison of each algorithm in the classification of autism(USM)
本節(jié)研究UFFM所提取的特征數(shù)目S對(duì)M2SVC性能的影響,圖3和圖4中給出了算法在數(shù)據(jù)集NYU和USM上S取不同值時(shí)M2SVC的分類結(jié)果。從圖3和圖4可以看出,UFFMM2SVC算法的分類準(zhǔn)確率隨著S取值的不同而發(fā)生變化,圖3中最高達(dá)到78.38%,圖4中最高達(dá)到78.95%,均比M2SVC算法提高了約5%??芍谔卣魈崛?shù)S合理取值的情況下,本文使用UFFM進(jìn)行無(wú)監(jiān)督模糊特征學(xué)習(xí),不僅可以有效保留原始有效的特征信息,而且去除了其中包含的冗余信息,使得自閉癥患者和正常對(duì)照組之間的特征差異更有區(qū)分性。
圖3 特征數(shù)目對(duì)分類結(jié)果的影響(NYU)Fig. 3 The influence of the number of feature learning on the classification results (NYU)
圖4 特征數(shù)目對(duì)分類結(jié)果的影響(USM)Fig. 4 The influence of the number of feature learning on the classification results (USM)
自閉癥患者的腦區(qū)神經(jīng)活動(dòng)異于常人。以此為出發(fā)點(diǎn),本文基于靜息態(tài)fMRI提出了一種面向自閉癥輔助診斷的無(wú)監(jiān)督模糊特征學(xué)習(xí)方法UFFM,并與M2SVC相結(jié)合,從而實(shí)現(xiàn)了自閉癥的輔助診斷。相對(duì)于目前傳統(tǒng)的分類算法,UFFM-M2SVC算法訓(xùn)練出的分類模型具有優(yōu)越且穩(wěn)定的分類性能。實(shí)驗(yàn)結(jié)果表明,本文所使用的無(wú)監(jiān)督模糊特征學(xué)習(xí)方法能夠有效地提取出fMRI數(shù)據(jù)中的重要特征,從而有助于自閉癥的臨床輔助診斷。但是,本文僅基于靜息態(tài)fMRI數(shù)據(jù)進(jìn)行實(shí)驗(yàn),針對(duì)任務(wù)態(tài)fMRI數(shù)據(jù)的分類效果還未可知,有待進(jìn)一步的研究。