国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

樹(shù)結(jié)構(gòu)組套索人腦超網(wǎng)絡(luò)構(gòu)建與分類

2022-11-04 07:11聞敏劉永艷李瑤IBEGBUNnamdiJulian郭浩
科學(xué)技術(shù)與工程 2022年27期
關(guān)鍵詞:腦區(qū)聚類分類

聞敏, 劉永艷, 李瑤, IBEGBU Nnamdi Julian, 郭浩

(太原理工大學(xué)信息與計(jì)算機(jī)學(xué)院, 晉中 030600)

由世界衛(wèi)生組織2020年的調(diào)查統(tǒng)計(jì)得知,全世界已有3.5億人為抑郁癥患者,根據(jù)相關(guān)新聞報(bào)道,每年有1%~6%的抑郁癥發(fā)病率[1],抑郁癥患者人數(shù)逐年上升,抑郁癥已成為危害人類健康的第二大殺手,其癥狀為情緒低沉、興趣衰減、行動(dòng)積極性下降。在中國(guó),抑郁癥還未被列入門(mén)診醫(yī)療保險(xiǎn)慢性疾病的范疇,高額的心理咨詢費(fèi)用也未被歸入醫(yī)保報(bào)銷領(lǐng)域。抑郁癥不僅會(huì)對(duì)患者的身心造成極大的傷害,勢(shì)必也會(huì)對(duì)患者的家庭造成不小的經(jīng)濟(jì)壓力。近年來(lái),全球性的抑郁癥患者比例的大幅度上升引起了世界各國(guó)的精神疾病研究人員的關(guān)注。由于精神疾病影響大腦的認(rèn)知功能,而神經(jīng)成像的宗旨也是在對(duì)精神疾病患者與正常人的大腦圖像進(jìn)行分類。而這能夠在不同腦區(qū)之間的連接中確定精神疾病患者大腦的變化。腦區(qū)之間的連接是由神經(jīng)成像數(shù)據(jù),例如磁共振成像(magnetic resonance imaging,MRI)技術(shù)產(chǎn)生的,并使用功能、結(jié)構(gòu)或形態(tài)網(wǎng)絡(luò)[2]表示。

對(duì)于現(xiàn)有的研究,許多方法被提出來(lái)用從靜息態(tài)功能磁共振成像(functional magnetic resonance imaging,fMRI)技術(shù)獲取的數(shù)據(jù)上進(jìn)行腦網(wǎng)絡(luò)建模,如基于相關(guān)[3]的方法,基于稀疏[4]的表示方法等。而以上所提出的腦功能連接模型反映出腦區(qū)之間信息傳遞的二階關(guān)系。隨著功能性腦網(wǎng)絡(luò)研究的發(fā)展,有研究表明大腦區(qū)域之間的聯(lián)系,不僅是兩個(gè)腦區(qū)之間的信息傳遞,同樣包含大腦區(qū)域的多個(gè)腦區(qū)之間信息的高階傳遞。針對(duì)研究與抑郁癥相關(guān)的生物標(biāo)志物,這種傳遞的高階信息對(duì)于提高識(shí)別抑郁癥的準(zhǔn)確性至關(guān)重要。為此,一些研究人員開(kāi)始使用超網(wǎng)絡(luò)來(lái)描述腦網(wǎng)絡(luò)[5]。

超網(wǎng)絡(luò)是基于超圖理論發(fā)展而來(lái)的,是圖的延伸,在超網(wǎng)絡(luò)中,一個(gè)腦區(qū)對(duì)應(yīng)一個(gè)節(jié)點(diǎn),多個(gè)腦區(qū)構(gòu)成一條超邊,即在大腦區(qū)域內(nèi),多個(gè)腦區(qū)進(jìn)行信息傳遞作用。然而目前大多數(shù)的超網(wǎng)絡(luò)的構(gòu)建方法均是利用套索(least absolute shrinkage and selection operator,Lasso)[6]方法進(jìn)行超網(wǎng)絡(luò)建模。然而Lasso的L1范數(shù)存在每個(gè)變量都是獨(dú)立估計(jì)的缺點(diǎn),因此沒(méi)有考慮變量之間的關(guān)系和結(jié)構(gòu)。研究人員更希望所有相關(guān)的腦區(qū)被作為一個(gè)組來(lái)選擇[7]。假定腦區(qū)分組為可用的先驗(yàn)知識(shí),并且它是以整組而不是用單個(gè)腦區(qū)作為變量選擇的單位。但該方法僅能在組級(jí)上選擇變量,缺乏選擇組間變量的能力,對(duì)于組套索來(lái)說(shuō)它被擴(kuò)展到一個(gè)更一般的設(shè)置[8]。在稀疏模式上有各種更復(fù)雜的結(jié)構(gòu),而不是簡(jiǎn)單的分組信息。然而研究表明,生物信息領(lǐng)域不僅存在重疊組的情況(即某種功能可由多個(gè)腦區(qū)共同協(xié)作來(lái)實(shí)現(xiàn),且某一腦區(qū)在同一時(shí)間下參加多種特定功能),還存在復(fù)雜的樹(shù)組結(jié)構(gòu)問(wèn)題[9]。為了解決這個(gè)問(wèn)題,本研究考慮了大腦區(qū)域中的樹(shù)組結(jié)構(gòu)問(wèn)題,并引入了樹(shù)結(jié)構(gòu)組套索方法來(lái)改進(jìn)超網(wǎng)絡(luò)的構(gòu)建。

為了增強(qiáng)組間差異表征能力,以準(zhǔn)確地發(fā)現(xiàn)生物標(biāo)志物以及疾病的病理機(jī)制,現(xiàn)提出利用樹(shù)結(jié)構(gòu)組套索方法構(gòu)建腦功能超網(wǎng)絡(luò),力求創(chuàng)建更有效及更可靠的超網(wǎng)絡(luò)模型。該方法屬于層級(jí)樹(shù)結(jié)構(gòu),包括根節(jié)點(diǎn)(所有腦區(qū)),中間節(jié)點(diǎn)(對(duì)腦區(qū)進(jìn)行分組)以及葉子節(jié)點(diǎn)(組中高度相關(guān)的一些腦區(qū))。既可以通過(guò)事先定義分組,也可以事先對(duì)每組進(jìn)行細(xì)劃,相當(dāng)于組級(jí)以及組間都采用了預(yù)設(shè)組進(jìn)行劃分,還可以解釋組間的覆蓋情況。

主要工作包括:①利用樹(shù)結(jié)構(gòu)組套索的方法進(jìn)行腦功能超網(wǎng)絡(luò)建模;②利用超網(wǎng)絡(luò)定義的三個(gè)局部聚類系數(shù)對(duì)構(gòu)建的腦功能超網(wǎng)絡(luò)進(jìn)行特征提?。虎劾肒S(Kolmogorov & Smimov)[10]非參數(shù)檢驗(yàn)方法選取局部聚類系數(shù)指標(biāo)間顯著性差異的特征;④使用支持向量機(jī)(support vector machine, SVM)[11]對(duì)顯著性差異特征進(jìn)行分類,提供更準(zhǔn)確和相關(guān)的成像標(biāo)記。

1 材料和方法

研究可分為以下幾個(gè)流程進(jìn)行:數(shù)據(jù)采集及預(yù)處理、使用基于樹(shù)結(jié)構(gòu)組套索的方法進(jìn)行腦功能超網(wǎng)絡(luò)建模、計(jì)算三個(gè)不同定義的聚類系數(shù)進(jìn)行特征提取、采用非參數(shù)檢驗(yàn)方法選擇最具差異性特征以及采用SVM方法進(jìn)行分類。研究流程如圖1所示。

MDD表示抑郁癥患者;NC表示正常人;AAL表示自動(dòng)解剖圖1 研究流程Fig.1 Research flow chart

1.1 材料與分析

1.1.1 被試信息

被試數(shù)據(jù)在山西醫(yī)科大學(xué)第一附屬醫(yī)院的放射科醫(yī)生在嚴(yán)格遵守山西醫(yī)學(xué)倫理委員會(huì)(編號(hào):202013)和赫爾辛基宣言要求的情況下采集完成,并且數(shù)據(jù)采集工作之前,嚴(yán)格遵守漢密爾頓量表(Hamilton depression rating scale,HAMD)的規(guī)定,征得被試及其法定監(jiān)護(hù)人的同意,和每位被試簽訂書(shū)面協(xié)議。實(shí)驗(yàn)研究對(duì)象包括38名第一次發(fā)病,且未服用過(guò)藥物的抑郁癥患者(major depression disorder,MDD)和28名正常對(duì)照組(normal control,NC),總共66名被試。研究所有的被試均使用西門(mén)子3T系統(tǒng)進(jìn)行功能磁共振(fMRI)掃描。被試的具體數(shù)據(jù)信息如表1所示。

表1 被試的具體信息Table 1 Specific information of participants

1.1.2 數(shù)據(jù)采集和預(yù)處理

為了保證數(shù)據(jù)的準(zhǔn)確性,在掃描過(guò)程中,采用軟海綿將被試的頭部固定住以防因被試頭部晃動(dòng)而產(chǎn)生數(shù)據(jù)誤差。除此以外,被試者要求在掃描過(guò)程中輕閉眼睛,腦部呈放空狀態(tài),但不能陷入昏睡并保持思維清晰。實(shí)驗(yàn)掃描參數(shù)設(shè)置如下:回波時(shí)間為30 ms,射頻重復(fù)時(shí)間為2 000 ms,層厚為4 mm,層間間隔為0,視野范圍為192 mm×192 mm,翻轉(zhuǎn)角為90°,存儲(chǔ)矩陣為64 mm×64 mm。

數(shù)據(jù)處理在MATLAB平臺(tái)環(huán)境下進(jìn)行,且本研究利用SPM8 (http://www.fil.ion.ucl.ac.uk/spm)來(lái)完成本實(shí)驗(yàn)的數(shù)據(jù)預(yù)處理工作。對(duì)于每一名被試,數(shù)據(jù)預(yù)處理步驟如下:由于fMRI信號(hào)的不穩(wěn)定,每名受試者的前10卷功能時(shí)間序列會(huì)被丟棄。在對(duì)數(shù)據(jù)樣本采集時(shí)需要時(shí)間層校正和頭動(dòng)校正,即除去超出允許頭動(dòng)范圍的被試數(shù)據(jù),頭動(dòng)允許范圍為頭動(dòng)小于等于3 mm且轉(zhuǎn)動(dòng)小于等于3°,最終有2組抑郁癥及正常對(duì)照組數(shù)據(jù)因超過(guò)頭動(dòng)允許范圍被丟棄,即最終得到66例被試數(shù)據(jù)。隨后,將圖像通過(guò)仿射變換標(biāo)準(zhǔn)化為3 mm×3 mm×3 mm2的蒙特利爾神經(jīng)研究所(montreal neurological institute,MNI)標(biāo)準(zhǔn)空間中。

1.2 超網(wǎng)絡(luò)構(gòu)建

1.2.1 稀疏線性回歸模型

采用稀疏表示[12]方法,利用 rs-fMRI時(shí)間序列構(gòu)建成腦功能超網(wǎng)絡(luò)。首先通過(guò)自動(dòng)解剖標(biāo)記(anatomical automatic labeling,AAL)[13]模板將大腦區(qū)域分割為90個(gè)感興趣解剖區(qū)域(regions of interest,ROI),每個(gè)腦半球被均分為45個(gè)ROI,每一個(gè)ROI可被定義為腦網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn)。在構(gòu)建超網(wǎng)絡(luò)之前,需要提取各腦區(qū)的時(shí)間序列信號(hào)。其次,白質(zhì)信號(hào)、頭動(dòng)校正以及平均腦脊髓液(cerebro-spinal fluid,CSF)對(duì)信號(hào)的影響巨大,為減小實(shí)驗(yàn)的誤差性,需要對(duì)每個(gè)腦區(qū)的平均時(shí)間序列進(jìn)行回歸分析;最后,根據(jù)計(jì)算得到的殘差來(lái)構(gòu)建腦功能超網(wǎng)絡(luò)。

稀疏線性回歸模型具體表示為

(1)

1.2.2 基于樹(shù)結(jié)構(gòu)組套索方法進(jìn)行腦功能超網(wǎng)絡(luò)建模

標(biāo)準(zhǔn)的Lasso方法假設(shè)所有的特征都是獨(dú)立的,但這并不適用于真實(shí)的特征是復(fù)雜關(guān)聯(lián)的情況。具體來(lái)說(shuō),研究表明腦區(qū)間經(jīng)常協(xié)同工作來(lái)實(shí)現(xiàn)某種功能[14],因而套索方法缺乏組效應(yīng)的解釋能力。鑒于腦區(qū)間存在的組結(jié)構(gòu)問(wèn)題,已有的研究針對(duì)群體結(jié)構(gòu)問(wèn)題引入了分組的方法模型[15],如彈性網(wǎng)(elastic net)方法、組套索(group Lasso,gLasso)[16]方法。但彈性網(wǎng)方法存在的主要問(wèn)題之一是依據(jù)數(shù)學(xué)公式自動(dòng)選擇組,缺乏腦區(qū)間組結(jié)構(gòu)先驗(yàn)知識(shí)的表達(dá)?;诖耍M套索解決了自動(dòng)組選擇效應(yīng)的問(wèn)題,也就是可以人為事先定義分組情況,但該方法僅能在組級(jí)上選擇變量,缺乏選擇組間變量的功能。因此稀疏組套索(sparse group Lasso,sgLasso)方法[17]被提出用來(lái)改善腦功能超網(wǎng)絡(luò)的構(gòu)建。該方法實(shí)現(xiàn)了能在組級(jí)和組間自由選擇變量的功能,但這種方法在選擇組間變量時(shí)是依據(jù)數(shù)學(xué)模型自動(dòng)選擇組中一些腦區(qū),認(rèn)為與所選腦區(qū)存在信息交互。為了提高特征選擇的性能,有必要獲取模型中特征之間的結(jié)構(gòu)關(guān)系。

圖2 樹(shù)組結(jié)構(gòu)示例圖Fig.2 Example diagram of tree group structure

為了體現(xiàn)出樹(shù)形結(jié)構(gòu)的層次空間關(guān)系,在進(jìn)行超網(wǎng)絡(luò)建模之前,先使用K-means[18]聚類方法將所有腦區(qū)聚類為K組,即樹(shù)的第二層每個(gè)節(jié)點(diǎn)代表對(duì)腦區(qū)進(jìn)行聚類操作得出的一個(gè)分組,每個(gè)葉子結(jié)點(diǎn)代表組中高度相關(guān)的腦區(qū)。隨后進(jìn)行樹(shù)結(jié)構(gòu)組套索方法的超網(wǎng)絡(luò)模型建模。

正則化目標(biāo)函數(shù)優(yōu)化模型為

(2)

1.3 特征提取

在得到了由樹(shù)結(jié)構(gòu)組套索構(gòu)建的腦功能超網(wǎng)絡(luò)之后,要對(duì)已構(gòu)建好的腦網(wǎng)絡(luò)拓?fù)溥M(jìn)行特征提取,用以分析網(wǎng)絡(luò)屬性。本實(shí)驗(yàn)的特征提取由3個(gè)指標(biāo)的計(jì)算組成,而這三個(gè)指標(biāo)的計(jì)算為三個(gè)不同定義、不同關(guān)系的聚類系數(shù)[21]。從目前已有的研究中可以看出,聚類系數(shù)在很大程度上被用來(lái)評(píng)估超網(wǎng)絡(luò)局部屬性的性能。有關(guān)公式為

(3)

(4)

式(4)中:HCC2(v)為與節(jié)點(diǎn)v相連的鄰居節(jié)點(diǎn)的數(shù)量;N(v)為超邊中包含節(jié)點(diǎn)v及其相鄰節(jié)點(diǎn)的集合。如果?ei∈E且u,t,v∈ei,則I′(u,t,v)=1。

(5)

式(5)中:HCC3(v)計(jì)算超邊之間的重疊量,即指節(jié)點(diǎn)v的相鄰超邊,鄰居區(qū)域的密度由鄰居區(qū)域的超邊重疊量來(lái)表示;|e|為超邊中包含的節(jié)點(diǎn)數(shù)目;S(v)表示超邊的集合,在這些超邊中都包含節(jié)點(diǎn)v,S(v)={ei∈E:v∈ei}。

1.4 特征選擇與分類

特征選擇是機(jī)器學(xué)習(xí)中最常見(jiàn)的問(wèn)題之一,其目的是選擇最具判別性的特征進(jìn)行分類和預(yù)測(cè)。從已構(gòu)建好的腦功能超網(wǎng)絡(luò)中提取出270個(gè)特征,但這些特征并不都是最具差異性特征,它可能會(huì)存在不相關(guān)或者虛假的屬性,因此要選取最具顯著性差異的特征并將其成功應(yīng)用于分類。具體地說(shuō),分別對(duì)由根據(jù)抑郁癥患者和正常對(duì)照組這兩種被試構(gòu)建出的腦功能超網(wǎng)絡(luò)中分別進(jìn)行HCC1、HCC2、HCC3局部屬性指標(biāo)計(jì)算,隨后將得到的270個(gè)節(jié)點(diǎn)屬性特征由已通過(guò)偽發(fā)現(xiàn)率(false-discovery rate,F(xiàn)DR)(q=0.05)[22]方法矯正的Kolmogorov & Smimov nonparametric test進(jìn)行組間非參數(shù)檢驗(yàn),最后經(jīng)由KS檢驗(yàn)方法得出的每個(gè)被試的p<0.05的最具差異性特征,隨后將選取的特征用于分類。

在完成特征選擇以后,以選取的最具顯著性的差異特征作為分類標(biāo)準(zhǔn)構(gòu)建分類模型,由此實(shí)現(xiàn)有效分類。因而在將分類特征進(jìn)行分類前,需將具有顯著性差異的特征選擇出來(lái),并將其計(jì)算得出它的算術(shù)平均值與標(biāo)準(zhǔn)差,降低因數(shù)據(jù)的不精確而導(dǎo)致的實(shí)驗(yàn)誤差性,以此來(lái)提高分類準(zhǔn)確率。分類問(wèn)題作為機(jī)器學(xué)習(xí)下的一個(gè)重要問(wèn)題,是為了對(duì)已有類標(biāo)簽的訓(xùn)練集數(shù)據(jù)展開(kāi)訓(xùn)練,構(gòu)建相應(yīng)的分類模型。在實(shí)驗(yàn)分類過(guò)程中,使用SVM作為分類器,并使用腦網(wǎng)絡(luò)建模方法中常用的徑向基函數(shù)(radial basis function, RBF)作為核函數(shù),并采用留一交叉驗(yàn)證方法對(duì)分類模型的性能進(jìn)行驗(yàn)證。

2 實(shí)驗(yàn)和結(jié)果

2.1 差異性腦區(qū)

為探究精神疾病大腦區(qū)域發(fā)病的病理機(jī)制,從抑郁癥患者和正常人的大腦區(qū)域中提取出差異性腦區(qū)。首先計(jì)算由樹(shù)結(jié)構(gòu)組套索方法構(gòu)建的超網(wǎng)絡(luò)得到的三個(gè)局部聚類屬性指標(biāo),并用KS非參數(shù)檢驗(yàn)方法對(duì)其做分析研究,本方法下共得到10個(gè)MDD與NC之間最具顯著性差異的腦區(qū),它們分別是:是右側(cè)眶部額上回(ORBsup.R)、右側(cè)補(bǔ)充運(yùn)動(dòng)區(qū)(SMA.R)、左側(cè)眶內(nèi)額上回(ORBsupmed.L)、右側(cè)眶內(nèi)額上回(ORBsupmed.R)、右側(cè)海馬旁回(PHG.R)、左側(cè)楔葉(CUN.L)、右側(cè)緣上回(SMG.R)、右側(cè)尾狀核(CAU.R)、左側(cè)豆?fàn)顨ず?PUT.L)、左側(cè)顳橫回(HES.L)。選擇出來(lái)的最具差異性腦區(qū)在目前已有的關(guān)于抑郁癥分類研究中已得到充分驗(yàn)證??导位鄣萚23]研究證明了與健康對(duì)照組相比,青少年抑郁癥患者的右側(cè)眶部額上回的低頻振幅(amplitude of low frequency fluctuation,ALFF)值顯著升高。王利娟等[24]研究證明患有睡眠障礙的抑郁癥患者與健康對(duì)照組相比在右側(cè)補(bǔ)充運(yùn)動(dòng)區(qū)的局部一致性(regional homogeneity,ReHo)值顯著增加。Ying等[25]研究證明晚發(fā)性抑郁癥(late-onset depression,LOD)原發(fā)性病變的ALFF廣泛分布于左側(cè)眶內(nèi)額上回。李璐莎等[26]研究證明與健康對(duì)照組相比,抑郁癥患者的右側(cè)眶內(nèi)額上回的ALFF值在降低。Rolls等[27]研究證明了與未用藥的抑郁癥患者相比,接受藥物治療的抑郁癥患者的海馬旁回的功能連接性較低。Peng等[28]研究證明了焦慮性抑郁癥患者的左側(cè)楔葉的灰質(zhì)體積大于健康對(duì)照組。Chen[29]等研究證明了與健康對(duì)照組相比,伴有抑郁癥的早泄患者右側(cè)緣上回的淋巴結(jié)參與減少。Filip等[30]研究證明了右側(cè)尾狀核區(qū)域的灰質(zhì)體積的增加與核心評(píng)估分?jǐn)?shù)顯著相關(guān)。王智等[31]研究證明了與健康對(duì)照組相比,刺激前治療難治性抑郁癥患者的左側(cè)豆?fàn)顨ず说墓δ苓B接較高。Hall等[32]研究證明了與健康青少年對(duì)照組相比,患有重度抑郁癥的青少年在左側(cè)顳橫回區(qū)域中看到可怕的面孔時(shí)具有較低的激活性。通過(guò)樹(shù)結(jié)構(gòu)組套索方法構(gòu)建的腦功能超網(wǎng)絡(luò)選取的MDD與NC之間最具差異性的腦區(qū)名稱及p值對(duì)應(yīng)表以及使用BrainNet軟件將最具差異性腦區(qū)映射到皮質(zhì)表面的分布圖分別如表2及圖3所示。綜合分析看,本研究提取到最具差異性腦區(qū)與之前的研究結(jié)果基本一致,對(duì)抑郁癥診斷有著重要的意義。

2.2 分類表現(xiàn)

為有效研究新方法的性能優(yōu)劣,基于樹(shù)結(jié)構(gòu)組套索方法構(gòu)建出的腦功能超網(wǎng)絡(luò)通過(guò)準(zhǔn)確率、敏感度、特異度以及BAC(balanced accuracy)這四個(gè)方面來(lái)評(píng)估所建的模型的分類性能。分類準(zhǔn)確率定義為抑郁癥患者及正常對(duì)照組可以被正確分辨的概率;靈敏度定義為抑郁癥患者可以被成功分辨為抑郁癥病人的概率;特異度定義為正常對(duì)照組可以被成功分辨為正常人的概率。為避免由數(shù)據(jù)集不平衡導(dǎo)致的膨脹性能[33],將敏感度和特異度的算術(shù)平均值來(lái)表示BAC,以此來(lái)減少實(shí)驗(yàn)的誤差性。

表2 顯著差異腦區(qū)及其p表Table 2 Table of significantly different brain regions and their p

圖3 差異腦區(qū)分布Fig.3 Differential brain area distribution

綜合評(píng)估了該研究所述的方法構(gòu)建的超網(wǎng)絡(luò)的分類性能,并結(jié)合傳統(tǒng)的腦網(wǎng)絡(luò)的構(gòu)建方法、套索方法、彈性網(wǎng)方法、組套索方法以及稀疏組套索方法進(jìn)行了對(duì)比分析的實(shí)驗(yàn)。由于本方法具有預(yù)設(shè)組效應(yīng),在對(duì)超網(wǎng)絡(luò)建模以前采用的K-means聚類方法進(jìn)行分組時(shí)具有隨機(jī)性,為了保證避免在對(duì)腦區(qū)分組時(shí)出現(xiàn)因分組隨機(jī)性而導(dǎo)致的實(shí)驗(yàn)結(jié)果產(chǎn)生誤差,在每個(gè)實(shí)驗(yàn)分組下分別以相同的操作重復(fù)做了50次實(shí)驗(yàn),隨后將每組實(shí)驗(yàn)的結(jié)果進(jìn)行算術(shù)平均運(yùn)算得到均值作為實(shí)驗(yàn)的最終結(jié)果進(jìn)行對(duì)比分析。為了對(duì)比出基于本方法進(jìn)行的腦功能超網(wǎng)絡(luò)建模和其他方法之間的差異性,本研究?jī)H使用三種聚類系數(shù)進(jìn)行特征選擇以及使用RBF核函數(shù)的分類方法,不同腦網(wǎng)絡(luò)的構(gòu)建方法以及新的超網(wǎng)絡(luò)建模方法的分類結(jié)果如表3所示。結(jié)果表明,樹(shù)結(jié)構(gòu)組套索方法下的分類性能要高于傳統(tǒng)的腦網(wǎng)絡(luò)構(gòu)建方法、套索方法、彈性網(wǎng)方法、組套索方法以及稀疏組套索方法。

表3 各方法的分類表現(xiàn)對(duì)比Table 3 Comparison of classification performance of each method

3 參數(shù)討論

參數(shù)調(diào)優(yōu)在整個(gè)實(shí)驗(yàn)過(guò)程中是一項(xiàng)不可或缺的環(huán)節(jié),參數(shù)的選擇會(huì)對(duì)實(shí)驗(yàn)的最終結(jié)果造成不可忽視的影響。在本研究中,主要涉及在樹(shù)結(jié)構(gòu)組套索方法下構(gòu)建的超網(wǎng)絡(luò)選取的聚類數(shù)K和正則化參數(shù)λ對(duì)于最終的分類效果的差異性。為了分析這兩個(gè)參數(shù)對(duì)于抑郁癥患者和正常對(duì)照組之間分類效果的影響,以樹(shù)結(jié)構(gòu)組套索進(jìn)行超網(wǎng)絡(luò)建模構(gòu)的方法進(jìn)行了對(duì)比分析實(shí)驗(yàn)。

3.1 聚類參數(shù)K的影響

為了體現(xiàn)出預(yù)設(shè)組的效應(yīng),本實(shí)驗(yàn)在創(chuàng)建超邊前實(shí)選用了K-means[17]聚類算法進(jìn)行聚類。參數(shù)k為在基于樹(shù)結(jié)構(gòu)組套索方法下構(gòu)建腦功能超網(wǎng)絡(luò)的分組數(shù)。分組數(shù)K值的選擇會(huì)影響到使用該方法構(gòu)建的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)同時(shí)也會(huì)對(duì)最終的分類結(jié)果產(chǎn)生影響。

為了探究分組數(shù)K對(duì)構(gòu)建的網(wǎng)絡(luò)模型產(chǎn)生的影響,將聚類參數(shù)k的取值范圍設(shè)置為[3,90],步長(zhǎng)間隔為3,總共30組實(shí)驗(yàn),在每一組的實(shí)驗(yàn)下構(gòu)建樹(shù)結(jié)構(gòu)組套索方法的腦功能超網(wǎng)絡(luò)。根據(jù)聚類算法的特性,它在每次的聚類過(guò)程中都會(huì)進(jìn)行一次中心點(diǎn)的移動(dòng),它會(huì)將中心點(diǎn)移動(dòng)到每一次劃分的包含其他節(jié)點(diǎn)的平均位置上。因而在本部分的實(shí)驗(yàn),分組數(shù)K的選取具有不確定性,聚類的結(jié)果會(huì)因分組數(shù)K的選取而隨之改變,進(jìn)而導(dǎo)致該方法構(gòu)建的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)及其最終分類結(jié)果產(chǎn)生不穩(wěn)定的差異性。為了確保實(shí)驗(yàn)的準(zhǔn)確性,在每個(gè)實(shí)驗(yàn)分組K下進(jìn)行了50次實(shí)驗(yàn),并對(duì)每組實(shí)驗(yàn)的結(jié)果求其均值作為該組的最終結(jié)果,最后將各組的實(shí)驗(yàn)結(jié)果進(jìn)行比對(duì)分析。如圖4所示,當(dāng)K=57時(shí),有最高的分類準(zhǔn)確率,達(dá)到87.25%。

圖4 聚類參數(shù)k對(duì)應(yīng)的分類結(jié)果Fig.4 Classification result of clustering parameter k

3.2 正則化參數(shù)λ的影響

構(gòu)建樹(shù)結(jié)構(gòu)組套索腦功能超網(wǎng)絡(luò)時(shí)通過(guò)設(shè)置λ來(lái)控制模型的稀疏度,即不同的λ會(huì)產(chǎn)生不同的超邊,進(jìn)而產(chǎn)生不同的分類效果。采用升序的組合方法,共測(cè)試9組λ,它們分別為{0.1}, {0.1,0.2}, {0.1,0.2,0.3}, …, {0.1,0.2,…,0.9},分別采用這9組λ進(jìn)行網(wǎng)絡(luò)建模,并選取最具判別性特征并進(jìn)行分類。分類結(jié)果如圖5所示,結(jié)果表明,在λ采用{0.1,0.2,…,0.9}時(shí),有最高的分類準(zhǔn)確率,為87.25%,表明分類準(zhǔn)確性可能隨著λ個(gè)數(shù)的增加而提高。

圖5 正則化參數(shù)λ對(duì)應(yīng)的分類結(jié)果Fig.5 Classification result of regularization parameters λ

4 結(jié)論

近年來(lái),靜息態(tài)腦功能超網(wǎng)絡(luò)已廣泛應(yīng)用于腦部精神疾病的分類研究中。腦病變并非嚴(yán)格集中在一個(gè)地方,其周圍區(qū)域也有助于臨床診斷?,F(xiàn)有的超網(wǎng)絡(luò)建模方法在進(jìn)行超網(wǎng)絡(luò)構(gòu)建時(shí)不能有效考慮層次組結(jié)構(gòu)問(wèn)題。鑒于這個(gè)問(wèn)題,提出樹(shù)結(jié)構(gòu)組套索方法構(gòu)建超網(wǎng)絡(luò)??梢酝ㄟ^(guò)事先定義分組,即對(duì)組級(jí)以及組間都采用了預(yù)設(shè)組進(jìn)行劃分,并可以對(duì)組間的重疊性做出解釋。結(jié)果顯示樹(shù)結(jié)構(gòu)組套索方法下得到的分類效果要優(yōu)于其他方法,能更好地體現(xiàn)人腦中復(fù)雜的層次組結(jié)構(gòu)關(guān)系。

盡管在目前的研究中,實(shí)驗(yàn)已取得較好的結(jié)果,但仍存在局限性。首先,在構(gòu)建模型之前采用K-means聚類方法進(jìn)行分組時(shí)具有一定的隨機(jī)性,即使求取多次實(shí)驗(yàn)結(jié)果的均值來(lái)減小誤差,但仍給實(shí)驗(yàn)結(jié)果帶來(lái)一定的影響;其次,考慮到抑郁癥患者的隱私性問(wèn)題,實(shí)驗(yàn)的數(shù)據(jù)采集具有一定的難度,因而本實(shí)驗(yàn)采用數(shù)據(jù)集的受試者數(shù)量較少。以上的幾個(gè)局限問(wèn)題有待于日后的研究來(lái)改進(jìn)。

猜你喜歡
腦區(qū)聚類分類
一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
基于知識(shí)圖譜的k-modes文本聚類研究
長(zhǎng)期戒斷海洛因成癮者沖動(dòng)性相關(guān)腦區(qū)的結(jié)構(gòu)及功能特征*
一種改進(jìn)K-means聚類的近鄰傳播最大最小距離算法
基于模糊聚類和支持向量回歸的成績(jī)預(yù)測(cè)
再不動(dòng)腦, 真的會(huì)傻
按需分類
教你一招:數(shù)的分類
說(shuō)說(shuō)分類那些事
止咳藥水濫用導(dǎo)致大腦結(jié)構(gòu)異常