丁超 趙海 司帥宗 朱劍
摘 要:為了對正常衰老的人腦功能網(wǎng)絡(NABFN)的拓撲結(jié)構變化進行探究,提出一種基于樸素貝葉斯的網(wǎng)絡演化模型(NBM)。首先,依據(jù)樸素貝葉斯(NB)的鏈路預測算法與解剖距離來定義節(jié)點間存在連邊的概率;其次,利用特定的網(wǎng)絡演化算法,在青年人的腦功能網(wǎng)絡基礎上,通過不斷地增加連邊來逐步得到相應中年及老年時期的模擬網(wǎng)絡;最后,為了對模擬網(wǎng)絡與真實網(wǎng)絡間的相似程度進行評價,提出網(wǎng)絡相似指標(SI)值。仿真實驗結(jié)果表明,與基于共同鄰居的網(wǎng)絡演化模型(CNM)相比,NBM構建的模擬網(wǎng)絡與真實網(wǎng)絡間的SI值(4.4794, 3.4021)高于CNM模擬網(wǎng)絡對應的SI值(4.1004, 3.0132);并且,兩者模擬網(wǎng)絡的SI值均明顯高于隨機網(wǎng)絡演化算法所得模擬網(wǎng)絡的SI值(1.8920, 1.5912)。實驗結(jié)果證實NBM能夠更為準確地預測出NABFN的拓撲結(jié)構變化過程。
關鍵詞:?腦功能網(wǎng)絡;演化模型;演化算法;鏈路預測;樸素貝葉斯
中圖分類號:?TP391.4; TP183
文獻標志碼:A
文章編號:1001-9081(2019)04-0963-09
Abstract: In order to explore the topological changes of Normal Aging human Brain Functional Network (NABFN), a network evolution Model based on Naive Bayes (NBM) was proposed. Firstly, the probability of existing edges between nodes was defined based on link prediction algorithm of Naive Bayes (NB) and anatomical distance. Secondly, based on the brain functional networks of young people, a specific network evolution algorithm was used to obtain a simulation network of the corresponding middle-aged and old-aged gradually by constantly adding edges. Finally, a network Similarity Index (SI) was proposed to evaluate the similarity degree between the simulation network and the real network. In the comparison experiments with network evolution Model based on Common Neighbor (CNM), the SI values between the simulation networks constructed by NBM and the real networks (4.4794, 3.4021) are higher than those of CNM (4.1004, 3.0132). Moreover, the SI value of both simulation networks are significantly higher than those of simulation networks derived from random network evolution algorithm (1.8920, 1.5912). The experimental results confirm that NBM can predict the topological changing process of NABFN more accurately.
Key words: brain functional network; evolution model; evolution algorithm; link prediction; Naive Bayes (NB)
0?引言
人類大腦是世界上最復雜的系統(tǒng)之一,它是由數(shù)十億個神經(jīng)元組成的一個高度縝密的組織結(jié)構[1]。為了便于研究分析,前人利用先進的技術手段將大腦劃分為不同的功能區(qū)域,以此來負責人的不同身體機能,例如精神功能區(qū)、視覺區(qū)、聽覺區(qū)等[2]。研究發(fā)現(xiàn)人在正常衰老過程中,腦功能區(qū)域連接的變化將導致認知能力的改變[3]。文獻[4]已經(jīng)證實人的語言功能會隨著年齡的增加而發(fā)生衰退現(xiàn)象,而這一影響正是由于腦區(qū)間的動態(tài)連接變化造成的。
與此同時,探索人類在正常衰老過程中腦功能區(qū)域復雜連接模式與認知能力變化之間的關系已然成為有關學者的關注重點。文獻[5-6]通過利用圖理論方法和網(wǎng)絡建模的方式研究與年齡相關的人的認知表現(xiàn)和各腦功能區(qū)域連接變化的關系。然而,目前的已有研究均未能對大時間尺度范圍內(nèi)人的腦區(qū)之間的功能連接變化進行有效分析。因此,切實利用適宜的模型構建方法來探索這一變化過程是本文的研究目標,為將來找尋造成人類認知變化的內(nèi)在原因提供了重要的理論參照。
本文的主要工作如下:1)提出一種利用樸素貝葉斯(Naive Bayes, NB)的鏈路預測算法和解剖距離定義的基于樸素貝葉斯的網(wǎng)絡演化模型(network evolution Model based on NB, NBM)對腦功能網(wǎng)絡建模,并與利用共同鄰居(Common Neighbor, CN)的鏈路預測算法和解剖距離定義的基于共同鄰居的網(wǎng)絡演化模型(network evolution Model based on CN, CNM)對比;2)NBM依據(jù)特定的網(wǎng)絡演化算法來模擬正常衰老的人腦功能網(wǎng)絡(Normal Aging human Brain Functional Network, NABFN)拓撲結(jié)構的變化過程,并與隨機網(wǎng)絡演化算法進行對比;
3)利用不同拓撲屬性間的雙樣本t校驗結(jié)果來定義網(wǎng)絡相似指標(Similarity Index, SI)值,用于評估演化模型的性能。
1?研究現(xiàn)狀
隨著神經(jīng)影像技術的發(fā)展,利用功能磁共振成像(functional Magnetic Resonance Images, fMRI)掃描數(shù)據(jù)所構建的腦功能網(wǎng)絡已經(jīng)能夠有效映射人的不同腦區(qū)之間的功能連接,即不同的腦區(qū)定義為網(wǎng)絡節(jié)點,腦區(qū)間的功能連接定義為網(wǎng)絡連邊。目前,國內(nèi)關于腦功能網(wǎng)絡的研究相對較少,而國外的相關人員已經(jīng)開始研究與年齡相關的人腦功能網(wǎng)絡與認知能力的變化關系[7],并通過利用復雜網(wǎng)絡理論對正常衰老過程中的人腦功能網(wǎng)絡的特性變化進行分析:文獻[8]利用復雜網(wǎng)絡理論來探究98名健康人的腦功能網(wǎng)絡的變化,結(jié)果發(fā)現(xiàn)在正常衰老期間人腦網(wǎng)絡的聚類系數(shù)會相應增加;文獻[9]發(fā)現(xiàn)老齡化會影響大腦區(qū)域之間的功能連接,結(jié)果證實老年人的腦功能網(wǎng)絡的模塊度與青年人相比有減小的趨勢;文獻[10]利用fMRI掃描數(shù)據(jù)系統(tǒng)地構建了126名健康個體的腦功能網(wǎng)絡,發(fā)現(xiàn)局部效益會隨著年齡的增加而減小。以上對于人腦功能網(wǎng)絡拓撲屬性的研究,為網(wǎng)絡建模提供了有效的模型評價依據(jù)。事實上,復雜網(wǎng)絡理論也為腦功能網(wǎng)絡的構建提供了諸多方法,為從建模的方面探索人腦的連接模式提供了新的解決辦法。
近年來,復雜網(wǎng)絡理論中的鏈路預測可以利用拓撲結(jié)構相似性來預測任意兩個未連邊的節(jié)點之間存在連邊的概率,便于人們通過使用鏈路預測來定義網(wǎng)絡模型,以此對復雜網(wǎng)絡的變化過程進行研究:文獻[11-12]利用鏈路預測對社交網(wǎng)絡等進行構建,并用復雜網(wǎng)絡理論中的多種拓撲屬性進行分析,發(fā)現(xiàn)不同的網(wǎng)絡屬性間存在差異。與此同時,腦網(wǎng)絡也實現(xiàn)了同步研究:文獻[13]利用解剖距離定義節(jié)點連邊概率,實現(xiàn)貓和獼猴腦網(wǎng)絡的建模,發(fā)現(xiàn)節(jié)點連邊概率與解剖距離成反比;文獻[14]利用鏈路預測中節(jié)點間的連邊變化關系對腦網(wǎng)絡進行重構,證實局部社團策略對節(jié)點連邊產(chǎn)生重大影響。以上兩者的模型構建方法也為人腦功能網(wǎng)絡的建模分析提供了思路:王艷群等[15]提出社團劃分算法應用于腦功能網(wǎng)絡,并重點分析了腦功能網(wǎng)絡的社團結(jié)構的變化情況;Yang等[16]提出基于最大似然估計的分層隨機圖模型來定義節(jié)點連邊概率實現(xiàn)對腦功能網(wǎng)絡的重新構建,最終驗證所提模型的模擬性能優(yōu)于隨機預測模型;Li等[17]利用復雜網(wǎng)絡理論提出基于點介數(shù)的鏈路預測算法的網(wǎng)絡模型并研究從正常到阿爾茨海默病的腦功能網(wǎng)拓撲屬性變化過程,結(jié)果表明該模型的模擬效果良好;Sulaimany等[18]提出基于多種鏈路預測算法的網(wǎng)絡演化模型,對阿爾茨海默病患者與正常人的腦功能網(wǎng)絡結(jié)構差異進行研究,結(jié)果證實了不同算法對于網(wǎng)絡的拓撲結(jié)構變化預測存在明顯差異;文獻[19-20]利用共同鄰居(CN)的鏈路預測算法(簡稱CN算法)計算得到兩節(jié)點間的拓撲結(jié)構相似性大小,再與解剖距離相結(jié)合來共同定義網(wǎng)絡模型,以實現(xiàn)對腦功能網(wǎng)絡的模擬,同時對比分析模擬網(wǎng)絡與真實腦功能網(wǎng)絡的多種拓撲屬性驗證了模型的有效性。雖然文獻[15-20]利用基于多種鏈路預測算法提出的網(wǎng)絡模型可以有效地對腦功能網(wǎng)絡進行建模,但是它們并沒有對正常衰老的人腦功能網(wǎng)絡(NABFN)拓撲結(jié)構變化過程進行研究。另外,文獻[19-20]通過拓撲結(jié)構相似性和解剖距離來定義節(jié)點連邊概率,的確能夠有效地對腦功能網(wǎng)絡進行模擬,為本文模型的定義提供了參考依據(jù)。然而,CN算法計算拓撲結(jié)構相似性時并沒有區(qū)分不同節(jié)點作為共同鄰居節(jié)點時對該相似性的影響。
因此,針對上述問題,本文首先利用樸素貝葉斯理論量化分析網(wǎng)絡中的每個節(jié)點作為共同鄰居節(jié)點時對拓撲結(jié)構相似性的影響,得到樸素貝葉斯的鏈路預測算法(簡稱NB算法)。在此基礎上,提出一種基于樸素貝葉斯的網(wǎng)絡演化模型(NBM)對腦功能網(wǎng)絡建模。其次,為了對NABFN的拓撲結(jié)構變化過程進行探究,NBM依據(jù)特定網(wǎng)絡演化算法來模擬從青年時期經(jīng)中年,再到老年時期的腦功能網(wǎng)絡的演化過程。通過校驗模擬網(wǎng)絡與真實網(wǎng)絡之間拓撲屬性變化,結(jié)果顯示NBM能夠有效地預測出NABFN的拓撲結(jié)構變化。
2?網(wǎng)絡演化模型定義
本章首先介紹模型構建的理論依據(jù),其次,利用CN算法來定義的網(wǎng)絡演化模型;最后,利用NB算法以區(qū)分不同的共同鄰居節(jié)點對拓撲結(jié)構相似性的影響,并相應給出本文所提網(wǎng)絡演化模型的具體定義。
2.1?網(wǎng)絡模型構建的理論依據(jù)
本文定義由fMRI掃描數(shù)據(jù)構建的不同年齡范圍的腦功能網(wǎng)絡集合為真實網(wǎng)絡(Young、Middle、Old),由網(wǎng)絡演化模型建模得到的網(wǎng)絡集合為模擬網(wǎng)絡。
實驗中,模型構建過程如圖1所示。注意,圖1僅包含網(wǎng)絡中的部分節(jié)點。觀察到真實網(wǎng)絡中的節(jié)點a和b、節(jié)點c和d之間是否存在連邊暫時無法知曉。然而,文獻[17-20]均依據(jù)鏈路預測思想來定義網(wǎng)絡模型,即節(jié)點a和b之間的拓撲結(jié)構相似性越大,則兩節(jié)點越傾向于彼此連接;而文獻[13,19]則是考慮兩節(jié)點間的解剖距離(即歐氏距離),可以觀察到節(jié)點a和b之間的距離小于節(jié)點c和d之間的距離。而距離越小則越傾向于建立連邊,解剖距離定義如下:
特別地,文獻[19]將解剖距離和拓撲結(jié)構相似性相結(jié)合提出一種新的網(wǎng)絡構建模型,結(jié)果證實相對于利用單個因素的模型來說,該模型構建的模擬網(wǎng)絡準確性更高。因此,本文模型也綜合考慮這兩個因素提出一種網(wǎng)絡演化模型用于計算兩節(jié)點間存在連邊的概率大小,若概率取值最高,則建立網(wǎng)絡連邊,由此獲得圖1中的模擬網(wǎng)絡。
2.2?基于共同鄰居的網(wǎng)絡演化模型
2.3?基于樸素貝葉斯的網(wǎng)絡演化模型
近年來,關于樸素貝葉斯理論的研究一直是學術界中的熱門方向。相關研究人員已經(jīng)將其與復雜網(wǎng)絡理論充分結(jié)合,并取得了重要的研究成果。Valverde-Rebaza等[21]提出一種使用重疊組結(jié)構信息來構建樸素的貝葉斯模型的新方法,有助于提高社交網(wǎng)絡中連邊預測的準確性。同樣地,Heiberger[22]提出一種利用公司層面的單體網(wǎng)絡作為后驗概率來預測國家經(jīng)濟增長的貝葉斯方法,最終能夠準確預測出不同季度的整體經(jīng)濟變化趨勢。然而以上的研究對象皆是人們較為熟悉的一些復雜網(wǎng)絡,而不是人腦功能網(wǎng)絡方面的。
此外,2.2節(jié)中的CNM表明拓撲結(jié)構相似性和解剖距離確實能夠有效地構建腦功能網(wǎng)絡[19]。本文模型的定義也同樣考慮了這兩方面的因素。并且,觀察圖1可以發(fā)現(xiàn),真實網(wǎng)絡中的a和b節(jié)點存在的共同鄰居節(jié)點明顯多于c和d節(jié)點,CN算法則判定節(jié)點a和b之間的拓撲相似性校大。然而,CN算法在計算拓撲結(jié)構相似性時并沒有區(qū)分不同節(jié)點作為共同鄰居節(jié)點時對該相似性的影響。因此,本文依據(jù)樸素貝葉斯理論,利用NB算法來量化分析單個節(jié)點對拓撲結(jié)構相似性的貢獻。同時,在此基礎上,提出一種基于樸素貝葉斯的網(wǎng)絡演化模型(NBM),模型定義為:
3?網(wǎng)絡演化算法設計
為了研究NABFN的節(jié)點連接變化情況,本章提出特定的網(wǎng)絡演化算法,并與隨機網(wǎng)絡演化算法進行對比。
3.1?網(wǎng)絡演化算法
針對上文的兩種網(wǎng)絡演化模型,本節(jié)給出了具體的網(wǎng)絡演化算法,以實現(xiàn)對NABFN拓撲結(jié)構變化過程的模擬,即算法以所有青年人的腦功能網(wǎng)絡為起點,逐步得到中年、老年時對應的模擬網(wǎng)絡。具體的網(wǎng)絡演化算法包含以下步驟:
第1步?初始網(wǎng)絡選取。選取真實網(wǎng)絡中的Young作為演化的初始網(wǎng)絡。
第2步?節(jié)點選擇。選取Young中的單個樣本對象網(wǎng)絡G,根據(jù)式(13)中Pm取值隨機從G中選擇一個節(jié)點m。
其中:dn代表節(jié)點n的度值;Pm表示節(jié)點m被選擇的概率,它與節(jié)點度dm正相關。如果dm≤1,或者m的任意鄰居節(jié)點間均存在連邊,將根據(jù)概率Pm重新選擇新的節(jié)點m。
第3步?連邊建立。若節(jié)點m鄰居節(jié)點集合為Φ,隨機選取Φ中的兩個不存在連邊的節(jié)點i與j,根據(jù)CNM、NBM的定義分別計算節(jié)點i與j之間的連邊概率 Pi, j。選取 Pi, j取值最大的節(jié)點i與j建立連邊。
第4步?并行演化。循環(huán)執(zhí)行第2~3步,來不斷增加G中節(jié)點間的連邊數(shù)目,并保證Young中所有的樣本對象網(wǎng)絡并行演化,即:只有當Young中的網(wǎng)絡全部完成當前演化步驟時,它們才會同時進入下一個循環(huán)。需要注意的是,演化過程包含兩個時期,從Young到Middle,以及從Young到Old。兩個時期中Young始終作為初始網(wǎng)絡,且演化步驟一致,僅僅是相應的真實網(wǎng)絡不同。最終當滿足方程(15)時,演化過程結(jié)束。
其中: Pedge(s)表示網(wǎng)絡演化過程中每個時期得到的模擬網(wǎng)絡與對應真實網(wǎng)絡(Middle, Old)之間關于節(jié)點連邊數(shù)量的雙樣本t檢驗的P值。規(guī)定每當完成一次第4步后都要重復上述檢驗。如果第s+1次校驗值Pedge(s+1)大于或等于第s次校驗值Pedge(s),則演化過程繼續(xù)下一循環(huán);否則,表明Pedge(s)達到最大值,整個演化過程結(jié)束,即:初始網(wǎng)絡Young中不再通過循環(huán)方式來添加新的連邊。此時,Young集合中每個樣本對象網(wǎng)絡均增加了s條連邊,最后選擇第s次檢驗后的模擬網(wǎng)絡作為最終模擬網(wǎng)絡。
不難看出,本文算法的復雜度與整體邊數(shù)的雙樣本t檢驗值有關。由于演化過程每次僅對Young中的所有網(wǎng)絡建立一條連邊,因此需要進行多輪操作直到滿足演化終止條件為止,算法復雜度會相應增加。另外,對于第3步中計算兩節(jié)點間的存在連邊的概率,該過程也提高了算法復雜度。但是,演化過程的加邊次數(shù)和網(wǎng)絡節(jié)點的個數(shù)有限,使得整體的算法復雜度仍在可接受的范圍內(nèi),并且合理的網(wǎng)絡模型對于實驗結(jié)果有著重要的影響。
3.2?隨機網(wǎng)絡演化算法
為了驗證本文所提網(wǎng)絡演化算法的準確性,與隨機網(wǎng)絡演化算法進行對比分析,并且兩者演化過程包含的兩個時期相同。具體步驟如下:
第1步?初始網(wǎng)絡選取。將真實網(wǎng)絡中的Young作為演化的初始網(wǎng)絡。
第2步?節(jié)點選擇。隨機選取Young中的單個被試網(wǎng)絡G中的一個節(jié)點m,如果節(jié)點m的度值dm≤1或者節(jié)點m任意鄰居節(jié)點間均存在連邊,則重新隨機選取節(jié)點m。
第3步?連邊建立。獲取節(jié)點m對應的所有鄰居節(jié)點集合Φ,并隨機選取Φ中兩個不同的節(jié)點i和j。若節(jié)點i和j之間不存在連邊,則建立連邊。
第4步?并行演化。循環(huán)執(zhí)行第2~3步,來不斷增加G中節(jié)點間的連邊數(shù)目,并保證Young中所有的樣本對象網(wǎng)絡并行演化,整個過程與3.1節(jié)網(wǎng)絡演化算法一致。最終當滿足方程(15)時,演化過程結(jié)束。
4?實驗與結(jié)果
4.1?樣本選取與預處理
本文使用的原始fMRI掃描數(shù)據(jù)分別來自于腦成像國際聯(lián)盟(International Consortium for Brain Mapping, ICBM)、生物醫(yī)學研究中心(The Center for Biomedical Research Excellence, COBRE)以及北京師范大學認知神經(jīng)科學與學習國家重點實驗室(Beijing Normal University, State Key Laboratory of Cognitive Neuroscience and Learning)關于靜息態(tài)功能性核磁共振影像(resting state fMRI, rs-fMRI)數(shù)據(jù)集中的一部分,三者包含了不同年齡范圍的人腦圖像掃描數(shù)據(jù)。
實驗中,隨機抽取上述三個數(shù)據(jù)集中共90個樣本對象,并根據(jù)年齡大小均分成三組(每組30人),各組樣本統(tǒng)計數(shù)據(jù)如表1所示。其中:青年組(young)平均年齡22.8歲,范圍為19~30歲;中年組(middle)平均年齡42.6歲,范圍為31~53歲;老年組(old)平均年齡61.3歲,范圍為54~79歲。并且,表中數(shù)據(jù)顯示任意組別間關于年齡的雙樣本t校驗值(P-value)顯示各組年齡在統(tǒng)計學上存在明顯差異。
針對上述所有樣本的原始掃描數(shù)據(jù)。本文使用SPM8(Statistical Parametric Mapping)對數(shù)據(jù)進行預處理,以去除原始掃描數(shù)據(jù)中的干擾因素,具體處理包括:時間片校正、頭動校正、空間標準化、平滑處理和濾波,最終得到用于構建腦功能網(wǎng)絡的標準圖像數(shù)據(jù)。
4.2?腦功能網(wǎng)絡構建
利用4.1節(jié)處理后的fMRI圖像數(shù)據(jù)來構建腦功能網(wǎng)絡,構建過程如圖2所示。
具體包括如下工作:1)定義節(jié)點。使用國際上通用的標準腦區(qū)模板——AAL模板對大腦進行區(qū)域分割,每個區(qū)域表示網(wǎng)絡中的一個節(jié)點。在這里,AAL模板將大腦劃分為90個感興趣的腦功能區(qū)域(Regions Of Interest, ROI),即網(wǎng)絡共有90個節(jié)點[24]。值得注意的是,AAL模板對腦區(qū)劃分所采用的方法是通過計算每個腦區(qū)所包含的所有體素的血氧水平依賴(Blood Oxygen Level Dependent, BOLD)信號大小,并取其算術平均值來表示一個ROI,即腦區(qū)。
2)獲取腦區(qū)間相關矩陣。完成第1)步后,將原始圖像數(shù)據(jù)劃分為90個不同腦區(qū),同時抽取每個腦區(qū)中包含的不同皮層的時間序列進行全局信號線性回歸分析。事實上,由4.1節(jié)得到的fMRI圖像數(shù)據(jù)是利用儀器對大腦皮層區(qū)域進行切分掃描獲得的有效時間序列。最后利用回歸分析得到的平均時間序列計算腦區(qū)彼此間的皮爾森相關系數(shù),得到腦區(qū)間相關矩陣A,即90×90的矩陣。相關系數(shù)的計算如式(16)所示:
3)確定連邊。依據(jù)表1,選取任意一個年齡組中的單個樣本對象。例如,選取young中的單個對象y1,利用第2)步得到y(tǒng)1對應的腦區(qū)相關矩陣A。而后,對于矩陣A中的任意元素取值大于0.5的約占20%,而網(wǎng)絡整體的邊數(shù)不宜過多或者過少,否則不便于建模分析。因此,實驗中將對象y1對應的矩陣A中的閾值設置為0.5,最后發(fā)現(xiàn)網(wǎng)絡演化效果最好。此外,如果A中的某個元素大于0.5,其值設為1;否則為0。值為1則表示對應的節(jié)點間存在連邊。由此得到對稱的只包含0和1元素的二元鄰接矩陣B,B即代表對象y1所對應的腦功能網(wǎng)絡。
利用上述分析與處理,分別對young、middle和old中所有的樣本對象構建對應的腦功能網(wǎng)絡集合,即為真實網(wǎng)絡Young、Middle和Old。
4.3?模型性能評價指標
為了衡量模擬網(wǎng)絡與真實網(wǎng)絡間的匹配程度,實驗中選取了復雜網(wǎng)絡理論中最重要的6個拓撲屬性作為評價指標,包括:1)聚類系數(shù)(clustering coefficient),指某個節(jié)點的所有鄰居節(jié)點間實際存在連邊的數(shù)目與理論上存在的最多連邊數(shù)之間的比值,而網(wǎng)絡的聚類系數(shù)是網(wǎng)絡中所有節(jié)點聚類系數(shù)的平均值。Sala-Llonch等[8]利用復雜網(wǎng)絡理論知識研究了不同年齡段的人群的腦功能網(wǎng)絡的拓撲結(jié)構變化,結(jié)果發(fā)現(xiàn)網(wǎng)絡的聚類系數(shù)隨著年齡增加發(fā)生著動態(tài)變化。
2)全局效益(global efficiency),能夠衡量網(wǎng)絡的并行信息傳輸能力,是對網(wǎng)絡整體信息傳輸效率的描述。相關研究已經(jīng)系統(tǒng)分析了腦功能網(wǎng)絡的結(jié)構變化與全局效益有關[25]。
3)局部效益(local efficiency),能夠衡量信息如何通過相鄰節(jié)點進行高效傳播,進而影響網(wǎng)絡局部的信息傳輸效率。
4)特征路徑長度(characteristic path length),是復雜網(wǎng)絡中的重要屬性指標,刻畫了網(wǎng)絡中某一節(jié)點信息到達另一節(jié)點的最優(yōu)路徑,影響網(wǎng)絡的拓撲結(jié)構[26]。
5)模塊度(modularity),是一種衡量網(wǎng)絡社區(qū)結(jié)構強度的指標,體現(xiàn)網(wǎng)絡功能的區(qū)域自治性,是描述腦功能網(wǎng)絡的一個重要指標[8,15]。
6)度(degree),是對節(jié)點的重要程度描述,反映了網(wǎng)絡中所有節(jié)點連邊的總體情況。此外,度分布(degree distribution)是網(wǎng)絡最基本的一個拓撲性質(zhì),它是對網(wǎng)絡中所有節(jié)點度值的概率統(tǒng)計。研究證實度分布曲線滿足冪律分布,說明高度節(jié)點更有可能形成額外的連邊[27]。
本文選取上述六種屬性以及網(wǎng)絡中的連邊數(shù)目(edge number)屬性作為評價演化模型是否有效的依據(jù)。
同時,本文綜合考慮了各個拓撲屬性指標之間的雙樣本t檢驗值取值大小,提出了網(wǎng)絡相似指標(SI)值。
其中:PGlob表示模擬網(wǎng)絡與真實網(wǎng)絡關于全局效益的雙樣本t檢驗值;同樣地,PC、PEdge、PQ、PEloc和PLen分別表示模擬網(wǎng)絡與真實網(wǎng)絡關于聚類系數(shù)、連邊數(shù)、模塊度、局部效益和特征路徑長度的雙樣本t檢驗值。
對于不同的網(wǎng)絡來說,以上幾種屬性校驗值存在顯著差異,因此不能簡單地憑借單個屬性的好壞來對模型的模擬有效性進行量化分析。而式(17)將所有的網(wǎng)絡屬性同等對待,由此表明不同的網(wǎng)絡屬性對于SI值的影響作用是一樣的,是對網(wǎng)絡的整體進行有效描述。因此,若一個或多個屬性的校驗值越大,SI值越大,相應表明兩個網(wǎng)絡之間越相似。
需要注意的地方是,由于使用NBM和CNM得到的模擬網(wǎng)絡與對應真實網(wǎng)絡間關于度的雙樣本t檢驗結(jié)果完全一樣,實驗中沒有將網(wǎng)絡的度屬性應用于式(17),而是通過利用累積度分布(cumulative distribution)和雙樣本柯爾莫哥洛夫斯摩洛夫(Kolmogorov Smirnov, KS)校驗給出相應的研究與分析。
4.4?真實網(wǎng)絡拓撲屬性分析
表2反映出真實網(wǎng)絡彼此之間關于6種拓撲屬性,即:特征路徑長度Len、全局效率Eglob、平均聚類系數(shù)Cc、模塊度Q、連邊數(shù)Enum和局部效益Eloc,并在此基礎上得到的網(wǎng)絡相似指標SI值。從表2可看出,Young和Old之間在每個網(wǎng)絡屬性上均有顯著性差異(P<0.05),例如聚類系數(shù)(0.0049)和特征路徑長度(0.0036);并且Young和Old之間的SI值最?。?.0445),由此說明人衰老過程中,腦功能網(wǎng)絡的拓撲屬性發(fā)生了明顯變化。另外,Middle和Young的連邊數(shù)(0.0028)以及Middle和Old的特征路徑長度(0.0218)等屬性校驗值均顯示真實網(wǎng)絡彼此之間存在差異,同時發(fā)現(xiàn)Middle和Young間的SI值最大(1.0128),表明兩者網(wǎng)絡間的差異相對較小。
為了進一步分析各拓撲屬性與年齡之間的關系,對每個屬性值和年齡之間進行回歸分析,如圖3所示。各子圖的曲線反映網(wǎng)絡中的屬性值與年齡皆線性相關。除了圖3(e)、(f)中的模塊度和特征路徑長度與年齡負相關以外,其他屬性與年齡正相關。此外,所有屬性值大小都僅在一定取值范圍之內(nèi)發(fā)生變化。結(jié)合以上論述,可以證實腦功能網(wǎng)絡的拓撲結(jié)構隨著年齡變化的確會產(chǎn)生相應的動態(tài)改變。
4.5?NBM和CNM性能對比
表3給出了CNM模擬網(wǎng)絡(C-Mid、C-Old)和NBM模擬網(wǎng)絡(N-Mid、N-Old)分別與真實網(wǎng)絡(Young、Middle、Old)之間的網(wǎng)絡相似指標SI值。當初始網(wǎng)絡(Young)演化到中年時期時,N-Mid、C-Mid與Young之間關于全局效益、聚類系數(shù)等五種拓撲屬性存在顯著性差異(P<0.05)。隨著網(wǎng)絡演化過程的推進,C-Old、N-Old與Young間所有屬性皆表現(xiàn)出更明顯的差異,并且網(wǎng)絡間的SI值為0.0019和0.0034。由此說明,實驗的演化操作確實會讓腦功能網(wǎng)絡的拓撲結(jié)構發(fā)生變化。
另外,C-Mid、N-Mid和Middle之間的6種拓撲屬性沒有觀察到顯著差異,屬性校驗值均大于0.15;并且,N-Old、C-Old和Old之間除聚類系數(shù)以外其余網(wǎng)絡屬性均未發(fā)現(xiàn)明顯差異。綜合分析表3的結(jié)果,可以有效驗證NBM和CNM能夠在多個拓撲屬性上對真實網(wǎng)絡進行模擬。
本文定義,利用NBM演化得到中年及老年時期時的模擬網(wǎng)絡稱為實驗組(N-Mid、N-Old);利用CNM演化得到的模擬網(wǎng)絡稱為對照組(C-Mid、C-Old)。此外,對比表3中實驗組(N-Mid、N-Old)和對照組(C-Mid、C-Old)的所有屬性校驗值,可以發(fā)現(xiàn)N-Mid和N-Old的網(wǎng)絡屬性校驗值更高。具體的,實驗組與對應真實網(wǎng)絡(Middle、Old)間的模塊度屬性校驗值為0.8346和0.5624,均高于對照組(0.7246, 0.4046)。同樣,觀察全局效益、聚類系數(shù)以及特征路徑長度等屬性皆有著相同的結(jié)論。并且,網(wǎng)絡相似性SI值的結(jié)果顯示,N-Mid與Middle間SI值為4.4794,高于C-Mid與Middle間的SI值(4.1004);同樣,N-Old與Old間的SI值為3.4021,也要更高于C-Old與Old間的SI值(3.0132)。由此證實實驗組可以更為確切地反映腦功能網(wǎng)絡拓撲屬性變化,說明NBM比CNM模擬性能更好,進而驗證了NB算法通過量化分析單個節(jié)點對拓撲結(jié)構相似性的影響,確實對CN算法作了有效改進。
4.6?NBM模擬網(wǎng)絡屬性分析
為了研究NBM模擬網(wǎng)絡的有效性,對比分析了模擬網(wǎng)絡(N-Mid、N-Old)與真實網(wǎng)絡(Young、Middle、Old)的6種拓撲屬性值,結(jié)果如圖4所示。從圖4中的真實網(wǎng)絡屬性圖像可發(fā)現(xiàn),從Young到Old間的屬性值呈階段性上升或下降趨勢,這與圖3結(jié)果相對應。此外,根據(jù)文中的網(wǎng)絡演化算法,當Young演化到中年時期時,盒式圖中的N-Mid所有的網(wǎng)絡屬性值與Middle非常接近,尤其是全局效益和特征路徑長度。而后,隨著Young演化到老年時期,N-Old中除了圖4(b)中的聚類系數(shù)以外,其余子圖的屬性,具體包括局部效益、連邊數(shù)、局部效益、模塊度以及特征路徑長度,它們的取值范圍皆達到Old的整體表現(xiàn)。結(jié)合上述分析,可以充分說明NBM模擬網(wǎng)絡能夠準確地預測多個拓撲屬性值,即NBM能夠?qū)ABFN的拓撲結(jié)構變化過程實現(xiàn)有效模擬。
另外,對比圖4中實驗組(N-Mid、N-Old)和對照組(C-Mid、C-Old)的拓撲屬性值可看出,圖4(e)和4(f)中N-Mid和N-Old的模塊度和特征路徑長度屬性值更加接近Middle和Old,這與表3的結(jié)果相一致。說明由NBM得到的模擬網(wǎng)絡(N-Mid、N-Old)能夠更接近對應的真實網(wǎng)絡。
4.7?不同網(wǎng)絡演化算法對比
通過實現(xiàn)隨機網(wǎng)絡演化算法的具體步驟,最終得到對應的模擬網(wǎng)絡,記為Random模擬網(wǎng)絡(R-Mid、 R-Old),將其與真實網(wǎng)絡(Young、Middle、Old)關于6種拓撲屬性進行比較,結(jié)果如圖5所示。與此同時,對于各網(wǎng)絡拓撲屬性執(zhí)行雙樣本t檢驗操作,具體檢驗結(jié)果在表4中顯示。觀察表3~4中的SI值大小,發(fā)現(xiàn)Random模擬網(wǎng)絡與對應真實網(wǎng)絡(Middle、Old)的SI值(1.8920, 1.5912)均低于對應NBM模擬網(wǎng)絡的SI值(4.4794, 3.4021)以及CNM模擬網(wǎng)絡的SI值(4.1004, 3.0132)。此外,對比圖5(f)與圖4(f)可看出,圖5(f)中R-Mid、R-Old與對應的Middle、Old之間關于特征路徑長度屬性存在明顯差異;并且,兩者的校驗值(0.0152, 0.0051)均小于0.05也可充分證實該觀點。相反地,對于圖4(f)中NBM模擬網(wǎng)絡(N-Mid、N-Old)卻有著良好的預測效果。同樣地,對比圖5(a)與圖4(a)、圖5(d)與圖4(d),也能看出全局效益和局部效益存在明顯差異。綜合上述分析,說明本文所提的網(wǎng)絡演化算法的模擬性能優(yōu)于隨機網(wǎng)絡演化算法。雖然前者的時間復雜度要高于后者的時間復雜度O(N)但是小于O(N2),在這里,N表示網(wǎng)絡節(jié)點數(shù)目(N=90)。但是,若以時間換取算法預測的準確性,可以明顯看出前者的準確性更高,并且算法整體的執(zhí)行時間仍然在可接受的范圍內(nèi)(沒有超過O(N2))。
4.8?節(jié)點度分布
為了直觀地反映出從Young到Old演化過程中NBM、CNM和Random模擬網(wǎng)絡(N-Old、C-Old、R-Old)的度屬性隨年齡的變化情況,使用節(jié)點累積度分布的對數(shù)形式予以分析,如圖6所示。
結(jié)果發(fā)現(xiàn),網(wǎng)絡的節(jié)點度分布滿足冪律分布,這與Viol等[27]的研究結(jié)果相符合。
此外,從圖6中N-Old和C-Old的擬合曲線可看出,N-Old與Old間的擬合曲線更加接近。
利用KS校驗Old與N-Old間的平均度,發(fā)現(xiàn)校驗值證實兩者之間沒有明顯差異(P=0.6648),且該值高于CNM模擬網(wǎng)絡的校驗值(0.3574)。由此驗證,N-Old與Old之間的度分布更為接近,即整體的節(jié)點連邊情況相近似。說明與C-Old相比,N-Old能夠更為準確地模擬出NABFN節(jié)點連邊的整體變化趨勢。此外,觀察N-Old、C-Old與R-Old三者的擬合曲線, 可看出N-Old、Old顯然更接近于Old,由此說明文中所提算法比隨機網(wǎng)絡演化算法模擬性能更優(yōu)。
5?結(jié)語
本文基于樸素貝葉斯(NB)的鏈路預測算法和解剖距離提出一種網(wǎng)絡演化模型(NBM)來發(fā)掘NABFN節(jié)點連邊的變化規(guī)律,并對該變化進行模擬。研究首先發(fā)現(xiàn)了真實網(wǎng)絡的拓撲屬性與年齡線性相關的規(guī)律。而后,NBM利用網(wǎng)絡演化算法逐步得到中年及老年時期的模擬網(wǎng)絡。最后,模擬網(wǎng)絡與對應真實網(wǎng)絡間關于聚類系數(shù)、模塊度等七種拓撲屬性的校驗結(jié)果表明,NBM與CNM相比,能夠更為精確地模擬NABFN拓撲結(jié)構的變化過程。同時,實驗結(jié)果也證實所提算法的模擬效果比隨機網(wǎng)絡演化算法更好。這一研究成果為解決傳統(tǒng)研究技術在大尺度時間范圍內(nèi)無法預測腦網(wǎng)動態(tài)結(jié)構變化的問題,提供了一個通過網(wǎng)絡建模的分析視角來模擬這一變化過程,為將來人類探索人腦的正常衰老機制與認知能力的關系提供了重要的理論依據(jù)。然而,本文還有需要改進和完善的地方。真實的人腦功能區(qū)域連接會隨著年齡變化發(fā)生丟失,而實驗中僅通過持續(xù)地向網(wǎng)絡中添加節(jié)點連邊來模擬NABFN的拓撲結(jié)構變化。因此,未來的研究可以考慮同時添加和去除定量的節(jié)點間的連邊來實現(xiàn)更好的模擬效果。
參考文獻(References)
[1] BASSETT D S, SPORNS O. Network neuroscience [J]. Nature Neuroscience, 2017, 20(3): 353.
[2] TATE M C, HERBET G, MOTITZ-GASSER S, et al. Probabilistic map of critical functional regions of the human cerebral cortex: Brocas area revisited [J]. Brain, 2014, 137(10): 2773-2782.
[3] SIMAN-TOV T, BOSAK N, SPRECHER E, et al. Early age-related functional connectivity decline in high-order cognitive networks [J]. Frontiers in Aging Neuroscience, 2017, 8: 330.
[4] ZHUANG J, MADDEN D J, DUONG-FERNANDEZ X, et al. Language processing in age-related macular degeneration associated with unique functional connectivity signatures in the right hemisphere [J]. Neurobiology of Aging, 2018, 63: 65-74.
[5] CABEZA R, ALBERT M, BELLEVILLE S, et al. Maintenance, reserve and compensation: the cognitive neuroscience of healthy ageing [J]. Nature Reviews Neuroscience, 2018: 19: 701-710.
[6] HOFFMAN P, MORCOM A M. Age-related changes in the neural networks supporting semantic cognition: a meta-analysis of 47 functional neuroimaging studies [J]. Neuroscience & Biobehavioral Reviews, 2018, 84: 134-150.
[7] TAYLOR J R, WILLIAMS N, CUSACK R, et al. The Cambridge Centre for Ageing and Neuroscience (Cam-CAN) data repository: structural and functional MRI, MEG, and cognitive data from a cross-sectional adult lifespan sample [J]. NeuroImage, 2017, 144: 262-269.
[8] SALA-LLONCH R, JUNQUE C, ARENAZA-URQUIJO E M, et al. Changes in whole-brain functional networks and memory performance in aging [J]. Neurobiology of Aging, 2014, 35(10): 2193-2202.
[9] GEERLIGS L, RENKEN R J, SALIASI E, et al. A brain-wide study of age-related changes in functional connectivity [J]. Cerebral Cortex, 2014, 25(7): 1987-1999.
[10] CAO M, WANG J H, DAI Z J, et al. Topological organization of the human brain functional connectome across the lifespan [J]. Developmental Cognitive Neuroscience, 2014, 7: 76-93.
[11] SHAKIBIAN H, CHARKARI N M. Mutual information model for link prediction in heterogeneous complex networks [J]. Scientific Reports, 2017, 7: 44981.
[12] WU J, ZHANG G, REN Y. A balanced modularity maximization link prediction model in social networks [J]. Information Processing & Management, 2017, 53(1): 295-307.
[13] KAISER M, HILGETAG C C. Modelling the development of cortical networks [J]. Neurocomputing, 2004, 58(3): 297-302.
[14] CANNISTRACI C V, ALANIS-LOBATO G, RAVASI T. From link-prediction in brain connectomes and protein interactomes to the local-community-paradigm in complex networks [J]. Scientific Reports, 2013, 3: 1613.
[15] 王艷群, 李海芳, 郭浩, 等.靜息態(tài)腦功能網(wǎng)絡的社團結(jié)構研究[J]. 計算機應用, 2012, 32(7): 2044-2048. (WANG Y Q, LI H F, GUO H, et al. Research into community structure of resting-state brain functional network [J]. Journal of Computer Applications, 2012, 32(7): 2044-2048.)
[16] YANG Y L, GUO H, TIAN T, et al. Link prediction in brain networks based on a hierarchical random graph model [J]. Tsinghua Science and Technology, 2015, 20(3): 306-315.
[17] LI Y P, QIN Y, CHEN X, et al. Exploring the functional brain network of Alzheimers disease: based on the computational experiment [J]. PLoS One, 2013, 8(9): e73186.
[18] SULAIMANY S, KHANSARI M, ZARRINEH P, et al. Predicting brain network changes in Alzheimers disease with link prediction algorithms [J]. Molecular BioSystems, 2017, 13(4): 725-735.
[19] VERTES P E, ALEXANDER-BLOCH A F, GOGTAY N, et al. Simple models of human brain functional networks [J]. Proceedings of the National Academy of Sciences, 2012, 109(15): 5868-5873.
[20] BETZEL R F, AVENA-KOENIGSBERGER A, GONI J, et al. Generative models of the human connectome [J]. NeuroImage, 2016, 124: 1054-1064.
[21] VALVERDE-REBAZA J, VALEIO A, BERTON L, et al. A Nave Bayes model based on overlapping groups for link prediction in online social networks [C]// Proceedings of the 30th Annual ACM Symposium on Applied Computing. New York: ACM, 2015: 1136-1141.
[22] HEIBERGER R H. Predicting economic growth with stock net-works [J]. Physica A: Statistical Mechanics and its Applications, 2018, 489: 102-111.
[23] WU J H, ZHANG G J, REN Y Z, et al. Weighted local Naive Bayes link prediction [J]. Journal of Information Processing Systems, 2017, 13(4): 914-927.
[24] TZOURIO-MAZOYER N, LANDEAU B, PAPATHANASSIOU D, et al. Automated anatomical labeling of activations in SPM using a macroscopic anatomical parcellation of the MNI MRI single-subject brain [J]. NeuroImage, 2002, 15(1): 273-289.
[25] PASQUALE F D, PENNA S D, SPORNS O, et al. A dynamic core network and global efficiency in the resting human brain [J]. Cerebral Cortex, 2016, 26(10): 4015-4033.
[26] PUETZ V B, PARKER D, KOHN N, et al. Altered brain network integrity after childhood maltreatment: a structural connectomic DTI-study [J]. Human Brain Mapping, 2017, 38(2): 855-868.
[27] VIOL A, PALHANO-FONTES F, ONIAS H, et al. Characterizing complex networks using entropy-degree diagrams: unveiling changes in functional brain connectivity induced by Ayahuasca [EB/OL]. [2018-09-30]. https://arxiv.org/pdf/1809.10301.