楊秋格,吳 鵬,孫旭光,陳丹琪
(1.防災科技學院災害信息工程系,河北廊坊065201;2.防災科技學院信息化管理中心,河北廊坊065201)
基于時間序列的災害區(qū)域關聯(lián)網(wǎng)絡構建方法*
楊秋格1,吳 鵬2,孫旭光1,陳丹琪1
(1.防災科技學院災害信息工程系,河北廊坊065201;2.防災科技學院信息化管理中心,河北廊坊065201)
針對災害地區(qū)相關性問題,提出一種災害區(qū)域關聯(lián)復雜網(wǎng)絡構建方法。首先利用冪級數(shù)展開得出網(wǎng)絡災害節(jié)點的系統(tǒng)動力學方程,通過節(jié)點關聯(lián)系數(shù)來表征節(jié)點間的區(qū)域關聯(lián)關系,并通過相關轉化使得可以利用壓縮感知理論對節(jié)點關聯(lián)系數(shù)進行求解,從而實現(xiàn)對網(wǎng)絡節(jié)點關系拓撲的構建。最后通過中國地震災害數(shù)據(jù)進行性能仿真實驗,實驗結果表明,完成網(wǎng)絡構建只需要較少量的時序信息,構建得出的區(qū)域關聯(lián)結果也具有一定的科學性。
災害;時間序列;壓縮感知;區(qū)域關聯(lián);復雜網(wǎng)絡
自然災害的區(qū)域關聯(lián)現(xiàn)象一直是災害學研究的熱點,大量觀察到的事實,如歷史記錄中某些災害(如地震)在部分地區(qū)會表現(xiàn)出一種同步衰漲趨勢,即同時趨于活躍或平靜[1],以及2005年及2007的蘇門答臘地震后,我國南方都隨之發(fā)生了雨澇災害,這表明了旱、洪、震等自然災害存在著一定的區(qū)域關聯(lián)性[2],而對其的研究則能夠為災害預測提供支持。
災害的時間序列是進行災害區(qū)域關聯(lián)研究的基本信息,通過對兩個地區(qū)的災害時間序列進行相似性匹配,從而確定兩者之間是否具有相關性,也是近年來災害區(qū)域關聯(lián)分析的常見方法[3-5]。由于這類方法每次只選取兩個區(qū)域進行相似性匹配(即單點對單點),因而在時間序列信息上會有大量的截取操作,而如果我們想以復雜網(wǎng)絡角度來研究多個區(qū)域間的災害相關性(即多點對多點),由于多個點間同步影響會形成一個復雜系統(tǒng),就使得這種單點匹配得到的區(qū)域相關性難以作為節(jié)點鏈接來構建災害區(qū)域關聯(lián)復雜網(wǎng)絡。
如何基于各區(qū)域的災害時序信息,挖掘出潛在的關聯(lián)關系并重構成網(wǎng)絡,是本文所要解決的問題。事實上,復雜網(wǎng)絡重構正逐漸成為復雜網(wǎng)絡研究的熱點問題,已提出的重構方法如逆向工程法[6]、微擾響應法[7]、收斂鏡像系統(tǒng)法[8],以及基于噪聲的相關性方法等[9],其基本思想都是通過個體單元行為來推導網(wǎng)絡拓撲,但都或多或少存在著運算成本過大的問題。文獻[10-12]中則針對這一問題,提出一種基于壓縮感知的復雜網(wǎng)絡重構方法,能夠以相對于網(wǎng)絡規(guī)模很少量的數(shù)據(jù)實現(xiàn)拓撲重構,并對非線性系統(tǒng)及博弈網(wǎng)絡等進行了重構嘗試,取得不錯的效果。
本文則借鑒壓縮感知思想,基于災害的時間序列信息,將災害區(qū)域視為復雜網(wǎng)絡節(jié)點,通過構建出節(jié)點的復雜系統(tǒng)動力學方程,進而確定節(jié)點間的拓撲關系,從而構建出一個災害區(qū)域關聯(lián)復雜網(wǎng)絡。在后面的實驗中我們會看到,只需要少量的時序信息,本文方法就可以完成對網(wǎng)絡的構建工作。
作為一種新的信息獲取理論,壓縮感知技術主要基于可壓縮信號的稀疏性,并滿足在遠小于Nyquist采樣率的情況下,實現(xiàn)對信號的精確重建。壓縮感知技術的主要優(yōu)勢在于能夠只基于少量觀測數(shù)據(jù)S(S∈RM)就實現(xiàn)對稀疏向量a(a∈RN)的高效恢復,并滿足S=D·a,其中D是一個M*N維滿秩矩陣,而信號重建過程即為對以下凸優(yōu)化問題進行求解,如式(1)所示。
由于當a為稀疏向量并使得D滿足式(1)時,利用壓縮感知技術可以在M遠小于N的情況下,準確恢復出a。而鑒于復雜網(wǎng)絡本身表現(xiàn)出的稀疏性,保證了向量a的稀疏性,那么只要把復雜網(wǎng)絡重構問題轉化成壓縮感知理論能夠處理的形式,就可以利用這一方法基于少量的時序信息準確重構網(wǎng)絡拓撲。
對于災害區(qū)域關聯(lián)網(wǎng)絡,由于各個區(qū)域節(jié)點的災害信息是可以獲取的,而具體災害結果的造成除了受區(qū)域自身各種因素的影響,還類似于振子網(wǎng)絡,同時受到其他多個區(qū)域多種因素的復合作用。因此本文希望能夠用少量的相關時序信息,從多節(jié)點復合影響的角度,推演出各個節(jié)點間的關聯(lián)情況,進而構建出整個網(wǎng)絡拓撲。
設災害區(qū)域關聯(lián)復雜網(wǎng)絡中節(jié)點個數(shù)為n,第i個節(jié)點在某一時刻(如時刻t)的時序信息被劃分為兩部分,第一部分設為si,表示在時刻t該區(qū)域觀測到的受災結果,第二部分設為xi,這是一個觀測參數(shù)向量,包含了在時刻t與該區(qū)域相關的孕災環(huán)境參數(shù)分量,如氣壓、氣溫、降水、位移場、地應力場等,設該向量的維數(shù)為m。那么節(jié)點i的災害復雜系統(tǒng)動力學方程可以用式(2)表示。
式中:fi(xi)為節(jié)點i獨自的災害動力學方程,式(2)后半部分則為節(jié)點i與其他節(jié)點間的關系動力學方程,兩者共同組成節(jié)點i的系統(tǒng)動力學方程;Gij表示節(jié)點i和節(jié)點j間的觀測參數(shù)向量關聯(lián)矩陣,如式(3)所示。
對于式(2),我們還可以用式(4)的方式表示
那么式(4)的前半部分就變?yōu)橹魂P于xi的方程,后半部分則是關于其他節(jié)點觀測向量的方程。此時我們可以將式(4)的前半部分用Qi(xi)表示,并使用一個N階冪級數(shù)將Qi(xi)展開,如式(5)所示。
式中:(xi)1表示節(jié)點i的觀測向量的第1個分量,(ai)k表示第k個展開項的系數(shù),需要注意的是式(5)涵蓋了該階冪級數(shù)下所有可能的展開項,即展開項數(shù)目為(1+N)m,這意味著許多展開項前的系數(shù)可能為0。
此時,式(4)又可以表示如式(6)所示。
從式(6)可以看到,在節(jié)點時序信息已知的情況下,未知的即為Qi(xi)中的展開項系數(shù)以及關聯(lián)矩陣Gij,同時,為了盡可能地從少量時序信息中構建出網(wǎng)絡拓撲,依據(jù)壓縮感知理論的稀疏性需求,即滿足大部分系數(shù)為零的條件,我們把式(6)中的Gijxj同樣按照式(5)的方式展開,那么式(6)又可以表示如式(7)所示。
式(7)的好處在于,它不僅滿足了壓縮感知理論對稀疏性的需求,同時體現(xiàn)出了節(jié)點i與其他節(jié)點的關聯(lián)性,如果求出Qj(xj)的系數(shù)全為零,那么就表示節(jié)點i與節(jié)點j沒有區(qū)域關聯(lián)性,反之如果存在不為零的系數(shù),就表示兩者具有區(qū)域關聯(lián)性,同時還能通過分析非零系數(shù)所對應的觀察向量的分量,進一步研究各個參數(shù)對災害區(qū)域關聯(lián)的影響力。
對于式(7)中各個Q(x)函數(shù),如以求解Qi(xi)為例,即式(5)。設展開項的各個系數(shù)用向量ai表示,由于是按照冪級數(shù)展開,因此展開形式是固定的,如在級數(shù)N=3,m=3的情況下,Qi(xi)的展開如式(8)所示。
式中:b,y,z為向量xi的3個分量。系數(shù)向量ai即為ai=[(ai)000,(ai)001,…,(ai)333]T,同時,對于某一時刻t下的觀測向量xi(t),我們可以得到式(9)。
此時Qi[xi(t)]=di(t)·ai,如果我們記錄有關于節(jié)點i的L個時刻的時間序列信息,那么就可以設觀測結果向量為S,即S=[si(t1),si(t2),…,si(tL)]T,從而可以得出符合壓縮感知理論的S=D·a形式的等式,如式(10)所示。
式中:S及di(t)都能夠通過已有的時序信息求得,同時由于滿足了壓縮感知的稀疏性,使得算法可以在時序信息量L遠小于網(wǎng)絡節(jié)點規(guī)模n的情況下求出各系數(shù)向量a,進而構建出網(wǎng)絡拓撲。
由于災害預測研究自身的特點,使得對災害區(qū)域關聯(lián)網(wǎng)絡的有效性驗證缺乏絕對參照。針對這一問題,我們選擇用具帶狀分布特點的地震災害來評估本文方法的性能。我國地域內共計有23條地震帶,根據(jù)這些地震帶的分布又可以劃分為以下五個主要地震地區(qū):臺灣省及其附近海域;西南地區(qū);西北地區(qū);華北地區(qū);東南沿海的廣東、福建等地。本文從這5個地區(qū)中選取共計60個城市作為網(wǎng)絡節(jié)點(除華北地區(qū)由于城市密集選取20個外,其他地區(qū)皆為各選取10個城市),時序數(shù)據(jù)資料來源于歷史災害數(shù)據(jù)庫,包括從1965年到2004年共計40年各個城市的地震受災情況及相關孕災環(huán)境參數(shù),即n=60,L=40。
實驗平臺為Matlab 7.0。在參數(shù)設置上,冪級數(shù)階數(shù)N=3,并根據(jù)專家建議選擇了6項參數(shù)作為地震關聯(lián)參數(shù),即觀測向量的維數(shù)m=6,觀測結果則根據(jù)當年有無4級以上地震(含余震)記為1或0。由于地質特點,同一地震帶上的節(jié)點本身就具備一定的關聯(lián)性,即每一個地震帶可以認為是一個社團,其內部節(jié)點具有較高的連接率。根據(jù)這一特性,可以從一定程度上檢驗出本文算法所建立網(wǎng)絡的科學性。
圖1為根據(jù)算法運行結果并利用pajek軟件做出的網(wǎng)絡拓撲圖,網(wǎng)絡的平均度為3.20,圖中出現(xiàn)了6個孤立節(jié)點,度最大節(jié)點為14號節(jié)點,度為8,對應城市為中國臺北市。
表1所示為根據(jù)節(jié)點關系拓撲,將節(jié)點鏈接映射到節(jié)點所對應地震帶的連接率統(tǒng)計結果,若本文算法有效,那么首先屬于同一地震帶的節(jié)點間會有較高的連接率。連接率的計算方法為地震帶內節(jié)點的實際鏈接數(shù)除以節(jié)點全連接數(shù)。
表1 各地震帶節(jié)點連接率
圖1 地震區(qū)域關聯(lián)網(wǎng)絡拓撲圖
從表1可以看到,本文算法建立的網(wǎng)絡拓撲中,地震帶內節(jié)點的連接率是符合期望的,這說明圖1中的網(wǎng)絡拓撲具備了一定的科學性,而對于地震帶間出現(xiàn)的節(jié)點鏈接,由于缺乏有效驗證方法,因而更適合作為線索信息來對災害區(qū)域關聯(lián)網(wǎng)絡進行分析。這里,通過對pajek拓撲圖的節(jié)點對應區(qū)域進行分析,我們發(fā)現(xiàn)臺灣-四川,四川-云南,青海-西藏這些區(qū)域內的節(jié)點連接十分密集,其中臺灣和四川分屬不同的地震區(qū),兩者間表現(xiàn)出的關聯(lián)性值得進一步關注。
為了進一步確認本文算法對時序信息量的低需求。我們用根據(jù)初始時序數(shù)據(jù)(即L=40)構建的網(wǎng)絡拓撲(圖1)作為參照,逐漸減少算法使用的時序信息量,觀察算法所建立的網(wǎng)絡是否能夠和圖1拓撲保持一致。為了不失一般性,算法分別在每種數(shù)據(jù)比例下進行5次網(wǎng)絡構建,時序信息為隨機抽取,最后統(tǒng)計與圖1拓撲匹配度的平均值。
圖2和圖3中給出了在不同時序信息量下,所求得網(wǎng)絡與圖1網(wǎng)絡的連接匹配度。圖中橫坐標表示所用數(shù)據(jù)占原數(shù)據(jù)量的比例,我們用了兩種參數(shù)進行評估,分別為節(jié)點間的非空鏈接和空鏈接。圖2中縱坐標表示錯誤鏈接占所求得鏈接的比率,圖3中縱坐標表示求得正確鏈接占實際鏈接的比率。
圖2 不同數(shù)據(jù)量下的錯連率
圖3 不同數(shù)據(jù)量下的正確連接率
從圖2和圖3中可以看到,算法只需要使用60%左右的原時間序列數(shù)據(jù)量,就可以得出與圖1一致的網(wǎng)絡拓撲,即實現(xiàn)對圖1網(wǎng)絡的準確構建。這同時也表明,在保證一定數(shù)據(jù)量的情況下,算法得出的網(wǎng)絡拓撲結果是比較穩(wěn)定的。
本文基于壓縮感知理論,嘗試利用少量時間序列信息實現(xiàn)對災害區(qū)域關聯(lián)復雜網(wǎng)絡的構建,并取得了一定效果??赡苡捎谒鶚嫿ňW(wǎng)絡節(jié)點較少的原因,本文實驗中所需的數(shù)據(jù)量尚未達到遠小于網(wǎng)絡規(guī)模的程度。下一步工作將對求得節(jié)點動力學方程中的各系數(shù)及非零項進行分析,以期能進一步探討災害區(qū)域關聯(lián)網(wǎng)絡的演化問題。
[1] 門可佩.重大地震災害鏈的時空有序性及其預測研究[J].地球物理學進展,2008,22(2):645-651.
[2] 延軍平,白晶,蘇坤慧,等.對稱性與部分重大自然災害趨勢研究[J].地理研究,2011,30(7):1159-1168.
[3] 邱劍鋒,謝娟,李煒,等.中強地震的相關性與周期性研究[J].計算機工程,2011,37(10):16-18.
[4] 吳明輝,許愛強,周小程,等.基于時間序列分析的動調陀螺儀故障預測研究[J].計算機測量與控制,2014,22(2):321-324.
[5] 吳紹春,吳耿鋒,王煒,等.尋找地震相關地區(qū)的時間序列相似性匹配算法[J].軟件學報,2006,17(2):185-192.
[6] 盛光磊,甄姬娜.一種網(wǎng)絡信道拓撲結構堅韌度的測量方法研究[J].科技通報,2014,29(02):152-154.
[7] GardnerA T S,d Bernardo D,Lorenz D,et al.Inferring genetic networks and identifying compound mode of action via expression profiling[J].Science,2003,301(5629):102-105.
[8] Bongard J,Lipson H.Automated reverse engineering of nonlinear dynamical systems[J].Proc Natl Acad Sci USA,2007,104(24):9943-9948.
[9] Timme M.Revealing network connectivity from response dynamics[J].Phys Rev Lett,2007,98(22):224101-1-4.
[10]Yu D,Righero M,Kocarev L.Estimating topology of networks[J].Phys Rev Lett,2006,97(18):188701-1-4.
[11]Wang W X,Yang R,Lai Y C,et al.Predicting catastrophes in nonlinear dynamical systems by compressive sensing[J].Phys Rev Lett,2011,106(15):154101-1-4.
[12]WangW X,Yang R,Lai Y C,etal.Time-series based prediction of complex oscillator networks via compressive sensing[J]. EPL,2011,94(4):48006-1-6.
Com plex Network Construction M ethod of Disaster Regional Association based on Time Series
Yang Qiuge1,Wu Peng2,Sun Xuguang1and Chen Danqi1
(1.Institute of Disaster Prevention,Disaster Information Engineering Department,Langfang 065201,China;2.Institute of Disaster Prevention,Information Management Center,Langfang 065201,China)
Aiming at the disaster regional-related issues,a complex network construction method of disaster regional association based on time series is proposed.The disaster system dynamic equations of network node are obtained through the use of power series expansion and the correlation coefficients between nodes are obtained through the use of compressed sensing theory,so as to realize the construction of the network topology.Experimental results show that,complete network construction requires less amount of time series information and the construction result has a certain rationality.
disaster;time series;compressive sensing;regional association;complex network
X43;TP18
A
1000-811X(2015)04-0021-04
10.3969/j.issn.1000-811X.2015.04.004
楊秋格,吳鵬,孫旭光,等.基于時間序列的災害區(qū)域關聯(lián)網(wǎng)絡構建方法[J].災害學,2015,30(4):21-24.[Yang Qiuge,Wu Peng,Sun Xuguang,etal.Complex Network Construction Method of Disaster Regional Association based on Time Series[J]. Journal of Catastrophology,2015,30(4):21-24.]
2015-04-13
2015-05-21
中央高校青年教師資助計劃項目(ZY20130213);中央高校創(chuàng)新團隊資助計劃項目(ZY20120104)
楊秋格(1981-),女,山東聊城人,碩士,講師,研究方向為物聯(lián)網(wǎng)技術.E-mail:yangqiuge0302@163.com