曾明 王二紅 趙明愿 孟慶浩
(天津大學(xué)電氣自動化與信息工程學(xué)院,機器人與自主系統(tǒng)研究所,天津市過程檢測與控制重點實驗室,天津 300072)
基于時間序列符號化模式表征的有向加權(quán)復(fù)雜網(wǎng)絡(luò)?
曾明?王二紅 趙明愿 孟慶浩
(天津大學(xué)電氣自動化與信息工程學(xué)院,機器人與自主系統(tǒng)研究所,天津市過程檢測與控制重點實驗室,天津 300072)
(2017年5月19日收到;2017年7月3日收到修改稿)
有向加權(quán)復(fù)雜網(wǎng)絡(luò),時間序列分析,可視圖建網(wǎng),Logistic系統(tǒng)
復(fù)雜網(wǎng)絡(luò)分析方法是把復(fù)雜系統(tǒng)內(nèi)部基元之間的關(guān)系抽象為網(wǎng)絡(luò)的節(jié)點和連邊形式,然后通過量化分析網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)特性及動力學(xué)行為,揭示復(fù)雜系統(tǒng)的內(nèi)在屬性及運行規(guī)律等重要信息.復(fù)雜網(wǎng)絡(luò)分析方法為不同類型的復(fù)雜系統(tǒng)(例如生物網(wǎng)絡(luò)、腦神經(jīng)網(wǎng)絡(luò)、萬維網(wǎng)、社交網(wǎng)絡(luò)等)研究提供全新且形式統(tǒng)一的視角,因此受到了不同學(xué)科科研人員的廣泛關(guān)注,并取得了一系列可喜的進(jìn)展[1?7].
近些年來,研究人員進(jìn)一步發(fā)現(xiàn)復(fù)雜網(wǎng)絡(luò)方法也非常適用于挖掘理論模型難以精確描述的復(fù)雜(非線性)時間序列的內(nèi)在重要信息[8?15].如何將時間序列映射為復(fù)雜網(wǎng)絡(luò)(即復(fù)雜網(wǎng)絡(luò)建網(wǎng))是時間序列復(fù)雜網(wǎng)絡(luò)分析系統(tǒng)中的關(guān)鍵環(huán)節(jié).目前,經(jīng)典的復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法有:基于偽周期時間序列劃分的建網(wǎng)方法[14]、基于相空間重構(gòu)建網(wǎng)方法[16?20]和可視圖建網(wǎng)方法[9,21?23].2006年Zhang和Small[14]最早提出了將一維時間序列轉(zhuǎn)換為復(fù)雜網(wǎng)絡(luò)的概念,并在此基礎(chǔ)上提出基于偽周期時間序列劃分的建網(wǎng)方法,該方法首先將原始時間序列按照局部極小值(或極大值)劃分為多個連續(xù)但不相交的周期子序列(這里的周期為偽周期,即每個周期長度近似相等),然后將每個周期定義為網(wǎng)絡(luò)的一個節(jié)點,最后通過計算周期間的相關(guān)系數(shù)或相空間距離大小確定網(wǎng)絡(luò)節(jié)點的連邊,從而將時間序列映射為復(fù)雜網(wǎng)絡(luò).基于相空間重構(gòu)建網(wǎng)方法是通過嵌入維數(shù)和延遲時間估算技術(shù)從原始時間序列中抽取一組多維向量作為復(fù)雜網(wǎng)絡(luò)的節(jié)點,然后依據(jù)向量之間的相似性確定網(wǎng)絡(luò)節(jié)點的連邊,從而構(gòu)造出原始時間序列對應(yīng)的復(fù)雜網(wǎng)絡(luò),該方法在嵌入維數(shù)和延遲時間估算過程中存在不穩(wěn)定因素,且連邊關(guān)系判斷的最佳閾值也很難確定,導(dǎo)致該方法應(yīng)用的魯棒性較差.可視圖建網(wǎng)方法是將原始時間序列中的數(shù)據(jù)點作為網(wǎng)絡(luò)的節(jié)點,數(shù)據(jù)點之間的可視關(guān)系作為網(wǎng)絡(luò)的連邊.相比相空間重構(gòu)建網(wǎng)方法,可視圖建網(wǎng)方法參數(shù)設(shè)置少、原理簡單、易于編程實現(xiàn).大量實驗測試表明,上述建網(wǎng)方法粗分不同類型時間序列信號(如周期信號、隨機信號、混沌信號、分形信號等)的結(jié)果較為滿意,但在同一類型信號的精細(xì)分析方面存在明顯不足.此外,以上兩種方法的網(wǎng)絡(luò)規(guī)模與原始時間序列的長度呈正相關(guān)關(guān)系,當(dāng)時間序列長度過長,導(dǎo)致網(wǎng)絡(luò)規(guī)模太大,普通計算機的計算能力無法滿足要求.不僅如此,分析序列長度受限問題在多數(shù)復(fù)雜網(wǎng)絡(luò)分析中普遍存在.
上面提到的建網(wǎng)方法構(gòu)建的是無權(quán)、無向復(fù)雜網(wǎng)絡(luò).這類網(wǎng)絡(luò)中各基元之間關(guān)系非常簡單,如果有關(guān)聯(lián),兩基元之間存在連邊,否則不存在連邊.但在很多實際復(fù)雜系統(tǒng)中,各基元之間的關(guān)聯(lián)存在程度上的差異,因此不能簡單地用“0”或“1”表示.此外,很多基元之間關(guān)聯(lián)還存在方向性,例如基元A可以影響基元B,但基元B可能對基元A的狀態(tài)沒有影響,即基元A對基元B具有單向傳遞性.由此看出,無權(quán)、無向復(fù)雜網(wǎng)絡(luò)無法精確反映網(wǎng)絡(luò)節(jié)點(或基元)之間的關(guān)聯(lián)程度及方向性差異,導(dǎo)致其在信號精細(xì)分析方面存在明顯缺陷.在現(xiàn)實世界中經(jīng)常會遇到一類復(fù)雜信號(如風(fēng)場信號),這類信號的典型特點是其幅度呈現(xiàn)出跳躍式變化規(guī)律而非普通的漸變式變化.針對這類信號的特點,綜合考慮信號基元的關(guān)聯(lián)程度及方向性差異,本文提出了一種新的基于時間序列符號化結(jié)合滑窗技術(shù)模式表征的有向加權(quán)復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法.該方法首先依據(jù)跳變數(shù)據(jù)的等概率分布對時間序列進(jìn)行符號化處理.然后利用滑窗技術(shù)獲得有限個數(shù)的不同符號化模式確定網(wǎng)絡(luò)的節(jié)點.最后通過計算符號化模式的轉(zhuǎn)換頻次確定網(wǎng)絡(luò)權(quán)重,符號化模式的轉(zhuǎn)換方向確定節(jié)點間的連接方向,最終建立時間序列有向加權(quán)復(fù)雜網(wǎng)絡(luò).
本文方法的優(yōu)勢主要體現(xiàn)在如下三方面:1)對復(fù)雜跳變數(shù)據(jù)進(jìn)行符號化處理,可在保障分析精度的同時大大簡化信號分析的復(fù)雜度;2)通過不同符號化模式的轉(zhuǎn)換頻次和方向確定網(wǎng)絡(luò)權(quán)重和連接方向,更準(zhǔn)確地反映復(fù)雜系統(tǒng)內(nèi)部基元的關(guān)聯(lián)程度和方向性;3)由于采用有限的符號化模式作為網(wǎng)絡(luò)節(jié)點,因此本文方法受時間序列分析長度的影響小,可適用于大數(shù)據(jù)量時間序列分析.通過對經(jīng)典Logistic信號和自然風(fēng)場信號進(jìn)行測試,驗證了本文方法的可行性和先進(jìn)性.
可視圖復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法是Lacasa等[21]在2008年提出的,時間序列以直方條的形式描繪到坐標(biāo)軸上,直方條高度代表時間序列的數(shù)值大小(如圖1(a)所示),該方法將時間序列的每個數(shù)據(jù)點映射成復(fù)雜網(wǎng)絡(luò)中的節(jié)點,若兩個直方條末端處相連,且并沒有被其他直方條阻斷,即兩個節(jié)點可視,則這兩個直方條所對應(yīng)的網(wǎng)絡(luò)節(jié)點有連邊,通過對所有數(shù)據(jù)點做類似處理,從而確定各節(jié)點之間的網(wǎng)絡(luò)連接關(guān)系(見圖1(b)).
圖1 時間序列可視圖原理圖[21]Fig.1.A time series and the associated graph derived from the visibility algorithm.
大量實驗測試結(jié)果表明,可視圖建網(wǎng)方法對不同類型的信號具有較好的區(qū)分能力,例如周期時間序列利用可視圖建網(wǎng)方法將得到規(guī)則網(wǎng)絡(luò);隨機序列可映射為隨機網(wǎng)絡(luò);分形時間序列可映射為無標(biāo)度網(wǎng)絡(luò).
本文提出的新方法主要針對一類呈現(xiàn)跳躍式變化的復(fù)雜時間序列信號(例如自然風(fēng)場信號)進(jìn)行建網(wǎng)分析.由于信號具有跳躍式變化特點,所以進(jìn)行多區(qū)域分段劃分處理可保障對原始信號精度損失較小的前提下大大簡化分析信號的難度.為此,本文提出基于等概率符號化[24,25]結(jié)合滑窗技術(shù)模式表征的有向加權(quán)復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法.該方法首先將原始時間序列進(jìn)行Z標(biāo)準(zhǔn)化處理,處理后的時間序列滿足均值為0,方差為1的標(biāo)準(zhǔn)正態(tài)分布.然后,將其等概率劃分成若干區(qū)間,不同區(qū)間用不同的字符來表示,實現(xiàn)時間序列的符號化轉(zhuǎn)換.采用(3)式可將原始時間序列{xh,h=1,2,···,n}進(jìn)行標(biāo)準(zhǔn)化處理,得到新的標(biāo)準(zhǔn)化時間序列{yh,h=1,2,···,n}:
其中,n為時間序列長度,是原始時間序列的均值,α為原始時間序列的標(biāo)準(zhǔn)差.根據(jù)等概率區(qū)間劃分的原則,確定每一個區(qū)間劃分點,然后將落在每個區(qū)間的數(shù)值用一個字母符號表示,最后可得到符號化序列
其中,a,b,c,d等為字母符號,如圖2所示.從圖2可以看出,符號化序列較好地保留了原始序列的跳變狀態(tài).下一步設(shè)置一個固定長度為l(默認(rèn)值為4)的滑窗,從符號化序列S的第一個符號開始,自左向右滑動,這樣就得到一系列長度為l的符號化子片段,實現(xiàn)對原始時間序列的符號化模式表征.
最后,將長度為l的不同符號化模式作為復(fù)雜網(wǎng)絡(luò)的節(jié)點,模式之間的轉(zhuǎn)換頻次和轉(zhuǎn)換方向確定網(wǎng)絡(luò)節(jié)點之間連邊的權(quán)重和方向.如果當(dāng)前模式到下一時刻的模式發(fā)了變化,那么這兩個模式之間存在連邊且連接權(quán)重加1,連接方向為從當(dāng)前模式指向下一個模式.如果當(dāng)前模式與下一時刻模式相同,網(wǎng)絡(luò)不發(fā)生變化.這樣,就可將原始時間序列映射為符號化模式表征的有向加權(quán)復(fù)雜網(wǎng)絡(luò).
圖2 時間序列符號化處理 (a)標(biāo)準(zhǔn)化時間序列;(b)符號化序列Fig.2.Time series symbolic process:(a)Standardized time series;(b)symbol series.
為了驗證新型有向加權(quán)復(fù)雜網(wǎng)絡(luò)的有效性和先進(jìn)性,以Logistic映射系統(tǒng)在不同參數(shù)下的時間序列為例,分別采用經(jīng)典可視圖和本文提出的建網(wǎng)方法對具有不同拓?fù)浣Y(jié)構(gòu)的序列進(jìn)行對比分析.
Logistic映射系統(tǒng)是產(chǎn)生混沌時間序列的經(jīng)典模型,它通過倍周期分叉進(jìn)入混沌[26].Logistic映射系統(tǒng)模型方程如下:
其中,μ為影響系統(tǒng)狀態(tài)的主要參數(shù),參數(shù)μ的不同取值對應(yīng)不同的狀態(tài).
本文設(shè)定Logistic系統(tǒng)的初始值為0.5,步長為0.01,時間為100 s.參數(shù)μ分別取3.5,3.6,3.628,3.7,3.74,3.8,3.83,3.9,3.99這9個值時,可以得到不同的周期態(tài)和混沌狀態(tài)的時間序列(見表1和圖3).為了更清晰地顯示波動狀態(tài),圖3只繪制了每個時間序列前200個數(shù)據(jù)點.
表1 Logistic映射系統(tǒng)在不同參數(shù)下的狀態(tài)Table 1.The state of Logistic system with different parameters.
圖3 Logistic系統(tǒng)在不同參數(shù)下的時間序列Fig.3.Time series of Logistic system with different parameters.
將9個不同參數(shù)下對應(yīng)的Logistic系統(tǒng)時間序列分別進(jìn)行建網(wǎng)分析.采用UCINET中的NETDRAW工具實現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)圖的可視化.由于該軟件無法實現(xiàn)大量數(shù)據(jù)量的可視化,因此僅給出前1000個數(shù)據(jù)點可視圖建網(wǎng)的網(wǎng)絡(luò)結(jié)構(gòu)圖(見圖4).從圖4可以看出,當(dāng)參數(shù)μ為3.5,3.628,3.74,3.83時(系統(tǒng)為周期態(tài)),網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)存在一定的差異,但結(jié)構(gòu)差異與系統(tǒng)的解集數(shù)之間沒有直接的關(guān)聯(lián).而參數(shù)μ取值為3.6,3.7,3.8,3.9,3.99時(系統(tǒng)為混沌態(tài)),其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)差異較小,都呈現(xiàn)出相似的簇團結(jié)構(gòu),無法區(qū)分系統(tǒng)不同的混沌強度差異.總體來看,可視圖建網(wǎng)方法大致能區(qū)分周期態(tài)和混沌態(tài),但對系統(tǒng)的細(xì)節(jié)差異區(qū)分度不明顯.
依照2.2節(jié)中描述的建網(wǎng)步驟,將數(shù)據(jù)長度均為10000的不同狀態(tài)Logistic時間序列映射為相應(yīng)的有向加權(quán)復(fù)雜網(wǎng)絡(luò),其中滑窗長度l默認(rèn)值為4.當(dāng)符號化級數(shù)取值較小時,信號的失真較大,而當(dāng)符號化級數(shù)取值較大時,可能的符號化模式數(shù)量會急劇增大,影響網(wǎng)絡(luò)的分析效率.折衷考慮信號分析的復(fù)雜度和精度,我們通過大量測試,最終確定優(yōu)選的符號化級數(shù)為12.圖5給出了符號化級數(shù)為12時不同狀態(tài)的Logistic時間序列映射的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu).
表1給出了Logistic映射系統(tǒng)在不同參數(shù)下的狀態(tài)列表.從表1可以看出,當(dāng)參數(shù)μ為3.5,3.628,3.74,3.83時,對應(yīng)的時間序列為解集數(shù)固定的周期變化序列,解集數(shù)分別為4,6,5,3,這與圖5給出的時間序列對應(yīng)的復(fù)雜網(wǎng)絡(luò)的規(guī)模(節(jié)點數(shù))完全一致.當(dāng)參數(shù)μ取值為3.6,3.7,3.8,3.9,3.99時,對應(yīng)的時間序列為混沌強度遞增時間序列,圖5中對應(yīng)的復(fù)雜網(wǎng)絡(luò)規(guī)模也同樣呈現(xiàn)出逐漸遞增的趨勢.由此可以看出,本文提出的有向加權(quán)復(fù)雜網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)不僅能直觀地區(qū)分周期信號和混沌信號,且對周期序列和混沌序列的細(xì)微變化具有較好的敏感性.此外,圖5顯示雖然分析數(shù)據(jù)長度為10000,但相應(yīng)的網(wǎng)絡(luò)規(guī)模卻不大(最多為140),由此可以看出,本文方法在處理大數(shù)據(jù)方面明顯優(yōu)于傳統(tǒng)的可視圖和相空間重構(gòu)等建網(wǎng)方法.
圖4 Logistic映射可視網(wǎng)絡(luò)拓?fù)鋱DFig.4.The topological structures of Logistic map from the visibility graph network.
圖5 Logistic系統(tǒng)有向加權(quán)復(fù)雜網(wǎng)絡(luò)拓?fù)鋱DFig.5.The topological structures of Logistic system from the directed weighted complex network.
本實驗主要目的是測試所構(gòu)建的復(fù)雜網(wǎng)絡(luò)對時間序列信號的量化分析能力,即網(wǎng)絡(luò)特性指標(biāo)的分析性能.為此,采集了一組具有特定空間位置關(guān)系的自然風(fēng)場信號.九個二維超聲波風(fēng)速儀(WindSonic,Gill公司)相鄰間隔為1 m排成一列(如圖6所示),距地面高度為0.6 m,數(shù)據(jù)采集時間為1 h,采樣頻率為4 Hz.測得的風(fēng)速時間序列如圖7所示,各風(fēng)速時間序列的均值如表2所列.
圖6 風(fēng)速儀空間排布示意圖Fig.6.Deployment of nine two-dimensional ultrasonic anemometers.
圖7 九個二維風(fēng)速儀采集的風(fēng)速時間序列Fig.7.Wind speed time series of nine two-dimensional ultrasonic anemometers.
表2 九個風(fēng)速時間序列的均值Table 2.The means of nine wind speed time series.
利用本文提出的方法,將實驗采集到的風(fēng)速時間序列映射成有向加權(quán)復(fù)雜網(wǎng)絡(luò).下面選用加權(quán)聚類系數(shù)[27]和平均路徑長度[28]兩個網(wǎng)絡(luò)特性指標(biāo)量化地分析或挖掘時間序列的內(nèi)在規(guī)律.
加權(quán)網(wǎng)絡(luò)的聚類系數(shù)[27]由于具有連邊權(quán)重的非均勻化特性,在衡量網(wǎng)絡(luò)相鄰節(jié)點之間的聚集度時,需考慮節(jié)點之間相關(guān)強度的影響.計算加權(quán)網(wǎng)絡(luò)的節(jié)點i的加權(quán)聚類系數(shù)
其中,ωij是從節(jié)點i到節(jié)點j連邊的權(quán)重.從(6)式可以看出,網(wǎng)絡(luò)中節(jié)點i的加權(quán)聚類系數(shù)越大,表明模式i與相鄰模式之間存在規(guī)則且頻繁的轉(zhuǎn)換.網(wǎng)絡(luò)的加權(quán)聚類系數(shù)WCC即為各個節(jié)點的加權(quán)聚類系數(shù)的均值,
其中,N表示網(wǎng)絡(luò)節(jié)點個數(shù).加權(quán)聚類系數(shù)越大表明網(wǎng)絡(luò)的連接越緊密、連接強度越高,但相比于無權(quán)網(wǎng)絡(luò),加權(quán)網(wǎng)絡(luò)的聚類系數(shù)會明顯較小.
有向加權(quán)網(wǎng)絡(luò)中,兩個節(jié)點i和j之間的加權(quán)最短路徑dij[28]是指在從節(jié)點i到j(luò)的所有可能路徑中最小的連邊權(quán)重和,
所以網(wǎng)絡(luò)的平均路徑長度L定義為
通過計算不同位置的風(fēng)速時間序列有向加權(quán)網(wǎng)絡(luò)的網(wǎng)絡(luò)規(guī)模、加權(quán)聚類系數(shù)和平均路徑長度這三個網(wǎng)絡(luò)特性參數(shù),分析這些參數(shù)與采集位置之間的關(guān)聯(lián)性,并與可視圖建網(wǎng)方法的網(wǎng)絡(luò)特性指標(biāo)做對比.
圖8為不同位置風(fēng)速信號可視圖建網(wǎng)的網(wǎng)絡(luò)特性分析結(jié)果,其中U1—U9代表順序排列的9個風(fēng)速儀位置.對于本文風(fēng)速信號采集的實驗環(huán)境,已有研究結(jié)果表明[29],雖然氣態(tài)流場隨時間不斷變化,但在一定區(qū)域內(nèi)(通常在10 m范圍內(nèi))的風(fēng)速/風(fēng)向變化近似一致(如圖7所示,9個風(fēng)速時間序列大尺度波動基本一致,但在小尺度波動上存在一定的差異),且采集點距離越近波動的相似性越高.從圖8可以看出,可視圖建網(wǎng)的網(wǎng)絡(luò)特性呈現(xiàn)無規(guī)律跳變,以聚類系數(shù)網(wǎng)絡(luò)參數(shù)為例,風(fēng)速儀U1與U5相距4 m,其相應(yīng)聚類系數(shù)值大小相當(dāng),而與U1相距1 m的U2,其相應(yīng)聚類系數(shù)值差別較大,這顯然是不合理的,即網(wǎng)絡(luò)特性大小與風(fēng)速儀空間位置沒有直接的關(guān)聯(lián).圖9為本文提出的有向加權(quán)網(wǎng)絡(luò)的網(wǎng)絡(luò)特性分析結(jié)果.三個網(wǎng)絡(luò)特性參數(shù)(網(wǎng)絡(luò)規(guī)模、加權(quán)聚類系數(shù)和平均路徑長度)大小隨著風(fēng)速儀排布的空間位置變化呈現(xiàn)出一致的增長或衰減趨勢,這與參考文獻(xiàn)[29]測試結(jié)果符合.
下面對本文方法的三個網(wǎng)絡(luò)特性參數(shù)(網(wǎng)絡(luò)規(guī)模、加權(quán)聚類系數(shù)和平均路徑長度)分析得到的一致增長或衰減結(jié)果做進(jìn)一步的說明.從9個采集點風(fēng)玫瑰圖統(tǒng)計結(jié)果顯示,測試實驗的主風(fēng)向為東北方向,隨著風(fēng)的流動方向能量逐漸減弱(如表2所列),即風(fēng)速儀U9采集的風(fēng)速時間序列平均風(fēng)速最大,自東向西逐漸減小(U2位置例外).參考文獻(xiàn)[29]的研究結(jié)果表明,在小的局部空間范圍內(nèi)(通常小于10 m)平均風(fēng)速越大,氣流的隨機波動幅度和頻率都會越弱,即波動的復(fù)雜性越小.從圖7給出的數(shù)據(jù)直觀來看,U9和U1兩個序列的大尺度波動基本一致,但U9序列(平均風(fēng)速最大)的小尺度波動明顯比U1序列(平均風(fēng)速最小)弱,因此U9序列的復(fù)雜度比U1序列小.網(wǎng)絡(luò)規(guī)模參數(shù)的大小反映時間序列中符號化模式的多少,符號化模式越多在一定程度上說明時間序列越復(fù)雜.U1序列由于波動的復(fù)雜度最大,因此網(wǎng)絡(luò)規(guī)模值最大,其他位置U3—U9由于復(fù)雜度逐漸減小,所以網(wǎng)絡(luò)規(guī)模值出現(xiàn)一致衰減的趨勢.U2位置由于平均風(fēng)速異常地變大,其網(wǎng)絡(luò)規(guī)模值出現(xiàn)異常也是合理的.另外兩個特性參數(shù):加權(quán)聚類系數(shù)和平均路徑長度也準(zhǔn)確地反映了采集風(fēng)速信號的復(fù)雜性差異,即信號的復(fù)雜度降低導(dǎo)致網(wǎng)絡(luò)的符號化模式減少,同時模式之間的轉(zhuǎn)換頻次增加,使得網(wǎng)絡(luò)的聚集度和平均路徑長度增大,因此U1—U9序列的上述兩個網(wǎng)絡(luò)特性參數(shù)呈現(xiàn)出一致增長的趨勢.上述分析表明,三個特性參數(shù)均能準(zhǔn)確反映分析信號的相似性及復(fù)雜性差異.
圖8 風(fēng)速時間序列的可視圖網(wǎng)絡(luò)特性 (a)聚類系數(shù);(b)平均路徑長度Fig.8.The visibility graph network characteristics of the wind speed time series:(a)Clustering coefficient;(b)average path length.
在電力系統(tǒng)中風(fēng)能的預(yù)測、氣象學(xué)中風(fēng)場分區(qū)等應(yīng)用中,經(jīng)常要對不同空間位置采集的風(fēng)場信號進(jìn)行相似性及復(fù)雜性分析.由于自然風(fēng)場信號是一類復(fù)雜的非線性非平穩(wěn)信號,因此其相似性及復(fù)雜性準(zhǔn)確度量至今沒有有效的解決方案.本文提出的有向加權(quán)網(wǎng)絡(luò)特性分析的方法為該難題的解決提供了一種有效的工具.此外,后續(xù)還可以在新的復(fù)雜網(wǎng)絡(luò)基礎(chǔ)上挖掘更豐富的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)信息,提出新的網(wǎng)絡(luò)特性指標(biāo)更深層次地揭示物理對象(如風(fēng)場)的動力學(xué)機理.
圖9 風(fēng)速時間序列的有向加權(quán)網(wǎng)絡(luò)特性 (a)網(wǎng)絡(luò)規(guī)模;(b)加權(quán)聚類系數(shù);(c)平均路徑長度Fig.9.The directed weighted network characteristics of the wind speed time series:(a)Network scale;(b)weighted clustering coefficient;(c)average path length.
本文提出了一種新的基于時間序列符號化結(jié)合滑窗技術(shù)模式表征的有向加權(quán)復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法.首先對標(biāo)準(zhǔn)化后的時間序列幅度進(jìn)行等概率量化處理,將原始時間序列轉(zhuǎn)化為更簡潔的符號化序列;然后結(jié)合滑窗技術(shù)提取出一系列符號化模式作為復(fù)雜網(wǎng)絡(luò)節(jié)點;最后將符號化模式的轉(zhuǎn)換方向和轉(zhuǎn)換頻次作為連邊方向和權(quán)重,從而構(gòu)建出有向加權(quán)復(fù)雜網(wǎng)絡(luò).通過對不同參數(shù)條件下的Logistic映射系統(tǒng)的時間序列分析表明,本文提出的有向加權(quán)復(fù)雜網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)不僅能直觀地區(qū)分周期信號和混沌信號,且能準(zhǔn)確地反映周期時間序列和混沌時間序列的細(xì)微變化.另外,通過多點規(guī)則排列采集的風(fēng)速信號的網(wǎng)絡(luò)特性指標(biāo)分析表明,本文方法的網(wǎng)絡(luò)參數(shù)大小能較準(zhǔn)確地預(yù)測風(fēng)速儀的空間位置鄰近關(guān)系.上述網(wǎng)絡(luò)指標(biāo)的量化分析結(jié)果,進(jìn)一步證實了本文提出的方法相比經(jīng)典的可視圖方法,對于分析復(fù)雜的時間序列具有更高的靈敏度和準(zhǔn)確性.
時間序列復(fù)雜網(wǎng)絡(luò)分析包含兩個研究分支:一是研究時間序列復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法;二是在建網(wǎng)基礎(chǔ)上挖掘豐富的網(wǎng)絡(luò)特性指標(biāo).本文的研究側(cè)重點是構(gòu)建新的時間序列復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法,后續(xù)可以在此基礎(chǔ)上探尋具有普適性的有向加權(quán)網(wǎng)絡(luò)的新的特性指標(biāo)或針對特定研究對象設(shè)計新的特異性指標(biāo).另外,除進(jìn)一步完善復(fù)雜網(wǎng)絡(luò)分析方法外,后續(xù)還可以做大量涉及時間序列分析的推廣應(yīng)用研究.例如本文的風(fēng)場實驗證實了新提出的有向加權(quán)復(fù)雜網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)特征是一種非常有效的風(fēng)場信號特征提取策略,未來在風(fēng)能預(yù)測、風(fēng)場模式分類、風(fēng)場動力學(xué)及演化機理等研究中將有廣闊的應(yīng)用前景.
[1]Watts D J,Strogatz S H 1998Nature393 440
[2]Barabasi A L,Albert R 1999Science286 509
[3]Albert R,Barabási A L 2002Rev.Mod.Phys.74 47
[4]Buldyrev S V,Parshani R,Paul G,Stanley H E,Havlin S 2010Nature464 1025
[5]Rubinov M,Sporns O 2010Neuroimage52 1059
[6]Zhuang E,Small M,Feng G 2014Physica A410 483
[7]Hao X,An H,Qi H,Gao X 2016Appl.Energy162 2016
[8]Zhou L,Gong Z Q,Zhi R,Feng G L 2008Acta Phys.Sin.57 7380(in Chinese)[周磊,龔志強,支蓉,封國林2008物理學(xué)報57 7380]
[9]Lacasa L,Toral R 2010Phys.Rev.E82 036120
[10]Xu X,Zhang J,Small M 2008Proc.Natl.Acad.Sci.USA105 19601
[11]Donges J F,Donner R V,Kurths J 2013Europhys.Lett.102 10004
[12]Zou Y,Small M,Liu Z 2014New J.Phys.16 013051
[13]Huang X,An H,Gao X 2015Physica A428 493
[14]Zhang J,Small M 2006Phys.Rev.Lett.96 238701
[15]Gao Z K,Fang P C,Ding M S,Jin N D 2015Exp.Therm.Fluid Sci.60 157
[16]Takens F 1981Dynamical Systems and Turbulence,Warwick 1980898 366
[17]Yang Y,Yang H 2008Physica A387 1381
[18]Gao Z,Jin N 2009Chaos19 033137
[19]Tang J,Liu F,Zhang W,Zhang S,Wang Y 2016Physica A450 635
[20]Webber C L,Zbilut J P 1994J.Appl.Phys.76 965
[21]Lacasa L,Luque B,Ballesteros F,Luque J,Nuno J C 2008Proc.Natl.Acad.Sci.USA105 13
[22]Gao Z K,Hu L D,Zhou T T,Jin N D 2013Acta Phys.Sin.62 110507(in Chinese)[高忠科,胡瀝丹,周婷婷,金寧德2013物理學(xué)報62 110507]
[23]Liu C,Zhou W X,Yuan W K 2010Physica A389 2675
[24]Lin J,Keogh E,Lonardi S,Chiu B 2003Proceedings of the 8th ACM SIGMOD workshop on Research Issues in Data Mining and Knowledge DiscoverySan Diego,USA,June 13,2003 p2
[25]Lin J,Keogh E,Li W,Lonardi S 2007Data Mining and Knowledge Discovery15 107
[26]Lü J H,Lu J A,Chen S H 2001Chaotic Time Series Analysis and Application(Wuhan:Wuhan University Press)p12(in Chinese)[呂金虎,陸君安,陳士華 2001混沌時間序列分析及其應(yīng)用(武漢:武漢大學(xué)出版社)第12頁]
[27]Shirazi A H,Jafari G R,Davoudi J,Peinke J,Tabar M R R,Sahimi M 2009J.Statist.Mech.:Theory and Experiment2009 P07046
[28]Antoniou I E,Tsompa E T 2008Discrete Dyn.Nat.Soc.2008 1
[29]Li J G,Meng Q H,Wang Y,Zeng M 2011Autonomous Robots30 281
PACS:05.45.Tp,88.50.jj,05.45.–a,89.75.–k DOI:10.7498/aps.66.210502
*Project supported by the National Natural Science Foundation of China(Grant Nos.61271321,61573253).
?Corresponding author.E-mail:zengming@tju.edu.cn
Directed weighted complex networks based on time series symbolic pattern representation?
Zeng Ming?Wang Er-Hong Zhao Ming-Yuan Meng Qing-Hao
(Tianjin Key Laboratory of Process Measurement and Control,Institute of Robotics and Autonomous Systems,School of Electrical and Information Engineering,Tianjin University,Tianjin 300072,China)
d 19 May 2017;revised manuscript
3 July 2017)
Complex networks are capable of modeling different kinds of complex systems in nature and technology,which contain a large number of components interacting with each other in a complicated manner.Quite recently,various approaches to analyzing time series by means of complex networks have been proposed,and their great potentials for uncovering valuable information embedded in time series,especially when nonlinear dynamical systems are incapable of being described by theoretical models have been proven.Despite the existing contributions,up to now,mapping time series into complex networks is still a challenging problem.In order to more effectively dig out the structural characteristics of time series(especially the nonlinear time series)and simplify the computational complexity of time series analysis,in this paper we present a novel method of constructing a directed weighted complex network based on time series symbolic pattern representation combined with sliding window technique.The proposed method firstly implements symbolic procession according to the equal probability segment division and then combines with the sliding window technique to determine the symbolic patterns at different times as nodes of the network.Next,the transition frequency and direction of symbolic patterns are set as the weights and directions of the network edges,thus establishing the directed weighted complex network of the analyzed time series.The results of test using the Logistic system with different parameter settings show that the topological structures of the directed weighted complex network can not only intuitively distinguish the periodic time series and chaotic time series,but also accurately re flect the subtle changes of two types of time series.These results are superior to those from the classical visibility graph method which can be only roughly classi fi ed as two types of signals.Finally,the proposed technique is used to investigate the natural wind field signals collected at an outdoor open space in which nine high precision two-dimensional(2D)ultrasonic anemometers are deployed in line with 1minterval.The topological parameters of the network analysis include the network size,weighted clustering coefficient,and average path length.The corresponding results of our approach indicate that the values of three network parameters show consistent increase or decrease trend with the spatial regular arrangement of the nine anemometers.While the results of the visibility graph network parameters are irregular,and cannot accurately predict the spatial deployment relationship of nine 2D ultrasonic anemometers.These interesting findings suggest that topological features of the directed weighted complex network are potentially valuable characteristics of wind signals,which will have broad applications in researches such as wind power prediction,wind pattern classi fication and wind field dynamic analysis.
directed weighted complex network,time series analysis,visibility graph,Logistic system
時間序列復(fù)雜網(wǎng)絡(luò)分析近些年已發(fā)展成為非線性信號分析領(lǐng)域的一個國際熱點課題.為了能更有效地挖掘時間序列(特別是非線性時間序列)中的結(jié)構(gòu)特征,同時簡化時間序列分析的復(fù)雜度,提出了一種新的基于時間序列符號化結(jié)合滑窗技術(shù)模式表征的有向加權(quán)復(fù)雜網(wǎng)絡(luò)建網(wǎng)方法.該方法首先按照等概率區(qū)段劃分的方式將時間序列做符號化處理,結(jié)合滑窗技術(shù)確定不同時刻的符號化模式作為網(wǎng)絡(luò)的節(jié)點;然后將待分析時間序列符號化模式的轉(zhuǎn)換頻次和方向作為網(wǎng)絡(luò)連邊的權(quán)重和方向,從而建立時間序列有向加權(quán)復(fù)雜網(wǎng)絡(luò).通過對Logistic系統(tǒng)不同參數(shù)設(shè)置對應(yīng)的時間序列復(fù)雜網(wǎng)絡(luò)建網(wǎng)測試結(jié)果表明,相比經(jīng)典的可視圖建網(wǎng)方法,本文方法的網(wǎng)絡(luò)拓?fù)淠芨啙崱⒅庇^地展示時間序列的結(jié)構(gòu)特征.進(jìn)而,將本文方法應(yīng)用于規(guī)則排列采集的自然風(fēng)場信號分析,其網(wǎng)絡(luò)特性指標(biāo)能較準(zhǔn)確地預(yù)測采集信號的排布規(guī)律,而可視圖建網(wǎng)方法的網(wǎng)絡(luò)特性指標(biāo)沒有任何規(guī)律性的結(jié)果.
10.7498/aps.66.210502
?國家自然科學(xué)基金(批準(zhǔn)號:61271321,61573253)資助的課題.
?通信作者.E-mail:zengming@tju.edu.cn
?2017中國物理學(xué)會Chinese Physical Society