唐 強,胡鐵松
?
徑流時間序列復雜網(wǎng)絡的動力學拓撲性質
唐 強1,胡鐵松2
(1. 武漢紡織大學 數(shù)學與計算機學院,湖北 武漢 430200;2. 武漢大學 水資源與水電工程科學國家重點實驗室,湖北 武漢 430072)
以金沙江和美國Ocumlgee河日徑流序列為對象,利用復雜網(wǎng)絡理論對徑流序列的波動性特征進行了初步探討。通過粗?;椒▽搅鲿r間序列轉化為符號序列,進而構建相應的復雜網(wǎng)絡。對網(wǎng)絡的聚類系數(shù)、平均路徑長度和中介中心性測度等動力學統(tǒng)計特征量和拓撲參數(shù)的討論發(fā)現(xiàn),網(wǎng)絡的聚類系數(shù)較大而平均路徑長度較小,不同的波動模式之間存在著短程相關性;不同頂點的中介中心性測度具有明顯的差異,表明某些頂點所代表的波動模式有著重要的意義,在一定程度上可以作為各種波動模式之間轉換的前兆。這些結論有助于更好地把握徑流變化的規(guī)律,對于徑流的短期預測具有一定的參考價值。
徑流序列;波動性;復雜網(wǎng)絡;粗粒化;聚類系數(shù);平均路徑長度;中介中心性測度
徑流過程是一種重要的水文現(xiàn)象,借助各種時間序列的分析方法研究徑流序列的性質,提取所需信息,揭示其內在規(guī)律對于水資源的利用有著重要的意義,長期以來受到眾多研究人員的重視。非線性科學的發(fā)展,為徑流過程的定量分析與研究提供了新的理論和方法,人們利用混沌、分形和小波等非線性理論對徑流序列進行了研究,試圖解釋序列波動的原因和機理,并對其未來的變化趨勢做出預測,幾十年來取得了豐碩的成果[1-6]。
由于河川徑流受到自然環(huán)境、社會條件和人類活動多重制約,同時又存在著各種尺度關聯(lián)和各種波動,具有高度的復雜性,需要利用多種方法,從不同的角度來進行討論。上個世紀90年代興起的復雜網(wǎng)絡理論為徑流過程的研究提供了一種新的思路[7-9]。
在本文中,我們以金沙江屏山站與佐治亞州Ocumlgee河Macon站日徑流時間序列作為研究對象,首先運用等概率粗?;椒?,將徑流序列轉化為復雜網(wǎng)絡,把徑流序列波動信息編碼在網(wǎng)絡的拓撲結構之中;隨后通過對網(wǎng)絡的動力學統(tǒng)計特征量和拓撲參數(shù)等進行分析,獲取徑流波動網(wǎng)絡的內在規(guī)律性,從復雜網(wǎng)絡的角度解釋徑流變化的動力學特征。
郝柏林提出可以通過符號動力學建立運動軌道和形式語言的聯(lián)系,然后借助語法復雜性理論來刻畫復雜性,其核心內容就是符號動力學與時間序列的粗粒化和符號化[10]。粗?;S玫姆椒ㄊ菍ο到y(tǒng)區(qū)間進行同質劃分[11],將整個區(qū)間分成有限個子區(qū)間。如果對劃分后的每個子區(qū)間賦予一個符號,則整個系統(tǒng)區(qū)間就轉換為一個符號序列,對粗?;栃蛄械难芯恳簿褪菍ο鄳獣r間序列的研究。由于粗粒化過程舍去了小層次上的細節(jié),粗?;问降姆栃蛄杏志哂杏邢扌裕@就使得粗?;椒芡怀鱿到y(tǒng)的本質的特征。
粗?;木葘Y論的有效性有很大的影響,這就要求在進行符號轉換時,確定的符號種類不能太多,每一個符號要盡可能代表系統(tǒng)變化中的某一種基本的、相對獨立的模式。常見的粗?;椒ㄓ卸荡至;⒍嘀荡至;偷雀怕蚀至;确椒╗12, 13]。
多值粗?;椒]有考慮不同的符號在符號序列中出現(xiàn)的概率,等概率粗?;椒梢允沟貌煌姆栐诜栃蛄兄谐霈F(xiàn)的概率相同。記日徑流序列為{(),=1,…,},首先計算徑流量的波動():
其中()為對應一種徑流量波動模態(tài)發(fā)生的次數(shù)[13]。按照等概率的思想,我們將徑流量的波動()分為4個區(qū)間,定義4個特征字符
其中,代表徑流量快速增加,代表徑流量緩慢增加,代表徑流量緩慢降低,代表徑流量快速降低。這樣就可以將徑流序列轉化為符號序列:
將時間序列粗?;幚砗螅梢缘玫接?個字符{,,,}構成的符號序列。在符號序列中,稱由個字符構成的字串為字串。理論上不同的字串共有4種。在符號序列的分析中,相互連接的字符的基本模式稱為元結構。這些字串即為符號序列的元結構,代表了各種波動模式。符號序列表現(xiàn)了一種波動模式向另一種波動模式的轉變,這種轉變體現(xiàn)了各種波動模式之間的信息傳遞等關系,具有多元化的特征。后一個模式的出現(xiàn)是以前一個或多個模式為基礎的,體現(xiàn)了一定的記憶性,因此模式之間的聯(lián)系是“有向”的,聯(lián)系的強弱程度也各不相同。因此,我們構建一個有向加權網(wǎng)絡來描述各種波動模式之間的關系。
當下,越來越多的汽車制造商和零部件制造商希望將工業(yè)服務外包,以獲得專業(yè)高效的服務,提升設備運行的可靠性,提高企業(yè)的生產(chǎn)能力和運營效率,從而將更多的精力集中到市場調研、產(chǎn)品研發(fā)、產(chǎn)品質量提升以及生產(chǎn)工藝研究等核心業(yè)務上。
將每一個字串視為網(wǎng)絡的一個頂點,符號序列中相鄰的兩個字串之間存在一條邊,由前一個字串指向后一個字串。如果兩個頂點和之間存在多條邊,則邊數(shù)即為這兩個頂點之間邊的權重w。
分別以金沙江屏山站1943年1月1號至1992年12月31號日徑流時間序列與美國佐治亞州Ocumlgee河Macon站1958年1月1號至2007年12月31號日徑流時間序列作為研究對象。金沙江屏山站徑流序列來源于長江水利委員會水文局,共有18263個數(shù)據(jù);Ocumlgee河Macon站徑流序列來源于美國地質調查局網(wǎng)站 http://water.usgs.gov/ waterwatch/,含18250個數(shù)據(jù)。
對于有向加權網(wǎng)絡,當考慮邊的權重的時候,網(wǎng)絡的某個頂點的聚類系數(shù)定義為[14]
圖 1 給出了網(wǎng)絡頂點的聚類系數(shù)與度值的關系。從圖1中可以看出,兩個網(wǎng)絡頂點的聚類系數(shù)隨度值的變化都較大,這意味著三個網(wǎng)絡并不是完全隨機的,而是在某種程度上具有類似于社會關系網(wǎng)絡中“物以類聚,人以群分”的特性[15]。Ocumlgee 河日徑流波動網(wǎng)絡度值較小的頂點聚類系數(shù)較大,度值較大的聚類系數(shù)較小,不同于小世界網(wǎng)絡的性質。聚類系數(shù)的這種性質說明網(wǎng)絡的群聚特性既可能會發(fā)生在小的集團中,也可能會發(fā)生在大的集團中。對于隨時間變化的徑流來說,意味著群發(fā)性有時會反映在小的時間尺度上,有時又會反映在大的時間尺度上,即徑流變化有多年的周期波動,又有年度的漲落,還有月的變化特征。而金沙江日徑流波動網(wǎng)絡聚類系數(shù)與度值的關系則正好相反,表明群發(fā)性更多的發(fā)生在大的集團中,徑流變化的長期周期波動更明顯。
圖1 日徑流波動網(wǎng)絡頂點的聚類系數(shù)與度值的關系
其中為頂點總數(shù),d為頂點和的距離。表1給出了兩個網(wǎng)絡的平均聚類系數(shù)和平均路徑長度。
表1 網(wǎng)絡的平均聚類系數(shù)與平均路徑長度
由表1可知,兩條河流的日徑流波動網(wǎng)絡均具有較大的平均聚類系數(shù)和較小的平均路徑長度。平均路徑長度表征了由一種波動模式轉變?yōu)榱硪环N波動模式所花的時間,網(wǎng)絡的平均路徑長度均小于 2,表明模式的轉換時間大約為6天左右,表現(xiàn)出短程相關性,這對于徑流的短期預測具有一定的參考價值。較大的平均聚類系數(shù)表明各種波動模式存在小規(guī)模的群簇,群簇內部頂點之間的關聯(lián)較好。如不同的季節(jié)內可能是不同的波動模式占主要地位,這些波動模式就構成一個群簇,不同的影響因素對應不同的群簇。Ocumlgee 河流日徑流波動網(wǎng)絡的平均聚類系數(shù)較大,平均路徑長度較小,表明它的群簇性明顯,模式轉換較頻繁。
在一個網(wǎng)絡中,不同的頂點一般具有不同的重要性。頂點的拓撲重要性等價于該頂點與其他頂點的連接性,這種拓撲重要性可以用中介中心性來刻畫[17, 18]。
信息在網(wǎng)絡中的流通和傳遞往往要通過少數(shù)關鍵頂點才能以最短路徑到達網(wǎng)絡中的其他頂點,失去這些關鍵頂點將對網(wǎng)絡的整體性質造成較大的影響。在復雜網(wǎng)絡理論中, 用中心性來衡量一個頂點在網(wǎng)絡中影響能力的大小,即獲得、控制信息的能力。中介中心性反映了頂點在網(wǎng)絡中的中介性和樞紐程度[19]。
網(wǎng)絡中一個頂點的中介中心性測度g定義如下:設(,)為頂點對(,)之間所有最短路徑的總數(shù),路徑的長度就是路徑通過的各條邊的權重之和。在這些路徑中通過中間頂點的路徑數(shù)記為c(,),記
則頂點的中介中心性測度g為所有頂點對的g(,)之和,即
我們計算了兩個網(wǎng)絡各頂點的中介中心性測度,并對它們進行了排序,結果如表2、表3所示。從中可見,不同頂點的中介中心性測度有較大的差異。Ocumlgee河日徑流波動網(wǎng)絡前 30 個頂點對整個網(wǎng)絡的中介中心性的貢獻率達到了 85.03%,前10個頂點的g都在3%以上,中介中心性的貢獻率達到41%。金沙江日徑流波動網(wǎng)絡前40個頂點對整個網(wǎng)絡的中介中心性的貢獻率達到了85.65%,前 7 個頂點的g都在3%以上,中介中心性的貢獻率達到26%。這些貢獻率較大的頂點的中介中心性等級與g%的雙對數(shù)曲線圖表明與g%呈冪律關系,如圖2所示。這意味著某些頂點所代表的波動模式有著重要的意義,任意兩個波動模式之間的轉換經(jīng)過這幾個波動模式中轉的概率較大,它們在一定程度上可以作為各種波動模式之間轉換的前兆,對波動模式的轉換具有重要的意義,對它們的研究將有助于更好地把握徑流變化的規(guī)律。此外,在Ocumlgee河日徑流波動網(wǎng)絡中,、和三種波動模式的g% 均在5%以上,說明了該徑流波動急劇增加和急劇降低模式的重要性,反映了該徑流波動的劇烈化程度。
表2 Ocumlgee河Macon站日徑流波動網(wǎng)絡各頂點的中介中心性測度
表3 金沙江屏山站日徑流波動網(wǎng)絡各頂點的中介中心性測度
圖2 頂點的中介中心性等級與測度的關系。
本文通過粗?;椒▽搅餍蛄修D化為符號序列,進而構建相應的復雜網(wǎng)絡。通過對網(wǎng)絡的聚類系數(shù)、平均路徑長度和中介中心性測度等動力學統(tǒng)計特征量和拓撲參數(shù)的討論發(fā)現(xiàn),金沙江屏山站與Ocumlgee河Macon站日徑流過程不是隨機的過程,存在少數(shù)幾種重要的波動模式。波動網(wǎng)絡均具有較大的聚類系數(shù)和較小的平均路徑長度,不同的波動模式之間存在著短程相關性,各種波動模式存在小規(guī)模的群簇,不同的群簇對應不同的影響因素,群簇內部頂點之間的關聯(lián)較好,這對于徑流的短期預測具有一定的參考價值。Ocumlgee 河流日徑流波動網(wǎng)絡頂點的度值和聚類系數(shù)呈負相關關系,說明徑流變化有多年的周期波動,又有年度的漲落,還有月的變化特征。Ocumlgee 河日徑流波動網(wǎng)絡中、和三種波動模式的中介中心性測度較大,說明了該徑流波動急劇增加和急劇降低模式的重要性,反映了該徑流劇烈波動較頻繁。不同頂點的中介中心性測度具有明顯的差異,這意味著某些頂點所代表的波動模式有著重要的意義,在一定程度上可以作為各種波動模式之間轉換的前兆,對它們的研究將有助于更好地把握徑流變化的規(guī)律。
[1] 王文均,葉敏,陳顯維. 長江徑流時間序列混濁特性的定量分析[J]. 水科學進展,1994,5(2):87-93.
[2] 侯玉,吳伯賢,鄧國權.分形理論用于洪水分期的初步探討[J].水科學進展,1999,10(2): 140-143.
[3] Wang W, Vrijling J K, Gelder V, et al. Testing for nonlinearity of streamflow processes at different timescales[J]. Journal of Hydrology, 2006, 322: 247-268.
[4] Bof L H, Pruski F F, Da Silva L M, et al. Analysis of appropriate timescale for water diversion permits in Brazil[J].Environmental Management, 2013, 51(2): 492-500 .
[5] 李新杰,胡鐵松,郭旭寧,等. 0-1 測試方法的徑流時間序列混沌特性應用[J]. 水科學進展,2012,32(6):875-882.
[6] Khatibir, Sivakumarb, Ghorbanima, et al. Investigating chaos in river stage and discharge time series[J].Journal of Hydrology,2012,414-415:108-117.
[7] Watts, D.J., S.H. Strogatz. Collective dynamics of small world networks [J].Nature, 1998, 393: 440-442.
[8] Barabási, A.L., R. Albert. Emergence of scaling in random networks [J].Science, 1999, 286(5439): 509-512.
[9] Qiang Tang,Jie Liu,Honglin Liu. Comparison of different daily streamflow series in US and CHINA, under a viewpoint of complex networks[J].Modern Physics Letters B, 2010, 24(14): 1541-1547.
[10]郝柏林.復雜性的刻畫與“復雜性科學”[J].科學,1999,51(3): 3-8.
[11]Wackerbauer, R., A. Witt, H. Atmanspacher, et al. A comparative classification of complexity measures [J].Chaos, Solitons & Fractals, 1994, 4(1): 133-173.
[12]張佃中,譚小紅,王智,等.基于等概率粗?;膹碗s度算法及其應用[J].系統(tǒng)仿真學報,2008,20(15): 4096-4098.
[13]周磊,龔志強,支蓉,等.利用復雜網(wǎng)絡研究中國溫度序列的拓撲性質[J].物理學報,2008,57(11): 7380-7389.
[14]陳衛(wèi)東,徐華,郭琦.國際石油價格復雜網(wǎng)絡的動力學拓撲性質[J].物理學報,2010,59(7): 4514-4523.
[15]汪小帆,李翔,陳關榮.復雜網(wǎng)絡理論及其應用[M].北京:清華大學出版社,2006.
[16]何大韌,劉宗華,汪秉宏.復雜系統(tǒng)與復雜網(wǎng)絡[M].北京:高等教育出版社,2009.
[17]Freeman, L.C.. Centrality in social networks conceptual clarification [J].Social Networks, 1978, 1(3): 215-239.
[18]Li P., B.H. Wang. Extracting hidden fluctuation patterns of Hang Seng stock index from network topologies [J].Physica A, 2007, 378(2): 519-526.
[19]Goh, K.I., E. Oh, B. Kahng, et al.Betweenness centrality correlation in social networks [J].Physical Review E, 2003, 67: 017101.
Dynamic Analysis on the Topological Properties of the Complex Network of Runoff Time Series
TANG Qiang1, HU Tie-song2
(1. School of Mathematics & Computer Science, Wuhan Textile University, Wuhan Hubei 430200, China; 2.State Key Laboratory of Water Resources and Hydropower Engineering Science, Wuhan University, Wuhan Hubei 430072, China.)
Based on the complex networks theory, daily runoff series of the Jinsha River in China and the Ocumlgee River in America are used for exploring the fluctuation characteristic of this runoff.A runoff time series can be transformed into a discrete symbolic sequence by preprocessing coarse graining, and a complex network will be created. Then some dynamic statistical features and topology parameters of two fluctuation networks, such as clustering coefficient, mean path length and betweenness centrality, are discussed. We find that the clustering coefficients of two networks are larger and mean path lengths are smaller, which indicates the short-range correlation exists in different fluctuation patterns. The betweenness centrality of different nodes have obvious difference, which means that some fluctuation patterns have important significance and can be as a conversion precursor between the various fluctuation patterns to some extent. These results contribute to understanding the variation of runoff process and have reference value for short-term prediction of runoff process.
Runoff Time Series; Fluctuation; Complex Networks; Coarse Graining; Clustering Coefficient; Mean Path Length; Betweenness Centrality
唐強(1974-),男,副教授,研究方向:時間序列非線性性質.
P333
A
2095-414X(2014)03-0087-05