趙瑋奇, 武雅潔,2??, 鄒華志, 孫永鑫
(1. 中國海洋大學(xué)工程學(xué)院, 山東 青島 266100; 2. 中國海洋大學(xué)山東省海洋工程重點(diǎn)實(shí)驗(yàn)室, 山東 青島 266100;3. 珠江水利科學(xué)研究院, 廣東 廣州 510611; 4. 淄博震旦資源環(huán)境工程有限公司, 山東 淄博 255000)
海洋系統(tǒng)是一個(gè)動態(tài)的、復(fù)雜的非線性系統(tǒng),在其演化過程中,研究海洋實(shí)測數(shù)據(jù)的統(tǒng)計(jì)學(xué)特性能夠揭示海洋系統(tǒng)的內(nèi)在作用機(jī)理。風(fēng)生流是由風(fēng)作用于海面而產(chǎn)生的切應(yīng)力引起的海水流動,海表面附近的風(fēng)向往往會對表面流向產(chǎn)生較大的影響,而研究實(shí)測數(shù)據(jù)中表面流方向與風(fēng)向之間的關(guān)系,有利于深入分析非理想條件下二者相互作用的機(jī)制。
近年來,國內(nèi)外學(xué)者對多尺度熵、置換熵進(jìn)行了大量的研究,并取得了一些成果。Costa等[1]于2002年開發(fā)了基于樣本熵的多尺度熵(Multiscale entropy, MSE)算法,它在生理信號、腦電信號、振動信號等信號的復(fù)雜度分析中起到了重要的作用[2-4]。置換熵(Permutation entropy, PE)是一種基于Shannon熵[5]的度量時(shí)間序列復(fù)雜度的方法。在實(shí)際應(yīng)用上,PE通常適用于混亂的、嘈雜的時(shí)間序列,已經(jīng)被廣泛應(yīng)用于心電圖分析[6]、金融數(shù)據(jù)分析[7]和交通時(shí)間序列分析[8]中。研究兩個(gè)時(shí)間序列同步性的時(shí)候,亦可使用置換熵進(jìn)行分析。受到聯(lián)合概率分布的啟發(fā),可以得到聯(lián)合置換熵[8](Joint permutation entropy, JPE),在此基礎(chǔ)上再結(jié)合多尺度分析,可以得到多尺度聯(lián)合置換熵[9](Multiscale joint permutation entropy, MJPE),它可以從次序模式識別和多尺度這兩個(gè)角度來檢測兩個(gè)復(fù)雜時(shí)間序列之間隱含的特性。
對于海洋實(shí)測數(shù)據(jù),趙丹楓等[10]構(gòu)建了motif規(guī)則樹,實(shí)現(xiàn)了海洋時(shí)間序列間強(qiáng)關(guān)聯(lián)規(guī)則的挖掘。趙彥平等[11]采用了混沌時(shí)間方法對海雜波進(jìn)行了分析和預(yù)測,提高了模型的精確性。徐麗麗等[12]基于赤潮的月發(fā)生次數(shù)的多年統(tǒng)計(jì)資料,建立了以數(shù)據(jù)驅(qū)動為核心的赤潮預(yù)測模型。宋大德等[13]利用ARIMA模型對小黃魚單位捕撈努力量漁獲量值進(jìn)行了驗(yàn)證,與實(shí)測值擬合良好。對于風(fēng)生流實(shí)測時(shí)間序列的同步性,目前尚缺乏研究。
本文利用多尺度分析的方法,采用多尺度聯(lián)合置換熵,利用對數(shù)變換構(gòu)建了DI指數(shù),然后構(gòu)建了同步性指數(shù)Isync和同步性指標(biāo)α,對模擬時(shí)間序列和實(shí)測時(shí)間序列的同步性進(jìn)行分析,利用實(shí)測數(shù)據(jù)的統(tǒng)計(jì)學(xué)分析來揭示珠江口區(qū)域天文潮的漲落對風(fēng)生流產(chǎn)生的影響。
為了測試多尺度分析法對于時(shí)間序列的適用性,本文采用的模擬時(shí)間序列第一部分為若干個(gè)初等函數(shù)的組合,分別為二次函數(shù)與二次函數(shù)、二次函數(shù)與三次函數(shù)、三角函數(shù)與三角函數(shù)的組合,橫坐標(biāo)對應(yīng)的時(shí)間分辨率為0.1 s,時(shí)間跨度為1~20 s。第二部分為一維Logistic映射,定義為:
xn+1=kxn(1-xn)。
(1)
由一維Logistic映射的性質(zhì)可知,參數(shù)k在3.45和3.56之間時(shí),即存在周期性,又存在混沌,且k越大,混沌程度越大。因此,對參數(shù)k分別取3.5、3.51和3.55生成三個(gè)序列,所有序列的初始值給定為x1=0.4。
本文分析所采用的實(shí)測數(shù)據(jù)來自珠江河口鄰近海域的三個(gè)測站,每個(gè)測站的數(shù)據(jù)均為單一浮標(biāo)的實(shí)測風(fēng)向時(shí)間序列和實(shí)測表面流向時(shí)間序列。三個(gè)測站的地理位置如圖1所示,三個(gè)測站的數(shù)據(jù)基本情況如表1所示。
圖1 各個(gè)測站在珠江口的位置Fig.1 Locations of all the stations in the Pearl River Estuary
表1 三個(gè)測站數(shù)據(jù)的各項(xiàng)參數(shù)Table 1 Parameters of the data of the three stations
多尺度聯(lián)合置換熵[8]為多尺度置換熵[14]的二維形式,其構(gòu)造方法為:
(1)給定時(shí)間序列{xt,t=1,2,…,N}和{yt,t=1,2,…,N},其中N是時(shí)間序列的長度。
(2)
(2)嵌入維數(shù)等于3時(shí),對于每一個(gè)Z,都對應(yīng)著圖2中的6種子模序,所以計(jì)算聯(lián)合概率時(shí),存在d!×d!種可能的情況。
圖2 當(dāng)嵌入模數(shù)為3時(shí)的6種模序Fig.2 The six motifs when the embedding dimension is three
JPE同樣由Shannon熵定義:
JPE(d,τ)=
(3)
(4)
式中:mts(·)表示由模序空間到符號空間的映射,‖·‖表示集合的基數(shù)。當(dāng)所有的模序組合等概率出現(xiàn)時(shí),JPE具有最大值ln(d!×d!);當(dāng)僅有一種相同的模序出現(xiàn)并重復(fù)時(shí),JPE有最小值0,即JPE的取值范圍是[0, ln(d!×d!)]。
為了后續(xù)計(jì)算方便,將JPE按照最大值進(jìn)行歸一化:
(5)
(3)由于兩個(gè)時(shí)間序列之間存在相關(guān)性,因此可以定義不相關(guān)性指數(shù)IRRI[8]如下:
(6)
IRRI的定義決定了它的取值范圍是[0,1]。此外,每給定一個(gè)尺度s,都能得到一個(gè)JPE和IRRI,從而可以得到s-MJPE曲線和s-IRRI曲線。通過比較式(3)和式(6)發(fā)現(xiàn):MJPE的值越大,序列間的同步性越低;IRRI的值越小,二者的相關(guān)性就越低,同步性也越低。
由于PE并未考慮信號的振幅[15],并且使用方差對置換熵進(jìn)行加權(quán)會增大和凸顯原始數(shù)據(jù)的局部振幅[16],為了使IRRI的局部波動振幅相對減小,降低局部波動對后續(xù)統(tǒng)一計(jì)算同步性指數(shù)的影響,本文利用對數(shù)函數(shù)定義新的DI指數(shù),定義如下:
(7)
式中波動參數(shù)a>1,且a越大,IRRI的局部波動振幅越小。實(shí)踐中根據(jù)放縮需求通常取大于1的實(shí)數(shù)即可。在測試2到10之間的整數(shù)以后,發(fā)現(xiàn)此參數(shù)取5時(shí)DI指數(shù)較為穩(wěn)定。因此,本文中此參數(shù)取值為5。
同時(shí)DI指數(shù)也進(jìn)行歸一化,定義如下:
(8)
時(shí)間延遲τ≥2時(shí),由于時(shí)間間隔過大,可能會引起交叉效應(yīng),從而降低置換熵計(jì)算的準(zhǔn)確度,故而本文中τ取1;在實(shí)踐中,嵌入維數(shù)d通常取3、4、5、6、7這幾個(gè)整數(shù)值[14]。當(dāng)τ=1時(shí),嵌入維數(shù)d直接決定了可能出現(xiàn)的模序數(shù)量。此外,在聯(lián)合置換熵計(jì)算時(shí),嵌入維數(shù)需滿足(d!×d!)?N,以提高獲取可靠的統(tǒng)計(jì)結(jié)果的概率。因此,在N=337的前提下,只有選擇d=3才能滿足上述要求。
為了用一個(gè)指標(biāo)來衡量兩個(gè)時(shí)間序列的同步性,將Isync定義為:
(9)
式中:Isync的值越大,兩個(gè)序列間的同步性越高。綜合考慮大尺度區(qū)域和小尺度區(qū)域的計(jì)算結(jié)果,采用前20%尺度區(qū)間的Isync計(jì)算結(jié)果和后20%尺度區(qū)間的Isync計(jì)算結(jié)果進(jìn)行平均,得出最終的用于估計(jì)同步性的指標(biāo)α,即:
(10)
式中αF20%表示前20%尺度區(qū)間的計(jì)算結(jié)果,αL20%表示后20%尺度區(qū)間的計(jì)算結(jié)果。
本文先利用Python編程,再將計(jì)算結(jié)果導(dǎo)入Matlab進(jìn)行繪圖。當(dāng)程序計(jì)算的輸入變量是下列函數(shù)對應(yīng)的函數(shù)值時(shí),MJPE和IRRI在所有尺度上的結(jié)果均為0,此時(shí)無法計(jì)算Isync的數(shù)值。雖然下列函數(shù)均為非線性函數(shù),但由于它們在給定的離散定義域里呈現(xiàn)出單調(diào)增長的趨勢,因此無法計(jì)算出相應(yīng)的MJPE和IRRI,即式(11~13)這些非線性函數(shù)的同步性趨勢不能通過方法3.1來進(jìn)行多尺度估計(jì)。
(11)
(12)
(13)
但是當(dāng)程序計(jì)算的輸入變量是下列非線性函數(shù)對應(yīng)的函數(shù)值時(shí),計(jì)算結(jié)果相比于式(11~13)的幾組函數(shù)出現(xiàn)了明顯的變化。由于大尺度區(qū)域(位于66.67%~100%的尺度區(qū)間)的計(jì)算出現(xiàn)了一定的變異,本次計(jì)算中只考慮了計(jì)算結(jié)果有意義的尺度,并且重點(diǎn)關(guān)注小尺度區(qū)域(位于前0%~33.32%的尺度區(qū)間)的計(jì)算結(jié)果。
(14)
(15)
(16)
(17)
式中將式(14~17)分別命名為振幅變換、初相變換、相位變換和半周期滯后變換。
式(14~17)的函數(shù)圖像如圖3所示,4組函數(shù)對應(yīng)的MJPE、IRRI和Isync計(jì)算結(jié)果如圖4所示。
((a)振幅變換;(b)初相變換;(c)相位變換;(d)半周期滯后變換。(a)、(b)、(c)、(d) represents amplitude transformation, initial phase transformation, phase transformation and half-period lag transformation.)
根據(jù)上述4組函數(shù)的計(jì)算結(jié)果分析可知(見圖4),MJPE與Isync的變化趨勢有關(guān)聯(lián)且恰好相反,即當(dāng)其中一個(gè)增大時(shí),另外一個(gè)減小。由于Isync的分子是由IRRI做對數(shù)變換得出的,因此IRRI與MJPE和Isync的變化趨勢沒有明顯的關(guān)聯(lián)。Isync在小尺度區(qū)域有降低的趨勢,然后在更大的尺度范圍內(nèi)逐漸增長并且趨于恒定。
MJPE計(jì)算出的隨尺度變化的結(jié)果能夠識別出不同振幅下的同步性、時(shí)滯同步性和周期同步性其中,相位變換的MJPE計(jì)算結(jié)果在小尺度區(qū)域明顯高于其他3種情況,可認(rèn)為其在小尺度區(qū)域同步性較低,但在大尺度區(qū)域卻又展現(xiàn)出了與其他3種變換幾乎相同的結(jié)果。另外,相位變換的IRRI指數(shù)在高尺度區(qū)域也出現(xiàn)了數(shù)值突變,說明在大尺度區(qū)域其同步性也表現(xiàn)出了不穩(wěn)定性。
((a)振幅變換的計(jì)算結(jié)果;(b)初相變換的計(jì)算結(jié)果;(c)相位變換的計(jì)算結(jié)果;(d)半周期滯后變換的計(jì)算結(jié)果。(a) Calculation results for amplitude transformation; (b) Calculation results for initial phase transformation; (c) Calculation results for phase transformation; (d) Calculation results for half-period lag transformation.)
對比振幅變換和初相變換的計(jì)算結(jié)果,其他3組函數(shù)在小尺度區(qū)域振幅變換的MJPE較小,IRRI較大,這說明振幅變換在小尺度區(qū)域具有更高的同步性;對比振幅變換和半周期滯后變換的計(jì)算結(jié)果,二者在中尺度區(qū)域略有分歧,幾乎沒有明顯的差異;初相變換和半周期滯后變換本質(zhì)上都是初相變換,半周期滯后變換恰好將函數(shù)的最大值對應(yīng)的自變量數(shù)值和最小值對應(yīng)的自變量數(shù)值平移到了同一點(diǎn),二者的MJPE和IRRI的計(jì)算結(jié)果顯示半周期滯后變換在小尺度區(qū)域的同步性更高。
4種變換對應(yīng)的同步性指標(biāo)α的計(jì)算結(jié)果如表2所示??梢钥闯觯穹儞Q的同步性指標(biāo)最高,半周期滯后變換次之,相位變換最低。表中的數(shù)據(jù)說明四種變換對應(yīng)的同步性可以進(jìn)行量化分析和比較。
3個(gè)Logistic映射序列如圖5所示。對圖6、7的計(jì)算結(jié)果進(jìn)行比較分析,發(fā)現(xiàn)參數(shù)k的取值越大,Logistic序列的周期越大,混沌程度也越高,因此混沌程度的相對大小為Logistic3>Logistic2>Logistic1。由3組Logistic映射的計(jì)算結(jié)果可以看出,MJPE、IRRI和Isync呈現(xiàn)出了一定的跳躍性,局部突變比較明顯。Logistic1與Logistic2的同步性指數(shù)α更高,意味著兩個(gè)時(shí)間序列的同步性和相似度也更高,這符合Logistic序列的變化特點(diǎn)。對Logistic序列的分析結(jié)果說明,此方法在同步性的識別上有一定的效果。
表2 四種變換對應(yīng)的同步性指標(biāo)α的計(jì)算結(jié)果(保留兩位小數(shù))
圖5 三個(gè)Logistic映射序列的示意圖Fig.5 Schematic diagrams of the three logistic map series
圖6 Logistic 1與Logistic 2的MJPE、IRRI和Isync計(jì)算結(jié)果Fig.6 MJPE,IRRI and Isync results for the total wind directions and total sea surface velocity directions of Logistic 1 with Logistic 2
圖7 Logistic 1與Logistic 3的MJPE、IRRI和Isync計(jì)算結(jié)果Fig.7 MJPE,IRRI and Isync results for the total wind directions and total sea surface velocity directions of Logistic 1 with Logistic 3
3.2.1 總體數(shù)據(jù)的計(jì)算分析 根據(jù)1號測站2018年10月25日—11月1日的實(shí)測數(shù)據(jù),得到實(shí)測風(fēng)向與表面流向的總體MJPE、IRRI和Isync的計(jì)算結(jié)果如圖8所示。結(jié)果表明:當(dāng)尺度大于50時(shí),計(jì)算結(jié)果沒有明顯的變化,這是由于MJPE在大尺度區(qū)域的計(jì)算具有不穩(wěn)定性或者變異性。對于1號測站2018年11月1—8日的實(shí)測數(shù)據(jù),如圖9所示,在尺度70以內(nèi)的MJPE、IRRI和Isync計(jì)算結(jié)果走勢良好。
圖8 1號測站2018-10-25—2018-11-01實(shí)測風(fēng)向與表面流向的總體MJPE、IRRI和Isync計(jì)算結(jié)果Fig.8 MJPE,IRRI and Isync results for the total wind directions and total sea surface velocity directions of station 1 during the period from October 25th,2018 to November 1st,2018
圖9 1號站2018-11-01—2018-11-08實(shí)測風(fēng)向與表面流向的總體MJPE、IRRI和Isync計(jì)算結(jié)果Fig.9 MJPE,IRRI and Isync results for the total wind directions and total sea surface velocity directions of station 1 during the period from November 1st,2018 to November 8th,2018
由圖8~9的計(jì)算結(jié)果可以看出:(1)在小尺度區(qū)域MJPE和IRRI沒有明顯的同步性變化趨勢差異,但是在大尺度區(qū)域卻有明顯的差異,IRRI在不同的尺度區(qū)域表現(xiàn)出了明顯的波動,證明了進(jìn)行多尺度研究對于識別實(shí)測數(shù)據(jù)同步性的必要性。(2)表面風(fēng)向和表面流向的同步性指數(shù)在小尺度區(qū)域隨著尺度的增大而增大,但是在大尺度區(qū)域,由于數(shù)據(jù)包裹導(dǎo)致的變異,兩個(gè)不同時(shí)段的MJPE、IRRI和Isync計(jì)算結(jié)果表現(xiàn)出了分歧,表明在小尺度區(qū)域和大尺度區(qū)域的MJPE、IRRI和Isync計(jì)算結(jié)果受到數(shù)據(jù)包裹的影響也不同,大尺度區(qū)域更容易受到數(shù)據(jù)包裹的影響。
3.2.2 漲落潮數(shù)據(jù)計(jì)算分析 由于天文潮的漲落潮切換會影響表面流向,使用Matlab的TMD(Tidal Model Drive)工具箱推算出各測站在相應(yīng)時(shí)間段的潮位過程線,再分析各測站落潮、漲潮期間風(fēng)向和表面流向的MJPE、IRRI和Isync計(jì)算結(jié)果,如圖10、11所示。3號測站和4號測站與1號測站的計(jì)算結(jié)果類似,不再具體展示計(jì)算結(jié)果。
((a)落潮期間的計(jì)算結(jié)果;(b)漲潮期間的計(jì)算結(jié)果。(a) Calculation results for the ebb period; (b) Calculation results for the flow period.)圖10 1號站2018-10-25—11-01落潮、漲潮期間的MJPE、IRRI and Isync計(jì)算結(jié)果Fig.10 MJPE,IRRI and Isync results for the total wind directions and total sea surface velocity directions of station 1 during the ebb period and flow period from October 25th,2018 to November 1st,2018
((a)落潮期間的計(jì)算結(jié)果;(b)漲潮期間的計(jì)算結(jié)果。(a) Calculation results for the ebb period; (b) Calculation results for the flow period.)圖11 1號站2018-11-01—08落潮、漲潮期間的MJPE、IRRI and Isync計(jì)算結(jié)果Fig.11 MJPE,IRRI and Isync results for the total wind directions and total sea surface velocity directions of station 1 during the ebb period and flow period from November 1st,2018 to November 8th,2018
對漲落潮數(shù)據(jù)進(jìn)行分離,對比圖10、11可以看出,同一測站在同一時(shí)間段的MJPE、IRRI和Isync計(jì)算結(jié)果的走勢除個(gè)別突變以外基本一致。因此,僅從MJPE、IRRI和Isync計(jì)算結(jié)果來看,1號測站在漲落潮期間風(fēng)對表面流向的影響基本一致,3號測站和4號測站亦如此。
3.2.3 同步性指標(biāo)α的計(jì)算分析 通過對1號測站同步性指標(biāo)α的計(jì)算結(jié)果進(jìn)行分析比較(見表3),結(jié)果表明整體上實(shí)測的同步性指標(biāo)α數(shù)據(jù)相比模擬數(shù)據(jù)明顯偏低。這是由于實(shí)測數(shù)據(jù)的測量擾動因素多,并且受初始條件影響大,導(dǎo)致了數(shù)據(jù)具有更高的復(fù)雜度和更高的混沌程度。
總體數(shù)據(jù)的計(jì)算結(jié)果明顯低于漲落潮分離以后的計(jì)算結(jié)果,進(jìn)一步證明了漲落潮分離計(jì)算的必要性。由表3可以看出,1號測站的同步性指標(biāo)α在兩個(gè)不同的時(shí)段均出現(xiàn)了落潮>漲潮>總體的趨勢。3號測站和4號測站的計(jì)算結(jié)果亦如此,不再贅述。
1號測站在兩個(gè)時(shí)段的同步性指標(biāo)α計(jì)算結(jié)果如圖12所示,可以看出:落潮期間同步性指標(biāo)整體更大,落潮期間比漲潮期間的同步性指標(biāo)α計(jì)算結(jié)果偏大4.9%到7%,這與3號測站和4號測站的計(jì)算結(jié)果一致。從同步性指標(biāo)α統(tǒng)計(jì)結(jié)果上來看,各個(gè)測站在落潮期間風(fēng)應(yīng)力對表面流向的影響更大??傮w數(shù)據(jù)的同步性指標(biāo)α計(jì)算結(jié)果明顯偏低,可能是因?yàn)闈q落潮切換時(shí)由于受到下層海水阻力的影響,表面流向的反轉(zhuǎn)需要一定的時(shí)間,導(dǎo)致實(shí)測數(shù)據(jù)出現(xiàn)一定的時(shí)間滯后性。
表3 三組數(shù)據(jù)對應(yīng)的同步性指標(biāo)α的計(jì)算結(jié)果(保留兩位小數(shù))
圖12 1號測站的同步性指標(biāo)α計(jì)算結(jié)果Fig.12 Synchronization indicator α results for station 1
本文提出了衡量同步性的同步性指數(shù)Isync和同步性指標(biāo)α,在此基礎(chǔ)上,結(jié)合多尺度聯(lián)合置換熵來分析模擬時(shí)間序列間的同步性和實(shí)測海洋時(shí)間序列間的同步性。本文得到的結(jié)論包括以下三個(gè)方面:
(1)在前人研究成果的基礎(chǔ)上,把對時(shí)間序列本身進(jìn)行變換,改成對IRRI做類似對數(shù)變換的一種變換后再進(jìn)行歸一化,進(jìn)而提出了同步性指數(shù)Isync和同步性指標(biāo)α的一種計(jì)算方法,嘗試把多尺度分析統(tǒng)一到一個(gè)指標(biāo)中。
(2)應(yīng)用了MJPE、IRRI和同步性指數(shù)Isync和同步性指標(biāo)α,計(jì)算并分析了4組初等函數(shù)和2組混沌系統(tǒng)的同步性,證明了多尺度分析的必要性,并認(rèn)為Isync和α能夠識別時(shí)滯同步性和周期同步性,但是Isync在大尺度區(qū)域的計(jì)算結(jié)果可能會有不穩(wěn)定和變異。此外,同步性指標(biāo)α能夠綜合考慮Isync在大尺度區(qū)域和小尺度區(qū)域的計(jì)算結(jié)果。
(3)應(yīng)用上述指標(biāo)計(jì)算并分析了三個(gè)測站不同時(shí)間段的實(shí)測風(fēng)向時(shí)間序列和實(shí)測表面流向時(shí)間序列,同樣證明了多尺度分析的必要性。此外,對漲落潮分離以后的數(shù)據(jù)進(jìn)行分析,有助于判斷出在漲潮、落潮期間風(fēng)對表面流向的影響。針對實(shí)測數(shù)據(jù)的分析發(fā)現(xiàn),落潮期間同步性指標(biāo)α更大,即落潮期間風(fēng)應(yīng)力對表面流向的影響更大。
綜上所述,這種方法不僅對于研究風(fēng)應(yīng)力對表面流向的影響有指導(dǎo)意義,且對于研究模擬時(shí)間序列的同步性和實(shí)測時(shí)間序列的同步性的方法也有改進(jìn),但同步性指標(biāo)α的結(jié)構(gòu)略顯簡單,因此后續(xù)研究中可對同步性指標(biāo)α的定義進(jìn)行改進(jìn)。