張綠夷 王革麗 譚桂容 吳越
1) (中國(guó)科學(xué)院大氣物理研究所,中層大氣和全球環(huán)境探測(cè)重點(diǎn)實(shí)驗(yàn)室,北京 100029)
2) (中國(guó)氣象局廣州熱帶海洋氣象研究所,廣州 510641)
3) (南京信息工程大學(xué),氣象災(zāi)害教育部重點(diǎn)實(shí)驗(yàn)室,氣象災(zāi)害預(yù)報(bào)預(yù)警與評(píng)估協(xié)同創(chuàng)新中心,氣候與環(huán)境變化國(guó)際合作聯(lián)合實(shí)驗(yàn)室,南京 210044)
4) (四川省氣候中心,成都 610072)
非線性、非平穩(wěn)系統(tǒng)的預(yù)測(cè)是一個(gè)具有重要科學(xué)意義的研究課題.最近一些工作已將收斂交叉映射算法(convergent cross mapping,CCM)用于檢驗(yàn)變量之間的因果關(guān)系,由于在CCM 算法中,相空間中相互靠近的點(diǎn)在時(shí)間上具有相似的發(fā)展趨勢(shì)和運(yùn)動(dòng)軌跡,因此該方法可以嘗試應(yīng)用于非線性、非平穩(wěn)系統(tǒng)的預(yù)測(cè)試驗(yàn)研究中.鑒于此,本文將CCM 算法分別應(yīng)用于Lorenz 系統(tǒng)和實(shí)際氣候時(shí)間序列的預(yù)測(cè)中,并檢測(cè)不同相空間重構(gòu)方法對(duì)預(yù)測(cè)效果的影響.主要結(jié)果如下:1)不論是理想Lorenz 模型還是實(shí)際氣候序列,對(duì)于單變量、多變量和多視角嵌入法3 種重構(gòu)相空間方法而言,多視角嵌入法對(duì)變量的預(yù)測(cè)效果最好,表明對(duì)于給定長(zhǎng)度的時(shí)間序列,重構(gòu)相空間中包含的信息越多,其預(yù)測(cè)能力越強(qiáng);2)將NAM (northern hemisphere annular mode)加入SAT (surface air temperature)的重構(gòu)相空間中可以改善SAT 的預(yù)測(cè)效果.在使用單變量、多變量和多視角嵌入法進(jìn)行預(yù)測(cè)時(shí),利用復(fù)雜系統(tǒng)中變量中共有信息的特性,在時(shí)間序列長(zhǎng)度一定的情況下,可以利用動(dòng)力系統(tǒng)的復(fù)雜性來(lái)增加系統(tǒng)內(nèi)的信息.基于因果檢驗(yàn)的預(yù)測(cè)建模方法,通過(guò)挖掘數(shù)據(jù)中定量信息的提取,對(duì)非線性、非平穩(wěn)系統(tǒng)預(yù)測(cè)技巧的改進(jìn)提供了一個(gè)新穎的思路.
對(duì)于氣候預(yù)測(cè)而言,目前的預(yù)測(cè)建模理論大多建立在傳統(tǒng)的統(tǒng)計(jì)預(yù)報(bào)、數(shù)值模式以及機(jī)器學(xué)習(xí)等方法上[1?5].氣候系統(tǒng)作為一個(gè)非線性、非平穩(wěn)的系統(tǒng),其過(guò)程比混沌運(yùn)動(dòng)更為復(fù)雜[6],氣候系統(tǒng)多因子間相互作用的復(fù)雜性是其預(yù)測(cè)理論和技術(shù)的瓶頸,有關(guān)非線性大氣動(dòng)力學(xué)的研究及預(yù)測(cè)依然是一個(gè)具有重大科學(xué)意義的前瞻性課題.
1980 年,Packard 等[7]提出了時(shí)間序列的相空間重構(gòu)理論,通過(guò)一維時(shí)間序列的時(shí)間延滯來(lái)恢復(fù)原系統(tǒng)的動(dòng)力學(xué);1981 年,Takens[8]提出的嵌入定理,表明可以從一維時(shí)間序列中重構(gòu)一個(gè)與原動(dòng)力系統(tǒng)在拓?fù)湟饬x下等價(jià)的相空間,奠定了非線性系統(tǒng)的理論基礎(chǔ).隨后,一系列基于這些理論的非線性時(shí)間序列分析和預(yù)測(cè)方法便應(yīng)運(yùn)而生.在非線性時(shí)間序列預(yù)測(cè)中,Farmer 等[9]給出了混沌時(shí)間序列對(duì)單變量時(shí)間序列進(jìn)行預(yù)測(cè)的方法;Casdagli[10]則比較了局域近似、全局近似和輻射近似3 種非線性預(yù)測(cè)方法的優(yōu)劣.Yang 等[11]和Wang 等[12]則參考場(chǎng)時(shí)間序列的思想,分別利用神經(jīng)網(wǎng)絡(luò)建模方法和“場(chǎng)時(shí)間序列”的局域近似預(yù)測(cè)模型,對(duì)臭氧濃度和北半球500 hPa 高度場(chǎng)進(jìn)行了預(yù)測(cè)試驗(yàn),結(jié)果表明利用場(chǎng)時(shí)間序列信息可有效提高預(yù)測(cè)技巧.
然而,在一些非線性時(shí)間序列的分析和預(yù)測(cè)中,均存在一個(gè)滿足遍歷性定理的假設(shè)[13],即該時(shí)間序列所在系統(tǒng)的驅(qū)動(dòng)力不隨時(shí)間變化.氣候系統(tǒng)作為一個(gè)復(fù)雜的非線性系統(tǒng),控制真實(shí)氣候系統(tǒng)的外部條件并非一成不變[14],此時(shí),假定的遍歷性定理也就不再成立[15].驅(qū)動(dòng)力的改變不僅破壞了系統(tǒng)的平穩(wěn)性,而且對(duì)時(shí)間序列分析和預(yù)測(cè)理論帶來(lái)新的障礙[15].特別是,如何從實(shí)際的氣候信號(hào)中識(shí)別并提取外部驅(qū)動(dòng)力因子,分析導(dǎo)致氣候變化的可能動(dòng)力機(jī)制,并將其引入氣候預(yù)測(cè)中是亟待解決的重要科學(xué)問(wèn)題之一.
近年來(lái),Verdes 等[16]和Wiskott[17]分別提出了從非平穩(wěn)時(shí)間序列中提取外強(qiáng)迫因子的理論方法.Verdes 等[16]提出的“交叉預(yù)測(cè)法”是根據(jù)局部線性映射來(lái)反演由此引起的外強(qiáng)迫因子;Wiskott[17]提出的“慢特征分析法”則是通過(guò)提取快速變化的信號(hào)中的慢變特征,從而評(píng)估一個(gè)單一的外強(qiáng)迫因子[13,14].這兩種方法都被應(yīng)用于一些非平穩(wěn)時(shí)間序列的分析中并得到了較好的結(jié)果[18,19].
此外,建立在因果關(guān)系上的驅(qū)動(dòng)力分析,近年來(lái)也得到了長(zhǎng)足的發(fā)展.Wiener[20]提出了一種因果關(guān)系的哲學(xué)概念,即因必須有助于改善果的預(yù)測(cè).在此概念基礎(chǔ)上,Granger[21]提出了著名的格蘭杰因果關(guān)系(Granger causality),然而此種方法并不適用于復(fù)雜的非線性系統(tǒng)[22,23].2012 年,生物學(xué)家Sugihara 等[24]提出了基于相空間重構(gòu)和Takens定理的收斂交叉映射算法(convergent cross mapping,CCM),該方法可以檢驗(yàn)自然界中非線性動(dòng)力系統(tǒng)中的因果關(guān)系,并已得到廣泛的應(yīng)用[25?27].例如,Zhang 等[28]利用 CCM 算法,探討了北半球環(huán)狀模(northern hemisphere annular mode,NAM)與東北亞地區(qū)冬季地面氣溫(surface air temperature,SAT)的信息傳遞,結(jié)果表明,二者存在單向因果關(guān)系,NAM 作為驅(qū)動(dòng)力因子影響東北亞地區(qū)冬季SAT.
同時(shí),由于在CCM 算法中相空間中相互靠近的點(diǎn)在時(shí)間上具有相似的發(fā)展趨勢(shì)和運(yùn)動(dòng)軌跡,還可以嘗試?yán)么朔椒▽?duì)變量進(jìn)行預(yù)測(cè).因此,本文運(yùn)用CCM 方法建立預(yù)測(cè)模型,并以Lorenz 系統(tǒng)以及東北亞地區(qū)冬季地面溫度時(shí)間序列為例,將NAM 信號(hào)加入SAT 的重構(gòu)相空間中,檢驗(yàn)對(duì)SAT的預(yù)測(cè)效果.借助因果檢驗(yàn)的手段識(shí)別影響氣候變化要素的外強(qiáng)迫因子,并將其應(yīng)用在實(shí)際的氣候預(yù)測(cè)中,檢驗(yàn)預(yù)測(cè)建模效果.本文首先簡(jiǎn)要介紹收斂交叉映射算法以及預(yù)測(cè)建模的思路,給出理想序列的預(yù)測(cè)檢驗(yàn)和包含NAM 信息的東北亞地區(qū)冬季SAT 時(shí)間序列的預(yù)測(cè)分析,對(duì)非線性、非平穩(wěn)系統(tǒng)預(yù)測(cè)技巧的改進(jìn)提供了一個(gè)新穎的思路.
CCM 算法基于相空間重構(gòu)理論和Takens 嵌入定理,其基本思想是通過(guò)兩變量間的重構(gòu)相空間的相互預(yù)測(cè)來(lái)判定二者之間的因果關(guān)系[24].若變量Y為變量X的驅(qū)動(dòng)力因子(Y影響X),利用變量X的重構(gòu)相空間MX預(yù)測(cè)Y時(shí),隨著時(shí)間序列長(zhǎng)度L的增大,鄰近點(diǎn)間的距離不斷減小,逐漸收斂于Y(t),并且與觀測(cè)值Y(t) 的相關(guān)系數(shù)會(huì)逐漸增大,且二者的相關(guān)系數(shù)不斷增大且達(dá)到收斂.
假設(shè)變量X,Y的時(shí)間序列長(zhǎng)度為L(zhǎng),重構(gòu)相空間的嵌入維度為E,采樣間隔為τ,在t時(shí)刻X和Y的重構(gòu)相空間MX,MY坐標(biāo)為
利用CCM 算法可以使用歷史軌跡上的信息來(lái)預(yù)測(cè)未來(lái)值,而不是依賴于求解固定的方程式或方程組.相空間重構(gòu)的方法是利用CCM 算法預(yù)測(cè)的關(guān)鍵.到目前為止,在動(dòng)態(tài)經(jīng)驗(yàn)?zāi)P偷目蚣苤?已提出三種不同的方法分別為:單變量嵌入法[29,30]、多變量嵌入法[31,32]多視角嵌入法[33].
單變量嵌入法使用單個(gè)變量的時(shí)間滯后值來(lái)重構(gòu)相空間,首先將預(yù)測(cè)變量的時(shí)間序列分為X,Y兩部分,然后用X的重構(gòu)相空間MX來(lái)預(yù)測(cè)Y.t時(shí)刻重構(gòu)相空間MX的坐標(biāo)為
其中,E為重構(gòu)相空間的嵌入維數(shù),τ為采樣間隔.由(7)式得到重構(gòu)流形MX={x(t)}.定義(t+1)|MX為利用重構(gòu)相空間MX預(yù)測(cè)得到的Y(t+1).
確定t時(shí)刻MX上的向量x(t),并在MX上找到距離其最近的E+1 個(gè)鄰近點(diǎn),離其最近的點(diǎn)記為x(t1),第二近的點(diǎn)為x(t2),依次類推.根據(jù)相空間的運(yùn)動(dòng)軌跡,找到E+1 個(gè)鄰近點(diǎn)在t+1 時(shí)刻的狀態(tài)點(diǎn)x(t1+1),x(t2+1)···x(t(E+1)+1).則Y(t+1)為
其中wi是MX上x(t)和其第i個(gè)鄰近點(diǎn)的距離的權(quán)重.
多變量嵌入法為在單變量嵌入的基礎(chǔ)上,使用多個(gè)變量的時(shí)間滯后來(lái)重構(gòu)相空間.例如,在M系統(tǒng)中包含C1和C2兩個(gè)變量,利用多變量嵌入法重構(gòu)M的相空間,t時(shí)刻重構(gòu)相空間的坐標(biāo)為{C1(t),C1(t–τ),C2(t)},其重構(gòu)相空間與M具有微分同胚的特點(diǎn).
多視角嵌入法則通過(guò)組合多種與預(yù)測(cè)變量有關(guān)的變量來(lái)增加重構(gòu)相空間中的信息[33],根據(jù)嵌入理論[8],即使系統(tǒng)中只存在幾個(gè)變量,通過(guò)多種有效嵌入也是可預(yù)測(cè)的.在包含n個(gè)變量的動(dòng)態(tài)系統(tǒng)中,假設(shè)嵌入維數(shù)為E,允許最大的滯后時(shí)間步長(zhǎng)為l,利用多視角嵌入法重構(gòu)相空間時(shí)共有種組合形式.根據(jù)重構(gòu)相空間中嵌入變量的不同,不同重構(gòu)相空間中包含的信息有所差異.不同的重構(gòu)相空間是從不同的角度對(duì)原始動(dòng)力系統(tǒng)進(jìn)行重構(gòu),其重構(gòu)相空間均與原始動(dòng)力系統(tǒng)的相空間微分同胚.利用CCM 算法進(jìn)行預(yù)測(cè)時(shí), 根據(jù)m個(gè)重構(gòu)相空間預(yù)測(cè)能力大小進(jìn)行排序, 通過(guò)對(duì)前k=構(gòu)相個(gè)空預(yù)間測(cè)預(yù)值測(cè)求能平力均大得小到進(jìn)最終的預(yù)測(cè)結(jié)果.盡管所有變量組合都是有效的嵌入,但是使用有限的數(shù)據(jù)可能無(wú)法很好地解決系統(tǒng)動(dòng)力學(xué)問(wèn)題.因此,多樣視角嵌入中僅使用了按樣本內(nèi)預(yù)測(cè)能力排名的前k個(gè)進(jìn)行重構(gòu),然后將從top-k重構(gòu)中預(yù)測(cè)的值平均,計(jì)算單個(gè)預(yù)測(cè)值.
至此,本文已經(jīng)簡(jiǎn)要說(shuō)明了CCM 算法以及該算法中包含的三種嵌入方法.接下來(lái)將用一組理想數(shù)據(jù)實(shí)驗(yàn)以及實(shí)際的氣候時(shí)間序列來(lái)討論CCM算法在預(yù)測(cè)上的應(yīng)用.
為了討論CCM 算法在預(yù)測(cè)上的應(yīng)用以及上述3 種嵌入方法的異同,本文將Lorenz 系統(tǒng)[34]作為理想模型來(lái)進(jìn)行實(shí)驗(yàn)設(shè)計(jì).Lorenz 模型是描述大氣對(duì)流等問(wèn)題的簡(jiǎn)化模型,其方程的表達(dá)式如下:
當(dāng)σ=10,β=8/3,ρ=28 時(shí),系統(tǒng)出現(xiàn)混沌現(xiàn)象并且產(chǎn)生奇異吸引子,其中ρ為Rayleigh 數(shù),是系統(tǒng)的控制變量.令Lorenz 系統(tǒng)的初值x(1)=y(1)=z(1)=10?17,步長(zhǎng) ?t=0.1,t取[0,8000],迭代80000 次,取后1000 個(gè)數(shù)據(jù)作為實(shí)驗(yàn)序列,并對(duì)系統(tǒng)中的x分量進(jìn)行預(yù)測(cè).
在使用單變量嵌入法進(jìn)行預(yù)測(cè)時(shí),首先要確定嵌入維數(shù),比較不同的嵌入維數(shù)E下x分量對(duì)應(yīng)的時(shí)間序列重構(gòu)相空間的預(yù)測(cè)的平均絕對(duì)誤差MAE (圖1).結(jié)果表明,當(dāng)嵌入維數(shù)E=3 時(shí),系統(tǒng)的平均絕對(duì)誤差最小,將x分量嵌入到一個(gè)三維相空間中可以很好地恢復(fù)其原始系統(tǒng)的動(dòng)力學(xué)特征.因此,當(dāng)對(duì)Lorenz 系統(tǒng)中x分量進(jìn)行預(yù)測(cè)時(shí),選擇最佳嵌入維數(shù)E=3 (見圖1),預(yù)測(cè)步數(shù)tp=1.
圖1 最佳嵌入維數(shù)E 的選取Fig.1.Selection of the best embedding dimension E..
圖2(a)—(c)給出了分別使用單變量嵌入法、多變量嵌入法、多視角嵌入法對(duì)上述Lorenz 系統(tǒng)中x分量重構(gòu)相空間的預(yù)測(cè)結(jié)果,預(yù)測(cè)步數(shù)tp=1.實(shí)驗(yàn)結(jié)果表明,在CCM 算法中三種重構(gòu)相空間方法的預(yù)測(cè)能力從大到小依次為:多視角嵌入法、多變量嵌入法、單變量嵌入法,且預(yù)測(cè)能力越強(qiáng),對(duì)應(yīng)的平均絕對(duì)誤差就越小(圖2(d)).多視角嵌入法的預(yù)測(cè)能力優(yōu)于多變量嵌入法和單變量嵌入法,說(shuō)明利用復(fù)雜系統(tǒng)中變量中共有信息的特性,可以提高對(duì)系統(tǒng)的預(yù)測(cè)能力.
圖2 (a)單變量嵌入法預(yù)測(cè)結(jié)果;(b)多變量嵌入法預(yù)測(cè)結(jié)果;(c)多視角嵌入法預(yù)測(cè)結(jié)果;(d)三種嵌入法預(yù)測(cè)結(jié)果的平均絕對(duì)誤差比較Fig.2.Forecast results:(a) Univariate embedding;(b) multivariate embedding;(c) multiview embedding;(d) average absolute error of the prediction results of the three embedding methods.
圖3 給出了利用三種嵌入方法對(duì)Lorenz 系統(tǒng)中x分量的多步預(yù)測(cè)結(jié)果,可以看出,隨著預(yù)測(cè)步數(shù)tp的增加,三種方法的的預(yù)測(cè)效果均逐漸減弱.同時(shí),考慮到真實(shí)氣候系統(tǒng)數(shù)據(jù)的長(zhǎng)度,作為初步探索,下文僅考慮了向后一步的預(yù)測(cè).
圖3 三種嵌入方法預(yù)測(cè)能力隨步長(zhǎng)的變化 (a)單變量嵌入法;(b)多變量嵌入法;(c)多視角嵌入法Fig.3.The prediction ability of three embedding methods varies with step size:(a)Univariate embedding;(b) multivariate embedding;(c) multiview embedding;.
利用Lorenz 系統(tǒng)對(duì)比了三種重構(gòu)相空間方法的預(yù)測(cè)能力并簡(jiǎn)單討論了預(yù)測(cè)能力隨預(yù)測(cè)步數(shù)tp的變化.接下來(lái)為了更好地說(shuō)明CCM 算法在預(yù)測(cè)上的應(yīng)用,將其應(yīng)用于實(shí)際大氣時(shí)間序列中,并對(duì)其預(yù)測(cè)試驗(yàn)結(jié)果進(jìn)行檢驗(yàn)比較.
1)美國(guó)氣候預(yù)測(cè)中心(Climate Prediction Center,CPC)提供的逐月北半球環(huán)狀模指數(shù)(NAM index,NAMI).
2)美國(guó)氣象環(huán)境預(yù)報(bào)中心/美國(guó)國(guó)家大氣研究中心(NCEP/NCAR)提供的 1000 hPa 逐月地面溫度,水平分辨率為2.5° × 2.5°.
本文主要研究的區(qū)域?yàn)闁|北亞區(qū)域:40°—50°(N),90°—130°(E).時(shí)間跨度為1950 年11 月—2019 年2 月.冬季定義為11 月至次年2 月.
Zhang 等[28]的工作已經(jīng)表明,NAM 與東北亞地區(qū)冬季地面氣溫SAT 存在因果關(guān)系,NAM 作為驅(qū)動(dòng)力因子能夠影響東北亞地區(qū)冬季SAT. 因此,本文在此工作基礎(chǔ)上,使用CCM 并結(jié)合單變量、多變量嵌入法及多視角嵌入法對(duì)東北亞地區(qū)冬季SAT 進(jìn)行預(yù)測(cè)試驗(yàn)研究.
首先使用單變量嵌入法進(jìn)行預(yù)測(cè)(圖4(a)),單變量嵌入法為使用單個(gè)變量的時(shí)滯特性來(lái)重建相空間.在預(yù)測(cè)試驗(yàn)中,選取東北亞地區(qū)冬季SAT 系統(tǒng)中的2 月份重構(gòu)系統(tǒng)的相空間.允許最大的滯后時(shí)間步長(zhǎng)max_lag=4,采樣間隔τ=1,預(yù)測(cè)步數(shù)tp=1,t時(shí)刻重構(gòu)相空間的坐標(biāo)為{X2(t),X2(t–τ),X2(t–2τ),X2(t–3τ)}.理論上,其重構(gòu)相空間雖然在形狀、大小方面發(fā)生了變化,但是兩個(gè)不動(dòng)點(diǎn)以及其基本的動(dòng)力特征沒(méi)有發(fā)生改變[8].然而由于時(shí)間序列長(zhǎng)度的限制,在較短的時(shí)間序列中,SAT 的重構(gòu)x吸引子非常稀疏,阻礙了對(duì)來(lái)自臨近點(diǎn)的動(dòng)力狀態(tài)的準(zhǔn)確推斷.使用單變量嵌入法對(duì)SAT 進(jìn)行預(yù)測(cè)的預(yù)測(cè)能力僅為0.12,加入NAM 信號(hào)后預(yù)測(cè)能力稍有提升,但預(yù)測(cè)效果仍不佳,其預(yù)測(cè)能力為0.18.
圖4 (a)單變量嵌入法和在目標(biāo)變量中加入NAM 信號(hào)后的預(yù)測(cè)結(jié)果;(b)多變量嵌入法的預(yù)測(cè)結(jié)果(黑色圓圈代表僅利用SAT 序列進(jìn)行預(yù)測(cè),紅色三角代表加入NAM 信號(hào)后)Fig.4.(a) Univariate embedding method and prediction result after adding NAM signal to the target variable;(b) prediction result of multivariate embedding method (black circle represents prediction using only SAT sequence,red triangle represents after adding NAM signal).
然后運(yùn)用多變量嵌入法來(lái)重構(gòu)東北亞地區(qū)冬季SAT 的相空間(圖4(b)).與單變量嵌入法不同的是,多變量嵌入法使用多個(gè)變量來(lái)重構(gòu)相空間,而不是運(yùn)用原變量的滯后值.因此在對(duì)2 月份的SAT 的相空間進(jìn)行重構(gòu)時(shí),可將其前三個(gè)月(即11,12,1 月)的值視作為系統(tǒng)中的另外三個(gè)變量,并且由于在冬季系統(tǒng)中,NAM 信號(hào)與東北亞冬季SAT 存在單向因果關(guān)系,NAM 是東北亞地區(qū)冬季SAT 的驅(qū)動(dòng)力因子,二者微分同胚,所以可將變量NAM 中的信息加入SAT 的重構(gòu)相空間中來(lái)預(yù)測(cè)SAT.分別選取1950—2018 年11 月-次年2 月的SAT 以及NAM 信號(hào),利用多變量嵌入法重構(gòu)2 月的SAT 相空間,該相空間中吸引子同樣具有微分同胚的特點(diǎn).圖4(b)中黑色圓圈代表僅用多個(gè)月份的SAT 信號(hào)嵌入進(jìn)行預(yù)測(cè)的結(jié)果,紅色三角代表加入NAM 后運(yùn)用多變量嵌入法對(duì)2 月SAT 進(jìn)行預(yù)測(cè)的結(jié)果.
對(duì)比圖4(a)和圖4(b)可以看出,多變量嵌入法的預(yù)測(cè)能力大于單變量嵌入法,將NAM 加入冬季SAT 系統(tǒng)中后,對(duì)SAT 的預(yù)測(cè)能力會(huì)顯著提高,并且預(yù)測(cè)值和觀測(cè)值之間的相關(guān)系數(shù)更高(將紅色虛線與黑色虛線進(jìn)行比較).然而,盡管多變量嵌入法的預(yù)測(cè)能力大于單變量嵌入法,SAT 的實(shí)際觀測(cè)值和預(yù)測(cè)值仍存在很大誤差,表明系統(tǒng)中仍然存在很多無(wú)法解釋的變化.此類方法可能會(huì)受到序列長(zhǎng)度的限制,并且可能會(huì)受到噪音的影響.此外,觀測(cè)誤差將導(dǎo)致精度降低,即使時(shí)間序列足夠長(zhǎng)以密集地吸引吸引子,臨近點(diǎn)也可能無(wú)法形成平滑的曲線,從而影響預(yù)測(cè)結(jié)果.
上述結(jié)果表明,單變量嵌入和多變量嵌入的方法十分依賴數(shù)據(jù)長(zhǎng)度,時(shí)間序列長(zhǎng)度越長(zhǎng),說(shuō)明序列中可能包含的信息越多,用來(lái)重構(gòu)相空間的點(diǎn)就越多;若數(shù)據(jù)長(zhǎng)度過(guò)短,則不能很好地恢復(fù)系統(tǒng)中時(shí)間序列的動(dòng)力學(xué)特性.因此在時(shí)間序列長(zhǎng)度較短時(shí),兩種方法的預(yù)測(cè)能力均不佳.但將NAM 信號(hào)加入SAT 的重構(gòu)相空間中,增加了SAT 相空間中的信息,有助于改善其預(yù)測(cè)效果.
與上述兩種嵌入方式不同,多視角嵌入通過(guò)組合多種與預(yù)測(cè)變量有關(guān)的變量來(lái)增加重構(gòu)相空間中的信息[31].選用1950—2018 年冬季SAT 和NAM,運(yùn)用多視角嵌入法對(duì)冬東北亞地區(qū)冬季SAT 進(jìn)行預(yù)測(cè),并對(duì)比其預(yù)測(cè)能力.
首先僅用東北亞地區(qū)冬季SAT 進(jìn)行預(yù)測(cè),選擇與上述單變量和多變量嵌入法相同的嵌入維數(shù)E=4,允許最大滯后時(shí)間步長(zhǎng)l=4,預(yù)測(cè)步數(shù)tp=1,使用多視角嵌入法進(jìn)行相空間重構(gòu)共有即1325 種重構(gòu)相空間.根據(jù)其預(yù)測(cè)值和觀測(cè)值的相關(guān)系數(shù)從大到小進(jìn)行排列,挑選出其中預(yù)測(cè)能力最強(qiáng)的前4 個(gè)重構(gòu)相空間,并將預(yù)測(cè)值和觀測(cè)值的相關(guān)系數(shù)進(jìn)行比較,如圖5 所示,其中k為嵌入的次數(shù).可以看出當(dāng)k取40—43 時(shí),SAT 的預(yù)測(cè)效果最好,其預(yù)測(cè)能力最大可達(dá)0.6638.
圖5 僅用東北亞地區(qū)冬季SAT 重構(gòu)相空間,(a)—(d)分別表示k 取40,41,42,43 的預(yù)測(cè)結(jié)果Fig.5.Only using Northeast Asia winter surface air temperature reconstruct the phase space:(a)–(d) represent the prediction results of k taking 40,41,42,43 respectively.
同樣地,將1950—2018 年11 月至次年2 月的NAM 信號(hào)加入SAT 的重構(gòu)相空間中,選擇嵌入維數(shù)E=4,允許最大滯后時(shí)間步長(zhǎng)l=4,預(yù)測(cè)步數(shù)tp=1,使用多視角嵌入法整合所有與預(yù)測(cè)變量有關(guān)的增量進(jìn)行相空間重構(gòu).圖6 中僅選擇了其中1 個(gè)月的NAM 加入SAT 的重構(gòu)相空間中,共有3480 種重構(gòu)相空間,挑選出其中預(yù)測(cè)能力最強(qiáng)的前4 個(gè)重構(gòu)相空間的預(yù)測(cè)值,并將預(yù)測(cè)值和觀測(cè)值的相關(guān)系數(shù)進(jìn)行比較.可以看出,當(dāng)k為30,36,31,34 時(shí)預(yù)測(cè)效果最好,預(yù)測(cè)值和真實(shí)值的相關(guān)系數(shù)最高可達(dá)0.687.
圖6 僅將2 月的NAM 信號(hào)加入SAT 的重構(gòu)相空間中,(a)—(d)分別表示k 取30,36,31,34 的預(yù)測(cè)結(jié)果Fig.6.Only adding the NAM signal in February to the reconstructed phase space of the SAT:(a)–(d) represent the prediction results of k taking 30,36,31,and 34,respectively.
圖7 所示為將11 月到次年2 月的全部NAM信號(hào)加入SAT 的重構(gòu)相空間中對(duì)SAT 的預(yù)測(cè)結(jié)果.在東北亞地區(qū)冬季溫度的重構(gòu)相空間中繼續(xù)加入NAM 信號(hào)后,其可重構(gòu)的相空間數(shù)量又有所增多,共有25334 種重構(gòu)相空間.挑選出其中預(yù)測(cè)能力最強(qiáng)的前4 個(gè)重構(gòu)相空間的預(yù)測(cè)值,并將預(yù)測(cè)值和觀測(cè)值的相關(guān)系數(shù)進(jìn)行比較,當(dāng)k為38,39,36,37 時(shí)對(duì)SAT 的預(yù)測(cè)效果最好,預(yù)測(cè)值和真實(shí)值的相關(guān)系數(shù)最高可達(dá)0.7946.
圖7 將12 月至次年2 月的NAM 信號(hào)加入SAT 的重構(gòu)相空間中,(a)—(d)分別表示當(dāng)k 取38,39,36,37 時(shí)的預(yù)測(cè)結(jié)果Fig.7.Adding the NAM signals from December to next February to the reconstructed phase space of the SAT:(a)–(d) show the prediction results when k takes 38,39,36,and 37,respectively.
可以看出,使用多視角嵌入法進(jìn)行預(yù)測(cè)時(shí),利用復(fù)雜系統(tǒng)中變量中共有信息的特性,在時(shí)間序列長(zhǎng)度一定的情況下,利用冬季動(dòng)力系統(tǒng)的復(fù)雜性來(lái)增加系統(tǒng)內(nèi)的信息,將NAM 加入SAT 的重構(gòu)相空間中可以改善對(duì)SAT 的預(yù)測(cè)效果.
表1 對(duì)比了單變量嵌入、多變量嵌入、多視角嵌入三種重構(gòu)相空間方法對(duì)1950—2018 年2 月份SAT 的預(yù)測(cè)能力(ρ)、平均絕對(duì)誤差(MAE)、均方根誤差(RMSE),得到三種嵌入方法的預(yù)測(cè)能力如下:多視角嵌入法 >多變量嵌入法 >單變量嵌入法;使用三種嵌入法預(yù)測(cè)的平均絕對(duì)誤差和均方根誤差如下:單變量嵌入法>多變量嵌入法>多視角嵌入法.經(jīng)上述對(duì)比可知,使用多視角嵌入法對(duì)變量的預(yù)測(cè)能力最強(qiáng),其對(duì)應(yīng)的均方根誤差和平均絕對(duì)誤差最小,表明對(duì)于已知長(zhǎng)度的時(shí)間序列,重構(gòu)相空間中包含的有用信息越多,預(yù)測(cè)效果越好.此外,對(duì)比僅用SAT 重構(gòu)相空間和將NAM 加入SAT 重構(gòu)相空間的預(yù)測(cè)能力可知,將NAM 加入SAT 的重構(gòu)相空間中可以改善SAT 的預(yù)測(cè)效果.
表1 多種嵌入方法的預(yù)測(cè)結(jié)果Table 1.Predicted results of multiple embedding methods.
此外,從理想數(shù)據(jù)結(jié)果和實(shí)際應(yīng)用的結(jié)果可以看出,就單變量嵌入法而言,系統(tǒng)內(nèi)部的所有信息最終都反映在單一變量時(shí)間序列的全部演化過(guò)程中,對(duì)于變量較少且系統(tǒng)中能量較大的分量所產(chǎn)生的作用很快就會(huì)體現(xiàn)在時(shí)間序列的短期變化上.而在實(shí)際的非平穩(wěn)系統(tǒng)中,系統(tǒng)的高階項(xiàng)或較弱分量產(chǎn)生的影響在短時(shí)間無(wú)法反映出來(lái),幾乎不可能從長(zhǎng)度有限的時(shí)間序列中提取系統(tǒng)的全部特征.多視角嵌入法通過(guò)整合多種與預(yù)測(cè)變量有關(guān)的變量來(lái)增加重構(gòu)相空間中的信息,從而恢復(fù)系統(tǒng)的動(dòng)力學(xué)特征,該種方法包含的信息最多,因此在實(shí)際應(yīng)用中,多視角嵌入法的預(yù)測(cè)結(jié)果要明顯優(yōu)于其他兩種嵌入方法.
將CCM 算法應(yīng)用于非線性系統(tǒng)的預(yù)測(cè),是因果分析及其預(yù)測(cè)應(yīng)用上研究進(jìn)展之一.同時(shí),它也加深了我們對(duì)非線性的氣候系統(tǒng)內(nèi)部規(guī)律的認(rèn)識(shí),使進(jìn)一步探究系統(tǒng)的驅(qū)動(dòng)機(jī)理成為可能.本文通過(guò)兩組預(yù)測(cè)試驗(yàn),討論了結(jié)合 CCM 方法,探討加入驅(qū)動(dòng)力因素對(duì)預(yù)測(cè)結(jié)果的影響并比較3 種不同預(yù)測(cè)建模方法,并得到如下結(jié)果.
1)對(duì)于理想Lorenz 模型和實(shí)際氣候時(shí)間序列,單變量、多變量和多視角嵌入法三重構(gòu)相空間方法對(duì)變量的預(yù)測(cè)能力均為:多視角嵌入法 >多變量嵌入法 >單變量嵌入法.利用多視角嵌入法對(duì)變量的預(yù)測(cè)效果最好,表明對(duì)于給定長(zhǎng)度的時(shí)間序列,重構(gòu)相空間中包含的信息越多,其預(yù)測(cè)能力越強(qiáng).
2)將NAM 加入SAT 的重構(gòu)相空間中有助于改善SAT 的預(yù)測(cè)效果.在氣候系統(tǒng)預(yù)測(cè)中,可以考慮利用復(fù)雜系統(tǒng)中變量共有信息的特性,構(gòu)建包含多種影響因子的東亞氣溫預(yù)測(cè)模型.
由于在CCM 算法中相空間中相互靠近的點(diǎn)在時(shí)間上具有相似的發(fā)展趨勢(shì)和運(yùn)動(dòng)軌跡,CCM算法在理想模型和東北亞地區(qū)冬季溫度預(yù)測(cè)上的應(yīng)用,進(jìn)一步展示了基于因果檢驗(yàn)在非線性系統(tǒng)的預(yù)測(cè)能力.然而,文中的試驗(yàn)仍是初步的.本文并沒(méi)有考慮變量之間的相互作用及其物理過(guò)程,此類問(wèn)題的深入和擴(kuò)展將是未來(lái)工作的方向.同時(shí),實(shí)際的時(shí)間序列中含有噪聲,解決預(yù)測(cè)模型對(duì)噪聲的抗干擾能力也是一個(gè)重要課題.此外,預(yù)測(cè)中對(duì)于挖掘數(shù)據(jù)中定量信息的提取,可能對(duì)觀測(cè)數(shù)據(jù)和質(zhì)量提出新的要求.