于振龍,許東峰, ,姚志雄, ,楊成浩, ,劉松楠
(1.自然資源部第二海洋研究所 衛(wèi)星海洋環(huán)境動力學(xué)國家重點實驗室,浙江 杭州 310012;2.浙江省海洋科學(xué)研究院,浙江 杭州 310012;;3.自然資源部海洋空間資源管理技術(shù)重點實驗室,浙江 杭州 310012)
太平洋年代際振蕩(Pacific Decadal Oscillation,PDO)是北太平洋年代際尺度上最主要的海表面溫度(Sea Surface Temperature,SST)異常模態(tài),PDO 的概念最早由Mantua 等[1]于1997 年首次提出,PDO 作為一種太平洋氣候變化強信號,對太平洋及其周邊地區(qū)氣候變化有著重要影響。在PDO 暖相位期間,冬季阿留申低壓加強,北太平洋呈現(xiàn)“馬蹄形”的海表面溫度異常,北太平洋中部偏冷,熱帶中東太平洋和北美沿岸偏暖;而在PDO 冷相位期間情況相反,北太平洋中部偏暖,熱帶中東太平洋和北美沿岸偏冷。PDO 指數(shù)被定義為太平洋20°N 以北海表面溫度異常場經(jīng)過經(jīng)驗正交函數(shù)分析(Empirical Orthogonal Function Analysis,EOF)第一模態(tài)的時間系數(shù),其正、負分別代表了PDO 的暖、冷位相。PDO 作為主要的年代際氣候變異之一,對太平洋動力環(huán)境、漁業(yè)收獲[1-3]和我國的降雨[4-5]、氣溫[6-7]、農(nóng)作物產(chǎn)量[8]以及南海的鹽度變化[9-10]等有重要影響,所以PDO 的預(yù)測就顯得尤為重要。
由于PDO 的復(fù)雜性以及全球變暖背景下PDO 的可預(yù)測性正逐漸降低[11],預(yù)測PDO 的相位變化對于人們來說仍具有很大的挑戰(zhàn)性。前人做過很多關(guān)于PDO 形成機理以及PDO 指數(shù)重建的研究:Mantua等[1-2]重點分析了PDO 的時間、空間特征,并定義PDO年代際指數(shù)是由PDO 指數(shù)5 年滑動平均獲得。Yasuda[12]利用樹木年輪和太平洋珊瑚數(shù)據(jù)對PDO 指數(shù)進行了氣候重建。MacDonald 和Case[13]利用加利福尼亞和阿爾伯塔的柔枝松的水文敏感年輪年表重建了公元993-1996 年的PDO 指數(shù)時間序列,同時評估了PDO 強度和周期的長期變動特征。趙傳湖等[14]利用東亞地區(qū)高分辨率的氣候代用指標,通過雙重檢驗的逐步回歸方法和小波分析等方法,重建了近400年來的北太平洋PDO 指數(shù),并分析了PDO 周期的演變特征。結(jié)果表明,北太平洋PDO 具有準20 年和準50~70 年的變化周期。Chen 等[15]通過模型數(shù)據(jù)比較,探討了千年尺度PDO 變率,并利用北太平洋副熱帶海溫的東西向差異以及東亞地區(qū)與PDO 相關(guān)的降水異常重建了PDO 指數(shù)。Schneider 和Cornuelle[16]指出,PDO 不是單一模式,而是多個物理過程的組合,PDO 的位相轉(zhuǎn)變源于Ni?o 3.4 的強迫作用以及阿留申低壓和黑潮-親潮延伸體海區(qū)變化的累積,并進一步估算了這些影響因子對PDO 的相對貢獻。與Schneider 和Cornuelle[16]的結(jié)論一致,Newman 等[17]分析了驅(qū)動PDO 的因素,改進了以前的PDO 經(jīng)驗?zāi)P蚚18]。Huang 和Wang[19]利用海表面高度、海平面壓力和海冰密集度,通過“年際增量法”將變量的年際增量作為預(yù)測對象,實現(xiàn)了對PDO指數(shù)的后報。Lu 等[20]利用一種氣候網(wǎng)絡(luò)分析的新技術(shù)來捕獲PDO 相位轉(zhuǎn)變的前兆。通過計算PDO空間格局冷區(qū)和暖區(qū)之間的聯(lián)系,在相位轉(zhuǎn)變前幾年,發(fā)現(xiàn)冷暖區(qū)域之間的負相關(guān)逐漸增強。該信號從1890 年到2000 年捕獲了6 個PDO 相位轉(zhuǎn)變,提前預(yù)警時間平均為(6.5±2.3)年。
PDO 是多個物理過程綜合作用的結(jié)果。其中,大氣強迫超前于海表溫度變率,是影響北太平洋溫度變率的主要因素。阿留申低壓通過影響北太平洋地區(qū)水汽輸送[21],間接影響北太平洋溫度,是驅(qū)動PDO 變率的主要大氣強迫之一;PDO 相位的改變影響風(fēng)場[22]和溫度場,進而帶來海表面高度的變化[23];熱含量(Ocean Heat Content,OHC)是表征海洋熱狀態(tài)的一個重要參數(shù)[24],海洋主要的熱量存儲于0~700 m 水層[25-26]。大西洋多年代際振蕩(Atlantic Multi-Decadal Oscillation,AMO)可以通過大氣遙相關(guān)影響太平洋副熱帶熱量分布,進而影響PDO[27-28];北極濤動(Arctic Oscillation,AO)在PDO 低頻變化中起著重要的作用,AO 增強會導(dǎo)致阿留申低壓增強,進而通過北太平洋海氣相互作用影響PDO[29]。格陵蘭海冰可以通過影響AO 來影響PDO 變率,海冰密集度可以用來表征海冰的變化[30]。綜上所述,海平面氣壓、海表面高度、熱含量和海冰密集度均可作為PDO 指數(shù)的預(yù)報要素進行建模。
隨著人工智能技術(shù)的發(fā)展,機器學(xué)習(xí)被應(yīng)用于各個領(lǐng)域的研究[31-33],深度神經(jīng)網(wǎng)絡(luò)成為了一種新型的研究手段。對于時間序列的預(yù)測應(yīng)用最多的是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)模型,由于RNN 模型結(jié)構(gòu)比較簡單,使用的反向傳播(Back Propagation Through Time,BPTT)算法不能適應(yīng)長時間序列數(shù)據(jù)的訓(xùn)練,容易產(chǎn)生梯度爆炸以及梯度消失的問題,無法實現(xiàn)長期記憶的效果。因此,需要一個含有存儲單元、存儲記憶功能的神經(jīng)網(wǎng)絡(luò)模型。1997 年長短期記憶(Long Short Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)模型由Hochreiter 和Schmidhuber[34]提出。LSTM 神經(jīng)網(wǎng)絡(luò)模型是RNN 模型的改進,通過增加記憶單元里的控制門限來解決RNN 模型短期記憶的問題,從而可以高效地處理長時間序列信息,實現(xiàn)對復(fù)雜函數(shù)的建模。目前,國內(nèi)外利用LSTM 神經(jīng)網(wǎng)絡(luò)模型對ENSO 預(yù)報的研究比較多[35-37],與其他統(tǒng)計預(yù)報模型相比,LSTM 神經(jīng)網(wǎng)絡(luò)模型在長時間序列上具有較強的預(yù)報能力。由于年代際變化信號的預(yù)測比較困難,部分學(xué)者主要利用氣候模型實現(xiàn)對PDO 指數(shù)的后報試驗[38-39],利用深度學(xué)習(xí)的研究還比較少。本文旨在前人研究基礎(chǔ)上,將海平面氣壓、海表面高度、海冰密集度作為PDO 指數(shù)的預(yù)報要素,新增0~700 m 水層的熱含量作為預(yù)報因子,建立LSTM 神經(jīng)網(wǎng)絡(luò)模型,實現(xiàn)對PDO 指數(shù)的預(yù)測,為PDO 指數(shù)的預(yù)測研究提供一種新的手段。
LSTM 神經(jīng)網(wǎng)絡(luò)模型在本質(zhì)上是RNN 模型的改進版本,其與RNN 模型最大的區(qū)別是增加了3 個邏輯控制單元(即控制門,包括輸入門、輸出門和遺忘門)來解決RNN 模型短期記憶問題,通過改變神經(jīng)網(wǎng)絡(luò)的記憶單元與其他部分連接的權(quán)值大小來控制信息流的輸入、輸出以及記憶單元的狀態(tài)。其中輸入門(input gate,記為it)用來控制信息是否能夠被記錄到記憶單元中;輸出門(output gate,記為ot)控制當前時間節(jié)點記憶單元中的信息是否能夠流入到當前隱藏層中;遺忘門(forget gate,記為ft)選擇性遺忘上一時刻記憶單元的信息并累加到當前時刻記憶單元中。LSTM 神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)示意圖如圖1 所示,其中,Xt為當前狀態(tài)下數(shù)據(jù)的輸入,ht為當前隱藏層,σ 和 tanh為當前記憶單元中兩個不同的激活函數(shù),“×”和“+”分別代表矩陣相乘和矩陣相加運算。
圖1 LSTM 神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)示意圖(來源于文獻[34])Fig.1 Schematic diagram of LSTM neural network model structure (from reference [34])
在LSTM 神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練過程中,首先模型把t時刻的數(shù)據(jù)特征信息輸入到輸入層中,經(jīng)過激活函數(shù)得到輸出結(jié)果。然后將輸出結(jié)果、t-1 時刻的記憶單元存儲信息和t-1 時刻隱藏層輸出結(jié)果輸入到當前LSTM 神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)處理單元中,通過3 個控制門限的處理后,輸出結(jié)果將進入下一輸出層和隱藏層,最后計算反向傳播誤差,更新各個遞歸連接權(quán)重的大小。在t時刻LSTM 神經(jīng)網(wǎng)絡(luò)模型每個記憶單元中的數(shù)據(jù)處理過程如式(1)~(6)所示:
式中,ft、it、ot為3 個控制門限;Wf、Wi、Wo分別代表了其對應(yīng)的控制門限的遞歸連接權(quán)重;bf、bi、bo是通過對應(yīng)的控制門限誤差值;ht代表t時刻隱藏層輸出值;Ct代表當前神經(jīng)元記憶狀態(tài)的記憶單元,具有隨著訓(xùn)練不斷存儲、讀取、重置和更新長時間信息的能力??刂崎T結(jié)構(gòu)由激活函數(shù)與點乘組成,公式中的激活函數(shù) σ在0~1 之間取值,tanh 在-1~1 之間取值。點乘決定了記憶單元可以傳送過去的信息量。激活函數(shù)的計算公式如式(7)和式(8)所示:
利用PDO 預(yù)測值與觀測值時間序列的均方根誤差(RMSE)、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE)評價模型預(yù)測值與觀測值的精度大小,計算公式為
本文采用多個預(yù)報要素建立多變量LSTM 神經(jīng)網(wǎng)絡(luò)模型預(yù)測PDO 指數(shù),實驗流程如圖2 所示。為了能夠預(yù)測更長時間序列的PDO 指數(shù),選取了1921-2020 年100 年的預(yù)報要素數(shù)據(jù)資料。除了海冰密集度數(shù)據(jù)以外,其他預(yù)報要素都選取了相同的研究區(qū)域(20°~60°N,120°E~100°W)。
圖2 實驗流程圖Fig.2 Experimental flowchart
首先,PDO 指數(shù)本文采用的是美國國家海洋和大氣管理局(National Oceanic and Atmospheric Administration,NOAA)基于第五代版本ERSST 擴展重建的NCEI PDO 指數(shù)數(shù)據(jù)(https://www.ncdc.noaa.gov/teleconnections/pdo/);海平面氣壓(Sea Level Pressure,SLP)數(shù)據(jù)源自哥白尼氣候變化服務(wù)(Copernicus Climate Change Service,C3S,https://cds.climate.copernicus.eu/)的CMIP5 氣候模式月平均數(shù)據(jù),該數(shù)據(jù)由NOAA 的GFDL-CM2p1 模型計算而來,水平分辨率為2.5°×1.5°;海表面高度(Sea Surface Height,SSH)數(shù)據(jù)同樣源自C3S 的CMIP5 模式數(shù)據(jù),水平分辨率為1°×1°;海冰密集度(Sea Ice Concentration,SIC)數(shù)據(jù)源自英國氣象局哈德萊中心的全球海冰和海表面溫度數(shù)據(jù)集HadISST,水平分辨率為1°×1°。
熱含量長時間序列數(shù)據(jù)獲取相對困難,本文利用熱含量計算公式獲取1921-2020 年的熱含量時間序列,所采用的數(shù)據(jù)為哈德萊中心的EN4 再分析溫鹽數(shù)據(jù)集。該數(shù)據(jù)集融合了WOD9、GTSPP、ASBO、GDACs 等數(shù)據(jù)集,并進行了質(zhì)量控制。水平分辨率為1°×1°,時間分辨率為1 個月,深度共42 層,最深達5 000 m 以上。熱含量計算方法為
式中,OHC 為熱含量,單位:J;S為數(shù)據(jù)網(wǎng)格的面積大??;ρ為海水的密度;Cp為定壓比熱容;T為海水溫度;h為熱含量計算水深(本文中h取為700 m)。
其次,采用相關(guān)性分析計算預(yù)報要素研究區(qū)域內(nèi)的所有網(wǎng)格點時間序列與PDO 指數(shù)的相關(guān)系數(shù),根據(jù)相關(guān)系數(shù)選取4 個預(yù)報區(qū)域,以下稱“預(yù)報因子”,其中,SLP 選取的是20°~30°N,160°E~180°海域范圍;SSH選取45°~55°N,175°E~175°W海域范圍;0~700m的OHC選取25°~40°N,150°~170°W海域范圍;SIC選取75°~85°N,10°W~10°E海域范圍。100年的數(shù)據(jù)時間尺度會大大降低預(yù)報要素與PDO 指數(shù)的相關(guān)性,預(yù)報要素與PDO 指數(shù)的相關(guān)系數(shù)空間分布及預(yù)報因子區(qū)域范圍如圖3 所示,預(yù)報因子在區(qū)域內(nèi)每個數(shù)據(jù)格點的時間變化與PDO 指數(shù)均滿足99%置信水平的相關(guān)性。
圖3 1921-2020 年預(yù)報要素與PDO 指數(shù)的相關(guān)系數(shù)Fig.3 Correlation coefficients of forecast elements and PDO index from 1921 to 2020
最后,計算預(yù)報因子的1921-2020 年的時間序列(異常),由于PDO 是年代際尺度上氣候內(nèi)部變率,周期通常為20~30 年,本文將PDO 指數(shù)數(shù)據(jù)利用Butterworth 低通濾波器進行了5 年的低通濾波處理,去掉高頻變化信號得到PDO 指數(shù),4 個預(yù)報因子的數(shù)據(jù)處理與PDO 指數(shù)相同,這樣不僅能夠讓LSTM 神經(jīng)網(wǎng)絡(luò)模型預(yù)測更長時間尺度的PDO 指數(shù)序列,同時可以提升模型訓(xùn)練時的訓(xùn)練效率。圖4 中從上到下依次是PDO 指數(shù)、海平面氣壓異常、海平面高度異常、0~700 m 熱含量異常以及海冰密集度異常數(shù)據(jù)。
圖4 太平洋年代際振蕩(PDO)指數(shù)以及預(yù)報因子時間序列Fig.4 Pacific decadal oscillation index and predictor time series
本文全部數(shù)據(jù)采用歸一化處理以消除量綱和數(shù)量級帶來的影響,有利于提高預(yù)測模型的收斂速度和精度。多變量LSTM 神經(jīng)網(wǎng)絡(luò)模型預(yù)測時,預(yù)測的精度對模型參數(shù)的要求較大,不同的參數(shù)組合類型對模型的預(yù)測精度影響較為明顯。LSTM 神經(jīng)網(wǎng)絡(luò)模型的性能取決于模型中超參數(shù)的設(shè)置,超參數(shù)是在模型訓(xùn)練前手動設(shè)定的訓(xùn)練變量,包括激活函數(shù)、優(yōu)化器、批大小、訓(xùn)練輪數(shù)和隱藏層節(jié)點數(shù)。為了提高模型的訓(xùn)練效率,本文提前確定不重要的超參數(shù):模型設(shè)定訓(xùn)練輪數(shù)為300 輪;學(xué)習(xí)率設(shè)置為0.005;使用自適應(yīng)矩估計(Adaptive Moment Estimation,Adam)優(yōu)化器不斷更新訓(xùn)練網(wǎng)絡(luò)權(quán)重以使損失最小。由于數(shù)據(jù)量大且為復(fù)雜矩陣,故調(diào)用GPU 進行訓(xùn)練加速。為了防止LSTM 神經(jīng)網(wǎng)絡(luò)模型出現(xiàn)過擬合的情況,通過在全連接層后添加隨機失活(dropdout)層對在正相傳遞或權(quán)值更新過程中的LSTM 神經(jīng)網(wǎng)絡(luò)模型記憶單元進行優(yōu)化,隨機失活率的大小設(shè)置為0.2。
關(guān)于模型最優(yōu)參數(shù)的確定,本文對隱藏層節(jié)點數(shù)、批大小以及學(xué)習(xí)率下降周期3 個超參數(shù)進行了組合調(diào)參,確保訓(xùn)練精度的同時也降低了模型訓(xùn)練的復(fù)雜程度。采用控制變量的方法,將隱藏層節(jié)點數(shù)分別取120層、240 層和360 層,批大小取60、120 和180,學(xué)習(xí)率下降周期取75、150 和225 輪,共27 種參數(shù)組合。每種參數(shù)組合在模型建立時都需要通過交叉驗證(Cross Validation,CV),交叉驗證是一種流行的具備魯棒性的模型性能評估技術(shù)。本文建立的是關(guān)于PDO 指數(shù)時間序列的多變量多步LSTM 神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練集和測試集在邏輯上存在時間先后順序,采用“遞增時間窗交叉驗證法”對模型進行交叉驗證,方法如圖5 所示。
圖5 遞增時間窗交叉驗證法Fig.5 Incremental time window cross-validation
該交叉驗證方法將PDO 指數(shù)數(shù)據(jù)等分成10 份,考慮到PDO 周期在20 年以上,本文將最小訓(xùn)練集設(shè)置為20 年。首先將前20 年(1921-1940 年)作為模型的訓(xùn)練集,后10 年(1941-1950 年)作為模型的測試集;將前30 年(1921-1950 年)作為模型的訓(xùn)練集,后10 年(1951-1960 年)作為模型的測試集;以此類推,直到將前90 年(1921-2010 年)作為模型的訓(xùn)練集,后10 年(2011-2020 年)作為模型的測試集。然后分別計算測試集中預(yù)測值與實際值的相關(guān)系數(shù)及均方根誤差,模型訓(xùn)練5 次后取平均結(jié)果。最終將交叉驗證的結(jié)果取平均作為該參數(shù)組合的交叉驗證結(jié)果,通過對比不同參數(shù)組合的模型平均相關(guān)系數(shù)以及均方根誤差大小,確定模型的最優(yōu)參數(shù)并利用最優(yōu)參數(shù)建立LSTM 神經(jīng)網(wǎng)絡(luò)模型,模型訓(xùn)練10 次取平均作為最終預(yù)報結(jié)果,最終將1921-2020 年的預(yù)報因子數(shù)據(jù)作為輸入,實現(xiàn)對未來10 年的PDO 指數(shù)預(yù)測。
多變量LSTM 神經(jīng)網(wǎng)絡(luò)模型調(diào)參的過程實際上是模型尋找靶心的過程,經(jīng)過交叉驗證,根據(jù)測試集與訓(xùn)練集相關(guān)系數(shù)(R)以及均方根誤差(RMSE)確定模型的最優(yōu)參數(shù),可以最大程度地保證模型的靶心處于最佳位置。模型調(diào)參結(jié)果如表1 所示,擬合效果比較優(yōu)異,所有參數(shù)組合測試集平均相關(guān)系數(shù)都在0.6~0.7 之間。其中,隱藏層節(jié)點數(shù)為360,批大小為180,學(xué)習(xí)率下降周期為75 輪的模型的平均相關(guān)系數(shù)為0.697 2,均方根誤差為0.622 1,選取該參數(shù)組合作為模型訓(xùn)練的最優(yōu)參數(shù),已在表1 中粗體顯示。
表1 交叉驗證平均結(jié)果Table 1 Cross-validation average result
圖6 為根據(jù)最優(yōu)參數(shù)建立的LSTM 模型10 次訓(xùn)練的平均擬合及預(yù)測結(jié)果。1921-2010 年為模型訓(xùn)練集擬合結(jié)果,2011-2020 年為模型測試集的擬合結(jié)果。黑色曲線代表NOAA 提供的PDO 指數(shù)觀測值;紅色曲線代表多變量LSTM 神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練結(jié)果(預(yù)測值)。PDO 指數(shù)預(yù)測值與觀測值的變化趨勢基本一致,在峰值和谷值處的差距較大。2013-2019 年的預(yù)測值比觀測值偏小,其余時間的預(yù)測值比觀測值偏大,總體來看,LSTM 神經(jīng)網(wǎng)絡(luò)模型的擬合效果比較理想;藍色曲線代表LSTM 神經(jīng)網(wǎng)絡(luò)模型對未來10 年(2021-2030 年)的低頻PDO 指數(shù)預(yù)測結(jié)果。預(yù)測結(jié)果顯示,PDO 未來10 年將一直處于冷位相,北太平洋中部出現(xiàn)SST 正異常,熱帶中東太平洋和北美沿岸出現(xiàn)SST 負異常,PDO 指數(shù)出現(xiàn)兩次波動,于2025 年出現(xiàn)最小值。
圖6 LSTM 網(wǎng)絡(luò)模型預(yù)測值及觀測值Fig.6 LSTM neural network model prediction results and true values
如圖7 所示,本文對比了不同模型對2011-2020 年P(guān)DO 指數(shù)的預(yù)測結(jié)果,包括單一變量LSTM 神經(jīng)網(wǎng)絡(luò)模型,統(tǒng)計回歸模型以及多變量支持向量回歸(Support Vector Regression,SVR)模型。其中,單變量LSTM 神經(jīng)網(wǎng)絡(luò)模型是由PDO 指數(shù)原始時間序列(來自NOAA)構(gòu)建,經(jīng)過與多變量LSTM 神經(jīng)網(wǎng)絡(luò)模型相同的交叉驗證方法確定模型最優(yōu)參數(shù)組合,并訓(xùn)練10 次取平均作為最終結(jié)果;統(tǒng)計回歸模型采用多元回歸,與多變量LSTM 神經(jīng)網(wǎng)絡(luò)模型采用相同的預(yù)報因子作為變量;多變量SVR 模型變量的選取與本文采用的多變量LSTM 神經(jīng)網(wǎng)絡(luò)模型相同。結(jié)果顯示,多變量LSTM 神經(jīng)網(wǎng)絡(luò)模型擬合效果優(yōu)于其他模型,特別是在峰值和谷值處更接近實際值。圖8 為不同模型的誤差精度評估結(jié)果,多變量LSTM 神經(jīng)網(wǎng)絡(luò)模型RMSE=0.358 0,MAE=0.298 4,MAPE=0.406 9;用PDO 指數(shù)原始時間序列構(gòu)建的單變量LSTM 神經(jīng)網(wǎng)絡(luò)模型RMSE=0.447 2,MAE=0.342 4,MAPE=0.529 1;統(tǒng)計回歸模型RMSE=0.466 1,MAE=0.409 9,MAPE=0.590 1;多變量SVR 模型RMSE=0.484 1,MAE=0.424 2,MAPE=0.629 9。從對比結(jié)果可以看出多變量LSTM 神經(jīng)網(wǎng)絡(luò)模型預(yù)測效果最好,誤差最小,與實際值擬合效果最好,其次是單變量LSTM 神經(jīng)網(wǎng)絡(luò)模型、統(tǒng)計回歸模型、多變量SVR 模型。
圖7 2011-2020 年不同模型的預(yù)測結(jié)果Fig.7 Forecast results of different models from 2011 to 2020
圖8 不同模型預(yù)測的精度評估結(jié)果Fig.8 Accuracy evaluation results of different model predictions
利用1921-2020 年的海平面氣壓、海平面高度、熱含量數(shù)據(jù)以及海冰密集度作為PDO 指數(shù)的預(yù)報要素,通過空間相關(guān)性分析選取PDO 指數(shù)預(yù)報因子,進一步將預(yù)報因子的時間序列數(shù)據(jù)進行5 年低通濾波處理,通過交叉驗證選取最優(yōu)參數(shù)組合,建立關(guān)于PDO 指數(shù)預(yù)測的多變量LSTM 神經(jīng)網(wǎng)絡(luò)模型,對比分析不同模型2011-2021 年的PDO 指數(shù)預(yù)測結(jié)果,進而利用模型實現(xiàn)了對2021-2030 年的PDO 指數(shù)的預(yù)測。通過此次研究,本文得到如下結(jié)論。
(1)基于多個預(yù)報因子數(shù)據(jù)建立的多變量LSTM神經(jīng)網(wǎng)絡(luò)模型可以有效地實現(xiàn)對PDO 指數(shù)的預(yù)測,模型經(jīng)過交叉驗證后平均相關(guān)系數(shù)和均方根誤差分別為0.70 和0.62,預(yù)測結(jié)果較為理想。
(2)多變量LSTM 神經(jīng)網(wǎng)絡(luò)模型預(yù)測效果要優(yōu)于多變量SVR 模型、統(tǒng)計回歸模型以及單變量LSTM神經(jīng)網(wǎng)絡(luò)模型,其PDO 指數(shù)預(yù)測結(jié)果誤差小、擬合效果好,可以作為一種新型的預(yù)測PDO 指數(shù)的手段。
(3)本文預(yù)測了未來10 年的低頻PDO 指數(shù)結(jié)果,結(jié)果顯示,PDO 未來10 年將一直處于冷位相,北太平洋中部將出現(xiàn)SST 正異常,熱帶中東太平洋和北美沿岸出現(xiàn)SST 負異常,PDO 指數(shù)出現(xiàn)兩次波動,于2025年出現(xiàn)最小值。
PDO 作為年代際氣候變化信號,本文建立的多變量的LSTM 人工神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)了PDO 指數(shù)的位相預(yù)測。前人的研究[19]雖然能夠有效向后預(yù)報1975-2009 年的PDO 指數(shù)(相關(guān)系數(shù)為0.81),但是其算法并不能實現(xiàn)對未來年代際時間尺度上PDO 指數(shù)的預(yù)報。本研究優(yōu)勢在于采用機器學(xué)習(xí)方法,采用更大空間范圍的預(yù)報因子,一定程度上克服了預(yù)測結(jié)果對PDO 的依賴,實現(xiàn)了對未來10 年P(guān)DO 指數(shù)的預(yù)報。然而本研究的交叉驗證試驗結(jié)果與實測值相關(guān)系數(shù)在0.6~0.7 之間,低于Huang 和Wang[19]預(yù)測的相關(guān)性,產(chǎn)生這種結(jié)果的原因可能是其預(yù)測對象為PDO 冬季(12 月、1 月、2 月)數(shù)據(jù),而本研究選取所有月份的數(shù)據(jù);其次,超參數(shù)的選取具有一定主觀性,在今后的研究中可以適當增加參數(shù)組合的數(shù)量來減小這種誤差;最后,長時間尺度理想的預(yù)測結(jié)果要求模型用更長時間的訓(xùn)練集,在更長時間尺度上的預(yù)測精度有待提高。