劉俊 唐佑民 宋迅殊 孫志林
1 浙江大學(xué)海洋學(xué)院, 杭州310058
2 河海大學(xué)海洋學(xué)院自然資源部海洋災(zāi)害預(yù)報重點實驗室, 南京210021
3 自然資源部第二海洋研究所衛(wèi)星海洋環(huán)境動力學(xué)國家重點實驗室, 杭州310012
4 南方海洋科學(xué)與工程廣東省實驗室(珠海), 珠海519082
在熱帶印度洋存在兩個明顯的年際變率模態(tài):印度洋海盆模態(tài)(Indian Ocean Basin-wide Mode,IOBM)和印度洋偶極子模態(tài)(Indian Ocean Dipole Mode,IODM)。IOBM 表現(xiàn)為整個熱帶印度洋區(qū)域一致增暖的模態(tài),該模態(tài)一般被認為是熱帶印度洋對熱帶太平洋的厄爾尼諾—南方濤動(El Nin?o-Southern Oscillation, ENSO)的響應(yīng)(Klein et al.,1999; Venzke et al., 2000)。IOD 模態(tài)表現(xiàn)為東西部海表溫度異常(Sea Surface Temperature anomaly,SSTA)符號相反的印度洋偶極子模態(tài)(Saji et al.,1999)。印度洋偶極子的兩極分別位于:熱帶西印度 洋(10°S~10°N,50°~70°E;簡 稱 西 極 子,WIO)與熱帶東南印度洋(10°S~0°,90°~110°E;簡稱東極子,EIO)。兩極子之間SST 距平的區(qū)域平均之差定義為印度洋偶極子指數(shù)(Indian Ocean Dipole Mode Index,DMI)。
IODM 是印度洋氣候異常年際變率的主要模態(tài)(Saji et al., 1999; Ashok et al., 2001),也是全球氣候季節(jié)到年際變化的主要影響因子之一(Saji and Yamagata, 2003)。IOD 一般起始于5~7 月,在9~11 月達到峰值,12 月到來年1、2 月迅速消亡,呈現(xiàn)出明顯的季節(jié)鎖相性(McKenna et al., 2020)。IOD 事件的整個過程受到熱帶印度洋背景場的調(diào)控。以正IOD 事件為例,通常在IOD 發(fā)展的初期,即5~7 月,在熱帶印度洋夏季風(fēng)的作用下,蘇門答臘島沿岸的東南風(fēng)加強,邊界流引起的Ekman 輸運增強,離岸流造成上升流也增強,使得局地的溫躍層變淺。當(dāng)溫躍層抬升到一定的深度后,上升流的作用使得蘇門答臘—爪哇島沿岸的SST 變冷。東印度洋的SST 負異常將進一步加強熱帶印度洋東西向的SST 梯度,SST 的梯度反過來導(dǎo)致大氣對流向西流動,從而進一步增強蘇門答臘—爪哇島沿岸和赤道印度洋的東風(fēng)異常,此東風(fēng)異常有利于蘇門答臘沿岸的SST 變冷,這個過程也稱為Bjerknes 正反饋。而在來年的冬季,由于季風(fēng)轉(zhuǎn)換,背景風(fēng)場轉(zhuǎn)向,熱帶東南印度洋的東南風(fēng)轉(zhuǎn)為西北風(fēng),不再利于上升流的產(chǎn)生,從而關(guān)閉利于產(chǎn)生IOD事件的時間窗口,使得IOD 事件迅速消亡(Saji et al., 1999; Saji and Yamagata, 2003; Liu et al., 2017)。
IOD 會直接或間接影響世界許多地區(qū)的氣候,例如東非、印度尼西亞、澳大利亞、中國、歐洲和日本。IOD 的正相位時期,印度洋東南部地區(qū)的冷SST 異常會影響澳大利亞的氣候,澳大利亞周圍的異常冷水會導(dǎo)致降雨的減少(Ashok et al.,2003);IOD 還可以通過調(diào)節(jié)太平洋遙相關(guān)對日本的氣候產(chǎn)生影響,并且借由大氣遙相關(guān)影響歐洲的夏季(Behera et al., 2013);IOD 還能通過調(diào)節(jié)亞洲冬季風(fēng)影響我國多個地區(qū)的氣溫和降雨(Li and Mu, 2001)。IOD 對許多國家產(chǎn)生了巨大的社會經(jīng)濟影響,因此,提前精準預(yù)測IOD 尤為重要。目前,世界上各大預(yù)報中心多使用大氣海洋耦合氣候模型來預(yù)測IOD(Luo et al., 2007; Weller and Cai,2013; Kirtman et al., 2014)。這些動力學(xué)模型對全球氣候模擬與IOD 預(yù)報起到了巨大的推動作用。目前氣候動力學(xué)模型對IOD 的實際預(yù)測時效約為一個季度左右,而理論分析表明,IOD 的潛在預(yù)測時效在兩個季度以上(Zhao and Hendon, 2009; Shi et al., 2012; Becker et al., 2014; Liu et al., 2017; Wang et al., 2017; Wu and Tang, 2019)。因此,IOD 的實際預(yù)報技巧仍有較大的提升空間。
隨著大數(shù)據(jù)時代的來臨,深度學(xué)習(xí)由于其高效的數(shù)據(jù)處理能力(LeCun et al., 2015),在氣候科學(xué)中的應(yīng)用逐漸增多(Sahai et al., 2000; Lee et al.,2018; Rasp et al., 2018; Ham et al., 2019; Ratnam et al., 2020)。深度學(xué)習(xí)一般由多個處理層來組成計算模型,在經(jīng)過若干處理層的轉(zhuǎn)換之后,模型可以學(xué)到非常精細的組合模式和空間特征(LeCun et al., 2015; Krizhevsky et al., 2017)。 Ham et al.(2019)利用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型對ENSO 進行了預(yù)報。他們的結(jié)果顯示利用深度學(xué)習(xí)獲得的ENSO 預(yù)報技巧要高于現(xiàn)有最先進的耦合氣候動力模式,證明了深度學(xué)習(xí)在預(yù)報氣候事件中的潛力。由于IOD 的預(yù)報存在冬春季和夏季預(yù)報障礙(Feng et al., 2014; Liu et al.,2018),當(dāng)起始態(tài)為北半球冬春季時,預(yù)報后續(xù)的IOD 發(fā)展最為困難(Wu and Tang, 2019; 雷蕾等,2020)。因此,本文將使用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)處理再分析資料中的SSTA,以春季為起始來預(yù)報IOD 事件以及東、西極子的溫度變化。同時,我們應(yīng)用人工神經(jīng)網(wǎng)絡(luò)(ANN)中的多層感知機(MLP)進行相同的預(yù)報試驗,作為經(jīng)典神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果。通過比較兩種模型的預(yù)報結(jié)果,分析CNN 模型的在預(yù)報印度洋海溫上的優(yōu)勢。
本文的主要內(nèi)容如下:第二節(jié)為本文所用的數(shù)據(jù)和模型;第三節(jié)為利用CNN 和MLP 模型對DMI、EIO 指數(shù)和WIO 指數(shù)的預(yù)測結(jié)果;第四節(jié)為總結(jié)與討論。
本文訓(xùn)練模型選取的觀測資料為美國國家海洋和大氣管理局(National Oceanic and Atmospheric Administration,NOAA)的再分析資料Extended Reconstructed Sea Surface Temperature Version 5(ERSSTv5)(Huang et al., 2017),其中,訓(xùn)練集時間范圍為1854~1989 年;驗證集時間范圍為1990~2019 年(共30 年)。SSTA 所選范圍為整個印度洋區(qū)域(70°S~25°N,25°~130°E)。我們將ERSSTv5 中連續(xù)三個月(1~3 月(JFM)、2~4 月(FMA)、3~5 月(MAM))的SSTA作為CNN 的輸入數(shù)據(jù)。模型輸出為提前時間(lead month)對應(yīng)的DMI、EIOI 、WIOI。輸入和輸出的數(shù)據(jù)均是相對于氣候態(tài)的異常值,并且輸入與輸出的數(shù)據(jù)都進行了去趨勢化處理。
如圖1 所示,本文使用的CNN 模型架構(gòu)包含兩個卷積池化層,一個全聯(lián)接層和一個輸出層。卷積層的作用是提取輸入SSTA 的空間特征等關(guān)鍵信息,池化層對這些信息進行放大或平均。經(jīng)過兩次卷積池化處理后,全聯(lián)接層將特征圖展開并映射到合理的解空間。每個卷積層中有10~12 個過濾器,用于提取SSTA 的空間信息。過濾器在3×3 網(wǎng)格中提取SSTA 數(shù)據(jù)特征。平均池化層在2×2 網(wǎng)格中提取特征。全連接層具有8~10 個神經(jīng)元。因為需要回歸來生成DMI,最終輸出層是一維的。根據(jù)卷積層中過濾器和全聯(lián)接層中神經(jīng)元數(shù)目的不同,共有27 種CNN 模型的架構(gòu),分別記做C10C10D8,C10C10D9, C10C10D10, C10C11D8, ······,C12C12D10 等(C 和D 分別表示卷積層和全連接層,后面的數(shù)字代表過濾器或神經(jīng)元數(shù)量)。數(shù)據(jù)批次為每次更新CNN 模型讀取的數(shù)據(jù)量大小。訓(xùn)練中嘗試了將數(shù)據(jù)批次設(shè)置為12、24、48 和全批次(whole batch)。結(jié)果表明,CNN 模型對數(shù)據(jù)批次并不敏感,因此,數(shù)據(jù)批次設(shè)置為24。
圖1 CNN 模型框架圖Fig. 1 Architecture of the CNN (convolutional neural network) model
訓(xùn)練輸入數(shù)據(jù)為ERSSTv5 連續(xù)三個月的SSTA,時間范圍為1854~1990 年。原始ERSSTv5網(wǎng)格點由原先的180×89 被重新調(diào)整為72×36,目的是避免CNN 模型參數(shù)過多導(dǎo)致的過擬合現(xiàn)象。除了限制輸入數(shù)據(jù)大小外,本文還通過減少神經(jīng)元數(shù)量來盡量避免過擬合現(xiàn)象。如前文所述,CNN模型的神經(jīng)元數(shù)量選取地較少,這本質(zhì)上也是在限制CNN 模型的參數(shù)。CNN 模型的激活函數(shù)為Relu 函數(shù),損失函數(shù)為常用的平均絕對誤差函數(shù)MAE(Mean Absolute Erorr)。
學(xué)習(xí)率(Learning Rate,LR)是CNN 模型中相當(dāng)重要的參數(shù),它代表了模型尋優(yōu)過程的優(yōu)劣。不同CNN 模型架構(gòu)傾向于不同的LR。因此,對于這27 種CNN 模型架構(gòu)中的每一種,采用從0.05到0.0001 的LR 范圍進行訓(xùn)練測試,選取使訓(xùn)練出的DMI 與觀測值相關(guān)系數(shù)最高的LR 作為對應(yīng)CNN模型架構(gòu)的參數(shù)。隨后,在這個模型上,輸入驗證集數(shù)據(jù)來生成預(yù)測的DMI。將27 個不同架構(gòu)的CNN 模型輸出的平均值用作最終的預(yù)測DMI。
文中針對每個輸入時刻和對應(yīng)的輸出時刻建立各自的CNN 模型組合(表1)。由于使用了三種預(yù)報初始時刻,且分別預(yù)報后續(xù)7 個月的DMI,則一共有21 個CNN 模型組合??紤]到不同的27種CNN 模型架構(gòu),則總的CNN 模型數(shù)量為567(21×27)。同理,預(yù)測EIO 和WIO 的CNN 模型的數(shù)量也均為567 個。
表1 CNN 模型、MLP 模型的輸入(SSTA)與輸出(DMI)Table 1 Input (Sea Surface Temperature Anomaly, SSTA) and output (Indian Ocean Dipole Mode Index, DMI) of CNN model and MLP (multi-layer perceptron) model
MLP 模型是一種前向結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò)(ANN)模型,由輸入層、隱藏層、輸出層組成。MLP 模型所有的神經(jīng)層均為全聯(lián)接結(jié)構(gòu),且可以包含多個隱藏層。本文使用的多層感知機MLP 只包含一個隱藏的全聯(lián)接層。與本文所用的CNN 模型相比,MLP 模型缺少了卷積層和池化層,因此提取空間特征的能力相對較弱。為了與CNN 模型的預(yù)測結(jié)果進行對比,MLP 模型輸入輸出的資料和設(shè)置與CNN 一致。
et al., 2017; Wu and Tang, 2019),利用CNN 模型從JFM、FMA、MAM 三個初始狀態(tài)預(yù)報出的DMI 有效預(yù)報時效均達到7 個月,而利用MLP 模型所獲得的DMI 有效預(yù)報時效則不超過3 個月。同時,利用CNN 模型從三個初始時刻預(yù)報出DMI的RMSE 技巧均優(yōu)于MLP 模型。從相關(guān)系數(shù)和RMSE 這兩種實際預(yù)報技巧評價標準來看,CNN模型對DMI 的實際預(yù)報技巧遠勝于MLP 模型。這可能是由于CNN 能對海表溫度異常的空間結(jié)構(gòu)進行解析,其卷積與池化能提取SSTA 中的空間特征,并充分考慮SSTA 中的非線性因素,從而能夠?qū)⑤斎氲腟STA 映射到合理的解空間,實現(xiàn)對數(shù)據(jù)的高效處理。MLP 模型由于不擅長處理結(jié)構(gòu)型數(shù)據(jù),對SSTA 空間結(jié)構(gòu)特征的提取能力較弱,因此,MLP 預(yù)報的結(jié)果較差?,F(xiàn)有最先進的動力耦合模式以春季為初始狀態(tài)對DMI 的有效預(yù)報時效不到一個季度(Shi et al., 2012),這遠低于CNN 模型的預(yù)報技巧,說明CNN 模型在預(yù)報DMI 上較現(xiàn)有的動力耦合模式有明顯的優(yōu)勢。RMSE 在預(yù)報目標月11 月以后迅速減少,主要是因為IOD 在秋季成熟后迅速衰退所致。RMSE 的大小跟預(yù)報量的振幅有直接的關(guān)系。
圖3 為利用CNN 模式預(yù)報出的北半球秋季(9 月和10 月)平均的DMI 和對應(yīng)觀測值隨時間的變化。所有指數(shù)均做了標準化處理。我們以一個標準差作為判定IOD 事件的閾值。當(dāng)秋季平均的DMI 減去多年均值后超過一個標準差時,則認為發(fā)生了正IOD 事件;反之,當(dāng)小于一個負標準差時,則認為發(fā)生了負IOD 事件。根據(jù)此標準,1990~2019 年間共發(fā)生五次正IOD 事件(1994 年、1997 年、2006 年、2015 年、2019 年)和 七 次 負IOD 事件(1990 年、1992 年、1996 年、1998 年、2005 年、2010 年、2016 年)。如果標準化的預(yù)報DMI 超過1,則認為預(yù)報出了IOD 事件。由于MLP 預(yù)報北半球秋季(9 月和10 月)平均DMI 的效果較差,其相關(guān)系數(shù)不超過0.5(圖2)。因此我們僅重點分析CNN 的結(jié)果。
圖2 1990~2019 年以JFM、FMA、MAM 為起始態(tài),分別使用CNN 模型(實線)與MLP 模型(虛線)預(yù)報的DMI 與觀測值的(a)相關(guān)系數(shù)和(b)均方根誤差(RMSE)Fig. 2 (a) Correlation coefficients and (b) RMSE (root mean square errors) between the forecasted and observed DMI during 1990-2019 using CNN(solid lines) and MLP (dashed lines) models, respectively, with JFM (January-March), FMA (February-April), and MAM (March-May) as the initial conditions
圖3 1990~2019 年觀測和CNN 模式預(yù)報的北半球秋季(9 月、10 月)平均的DMI(標準化的)Fig. 3 Normalized DMI observed and forecasted by CNN model averaged in boreal autumn (September and October) during 1990-2019
以MAM 為起始態(tài),即提前預(yù)報時間為4 個月時,CNN 預(yù)報秋季平均DMI 與對應(yīng)觀測值之間的相關(guān)系數(shù)為0.72。CNN 模型正確預(yù)報出了1997 年和2019 年的強IOD 事件,但低估了1994 年強IOD 事件的強度。對于強負IOD 事件,例如1990 年、1996 年和2016 年,CNN 模型預(yù)報的強度與觀測較為符合,但CNN 模型低估了2010 年強負IOD 時間的強度。
隨著提前時間的增加,預(yù)報出的DMI 與觀測的相關(guān)系數(shù)逐漸減小。以FMA 和JFM 為初始時刻的相關(guān)系數(shù)預(yù)報技巧分別降低至0.67 和0.61。預(yù)報出的DMI 在21 世紀初出現(xiàn)較多的誤報。但對于1994 年和1997 年的強正IOD 事件,CNN 模型能夠提前5 個月(以FMA 為初始態(tài))和6 個月(以JFM 為初始態(tài))正確預(yù)報出IOD 的強度。而目前動力耦合模式以春季為初始態(tài)對這兩個強事件進行的預(yù)報均低估了IOD 事件的強度(Luo et al.,2005; Zhao and Hendon, 2009)。這說明CNN 在預(yù)報IOD 事件的強度上比現(xiàn)有的動力耦合模式存在優(yōu)勢。
印度洋東極子(EIO)在IOD 的發(fā)生發(fā)展中起到重要作用,是IOD 預(yù)報的重要區(qū)域(Luo et al.,2005)。圖4 顯示了利用CNN 模型和MLP 模型預(yù)報出的DMI 與觀測值的相關(guān)系數(shù)和RMSE 隨目標月份的變化。MLP 模型以北半球春季為起始態(tài)對EIO 的有效預(yù)報能夠提前約3~4 個月做出,而CNN 模型則能夠提前7 個月做出有效預(yù)報。同時,CNN 模型預(yù)報出EIOI 的RMSE 也明顯低于MLP模式,說明CNN 模型對EIOI 的預(yù)報技巧優(yōu)于MLP 模型。目前耦合動力模式以北半球春季為起始態(tài)對EIO 預(yù)報的有效預(yù)報時效約為4~5 個月(Luo et al., 2007; Zhao and Hendon, 2009)。這一預(yù)報技巧優(yōu)于MLP 模型但低于CNN 模型,說明CNN 模型能夠顯著改進目前對EIO 的預(yù)報技巧。
圖4 1990~2019 年以JFM、FMA、MAM 為起始態(tài),分別使用CNN 模型(實線)與MLP 模型(虛線)預(yù)報的EIO 指數(shù)與觀測值的(a)相關(guān)系數(shù)和(b)RMSEFig. 4 (a) Correlation coefficients and (b) RMSE between the forecasted and observed EIOI (East Pole Index for Indian Ocean) during 1990-2019 using CNN (solid lines) and MLP (dashed lines) models, respectively, with JFM, FMA, and MAM as the initial conditions
圖5 是以北半球春季為初始態(tài),CNN 模型預(yù)報出的北半球秋季(9 月和10 月)平均的標準化EIO 指數(shù)隨時間的變化??梢钥闯?,無論哪個初始態(tài),CNN 模型能夠較好地預(yù)報出過去30 年主要的EIO 冷暖事件,例如:1994 年、1997 年的冷事件和1998 年、2010 年的暖事件。但對于2019 年的強冷事件,無論以哪個初始狀態(tài),CNN 模型均低估了其強度。
圖5 1990~2019 年觀測和CNN 模式預(yù)報的北半球秋季(9、10 月)平均EIO 指數(shù)(標準化的)Fig. 5 Normalized EIOI index observed and forecasted by CNN mode averaged in boreal autumn (September and October) during 1990-2019
印度洋西極子(WIO)受到太平洋ENSO 事件的影響,其預(yù)報技巧通常比EIO 和DMI 高(Luo et al., 2005, 2007; Zhao and Hendon, 2009; Shi et al., 2012)。圖6 顯示了以北半球春季為初始態(tài),利用CNN 模型和MLP 模型預(yù)報出的WIO 指數(shù)與觀測的相關(guān)系數(shù)和RMSE 隨目標月份的變化。MLP 模型對WIO 指數(shù)的有效預(yù)報時效僅為一個季度不到,這遠低于目前耦合動力模式的有效預(yù)報時效(約為6~7 個月,Luo et al., 2007; Zhao and Hendon, 2009)。而CNN 模型對WIO 的有效預(yù)報也僅能提前6~7 個月做出,與目前耦合動力模式的預(yù)報技巧相近。與EIO 的預(yù)報技巧相比,CNN模型對WIO 的預(yù)報技巧更低,這與耦合動力模式的預(yù)報技巧不一致。這可能是由于我們在構(gòu)造CNN 模型時僅利用印度洋作為輸入數(shù)據(jù),缺少太平洋的ENSO 信號作為先兆因子,從而導(dǎo)致受到ENSO 影響的WIO 的預(yù)報技巧降低。
圖6 1990~2019 年以JFM、FMA、MAM 為起始態(tài),分別使用CNN 模型(實線)與MLP 模型(虛線)預(yù)報的WIO 指數(shù)與觀測值的(a)相關(guān)系數(shù)和(b)RMSEFig. 6 (a) Correlation coefficients and (b) RMSE between the forecasted and observed WIOI (West Pole Index for Indian Ocean) during 1990-2019 using CNN and MLP models, respectively, with JFM, FMA, and MAM as the initial conditions
圖7 給出了以北半球春季為初始態(tài),CNN 模型預(yù)報出的北半球秋季(9 月和10 月)平均的標準化WIO 指數(shù)隨時間的變化。當(dāng)提前時間較短時,以MAM 作為初始狀態(tài),CNN 模型基本預(yù)報出了主要的WIO 事件,例如,1996 年的冷事件以及2015 年和2019 年的暖事件。隨著提前時間的增長,CNN 模型對WIO 的預(yù)報技巧逐漸降低,并且在21 世紀初出現(xiàn)了較多的誤報。對于強WIO 事件(如1996 年、2015 年和2019 年),CNN 模型均能提前5 個月以上(以FMA 為初始條件)預(yù)報出。
圖7 1990~2019 年觀測和CNN 模式預(yù)報的北半球秋季(9、10 月)平均WIO 指數(shù)(標準化的)Fig. 7 Normalized WIOI observed and forecasted by CNN mode averaged in boreal autumn (September and October) during 1990-2019
本文使用CNN 模型和MLP 模型處理再分析資料ERSSTv5,并以北半球春季的三個初始態(tài)為起始,對IOD 模態(tài)以及印度洋東西極子的海溫變化進行了預(yù)報。結(jié)果表明:
(1)CNN 對DMI、EIOI 和WIOI 的有效預(yù)測時效均超過了6 個月。與現(xiàn)在耦合動力模式相比,CNN 模型能夠顯著提升DMI 和EIOI 的預(yù)報技巧,但對WIOI 的預(yù)報技巧提升有限。
(2)當(dāng)預(yù)報提前時間為7 個月時,CNN 模型能夠比較準確地預(yù)報1994 年、1997 年與2019 年的IOD 事件。
(3)相比于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型MLP,CNN模型對DMI、EIOI 和WIOI 的預(yù)報均有更高的預(yù)報技巧。
IOD 事件在空間結(jié)構(gòu)上的主要特征是東西印度洋的溫度梯度。由于CNN 模型擁有卷積層和池化層,能夠更好地解析圖像數(shù)據(jù)的空間結(jié)構(gòu)(Zeiler and Fergus, 2014),抓住IOD 事件東西溫度梯度的特征,從而能高效地求解SSTA 與DMI 之間映射關(guān)系,因此,CNN 模型對IOD 事件的預(yù)報技巧較優(yōu)于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)MLP 模型。
CNN 模型對WIOI 的預(yù)報不夠理想表明了在訓(xùn)練模型時,不僅要考慮局地印度洋的信號,而且還要考慮太平洋信號的遙相關(guān)作用。今后我們將就這一點進行進一步研究。
同時,深度學(xué)習(xí)中超參數(shù)的最優(yōu)解會隨具體數(shù)據(jù)集變化而不同,需根據(jù)具體的數(shù)據(jù)狀況進行逐步調(diào)試,應(yīng)避免過擬合與欠擬合現(xiàn)象發(fā)生。神經(jīng)元數(shù)量、學(xué)習(xí)率、優(yōu)化器、網(wǎng)絡(luò)層數(shù)等是模型自身超參數(shù),其調(diào)節(jié)一般都是試錯的過程。在算力充足的條件下,可對每個超參數(shù)設(shè)定一個數(shù)值或類型范圍,對它們的組合全部進行訓(xùn)練。若時間有限,在固定其他超參數(shù)為默認值的條件下,可優(yōu)先調(diào)節(jié)神經(jīng)元數(shù)量與學(xué)習(xí)率,同樣能夠取得較為理想的結(jié)果。
總而言之,我們的研究結(jié)果表明,CNN 模型在印度洋海溫預(yù)報中有著較好的表現(xiàn),深度學(xué)習(xí)方法在氣候預(yù)報中存在較大的潛力和應(yīng)用價值。