楊淑賢,零豐華,應(yīng)武杉,楊松,羅京佳
南京信息工程大學(xué) 氣候與應(yīng)用前沿研究院/氣象災(zāi)害教育部重點實驗室/氣候與環(huán)境變化國際合作聯(lián)合實驗室/氣象災(zāi)害預(yù)報預(yù)警與評估協(xié)同創(chuàng)新中心,江蘇 南京 210044
近年來,熱浪、干旱、洪澇、風(fēng)暴等極端天氣氣候事件頻發(fā),嚴(yán)重影響著當(dāng)?shù)亟?jīng)濟(jì)、工農(nóng)業(yè)發(fā)展以及人民的生命財產(chǎn)安全。例如,世界氣象組織(WMO)發(fā)布的《2020年氣候服務(wù)狀態(tài)報告》指出,2018年全球約有1.08億人遭受風(fēng)暴、洪澇、干旱和野火等災(zāi)害影響,到2030年這一數(shù)量將增加近50%,每年的損失約為200億美元。英國公益團(tuán)體基督教救濟(jì)會2020年12月28日發(fā)布報告稱,2020年大西洋出現(xiàn)30個獲得命名的颶風(fēng),打破了歷年紀(jì)錄,導(dǎo)致至少400人死亡、直接經(jīng)濟(jì)損失410億美元以上。2019—2020年澳大利亞發(fā)生規(guī)??涨暗纳交?燒毀20%的森林,燒死成百上千萬只野生動物(Komesaroff and Kerridge,2020)。由此可見,氣候變化帶來的影響已不容小覷,并且氣候變化具有很強的敏感性,往往海洋溫度變化0.5 ℃就能引發(fā)強烈的海氣相互作用(Trenberth,1997;Trenberth and Stepaniak,2001),導(dǎo)致全球多地的氣候發(fā)生異常(Rasmusson and Wallace,1983;Glantz et al,1991;McPhaden et al.,2006),影響人類社會的進(jìn)步和發(fā)展。
為了更好地應(yīng)對環(huán)境以及氣候變化,從古至今人類一直在試圖理解客觀世界和預(yù)測未來。預(yù)測的方法和手段已經(jīng)發(fā)生了天翻地覆的變化,地球科學(xué)領(lǐng)域的預(yù)測也從古希臘哲學(xué)推理發(fā)展到數(shù)值模式預(yù)報。雖然目前數(shù)值天氣預(yù)報取得了很好的進(jìn)展,但是氣候預(yù)測水平并沒有很大的提高(Reichstein et al.,2019),準(zhǔn)確的短期、長期氣候預(yù)測以及洪澇干旱等極端事件的預(yù)測仍然是主要挑戰(zhàn)。目前氣候預(yù)測主要分為兩種方式,一種是基于預(yù)測對象和預(yù)測因子之間線性關(guān)系的傳統(tǒng)統(tǒng)計方法,例如多元線性回歸(Multiple Linear Regression,MLR)(Cannon and McKendry,2002;Mote,2006;Mekanik et al.,2013)、主成分分析(Principal Component Analysis,PCA)(Ehrendorfer,1987;McCabe and Dettinger,2002;Moradkhani and Meier,2010)、奇異值分解(Singular Value Decomposition,SVD)(Yun et al.,2003;Qiu et al.,2007;Fattorini and Brandini,2020)等。這種統(tǒng)計預(yù)報關(guān)系大多是不隨時間變化的,計算比較簡單,依據(jù)歷史資料建立的模型和當(dāng)前實際狀態(tài)可快速預(yù)測未來,但這種方法并沒有充分利用物理知識,也難以準(zhǔn)確抓住預(yù)測對象和預(yù)測因子之間復(fù)雜的非線性關(guān)系。另一種是基于物理定律對偏微分方程組加入初始條件和邊界條件的動力數(shù)值模式預(yù)報,動力模式可以模擬現(xiàn)象間的非線性關(guān)系和預(yù)測每一個事件及其不同的影響,迄今為止世界主要國家研發(fā)了大量天氣和氣候預(yù)測系統(tǒng),包括南京信息工程大學(xué)氣候預(yù)測系統(tǒng)(賀嘉櫻等,2020)等。但是純動力模式預(yù)測存在兩個主要的缺陷:一是數(shù)值模式的研發(fā)往往需要耗費大量的資源,模式性能的提高十分不易,且普遍存在各種較明顯的系統(tǒng)性模式偏差以及空間分辨率不足等問題,限制了預(yù)測技巧;二是數(shù)值模式預(yù)測技巧的高低還取決于初始場,即資料同化方法的好壞以及集合預(yù)報方案的構(gòu)建,尤其是氣候預(yù)測往往需要研發(fā)較好的耦合資料同化方案以及充分考慮觀測資料和各分量模式物理過程的諸多不確定性,使得整個預(yù)測系統(tǒng)的構(gòu)建十分復(fù)雜(Luo et al.,2008,2015)。
隨著數(shù)據(jù)信息科學(xué)與觀測技術(shù)和設(shè)備的快速發(fā)展,人們?yōu)榱烁玫乇O(jiān)測、模擬和預(yù)測大氣和海洋的變化,利用衛(wèi)星遙感、浮標(biāo)、雷達(dá)、固定觀測臺站等各類手段收集了大量的地球系統(tǒng)數(shù)據(jù),目前數(shù)據(jù)量遠(yuǎn)超了幾十PB。如此龐大的數(shù)據(jù)量,已經(jīng)遠(yuǎn)遠(yuǎn)超過了傳統(tǒng)統(tǒng)計方法處理數(shù)據(jù)和理解數(shù)據(jù)的能力。近年來隨著人工智能方法爆發(fā)式發(fā)展,研究人員發(fā)現(xiàn)人工智能方法可以幫助地學(xué)研究者更加高效地處理地球系統(tǒng)數(shù)據(jù),為地球科學(xué)研究開啟了一個新的方向,例如Shi et al.(2015,2017)。
人工智能的概念最早于1956年被提出(Crevier,1993),機(jī)器學(xué)習(xí)是一種實現(xiàn)人工智能的方法,早期的算法包括決策樹、神經(jīng)網(wǎng)絡(luò)、聚類、貝葉斯分類、支持向量機(jī)、遺傳編程等(Kotsiantis et al.,2006;Dey,2016)。隨著計算能力的大大提升,深度學(xué)習(xí)是目前備受關(guān)注的機(jī)器學(xué)習(xí)方法之一,它由多個處理層組成并通過學(xué)習(xí)輸入數(shù)據(jù)來提取特征(LeCun et al.,2015)。這種方法利用包含多個隱含層的神經(jīng)網(wǎng)絡(luò)通過擬合的方式將研究目標(biāo)與輸入數(shù)據(jù)構(gòu)建聯(lián)系,從而解決實際問題。當(dāng)然,深度學(xué)習(xí)模型離不開大量的訓(xùn)練數(shù)據(jù),隨著可分析的數(shù)據(jù)量不斷增長,模型的性能也會逐步提高。地球科學(xué)擁有大量可使用的觀測和模式模擬數(shù)據(jù),這使得人工智能可以應(yīng)用于大氣和海洋預(yù)測(Jones,2017)。早在20世紀(jì)80年代中期,人工智能技術(shù)便應(yīng)用于氣象領(lǐng)域,許多學(xué)者一致認(rèn)為大氣科學(xué)是一門非常適合應(yīng)用人工智能的學(xué)科(Campbell and Olson,1987;Elio et al.,1987;Schizas et al.,1991;Kuligowski and Barros,1998;Malmgren and Winter,1999;Dueben and Bauer,2018;Rolnick et al.,2019)。近年來人工智能迎來了第3次發(fā)展浪潮并在多個領(lǐng)域的大數(shù)據(jù)分析中取得成功,有關(guān)人工智能預(yù)測氣候的論文數(shù)量也越來越多(圖1),我國發(fā)布了《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃(2018—2020)》以抓住歷史機(jī)遇,促進(jìn)人工智能產(chǎn)業(yè)發(fā)展,這也給人工智能技術(shù)應(yīng)用于氣候預(yù)測提供了政策支持。目前人工智能給擁有眾多觀測、模擬和再分析資料數(shù)據(jù)的大氣和海洋學(xué)科的發(fā)展帶來了新的機(jī)遇和挑戰(zhàn),將在下面的章節(jié)中一一討論利用人工智能預(yù)測氣候的研究進(jìn)展。
圖1 美國地球物理協(xié)會上有關(guān)機(jī)器學(xué)習(xí)應(yīng)用的會議摘要數(shù)量Fig.1 Number of conference abstracts about machine learning application according to the AGU website
1.1.1 資料同化
資料同化是一種利用時間演化規(guī)律和物理特性的一致性約束,在數(shù)值模式的動態(tài)運行過程中融合新的觀測數(shù)據(jù)的方法(Bouttier and Courtier,2002)。它是數(shù)值模式預(yù)測的一個重要步驟,特別是在大氣和海洋科學(xué)方面,可以為大氣和海洋數(shù)值預(yù)報系統(tǒng)提供準(zhǔn)確、合理的初始場。資料同化是一種行之有效的方法,它解決了不均勻的空間和時間數(shù)據(jù)分布和冗余以便為模式提供大量可用數(shù)據(jù)集,傳統(tǒng)的同化方法包括逐步訂正法、最優(yōu)插值法、卡爾曼濾波和變分方法。然而這些方法不能完全克服它們不切實際的假設(shè),特別是線性、正態(tài)性、馬爾科夫過程、基礎(chǔ)數(shù)學(xué)模型知識和零誤差協(xié)方差等(Gilbert et al.,2010)。Geer(2021)提出機(jī)器學(xué)習(xí)和數(shù)據(jù)同化有很多共同點,都能通過“inverse methods”從數(shù)據(jù)中了解世界,兩者可以在貝葉斯統(tǒng)計方法下統(tǒng)一起來。近年來,許多學(xué)者利用人工智能改進(jìn)數(shù)據(jù)同化方法,例如Wang et al.(2020)通過構(gòu)建集成卡爾曼濾波器(Ensemble Kalman Filter,EnKF)和高斯過程(Gaussian Process,GP)誤差訂正的混合模型來解決不同深度土壤水分?jǐn)?shù)據(jù)同化模型的誤差,發(fā)現(xiàn)EnKF-GP模型可以取得很好的效果,尤其是在輸入大量數(shù)據(jù)和相關(guān)的氣象數(shù)據(jù)后。Brajard et al.(2021)提出利用神經(jīng)網(wǎng)絡(luò)預(yù)測集成卡爾曼濾波后截斷模型的誤差并將預(yù)測的誤差加入模型中,這種混合模型預(yù)測結(jié)果更優(yōu)于單獨的截斷模型。Wu et al.(2021)提出多層感知器(Multi-Layer Perceptron,MLP)來學(xué)習(xí)四維變分(Four-Dimensional Variational,4DVAR)的同化過程,這種快速數(shù)據(jù)同化方法(Fast Data Assimilation,FDA)的單次分析時間比4DVAR快534倍,證明其可以取代傳統(tǒng)的同化方法,解決計算量大、運行時間長的問題(表1)。Arcucci et al.(2021)使用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)模型來學(xué)習(xí)資料同化過程,這種深度數(shù)據(jù)同化(Deep Data Assimilation,DDA)方法使得模型誤差在每一次迭代過程中都可以不斷減少。此外,Jin et al.(2019)將長短時記憶(Long Short Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)用于沙塵暴預(yù)報的資料同化,通過對PM濃度觀測資料進(jìn)行處理,去除PM濃度中的非粉塵部分,使得PM濃度能更好地模擬沙塵暴過程。由此可見,基于機(jī)器學(xué)習(xí)的資料同化方法不僅可以取代傳統(tǒng)的資料同化方案并極大地提高計算速度,還可以進(jìn)一步減少氣候預(yù)測系統(tǒng)的初始場誤差。
表1 FDA和4DVAR的運行(分析)時間的對比(引自Wu et al.,2021)
1.1.2 參數(shù)化過程
準(zhǔn)確的數(shù)值預(yù)報系統(tǒng)除了需要數(shù)據(jù)同化方案提供真實且與模式物理過程協(xié)調(diào)的初始場之外還需要模擬性能高的數(shù)值模式,而數(shù)值模式的性能往往受到次網(wǎng)格物理過程參數(shù)化的影響。比如,云和對流是地球氣候系統(tǒng)最重要最復(fù)雜的現(xiàn)象(Krasnopolsky et al.,2013),由于輻射傳輸過程、水汽凝結(jié)蒸發(fā)過程等次網(wǎng)格過程在模式中很難直接模擬出來,需要用大尺度變量描述這些次網(wǎng)格過程的統(tǒng)計效應(yīng)并作為某些物理量的源或匯包含在大尺度運動方程中,即參數(shù)化方案。大氣和海洋的大尺度環(huán)流模式(General Circulation Models,GCMs)是氣候模擬和數(shù)值天氣預(yù)報的重要工具。GCMs基于描述解析動力學(xué)和熱力學(xué)(基于能量、動量和質(zhì)量守恒定律)的方程和表示次網(wǎng)格過程的參數(shù)化方案。數(shù)值模式預(yù)測中這些巨大而長期存在的不確定性根源于參數(shù)化方案的不確定性(Schneider et al.,2017)?;谖锢砟J捷敵隼脵C(jī)器學(xué)習(xí)來訓(xùn)練一個統(tǒng)計模型可以很好地表示次網(wǎng)格物理過程,例如基于云解析模型(Cloud-Resolving Model,CRM)的輸出結(jié)果利用機(jī)器學(xué)習(xí)來訓(xùn)練參數(shù)化模型,也稱為超參數(shù)化(Ukkonen and M?kel?,2019)。目前CRM已經(jīng)能減少次網(wǎng)格過程在粗糙網(wǎng)格模式短期模擬中帶來的誤差,但由于計算資源的限制,往往只能用于短時間的模擬試驗。在氣候模擬和預(yù)測中由于計算資源要求過高,許多學(xué)者開始利用深度學(xué)習(xí)基于短時間云解析模式的結(jié)果來訓(xùn)練和構(gòu)建傳統(tǒng)參數(shù)化方案的人工智能替代方案,例如Krasnopolsky et al.(2013)使用神經(jīng)網(wǎng)絡(luò)集合從CRM模擬的數(shù)據(jù)中學(xué)習(xí)隨機(jī)對流參數(shù)化,并在NCAR CAM(National Center of Atmospheric Research Community Atmospheric Model)中進(jìn)行試驗,得到了合理的熱帶太平洋地區(qū)10 a氣候模擬。Rasp and Lerch(2018)利用深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練出模擬大氣中次網(wǎng)格對流過程的替代模型,可以再現(xiàn)CRM模擬的平均氣候(圖2)。基于Relaxed Arakawa-Schubert (RAS)參數(shù)化方案(Moorthi and Suarez,1992)的輸出,O’Gorman and Dwyer(2018)評估了利用隨機(jī)森林(Random Forest,RF)方法訓(xùn)練出的模型在GCM模擬中的性能,這種方法下的GCM運行穩(wěn)定且準(zhǔn)確地捕獲如極端降水值等重要的氣候統(tǒng)計數(shù)據(jù),也能很好地應(yīng)對全球變暖,并且認(rèn)為機(jī)器學(xué)習(xí)模型可以用來更好地理解潛在的物理過程。此外,還有一種方法就是通過機(jī)器學(xué)習(xí)構(gòu)建高分辨率模型或利用高分辨率觀測資料來優(yōu)化GCMs的參數(shù)(O’Gorman and Dwyer,2018)。根據(jù)Lorenz’96模式的輸出進(jìn)行訓(xùn)練,Gagne et al.(2020)通過輸入不同噪聲評估生成對抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)得到的隨機(jī)參數(shù)化模型,發(fā)現(xiàn)GAN可以直接從數(shù)據(jù)中學(xué)習(xí)到次網(wǎng)格過程的隨機(jī)參數(shù)化。Yuval and O’Gorman(2020)使用隨機(jī)森林方法從三維高分辨率大氣模式的輸出結(jié)果中學(xué)習(xí)次網(wǎng)格過程的參數(shù)化。機(jī)器學(xué)習(xí),尤其是神經(jīng)網(wǎng)絡(luò),可以模擬云和對流中的熱量和水汽的垂直輸送以及輻射與云和水蒸氣的相互作用(Gentine et al,2018)。這些機(jī)器學(xué)習(xí)技術(shù)可以與任意數(shù)值模式組件相結(jié)合,可以更準(zhǔn)確地把大氣和海洋等數(shù)值模式中復(fù)雜的次網(wǎng)格物理過程的影響模擬出來,進(jìn)而取代傳統(tǒng)的參數(shù)化方案?;跈C(jī)器學(xué)習(xí)的參數(shù)化方案已被開發(fā)用于輻射傳輸(Chevallier et al.,1998;Belochitski et al.,2011)以及對流和邊界層過程(Krasnopolsky et al.,2010;Brenowitz and Bretherton,2018)。目前也在探索將機(jī)器學(xué)習(xí)用于次網(wǎng)格湍流建模(Ling et al.,2016;Wang et al.,2016)。機(jī)器學(xué)習(xí)方法與數(shù)值模式融合,可以更有效地改進(jìn)數(shù)值模式的模擬性能以及大幅提高計算效率,進(jìn)而應(yīng)用于氣候模擬和預(yù)測,可以對氣候模式的發(fā)展和氣候預(yù)測水平的提高帶來深遠(yuǎn)的影響。
圖2 平均對流和輻射次網(wǎng)格加熱率ΔTphy(a1—a3;×10-5)、SPCAM的平均溫度以及NNCAM和CTRLCAM相對于SPCAM的偏差(b1—b3;黑色虛線表示對流層頂?shù)拇笾挛恢?由等值線決定)、大氣頂部和降水的平均短波(太陽)和長波(熱)凈通量(c1—c3)。結(jié)果均為5 a經(jīng)向平均值,并考慮了各緯度的面積加權(quán)。其中SPCAM為Superparameterized Community Atmosphere Model v3.0,NNCAM為神經(jīng)網(wǎng)絡(luò)次網(wǎng)格模型,CTRLCAM是傳統(tǒng)參數(shù)化模型(引自Rasp et al.,2018)Fig.2 (a—c) Longitudinal and 5-year temporal averages.(a1—a3) Mean convective and radiative subgrid heating rates ΔTphy;×10-5.(b1—b3) Mean temperature T of SPCAM and biases of NNCAM and CTRLCAM relative to SPCAM.The dashed black line denotes the approximate position of the tropopause,determined by contour.(c1—c3) Mean shortwave (solar) and longwave (thermal) net fluxes at the top of the atmosphere and precipitation.Note that the latitude axis is area weighted (adapted from Rasp et al.,2018)
1.1.3 偏微分方程組求解
既然數(shù)值預(yù)報模式內(nèi)的各種組件可以被替換,近年來有學(xué)者嘗試?yán)萌斯ぶ悄艿姆椒▽?shù)值預(yù)報中的動力學(xué)、熱力學(xué)等偏微分方程(Partial Differential Equation,PDE)直接求解,從而通過人工智能方法替換掉數(shù)值模式的差分結(jié)構(gòu)。通常偏微分方程求解只能借助計算機(jī)采用數(shù)值方法求近似解而不可能求得解析解。計算機(jī)無法處理連續(xù)性問題只能離散化,常見的方法就是有限差分方法和譜方法。有限差分方法簡單且邊界條件易于處理,但逼近函數(shù)的連續(xù)性差,模擬的波動移速往往偏慢,在球坐標(biāo)中極點不好處理以及非線性項的計算容易出現(xiàn)混淆誤差等。而譜方法是基于某種正交函數(shù)基底離散化方程組,將大氣偏微分方程組化為常微分方程組求解,可以給出精確的空間導(dǎo)數(shù)的計算,在球坐標(biāo)系不存在地球極點問題,但不易處理復(fù)雜邊界問題。人工智能方法在處理離散化以及復(fù)雜的邊界問題中都有自己獨特的方式,例如Long et al.(2018)提出一種新的前饋深度網(wǎng)絡(luò)(PDE-Net)以準(zhǔn)確模擬復(fù)雜系統(tǒng)的動力學(xué)和揭示隱藏的偏微分方程,與有限差分方法相比,此方法通過卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Networks,CNN)能有效捕捉物理場邊界特征,再構(gòu)建傅立葉微分算子將整個物理場的變化趨勢進(jìn)行提取,這種微分算子的構(gòu)建和網(wǎng)絡(luò)的非線性響應(yīng)都具有極強的靈活性。而后又提出PDE-Net2.0版本,對PDE-Net版本進(jìn)行改進(jìn),通過卷積來對微分算子數(shù)值進(jìn)行逼近,利用符號多層神經(jīng)網(wǎng)絡(luò)恢復(fù)模型。相較于PDE-Net,這種方法通過學(xué)習(xí)微分算子和潛層PDE模型的非線性響應(yīng)函數(shù),具有最大的靈活性和表達(dá)能力,能預(yù)測較長時間的動力學(xué)過程(Long et al.,2019)。Bar-Sinai et al.(2019)提出了基于已知基本方程的實際解利用神經(jīng)網(wǎng)絡(luò)擬合偏微分方程近似解的方法,此方法更加精確,能夠求解低分辨率網(wǎng)格上的方程。此外,也有學(xué)者通過機(jī)器學(xué)習(xí)算法的改進(jìn),使得原本的算法不受限于特定的邊界和初始條件進(jìn)行模擬。Raissi et al.(2020)提出了一種“隱藏的流體力學(xué)”網(wǎng)絡(luò)框架(Hidden Fluid Mechanics,HFM),將六個由原始流體物理方程推導(dǎo)而來的公式加入網(wǎng)絡(luò)框架中。這個全新的框架既有人工智能的高效性、非線性,又有流體力學(xué)的物理約束,該框架對流體物理數(shù)據(jù)的模擬不僅超越了純粹使用機(jī)器學(xué)習(xí)進(jìn)行數(shù)據(jù)學(xué)習(xí)的效果、更是超過了傳統(tǒng)的使用離散方法求解納維-斯托克斯方程(Navier-Stokes equations,N-S equations)的方法(圖3)。
圖3 通過圓柱體矩形訓(xùn)練區(qū)域的二維流動:(a)輸入的濃度;(b)人工智能模型回歸出的濃度。根據(jù)納維-斯托克斯方程由圖(b)回歸出來的速度場u(c)、v(d)和壓力場p(e)以及用來對照的同一時刻速度場u(f)、v(g)和壓力場p(h)。其中橫縱坐標(biāo)表示二維流動的方向,數(shù)值分別表示沿著x,y方向的位移。引自Raissi et al.(2020)Fig.3 2D flow past a circular cylinder with rectangular training domain:(a) A representative snapshot of the input data on the concentration of the passive scalar.(b) The same concentration field regressed by the algorithm.The algorithm is capable of accurately regressing the velocity u (c),v (d),and the pressure p (e) fields (according to Navier-Stokes (NS) equations).The reference velocity (f—g) and pressure (h) fields at the same point in time are plotted for comparison.Finally,the horizontal and vertical coordinates represent the directions of the two-dimensional flow (adapted from Raissi et al.,2020)
數(shù)值天氣預(yù)報系統(tǒng)通過改進(jìn)模式和同化觀測數(shù)據(jù),技能已經(jīng)改進(jìn)許多(Magnusson and K?llén,2013),也由于計算能力的提高,實現(xiàn)了更高的模式分辨率和更全面的數(shù)據(jù)同化(Bauer et al.,2015)。但在摩爾定律消亡的情況下,這一進(jìn)展不太可能長期繼續(xù)下去。在這種情況下,模式后處理變得更加重要,有助于在越來越有限的計算資源下推動技能提高。人工智能是開發(fā)更強大模式后處理方法的主要候選者,將人工智能/機(jī)器學(xué)習(xí)應(yīng)用于大氣科學(xué)問題的最成熟方面可能就是模式輸出的后處理(Haupt et al.,2021)。
1.2.1 人工智能預(yù)測模型
圖4 1982—2019年秋季(a)和冬季(b)Nio3.4海溫指數(shù)的相關(guān)系數(shù)預(yù)測技巧隨預(yù)測時效(提前1—24個月)的分布(紅色為CNN模型、藍(lán)色為南京信息工程大學(xué)氣候預(yù)測系統(tǒng)(NUIST-CFS1.0)以及其他顏色為來自北美多模式(NMME)的動力模式預(yù)測系統(tǒng)的結(jié)果)。CNN模型(c)和NUIST-CFS1.0(d)對逐季(3個月平均)Nio3.4海溫指數(shù)的相關(guān)系數(shù)預(yù)測技巧,加斜線部分表示相關(guān)系數(shù)技巧超過0.5。(c)和(d)引自Ham et al.(2019)Fig.4 The correlation skill of Nio3.4 SST index in boreal autumn (a) and winter (b) as a function of the forecast lead month in the CNN model (red),NUIST-CFS1.0 (blue),and the dynamical forecast systems included in the North American Multi-Model Ensemble (NMME) project (the other colors).The validation (i.e.,hindcast) period is 1982—2019.The correlation skill of the Nio3.4 index in each target season based on the CNN model (c) and NUIST-CFS1.0 (d).The hatching highlights the forecasts with correlation skill exceeding 0.5.(c) and (d) are adapted from Ham et al.(2019)
1.2.2 數(shù)值模式產(chǎn)品釋用
1)誤差訂正
數(shù)值模式是利用方程組和約束條件來模擬氣候系統(tǒng),由于未能充分代表各類尺度物理過程和離散化算法缺陷等各種因素導(dǎo)致的偏差常常使得氣候模擬和預(yù)測的性能偏低。模式誤差是當(dāng)前數(shù)值天氣預(yù)報和氣候預(yù)測提高準(zhǔn)確性和可靠性的主要障礙之一。模式預(yù)測誤差來自初始場誤差、模式誤差以及外部強迫場誤差等(Hawkins and Sutton,2009,2011;Deser et al.,2012a,2012b;Sriver et al.,2015;Yao et al.,2016),主要分為系統(tǒng)性誤差和時變誤差。系統(tǒng)性誤差又稱為氣候漂移,是由于模式存在偏差,從初始真實場開始經(jīng)過長期積分會趨向于模式內(nèi)在的統(tǒng)計平衡狀態(tài)(即模式氣候態(tài)),而模式氣候態(tài)與實際氣候態(tài)之間存在偏差。而時變誤差是模式誤差中依賴于時間變化的部分,隨環(huán)流型而變化(Johansson and Baer,1986;Miyakoda et al.,1986)。近年來許多學(xué)者利用人工智能方法訂正數(shù)值模式誤差進(jìn)行了嘗試,例如Moghim and Bras(2017)使用ANN模型對CCSM3(Community Climate System Model version 3)的南美洲北部降水進(jìn)行訂正,通過輸入同期和前1、2、3個月降水量以及周圍鄰近區(qū)域的降水平均和標(biāo)準(zhǔn)差,發(fā)現(xiàn)ANN模型對所有季節(jié)降水的均方差(Mean Square Error,MSE)、偏差(bias)、相關(guān)性(ρ)的平均改進(jìn)率(Improvement,Imp)分別為70.75%、55%和56.5%,相比于線性回歸模型63.25%、46.5%和40.75%的改進(jìn)率,ANN模型顯著優(yōu)于線性回歸模型,說明人工神經(jīng)網(wǎng)絡(luò)靈活而強大的能力能夠有效地用于降水的偏差訂正。Lee and Ahn(2018)利用自組織映射(Self-Organizing Mapping,SOM)方法找出隱藏在模式動態(tài)預(yù)測中有意義的信號來修正預(yù)測,發(fā)現(xiàn)經(jīng)過此方法訂正后各季節(jié)、各預(yù)測時效的均方根誤差均有所降低,且提前時間越長的預(yù)測訂正效果越好。Wang et al.(2018)比較了隨機(jī)森林(RF)、支持向量機(jī)(SVM)、貝葉斯模型(Bayesian model averaging,BMA)和算術(shù)總平均值(arithmetic Ensemble Mean,EM)四種不同的方法對不同的GCMs進(jìn)行多模式集合模擬月降雨量和溫度方面的能力,RF和SVM在性能標(biāo)準(zhǔn)上比EM和BMA有更顯著的改進(jìn)。Kim et al.(2021)利用LSTM模型對多模式預(yù)測MJO(Madden-Julian Oscillation)的結(jié)果進(jìn)行偏差訂正,MJO預(yù)測的幅度和相位的誤差分別顯著減少了90%和77%(圖5)。諸多研究表明,人工智能模型可以用來對訂正動力模式的偏差,從而提高氣候預(yù)測水平。
圖5 單個模式平均的均方根誤差(BMSE,Bivariate root-mean-squared error)。次季節(jié)至季節(jié)(S2S)預(yù)測(藍(lán)色)和深度學(xué)習(xí)(DL)訂正(紅色)的均方根誤差,其中振幅誤差(BMSEa)(深色)和相位誤差(BMSEp)(淺色)取4周8個相位的平均。縱坐標(biāo)表示均方根誤差,橫坐標(biāo)的第二到第九項表示用來訂正的動力模式,八個模式的集合平均為第一項。引自Kim et al.(2021)Fig.5 Averaged forecast errors in individual models.Bivariate root-mean-squared amplitude error (BMSEa) (darker colors) and phase error (BMSEp) (lighter colors) for subseasonal-to-seasonal (S2S) reforecasts (blue) and deep learning (DL) corrections (red) averaged over four weeks and eight phases.For ECMWF-Cy43r3 and NCAR-CESM1,the orange error bar denotes the 95% confidence interval based on the bootstrap method.ECMWF-Cy43r3,NCAR-CESM1,NASA-GEOS5,Navy-ESPC,ESRL-FIM,RSMAS-CCSM4,KMA/UKMO-GloSea5,and NCEP-GEFS denote the dynamical model for use (adapted from Kim et al.,2021)
2)降尺度
除了訂正上述動力模式的偏差之外,由于用來預(yù)測氣候的GCMs的空間分辨率普遍較低,適合模擬和預(yù)測大尺度環(huán)流和信息,但在模擬和預(yù)測區(qū)域氣候時,因為空間分辨率低、難以準(zhǔn)確刻畫氣溫、降水的小尺度局地變化特征,我們就需要將大尺度、低分辨率的全球氣候模式輸出信息轉(zhuǎn)化為小尺度、高分辨率的區(qū)域氣候信息,這種過程稱為降尺度。降尺度方法可以分為三大類:動力降尺度方法(Benestad et al.,2008)、統(tǒng)計降尺度方法(Chu et al.,2010)以及統(tǒng)計與動力相結(jié)合的降尺度法。動力降尺度有兩個發(fā)展方向,一種是提高GCM的水平分辨率,例如近20 a來國際上大力發(fā)展的下一代全球準(zhǔn)均勻高分辨格點模式(McGregor,1996;Mcgregor and Dix,2001;Dudhia and Bresch,2002;Satoh et al.,2008;Ringler et al.,2013),但這需要極大的計算資源支撐。另一種是在GCM中針對有限目標(biāo)區(qū)域嵌套高分辨率區(qū)域模式(如WRF等),與第一種方法比可以相對減少計算量,但是存在大尺度模式和區(qū)域模式之間邊界信息交換不易處理等問題?,F(xiàn)有的區(qū)域動力降尺度方法的計算量仍較大,計算資源往往難以得到滿足。統(tǒng)計降尺度方法則是建立GCM中模擬效果較好的大尺度變量和實測小尺度(或臺站)變量之間的統(tǒng)計關(guān)系,由于統(tǒng)計降尺度方法的計算量小、性能較高,因此得到了廣泛的應(yīng)用(Beecham et al.,2014;Sachindra et al.,2014,2016;Gutiérrez et al.,2019)。統(tǒng)計與動力相結(jié)合的降尺度法結(jié)合了物理知識約束和計算效率快的優(yōu)點,在實際業(yè)務(wù)中應(yīng)用更廣(Chen et al.,2012;Wang et al.,2015;Ba et al.,2018)。除此之外,近年來人工智能方法也在降尺度領(lǐng)域大顯身手。例如,Tripathi et al.(2006)引入支持向量機(jī)(Support Vector Machine,SVM)方法對GCM模擬的降水進(jìn)行降尺度,比流行的基于多層反向傳播神經(jīng)網(wǎng)絡(luò)方法更有效。Srivastava et al.(2013)通過對比三種人工智能方法(ANN,SVM,RVM)和廣義線性模型(Generalized Linear Model,GLM)對提高土壤水分和海洋鹽度(SMOS)空間分辨率的能力,發(fā)現(xiàn)ANN算法具有更好的性能。Sachindra et al.(2018)提出可以用支持向量機(jī)(SVM)或遺傳算法(Genetic Programming,GP)方法來建立降尺度模型進(jìn)行洪水預(yù)測或極端降水預(yù)測,在研究干旱時使用相關(guān)向量機(jī)(RVM)降尺度模型等。除了以上的常規(guī)方法外,計算機(jī)視覺領(lǐng)域中的圖像超分辨率(Super-resolution,SR)與統(tǒng)計降尺度非常相似,它通過獲取低分辨率(low-resolution,LR)圖像并生成近似真實高分辨率(high-resolution,HR)的增強圖像(Yang et al.,2014)。隨著機(jī)器學(xué)習(xí)特別是基于卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)方法的快速發(fā)展,它在降尺度上的應(yīng)用取得了迅速的發(fā)展和巨大的成功。Vandal et al.(2017)首次將降尺度過程與圖像超分辨率類比,將多個超分辨率卷積神經(jīng)網(wǎng)絡(luò)(Super-Resolution Convolutional Neural Networks,SRCNN)疊加在一起建立了深度統(tǒng)計降尺度模型(DeepSD),并加入高分辨率的靜態(tài)地形數(shù)據(jù)訓(xùn)練模型,將降水資料的分辨率提高了8倍(圖6)。相比而言,DeepSD的效果以及效率遠(yuǎn)好于其他降尺度方法。但由于過于簡化問題以及模型缺乏靈活性,Liu et al.(2020)提出一種具有跳躍連接和融合功能的Ynet模型,可以直接對多個GCM進(jìn)行降尺度,且性能顯著高于DeepSD。另外,Stengel et al.(2020)開發(fā)了一種對抗性深度學(xué)習(xí)方法,并表明該方法能將氣候數(shù)據(jù)分辨率提高50倍。
圖6 降水分布:低分辨率1.0°(a,約100 km)和通過DeepSD降尺度后高分辨率1/8°(b,約12.5 km)的結(jié)果(引自Vandal et al.,2017)Fig.6 PRISM observed precipitation based on (a) low resolution at 1.0° (100 km),and (b) high resolution at 1/8° (12.5 km).Adapted from Vandal et al.(2017)
ANN被稱為通用逼近器,可以逼近任何非線性確定性函數(shù),即逼近幾乎任何連續(xù)的輸入和輸出映射,這一特性被稱為通用逼近定理(Hornik et al.,1989;Hornik,1991;Schmidhuber,2015)。氣候系統(tǒng)的高度非線性和復(fù)雜性,以及它存在的大數(shù)據(jù)集和有限的訓(xùn)練數(shù)據(jù)使得氣候成為一個有趣的機(jī)器學(xué)習(xí)挑戰(zhàn)的領(lǐng)域(Watson-Parris,2021)。表2表示與地球科學(xué)任務(wù)有關(guān)的傳統(tǒng)方法與深度學(xué)習(xí)方法。目前人工智能方法預(yù)測氣候領(lǐng)域依舊存在許多挑戰(zhàn)(Reichstein et al.,2019),列舉如下。
1)數(shù)據(jù)集構(gòu)建的問題:
隨著人工智能方法應(yīng)用于氣候研究領(lǐng)域的興起,越來越多的實用案例在氣候問題的解決上大放異彩,不少學(xué)者也認(rèn)為氣候問題僅僅是一個數(shù)據(jù)問題,認(rèn)為只要有足夠多的數(shù)據(jù)就可以解決大多數(shù)的氣候問題。然而,數(shù)據(jù)的獲取以及可利用性等均是不可忽視的問題。
大氣和海洋數(shù)據(jù)來源廣泛,根據(jù)不同的傳感器獲得的數(shù)據(jù)往往具有自身的觀測誤差,并且在氣候?qū)ο蟮念A(yù)測中僅使用觀測資料是不夠的。表3突出顯示每個數(shù)據(jù)源的主要優(yōu)勢和劣勢。有關(guān)氣候數(shù)據(jù)來源的更詳細(xì)討論,請參見Faghmous and Kumar(2014a)。當(dāng)嘗試?yán)媚J捷敵鼋Y(jié)果作為訓(xùn)練數(shù)據(jù)來彌補觀測有效樣本不足時,不同的模式有著各自的系統(tǒng)性誤差,增大了數(shù)據(jù)集中的噪聲,如果不基于物理規(guī)律進(jìn)行數(shù)據(jù)處理,這些誤差的存在將會極大程度影響人工智能模型的準(zhǔn)確性。此外,對于不同目標(biāo)的人工智能模型需要構(gòu)建相對應(yīng)的數(shù)據(jù)集,人工智能模型并不像傳統(tǒng)動力模式一樣,將大量的數(shù)據(jù)輸入到動力模式之后用物理方程約束從而模擬大氣和海洋等圈層中的物理過程,過于冗余的數(shù)據(jù)反而不能對人工智能模型起到積極作用。因此,基于物理規(guī)律的因子篩選在建模前也是格外重要的。
表2 地球科學(xué)任務(wù)的傳統(tǒng)方法和深度學(xué)習(xí)方法(引自Reichstein et al.,2019)
表3 氣候數(shù)據(jù)來源(引自Faghmous and Kumar,2014a)
除此之外在充分利用氣候數(shù)據(jù)潛力來促進(jìn)科學(xué)發(fā)現(xiàn)還存在著許多挑戰(zhàn),例如我們在氣候科學(xué)中所感興趣的對象通常是連續(xù)時空場中隨時間和空間演變的部分,以及許多涉及物理變量之間的復(fù)雜關(guān)系難以從有限的高質(zhì)量氣候數(shù)據(jù)中提取等等。全球范圍內(nèi)高質(zhì)量傳感器測量的氣候變量數(shù)據(jù)僅存在于過去40~100 a,這就限制了一些最先進(jìn)的數(shù)據(jù)科學(xué)算法(如深度學(xué)習(xí))的實用性,這些算法在語音和圖像識別問題上的成功在很大程度上得益于這些領(lǐng)域大規(guī)模的數(shù)據(jù)可用性(Karpatne and Kumar,2017)。
對于氣候預(yù)測問題,目前常見的人工智能方法往往是采用監(jiān)督學(xué)習(xí)的方式,這就涉及數(shù)據(jù)集中有效樣本集的構(gòu)建。但是由于很多極端氣候事件如干旱、洪澇等并不是每年都會發(fā)生,再者動力模式對這種極端事件也沒有很好的模擬效果,所以有效樣本量相對較小,尤其是年際與年代際預(yù)測對象因為觀測序列較短,均屬于小樣本問題。目前針對小樣本問題的解決方案有數(shù)據(jù)增強(Data augmentation)(翻轉(zhuǎn)、剪切、平移等)、遷移學(xué)習(xí)(Transfer learning)、生成對抗(Generative Adversarial Networks)、元學(xué)習(xí)(Meta-learning)和零樣本學(xué)習(xí)(Zero-shot learning)等方法(Barto and Sutton,1997;Sung et al.,2018;Taylor and Nitschke,2018;Zhang et al.,2018;Liu et al.,2019;Xian et al.,2019;Zhong et al.,2020;Zhu et al.,2020;Wang et al.,2021),但已有的數(shù)據(jù)增強方法僅僅適用于圖像識別問題,在氣候問題上如果將數(shù)據(jù)進(jìn)行翻轉(zhuǎn),其本身的物理意義將完全改變,使模型結(jié)果失去物理意義。目前來說利用遷移學(xué)習(xí)或者將有監(jiān)督問題轉(zhuǎn)化成無監(jiān)督問題或許是解決這類小樣本問題較好的途徑,例如Sap and Awan(2005),Zscheischler et al.(2012),Chalupka et al.(2016),Sathiaraj et al.(2019),Ham et al.(2019)。然而如何使遷移學(xué)習(xí)等方法能更符合物理規(guī)律地應(yīng)用于解決氣候問題,還需要更多的探索。
2)模型的可適用性問題
盡管最近一系列人工智能方法在氣候預(yù)測中取得了不錯的成果,且有越來越多的深度學(xué)習(xí)/機(jī)器學(xué)習(xí)模型可供選擇,這些模型可以在短期或長期氣候預(yù)測中勝過現(xiàn)有的動力模式預(yù)測系統(tǒng)和傳統(tǒng)的統(tǒng)計模型,但我們?nèi)圆荒苓^于樂觀,對于使用類似“黑匣子”一樣的深度學(xué)習(xí)工具進(jìn)行預(yù)測要持懷疑態(tài)度。目前很多研究將機(jī)器學(xué)習(xí)與傳統(tǒng)的物理知識建模隔離開,這極大限制了這兩種方法的融合發(fā)展。如果不能在地球科學(xué)的機(jī)理認(rèn)識背景下正確應(yīng)用人工智能技術(shù),人工智能模型結(jié)果可能與基本物理知識相背離。
物理過程模式與人工智能預(yù)測模型不是相互替代關(guān)系,而是互為補充。兩者的結(jié)合可以有很多方面,主要分為兩種:其一是以動力模式為主,比如利用人工智能模型來優(yōu)化動力模式中的部分參數(shù),或利用人工智能方法替換掉模式中半經(jīng)驗化的參數(shù)化方案,或者利用人工智能方法對動力模式結(jié)果進(jìn)行訂正和降尺度等;另一種則剛好相反是以人工智能模型為主,將物理過程如動力方程組等加入人工智能模型中,對人工智能模型的構(gòu)建進(jìn)行合理的物理約束,或者對動力方程組利用人工智能方法直接建模求解。
最終,構(gòu)建的動力-人工智能混合模式或模型,應(yīng)當(dāng)遵循地學(xué)的物理規(guī)律,對于理論支持薄弱的部分采取數(shù)據(jù)驅(qū)動為主的策略。越來越多的研究采用在機(jī)器學(xué)習(xí)算法中使用物理定律和守恒性質(zhì)方面的物理學(xué)知識來約束訓(xùn)練并進(jìn)一步改進(jìn)算法。例如,基于GAN的湍流模擬模型可以通過在損失函數(shù)中加入物理約束,如能量譜(Wu et al.,2020)?;贑NN的次網(wǎng)格尺度物理過程參數(shù)化模型可以通過約束全球守恒性質(zhì)來進(jìn)一步改進(jìn)平均氣候特征的模擬,例如動量守恒(Bolton and Zanna,2019)。只有致力于將物理模式與數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)工具兩者多功能相結(jié)合的混合建模方法,才能在模擬和預(yù)測中取得最佳效果,促進(jìn)兩個學(xué)科融合,賦予全新的活力。
3)物理解釋性問題
人工智能模型一直以來都有一個弱點,就是物理解釋性差的問題。高性能的復(fù)雜算法和模型大量存在,但它們卻缺乏決策邏輯的透明度和結(jié)果的可解釋性,導(dǎo)致在預(yù)測應(yīng)用中很多學(xué)者將人工智能模型認(rèn)為是一個黑箱模型,無法完全信任。氣候科學(xué)強調(diào)在理解機(jī)理的基礎(chǔ)上進(jìn)行預(yù)測。人們對預(yù)測單個事件很感興趣,但更多的注意力仍然放在整個系統(tǒng)的規(guī)律而不是單個事件上,所以更強調(diào)模型的可解釋性而不是模型的靈活性(Faghmous and Kumar,2014b)。只有物理上提供一定可解釋性的模型才是可取的,因為它可能有助于揭示觀測數(shù)據(jù)中的因果關(guān)聯(lián),根據(jù)數(shù)據(jù)中反映的內(nèi)在關(guān)系以計算機(jī)方法的視角挖掘出物理上全新的聯(lián)系,從而推動物理規(guī)律認(rèn)識的發(fā)展。Toms et al.(2020)為地球科學(xué)開發(fā)了可解釋的神經(jīng)網(wǎng)絡(luò),通過后向優(yōu)化(backward optimization)和分層相關(guān)性傳播(Layerwise Relevance Propagation,LRP)這兩種方法來有助于確定哪些輸入對神經(jīng)網(wǎng)絡(luò)的決策過程最有幫助,并展示了它們在提高理解MJO的有用性和可靠性(Toms et al.,2021)。McGovern et al.(2019)介紹了如何應(yīng)用機(jī)器學(xué)習(xí)方法來更好地理解物理學(xué),且這些方法已證明對確定性預(yù)測的改進(jìn)是成功的(Bremnes,2020;Rasp and Lerch,2018)
常見的探究物理解釋的方法可以根據(jù)建模過程分為三類,分別是輸入數(shù)據(jù)(或預(yù)測因子)選取的可解釋性、建模中模型基于物理機(jī)理構(gòu)建、以及模型輸出結(jié)果的可解釋(Reichstein et al.,2019;Murdoch et al.,2019;Barredo,2020;Camps-Valls et al.,2020;Kashinath et al.,2021)。目前在氣候預(yù)測中被廣泛關(guān)注的是結(jié)果的可解釋性,可解釋性越高則模型結(jié)果更為可信。主要用到的方法為隱藏層分析,即通過提取隱藏層中的權(quán)重,可視化分析模型關(guān)注區(qū)域,并根據(jù)可解釋結(jié)果結(jié)合理論認(rèn)識來解釋物理機(jī)理。此外還可以采用敏感性分析等方法,將模型輸入變量在可能的范圍內(nèi)變動,研究和評估這些屬性(或預(yù)測因子)的變化對模型輸出結(jié)果的影響程度。我們將影響程度的大小稱為該屬性的敏感性系數(shù),敏感性系數(shù)越大就說明屬性對模型輸出的影響越大。
當(dāng)然這些方法要合理的應(yīng)用到氣候預(yù)測領(lǐng)域還有很多問題亟待解決,比如有的預(yù)測模型雖然具有很好的預(yù)測效果,但是模型的可解釋分析或許與現(xiàn)有物理規(guī)律的認(rèn)識明顯背離,或者數(shù)據(jù)信號中噪音過多、可解釋分析并不顯著等。如果能夠解決這些問題,建立具有可解釋性的人工智能模型,根據(jù)可解釋結(jié)果或許可以有效地推動氣候預(yù)測的理論和方法發(fā)展(圖7)。
圖7 人工智能預(yù)測氣候的流程圖、面臨的挑戰(zhàn)及其可能的解決方法Fig.7 Flow diagram of climate prediction by means of artificial intelligence,the challenges it faces and potential solutions
隨著觀測手段和方法的快速發(fā)展,地球科學(xué)研究面臨的數(shù)據(jù)量將越來越多,也面臨著國家和社會發(fā)展越來越高的需求,更為準(zhǔn)確的天氣/氣候預(yù)測結(jié)果能更好地為防災(zāi)減災(zāi)服務(wù)。由于計算資源的限制,高分辨率的數(shù)值模式預(yù)報系統(tǒng)已略顯疲態(tài),而人工智能方法特別是深度學(xué)習(xí)通過大量數(shù)據(jù)驅(qū)動建立基于物理解釋的預(yù)測模型有希望成為動力模式的一種有力補充工具。兩者相輔相成,共同促進(jìn)發(fā)展,可以更好地改善大氣和海洋預(yù)測,圖8展示了地球系統(tǒng)模式與人工智能相融合的階段。對于人工智能模型的發(fā)展,有三個主要建議,如下。
1)根據(jù)不同的預(yù)測任務(wù)結(jié)合氣候機(jī)理構(gòu)建數(shù)據(jù)集
氣象數(shù)據(jù)具有多源、多尺度、多維、非線性、滯后性等特性。人工智能方法要想更好地應(yīng)對預(yù)測問題,必須要結(jié)合氣候預(yù)測機(jī)理,充分考慮數(shù)據(jù)之間的因果關(guān)系、時空關(guān)系。對于小樣本的數(shù)據(jù)問題,合理恰當(dāng)?shù)厥褂萌斯ぶ悄芊椒ㄟM(jìn)行數(shù)據(jù)增強或遷移學(xué)習(xí)。
2)模型構(gòu)建的合理性與可解釋性
構(gòu)建的人工智能模型不僅結(jié)果要準(zhǔn)確,而且要可信,包括在構(gòu)建模型的過程,要充分考慮模型構(gòu)建的物理合理性,不能把時空預(yù)測問題簡單地轉(zhuǎn)化為空間上的相互關(guān)系或者時間上的連續(xù)性。如果能利用數(shù)值模式中的動力學(xué)方程對人工智能模型進(jìn)行約束使智能模型本身具有物理約束,將極大地增加智能模型的物理可解釋性。而對于智能模型給出的預(yù)測結(jié)果,要盡可能對模型結(jié)果進(jìn)行可解釋性分析,解釋模型通過哪些特征做出的預(yù)測,使得模型變得更加透明,將黑盒子變成灰盒子。
3)更多嘗試與動力模式結(jié)合
動力模式和人工智能模型并不是兩個獨立個體,也不是相互替代的關(guān)系,兩者只有相互融合才會產(chǎn)生最好的效果。動力模式中仍有很多不全面的地方,比如空間分辨率不高、極其消耗計算資源的復(fù)雜參數(shù)化過程、資料同化過程以及一些復(fù)雜過程的半經(jīng)驗半理論的擬合。如果將兩者相互結(jié)合,或?qū)⒄嬲龑崿F(xiàn)數(shù)字地球,更好地模擬天氣/氣候變化。
總的來說,未來的智能模型應(yīng)該既包含物理過程約束又應(yīng)用大數(shù)據(jù)人工智能的方法。數(shù)據(jù)驅(qū)動的人工智能方法不會取代物理模式,而是會對其進(jìn)行有力的補充和豐富。具體來說,這些智能模型應(yīng)該遵守物理定律,使用可解釋的結(jié)構(gòu)框架并且在理論薄弱的地方遵循數(shù)據(jù)驅(qū)動。這兩個交叉學(xué)科的合理碰撞與融合一定會激發(fā)全新的活力推動各自的發(fā)展,為應(yīng)對未來氣候變化和提高氣候預(yù)測水平提供強有力的科技支撐。
圖8 地球系統(tǒng)模式與人工智能相融合的不同階段(改編自Irrgang et al.,2021)Fig.8 Successive stages of the fusion process of Earth system models and artificial intelligence (adapted from Irrgang et al.,2021)