国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

深度學習在天氣預報領域的應用分析及研究進展綜述

2023-07-03 14:12:34董潤婷王曉英曹騰飛黃建強吳潔瑕
計算機應用 2023年6期
關鍵詞:天氣預報氣象數值

董潤婷,吳 利*,王曉英,曹騰飛,黃建強,管 琴,吳潔瑕

(1.青海大學 計算機技術與應用系,西寧 810016;2.青海省氣象臺,西寧 811300;3.北京弘象科技有限公司,北京 100195)

0 引言

天氣預報作為一個與人類生產生活和社會穩(wěn)定息息相關的課題,一直是科學家們的研究重點。由于人們并不完全清楚氣候變化這種復雜時空問題的內在機制,很難建立精確且高效的數值天氣預報(Numerical Weather Prediction,NWP)模式;另外,雖然基于機器學習的方法已被證明可以根據歷史數據學習內在“規(guī)律”并有助于作出相對準確的預測[1],但是由于天氣預報相關問題涉及的氣象數據體量龐大、特征維度高、格式復雜多樣,傳統(tǒng)機器學習方法在面對爆炸式增長的氣象訓練數據和更長期的預測需求時,預測效果難以進一步提升,因此當前人們能夠準確預測的天氣演變時長仍然僅限于短短幾天,而長期或者季節(jié)性的預測,以及臺風、山洪等極端天氣情況的預報仍然是該領域面臨的主要挑戰(zhàn)[2]。目前,不斷發(fā)展的時空序列深度學習模型、計算機持續(xù)增長的計算能力和大量現有的觀測數據都為氣象領域相關問題建模分析和預測提供了新的機遇。氣象領域的預測或檢測問題無論是從數據形式還是問題本身,都非常經典地融合了時間與空間特征的深度學習問題,因此深度學習在天氣預報領域,例如風速與降水等天氣要素的預測問題[3-4]、極端天氣的檢測問題[5-6]和天氣現象的分類問題[5]等,都有著廣泛的應用。根據歷史的觀測結果準確檢測氣象信息、正確預測氣象要素的未來趨勢對廣泛的科學研究和實際應用至關重要。

雖然深度學習模型一般分為能夠編碼時間信息的遞歸神經網絡(Recurrent Neural Network,RNN)和能夠編碼空間信息的卷積神經網絡(Convolution Neural Network,CNN)兩大主要方向,但現在越來越多研究開始將兩者結合,對融合時間與空間特性的氣象數據進行分析建模。這種使用深度學習模型進行時空序列預測(SpatioTemporal Sequence Forecasting,STSF)分析的方式與傳統(tǒng)機器學習模型相比有諸多優(yōu)勢:氣象數據的空間鄰近性和長期時間相關性通常比較復雜,特征難以捕捉,因此與傳統(tǒng)的需要人工設定特征的機器學習方法相比,融合了CNN 多層卷積和RNN 遞歸結構的深度學習模型可自動從原始數據中學習這些時空依賴關系[7];氣象數據特征維度高、數據格式復雜難懂[8],而由多個簡單且非線性的模塊堆疊而成的深度學習模型擁有強大的函數逼近能力,可以通過子模塊的池化、參數丟棄和激活的功能將抽象的高層特征表示轉化為較低層次的潛在特征表示。目前已有更多的研究者[9]探索由用于時空序列預測的深度神經網絡和編碼器結構(例如注意力機制)組成的混合深度學習模型,這種組合建模的發(fā)展過程如圖1 所示。在天氣預報領域,具有發(fā)展前景的融合時空信息與注意力機制的深度學習模型則是將原始數據按時間序列順序輸入經過采樣器采樣和時空序列預測模型編碼時空信息,再通過注意力機制整合空間信息得到預測輸出的結果,原理如圖2 所示。

圖1 時空序列預測問題的深度學習模型發(fā)展流程Fig.1 Development flow of deep learning model for spatiotemporal sequence forecasting problem

圖2 融合時空信息與注意力機制的深度學習模型Fig.2 Deep learning model integrating spatiotemporal information and attention mechanism

同時,隨著遙感和實地檢測技術的普及,已有大量的地球系統(tǒng)數據可用[10],但是來自傳感器的觀測數據可能會由于設備原因而包含噪聲信息或缺省值[11],如何從這些大量復雜又不確定的時空數據中提取有用的信息和知識也是一個需要突破的方向。此外,從原理上來看,理論驅動的數值天氣預報模式和數據驅動的深度學習技術通常被視為兩個不同的領域,具有截然不同的科學范式,但兩者間的協同作用較大,因此兩種技術的共同進步也使得使模擬和數據科學的方法能夠在多個方面更緊密地結合在一起。

本文先將經典深度學習應用領域的科學問題與天氣預報領域應用深度學習技術的數據格式和問題模型的異同作類比分析。首先,回顧并總結了深度學習在解決天氣預報方面問題的發(fā)展歷程與應用現狀;然后,綜述了將深度學習技術與數值天氣預報結合的技術重點和最新應用進展,指出了在龐大的氣象數據體量下對深度學習模型性能提升的可能性和研究深度學習模型的可解釋性對天氣預報領域的重要性;最后,對比了深度學習問題的評價指標在氣象領域的融合與適配以及應用場景,指出了深度學習在天氣預報中應用的挑戰(zhàn)問題、后續(xù)發(fā)展方向和研究重點,為以后天氣預報領域的深度學習發(fā)展提供參考依據。

1 天氣預報問題與其他經典深度學習問題的類比分析

針對時空數據的深度學習技術已經在智能交通(交通預測)、城市規(guī)劃(人流移動)等相關應用領域[12-14]取得了顯著成功,而在天氣預報領域的應用仍處于初級階段。

使用深度學習模型解決經典時空序列預測問題的一般過程通常是:首先將原始時空數據構建數據實例進行存儲,再將時空數據實例表示為一種特定的數據格式,例如序列數據、二維矩陣、三維張量和圖等;然后針對不同的數據格式采用不同的深度學習模型進行處理;最后選擇合適的深度學習模型用于處理各種時空數據挖掘任務,如預測、分類等。

無論是數據格式還是抽象后的問題模型(回歸、分類、異常檢測、時空狀態(tài)預測),天氣預報領域問題與其他經典深度學習問題都有著一定的相關性。

1.1 數據格式

Wang 等[15]總結了經典深度學習問題的基本數據格式,包含事件、軌跡、數值和視頻等幾種類型?;诖?,本文將各類數據格式與相關天氣預報問題對應如下。

1)事件。事件數據包括在某個地點和時間發(fā)生的離散事件,例如極端天氣檢測問題中的冰雹、雷電等。

2)軌跡。軌跡表示隨時間推移在空間中移動的物體所經過的路徑。軌跡數據通常由傳感器收集,隨著時間的推移周期性地采集云高云量等天氣相關信息。

3)數值。數值數據包括各類連續(xù)時空場的測量值,例如在空間和時間上觀測的一組溫度、濕度等基本天氣要素參數。

4)圖像。天氣預報領域的圖像數據通常是將雷達的基本反射率通過線性轉換成普通圖片后進行雷達回波外推。

5)視頻。由一系列圖像組成的視頻也可以視為一種時空數據。在空間域中,相鄰像素通常具有相似的RGB 值,因此呈現出較高的空間相關性。在時間域中,連續(xù)幀的圖像通常會平滑變化并呈現較高的時間依賴性。

深度學習模型所處理的數據類型與氣象數據之間的相似性為將深度學習整合到氣象系統(tǒng)中提供了令人信服的論據,但氣象數據獨有的特性也一定程度上成為了天氣預報問題應用深度學習模型的挑戰(zhàn)。例如,衛(wèi)星觀測數據會伴隨著各種噪聲、缺省與不確定性,以及采集、存儲和傳輸過程中的失真[16],另外,光譜、空間和時間維度也帶來了計算上的挑戰(zhàn)[17]。

1.2 問題模型

當把包含有時間與空間的氣象數據,表示為深度學習模型能夠處理的合適的數據表示格式后,將它們提供給不同的深度學習模型,以解決不同類型的天氣預報問題。例如經典CNN 模型主要用于處理圖數據[18],完成對各類天氣模式的檢測與識別,也可以用來處理軌跡數據,預測雷達回波圖中的云層軌跡;RNN 模型用于預測時間序列,預測天氣要素的未來值;ConvLSTM(Convolutional Long Short-Term Memory network)[19]首先提出將RNN 和CNN 結合,通過雷達回波圖應用于降水情況分類;此外還有以自動編碼器(Auto-Encoder,AE)為基礎的復雜深度學習模型[1,20],在模型中同時編碼時間與空間信息以解決更復雜更不確定的科學問題。

天氣預報問題可以類比經典深度學習問題,大致劃分為分類、回歸、檢測識別等幾個方向;然而在解決每個天氣預報領域中具體的實際問題時,如何選擇并設計一個完整且合理的深度學習模型,以及需要融合哪些其他數據或基礎模型仍然需要具體分析。因為現實中某個時間和空間點上的過程會受到一些不易被觀察到的其他狀態(tài)的影響,例如,當判定某一大氣狀況歸類是颶風還是溫帶風暴時,就需要同時了解一定的空間信息[21]。

綜上所述,在天氣預報領域中的觀測圖像可以類比為經典深度學習問題中包含特定變量的二維數據或是照片中的顏色三元組(RGB 值);而動態(tài)視頻本質上為一系列圖像序列,可類比于隨時間演變的二維數據;同樣,自然語言和語音信號也具有與地球系統(tǒng)變量動態(tài)時間序列相同的多分辨率特性;此外,分類(氣旋分類、天氣狀況分類)、回歸(天氣要素數值預測)、異常檢測(極端天氣檢測)和動態(tài)建模是氣象監(jiān)測領域的典型問題。

因此,經典問題中深度學習技術的發(fā)展方向也同樣適用于天氣預報領域。經典深度學習方法通常被分為空間特征學習(例如計算機視覺領域的CNN)和時間特征學習(例如自然語言處理領域的RNN)兩個方向,Shi 等[19]提出的ConvLSTM 將兩個方向結合用于降水預測。

1.3 評價指標

在深度學習領域,針對不同類型的數據(數值、圖像等)和問題(分類、回歸、檢測識別等)的評價指標體系已基本建立完備。下面對于這些評價指標在天氣預報領域的適配與應用進行總結和說明。

1.3.1 分類問題

天氣預報問題中經常根據預測后的雷達回波圖在一定區(qū)域范圍的網格化的氣象要素結果對該區(qū)域進行晴雨分類,當格點數值大于一個特定閾值時,預測為有降水;否則預測為無降水。以晴雨分類為例,經典深度學習中的混淆矩陣對應的氣象概念如表1 所示。

表1 氣象領域的混淆矩陣Tab.1 Confusion matrix in meteorological field

針對不同需求,氣象上有許多評價此類預報準確度的指標,其中關鍵成功指數(Critical Success Index,CSI)、誤警率(False Alarm Rate,FAR)和檢測率(Probability Of Detection,POD)常用于評估模型精度,具體如表2所示。

表2 氣象分類問題的評估指標Tab.2 Evaluation metrics for meteorological classification problems

1.3.2 回歸問題

當評價時序模型預測結果時,一般基于預測值和實際值的函數,比如預測某坐標未來一段時間的風速、溫度和降水量等數值預測問題。假設存在n個樣本,每個樣本的真實值為預測值為y={y1,y2,…,yn},則常用的評價指標通常有均方誤差(Mean Square Error,MSE)、均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE),以上幾種評估結果的數值范圍均為[0,+∞),且結果越小,模型越優(yōu)。表3 給出了關于上述指標的計算原理和說明。

表3 氣象回歸問題的評估指標Tab.3 Evaluation metrics for meteorological regression problems

1.3.3 圖像預測與檢測識別

氣象有關的時空序列問題也通常包含圖片的數據格式,例如在視頻幀預測、根據雷達回波圖進行降水預測或者根據溫度位勢圖檢測熱帶氣旋以識別極端天氣模式時,通常需要對比評估預測生成的圖像與真實地理圖像的區(qū)別,客觀的基于數學原理的評價方法則有助于量化評價的數值結果。目前主流的客觀評價方法為通過峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)和結構相似度(Structural SIMilarity,SSIM)評估預測圖像與真實圖像的差異[22],通過交并比(Intersection of Union,IoU)[23]評估檢測范圍與真實范圍的重疊度。例如,Chen 等[24]使用生 成式對 抗網絡(Generative Adversarial Network,GAN)解決天氣雷達回波的超分辨率問題,通過PSNR 指標證明了該方法可以取得更好的重建性能;Yuan等[25]也分別通過對比PSNR和SSIM結果證明了所提出的模型在天氣雷達圖像重建的視覺質量方面取得的優(yōu)異性能。

PSNR 基于統(tǒng)計學原理,通過計算預測結果與原始圖像對應像素點灰度值之間的差異評估預測結果圖片的準確度。公式如下:

其中:F為結果圖像,R為原始圖像,圖像的大小為M×N。結果范圍[0,+∞],結果越大,模型效果越好。

PSNR 的原理簡單直觀,但PSNR 僅考慮了圖像像素值的全局統(tǒng)計結果;而人眼對不同區(qū)域的敏感度是不同的,相較于PSNR,SSIM 更符合人類視覺系統(tǒng)的特點,SSIM 的評估對象由亮度、對比度和結構這3 個方面組成,可以避免PSNR 的局限性。

在計算亮度相似度時,SSIM 使用亮度的均值來度量兩幅圖像的亮度差異;在計算對比度相似度時,SSIM 使用標準差來度量兩幅圖像的對比度差異;在計算結構相似度時,SSIM 使用亮度和對比度信息的相關性來度量兩幅圖像的結構差異。

若使用x和y表示需要計算相似度的兩幅圖像,則SSIM的具體公式可以表示為:

其中:l(x,y)表示亮度相似度,c(x,y)表示對比度相似度,s(x,y)表示結構相似度,α、β和γ是3 個非負的加權系數,滿足α+β+γ=1。

亮度相似度可以用式(3)進行計算:

其中:μx、μy分別表示兩幅圖的亮度均值。

對比度相似度可以用式(4)進行計算:

其中:σx、σy分別表示兩幅圖的亮度標準差。

結構相似度可以用式(5)進行計算:

其中σxy表示兩幅圖的亮度協方差。

式(3)~(5)中的c1、c2和c3均為常數,用于避免分母為0或者噪聲過大的情況,取值需要根據具體應用進行調整。

另一個在處理氣象領域的異常天氣檢測(例如氣旋檢測等)問題上廣泛應用的評價指標為交并比(IoU)。例如在檢測熱帶氣旋時,不僅要識別氣旋中心,同時也要定位整個熱帶氣旋的發(fā)生和影響范圍。定位精度評價指標IoU 定義了兩個邊界框的重疊度,如圖3 所示。

圖3 IoU示意圖Fig.3 Schematic diagram of IoU

矩形框A、B的一個重合度IoU 計算公式為:

即矩形框A、B的重疊面積占A、B并集的面積比例,其中SI、SA、SB分別表示I、A、B三個部分的面積:

實際上,除了上述PSNR 和SSIM 此類常用的有參考的圖像質量評價方法之外,由于天氣預報領域數據來自傳感器收集的局限性,數據圖片常伴隨有缺失值和模糊噪聲,因此Doukari 等[26]針對無人機/傳感器等獲取的天氣預報數據(即風速、云量、降水概率等)進行關于圖像去噪去霧等方面的研究,并使用BRISQUE(Blind/Referenceless Image Spatial QUality Evaluator)[27-29]、RankIQA(Rankings for no-reference Image Quality Assessment)[30]等無參考圖像質量評估方法[31]進行定量評估。目前尚未有直接將此類方法應用于天氣預報結果評估的研究,但由于氣象圖像變化復雜性,無法獲取原始可參考圖像,因此在后續(xù)研究中可以綜合考慮無參考圖像的質量評價方法應用于天氣圖像預報的評價。

表4 總結了天氣預報領域問題的經典案例中所使用的深度學習模型及其評估模型性能時所用到的評價指標。

表4 天氣預報問題和對應評價指標Tab.4 Weather forecasting problems and corresponding evaluation metrics

2 深度學習在天氣預報領域的應用現狀

天氣預報領域問題可以分為天氣現象分類問題、天氣要素預測問題、極端與異常天氣模式檢測與識別這3 個方面,分別總結深度學習在各個方面的應用如下。

2.1 天氣現象分類問題

近年來,基于計算機視覺和深度學習的天氣自動分類研究引來廣泛關注。Yildirim 等[32]使用了深度學習、支持向量機(Support Vector Machine,SVM)分類器和最大相關最小冗余算法(minimum Redundancy-Maximum Relevance,mRMR)特征選擇的混合方法,對陰天、霧天、雨天、陽光和日出這5個類別的天氣狀況分類;Xie 等[33]首次嘗試將天氣分類視為一項無監(jiān)督任務,即從沒有標簽的單個圖像中分類天氣狀況;Mishra 等[34]在使用圖像數據實現天氣分類的同時,還比較分析了機器學習分類技術,證明基于深度學習的卷積神經網絡明顯優(yōu)于傳統(tǒng)機器學習方法;此外,經典的以GoogleNet及其衍生網絡為基礎的神經網絡框架[35-36]也已經被用于天氣現象分類任務,并且獲得了高達92%的分類準確率。

吳昆等[37]提出了一種基于3D-CNN 與LSTM 融合的混合模型預測短臨降水。將歷史數據按時序輸入卷積模塊中提取特征,然后將提取的高階特征信息輸入LSTM 模塊預測降水量,并通過大量實驗優(yōu)化模型的網絡參數,解決了過擬合和特征學習不充分的問題。

天氣預報領域的分類問題也存在需要依賴檢測技術的應用[38],例如,極端氣象分析工具包(the Toolkit for Extreme Climate Analysis,TECA)[39]是使用啟發(fā)式方法對氣象數據進行大規(guī)模模式檢測的應用?;赥ECA 分析的輸出,Liu等[40]利用深度卷積網絡預測兩種極端天氣事件類型的分類標簽,通過考慮從二維多通道圖像中對中心、裁剪的斑塊進行二元分類任務。

另外,Zhou 等[41]開發(fā)了基于數值天氣預報數據的強對流天氣深度學習預測解決方案,包括對短時大雨、冰雹、對流陣風和雷暴的檢測與分類。劉新偉等[42]基于LightGBM(Light Gradient Boosting Machine)算法,利用甘肅3 個地區(qū)的雷達回波和地面觀測數據,對3 類極端天氣狀況(冰雹、雷暴大風、短時強降雨)分類,實驗得到的整體誤判率僅為4.9%。

2.2 天氣要素預測問題

Shi 等[19]提出一種用于降水實時預報的ConvLSTM,該網絡在輸入到狀態(tài)和狀態(tài)到狀態(tài)的轉換中都具有卷積結構,由編碼網絡和預測網絡組成。與全連通LSTM 相比,ConvLSTM的編碼部分對氣象數據的時空關系進行了編碼,有助于提高預報精度;然而,ConvLSTM 的卷積遞歸結構是位置不變的。為了研究一個更一般的預測框架,Wang 等[43]提出了PredRNN(Predictive RNN),在遞歸過程中的相鄰時間步之間增加了額外連接,利用雙存儲器機制在統(tǒng)一的存儲池中同時提取和存儲序列的空間和時間變化。此后,Wang 等[44]又提出了PredRNN++來解決深層時間結構和消失梯度之間的時空預測學習問題,并將PredRNN 及其變體成功地推廣到了降水實況預報[45]。

針對通過雷達回波圖預測降水的問題,Zamo 等[46]將它歸結為輸入和預測目標都是圖像序列的視頻預測問題,將LSTM 與卷積編解碼網絡(U-Net)結合以捕捉時空相關性,獲得了有意義的預測結果。黃興友等[47]針對傳統(tǒng)雷達回波外推方法中存在資料信息利用率不足和外推時效有限的問題,通過利用預測神經網絡模型進行2 h 以內的回波變化預報分析結果,發(fā)現預測神經網絡對強回波的預報能力高于光流法,且在預報時效性和準確性上更好。Li 等[48]基于互信息(Mutual Information,MI)特征提取方法和不平衡數據采樣方法(Adaptive Synthetic Sampling),構建了自適應合成和互信息提取矩陣(Adaptive Synthesis and Mutual Information extraction Matrix,ASMI-M),并通過一種基于深度學習的卷積神經網絡和長短期記憶(CNN-Long Short-Term Memory,CNN-LSTM)模型預測蘭州市3 h 內的降水量,得到了更好的預測性能。Gorooh 等[49]開發(fā)了一種名為深度神經網絡高時空分辨率降水估計(Deep neural network high SpatioTemporal resolution Precipitation Estimation,Deep-STEP)的CNN 算法,能可靠地檢索高空間分辨率的地表降水。

針對其他天氣要素的預測問題,馬景奕等[50]通過神經網絡的前向訓練、長短時記憶反饋學習,經過多隱藏層的自主訓練,對溫度、風速、風向和壓力等6 項氣象信息實現準確預測;對于更為特殊的海表面溫度預測問題,張雪薇等[51]采用卷積門控循環(huán)單元(Convolutional Gated Recurrent Unit,ConvGRU)深度學習神經網絡模型,分析研究了西北太平洋部分海域的海表面溫度預測,預測準確率達到99.64%。

考慮風速屬性和時空相關性的預測建模同樣對人類生產(例如風電并網)有著較大的影響。潘超等[52]通過CNN 降維風速信息并提取空間特征,再由雙層記憶神經網絡進行多位置多步超短期預測,實現了對實際風電場的風速預測。修春波等[53]也針對風速預測問題設計了由多個LSTM 和卷積網絡組成的預測模型,并利用誤差動態(tài)補償方法校正預測值;Li 等[54]提出了一種混合時空注意網絡和多層感知器的集成模型(Ensemble of Spatial-Temporal Attention Network and Multi-Layer Perceptron,E-STAN-MLP)同時預測風速和風向,模型主要由一個時空注意遞歸神經網絡和一個多層感知器結構組成,實驗結果證明E-STAN-MLP 模式在風速與風向方面獲得了比NWP 更好的效果。

2.3 極端與異常天氣模式檢測與識別

極端天氣(如臺風、強降水、雷暴等)探測對于自然災害管理、防災和應急決策至關重要。數據驅動的數值預報方法可以在接收到新數據后的幾分鐘內提供預報,比傳統(tǒng)的理論驅動的數值預報方法更適合高響應性預報服務。另一方面,有監(jiān)督和半監(jiān)督的深度學習方法能夠突破傳統(tǒng)基于閾值的檢測方法的局限性。

Wang 等[55]提出了一種將自動氣象站數據和單極化S 波段雷達數據與圖形模型和隨機森林耦合的算法用于短期強降水檢測預警,以2015—2016 年華北地區(qū)的數據實現了79.2%的檢測概率(POD)和68.3%的關鍵成功指數(CSI)。Peterson 等[56]為GOES 地球靜止閃電測 繪儀(Geostationary Lightning Mapper,GLM)觀測開發(fā)了一種根據閃電數據中與非對流電荷結構的相互作用特征識別雷暴中對流/非對流區(qū)域的算法,并通過提供與閃電物理學相關的當代評估補充其他云型檢索。針對高原地區(qū)數值預測法建模復雜、雷達回波外推法易產生累積誤差且模型參數難以設置的問題,張永宏等[57]針對小目標和非平衡數據集,提出了一種基于改進DeepLab v3 網絡模型的西藏地區(qū)降雨云團的分割方法,可以更準確地分割降雨云團,為降雨云團監(jiān)測預警提供參考。

為了解決熱帶氣旋、溫帶氣旋、熱帶低壓和大氣流等極端天氣的多類檢測和定位問題,Mudigonda 等[58]提出了一種三維(高度、寬度、時間)多通道時空卷積編碼解碼器,首次將深度自編碼架構應用于邊界盒回歸的半監(jiān)督學習,通過對未標記數據重構訓練,有效地克服了氣象數據集標記的困難。Tong 等[59]提出了一種基于深度卷積神經網絡技術識別熱帶氣旋的方法,在西北太平洋盆地200 多個熱帶氣旋的測試數據中,達到96%的識別準確率。耿逍懿等[60]提出了一種以LSTM 為基礎構架的熱帶氣旋路徑集成預報方法,集成直接預報和通過路徑間接預報的結果進行綜合預報,并通過實驗驗證了所提出的方向預報因子、集成方法在熱帶氣旋路徑預報問題中的有效性。同樣在預測熱帶氣旋軌跡和強度的問題方面,Na 等[61]提出了一種用于預測西北太平洋盆地的遞歸神經網絡模型——熱帶氣旋預測的水庫計算,用于預測熱帶氣旋的4 個屬性,即緯度、經度、最大持續(xù)風速和最小海平面水平壓力。

為減輕臺風可能造成的巨大生命財產損失,Chen 等[62]提出了一個CNN-LSTM 混合模型,用于預測臺風的形成和強度??紤]到臺風是一個受多個相關氣象屬性影響的強對流天氣過程,作者設計了一個由3 個部分組成的混合模型:使用一個2D-CNN 從前一個特征圖的局部鄰域中提取特征,并將它分為3 個部分用于分析二維海面變量;使用一個帶三維濾波器的CNN,用于捕捉三維大氣變量(如風和氣壓)之間的空間相關性;使用一個LSTM 用于捕捉時間相關性。該混合模式的預報效果優(yōu)于以往的臺風預報方法,包括臺風的形成和強度。錢奇峰等[63]以ResNet 模型為基礎,在預訓練后應用遷移學習技術,以西北太平洋和南海臺風的衛(wèi)星云圖為樣本,設計了一種自動且客觀的臺風強度估測技術。陳睿[64]提出了一種基于深度學習的臺風時空深度混合預測模型,在24 h 臺風形成預測實驗中,最高準確率為85.2%,展現了機器學習在極端天氣中短期預測中的強大能力。

3 深度學習與數值模式結合預報最新進展

在天氣預報方面,氣象科學家一直致力于通過對物理機制的理解提高預報的準確性,試圖應用數據驅動的計算范式挖掘氣象數據元素之間復雜的時空關系。因此,將深度學習(Deep Learning)與數值天氣預報(NWP)結合的DLWP(Deep Learning Weather Prediction)已成為研究熱點[65]。圖4 展示了數值天氣預報模式與人工智能技術結合的整體概念,在預測前使用深度學習技術分析參數不確定性,在預測過程中融合特征信息進行綜合預報,并在NWP 模型輸出后對預測結果進行偏差訂正。

圖4 NWP與深度學習結合的天氣預測Fig.4 NWP combined with deep learning for weather forecasting

目前,將數值模擬與深度學習相結合的方法有很多,典型的方式有兩種:一是提高DLWP 的解釋能力,二是提高數值預報的準確性和時效性。

DLWP 使數值模擬和觀測數據在多個方面更緊密地結合,從整個系統(tǒng)建模的角度,有4 個深度學習與數值模式的結合方向:1)使用深度學習技術改進數值模式物理參數;2)使用深度學習模型替換數值模式子模塊;3)使用深度學習技術訂正數值模式輸出與真實值間可能存在的偏差;4)利用數值模式輸出的科學先驗知識作為約束條件訓練深度學習模型。

3.1 用數值理論知識增強深度學習模型

經典數值模式由一組原始方程描述,這些方程基于理論物理原理,包括牛頓第二運動定律、質量守恒定律、熱力學第一定律、理想氣體定律和靜水力學定律。因此,數值預報模式不僅可以同時捕捉多個氣象要素的時空動態(tài),而且可以考慮不同變量之間的相關性。觀測到的天氣要素的許多重要方面可以通過數值模式重現,但完全由數據驅動的深度學習模型本身難以從觀測數據中發(fā)現因果關系[66],也不能模擬整個復雜的天氣系統(tǒng),因此將數值模式輸出的科學先驗知識作為約束條件編碼于模型中,有助于保證模型的物理一致性和可解釋性。

Frnda 等[67]利用數值模式的知識訓練深度神經網絡,將天氣預報問題轉化為端到端的深度學習問題,并提出一種有效的信息融合機制,從歷史數據中學習包含NWP 先驗知識的歷史數據,可以預報多種氣象變量。Zhuo 等[68]提出了一種名為DeepTCNet 的深度學習方法,該方法由熱帶氣旋的先驗知識增強,在性能上超越了多平臺熱帶氣旋表面風分析技術(Multiplatform Tropical Cyclone Surface Wind Analysis,MTCSWA),在風半徑估計方面平均提高了32%。Chen 等[69]基于物理的深度學習框架中提出了一種名為PGnet 的溫度預測方法,其中生成神經網絡部分將掩碼作為精細預測的先驗,并通過掩碼損失和跳躍模式策略訓練生成神經網絡,避免時間序列預測期間的誤差累積,從而更精確地預測溫度。

3.2 通過深度學習改進數值模式

隨著氣象數據量的快速增長和模型分辨率的不斷提高,數值預報的計算需求急劇增加,導致數值預報效率低下。深度學習模型可以“學習”系統(tǒng)的復雜行為并快速建模,避免了求解復雜的偏微分方程,同時對于傳統(tǒng)預報方法難以預測的突發(fā)性天氣現象,深度學習與數值模式結合預報可以更及時準確地得到預測結果[70]。而經過歷史觀測數據或模式模擬運行輸出數據訓練后的深度學習模型,也可以直接用于模擬數值天氣模式的一個模塊或過程,同樣可以提高混合模型的預測準確度和預報及時性。這種通過深度學習技術改進數值天氣預報模式的方式可以從以下3 種途徑進行。

3.2.1 深度學習方法改進數值模式參數化

理論驅動的物理數值模式需要的參數存在很大的不確定性,且復雜不易推導,而深度學習方法可以學習參數化,并以最佳方式描述觀察或生成的基本事實。為了提高子網格參數化的精度,Rasp 等[71]通過學習多尺度模型訓練深度神經網絡表示混合機器學習-物理大氣環(huán)流模型(General Circulation Model,GCM)中的所有大氣子網格過程,使用訓練后的深度學習模型替代GCM 中傳統(tǒng)的子網格參數化,實驗結果證明模型整體的預測過程更快,結果更準確。在GCM 中模擬具有不同輸出的超參數化方面,Wang 等[72]設計了一組具有強非線性擬合能力的殘差深度神經網絡(Residual-Deep Neural Networks,ResDNNs),首次使用基于神經網絡的參數化在現實世界的地理邊界條件下實現長達十年的穩(wěn)定真實世界氣候模擬,展示了在氣候模擬中使用機器學習參數化的新興潛力。

3.2.2 數值天氣預報模式輸出結果的偏差訂正

雖然近年來數值模式不斷朝著精細化方向發(fā)展,但是由于它采用理想化數值假設模擬混沌大氣系統(tǒng),輸出結果不可避免地會出現偏差,因此可以通過深度學習技術快速、準確地識別和校正偏差。Peng 等[73]提出模式距平積分預報訂正方法(Anomaly Numerical-correction with Observations,ANO),通過計算多年的平均氣候態(tài)訂正數值模式系統(tǒng)性誤差,這是早期經典的偏差訂正方法之一。在此基準訂正方法之上,Han 等[74]使用基于U-Net 改進的CU-Net 模型,針對ECMWF(European Centre for Medium-range Weather Forecasts)的偏差訂正,訂正效果相較于傳統(tǒng)的 ANO 有較大提升。張延彪等[75]通過引入稠密卷積優(yōu)化CU-Net 模型,又融合多種氣象要素和地形特征信息構建了Fuse-CUnet,最終進行了不同模型的偏差訂正實驗和對比分析。

Sayeed 等[76]研究了使用計算高效的CNN 作為改進中尺度天氣研究和預報(Weather Research and Forecasting,WRF)一日模擬的輸出,對 2018 年全年 WRF 模型計算的幾個氣象參數進行了偏差校正,在模擬地表風速和風向、降水、相對濕度、地表壓力、露點溫度時減小了這些偏差。為了對所生成多步預測結果進行偏差校正,Sha 等[77]將模擬集成(Analog Ensemble,AnEn)和CNN 結合,提出了名為AnEn-CNN 的集合降水預報后處理方法,可生成長達7 d 的經過概率校準和物理現實的網格化降水預報序列。

在總結評估偏差訂正模型方面,Wang 等[78]使用GCM 每日平均、最高和最低溫度在CMIP6(Coupled Model Intercomparison Project phase 6)中全面評估了用于氣候降尺度和偏差校正的超分辨率深度殘差網絡(Super Resolution Deep Residual Network,SRDRN)深度學習模型。為了基于本地數據同化和預測系統(tǒng)進行總結評估,Cho 等[79]比較了各種單獨的后處理模型——多線性回歸、支持向量回歸、門控循環(huán)單元和卷積神經網絡的參數化效果,并提出了多模型集成方法,得到了比單個模型更可靠、更穩(wěn)健的結果。

3.2.3 利用深度學習模擬數值模式的物理過程或動力框架

如果數值模式子模塊的函數形式理論基礎不足,可以使用足夠數量的觀察值訓練機器學習模型替換原子模塊。例如,Scher 等[80]設計了一個直接利用端到端的深層卷積神經網絡完全模擬并替代GCM,神經網絡以GCM 的完整模型狀態(tài)為輸入,學習仿真其動力學框架并預測下一個模型狀態(tài),結果證實了該模型可以在保證預報準確率的情況下有效提高計算效率。類似地,De Bézenac 等[81]使用深度學習模型有效地模擬海洋中的水的運動并預測海面溫度(Sea Surface Temperature,SST)。在此基礎上,Weber 等[82]探討了 用CanESM2(Canadian Earth System Model2)模擬的1pctCO2(二氧化碳濃度每年增加1%)運行97 年的輸出訓練的卷積神經網絡,作為降水場替代模型的應用,這種替代后的混合模型即使在預測長度延長至120 個月時,性能也沒有顯著下降。

4 現存挑戰(zhàn)與未來工作展望

盡管深度學習模型已經通過各種方式被廣泛應用于天氣預報的研究中,但是由于氣象數據本身復雜度高、數據量大和格式多樣的特點,用于時空數據的預測問題的深度學習模型仍然面臨挑戰(zhàn),例如高緯度多通道的天氣數據帶來的龐大的算力需求、深度學習模型本身的可解釋性、以及觀測數據自身的復雜和不確定性。目前針對這些挑戰(zhàn)的解決方案,也已經有了一定的研究進展。

4.1 龐大的算力需求

天氣預報這類科學問題的高計算成本一直是一個巨大的技術挑戰(zhàn),氣象機構每天都必須以幾乎實時的方式處理萬億字節(jié),通常精度也非常高,因此在深度學習模型上應用并行技術已成為一種必然趨勢。模型在訓練時可能被挖掘的并行性能也應是深度學習應用于天氣預報領域需要考慮的問題,而對于深度學習模型本身的計算性能提升也已經有了一定的研究基礎。

使用CUDA(Compute Unified Device Architecture)利用GPU 強大的并行計算能力處理深度網絡的這個思想最早在ResNeXt[83]中被提 出。Huang 等[84]將分組 思想應用于DenseNet,提出了優(yōu)化后的CondenseNet。后續(xù)也有不少研究者指出傳統(tǒng)的組卷積存在需要手動設置組數、分組方式不確定等不足,并提出了針對這些問題的優(yōu)化方法[85-86]。

上述研究都證實了CNN 的可并行性,但是幾乎所有的序列預測問題上都有良好表現的RNN 在每個時間步上的計算結果之間都存在依賴關系,意味著所有基于LSTM 的模型都難以直接并行。因此,解決問題的主要思路就是拋開RNN 作序列建模。

例如,Transformer[87]充分利用了注意力機制,在編碼器的內部使用自注意力與前饋神經網絡聯合建模進行訓練,在編碼器和解碼器連接處使用注意力機制作映射,最終達到了優(yōu)于RNN 的效果。Bai 等[88]以加入殘差塊的CNN 為基礎,首次提出了一種時域卷積網絡(Temporal Convolutional Network,TCN)。TCN 的卷積層結合了因果卷積與空洞卷積,其中因果卷積保證了前面時間步的預測不會使用未來步的信息,空洞卷積則可以在不做池化的情況下迅速擴大感受野(Receptive Field)。隨后,Yan 等[89]發(fā)表了有關TCN 用于天氣預報任務的研究成果,通過TCN 和LSTM 的對比實驗,證實TCN 在計算效率和預測準確度上都表現良好。近期,Hewage 等[90]進一步提出具有LSTM 和TCN 層的深度學習網絡,在多輸入多輸出和多輸入單輸出兩種不同的回歸分析中進行了評估,并表明與復雜WRF 模式相比,這種輕量級天氣預報模式也可以擁有很好的預報效果。

4.2 深度學習模型的“黑箱”問題

提升預測準確度的同時將結果可視化供人類分析的可解釋性也是至關重要的,而深度學習模型的可解釋性被認為是它的一個潛在弱點[91]。鑒于氣象科學問題的復雜性,研究人員在實踐中很難獲得模型訓練過程中的假設,因此也限制了模型的可解釋性。深度學習技術可以通過建立更復雜的函數擬合觀測值,但是觀測數據的偏差和訓練過程中的誤差都是不可避免的,所以預測結果也可能出現與物理理論不一致或結果不可信的情況[9]。通過對深度學習模型進行特征分析與可解釋研究,不僅有助于人們理解模型的推理過程以便于更有針對性地優(yōu)化預報模型,同時還有助于提取有效的科學信息以更好地理解地球系統(tǒng)。

目前已經有不少研究者開始探索利用“可解釋人工智能”解決機器學習和深度學習在氣象領域的可解釋性問題。Manandhar 等[92]通過特征選擇方法找到對降水具有較大影響的特征,并基于這些特征優(yōu)化機器學習方法,在降水量預測上有效降低虛警率。Gagne 等[93]使用CNN 基于上層空氣動力場和熱力場進行冰雹預測,并通過對CNN 特征重要性的解釋與分析綜合了對冰雹生成過程的理解,最終實驗結果證明模型預測結果優(yōu)于其他模型。Toms 等[94]優(yōu)化了特征可視化和層間相關傳播(Layer-wise Relevance Propagation,LRP)方法,并分析探討了厄爾尼諾現象季節(jié)性預報相關的可解釋性問題。Yuan 等[95]提出了一種基于雙因素注意力機制的預報模型,從時間信息和先驗知識這兩個方面學習訓練注意力權重,并在公共天氣預報數據集上得到了更高的預報精度。

4.3 復雜且不確定的數據

雖然各種傳感技術的發(fā)展能夠收集并保存大量可供學習的地球數據,但是不同的傳感器觀測獲得并轉化生產的數據圖片形狀和統(tǒng)計信息的內容和物理意義都不同,并且觀測數據也不可避免地伴隨著各種噪聲、不確定性和缺失;因此集成處理、消納利用這些數據且是一個非常大的挑戰(zhàn),而且在這個過程中往往需要采用復雜和不確定的數據機器學習方法。Chakraborty 等[96]通過研究NCEP/NCAR、MERRA-2和ERA5這幾種全球再分析數據集,發(fā)現它們的月平均入射輻射都存在不同程度的低估,散射輻射同時存在被低估或高估的情況,并通過實驗證明隨機森林方法可在一定程度上改善這一誤差。

此外,集成多傳感器數據在天氣預報領域也是一項挑戰(zhàn),因為從不同的傳感器獲取的內容和信息不同,統(tǒng)計數據的空間和時間分辨率和物理意義也不同。不過資料同化技術已經發(fā)展多年,目前已有逐步訂正、最優(yōu)插值和卡爾曼濾波等較為基礎的同化技術。Peyron 等[97]將深度學習方法整合到數據同化框架中,利用自動編碼器提供的潛在結構設計潛在空間中具有模型誤差的集成變換卡爾曼濾波器(Ensemble Transform Kalman Filter,ETKF),這種新穎的算法可以準確地表示觀察的動態(tài),既降低了計算成本,又提供了比ETKF-Q 等先進算法更好的準確性。Wang 等[98]則通過使用正壓渦量方程展示深度學習增強數據同化的潛力,通過以粗略的“預測”分辨率訓練具有長時間模擬的卷積自動編碼器,將空間上不完整的觀察映射到具有完全空間覆蓋和分辨率的模型狀態(tài),最終得到了令人滿意的重建性能。

除了以上研究,更具挑戰(zhàn)性的就是如何從深度模型的訓練過程中獲得對地球體統(tǒng)本身的理解,并實現從數據中最大限度地學習模型的同時,將物理、生物、氣象和地質等原理知識也納入考慮范圍。目前主流的將這些要素綜合考慮的方法是將數值模式與深度學習結合建立混合模型。下文總結了綜合研究可能的研究方向與問題。

數據和模型的選擇與融合 對于同一個氣象任務,可以收集到的數據格式和可選擇的深度學習模型都是不唯一的。例如,針對氣象觀測站點的多維數據,可以將預測問題的目標數值直接建模為一個時空序列,使用RNN+CNN 進行預測;也以可將各個站點建模為圖,融合圖卷積建模。如何正確選擇或者融合深度學習模型和時空數據目前還缺乏更深入的研究。

更綜合的評價標準 很多模型通過堆疊各種現有的時空預測技術以得到更好的預測性能,大部分的文章也通過消融實驗證明了所提模型架構的每一部分的有效性;但是重用多種深度學習技術構造的復雜的深度學習模型同時也會帶來巨大的時間和空間復雜度。這種用“大量的訓練時間”和“巨大的顯存占用”換取“精度的提升”的平衡是否值得的問題尚且沒有全面的研究,也沒有一個綜合精度與計算性能的評估標準評價模型的綜合性能。

總之,氣象相關的地球科學問題需要處理大量、快速增長的數據,為了能夠更進一步完成更精準的預測、更科學的建模,并在研究中理解復雜地球系統(tǒng),研究者需要繼續(xù)探索將融合了時間與空間信息編碼能力的深度學習模型進行優(yōu)化,并考慮與基于過程的物理模式相結合,以提供更準確、不確定性更小、物理上一致的推斷。

5 結語

本文主要總結了深度學習在天氣預報領域的發(fā)展歷程,將天氣預報問題與其他典型深度學習應用問題進行了類比研究,回顧與總結了天氣預報領域的深度學習的發(fā)展過程,也對比了深度學習評價指標在天氣預報領域的融合以及應用場景。目前,正在興起且具有一定前景和潛力的基于過程和深度學習模型相結合的方法尚有許多問題和挑戰(zhàn)等待解決和深入探究。天氣預報中完全通過數據驅動的機器學習方法短時間內不會取代由物理原理構建的數值模式,但卻是對數值模式的有力補充,并且能夠有效優(yōu)化預報效率,所以二者間的協同作用是不可忽略的。對于天氣預報領域,最終目標是通過混合建模使得模型能夠自適應數據,且遵守物理定律,具有一定的可解釋性。通過綜合分析和總結研究現狀中存在的不足和空白點,本文最后提出了對未來可行研究方向的展望,旨在為本領域研究者梳理亟待研究的問題并為后續(xù)研究工作提供參考。

猜你喜歡
天氣預報氣象數值
用固定數值計算
氣象樹
數值大小比較“招招鮮”
《內蒙古氣象》征稿簡則
內蒙古氣象(2021年2期)2021-07-01 06:19:58
氣象戰(zhàn)士之歌
心聲歌刊(2019年5期)2020-01-19 01:52:52
測不準的天氣預報
天氣預報的前世今生
大國氣象
中期天氣預報
中國農資(2016年1期)2016-12-01 05:21:22
基于Fluent的GTAW數值模擬
焊接(2016年2期)2016-02-27 13:01:02
乐亭县| 安徽省| 同江市| 齐河县| 平定县| 柳州市| 泰宁县| 前郭尔| 城口县| 紫阳县| 普兰店市| 白水县| 鞍山市| 金堂县| 阳城县| 土默特右旗| 怀化市| 云浮市| 年辖:市辖区| 宝坻区| 天镇县| 嘉峪关市| 班玛县| 镇原县| 金川县| 玉环县| 河东区| 武功县| 进贤县| 融水| 江源县| 道孚县| 隆化县| 潍坊市| 黔东| 密山市| 东安县| 平舆县| 普宁市| 景泰县| 乃东县|