張亞萍,張焱,翟丹華,劉伯駿,周國兵
(重慶市氣象臺,重慶401147)
天氣預(yù)報(bào)是根據(jù)過去和現(xiàn)在的大氣狀態(tài),利用現(xiàn)代預(yù)報(bào)技術(shù)和方法,運(yùn)用天氣學(xué)、動力氣象學(xué)、統(tǒng)計(jì)學(xué)等科學(xué)理論和數(shù)值預(yù)報(bào)技術(shù),對未來某一地區(qū)或地點(diǎn)的大氣狀態(tài)及可能影響進(jìn)行預(yù)測(《中國氣象百科全書·氣象預(yù)報(bào)預(yù)測卷》編委會,2016)。世界氣象組織(World Meteorological Organization,WMO)將臨近預(yù)報(bào)(Nowcasting)定義為從現(xiàn)在到未來6 h內(nèi)的天氣預(yù)報(bào)(鄭永光等,2010;WMO,2017)??紤]到本文主要討論的是深度學(xué)習(xí)方法在0~2 h強(qiáng)降水預(yù)報(bào)技術(shù)中的應(yīng)用,因此對降水臨近預(yù)報(bào)(Precipitation Nowcasting)的定義采用Ravuri 等(2021)的標(biāo)準(zhǔn),即對未來0~2 h 的降水進(jìn)行高時(shí)空分辨率的預(yù)報(bào)。精準(zhǔn)的降水臨近預(yù)報(bào),除有助于開展重大活動氣象保障服務(wù)和公眾日常出行外,還是發(fā)布強(qiáng)降水誘發(fā)城鄉(xiāng)積澇、中小河流洪水以及山洪、滑坡、泥石流等次生災(zāi)害氣象風(fēng)險(xiǎn)預(yù)警的重要技術(shù)支撐,并為應(yīng)急管理部門指揮搶險(xiǎn)救災(zāi)提供參考信息。短時(shí)強(qiáng)降水(Flash heavy rain)是指1 h雨量大于等于20 mm 的降水事件。為了分析短時(shí)強(qiáng)降水的極端性,需要進(jìn)一步將1 h 雨量≥80 mm 或3 h 雨量≥180 mm 的降水事件作為極端短時(shí)強(qiáng)降水(俞小鼎等,2020)。目前,業(yè)務(wù)上采用的降水臨近預(yù)報(bào)方法主要是拉格朗日外推法(鄭永光等,2010),外推法只對范圍較大的弱降水預(yù)報(bào)效果較好,但對短時(shí)強(qiáng)降水預(yù)報(bào)在落區(qū)和強(qiáng)度上還存在較大偏差,限制了降水臨近預(yù)報(bào)產(chǎn)品的業(yè)務(wù)用途(Wilson et al.,2020;Ravuri et al.,2021)。短時(shí)強(qiáng)降水誘發(fā)的次生災(zāi)害往往會對人民生命財(cái)產(chǎn)及各種生產(chǎn)生活設(shè)施造成重大危害,為更好地發(fā)揮降水臨近預(yù)報(bào)的作用,急需提升短時(shí)強(qiáng)降水預(yù)報(bào)精度。
人工智能(Artificial Intelligence,AI)在大氣科學(xué)及相關(guān)領(lǐng)域得到了廣泛應(yīng)用(許小峰,2018;馬雷鳴,2020;王啟光和丑紀(jì)范,2021;張敬林等,2022)。其中,深度學(xué)習(xí)(Deep Learning,DL)算法因能自動提取強(qiáng)對流天氣的非線性特征,可對具有高度非線性變化的降水 進(jìn) 行 較 好 的 預(yù) 報(bào)(Shi et al.,2015;Ravuri et al.,2021)。然而,目前大多數(shù)深度學(xué)習(xí)模型只考慮了輸入數(shù)據(jù)本身的信息,模型訓(xùn)練過程中沒有人為的先驗(yàn)信息,因此將先驗(yàn)知識與深度學(xué)習(xí)模型融合,則有可能提高此類模型的準(zhǔn)確性和泛化能力。如,由Zhuo 和Tan(2021)發(fā)展的基于深度學(xué)習(xí)的熱帶氣旋強(qiáng)度和大小估計(jì)模型DeepTCNet,將表征熱帶氣旋強(qiáng)度的豐滿度(fullness)指標(biāo)(Guo and Tan,2017)作為輔助信息,模型融合輔助信息后估計(jì)熱帶氣旋強(qiáng)度的誤差較未融合輔助信息時(shí)的誤差減少12%。如何有效地將基于預(yù)報(bào)員經(jīng)驗(yàn)、不受物理公式約束的強(qiáng)降水天氣特征作為先驗(yàn)知識融入到深度學(xué)習(xí)模型,是提升強(qiáng)降水臨近預(yù)報(bào)準(zhǔn)確率面臨的重要挑戰(zhàn)之一。為此,本文梳理了深度學(xué)習(xí)算法在強(qiáng)降水臨近預(yù)報(bào)技術(shù)中的應(yīng)用情況,并提出了改進(jìn)強(qiáng)降水臨近預(yù)報(bào)技術(shù)的幾點(diǎn)建議。
關(guān)于人工智能,可將其簡單理解為研究一種“機(jī)器”,這種“機(jī)器”在處理任務(wù)時(shí)具有類似人類智力的特點(diǎn)(Russell and Norvig,2020)。制作強(qiáng)降水臨近預(yù)報(bào)時(shí)采用的外推法和數(shù)值預(yù)報(bào)方法,實(shí)質(zhì)上都屬于人工智能方法。外推法對強(qiáng)降水演變的非線性考慮不足(Wilson et al.,1998);雖然現(xiàn)有高分辨率對流尺度數(shù)值模式可以模擬局地對流,但由于數(shù)值預(yù)報(bào)模式需要spin-up時(shí)間、對流尺度同化方法提供的初始條件還不能完全與高分辨率對流尺度數(shù)值模式相協(xié)調(diào)(Sun et al.,2014)、顯式微物理方案(Jensen et al.,2020)和邊界層模擬技術(shù)(Sun et al.,2021)也需要進(jìn)一步完善,導(dǎo)致數(shù)值預(yù)報(bào)對強(qiáng)降水臨近預(yù)報(bào)效果比外推法差,因此,對精準(zhǔn)模擬局地尺度的對流存在困難。在提取非線性特征方面,深度學(xué)習(xí)是人工智能中最具優(yōu)勢的方法(LeCun et al.,2015),將深度學(xué)習(xí)用于提取強(qiáng)降水演變的非線性特征,從而提高強(qiáng)降水預(yù)報(bào)準(zhǔn)確率,是外推法和數(shù)值預(yù)報(bào)方法的有效補(bǔ)充(Ravuri et al.,2021)。為后文討論方便,先對目前主流的深度學(xué)習(xí)模型以及一些已開展的針對深度學(xué)習(xí)模型可解釋性的探索成果簡述如下。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)和圖神經(jīng)網(wǎng)絡(luò)(Graph neural networks,GNN)是深度學(xué)習(xí)中最典型的三類模型。對其分別介紹如下:
(1)CNN。該模型專門用于從空間網(wǎng)格等具有拓?fù)浣Y(jié)構(gòu)的數(shù)據(jù)中學(xué)習(xí)。該深度學(xué)習(xí)模型由于采用卷積核和深層網(wǎng)絡(luò)實(shí)現(xiàn)特征圖上像素點(diǎn)感受野的擴(kuò)大和多尺度深層特征提取,采用激活函數(shù)進(jìn)行非線性映射等,在圖像識別任務(wù)上表現(xiàn)極佳(Krizhevsky et al.,2012)。但隨著神經(jīng)網(wǎng)絡(luò)深度加深會出現(xiàn)梯度消失問題,導(dǎo)致訓(xùn)練難以收斂。He 等(2016)研發(fā)的深度殘差網(wǎng)絡(luò)(Deep Residual Learning Network,ResNet)能夠有效避免梯度消失現(xiàn)象。只要提供一定數(shù)量的矩陣數(shù)據(jù)和對應(yīng)的標(biāo)簽,均可以用CNN 進(jìn)行識別,如進(jìn)行鋒面和陣風(fēng)鋒等的識別(Lagerquist et al.,2019;徐月飛等,2020)。
(2) RNN。CNN 注重的是空間特征的提取,而RNN在神經(jīng)網(wǎng)絡(luò)中引入了記憶的反饋,即每一個(gè)時(shí)間步中除了輸入當(dāng)前特征外,還要輸入上一步輸出的隱藏特征,因此可用于處理序列數(shù)據(jù)(Rumelhart et al.,1986;Werbos,1990),其中每一個(gè)輸出都與之前所有序列數(shù)據(jù)相關(guān),即過去的數(shù)據(jù)會對未來的數(shù)據(jù)產(chǎn)生影響,具有“記憶”效果。為避免RNN存在的梯度消失現(xiàn)象,Hochreiter 和Schmidhuber (1997)發(fā)展了長短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short Term Memory,LTSM),Vaswani等(2017)則發(fā)展了門控循環(huán)單元(Gated Recurrent Unit,GRU)。Shi 等(2015)將降水臨近預(yù)報(bào)作為一個(gè)針對雷達(dá)回波演變的時(shí)空序列預(yù)報(bào)問題,發(fā)展了卷積長短期記憶網(wǎng)絡(luò)(Convolutional LSTM Network,ConvLSTM),模型的輸入為包括當(dāng)前時(shí)次在內(nèi)的時(shí)間間隔為6 min的過去J個(gè)時(shí)次觀測的回波,模型輸出為未來K個(gè)時(shí)次的回波最可能的演變情況。
(3)GNN。許多學(xué)習(xí)任務(wù)都需要處理包含元素間豐富關(guān)系信息的圖(Graph)數(shù)據(jù)。GNN(Scarselli et al.,2009)將神經(jīng)網(wǎng)絡(luò)使用在圖數(shù)據(jù)上,通過圖節(jié)點(diǎn)之間的消息傳遞來捕獲圖的依賴性。GNN 能處理不規(guī)則數(shù)據(jù)結(jié)構(gòu),可用于場景分析和問題推理等,如道路交通動態(tài)流量預(yù)測、智能客服、異常檢測、欺詐檢測等(Zhou et al.,2020a;Waikhom and Patgiri,2021)。由于GNN具有處理不規(guī)則數(shù)據(jù)結(jié)構(gòu)的優(yōu)勢,其在氣象上的應(yīng)用研究也會逐漸增加(Lin et al.,2021)。
(4)其他模型。主流的深度學(xué)習(xí)模型還包括Hinton 等(2006)提出的深度信念網(wǎng)絡(luò)(Deep Belief Networks,DBN)、Goodfellow 等(2014)提出的生成式對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)、Vaswani 等(2017)提出的Transformer 等。其中,Transformer 以注意力機(jī)制(Attention)為其網(wǎng)絡(luò)結(jié)構(gòu),與CNN、RNN 和GNN 均有一定的相似性(Bai et al.,2019;Cordonnier et al.,2019;Katharopoulos et al.,2020)。自然語言處理(Natural Language Processing,NLP)和計(jì)算機(jī)視覺(Computer vision,CV)領(lǐng)域?qū)ransformer的研究應(yīng)用都較廣泛,但Transformer對數(shù)據(jù)量的要求較高。
深度學(xué)習(xí)模型在大氣科學(xué)領(lǐng)域的可解釋性初步分為兩個(gè)方向,即對深度學(xué)習(xí)模型的“黑箱”探索方向和基于特征提取后的可解釋性方向。
深度學(xué)習(xí)模型是端到端(end to end)的“黑箱”模型,其中間過程不可知、結(jié)果不可控。一方面,人們難以知道它在做什么;另一方面,難以解釋和理解它為什么這么做。隨著對深度學(xué)習(xí)可解釋性需求的增加,對深度學(xué)習(xí)模型進(jìn)行解釋的方法得到了發(fā)展。如,通過求出某個(gè)神經(jīng)元的激活值相對于原始輸入圖像的梯度,把某個(gè)神經(jīng)元的輸出重構(gòu)回原始輸入像素空間,可研究該神經(jīng)元究竟在尋找什么特征(Zeiler and Fergus,2013;Karpathy et al.,2015)。為探索深度學(xué)習(xí)模型是否能夠?qū)臻g天氣特征進(jìn)行編碼,并解釋其與相關(guān)強(qiáng)天氣的聯(lián)系,Gagne等(2019)利用深度學(xué)習(xí)方法研究了直徑25 mm以上冰雹的預(yù)報(bào)水平,通過特征重要性和特征優(yōu)化對CNN 進(jìn)行解釋,結(jié)果表明:該網(wǎng)絡(luò)綜合了大的溫度遞減率和有利于寬廣上升氣流的風(fēng)切變廓線等有利于冰雹生長的環(huán)境和風(fēng)暴形態(tài)信息,這與氣象學(xué)家的理解一致。
Lagerquist 等(2019)以人工分析的鋒面為標(biāo)簽,利用CNN來識別天氣尺度鋒面,然后采用后處理方法將網(wǎng)格上的概率值轉(zhuǎn)化為預(yù)報(bào)目標(biāo),用北美區(qū)域再分析資料中的1 000 hPa風(fēng)速、溫度、比濕、濕球位溫和位勢高度等網(wǎng)格化資料作為預(yù)報(bào)因子,結(jié)果表明該系統(tǒng)有可能用于定量解釋數(shù)值天氣預(yù)報(bào)集合成員預(yù)報(bào)鋒面特性的多樣性。
人工標(biāo)簽雖然也是一種對先驗(yàn)知識的應(yīng)用,但若在模型提取特征前就引入先驗(yàn)知識,如基于主觀預(yù)報(bào)經(jīng)驗(yàn)或概念模型先對某些特征(如陣風(fēng)鋒、中氣旋等)進(jìn)行提取,將提取的特征進(jìn)行編碼再與模型融合,也可能是探索模型可解釋性和提高模型泛化能力的一種方法。
強(qiáng)降水臨近預(yù)報(bào)主要是基于地面雨量計(jì)、天氣雷達(dá)、氣象衛(wèi)星等監(jiān)測資料,分析監(jiān)測到的強(qiáng)降水中心特征,采用主客觀方法預(yù)報(bào)未來0~2 h強(qiáng)降水中心和量級。強(qiáng)降水落區(qū)和量級預(yù)報(bào)越準(zhǔn)確,越有利于提升強(qiáng)降水誘發(fā)的城市積澇、山洪、滑坡等次生災(zāi)害的預(yù)警提前量。對目前常用的幾種強(qiáng)降水臨近預(yù)報(bào)方法簡介如下。
目前,臨近預(yù)報(bào)在很大程度上仍然是依賴于基于觀測的拉格朗日外推。此外推法又可分為平流外推法和單體跟蹤外推法,但無論采用何種外推,準(zhǔn)確預(yù)報(bào)強(qiáng)回波中心的位置和強(qiáng)度都是提高強(qiáng)降水預(yù)報(bào)精度的關(guān)鍵。
平流外推法通常是假設(shè)在數(shù)小時(shí)時(shí)間范圍內(nèi),通過沿不變的運(yùn)動場來移動雷達(dá)回波,且不改變其強(qiáng)度以捕獲降水演變(Zawadzki et al.,1994)。用于臨近預(yù)報(bào)的平流場通?;谑褂米钚吕走_(dá)圖像或衛(wèi)星云圖分析獲得的視運(yùn)動?;夭ㄟ\(yùn)動場可通過相關(guān)系數(shù)法(Wilson et al.,1998;Li et al.,2000;陳明軒等,2007;胡勝等,2011;羅義等,2021)或光流法(韓雷等,2008;曹春燕等,2015;Pulkkinen et al.,2019;田剛等,2021)得到。單體跟蹤外推法首先將風(fēng)暴識別為當(dāng)前雷達(dá)掃描中的目標(biāo),然后通過在連續(xù)掃描中識別相同的目標(biāo)來跟蹤風(fēng)暴的運(yùn)動(Dixon and Wiener,1993;Johnson et al.,1998;胡勝等,2006;鄭永光等,2010),適用于識別和跟蹤強(qiáng)對流風(fēng)暴。將外推預(yù)報(bào)的雷達(dá)回波經(jīng)過Z-R關(guān)系(Z為天氣雷達(dá)反射率因子,R為降水強(qiáng)度)轉(zhuǎn)換為降水,得到降水臨近預(yù)報(bào)結(jié)果。
與雷達(dá)強(qiáng)回波中心的外推預(yù)報(bào)類似,通過對衛(wèi)星云圖上的強(qiáng)降水云團(tuán)進(jìn)行識別和跟蹤(Hubert and Whitney,1971;Merritt and Fritsch,1984;白潔等,1997;傅云飛,2019;楊磊等,2020),可開展強(qiáng)降水臨近預(yù) 報(bào)。如,Merritt 和Fritsch (1984)利用GOES 衛(wèi)星的10.7 μm 數(shù)字資料將中尺度對流系統(tǒng)(Mesoscale Convective System,MCS)最冷云頂簇定義為空間尺度在10~100 km、時(shí)間尺度在1~10 h 的β中尺度核(Meso-Beta Cores,MBC),并通過監(jiān)測和預(yù)報(bào)MBC 的移動和傳播實(shí)現(xiàn)基于衛(wèi)星的強(qiáng)降水監(jiān)測和預(yù)報(bào)。隨著衛(wèi)星觀測資料時(shí)空分辨率的提高(Yang et al.,2017)以及對流初生(Convection Initiation,CI)等臨近預(yù)報(bào)技術(shù)的發(fā)展(黃亦鵬等,2019),衛(wèi)星、雷達(dá)等多源觀測資料將在降水臨近預(yù)報(bào)中得到更充分的融合與應(yīng)用。
然而,拉格朗日外推預(yù)報(bào)精度會隨時(shí)間迅速降低(Wilson et al.,1998;Mandapaka et al.,2012)。正因?yàn)槿绱耍琓sonis和Austin(1981)針對已經(jīng)維持了30 min以上的風(fēng)暴單體,利用回波影響范圍和強(qiáng)度的時(shí)間變化趨勢,希望能提高臨近外推預(yù)報(bào)的精度,結(jié)果發(fā)現(xiàn)即使在復(fù)雜的非線性時(shí)間趨勢方案中,預(yù)報(bào)技巧的提高也微不足道。后來,Wilson 等(1998)測試了類似的回波趨勢變化技術(shù),得到了相似的結(jié)果,并指出預(yù)報(bào)技巧難以提高的原因可能是決定強(qiáng)降雨隨時(shí)間變化的關(guān)鍵物理過程(如邊界層風(fēng)的輻合)在回波發(fā)展過程中不一定是可被觀測到的。
目前基于數(shù)值模式的0~2 h 強(qiáng)降水預(yù)報(bào)效果還不理想,主要原因包括數(shù)值模式預(yù)報(bào)提前時(shí)間少于模式spin-up 所需時(shí)間、非高斯分布數(shù)據(jù)同化存在困難(Sun et al.,2014)、對云及對流過程表征還不夠準(zhǔn)確(Guo et al.,2015)等。另外,高分辨率快速更新模式(High-Resolution Rapid Refresh,HRRR)還不能精準(zhǔn)模擬出既受外流邊界輻合影響又受地形影響的γ中尺度氣流,從而導(dǎo)致降水臨近預(yù)報(bào)出現(xiàn)誤差。近年,國外有人利用HRRR 模式(Wilson et al.,2020)研究了2017年夏季沿美國科羅拉多州弗蘭特山脈120 km 空間尺度上的降水臨近預(yù)報(bào)情況,結(jié)果表明:模式預(yù)報(bào)的0~2 h降水精度較基于天氣雷達(dá)資料的外推結(jié)果差;局地尺度(中尺度)對強(qiáng)降水的影響比大尺度(天氣尺度)的影響要大得多,在局地尺度上大尺度趨勢對于修正外推臨近預(yù)報(bào)沒有作用。
數(shù)值預(yù)報(bào)方法對0~2 h預(yù)報(bào)還多是參考,其直接應(yīng)用偏少,但可通過使用后處理診斷工具提取一些有用信息進(jìn)行間接使用(鄭永光等,2015a,2015b;WMO,2017)。大量事實(shí)證明,NWP 模式在起報(bào)數(shù)小時(shí)后通常比外推法能產(chǎn)生更好的定量降水預(yù)報(bào)效果,因此通常將雷達(dá)回波外推與數(shù)值天氣預(yù)報(bào)模式相結(jié)合以生成無縫的0~6 h 預(yù)報(bào)(程叢蘭等,2013;Sun et al.,2014;Pinto et al.,2018)。
由于深度學(xué)習(xí)能提取復(fù)雜的非線性特征,它適用于處理強(qiáng)降水臨近預(yù)報(bào)這種需要進(jìn)行強(qiáng)降水回波或強(qiáng)降水云團(tuán)空間特征提取和時(shí)間演變分析的情形。如果按照輸入數(shù)據(jù)和輸出數(shù)據(jù)類型不同,可將基于深度學(xué)習(xí)方法的強(qiáng)降水臨近預(yù)報(bào)分為以下3種情況:
(1)深度學(xué)習(xí)模型的輸入和輸出均為雷達(dá)反射率因子場,將模型輸出經(jīng)過Z-R關(guān)系轉(zhuǎn)換為降水。這是目前進(jìn)行強(qiáng)降水臨近預(yù)報(bào)最常用的方法。這方面工作最早可追溯到Shi等(2015)提出的ConvLSTM。此后不久,Shi等(2017)又提出了卷積核可變形門控循環(huán)單元(Trajectory Gated Recurrent Unit,TrajGRU),通過顯式地學(xué)習(xí)輸入數(shù)據(jù)中的空間變化關(guān)系,改進(jìn)了ConvLSTM 卷積循環(huán)結(jié)構(gòu)位置不變的不足。之后,其他人在相關(guān)工作上也有一些進(jìn)展。如,韓豐等(2019)使用預(yù)測循環(huán)神經(jīng)網(wǎng)絡(luò)架構(gòu)(predictive RNN),利用歷史雷達(dá)組合反射率因子建模,進(jìn)行未來1 h 組合反射率因子預(yù)報(bào),對反射率因子強(qiáng)度變化有一定的預(yù)報(bào)能力。郭瀚陽等(2019)基于改進(jìn)的RNN 算法形成的自編碼模型,開展了強(qiáng)對流高分辨率臨近預(yù)報(bào)試驗(yàn),其結(jié)果比傳統(tǒng)外推方法有了較明顯的提高。Agrawal 等(2019)將回波演變模擬視為一個(gè)圖像到圖像的轉(zhuǎn)換問題,基于深度圖像分割網(wǎng)絡(luò)U-Net 架構(gòu)(Ronneberger et al.,2015)進(jìn)行降水臨近預(yù)報(bào),其預(yù)報(bào)效果好于光流法。參考U-Net 和SegNet (Badrinarayanan et al.,2017),Ayzel等(2020)提出了RainNet模型,該模型是一種分支之間有跳躍連接的、遵循標(biāo)準(zhǔn)的編碼器-解碼器結(jié)構(gòu)的深度卷積神經(jīng)網(wǎng)絡(luò),其預(yù)報(bào)效果也優(yōu)于光流法。Trebing 等(2021)提出了一個(gè)基于U-Net 的、包括注意力模塊和深度可分離卷積的SmaAt-UNet 模型,該模型僅使用了1/4的可訓(xùn)練參數(shù),在預(yù)報(bào)性能上與其他模型相當(dāng)。
值得一提的是,重慶市氣象局與百度公司合作,基于2008—2018年天氣雷達(dá)數(shù)據(jù)集和其它實(shí)況資料,結(jié)合重慶市氣象臺發(fā)展的冰雹大風(fēng)自動標(biāo)識技術(shù)(劉伯駿等,2021),采用TrajGRU,初步建立了三維雷達(dá)回波智能臨近預(yù)報(bào)模型,并將以上技術(shù)用于強(qiáng)降水臨近預(yù)報(bào)業(yè)務(wù)。結(jié)果顯示,與中國氣象局災(zāi)害天氣短時(shí)臨近預(yù)報(bào)系統(tǒng)(Severe Weather Automatic Nowcast system,SWAN)的產(chǎn)品相比,雷達(dá)回波智能預(yù)報(bào)能力隨時(shí)間降低的速度低于傳統(tǒng)外推方法,對長時(shí)效雷達(dá)回波預(yù)報(bào)明顯提升,降水智能預(yù)報(bào)比SWAN降水預(yù)報(bào)有了一定程度的提高(顧建峰等,2020),但對強(qiáng)降水的預(yù)報(bào)能力仍然有限。對重慶2018年發(fā)生的10次暴雨天氣過程的檢驗(yàn)表明,以7 mm·h-1雨強(qiáng)為閾值,深度學(xué)習(xí)的1 h臨近預(yù)報(bào)臨界成功指數(shù)(Critical Success Index,CSI)為0.16,而SWAN 的只有0.04;其2 h 臨近預(yù)報(bào)CSI 僅為0.06,而SWAN的則更低,為0.01(顧建峰等,2020)。
(2)深度學(xué)習(xí)模型的輸入和輸出均為降水場。隨著預(yù)報(bào)時(shí)效的延長,由于缺乏對提高預(yù)測值很重要的小尺度天氣特征的有效提取,基于深度學(xué)習(xí)的降水臨近預(yù)報(bào)模型輸出的降水場越來越模糊,預(yù)報(bào)的不確定性也相應(yīng)增加。為有效提取小尺度天氣特征以提高強(qiáng)降水預(yù)報(bào)準(zhǔn)確率,Ravuri等(2021)提出了降水深度生成模型(Deep Generative Model of Rainfall,DGMR),采用的算法框架為Mirza 和Osindero (2014)提出的條件生成對抗網(wǎng)絡(luò)(Conditional Generative Adversarial Network,CGAN)。DGMR 的輸入和標(biāo)簽均為雷達(dá)定量估計(jì)降水,輸出為降水場。DGMR平衡了預(yù)報(bào)的降水強(qiáng)度和范圍,可更好地捕捉環(huán)流、強(qiáng)度和結(jié)構(gòu)等信息,更準(zhǔn)確地預(yù)報(bào)局部降雨,提高了強(qiáng)降水預(yù)報(bào)的質(zhì)量和一致性。此外,通過50 多位氣象專家的系統(tǒng)評估,與利用平流方法的PySTEPS (Pulkkinen et al.,2019)和利用深度學(xué)習(xí)方法的MetNet (S?nderby et al.,2020)相比,DGMR 在89% 的案例中其準(zhǔn)確性和實(shí)用性排名第一,對強(qiáng)降水的位置、范圍、運(yùn)動和強(qiáng)度預(yù)報(bào)均具優(yōu)勢。
(3)深度學(xué)習(xí)模型的輸入為多源數(shù)據(jù),輸出為降水場。S?nderby 等(2020)提出了一種將LSTM 編碼器和軸向注意力解碼器組合的模型(即MetNet),該模型以雷達(dá)定量估計(jì)降水、衛(wèi)星數(shù)據(jù)作為輸入,并進(jìn)行了經(jīng)緯度、海拔高度、小時(shí)、日、月等實(shí)值特征的嵌入,實(shí)現(xiàn)了對未來8 h 降水的預(yù)報(bào),并能生成概率降水預(yù)報(bào)圖。Ravuri 等(2021)利用英國和美國的數(shù)據(jù)對MetNet的預(yù)報(bào)性能進(jìn)行評估后發(fā)現(xiàn),額外的衛(wèi)星或地形數(shù)據(jù)以及時(shí)空嵌入并沒有提供統(tǒng)計(jì)上顯著的CSI改善。
目前,將雷達(dá)反射率因子作為深度學(xué)習(xí)模型的輸入,將地面觀測的降水場作為標(biāo)簽和輸出的研究尚少,這種方式相當(dāng)于需要模型自動尋找Z-R關(guān)系,如果相關(guān)模型得到發(fā)展和解釋,有望促進(jìn)Z-R關(guān)系的研究。另外,閃電活動與短時(shí)強(qiáng)降水也有較好的相關(guān)關(guān)系(劉澤等,2020;成勤等,2020)。如,Zhou 等(2020b)構(gòu)建的三維語義分割模型LightningNet,其輸入數(shù)據(jù)為雷達(dá)回波、衛(wèi)星云圖和閃電密度,實(shí)現(xiàn)了0~1 h云地閃臨近預(yù)報(bào)。因此,需要發(fā)展將閃電資料等多源數(shù)據(jù)輸入到深度學(xué)習(xí)模型并應(yīng)用到強(qiáng)降水臨近預(yù)報(bào)的方法。
應(yīng)用深度學(xué)習(xí)方法的強(qiáng)降水臨近預(yù)報(bào)技術(shù)在強(qiáng)降水預(yù)報(bào)精度上已經(jīng)明顯高于光流法等外推法已是不爭的事實(shí),但隨著預(yù)報(bào)時(shí)效延長,其對強(qiáng)降水區(qū)域的預(yù)報(bào)仍然非常困難(Ravuri等,2021)。在深度學(xué)習(xí)模型的不同環(huán)節(jié)融入適當(dāng)?shù)南闰?yàn)知識,有可能提高模型學(xué)習(xí)到重要特征的能力,也有可能提高模型的可解釋性。同時(shí),對模型效果的評估方法決定了模型算法改進(jìn)的方向。下文從先驗(yàn)知識融入深度學(xué)習(xí)模型和提高主客觀評估結(jié)果的一致性方面,提出改進(jìn)強(qiáng)降水臨近預(yù)報(bào)技術(shù)的幾點(diǎn)建議如下。
將物理過程與數(shù)據(jù)驅(qū)動(data-driven)的機(jī)器學(xué)習(xí)進(jìn)行混合建模,發(fā)揮兩者的協(xié)同作用,是提升預(yù)報(bào)能力的重要途徑(Reichstein et al.,2019;馬雷鳴2020;李揚(yáng)等,2021;周康輝等,2021)。如,Snaiki 和Wu(2019)將基于物理方程或半經(jīng)驗(yàn)公式的熱帶氣旋邊界層風(fēng)的先驗(yàn)知識轉(zhuǎn)變?yōu)闄C(jī)器可讀的(machine-readable)補(bǔ)充知識,并應(yīng)用到熱帶氣旋邊界層風(fēng)動力學(xué)的深層網(wǎng)絡(luò)建模,減少了模型訓(xùn)練需要的數(shù)據(jù)集,訓(xùn)練后的模型可以準(zhǔn)確、有效地預(yù)報(bào)各種熱帶氣旋的邊界層風(fēng)場。與上述文獻(xiàn)將受物理公式約束的先驗(yàn)知識引入深度學(xué)習(xí)算法不同,Zhuo 和Tan(2021)發(fā)展的熱帶氣旋強(qiáng)度和大小估計(jì)模型DeepTCNet,引入了表征熱帶氣旋強(qiáng)度的豐滿度指標(biāo)等作為輔助信息,并假設(shè)這些先驗(yàn)知識不受物理公式約束,輔助信息在輸入空間和輸出目標(biāo)之間可能引入了額外的物理關(guān)系,因此可以約束模型產(chǎn)生更好的熱帶氣旋強(qiáng)度和大小估計(jì)。后者將不受物理公式約束的先驗(yàn)知識融入深度學(xué)習(xí)算法的思路,可作為探索強(qiáng)降水臨近預(yù)報(bào)業(yè)務(wù)初步解決方案的借鑒。類似的不受物理公式約束的先驗(yàn)知識,常見于氣象專家系統(tǒng)(expert system)。氣象專家系統(tǒng)是一種基于知識的推理系統(tǒng),將有經(jīng)驗(yàn)的預(yù)報(bào)員在實(shí)際預(yù)報(bào)實(shí)踐中取得的經(jīng)驗(yàn)用適當(dāng)形式存入計(jì)算機(jī),形成知識庫,根據(jù)輸入的氣象資料,按照一定的推理規(guī)則作出客觀預(yù)報(bào)。20世紀(jì)80年代,作為人工智能的一個(gè)分支,已有少數(shù)專家系統(tǒng)的災(zāi)害性天氣預(yù)報(bào)準(zhǔn)確率接近當(dāng)時(shí)優(yōu)秀預(yù)報(bào)員的水平,在其落區(qū)和強(qiáng)度預(yù)報(bào)方面也取得了比較明顯的效果(氣象史料挖掘與研究工程項(xiàng)目組,2018)。
從多源觀測資料總結(jié)更多的強(qiáng)降水風(fēng)暴特征,研究將經(jīng)驗(yàn)知識適當(dāng)?shù)剞D(zhuǎn)換為機(jī)器可讀知識的方法,并將這種類似于專家系統(tǒng)的先驗(yàn)知識融入到深度學(xué)習(xí)模型,可能是預(yù)報(bào)員開展研究型強(qiáng)降水臨近預(yù)報(bào)業(yè)務(wù)需要面對的挑戰(zhàn)(圖1)。預(yù)報(bào)員和科研人員在強(qiáng)降水臨近預(yù)報(bào)實(shí)踐中總結(jié)了一些強(qiáng)降水風(fēng)暴的特征和指標(biāo),如雷達(dá)回波不斷經(jīng)過同一地點(diǎn)時(shí)的“列車效應(yīng)”(李明華等,2019)、中尺度輻合輻散共軛系統(tǒng)風(fēng)場反映在多普勒天氣雷達(dá)徑向速度圖上的逆風(fēng)區(qū)(張培源和陳榮林,1995)、強(qiáng)低空急流展現(xiàn)在多普勒速度圖上的“牛眼”以及強(qiáng)降水與雷達(dá)反射率因子垂直累積液態(tài)水含量(Vertically Integrated Liquid water content,VIL)的關(guān)系、強(qiáng)降水與閃電的關(guān)系等(章國材,2011)。“列車效應(yīng)”這類特征由于含有運(yùn)動信息,可能是機(jī)器能夠自動學(xué)習(xí)到的“知識”?!澳骘L(fēng)區(qū)”等特征需要先開發(fā)識別算法才能編碼,在數(shù)據(jù)量較大時(shí)也可探索采用機(jī)器學(xué)習(xí)算法提取。VIL等特征已可量化,其編碼相對簡單。
圖1 先驗(yàn)知識融入深度學(xué)習(xí)模型Fig.1 Schematic diagram of prior information into deep learning algorithm
為了將先驗(yàn)知識融入到深度學(xué)習(xí)模型,可從數(shù)據(jù)預(yù)處理、改變數(shù)據(jù)標(biāo)簽、在模型架構(gòu)中嵌入先驗(yàn)知識的量化編碼、修改損失函數(shù)等方面著手。
在數(shù)據(jù)預(yù)處理方面,若先驗(yàn)知識不能簡單量化,可基于決策樹等機(jī)器學(xué)習(xí)算法或另一深度學(xué)習(xí)算法先對特征進(jìn)行提取,再將提取的特征向量輸入到強(qiáng)降水預(yù)報(bào)的深度學(xué)習(xí)模型。如,徐月飛等(2020)基于深度卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了陣風(fēng)鋒自動識別算法。這類輔助信息可作為強(qiáng)降水預(yù)報(bào)深度學(xué)習(xí)模型的輸入。同時(shí),預(yù)先提取的特征也可作為標(biāo)簽。周康輝等(2021)指出,若能利用機(jī)器學(xué)習(xí)識別中氣旋、上沖云頂和弓狀回波等與強(qiáng)對流相關(guān)的特征并作為標(biāo)簽,相比直接用雷暴大風(fēng)等天氣現(xiàn)象作為標(biāo)簽,可能有望延長預(yù)警提前時(shí)間?!吧顚α魉笔俏髂蠝u強(qiáng)降水的一種重要γ中尺度系統(tǒng)(Zhai et al.,2021),若能實(shí)現(xiàn)其自動識別,有望延長強(qiáng)降水臨近預(yù)報(bào)時(shí)間。在對深度學(xué)習(xí)模型深入理解的基礎(chǔ)上,可在模型架構(gòu)中嵌入先驗(yàn)知識的量化編碼。如Zhuo 和Tan (2021)發(fā)展的DeepTCNet,就是通過將輔助信息嵌入到VGGNet 模型(Simonyan and Zisserman,2014)的全連接層前面實(shí)現(xiàn)了先驗(yàn)知識與深度學(xué)習(xí)模型的融合。
無論深度學(xué)習(xí)模型的架構(gòu)如何,最終要實(shí)現(xiàn)的任務(wù)是由損失函數(shù)決定的。Ravuri 等(2021)分別用一個(gè)空間判別器和一個(gè)時(shí)間判別器定義了兩個(gè)損失函數(shù)以驅(qū)動深度學(xué)習(xí),第一個(gè)判別器的目的是確??臻g一致性并阻止模糊預(yù)測,第二個(gè)判別器旨在區(qū)分觀測到的和生成的雷達(dá)序列,施加時(shí)間一致性并懲罰跳躍預(yù)測。結(jié)合可求導(dǎo)的檢驗(yàn)指標(biāo)用于損失函數(shù)設(shè)計(jì),可作為模型優(yōu)化的一種重要手段。而Zheng 等(2021)則利用Dense U-Net 架構(gòu),在牙齒的CT 圖像上引入材料(materials)不會直接連接骨頭等解剖學(xué)先驗(yàn)知識,對先驗(yàn)知識進(jìn)行量化,并在深度學(xué)習(xí)網(wǎng)絡(luò)的損失函數(shù)中考慮新的得分函數(shù),其得分越高表示越符合解剖學(xué)的先驗(yàn)知識,取得了較好的圖像分割效果。
檢驗(yàn)是研發(fā)預(yù)報(bào)系統(tǒng)過程中不可或缺的一步,也是確定強(qiáng)降水預(yù)報(bào)技術(shù)改進(jìn)方向的關(guān)鍵。同時(shí),預(yù)報(bào)檢驗(yàn)也是一個(gè)具有很多可能評分方法的多維難題(Jolliffe and Stephenson,2016)。國外有人在評估降水臨近預(yù)報(bào)結(jié)果時(shí)(Ravuri et al.,2021)指出,氣象專家認(rèn)為不同方法的預(yù)報(bào)結(jié)果有很大差別: 與其它方法相比,DGMR 模型的預(yù)報(bào)結(jié)果“能夠最好地捕捉到對流單體的大小和強(qiáng)度”,但常用的降水檢驗(yàn)指標(biāo)大多只能得出差別不大的檢驗(yàn)結(jié)果。為了盡量做到客觀檢驗(yàn)指標(biāo)與氣象專家評估結(jié)果的一致,需要發(fā)展新的評估指標(biāo)。
針對同樣的強(qiáng)降水回波,兩個(gè)預(yù)報(bào)員的看法都可能不一樣,主客觀評估結(jié)果更不可能完全一致。但通過改進(jìn)客觀檢驗(yàn)指標(biāo),有可能提高主客觀評估結(jié)果的一致性。茅懋等(2016)設(shè)計(jì)了強(qiáng)對流預(yù)報(bào)產(chǎn)品的目標(biāo)對象檢驗(yàn)方法,包括預(yù)報(bào)產(chǎn)品和實(shí)況資料的對流單體和強(qiáng)降水落區(qū)等目標(biāo)的識別和匹配、多指標(biāo)檢驗(yàn)、根據(jù)用戶評價(jià)偏好進(jìn)行加權(quán)平均給出總體檢驗(yàn)評分。這種目標(biāo)對象檢驗(yàn)方法提供的有關(guān)面積、位置和形狀等的評價(jià)信息更適合預(yù)報(bào)員和預(yù)報(bào)業(yè)務(wù)的需求,可作為研發(fā)新的檢驗(yàn)指標(biāo)的參考。
本文以強(qiáng)降水臨近預(yù)報(bào)為例,梳理了深度學(xué)習(xí)算法在強(qiáng)降水臨近預(yù)報(bào)技術(shù)中的應(yīng)用情況,參考已有研究成果,提出了將基于預(yù)報(bào)員經(jīng)驗(yàn)、不受物理公式約束的強(qiáng)降水天氣特征作為先驗(yàn)知識融入到深度學(xué)習(xí)模型的可能途徑,包括將一些經(jīng)驗(yàn)特征進(jìn)行量化或自動識別后作為模型輸入、將預(yù)先提取的特征作為模型標(biāo)簽、在模型架構(gòu)中嵌入先驗(yàn)知識的量化編碼、結(jié)合可求導(dǎo)的檢驗(yàn)指標(biāo)設(shè)計(jì)損失函數(shù)對模型進(jìn)行優(yōu)化。同時(shí),針對一些客觀檢驗(yàn)指標(biāo)對氣象專家認(rèn)為明顯有差別的強(qiáng)降水預(yù)報(bào)結(jié)果的評分相差不大的問題,提出要提高主客觀評估的一致性,以便更好地確定強(qiáng)降水臨近預(yù)報(bào)技術(shù)的改進(jìn)方向。
為了更好地改進(jìn)深度學(xué)習(xí)方法在強(qiáng)降水臨近預(yù)報(bào)技術(shù)中的應(yīng)用,還需要關(guān)注數(shù)據(jù)集構(gòu)建(劉娜等,2021)、深度學(xué)習(xí)算法代碼復(fù)現(xiàn)時(shí)的本地化。為了支持強(qiáng)降水臨近預(yù)報(bào)技術(shù)研究及應(yīng)用的長期有效性,需要建設(shè)具有氣象學(xué)、遙感、計(jì)算機(jī)科學(xué)等背景的多學(xué)科人員組成的團(tuán)隊(duì),團(tuán)隊(duì)成員需要具有實(shí)時(shí)跟蹤最新技術(shù)的能力。如,RNN、LSTM 和GRU 都是串行,如何將目前能夠處理時(shí)間序列并實(shí)現(xiàn)并行的Informer 架構(gòu)(Zhou et al.,2020c)應(yīng)用到強(qiáng)降水臨近預(yù)報(bào)中,是否能夠?qū)⑾闰?yàn)知識嵌入到該架構(gòu),如何對其損失函數(shù)進(jìn)行改進(jìn),是一個(gè)有意義的探索方向。同時(shí),要特別關(guān)注團(tuán)隊(duì)成員之間頻繁而常態(tài)化的交叉培訓(xùn),培訓(xùn)越多,聯(lián)合研發(fā)和業(yè)務(wù)應(yīng)用過程就越有效。
鑒于天氣預(yù)報(bào)的不確定性,研究成果投入業(yè)務(wù)應(yīng)用后需要得到反饋,再根據(jù)反饋進(jìn)行技術(shù)升級,并反復(fù)進(jìn)行應(yīng)用評估,才能真正發(fā)揮研究成果的作用(鄭永光等,2015a;林建等,2016)。為加快強(qiáng)降水臨近預(yù)報(bào)技術(shù)的應(yīng)用,有必要從需求分析出發(fā),有的放矢,研究相關(guān)的深度學(xué)習(xí)技術(shù),統(tǒng)計(jì)并提取相關(guān)強(qiáng)降水天氣特征,將不受物理公式約束的先驗(yàn)知識融入深度學(xué)習(xí)算法,研發(fā)能夠提高主客觀評估結(jié)果一致性的檢驗(yàn)指標(biāo),最終形成一個(gè)從研究到業(yè)務(wù)、再從業(yè)務(wù)到研究的相輔相成、緊密聯(lián)系的閉環(huán)。