張樂(lè),楊昊源,周寧
(1.商洛學(xué)院電子信息與電氣工程學(xué)院,陜西商洛 726000;2.陜西省商洛市氣象局,陜西商洛 726000)
臨近降水預(yù)報(bào)是一項(xiàng)對(duì)未來(lái)兩小時(shí)內(nèi)降水量進(jìn)行高分辨率預(yù)測(cè)的任務(wù),支持著許多依賴于天氣進(jìn)行決策的相關(guān)部門的現(xiàn)實(shí)需求[1]。作為實(shí)現(xiàn)臨近降水預(yù)報(bào)的重要方法,天氣雷達(dá)回波外推可視為對(duì)時(shí)間序列圖像變化趨勢(shì)的估計(jì)和預(yù)測(cè),即用“現(xiàn)在”之前的一段時(shí)間內(nèi)雷達(dá)回波圖像預(yù)測(cè)“未來(lái)”一定時(shí)間內(nèi)的雷達(dá)回波圖像,也即從雷達(dá)回波歷史觀測(cè)數(shù)據(jù)中學(xué)習(xí)時(shí)空域中隱含的動(dòng)
力學(xué)規(guī)律,從而預(yù)測(cè)未來(lái)臨近時(shí)刻的云層走向[2-5]。此項(xiàng)工作在氣象領(lǐng)域也稱為雷達(dá)預(yù)測(cè)外推或雷達(dá)外推[6],也常被視為一個(gè)時(shí)空序列預(yù)測(cè)問(wèn)題[4,7]和視頻預(yù)測(cè)任務(wù)。從算法的角度,天氣雷達(dá)回波外推可分為傳統(tǒng)外推方法和基于深度學(xué)習(xí)(Deep Learning,DL)的外推方法[8]。傳統(tǒng)外推方法主要有交叉相關(guān)法[9-11]、光流法[12]和質(zhì)心跟蹤法[13-14]等。但由于在局部強(qiáng)對(duì)流天氣中,回波發(fā)展變化比較快,無(wú)法滿足守恒條件,因而傳統(tǒng)外推方法的預(yù)測(cè)效果會(huì)隨著外推時(shí)間增長(zhǎng)而逐漸變差。此外,除大氣及其相關(guān)動(dòng)力過(guò)程的復(fù)雜性外,對(duì)臨近降水預(yù)報(bào)實(shí)時(shí)性、規(guī)模性、細(xì)粒度等需求的日益增長(zhǎng)也給雷達(dá)回?fù)芡馔蒲芯繋?lái)新的挑戰(zhàn)。在過(guò)去的七十年里,DL技術(shù)發(fā)展十分迅猛,已在圖像、語(yǔ)音和自然語(yǔ)言處理等領(lǐng)域大放異彩[15-18]。基于此,越來(lái)越多的學(xué)者也將DL技術(shù)用于天氣雷達(dá)回波外推,并取得了令人滿意的效果。目前,解決天氣雷達(dá)回波外推問(wèn)題的DL方法主要基于三類模型:循環(huán)神經(jīng)網(wǎng)絡(luò)(Recursive Neural Network,RNN)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)、深度生成模型(Deep Generative Models,DGM)。利用DL方法實(shí)現(xiàn)天氣雷達(dá)回波外推的核心是構(gòu)建DL模型以實(shí)現(xiàn)圖像序列預(yù)測(cè)。因而,本文將以DL方法在天氣雷達(dá)回波外推中的應(yīng)用為主線,重點(diǎn)對(duì)可用于天氣雷達(dá)回波外推相關(guān)的DL模型進(jìn)行概況闡述和總結(jié)。
RNN是一類具有記憶能力的神經(jīng)網(wǎng)絡(luò)。其中,簡(jiǎn)單循環(huán)網(wǎng)絡(luò)(Simple Recurrent Network,S RN)[19]是一類典型的具有短期記憶能力的神經(jīng)網(wǎng)絡(luò),難以建模長(zhǎng)時(shí)間間隔狀態(tài)之間的依賴關(guān)系。為了解決短期記憶網(wǎng)絡(luò)的長(zhǎng)程依賴問(wèn)題,相關(guān)學(xué)者提出了長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory Network,LSTM)[20]和門控循環(huán)單元(Gated Recurrent Unit,GRU)[21]。
RNN因其能在網(wǎng)絡(luò)中存儲(chǔ)歷史信息,從而建立持久數(shù)據(jù)依賴關(guān)系,適合用來(lái)對(duì)雷達(dá)回波圖中的時(shí)間信息進(jìn)行建模。近年來(lái),許多研究以RNN為核心的網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)天氣雷達(dá)回波外推。
WANG Y B等[22]提出了PredRNN-v2模型,該模型可沿著循環(huán)狀態(tài)轉(zhuǎn)換的水平和之字形路徑解耦扭曲的記憶狀態(tài),能夠從學(xué)習(xí)分布式表示中受益,這些表示可以涵蓋時(shí)空變化的不同方面。此外,還提出了一種新的課程學(xué)習(xí)策略:反向計(jì)劃抽樣。該策略迫使模型的編碼部分從較長(zhǎng)時(shí)間的上下文框架中學(xué)習(xí)時(shí)間動(dòng)態(tài)信息,可以達(dá)到較好的預(yù)測(cè)效果。研究表明,該模型對(duì)于無(wú)動(dòng)作和動(dòng)作條件預(yù)測(cè)學(xué)習(xí)場(chǎng)景都能獲得極具競(jìng)爭(zhēng)力的結(jié)果。
BALLAS N等[23]提出了卷積門循環(huán)單元(Convolutional GRU,ConvGRU), 該模型將RNN單元中的全連接層替換為了卷積層;同時(shí),也將輸入狀態(tài)和隱狀態(tài)進(jìn)行了空間維度的擴(kuò)展,使空間特征信息能夠以三維張量的形式在RNN節(jié)點(diǎn)間進(jìn)行流動(dòng),使模型具有較強(qiáng)的天氣雷達(dá)回波外推能力。研究表明,該模型可利用來(lái)自不同空間分辨率的感知,更精細(xì)地捕獲圖像中的運(yùn)動(dòng)模式。
雖然ConvLSTM模型比傳統(tǒng)方法具有更好的性能,但在基于ConvLSTM單元的模型中,卷積遞歸結(jié)構(gòu)是位置不變的,而自然運(yùn)動(dòng)和變換(如旋轉(zhuǎn)、翻轉(zhuǎn)和平移等)一般是涉及位置變化的?;诖耍琒HI X J等[5]提出了一種軌跡門控遞歸單元(Trajectory GRU,TrajGRU),該模型可以先學(xué)習(xí)全局運(yùn)動(dòng)趨勢(shì),然后再對(duì)更多局部鄰域的運(yùn)動(dòng)細(xì)節(jié)信息進(jìn)行預(yù)測(cè)。試驗(yàn)證明,TrajGRU超越了ConvLSTM,比現(xiàn)有的ConvGRU更能有效地捕捉時(shí)空相關(guān)性。
SHI X J等[2]將臨近降雨預(yù)測(cè)當(dāng)作一個(gè)可以用Seq2Seq學(xué)習(xí)框架解決的天氣雷達(dá)回波外推任務(wù),并由此提出了卷積長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Convolutional LSTM,ConvLSTM)。通過(guò)堆疊多層ConvLSTM單元,從而構(gòu)建端到端的可訓(xùn)練模型,形成一個(gè)編碼-解碼器結(jié)構(gòu),從而有效地解決了傳統(tǒng)LSTM模型在天氣雷達(dá)回波外推問(wèn)題中,存在的無(wú)法準(zhǔn)確刻畫空間結(jié)構(gòu)信息的難題。WANG Y B等[24]為了更好地提取時(shí)空特征信息,提升天氣雷達(dá)回波外推效果,提出了一種新的端到端循環(huán)網(wǎng)絡(luò)PredRNN。該網(wǎng)絡(luò)的核心是一個(gè)新的時(shí)空LSTM(ST-LSTM)單元,可同時(shí)提取和存儲(chǔ)空間和時(shí)間信息的表示。內(nèi)存狀態(tài)不再被限制在每個(gè)LSTM單元內(nèi),而是在兩個(gè)方向上曲折:垂直穿過(guò)堆疊的RNN層與水平穿過(guò)所有RNN狀態(tài)。WANG Y B等[25]為解決ST-LSTM單元內(nèi)部的雙記憶狀態(tài)耦合方式存在的缺點(diǎn),提出了一種因果長(zhǎng)短時(shí)記憶單元(Causal LSTM)。同時(shí),為緩解深度轉(zhuǎn)移預(yù)測(cè)模型中梯度傳播的困難,提出了一種新型卷積循環(huán)網(wǎng)絡(luò)模塊:梯度高速公路單元 (Gradient Highway Unit,GHU)。 通過(guò)融合Causal LSTM和GHU,較好地解決了深度轉(zhuǎn)移模型(Deep Transition Model)和梯度消失(Vanishing Gradient Problem)之間的矛盾問(wèn)題,并由此提出了PredRNN++模型。
自然時(shí)空過(guò)程在許多方面可以是高度非平穩(wěn)的,如降水預(yù)報(bào)中雷達(dá)回波的積累、變形或消散等變化過(guò)程。根據(jù)Cramér分解理論[26],任何非平穩(wěn)過(guò)程都可以分解為確定性、時(shí)變多項(xiàng)式及零均值隨機(jī)項(xiàng)。通過(guò)適當(dāng)?shù)貞?yīng)用差分運(yùn)算,就可以將時(shí)變多項(xiàng)式轉(zhuǎn)化為常數(shù),使確定性分量可預(yù)測(cè)。然而,大多數(shù)以前用于時(shí)空預(yù)測(cè)的遞歸神經(jīng)網(wǎng)絡(luò)沒(méi)有有效地使用差分信號(hào),它們相對(duì)簡(jiǎn)單的狀態(tài)轉(zhuǎn)移函數(shù)阻止了它們學(xué)習(xí)太復(fù)雜的時(shí)空變化。受此啟發(fā),YunboW等[27]提出了嵌套記憶單元(Memory In Memory,MIM),該單元利用相鄰遞歸狀態(tài)之間的差分信號(hào)來(lái)建模具有兩個(gè)級(jí)聯(lián)自更新存儲(chǔ)器模塊的時(shí)空動(dòng)力學(xué)中的非平穩(wěn)和近似平穩(wěn)特性。MIM單元主要改進(jìn)了ST-LSTM中的時(shí)間記憶狀態(tài)的遺忘門,用另外兩個(gè)內(nèi)層LSTM單元替換了原本的遺忘門,從而改善了循環(huán)神經(jīng)網(wǎng)絡(luò)中的記憶狀態(tài)轉(zhuǎn)移機(jī)制,較好地解決了由遺忘門負(fù)飽和而造成的長(zhǎng)時(shí)特征的災(zāi)難性遺忘問(wèn)題。通過(guò)堆疊多個(gè)MIM塊,可以潛在地處理高階非平穩(wěn)性。研究表明,MIM網(wǎng)絡(luò)在合成和真實(shí)數(shù)據(jù)集的三個(gè)時(shí)空預(yù)測(cè)任務(wù)上取得了最先進(jìn)的成果。
WANGYB等[28]提出了Eidetic3DLSTM(E3DLSTM)模型,該模型一方面將LSTM內(nèi)部的記憶狀態(tài)從三維(依次為空間寬度、空間高度和通道數(shù))擴(kuò)展至四維(依次為時(shí)間長(zhǎng)度、空間寬度、空間高度和通道數(shù)),即在其內(nèi)部所有隱狀態(tài)和記憶狀態(tài)上都增加了時(shí)間特征維度,并將三維卷積集成到LSTM節(jié)點(diǎn)的狀態(tài)轉(zhuǎn)移方程中;另一方面引入了可微分的記憶狀態(tài)讀寫機(jī)制。研究表明,由于E3D-LSTM網(wǎng)絡(luò)針對(duì)動(dòng)作意圖和趨勢(shì)進(jìn)行了較好的建模,可以根據(jù)現(xiàn)有視頻幀進(jìn)行準(zhǔn)確地推斷;同時(shí),其在早期活動(dòng)識(shí)別方面也表現(xiàn)出良好性能。CHEN G X等[29]用三層不同的LSTM來(lái)捕獲目標(biāo)的空間、時(shí)間和軌跡信息,并將基于LSTM的編碼-解碼器模型作為一個(gè)整體,提出了一種新的基于時(shí)空?qǐng)D的時(shí)空長(zhǎng)短時(shí)記憶單(Spatiotemporal LSTM,ST-LSTM)。研究表明,與現(xiàn)有方法相比,該方法可以在短時(shí)間范圍內(nèi)實(shí)現(xiàn)更準(zhǔn)確的目標(biāo)運(yùn)動(dòng)軌跡預(yù)測(cè)。KIM S等[30]提出了一種全新的數(shù)據(jù)驅(qū)動(dòng)預(yù)加密預(yù)測(cè)模型DeepRain。該模型使用卷積 LSTM(ConvLSTM)[6],從而根據(jù)天氣雷達(dá)數(shù)據(jù)(三維四通道數(shù)據(jù))預(yù)測(cè)降雨量。ConvLSTM是LSTM(長(zhǎng)期短期存儲(chǔ)器)的一種變體,在LSTM單元內(nèi)包含卷積運(yùn)算。通過(guò)試驗(yàn),使用了兩年的雷達(dá)反射率數(shù)據(jù),其輸入是以6 min為單位的時(shí)間序列格式,分為15個(gè)記錄。輸出是輸入數(shù)據(jù)的預(yù)測(cè)降雨量信息。研究表明,與線性回歸相比,兩層堆疊的ConvLSTM將RMSE降低了23.0%。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是受生物學(xué)上的感受野機(jī)制[31]啟發(fā)而提出一類神經(jīng)網(wǎng)絡(luò)。最早的CNN可追溯至20世紀(jì)末期,F(xiàn)ukushima受生物學(xué)家Huble等的層級(jí)模型[31]的啟發(fā)而提出的神經(jīng)認(rèn)知機(jī)(Neocognitron)[32]。最具有代表性的CNN網(wǎng)絡(luò)結(jié)構(gòu)為L(zhǎng)eNet-5[33]。隨后,CNN迅速進(jìn)入人們的視野,并在圖像任務(wù)領(lǐng)域所向披靡。CNN具有良好的圖像處理能力,擅于從圖像中提取空間特征,適合用來(lái)對(duì)雷達(dá)回波圖中的空間信息進(jìn)行建模。近年來(lái),許多研究是以CNN為核心的網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)天氣雷達(dá)回波外推。
施恩等[34]注意到雷達(dá)回波外推任務(wù)中,輸入回波圖與輸出回波圖之間具有較強(qiáng)的關(guān)聯(lián)性,并由此提出了一種動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)(DCNN-I)。該網(wǎng)絡(luò)添加了動(dòng)態(tài)子網(wǎng)絡(luò)和概率預(yù)測(cè)層,構(gòu)建了卷積核與輸入圖像見(jiàn)映射關(guān)系,加強(qiáng)了輸入圖像與預(yù)測(cè)圖像間的聯(lián)系,從而提升了天氣雷達(dá)回波外推任務(wù)的效果。
考慮到基于物理的數(shù)值模擬模型可能非常復(fù)雜,且無(wú)法解釋測(cè)量和建模中的復(fù)合不確定性。此外,考慮到大氣控制方程中的非線性對(duì)初始條件產(chǎn)生了敏感的依賴性,數(shù)值天氣預(yù)報(bào)模型對(duì)降水量的準(zhǔn)確預(yù)測(cè)僅限于較短的時(shí)間?;诖?,ZHUANG Y等[35]提出了一種時(shí)空卷積神經(jīng)網(wǎng)絡(luò)(ST-CNN),用以充分利用時(shí)空信息,從極端降水集群預(yù)測(cè)數(shù)據(jù)中自動(dòng)學(xué)習(xí)降水前兆的潛在模式。并在美國(guó)愛(ài)荷華州收集的62年(1948—2010年)歷史降水?dāng)?shù)據(jù)中驗(yàn)證了ST-CNN模型的有效性。
在視頻幀預(yù)測(cè)任務(wù)中,主流的遞歸網(wǎng)絡(luò)模型存在巨大的內(nèi)存占用和計(jì)算成本,而卷積模型無(wú)法有效地捕獲連續(xù)視頻幀之間的時(shí)間相關(guān)性。為解決此問(wèn)題,XU Z R等[36]提出了一個(gè)完全基于CNN的網(wǎng)絡(luò)架構(gòu)PredCNN,該網(wǎng)絡(luò)完全由卷積組成,簡(jiǎn)化了梯度傳播,減少了計(jì)算和內(nèi)存負(fù)擔(dān)。同時(shí),還引入了一個(gè)級(jí)聯(lián)乘法單元(Cascade Multiplicative Unit,CMU),它將更多的運(yùn)算應(yīng)用于先前的幀,這明確地捕獲了時(shí)間相關(guān)性。此外,提出了一種分層級(jí)聯(lián)結(jié)構(gòu),通過(guò)疊加級(jí)聯(lián)乘法單元來(lái)捕獲下一幀和輸入幀之間的時(shí)間相關(guān)性。所提出的PredCNN模型在標(biāo)準(zhǔn)移動(dòng)MNIST數(shù)據(jù)集和兩個(gè)具有挑戰(zhàn)性的交通擁擠流預(yù)測(cè)數(shù)據(jù)集上實(shí)現(xiàn)了最先進(jìn)的性能。
AGRAWAL S等[37]受CNN在圖像-圖像翻譯中成功應(yīng)用的啟發(fā),將預(yù)測(cè)視為圖像到圖像的轉(zhuǎn)換問(wèn)題,使用U-Net[38]網(wǎng)絡(luò)架構(gòu)進(jìn)行重構(gòu)。該模型分為兩部分:編碼器(先將一個(gè)基本卷積塊作用于圖像,然后迭代幾個(gè)下采樣卷積塊)和解碼器(用基本卷積塊接受編碼器的輸出,再用一系列上采樣塊)。研究表明,該模型比光流法等傳統(tǒng)雷達(dá)外推手段的結(jié)果更優(yōu)。
AYZEL G等[39]提出了一種簡(jiǎn)單的全卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)(DozdyaNet),其中,六個(gè)后續(xù)的2D卷積層根據(jù)所使用的核大小進(jìn)行參數(shù)化,第一層到最后一層的卷積層數(shù)量分別為 48,24,12,6,3和1。相較于傳統(tǒng)深度神經(jīng)網(wǎng)絡(luò),DozdyaNet網(wǎng)絡(luò)更側(cè)重于選擇和采用合適的數(shù)據(jù)預(yù)處理程序、網(wǎng)絡(luò)結(jié)構(gòu)和損失函數(shù),從而獲得了更好的效果。
WU K等[40]根據(jù)自動(dòng)站探測(cè)和多普勒雷達(dá)回波外推圖上方不同高度天氣觀測(cè)區(qū)域的周邊歷史降雨量數(shù)據(jù),提出了一種3D卷積神經(jīng)網(wǎng)絡(luò)(3D Convolution Neural Network)。 研究表明,該方法能夠?qū)μ囟▍^(qū)域上空的臨近降水量進(jìn)行較為精準(zhǔn)的預(yù)報(bào),且該網(wǎng)絡(luò)模型具有較好的魯棒性與穩(wěn)定性。ZHANG W等[41]構(gòu)建了一個(gè)多通道3D立方體連續(xù)卷積網(wǎng)絡(luò)(3D-cube Successive Convolution Network,3D-SCN)。該網(wǎng)絡(luò)利用原始3D雷達(dá)數(shù)據(jù)進(jìn)行分析,不需要額外的特征工程。用于訓(xùn)練的數(shù)據(jù)被表示為多通道3D立方體,將被饋送到3D-SCN網(wǎng)絡(luò)中,并通過(guò)跨通道3D卷積進(jìn)行卷積。通過(guò)堆疊連續(xù)的卷積層而不使用池化層,構(gòu)建一個(gè)端到端的可訓(xùn)練模型。研究表明,該模型方法比傳統(tǒng)的天氣雷達(dá)回波外推方法更有優(yōu)勢(shì)。
KLEIN B等[42]考慮到傳統(tǒng)卷積層在模型學(xué)習(xí)和預(yù)測(cè)期間均保持不變而存在的弊端,而提出了一種新型動(dòng)態(tài)卷積層(Dynamic Convolutional Layer,DCL),用于構(gòu)建一類動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)。與傳統(tǒng)卷積層不同的是DCL的卷積核來(lái)源于一個(gè)任意深度的子網(wǎng)絡(luò),即該卷積核是輸入圖像數(shù)據(jù)的函數(shù)生成的,故而卷積核隨著輸入樣本的不同而不同。研究表明,使用DCL的網(wǎng)絡(luò)比其它基線方法擁有更好性能。
目前,雖然以CNN和RNN為核心的網(wǎng)絡(luò)模型已經(jīng)取得了不俗的效果,但外雷達(dá)回波外推過(guò)程中仍然存在兩個(gè)問(wèn)題:天氣系統(tǒng)演化過(guò)程較大程度地影響著外推精度;回波圖像預(yù)測(cè)模糊。
DGM是一類試圖把概率論與數(shù)理統(tǒng)計(jì)的知識(shí)與強(qiáng)有力的深度神經(jīng)網(wǎng)絡(luò)的表示學(xué)習(xí)能力相結(jié)合的模型[43],是挖掘可觀變量之間復(fù)雜依賴關(guān)系和可觀變量背后隱藏內(nèi)部表示的強(qiáng)有力工具。由于其擅長(zhǎng)生成以假亂真的圖像,因此能更好地刻畫雷達(dá)回波演變過(guò)程,生成更清晰的回波圖像信息。近年來(lái),許多研究以RNN為核心的網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)天氣雷達(dá)回波外推。
從處理極大似然函數(shù)的方法的角度,可將DGM分成三種[43]:近似法(如深度信念網(wǎng)絡(luò))、隱式法(如生成對(duì)抗網(wǎng)絡(luò))、變形法(如流模型和自回歸模型)。
JING J R等[44]提出了多級(jí)相關(guān)長(zhǎng)期短期記憶(MLC-LSTM),并將對(duì)抗訓(xùn)練集成到該方法中。該網(wǎng)絡(luò)可利用多級(jí)雷達(dá)回波之間的時(shí)空相關(guān)性,并對(duì)其演變進(jìn)行建模,而對(duì)抗訓(xùn)練可以幫助模型推斷真實(shí)和尖銳的回波。為了訓(xùn)練和測(cè)試其模型,研究者基于中國(guó)國(guó)家氣象信息中心提供的原始CINRAD/SA雷達(dá)觀測(cè)數(shù)據(jù),構(gòu)建了一個(gè)真實(shí)的多層次天氣雷達(dá)回波數(shù)據(jù)集。研究表明,該模型可以準(zhǔn)確地預(yù)測(cè)回波的運(yùn)動(dòng)和演變,同時(shí)保持預(yù)測(cè)的回波看起來(lái)真實(shí)和細(xì)粒度。然而,雖然該模型已經(jīng)對(duì)回波運(yùn)動(dòng)和演變進(jìn)行了適當(dāng)?shù)慕?,但外推的回波形狀與地面真實(shí)情況并不完全匹配,有時(shí)回波強(qiáng)度會(huì)波動(dòng),強(qiáng)度的一致性也無(wú)法保證。因此,設(shè)計(jì)一個(gè)準(zhǔn)確和性能可靠的長(zhǎng)期外推模型是十分必要的。
LIU H B等[45]提出了氣象預(yù)測(cè)學(xué)習(xí)GAN模型(MPL-GAN),該模型使用了條件GAN和預(yù)測(cè)學(xué)習(xí)模塊來(lái)處理未來(lái)幀預(yù)測(cè)中的不確定性,能夠?qū)鹘y(tǒng)基于均方誤差損失的預(yù)測(cè)學(xué)習(xí)方法產(chǎn)生的模糊預(yù)測(cè)映射回其原始數(shù)據(jù)分布,因而可以改進(jìn)和銳化預(yù)測(cè)圖像。該模型能更準(zhǔn)確地檢測(cè)到傳統(tǒng)無(wú)條件GAN難以做到的氣象運(yùn)動(dòng)模式。研究表明,MPL-GAN不僅可以生成清晰逼真的氣象預(yù)測(cè),而且還可以在預(yù)測(cè)學(xué)習(xí)模塊的約束下對(duì)真實(shí)世界的氣象運(yùn)動(dòng)模式進(jìn)行建模。但是,盡管GAN模型提高了預(yù)測(cè)的清晰度,但是卻帶來(lái)了不確定性因素,降低了預(yù)測(cè)的準(zhǔn)確性。因此,提高預(yù)測(cè)精度仍有較大的提升空間。
盡管ConvGRU性能很好,但其外推圖像往往會(huì)比較模糊,并且無(wú)法實(shí)現(xiàn)多模態(tài)和偏斜的強(qiáng)度分布。為了克服這些限制,TIAN L等[46]提出了一種生成式對(duì)抗性ConvGRU模型(GAConvGRU)。該模型由兩個(gè)對(duì)抗性學(xué)習(xí)系統(tǒng)組成,即基于ConvGRU的生成器和基于CNN的鑒別器。這種對(duì)抗性學(xué)習(xí)方案,使得GA ConvGRU可以產(chǎn)生更真實(shí)、更準(zhǔn)確的外推。研究表明,GA ConvGRU的性能明顯優(yōu)于ConvGRU和光流法,但依然沒(méi)有很好地解決圖像模糊失真的問(wèn)題。
RAVURI S等[1]提出了一種條件生成對(duì)抗網(wǎng)絡(luò)(DGMR),著重提升罕見(jiàn)的中到大雨的預(yù)測(cè)。研究表明,在89%的案例中,該模型的準(zhǔn)確性和實(shí)用性排名第一,極大地提高了預(yù)測(cè)質(zhì)量、預(yù)測(cè)一致性和預(yù)測(cè)價(jià)值,實(shí)現(xiàn)了一種快速準(zhǔn)確的短期預(yù)測(cè)方法。然而,DGMR對(duì)于預(yù)測(cè)長(zhǎng)時(shí)間的強(qiáng)降水仍然是困難的。
為了更好地反映區(qū)域降水的變化趨勢(shì),張鵬程等[47]提出了一種深度信念網(wǎng)絡(luò)模型(DBN),用于降水量預(yù)報(bào)。該模型通過(guò)模擬了人腦神經(jīng)元的多層結(jié)構(gòu),并利用反向傳播算法對(duì)網(wǎng)絡(luò)進(jìn)行調(diào)整。DBN網(wǎng)絡(luò)以與降雨量最為相關(guān)的七種關(guān)鍵特征數(shù)據(jù)作為輸入,未來(lái)二十四小時(shí)降雨量為輸出。研究表明,DBN網(wǎng)絡(luò)較支持向量機(jī)和自回歸滑動(dòng)平均模型等方法更具優(yōu)勢(shì)。
為解決來(lái)自噪聲觀測(cè)中的感知不確定性和正演模擬中的動(dòng)力學(xué)不確定性,WANG Y B等[48]提出用一個(gè)端到端的可訓(xùn)練模型貝葉斯預(yù)測(cè)網(wǎng)絡(luò)(BP-Net)。與現(xiàn)有的隨機(jī)視頻預(yù)測(cè)工作不同,該工作假設(shè)時(shí)空一致性,因此無(wú)法處理感知不確定性,BP網(wǎng)絡(luò)在一個(gè)集成框架中對(duì)兩種不確定性水平進(jìn)行建模。此外,與之前只能提供未來(lái)幀的未排序估計(jì)的工作不同,BP網(wǎng)絡(luò)利用可微分順序重要性抽樣(SIS)方法實(shí)現(xiàn)基于潛在物理狀態(tài)的推斷進(jìn)行未來(lái)預(yù)測(cè),從而根據(jù)SIS重要性權(quán)重(即置信度)提供排序的預(yù)測(cè)候選。研究證明,BP網(wǎng)絡(luò)在從噪聲數(shù)據(jù)預(yù)測(cè)未來(lái)幀方面顯著優(yōu)于現(xiàn)有方法。
注意力是人類十分重要的認(rèn)知功能,可在廣泛的信息中聚焦重要的信息,從而有效地避免信息的過(guò)載問(wèn)題。在計(jì)算機(jī)領(lǐng)域,注意力機(jī)制常被當(dāng)作一種算力資源分配方案,即將受限的算力資源用于處理少而重要的信息。在天氣雷達(dá)回波外推研究中,利用注意力機(jī)制可有效改善回波圖像信息過(guò)載的問(wèn)題,提高神經(jīng)網(wǎng)絡(luò)的效能。
在結(jié)合卷積神經(jīng)網(wǎng)(CNN)和遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的雷達(dá)回波預(yù)測(cè)模型中,多層CNN和RNN中傳遞的特征流通常伴隨著信息丟失,且因無(wú)法對(duì)長(zhǎng)期依賴性進(jìn)行建模而難以準(zhǔn)確預(yù)測(cè)暴雨強(qiáng)度趨勢(shì)。LUO C Y等[7]通過(guò)將時(shí)間注意力模塊(TAM)和層注意力模塊(LAM)嵌入預(yù)測(cè)單元來(lái)提出PredRANN模型,以分別從時(shí)間和空間維度保留更多的表示。在合成數(shù)據(jù)集和真實(shí)世界數(shù)據(jù)集上的大量試驗(yàn)結(jié)果證明,所提出的方法具有較高的效能和優(yōu)越性。
針對(duì)現(xiàn)有的基于深度學(xué)習(xí)的方法沒(méi)有考慮不同地區(qū)和渠道對(duì)降水產(chǎn)生不同影響的問(wèn)題,YAN Q等[49]提出了一種基于深度學(xué)習(xí)的雙通道多頭注意力模型(Convolutional Residual-Attention)。 該模型中引入了剩余連接,很好地保留了基于注意力的全局信息,避免了因引入注意力機(jī)制而導(dǎo)致的全局信息過(guò)度丟失的問(wèn)題。大量研究證明,通過(guò)向CNN添加多頭關(guān)注,該模型可以精確提取雷達(dá)反射率圖像的局部空間特征。此外,所提出的雙信道網(wǎng)絡(luò)中的第二信道可以有效地提取云彩的顏色、移動(dòng)速度和大小等信息。此外,研究證明,該模型的訓(xùn)練收斂速度更快、更穩(wěn)定。定量和定性結(jié)果表明,所提出的方法在雷達(dá)回波數(shù)據(jù)集上實(shí)現(xiàn)了最先進(jìn)的降水預(yù)測(cè)精度,為降水預(yù)報(bào)中的時(shí)空特征提取提供了一種新的有效方案。
天氣雷達(dá)回波外推是進(jìn)行臨近降水預(yù)測(cè)的重要手段,其基本原理是利用氣象雷達(dá)探測(cè)云層回波數(shù)據(jù),確定回波的強(qiáng)度分布和回波體的移動(dòng)速度與方向,再通過(guò)對(duì)回波體進(jìn)行線性或非線性的外推,從而預(yù)測(cè)一定時(shí)間段后的雷達(dá)回波狀態(tài)。本文對(duì)圍繞DL方法進(jìn)行天氣雷達(dá)回波外推展開(kāi)了介紹,重點(diǎn)總結(jié)了以CNN、RNN和DGM等為核心的方法。就目前來(lái)看,以CNN和RNN為核心的深度學(xué)習(xí)方法研究較為成熟,而基于深度生成模型和注意力機(jī)制的方法還有較大地探索空間。由于雷達(dá)回波也可以看成是圖像序列預(yù)測(cè)或視頻預(yù)測(cè)任務(wù),因而序列生成模型方法也可以用于此項(xiàng)研究。此外,現(xiàn)有的天氣雷達(dá)回波外推模型僅以多個(gè)時(shí)刻雷達(dá)圖像的反射率因子信息作為輸入,因而可考慮加入風(fēng)場(chǎng)信息及數(shù)值預(yù)報(bào)環(huán)境場(chǎng)等信息,使得網(wǎng)絡(luò)可以學(xué)習(xí)到更多的物理變化機(jī)制,對(duì)天氣系統(tǒng)的演變可能有更好的建模,能更進(jìn)一步提高預(yù)報(bào)的精準(zhǔn)度。