摘 要:當(dāng)前的短臨降水預(yù)報(bào)方法大多是基于雷達(dá)回波外推,沒(méi)有充分考慮其他氣象要素對(duì)降水生消演變的密切影響,從而限制了其預(yù)報(bào)的準(zhǔn)確性。為解決此問(wèn)題,基于風(fēng)云四號(hào)B星數(shù)據(jù),制作了包含四種背景氣象要素、以定量降水估計(jì)為預(yù)報(bào)對(duì)象的短時(shí)臨近降水預(yù)報(bào)數(shù)據(jù)集,提出了短臨降水預(yù)報(bào)模型——MFPNM。以TransUNet為骨干,設(shè)計(jì)了并行雙編碼器分別提取預(yù)報(bào)對(duì)象和背景氣象數(shù)據(jù)的高維時(shí)空特征;構(gòu)造了內(nèi)容編碼模塊將背景數(shù)據(jù)的空間特征作為預(yù)報(bào)對(duì)象高維特征向量的可學(xué)習(xí)位置編碼;以已有的Transformer模塊構(gòu)建序列數(shù)據(jù)高維特征間的全局關(guān)系,以實(shí)現(xiàn)更準(zhǔn)確的序列預(yù)測(cè)。MFPNM在風(fēng)云-4B數(shù)據(jù)集和開(kāi)源數(shù)據(jù)集上達(dá)到了最優(yōu)水平,采用的指標(biāo)包括臨界成功指數(shù)、虛警率、均方根誤差和結(jié)構(gòu)相似性等。同時(shí)通過(guò)SHAP(shapley additive explanations)技術(shù)對(duì)模型進(jìn)行了可解釋性分析。實(shí)驗(yàn)結(jié)果及可解釋性分析表明,該模型具有更好的預(yù)報(bào)準(zhǔn)確度及可靠性。
關(guān)鍵詞:短時(shí)臨近降水預(yù)報(bào);氣象衛(wèi)星;數(shù)據(jù)融合
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(2024)09-029-2773-08
doi:10.19734/j.issn.1001-3695.2024.01.0030
Precipitation nowcasting based on multiple factors and explainability analysis
Chen Long,Peng Jing,Hu Xuefei,Huang Zhan’ao,Li Xiaojie
(School of Computer Science,Chengdu University of Information Technology,Chengdu 610225,China)
Abstract:The current methods for short-time precipitation nowcasting are based on radar echo extrapolation model,without fully considering the close influence of other meteorological factors on the evolution of precipitation generation and cancellation,thus limiting the accuracy of the forecasts.To address the above issues,this paper produced a short-time precipitation nowcasting dataset,and proposed the MFPNM(multiple factors precipitation nowcasting model)Based on data from the Fengyun-4B satellite,the dataset toke quantitative precipitation estimation as the forecast object and contained four background meteorological factors.Taking the TransUNet as the backbone of the model,this molel proposed the parallel dual encoder to extract the high-dimensional spatio-temporal features of the forecast object and the background meteorological data,respectively.Besides,it constructed the content coding module to encode the spatial features of the background data as the learnable positional embedding of the high-dimensional feature vectors of the forecast object.It used a Transformer module to construct the global relationship between the high-dimensional features of the sequence data for better sequence prediction.The metrics used in this paper included critical success index,false alarm rate,root-mean-square error,and structural similarity,etc.The MPFNM was evaluated on two datasets(the proposed dataset and an open-source dataset)and outperformed the baseline models,and it was analyzed for explainability through the SHAP technique.The experimental results and explainability analysis show that the model has better forecasting accuracy and reliability.
Key words:short-time precipitation nowcasting;meteorological satellite;data fusion
0 引言
短時(shí)臨近降水預(yù)報(bào)指提供某一地理區(qū)域未來(lái)0~6 h(0~2 h為重點(diǎn))時(shí)段的高時(shí)空分辨率降水預(yù)報(bào)。準(zhǔn)確的預(yù)報(bào)有助于提前規(guī)劃和危機(jī)管理,如生成緊急降雨警報(bào),為機(jī)場(chǎng)及地面交通管理、戶外活動(dòng)和體育比賽提供天氣指導(dǎo)。短臨降水預(yù)報(bào)對(duì)時(shí)空分辨率和預(yù)報(bào)實(shí)時(shí)性的要求遠(yuǎn)高于傳統(tǒng)預(yù)報(bào)任務(wù),該領(lǐng)域具有相當(dāng)高的挑戰(zhàn)性,已成為氣象學(xué)界的研究熱點(diǎn)。
傳統(tǒng)氣象預(yù)報(bào)任務(wù)依賴于數(shù)值天氣預(yù)報(bào)技術(shù)(numerical weather prediction,NWP)[1,2]。在大量氣象觀測(cè)資料的基礎(chǔ)上,NWP利用流體力學(xué)和熱力學(xué)定律來(lái)描述和模擬大氣、海洋和陸地表面的基本物理過(guò)程,從而提供可靠的預(yù)報(bào)。迄今為止,其仍然是中長(zhǎng)期天氣預(yù)報(bào)的主流方法。但是因?yàn)槠淠M過(guò)程極其復(fù)雜且耗時(shí),難以滿足短時(shí)臨近預(yù)報(bào)的實(shí)時(shí)性要求。降水預(yù)報(bào)基于對(duì)降水的準(zhǔn)確觀測(cè),而觀測(cè)方式包括雨量計(jì)、天氣雷達(dá)和衛(wèi)星等。當(dāng)前主流臨近降水預(yù)測(cè)算法是雷達(dá)云圖外推預(yù)測(cè)算法,主要包括:互相關(guān)法[3]、質(zhì)心跟蹤法[4]和光流法[5,6]等。天氣雷達(dá)利用水汽對(duì)電磁波的散射作用探測(cè)大氣中的降水空間分布、強(qiáng)度以及演變過(guò)程。這些信息通過(guò)時(shí)序的雷達(dá)回波圖表示,雷達(dá)回波圖具有非常高的時(shí)空分辨率,能夠顯示降水結(jié)構(gòu)的演變。不同于NWP,作為一種基于數(shù)據(jù)圖像驅(qū)動(dòng)技術(shù),雷達(dá)云圖外推算法主要是根據(jù)當(dāng)前時(shí)刻雷達(dá)云圖預(yù)測(cè)下一時(shí)刻雷達(dá)云圖,如假定降水分布不變,計(jì)算其質(zhì)心的運(yùn)動(dòng)軌跡[4]。而云圖與降水的關(guān)系依賴于經(jīng)驗(yàn)公式:Z-R關(guān)系式[7],這類方法對(duì)氣象資料的利用效率低、外推時(shí)效性有限且泛化能力弱。從輸入輸出的形式上看,雷達(dá)云圖外推的核心是圖到圖(image2image)的預(yù)測(cè),可以視為深度學(xué)習(xí)中時(shí)空序列預(yù)測(cè)任務(wù)(spatio-temporal seq2seq)的子任務(wù)。
Shi等人[8]創(chuàng)新性地提出了ConvLSTM模型,將卷積與長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)相結(jié)合以便同時(shí)對(duì)雷達(dá)云圖序列時(shí)空關(guān)系建模,其中,LSTM捕獲云圖序列隨時(shí)間的演變,二維卷積則學(xué)習(xí)數(shù)據(jù)的空間分布。在ConvLSTM的基礎(chǔ)上,Shi等人[9]進(jìn)一步提出了TrajGRU,該模型可以主動(dòng)學(xué)習(xí)降水的結(jié)構(gòu)與位置變化。這些工作開(kāi)創(chuàng)了時(shí)空序列網(wǎng)絡(luò)在臨近降水預(yù)報(bào)方面的應(yīng)用,后續(xù)涌現(xiàn)出一系列時(shí)空模型,如ST-LSTM[10]、Causal LSTM[11]、E3D-LSTM[12]和IDA-LSTM[13]等。Wang等人[10]提出了時(shí)空LSTM(spatio-temporal LSTM,ST-LSTM)單元,該單元允許沿著狀態(tài)轉(zhuǎn)換路徑在堆疊的循環(huán)層上更新記憶狀態(tài),以便同時(shí)提取并記憶空間和時(shí)間表示。Wang等人[11]提出15aafaf7088ccbaccaf8e33f8e409b30339102903e98d13b134327b895f03b19了PredRNN++,它利用一種名為Causal LSTM的新循環(huán)結(jié)構(gòu)(具有級(jí)聯(lián)雙記憶)使PredRNN在時(shí)間上遞歸的更深。后來(lái),Wang等人[12]又提出了E3D-LSTM,其結(jié)合了ST-LSTM、3D卷積和記憶注意力模塊,構(gòu)建了一個(gè)記憶增強(qiáng)的循環(huán)網(wǎng)絡(luò)以捕獲長(zhǎng)期視頻動(dòng)態(tài)。此外,U-Net結(jié)構(gòu)也被用于臨近預(yù)報(bào)。Samsi等人[14]實(shí)現(xiàn)了基于U-Net的數(shù)據(jù)并行CNN模型,以實(shí)現(xiàn)更快的迭代。文獻(xiàn)[15]將預(yù)測(cè)視為圖像到圖像的轉(zhuǎn)換問(wèn)題,利用U-Net卷積神經(jīng)網(wǎng)絡(luò)并采用三個(gè)二元分類來(lái)指示降雨率的強(qiáng)度。在不確定性預(yù)測(cè)方面,Bihlo等人[16]使用SVG-LP模型[17]進(jìn)行降水臨近預(yù)報(bào)。吳卓升等人[18]提出了基于動(dòng)態(tài)概率的卷積神經(jīng)網(wǎng)絡(luò),引入動(dòng)態(tài)概率計(jì)算層對(duì)不同的雷達(dá)回波輸入序列計(jì)算對(duì)應(yīng)的概率卷積核,使模型能夠在測(cè)試階段對(duì)輸入做動(dòng)態(tài)調(diào)整。
上述方法有力地促進(jìn)了短臨降水預(yù)報(bào)的研究,但是均基于雷達(dá)回波圖[19]進(jìn)行預(yù)測(cè),而雷達(dá)的應(yīng)用常受到地面雜波、地形及成本等因素限制;其次,雷達(dá)回波強(qiáng)度并不直接反映降水量,而是依賴于經(jīng)驗(yàn)公式:Z-R公式,存在二次誤差且泛化能力弱。另一方面,溫度、壓力和濕度等氣象要素在任何時(shí)間和地點(diǎn)都有意義,而降雨的生消具有局部性強(qiáng)、突發(fā)性強(qiáng)、在時(shí)空分布上相對(duì)稀疏和變化快等特點(diǎn),這使得針對(duì)降水的臨近預(yù)報(bào)比其他氣象要素更具挑戰(zhàn)性。已有研究表明,在短臨降水預(yù)報(bào)中引入其他氣象要素作為背景信息,可以提升預(yù)報(bào)的準(zhǔn)確性,降水并非孤立事件,其與天氣系統(tǒng)中其他要素密切相關(guān)[20~24]。Kaparakis等人[20]提出了weather fusion U-Net(WF-UNet)模型,其利用core 3D-UNet模型,將降水和風(fēng)速變量作為學(xué)習(xí)過(guò)程的輸入,并分析其對(duì)降水目標(biāo)任務(wù)的影響,證明了相比于僅使用降水雷達(dá)數(shù)據(jù),引入背景變量可以獲得更優(yōu)的預(yù)測(cè)結(jié)果。Küük等人[21]提出了一個(gè)基于Transformer的模型,其使用提前兩小時(shí)的衛(wèi)星數(shù)據(jù)來(lái)預(yù)報(bào)地面雷達(dá)圖像序列。該模型在反映惡劣天氣條件的數(shù)據(jù)集上進(jìn)行訓(xùn)練,可以預(yù)測(cè)不同天氣現(xiàn)象下發(fā)生的雷達(dá)場(chǎng),并對(duì)快速增長(zhǎng)/衰減的場(chǎng)和復(fù)雜的場(chǎng)結(jié)構(gòu)表現(xiàn)出魯棒性。Mark等人[25]提出了多要素的風(fēng)暴事件圖像數(shù)據(jù)集,并將其應(yīng)用于短臨降水預(yù)報(bào)和雷達(dá)云圖反演。這些工作都擴(kuò)展了氣象數(shù)據(jù)(來(lái)自雷達(dá)或氣象衛(wèi)星載荷)在短臨降水預(yù)報(bào)中的應(yīng)用,并獲得了更好的預(yù)報(bào)效果,本文是這些工作延續(xù)。
本文提出了短臨降水預(yù)報(bào)模型——MFPNM,該模型引入多種氣象要素作為短臨降水預(yù)測(cè)過(guò)程的背景信息,以獲得豐富的學(xué)習(xí)特征、實(shí)現(xiàn)更為準(zhǔn)確的預(yù)報(bào)。該模型包括兩個(gè)編碼器(序列編碼器和背景編碼器)、內(nèi)容編碼模塊(content embedding)和Transformer注意力模塊、序列解碼器。模型的輸入包括降水變量和背景變量,其中降水變量是序列數(shù)據(jù),而背景變量指初始時(shí)刻其他的氣象要素,如溫度、壓力、紅外通道云圖等。以TransUNet為骨干,本文在原始的編碼器與解碼器中引入3D卷積,同時(shí)處理降水變量的時(shí)序信息和空間特征,即序列編碼器與序列解碼器;同時(shí),設(shè)計(jì)了并行的背景編碼器提取背景變量的空間特征;另外,本文提出了內(nèi)容編碼模塊以替代原TransUNet中的位置編碼,將背景變量特征編碼到降水變量特征中作為其可學(xué)習(xí)的位置編碼。MFPNM模型沿用了TransUNet中的Transformer模塊,通過(guò)注意力機(jī)制學(xué)習(xí)序列數(shù)據(jù)間的相關(guān)性,以建模序列元素間的長(zhǎng)程依賴關(guān)系。
為了有效地訓(xùn)練和驗(yàn)證提出的模型,本文利用氣象衛(wèi)星數(shù)據(jù)制作了以多種物理要素為背景變量的高分辨率短臨降水預(yù)報(bào)數(shù)據(jù)集,以推動(dòng)短臨降水預(yù)報(bào)研究。通過(guò)在制作的和開(kāi)源的數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),驗(yàn)證了所提模型優(yōu)異的預(yù)報(bào)性能。另外,使用SHAP技術(shù)對(duì)模型進(jìn)行了可解釋性分析,驗(yàn)證了所提模型的可靠性和多要素融合預(yù)報(bào)的有效性。
1 算法
氣象衛(wèi)星的觀測(cè)范圍廣且不受自然條件限制,但存在分辨率較低、獲取的降水?dāng)?shù)據(jù)特征不足以及時(shí)空分布相對(duì)稀疏等問(wèn)題。基于CNN-RNN的預(yù)測(cè)模型在下采樣中丟失過(guò)多信息,其在特征稀疏的衛(wèi)星降水?dāng)?shù)據(jù)上表現(xiàn)相對(duì)較差。ViT(vision Transformer)網(wǎng)絡(luò)是將圖像分割成塊并轉(zhuǎn)換為序列,通過(guò)嵌入層得到序列中每個(gè)成員的向量表示,利用Transformer的注意力機(jī)制捕捉圖像中的全局關(guān)系;受ViT的啟發(fā),本文將其擴(kuò)展到時(shí)空序列預(yù)測(cè)任務(wù)。常規(guī)的ViT模型無(wú)法有效地處理尺寸較大的降水序列數(shù)據(jù),但是通過(guò)結(jié)合U-Net網(wǎng)絡(luò)與ViT模型得到的TransUNet模型可以較好地處理該問(wèn)題。
本文提出了一個(gè)基于TransUNet的降水預(yù)報(bào)模型——MFPNM,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,主要包括兩個(gè)編碼器(序列編碼器和背景編碼器)、一個(gè)序列解碼器、內(nèi)容編碼模塊(content embedding)和Transformer注意力模塊。其中,序列編碼器接受過(guò)去連續(xù)T個(gè)時(shí)刻定量降水估計(jì)(quantitative precipitation estimation,QPE)數(shù)據(jù)作為輸入Sin,背景編碼器將序列初始時(shí)刻對(duì)應(yīng)的背景變量(CTH、CTT、CTP和CLE,具體情況如表1所示)作為輸入Gin,以預(yù)測(cè)未來(lái)T個(gè)時(shí)刻的QPE數(shù)據(jù)Sout。序列編碼器和背景編碼器分別獲取Sin和Gin的高維向量表示,Gin為目標(biāo)變量Sin提供豐富的氣象背景信息如溫度、壓力等,這些氣象背景信息將通過(guò)內(nèi)容編碼模塊融合到降水?dāng)?shù)據(jù)的高維特征中作為其位置編碼。卷積操作具有局部性,基于卷積的U-Net對(duì)遠(yuǎn)程依賴關(guān)系的建模能力有限,因此在U-Net引入Transformer模塊,通過(guò)多頭注意力機(jī)制計(jì)算不同特征向量之間的相關(guān)性,學(xué)習(xí)序列數(shù)據(jù)間的全局關(guān)系。最終,序列解碼器重構(gòu)出序列預(yù)測(cè)結(jié)果。同時(shí),在序列編碼器與解碼器之間使用了短連接來(lái)解決下采樣過(guò)程信息丟失的問(wèn)題。
1.1 雙編碼器時(shí)空特征提取
本文設(shè)計(jì)了雙編碼器分別提取降水序列變量Sin和背景變量Gin的高維特征并映射為向量表示。Transformer的輸入是具有位置嵌入(positional embedding,PE)的一組向量,其通過(guò)注意力機(jī)制計(jì)算向量之間的相關(guān)性并構(gòu)建向量間的全局關(guān)系;本文使用了序列編碼器學(xué)習(xí)得到這些向量。但作為預(yù)測(cè)目標(biāo)的降水?dāng)?shù)據(jù)在空間分布上具有稀疏性,經(jīng)過(guò)序列編碼器下采樣后空間信息損失較重;引入背景編碼器處理與降水具有強(qiáng)相關(guān)性的背景變量如溫度、壓力等,可以為模型處理序列變量提供豐富的氣象背景信息和學(xué)習(xí)特征,因?yàn)榻邓哂袇^(qū)域性和時(shí)效性,而溫度、壓力等氣象要素在任何時(shí)刻、任何地點(diǎn)都有意義且都與降水密切相關(guān)。
如圖1右側(cè)所示,構(gòu)建編碼器與解碼器的基本塊包括Ch block、Res block、down block和up block。Ch block用作編碼器和解碼器的輸入輸出層,用于將數(shù)據(jù)在通道維度進(jìn)行快速升維或降維;其內(nèi)部采用雙層卷積的殘差結(jié)構(gòu),同時(shí)對(duì)輸入使用1×1卷積改變通道數(shù)。Res block是網(wǎng)絡(luò)中提取特征的殘差塊,與down block與up block構(gòu)成了編碼器與解碼器的主干;down block與up block分別負(fù)責(zé)進(jìn)行下采樣與上采樣,up block會(huì)接受來(lái)自前一層和對(duì)應(yīng)短連接的特征圖作為輸入。根據(jù)文獻(xiàn)[12,20],三維卷積網(wǎng)絡(luò)(3D-CNN)和循環(huán)遞歸網(wǎng)絡(luò)(RNN)都具有時(shí)空建模功能,本文在序列編碼器和序列解碼器中使用3D卷積和3D轉(zhuǎn)置卷積來(lái)保留序列的時(shí)間和空間特征,即對(duì)應(yīng)的基本塊中均使用3D卷積。而背景編碼器只處理初始時(shí)刻背景變量的空間特征,其使用的Ch block、Res block和down block中均使用2D卷積。
序列編碼器的輸入Sin是一個(gè)時(shí)空序列變量,包括通道、長(zhǎng)、寬和時(shí)間四個(gè)維度,3D卷積核會(huì)同時(shí)在空間(長(zhǎng)和寬)和時(shí)間維度提取QPE序列的時(shí)空信息,通道數(shù)對(duì)應(yīng)于卷積核數(shù),不同的卷積核會(huì)提取不同類型的特征。將初始時(shí)刻的云頂高度(cloud top height,CTH)、云頂溫度(cloud top temperature,CTT)、云頂壓力(cloud top pressure,CTP)和云反射率(cloud emissivity,CLE)四種背景變量在通道維度疊加,形成三維變量作為背景編碼器的輸入Gin,即這些數(shù)據(jù)表征了同一時(shí)間和空間下不同的氣象要素。在兩個(gè)編碼器最后一層通過(guò)Ch block將特征的通道數(shù)統(tǒng)一擴(kuò)展到N,以確保兩個(gè)編碼器都得到N個(gè)向量。通過(guò)訓(xùn)練,序列編碼器可以學(xué)習(xí)到輸入序列的高維特征,背景編碼器學(xué)習(xí)初始時(shí)刻其他氣象要素的高維特征。這些高維特征分別被映射為N×d1的二維特征矩陣Svectors和N×d2的二維特征矩陣Gpe(N個(gè)長(zhǎng)度為d1和d2的向量,每個(gè)向量表示整個(gè)序列或?qū)?yīng)背景變量的某種高維特征),這些氣象背景信息將通過(guò)內(nèi)容編碼模塊以位置編碼的形式,融合到降水?dāng)?shù)據(jù)的高維特征。
1.2 內(nèi)容編碼模塊
為了給Transformer模塊提供更合理的位置嵌入,本文模型通過(guò)背景編碼器對(duì)背景變量進(jìn)行特征提取,得到的向量作為可學(xué)習(xí)的位置編碼。ViT模型通常將圖像切分為一系列補(bǔ)丁,再展平為多個(gè)一維向量,因此可以直接對(duì)向量進(jìn)行位置編碼。為了處理高時(shí)空分辨率的氣象數(shù)據(jù),本文使用了序列編碼器對(duì)序列數(shù)據(jù)進(jìn)行降維,得到高維特征表示,但是這些特征間的位置信息與原始序列間的位置信息并不對(duì)應(yīng)。為了合理地表達(dá)特征間的位置信息,如1.1節(jié)所述,本文引入了背景編碼器提取初始時(shí)刻背景變量的空間特征作為序列數(shù)據(jù)高維特征的位置編碼。
如圖2所示,傳統(tǒng)的位置編碼服從標(biāo)準(zhǔn)正態(tài)分布;而本文提出的內(nèi)容編碼中使用背景編碼器的輸出Gpe作為位置嵌入。通過(guò)訓(xùn)練與學(xué)習(xí),背景編碼器擬合數(shù)據(jù)集中背景變量Gin的分布,因此可以將背景編碼器每次前向傳播視為一次采樣過(guò)程。Sin與Gin具有強(qiáng)相關(guān)性,Gpe為Svectors提供的位置嵌入因Svectors不同而不同,也即位置嵌入是基于輸入向量的內(nèi)容而不同的,而非一個(gè)服從正態(tài)分布的隨機(jī)參數(shù)。在內(nèi)容編碼模塊中,使用兩個(gè)linear線性映射層將兩組向量的長(zhǎng)度統(tǒng)一到d維;最后,將二者加和得到編碼后的向量。通過(guò)內(nèi)容編碼后,向量將傳入Transformer模塊計(jì)算向量間的相關(guān)性,通過(guò)注意力機(jī)制捕獲序列時(shí)空特征間的長(zhǎng)程關(guān)系。對(duì)于任意降水序列,初始時(shí)刻作為背景變量的氣象條件不同,則對(duì)應(yīng)的背景向量也不同,內(nèi)容編碼模塊可以提供針對(duì)降水序列內(nèi)容的位置嵌入。
1.3 模型可解釋性分析方法
深度學(xué)習(xí)模型在降水預(yù)測(cè)中存在黑盒問(wèn)題,其具有大量的計(jì)算層和參數(shù)以及復(fù)雜的模型結(jié)構(gòu),這是模型學(xué)習(xí)能力的基礎(chǔ),但使其內(nèi)部工作機(jī)制變得難以理解。在應(yīng)用深度學(xué)習(xí)模型進(jìn)行降水預(yù)測(cè)時(shí),需要權(quán)衡模型的性能和可解釋性,以確保模型的預(yù)測(cè)結(jié)果在實(shí)際應(yīng)用中是可靠的??山忉屝苑椒砂凑沼?xùn)練周期劃分,訓(xùn)練前期的可解釋性著重?cái)?shù)據(jù)分析,如數(shù)據(jù)可視化、統(tǒng)計(jì)分析數(shù)據(jù)分布(MMD)等;訓(xùn)練中應(yīng)用可解釋性方法即創(chuàng)建可解釋的模型,如Li等人[26]提出了一種基于大氣散射模型的物理感知清晰特征預(yù)測(cè)模塊,該模塊可以從場(chǎng)景照明和深度中推斷出透光率的變化。訓(xùn)練后的可解釋性即解釋黑盒模型的決策依據(jù),典型方式是敏感性分析(sensitivity analysis)和基于梯度的方法(gradient-based method)。敏感性分析考察模型對(duì)特定數(shù)據(jù)實(shí)例的敏感程度及數(shù)據(jù)對(duì)模型決策邊界的影響;基于梯度的方法考察輸入的哪一部分更影響決策,對(duì)于圖像任務(wù)來(lái)說(shuō),輸入對(duì)決策的貢獻(xiàn)度體現(xiàn)為顯著圖,顯示圖片中每個(gè)像素的重要性。
本文使用基于梯度的SHAP(Shapley additive explanations)技術(shù)[27],分析引入的背景變量是否為序列變量的預(yù)測(cè)提供了合理的氣象背景信息。分析流程如圖3所示,利用背景編碼器提取到背景變量的特征矩陣(N×d2),這些特征向量是數(shù)據(jù)在模型中的抽象表示。采用SHAP技術(shù)計(jì)算特征矩陣中每個(gè)特征向量的Shapley value,與原特征向量相加即得到對(duì)應(yīng)的重要性向量,重要性向量表征了對(duì)應(yīng)特征向量對(duì)輸出結(jié)果的貢獻(xiàn)度。為了便于通過(guò)可視化判斷,后續(xù)重要性向量進(jìn)行上采樣輸出得到顯著圖,可直觀判斷模型從輸入數(shù)據(jù)中學(xué)習(xí)到的特征向量的有效性。
SHAP基于博弈論中的Shapley值概念,為每個(gè)特征分配一個(gè)Shapley值,表示該特征對(duì)于模型輸出的貢獻(xiàn)。這種方法提供了一種全局解釋,可以揭示每個(gè)特征對(duì)于整體預(yù)測(cè)的影響。對(duì)于本文的N個(gè)d維特征向量,SHAP通過(guò)以下步驟計(jì)算Shapley值:
a)采樣特征子集。對(duì)于給定的N個(gè)特征向量,生成一系列子集,每個(gè)子集包含若干個(gè)特征向量。
b)計(jì)算邊際貢獻(xiàn)。對(duì)于每個(gè)特征子集,計(jì)算該子集中每個(gè)特征的邊際貢獻(xiàn),即在考慮其他特征的情況下,每個(gè)特征對(duì)于模型輸出的貢獻(xiàn)。
c)計(jì)算平均邊際貢獻(xiàn)。對(duì)于每個(gè)特征,計(jì)算它在所有可能子集中的平均邊際貢獻(xiàn),得到Shapley值。
d)分配Shapley值。將計(jì)算得到的Shapley值分配給每個(gè)特征,表示該特征對(duì)于整體預(yù)測(cè)的平均貢獻(xiàn)。
2 數(shù)據(jù)集
本文在自制的FY-4B數(shù)據(jù)集和開(kāi)源的SEVIR數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),數(shù)據(jù)集制作流程介紹如下。
2.1 FY-4B衛(wèi)星數(shù)據(jù)概要
我國(guó)氣象衛(wèi)星系統(tǒng)發(fā)展逐步成熟,其可以穩(wěn)定持久提供豐富的氣象數(shù)據(jù)且不受地形、地面雜波和惡劣天氣等因素影響。本文所使用數(shù)據(jù)來(lái)自我國(guó)第二代靜止軌道氣象衛(wèi)星風(fēng)云四號(hào)B星(簡(jiǎn)稱FY-4B,http://www.nsmc.org.cn/nsmc/cn/satellite/FY4B.html),其于2022年6月1日轉(zhuǎn)入業(yè)務(wù)試運(yùn)行。FY-4B提供了豐富的定量監(jiān)測(cè)產(chǎn)品,包括云和大氣產(chǎn)品、地表類產(chǎn)品、天氣產(chǎn)品、輻射產(chǎn)品等等。本文使用的定量降水估計(jì)(quantitative precipitation estimation,QPE)是采用衛(wèi)星紅外資料生成的衛(wèi)星估計(jì)降水,反映了高時(shí)空分辨率的同區(qū)域降水動(dòng)態(tài)變化信息,全面監(jiān)測(cè)降水系統(tǒng)的強(qiáng)度、面積、趨勢(shì)走向等特征演變。降水是大氣中水的相變,降水的形成大致包括:a)水汽的水平輸送;b)水汽垂直運(yùn)動(dòng):水汽輻合上升,絕熱膨脹并冷凝成云;c)云滴增長(zhǎng)。當(dāng)水汽供應(yīng)越充足,上升運(yùn)動(dòng)增強(qiáng),則云頂高度越高,云層越厚,當(dāng)云層溫度足夠低或云頂壓力足夠大時(shí)就會(huì)通過(guò)冰晶效應(yīng)或云滴碰撞合并,使得云滴快速增長(zhǎng)形成降水。因此,本文另外選用了云頂高度(CTH)、云頂壓力(CTP)、云頂溫度(CTT)和云反射率(CLE)作為預(yù)報(bào)QPE的氣象背景數(shù)據(jù),數(shù)據(jù)產(chǎn)品概況如表1所示。
數(shù)據(jù)的空間分辨率為4 km,時(shí)間分辨率為15 min,F(xiàn)Y-4B星下點(diǎn)精度為東經(jīng)133°,覆蓋從東經(jīng)51.776°至西經(jīng)145.776°區(qū)域,包括亞洲、大洋洲和西太平洋,數(shù)據(jù)存儲(chǔ)為2 748×2 748的二維矩陣。本文使用數(shù)據(jù)覆蓋2022年6月1日至2023年5月31日,為方便敘述,本文稱每15 min一次的數(shù)據(jù)為一幀,理論上,每天包含96幀數(shù)據(jù),一年有35 040幀數(shù)據(jù),在排除不可用數(shù)據(jù)(缺失、損壞和空值)后,實(shí)際數(shù)據(jù)的完整性如表1所示。
2.2 FY-4B數(shù)據(jù)預(yù)處理與數(shù)據(jù)集制作
地面溫度、壓力等物理要素在任何時(shí)間任何地點(diǎn)都有意義,但現(xiàn)實(shí)中多數(shù)時(shí)間和區(qū)域均無(wú)雨,即原始降水?dāng)?shù)據(jù)中存在大量零值,為避免數(shù)據(jù)集中有效數(shù)據(jù)太少導(dǎo)致模型無(wú)法訓(xùn)練,因此數(shù)據(jù)預(yù)處理時(shí)需要盡力篩選出原始數(shù)據(jù)中的降雨區(qū)域。數(shù)據(jù)集的制作主要包括以下步驟:
a)根據(jù)需要下載選定數(shù)據(jù)產(chǎn)品、篩選可用數(shù)據(jù)。風(fēng)云衛(wèi)星遙感服務(wù)網(wǎng)提供多種下載方式,下載地址:http://satellite.nsmc.org.cn/PortalSite/Data/Satellite.aspx?currentculture=zh-CN。
b)將原始數(shù)據(jù)由標(biāo)稱圓盤投影轉(zhuǎn)換為墨卡托投影。
c)降水區(qū)域選擇:
(a)根據(jù)定量降水估計(jì)(QPE),統(tǒng)計(jì)中心2 560×2 560區(qū)域內(nèi)每個(gè)格點(diǎn)的月平均降水;
(b)將區(qū)域劃分為256×256的100個(gè)子區(qū)域,每月選擇降水量最大的四個(gè)子區(qū)域備用;
(c)計(jì)算每幀QPE數(shù)據(jù)的每個(gè)子區(qū)域中降水面積比,圖4(a)是一個(gè)有效降水面積為19%的子區(qū)域,公式如下:
p=降水量大于0.1 mm/h的像素點(diǎn)數(shù)256×256×100%(1)
d)時(shí)間點(diǎn)篩選:
(a)篩選出QPE、CTH、CTT、CTP和CLE數(shù)據(jù)都可用的時(shí)間點(diǎn),共計(jì)33 348個(gè);
(b)根據(jù)需要篩選降雨區(qū)域面積足夠大的數(shù)據(jù),本文采取閾值為19%,四個(gè)子區(qū)域內(nèi)分別得到9 804,9 237,6 646和7 822個(gè)可用數(shù)據(jù)。如圖4(b)所示,為原始數(shù)據(jù)與篩選后得到的數(shù)據(jù)集中有效降雨面積大于特定閾值的子區(qū)域的比例分布。藍(lán)色圓點(diǎn)表示降水面積比大于某閾值的子區(qū)域在所有子區(qū)域中的占比;篩選掉閾值小于19%的子區(qū)域后,得到紅色方點(diǎn)所示的分布。
e)設(shè)定序列長(zhǎng)度為16,步長(zhǎng)為2,從上述可用數(shù)據(jù)中生成連續(xù)的序列數(shù)據(jù)。
f)劃分?jǐn)?shù)據(jù)集。將所有序列隨機(jī)分為訓(xùn)練集、測(cè)試集和驗(yàn)證集(數(shù)據(jù)量為8 000:1 000:1 000)。
最終,數(shù)據(jù)集樣本量為10 000,每個(gè)樣本為5×16×256×256的四維矩陣,5代表QPE、CTH、CTT、CTP和CLE五類變量,16表示序列包含4 h共16幀,256×256是數(shù)據(jù)覆蓋的空間范圍。
2.3 SEVIR數(shù)據(jù)集
storm event imagry(SEVIR)數(shù)據(jù)集是一個(gè)多源氣象數(shù)據(jù)集,包含來(lái)自對(duì)地靜止環(huán)境衛(wèi)星系統(tǒng)(GOES-16)與下一代雷達(dá)(NEXRAD)系統(tǒng)的五種圖像數(shù)據(jù):GOES-16 0.6 μm可見(jiàn)衛(wèi)星通道(C02)、6.9 μm和10.7 μm紅外通道(C09,C13;分辨率為2 km)、GOES-16收集的閃電事件(分辨率為8 km)和垂直集成液體雷達(dá)拼圖(vertically integrated liquid,VIL,分辨率為1km)。五個(gè)變量依次表示為VIS、IR069、IR107、LGHT和VIL。C09通道被稱為“中層水汽”通道,用于跟蹤對(duì)流層中層風(fēng);C13被廣泛應(yīng)用于與云和其他大氣特征相關(guān)的監(jiān)測(cè),例如估計(jì)云頂溫度、云粒徑和大氣濕度校正。最后,閃電計(jì)數(shù)提供了5 min內(nèi)匯總的云間和云地閃電總數(shù)。VIL提供了給定大氣柱中液態(tài)水總量的估計(jì),是惡劣天氣的重要診斷工具,被廣泛用于業(yè)務(wù)臨近預(yù)報(bào)系統(tǒng)。SEVIR數(shù)據(jù)集將單位為kg/m2的VIL通過(guò)非線性縮放存儲(chǔ)為0~255的整數(shù);在輸入模型時(shí)通過(guò)最大最小歸一化映射到[0,1]。SEVIR包含超過(guò)10 000個(gè)天氣事件,每個(gè)天氣事件由跨越4 h的384 km×384 km的圖像序列組成(長(zhǎng)度為49幀、時(shí)間分辨率為5 min)。數(shù)據(jù)集中的變量于2017—2019年采集自美國(guó)本土,且進(jìn)行了時(shí)空對(duì)齊。Veillette等人(2020)設(shè)計(jì)了復(fù)雜的采樣方案,以避免數(shù)據(jù)集中包含過(guò)多無(wú)降水樣本從而導(dǎo)致數(shù)據(jù)類別不平衡問(wèn)題。
本實(shí)驗(yàn)中將兩個(gè)紅外通道數(shù)據(jù)作為背景變量,VIL作為預(yù)測(cè)目標(biāo),由于設(shè)備限制,只采用每個(gè)序列的前16幀,其中前8幀作為歷史數(shù)據(jù),后8幀作為預(yù)測(cè)目標(biāo)。打亂所有天氣事件并將其按5:1:1的比例拆分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。三種變量都通過(guò)雙線性差值統(tǒng)一調(diào)整為256×256的二維圖像。
3 實(shí)驗(yàn)與結(jié)果
3.1 實(shí)驗(yàn)方案
給定初始時(shí)刻背景變量(為方便敘述,以FY-4B數(shù)據(jù)集為例,包括CTH、CTP、CTT和CLE)和前8個(gè)時(shí)刻QPE序列數(shù)據(jù),模型預(yù)測(cè)出未來(lái)8個(gè)時(shí)刻的QPE數(shù)據(jù),序列編碼器輸入QPE序列的形狀為(256,256,8),初始時(shí)刻背景變量在通道維度疊加成為背景編碼器的輸入,其形狀為(4,256,256)。對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,對(duì)不同類型數(shù)據(jù)進(jìn)行伸縮變換使得不同量度之間的特征具有可比性,使用最大最小值標(biāo)準(zhǔn)化(min-max standardization)將數(shù)據(jù)變換到[0,1];為了避免少量極端值的存在影響標(biāo)準(zhǔn)化,使其余大部分?jǐn)?shù)據(jù)的分布過(guò)于集中,先對(duì)這些極端值采取了適當(dāng)?shù)慕財(cái)啻胧┰賹?duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。模型中卷積核大小為3×3(如圖1、2所示),使用的基礎(chǔ)通道數(shù)為16,每次下采樣時(shí)通道數(shù)翻倍。Transformer的嵌入維度為512,其MLP的維度為4 096。使用ReLU函數(shù)作為網(wǎng)絡(luò)的激活函數(shù)、在模型的輸出層使用sigmoid()函數(shù)將輸出約束在[0,1],并用Kaiming方法初始化網(wǎng)絡(luò)的參數(shù),通過(guò)l1+l2損失進(jìn)行優(yōu)化,模型中使用了分組歸一化(group normalization)。損失函數(shù)公式如下:
loss=1N×256×256∑Nn=1∑256i=1∑256j=1|xn,i,j-n,i,j|+(xn,i,j-n,i,j)2(2)
其中:N表示預(yù)測(cè)幀數(shù);數(shù)據(jù)的長(zhǎng)寬為256;xn,i,j和n,i,j表示第n幀(i,j)處的真實(shí)數(shù)值和預(yù)測(cè)數(shù)值。在訓(xùn)練步驟中,模型使用ADAM優(yōu)化器,以0.000 1的學(xué)習(xí)率進(jìn)行迭代優(yōu)化。每個(gè)迭代過(guò)程的批量大小和最大epoch數(shù)分別設(shè)置為20和100。此外,還采用了early-stop策略。模型的實(shí)現(xiàn)基于PyTorch深度學(xué)習(xí)框架,使用了DataParallel并行化訓(xùn)練策略以加速訓(xùn)練,所用顯卡為NVIDIA GeForce GPU RTX 4080Ti。
3.2 評(píng)價(jià)指標(biāo)
本文采用了圖片質(zhì)量評(píng)價(jià)指標(biāo)(RMSE和SSIM)和基于降雨等級(jí)的預(yù)報(bào)技能得分(CSI、FAR和HSS)對(duì)算法的臨近預(yù)報(bào)性能進(jìn)行全面評(píng)估。預(yù)報(bào)技能得分的計(jì)算基于降水閾值,對(duì)于FY-4B數(shù)據(jù)集的定量降水估計(jì)(QPE,單位為mm/h),本文選定0.1、2.5、8和16作為閾值,依據(jù)為小時(shí)累計(jì)降雨等級(jí)表(如表2所示);對(duì)于SEVIR數(shù)據(jù)集的垂直累計(jì)液體(VIL,單位為km/m2),選定0.1、0.3和1.4作為閾值,數(shù)據(jù)集中VIL大于0.1、0.3和1.4的像素點(diǎn)占比分別為25%、18%和10%。在給定某閾值時(shí),將預(yù)測(cè)數(shù)據(jù)和真實(shí)數(shù)據(jù)中大于等于閾值的數(shù)據(jù)設(shè)為1,將小于閾值的數(shù)據(jù)設(shè)為0,由表3統(tǒng)計(jì)各類別檢驗(yàn)結(jié)果的數(shù)量,由式(3)~(5)計(jì)算關(guān)鍵成功指數(shù)(critical success index,CSI)、誤報(bào)率(false alarm rate,F(xiàn)AR)和海德克技能評(píng)分(heidke skill score,HSS)。臨界成功指數(shù)(CSI)指預(yù)報(bào)結(jié)果的正確部分占所有結(jié)果的比例;虛警率(FAR)預(yù)報(bào)結(jié)果中誤報(bào)部分所占比例。圖像質(zhì)量評(píng)價(jià)指標(biāo)包括均方根誤差(RMSE)和結(jié)構(gòu)相似性(SSIM),其計(jì)算方法如式(6)(7)所示。
CSI=TPTP+FP+FN(3)
FAR=FPTP+FP(4)
HSS=2×TP×TN-FN×FP(TP+FN)×(TN+FN)+(TP+FP)×(TN+FP)(5)
RMSE=1n∑ni=1(xi-yi)2(6)
SSIM=(2μxμy+C1)(2σxy+C2)(μ2x+μ2y+C1)(σ2x+σ2y+C2)(7)
其中:xi和yi分別表示真實(shí)數(shù)據(jù)x和預(yù)測(cè)數(shù)據(jù)y的第i個(gè)值;μ和σ表示均值和方差;σxy表示x和y之間的方差。C1和C2分別為6.502 5和58.522 5。
在計(jì)算SSIM時(shí),需將降水量通過(guò)線性映射擴(kuò)展到0~255并存為灰度圖,SSIM從亮度、對(duì)比度和結(jié)構(gòu)三方面評(píng)價(jià)預(yù)報(bào)降雨分布圖與真實(shí)降雨圖之間的相似度。RMSE衡量預(yù)報(bào)降雨量與真實(shí)降雨量之間的差異。SSIM的最佳值為1,RMSE的最佳值為0。
3.3 結(jié)果與分析
3.3.1 FY-4B數(shù)據(jù)集
為驗(yàn)證本文模型的有效性,將其與近年的SOTA模型進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)的定量結(jié)果如表4~6所示,相比對(duì)比模型,本文模型在各個(gè)指標(biāo)上都明顯取得更好的效果,可以證明本文模型的有效性。隨著降雨等級(jí)增強(qiáng),各指標(biāo)都逐漸變差,因?yàn)闃O端的降水事件在現(xiàn)實(shí)中發(fā)生概率也較低,訓(xùn)練樣本少使得模型無(wú)法有效學(xué)習(xí)到其規(guī)律。但是觀察表4、5可知,當(dāng)降雨等級(jí)越高,本文模型與次優(yōu)模型的差異越大,如在誤報(bào)率方面,降雨量大于2.5時(shí)相差0.013 4,而在降雨量大于16時(shí)相差0.044 5,這表明本文模型可以更好地預(yù)報(bào)極端降雨事件,這得益于其他氣象背景信息的引入;而其他模型只依賴于降水?dāng)?shù)據(jù)進(jìn)行預(yù)測(cè),很難有效利用稀疏的極端降水?dāng)?shù)據(jù)。
預(yù)報(bào)技能得分是基于閾值進(jìn)行計(jì)算的,并不能反映預(yù)測(cè)值與真實(shí)值之間的實(shí)際差異,因此本文也使用了均方根誤差(RMSE)和圖像結(jié)構(gòu)相似性(SSIM)。均方根誤差是計(jì)算每個(gè)像素點(diǎn)真實(shí)降雨量與預(yù)測(cè)降雨量之間誤差的均值平方根,而SSIM是從亮度、對(duì)比度和結(jié)構(gòu)等方面評(píng)價(jià)真實(shí)圖像與預(yù)測(cè)圖像的相似性。本文模型在EF Sat2Rad的基礎(chǔ)上將RMSE降低了0.57,將SSIM提升0.09。
某時(shí)刻降雨的定性結(jié)果如圖5所示,圖5(a)為模型的輸入數(shù)據(jù),即過(guò)去兩小時(shí)(每15 min一幀,共8幀)的降雨趨勢(shì)圖,各個(gè)模型根據(jù)輸入預(yù)測(cè)未來(lái)兩小時(shí)的降雨趨勢(shì)圖;圖5(b)為預(yù)測(cè)時(shí)段的真實(shí)降雨;圖5(c)為本文MFPNM模型預(yù)測(cè)結(jié)果;圖5(d)~(g)依次是EF Sat2Rad[21]、WF-UNet[20]、IDA-LSTM[13]和E3D-LSTM[12]等模型的結(jié)果。各個(gè)模型均能預(yù)測(cè)出降雨的整體趨勢(shì),而在細(xì)節(jié)上則差異明顯。圖5(f)(g)的基于CNN-RNN的模型在小雨區(qū)域表現(xiàn)很差,基本無(wú)法預(yù)測(cè),而在降雨量大時(shí)傾向于低估降雨量,特別是隨預(yù)報(bào)時(shí)間延長(zhǎng),無(wú)法或只能部分預(yù)測(cè)出暴雨區(qū)域。WF-UNet可以較好地捕獲暴雨,但是會(huì)將部分無(wú)雨的離散點(diǎn)錯(cuò)誤地預(yù)報(bào)為有雨。EF Sat2Rad普遍低估降雨的強(qiáng)度,如預(yù)測(cè)的中雨區(qū)域明顯小于真實(shí)中雨區(qū)域。但是相比于前兩個(gè)方法,WF-UNet和EF Sat2Rad都能捕獲到小面積的降雨。本文模型在預(yù)測(cè)降雨時(shí)由于結(jié)合了更多氣象背景信息,其可以充分關(guān)注到大雨到暴雨的區(qū)域,可以看出預(yù)測(cè)的大雨區(qū)域會(huì)比實(shí)際更大,而在暴雨區(qū)域預(yù)報(bào)地很精準(zhǔn),從這些定性結(jié)果中可以判斷本文模型的有效性和預(yù)報(bào)的高準(zhǔn)確度。
3.3.2 SEVIR數(shù)據(jù)集實(shí)驗(yàn)結(jié)果及分析
在SEVIR數(shù)據(jù)集上在進(jìn)行了模型間對(duì)比實(shí)驗(yàn),包括本文MFPNM、WF-UNet[20]和EF Sat2Rad[21]。SEVIR數(shù)據(jù)集的VIL原始數(shù)據(jù)為1~255的整數(shù),在分析實(shí)驗(yàn)結(jié)果時(shí)轉(zhuǎn)換為實(shí)際的垂直累計(jì)液體值,單位為kg/m2,其遵循如圖6所示的非線性關(guān)系。
在SEVIR數(shù)據(jù)集上各預(yù)報(bào)時(shí)刻和不同降雨閾值水平下的CSI得分與HSS得分如圖7、8所示,圖中thr表示降雨等級(jí)。由圖7、8可知,MFPNM在不同閾值和不同時(shí)間下的CSI和HSS得分均明顯優(yōu)于其他兩個(gè)模型,表明本文模型預(yù)報(bào)性能優(yōu)異。在不同閾值水平下,三個(gè)模型的預(yù)報(bào)性能都隨著預(yù)報(bào)時(shí)間的增加而下降,但是根據(jù)曲線的趨勢(shì)可知,MFPNM隨預(yù)報(bào)時(shí)間延長(zhǎng),得分變化更為平滑穩(wěn)定;反之,WF-UNet和EF Sat2Rad的得分變化波動(dòng)大,這表明了MFPNM的預(yù)報(bào)性能更穩(wěn)定。在預(yù)報(bào)時(shí)間40 min、閾值為0.1和1.4時(shí)可觀察到MFPNM的指標(biāo)顯然更高,這源于其對(duì)序列數(shù)據(jù)長(zhǎng)程關(guān)系的建模能力。
3.4 模型可解釋性分析
可解釋性分析流程如1.3節(jié)所述,SHAP方法計(jì)算得到每個(gè)特征的重要性向量以表征其對(duì)預(yù)測(cè)的貢獻(xiàn)度。為評(píng)價(jià)所得重要性向量是否能客觀反映特征的貢獻(xiàn)度,使用預(yù)訓(xùn)練網(wǎng)絡(luò)得到了對(duì)應(yīng)的顯著圖,可以直觀表現(xiàn)背景變量的不同區(qū)域?qū)τ谀P妥罱K輸出的顯著性或重要性,亮色(如黃色或紅色)表示高重要性,而深的顏色(如藍(lán)色)表示低重要性。如圖9所示,第一行是背景編碼器的輸入及其顯著圖;第二行是模型的預(yù)測(cè)結(jié)果(連續(xù)五個(gè)時(shí)刻),其顯示了降雨的分布范圍與強(qiáng)度變化。顯著圖與背景編碼器的輸入之間具有強(qiáng)相關(guān)性,背景編碼器良好地學(xué)習(xí)到了輸入數(shù)據(jù)的有效特征,而顯著性圖中高亮區(qū)域與降水區(qū)域具有明顯的空間對(duì)應(yīng)關(guān)系,說(shuō)明這些特征在模型中得到了應(yīng)有的關(guān)注,特別是其作為特殊的位置編碼參與Transformer模塊中注意力的計(jì)算,為QPE的預(yù)測(cè)提供了有益的信息。這表明了本文模型作出的降水預(yù)報(bào)是基于模型正確識(shí)別了氣象要素,驗(yàn)證了降水預(yù)測(cè)結(jié)果的可靠性。
4 結(jié)束語(yǔ)
本文以TransUNet模型為基礎(chǔ)提出了基于雙編碼器與內(nèi)容編碼的短臨降水預(yù)報(bào)算法,通過(guò)在降水預(yù)測(cè)過(guò)程中融入更多氣象背景信息,引導(dǎo)模型實(shí)現(xiàn)更為準(zhǔn)確的預(yù)報(bào)。為此,利用我國(guó)第四代靜止衛(wèi)星FY-4B的氣象數(shù)據(jù)制作了一個(gè)包含多種物理要素的短臨降水預(yù)報(bào)數(shù)據(jù)集。在該方法中,采用雙編碼器分別提取降水?dāng)?shù)據(jù)的時(shí)空特征和其他變量的空間特征;通過(guò)內(nèi)容編碼模塊將其他變量特征編碼到降水特征中作為其可學(xué)習(xí)的位置編碼,同時(shí)為其提供更為豐富的氣象背景信息,以解決降水?dāng)?shù)據(jù)稀疏的問(wèn)題。使用SHAP技術(shù)對(duì)模型進(jìn)行了可解釋性分析,其結(jié)果表明本文模型是基于正確理解輸入數(shù)據(jù)而得到合理且可靠的預(yù)測(cè)結(jié)果。通過(guò)與其他現(xiàn)有模型的比較,本文模型的性能優(yōu)越性得到了充分證明。
參考文獻(xiàn):
[1]Marchuk G I.Numerical methods in weather prediction[M].[S.l.]:Academic Press,2012.
[2]Alley R B,Emanuel K A,Zhang Fuqing.Advances in weather prediction[J].Science,2019,363(6425):342-344.
[3]Chen Mingxuan,Wang Yingchun,Yu Xiaoding.Improvement and ap-plication test of TREC algorithm for convective storm nowcast[J].Journal of Applied Meteorological Science,2007,18(5):690-701.
[4]Moral A D,Rigo T,Llasat M C.A radar-based centroid tracking algorithm for severe weather surveillance:identifying split/merge processes in convective systems[J].Atmospheric Research,2018,213:110-120.
[5]Woo W C,Wong W K.Operational application of optical flow techniques to radar-based rainfall nowcasting[J].Atmosphere,2017,8(3):48.
[6]Ayzel G,Heistermann M,Winterrath T.Optical flow models as an open benchmark for radar-based precipitation nowcasting[J].Geoscient-ific Model Development,2019,12(4):1387-1402.
[7]Dhiram K,Wang Zhenhui.Evaluation on radar reflectivity-rainfall rate(Z-R)relationships for Guyana[J].Atmospheric and Climate Sciences,2016,6(4):489-499.
[8]Shi Xingjian,Chen Zhourong,Wang Hao,et al.Convolutional LSTM network:a machine learning approach for precipitation nowcasting[C]//Proc of the 28th International Conference on Neural Information Processing Systems.Cambridge,MA:MIT Press,2015:802-810.
[9]Shi Xingjian,Gao Zhihang,Lausen L,et al.Deep learning for precipitation nowcasting:a benchmark and a new model[C]//Proc of the 31st International Conference on Neural Information Processing Systems.Red Hook,NY:Curran Associates Inc.,2017:5622-5632.
[10]Wang Yunbo,Long Mingsheng,Wang Jianmin,et al.PredRNN:recurrent neural networks for predictive learning using spatiotemporal LSTMs[C]//Proc of the 31st International Conference on Neural Information Processing Systems.Red Hook,NY:Curran Associates Inc.,2017:879-888.
[11]Wang Yunbo,Gao Zhifeng,Long Mingsheng,et al.PredRNN+:towards a resolution of the deep-in-time dilemma in spatiotemporal predictive learning[C]//Proc of the 35th International Conference on Machine Learning.[S.l.]:PMLR,2018,5123-5132.
[12]Wang Yunbo,Jiang Lu,Yang M H,et al.Eidetic 3D LSTM:a model for video prediction and beyond[C/OL]//Proc of the 7th International Conference on Learning Representations.2019.(2019-12-21).https://openreview.net/forum?id=B1lKS2AqtX.
[13]Luo Chuyao,Li Xutao,Wen Yongliang,et al.A novel LSTM model with interaction dual attention for radar echo extrapolation[J].Remote Sensing,2021,13(2):164.
[14]Samsi S,Mattioli C J,Veillette M S.Distributed deep learning for precipitation nowcasting[C]//Proc of the 31st International Conference on Neural Information Processing Systems.Red Hook,NY:Curran Associates Inc.,2019:5622-5632.
[15]Agrawal S,Barrington L,Bromberg C,et al.Machine learning for precipitation nowcasting from radar images[EB/OL].(2019-12-11).https://arxiv.org/abs/1912.12132.
[16]Bihlo A.Precipitation nowcasting using a stochastic variational frame predictor with learned prior distribution[EB/OL].(2019-05-13)[2024-03-09].https://doi.org/10.48550/arXiv.1905.05 037.
[17]Denton R,F(xiàn)ergus R.Stochastic video generation with a learned prior[EB/OL].(2018-03-02).https://arxiv.org/abs/1802.07687.
[18]吳卓升,張巍,林艷,等.動(dòng)態(tài)概率卷積神經(jīng)網(wǎng)絡(luò)在雷達(dá)回波外推中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,2021,38(7):2125-2129.(Wu Zhuosheng,Zhang Wei,Lin Yan,et al.Application of dynamic probability convolutional neural network in radar echo extrapolation[J].Application Research of Computers,2021,38(7):2125-2129.)
[19]潘龍,吳錫.基于雙向Transformer的降水臨近預(yù)報(bào)模型[J/OL].計(jì)算機(jī)應(yīng)用研究.(2024-03-18).https://kns.cnki.net/kcms/detail/51.1196.TP.20240315.0936.001.html.(Pan Long,Wu Xi.Bidirectional Transformer-based precipitation nowcasting model[J/OL].Application Research of Computers.(2024-03-18).https://kns.cnki.net/kcms/detail/51.1196.TP.20240315.0936.001.html.)
[20]Kaparakis C,Mehrkanoon S.WF-UNet:weather data fusion using 3D-UNet for precipitation nowcasting[J].Procedia Computer Science,2023,222:223-232.
[21]Küük ,Giannakos A,Schneider S,et al.Transformer-based nowcasting of radar composites from satellite images for severe weather[EB/OL].(2023-10-30)[2024-03-09].https://doi.org/10.48550/arXiv.2310.19515.
[22]Ivashkin V,Lebedev V.Spatiotemporal data fusion for precipitation nowcasting[EB/OL].(2018-12-28)[2024-03-09].https://doi.org/10.48550/arXiv.1812.10915.
[23]An S.Nowcast-to-forecast:token-based multiple remote sensing data fusion for precipitation forecast[C]//Proc of the 32nd ACM International Conference on Information and Knowledge Management.New York,NY:ACM Press,2023:4495-4501.
[24]Bouget V,Béréziat D,Brajard J,et al.Fusion of rain radar images and wind forecasts in a deep learning model applied to rain nowcasting[J].Remote Sensing,2021,13(2):246.
[25]Mark S V,Siddharth S,Christopher J M.SEVIR:a storm event imagery dataset for deep learning applications in radar and satellite mete-orology[C]//Proc of the 34th International Conference on Neural Information Processing Systems.Red Hook,NY:Curran Associates Inc.,2020:article No.1846.
[26]Li Xilai,Liu Wuyang,Li Xiaosong,et al.Physical perception network and an all-weather multi-modality benchmark for adverse weather image fusion[EB/OL].(2024-02-03)[2024-03-09].https://doi.org/10.48550/arXiv.2402.02090.
[27]Lundberg S M,Lee S I.A unified approach to interpreting model predictions[C]//Proc of the 31st International Conference on Neural Information Processing Systems.Red Hook,NY:Curran Associates Inc.,2017:4768-4777.
收稿日期:2024-01-21
修回日期:2024-03-25
基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(42075142,42130608);國(guó)家重點(diǎn)研發(fā)計(jì)劃資助項(xiàng)目(2020YFA0608000);四川省科技計(jì)劃資助項(xiàng)目(2022YFG0029,2023YFG0101,2024YFG0001);成都信息工程大學(xué)科技創(chuàng)新能力提升計(jì)劃資助項(xiàng)目(KYTD202330)
作者簡(jiǎn)介:陳龍(1997—),男,四川巴中人,碩士,主要研究方向?yàn)樯疃葘W(xué)習(xí)與降雨預(yù)報(bào);彭靜(1991—),女,四川綿陽(yáng)人,講師,博士,主要研究方向?yàn)閳D形圖像處理、分布式計(jì)算優(yōu)化等;胡雪飛(1980—),女,重慶永川人,副研究員,碩士,主要研究方向?yàn)閿?shù)字文旅、文化傳播等;黃占鰲(1993—),男,四川隆昌人,講師,博士,主要研究方向?yàn)樯窠?jīng)網(wǎng)絡(luò)理論與應(yīng)用、不平衡數(shù)據(jù)學(xué)習(xí);李孝杰(1981—),女(通信作者),山東菏澤人,教授,碩導(dǎo),博士,主要研究方向?yàn)闄C(jī)器學(xué)習(xí)、圖像處理與智慧氣象(lixj@cuit.edu.cn).