尹麒名 甘建紅 漆慧 胡文東 張瑩 黎仁國(guó) 唐旺
(1 成都信息工程大學(xué),成都 610200; 2 西華師范大學(xué),南充 637002)
雷達(dá)回波圖像外推可視為對(duì)時(shí)間序列圖像變化趨勢(shì)的估計(jì)和預(yù)測(cè),即用“現(xiàn)在”之前的一段時(shí)間內(nèi)雷達(dá)回波圖像預(yù)測(cè)“未來(lái)”一定時(shí)間內(nèi)的雷達(dá)回波圖像。這項(xiàng)工作在氣象領(lǐng)域稱為雷達(dá)預(yù)測(cè)外推或直接稱為雷達(dá)外推。臨近預(yù)報(bào)通常是指對(duì)未來(lái)0~2 h內(nèi)的天氣預(yù)報(bào),臨近強(qiáng)降水預(yù)報(bào)目標(biāo)是準(zhǔn)確、及時(shí)地預(yù)報(bào)未來(lái)0~2 h內(nèi)區(qū)域降水強(qiáng)度和分布[1],較短時(shí)預(yù)報(bào)、短期預(yù)報(bào)、中期預(yù)報(bào)而言更具有挑戰(zhàn)性,雷達(dá)回波外推結(jié)果能為臨近降水預(yù)報(bào)提供直觀的雷達(dá)圖象參考,是臨近預(yù)報(bào)主要參考?xì)庀筚Y料之一[2],如何快速、準(zhǔn)確地外推出氣象雷達(dá)圖像序列已成為氣象領(lǐng)域研究的熱點(diǎn)之一。
雷達(dá)回波外推目的是指根據(jù)氣象雷達(dá)圖象預(yù)測(cè)“未來(lái)”的雷達(dá)圖象,確定回波的強(qiáng)度分布、回波體的移動(dòng)速度和方向,進(jìn)而分析強(qiáng)回波相關(guān)狀態(tài)生成、發(fā)展、消亡的過程。傳統(tǒng)基于形態(tài)學(xué)的雷達(dá)回波外推技術(shù)主要有單體質(zhì)心法[3]和交叉相關(guān)法[4]。單體質(zhì)心法是簡(jiǎn)化目標(biāo),適用于較大目標(biāo)跟蹤預(yù)報(bào),當(dāng)雷達(dá)回波比較零散或出現(xiàn)合并、分裂現(xiàn)象時(shí),外推預(yù)報(bào)的準(zhǔn)確度會(huì)受到很大影響[5]。交叉相關(guān)法是選取兩個(gè)連續(xù)時(shí)次的空間優(yōu)化相關(guān)系數(shù)建立擬合關(guān)系,對(duì)于回波變化較為快速的強(qiáng)對(duì)流天氣過程,很難保證外推追蹤的精度,外推效果將會(huì)降低[6]。光流法由Gibson于1950提出[7],在圖像和視頻處理領(lǐng)域光流法常用于運(yùn)動(dòng)矢量估計(jì),正是具有能捕捉運(yùn)動(dòng)信息的功能,近年來(lái)光流法也應(yīng)用于多普勒天氣雷達(dá)回波圖像外推[8-12]。光流法本質(zhì)是利用相鄰兩個(gè)圖像估計(jì)運(yùn)動(dòng)矢量,在時(shí)間域內(nèi)沒有充分利用更長(zhǎng)時(shí)間上圖像信息。
陳家慧等[13]將BP人工神經(jīng)網(wǎng)絡(luò)應(yīng)用于回波圖象外推,神經(jīng)網(wǎng)絡(luò)通過“學(xué)習(xí)”掌握了一定的規(guī)律,得到了較高準(zhǔn)確度的外推結(jié)果,但是BP網(wǎng)絡(luò)輸入特征需要通過特征工程手工方式獲取,所獲取特征的質(zhì)量對(duì)外推結(jié)果影響很大。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)中近幾年發(fā)展最為迅速的領(lǐng)域,在圖像識(shí)別、自然語(yǔ)言處理、決策分析等領(lǐng)域表現(xiàn)出優(yōu)良的性能。雷達(dá)回波圖像外推本質(zhì)上是時(shí)間序列數(shù)據(jù)預(yù)測(cè),目前深度學(xué)習(xí)中的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)模型和長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)模型[14-16]是解決時(shí)序問題的有效模型。
施行健改進(jìn)全連接FC-LSTM(Fully Connected LSTM)深度學(xué)習(xí)模型提出了基于卷積運(yùn)算的長(zhǎng)短記憶模型(ConvLSTM)[17]和TrajGRU模型[18],在雷達(dá)回波圖像外推試驗(yàn)中效果得到明顯提升,其中ConvLSTM模型是針對(duì)FC-LSTM沒有考慮空間相關(guān)性而將卷積應(yīng)用于模型“輸入到狀態(tài)”和“狀態(tài)到狀態(tài)”計(jì)算改進(jìn)模型,去除了大量空間冗余數(shù)據(jù),該模型從輸入到狀態(tài)以及狀態(tài)到狀態(tài)的轉(zhuǎn)換中都具有卷積結(jié)構(gòu),通過堆疊多個(gè)ConvLSTM層形成編碼預(yù)測(cè)網(wǎng)絡(luò)結(jié)構(gòu),構(gòu)建用于臨近預(yù)報(bào)的端到端訓(xùn)練模型。但是ConvLSTM的卷積尺寸固定且不會(huì)隨空間位置變化而變化,施行健進(jìn)一步改進(jìn)得到TrajGRU模型,該模型可以主動(dòng)學(xué)習(xí)循環(huán)連接中的位置變量結(jié)構(gòu),比ConvLSTM更靈活。文獻(xiàn)[17]將ConvLSTM與兩種基于光流的外推算法(ROVER及其非線性變體)進(jìn)行試驗(yàn)對(duì)比,光流法中首先對(duì)輸入圖像進(jìn)行非線性變化,然后計(jì)算基于變化圖像的運(yùn)動(dòng)矢量場(chǎng)。試驗(yàn)結(jié)果均表明,基于作者改進(jìn)后的循環(huán)網(wǎng)絡(luò)深度學(xué)習(xí)模型外推效果優(yōu)于傳統(tǒng)光流法。
針對(duì)雷達(dá)回波圖像的外推領(lǐng)域,本文從兩個(gè)方面進(jìn)行了改進(jìn):①對(duì)錯(cuò)報(bào)、漏報(bào)的像素給以不同的權(quán)重改進(jìn)損失函數(shù);②增加更多高度層數(shù)據(jù)作為深度學(xué)習(xí)模型輸入,以反應(yīng)空間中上下層空間的相關(guān)性。該改進(jìn)方法具有一定的通用性,能應(yīng)用于ConvLSTM模型和TrajGRU模型進(jìn)行改進(jìn)。試驗(yàn)證明,進(jìn)行算法改進(jìn)后的雷達(dá)外推圖像更為清晰準(zhǔn)確。
長(zhǎng)短期記憶網(wǎng)絡(luò)作為一種特殊的RNN結(jié)構(gòu),已經(jīng)證明在處理各種長(zhǎng)期依賴性問題(Long Term Dependency)中具有很好的穩(wěn)健性和高性能[19]。LSTM中引入了3個(gè)門函數(shù):輸入門、遺忘門和輸出門來(lái)控制輸入值、記憶值和輸出值。而GRU模型中只有兩個(gè)門,分別是更新門和重置門。由圖1可以看出它與LSTM記憶塊的區(qū)別在于:它只有一個(gè)重置門單元和一個(gè)更新門單元,不含記憶和遺忘門單元。圖1為L(zhǎng)STM與GRU的具體結(jié)構(gòu)。
圖1 ConvLSTM與TrajGRU結(jié)構(gòu)(xt為t時(shí)刻的輸入,Ct-1和Ct為上一個(gè)單元輸出的單元狀態(tài)(cell state),ht-1和ht分別為前一個(gè)單元輸出隱藏狀態(tài)(hidden state)和當(dāng)前單元輸出隱藏狀態(tài)。 σ是輸出范圍為[0,1]的logistic sigmoid函數(shù),tanh是輸出范圍為[-1,1]的雙曲正切函數(shù))
ConvLSTM和TrajGRU是目前用深度學(xué)習(xí)方法進(jìn)行雷達(dá)回波圖像外推研究的常用參考模型,是多輸入多輸出的“編碼-預(yù)測(cè)”模型,為了便于敘述,本節(jié)中的模型輸入只有兩個(gè)時(shí)刻的數(shù)據(jù),同樣,輸出也只考慮兩個(gè)時(shí)刻的數(shù)據(jù),即輸入和輸出都只有兩個(gè)時(shí)刻的數(shù)據(jù),模型結(jié)構(gòu)如圖2所示。
圖2 編碼-預(yù)測(cè)模型(其中I1和I2為輸入圖像,I3和I4為輸出圖像(即預(yù)測(cè)外推圖像),h為隱藏狀態(tài),RNNCells表示RNN的單元)
RNNCells內(nèi)可以是多層ConvLSTM或多層TrajGRU,該模型前部分實(shí)現(xiàn)了I1和I2的編碼。ConvLSTM將LSTM所有點(diǎn)乘計(jì)算都換成卷積操作,算法中編碼、預(yù)測(cè)網(wǎng)絡(luò)都是通過堆疊多個(gè)ConvLSTM層形成,如圖3所示。
圖3 ConvLSTM網(wǎng)絡(luò)結(jié)構(gòu)
在捕獲數(shù)據(jù)時(shí)空相關(guān)性方面,ConvLSTM的不足之處比較明顯,它的連接結(jié)構(gòu)和權(quán)重對(duì)于所有位置都是固定的。而TrajGRU的連接結(jié)構(gòu)是動(dòng)態(tài)的,TrajGRU的參數(shù)數(shù)量更少,模型可以更有效的使用參數(shù)。圖4是對(duì)圖2進(jìn)一步具體描述TrajGRU模型的編碼解碼預(yù)測(cè)網(wǎng)絡(luò)結(jié)構(gòu),該結(jié)構(gòu)使用3個(gè)RNN結(jié)構(gòu),其中空間坐標(biāo)G被拼接到輸入幀以確保網(wǎng)絡(luò)具有空間位置信息。模型中采用經(jīng)典的均方誤差(mean square error MSE)損失函數(shù)。
圖4 TrajGRU網(wǎng)絡(luò)結(jié)構(gòu)
文獻(xiàn)[17][18]中試驗(yàn)已經(jīng)證明TrajGRU模型比ConvLSTM模型更能有效地捕獲時(shí)空相關(guān)性,在天氣雷達(dá)回波圖像外推中TrajGRU具有更好的效果。本文對(duì)TrajGRU模型進(jìn)行了兩個(gè)方面改進(jìn):首先,在損失函數(shù)中對(duì)外推圖像中的錯(cuò)報(bào)、漏報(bào)、誤報(bào)情況分別考慮,計(jì)算MSE時(shí)使用不同權(quán)重;其次,增加一個(gè)高度的圖像數(shù)據(jù)作為輸入,每個(gè)高度層數(shù)據(jù)使用獨(dú)立的TrajGRU模型,兩個(gè)高度層的損失函數(shù)計(jì)算權(quán)重和作為整個(gè)模型的損失函數(shù)。
TrajGRU采用的損失函數(shù)為MSE損失函數(shù)(即均方損失函數(shù)),均方誤差MSE是指參數(shù)估計(jì)值與參數(shù)真值之差平方的期望值,如式(1)所示。
在當(dāng)前市場(chǎng)競(jìng)爭(zhēng)相對(duì)激烈的環(huán)境和條件下,醫(yī)院各層領(lǐng)導(dǎo)者在經(jīng)營(yíng)意識(shí)和成本理念中仍無(wú)法跟上時(shí)代發(fā)展的腳步,普遍存在著重醫(yī)療而輕管理、重收入而輕支出和重投入而輕效益等問題。醫(yī)院現(xiàn)在都在實(shí)行預(yù)算會(huì)計(jì)的相關(guān)制度,而財(cái)務(wù)人員卻缺乏有關(guān)成本核算的知識(shí)和理念,體現(xiàn)在管理機(jī)制和模式上就是比較重視業(yè)務(wù)部門的成本核算,而忽視了管理部門的成本核算。在管理部門或管理工作中存在著粗放式的成本核算管理制度,使管理者在成本核算時(shí)產(chǎn)生了一定的誤導(dǎo)和偏差,最終導(dǎo)致管理者在管理決策上出現(xiàn)失誤,從而影響到醫(yī)院的可持續(xù)發(fā)展。
(1)
為了提高對(duì)錯(cuò)報(bào)、漏報(bào)的重視程度,構(gòu)造損失函數(shù)時(shí)對(duì)錯(cuò)報(bào)、漏報(bào)、準(zhǔn)報(bào)區(qū)域像素給以不同的權(quán)重。示意圖如圖5所示,圖中橢圓形表示有回波區(qū)域,設(shè)圖5a表示雷達(dá)實(shí)況圖像數(shù)據(jù),圖5b為模型外推結(jié)果,將兩張圖重疊在一起如圖5c所示。模型外推結(jié)果和實(shí)況值之間必然存在不同程度的差異,因此,外推結(jié)果圖像中回波區(qū)域與實(shí)況圖像中回波區(qū)域有重合部分,也有未重合部分。
圖5 錯(cuò)報(bào)漏報(bào)示意:(a)實(shí)況,(b)模型外推,(c)實(shí)況疊加模型外推
本算法將完全重疊部分A區(qū)域稱為準(zhǔn)報(bào)區(qū)域,將B區(qū)域稱為漏報(bào)區(qū)域(既未能預(yù)測(cè)到的部分),C區(qū)域稱為錯(cuò)報(bào)區(qū)域(即預(yù)測(cè)錯(cuò)誤的部分)。這樣逐點(diǎn)計(jì)算損失值就不再是單純的像素值相減,在錯(cuò)報(bào)與漏報(bào)處的像素點(diǎn)計(jì)算損失值之前加上一個(gè)權(quán)重w,公式為:
(2)
通常天氣雷達(dá)一個(gè)體掃需要6 min,一個(gè)體掃包含多個(gè)仰角數(shù)據(jù),在應(yīng)用中會(huì)轉(zhuǎn)換為多個(gè)高度層圖像。大氣流體運(yùn)動(dòng)變化過程是在三維空間中進(jìn)行,任意一個(gè)高度層與附近的高度層具有很強(qiáng)的相關(guān)性,因此,為了解決只有一層雷達(dá)回波圖像外推的局限性,本文將在每一個(gè)時(shí)刻輸入相鄰多個(gè)高度層回波圖像。
試驗(yàn)數(shù)據(jù)包括成都站雷達(dá)數(shù)據(jù)、岳陽(yáng)站雷達(dá)數(shù)據(jù)和CIKM AnalytiCup 2017公開數(shù)據(jù)集。本文首先在Visual Studio 2015中編寫C++程序?qū)D像轉(zhuǎn)化為只有一個(gè)通道的灰度圖,然后用深度學(xué)習(xí)模型進(jìn)行外推。深度學(xué)習(xí)模型采用Pytorch 0.4.1在Pycharm中實(shí)現(xiàn)。
表1為ConvLSTM模型與TrajGRU模型預(yù)測(cè)外推結(jié)果對(duì)比。其中,第1行是預(yù)測(cè)時(shí)刻,第2行為ConvLSTM預(yù)測(cè)外推結(jié)果,第3行為TrajGRU模型預(yù)測(cè)外推結(jié)果,第4行為實(shí)況圖像。試驗(yàn)中,模型迭代40次,學(xué)習(xí)率0.0001,訓(xùn)練集有500個(gè)圖像序列。從表1可知,隨著外推時(shí)刻的增加,圖像質(zhì)量變得越加模糊,細(xì)節(jié)減少,但是就TrajGRU而言,圖像模糊的程度減少較小,可見TrajGRU模型比ConvLSTM模型更優(yōu),與文獻(xiàn)[11][12]結(jié)果一致。從試驗(yàn)結(jié)果可知,TrajGRU模型比ConvLSTM模型外推結(jié)果好,因此,本研究將改進(jìn)方法應(yīng)用于TrajGRU進(jìn)行改進(jìn)并與TrajGRU進(jìn)行比較分析。
表1 ConvLSTM與TrajGRU模型對(duì)比
表1~5中1,2,3,4,5,6,7分別表示預(yù)測(cè)估計(jì)的連續(xù)且具有先后順序7個(gè)時(shí)刻回波圖像編號(hào)。
表2 TrajGRU模型修改損失函數(shù)對(duì)比
表3為針對(duì)TrajGRU模型只增加輸入圖象層數(shù)而不考慮錯(cuò)報(bào)、漏報(bào)權(quán)重變化的結(jié)果對(duì)比。采用1層輸入的深度學(xué)習(xí)網(wǎng)絡(luò)和采用2層輸入深度學(xué)習(xí)網(wǎng)絡(luò)參數(shù)相同:循環(huán)次數(shù)100次,每層訓(xùn)練數(shù)據(jù)集包含1000個(gè)雷達(dá)圖像序列,學(xué)習(xí)率為0.0001。從表3中可以看出,使用兩層回波圖像獲取圖像特征的能力更強(qiáng),右下角小塊回波保留得更好,而只輸入1層的結(jié)果中右下角回波圖未能很好保持。試驗(yàn)結(jié)果中迭代次數(shù)相同,輸入兩層回波圖像結(jié)果對(duì)紋理細(xì)節(jié)保持要差一些,存在欠擬合現(xiàn)象,可增加迭代次數(shù)增加訓(xùn)練樣本提高細(xì)節(jié)保持能力。
表3 增加輸入層數(shù)結(jié)果對(duì)比
為了驗(yàn)證改進(jìn)后的模型對(duì)真實(shí)雷達(dá)回波數(shù)據(jù)的有效性,將模型應(yīng)用于2018年7—9月成都雷達(dá)數(shù)據(jù)進(jìn)行試驗(yàn)。經(jīng)過一定脫敏等預(yù)處理并轉(zhuǎn)化為灰度圖后作為模型的輸入。試驗(yàn)采用參數(shù)為:循環(huán)次數(shù)40次,訓(xùn)練集包含2000個(gè)雷達(dá)圖像序列,共14000幅雷達(dá)圖像,學(xué)習(xí)率為0.0001。用于測(cè)試的數(shù)據(jù)為2018年7月2日08:00—08:42,共7幅圖像,表4為外推預(yù)測(cè)圖象與真實(shí)實(shí)況圖像的對(duì)比,結(jié)果表明修改后的TrajGRU模型對(duì)圖像細(xì)節(jié)保持較好,與真實(shí)圖像數(shù)據(jù)一致性較好。
表4 真實(shí)雷達(dá)數(shù)據(jù)方面對(duì)比
為了驗(yàn)證模型改進(jìn)的有效性,將成都雷達(dá)數(shù)據(jù)訓(xùn)練的模型應(yīng)用于岳陽(yáng)2018年4月29日雷達(dá)圖象進(jìn)行外推,表5為本文方法預(yù)測(cè)外推結(jié)果、TrajGRU外推結(jié)果、實(shí)況數(shù)據(jù)3者的對(duì)比??梢钥闯?,對(duì)于強(qiáng)對(duì)流天氣現(xiàn)象,改進(jìn)后的TrajGRU模型仍然能夠較好地保持圖像細(xì)節(jié),與實(shí)況數(shù)據(jù)基本保持一致。該試驗(yàn)證明,對(duì)于強(qiáng)對(duì)流雷達(dá)回波,改進(jìn)后的TrajGRU模型在強(qiáng)對(duì)流天氣下也能得到很好的外推效果。
表5 強(qiáng)對(duì)流雷達(dá)數(shù)據(jù)預(yù)測(cè)
試驗(yàn)中采用連續(xù)7個(gè)時(shí)刻的雷達(dá)圖像外推后續(xù)7個(gè)時(shí)刻的雷達(dá)圖像,由于氣象雷達(dá)是每6 min完成一次體掃,此處相鄰兩個(gè)時(shí)刻時(shí)間間隔為6 min,即用42 min內(nèi)的圖像外推其后的42 min內(nèi)7個(gè)時(shí)刻的圖像。為了便于敘述,設(shè)預(yù)測(cè)的第1個(gè)6 min時(shí)刻為t1,預(yù)測(cè)的第2個(gè)6 min時(shí)刻為t2,依此類推,第7個(gè)6 min為t7。
圖像相減的差值常用于描述圖像的相似程度,據(jù)此,對(duì)于每個(gè)預(yù)測(cè)時(shí)刻(ti=1,2,3,4,5,6,7),將100個(gè)預(yù)測(cè)圖與對(duì)應(yīng)時(shí)刻實(shí)測(cè)雷達(dá)圖像相減并取絕對(duì)值,該100個(gè)絕對(duì)值的平均值一定程度上反應(yīng)了預(yù)測(cè)的準(zhǔn)確程度,記為TD,計(jì)算公式如式(11)所示。
(11)
圖6~9中橫坐標(biāo)1、2、3、4、5、6、7分別表示t1、t2、t3、t4、t5、t6、t7時(shí)刻,縱坐標(biāo)為按照式(11)計(jì)算的值。4個(gè)圖中柱狀圖隨著時(shí)間的推移,TD值總體呈上升趨勢(shì),表明在時(shí)間維度上,預(yù)測(cè)外推過程中誤差逐漸變大,時(shí)間上越靠后準(zhǔn)確度越低。
圖6和圖7分別是TrajGRU和ConvLSTM模型進(jìn)行錯(cuò)報(bào)、漏報(bào)損失函數(shù)修改結(jié)果對(duì)比,結(jié)果表明,修改了損失函數(shù)后,預(yù)測(cè)結(jié)果更加準(zhǔn)確。
圖6 TrajGRU模型損失函數(shù)(TD)改進(jìn)前后對(duì)比
圖7 ConvLSTM模型損失函數(shù)(TD)改進(jìn)前后對(duì)比
圖8中試驗(yàn)結(jié)果表明TrajGRU在時(shí)間維度上魯棒性更好,整體預(yù)測(cè)外推性能也更優(yōu),因此,本文對(duì)于增加預(yù)測(cè)外推輸入雷達(dá)層數(shù)的試驗(yàn)選擇在TrajGRU中進(jìn)行,結(jié)果如圖9所示,增加輸入雷達(dá)層數(shù),圖像預(yù)測(cè)外推結(jié)果明顯提高,而且越近的時(shí)刻效果越加明顯。
圖8 TrajGRU與ConvLSTM模型對(duì)比
圖9 TrajGRU模型1層數(shù)據(jù)與2層數(shù)據(jù)對(duì)比
本文研究了現(xiàn)有基于深度學(xué)習(xí)的氣象雷達(dá)圖像外推模型,對(duì)ConvLSTM模型與TrajGRU模型進(jìn)行了分析。選擇了TrajGRU模型為主要研究對(duì)象,在該模型的基礎(chǔ)之上做出算法改進(jìn)。針對(duì)成都雷達(dá)、岳陽(yáng)雷達(dá)數(shù)據(jù)和CIKM AnalytiCup 2017競(jìng)賽數(shù)據(jù)集進(jìn)行試驗(yàn),得出以下結(jié)論:
TrajGRU模型處理時(shí)空相關(guān)性方面效果優(yōu)于ConvLSTM。改進(jìn)的TrajGRU模型能更準(zhǔn)確地捕獲雷達(dá)圖片的時(shí)空相關(guān)性,并且圖像質(zhì)量進(jìn)一步提高。改進(jìn)模型的外推結(jié)果圖像能夠更好保持圖像細(xì)節(jié),雷達(dá)回波分布更接近真實(shí)雷達(dá)掃描圖像。目前深度學(xué)習(xí)讓雷達(dá)外推得到了很大地提升,但是距離真實(shí)實(shí)況圖像仍有一定的距離,在后續(xù)研究中可考慮更多的氣象要素納入外推模型,充分反應(yīng)時(shí)空特性和相關(guān)性,充分反應(yīng)云和降水的微物理過程。