李宗飛,陳凱華,趙玉娟
(天津市氣象信息中心,天津 300000)
多普勒天氣雷達(dá)在短時(shí)臨近預(yù)報(bào)中起到極其重要的地位,目前較為普遍的應(yīng)用包括降水強(qiáng)度反演,雷達(dá)回波外推,冰雹識(shí)別等[1]。采用雷達(dá)反射率(ZH)進(jìn)行降水強(qiáng)度(I)反演是多普勒雷達(dá)的一項(xiàng)重要應(yīng)用,較為常用的方法是使用Z-I 公式進(jìn)行計(jì)算,可通過理論推算或觀測(cè)數(shù)據(jù)統(tǒng)計(jì)獲得,實(shí)驗(yàn)表明反射率和降水強(qiáng)度成指數(shù)關(guān)系[2-5],如式1 所示。研究表明,Z-I 公式的系數(shù)a 和指數(shù)b 與降水類型存在較為密切的關(guān)系,其中系數(shù)a 波動(dòng)范圍較大,在100~400 之間,如對(duì)流性降水和層狀云降水的系數(shù)a 表現(xiàn)差別較大[6],指數(shù)b 一般在1.0~2.0 之間,所以該方法在不同類型的降水中存在一定的誤差,針對(duì)我國中西部地區(qū)觀測(cè)資料缺乏的現(xiàn)象[7],使用雷達(dá)數(shù)據(jù)進(jìn)行面雨量計(jì)算可以彌補(bǔ)不足。
近年來,人工智能算法得到較好的發(fā)展。人工智能算法中的卷積神經(jīng)網(wǎng)絡(luò)在雷達(dá)回波外推、模式識(shí)別等領(lǐng)域取得較好發(fā)展[8-10]。本文在以上經(jīng)驗(yàn)的基礎(chǔ)上,嘗試采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行雷達(dá)定量估測(cè)降水,完成小時(shí)面雨量的計(jì)算,并選用2D 卷積神經(jīng)網(wǎng)絡(luò)(Conv2D)和U-Net 卷積神經(jīng)網(wǎng)絡(luò)模型分別進(jìn)行計(jì)算。本文通過對(duì)小時(shí)面雨量的計(jì)算來檢驗(yàn)傳統(tǒng)算法、Conv2D 和U-Net 網(wǎng)絡(luò)模型的優(yōu)缺點(diǎn)。
小時(shí)面雨量估計(jì)需要考慮兩個(gè)因素,即時(shí)間和尺度。時(shí)間因素是指降水隨時(shí)間的發(fā)展和變化,雷達(dá)每6min 完成一次全體掃觀測(cè),每小時(shí)11 次數(shù)據(jù)(加首尾觀測(cè)),所以在時(shí)間維度上需要將當(dāng)前小時(shí)的11 次觀測(cè)數(shù)據(jù)都作為原始數(shù)據(jù)進(jìn)行計(jì)算;尺度因素是指不同降水的尺度存在較大差異,如對(duì)流性降水和層狀云降水。對(duì)于傳統(tǒng)算法來說,對(duì)流性降水和層狀云降水的雨強(qiáng)計(jì)算參數(shù)有較大的差異,而對(duì)于神經(jīng)網(wǎng)絡(luò)算法來說,目前并不確定其影響。
傳統(tǒng)算法主要采用Z-I 公式進(jìn)行降水估算,公式中I(mm·h-1)表示小時(shí)雨強(qiáng),Zh(mm6·m-3)為反射率,a、b 分別為系數(shù)和指數(shù)。為了更準(zhǔn)確計(jì)算小時(shí)面雨量,解決以上提出的第一個(gè)問題,本文采用逐時(shí)積分法,如下式(2)所示,Is 為小時(shí)面雨量,Ist 為第t 次觀測(cè)數(shù)據(jù)反演面雨量。
針對(duì)時(shí)間因素,Conv2D 網(wǎng)絡(luò)的輸入通道定義為11 路,作為11 個(gè)觀測(cè)時(shí)次的雷達(dá)掃描數(shù)據(jù)的輸入通道。考慮卷積網(wǎng)絡(luò)的計(jì)算時(shí)間和計(jì)算效果,經(jīng)過多次實(shí)驗(yàn)后確定Conv2D 網(wǎng)絡(luò)的層數(shù)為5。針對(duì)尺度因素,本文采用U-Net 卷積神經(jīng)網(wǎng)絡(luò)與Conv2D 進(jìn)行對(duì)比研究,U-Net 卷積神經(jīng)網(wǎng)絡(luò)通過上下采樣的方法,改變數(shù)據(jù)的空間分辨率,不同分辨率的數(shù)據(jù)對(duì)不同尺度降水有不同的影響,從而實(shí)現(xiàn)不同尺度降水估計(jì)的區(qū)別對(duì)待。
基于以上考慮,設(shè)計(jì)U-net 網(wǎng)絡(luò)模型的輸入通道為11 路,輸出為1 路。為了增加網(wǎng)絡(luò)容量,提高其擬合能力,第一層網(wǎng)絡(luò)首先將11 路通道的輸入升為33 路,然后再進(jìn)入U(xiǎn) 型結(jié)構(gòu),網(wǎng)絡(luò)中包含了兩次下采樣(池化),兩次上采樣,各卷積層輸入輸出及銜接情況如下圖1 所示:
圖1 conv2D 卷積神經(jīng)網(wǎng)絡(luò)(a)、U-net 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(b)
本次實(shí)驗(yàn)使用了兩年的降水?dāng)?shù)據(jù),其中包括了雷達(dá)基數(shù)據(jù)和地面自動(dòng)站降水?dāng)?shù)據(jù)。雷達(dá)數(shù)據(jù)使用基本反射率ZH(dBz),自動(dòng)站數(shù)據(jù)使用過去一小時(shí)降雨量,其中自動(dòng)站小時(shí)降雨量的插值面雨量產(chǎn)品將作為數(shù)據(jù)真值(標(biāo)簽)用于機(jī)器學(xué)習(xí)。
為了避免海上和偏遠(yuǎn)地區(qū)站點(diǎn)稀疏影響插值效果,本次實(shí)驗(yàn)選用北京Z9010 雷達(dá)基數(shù)據(jù),該雷達(dá)站附近自動(dòng)站較為密集,便于降水?dāng)?shù)據(jù)插值。由于雷達(dá)觀測(cè)范圍及高度對(duì)降水估計(jì)影響較大,所以將計(jì)算范圍選擇在雷達(dá)附近150km 范圍內(nèi),地面自動(dòng)站數(shù)據(jù)使用了東經(jīng)114°51′~118°,北緯38°12′~41°21′范圍內(nèi)的數(shù)據(jù),與雷達(dá)數(shù)據(jù)范圍相匹配。
雷達(dá)數(shù)據(jù)使用0.5 度仰角的基本反射率,該仰角更接近地面降水,但是該仰角可能存在地物雜波、晴空回波、微量降水(小于15dBZ)等,基于以上考慮,本文在神經(jīng)網(wǎng)絡(luò)計(jì)算前剔除了小于15dBZ 的雷達(dá)回波。
2.2.1 雷達(dá)數(shù)據(jù)坐標(biāo)轉(zhuǎn)換
因?yàn)榈厍蚴乔蛐危缘孛孀詣?dòng)站是分布在球面上的點(diǎn),以經(jīng)度和緯度表示其位置,而雷達(dá)掃描數(shù)據(jù)是錐形面,采用仰角、方位和距離表示其觀測(cè)位置。為了便于機(jī)器學(xué)習(xí),需要將雷達(dá)數(shù)據(jù)轉(zhuǎn)換到經(jīng)緯度坐標(biāo),與地面數(shù)據(jù)相匹配。
構(gòu)建三維坐標(biāo)系,通過計(jì)算地面觀測(cè)數(shù)據(jù)與雷達(dá)站點(diǎn)的經(jīng)度差Δlon 和緯度差Δlat,利用下面公式,計(jì)算觀測(cè)位置相對(duì)于雷達(dá)的方位角∠A、距離d,式中∠φ 是雷達(dá)仰角,∠θ 為觀測(cè)位置與雷達(dá)站點(diǎn)的地心夾角,利用(3)(4)(5)式實(shí)現(xiàn)雷達(dá)數(shù)據(jù)的坐標(biāo)轉(zhuǎn)換,完成雷達(dá)數(shù)據(jù)到地面數(shù)據(jù)的投影。
雷達(dá)數(shù)據(jù)投影成以經(jīng)緯度為坐標(biāo)的格點(diǎn)數(shù)據(jù),格點(diǎn)精度為0.05°,格點(diǎn)范圍是114°51′E 至118°E經(jīng)度,38°12′N 至41°21′N 緯度,范圍和精度與地面插值數(shù)據(jù)一致。
2.2.2 數(shù)據(jù)插值及歸一化
使用IDW(反距離權(quán)重)插值算法完成地面降水插值,將接近2000 個(gè)站點(diǎn)插值成64×64 格點(diǎn),格點(diǎn)分辨率為0.05°×0.05°,約為5000m。插值使用meteva 函數(shù)庫中interp_sg_idw 函數(shù)實(shí)現(xiàn),臨近點(diǎn)最多使用4 個(gè),函數(shù)當(dāng)中冪次參數(shù)為2。
數(shù)據(jù)歸一化是神經(jīng)網(wǎng)絡(luò)算法計(jì)算的一個(gè)重要環(huán)節(jié),首先歸一化解決了卷積過程中因數(shù)據(jù)過大導(dǎo)致的溢出;第二,數(shù)據(jù)歸一化使不同量級(jí)的輸入數(shù)據(jù)具備了相同的影響能力;第三,數(shù)據(jù)歸一化使激活函數(shù)處于最大梯度區(qū)間,加快了學(xué)習(xí)速率;最后,數(shù)據(jù)歸一化使網(wǎng)絡(luò)系統(tǒng)更加穩(wěn)定[11]。文章將15~65dBZ 的反射率進(jìn)行歸一化(小于15dBZ 舍去),將0~80mm的小時(shí)降雨量進(jìn)行歸一化,因?yàn)槌^80mm 的降水極為稀少,如果以最大值進(jìn)行歸一化將使算法對(duì)頻次更高的中小雨的學(xué)習(xí)變得困難。
使用2018 年汛期降水?dāng)?shù)據(jù)進(jìn)行模型訓(xùn)練,然后使用2019 年汛期的11 個(gè)降水日,共264(11×24)個(gè)小時(shí)降水?dāng)?shù)據(jù)進(jìn)行分析。圖2 是2019 年5 月26 日03 時(shí)小時(shí)面雨量,圖2 中分別是Conv2D 神經(jīng)網(wǎng)絡(luò)產(chǎn)品、U-Net 卷積神經(jīng)網(wǎng)絡(luò)產(chǎn)品、實(shí)況插值產(chǎn)品和Z-I 關(guān)系反演產(chǎn)品。宏觀上看,兩種卷積神經(jīng)網(wǎng)絡(luò)算法在降水強(qiáng)度、位置、面積與實(shí)況插值產(chǎn)品基本一致,但是由于Conv2D 神經(jīng)網(wǎng)絡(luò)未考慮尺度問題,對(duì)較小尺度降水分布細(xì)節(jié)保留不夠,如圖2 中Conv2D反演面雨量有明顯的均化現(xiàn)象,U-Net 對(duì)細(xì)節(jié)的保留比Conv2D 好,且降水中心強(qiáng)度與實(shí)況更為接近。雷達(dá)反演降水的分布細(xì)節(jié)及紋理較為合理,但強(qiáng)度比實(shí)況產(chǎn)品弱,并且因地物原因,雷達(dá)站附近出現(xiàn)強(qiáng)地物回波(圖2(Z-I)中心位置亮點(diǎn)),影響顯示效果。
圖2 Conv2D 網(wǎng)絡(luò)(a)、U-net 網(wǎng)絡(luò)(b)、實(shí)況面雨量(c)和Z-I 公式計(jì)算的面雨量(d)
圖3 為2019 年7 月22 日16 時(shí)的面雨量產(chǎn)品,通過比較實(shí)況產(chǎn)品與Z-I 關(guān)系反演面雨量發(fā)現(xiàn),在雷達(dá)觀測(cè)方位90°左右存在明顯遮擋,并且在雷達(dá)北部受觀測(cè)高度和地形的影響,雷達(dá)觀測(cè)數(shù)據(jù)與實(shí)況數(shù)據(jù)存在一定差異。Conv2D 和U-Net 兩種卷積網(wǎng)絡(luò)計(jì)算面雨量,其位置和降水覆蓋面積比雷達(dá)反演降水有較大改善,U-net 卷積網(wǎng)絡(luò)計(jì)算效果更好,尤其是在降水強(qiáng)度上與實(shí)況更為接近,但仍存在不足。首先,卷積神經(jīng)網(wǎng)絡(luò)為減小整體誤差,對(duì)于尺度較大的降水,中心區(qū)域存在聚攏現(xiàn)象,損失了降水分布細(xì)節(jié),兩種卷積網(wǎng)絡(luò)計(jì)算面雨量降水中心聚攏;其次,同樣為減小整體誤差,部分不連續(xù)降水區(qū)域會(huì)被連接。
圖3 Conv2D 網(wǎng)絡(luò)(a)、U-net 網(wǎng)絡(luò)(b)、實(shí)況插值面雨量(c)和Z-I 公式計(jì)算的面雨量(d)
U-Net 卷積網(wǎng)絡(luò)算法與Conv2D 卷積網(wǎng)絡(luò)算法相比,由于增加了不同分辨率的數(shù)據(jù)處理,在較小尺度降水中會(huì)保留更多的降水分布細(xì)節(jié),如圖2 所示;而在略大尺度的降水中,U-Net 卷積網(wǎng)絡(luò)在反演降水的強(qiáng)度上比Conv2D 卷積網(wǎng)絡(luò)算法更好,如圖3 所示。
同樣以地面降水插值面雨量為參考,對(duì)計(jì)算產(chǎn)品進(jìn)行統(tǒng)計(jì)評(píng)估,參考梁維亮等[12]分量級(jí)統(tǒng)計(jì)思想,現(xiàn)給出4 個(gè)統(tǒng)計(jì)水平,分別是level=(0.1mm,10mm,20mm,30mm),借鑒TS 評(píng)分法給出如下表1 所示分類。因?yàn)榫矸e神經(jīng)網(wǎng)絡(luò)算法輸出產(chǎn)品增加了接近0.5的背景噪聲,需要額外去除,針對(duì)卷積神經(jīng)網(wǎng)絡(luò)算法,只統(tǒng)計(jì)大于0.5mm 的雨量。
表1 評(píng)分統(tǒng)計(jì)分類
根據(jù)TS 評(píng)分標(biāo)準(zhǔn),定義準(zhǔn)確率等于(A+D)/(A+B+C+D),擊中率等于A/(A+C),漏報(bào)率等于C/(A+C),空?qǐng)?bào)率等于B/(A+B),虛警率等于B/(B+D)。以此標(biāo)準(zhǔn)對(duì)四種反演效果進(jìn)行評(píng)估,得到表2所示結(jié)果。該結(jié)果表明,普通Conv2D 網(wǎng)絡(luò)反演效果在各個(gè)參數(shù)上都表現(xiàn)最差,U-Net 卷積網(wǎng)絡(luò)與Z-I關(guān)系法相近,其中Z-I 關(guān)系法在參數(shù)調(diào)整后各參數(shù)表現(xiàn)存在差異。所以,Z-I 關(guān)系法參數(shù)的選取,需要根據(jù)降水情況調(diào)整,而卷積神經(jīng)網(wǎng)絡(luò)因平均和聚攏作用使其對(duì)降水分布的細(xì)節(jié)以及降水邊界處理不夠好,但通過調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),具備改進(jìn)的可能,如UNet 效果強(qiáng)于Conv2D 的效果。
表2 四種計(jì)算方法的評(píng)分統(tǒng)計(jì)結(jié)果(單位:%)
通過對(duì)不同降水強(qiáng)度進(jìn)行分級(jí)統(tǒng)計(jì),得到表3所示結(jié)果,在大于10mm 強(qiáng)度等級(jí)的統(tǒng)計(jì)結(jié)果中U-Net 表現(xiàn)最好,Conv2D 表現(xiàn)次之,Z-I 關(guān)系法表現(xiàn)最差。
表3 四種計(jì)算方法不同降水強(qiáng)度的評(píng)分統(tǒng)計(jì)結(jié)果(單位:%)
為了更好的比較反演效果,本文給出了宏觀層面的參數(shù)統(tǒng)計(jì),分別是等效中心P、覆蓋面積S、平均強(qiáng)度E 三個(gè)參數(shù),分別由下式(6)(7)(8)表示,M和N 表示水平格點(diǎn)數(shù)和垂直格點(diǎn)數(shù),x,y 表示坐標(biāo)位置,Ixy 表示(x,y)位置的小時(shí)降水量,式(6)中Px表示水平方向的等效中心,Py 表示垂直方向的等效中心。式(7)(8)中i 是卷積神經(jīng)網(wǎng)絡(luò)算法輸出產(chǎn)品的背景噪聲,在本次實(shí)驗(yàn)中i 為0.5。
通過對(duì)宏觀參數(shù)的統(tǒng)計(jì)得到表4 所示數(shù)據(jù)。首先從等效中心誤差進(jìn)行分析,四種方法與實(shí)況插值數(shù)據(jù)差別不大。然后從覆蓋面積誤差來看,Conv2D和Z-I(a=200,b=1.5)的誤差最大,Conv2D 卷積神經(jīng)網(wǎng)絡(luò)由于存在平均和背景噪聲現(xiàn)象,使其面積增大,Z-I(a=200,b=1.5)方法是因?yàn)榇罅课葱纬山邓娜趸夭ū挥?jì)算在內(nèi),導(dǎo)致面積增大。最后從平均強(qiáng)度來看,Z-I(a=300,b=1.4)存在嚴(yán)重低估現(xiàn)象,另三種方法表現(xiàn)較好。從整體效果來看,U-net 卷積網(wǎng)絡(luò)算法表現(xiàn)最好。
表4 四種計(jì)算方法的宏觀統(tǒng)計(jì)誤差(%)
對(duì)比人工智能方法和傳統(tǒng)算法在雷達(dá)反演面雨量上的效果,可以看出卷積神經(jīng)網(wǎng)絡(luò)算法可以實(shí)現(xiàn)雷達(dá)面雨量估計(jì),并且通過優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),調(diào)整網(wǎng)絡(luò)參數(shù),使算法的反演效果可以得到提升,例如U-Net卷積神經(jīng)網(wǎng)絡(luò)比普通Conv2D 網(wǎng)絡(luò)效果略好,但是卷積神經(jīng)網(wǎng)絡(luò)為了減小平均誤差,出現(xiàn)了平均和聚攏的現(xiàn)象,所以降水分布細(xì)節(jié)不如傳統(tǒng)算法效果好。
通過對(duì)各類算法評(píng)分參數(shù)對(duì)比,傳統(tǒng)算法在準(zhǔn)確率、擊中率等統(tǒng)計(jì)評(píng)分中表現(xiàn)較好,U-Net 卷積網(wǎng)絡(luò)居中,Conv2D 卷積算法最差,但在分量級(jí)參數(shù)統(tǒng)計(jì)中U-Net 表現(xiàn)效果最好,表明U-Net 卷積網(wǎng)絡(luò)在面雨量估計(jì)中存在一定優(yōu)勢(shì)。
宏觀統(tǒng)計(jì)參數(shù)對(duì)比表明U-Net 卷積神經(jīng)網(wǎng)絡(luò)算法整體效果最好,傳統(tǒng)算法通過對(duì)其參數(shù)調(diào)整,發(fā)現(xiàn)平均強(qiáng)度和覆蓋面積存在一定矛盾,表明該算法為同時(shí)滿足面積和強(qiáng)度上的要求需要進(jìn)一步改進(jìn)。
綜上所述,人工智能的方法與傳統(tǒng)算法各有優(yōu)劣,人工智能算法通過調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)存在優(yōu)化空間,后期可通過增加格點(diǎn)密度或者改善網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)一步實(shí)驗(yàn),本次實(shí)驗(yàn)受計(jì)算資源限制,未完成此內(nèi)容。而傳統(tǒng)算法同樣存在一定的局限性,需要根據(jù)其降水強(qiáng)度的不同調(diào)整相應(yīng)參數(shù)。