国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于卷積神經(jīng)網(wǎng)絡(luò)的雷電臨近預(yù)警模型*

2021-04-20 00:38:40張燁方馮真禎
氣象 2021年3期
關(guān)鍵詞:格點雷電預(yù)警

張燁方 馮真禎 劉 冰

1 福建省災(zāi)害天氣重點實驗室,福州 350001 2 福建省氣象災(zāi)害防御技術(shù)中心,福州 350001

提 要: 從研究人工智能雷電臨近預(yù)警模型的目的出發(fā),以卷積神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ),結(jié)合多個時間序列的雷達(dá)產(chǎn)品(組合反射率、液態(tài)水含量、回波頂高)與閃電數(shù)據(jù),對雷電臨近預(yù)報方法進(jìn)行基于卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的應(yīng)用,以福建省2017—2018年雷達(dá)、閃電數(shù)據(jù)為樣本完成了模型的訓(xùn)練與預(yù)測研究。訓(xùn)練結(jié)果顯示,15~30 min模型訓(xùn)練樣本測試集準(zhǔn)確率為0.798 5;選取福建省2019年20個雷電過程驗證分析表明,15~30 min模型對動力抬升型雷電過程預(yù)警TS評分為0.716,夏季局地?zé)崂妆╊A(yù)警TS評分為0.694,與常規(guī)采用雷達(dá)、閃電閾值控制的雷電預(yù)警算法相比,準(zhǔn)確率有一定的提高,具有一定的實踐意義。

引 言

人工智能是近幾年來發(fā)展特別迅速的一門科學(xué)技術(shù),普遍被認(rèn)為是下一場科技革命的生產(chǎn)力代表,2017年8月國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,提出了面向2030年我國新一代人工智能發(fā)展的戰(zhàn)略目標(biāo)。逐步推進(jìn)氣象業(yè)務(wù)工作與人工智能技術(shù)的對接,拓展未發(fā)掘的預(yù)報模式,滿足多角度氣象專業(yè)服務(wù)需求,是實現(xiàn)氣象工作自動化、智能化、現(xiàn)代化的重要途徑。

我國在20世紀(jì)90年代初已開始?xì)庀箢I(lǐng)域人工智能方面的預(yù)報研究,如中國氣象局在“八五”期間就成立了《人工智能、模式識別在天氣預(yù)報業(yè)務(wù)中的應(yīng)用》課題項目,運(yùn)用神經(jīng)網(wǎng)絡(luò)模式對暴雨預(yù)報進(jìn)行試驗(王寶榮,1993)。進(jìn)入21世紀(jì)后,國內(nèi)出現(xiàn)更多基于機(jī)器學(xué)習(xí)的氣象人工智能研究,如賀佳佳等(2017)采用支持向量機(jī)(SVM)開展局部短時臨近降雨預(yù)測研究;孫全德等(2019)對數(shù)值天氣預(yù)報模式ECMWF預(yù)測的華北地區(qū)近地面10 m 風(fēng)速進(jìn)行訂正,指出三種機(jī)器學(xué)習(xí)算法的訂正效果均好于傳統(tǒng)訂正方法模式輸出統(tǒng)計〈MOS〉的結(jié)果;熊亞軍等(2015)利用KNN(KNearest Neighbor)數(shù)據(jù)挖掘算法構(gòu)建等級預(yù)報分類器,開展霾等級客觀識別實驗;陳勇偉等(2013)、趙旭寰等(2009)使用BP(back propagation)神經(jīng)網(wǎng)絡(luò)模型,選用7個對流參數(shù)對雷暴活動進(jìn)行潛勢預(yù)報。

在雷電臨近預(yù)警領(lǐng)域,目前主要是使用雷達(dá)組合反射率、液態(tài)水含量、回波頂高、閃電數(shù)據(jù)進(jìn)行預(yù)警,如:張其林等(2010)對閃電發(fā)生進(jìn)行高密度區(qū)域識別并外推,得出雷電預(yù)警產(chǎn)品;呂偉濤等(2009)借鑒美國NCAR的TITAN(Thunderstorm Identification,Tracking,Analysis,and Nowcasting)算法對雷達(dá)數(shù)據(jù)進(jìn)行重點區(qū)域識別與外推,研究格點雷電發(fā)生概率;秦微等(2016)在深圳地區(qū)采用TITAN算法對某次強(qiáng)風(fēng)暴過程中的強(qiáng)回波區(qū)進(jìn)行分析,得出該算法識別效果理想的結(jié)果;劉維成等(2015)對甘肅中部雷達(dá)回波單體與雷電活動之間的對應(yīng)關(guān)系進(jìn)行分析,得出回波強(qiáng)度、回波頂高、垂直累積液態(tài)含水量與雷電發(fā)生的閾值關(guān)系,并根據(jù)該結(jié)論建立了雷電預(yù)警方案;常越等(2010)對湖南省閃電的發(fā)生和雷達(dá)關(guān)系進(jìn)行研究,認(rèn)為閃電發(fā)生與回波強(qiáng)度、回波頂高、速度場特征、垂直液態(tài)含水量等有著密切的關(guān)系;此外還有研究使用衛(wèi)星、探空、大氣電場等數(shù)據(jù)對雷電預(yù)警關(guān)系進(jìn)行分析。國外在雷電臨近預(yù)警研究方面,Hondl and Eilts(1994)根據(jù)雷暴發(fā)展到不同高度層的回波特征與閾值進(jìn)行短時臨近預(yù)報,Schmeits et al(2008)運(yùn)用數(shù)理統(tǒng)計方法處理和開發(fā)雷電臨近預(yù)報系統(tǒng),Jacobson et al(2011)統(tǒng)計分析衛(wèi)星、閃電定位系統(tǒng)等提供的雷電數(shù)據(jù),計算雷電發(fā)生概率。近幾年國外在雷電臨近預(yù)報領(lǐng)域也有了一些新的成果,如Ivanova(2019)應(yīng)用地面微波輻射計進(jìn)行雷電預(yù)警;Baldini et al(2018)利用雙偏振雷達(dá)識別graupel粒子,研究與雷電活動的相關(guān)性。在人工智能的氣象應(yīng)用上,還沒有明確應(yīng)用于雷電臨近預(yù)警的成果,但在氣象預(yù)報的其他領(lǐng)域已經(jīng)有較多的人工智能應(yīng)用產(chǎn)品,如:Andreev et al(2019)將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于云識別與檢測,Saha et al(2016)采用自編碼器對印度季風(fēng)進(jìn)行預(yù)測應(yīng)用;Geng et al(2019)引入ConvLSTM建立包含不同編碼器、預(yù)測解碼器的LightNet模型對雷電進(jìn)行預(yù)測等。探索一種新的雷電預(yù)警思路與當(dāng)前人工智能技術(shù)的興起不謀而合,利用人工智能技術(shù)來進(jìn)行雷電臨近預(yù)警具有很好的探索意義。

現(xiàn)行的雷電臨近預(yù)警技術(shù)方案主要以線性或簡單的非線性函數(shù)為主,非線性化程度低,以非變形外推為主,較少看到變形外推的應(yīng)用模型,或者以中尺度分析技術(shù)中的“配料法”為基礎(chǔ),對雷達(dá)、閃電數(shù)據(jù)進(jìn)行“配料”閾值控制預(yù)警,而實際雷電的發(fā)生與各影響要素之間不僅只存在線性的關(guān)系,可能還有我們未發(fā)掘的更為復(fù)雜的非線性規(guī)則,因此采用具有強(qiáng)非線性表征能力的神經(jīng)網(wǎng)絡(luò)技術(shù)來處理雷電臨近預(yù)警問題是提升預(yù)警效果的有效途徑。

本文選用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)為基礎(chǔ),構(gòu)建基于CNN的雷電臨近預(yù)警模型,將雷達(dá)組合反射率、液態(tài)水含量、回波頂高、云地閃電數(shù)據(jù)等指標(biāo)按CNN所需求的“圖片”模式進(jìn)行網(wǎng)格“切片”化處理,對數(shù)據(jù)進(jìn)行時間、空間維度上的延伸,建立相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型,采用谷歌公司人工智能線性代數(shù)編譯器(TENSORFLOW)為計算工具,對該模型進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,將得到的結(jié)果進(jìn)行實例的檢驗和應(yīng)用。

1 模型設(shè)計

1.1 CNN概述

CNN是一種專門用來處理類似網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),它采用具有一定大小、包含權(quán)重矩陣的格點網(wǎng)(卷積核,也稱過濾器)對輸入圖像逐個位置進(jìn)行掃描和卷積,利用卷積實變函數(shù)運(yùn)算實現(xiàn)對圖像局部特征的信息提取并保存在權(quán)重矩陣中,加上中間添加的非線性激活函數(shù),使整個神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的學(xué)習(xí)和非線性處理能力,實踐表明該計算方式可以很好地獲取圖片的總體與局部特征,其一般流程是對輸入的多通道圖像(可以把氣象格點數(shù)據(jù)看成是圖像)經(jīng)過多次的卷積、池化操作,提取到圖像深層次的高維特征,再將卷積、池化操作后的矩陣展開成神經(jīng)網(wǎng)絡(luò)層,經(jīng)過一定層數(shù)的神經(jīng)網(wǎng)絡(luò)層計算后,根據(jù)需求輸出對輸入圖像某一種類別屬性的預(yù)測結(jié)論,例如判斷輸入的圖像是哪一種動物、哪一個數(shù)字等。

盡管CNN已經(jīng)在計算機(jī)視覺、圖像分析等領(lǐng)域取得了積極的成果,但也存在著一定的不足和缺點,主要表現(xiàn)在對訓(xùn)練數(shù)據(jù)的需求量大、自身模型計算量龐大及訓(xùn)練時間長、硬件要求高、生物學(xué)基礎(chǔ)支持不足、無法掌握其內(nèi)部的計算機(jī)理、過多的參數(shù)設(shè)計使得模型設(shè)計的最優(yōu)解難以精確得到,等等。尤其在氣象預(yù)報應(yīng)用領(lǐng)域,由于常規(guī)的CNN處理的是圖片輸入、有限類別輸出的情形,而在格點化氣象預(yù)報領(lǐng)域,則要求輸入圖片,針對圖片的所有格點都要求有結(jié)果輸出的情況,即圖片輸入、圖片輸出,在人工智能領(lǐng)域稱這樣的問題為像素級的預(yù)測模型,因此常規(guī)的CNN模型無法直接應(yīng)用到氣象格點預(yù)報中。為了解決氣象預(yù)報這樣像素級的人工智能CNN模型,本文提出了一種采用切片式的數(shù)據(jù)處理方法,將輸入的氣象格點圖片根據(jù)像素預(yù)報點轉(zhuǎn)換成多量的“小切片”,作為新的輸入圖片進(jìn)行CNN預(yù)測;為了規(guī)避這種方法可能帶來的大計算量,本文設(shè)計了適宜的數(shù)據(jù)壓縮模型,有效降低了整個模型的計算量,使模型的預(yù)測計算可以在1~2 min內(nèi)實現(xiàn)福建省區(qū)域內(nèi)的格點化預(yù)警預(yù)報,保證預(yù)警產(chǎn)品的時效性,具體模型內(nèi)容討論如下。

1.2 參數(shù)選取

深度神經(jīng)網(wǎng)絡(luò)是一個封閉的黑盒子計算單元,目前在人工智能領(lǐng)域?qū)τ谏窠?jīng)網(wǎng)絡(luò)的工作原理尚不清楚,只知道“神經(jīng)元+激活函數(shù)”可以實現(xiàn)復(fù)雜的非線性數(shù)學(xué)變換,本文根據(jù)目前雷電臨近預(yù)警預(yù)報工作常用的思路與方法,結(jié)合雷電發(fā)生、發(fā)展的規(guī)律以及預(yù)報產(chǎn)品的時效、精度需求,選用下面幾個參量作為神經(jīng)網(wǎng)絡(luò)的輸入與輸出單元。

(1)雷達(dá)產(chǎn)品數(shù)據(jù),包括組合反射率、液態(tài)水含量、回波頂高三個參數(shù)。 這是目前雷電臨近預(yù)警預(yù)報工作最常用的三個指標(biāo)。國內(nèi)多項研究也表明這三個參數(shù)可以很好地適配雷電臨近預(yù)警工作,結(jié)合雷達(dá)數(shù)據(jù)質(zhì)量控制與SWAN雷達(dá)拼圖的處理等相關(guān)研究,如對有源干擾回波識別(黃小玉等,2019)、雷達(dá)CAPPI格點數(shù)據(jù)均一性處理(葉飛等,2020)、SWAN雷達(dá)拼圖產(chǎn)品處理(張勇等,2019)。對所有雷達(dá)產(chǎn)品數(shù)據(jù)進(jìn)行質(zhì)量控制和處理,剔除可能存在誤差或錯誤的雷達(dá)產(chǎn)品數(shù)據(jù)。

(2)云地閃數(shù)據(jù)。 閃電定位監(jiān)測數(shù)據(jù)是目前表征雷電發(fā)生位置、時間最直接、精度最高的觀測產(chǎn)品。利用不同時次地閃發(fā)生位置的變化來預(yù)測下一時次的雷電發(fā)生位置,是當(dāng)前地閃數(shù)據(jù)在雷電臨近預(yù)警工作中的主要應(yīng)用思路。本文通過對云地閃數(shù)據(jù)按雷達(dá)時次(本文規(guī)定每個小時的第00、06、12、…、54 min,即雷達(dá)數(shù)據(jù)產(chǎn)生的時間為雷達(dá)時次,以下同)和設(shè)計的柵格大小進(jìn)行每個柵格云地閃頻數(shù)的統(tǒng)計(時間分辨率:6 min,空間分辨率:0.01°),實現(xiàn)將一條一條的云地閃數(shù)據(jù)轉(zhuǎn)變成和雷達(dá)產(chǎn)品數(shù)據(jù)一樣格式的格點化數(shù)據(jù),應(yīng)用到神經(jīng)網(wǎng)絡(luò)模型中,設(shè)待計算時刻為t1,計算t1往前6 min的時刻t0,獲取[t0,t1]時間、柵格區(qū)域內(nèi)所有發(fā)生的云地閃數(shù)據(jù),計算其總頻數(shù)作為該t1時刻、該柵格區(qū)域的標(biāo)示值。

(3)預(yù)警輸出標(biāo)簽設(shè)計。按二分類對預(yù)警輸出結(jié)果進(jìn)行標(biāo)簽編制,考慮到雷達(dá)、閃電數(shù)據(jù)的實際到達(dá)時間存在一定的延遲(SWAN拼圖要等到所有單站雷達(dá)數(shù)據(jù)全到位才能拼圖,因此延遲在10 min左右),加上模型計算、結(jié)果傳輸所消耗的時間,雖然也可以做到0~15 min的預(yù)警,但該預(yù)警結(jié)果基本失去其時效意義,因此預(yù)報結(jié)果設(shè)定為當(dāng)前時刻之后15~30、30~45、45~60 min內(nèi)雷電發(fā)生位置的網(wǎng)格化產(chǎn)品,限于篇幅關(guān)系,本文僅對15~30 min 內(nèi)的預(yù)報模型進(jìn)行討論、介紹。具體規(guī)則:對于某一個預(yù)警格點,當(dāng)該格點在15~30 min的時間區(qū)間里監(jiān)測到有一次以上的云地閃數(shù)據(jù)時,即標(biāo)記該預(yù)警格點標(biāo)簽值為1,否則則記為0。

1.3 數(shù)據(jù)切片處理

針對氣象預(yù)報對預(yù)報結(jié)果的需求特點(大輸入、大輸出),本文把每個預(yù)報格點看成是一個實例,把一張300×300像素點的預(yù)報圖片,看成是預(yù)報300×300個實例的樣式;對每一個預(yù)報格點,分別向四個方向拓展指定的網(wǎng)格,形成以預(yù)報格點為中心,具有一定長、寬的網(wǎng)格切片,對每個時次、每個參數(shù)的網(wǎng)格圖層進(jìn)行一次切片,得到指定大小的網(wǎng)格矩陣,類比為圖片的一個“通道”,這樣每個時次的每個參數(shù)就可以得到一個通道,n個參數(shù)、m個時次就可以得到n×m個通道的輸入層,再經(jīng)過CNN的訓(xùn)練和計算后,就可以得到該網(wǎng)格(像素點)的預(yù)報結(jié)果了,具體思路如圖1所示。

圖1 單個格點的切片處理方法及雷電臨近預(yù)警CNN模型示意圖Fig.1 Slice processing method for single grid points and lightning nowcasting warning CNN model diagram

1.4 數(shù)據(jù)壓縮

在上述采用切片提取與該網(wǎng)格預(yù)報結(jié)果有關(guān)參數(shù)的矩陣時,通過向四個方向分別拓展一定距離的網(wǎng)格來形成該參數(shù)一個“通道”的“圖片”。經(jīng)驗表明,福建省內(nèi)中小尺度天氣系統(tǒng)移動速度最大在0.1°·6 min-1以內(nèi),也就是說,如果要做15~30 min預(yù)報的話,需要拓展網(wǎng)格的距離在0.25°~0.5°,保證對中心點有影響的數(shù)據(jù)包含在這個“圖片”內(nèi),換算成0.01°的個數(shù)就是25~50個柵格,取40格來計算的話,那么按上述拓展方法得到的一個時次、一個指標(biāo)的切片通道“圖片”的分辨率是(40×2+1,40×2+1),即(81,81)。由于這個圖片的大小比較大,為了降低計算量、提高預(yù)警速率,需要對原始網(wǎng)格化圖片進(jìn)行壓縮、池化處理。原來網(wǎng)格單元為0.01°×0.01°,選取k×k個相鄰的網(wǎng)格,將這k×k個網(wǎng)格的所有數(shù)值提取出來作為一個樣本序列,取這個樣本序列的最大值、中位數(shù)表征這個網(wǎng)格壓縮后的信息。以本文所討論15~30 min為例,對于15~30 min 預(yù)報模型,選取k=3,即把某參數(shù)、某通道切片的每9個網(wǎng)格壓縮成1個網(wǎng)格,每個網(wǎng)格儲存原9個網(wǎng)格數(shù)值的最大值、中位數(shù)兩個數(shù)值信息,如圖2所示,對雷達(dá)組合反射率、液態(tài)水含量、回波頂高提取這兩個值,對于地閃參數(shù)則僅用這3×3個網(wǎng)格的總地閃個數(shù)表示,即實現(xiàn)了2/9的壓縮、提取,大大減少了計算量,滿足了臨近預(yù)報對預(yù)報產(chǎn)品時效性的需求。

圖2 某參數(shù)某通道數(shù)據(jù)3×3壓縮方法示意圖Fig.2 A diagram of a channel data 3×3 compression method for a parameter

本文實際模型中先對各指標(biāo)按3×3網(wǎng)格進(jìn)行格點壓縮,對于每個預(yù)報格點按東10、西13、南8、北6個格點距離拓展進(jìn)行切片處理,這樣處理后每個參數(shù)通道的切片分辨率為(10+13+1,8+6+1),即24×15=360,對每個參數(shù)選取當(dāng)前預(yù)報時刻往前2個雷達(dá)時次的值,最終本文設(shè)計模型的每個預(yù)報格點輸入情況總結(jié)如下:

(1)預(yù)報格點基準(zhǔn)大小為0.03°×0.03°;

(2)共包含雷達(dá)組合反射率、液態(tài)水含量、回波頂高以及云地閃4個參量;

(3)每個參量按0.03°×0.03°網(wǎng)格進(jìn)行格點壓縮,壓縮后雷達(dá)組合反射率、液態(tài)水含量、回波頂高包含最大值、中位數(shù)值兩個圖片通道,云地閃包含總頻次一個圖片通道,4個參量合計有3×2+1×1=7個圖片通道;

(4)每個參量包含當(dāng)前時刻以及當(dāng)前時刻往前6 min時刻的2個時間序列,即按上述處理后,共計有7×2=14個0.03°×0.03°大小的圖片通道;

(5)每個待預(yù)報格點在每個通道上按東10、西13、南8、北6個格點距離拓展進(jìn)行切片處理,每個切片大小為24×15,14個通道得到14個通道的24×15分辨率的小圖片,實際輸入大小為24×15×14=5040。

1.5 CNN模型設(shè)計

按上述方法對雷達(dá)、閃電數(shù)據(jù)進(jìn)行切片及切片壓縮處理后,對于每一個預(yù)報格點,可以得到14個通道、24×15分辨率的小圖片,將這14個通道的圖片作為神經(jīng)網(wǎng)絡(luò)模型的輸入,按“兩次卷積-池化-兩次卷積-池化-展開-全連接層-全連接層-激活函數(shù)(sigmoid)激活輸出”的流程建立深度學(xué)習(xí)模型,具體如圖3所示,模型中各個處理單元設(shè)計如下:

圖3 CNN設(shè)計模型示意圖Fig.3 Diagram of the model design of convolutional neural network

(1)卷積層:選用2×2濾波器,移動步長為1,采用邊界不填0的卷積處理方式。這主要是考慮使用的4個參數(shù)的數(shù)值存在較多0值的情況,如果采用0值填邊的話會使神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時以為邊界沒有天氣活動,進(jìn)而引起較大的誤差。通道數(shù)按輸入通道數(shù)的1.25倍數(shù)遞增(取整),采用層標(biāo)準(zhǔn)化技術(shù)(batch normalization)對每層輸入值進(jìn)行規(guī)范化處理,最后按激活函數(shù)(relu)對卷積層做非線性激活,隨意節(jié)點丟棄率(dropout)取值為0.15,防止模型的過擬合,將結(jié)果傳遞到下一層模型中。

(2)池化層:按最大池化(max pooling)模式進(jìn)行池化操作,移動步長為2,采用邊界不填0的卷積處理方式,理由同卷積層的設(shè)計。

(3)全連接層:在兩次卷積-池化操作后,將輸出的多通道圖片按單列格點展開,進(jìn)行全連接操作。全連接共兩層,全連接節(jié)點設(shè)置為64、32,每個全連接層都采用層標(biāo)準(zhǔn)化技術(shù)對輸入值進(jìn)行規(guī)范化處理,選用激活函數(shù)(relu),隨意節(jié)點丟棄率(dropout)取值為0.15,防止模型的過擬合,最后使用激活函數(shù)(sigmoid)對前面神經(jīng)網(wǎng)絡(luò)運(yùn)算結(jié)果進(jìn)行最后預(yù)測,定義最后的預(yù)測值>0.5為Y=1類標(biāo)簽,預(yù)測值≤0.5為Y=0類標(biāo)簽,得到0、1的二分類結(jié)果。

對于Y標(biāo)簽按如下規(guī)則確定:以本文討論的15~30 min預(yù)報為例,若預(yù)報網(wǎng)格在預(yù)報時刻往后的15~30 min監(jiān)測到云地閃,則不管該時段內(nèi)發(fā)生多少次閃電,都標(biāo)記為1,沒有監(jiān)測到云地閃即標(biāo)記為0。

1.6 數(shù)據(jù)與模型訓(xùn)練

以2017年3—10月、2018年3—7月福建省雷達(dá)、閃電監(jiān)測數(shù)據(jù)為樣本,對每個月選取當(dāng)月閃電定位監(jiān)測數(shù)據(jù)文本文件大小最大的兩個日期,對每個選取日期按每個小時、每個雷達(dá)時次、每個經(jīng)緯度網(wǎng)格進(jìn)行切片選取(X輸入)與對應(yīng)15~30 min后該經(jīng)緯度網(wǎng)格雷電發(fā)生情況(Y二分類標(biāo)簽)進(jìn)行提取。 由于Y=0且X大部分?jǐn)?shù)據(jù)為0值(即各個網(wǎng)格的雷達(dá)、閃電數(shù)據(jù)基本為0,對應(yīng)預(yù)報時效內(nèi)沒有閃電)的情況占所遴選樣本的比例非常大,因此在數(shù)據(jù)提取時判定當(dāng)X數(shù)據(jù)中雷達(dá)組合反射率的值大于20 dBz的個數(shù)占比小于10%時,本次樣本提取放棄; 此外由于閃電定位監(jiān)測數(shù)據(jù)存在一定的偏差,經(jīng)常出現(xiàn)在同一時間段,某個閃電數(shù)據(jù)的發(fā)生位置與當(dāng)時的閃電集中區(qū)域偏離較大的情況,為了使訓(xùn)練樣本Y=1的標(biāo)簽降低噪聲、干擾的情況,樣本提取時剔除閃電定位方法為2站、雷電流幅值絕對值≤2 kA、某個閃電前后10 min內(nèi)距離本次閃電0.5°范圍內(nèi)沒有其他閃電監(jiān)測記錄的閃電數(shù)據(jù)。為了避免訓(xùn)練樣本出現(xiàn)0、1標(biāo)簽個數(shù)差別太大的情況,對當(dāng)前得到的所有訓(xùn)練樣本進(jìn)行隨機(jī)遴選,根據(jù)計算機(jī)的計算負(fù)荷,設(shè)置總量為80 000個樣本,遴選0、1樣本個數(shù)各40 000個,進(jìn)入后續(xù)的網(wǎng)絡(luò)訓(xùn)練。 具體網(wǎng)絡(luò)訓(xùn)練采用Adam優(yōu)化器,即在梯度下降進(jìn)行迭代求最優(yōu)解的基礎(chǔ)上,根據(jù)一階梯度矩估計、二階梯度矩估計計算更新步長的優(yōu)化模型,設(shè)置初始學(xué)習(xí)率為0.001,模型學(xué)習(xí)率自動衰減為0.9,設(shè)置單次訓(xùn)練樣本數(shù)(batch size)為120,選取10%的樣本容量作為測試數(shù)據(jù),選擇二分類損失函數(shù)(binary crossentropy)為損失計算方式,設(shè)置最大訓(xùn)練次數(shù)為500次,將訓(xùn)練過程中準(zhǔn)確率最好的參數(shù)矩陣保存為最終訓(xùn)練結(jié)果。

按上述方法與規(guī)則對模型進(jìn)行訓(xùn)練,繪制整個訓(xùn)練過程的損失(losses)與準(zhǔn)確率(accuracy)曲線(圖4)。由圖4可知,損失曲線下降的速度適均,說明模型設(shè)計的初始學(xué)習(xí)率可行;最終測試集損失控制在0.430 1,測試集準(zhǔn)確率為0.798 5,測試集與訓(xùn)練集的損失、準(zhǔn)確率曲線基本貼合,訓(xùn)練后期也沒有出現(xiàn)明顯的分開,表明模型沒有出現(xiàn)明顯的過擬合現(xiàn)象,也說明按本文設(shè)計的訓(xùn)練數(shù)據(jù)提取、遴選方法可行,保證了數(shù)據(jù)集數(shù)據(jù)質(zhì)量的一致性與噪聲的隨機(jī)分布。整個訓(xùn)練模型在大概訓(xùn)練350個訓(xùn)練次數(shù)后開始趨于平穩(wěn),模型學(xué)習(xí)率經(jīng)自動衰減100個訓(xùn)練次數(shù)仍沒有明顯下降和變化,可見模型在這時基本已訓(xùn)練到飽和,整個模型的訓(xùn)練過程合理、可行。

圖4 模型訓(xùn)練損失曲線(a)和準(zhǔn)確率曲線(b)Fig.4 Curves of model training losses (a) and accuracy (b)

2 應(yīng)用與檢驗

本文所建立與訓(xùn)練的模型在福建省2019年的汛期工作(3—10月)中得到完整的應(yīng)用。從總體上看本文討論的15~30 min雷電預(yù)警效果總體表現(xiàn)穩(wěn)定和良好,取2019年4月22日14時的預(yù)報、實況圖(圖5)為例,由圖可見,模型預(yù)報的幾個雷電發(fā)生區(qū)域在15~30 min后的都有閃電發(fā)生。需要說明的是,預(yù)報圖中對預(yù)報格點按福建省邊界外圍一定距離做了裁剪,因此實況圖中左下角的閃電并非沒有預(yù)報出來,而是被裁剪。

圖5 2019年4月22日14時的15~30 min雷電預(yù)報(a)、實況(b)對比Fig.5 The 15-30 min lightning nowcasting (a) and observation (b) at 14:00 BT 22 April 2019

為了更精確了解本模型的實際準(zhǔn)確率情況,本文按系統(tǒng)動力抬升型雷電過程、副高邊緣局地?zé)崂妆┻^程這兩種福建省主要雷電天氣類別,選取了2019年主要雷電天氣(兩種類型各選取10 d)作為樣本進(jìn)行TS評分計算,結(jié)果表明:

動力抬升型雷電過程, TS平均評分為0.716,平均漏報率、空報率分別為0.095、0.190;

局地?zé)崂妆┬屠纂娺^程,TS平均評分為0.694,平均漏報率、空報率分別為0.112、0.194。

檢驗結(jié)果表明,模型對前汛期動力抬升型的雷電過程預(yù)警效果略微好于夏季局地?zé)崂妆┑睦纂娺^程,考慮到閃電定位系統(tǒng)本身存在的誤差,且福建省多山地地形,這樣的預(yù)報結(jié)果基本可以接受。有研究采用雷達(dá)與閃電閾值控制算法,對福建省進(jìn)行格點化雷電臨近預(yù)警應(yīng)用,按雷達(dá)組合反射率37 dBz、垂直液態(tài)水含量1.5 kg·m-2、回波頂高11 km作為雷達(dá)預(yù)警控制的閾值,研究中直接閃電預(yù)警判定距離為10 km,間接閃電預(yù)警判定距離為15 km,閃電預(yù)警解除判定距離為15 km,最后分析得出其TS評分為0.671(張燁方等,2019)。相比之下,本文設(shè)計與訓(xùn)練的CNN模型的準(zhǔn)確率有了一定提升。

3 結(jié)論與展望

本文以雷達(dá)產(chǎn)品(組合反射率、液態(tài)水含量、回波頂高)和閃電數(shù)據(jù)為指標(biāo),對CNN模型進(jìn)行了適應(yīng)雷電臨近預(yù)警需求的改進(jìn)和調(diào)整,對改進(jìn)后的模型進(jìn)行了訓(xùn)練、檢驗,得出以下結(jié)論:

(1)本文設(shè)計的切片式處理方法可以解決CNN在氣象格點預(yù)報應(yīng)用中遇到的像素級分類問題,設(shè)計的格點壓縮算法可以在短時間、一般計算硬件的條件下,得到一個省范圍內(nèi)的格點預(yù)報產(chǎn)品,滿足臨近預(yù)警服務(wù)對時效性的要求。檢驗表明設(shè)計的模型在預(yù)警效果上比常規(guī)采用“配料法-閾值控制”的雷電臨近預(yù)警模型有了一定的提高,模型對動力抬升型雷電過程的預(yù)警效果稍微好于副熱帶高壓邊緣局地?zé)崂妆┻^程的預(yù)警效果。

(2)原始訓(xùn)練數(shù)據(jù)的質(zhì)量對模型的訓(xùn)練效果有很大影響,原始數(shù)據(jù)噪聲的大小、不同類別標(biāo)簽的數(shù)量比例遴選不合理甚至可能會使訓(xùn)練的模型矩陣出現(xiàn)預(yù)報結(jié)果全是0或1的“垃圾輸出”;此外,在雷電臨近預(yù)警領(lǐng)域,對閃電定位數(shù)據(jù)進(jìn)行適宜的修訂可以有效提高模型的訓(xùn)練準(zhǔn)確率,本文按“剔除2站定位、雷電流幅值絕對值≤2 kA、某個閃電前后10 min 內(nèi)距離本次閃電0.5°范圍沒有其他閃電監(jiān)測記錄的閃電數(shù)據(jù)”的條件對訓(xùn)練的閃電數(shù)據(jù)進(jìn)行了剔除和修訂后,模型的訓(xùn)練準(zhǔn)確率提高了近0.10,是模型訓(xùn)練過程中各個環(huán)節(jié)、參數(shù)調(diào)整中準(zhǔn)確率變化最大的地方。

(3)1~2 h預(yù)報思路展望。相較傳統(tǒng)的雷達(dá)回波相關(guān)性跟蹤(TREC)的外推算法,本文所建立基于切片式處理、CNN模型的雷電臨近預(yù)警模型在預(yù)報區(qū)域的外推上,初步具有變形外推的效果,但在不少方面仍有改進(jìn)和不足的地方。如:模型沒有根據(jù)不同的天氣系統(tǒng)進(jìn)行分類訓(xùn)練、預(yù)警;模型在參數(shù)的選擇上沒有把高程、土壤、云閃及潛勢預(yù)報的因子列入其中;限于計算硬件設(shè)備的影響,本文輸入數(shù)據(jù)的時間序列時段、切片大小有限等。需要看到的是,單純依靠上述模型只能滿足15~60 min的雷電預(yù)警需求,要做1~2 h的預(yù)警產(chǎn)品,需要再引入其他強(qiáng)天氣潛勢預(yù)報涉及的物理量,但這些物理量在格點精度、時間序列點上與雷達(dá)、閃電的數(shù)據(jù)無法同步,這也是影響1~2 h臨近預(yù)報格點產(chǎn)品效果的重要因素,本文研究項目也正嘗試對這些物理量進(jìn)行基于深度學(xué)習(xí)網(wǎng)絡(luò)模型的處理,努力將其融入到本文所研究模型的1~2 h預(yù)報產(chǎn)品中,以更好地實現(xiàn)人工智能技術(shù)在雷電臨近預(yù)警工作中的有效應(yīng)用。

猜你喜歡
格點雷電預(yù)警
帶有超二次位勢無限格點上的基態(tài)行波解
一種電離層TEC格點預(yù)測模型
雨天防雷電要選對雨傘
中老年保健(2021年5期)2021-08-24 07:08:30
法國發(fā)布高溫預(yù)警 嚴(yán)陣以待備戰(zhàn)“史上最熱周”
雷電
帶可加噪聲的非自治隨機(jī)Boussinesq格點方程的隨機(jī)吸引子
園林有害生物預(yù)警與可持續(xù)控制
格點和面積
計算機(jī)機(jī)房的雷電防護(hù)
中國市場(2016年45期)2016-05-17 05:15:53
機(jī)載預(yù)警雷達(dá)對IFF 的干擾分析
浙江省| 陆川县| 华坪县| 济源市| 隆尧县| 钟山县| 锦州市| 巴塘县| 义乌市| 桂林市| 囊谦县| 厦门市| 万安县| 永康市| 湖州市| 靖安县| 西林县| 山东省| 蕲春县| 宁化县| 潞城市| 海晏县| 马龙县| 舞阳县| 交口县| 客服| 彭泽县| 通道| 宁安市| 喀什市| 富裕县| 郴州市| 环江| 宣城市| 桂林市| 涪陵区| 威远县| 武隆县| 安化县| 沭阳县| 吉木乃县|