基于卷積神經(jīng)網(wǎng)絡(luò)的雷電臨近預(yù)警模型*

2021-04-20 00:38:40張燁方馮真禎

氣象 2021年3期

張燁方馮真禎劉冰

1 福建省災(zāi)害天氣重點實驗室，福州 350001 2 福建省氣象災(zāi)害防御技術(shù)中心，福州 350001

提要：從研究人工智能雷電臨近預(yù)警模型的目的出發(fā)，以卷積神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ)，結(jié)合多個時間序列的雷達(dá)產(chǎn)品(組合反射率、液態(tài)水含量、回波頂高)與閃電數(shù)據(jù)，對雷電臨近預(yù)報方法進(jìn)行基于卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的應(yīng)用，以福建省2017—2018年雷達(dá)、閃電數(shù)據(jù)為樣本完成了模型的訓(xùn)練與預(yù)測研究。訓(xùn)練結(jié)果顯示，15～30 min模型訓(xùn)練樣本測試集準(zhǔn)確率為0.798 5；選取福建省2019年20個雷電過程驗證分析表明，15～30 min模型對動力抬升型雷電過程預(yù)警TS評分為0.716，夏季局地?zé)崂妆╊A(yù)警TS評分為0.694，與常規(guī)采用雷達(dá)、閃電閾值控制的雷電預(yù)警算法相比，準(zhǔn)確率有一定的提高，具有一定的實踐意義。

引言

人工智能是近幾年來發(fā)展特別迅速的一門科學(xué)技術(shù)，普遍被認(rèn)為是下一場科技革命的生產(chǎn)力代表，2017年8月國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》，提出了面向2030年我國新一代人工智能發(fā)展的戰(zhàn)略目標(biāo)。逐步推進(jìn)氣象業(yè)務(wù)工作與人工智能技術(shù)的對接，拓展未發(fā)掘的預(yù)報模式，滿足多角度氣象專業(yè)服務(wù)需求，是實現(xiàn)氣象工作自動化、智能化、現(xiàn)代化的重要途徑。

我國在20世紀(jì)90年代初已開始?xì)庀箢I(lǐng)域人工智能方面的預(yù)報研究，如中國氣象局在“八五”期間就成立了《人工智能、模式識別在天氣預(yù)報業(yè)務(wù)中的應(yīng)用》課題項目，運(yùn)用神經(jīng)網(wǎng)絡(luò)模式對暴雨預(yù)報進(jìn)行試驗(王寶榮，1993)。進(jìn)入21世紀(jì)后，國內(nèi)出現(xiàn)更多基于機(jī)器學(xué)習(xí)的氣象人工智能研究，如賀佳佳等(2017)采用支持向量機(jī)(SVM)開展局部短時臨近降雨預(yù)測研究；孫全德等(2019)對數(shù)值天氣預(yù)報模式ECMWF預(yù)測的華北地區(qū)近地面10 m 風(fēng)速進(jìn)行訂正，指出三種機(jī)器學(xué)習(xí)算法的訂正效果均好于傳統(tǒng)訂正方法模式輸出統(tǒng)計〈MOS〉的結(jié)果；熊亞軍等(2015)利用KNN(KNearest Neighbor)數(shù)據(jù)挖掘算法構(gòu)建等級預(yù)報分類器，開展霾等級客觀識別實驗；陳勇偉等(2013)、趙旭寰等(2009)使用BP(back propagation)神經(jīng)網(wǎng)絡(luò)模型，選用7個對流參數(shù)對雷暴活動進(jìn)行潛勢預(yù)報。

在雷電臨近預(yù)警領(lǐng)域，目前主要是使用雷達(dá)組合反射率、液態(tài)水含量、回波頂高、閃電數(shù)據(jù)進(jìn)行預(yù)警，如：張其林等(2010)對閃電發(fā)生進(jìn)行高密度區(qū)域識別并外推，得出雷電預(yù)警產(chǎn)品；呂偉濤等(2009)借鑒美國NCAR的TITAN(Thunderstorm Identification，Tracking，Analysis，and Nowcasting)算法對雷達(dá)數(shù)據(jù)進(jìn)行重點區(qū)域識別與外推，研究格點雷電發(fā)生概率；秦微等(2016)在深圳地區(qū)采用TITAN算法對某次強(qiáng)風(fēng)暴過程中的強(qiáng)回波區(qū)進(jìn)行分析，得出該算法識別效果理想的結(jié)果；劉維成等(2015)對甘肅中部雷達(dá)回波單體與雷電活動之間的對應(yīng)關(guān)系進(jìn)行分析，得出回波強(qiáng)度、回波頂高、垂直累積液態(tài)含水量與雷電發(fā)生的閾值關(guān)系，并根據(jù)該結(jié)論建立了雷電預(yù)警方案；常越等(2010)對湖南省閃電的發(fā)生和雷達(dá)關(guān)系進(jìn)行研究，認(rèn)為閃電發(fā)生與回波強(qiáng)度、回波頂高、速度場特征、垂直液態(tài)含水量等有著密切的關(guān)系；此外還有研究使用衛(wèi)星、探空、大氣電場等數(shù)據(jù)對雷電預(yù)警關(guān)系進(jìn)行分析。國外在雷電臨近預(yù)警研究方面，Hondl and Eilts(1994)根據(jù)雷暴發(fā)展到不同高度層的回波特征與閾值進(jìn)行短時臨近預(yù)報，Schmeits et al(2008)運(yùn)用數(shù)理統(tǒng)計方法處理和開發(fā)雷電臨近預(yù)報系統(tǒng)，Jacobson et al(2011)統(tǒng)計分析衛(wèi)星、閃電定位系統(tǒng)等提供的雷電數(shù)據(jù)，計算雷電發(fā)生概率。近幾年國外在雷電臨近預(yù)報領(lǐng)域也有了一些新的成果，如Ivanova(2019)應(yīng)用地面微波輻射計進(jìn)行雷電預(yù)警；Baldini et al(2018)利用雙偏振雷達(dá)識別graupel粒子，研究與雷電活動的相關(guān)性。在人工智能的氣象應(yīng)用上，還沒有明確應(yīng)用于雷電臨近預(yù)警的成果，但在氣象預(yù)報的其他領(lǐng)域已經(jīng)有較多的人工智能應(yīng)用產(chǎn)品，如：Andreev et al(2019)將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于云識別與檢測，Saha et al(2016)采用自編碼器對印度季風(fēng)進(jìn)行預(yù)測應(yīng)用；Geng et al(2019)引入ConvLSTM建立包含不同編碼器、預(yù)測解碼器的LightNet模型對雷電進(jìn)行預(yù)測等。探索一種新的雷電預(yù)警思路與當(dāng)前人工智能技術(shù)的興起不謀而合，利用人工智能技術(shù)來進(jìn)行雷電臨近預(yù)警具有很好的探索意義。

現(xiàn)行的雷電臨近預(yù)警技術(shù)方案主要以線性或簡單的非線性函數(shù)為主，非線性化程度低，以非變形外推為主，較少看到變形外推的應(yīng)用模型，或者以中尺度分析技術(shù)中的“配料法”為基礎(chǔ)，對雷達(dá)、閃電數(shù)據(jù)進(jìn)行“配料”閾值控制預(yù)警，而實際雷電的發(fā)生與各影響要素之間不僅只存在線性的關(guān)系，可能還有我們未發(fā)掘的更為復(fù)雜的非線性規(guī)則，因此采用具有強(qiáng)非線性表征能力的神經(jīng)網(wǎng)絡(luò)技術(shù)來處理雷電臨近預(yù)警問題是提升預(yù)警效果的有效途徑。

本文選用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network，CNN)為基礎(chǔ)，構(gòu)建基于CNN的雷電臨近預(yù)警模型，將雷達(dá)組合反射率、液態(tài)水含量、回波頂高、云地閃電數(shù)據(jù)等指標(biāo)按CNN所需求的“圖片”模式進(jìn)行網(wǎng)格“切片”化處理，對數(shù)據(jù)進(jìn)行時間、空間維度上的延伸，建立相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型，采用谷歌公司人工智能線性代數(shù)編譯器(TENSORFLOW)為計算工具，對該模型進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練，將得到的結(jié)果進(jìn)行實例的檢驗和應(yīng)用。

1 模型設(shè)計

1.1 CNN概述

CNN是一種專門用來處理類似網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)，它采用具有一定大小、包含權(quán)重矩陣的格點網(wǎng)(卷積核，也稱過濾器)對輸入圖像逐個位置進(jìn)行掃描和卷積，利用卷積實變函數(shù)運(yùn)算實現(xiàn)對圖像局部特征的信息提取并保存在權(quán)重矩陣中，加上中間添加的非線性激活函數(shù)，使整個神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的學(xué)習(xí)和非線性處理能力，實踐表明該計算方式可以很好地獲取圖片的總體與局部特征，其一般流程是對輸入的多通道圖像(可以把氣象格點數(shù)據(jù)看成是圖像)經(jīng)過多次的卷積、池化操作，提取到圖像深層次的高維特征，再將卷積、池化操作后的矩陣展開成神經(jīng)網(wǎng)絡(luò)層，經(jīng)過一定層數(shù)的神經(jīng)網(wǎng)絡(luò)層計算后，根據(jù)需求輸出對輸入圖像某一種類別屬性的預(yù)測結(jié)論，例如判斷輸入的圖像是哪一種動物、哪一個數(shù)字等。

盡管CNN已經(jīng)在計算機(jī)視覺、圖像分析等領(lǐng)域取得了積極的成果，但也存在著一定的不足和缺點，主要表現(xiàn)在對訓(xùn)練數(shù)據(jù)的需求量大、自身模型計算量龐大及訓(xùn)練時間長、硬件要求高、生物學(xué)基礎(chǔ)支持不足、無法掌握其內(nèi)部的計算機(jī)理、過多的參數(shù)設(shè)計使得模型設(shè)計的最優(yōu)解難以精確得到，等等。尤其在氣象預(yù)報應(yīng)用領(lǐng)域，由于常規(guī)的CNN處理的是圖片輸入、有限類別輸出的情形，而在格點化氣象預(yù)報領(lǐng)域，則要求輸入圖片，針對圖片的所有格點都要求有結(jié)果輸出的情況，即圖片輸入、圖片輸出，在人工智能領(lǐng)域稱這樣的問題為像素級的預(yù)測模型，因此常規(guī)的CNN模型無法直接應(yīng)用到氣象格點預(yù)報中。為了解決氣象預(yù)報這樣像素級的人工智能CNN模型，本文提出了一種采用切片式的數(shù)據(jù)處理方法，將輸入的氣象格點圖片根據(jù)像素預(yù)報點轉(zhuǎn)換成多量的“小切片”，作為新的輸入圖片進(jìn)行CNN預(yù)測；為了規(guī)避這種方法可能帶來的大計算量，本文設(shè)計了適宜的數(shù)據(jù)壓縮模型，有效降低了整個模型的計算量，使模型的預(yù)測計算可以在1～2 min內(nèi)實現(xiàn)福建省區(qū)域內(nèi)的格點化預(yù)警預(yù)報，保證預(yù)警產(chǎn)品的時效性，具體模型內(nèi)容討論如下。

1.2 參數(shù)選取

深度神經(jīng)網(wǎng)絡(luò)是一個封閉的黑盒子計算單元，目前在人工智能領(lǐng)域?qū)τ谏窠?jīng)網(wǎng)絡(luò)的工作原理尚不清楚，只知道“神經(jīng)元+激活函數(shù)”可以實現(xiàn)復(fù)雜的非線性數(shù)學(xué)變換，本文根據(jù)目前雷電臨近預(yù)警預(yù)報工作常用的思路與方法，結(jié)合雷電發(fā)生、發(fā)展的規(guī)律以及預(yù)報產(chǎn)品的時效、精度需求，選用下面幾個參量作為神經(jīng)網(wǎng)絡(luò)的輸入與輸出單元。

(1)雷達(dá)產(chǎn)品數(shù)據(jù)，包括組合反射率、液態(tài)水含量、回波頂高三個參數(shù)。這是目前雷電臨近預(yù)警預(yù)報工作最常用的三個指標(biāo)。國內(nèi)多項研究也表明這三個參數(shù)可以很好地適配雷電臨近預(yù)警工作，結(jié)合雷達(dá)數(shù)據(jù)質(zhì)量控制與SWAN雷達(dá)拼圖的處理等相關(guān)研究，如對有源干擾回波識別(黃小玉等，2019)、雷達(dá)CAPPI格點數(shù)據(jù)均一性處理(葉飛等，2020)、SWAN雷達(dá)拼圖產(chǎn)品處理(張勇等，2019)。對所有雷達(dá)產(chǎn)品數(shù)據(jù)進(jìn)行質(zhì)量控制和處理，剔除可能存在誤差或錯誤的雷達(dá)產(chǎn)品數(shù)據(jù)。

(2)云地閃數(shù)據(jù)。閃電定位監(jiān)測數(shù)據(jù)是目前表征雷電發(fā)生位置、時間最直接、精度最高的觀測產(chǎn)品。利用不同時次地閃發(fā)生位置的變化來預(yù)測下一時次的雷電發(fā)生位置，是當(dāng)前地閃數(shù)據(jù)在雷電臨近預(yù)警工作中的主要應(yīng)用思路。本文通過對云地閃數(shù)據(jù)按雷達(dá)時次(本文規(guī)定每個小時的第00、06、12、…、54 min，即雷達(dá)數(shù)據(jù)產(chǎn)生的時間為雷達(dá)時次，以下同)和設(shè)計的柵格大小進(jìn)行每個柵格云地閃頻數(shù)的統(tǒng)計(時間分辨率：6 min，空間分辨率：0.01°)，實現(xiàn)將一條一條的云地閃數(shù)據(jù)轉(zhuǎn)變成和雷達(dá)產(chǎn)品數(shù)據(jù)一樣格式的格點化數(shù)據(jù)，應(yīng)用到神經(jīng)網(wǎng)絡(luò)模型中，設(shè)待計算時刻為t1，計算t1往前6 min的時刻t0，獲取[t0,t1]時間、柵格區(qū)域內(nèi)所有發(fā)生的云地閃數(shù)據(jù)，計算其總頻數(shù)作為該t1時刻、該柵格區(qū)域的標(biāo)示值。

(3)預(yù)警輸出標(biāo)簽設(shè)計。按二分類對預(yù)警輸出結(jié)果進(jìn)行標(biāo)簽編制，考慮到雷達(dá)、閃電數(shù)據(jù)的實際到達(dá)時間存在一定的延遲(SWAN拼圖要等到所有單站雷達(dá)數(shù)據(jù)全到位才能拼圖，因此延遲在10 min左右)，加上模型計算、結(jié)果傳輸所消耗的時間，雖然也可以做到0～15 min的預(yù)警，但該預(yù)警結(jié)果基本失去其時效意義，因此預(yù)報結(jié)果設(shè)定為當(dāng)前時刻之后15～30、30～45、45～60 min內(nèi)雷電發(fā)生位置的網(wǎng)格化產(chǎn)品，限于篇幅關(guān)系，本文僅對15～30 min 內(nèi)的預(yù)報模型進(jìn)行討論、介紹。具體規(guī)則：對于某一個預(yù)警格點，當(dāng)該格點在15～30 min的時間區(qū)間里監(jiān)測到有一次以上的云地閃數(shù)據(jù)時，即標(biāo)記該預(yù)警格點標(biāo)簽值為1，否則則記為0。

1.3 數(shù)據(jù)切片處理

針對氣象預(yù)報對預(yù)報結(jié)果的需求特點(大輸入、大輸出)，本文把每個預(yù)報格點看成是一個實例，把一張300×300像素點的預(yù)報圖片，看成是預(yù)報300×300個實例的樣式；對每一個預(yù)報格點，分別向四個方向拓展指定的網(wǎng)格，形成以預(yù)報格點為中心，具有一定長、寬的網(wǎng)格切片，對每個時次、每個參數(shù)的網(wǎng)格圖層進(jìn)行一次切片，得到指定大小的網(wǎng)格矩陣，類比為圖片的一個“通道”，這樣每個時次的每個參數(shù)就可以得到一個通道，n個參數(shù)、m個時次就可以得到n×m個通道的輸入層，再經(jīng)過CNN的訓(xùn)練和計算后，就可以得到該網(wǎng)格(像素點)的預(yù)報結(jié)果了，具體思路如圖1所示。

圖1 單個格點的切片處理方法及雷電臨近預(yù)警CNN模型示意圖Fig.1 Slice processing method for single grid points and lightning nowcasting warning CNN model diagram

1.4 數(shù)據(jù)壓縮

在上述采用切片提取與該網(wǎng)格預(yù)報結(jié)果有關(guān)參數(shù)的矩陣時，通過向四個方向分別拓展一定距離的網(wǎng)格來形成該參數(shù)一個“通道”的“圖片”。經(jīng)驗表明，福建省內(nèi)中小尺度天氣系統(tǒng)移動速度最大在0.1°·6 min-1以內(nèi)，也就是說，如果要做15～30 min預(yù)報的話，需要拓展網(wǎng)格的距離在0.25°～0.5°，保證對中心點有影響的數(shù)據(jù)包含在這個“圖片”內(nèi)，換算成0.01°的個數(shù)就是25～50個柵格，取40格來計算的話，那么按上述拓展方法得到的一個時次、一個指標(biāo)的切片通道“圖片”的分辨率是(40×2+1,40×2+1)，即(81,81)。由于這個圖片的大小比較大，為了降低計算量、提高預(yù)警速率，需要對原始網(wǎng)格化圖片進(jìn)行壓縮、池化處理。原來網(wǎng)格單元為0.01°×0.01°，選取k×k個相鄰的網(wǎng)格，將這k×k個網(wǎng)格的所有數(shù)值提取出來作為一個樣本序列，取這個樣本序列的最大值、中位數(shù)表征這個網(wǎng)格壓縮后的信息。以本文所討論15～30 min為例，對于15～30 min 預(yù)報模型，選取k=3，即把某參數(shù)、某通道切片的每9個網(wǎng)格壓縮成1個網(wǎng)格，每個網(wǎng)格儲存原9個網(wǎng)格數(shù)值的最大值、中位數(shù)兩個數(shù)值信息，如圖2所示，對雷達(dá)組合反射率、液態(tài)水含量、回波頂高提取這兩個值，對于地閃參數(shù)則僅用這3×3個網(wǎng)格的總地閃個數(shù)表示，即實現(xiàn)了2/9的壓縮、提取，大大減少了計算量，滿足了臨近預(yù)報對預(yù)報產(chǎn)品時效性的需求。

圖2 某參數(shù)某通道數(shù)據(jù)3×3壓縮方法示意圖Fig.2 A diagram of a channel data 3×3 compression method for a parameter

本文實際模型中先對各指標(biāo)按3×3網(wǎng)格進(jìn)行格點壓縮，對于每個預(yù)報格點按東10、西13、南8、北6個格點距離拓展進(jìn)行切片處理，這樣處理后每個參數(shù)通道的切片分辨率為(10+13+1,8+6+1)，即24×15=360，對每個參數(shù)選取當(dāng)前預(yù)報時刻往前2個雷達(dá)時次的值，最終本文設(shè)計模型的每個預(yù)報格點輸入情況總結(jié)如下：

(1)預(yù)報格點基準(zhǔn)大小為0.03°×0.03°；

(2)共包含雷達(dá)組合反射率、液態(tài)水含量、回波頂高以及云地閃4個參量；

(3)每個參量按0.03°×0.03°網(wǎng)格進(jìn)行格點壓縮，壓縮后雷達(dá)組合反射率、液態(tài)水含量、回波頂高包含最大值、中位數(shù)值兩個圖片通道，云地閃包含總頻次一個圖片通道，4個參量合計有3×2+1×1=7個圖片通道；

(4)每個參量包含當(dāng)前時刻以及當(dāng)前時刻往前6 min時刻的2個時間序列，即按上述處理后，共計有7×2=14個0.03°×0.03°大小的圖片通道；

(5)每個待預(yù)報格點在每個通道上按東10、西13、南8、北6個格點距離拓展進(jìn)行切片處理，每個切片大小為24×15，14個通道得到14個通道的24×15分辨率的小圖片，實際輸入大小為24×15×14=5040。

1.5 CNN模型設(shè)計

按上述方法對雷達(dá)、閃電數(shù)據(jù)進(jìn)行切片及切片壓縮處理后，對于每一個預(yù)報格點，可以得到14個通道、24×15分辨率的小圖片，將這14個通道的圖片作為神經(jīng)網(wǎng)絡(luò)模型的輸入，按“兩次卷積-池化-兩次卷積-池化-展開-全連接層-全連接層-激活函數(shù)(sigmoid)激活輸出”的流程建立深度學(xué)習(xí)模型，具體如圖3所示，模型中各個處理單元設(shè)計如下：

圖3 CNN設(shè)計模型示意圖Fig.3 Diagram of the model design of convolutional neural network

(1)卷積層：選用2×2濾波器，移動步長為1，采用邊界不填0的卷積處理方式。這主要是考慮使用的4個參數(shù)的數(shù)值存在較多0值的情況，如果采用0值填邊的話會使神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時以為邊界沒有天氣活動，進(jìn)而引起較大的誤差。通道數(shù)按輸入通道數(shù)的1.25倍數(shù)遞增(取整)，采用層標(biāo)準(zhǔn)化技術(shù)(batch normalization)對每層輸入值進(jìn)行規(guī)范化處理，最后按激活函數(shù)(relu)對卷積層做非線性激活，隨意節(jié)點丟棄率(dropout)取值為0.15，防止模型的過擬合，將結(jié)果傳遞到下一層模型中。

(2)池化層：按最大池化(max pooling)模式進(jìn)行池化操作，移動步長為2，采用邊界不填0的卷積處理方式，理由同卷積層的設(shè)計。

(3)全連接層：在兩次卷積-池化操作后，將輸出的多通道圖片按單列格點展開，進(jìn)行全連接操作。全連接共兩層，全連接節(jié)點設(shè)置為64、32，每個全連接層都采用層標(biāo)準(zhǔn)化技術(shù)對輸入值進(jìn)行規(guī)范化處理，選用激活函數(shù)(relu)，隨意節(jié)點丟棄率(dropout)取值為0.15，防止模型的過擬合，最后使用激活函數(shù)(sigmoid)對前面神經(jīng)網(wǎng)絡(luò)運(yùn)算結(jié)果進(jìn)行最后預(yù)測，定義最后的預(yù)測值>0.5為Y=1類標(biāo)簽，預(yù)測值≤0.5為Y=0類標(biāo)簽，得到0、1的二分類結(jié)果。

對于Y標(biāo)簽按如下規(guī)則確定：以本文討論的15～30 min預(yù)報為例，若預(yù)報網(wǎng)格在預(yù)報時刻往后的15～30 min監(jiān)測到云地閃，則不管該時段內(nèi)發(fā)生多少次閃電，都標(biāo)記為1，沒有監(jiān)測到云地閃即標(biāo)記為0。

1.6 數(shù)據(jù)與模型訓(xùn)練

以2017年3—10月、2018年3—7月福建省雷達(dá)、閃電監(jiān)測數(shù)據(jù)為樣本，對每個月選取當(dāng)月閃電定位監(jiān)測數(shù)據(jù)文本文件大小最大的兩個日期，對每個選取日期按每個小時、每個雷達(dá)時次、每個經(jīng)緯度網(wǎng)格進(jìn)行切片選取(X輸入)與對應(yīng)15～30 min后該經(jīng)緯度網(wǎng)格雷電發(fā)生情況(Y二分類標(biāo)簽)進(jìn)行提取。由于Y=0且X大部分?jǐn)?shù)據(jù)為0值(即各個網(wǎng)格的雷達(dá)、閃電數(shù)據(jù)基本為0，對應(yīng)預(yù)報時效內(nèi)沒有閃電)的情況占所遴選樣本的比例非常大，因此在數(shù)據(jù)提取時判定當(dāng)X數(shù)據(jù)中雷達(dá)組合反射率的值大于20 dBz的個數(shù)占比小于10%時，本次樣本提取放棄；此外由于閃電定位監(jiān)測數(shù)據(jù)存在一定的偏差，經(jīng)常出現(xiàn)在同一時間段，某個閃電數(shù)據(jù)的發(fā)生位置與當(dāng)時的閃電集中區(qū)域偏離較大的情況，為了使訓(xùn)練樣本Y=1的標(biāo)簽降低噪聲、干擾的情況，樣本提取時剔除閃電定位方法為2站、雷電流幅值絕對值≤2 kA、某個閃電前后10 min內(nèi)距離本次閃電0.5°范圍內(nèi)沒有其他閃電監(jiān)測記錄的閃電數(shù)據(jù)。為了避免訓(xùn)練樣本出現(xiàn)0、1標(biāo)簽個數(shù)差別太大的情況，對當(dāng)前得到的所有訓(xùn)練樣本進(jìn)行隨機(jī)遴選，根據(jù)計算機(jī)的計算負(fù)荷，設(shè)置總量為80 000個樣本，遴選0、1樣本個數(shù)各40 000個，進(jìn)入后續(xù)的網(wǎng)絡(luò)訓(xùn)練。具體網(wǎng)絡(luò)訓(xùn)練采用Adam優(yōu)化器，即在梯度下降進(jìn)行迭代求最優(yōu)解的基礎(chǔ)上，根據(jù)一階梯度矩估計、二階梯度矩估計計算更新步長的優(yōu)化模型，設(shè)置初始學(xué)習(xí)率為0.001，模型學(xué)習(xí)率自動衰減為0.9，設(shè)置單次訓(xùn)練樣本數(shù)(batch size)為120，選取10%的樣本容量作為測試數(shù)據(jù)，選擇二分類損失函數(shù)(binary crossentropy)為損失計算方式，設(shè)置最大訓(xùn)練次數(shù)為500次，將訓(xùn)練過程中準(zhǔn)確率最好的參數(shù)矩陣保存為最終訓(xùn)練結(jié)果。

按上述方法與規(guī)則對模型進(jìn)行訓(xùn)練，繪制整個訓(xùn)練過程的損失(losses)與準(zhǔn)確率(accuracy)曲線(圖4)。由圖4可知，損失曲線下降的速度適均，說明模型設(shè)計的初始學(xué)習(xí)率可行；最終測試集損失控制在0.430 1，測試集準(zhǔn)確率為0.798 5，測試集與訓(xùn)練集的損失、準(zhǔn)確率曲線基本貼合，訓(xùn)練后期也沒有出現(xiàn)明顯的分開，表明模型沒有出現(xiàn)明顯的過擬合現(xiàn)象，也說明按本文設(shè)計的訓(xùn)練數(shù)據(jù)提取、遴選方法可行，保證了數(shù)據(jù)集數(shù)據(jù)質(zhì)量的一致性與噪聲的隨機(jī)分布。整個訓(xùn)練模型在大概訓(xùn)練350個訓(xùn)練次數(shù)后開始趨于平穩(wěn)，模型學(xué)習(xí)率經(jīng)自動衰減100個訓(xùn)練次數(shù)仍沒有明顯下降和變化，可見模型在這時基本已訓(xùn)練到飽和，整個模型的訓(xùn)練過程合理、可行。

圖4 模型訓(xùn)練損失曲線(a)和準(zhǔn)確率曲線(b)Fig.4 Curves of model training losses (a) and accuracy (b)

2 應(yīng)用與檢驗

本文所建立與訓(xùn)練的模型在福建省2019年的汛期工作(3—10月)中得到完整的應(yīng)用。從總體上看本文討論的15～30 min雷電預(yù)警效果總體表現(xiàn)穩(wěn)定和良好，取2019年4月22日14時的預(yù)報、實況圖(圖5)為例，由圖可見，模型預(yù)報的幾個雷電發(fā)生區(qū)域在15～30 min后的都有閃電發(fā)生。需要說明的是，預(yù)報圖中對預(yù)報格點按福建省邊界外圍一定距離做了裁剪，因此實況圖中左下角的閃電并非沒有預(yù)報出來，而是被裁剪。

圖5 2019年4月22日14時的15～30 min雷電預(yù)報(a)、實況(b)對比Fig.5 The 15-30 min lightning nowcasting (a) and observation (b) at 14:00 BT 22 April 2019

為了更精確了解本模型的實際準(zhǔn)確率情況，本文按系統(tǒng)動力抬升型雷電過程、副高邊緣局地?zé)崂妆┻^程這兩種福建省主要雷電天氣類別，選取了2019年主要雷電天氣(兩種類型各選取10 d)作為樣本進(jìn)行TS評分計算，結(jié)果表明：

動力抬升型雷電過程， TS平均評分為0.716，平均漏報率、空報率分別為0.095、0.190；

局地?zé)崂妆┬屠纂娺^程，TS平均評分為0.694，平均漏報率、空報率分別為0.112、0.194。

檢驗結(jié)果表明，模型對前汛期動力抬升型的雷電過程預(yù)警效果略微好于夏季局地?zé)崂妆┑睦纂娺^程，考慮到閃電定位系統(tǒng)本身存在的誤差，且福建省多山地地形，這樣的預(yù)報結(jié)果基本可以接受。有研究采用雷達(dá)與閃電閾值控制算法，對福建省進(jìn)行格點化雷電臨近預(yù)警應(yīng)用，按雷達(dá)組合反射率37 dBz、垂直液態(tài)水含量1.5 kg·m-2、回波頂高11 km作為雷達(dá)預(yù)警控制的閾值，研究中直接閃電預(yù)警判定距離為10 km，間接閃電預(yù)警判定距離為15 km，閃電預(yù)警解除判定距離為15 km，最后分析得出其TS評分為0.671(張燁方等，2019)。相比之下，本文設(shè)計與訓(xùn)練的CNN模型的準(zhǔn)確率有了一定提升。

3 結(jié)論與展望

本文以雷達(dá)產(chǎn)品(組合反射率、液態(tài)水含量、回波頂高)和閃電數(shù)據(jù)為指標(biāo)，對CNN模型進(jìn)行了適應(yīng)雷電臨近預(yù)警需求的改進(jìn)和調(diào)整，對改進(jìn)后的模型進(jìn)行了訓(xùn)練、檢驗，得出以下結(jié)論：

(1)本文設(shè)計的切片式處理方法可以解決CNN在氣象格點預(yù)報應(yīng)用中遇到的像素級分類問題，設(shè)計的格點壓縮算法可以在短時間、一般計算硬件的條件下，得到一個省范圍內(nèi)的格點預(yù)報產(chǎn)品，滿足臨近預(yù)警服務(wù)對時效性的要求。檢驗表明設(shè)計的模型在預(yù)警效果上比常規(guī)采用“配料法-閾值控制”的雷電臨近預(yù)警模型有了一定的提高，模型對動力抬升型雷電過程的預(yù)警效果稍微好于副熱帶高壓邊緣局地?zé)崂妆┻^程的預(yù)警效果。

(2)原始訓(xùn)練數(shù)據(jù)的質(zhì)量對模型的訓(xùn)練效果有很大影響，原始數(shù)據(jù)噪聲的大小、不同類別標(biāo)簽的數(shù)量比例遴選不合理甚至可能會使訓(xùn)練的模型矩陣出現(xiàn)預(yù)報結(jié)果全是0或1的“垃圾輸出”；此外，在雷電臨近預(yù)警領(lǐng)域，對閃電定位數(shù)據(jù)進(jìn)行適宜的修訂可以有效提高模型的訓(xùn)練準(zhǔn)確率，本文按“剔除2站定位、雷電流幅值絕對值≤2 kA、某個閃電前后10 min 內(nèi)距離本次閃電0.5°范圍沒有其他閃電監(jiān)測記錄的閃電數(shù)據(jù)”的條件對訓(xùn)練的閃電數(shù)據(jù)進(jìn)行了剔除和修訂后，模型的訓(xùn)練準(zhǔn)確率提高了近0.10，是模型訓(xùn)練過程中各個環(huán)節(jié)、參數(shù)調(diào)整中準(zhǔn)確率變化最大的地方。

(3)1～2 h預(yù)報思路展望。相較傳統(tǒng)的雷達(dá)回波相關(guān)性跟蹤(TREC)的外推算法，本文所建立基于切片式處理、CNN模型的雷電臨近預(yù)警模型在預(yù)報區(qū)域的外推上，初步具有變形外推的效果，但在不少方面仍有改進(jìn)和不足的地方。如：模型沒有根據(jù)不同的天氣系統(tǒng)進(jìn)行分類訓(xùn)練、預(yù)警；模型在參數(shù)的選擇上沒有把高程、土壤、云閃及潛勢預(yù)報的因子列入其中；限于計算硬件設(shè)備的影響，本文輸入數(shù)據(jù)的時間序列時段、切片大小有限等。需要看到的是，單純依靠上述模型只能滿足15～60 min的雷電預(yù)警需求，要做1～2 h的預(yù)警產(chǎn)品，需要再引入其他強(qiáng)天氣潛勢預(yù)報涉及的物理量，但這些物理量在格點精度、時間序列點上與雷達(dá)、閃電的數(shù)據(jù)無法同步，這也是影響1～2 h臨近預(yù)報格點產(chǎn)品效果的重要因素，本文研究項目也正嘗試對這些物理量進(jìn)行基于深度學(xué)習(xí)網(wǎng)絡(luò)模型的處理，努力將其融入到本文所研究模型的1～2 h預(yù)報產(chǎn)品中，以更好地實現(xiàn)人工智能技術(shù)在雷電臨近預(yù)警工作中的有效應(yīng)用。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡