基于CNN 的天氣雷達異常回波圖像識別算法研究

2021-04-20 09:30李奇臨楊永毅趙思亮

電子設(shè)計工程 2021年6期

劉昉，李奇臨，蔣涌，楊永毅，張俊，趙思亮

（重慶市氣象局重慶市氣象信息與技術(shù)保障中心，重慶 401147）

天氣雷達回波數(shù)據(jù)質(zhì)量直接關(guān)系到天氣預報、災害天氣預警的準確性，回波的可靠性在天氣預報預測中具有十分重要的作用。在實際應用中，必須高效篩選異?；夭?，方能大大提高預報效率。

筆者之前研究了基于支持向量機的識別方法，該方法一個重要步驟就是要準確提取出異?；夭▓D像的特征。但是由于異?；夭ǖ谋憩F(xiàn)復雜性，若要準確地提取出來，并且具有代表性，則存在相當難度，也給識別結(jié)果帶來了局限性。

卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN）是一種前饋多層神經(jīng)網(wǎng)絡(luò)，是一種在圖像處理領(lǐng)域很常用的深度學習算法[1-2]。其本質(zhì)是一種輸入到輸出的映射，它能夠?qū)W習大量的輸入與輸出之間的映射關(guān)系，而不需要兩者之間的精確的數(shù)學表達式，只要用已知的模式對卷積網(wǎng)絡(luò)加以訓練，網(wǎng)絡(luò)就具有輸入輸出對之間的映射能力。CNN 在圖像識別時可以將原始圖片作為輸入，避免了前期繁瑣的圖像預處理工作，又可以從訓練數(shù)據(jù)中隱式的學習圖像特征，而不用顯式的提取，大大減小特征提取難度的同時又具備了可靠性和廣泛性。再者，CNN 網(wǎng)絡(luò)采用感受野和權(quán)值共享思想，減少了參數(shù)量，縮短了訓練時間，保證了時效性[3-4]。

鑒于CNN 算法的優(yōu)勢，該文將CNN 算法用于雷達異?；夭ǖ淖R別。由于樣本量比較少，選擇VGG這種深層網(wǎng)絡(luò)會引起過度訓練，采用淺層結(jié)構(gòu)的LeNet-5 網(wǎng)絡(luò)比較合適。將VGG 算法中的小卷積核的思想引入LeNet-5 結(jié)構(gòu)，用小卷積核級聯(lián)的方式代替原結(jié)構(gòu)中的大卷積核，每次卷積都對權(quán)重進行L2 正則化處理；并且每層都引入ReLU 激活函數(shù)[5-6],在全連接層加入了dropout 層，最終進入softmax 分類器得到輸出結(jié)果。

1 卷積神經(jīng)網(wǎng)絡(luò)（CNN）結(jié)構(gòu)

顧名思義，卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的一個核心算法就是卷積運算。用一個可訓練的濾波器fx去卷積一個輸入的圖像（第一階段是輸入的圖像，后面的階段就是卷積特征圖了），再加一個偏置量bx，便得到卷積層Cx。對卷積層的輸出作一次非線性映射，提高泛化力，這就是激活層。為了降低維度，防止過擬合，池化處理必不可少。池化層又稱下采樣層，是仿照人的視覺系統(tǒng)對視覺輸入對象進行降維和抽象。最后對神經(jīng)元進行全連接，目的將學到的“分布式特征表示”映射到樣本標記空間[7-8]。

1.1 LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)

LeNet-5 網(wǎng)絡(luò)是一種七層神經(jīng)網(wǎng)絡(luò)，最早用于手寫字體識別，具有很高的穩(wěn)定性[9-11]。此網(wǎng)絡(luò)首先提到了感受野的概念，感受野是卷積神經(jīng)網(wǎng)絡(luò)的核心，它的結(jié)構(gòu)表現(xiàn)就是卷積核。LeNet-5 網(wǎng)絡(luò)通過交替連接的卷積層和下采樣層，將原始圖像逐漸轉(zhuǎn)換為一系列的特征圖，并且將這些特征傳遞給全連接的神經(jīng)網(wǎng)絡(luò)，以根據(jù)圖像的特征對圖像進行分類。

LeNet-5 網(wǎng)絡(luò)主要由輸入層、卷積層、池化層、全連接層和輸出層組成。首先將圖像進行預處理后輸入第一個卷積層C1，卷積得到特征圖，然后進行下采樣運算，也就是進入池化層S1。將池化后的圖像又經(jīng)過卷積層C2 得到特征圖輸出，接著再次通過池化層S2后進入卷積層C3，將C3輸出后的特征圖進行全連接，得到一個一維向量，最后通過一個分類器輸出。

LeNet-5 網(wǎng)絡(luò)引入了卷積提取特征的思路，并且采用參數(shù)共享、對特征圖池化下采樣和全連接等思想，這些為卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展提供了良好的基礎(chǔ)。

1.2 VGGNet 網(wǎng)絡(luò)結(jié)構(gòu)

VGG（Visual Geometry Group）是牛津大學計算機視覺組提出的，由此命名[12-14]。通過評估一般采用16 層和19 層兩種深度，其核心思想就是用3×3 的小卷積級聯(lián)核來構(gòu)造各種深度結(jié)構(gòu)，達到對大規(guī)模圖像集較高精度的識別效果。

同LeNet-5 網(wǎng)絡(luò)一樣，VGG（16/19）同樣是由輸入層、卷積層、池化層、全連接層以及輸出層組成[15]。其輸入一般是RGB 圖像。卷積層統(tǒng)一采用3×3 的小卷積的堆疊形式，增大了感受野，并且減少了參數(shù)量的同時增強了網(wǎng)絡(luò)的非線性映射能力。在池化層，統(tǒng)一采用了基于2×2 的小池化核的最大池化法（Max-pooling），這樣既進行了最大程度的降維又一定程度地防止了過擬合[16]。此后，使用了3 個全連接層，這也是整個網(wǎng)絡(luò)參數(shù)量最大的地方。

2 改進的學習網(wǎng)絡(luò)

由于本研究所收集到異?；夭▓D像樣本量很小，直接使用VGG 網(wǎng)絡(luò)的話，較深的網(wǎng)絡(luò)層數(shù)反而會造成過擬合；并且由于其3 個全連接層結(jié)構(gòu)，還會占用大量的內(nèi)存資源。但若簡單地采用LeNet-5 這個學習模型，又不能很好地提取到到圖像特征，并且網(wǎng)絡(luò)非線性映射能力不足，對識別結(jié)果影響較大。

綜上，文中采用了一種LeNet-5 與VGGNet 相結(jié)合的思路：總體上使用LeNet-5 這個淺層網(wǎng)絡(luò)結(jié)果，用VGGNet 中的卷積核（3×3）級聯(lián)模式代替原網(wǎng)絡(luò)的大卷積核，并且每次卷積都在權(quán)重上進行L2 正則化；采用VGGNet 中的基于2×2 的小池化核的最大池化法；并且每層輸出都使用ReLU 激活函數(shù)來增加非線性映射能力。最后，在全連接層后引入Dropout層，防止樣本數(shù)據(jù)過少而產(chǎn)生過擬合。

如圖1 所示，該文采用的學習網(wǎng)絡(luò)結(jié)構(gòu)一共有10 層（不含輸入層）。

圖1 學習網(wǎng)絡(luò)結(jié)構(gòu)圖

2.1 圖像預處理

將原始圖像縮放到256×256×3，然后將灰度值進行歸一化處理。由于回波圖像樣本量比較少，因此必須要增強數(shù)據(jù)，包括對圖像進行旋轉(zhuǎn)、平移、反轉(zhuǎn)、隨機剪裁等。

2.2 卷積層

統(tǒng)一采用了3×3 小卷積核，兩層卷積為一組；每層卷積時，對參數(shù)的權(quán)重都進行了L2 正則化處理；并且每個卷積輸出都經(jīng)過一個ReLU 激活函數(shù)。

2.3 池化層

使用基于2×2 的小池化核的最大池化法，可以將輸入圖像大小變?yōu)?/2，極大地減小了參數(shù)量。

2.4 全連接層與Dropout層相結(jié)合

在兩個全連接層之間加入一個Dropout 層，使神經(jīng)元按照一定概率將其從網(wǎng)絡(luò)中舍去，這樣就很好地優(yōu)化了過擬合問題。

2.5 輸出層

由于雷達回波圖像異常識別屬于二值分類問題，那么，最后經(jīng)過第二個全連接層，使其輸出為2個神經(jīng)元。

3 實驗結(jié)果

該實驗的數(shù)據(jù)都是來自于新一代天氣雷達回波圖，其中90%來源于重慶現(xiàn)有的四部天氣雷達。一共有圖像462 張，其中正常圖像370 張，異?；夭?2 張。如此小的樣本量是由于雷達的異?；夭ǔ霈F(xiàn)概率較小，并且很多時候是重復形式出現(xiàn)。那么首先要做的就是數(shù)據(jù)增強，通過圖像幾何算法來擴充樣本。將兩類圖像各自數(shù)量的60%作為訓練集，40%作為測試集。

考慮到網(wǎng)絡(luò)層之間連接量的問題，結(jié)合所收集的雷達回波樣本圖特點（有用信息只集中在中心圓形區(qū)域），故將預處理后的圖像再進行一個剪裁，統(tǒng)一大小為160×160，作為訓練網(wǎng)絡(luò)的輸入。為了最大限度地保留圖像邊界信息，在卷積時，填充模式Padding 選SAME，這樣輸出和輸入尺寸大小一樣。卷積核個數(shù)分別采用20 和50 兩種。

3.1 網(wǎng)絡(luò)主要結(jié)構(gòu)參數(shù)

網(wǎng)絡(luò)主要結(jié)構(gòu)參數(shù)如表1 所示。

表1 網(wǎng)絡(luò)主要結(jié)構(gòu)參數(shù)表

其中，最大量參數(shù)主要集中在第一個全連接層。由于是二值分類問題，第一個全連接的輸出通過ReLU 激活函數(shù)后進入只有兩個神經(jīng)元的第二個全連接層，最后輸出的2 個神經(jīng)元進入softmax 分類器得到判別結(jié)果。

3.2 實驗數(shù)據(jù)

將天氣雷達回波圖像分為正常和異常兩大類。一部分包含RDA 反射率顯示界面信息，一部分只有回波圖。

3.3 訓練模型收斂圖

圖2 選取正?；夭颖緢D

實驗在win7 系統(tǒng)上安裝Anaconda3，將樣本以8∶2 的比例隨機分為訓練集和驗證集，由于樣本量太少，本實驗未設(shè)置測試機，直接用驗證集代替。輸入圖像大小為160×160，每次訓練迭代100 次，每次迭代選取樣本數(shù)為32。

圖4 中，橫坐標表示迭代次數(shù)，圓點和點橫線分別代表訓練集與驗證集的損失率（%）；長實線和虛線表示訓練集和驗證集的正確率（%）。由圖可見，隨著迭代次數(shù)的增加，損失率不斷減小，正確率不斷提高。當?shù)话霑r，在驗證集的正確率比較穩(wěn)定的情況下，訓練集的正確率出現(xiàn)波動。在迭代最后，訓練集的正確率有明顯的上升趨勢，達到98%以上；對應的訓練集和驗證集損失率明顯降低，降到了0.1以下，收斂性較好。

3.4 識別結(jié)果

該文在Anaconda3 平臺下用python 設(shè)計了一個天氣雷達回波識別系統(tǒng)，圖5 用訓練收斂圖作為底圖背景，點擊選擇待檢測圖像按鈕后出現(xiàn)一個對話框，如圖6 所示；選取想要識別的圖像，圖7 就是系統(tǒng)自動給出的判別結(jié)果和概率值。

圖3 選取異?；夭颖緢D

圖4 網(wǎng)絡(luò)訓練圖

3.5 與基于SVM的識別算法比較

此前作者研究了基于支持向量機(SVM)的異?；夭ㄗR別算法，算法時效性和正確率都不具優(yōu)勢。選取同樣的樣本（一共200 張，其中正常回波120 張，異?；夭?0 張），用兩種算法進行測試，表2 給出了對比情況。

圖5 天氣雷達回波識別系統(tǒng)界面

圖6 系統(tǒng)選擇待檢圖像對話框

圖7 系統(tǒng)檢測結(jié)果

表2 兩種算法對比情況

其中，兩種算法的錯誤率主要來源于正常回波圖，由于正常回波的形態(tài)多樣化，引起虛警判別。該文算法相對于基于SVM 算法正確率和時效性都有了顯著提高。

4 結(jié)束語

該文采用了卷積神經(jīng)網(wǎng)絡(luò)（CNN）對雷達回波圖像進行二類識別，在LeNet-5 網(wǎng)絡(luò)的淺層框架基礎(chǔ)上引入了VGG 網(wǎng)絡(luò)的一些特點，相比傳統(tǒng)的一些機器學習算法，例如SVM 等，具有更好的準確性和時效性。SVM 算法需要依賴所提取出的準確特征，而深度學習算法不需要明確的找出圖像特征，因此具有很好的泛化能力和魯棒性。該文算法中，正則化系數(shù)的取值是一個影響識別率的重要因素；樣本量的大小也直接決定了網(wǎng)絡(luò)的性能，該文所選樣本量，尤其是異常回波的樣本偏少，影響了識別率；若需提高，則增加訓練樣本量是必須的。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡