劉 昉,李奇臨,蔣 涌,楊永毅,張 俊,趙思亮
(重慶市氣象局重慶市氣象信息與技術(shù)保障中心,重慶 401147)
天氣雷達回波數(shù)據(jù)質(zhì)量直接關(guān)系到天氣預報、災害天氣預警的準確性,回波的可靠性在天氣預報預測中具有十分重要的作用。在實際應用中,必須高效篩選異?;夭?,方能大大提高預報效率。
筆者之前研究了基于支持向量機的識別方法,該方法一個重要步驟就是要準確提取出異?;夭▓D像的特征。但是由于異?;夭ǖ谋憩F(xiàn)復雜性,若要準確地提取出來,并且具有代表性,則存在相當難度,也給識別結(jié)果帶來了局限性。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種前饋多層神經(jīng)網(wǎng)絡(luò),是一種在圖像處理領(lǐng)域很常用的深度學習算法[1-2]。其本質(zhì)是一種輸入到輸出的映射,它能夠?qū)W習大量的輸入與輸出之間的映射關(guān)系,而不需要兩者之間的精確的數(shù)學表達式,只要用已知的模式對卷積網(wǎng)絡(luò)加以訓練,網(wǎng)絡(luò)就具有輸入輸出對之間的映射能力。CNN 在圖像識別時可以將原始圖片作為輸入,避免了前期繁瑣的圖像預處理工作,又可以從訓練數(shù)據(jù)中隱式的學習圖像特征,而不用顯式的提取,大大減小特征提取難度的同時又具備了可靠性和廣泛性。再者,CNN 網(wǎng)絡(luò)采用感受野和權(quán)值共享思想,減少了參數(shù)量,縮短了訓練時間,保證了時效性[3-4]。
鑒于CNN 算法的優(yōu)勢,該文將CNN 算法用于雷達異?;夭ǖ淖R別。由于樣本量比較少,選擇VGG這種深層網(wǎng)絡(luò)會引起過度訓練,采用淺層結(jié)構(gòu)的LeNet-5 網(wǎng)絡(luò)比較合適。將VGG 算法中的小卷積核的思想引入LeNet-5 結(jié)構(gòu),用小卷積核級聯(lián)的方式代替原結(jié)構(gòu)中的大卷積核,每次卷積都對權(quán)重進行L2 正則化處理;并且每層都引入ReLU 激活函數(shù)[5-6],在全連接層加入了dropout 層,最終進入softmax 分類器得到輸出結(jié)果。
顧名思義,卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的一個核心算法就是卷積運算。用一個可訓練的濾波器fx去卷積一個輸入的圖像(第一階段是輸入的圖像,后面的階段就是卷積特征圖了),再加一個偏置量bx,便得到卷積層Cx。對卷積層的輸出作一次非線性映射,提高泛化力,這就是激活層。為了降低維度,防止過擬合,池化處理必不可少。池化層又稱下采樣層,是仿照人的視覺系統(tǒng)對視覺輸入對象進行降維和抽象。最后對神經(jīng)元進行全連接,目的將學到的“分布式特征表示”映射到樣本標記空間[7-8]。
LeNet-5 網(wǎng)絡(luò)是一種七層神經(jīng)網(wǎng)絡(luò),最早用于手寫字體識別,具有很高的穩(wěn)定性[9-11]。此網(wǎng)絡(luò)首先提到了感受野的概念,感受野是卷積神經(jīng)網(wǎng)絡(luò)的核心,它的結(jié)構(gòu)表現(xiàn)就是卷積核。LeNet-5 網(wǎng)絡(luò)通過交替連接的卷積層和下采樣層,將原始圖像逐漸轉(zhuǎn)換為一系列的特征圖,并且將這些特征傳遞給全連接的神經(jīng)網(wǎng)絡(luò),以根據(jù)圖像的特征對圖像進行分類。
LeNet-5 網(wǎng)絡(luò)主要由輸入層、卷積層、池化層、全連接層和輸出層組成。首先將圖像進行預處理后輸入第一個卷積層C1,卷積得到特征圖,然后進行下采樣運算,也就是進入池化層S1。將池化后的圖像又經(jīng)過卷積層C2 得到特征圖輸出,接著再次通過池化層S2后進入卷積層C3,將C3輸出后的特征圖進行全連接,得到一個一維向量,最后通過一個分類器輸出。
LeNet-5 網(wǎng)絡(luò)引入了卷積提取特征的思路,并且采用參數(shù)共享、對特征圖池化下采樣和全連接等思想,這些為卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展提供了良好的基礎(chǔ)。
VGG(Visual Geometry Group)是牛津大學計算機視覺組提出的,由此命名[12-14]。通過評估一般采用16 層和19 層兩種深度,其核心思想就是用3×3 的小卷積級聯(lián)核來構(gòu)造各種深度結(jié)構(gòu),達到對大規(guī)模圖像集較高精度的識別效果。
同LeNet-5 網(wǎng)絡(luò)一樣,VGG(16/19)同樣是由輸入層、卷積層、池化層、全連接層以及輸出層組成[15]。其輸入一般是RGB 圖像。卷積層統(tǒng)一采用3×3 的小卷積的堆疊形式,增大了感受野,并且減少了參數(shù)量的同時增強了網(wǎng)絡(luò)的非線性映射能力。在池化層,統(tǒng)一采用了基于2×2 的小池化核的最大池化法(Max-pooling),這樣既進行了最大程度的降維又一定程度地防止了過擬合[16]。此后,使用了3 個全連接層,這也是整個網(wǎng)絡(luò)參數(shù)量最大的地方。
由于本研究所收集到異?;夭▓D像樣本量很小,直接使用VGG 網(wǎng)絡(luò)的話,較深的網(wǎng)絡(luò)層數(shù)反而會造成過擬合;并且由于其3 個全連接層結(jié)構(gòu),還會占用大量的內(nèi)存資源。但若簡單地采用LeNet-5 這個學習模型,又不能很好地提取到到圖像特征,并且網(wǎng)絡(luò)非線性映射能力不足,對識別結(jié)果影響較大。
綜上,文中采用了一種LeNet-5 與VGGNet 相結(jié)合的思路:總體上使用LeNet-5 這個淺層網(wǎng)絡(luò)結(jié)果,用VGGNet 中的卷積核(3×3)級聯(lián)模式代替原網(wǎng)絡(luò)的大卷積核,并且每次卷積都在權(quán)重上進行L2 正則化;采用VGGNet 中的基于2×2 的小池化核的最大池化法;并且每層輸出都使用ReLU 激活函數(shù)來增加非線性映射能力。最后,在全連接層后引入Dropout層,防止樣本數(shù)據(jù)過少而產(chǎn)生過擬合。
如圖1 所示,該文采用的學習網(wǎng)絡(luò)結(jié)構(gòu)一共有10 層(不含輸入層)。
圖1 學習網(wǎng)絡(luò)結(jié)構(gòu)圖
將原始圖像縮放到256×256×3,然后將灰度值進行歸一化處理。由于回波圖像樣本量比較少,因此必須要增強數(shù)據(jù),包括對圖像進行旋轉(zhuǎn)、平移、反轉(zhuǎn)、隨機剪裁等。
統(tǒng)一采用了3×3 小卷積核,兩層卷積為一組;每層卷積時,對參數(shù)的權(quán)重都進行了L2 正則化處理;并且每個卷積輸出都經(jīng)過一個ReLU 激活函數(shù)。
使用基于2×2 的小池化核的最大池化法,可以將輸入圖像大小變?yōu)?/2,極大地減小了參數(shù)量。
在兩個全連接層之間加入一個Dropout 層,使神經(jīng)元按照一定概率將其從網(wǎng)絡(luò)中舍去,這樣就很好地優(yōu)化了過擬合問題。
由于雷達回波圖像異常識別屬于二值分類問題,那么,最后經(jīng)過第二個全連接層,使其輸出為2個神經(jīng)元。
該實驗的數(shù)據(jù)都是來自于新一代天氣雷達回波圖,其中90%來源于重慶現(xiàn)有的四部天氣雷達。一共有圖像462 張,其中正常圖像370 張,異?;夭?2 張。如此小的樣本量是由于雷達的異?;夭ǔ霈F(xiàn)概率較小,并且很多時候是重復形式出現(xiàn)。那么首先要做的就是數(shù)據(jù)增強,通過圖像幾何算法來擴充樣本。將兩類圖像各自數(shù)量的60%作為訓練集,40%作為測試集。
考慮到網(wǎng)絡(luò)層之間連接量的問題,結(jié)合所收集的雷達回波樣本圖特點(有用信息只集中在中心圓形區(qū)域),故將預處理后的圖像再進行一個剪裁,統(tǒng)一大小為160×160,作為訓練網(wǎng)絡(luò)的輸入。為了最大限度地保留圖像邊界信息,在卷積時,填充模式Padding 選SAME,這樣輸出和輸入尺寸大小一樣。卷積核個數(shù)分別采用20 和50 兩種。
網(wǎng)絡(luò)主要結(jié)構(gòu)參數(shù)如表1 所示。
表1 網(wǎng)絡(luò)主要結(jié)構(gòu)參數(shù)表
其中,最大量參數(shù)主要集中在第一個全連接層。由于是二值分類問題,第一個全連接的輸出通過ReLU 激活函數(shù)后進入只有兩個神經(jīng)元的第二個全連接層,最后輸出的2 個神經(jīng)元進入softmax 分類器得到判別結(jié)果。
將天氣雷達回波圖像分為正常和異常兩大類。一部分包含RDA 反射率顯示界面信息,一部分只有回波圖。
圖2 選取正?;夭颖緢D
實驗在win7 系統(tǒng)上安裝Anaconda3,將樣本以8∶2 的比例隨機分為訓練集和驗證集,由于樣本量太少,本實驗未設(shè)置測試機,直接用驗證集代替。輸入圖像大小為160×160,每次訓練迭代100 次,每次迭代選取樣本數(shù)為32。
圖4 中,橫坐標表示迭代次數(shù),圓點和點橫線分別代表訓練集與驗證集的損失率(%);長實線和虛線表示訓練集和驗證集的正確率(%)。由圖可見,隨著迭代次數(shù)的增加,損失率不斷減小,正確率不斷提高。當?shù)话霑r,在驗證集的正確率比較穩(wěn)定的情況下,訓練集的正確率出現(xiàn)波動。在迭代最后,訓練集的正確率有明顯的上升趨勢,達到98%以上;對應的訓練集和驗證集損失率明顯降低,降到了0.1以下,收斂性較好。
該文在Anaconda3 平臺下用python 設(shè)計了一個天氣雷達回波識別系統(tǒng),圖5 用訓練收斂圖作為底圖背景,點擊選擇待檢測圖像按鈕后出現(xiàn)一個對話框,如圖6 所示;選取想要識別的圖像,圖7 就是系統(tǒng)自動給出的判別結(jié)果和概率值。
圖3 選取異?;夭颖緢D
圖4 網(wǎng)絡(luò)訓練圖
此前作者研究了基于支持向量機(SVM)的異?;夭ㄗR別算法,算法時效性和正確率都不具優(yōu)勢。選取同樣的樣本(一共200 張,其中正常回波120 張,異?;夭?0 張),用兩種算法進行測試,表2 給出了對比情況。
圖5 天氣雷達回波識別系統(tǒng)界面
圖6 系統(tǒng)選擇待檢圖像對話框
圖7 系統(tǒng)檢測結(jié)果
表2 兩種算法對比情況
其中,兩種算法的錯誤率主要來源于正常回波圖,由于正常回波的形態(tài)多樣化,引起虛警判別。該文算法相對于基于SVM 算法正確率和時效性都有了顯著提高。
該文采用了卷積神經(jīng)網(wǎng)絡(luò)(CNN)對雷達回波圖像進行二類識別,在LeNet-5 網(wǎng)絡(luò)的淺層框架基礎(chǔ)上引入了VGG 網(wǎng)絡(luò)的一些特點,相比傳統(tǒng)的一些機器學習算法,例如SVM 等,具有更好的準確性和時效性。SVM 算法需要依賴所提取出的準確特征,而深度學習算法不需要明確的找出圖像特征,因此具有很好的泛化能力和魯棒性。該文算法中,正則化系數(shù)的取值是一個影響識別率的重要因素;樣本量的大小也直接決定了網(wǎng)絡(luò)的性能,該文所選樣本量,尤其是異常回波的樣本偏少,影響了識別率;若需提高,則增加訓練樣本量是必須的。