国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合LightGBM的Res Next氣象目標細粒度識別方法

2024-01-18 00:00:00歐陽彤汪玲朱岱寅李勇
系統(tǒng)工程與電子技術 2024年12期
關鍵詞:深度學習融合

關鍵詞:氣象雷達;氣象目標識別;殘差網絡;輕量級梯度提升機;融合;深度學習

中圖分類號:TN957.5 文獻標志碼:A DOI:10.12305/j.issn.1001-506X.2024.12.12

0引言

氣象目標識別對于保證人類美好生活具有重要意義。氣象雷達是氣象目標識別的基礎設施,其依靠發(fā)送和接收電磁波來獲取大氣中的目標相關信息,通過雷達回波對目標位置、特征形態(tài)等信息進行判別。常規(guī)多普勒氣象雷達發(fā)送單一方向電磁波并由回波得到單一方向的反射率因子等參數。但僅依靠單一方向信息很難反映出氣象目標的形態(tài)、空間取向等方面的具體情況,因此無法實現對氣象目標的準確識別。同時或交替發(fā)射水平和垂直方向的電磁波代替單一方向回波,可得到兩個相互垂直極化方向電磁波間的差分反射率、相關系數、差分相移率等極化參數,雙極化氣象雷達由此誕生。雙極化氣象雷達憑借這些極化參數,能更有效地獲取氣象目標相態(tài)、類型等方面的具體情況,彌補常規(guī)多普勒氣象雷達存在的不足,在氣象目標識別領域具有巨大優(yōu)勢,有力推動了氣象目標識別技術的發(fā)展[1 7]。

在雷達實際工作中,雷達掃描照射到地面物體或者空中生物時,其回波除氣象回波以外,還包含非氣象回波。非氣象回波混雜于氣象回波之中,影響氣象回波數據質量,并影響氣象目標分類。所以,對氣象目標的識別研究一直以來都是氣象雷達數據質量控制的一個重要內容[811]。多年來,模糊邏輯算法作為氣象目標識別領域的主流算法,在氣象目標識別中做出巨大貢獻,但是由于模糊邏輯算法的運行需要依靠專家經驗,通用性不佳[12]。

針對傳統(tǒng)模糊邏輯算法存在的不足,研究者們開始將無需依靠經驗值的機器學習算法應用至氣象目標識別領域。2019年,Golbon-Haghighi等[13]提出一種新的三維判別函數,作為其所提出的改進地雜波識別算法的一部分,有效區(qū)分天氣信號與雜波信號的概率密度函數,再選用一個簡單的貝葉斯分類器,最后做出基于三維判別函數的最佳決策,從天氣信號中區(qū)分出雜波。2020年,Ma等[14]指出使用貝葉斯方法可有效完成對融化層與非融化層的判別,進而改善干雪和小雨兩類氣象目標的相互誤判。2021年,Jatau等[15]利用S波段雷達的高靈敏度特性,以所提出的鳥類(昆蟲)特征為數據驅動,訓練出成熟的嶺回歸分類器,結合水凝物分類算法,有效完成鳥類回波、昆蟲回波與氣象目標回波之間的分離工作。2022 年,Makinen等[16]提出一種有監(jiān)督的貝葉斯概率方法,得到雷達回波單個距離元中非氣象回波的細粒度識別,有效區(qū)分出7類氣象目標和12類非氣象目標。2023年,歐陽彤等[17]提出一種基于輕量級梯度提升機(lightgradientboosting machine,LightGBM)算法的氣象目標分類技術,實現中小雨、冰雹、濕雪與雜波的4類氣象目標的識別。

此外,一些研究者開始將可根據數據驅動自動優(yōu)化的卷積神經網絡(convolutionalneuralnetwork,CNN)應用于氣象目標識別工作中。2019 年,Lu 等[18]首先將雷達極化參數等效于圖像通道信息,將氣象目標識別類比于圖像識別,以5個CNN 為基礎模型,實現4 種氣象目標的分類過程,之后以其中識別最準確的殘差CNN 為最終模型,得到對4類氣象目標的最優(yōu)識別。2020 年,Yu 等[19]使用基礎CNN 有效解決機載氣象雷達回波識別領域中氣象目標與地雜波的判別問題。2022 年,高涌荇等[20]采用殘差CNN解決雙極化氣象雷達天氣信號檢測問題,得到比CNN、支持向量機等算法更優(yōu)的識別結果,此算法大大提升對天氣信號的識別準確性。

CNN 算法具有強大的數據識別與分類能力,比如文獻[20]中使用的基于殘差CNN 的氣象目標識別方法,具有極其優(yōu)秀的識別率,但是這種識別方法需要類比于圖像分類,通過把切割分塊的極化參量與圖像通道信息進行對應,以數據樣本粒度單位為塊狀矩陣,識別結果也以塊為基本單位并呈塊狀分布,塊內占比較少目標被忽視,識別結果較為粗糙。而在實際情況中,雷達獲取信息以雷達距離單元為基本單位,塊狀樣本單元包含多個距離單元,且氣象目標分類分布往往是離散的、不確定的,導致樣本塊中距離單元類型不唯一。因此,此類算法容易造成塊內小區(qū)域的識別偏差且在分界線上會出現與實際天氣分布不符的識別結果,識別精準度不足。而文獻[17]中給出的基于LightGBM算法的氣象目標識別方法以雷達采樣單元為數據樣本進行預測,能夠有效實現氣象目標細粒度識別,但是在識別準確度方面仍有較大提升空間。

基于上述分析,本文針對雙極化雷達氣象目標識別問題,在文獻[17]和文獻[20]的研究基礎上,提出融合Light-GBM 算法細粒度識別與CNN 高識別率特性,將殘差網絡的殘差網絡(residualnetworkofresidualnetwork:nextgeneration,ResNeXt)[21]與LightGBM 算法[22]相結合,提出一種氣象目標識別方法,簡稱為LightGBM-ResNeXt,實現對氣象目標高精度且細粒度的識別。選用具有快速和準確選擇能力且性能優(yōu)于殘差網絡(residualnetwork,Res-Net)的ResNeXt為第一層算法,得到高精度的粗粒度識別結果,再將此結果與實際標簽的差異值輸入第二層Light-GBM 分類器,得到符合實際要求的細粒度識別結果。實驗結果表明,相對于LeNet (Lecun net)和ResNet,ResNeXt對氣象目標識別有更高的識別率,融合LightG-BM 算法的分類器之后,識別粒度得到高度提升,與雷達采樣單元粒度一致。

1Light GBM-ResNeXt氣象目標識別

CNN氣象目標識別算法,需將雷達極化參數等效于圖像通道,將極化參數制作成塊狀樣本,轉換成與圖像分類相似的任務,實現氣象目標識別。參考分類圖像如圖1所示。此類方法識別精度高、識別迅速,但是由于其基于切割后塊狀數據樣本進行識別,所以識別結果也只能趨向數據切割后的參考結果,如圖1(b)所示。

對比圖1(a)和圖1(b)可知,美國國家海洋和大氣管理局(National Oceanicand Atmospheric Administration,NOAA)的原始參考圖像中氣象目標分布比較離散,而切割參考圖像呈塊狀分布,兩者在識別粒度上存在較大差距。LightGBM 算法通過離散數據生成向量數據來反映特征和目標類別的關系,是一種可以完成以雷達采樣單元為單位的、點到點識別的機器學習分類算法。LightGBM 算法的機器學習算法識別結果如圖1(c)所示。可見,LightGBM算法的識別分布與圖1(a)中原始參考數據表現相同,誤識別較多,如圖1(c)紅藍標注所示。

為進一步得到高精度且細粒度的氣象目標識別結果,本文將具有離散特性的LightGBM 算法的分類器與具有高精度識別能力的CNN融合使用,建立一種兼并LightGBM算法細粒度識別特性與CNN 高精度識別能力的氣象目標識別方法。CNN 融合LightGBM 算法的細分類器的整體識別過程具體步驟如圖2 所示。首先,制作矩陣塊樣本數據集,再根據數據集特性搭建ResNeXt分類模型框架,將矩陣塊數據集輸入模型并訓練。將ResNeXt氣象目標識別模型輸出的粗粒度識別結果CH 與NOAA 原始參考目標進行點對點對比。若識別正確,則將該點識別結果保存為CNN 識別結果CH;若判別失誤,則將ResNeXt判別結果與實際參考值的差異雷達距離單元數據輸入訓練Light-GBM 算法的分類器。再由LightGBM 算法的分類器進行細化識別,優(yōu)化粗粒度識別結果,將差異雷達距離單元點識別結果保存為LightGBM 算法的細化結果LH。最后,得到與實際氣象分布相符的高精度且細粒度的識別結果。

2算法原理

2.1ResNeXt氣象目標粗粒度識別網絡

隨著計算機不斷優(yōu)化,CNN 在圖像分類領域已取得優(yōu)越成果[23]。研究表明,CNN 的深化和拓展可以優(yōu)化傳統(tǒng)模型的準確性,但是隨著網絡層數的加深,會導致梯度爆炸、梯度消失甚至網絡退化等問題。為解決這些問題,ResNet[24]提出以殘差卷積結構取締基礎卷積結構,從而解決由網絡深化產生的網絡退化問題。然后,研究者又提出ResNeXt,ResNeXt 模型將視覺幾何組(visualgeometrygroup,VGG)網絡[25]的堆疊理念、ResNet的重復策略和Inception網絡[26]的拆分轉換合并的思想相結合,不僅解決了由網絡深化產生的梯度消失等問題,而且能保持ResNet的基本網絡結構。只需要對殘差卷積模塊進行拓寬,即可在不增加參數復雜度的基礎上,提高識別精度,并且在一定程度上削減超參數的數目。

ResNeXt模型的主要思想是在ResNet模型基礎上進行分組卷積,使得模型精度提升,但復雜度幾乎不變。圖3為普通卷積網絡、ResNet、ResNeXt等效變換結構圖。在圖3(a)~圖3(c)的過程中,殘差卷積結構取締普通卷積結構,解決由網絡深化產生的梯度消失等問題。之后,分組殘差結構又取締了殘差卷積結構,在保障復雜度幾乎不變的前提下,進一步提高模型精度。

本文將氣象目標與雜波(生物雜波與地雜波)的識別等效于圖像識別,數據集樣本矩陣尺寸大小預定為4×24×24,以ResNeXt原始網絡模型為基礎,修改網絡參數,設計適用于本文數據集的ResNeXt,最終完成氣象目標與雜波識別。本文ResNeXt結構如圖4所示。

3模型訓練與驗證

3.1數據集制作

本文數據集來源于NOAA提供的雙極化雷達氣象數據記錄。選取氣象雷達站點代碼為KVNX 的雷達在2021年全年的觀測數據,從中提取雷達仰角為0.5°的4 個極化參數(反射率因子、差分反射率、相關系數、差分相移率)以及對應的NOAA 分類結果數據,將5類數據分別記為Z、Zdr、Kdp、ρhv、Cls。

作為一種信息單向傳播的前饋多層網絡,CNN 以圖片的GRB (green,red,blue)通道信息為數據驅動,可以通過層層轉化,自動學習圖像特征,最終達到分類的目的。本文以反射率因子、差分反射率、相關系數、差分相移率這4 個極化參數為識別輸入數據,結合NOAA 分類標簽制作數據集標簽。這些極化參數與圖像通道信息雖有差距,但可以對極化參數預處理,在保證這些極化參數的通用性的同時,可將這些極化參數等效于圖像通道信息,堆疊4 個極化參數二維數據矩陣,形成三維數據陣列。最后,以這些三維數據陣列為數據集,類比于圖像分類,利用CNN,完成氣象目標與非氣象目標的區(qū)分。

數據集的制作過程如圖5 所示。首先,在網站所提供的數據中,Z數據的大小為360×460,其他數據的大小為360×1200。為得到有效可靠的數據集,需先對Z 進行校準,得到與其他數據大小對應的Z。處理后,各數據矩陣大小均為360×1200,這與實際圖像尺寸不符。此外,在單次掃描范圍內,由于氣象目標分類分布往往是離散的、不確定的,導致氣象目標中摻雜大量雜波目標以及一些無效值。因此,為保證單個數據矩陣數據樣本質量,需要盡可能避免混雜回波的干擾,并對無效值數據進行處理。綜上,需要將雷達極化參數做如下處理,以生成適配CNN 訓練的數據集。首先,將原始極化參數矩陣校準并堆疊。其次,進行切割分塊,將原來的360×1200大尺寸二維矩陣拆分為750個24×24的小尺寸二維矩陣塊,再舍棄無效值點超過80%的矩陣塊。此時,矩陣塊中依然包含氣象目標、雜波以及一些無效值。因此,將占比超過50% 的類別記為此矩陣塊類別,將其他數據視為無效數據并舍棄。之后,選用各矩陣塊中有效值的均值替代該矩陣塊中包含的無效值。最后,將極化參數進行歸一化處理,使得網絡模型與數據擬合更加高效。為保障兩類數據樣本均衡,選取氣象目標與雜波樣本量均為15000,再將此數據集隨機切割為比例為7∶2∶1的訓練集、驗證集與測試集。

3.2 ResNeXt訓練

本文以Pytorch[30]為深度學習框架,完成ResNeXt、LeNet、ResNet氣象目標識別模型以及LightGBM 算法細分類器的創(chuàng)建。本研究內核為分類,故選用交叉熵損失函數為模型損失函數,再使用隨機梯度下降(stochasticgradi-entdescent,SGD)優(yōu)化器,利用梯度下降調整網絡權重,優(yōu)化器參數設置如表1 所示。在訓練過程中,設置批量大小為128,迭代次數為400,確保模型訓練成功。

深度學習過程的一個重要特性是比較學習結果與樣本標簽兩者的差距,兩者差距越小,表示模型學習效果越強。深度學習普遍以損失函數來表示這個差距,理論上,損失函數越小越好,但是其不可能為零,只能無限逼近于零。當損失函數收斂時,可以判斷網絡模型學習成功。此外,分類準確率在分類問題中是描述分類算法性能的有力工具,因此本文以損失函數和準確率來說明模型性能。為充分表現ResNeXt模型對氣象目標與非氣象目標的識別能力,本文以相同數據集訓練LeNet模型[31]和ResNet,對比二者與ResNeXt的性能表現。圖6~圖9為訓練過程中訓練集與驗證集的損失函數、準確率變換曲線。從圖6 和圖7 可以看出,隨著迭代次數的增加,ResNeXt、LeNet、ResNet的訓練集與驗證集損失函數迅速下降并穩(wěn)定,并且未出現過擬合現象。由此可見,模型成功完成訓練。由圖8和圖9可知,ResNeXt識別準確度要強于LeNet和ResNet,這與理論上各模型的性能表現一致。此外,ResNeXt的訓練集、驗證集訓練曲線在穩(wěn)定時的識別準確率均超過99.6%,這表示ResNeXt在氣象目標與非氣象目標的判別問題上具有良好性能。

為進一步證明模型表現力,使用訓練獲取的3個網絡最優(yōu)模型對測試集進行初步檢測,圖10~ 圖12 為測試集在LeNet、ResNet和ResNeXt最優(yōu)模型上的混淆矩陣。由3個混淆矩陣可以看出,3個CNN 對氣象回波與非氣象回波識別性能都很優(yōu)越,但ResNeXt模型對氣象回波和非氣象回波的識別精度均高于LeNet、ResNet模型,整體識別效果極佳,這與訓練過程中3個模型的表現相符。

由圖6~圖12可以明顯看出,在訓練集、驗證集以及測試集上,ResNeXt模型表現都要優(yōu)于LeNet和ResNet模型,這與理論預測結果相符。

3.3LightGBM算法分類器訓練

將CNN 氣象目標識別模型所輸出的粗粒度識別結果CH 與NOAA 原始參考目標標簽進行點對點對比,將CNN目標樣本塊與參考數據的差異雷達距離單元點數據作為LightGBM 算法細化分類器的輸入數據,訓練LightGBM算法分類器,圖13和圖14 為LightGBM 算法分類器訓練過程曲線。如圖13 和圖14 所示,隨著迭代次數的增加,LightGBM 算法分類器在訓練集、驗證集的損失函數和準確率都迅速趨于穩(wěn)定,未出現過擬合現象,分類器訓練成功。但是,LightGBM 算法分類器對氣象目標與非氣象目標的識別準確度只超過98.6%,識別能力低于CNN。

3.4LightGBM-ResNeXt算法性能驗證

為驗證模型對雷達實際觀測數據的預測能力,本文選取非訓練數據集數據,即NOAA網站上KTLX雙極化天氣雷達2021年4月24日02:56的雷達0.5°仰角觀測回波數據進行測試。圖15為校準后Z、Zdr、Zdp、ρhv原始數據圖像,4個分圖右側坐標軸表示圖中參數值大小與顏色的對應關系。

KTLX 雷達識別結果如圖16 所示。LeNet、ResNet和ResNeXt的氣象目標識別結果如圖16(c)~ 圖16(e)所示。可見,ResNeXt模型將一個雜波樣本塊識別為氣象目標,將兩個氣象目標樣本塊識別為雜波。LeNet模型將4個氣象目標樣本塊誤識別為雜波。ResNet模型則將一個雜波樣本塊識別為氣象目標,將3個氣象目標樣本塊識別為雜波。從誤識別塊數以及與圖16(b)的比較可知,數據切割后,CNN 對氣象目標識別在整體上表現十分優(yōu)越,與切割參考圖像基本一致,且ResNeXt模型對非氣象回波的識別能力要強于LeNet模型和ResNet模型。此外,三卷積網絡模型主要的誤識別在于將氣象目標識別為雜波,這與測試集混淆矩陣的表現一致。

圖16(f)為采用LightGBM 算法的識別結果,與圖16(a)比較可見,LightGBM 算法的識別結果與NOAA參考分類在識別粒度、分布狀態(tài)上表現基本一致,但是LightGBM 算法的識別結果存在一定區(qū)域的誤判,如圖16(f)中黑色方框區(qū)域和黑色橢圓區(qū)域所示。

圖16(g)為ResNeXt結合LigthGBM 算法分類器細化后的識別結果。由圖16比較可知,融合ResNeXt和Light-GBM 算法的LightGBM-ResNeXt氣象目標識別方法能夠有效識別氣象目標與雜波。相對于單一的ResNeXt識別結果而言,識別粒度有效提升;相對于單一的LightGBM 算法識別結果而言,誤判明顯減少,如圖16(g)中不存在圖16(f)中黑色方框和黑色橢圓區(qū)域所示的誤判;LightGBM-ResNeXt氣象目標識別方法對氣象目標的識別基本上與NOAA 參考數據相同,精確度明顯提高,識別粒度較細。

4結論

為有效區(qū)分氣象目標與雜波,本文提出一種基于ResNeXt網絡并融合LightGBM 算法的氣象目標識別方法。該方法融合LightGBM 算法細粒度識別能力與ResNeXt高精度識別特性,采用氣象雷達實測數據對本文所建立的識別模型進行驗證。實驗結果表明,ResNeXt識別模型性能要優(yōu)于LeNet、ResNet模型,識別精度可達99.6%以上,但是識別單元較大,識別結果較粗糙。Light-GBM 算法的分類器雖然可以實現以雷達距離單元為識別單位的氣象目標識別,但是對兩類目標的識別精度只能達到98%。而融合LightGBM 算法之后的ResNeXt模型,不僅具有ResNeXt模型的準確識別能力,還擁有LightGBM 算法的精細識別優(yōu)勢,能精細且高精度地識別氣象目標與雜波,其結果相比于CNN 識別結果而言更加精細,識別精度又優(yōu)于LightGBM 算法的分類器,與參考結果一致性極高。

作者簡介

歐陽彤(1997—),女,碩士研究生,主要研究方向為氣象雷達目標識別。

汪玲(1977—),女,教授,博士,主要研究方向為雷達信號處理。

朱岱寅(1974—),男,教授,博士,主要研究方向為合成孔徑雷達/逆合成孔徑雷達成像、自聚焦算法、干涉合成孔徑雷達成像、合成孔徑雷達地面動目標指示、機載雷達動目標指示。

李勇(1977—),男,副教授,博士,主要研究方向為雷達信號處理、雷達系統(tǒng)。

猜你喜歡
深度學習融合
一次函數“四融合”
村企黨建聯(lián)建融合共贏
融合菜
從創(chuàng)新出發(fā),與高考數列相遇、融合
寬窄融合便攜箱IPFS500
《融合》
現代出版(2020年3期)2020-06-20 07:10:34
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
信阳市| 民县| 平山县| 益阳市| 正安县| 庆城县| 马山县| 河西区| 宁阳县| 武邑县| 伊宁县| 平湖市| 会理县| 方山县| 德令哈市| 兴化市| 上犹县| 南召县| 西昌市| 武鸣县| 北流市| 从化市| 孝昌县| 泉州市| 天台县| 慈溪市| 平阳县| 石林| 双牌县| 专栏| 巴南区| 德兴市| 民乐县| 高淳县| 广安市| 桓台县| 佛冈县| 静海县| 石首市| 瑞金市| 杨浦区|