国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機(jī)森林的雷達(dá)輻射源識別算法研究

2022-02-22 05:47:52劉藝林李勝勇李偉鵬林曉烘
電光與控制 2022年2期
關(guān)鍵詞:輻射源先驗識別率

劉藝林, 李勝勇, 李偉鵬,3, 林曉烘, 毛 盾

(1.海軍工程大學(xué),武漢 430000; 2.中國人民解放軍91715部隊,廣州 510000; 3.陸軍勤務(wù)學(xué)院,重慶 401000)

0 引言

隨著電子科學(xué)的發(fā)展,現(xiàn)代戰(zhàn)場的電磁環(huán)境也變得越來越復(fù)雜,雷達(dá)輻射源識別作為電子偵察的重要環(huán)節(jié)在日益復(fù)雜的電磁環(huán)境下作用更加凸顯。由于截獲的雷達(dá)信號信噪比較低,傳統(tǒng)的模板匹配雷達(dá)輻射源識別方法識別率低下[1]。當(dāng)前基于神經(jīng)網(wǎng)絡(luò)[2-3]、支持向量機(jī)(SVM)[4]、深度學(xué)習(xí)[5-6]、遷移學(xué)習(xí)[7]等方法的雷達(dá)輻射源識別,有的對先驗樣本信噪比要求較高,有的只針對部分型號雷達(dá)識別率較高,有的存在時效性不佳的問題,這將嚴(yán)重影響目標(biāo)威脅等級判斷,致使指揮員戰(zhàn)場決策失誤。

隨機(jī)森林是一種統(tǒng)計學(xué)理論,它具有很高的預(yù)測準(zhǔn)確率,不易出現(xiàn)過擬合[8-9]。為解決上述問題,本文提出了基于隨機(jī)森林的雷達(dá)輻射源型號識別的算法。該算法以雷達(dá)信號的載頻、脈寬、脈沖重復(fù)周期為識別特征向量,通過隨機(jī)抽取訓(xùn)練集的方式構(gòu)建“森林”中的決策樹分類器,當(dāng)有新的識別特征向量輸入時,“森林”中每個決策樹對其進(jìn)行歸類并通過投票選出最終識別結(jié)果。實驗表明,該方法在測試數(shù)據(jù)誤差小于30%時,識別率能達(dá)到95%以上,耗時低于0.2 s,在先驗樣本誤差大于測試數(shù)據(jù)誤差的情況下也可以取得較好的識別效果。

1 隨機(jī)森林基本原理

隨機(jī)森林是一個由決策樹分類器集合{hk(x,θk)|k=1,2,…,n}構(gòu)成的組合分類模型[10],其中,每一個決策樹分類器hk(x,θk)均由原始數(shù)據(jù)集θ中隨機(jī)抽取的訓(xùn)練集θk訓(xùn)練而成。當(dāng)有新的樣本x輸入隨機(jī)森林時,所有決策樹h(x)都對新的樣本x進(jìn)行歸類得到結(jié)果,最后通過投票選出票數(shù)最多的結(jié)果作為最終歸類結(jié)果

(1)

式中:H(x)為組合分類模型;Y為最終歸類的結(jié)果;hk(x)為單個決策樹分類器;y為單個決策樹分類器歸類的結(jié)果;I(·)為示性函數(shù)。

對于一個給定的隨機(jī)森林組合分類模型{hk(x)|k=1,2,…,n},其原始數(shù)據(jù)集為(X,Y) ,則其余量函數(shù)可表示為

(2)

余量函數(shù)用來度量平均正確分類數(shù)超過平均錯誤分類數(shù)的程度,余量值越大,分類預(yù)測越可靠。當(dāng)決策樹足夠多時,hk(X)=h(X,θk)服從于強(qiáng)大數(shù)定律,其泛化誤差可寫為

(3)

這說明隨機(jī)森林不會隨著決策樹的增加而產(chǎn)生過擬合的問題。

2 基于隨機(jī)森林的雷達(dá)輻射源型號識別

相較于傳統(tǒng)的模板匹配法,隨機(jī)森林具有良好的適應(yīng)性和抗噪性,既能處理離散數(shù)據(jù),也能處理連續(xù)數(shù)據(jù),對先驗樣本質(zhì)量要求不高。隨機(jī)森林由決策樹組合構(gòu)建而成,由于決策樹結(jié)構(gòu)簡單、迭代次數(shù)較少,隨機(jī)森林相較于神經(jīng)網(wǎng)絡(luò)等算法具有更佳的時效性。

基于隨機(jī)森林的雷達(dá)輻射源型號識別選取脈沖描述字(PDW)中的載頻(CF)、脈寬(PW)和脈沖重復(fù)周期(PRI)3個參數(shù)作為識別特征,主要有以下幾個步驟:1) 通過隨機(jī)采樣從先驗樣本集中抽取任意個子集作為訓(xùn)練集;2) 使用訓(xùn)練樣本構(gòu)建決策樹分類器;3) 將多個決策樹進(jìn)行組合,通過投票得出最終識別結(jié)果。具體過程如圖1所示。

圖1 基于隨機(jī)森林的雷達(dá)輻射源識別過程Fig.1 The process of radar emitter identification based on random forest

2.1 隨機(jī)抽取樣本集

用于輻射源識別的先驗樣本集θ={SI|I=1,2,…,N}由N個先驗樣本組成,每個樣本SI包含了某一雷達(dá)輻射源的識別特征向量xI和與之對應(yīng)的雷達(dá)型號yI,可表示為

SI==<(fI,wI,rI),yI>

(4)

式中,fI,wI和rI作為識別特征分別表示某一雷達(dá)輻射源的載頻、脈寬和脈沖重復(fù)周期的值。

采用bootstrap重抽樣方法從先驗樣本集θ中進(jìn)行m次有放回的抽樣,每次隨機(jī)抽取n個樣本作為訓(xùn)練集θk={si|i=1,2,…,n},k=1,2,…,m,要求訓(xùn)練集樣本數(shù)n≤N,訓(xùn)練集中樣本si的識別特征不超過3個,如圖2所示。

圖2 從先驗樣本中隨機(jī)抽取訓(xùn)練集Fig.2 Drawing samples randomly from the priori sample set as the training set

2.2 構(gòu)建決策樹

構(gòu)建決策樹分類器可分為以下幾步。

1) 將訓(xùn)練集θk作為根節(jié)點的數(shù)據(jù)集D。

2) 針對該節(jié)點,遍歷數(shù)據(jù)集D中每一個識別特征的參數(shù)a,用該特征參數(shù)將集合分裂成2個子集D1和D2,并計算劃分后的基尼指數(shù)

(5)

找到使得基尼指數(shù)最小的特征參數(shù)a,并以此作為“分裂點”,依據(jù)“分裂點”將訓(xùn)練集分為2個子集θk1和θk2。

3) 判斷2個子集θk1和θk2是否都屬于同一雷達(dá),若其中任一子集的所有元素均屬于同一雷達(dá),則標(biāo)記該子集為“樹葉”,若不屬于同一雷達(dá),則將該子集視作新的節(jié)點,重復(fù)2)。

4) 判斷是否所有子集都被標(biāo)記為“樹葉”,若都被標(biāo)記為“樹葉”,則算法結(jié)束;若存在未被標(biāo)記為“樹葉”的分支,則重復(fù)3)。

構(gòu)建決策樹算法流程如圖3所示。

圖3 構(gòu)建決策樹流程Fig.3 The process of building the decision tree classifier

2.3 組合歸類

將所有決策樹放在一個集合中便構(gòu)成隨機(jī)森林{h1(x),h2(x),…,hm(x)},當(dāng)有一組新的識別特征向量x=(f,w,r)輸入隨機(jī)森林時,“森林”中的每一個決策樹都對這組參數(shù)進(jìn)行識別。最終統(tǒng)計所有決策樹的識別結(jié)果,決定票數(shù)最多的作為最終識別結(jié)果,可表示為

(6)

式中:x為一組新的識別特征向量;hk(x)為單個決策樹分類器;y為單個決策樹分類器歸類的結(jié)果;Y為最終歸類的結(jié)果。組合歸類過程如圖4所示。

圖4 組合歸類過程Fig.4 The process of combination categorization

3 仿真實驗分析

由于采集輻射源參數(shù)時會受到外部電磁環(huán)境、偵收設(shè)備差異的影響,新輸入樣本可能與先驗樣本存在不同程度的誤差。為驗證基于隨機(jī)森林的雷達(dá)輻射源型號識別的有效性,仿真生成包含8種雷達(dá)輻射源的特征參數(shù),如表1所示。以上述8種雷達(dá)輻射源的特征參數(shù)為基礎(chǔ),分別加入0%,10%,20%和30%誤差構(gòu)成4組數(shù)據(jù),每組數(shù)據(jù)由1600個輻射源樣本構(gòu)成,其中,每類輻射源有200個樣本,4組數(shù)據(jù)的分布如圖5所示。使用4組數(shù)據(jù)對基于隨機(jī)森林的雷達(dá)輻射源識別的效果和穩(wěn)健性進(jìn)行分析。仿真實驗使用軟件為Matlab R2020a,計算機(jī)配置為Intel(R) Core(TM) i7-9700 CPU@3.00 GHz,內(nèi)存16 GiB,Windows 7 旗艦版64位操作系統(tǒng)。

表1 仿真雷達(dá)特征參數(shù)Table 1 Simulation of radar characteristic parameters

圖5 仿真數(shù)據(jù)分布Fig.5 Simulation data distribution

3.1 識別效果分析

分別使用誤差10%,20%和30%的數(shù)據(jù)作為先驗樣本集與測試數(shù)據(jù),訓(xùn)練并測試隨機(jī)森林。調(diào)整“森林”中決策樹的數(shù)量,識別率隨決策樹數(shù)量的變化情況如圖6所示,算法耗時情況如圖7所示。

從圖6可以看出,對于誤差為10%,20%和30%的數(shù)據(jù),隨著數(shù)據(jù)誤差的增加,隨機(jī)森林算法的識別率會逐漸下降,當(dāng)決策樹數(shù)量大于10時,對3組數(shù)據(jù)識別率均能達(dá)到95%以上,隨著決策樹數(shù)量的增加,識別率逐漸提高,并且當(dāng)決策樹數(shù)量從1增加到5時,識別率迅速提高。從圖7可以看出,隨機(jī)森林算法耗時隨決策樹數(shù)量增加呈線性分布,當(dāng)決策樹數(shù)量達(dá)到50時,算法耗時小于0.2 s。

圖6 隨機(jī)森林識別率變化情況Fig.6 The change of recognition rate of random forest

圖7 隨機(jī)森林算法耗時變化情況Fig.7 The change of time consumption of random forest

設(shè)置BP神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元數(shù)量為3、輸出層神經(jīng)元數(shù)量為8、最大迭代次數(shù)為1000、迭代速率為1.2、訓(xùn)練精度為0.005、調(diào)整參數(shù)方式為彈性梯度下降法,使用誤差為10%,20%和30%的數(shù)據(jù)分別作為先驗樣本集與測試數(shù)據(jù),訓(xùn)練并測試BP神經(jīng)網(wǎng)絡(luò)。調(diào)整隱含層神經(jīng)元數(shù),其識別率的變化情況如圖8所示,算法耗時情況如圖9所示。

圖8 BP神經(jīng)網(wǎng)絡(luò)識別率變化情況Fig.8 The change of recognition rate of BP neural network

由圖8可以看出,BP神經(jīng)網(wǎng)絡(luò)隨著神經(jīng)元數(shù)的增加,識別率逐漸提高,當(dāng)數(shù)據(jù)誤差為30%時,識別率下降明顯。由圖9可以看出,算法耗時曲線受彈性梯度下降方式的影響有較大波動,當(dāng)隱含層神經(jīng)元數(shù)不超過60時,算法耗時低于1.3 s。對比可以看出,相較于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)算法,隨機(jī)森林算法明顯具有更高的時效性。

圖9 BP神經(jīng)網(wǎng)絡(luò)耗時變化情況Fig.9 The change of time consumption of BP neural network

3.2 穩(wěn)健性分析

使用誤差為10%,20%和30%的數(shù)據(jù)分別作為先驗樣本集,訓(xùn)練得到3個由20個決策樹組成的隨機(jī)森林,然后依次使用誤差為0%,10%,20%和30%的數(shù)據(jù)作為測試數(shù)據(jù)進(jìn)行識別,結(jié)果如表2所示。

表2 隨機(jī)森林識別情況Table 2 The recognition rate of random forest

再次使用誤差為10%,20%和30%的數(shù)據(jù)分別作為先驗樣本集,訓(xùn)練得到3個隱含層有30個神經(jīng)元的三層BP神經(jīng)網(wǎng)絡(luò),然后依次使用誤差為0%,10%,20%和30%的數(shù)據(jù)作為測試數(shù)據(jù)進(jìn)行識別,結(jié)果如表3所示。

表3 BP神經(jīng)網(wǎng)絡(luò)識別情況Table 3 The recognition rate of BP neural network

從表2可以看出,隨機(jī)森林的泛化誤差會隨著先驗樣本誤差的增加而增加,當(dāng)先驗樣本誤差大于等于測試數(shù)據(jù)誤差時,算法仍具有較高的識別率。從表3可以看出,當(dāng)先驗樣本誤差與測試數(shù)據(jù)誤差相差較大時,BP神經(jīng)網(wǎng)絡(luò)算法的識別率下降明顯。對比可得,相較于BP神經(jīng)網(wǎng)絡(luò)算法,隨機(jī)森林算法具有更強(qiáng)的穩(wěn)健性。

4 結(jié)束語

本文研究了基于隨機(jī)森林的雷達(dá)輻射源型號識別算法。該算法首先通過隨機(jī)采樣得到樣本集;然后使用樣本集構(gòu)建決策樹分類器;當(dāng)有新的輻射源特征參數(shù)輸入時,所有決策樹都對其進(jìn)行歸類,通過投票選出票數(shù)最多的歸類作為最終識別結(jié)果。通過仿真實驗分析,證實了該算法不僅擁有較好的穩(wěn)健性,同時具有較好的實時性,可為雷達(dá)輻射源型號識別的工程應(yīng)用提供有益的借鑒。

猜你喜歡
輻射源先驗識別率
基于博弈論的GRA-TOPSIS輻射源威脅評估方法
基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測
基于無噪圖像塊先驗的MRI低秩分解去噪算法研究
基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識別率的關(guān)系
數(shù)字電視外輻射源雷達(dá)多旋翼無人機(jī)微多普勒效應(yīng)實驗研究
外輻射源雷達(dá)直升機(jī)旋翼參數(shù)估計方法
提升高速公路MTC二次抓拍車牌識別率方案研究
基于自適應(yīng)塊組割先驗的噪聲圖像超分辨率重建
基于遷移成分分析的雷達(dá)輻射源識別方法研究
高速公路機(jī)電日常維護(hù)中車牌識別率分析系統(tǒng)的應(yīng)用
新和县| 龙山县| 瓦房店市| 年辖:市辖区| 上思县| 疏附县| 祁门县| 禹城市| 三门县| 伊金霍洛旗| 七台河市| 巴塘县| 疏勒县| 广平县| 莱州市| 行唐县| 赤城县| 舒城县| 龙山县| 玛曲县| 白水县| 贵德县| 赤城县| 淳化县| 丹棱县| 建始县| 五常市| 玉田县| 枣阳市| 辽阳县| 内丘县| 韶山市| 澎湖县| 岳阳市| 河北区| 德化县| 桂阳县| 都安| 海淀区| 东乌珠穆沁旗| 申扎县|