国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于深度學(xué)習(xí)的無人機(jī)識別方法

2020-12-25 02:09黃湘鵬黃曉剛
雷達(dá)與對抗 2020年2期
關(guān)鍵詞:特征向量聚類卷積

黃湘鵬,黃曉剛

(海軍裝備部駐南京地區(qū)第四軍事代表室,南京 211106)

0 引 言

在過去幾年中,小型無人駕駛飛機(jī)的普及迅速發(fā)展,并且有望進(jìn)一步增加。小型無人機(jī)在軍事領(lǐng)域和民用領(lǐng)域都得到越來越廣泛的應(yīng)用,例如獲得重要事件的電視錄像或在危險(xiǎn)地區(qū)提供急救支持。無人機(jī)在給人們生活帶來便利的同時(shí)也對個(gè)人隱私、社會安全、軍事安全等領(lǐng)域構(gòu)成了嚴(yán)重威脅。[1-2]如何更快、更精確地實(shí)現(xiàn)無人機(jī)的檢測和識別是無人機(jī)反制的前提,但小型無人機(jī)由于飛行速度較慢、飛行高度較低等原因很難被檢測到。此外,飛鳥可能會導(dǎo)致無人機(jī)檢測系統(tǒng)出現(xiàn)很多的虛警。因此,不僅必須及時(shí)檢測進(jìn)來的無人機(jī),而且要將其歸類為可疑的、具有潛在危險(xiǎn)的人造目標(biāo)。

一般來說,小型無人機(jī)的檢測和識別可以使用不同的傳感器執(zhí)行,例如聲學(xué)傳感器、高分辨率紅外傳感器、光學(xué)傳感器和雷達(dá)等。通常,通過聲傳感器進(jìn)行的檢測很不可靠,因?yàn)樾⌒蜔o人機(jī)相對安靜,并且在城市中環(huán)境噪聲水平一般較高。利用光學(xué)圖像實(shí)現(xiàn)無人機(jī)檢測和識別是一種常用手段。隨著機(jī)器學(xué)習(xí)及深度學(xué)習(xí)技術(shù)的發(fā)展,越來越多的研究者選擇構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò)實(shí)現(xiàn)無人機(jī)分類,在有足夠訓(xùn)練資源的情況下可以達(dá)到較好的性能。[3]高分辨紅外傳感器能夠在一定距離檢測無人機(jī),檢測后可以通過放大目標(biāo)區(qū)域以獲得支持分類的詳細(xì)圖像。但是,紅外傳感器無法提供目標(biāo)的速度和范圍,既不適合大區(qū)域搜索也不適合霧天等惡劣天氣條件下運(yùn)行,而這些卻是雷達(dá)的強(qiáng)項(xiàng)。國外有些研究者使用高重頻雷達(dá)獲取目標(biāo)微多普勒特征,實(shí)現(xiàn)無人機(jī)分類。[4-6]本文聚焦于無人機(jī)與飛鳥的分類識別,提出一種基于深度學(xué)習(xí)的無人機(jī)識別方法。主要工作有:(1)構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò),利用深度學(xué)習(xí)網(wǎng)絡(luò)強(qiáng)大的學(xué)習(xí)能力,對目標(biāo)RCS序列進(jìn)行特征學(xué)習(xí),獲得特征向量后使用邏輯回歸進(jìn)行分類;(2)針對無人機(jī)數(shù)據(jù)遠(yuǎn)少于飛鳥數(shù)據(jù)量的問題,基于SMOTE(Synthetic Minority Over-sampling Technique)算法提出聚類SMOTE算法,一定程度上緩解了數(shù)據(jù)不平衡問題。通過實(shí)測數(shù)據(jù)驗(yàn)證,本文方法具有良好的分類性能,在無人機(jī)識別正確率達(dá)到87%的同時(shí)過濾掉60%的飛鳥目標(biāo)。

1 處理流程

圖1為無人機(jī)識別流程。首先由雷達(dá)回波提取目標(biāo)RCS序列,訓(xùn)練集和測試集數(shù)據(jù)獨(dú)立采集,可驗(yàn)證方法的有效性;然后對訓(xùn)練集和測試集數(shù)據(jù)分別進(jìn)行預(yù)處理,本文采用均值方差歸一化,測試集使用訓(xùn)練集的均值方差進(jìn)行歸一化;訓(xùn)練集數(shù)據(jù)由于存在數(shù)據(jù)不平衡的問題,使用聚類SMOTE算法插值平衡;使用平衡后的訓(xùn)練集訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò),使用測試集驗(yàn)證訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)。

圖1 無人機(jī)識別流程

2 深度學(xué)習(xí)網(wǎng)絡(luò)

2.1 網(wǎng)絡(luò)結(jié)構(gòu)

本文的深度學(xué)習(xí)網(wǎng)絡(luò)使用卷積神經(jīng)網(wǎng)絡(luò)搭建,有1個(gè)輸入層、兩個(gè)卷積層加池化層、1個(gè)全連接層和1個(gè)輸出層。卷積核大小為3*1。卷積層及全連接層激活函數(shù)均為ReLU函數(shù)。第2層卷積層及全連接層接dropout,隨機(jī)失活一半的神經(jīng)元,以緩解過擬合現(xiàn)象。訓(xùn)練時(shí)訓(xùn)練集數(shù)據(jù)批量輸入,大小為N*12*1(其中N為批大小,12為序列長度,1為通道數(shù))。經(jīng)過第1層卷積后輸出特征圖大小為N*12*32,經(jīng)過池化后特征圖大小為N*6*32。第2層卷積后輸出特征圖大小為N*6*64,經(jīng)過池化后特征圖大小為N*3*64。全連接層輸出128維特征向量,輸出層輸出目標(biāo)為無人機(jī)的置信度,越接近1則無人機(jī)的置信度越高。圖2為無人機(jī)識別網(wǎng)絡(luò)結(jié)構(gòu)。

圖2 無人機(jī)識別網(wǎng)絡(luò)結(jié)構(gòu)

2.2 卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)模型中的重要內(nèi)容。[7]在傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)中引用了卷積核、池化層等操作,實(shí)現(xiàn)了權(quán)值共享,具有強(qiáng)大的特征提取能力,并且相對于全連接網(wǎng)絡(luò)有效減少了網(wǎng)絡(luò)參數(shù),在一定程度上緩解了過擬合,提升了網(wǎng)絡(luò)的性能。

卷積神經(jīng)網(wǎng)絡(luò)由輸入層、輸出層及多個(gè)隱藏層構(gòu)成。隱藏層一般包括卷積層、池化層。池化層接在卷積層后面,減少特征維數(shù)。輸入樣本在輸入后首先經(jīng)過卷積層,與卷積核進(jìn)行卷積,然后加上偏置。經(jīng)過卷積后輸出的特征向量再輸入池化層進(jìn)行特征降維。一般網(wǎng)絡(luò)中有多個(gè)卷積層和池化層。卷積層的輸出作為池化層的輸入,池化層的輸出作為下一層卷積的輸入。重復(fù)上述的卷積池化操作,直至達(dá)到設(shè)定的網(wǎng)絡(luò)深度。在卷積和池化操作后,輸出的特征向量一般會使用非線性激活函數(shù)激活映射成非線性特征。卷積神經(jīng)網(wǎng)絡(luò)的最后一層或幾層一般是全連接層。全連接層的作用是對卷積結(jié)構(gòu)提取的抽象特征進(jìn)行合并整合。在網(wǎng)絡(luò)末尾通常會連接著logistic回歸或softmax分類器,實(shí)現(xiàn)二分類或者多分類。

2.3 卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練

和其他的人工神經(jīng)網(wǎng)絡(luò)類似,卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程通常分為前向傳播和后向傳播兩個(gè)主要過程。[8]前向傳播表達(dá)了特征信息的傳遞。反向傳播主要是傳播誤差,計(jì)算梯度通過梯度下降方法實(shí)現(xiàn)參數(shù)的更新,并使參數(shù)最終收斂至全局最小或局部最先值。

(1) 前向傳播

全連接層前向傳播公式可以表示為

al=σ(al-1wl+bl)

(1)

其中,σ()為非線性激活函數(shù),一般有Sigmoid、tanh、ReLU等。

卷積層的前向傳播公式可表示為

al=σ(al-1*wl+bl)

(2)

池化層是對卷積得到的特征圖進(jìn)行下采樣的過程,主要有平均池化、最大池化等方式。

(2) 后向傳播

? 最后一層的殘差

(3)

δL=▽aCeσ′(zL)

(4)

? 全連接層殘差反向傳播公式

δl=((wl+1)Tδl+1)·σ′(zl)

(5)

? 全連接層權(quán)重及偏置更新公式

(6)

(7)

? 卷積層殘差反向傳播公式

δl=δl+1*rot180(wl+1)·σ′(zl)

(8)

? 卷積層權(quán)重及偏置更新公式

(9)

(10)

池化層殘差反向傳播時(shí),如果是最大池化層,則下一層的誤差項(xiàng)的值會原封不動(dòng)地傳遞到上一層對應(yīng)區(qū)塊中的最大值所對應(yīng)的神經(jīng)元,而其他神經(jīng)元的誤差項(xiàng)的值都為零。如果是平均池化層,下一層的誤差項(xiàng)會平均分配到上一層對應(yīng)區(qū)塊中的所有神經(jīng)元。

3 聚類SMOTE算法

在進(jìn)行鳥和無人機(jī)的數(shù)據(jù)處理時(shí),由于鳥類數(shù)據(jù)多,無人機(jī)數(shù)據(jù)少,鳥類樣本是無人機(jī)樣本的好幾倍,數(shù)據(jù)集存在嚴(yán)重的不平衡問題,因此可能會導(dǎo)致模型學(xué)到的分類決策面傾向鳥類一側(cè),導(dǎo)致無人機(jī)分裂損失過大,無法有效識別無人機(jī)。數(shù)據(jù)集不平衡問題是機(jī)器學(xué)習(xí)中經(jīng)常遇到的一類問題。在不平衡問題中一般將樣本多的類稱為多數(shù)類,樣本少的類稱為少數(shù)類。在像本文的這種二分類問題中,將多數(shù)類稱為負(fù)類,少數(shù)類稱為正類。由于樣本數(shù)量的嚴(yán)重傾斜,直接分類具有很大的偏向性。多數(shù)類的分類準(zhǔn)確率相對較高,少數(shù)類的分類準(zhǔn)確率相對較低。不均衡數(shù)據(jù)的分類問題是機(jī)器學(xué)習(xí)、深度學(xué)習(xí)領(lǐng)域的重要研究內(nèi)容之一,在均衡數(shù)據(jù)集上表現(xiàn)良好的分類方法在不均衡數(shù)據(jù)集上往往會暴露出很多問題。常用的解決方法主要分為兩個(gè)層面:數(shù)據(jù)層面和算法層面。數(shù)據(jù)層面包括上采樣、下采樣和混合采樣,算法層面主要包括單類學(xué)習(xí)、集成學(xué)習(xí)、代價(jià)敏感性學(xué)習(xí)等方法,目前比較常用的方法是SMOTE算法。[9]

3.1 SMOTE算法

SMOTE算法是一種過采樣算法,被廣泛應(yīng)用于解決不平衡數(shù)據(jù)集的問題,其主要思想是:對于每一個(gè)少數(shù)類樣本x,搜索其K個(gè)同類最近鄰樣本,若上采樣的倍率是N,則在其K個(gè)最近鄰樣本中隨機(jī)選擇N個(gè)樣本,記為y1,y2,…,yN,在少數(shù)類樣本x和yi(i=1,2,…,N)之間進(jìn)行隨機(jī)線性插值,構(gòu)造新的少數(shù)類樣本pi。公式描述如下:

pi=x+rand(0,1)*(yi-x),i=1,2,…,N

(11)

在使用公式(11)插值后,將新產(chǎn)生的少數(shù)類樣本加入到原來的訓(xùn)練集中產(chǎn)生新的訓(xùn)練集。

3.2 基于聚類的SMOTE

由圖3可以看出,由于未考慮少數(shù)類內(nèi)間聚類問題,直接插值會產(chǎn)生噪聲,導(dǎo)致分類性能下降。因此,本文提出一種基于聚類的SMOTE算法,其基本思想是先利用K-means算法在少數(shù)類內(nèi)部產(chǎn)生聚類,然后圍繞類中心使用SMOTE算法插值。具體步驟如下:

(1) 統(tǒng)計(jì)雜波點(diǎn)數(shù)M、目標(biāo)點(diǎn)數(shù)N(M>N);

(2) 基于ENN(Edited Nearest Neighbor),清理雜波噪聲點(diǎn),假設(shè)有P點(diǎn);

(3) 利用T-SNE對目標(biāo)數(shù)據(jù)可視化,得到目標(biāo)類間聚類數(shù)C;

(4) 基于K-means對目標(biāo)進(jìn)行聚類,聚類數(shù)設(shè)為C,聚類產(chǎn)生C個(gè)類間簇;

(5) 對每個(gè)類間簇使用SMOTE插值,每個(gè)點(diǎn)插值個(gè)數(shù)為(M-N-P)/N。

圖3 SMOTE插值

4 分類性能評價(jià)指標(biāo)

由于類別不平衡,不能簡單地使用平均準(zhǔn)確率作為評價(jià)指標(biāo),因?yàn)槎鄶?shù)類樣本對平均準(zhǔn)確率的影響更大,性能評估度量應(yīng)區(qū)別對待不同類別上的準(zhǔn)確率,最常見的評價(jià)指標(biāo)有F-measure、G-mean、AUC[10]等。為了介紹這些指標(biāo),先要引入模糊矩陣這一概念,如表1所示。

表1 混淆矩陣

TP表示實(shí)際為正例被分為正例的樣本數(shù),同理FN、FP、TN分別表示對應(yīng)情況的樣本數(shù),顯然有TP+FN+FP+TN=樣本總數(shù)。精準(zhǔn)度是分類問題常用的評價(jià)指標(biāo),在樣本平衡時(shí)可以有效地反映分類器的分類性能。

(12)

針對不平衡數(shù)據(jù)集,常用的評價(jià)指標(biāo)有F-measure、G-mean、ROC曲線和AUC。

(13)

(14)

可以看出,G-mean值綜合考慮了兩類的分類準(zhǔn)確率,相對于單獨(dú)使用準(zhǔn)確率而言,能夠更好地衡量分類器的分類性能,不均衡數(shù)據(jù)集下常用的衡量指標(biāo)。

在本文中,分類器采用卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)末尾使用logistic回歸輸出樣本是無人機(jī)的置信度。實(shí)際上,可以設(shè)置一系列置信度閾值,大于閾值則認(rèn)為是正類(無人機(jī)),小于閾值則認(rèn)為是負(fù)類(鳥)。因此,可以得到一個(gè)動(dòng)態(tài)的指標(biāo)。一般將“真正類率”(TPR)作為縱軸,“假正類率”(FPR)作為橫軸,得到的曲線稱為ROC曲線。TPR和FPR定義為

(15)

(16)

一般來說,ROC曲線越靠近左上角說明分類器性能越好。為了定量地比較,可以ROC曲線下的面積,也就是AUC值,AUC值越大則說明分類器性能越好。本文綜合使用這幾個(gè)指標(biāo)來評價(jià)無人機(jī)的分類性能。

5 實(shí)錄數(shù)據(jù)驗(yàn)證

5.1 數(shù)據(jù)集

訓(xùn)練集和測試集來自不同日期、不同批次的數(shù)據(jù)。因此,測試集可有效驗(yàn)證方法的泛化能力。從表2可以看出,數(shù)據(jù)集存在嚴(yán)重的不平衡問題,訓(xùn)練集中不平衡比例達(dá)到了8.36。因此,在訓(xùn)練前使用聚類插值方法將無人機(jī)樣本從544個(gè)擴(kuò)充到4 548個(gè)。實(shí)驗(yàn)中也使用了未平衡的原始數(shù)據(jù)訓(xùn)練作為對照比較。

表2 數(shù)據(jù)集

在數(shù)據(jù)輸入網(wǎng)絡(luò)前需要對數(shù)據(jù)預(yù)處理,將數(shù)據(jù)縮放在0~1間。無人機(jī)和鳥樣本示例如圖4所示。

5.2 訓(xùn)練過程及特征可視化

在訓(xùn)練中,隨著訓(xùn)練的進(jìn)行,訓(xùn)練損失會逐漸降低,網(wǎng)絡(luò)會慢慢收斂,測試集的AUC值會逐漸上升。圖5為訓(xùn)練集損失曲線,圖6為測試集AUC變化曲線。

訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)最后一層全連接層輸出網(wǎng)絡(luò)學(xué)習(xí)到的特征向量(如圖7所示),分別為鳥類樣本和無人機(jī)類樣本對應(yīng)的特征向量。為了驗(yàn)證學(xué)習(xí)到的特征向量具有有效的可分性,使用PCA降維可視化(如圖8所示),可以看出數(shù)據(jù)在學(xué)習(xí)到的特征上具有明顯的可分性。

圖4 數(shù)據(jù)集樣本

圖5 訓(xùn)練集損失曲線

圖6 測試集AUC變化曲線

圖7 特征向量

圖8 特征向量可視化結(jié)果

5.3 性能分析

為了驗(yàn)證本文方法的有效性,采用F-measure、G-mean、ROC曲線、AUC 4個(gè)指標(biāo)評價(jià)最終性能,并將使用SMOTE平衡的訓(xùn)練集和未平衡的訓(xùn)練集作為對照組,驗(yàn)證聚類SMOTE解決本文不平衡問題的能力。由表3可以看出,聚類SMOTE方法3種定量指標(biāo)值均優(yōu)于對照組,且由圖9通過ROC曲線可以看出聚類SMOTE的 ROC曲線完全包裹住對照組曲線。實(shí)驗(yàn)結(jié)果可以看出,聚類SMOTE可有效緩解數(shù)據(jù)不平衡問題。將置信度閾值設(shè)為0.5后得到混淆矩陣如表4??梢钥闯?,在無人機(jī)識別率達(dá)到87%的同時(shí)可過濾60%的虛假目標(biāo)。

表3 指標(biāo)對比

表4 混淆矩陣

6 結(jié)束語

由于小型無人機(jī)飛行速度較慢、飛行高度較低且RCS小,飛鳥會導(dǎo)致無人機(jī)檢測系統(tǒng)出現(xiàn)大量虛警。本文聚焦于無人機(jī)和飛鳥的識別問題,使用深度學(xué)習(xí)網(wǎng)絡(luò)對RCS序列進(jìn)行特征學(xué)習(xí),針對數(shù)據(jù)不平衡問題提出聚類SMOTE算法,進(jìn)而實(shí)現(xiàn)無人機(jī)的有效識別。經(jīng)過實(shí)錄數(shù)據(jù)驗(yàn)證,本文方法在無人機(jī)識別準(zhǔn)確率達(dá)到87%的同時(shí)過濾掉60%的飛鳥目標(biāo)。

猜你喜歡
特征向量聚類卷積
基于全卷積神經(jīng)網(wǎng)絡(luò)的豬背膘厚快速準(zhǔn)確測定
一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
克羅內(nèi)克積的特征向量
基于知識圖譜的k-modes文本聚類研究
高中數(shù)學(xué)特征值和特征向量解題策略
一種基于卷積神經(jīng)網(wǎng)絡(luò)的地磁基準(zhǔn)圖構(gòu)建方法
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
一種并行不對稱空洞卷積模塊①
一種改進(jìn)K-means聚類的近鄰傳播最大最小距離算法
基于模糊聚類和支持向量回歸的成績預(yù)測