黃湘鵬,黃曉剛
(海軍裝備部駐南京地區(qū)第四軍事代表室,南京 211106)
在過去幾年中,小型無人駕駛飛機(jī)的普及迅速發(fā)展,并且有望進(jìn)一步增加。小型無人機(jī)在軍事領(lǐng)域和民用領(lǐng)域都得到越來越廣泛的應(yīng)用,例如獲得重要事件的電視錄像或在危險(xiǎn)地區(qū)提供急救支持。無人機(jī)在給人們生活帶來便利的同時(shí)也對個(gè)人隱私、社會安全、軍事安全等領(lǐng)域構(gòu)成了嚴(yán)重威脅。[1-2]如何更快、更精確地實(shí)現(xiàn)無人機(jī)的檢測和識別是無人機(jī)反制的前提,但小型無人機(jī)由于飛行速度較慢、飛行高度較低等原因很難被檢測到。此外,飛鳥可能會導(dǎo)致無人機(jī)檢測系統(tǒng)出現(xiàn)很多的虛警。因此,不僅必須及時(shí)檢測進(jìn)來的無人機(jī),而且要將其歸類為可疑的、具有潛在危險(xiǎn)的人造目標(biāo)。
一般來說,小型無人機(jī)的檢測和識別可以使用不同的傳感器執(zhí)行,例如聲學(xué)傳感器、高分辨率紅外傳感器、光學(xué)傳感器和雷達(dá)等。通常,通過聲傳感器進(jìn)行的檢測很不可靠,因?yàn)樾⌒蜔o人機(jī)相對安靜,并且在城市中環(huán)境噪聲水平一般較高。利用光學(xué)圖像實(shí)現(xiàn)無人機(jī)檢測和識別是一種常用手段。隨著機(jī)器學(xué)習(xí)及深度學(xué)習(xí)技術(shù)的發(fā)展,越來越多的研究者選擇構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò)實(shí)現(xiàn)無人機(jī)分類,在有足夠訓(xùn)練資源的情況下可以達(dá)到較好的性能。[3]高分辨紅外傳感器能夠在一定距離檢測無人機(jī),檢測后可以通過放大目標(biāo)區(qū)域以獲得支持分類的詳細(xì)圖像。但是,紅外傳感器無法提供目標(biāo)的速度和范圍,既不適合大區(qū)域搜索也不適合霧天等惡劣天氣條件下運(yùn)行,而這些卻是雷達(dá)的強(qiáng)項(xiàng)。國外有些研究者使用高重頻雷達(dá)獲取目標(biāo)微多普勒特征,實(shí)現(xiàn)無人機(jī)分類。[4-6]本文聚焦于無人機(jī)與飛鳥的分類識別,提出一種基于深度學(xué)習(xí)的無人機(jī)識別方法。主要工作有:(1)構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò),利用深度學(xué)習(xí)網(wǎng)絡(luò)強(qiáng)大的學(xué)習(xí)能力,對目標(biāo)RCS序列進(jìn)行特征學(xué)習(xí),獲得特征向量后使用邏輯回歸進(jìn)行分類;(2)針對無人機(jī)數(shù)據(jù)遠(yuǎn)少于飛鳥數(shù)據(jù)量的問題,基于SMOTE(Synthetic Minority Over-sampling Technique)算法提出聚類SMOTE算法,一定程度上緩解了數(shù)據(jù)不平衡問題。通過實(shí)測數(shù)據(jù)驗(yàn)證,本文方法具有良好的分類性能,在無人機(jī)識別正確率達(dá)到87%的同時(shí)過濾掉60%的飛鳥目標(biāo)。
圖1為無人機(jī)識別流程。首先由雷達(dá)回波提取目標(biāo)RCS序列,訓(xùn)練集和測試集數(shù)據(jù)獨(dú)立采集,可驗(yàn)證方法的有效性;然后對訓(xùn)練集和測試集數(shù)據(jù)分別進(jìn)行預(yù)處理,本文采用均值方差歸一化,測試集使用訓(xùn)練集的均值方差進(jìn)行歸一化;訓(xùn)練集數(shù)據(jù)由于存在數(shù)據(jù)不平衡的問題,使用聚類SMOTE算法插值平衡;使用平衡后的訓(xùn)練集訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò),使用測試集驗(yàn)證訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)。
圖1 無人機(jī)識別流程
本文的深度學(xué)習(xí)網(wǎng)絡(luò)使用卷積神經(jīng)網(wǎng)絡(luò)搭建,有1個(gè)輸入層、兩個(gè)卷積層加池化層、1個(gè)全連接層和1個(gè)輸出層。卷積核大小為3*1。卷積層及全連接層激活函數(shù)均為ReLU函數(shù)。第2層卷積層及全連接層接dropout,隨機(jī)失活一半的神經(jīng)元,以緩解過擬合現(xiàn)象。訓(xùn)練時(shí)訓(xùn)練集數(shù)據(jù)批量輸入,大小為N*12*1(其中N為批大小,12為序列長度,1為通道數(shù))。經(jīng)過第1層卷積后輸出特征圖大小為N*12*32,經(jīng)過池化后特征圖大小為N*6*32。第2層卷積后輸出特征圖大小為N*6*64,經(jīng)過池化后特征圖大小為N*3*64。全連接層輸出128維特征向量,輸出層輸出目標(biāo)為無人機(jī)的置信度,越接近1則無人機(jī)的置信度越高。圖2為無人機(jī)識別網(wǎng)絡(luò)結(jié)構(gòu)。
圖2 無人機(jī)識別網(wǎng)絡(luò)結(jié)構(gòu)
卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)模型中的重要內(nèi)容。[7]在傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)中引用了卷積核、池化層等操作,實(shí)現(xiàn)了權(quán)值共享,具有強(qiáng)大的特征提取能力,并且相對于全連接網(wǎng)絡(luò)有效減少了網(wǎng)絡(luò)參數(shù),在一定程度上緩解了過擬合,提升了網(wǎng)絡(luò)的性能。
卷積神經(jīng)網(wǎng)絡(luò)由輸入層、輸出層及多個(gè)隱藏層構(gòu)成。隱藏層一般包括卷積層、池化層。池化層接在卷積層后面,減少特征維數(shù)。輸入樣本在輸入后首先經(jīng)過卷積層,與卷積核進(jìn)行卷積,然后加上偏置。經(jīng)過卷積后輸出的特征向量再輸入池化層進(jìn)行特征降維。一般網(wǎng)絡(luò)中有多個(gè)卷積層和池化層。卷積層的輸出作為池化層的輸入,池化層的輸出作為下一層卷積的輸入。重復(fù)上述的卷積池化操作,直至達(dá)到設(shè)定的網(wǎng)絡(luò)深度。在卷積和池化操作后,輸出的特征向量一般會使用非線性激活函數(shù)激活映射成非線性特征。卷積神經(jīng)網(wǎng)絡(luò)的最后一層或幾層一般是全連接層。全連接層的作用是對卷積結(jié)構(gòu)提取的抽象特征進(jìn)行合并整合。在網(wǎng)絡(luò)末尾通常會連接著logistic回歸或softmax分類器,實(shí)現(xiàn)二分類或者多分類。
和其他的人工神經(jīng)網(wǎng)絡(luò)類似,卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程通常分為前向傳播和后向傳播兩個(gè)主要過程。[8]前向傳播表達(dá)了特征信息的傳遞。反向傳播主要是傳播誤差,計(jì)算梯度通過梯度下降方法實(shí)現(xiàn)參數(shù)的更新,并使參數(shù)最終收斂至全局最小或局部最先值。
(1) 前向傳播
全連接層前向傳播公式可以表示為
al=σ(al-1wl+bl)
(1)
其中,σ()為非線性激活函數(shù),一般有Sigmoid、tanh、ReLU等。
卷積層的前向傳播公式可表示為
al=σ(al-1*wl+bl)
(2)
池化層是對卷積得到的特征圖進(jìn)行下采樣的過程,主要有平均池化、最大池化等方式。
(2) 后向傳播
? 最后一層的殘差
(3)
δL=▽aCeσ′(zL)
(4)
? 全連接層殘差反向傳播公式
δl=((wl+1)Tδl+1)·σ′(zl)
(5)
? 全連接層權(quán)重及偏置更新公式
(6)
(7)
? 卷積層殘差反向傳播公式
δl=δl+1*rot180(wl+1)·σ′(zl)
(8)
? 卷積層權(quán)重及偏置更新公式
(9)
(10)
池化層殘差反向傳播時(shí),如果是最大池化層,則下一層的誤差項(xiàng)的值會原封不動(dòng)地傳遞到上一層對應(yīng)區(qū)塊中的最大值所對應(yīng)的神經(jīng)元,而其他神經(jīng)元的誤差項(xiàng)的值都為零。如果是平均池化層,下一層的誤差項(xiàng)會平均分配到上一層對應(yīng)區(qū)塊中的所有神經(jīng)元。
在進(jìn)行鳥和無人機(jī)的數(shù)據(jù)處理時(shí),由于鳥類數(shù)據(jù)多,無人機(jī)數(shù)據(jù)少,鳥類樣本是無人機(jī)樣本的好幾倍,數(shù)據(jù)集存在嚴(yán)重的不平衡問題,因此可能會導(dǎo)致模型學(xué)到的分類決策面傾向鳥類一側(cè),導(dǎo)致無人機(jī)分裂損失過大,無法有效識別無人機(jī)。數(shù)據(jù)集不平衡問題是機(jī)器學(xué)習(xí)中經(jīng)常遇到的一類問題。在不平衡問題中一般將樣本多的類稱為多數(shù)類,樣本少的類稱為少數(shù)類。在像本文的這種二分類問題中,將多數(shù)類稱為負(fù)類,少數(shù)類稱為正類。由于樣本數(shù)量的嚴(yán)重傾斜,直接分類具有很大的偏向性。多數(shù)類的分類準(zhǔn)確率相對較高,少數(shù)類的分類準(zhǔn)確率相對較低。不均衡數(shù)據(jù)的分類問題是機(jī)器學(xué)習(xí)、深度學(xué)習(xí)領(lǐng)域的重要研究內(nèi)容之一,在均衡數(shù)據(jù)集上表現(xiàn)良好的分類方法在不均衡數(shù)據(jù)集上往往會暴露出很多問題。常用的解決方法主要分為兩個(gè)層面:數(shù)據(jù)層面和算法層面。數(shù)據(jù)層面包括上采樣、下采樣和混合采樣,算法層面主要包括單類學(xué)習(xí)、集成學(xué)習(xí)、代價(jià)敏感性學(xué)習(xí)等方法,目前比較常用的方法是SMOTE算法。[9]
SMOTE算法是一種過采樣算法,被廣泛應(yīng)用于解決不平衡數(shù)據(jù)集的問題,其主要思想是:對于每一個(gè)少數(shù)類樣本x,搜索其K個(gè)同類最近鄰樣本,若上采樣的倍率是N,則在其K個(gè)最近鄰樣本中隨機(jī)選擇N個(gè)樣本,記為y1,y2,…,yN,在少數(shù)類樣本x和yi(i=1,2,…,N)之間進(jìn)行隨機(jī)線性插值,構(gòu)造新的少數(shù)類樣本pi。公式描述如下:
pi=x+rand(0,1)*(yi-x),i=1,2,…,N
(11)
在使用公式(11)插值后,將新產(chǎn)生的少數(shù)類樣本加入到原來的訓(xùn)練集中產(chǎn)生新的訓(xùn)練集。
由圖3可以看出,由于未考慮少數(shù)類內(nèi)間聚類問題,直接插值會產(chǎn)生噪聲,導(dǎo)致分類性能下降。因此,本文提出一種基于聚類的SMOTE算法,其基本思想是先利用K-means算法在少數(shù)類內(nèi)部產(chǎn)生聚類,然后圍繞類中心使用SMOTE算法插值。具體步驟如下:
(1) 統(tǒng)計(jì)雜波點(diǎn)數(shù)M、目標(biāo)點(diǎn)數(shù)N(M>N);
(2) 基于ENN(Edited Nearest Neighbor),清理雜波噪聲點(diǎn),假設(shè)有P點(diǎn);
(3) 利用T-SNE對目標(biāo)數(shù)據(jù)可視化,得到目標(biāo)類間聚類數(shù)C;
(4) 基于K-means對目標(biāo)進(jìn)行聚類,聚類數(shù)設(shè)為C,聚類產(chǎn)生C個(gè)類間簇;
(5) 對每個(gè)類間簇使用SMOTE插值,每個(gè)點(diǎn)插值個(gè)數(shù)為(M-N-P)/N。
圖3 SMOTE插值
由于類別不平衡,不能簡單地使用平均準(zhǔn)確率作為評價(jià)指標(biāo),因?yàn)槎鄶?shù)類樣本對平均準(zhǔn)確率的影響更大,性能評估度量應(yīng)區(qū)別對待不同類別上的準(zhǔn)確率,最常見的評價(jià)指標(biāo)有F-measure、G-mean、AUC[10]等。為了介紹這些指標(biāo),先要引入模糊矩陣這一概念,如表1所示。
表1 混淆矩陣
TP表示實(shí)際為正例被分為正例的樣本數(shù),同理FN、FP、TN分別表示對應(yīng)情況的樣本數(shù),顯然有TP+FN+FP+TN=樣本總數(shù)。精準(zhǔn)度是分類問題常用的評價(jià)指標(biāo),在樣本平衡時(shí)可以有效地反映分類器的分類性能。
(12)
針對不平衡數(shù)據(jù)集,常用的評價(jià)指標(biāo)有F-measure、G-mean、ROC曲線和AUC。
(13)
(14)
可以看出,G-mean值綜合考慮了兩類的分類準(zhǔn)確率,相對于單獨(dú)使用準(zhǔn)確率而言,能夠更好地衡量分類器的分類性能,不均衡數(shù)據(jù)集下常用的衡量指標(biāo)。
在本文中,分類器采用卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)末尾使用logistic回歸輸出樣本是無人機(jī)的置信度。實(shí)際上,可以設(shè)置一系列置信度閾值,大于閾值則認(rèn)為是正類(無人機(jī)),小于閾值則認(rèn)為是負(fù)類(鳥)。因此,可以得到一個(gè)動(dòng)態(tài)的指標(biāo)。一般將“真正類率”(TPR)作為縱軸,“假正類率”(FPR)作為橫軸,得到的曲線稱為ROC曲線。TPR和FPR定義為
(15)
(16)
一般來說,ROC曲線越靠近左上角說明分類器性能越好。為了定量地比較,可以ROC曲線下的面積,也就是AUC值,AUC值越大則說明分類器性能越好。本文綜合使用這幾個(gè)指標(biāo)來評價(jià)無人機(jī)的分類性能。
訓(xùn)練集和測試集來自不同日期、不同批次的數(shù)據(jù)。因此,測試集可有效驗(yàn)證方法的泛化能力。從表2可以看出,數(shù)據(jù)集存在嚴(yán)重的不平衡問題,訓(xùn)練集中不平衡比例達(dá)到了8.36。因此,在訓(xùn)練前使用聚類插值方法將無人機(jī)樣本從544個(gè)擴(kuò)充到4 548個(gè)。實(shí)驗(yàn)中也使用了未平衡的原始數(shù)據(jù)訓(xùn)練作為對照比較。
表2 數(shù)據(jù)集
在數(shù)據(jù)輸入網(wǎng)絡(luò)前需要對數(shù)據(jù)預(yù)處理,將數(shù)據(jù)縮放在0~1間。無人機(jī)和鳥樣本示例如圖4所示。
在訓(xùn)練中,隨著訓(xùn)練的進(jìn)行,訓(xùn)練損失會逐漸降低,網(wǎng)絡(luò)會慢慢收斂,測試集的AUC值會逐漸上升。圖5為訓(xùn)練集損失曲線,圖6為測試集AUC變化曲線。
訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)最后一層全連接層輸出網(wǎng)絡(luò)學(xué)習(xí)到的特征向量(如圖7所示),分別為鳥類樣本和無人機(jī)類樣本對應(yīng)的特征向量。為了驗(yàn)證學(xué)習(xí)到的特征向量具有有效的可分性,使用PCA降維可視化(如圖8所示),可以看出數(shù)據(jù)在學(xué)習(xí)到的特征上具有明顯的可分性。
圖4 數(shù)據(jù)集樣本
圖5 訓(xùn)練集損失曲線
圖6 測試集AUC變化曲線
圖7 特征向量
圖8 特征向量可視化結(jié)果
為了驗(yàn)證本文方法的有效性,采用F-measure、G-mean、ROC曲線、AUC 4個(gè)指標(biāo)評價(jià)最終性能,并將使用SMOTE平衡的訓(xùn)練集和未平衡的訓(xùn)練集作為對照組,驗(yàn)證聚類SMOTE解決本文不平衡問題的能力。由表3可以看出,聚類SMOTE方法3種定量指標(biāo)值均優(yōu)于對照組,且由圖9通過ROC曲線可以看出聚類SMOTE的 ROC曲線完全包裹住對照組曲線。實(shí)驗(yàn)結(jié)果可以看出,聚類SMOTE可有效緩解數(shù)據(jù)不平衡問題。將置信度閾值設(shè)為0.5后得到混淆矩陣如表4??梢钥闯?,在無人機(jī)識別率達(dá)到87%的同時(shí)可過濾60%的虛假目標(biāo)。
表3 指標(biāo)對比
表4 混淆矩陣
由于小型無人機(jī)飛行速度較慢、飛行高度較低且RCS小,飛鳥會導(dǎo)致無人機(jī)檢測系統(tǒng)出現(xiàn)大量虛警。本文聚焦于無人機(jī)和飛鳥的識別問題,使用深度學(xué)習(xí)網(wǎng)絡(luò)對RCS序列進(jìn)行特征學(xué)習(xí),針對數(shù)據(jù)不平衡問題提出聚類SMOTE算法,進(jìn)而實(shí)現(xiàn)無人機(jī)的有效識別。經(jīng)過實(shí)錄數(shù)據(jù)驗(yàn)證,本文方法在無人機(jī)識別準(zhǔn)確率達(dá)到87%的同時(shí)過濾掉60%的飛鳥目標(biāo)。