徐洪志 姚家馳 劉 超 李彩霞 蔣東翔 孫騰龍 趙新青
(1.中國人民解放軍32142部隊 河北保定 071000;2.清華大學 北京 100084;3.河北大學 河北保定 071000)
電磁目標識別在軍事領域中具有非常重要的作用,通過識別電磁目標的類型和數(shù)量能夠有助于判斷敵方所使用的設備狀態(tài)及人員規(guī)模,進而提前有針對性地部署相應的作戰(zhàn)方案。目前國內(nèi)外學者對電磁目標識別進行了許多研究,主要有基于卷積神經(jīng)網(wǎng)絡的方法,基于輕量化卷積神經(jīng)網(wǎng)絡的方法,基于深度學習的方法,基于深度神經(jīng)網(wǎng)絡與多任務學習的方法,基于輕量級深度神經(jīng)網(wǎng)絡的方法,基于遷移學習的方法,基于壓縮感知的識別方法,基于模型的識別方法,基于指紋機制的識別方法等。基于神經(jīng)網(wǎng)絡和深度學習的方法雖然識別準確率高,但是復雜的網(wǎng)絡結構會導致計算時間較長,且需要較高的計算硬件條件;基于模型和指紋機制的識別方法需要根據(jù)電磁目標的特點建立相應的數(shù)學模型,雖然能夠準確識別電磁目標,但是存在模型通用性有限等限制。
本項工作針對實際現(xiàn)場環(huán)境中要求快速準確識別出電磁目標的需求,提出一種基于特征提取和機器學習的電磁目標識別方法,同時針對現(xiàn)有電磁目標數(shù)據(jù)庫數(shù)據(jù)有限的情況,提出通過重采樣、改變幅值和信號疊加三種方法擴充現(xiàn)有數(shù)據(jù)庫,通過本項工作既能擴充現(xiàn)有電磁目標數(shù)據(jù)庫,又能實時準確地識別出各電磁目標。
對于電磁目標識別,Anu Jagannath和Jithin Jagannath學者通過研究得到了電磁目標數(shù)據(jù)庫。該數(shù)據(jù)庫主要包含8種信號類型和6種調(diào)制類型,8種信號類型分別為Airborne detection radar、Airborne range radar、Air-Ground MTI radar、Ground mapping radar、Radar Altimeter、SATCOM、AM Radio、Short-range wireless;6種調(diào)制類型分別為Pulsed Continuous wave、Frequency modulated Continuous wave、BPSK、AM-DSB、AM-SSB、ASK。雖然該數(shù)據(jù)庫中已有許多數(shù)據(jù),但是在實際應用中可能還不夠,為了擴充數(shù)據(jù)庫,提出通過重采樣、改變幅值和信號疊加三種方法對現(xiàn)有數(shù)據(jù)庫進行擴充:重采樣指改變電磁信號的采樣頻率;改變幅值指增加或降低電磁信號的幅值;信號疊加指將兩個或兩個以上的電磁信號混合生成新的電磁信號。通過重采樣、改變幅值和信號疊加三種數(shù)據(jù)擴充方法能夠有效擴充現(xiàn)有的電磁目標數(shù)據(jù)庫,有助于開展電磁目標識別研究。
對于擴充的電磁目標數(shù)據(jù)庫,選取8種電磁目標進行研究,如表1所示。
表1中電磁目標類型6采用了重采樣處理,電磁目標類型7采用了改變幅值處理,電磁目標類型8由電磁目標類型1和2疊加生成。對于選取的8種電磁目標,研究能在不同信噪比(18dB、16dB、14dB、12dB、10dB、8dB)下準確識別各電磁目標的方法,每種電磁目標類型有600個樣本,表1中8種電磁目標類型的波形圖如圖1所示。
表1 8種電磁目標
圖1中展示的是在信噪比18 dB下第78個樣本數(shù)據(jù)的電磁目標波形圖。對于8種電磁目標類型,每種類型共有600個樣本數(shù)據(jù),將其中的70%當作訓練集用于訓練,剩下的30%當作測試集驗證所提出電磁目標識別方法的識別效果。
圖1 8種電磁目標波形圖
電磁目標識別方法主要包括三個步驟:特征提取、特征降維和分類識別,下面分別對這三個步驟的計算過程進行分析。
在特征提取部分,對于電磁目標信號,提取其時域和頻域統(tǒng)計特征,時域和頻域統(tǒng)計特征參數(shù)的計算公式分別如表2和表3所示。
表2 時域統(tǒng)計特征
表3 頻域統(tǒng)計特征
表2中的表示電磁目標時間序列信號,表3中的和分別表示經(jīng)過傅里葉變換后的頻率成分和頻譜幅值。通過計算時域統(tǒng)計特征可以得到16個特征參數(shù),通過計算頻域統(tǒng)計特征可以得到12個特征參數(shù),為了提高計算效率,采用特征降維方法保留主成分。
經(jīng)過特征提取后可得到16個時域統(tǒng)計特征和12個頻域統(tǒng)計特征,采用主成分分析(Principal Component Analysis,PCA)方法對其進行特征降維。
對于個特征參數(shù)對應的個值,構造的特征矩陣為
(1)
將特征矩陣進行線性變換使其滿足式(2)。
(2)
且有
(3)
式中var()表示方差,cor(,)表示主成分間的相關性。
通過PCA方法能夠將特征參數(shù)變換成多個主成分,為了提高計算效率,這里選取前三個主成分進行計算和分析。
對于8種電磁目標,每種電磁目標有600個樣本,總共4800個樣本,對每個樣本提取16個時域統(tǒng)計特征和12個頻域統(tǒng)計特征,然后經(jīng)過PCA處理選取前三個主成分,最后得到4800×3維的特征空間,將其中的70%當作訓練集用于訓練,剩余的30%當作測試集驗證識別的準確率。為了進行對比分析研究,選取SVM、KNN、Random forest和AdaBoost四種基于機器學習的分類識別算法進行識別,同時考慮在現(xiàn)場環(huán)境應用中的實際需求,還研究了在不同信噪比下的識別結果以及進行識別所需耗費的時間,在進行計算時所使用的計算機為Windows 10系統(tǒng),CPU為英特爾i7-9700,內(nèi)存為64 GB,程序代碼用python語言編寫,并基于Spyder編譯器運行。
通過計算得到的電磁目標識別結果如表4所示。
表4 電磁目標識別結果
由表4可知,隨著信噪比(18dB、16dB、14dB、12dB、10dB、8dB)降低,電磁目標識別的準確率也逐漸降低。在采用時域統(tǒng)計特征時,8dB信噪比下SVM、KNN、Random forest和AdaBoost算法識別的準確率分別為92.92%、93.75%、94.72%和94.86%;在采用頻域統(tǒng)計特征時,其識別準確率分別為96.88%、97.29%、97.78%和98.06%;在同時采用時域和頻域統(tǒng)計特征時,其識別準確率分別為89.86%、93.26%、93.75%和92.85%。當同時采用時域和頻域統(tǒng)計特征時,電磁目標的識別準確率沒有只采用頻域統(tǒng)計特征時高,這可能是因為電磁目標對頻域特征參數(shù)更加敏感,因此只需采用頻域統(tǒng)計特征即可準確識別各電磁目標,此外通過比較平均耗費時間可知,Random forest算法雖然識別準確率略高于AdaBoost算法,但是其所需的時間比AdaBoost算法約長1.3s。為了快速準確識別電磁目標,研究結果表明基于AdaBoost算法采用頻域統(tǒng)計特征能夠準確快速識別出電磁目標,識別的平均準確率高達99.20%,所需時間為0.19s。
本項工作提出了重采樣、改變幅值和信號疊加三種電磁目標數(shù)據(jù)庫擴充方法,通過這三種方法能夠有效擴充現(xiàn)有數(shù)據(jù)庫。基于擴充的電磁目標數(shù)據(jù)庫,提出了一種基于特征提取和機器學習的電磁目標識別方法,研究結果表明,基于頻域統(tǒng)計特征采用AdaBoost算法能夠準確識別出不同信噪比下的電磁目標,平均識別準確率高達99.20%,在8dB低信噪比下的識別準確率仍有98.06%,且平均耗時僅為0.19s。