姚璐,韓磊,楊磊,柴曉飛
(1. 西安電子工程研究所,陜西,西安 710000;2. 北京理工大學 機電學院,北京 100081)
雷達高分辨距離像是在大發(fā)射帶寬、目標尺寸遠大于雷達距離分辨率的條件下,目標散射點的子回波在雷達方向上投影的矢量和[1-5]. 由于其易獲取、便于處理、占用存儲空間少,以及包含豐富的目標結構信息等優(yōu)點,利用HRRP 進行目標識別被認為是一種很有前景的雷達目標識別方法.
劉家鋒等[6]指出,距離分類器是目前解決目標識別問題的主要方法之一,其思想直觀、方法簡單,但是由于其未考慮到目標類別內(nèi)部的分類情況,識別精度有限. 基于此,諸多學者也基于不同的研究方向提出了多種基于HRRP 的識別算法以提高目標識別精度:(1)基于分類超平面提出了支持向量機(support vector machines,SVM),而且針對非線性問題后續(xù)引入了核函數(shù)、多尺度特征等多種解決方法.MALL 等[7]提出最小二乘向量機用于HRRP 目標識別,LIU 等[8]提出基于多尺度特征的模糊支持向量機,然而由于SVM 的邊界是線性開放邊界,因此會產(chǎn)生嚴重的重疊問題. (2)基于概率框架提出了貝葉斯分類器. DU 等[9]開發(fā)了一種基于貝葉斯稀疏學習的噪聲統(tǒng)計模型進行噪聲魯棒雷達HRR 目標識別,但是基于貝葉斯的先驗概率的計算一直是提高識別率的難題;(3)基于特征優(yōu)化發(fā)展出子空間法. DAI 等[10]提出了多尺度融合稀疏保持投影方法用于提取包含更多判別信息的多尺度融合特征. 第四:基于自主提取深層特征引入了神經(jīng)網(wǎng)絡. LIAO 等[11]構建了基于級聯(lián)深度神經(jīng)網(wǎng)絡的雷達HRRP 目標識別方法,但是神經(jīng)網(wǎng)絡需要訓練大量的內(nèi)置參數(shù),因此需要大量的訓練樣本,而且容易出現(xiàn)局部最優(yōu)、不能收斂或者過擬合的問題.
不過針對戰(zhàn)場對抗環(huán)境下敵方非合作目標類型眾多,且難以獲得大量的訓練樣本,上述算法難以兼顧隨著目標類型增加而明顯增加的運算復雜度以及小樣本時仍然具有優(yōu)越的泛化性能,因此需要提出新的識別算法保證在進行多目標小樣本識別時同時具備低的運算復雜度與優(yōu)異的泛化性能,保證優(yōu)越的識別性能.
通過利用比值計算兩個向量之間的距離,本文提出一種新的距離計算方法,即比值距離,并將比值距離運用到距離分類器中進行目標識別,可以在進行多類目標識別時,保證分類器的運算復雜度很低,并且訓練樣本較少時,仍然具備優(yōu)異的泛化性能,這兩種性能能夠確保分類器具有優(yōu)異的識別性能. 本文將基于比值距離的分類器稱為D 距離分類器.
諸多識別算法利用特征進行目標識別時,考慮到目標內(nèi)部的特征分類情況,有的特征數(shù)量級過大,則在計算結果時所占比重會大,但其分布并非一定利于目標識別,所以一般會采用歸一化方法將特征值的數(shù)量級縮放至同一區(qū)間,不過這種操作也會引發(fā)新的問題,因為并非所有數(shù)量級過大的特征都是不利于目標識別的特征,因此盲目的歸一化也會將利于目標識別且數(shù)量級較大的特征與不利于目標識別且數(shù)量級較小的特征統(tǒng)一到同一數(shù)量級,反而會弱化算法的識別效果.
考慮到計算兩個特征向量的比值距離時,無論對特征如何進行縮放,兩點之間的比值距離不會受到影響,而且比值計算也會使得同等級的數(shù)量級相消,因而也不用考慮不同類特征數(shù)量級相差過大對結果所占比重不同的問題. 故此,基于以上思路構建比值距離用于對雷達HRRP 的目標識別.
針對小樣本問題,主要是考驗識別算法的泛化性能,特征提取一直是解決該類問題的重要途徑,而正如公式(1)可見,比值距離的計算既可以解決不同類特征數(shù)量相差過大導致計算結果時比重相差過大的問題,也不會降低特征的可分性. 因此面對戰(zhàn)場對抗環(huán)境下非合作目標無法獲得大量訓練樣本的小樣本問題,利用比值距離作為分類器的判別依據(jù)能保證更高的識別率.
另外,由于該比值距離分類器與歐式距離分類器類似,都屬于模板匹配類型的識別算法,思想直觀,計算公式簡單,因此在目標類別數(shù)目增加時,增加的訓練樣本不會為識別運算量和訓練難度增加過重的負擔,即在對多目標進行分類時,依然能保證較低的運算復雜度,因此可用于對戰(zhàn)場環(huán)境下多目標的識別.
為便于描述,本文將基于比值距離作為判別依據(jù)的分類器統(tǒng)稱為D 距離分類器.
基于D 距離分類器的目標識別流程與傳統(tǒng)的分類算法相同,包括訓練階段與識別階段兩部分,其識別流程如圖1 所示.
圖1 D 距離分類器的識別流程Fig. 1 Recognition process of D distance classifier
1)D 距離分類器的訓練階段為建立訓練樣本特征矩陣庫Tprac.
假設可用于訓練的樣本數(shù)目為m,每個樣本提取n類特征,則可建立訓練樣本特征矩陣庫Tprac,見公式(2),訓練樣本特征矩陣庫Tprac包 含m×n個特征,其中每一個行向量為一個訓練樣本通過特征提取操作得到的訓練樣本特征向量.
首先計算輸入的識別樣本特征向量Tid與分類器存儲的訓練樣本特征矩陣庫Tprac中每一個行向量之間的比值距離,可以得到m個距離值,具體計算過程可見公式(4).
其次對m個比值距離進行大小比較;
最后輸出比值距離最小的訓練樣本對應的目標類別,就是D 距離分類器對輸入樣本的識別結果.
與傳統(tǒng)的HRRP 自動目標識別算法相比,D 距離分類器具有優(yōu)異的泛化性能以及很低的運算復雜度,從而保證其具有優(yōu)異的識別性能,主要創(chuàng)新優(yōu)勢在于:
1)在計算兩個特征向量之間的距離時,未采用傳統(tǒng)的歐式距離,而是改為比值距離,這種距離計算方法能夠在消除不同類特征數(shù)量級差異時避免降低利于目標分類的特征的權重、提高不利于目標分類的特征的權重這一情況的發(fā)生,從而能夠保證D 距離分類器具有優(yōu)異的泛化性能;
2)因為D 距離分類器的思想直觀,計算公式簡單,因此具有較低的運算復雜度,當待識別目標類別數(shù)目增加時,同樣能夠保證很高的識別精度;
3)對輸入的特征值直接進行距離計算,不需要進一步的特征優(yōu)化同樣能保證很高的識別精度,這一特點能夠優(yōu)化距離分類器的運算步驟.
采用8 類地面目標的一維距離像實測數(shù)據(jù),來驗證D 距離分類器進行多類目標識別時的識別性能,包括泛化性能以及計算復雜度兩部分. 如表1 所示,8 類地面目標可分為軍事目標與非軍事目標兩大類,其中軍事目標包括4 類,非軍事目標包括4 類.
表1 用于進行分類器性能驗證的8 類地面目標Tab. 1 Eight ground targets used for classifier performance verification
對地面目標的距離像進行平均距離像降噪等預處理,所得的全部圖像用于訓練與識別,總樣本數(shù)為6 681;對預處理后的距離像提取15 類特征并利用Fisher 準則計算每類特征的類間距離與類內(nèi)距離之比,取比值最高的前10 類特征用于目標識別,包括目標徑向長度、強散射中心數(shù)目、二階中心矩、方差、平均起伏特性、差分起伏特性、對稱性特征、去尺度結構特征、徑向能量特征、散射中心分布熵等. 八類地面目標關于方差、平均起伏特性、差分起伏特性三類特征的分布如圖2、圖3 所示.
圖2 4 類軍事目標的特征分布Fig. 2 Characteristic distribution of four military targets
圖3 4 類非軍事目標的特征分布Fig. 3 Characteristic distribution of four non-military targets
與D 距離分類器進行對比分析的識別算法包括:進行特征優(yōu)化的歐式距離分類器、LDA 分類算法、樸素貝葉斯(Naive Bayes)分類器、可用于多目標分類的支持向量機(SVM),BP(back propagation)算法.
算法運行平臺為MATLAB2020b.
識別算法的泛化性能優(yōu)劣可通過比較少訓練樣本情況下識別算法的識別精度得出. 當訓練樣本的比例從10%~90%逐次遞增時時,各分類算法的識別精度如表2 所示,變化趨勢如圖4 所示.
表2 訓練樣本比例變化時,各分類算法的識別精度Tab. 2 Recognition accuracy of each classification algorithm with different proportion of training samples
圖4 訓練樣本比例變化時,各分類算法的識別精度變化趨勢Fig. 4 Recognition accuracy’s change trend of each classification algorithm with different proportion of training samples
分析表2 與圖4,可以發(fā)現(xiàn)在對八類地面目標進行分類時,在訓練樣本的比例從10%逐次遞增到90%的過程中,D 距離分類器的識別精度始終是6種分類算法中最高的,而且當訓練樣本的比例分別為10%與90%時,識別精度僅相差5.69%,說明D 距離分類器在待分類目標類別數(shù)目為8 且訓練樣本數(shù)目很少時,依然能夠保證很高的識別精度. 可得出結論,本文提出的D 距離分類器在利用一維距離像進行多類目標識別時具有優(yōu)越的識別性能與泛化性能.
傳統(tǒng)的距離分類器同樣具有優(yōu)越的識別性能與泛化性能,但稍遜于D 距離分類器;SVM 的識別精度隨著訓練樣本比例的提高有很明顯的提升,說明針對本文的實測數(shù)據(jù)該算法的泛化性能一般;樸素貝葉斯與LDA 兩類算法的識別精度太低;以BP 算法為代表的深度神經(jīng)網(wǎng)絡在本次實測驗證時表現(xiàn)最差,通過分析訓練過程,發(fā)現(xiàn)神經(jīng)網(wǎng)絡總是進入無法收斂的狀態(tài),因此無法確定最優(yōu)模型,從而導致識別效果過差.
算法的識別運算復雜度主要體現(xiàn)在當待識別目標類別增加時,隨著識別運算量與訓練難度增加,其識別精度降低的程度. 當訓練樣本的比例為50%,待識別目標的類別數(shù)目分別為2、4、6、8,從識別樣本中選取一組特征向量用于目標識別,循環(huán)測試500 次,計算6 種識別算法的平均訓練時長以及平均識別時長,數(shù)據(jù)列于表3. 需要注意的是,待識別目標的類別數(shù)目增加時,是在原有待識別目標已有的訓練樣本的基礎上直接添加新的待識別目標的訓練樣本,識別樣本也更新為數(shù)據(jù)庫內(nèi)當前所包含的目標的識別樣本,因此,待識別目標的類別數(shù)目分別為2、4、6、8 時,訓練樣本的數(shù)目也是增加的,識別樣本也是增加的.
分析表3 數(shù)據(jù),可以發(fā)現(xiàn)隨著待識別目標的類別數(shù)目增加時,每類算法的訓練時長都會持續(xù)增加,但是識別時長僅有D 距離分類器與歐氏距離分類器有明顯的增加,這是因為該兩類分類器采用的是模板匹配法,分類器內(nèi)部儲存的是提取的特征而不像其他識別算法存儲的是公式以及訓練過程計算的參數(shù),因此隨著待識別目標數(shù)目的增長,該兩類分類器內(nèi)部存儲的參數(shù)增多,識別時長自然會增加,另外4類算法的識別時長基本保持在同一水平,說明分析識別時長不能體現(xiàn)出識別算法的計算復雜度;當待識別目標的類別數(shù)目增加時,每類算法的訓練時長都會持續(xù)增加,其中BP 算法體現(xiàn)的最為明顯,當目標數(shù)目變?yōu)? 時,50%的樣本根本無法訓練出能夠用來識別的神經(jīng)網(wǎng)絡,說明神經(jīng)網(wǎng)絡內(nèi)部運行復雜,而D 距離分類器的訓練時長增加緩慢且在各個待識別目標數(shù)目時一直用時最短,其次用時短且增長緩慢的是歐式距離分類器,說明待識別目標類型的增加不會給基于模板匹配的兩類分類器增加過重的訓練負擔.
表3 待識別目標類別數(shù)目變化時,各算法的訓練時長與識別時長Tab. 3 Training durations and recognition durations of each classification algorithm with identified target categories number
當訓練樣本的比例為50%,待識別目標的類別數(shù)目分別為2、4、6、8 時,6 種識別算法的識別精度被列于表4,變化趨勢可見圖5.
表4 待識別目標的類別數(shù)目變化時,各算法的識別精度Tab. 4 Recognition accuracy of each classification algorithm with different target categories number
圖5 待識別目標類別數(shù)目變化時,各算法的識別精度變化趨勢Fig. 5 Recognition accuracy’s change trend of each classification algorithm with identified target categories number
觀察表4 與圖5,可發(fā)現(xiàn)隨著待識別目標類別數(shù)目的增加,所有算法的識別精度都有不同程度的下降,而D 距離分類器的下降是最少的,其次是歐式距離分類器,結合表3 中D 距離分類器的訓練時長是最短且增長緩慢的特點,可以說明隨著待識別目標數(shù)目的增加,D 距離分類器的識別運算復雜度的增加是最緩慢的,可以保證在目標種類增加時,具有優(yōu)于其他算法的識別性能.
本文提出一種利用比值計算兩個向量距離的新方法,并將比值距離應用到距離分類器中形成一種新的距離分類器即D 距離分類器,進行基于HRRP 的雷達自動目標識別. 通過八類地面目標實測的距離像進行驗證可知,D 距離分類器不僅具有優(yōu)異的泛化性能,而且隨著待識別目標的種類增加時,其識別運算復雜度仍能保持很低的水平,從而保證D 距離分類器在進行多類目標識別且訓練樣本有限時,仍然具有優(yōu)異的識別性能. 目前僅驗證了D 距離分類器在基于HRRP 的雷達自動目標識別領域的性能,而且由于計算公式使用了比值計算,因此需要確保D 距離分類器中儲存的特征值均為非0 的數(shù)值.