徐帥, 劉魯濤
(哈爾濱工程大學(xué) 信息與通信工程學(xué)院,黑龍江 哈爾濱 150001)
當(dāng)代雷達(dá)技術(shù)發(fā)展鼎力突進(jìn),新的雷達(dá)信號(hào)調(diào)制技術(shù)不斷涌現(xiàn),更多的信號(hào)類別進(jìn)入信息化戰(zhàn)場(chǎng)。這使得信息樣本不充分的未知LPI雷達(dá)信號(hào)識(shí)別難問題日益突出。目前雷達(dá)信號(hào)識(shí)別的方法主要有2類:匹配模板方法、特征提取組合機(jī)器學(xué)習(xí)的方法[1]。此2類方法總體上實(shí)現(xiàn)了對(duì)全部雷達(dá)信號(hào)的有效識(shí)別,但是作為特征分析的主要手段,無論是人工分析還是機(jī)器學(xué)習(xí),均需要建立在較大數(shù)量的標(biāo)簽信號(hào)樣本的數(shù)據(jù)基礎(chǔ)之上。
譬如傳統(tǒng)方法以人工提取的信號(hào)特征參數(shù)為依據(jù),早期文獻(xiàn)[2]中LPI雷達(dá)信號(hào)的識(shí)別借助最大似然估計(jì),對(duì)時(shí)域瞬時(shí)變化的某些統(tǒng)計(jì)特征進(jìn)行分析和建模。對(duì)于PSK、FSK等經(jīng)典調(diào)制方式具有可觀的識(shí)別效果,但這種識(shí)別方法依賴一定數(shù)據(jù)量下的標(biāo)簽信號(hào)的人工分析,方才能建立出該類型信號(hào)適用的多維特征匹配模板。
文獻(xiàn)[3]嘗試將神經(jīng)網(wǎng)絡(luò)搭建引入信號(hào)調(diào)制方式識(shí)別的領(lǐng)域中,實(shí)現(xiàn)信號(hào)的自動(dòng)分類識(shí)別,為往后LPI雷達(dá)信號(hào)識(shí)別開啟了新思路。進(jìn)入深度學(xué)習(xí)的框架領(lǐng)域后,國(guó)內(nèi)外學(xué)者在該方向做了諸多探索。Kong等[4]通過時(shí)頻分析建立LFM、Costas、BPSK等12種LPI雷達(dá)信號(hào)時(shí)頻數(shù)據(jù)集,并使用CNN對(duì)該12種信號(hào)進(jìn)行分類識(shí)別,低信噪比下識(shí)別率達(dá)90%??v觀近年來這一領(lǐng)域方法的研究,思路是將LPI雷達(dá)信號(hào)的時(shí)頻域信息通過各種卷積神經(jīng)網(wǎng)絡(luò),去自動(dòng)擬合出一個(gè)高維的分類函數(shù)。訓(xùn)練的過程需要和標(biāo)簽信號(hào)做有監(jiān)督學(xué)習(xí),也意味著需要大量的標(biāo)簽樣本提供訓(xùn)練支持,以此訓(xùn)練出一個(gè)期望的分類函數(shù)[5]??梢砸暈槿斯ぶ悄芊诸悓?duì)傳統(tǒng)人工識(shí)別的一種優(yōu)化嘗試[6],但是依然沒能解決需要大量已知的標(biāo)簽樣本的問題。
面對(duì)當(dāng)下復(fù)雜的信息戰(zhàn)場(chǎng)環(huán)境中的大量的小樣本信號(hào),信息樣本嚴(yán)重不足,常規(guī)的特征學(xué)習(xí)框架具有明顯的局限性。雖然,文獻(xiàn)[7]提出了一種基于多視角子空間聚類的無監(jiān)督雷達(dá)信號(hào)識(shí)別方法,但是其完全脫離訓(xùn)練樣本的策略在面對(duì)較復(fù)雜的識(shí)別任務(wù)時(shí),聚類效果不佳[8]。
本文就對(duì)信號(hào)因信息樣本不足,無法通過訓(xùn)練擬合的問題,提出一種基于原型網(wǎng)絡(luò)P-Net(prototypical networks, P-Net)[9]的識(shí)別算法。獲取小量信號(hào)樣本的時(shí)頻信息,擬合出整體信號(hào)的分類函數(shù)。該算法摒棄了常規(guī)的交叉熵?fù)p失[10],通過優(yōu)化充足類樣本點(diǎn)和類原型的相對(duì)位置使得充足類樣本點(diǎn)在空間類間分散、類內(nèi)聚合[11-12],得到的模型具有泛化能力。在測(cè)試過程中,小樣本信號(hào)通過現(xiàn)有小樣本的微調(diào),可實(shí)現(xiàn)對(duì)全部類信號(hào)的識(shí)別。
本節(jié)主要介紹了以P-Net和SPWVD時(shí)頻分析為依托的小樣本LPI雷達(dá)信號(hào)識(shí)別體統(tǒng)的結(jié)構(gòu)組成及各模塊功能。
如圖1所示為小樣本雷達(dá)信號(hào)識(shí)別系統(tǒng)的結(jié)構(gòu)組成,該系統(tǒng)主要由3部分組成,時(shí)頻圖像獲取,圖像預(yù)處理與P-Net神經(jīng)網(wǎng)絡(luò)訓(xùn)練與測(cè)試。
圖1 基于P-Net的小樣本雷達(dá)信號(hào)識(shí)別系統(tǒng)結(jié)構(gòu)組成
前兩部分中時(shí)頻分析是為了將時(shí)域數(shù)據(jù)轉(zhuǎn)化為二維的時(shí)頻數(shù)據(jù)矩陣。數(shù)據(jù)矩陣經(jīng)過Imresize等預(yù)處理操作,可以集中呈現(xiàn)時(shí)頻信息的關(guān)鍵部分,簡(jiǎn)化一些空白的冗余信息,為后續(xù)的識(shí)別網(wǎng)絡(luò)的訓(xùn)練擬合和自動(dòng)分類識(shí)別做好準(zhǔn)備[13]。第3部分識(shí)別網(wǎng)絡(luò)是本章的重點(diǎn)。原型網(wǎng)絡(luò)是用來做小樣本分析訓(xùn)練的一種神經(jīng)網(wǎng)絡(luò),在得到前兩部分處理完的雷達(dá)信號(hào)時(shí)頻信息以后,可以在有限數(shù)量的雷達(dá)信號(hào)時(shí)頻信息樣本條件下,發(fā)掘樣本之間的聯(lián)系,尋求一個(gè)模型較好的空間表征。在測(cè)試的時(shí)候每個(gè)類別僅依賴于很少的幾個(gè)樣例就可以確定每一類的原型,以此達(dá)到小樣本訓(xùn)練的目的。
此雷達(dá)信號(hào)識(shí)別系統(tǒng)避免了對(duì)龐大的標(biāo)簽信號(hào)樣本的依賴,支持小樣本訓(xùn)練在一定程度上優(yōu)化了雷達(dá)信號(hào)識(shí)別的資源配置。
面對(duì)多種復(fù)雜的雷達(dá)調(diào)制信號(hào),時(shí)域和頻域的獨(dú)立信息有時(shí)缺乏可辨性,而在二維的時(shí)頻聯(lián)合域,可以清楚地辨析出各種調(diào)制方式的瞬時(shí)頻率時(shí)變特性,因此,時(shí)頻分析也作為雷達(dá)信號(hào)脈內(nèi)識(shí)別的重要依據(jù)[14]。這里的時(shí)頻信息是一個(gè)二維數(shù)據(jù)矩陣,它以圖像的形式呈現(xiàn)。但是并不是在對(duì)圖像進(jìn)行研究探討,本文關(guān)注的重點(diǎn)是數(shù)據(jù)矩陣中的較大數(shù)值的分布情況,它表征了信號(hào)能量在時(shí)頻域的分散,這使得時(shí)頻信息的識(shí)別有別于傳統(tǒng)的圖像的識(shí)別[15]。
經(jīng)過參考,本文采用平滑偽Wigner-Ville分布[12](smooth pseudo WVD,SPWVD)表征時(shí)頻信息。因?yàn)榇瞬糠植皇潜疚难芯康闹攸c(diǎn),直接給出它具體的數(shù)學(xué)表達(dá)并建立時(shí)頻信息的圖像表達(dá)。
(1)
圖2是通過SPWVD變換以及Imresize的預(yù)處理過程,獲取的10種常見LPI雷達(dá)信號(hào)的時(shí)頻圖像。
圖2 LPI雷達(dá)信號(hào)的時(shí)頻圖像
通過上述處理,將雷達(dá)信號(hào)以時(shí)頻圖像的形式存儲(chǔ),并建立LPI雷達(dá)信號(hào)數(shù)據(jù)集。
圖3 P-Net結(jié)構(gòu)示意
()
(2)
(3)
式中xi∈PM代表矢量點(diǎn),yi∈[1,2,…,K]代表該點(diǎn)的標(biāo)簽。以圖4為例,1-4是樣本空間按矢量點(diǎn)的類分為 4個(gè)區(qū)域,圖中區(qū)域面積的大小反映該類別下樣本矢量點(diǎn)的多少。其中,1-3是樣本充足類區(qū)域,4是小樣本類區(qū)域。
圖4 P-Net的樣本空間
1={(x1,1),(x2,1)…(xN1,1)}
(4)
式中N=∑Ni,N1,N2,N3?N4。
對(duì)于每一個(gè)類別,選取該類別中所有樣本點(diǎn)的中心c,用來表征該類別的空間信息。在運(yùn)算中,選取該類樣本點(diǎn)的坐標(biāo)均值為原型(Prototypic)[5]:
(5)
各類的原型ck∈PM承擔(dān)了該類樣本點(diǎn)在樣本空間中的空間表征,而模型的訓(xùn)練在空間中尋求一種無序到有序的過程,如圖5所示。P-Net的優(yōu)化對(duì)象不同于普通卷積神經(jīng)網(wǎng)絡(luò)在概率空間取標(biāo)簽值的交叉熵,而是以矢量點(diǎn)在樣本空間中到原型的歐幾里得距離(euclidean distance)作為優(yōu)化函數(shù)[9]:
圖5 P-Net訓(xùn)練過程
pφ(y=k|x)=softmax(dEuclido(fφ(x),ck))=
(6)
J(φ)=-logpφ(y=k|x)
(7)
其中J(φ)代表空間樣本點(diǎn)到原型的損失函數(shù)(loss function),對(duì)它采用SGD優(yōu)化器或者亞當(dāng)優(yōu)化器,以BP反向傳播的形式更新映射函數(shù)fφ。事實(shí)上,P-Net網(wǎng)絡(luò)的訓(xùn)練過程是通過訓(xùn)練各類樣本點(diǎn)在空間PM中的聚集程度,來實(shí)現(xiàn)映射模型fφ的獲取。在某種程度上,P-Net的學(xué)習(xí)不同于一般CNN對(duì)“正確答案”——標(biāo)簽值的學(xué)習(xí),而是學(xué)習(xí)樣本點(diǎn)的空間特征表征能力,這樣得到的訓(xùn)練模型具有一定的泛化能力。其表現(xiàn)在,通過充沛樣本(1~3)訓(xùn)練得到的映射函數(shù),對(duì)于小樣本類別(4)的矢量點(diǎn)也具備聚集能力。
pre=k,dEuclido(fφ′(x′),ck)=Min
(8)
在具體的操作過程中,訓(xùn)練樣本集以一個(gè)批次(episode)L為訓(xùn)練單位,其中每個(gè)批次由支持集(support-set)Ls和查詢集(query-set)Lq組成(L=Ls+Lq)。
具體識(shí)別的操作步驟如下:
1)按3中操作算法得到由雷達(dá)信號(hào)時(shí)頻圖構(gòu)成的訓(xùn)練集。此訓(xùn)練集由足量的信號(hào)樣本組成。
2)訓(xùn)練時(shí),每個(gè)信號(hào)類任取Ls數(shù)量的時(shí)頻信息圖作為支持集,將支持集送入作為映射過程fφ的卷積神經(jīng)網(wǎng)絡(luò),在樣本空間PM得到若干支持樣本點(diǎn)(support-points)。計(jì)算出每類支持樣本點(diǎn)的原型。
圖6 P-Net訓(xùn)練及識(shí)別過程
針對(duì)10種LPI雷達(dá)調(diào)制信號(hào),通過Matlab 2016a仿真出I路和Q路的數(shù)據(jù)信息,作為初始信號(hào)信息。
10種LPI雷達(dá)調(diào)制信號(hào)數(shù)據(jù)獲取的初始參數(shù)如下[12]:
NS:信號(hào)長(zhǎng)度[500,1 024],載頻fc是U(1/4,1/8)的隨機(jī)數(shù)。
LFM:信號(hào)長(zhǎng)度[500,1 024],帶寬Δf和初始頻率f0隨機(jī)分布于U(1/16,1/8)。
NLFM信號(hào):信號(hào)長(zhǎng)度[500,1 024],信號(hào)載頻fc隨機(jī)分布于U(1/20)到U(1/4),調(diào)頻斜率k隨機(jī)分布于[2B/T,3B/T]。
BPSK:?jiǎn)涡蛄虚L(zhǎng)度為7,11,13。載波頻率fc隨機(jī)分布于U(1/8)~U(1/4)。循環(huán)相位碼長(zhǎng)度cpp是1~5的隨機(jī)整數(shù),碼周期Np也是整數(shù)隨機(jī)分布于[100,300]。
Costas碼:跳頻序列NF是[3~6]的隨機(jī)整數(shù),基頻fmin隨機(jī)分布于U(1/24,1/20),信號(hào)長(zhǎng)度[500,1 024]。
Frank碼:載頻fc隨機(jī)分布于U(1/8,1/4),循環(huán)相位碼長(zhǎng)度cpp是1~5的隨機(jī)整數(shù),步進(jìn)頻率M是4~8的隨機(jī)整數(shù)。
T1-T4碼:碼序列段數(shù)k是4,5,6。編碼周期T范圍在[0.07,0.1]。
本節(jié)針對(duì)小樣本雷達(dá)信號(hào)的識(shí)別進(jìn)行仿真實(shí)驗(yàn)。為了使雷達(dá)信號(hào)在復(fù)雜電磁環(huán)境中更具一般性,在上一節(jié)的10種雷達(dá)信號(hào)數(shù)據(jù)中加入高斯白噪聲,選取信噪比的區(qū)間為-12~8 dB,并以步長(zhǎng)2 dB選取若干測(cè)試點(diǎn)。
其中,在每個(gè)信噪比下,隨機(jī)將5種信號(hào)作為充足樣本類信號(hào),剩余5種信號(hào)作為小樣本類信號(hào)。P-Net的訓(xùn)練集由這5種充足樣本類信號(hào)組成,每種充足類信號(hào)800個(gè)樣本,不含小樣本信號(hào);小樣本信號(hào)類的所謂的小樣本為L(zhǎng)small=5帶標(biāo)簽的時(shí)頻信息圖;測(cè)試集包含全部10種信號(hào),每種信號(hào)100個(gè)樣本用于測(cè)試。
在本節(jié)中,選取文獻(xiàn)[17]的InceptionNet-v3網(wǎng)絡(luò)、文獻(xiàn)[18]的AlexNet網(wǎng)絡(luò)以及文獻(xiàn)[19]的ResNet-50神經(jīng)網(wǎng)絡(luò)作為本文P-Net分類系統(tǒng)的參照對(duì)象。以上三者算法與本文分類系統(tǒng)在信號(hào)自動(dòng)識(shí)別領(lǐng)域有著相似性,且它們得到深度學(xué)習(xí)界廣泛認(rèn)可具有一定代表性。具體的,AlexNet、Inception-v3和ResNet-50屬于傳統(tǒng)的深度學(xué)習(xí)訓(xùn)練模式。它們都需要在足量訓(xùn)練樣本支持的條件下,完成對(duì)信號(hào)樣本的學(xué)習(xí),屬于常規(guī)而典型的有監(jiān)督訓(xùn)練模式,這不同于本文所研究的P-Net訓(xùn)練模式。在仿真操作上為使信息條件等價(jià),令每個(gè)信噪比下AlexNet、Inception-v3和ResNet-50的訓(xùn)練集由5類充足樣本信號(hào)各800張時(shí)頻圖像,和5類小樣本信號(hào)各5張時(shí)頻圖像共同組成。
使用5.1節(jié)參數(shù)去產(chǎn)生十種雷達(dá)信號(hào)用于本節(jié)3種系統(tǒng)的學(xué)習(xí)和測(cè)試。仿真對(duì)比結(jié)果如圖7所示。
圖7 整體識(shí)別正確率
P-Net系統(tǒng)的整體識(shí)別準(zhǔn)確率與信噪比大小呈正相關(guān),并且在給定等價(jià)的小樣本信息條件下,P-Net的識(shí)別效果要明顯優(yōu)于后三者。AlexNet等常規(guī)深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)隨著信噪比的提升,識(shí)別率依然只能停滯在50%。這是因?yàn)樗鼈兡芎芎玫貙W(xué)習(xí)5類足量樣本信號(hào)的特征,而對(duì)另外5類小樣本信號(hào),缺乏有效的學(xué)習(xí)能力。
P-Net雷達(dá)信號(hào)分類系統(tǒng)能根據(jù)訓(xùn)練樣本集學(xué)習(xí)得到一個(gè)泛化的空間表征模型,然后在極少量的小樣本信號(hào)條件下,完成對(duì)所有信號(hào)的分類識(shí)別。在整個(gè)過程中涉及到較多的變量條件,相關(guān)變量的改變都會(huì)影響到最后識(shí)別的正確率。
因整體識(shí)別率如圖7已處于較高水準(zhǔn),本節(jié)主要關(guān)注信號(hào)的小樣本識(shí)別率。將探討如下3個(gè)重要變量對(duì)小樣本識(shí)別率的影響:
1)充足樣本類信號(hào)的訓(xùn)練集樣本數(shù)。
充足樣本類信號(hào)訓(xùn)練樣本集的數(shù)量直接影響了模型在類中的表征精度,它與模型的刻畫能力密切相關(guān)。保持其他各類參數(shù)變量不變(充足樣本信號(hào)為5類,小樣本信號(hào)的樣本數(shù)量為5),對(duì)該變量下不同數(shù)值大小做了統(tǒng)計(jì)分析,如圖8所示。
圖8 充足樣本類信號(hào)的樣本數(shù)對(duì)純小樣本識(shí)別率的影響
-8 dB以下時(shí),系統(tǒng)受樣本數(shù)量的影響較為明顯且為正相關(guān),信噪比較高時(shí)影響較小。但是隨著樣本數(shù)量的增加,純小樣本識(shí)別率的上限有所停滯無法達(dá)到100%。說明系統(tǒng)在上述參數(shù)條件下,識(shí)別率已達(dá)上限。
2)充足/小樣本類數(shù)的相對(duì)關(guān)系。
充足/小樣本類數(shù)同樣和模型的表征能力密切相關(guān)。保持其他各類參數(shù)變量不變(訓(xùn)練信號(hào)樣本數(shù)量為800,小樣本信號(hào)提供的小樣本數(shù)量為5),在固定充足類數(shù)為5的條件下,觀測(cè)小樣本類數(shù)2~5時(shí)的純小樣本識(shí)別率;固定小樣本類數(shù)為5的條件下,觀測(cè)充足類數(shù)2~5時(shí)的純小樣本識(shí)別率。
對(duì)比發(fā)現(xiàn),純小樣本識(shí)別率與小樣本信號(hào)類數(shù)呈負(fù)相關(guān),而受充足信號(hào)類數(shù)的影響不大。
3)小樣本信號(hào)的小樣本數(shù)Lsmall。
圖9 充足、小樣本類數(shù)的相對(duì)關(guān)系對(duì)純小樣本識(shí)別率的影響
對(duì)于已經(jīng)訓(xùn)練完成的模型,在測(cè)試時(shí)的正確率同樣受測(cè)試支持集樣本數(shù)量的影響。該類樣本數(shù)量越大,則對(duì)模型的利用率越大,能更好地發(fā)揮模型的表征能力。保持其他各類參數(shù)變量不變(充足信號(hào)為5類,訓(xùn)練信號(hào)樣本數(shù)量為800),對(duì)該變量下不同數(shù)值大小做了統(tǒng)計(jì)分析,如圖10所示。
圖10 小樣本信號(hào)的小樣本數(shù)對(duì)純小樣本識(shí)別率的影響
通過結(jié)果發(fā)現(xiàn),在小樣本區(qū)間[0~5]內(nèi),識(shí)別率與小樣本數(shù)呈正相關(guān),而超過5以后遲滯不變。實(shí)際中,小樣本信號(hào)所提供的樣本信息較少,符合小樣本的思想。
1)傳統(tǒng)的雷達(dá)信號(hào)識(shí)別方法依賴?yán)走_(dá)信號(hào)的大量樣本數(shù)據(jù)以形成信號(hào)模板,對(duì)于有限的、少量的雷達(dá)信號(hào)數(shù)據(jù)缺乏有效的識(shí)別策略。
2)本文將雷達(dá)信號(hào)識(shí)別與深度學(xué)習(xí)中的原型網(wǎng)絡(luò)結(jié)合,發(fā)揮原型網(wǎng)絡(luò)在小樣本訓(xùn)練中的優(yōu)勢(shì),依靠已有的雷達(dá)信號(hào)數(shù)據(jù)庫(kù),不斷優(yōu)化樣本類間距離,形成泛化的聚合模型。
3)捕捉有限的、少量的小樣本雷達(dá)信號(hào),就能識(shí)別出包括小樣本雷達(dá)信號(hào)在內(nèi)的所有LPI雷達(dá)信號(hào)。
4)仿真結(jié)果表明,等價(jià)樣本信息條件下,AlexNet等普通有監(jiān)督神經(jīng)網(wǎng)絡(luò)架構(gòu)難以擬合出有效的訓(xùn)練模型,而本文提出的P-Net雷達(dá)信號(hào)識(shí)別算法能對(duì)小樣本雷達(dá)信號(hào)達(dá)到較好的識(shí)別水準(zhǔn)。