吳 瑩 羅 明
(西安電子科技大學(xué)電子工程學(xué)院,陜西西安 710071)
近年來,聯(lián)合時頻分析(Time-frequency Analysis,TFA)在不同的信號處理應(yīng)用上比如水下聲學(xué)、語音處理和醫(yī)學(xué)分析等領(lǐng)域得到了廣泛的應(yīng)用。雷達(dá)研究人員也對它進(jìn)行了研究,并將其作為雷達(dá)信號檢測、分析和識別的一個非常有效的工具。本文采用了徑向高斯核(Radially Gaussian Kernel,RGK)時頻分析方法,其核函數(shù)不僅能有效壓制交叉干擾項(xiàng)的存在,而且能自適應(yīng)于多種類型信號。將徑向高斯核時頻分析方法[1]應(yīng)用于雷達(dá)信號,對獲得的時頻分布進(jìn)行奇異值分解,提取奇異向量作為本文雷達(dá)信號分類識別的特征參數(shù)。
目前用于雷達(dá)信號分類識別的方法主要可以劃分為:無監(jiān)督學(xué)習(xí)、監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)等。文獻(xiàn)[2]利用 K-means方法進(jìn)行聚類;文獻(xiàn)[3]提出基于核模糊C-means的雷達(dá)信號識別算法;這兩種算法均屬于無監(jiān)督學(xué)習(xí),雖然操作簡單,成本低,但實(shí)際效果不太理想。文獻(xiàn)[4]利用支持向量機(jī)(Support Vector Machine,SVM)來解決雷達(dá)信號識別問題;該方法屬于監(jiān)督學(xué)習(xí),監(jiān)督學(xué)習(xí)需要大量的訓(xùn)練樣本,但實(shí)際應(yīng)用中有標(biāo)簽樣本數(shù)據(jù)特別少,因此有一定的局限性。文獻(xiàn)[5]提出基于半監(jiān)督學(xué)習(xí)(S3VM)的雷達(dá)信號識別方法;文獻(xiàn)[6]采用多核半監(jiān)督學(xué)習(xí)算法(TSVM-MKL)進(jìn)行雷達(dá)信號識別;半監(jiān)督學(xué)習(xí)(Semi-supervised Learning, SSL)方法是在較少量的有標(biāo)簽樣本數(shù)據(jù)下,利用無標(biāo)簽樣本數(shù)據(jù)來改善訓(xùn)練學(xué)習(xí)效果,但是對于目前的雷達(dá)信號分類過程中,獲取較少的訓(xùn)練樣本仍是一個具有挑戰(zhàn)的問題,而可獲取的有標(biāo)簽樣本的數(shù)量相對更少。如何有效的減少訓(xùn)練所需標(biāo)簽樣本是本文研究的主要問題。
將主動學(xué)習(xí)和半監(jiān)督學(xué)習(xí)方法相結(jié)合,可以有效地減少學(xué)習(xí)模型訓(xùn)練中需要的標(biāo)簽樣本數(shù)量。這兩種方法都是通過在訓(xùn)練集中加入偽標(biāo)記樣本來提升訓(xùn)練能力,然而僅依賴分類器自身獲取樣本偽標(biāo)記,往往是不可靠的。因此,本文提出了改進(jìn)的半監(jiān)督主動學(xué)習(xí)算法,該算法利用對偽標(biāo)記樣本進(jìn)行迭代驗(yàn)證來提高偽標(biāo)記信息的準(zhǔn)確性,從而改善了最終的分類性能。
(1)
其中A(θ,τ)是信號s(t)的模糊函數(shù)(AF),φ(θ,τ)是信號s(t)的核函數(shù)。
通過求解下列優(yōu)化問題來尋找適應(yīng)于信號的最優(yōu)核,
(2)
上述最優(yōu)化問題的約束條件可表示為:
φ(r,ψ)=e-r2/ 2σ2(ψ)
(3)
a≥0
(4)
其中A(r,ψ)是信號s(t)在極坐標(biāo)下的模糊函數(shù)。擴(kuò)散函數(shù)σ(ψ)決定著相應(yīng)核的等能量輪廓的基本形狀,從而通過求出σopt(ψ)得到適應(yīng)于信號的最優(yōu)核φopt。約束條件(3)限制了徑向高斯核的優(yōu)化范圍,約束條件(4)限制了核函數(shù)的體積a,a一般取1~5。約束條件使得最優(yōu)核成為一個固定體積的低通濾波器,從而使得信號模糊函數(shù)的自相能量通過,而抑制交叉干擾項(xiàng)。
徑向高斯核時頻分析作為一種有效的非平穩(wěn)信號處理方法,能從時域和頻域兩個維度反映信號能量的變化分布情況,因此從理論上來講利用信號最優(yōu)核時頻分布之間的差異性可以進(jìn)行信號分類的識別。下面選取兩種典型的雷達(dá)信號進(jìn)行分析,設(shè)置參數(shù)a=2,繪制其徑向高斯核函數(shù)時頻分布三維圖,如圖1所示。
圖1 徑向高斯核函數(shù)時頻分布Fig.1 The time-frequency distribution of RGK function
LFM和BPSK信號分別在迭代次數(shù)為14和30時收斂到局部能量最大值。從圖1(a)可以看出,對于單一的線性調(diào)頻信號,徑向高斯核函數(shù)表現(xiàn)為極高的聚集性;對于二相編碼信號,圖1(b),RGK算法不但顯示了信號的時頻分布性質(zhì),且噪聲抑制能力較強(qiáng)。綜上分析,利用徑向高斯核時頻分布對雷達(dá)信號分類是可行的。
在復(fù)雜電磁環(huán)境中接收到的雷達(dá)信號,由于低信噪比導(dǎo)致雷達(dá)回波信號的時頻分布會受到嚴(yán)重的扭曲,應(yīng)用奇異值分解(Singular Value Decomposition, SVD),能夠盡可能地消除噪聲的影響。SVD是一個被廣泛用于提取數(shù)據(jù)特性的非線性過濾器,得到的奇異向量能夠保留雷達(dá)信號的固有性質(zhì)[7],因此利用SVD對雷達(dá)信號的徑向高斯核時頻分布進(jìn)行去噪和降維是可行的[8],本文正是基于該思想進(jìn)行了一系列論證。
對于任意矩陣Y∈Rm×n,由正交矩陣U∈Rm×m和V∈Rn×n,使得
(5)
該式稱為矩陣的奇異值分解(SVD)。其中矩陣的非零對角元素λ1≥λ2≥…λq稱為矩陣Y的非零奇異值,u1,u2,…,uq和v1,v2,…,vq分別稱為矩陣Y奇異值對應(yīng)的左右奇異向量。
由于奇異值分解的可逆性,即原始矩陣可以由奇異值和奇異向量完全重構(gòu),奇異向量包含了能夠反映原始矩陣的特性,能有效體現(xiàn)不同信號之間的細(xì)微差異。奇異值對應(yīng)于不同分量對時頻譜包絡(luò)的貢獻(xiàn),某部分能量越高,其對應(yīng)的奇異值越大;并且,由于矩陣的對稱性,左奇異向量和右奇異向量包含了同樣的信息。因此,本文選擇左一和左二奇異向量作為雷達(dá)信號徑向高斯核時頻分布的二次特征進(jìn)行后面的分類識別。
為了驗(yàn)證時頻分布奇異值分解的有效性,本文選取了四種不同的雷達(dá)信號進(jìn)行仿真實(shí)驗(yàn),分別為連續(xù)波(CW)信號、線性調(diào)頻(LFM)信號、二進(jìn)制移頻鍵控(FSK)信號、二相編碼(BPSK)信號。其中LFM的帶寬為15 MHz,BFSK信號的兩個頻率分別為f1=15 MHz,f2=20 MHz;BFSK采用6位Costas碼,編碼規(guī)則為:[100110]。圖2和圖3分別為四種信號徑向高斯核時頻分布奇異值分解后得到的左一奇異向量和左二奇異向量。
圖2 四種典型信號的左一奇異向量Fig.2 The left one singular vector of the four typical signals
圖3 四種典型信號的左二奇異向量Fig.3 The left two singular vector of the four typical signals
結(jié)合圖2和圖3分析發(fā)現(xiàn),四種信號的幅度峰值各不相同,結(jié)合左一和左二奇異向量能夠充分地保留原始時頻分布矩陣的信息,并且有效地反映了四種信號之間的差異性,進(jìn)而可以對這四種信號進(jìn)行區(qū)分。由于左一和左二奇異向量維數(shù)較高,使用主成分分析法(PCA)對奇異向量進(jìn)行維數(shù)約簡,構(gòu)成低維的特征向量作為改進(jìn)的半監(jiān)督主動學(xué)習(xí)識別器的輸入。
傳統(tǒng)的將主動學(xué)習(xí)與半監(jiān)督學(xué)習(xí)相結(jié)合的方法稱為半監(jiān)督主動學(xué)習(xí)算法(Collaborative Active and Semi-Supervised Labeling,CASSL)[9]。主動學(xué)習(xí)(AL)和半監(jiān)督學(xué)習(xí)(SSL)具有不同的工作機(jī)制,但在保持分類性能的同時,都減輕了人工標(biāo)記的成本[10]。在CASSL中,依靠主動學(xué)習(xí)抓取樣本進(jìn)行人工標(biāo)記并不能確保所有偽標(biāo)記的準(zhǔn)確性,因而CASSL并不能保證算法性能會隨著偽標(biāo)記樣本的加入而提高[11]。
針對CASSL算法的不足,本文對半監(jiān)督主動學(xué)習(xí)算法進(jìn)行了改進(jìn)。改進(jìn)的半監(jiān)督主動學(xué)習(xí)算法(Improved semi-supervised active learning,ISSAL) 基于偽標(biāo)記技術(shù),使用迭代驗(yàn)證的方法來改進(jìn)偽標(biāo)記的準(zhǔn)確性。ISSAL使得人類專家和分類器通過協(xié)作標(biāo)記的過程來獲取更加準(zhǔn)確的標(biāo)記信息,從而提高最終的分類性能。具體來說,通過 AL在逐漸擴(kuò)展的標(biāo)記數(shù)據(jù)集上訓(xùn)練附加的驗(yàn)證分類器,并與SSL中的分類器一起使用,以提高偽標(biāo)記準(zhǔn)確性,從而促進(jìn)SSL。因此,在算法復(fù)雜度方面,相較于傳統(tǒng)的CASSL算法,ISSAL算法多了一個SVM的算法復(fù)雜度,即O(N3)。此外,為了獲取AL中與識別相關(guān)的大部分未標(biāo)記樣本信息,只有在SSL中不能準(zhǔn)確地被分配偽標(biāo)簽的未標(biāo)記數(shù)據(jù)才能作為AL中的查詢候選樣本。
首先,利用原始標(biāo)記好的雷達(dá)信號樣本集L訓(xùn)練一個分類器,記為SVM1。然后采用MCLU查詢函數(shù)[12]從候選池中選擇h個最具有代表性的雷達(dá)信號樣本集Q進(jìn)行專家標(biāo)記并添加到已標(biāo)記的樣本集L中,更新標(biāo)記樣本集L和未標(biāo)記樣本集U。利用最新的標(biāo)記樣本集來訓(xùn)練另一個的分類器,為SVM2。對于SVM1和SVM2,對無標(biāo)記樣本集U進(jìn)行分類,將獲得兩個分類結(jié)果,分別為V1,V2,如果V1和V2中的樣本的標(biāo)簽是相同的,則記為偽標(biāo)記樣本集T。第二次迭代時,使用T和標(biāo)記數(shù)據(jù)集L在每次迭代中訓(xùn)練分類器SVM1。在本文的算法中,選擇使用基于RBF核函數(shù)的SVM模型作為分類器,同時設(shè)置每個實(shí)驗(yàn)中的RBF核函數(shù)參數(shù)gamma為0.1,懲罰因子Cs為100。
綜上分析,改進(jìn)的半監(jiān)督主動學(xué)習(xí)算法的主要步驟如下:
輸入:有標(biāo)記信號樣本集L;
偽標(biāo)記信號樣本集T=?;
未被作為偽標(biāo)記的信號樣本集:S=U;
無標(biāo)記信號樣本集U;
每次迭代采樣個數(shù):h;
迭代次數(shù):iter;
步驟1 利用已標(biāo)記信號樣本集L和偽標(biāo)記信號樣本集T訓(xùn)練SVM1;
步驟2 采用MCLU查詢函數(shù)從S中選擇h個信息量豐富的樣本集Q由人類專家進(jìn)行標(biāo)記,并更新L:L=L∪Q,U=U/Q;
步驟3 利用最新的樣本集L訓(xùn)練SVM2;
步驟4 利用SVM1和SVM2對U進(jìn)行分類,獲得兩個分類器的分類結(jié)果為V1,V2;
步驟5 更新T=(x,V1(x)|V1(x)=V2(x));
步驟6 更新S=U/T。
對步驟1至步驟6進(jìn)行迭代,直到迭代次數(shù)為iter。
輸出:基于最新的已標(biāo)記雷達(dá)信號樣本集L和被作為偽標(biāo)記的信號樣本集T訓(xùn)練分類器SVM。
為驗(yàn)證分類器SVM的泛化能力,設(shè)置一組雷達(dá)信號樣本作為測試集,輸出雷達(dá)信號識別率。
為驗(yàn)證本文識別算法的有效性,選取五種不同的輻射源信號進(jìn)行仿真實(shí)驗(yàn),分別為連續(xù)波(CW)信號、線性調(diào)頻(LFM)信號、二進(jìn)制頻移鍵控(FSK)信號、二相編碼(BPSK)信號、多相編碼(QPSK)信號。其中LFM的帶寬為15 MHz,BFSK信號的兩個頻率分別為f1=15 MHz,f2=20 MHz;BFSK采用6位Costas碼,編碼規(guī)則為:[100110],BPSK采用7位巴克碼,編碼規(guī)則為:[1110010]。
圖4 ISSAL和CASSL算法的在測試集上的性能Fig.4 The performance of ISSAL and CASSL on the test set
圖5 ISSAL和CASSL算法的識別性能進(jìn)行對比Fig.5 The performance comparison of ISSAL and CASSL
圖4可以發(fā)現(xiàn),在一定信噪比下,由于借助了迭代驗(yàn)證的方法,隨著有標(biāo)記訓(xùn)練集的增加,ISSAL算法對偽標(biāo)記樣本進(jìn)行了篩選和更正操作,識別率比CASSL算法提升的更高更快,并且能夠看出ISSAL算法的識別率最終收斂于基于SVM的學(xué)習(xí)模型,由此證明在訓(xùn)練樣本較少的條件下,ISSAL算法同樣能夠獲得較好的識別率。從圖5可以看出,隨著信噪比SNR的增加,ISSAL和CASSL算法的平均識別率都在提高,但是能明顯看出ISSAL的算法識別率比CASSL算法高。
對于本文提出的雷達(dá)信號識別方法,為證明其二次特征參數(shù)提取方法具有較高的準(zhǔn)確率,采用基于模糊函數(shù)奇異值分解(AF_SVD)[5]的方法和基于Wigner三譜[13]的識別方法進(jìn)行對比實(shí)驗(yàn)。圖6為在不同信噪比下三種方法的識別性能比較。
圖6 不同模型下輻射源識別性能對比Fig.6 The comparison of radiation recognition performance under different models
雷達(dá)信號識別是雷達(dá)偵察系統(tǒng)的關(guān)鍵部分,對于日益復(fù)雜的雷達(dá)體制,較少的訓(xùn)練樣本已成為信號識別分類中的一個重要研究課題。本文采用半監(jiān)督學(xué)習(xí)和主動學(xué)習(xí)相結(jié)合的方法,并對其進(jìn)行了改進(jìn),ISSAL提供了一種有效的偽標(biāo)記驗(yàn)證方案,從而提高了偽標(biāo)記的準(zhǔn)確性,在訓(xùn)練樣本非常有限的情況下有效改善了最終分類器的性能。同時本文采用基于徑向高斯核時頻分布奇異值分解的方法,提取奇異向量作為特征參數(shù),有效提高了在低信噪比情況下雷達(dá)信號的識別率。