唐文杰,程遠(yuǎn)國
(海軍工程大學(xué),湖北 武漢 430032)
雷達(dá)輻射源識別是電子對抗領(lǐng)域的關(guān)鍵技術(shù)之一,其目的在于根據(jù)截獲的雷達(dá)輻射源信號,得到能夠描述輻射源的特征參數(shù),從而獲取該雷達(dá)輻射源的體制、用途和型號等信息。傳統(tǒng)的識別方法是根據(jù)載頻(CF)、脈沖寬度(PW)、脈沖幅度(PA)、到達(dá)時間(TOA)、到達(dá)角(AOA)等構(gòu)成的脈沖描述字(PDW)對輻射源進(jìn)行識別[1]。隨著技術(shù)的發(fā)展,復(fù)雜體制雷達(dá)的應(yīng)用越來越廣泛。由于復(fù)雜體制雷達(dá)工作模式較多,信號參數(shù)變化大,PDW不能很好地描述雷達(dá)輻射源信息。研究人員轉(zhuǎn)而向雷達(dá)輻射源脈內(nèi)特征進(jìn)行挖掘[2-3]。例如文獻(xiàn)[4]根據(jù)模糊函數(shù)(AF)主脊切片特征對不同輻射源進(jìn)行唯一表示,然后通過奇異值分解降噪,實(shí)現(xiàn)了輻射源的識別。文獻(xiàn)[5]將屬性測度與D-S證據(jù)理論相結(jié)合,并通過屬性測度計(jì)算方法構(gòu)造證據(jù)理論中的基本概率賦值函數(shù),實(shí)現(xiàn)了雷達(dá)輻射源的用途和體制識別。
除此之外,當(dāng)前信號環(huán)境越來越復(fù)雜,偵察數(shù)據(jù)庫逐漸龐大,但其中數(shù)據(jù)價值參差不齊,其中不乏存在潛在價值的信息,對這些潛在價值的挖掘勢在必行。頻繁模式挖掘是指通過Apriori等算法對數(shù)據(jù)庫中頻繁出現(xiàn)且具有突出性質(zhì)的模式(如項(xiàng)集、序列等)進(jìn)行挖掘,從而獲取有價值的信息[6-7]。在輻射源識別領(lǐng)域,不管信號樣式、參數(shù)如何多變,但目標(biāo)平臺所搭載的輻射源種類、數(shù)量是固定的,各信號間必然存在強(qiáng)關(guān)聯(lián)規(guī)則。對這些關(guān)聯(lián)規(guī)則的挖掘能夠?yàn)檩椛湓醋R別提供支持。本文以偵察數(shù)據(jù)庫中信號的幾項(xiàng)常規(guī)參數(shù)為基礎(chǔ)構(gòu)建特征向量,通過Apriori算法對特征向量庫進(jìn)行處理,從而實(shí)現(xiàn)了基于特征參數(shù)向量的頻繁模式挖掘。結(jié)合其他來源的數(shù)據(jù)信息,可生成信號與信號之間以及與輻射源之間的關(guān)聯(lián)規(guī)則。將偵獲信號與關(guān)聯(lián)規(guī)則相匹配,可為輻射源的識別提供依據(jù)。模擬數(shù)據(jù)的仿真實(shí)驗(yàn)表明,該方法具有一定的可行性和有效性。
將偵察數(shù)據(jù)庫中各信號的參數(shù)進(jìn)行整合處理,由于載頻、脈寬、脈幅和脈沖重復(fù)間隔(PRI)能夠較為明顯地反映雷達(dá)用途,而且參數(shù)獲取較容易,故采用CF、PW、PA、PRI 4個參數(shù)組成特征向量Si:
Si={Fci,Wpi,Api,fPRIi}
(1)
式中:腳標(biāo)i為序列號,即每一組參數(shù)構(gòu)成一個特征向量。
根據(jù)復(fù)雜體制雷達(dá)的實(shí)際情況,即每種工作模式對應(yīng)多種不同的信號,構(gòu)建輻射源信號組成模型:
Rk={Sk1,Sk2,…,Skj},1≤k≤m,1≤j≤n
(2)
式中:k為輻射源編號;m為輻射源數(shù)量;j為輻射源所包含信號編號;n為信號數(shù)量。
本文使用經(jīng)典的Apriori算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘。Apriori算法是Agrawal和R.Srikant于1994年提出的,是布爾關(guān)聯(lián)規(guī)則挖掘頻繁模式的原創(chuàng)性算法。該算法使用逐層搜索的迭代方法從數(shù)據(jù)庫中找出項(xiàng)目的關(guān)系。使用k項(xiàng)集用于搜索(k+1)項(xiàng)集(其中k=1,2,…),循環(huán)迭代至無法生成更高的頻繁k項(xiàng)集為止。
對特征參數(shù)向量關(guān)聯(lián)規(guī)則挖掘的具體步驟如下:
(1) 根據(jù)實(shí)際情況,設(shè)置好最小支持度(min_sup)和最小置信度(min_conf),支持度-置信度框架是評價關(guān)聯(lián)規(guī)則是否有價值的標(biāo)準(zhǔn)。掃描偵察數(shù)據(jù)庫,第1次迭代,數(shù)據(jù)庫中的每個項(xiàng)都是候選1-項(xiàng)集的集合C1的成員,即所有信號特征參數(shù)向量均存入候選1-項(xiàng)集C1。算法記錄每個項(xiàng)出現(xiàn)的次數(shù),即每個項(xiàng)的支持度,大于min_sup的項(xiàng)組成頻繁1-項(xiàng)集L1。
(3) 剪枝步:根據(jù)性質(zhì)“任何非頻繁的(k-1)項(xiàng)集都不是頻繁k項(xiàng)集的子集”對候選頻繁k項(xiàng)集Ck進(jìn)行修剪。即如果1個候選k項(xiàng)集的(k-1)項(xiàng)子集不在Lk-1中,則該候選也不可能是頻繁的,從而應(yīng)在Ck中刪除。
(4) 掃描數(shù)據(jù)庫,記錄Ck中各項(xiàng)集的頻度,即支持度。支持度大于min_sup的項(xiàng)集組成頻繁k項(xiàng)集Lk。循環(huán)運(yùn)行(2)、(3)至無法生成更高的頻繁k項(xiàng)集時,輸出產(chǎn)生的頻繁項(xiàng)集∪Lk。
(5) 由頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則。對每一個頻繁項(xiàng)集L產(chǎn)生其所有非空真子集,對于每個真子集s,當(dāng)滿足式(3)時,輸出規(guī)則“s→(L-s)”,并給出置信度。
(3)
式中:count()表示包含對應(yīng)項(xiàng)集的事務(wù)數(shù)。
算法偽代碼略。
為便于進(jìn)行示例分析且盡可能模擬實(shí)際情況,式(2)中m取值為3,n分別取值2,3,4,即共有3部雷達(dá)輻射源,分別擁有2,3,4種工作信號。而在偵察數(shù)據(jù)庫中,由于信號所屬雷達(dá)未知,故采用Sx(x=1,2,…,9)表示。表1為模擬偵察數(shù)據(jù)庫,其中事物T代表以實(shí)時態(tài)勢為依據(jù)劃分的不同時間段。信號種類模擬以雷達(dá)工作情況和潛在邏輯關(guān)系為依據(jù)。
表1 偵察數(shù)據(jù)庫
以時間段作為事務(wù),特征向量作為項(xiàng)集,運(yùn)用Apriori算法進(jìn)行頻繁模式挖掘,根據(jù)所得頻繁項(xiàng)集L和其他來源的輻射源信息可生成所需的信號與輻射源之間的關(guān)聯(lián)規(guī)則。
根據(jù)模擬的偵察數(shù)據(jù)庫,設(shè)置最小支持度為20%,最小置信度為80%,運(yùn)行Apriori算法可產(chǎn)生不同項(xiàng)目數(shù)的頻繁項(xiàng)集。由于頻繁1-項(xiàng)集參考價值較低,這里不做論述。表2、表3、表4分別為所得頻繁2-項(xiàng)集、3-項(xiàng)集、4-項(xiàng)集以及其對應(yīng)的支持度。
表2 頻繁2-項(xiàng)集及支持度
表3 頻繁3-項(xiàng)集及支持度
表4 頻繁4-項(xiàng)集及支持度
分析上述3個表格的數(shù)據(jù)結(jié)果,可以看出,S1和S2,S3、S4和S5,S6、S7、S8和S9具有一定的布爾規(guī)則關(guān)聯(lián)性,結(jié)合數(shù)據(jù)庫中的方位信息以及其他來源的數(shù)據(jù)信息,在一定的支持度-置信度水平下,可認(rèn)為這3組信號分別來自于3個不同輻射源,即滿足如下規(guī)則:
R1={S1,S2}support=26.67%
(4)
R2={S3,S4,S5}support=20.00%
(5)
R3={S6,S7,S8,S9}support=20.00%
(6)
在最小置信度80.00%的水平下,算法共生成29條關(guān)聯(lián)規(guī)則。表5所列為包含4項(xiàng)的關(guān)聯(lián)規(guī)則。
表5 產(chǎn)生的4-項(xiàng)關(guān)聯(lián)規(guī)則
以“S6,S7,S9→S8”為例,表示當(dāng)S6,S7,S9信號存在的情況下,置信度為85.71%的水平下可認(rèn)為會有S8信號存在。結(jié)合信號特征分析,這能夠?yàn)檩椛湓纯赡苓M(jìn)行的行為預(yù)測提供支持。
本文提到的通過關(guān)聯(lián)規(guī)則識別輻射源能夠進(jìn)一步挖掘現(xiàn)有信息數(shù)據(jù)庫的潛在價值,是對海量數(shù)據(jù)信息有效處理運(yùn)用的體現(xiàn)。首先整合偵察數(shù)據(jù)庫中信號的參數(shù)信息,形成特征向量。然后對特征向量運(yùn)用Apriori算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘。將信號間的布爾關(guān)聯(lián)規(guī)則同其他來源的雷達(dá)輻射源信息進(jìn)行匹配并建立關(guān)聯(lián)規(guī)則數(shù)據(jù)庫,可為偵獲信號的雷達(dá)輻射源識別提供支持。但是算法對設(shè)備運(yùn)算能力和存
儲能力要求較高,進(jìn)行工程實(shí)現(xiàn)還需要進(jìn)一步提高算法的時間-空間效率。另一方面,通過聚類等其他方式對數(shù)據(jù)進(jìn)行預(yù)處理也是必要的,對壓縮后的數(shù)據(jù)進(jìn)行挖掘能夠更快速有效地獲得關(guān)聯(lián)規(guī)則。
[1] WILEY R G.Electronic Intelligence:The Analysis of Radar Signals[M].New York:Artech House,1993:36-37.
[2] 周志文,黃高明,陳海洋,等.雷達(dá)輻射源識別算法綜述[J].電訊技術(shù),2017,57(8):973-980.
[3] 沈家煌,黃建沖,朱永成.雷達(dá)輻射源信號快速識別綜述[J].電子信息對抗技術(shù),2017,32(5):5-10.
[4] GUO Q,NAN P L,ZHANG X Y,et al.Recognition of radar emitter signals based on SVD and AF main ridge slice[J].Journal of Communications and Networks,2015,17(5):491-498.
[5] 何友,關(guān)欣,衣曉.基于屬性測度的輻射源識別方法研究[J].中國科學(xué)E輯:信息科學(xué),2004,34(12):1329-1336.
[6] HAN J,KAMBER M,PEI J.數(shù)據(jù)挖掘:概念與技術(shù)[M].3版.范明,孟小峰譯.北京:機(jī)械工業(yè)出版社,2017.
[7] 張一梅.基于數(shù)組的關(guān)聯(lián)規(guī)則挖掘算法的改進(jìn)研究[D].太原:太原理工大學(xué),2008.