郜麗鵬,沙作金
哈爾濱工程大學 信息與通信工程學院,黑龍江 哈爾濱 150001
在現(xiàn)代電子戰(zhàn)中,隨著科學技術的不斷更新應用,新的雷達體制和信號調制樣式相繼出現(xiàn)在日益復雜的電磁環(huán)境中[1]。雷達信號分選作為衡量偵察系統(tǒng)是否仍能適應當前電子對抗環(huán)境的標志[2],面臨著日益嚴峻的挑戰(zhàn)。如何在現(xiàn)在這種復雜的電磁環(huán)境中正確地分選出雷達信號,一直是分選工作中的重點和難題。
目前電磁環(huán)境中的雷達脈沖數(shù)量已經(jīng)超過了每秒百萬個的量級,而雷達分選算法需要進行處理的數(shù)據(jù)量和雷達數(shù)目的平方呈正比例關系,而分選設備處理速度的提升受限于硬件設備[3],因此有必要減輕主分選算法的負擔,將聚類作為雷達信號的預處理過程可以很好地達到這個目的。K?means聚類算法作為一種經(jīng)典的聚類算法,原理簡單,收斂速度快,因而被廣泛應用[4],不過該算法的缺點也較多,對噪聲敏感、需要人工設置K值大小、聚類效果受初始聚類中心的選取影響等。李德毅[5]院士在傳統(tǒng)物理場的思想上提出了數(shù)據(jù)場這一概念之后,數(shù)據(jù)場被應用到雷達信號聚類算法中,能夠克服K?means聚類算法的這幾個缺點,具有良好的應用性能。因此,本文提出一種基于數(shù)據(jù)場的雷達信號聚類算法,計算每個數(shù)據(jù)對象在數(shù)據(jù)場中的勢值,根據(jù)勢值的極值點求出勢心,勢心就是雷達信號的參數(shù)中心。作為聚類的聚類中心,勢心的數(shù)量則是聚類的類別個數(shù),因此無需人工設置聚類數(shù)目的值以及選取初始聚類中心。此外設置數(shù)據(jù)點的勢值閾值可以將孤立的噪聲點剔除出去。針對聚類過程中出現(xiàn)的增批現(xiàn)象,將數(shù)據(jù)場的場強函數(shù)的形式進行改進,取得了良好的效果。
將數(shù)據(jù)對象的集合映射到數(shù)域空間中,依照物理學中的穩(wěn)定有源場,將數(shù)據(jù)對象視為源點,在源點周圍產(chǎn)生場,對周圍其他的數(shù)據(jù)對象產(chǎn)生影響,能夠影響的范圍所構成的空間就成為數(shù)據(jù)場[6]。
為了能夠準確描述數(shù)據(jù)場是如何對周圍的數(shù)據(jù)對象產(chǎn)生影響、相互之間進行作用的,參考物理中的牛頓萬有引力定律和庫倫定律公式[7],數(shù)據(jù)場也應該存在一種方式可以衡量數(shù)據(jù)場中的源點對周圍其他數(shù)據(jù)對象的影響強弱的函數(shù)公式,則定義這個公式為場強函數(shù)。數(shù)據(jù)場的場強函數(shù)是描述以源點為中心的周圍空間中的數(shù)據(jù)場的變化規(guī)律的函數(shù),考慮到高斯分布的普遍適用特性,概率密度分布函數(shù)的形式以及短程場作用更方便表達數(shù)據(jù)對象分布的聚簇的特性,場強函數(shù)一般定義為[8]
一個數(shù)據(jù)對象的場強函數(shù)描述的是以其為源點的數(shù)據(jù)場的變化規(guī)律,但是數(shù)據(jù)挖掘面對的是大量的數(shù)據(jù)對象,只研究單個數(shù)據(jù)對象的數(shù)據(jù)場變化規(guī)律對整個數(shù)據(jù)集合并沒有什么實際意義,需要研究的是所有數(shù)據(jù)對象的數(shù)據(jù)場的共同作用下的空間中的點的場強值的變化規(guī)律。定義此點處的所有數(shù)據(jù)場的場強值的和為勢值,根據(jù)這個定義和場強函數(shù)可以得到勢函數(shù)的公式為[10]
式中n表示為數(shù)據(jù)的數(shù)量。
圖1 輻射因子不同時勢值變化
圖2 輻射因子與勢熵的關系曲線
孤立噪聲點距離實際的聚類中心有相對很大的距離,這個距離已經(jīng)遠遠超出了單個數(shù)據(jù)點的數(shù)據(jù)場所能有效輻射的范圍,即距離遠遠大于[13]。根據(jù)數(shù)據(jù)場的場強函數(shù)可以得知,在這個距離下,其他脈沖點輻射給它的場強的大小的數(shù)量級遠遠小于這個數(shù)域空間中存在的脈沖個數(shù)的數(shù)量級,所以孤立脈沖點的勢值大小應該大于并且十分接近1。因此可以設置閾值,將勢值小于閾值的數(shù)據(jù)對象視為噪聲剔除掉。
除了要滿足場強函數(shù)的導數(shù)值在近距離時比高斯函數(shù)要小之外,還要滿足場強函數(shù)的其他特點:場強函數(shù)是一個連續(xù)光滑的函數(shù)、在距離為0時,場強值為0;距離趨于無窮大時,場強值趨于0。根據(jù)上述幾個條件,最先想到的就是指數(shù)函數(shù)。
解這個方程,得到:
在實際中,a的值可以根據(jù)情況進行調整。
綜上所述,改進的的場強函數(shù)的表達式為
改進的數(shù)據(jù)場聚類的步驟為:
1)對提取聚類所用的3個參數(shù)脈寬(PW)、載頻(RF)、到達角(DOA)進行歸一化處理;
2)將脈沖序列按照到達時間排序,依次計算各個脈沖點之間的歐式距離,得到一個n×n的距離矩陣;
3)將所求得的距離矩陣代入數(shù)據(jù)場的場強函數(shù),得到各個脈沖點的場強值,按列求和得到每個點的勢值。
4)根據(jù)設置的閾值剔除孤立噪聲點,找到局部勢值最大的數(shù)據(jù)樣本作為聚類中心,局部勢值最大的數(shù)據(jù)樣本的個數(shù)作為聚類數(shù)目;
5)根據(jù)之前求得的距離矩陣,將雷達脈沖序列中的數(shù)據(jù)樣本依次劃分到距離此數(shù)據(jù)樣本最近的一個聚類中心的那一類中[14]。
本文仿真了12部雷達脈沖信號,參數(shù)如表1所示。表中序號1~5為常規(guī)雷達信號,序號6、7為抖動雷達信號,序號8~10為參差雷達信號,序號11、12為捷變頻雷達信號,分別是脈間捷變和脈組捷變雷達信號。雷達信號脈寬精度為1 μs,載頻精度為1 MHz,方位角精度為1°,10%的干擾脈沖。圖3為仿真的12部雷達信號在以載頻?脈寬?到達角為參數(shù)的的三維空間中的分布。
圖3 待聚類雷達信號
表1 雷達參數(shù)表
計算所有雷達脈沖信號的勢值,可以得到雷達脈沖信號的脈寬、載頻、到達角和勢值的關系圖如圖4~6所示。
圖4 脈寬?到達角?勢值關系
圖5 脈寬?載頻?勢值關系
圖6 載頻?到達角?勢值關系
使用剔除勢心法得到的聚類中心如表2所示。
表2 聚類中心參數(shù)表
將改進前后的數(shù)據(jù)場聚類求得的聚類中心與理論的雷達信號中心進行誤差值的計算,并進行1 000次的蒙特卡洛實驗,仿真結果如圖7所示。
圖7 改進前后的聚類中心誤差曲線
可以看到改進前的數(shù)據(jù)場聚類會出現(xiàn)多次求得的聚類中心與理論值的誤差很大的情況,而改進之后的數(shù)據(jù)場所求得的聚類中心與理論值的誤差的平均值和方差都要比改進前小。分析出現(xiàn)誤差大的情況是因為出現(xiàn)了增批的現(xiàn)象,改進的數(shù)據(jù)場聚類有效地抑制這種增批現(xiàn)象的出現(xiàn)。
本文提出了一種改進的數(shù)據(jù)場聚類算法,通過重新分配數(shù)據(jù)場內場強值和距離的關系變化情況,即對場強函數(shù)進行改進這一方式達到改善聚類結果的目標。
1)改進后的數(shù)據(jù)場聚類求得的聚類中心與理論值的誤差和方差更小,說明求得的聚類中心更準確;
2)改進后的數(shù)據(jù)場聚類出現(xiàn)增批現(xiàn)象的次數(shù)大大減少。
經(jīng)仿真實驗表明,本文提出的算法能夠很好地完成聚類,具有良好的聚類性能。關于如何減少出現(xiàn)的漏批現(xiàn)象還需要進一步的深入研究。