張澤銳,張?zhí)熨t,陳鋒彬,李健濤
(電子科技大學(xué) 信息與通信工程學(xué)院, 四川 成都 611731)
近年來(lái),距離門(mén)拖引干擾(RGPO)因其被發(fā)現(xiàn)概率小、被感知識(shí)別風(fēng)險(xiǎn)低以及對(duì)雷達(dá)干擾效果顯著等優(yōu)點(diǎn)而受到廣大研究者的青睞。然而,隨著雷達(dá)有源欺騙干擾感知技術(shù)研究的深入[1-2],傳統(tǒng)的勻速拖引策略和勻加速拖引策略越來(lái)越容易被識(shí)別,這就對(duì)干擾方所提供的干擾策略提出了更高的性能需求。
目前,RGPO干擾領(lǐng)域的工作主要集中在信號(hào)級(jí)上干擾信號(hào)的波形設(shè)計(jì)與生成[3-5],卻忽視了在數(shù)據(jù)級(jí)上基于RGPO干擾策略的優(yōu)化。實(shí)際上,數(shù)據(jù)級(jí)上基于干擾策略的優(yōu)化不僅能夠提升干擾成功率,并且能夠降低拖引策略被敵方雷達(dá)感知識(shí)別的可能性,是一種極具研究?jī)r(jià)值的反感知RGPO干擾方法。文獻(xiàn)[6-7]早就指出對(duì)時(shí)延的設(shè)置是影響RGPO干擾策略性能的主要因素,并定性分析了時(shí)延對(duì)RGPO干擾的影響。此后,利用優(yōu)化算法對(duì)RGPO干擾中的時(shí)延設(shè)置進(jìn)行優(yōu)化成為了研究熱點(diǎn)[8-11],文獻(xiàn)[8]以平均波門(mén)偏移距離作為干擾效果的性能評(píng)價(jià)指標(biāo),建立了RGPO干擾的多幀聯(lián)合優(yōu)化模型,提出了基于粒子群優(yōu)化(PSO)算法的RGPO干擾策略?xún)?yōu)化方法。文獻(xiàn)[10]針對(duì)雷達(dá)跟蹤系統(tǒng)干擾性能不足的問(wèn)題,以粒子群優(yōu)化算法為基礎(chǔ)提出了一種RGPO干擾策略自適應(yīng)生成方法。
然而,由于雷達(dá)跟蹤過(guò)程中存在過(guò)程噪聲和量測(cè)噪聲,即使干擾策略是固定的,敵方雷達(dá)跟蹤系統(tǒng)所產(chǎn)生的干擾結(jié)果仍然存在不確定性,使得衡量RGPO干擾策略的性能變得更加困難。并且,在真實(shí)的戰(zhàn)場(chǎng)環(huán)境下,干擾方依賴(lài)偵察分析雷達(dá)發(fā)射信號(hào)來(lái)獲得少量的雷達(dá)行為特征,準(zhǔn)確獲得敵方雷達(dá)跟蹤效果的可能性極小,這就意味著干擾方將難以直接觀(guān)察到敵方雷達(dá)跟蹤系統(tǒng)對(duì)干擾結(jié)果的準(zhǔn)確反饋。因此,RGPO干擾的策略?xún)?yōu)化并不是一個(gè)確定性的優(yōu)化問(wèn)題,而是一個(gè)隨機(jī)仿真優(yōu)化問(wèn)題,現(xiàn)有的各種智能優(yōu)化算法在隨機(jī)優(yōu)化環(huán)境下的性能還需要進(jìn)一步的提升。
基于以上分析,本文首先將RGPO干擾的策略?xún)?yōu)化問(wèn)題建模為一個(gè)隨機(jī)仿真優(yōu)化(SSO)問(wèn)題,并設(shè)計(jì)了一個(gè)不依賴(lài)于敵方雷達(dá)跟蹤系統(tǒng)信息的RGPO干擾策略評(píng)價(jià)方案。為了解決干擾策略性能評(píng)價(jià)的不確定性,可以利用重采樣的方法得到干擾策略的評(píng)分均值,并以此評(píng)價(jià)該干擾策略的性能。本文將一種基于假設(shè)檢驗(yàn)的計(jì)算預(yù)算分配算法與傳統(tǒng)的粒子群優(yōu)化算法結(jié)合,提出了一種基于假設(shè)檢驗(yàn)的計(jì)算預(yù)算分配-粒子群優(yōu)化算法(HTCBA-PSO)。最后,通過(guò)數(shù)值仿真的方式與PSO-ER、PSO-ERN[12]、PSO-OCBA[13]等傳統(tǒng)隨機(jī)仿真優(yōu)化算法進(jìn)行了比較,驗(yàn)證了該算法的有效性。
圖1 RGPO干擾場(chǎng)景示意圖Fig.1 Diagram of RGPO jamming
(1)
因此,在第k個(gè)干擾階段,真實(shí)目標(biāo)與假目標(biāo)之間的距離dk可以表示為
(2)
式中:c代表光速。
設(shè)真實(shí)目標(biāo)的狀態(tài)方程為
X(k)=f[k,X(k-1)]+ψ[,X(k-1),v[X(k-1)]]
(3)
式中:X(k)表示第k個(gè)干擾階段真實(shí)目標(biāo)的狀態(tài)向量;f[·]表示當(dāng)前干擾階段狀態(tài)與下一干擾階段狀態(tài)之間的狀態(tài)轉(zhuǎn)換函數(shù);v[·]表示過(guò)程噪聲序列;ψ[·]表示過(guò)程噪聲的分布函數(shù)。
(4)
式中:θ[·]是將dk投影到狀態(tài)空間中的投影函數(shù)。此時(shí),雷達(dá)跟蹤系統(tǒng)對(duì)真實(shí)目標(biāo)和假目標(biāo)狀態(tài)矢量的量測(cè)值可以分別表示為
Z(k)=h(k,X(k))+ω[k,X(k)]
(5)
(6)
式中:h[·]表示測(cè)量函數(shù);ω[·]表示量測(cè)噪聲序列。
一般來(lái)說(shuō),雷達(dá)跟蹤系統(tǒng)的數(shù)據(jù)處理過(guò)程為
(7)
(8)
式中:φ[·]表示關(guān)聯(lián)函數(shù);(k)表示被懷疑來(lái)自被跟蹤目標(biāo)的量測(cè)集。由此可以得出雷達(dá)跟蹤系統(tǒng)在第k個(gè)干擾階段的狀態(tài)估計(jì)為
(9)
一般情況下,對(duì)RGPO干擾結(jié)果的評(píng)價(jià)主要取決于兩點(diǎn):
(1) 真實(shí)目標(biāo)是否離開(kāi)跟蹤波門(mén)。
(2) 波門(mén)拖引距離(POD),即在有限的干擾階段內(nèi)RGPO干擾將雷達(dá)距離波門(mén)中心拖離真目標(biāo)位置的距離。
在本文中對(duì)RGPO干擾策略性能的評(píng)價(jià)將基于以上兩項(xiàng)指標(biāo)進(jìn)行。
首先,定義ξ(k)為真實(shí)目標(biāo)在第k個(gè)干擾階段是否擺脫跟蹤波門(mén)
(10)
式中:ξ(k)=1表示真實(shí)目標(biāo)已經(jīng)擺脫跟蹤波門(mén),而ξ(k)=0表示真實(shí)目標(biāo)還尚未擺脫跟蹤波門(mén)。
(11)
(12)
據(jù)此,定義第k個(gè)干擾階段的拖引距離為
(13)
為了評(píng)價(jià)在最后一個(gè)干擾階段K的RGPO干擾策略性能,干擾策略性能可以表示為以ξ(K)和拖引距離POD(K)為自變量的函數(shù)
(14)
式(14)中包含噪聲和雜波序列,RGPO干擾策略的性能存在不確定性。因此,建立隨機(jī)仿真優(yōu)化模型為
(15)
式中:Ω代表決策空間。
POD(k)屬于敵方雷達(dá)跟蹤系統(tǒng)信息,并不會(huì)在電子對(duì)抗中被干擾方輕易獲取,因此,式(14)所表示的干擾策略評(píng)價(jià)方案要簡(jiǎn)化為一種對(duì)敵方雷達(dá)跟蹤系統(tǒng)信息需求更小的評(píng)價(jià)方案。
一般情況下,干擾方可以通過(guò)在干擾停止時(shí)感知敵方雷達(dá)工作模式是否改變來(lái)判斷真實(shí)目標(biāo)是否已經(jīng)擺脫跟蹤波門(mén)。因此,對(duì)于干擾策略性能的評(píng)價(jià)可以據(jù)此分為以下兩種情況:
(1) 如果真實(shí)目標(biāo)沒(méi)有擺脫跟蹤波門(mén),即ξ(K)=0,那么該干擾策略的評(píng)分將為0。
(2) 如果真實(shí)目標(biāo)已擺脫跟蹤波門(mén),即ξ(K)=1,此時(shí)的干擾策略評(píng)分將取決于POD(K)。
(16)
式中:d1imit表示為防止異常干擾結(jié)果影響干擾策略平均性能而設(shè)置的參數(shù)。
在本節(jié)中,圖2展示了HTCBA-PSO的總體架構(gòu)和基本原理。HTCBA-PSO的主體包括兩個(gè)部分:PSO和基于假設(shè)檢驗(yàn)的計(jì)算預(yù)算分配。其中,PSO主要用于搜索解空間并生成N個(gè)候選解[14],計(jì)算預(yù)算分配則主要負(fù)責(zé)分配有限的計(jì)算預(yù)算M來(lái)估計(jì)這些候選解的性能。
圖2 HTCBA-PSO流程圖Fig.2 Generic diagram of HTCBA-PSO
在PSO的第t次迭代中,每個(gè)粒子的位置更新為
(17)
(18)
(19)
式中:tmax表示最大迭代次數(shù),在這里取150;ωmax表示慣性權(quán)重的初始值,通常取0.9;ωmin表示迭代結(jié)束時(shí)的慣性權(quán)重值,通常取0.4。
為了對(duì)PSO生成的候選RGPO干擾策略性能進(jìn)行評(píng)價(jià),本文采用重采樣的方法對(duì)候選RGPO干擾策略進(jìn)行性能估計(jì)。顯然,采樣次數(shù)越多,該候選策略的性能估計(jì)就越準(zhǔn)確。但是在現(xiàn)實(shí)工程問(wèn)題中,重采樣次數(shù)是重要的計(jì)算預(yù)算資源,過(guò)多的重采樣次數(shù)會(huì)加大時(shí)間和計(jì)算預(yù)算資源上的負(fù)擔(dān),因此重采樣的次數(shù)是有限的。本節(jié)針對(duì)有限的計(jì)算預(yù)算資源分配問(wèn)題,提出了一種基于假設(shè)檢驗(yàn)的計(jì)算預(yù)算分配方法。
計(jì)算預(yù)算的分配分為多個(gè)階段,首先,要將初始計(jì)算預(yù)算m0分配給PSO所生成的每個(gè)RGPO干擾策略,以獲得下一個(gè)分配階段中必需的的統(tǒng)計(jì)信息。在之后的每個(gè)階段,都會(huì)根據(jù)特定的分配規(guī)則面向RGPO干擾策略分配增量計(jì)算預(yù)算Δ。為了構(gòu)建一個(gè)更為合理的計(jì)算預(yù)算分配規(guī)則,引入了假設(shè)檢驗(yàn)的相關(guān)理論。
(20)
(21)
由于自由度必須為整數(shù),要對(duì)計(jì)算結(jié)果進(jìn)行取整處理,
(22)
此時(shí),該項(xiàng)假設(shè)檢驗(yàn)的p值δij可以表示為
(23)
(24)
λb=max(δb,1,…,δb,o,…,δb,N)
(o∈{1,2,…,N},o≠b)
(25)
λo=δb,o(o∈{1,2,…,N},o≠b)
(26)
顯然,將更多的計(jì)算預(yù)算分配給具有更高不確定度的干擾策略是選擇最優(yōu)RGPO干擾策略的關(guān)鍵,即不確定度越高的干擾策略將被分配更多的計(jì)算預(yù)算,因此,可以得到一個(gè)分配規(guī)則如式(27)所示。
(27)
為了評(píng)價(jià)HTCBA-PSO在RGPO干擾策略?xún)?yōu)化上的性能優(yōu)勢(shì),假設(shè)跟蹤目標(biāo)在二維平面內(nèi)作近似勻速(CV)運(yùn)動(dòng),并在該跟蹤場(chǎng)景下與其他優(yōu)化算法進(jìn)行了對(duì)比仿真驗(yàn)證。
假設(shè)跟蹤目標(biāo)從[50 km, 55 km]處出發(fā),以[50 m/s, 350 m/s]的速度作近似勻速直線(xiàn)運(yùn)動(dòng),跟蹤目標(biāo)在x軸方向上和y軸方向上的過(guò)程噪聲均滿(mǎn)足N(0.52);跟蹤方雷達(dá)采用卡爾曼濾波的方式進(jìn)行跟蹤,其在距離向和角度上的量測(cè)噪聲分別滿(mǎn)足N(0,102)和N(0,0.001 752),在x軸方向上和y軸方向上的過(guò)程噪聲均滿(mǎn)足N(0,102),跟蹤波門(mén)采用橢圓波門(mén),波門(mén)參數(shù)γ設(shè)為16,量測(cè)落入波門(mén)內(nèi)概率為0.999 7;干擾方的總拖引幀數(shù)為15,d1imit取900 m。
PSO的相關(guān)參數(shù)已在上一節(jié)中介紹。對(duì)于HTCBA而言,初始計(jì)算預(yù)算m0設(shè)為100,每一次PSO迭代中所要分配的總計(jì)算預(yù)算M設(shè)為10 000,每個(gè)分配階段需要分配的計(jì)算預(yù)算Δ設(shè)為1 000。由于總計(jì)算預(yù)算數(shù)量有限,粒子群中粒子個(gè)數(shù)越多,分配給每個(gè)粒子的計(jì)算預(yù)算數(shù)量就越少。為了探究粒子個(gè)數(shù)對(duì)算法性能的影響,在本節(jié)的算法性能對(duì)比實(shí)驗(yàn)中粒子個(gè)數(shù)N將被分別設(shè)為40、20和10。
表1給出了PSO-ER[8,10]、PSO-ERN、PSO-OCBA[9]、HTCBA-PSO四種算法在50次Monte Carlo實(shí)驗(yàn)后所得到的最佳RGPO干擾策略的平均最優(yōu)。
表1 平均最Tab.1
圖3給出了PSO-ER、PSO-ERN、PSO-OCBA、HTCBA-PSO四種算法在上述仿真條件下,經(jīng)過(guò)50次Monte Carlo實(shí)驗(yàn)后所得到的最佳RGPO干擾策略的平均迭代曲線(xiàn)。
圖3 三種情況下的平均迭代曲線(xiàn)Fig.3 Average iteration profile of
從圖3中可以發(fā)現(xiàn),當(dāng)從10變化到40的過(guò)程中,HTCBA-PSO的性能均優(yōu)于其他三種算法。同時(shí)結(jié)合對(duì)表1結(jié)果的分析可知,當(dāng)N=10或N=20時(shí),HTCBA-PSO的初始性能較差,但是隨著迭代次數(shù)的增加,HTCBA-PSO所得到的RGPO干擾策略性能迅速提高,當(dāng)N=40時(shí),HTCBA-PSO的初始性能良好,但是性能曲線(xiàn)的提升速度卻小于N=10或N=20的情況。這是因?yàn)樵贜比較小時(shí),HTCBA-PSO本身的搜索能力較弱,導(dǎo)致在迭代初期對(duì)解空間的搜索不足。因此,有限的計(jì)算預(yù)算能夠分配給更少量的候選解,提升RGPO干擾策略性能的估計(jì)準(zhǔn)確性。因此,性能曲線(xiàn)會(huì)隨著迭代次數(shù)的增加而迅速提高。但是,這仍然無(wú)法彌補(bǔ)在N=10或N=20的情況下HTCBA-PSO對(duì)解空間的探索能力不足的問(wèn)題,所以HTCBA-PSO在N=40時(shí)得到的RGPO干擾策略的平均性能要優(yōu)于其他情況。
上述結(jié)果已經(jīng)可以證明基于HTCBA-PSO的RGPO干擾策略?xún)?yōu)化算法的性能優(yōu)于其他算法。但是,通過(guò)HTCBA-PSO所得到的RGPO干擾策略的具體干擾效果還需要通過(guò)實(shí)驗(yàn)加以驗(yàn)證。因此,本文將利用POD和拖引成功率(POR)兩項(xiàng)評(píng)價(jià)指標(biāo)來(lái)測(cè)試N=40時(shí)通過(guò)HTCBA-PSO所得到的RGPO干擾策略的具體干擾效果。傳統(tǒng)的勻速拖引策略和勻加速拖引策略就是讓假目標(biāo)相對(duì)于真目標(biāo)做勻速運(yùn)動(dòng)或勻加速運(yùn)動(dòng)來(lái)達(dá)到拖引波門(mén)離開(kāi)真目標(biāo)的目的。為了增加對(duì)比效果,本文也展示了傳統(tǒng)的勻速干擾策略和勻加速拖引干擾策略在CV場(chǎng)景下的具體干擾效果。
圖4繪制了在拖引速度取154 m/s的情況下,勻速拖引策略在CV場(chǎng)景下的POD箱線(xiàn)圖和POR曲線(xiàn)。通過(guò)觀(guān)察可知,在勻速拖引策略下,POD箱線(xiàn)圖在最后一幀的上四分位數(shù)可以達(dá)到383 m;POR在最后一幀可以達(dá)到15.04%。
圖4 勻速拖引策略在CV場(chǎng)景下的POD箱線(xiàn)圖和POR曲線(xiàn)Fig.4 Simulation results of POD and POR for uniform velocity pull-off jamming strategy over different jamming stages on CV benchmark
圖5繪制了在拖引初速度取86 m/s,加速度取64 m/s2的情況下[9],勻加速拖引策略在CV場(chǎng)景下的POD箱線(xiàn)圖和POR曲線(xiàn)。
圖5 勻加速拖引策略在CV場(chǎng)景下的POD箱線(xiàn)圖和POR曲線(xiàn)Fig.5 Simulation results of POD and POR for uniform acceleration pull off jamming strategy over different jamming stages on CV benchmark
通過(guò)觀(guān)察可知,在勻加速拖引策略下,POD箱線(xiàn)圖在最后一幀的上四分位數(shù)可以達(dá)到626 m;POR在最后一幀可以達(dá)到18.72%。圖6繪制了在HTCBA-PSO所生成的RGPO干擾策略下的POD箱線(xiàn)圖和POR曲線(xiàn)。由圖6中的箱線(xiàn)圖可知,隨著干擾幀數(shù)的增加,POD的箱線(xiàn)圖逐漸發(fā)散,其上四分位數(shù)最終可以達(dá)到725 m。與此同時(shí),隨著干擾幀數(shù)的增加,POR不斷增加,最終達(dá)到了接近25%的拖引成功率。然而,在第9幀和第13幀卻出現(xiàn)了在POD持續(xù)上升的情況下,POR不升反降的情況。這主要是因?yàn)樵赑OR較前一幀有了較大提升的情況下,進(jìn)一步增大POD將可能會(huì)降低干擾量測(cè)值落入跟蹤波門(mén)的概率,從而導(dǎo)致了POR的下降。將圖6中的兩項(xiàng)拖引干擾性能指標(biāo)與圖4、圖5對(duì)比可知,在HTCBA-PSO所生成的RGPO干擾策略下,POD提升了17.69%,POR提升了9.96%。
圖6 N=40時(shí)HTCBA-PSO所得到的RGPO干擾策略在CV場(chǎng)景下的POD箱線(xiàn)圖和POR曲線(xiàn)Fig.6 Simulation results of POD and POR for the RGPO jamming strategy obtained by HTCBA-PSO at N=40 on CV benchmark
上述結(jié)果表明,在HTCBA-PSO所生成的RGPO干擾策略下,被攻擊敵方雷達(dá)跟蹤系統(tǒng)的可靠性顯著降低。同時(shí),干擾效果隨著干擾幀數(shù)的增加而逐漸增加,這也與RGPO干擾的原理一致。
本文針對(duì)隨機(jī)優(yōu)化環(huán)境下RGPO干擾策略?xún)?yōu)化問(wèn)題,提出了一種基于HTCBA-PSO的RGPO干擾策略?xún)?yōu)化算法。首先,通過(guò)對(duì)雷達(dá)跟蹤過(guò)程的分析,將RGPO干擾策略?xún)?yōu)化問(wèn)題建模為一個(gè)SSO問(wèn)題,為了解決干擾方難以獲得敵方雷達(dá)跟蹤系統(tǒng)信息的問(wèn)題,提出了一種不依賴(lài)于敵方雷達(dá)跟蹤系統(tǒng)信息的RGPO干擾策略評(píng)價(jià)方案;然后,為了提升傳統(tǒng)算法在解決SSO問(wèn)題時(shí)的性能,提出了一種基于HTCBA-PSO的RGPO干擾策略?xún)?yōu)化算法;最后,在跟蹤目標(biāo)做近似勻速運(yùn)動(dòng)的背景下,選擇不同種群規(guī)模來(lái)驗(yàn)證HTCBA-PSO的有效性,并通過(guò)POD和POR兩個(gè)物理量來(lái)驗(yàn)證通過(guò)HTCBA-PSO所得到的RGPO干擾策略的具體干擾效果。仿真結(jié)果表明:在不同種群規(guī)模下,HTCBA-PSO的性能均優(yōu)于其他三種算法,并且與傳統(tǒng)算法相比,本文提出的優(yōu)化方法能提高干擾方的波門(mén)拖引距離和拖引成功率,這對(duì)于在電子對(duì)抗環(huán)境下的反感知RGPO干擾研究具有重要意義。