姚家倫,黃高明,田 威
(海軍工程大學(xué)電子工程學(xué)院,武漢 430033)
為了適應(yīng)更為復(fù)雜的電磁空間,美軍積極倡導(dǎo)推進(jìn)認(rèn)知電子戰(zhàn)。DARPA 的研究報告表明,認(rèn)知電子戰(zhàn)是一種將智能算法技術(shù)用于電子戰(zhàn)領(lǐng)域,達(dá)到實時發(fā)現(xiàn)、搜索和對抗戰(zhàn)場未知干擾信號的新型作戰(zhàn)理念[1-2]。
這種理念充分利用機(jī)器學(xué)習(xí)算法的智能性,并融入“人在回路”的思想,實時分析戰(zhàn)場態(tài)勢,基于目標(biāo)數(shù)據(jù)和環(huán)境數(shù)據(jù)自適應(yīng)地調(diào)整作戰(zhàn)手段。為了有針對性地、準(zhǔn)確地對高威脅目標(biāo)進(jìn)行對抗,作戰(zhàn)對象的特定行為分析與預(yù)測至關(guān)重要。在認(rèn)知電子戰(zhàn)的體系下,輻射源行為區(qū)別于輻射源模式,特指輻射源參數(shù)和模式的動態(tài)調(diào)整與切換,行為推理則是基于歷史信息與實時信息對目標(biāo)輻射源的特定參數(shù)與狀態(tài)進(jìn)行短時或長時預(yù)測。
相控陣?yán)走_(dá)資源的時序調(diào)度一直是研究的熱點問題[3-4]。對相控陣?yán)走_(dá)的波束掃描調(diào)度規(guī)律進(jìn)行預(yù)測能夠提高干擾機(jī)的瞄準(zhǔn)式干擾效率,有效提高電子戰(zhàn)攻擊能力,因此,極具工程意義。相控陣?yán)走_(dá)的波束掃描規(guī)律可以抽象為正弦坐標(biāo)系中的移動軌跡,而基于歷史數(shù)據(jù)的波束行為預(yù)測問題實質(zhì)上是一類軌跡預(yù)測和B 樣條曲線擬合優(yōu)化問題。這類問題一般使用自回歸或濾波算法解決。文獻(xiàn)[5]提出了一種基于差分自回歸和卡爾曼濾波的預(yù)測方法。這種方法能夠很好地解決低階無周期的時間序列模型,但是所研究對象僅為一維數(shù)據(jù),變化特征比較有限。文獻(xiàn)[6]為航行器飛行軌跡的預(yù)測問題,使用了一種基于貝葉斯正則化的Elman-NARX神經(jīng)網(wǎng)絡(luò)方法。在分析飛行模型關(guān)鍵因子的基礎(chǔ)上,借鑒Elman 網(wǎng)絡(luò)特點對NARX 網(wǎng)絡(luò)進(jìn)行改進(jìn),其本質(zhì)是利用歷史數(shù)據(jù)對飛行軌跡進(jìn)行自回歸。該算法在保證一定精度的前提下,訓(xùn)練速度和泛化能力得到增強(qiáng),但是飛行器是一個有慣性的動力學(xué)目標(biāo),其特征同波束掃描軌跡相比仍有較大區(qū)別,且NARX 算法對復(fù)雜曲線的適應(yīng)性有限。文獻(xiàn)[7]將長短時記憶網(wǎng)絡(luò)(Long Short Time Memory,LSTM)與位置分布式表示模型(Location Distributed Representation Model,LDRM)結(jié)合,LDRM 模型將高維的位置向量數(shù)據(jù)轉(zhuǎn)化為易于處理的低維數(shù)據(jù),優(yōu)化了訓(xùn)練數(shù)據(jù)的形式,便于LSTM 對位置信息進(jìn)行預(yù)測,但是LSTM 網(wǎng)絡(luò)的人工調(diào)參占用了大量人力資源,且調(diào)參效率也比較有限。文獻(xiàn)[8]基于自適應(yīng)混沌算法對支持向量回歸(Support Vector Regression,SVR)的超參數(shù)進(jìn)行選擇,有效地提高了SVR 的泛化性能和求解精度,不過這類算法依然需要預(yù)置核函數(shù)。文獻(xiàn)[9]指出啟發(fā)式算法能夠幫助神經(jīng)網(wǎng)絡(luò)調(diào)參,保證了網(wǎng)絡(luò)的適應(yīng)性與訓(xùn)練效率。在工程實際中,智能化的相控陣?yán)走_(dá)會基于多種準(zhǔn)則改變波束的掃描方式[10-11],即波束軌跡不是趨勢單一的簡單路徑。相控陣?yán)走_(dá)波束在掃描時其軌跡連續(xù),但其波束移動不具有動力學(xué)特征,所以傳統(tǒng)的牛頓力學(xué)體系與卡爾曼濾波的方法無法解決這類軌跡的預(yù)測問題。
綜上提出基于果蠅算法優(yōu)化LSTM 網(wǎng)絡(luò)的相控陣?yán)走_(dá)波束行為預(yù)測算法,一方面提供了對于相控陣?yán)走_(dá)波束掃描規(guī)律預(yù)測的新思路,另一方面在提高預(yù)測精度的前提下,也能自適應(yīng)調(diào)整對應(yīng)的網(wǎng)絡(luò)超參數(shù),緩解了網(wǎng)絡(luò)適應(yīng)性與訓(xùn)練效率的矛盾問題。
在多目標(biāo)探測跟蹤和抗飽和干擾等目標(biāo)的要求下,大量學(xué)者進(jìn)行了有關(guān)相控陣?yán)走_(dá)的資源調(diào)度的研究,其中動態(tài)波位編排與搜索波束的時序優(yōu)化則是研究的重點[12]。相控陣?yán)走_(dá)的波束調(diào)度通常利用正弦空間坐標(biāo)系下的波位編排圖和搜索波位表表示[13]:
圖1 波位編排與傳感器監(jiān)測示意圖
在搜索波位排列圖的表示下,冗余的波束掃描數(shù)據(jù)轉(zhuǎn)化為抽象的點信息,便于相控陣?yán)走_(dá)對于波束進(jìn)行控制;如圖1,利用多個傳感器監(jiān)測空域(圖中一個紅圈內(nèi)的區(qū)域由一個傳感器負(fù)責(zé)監(jiān)控),波束的調(diào)度規(guī)律等效于其最大波束在逐個波位區(qū)域上形成的波束軌跡。
多傳感器網(wǎng)絡(luò)采集的數(shù)據(jù)經(jīng)過分離提取后,掃描軌跡可以表示為在正弦坐標(biāo)系內(nèi)的點時序序列。為了便于提取軌跡數(shù)據(jù)特征,提高對軌跡數(shù)據(jù)的預(yù)測效率,原始的軌跡數(shù)據(jù)一般需要進(jìn)行網(wǎng)格化操作。這種處理方法常用于地理學(xué)領(lǐng)域,即將m×n 個傳感器獲取的波位區(qū)域掃描圖進(jìn)一步劃分為網(wǎng)格圖,具體如圖2 所示。
圖2 監(jiān)測傳感器網(wǎng)格分割示意圖
根據(jù)研究對象的具體情況來指定不同的劃分精細(xì)程度。比如對于火控雷達(dá),這個劃分就需要細(xì)致一些;而對于超視距的遠(yuǎn)程預(yù)警雷達(dá)這種劃分可以粗略一些,這也可以平衡大數(shù)據(jù)量對計算資源的要求。參考Geohash 編碼[14],依據(jù)輻射源識別的情況將波位區(qū)域掃描圖分為ix×iy個網(wǎng)格,其分辨率為
LSTM 是循環(huán)神經(jīng)網(wǎng)絡(luò)的改進(jìn)算法,利用了記憶門的設(shè)計,有效解決了梯度消失的問題,可以學(xué)習(xí)非線性長時序數(shù)據(jù)的規(guī)律[15]。其網(wǎng)絡(luò)基本單元如圖3 所示。
圖3 長短時記憶網(wǎng)絡(luò)單元結(jié)構(gòu)圖
基本單元中的特征映射表達(dá)式為:
在使用該算法處理數(shù)據(jù)時,一般將數(shù)據(jù)分為訓(xùn)練值和觀測值,訓(xùn)練值用于網(wǎng)絡(luò)訓(xùn)練,觀測值用于與預(yù)測值進(jìn)行比較。對于變化規(guī)律簡單的數(shù)據(jù)而言,這種方法預(yù)測精度比較高。但對于復(fù)雜數(shù)據(jù),預(yù)測精度就會大大降低。為了提高算法的適應(yīng)性,使其能夠動態(tài)地適應(yīng)多種掃描模式的波束位置預(yù)測問題,網(wǎng)絡(luò)應(yīng)使用觀測值對網(wǎng)絡(luò)進(jìn)行實時更新。即每一時刻始終使用當(dāng)前觀測值訓(xùn)練網(wǎng)絡(luò),并在新網(wǎng)絡(luò)下獲得下一時刻的預(yù)測值。
圖4 FOA-LSTM 預(yù)測流程圖
如圖4 所示,經(jīng)由傳感器網(wǎng)絡(luò)接收到的波束軌跡數(shù)據(jù)對輻射源數(shù)據(jù)庫進(jìn)行實時更新,并離線訓(xùn)練獲得最優(yōu)的LSTM 網(wǎng)絡(luò)超參數(shù),在預(yù)測波束掃描位置時根據(jù)輻射源類別調(diào)用對應(yīng)的超參數(shù)。
將位置信息直角分解,獲得序列Sx、Sy,分別送入到兩個LSTM。在達(dá)到訓(xùn)練門限值后,兩個網(wǎng)絡(luò)同時停止。訓(xùn)練完畢后,輸入此刻波束位置的觀測值對兩個網(wǎng)絡(luò)分別更新,并獲得下一時刻的X 與Y 方向的預(yù)測值,經(jīng)過合成得到下一時刻波束位置的預(yù)測值。
網(wǎng)絡(luò)超參數(shù)的選擇對于網(wǎng)絡(luò)的訓(xùn)練效率和預(yù)測精度至關(guān)重要。文獻(xiàn)[16]表明在LSTM 的隱藏層單元數(shù)目和學(xué)習(xí)率對于該類網(wǎng)絡(luò)的影響最大。而超參數(shù)選擇一般分為兩步:1)根據(jù)所需預(yù)測的雷達(dá)類型和預(yù)測需求,確定超參數(shù)的變化范圍;2)在給定范圍內(nèi)使用果蠅優(yōu)化算法,尋找最優(yōu)性能的隱藏單元數(shù)與學(xué)習(xí)率。
果蠅優(yōu)化算法是一類模仿果蠅覓食行為求取全局最優(yōu)值的啟發(fā)式算法。由于這類群智能優(yōu)化算法在優(yōu)化速度和參數(shù)上存在優(yōu)勢,它很適合用于調(diào)整超參數(shù)。
果蠅優(yōu)化算法的思路是在解空間中根據(jù)適應(yīng)度函數(shù)(味道濃度判定函數(shù))控制果蠅群體步進(jìn)尋優(yōu)。一般可以分為4 個步驟:
1)初始化
初始化就是設(shè)定果蠅群體的初始參數(shù),包括果蠅群體的大小、最大迭代次數(shù)、初始位置以及果蠅個體尋找目標(biāo)的步進(jìn)值,即果蠅飛行的隨機(jī)方向和距離:
其中,X_axis 和Y_axis 是果蠅的初始位置。
2)判斷
判斷就是根據(jù)適應(yīng)度函數(shù),求出果蠅個體所處位置的味道濃度(Smell):
其中,味道濃度與果蠅到食物的距離成反比,即:
3)移動
移動就是在果蠅群體中選擇濃度最高的個體,記錄該個體的位置,并指揮余下果蠅按初始設(shè)定的步長向最優(yōu)果蠅位置移動。
4)迭代
重復(fù)步驟2)與步驟3),直到味道濃度滿足設(shè)定條件或者到達(dá)最大迭代次數(shù)。
適應(yīng)度函數(shù)選擇均方根誤差(Root Mean Square Error,RMSE),其定義為
其中,σR為均方根;yi為離散的待處理位置數(shù)據(jù);y?i為位置的預(yù)測值,n 為數(shù)據(jù)個數(shù)。
根據(jù)歷史數(shù)據(jù)對超參數(shù)進(jìn)行確定,即在離線狀態(tài)下選擇超參數(shù)的最優(yōu)值。基于果蠅優(yōu)化算法的LSTM 超參數(shù)選擇具體步驟如下:
step1:根據(jù)輻射源識別結(jié)果,參照歷史數(shù)據(jù)確定單元數(shù)目和學(xué)習(xí)率的基本搜索范圍。
step2:將果蠅種群初始化,把不同的超參數(shù)賦值到果蠅個體上。
step3:離線運(yùn)行LSTM,根據(jù)式(7)計算預(yù)測誤差并評估果蠅個體所代表的超參數(shù)適應(yīng)度,并計算各個果蠅個體位置的味道濃度。
step4:選擇適應(yīng)度函數(shù)最優(yōu)的個體作為群體的移動目標(biāo)。
step5:其余果蠅個體按步長調(diào)整位置。
step6:重復(fù)step2~step5,直到RSME 滿足要求或者超過最大迭代次數(shù)。
step7:更新輻射源數(shù)據(jù)庫中對于此類輻射源的預(yù)測網(wǎng)絡(luò)超參數(shù)。
由于無法獲取相控陣?yán)走_(dá)的波束掃描時序位置數(shù)據(jù),基于典型的3 類掃描方式進(jìn)行仿真實驗:1)在相控陣?yán)走_(dá)未在空域中發(fā)現(xiàn)高威脅目標(biāo)或無先驗信息的情況下,雷達(dá)波束在空域內(nèi)作柵形覆蓋式掃描;2)在雷達(dá)經(jīng)搜索后發(fā)現(xiàn)目標(biāo)或有先驗數(shù)據(jù)支持的情況下,對目標(biāo)進(jìn)行范圍逐漸縮小的定位掃描;3)雷達(dá)對目標(biāo)進(jìn)行跟蹤,在丟失目標(biāo)后,對高威脅區(qū)域進(jìn)行范圍逐漸擴(kuò)大的螺旋掃描,如圖5 所示。
同時使用NAR 神經(jīng)網(wǎng)絡(luò)、LSTM 網(wǎng)絡(luò)和FOA-LSTM 網(wǎng)絡(luò)預(yù)測相控陣?yán)走_(dá)的波束掃描行為。
果蠅優(yōu)化算法:果蠅群體大小為20,最大迭代次數(shù)為50;將優(yōu)化參數(shù)歸一化后,固定移動步長為[0.01,0.01]。
LSTM 網(wǎng)絡(luò)超參數(shù):為了保證訓(xùn)練的速度和精度,最大訓(xùn)練次數(shù)為200;學(xué)習(xí)率與隱含層單元數(shù)由優(yōu)化算法確定,其中學(xué)習(xí)率范圍在[0.001,0.5]內(nèi),而單元數(shù)范圍在[50,500]內(nèi)。
根據(jù)3 種不同的雷達(dá)掃描規(guī)則設(shè)定長度為100的3 組波束掃描位置數(shù)據(jù)。其中,前70 個數(shù)據(jù)用于訓(xùn)練,后30 個數(shù)據(jù)用于評估預(yù)測精度。算法運(yùn)行100 次,結(jié)果取平均值。
從下頁圖6 可以看出,對于柵形掃描這類比較穩(wěn)定的搜索方式而言,所提算法在X 和Y 方向上預(yù)測都沒有明顯優(yōu)勢,所提算法在X 方向上的預(yù)測甚至存在一定的誤差積累效應(yīng);在對Y 方向位置預(yù)測時,兩種預(yù)測方法的精度基本持平,但所提方法的相對誤差還是略優(yōu)于NAR 神經(jīng)網(wǎng)絡(luò)。對于定向搜索和螺旋搜索而言,如圖7 與圖8 所示。NAR 神經(jīng)網(wǎng)絡(luò)方法預(yù)測相對誤差最大值大于所提算法,這說明所提算法對于這兩類搜索的預(yù)測精度優(yōu)于NAR神經(jīng)網(wǎng)絡(luò)。雖然所提算法的預(yù)測誤差僅從相對誤差上看優(yōu)勢有限,但對X、Y 方向位置預(yù)測時,其預(yù)測誤差仍然小于1 個網(wǎng)格。
圖5 波束掃描位置示意圖
圖6 柵形搜索波束預(yù)測相對誤差曲線
圖7 定向搜索波束預(yù)測相對誤差曲線
圖8 螺旋搜索波束預(yù)測相對誤差曲線
為了能夠更加清晰地反映所提算法的預(yù)測性能,對訓(xùn)練數(shù)據(jù)進(jìn)行白噪聲加噪處理并進(jìn)行算法穩(wěn)定性分析,增加普通的LSTM 算法進(jìn)行實驗驗證,結(jié)果如表1??梢钥闯?,對于3 種搜索方式而言,所提方法對于噪聲的耐受性能整體優(yōu)于NAR 神經(jīng)網(wǎng)絡(luò),即FOA-LSTM 在數(shù)據(jù)質(zhì)量較低、較高的情況下都能保持更好的預(yù)測性能。此外,所提方法對于信噪比改善的敏感性更強(qiáng),在數(shù)據(jù)質(zhì)量逐漸提高的條件下,相對于NAR 神經(jīng)網(wǎng)絡(luò)的預(yù)測精度優(yōu)勢愈發(fā)明顯,這說明所提算法有著更強(qiáng)的數(shù)據(jù)質(zhì)量改善增益。在20 dB 的條件下,所提算法預(yù)測誤差保持在1個網(wǎng)格以下,能在工程上提供足夠質(zhì)量的預(yù)測引導(dǎo)信息。對比普通的LSTM 算法,F(xiàn)OA-LSTM 算法在節(jié)省人力的基礎(chǔ)上,也進(jìn)一步提高了預(yù)測精度,在3種掃描方式下其RMSE 都有不同程度的降低。
表1 不同信噪比條件下算法預(yù)測誤差
本文提出了一種果蠅算法優(yōu)化LSTM 的雷達(dá)波束掃描行為預(yù)測方法。參考動力學(xué)軌跡預(yù)測思路,對波束掃描的位置變化規(guī)律進(jìn)行了研究,在典型信噪比條件下,對于主要相控陣?yán)走_(dá)掃描方式進(jìn)行了較高精度的預(yù)測,顯示了較強(qiáng)的魯棒性,為雷達(dá)干擾智能化引導(dǎo)提供了新思路,因此,極具工程意義。未來工作主要包括以下3 個方面:1)所提算法僅根據(jù)相控陣?yán)走_(dá)單波束掃描行為進(jìn)行了位置規(guī)律預(yù)測,下一步需要研究多個波束組合掃描的規(guī)律,研究適應(yīng)性更強(qiáng)的預(yù)測算法。2)為了保證超參數(shù)調(diào)整效率,所提算法使用兩個LSTM 網(wǎng)絡(luò)對X 向和Y 向進(jìn)行了分離訓(xùn)練,因此,丟失了一些位置相關(guān)性信息,也損失了部分預(yù)測精度,下一步需要繼續(xù)深入研究,平衡好超參數(shù)調(diào)整效率與預(yù)測精度的關(guān)系。3)智能算法的運(yùn)行速度比較慢,需要進(jìn)一步優(yōu)化算法,提高計算速度。