邱少明,劉良成,張學(xué)翠,杜秀麗,呂亞娜
(1.大連大學(xué)通信與網(wǎng)絡(luò)重點實驗室,遼寧 大連 116622;2.北方自動控制技術(shù)研究所,太原 030006)
武器- 目標(biāo)分配(Weapon-Target Assignment,WTA)問題是指在多武器、多目標(biāo)的戰(zhàn)場環(huán)境中,已知來襲目標(biāo)的毀傷概率,以及防御方的武器數(shù)量等諸多約束的條件下,計算出防御方的最優(yōu)武器分配方案,并對來襲目標(biāo)進(jìn)行攔截,使防御方所遭受的損失最?。?-3]。
根據(jù)武器對來襲目標(biāo)的毀傷不同,如何快速、準(zhǔn)確地找出合理分配方案,有效減少目標(biāo)威脅、減小防御方損失,目前還沒有一種有效的算法[4]。傳統(tǒng)的方法有枚舉法、動態(tài)規(guī)劃法等。在武器與目標(biāo)的數(shù)量都很少時,雖然也能夠找出一些合理的分配方案,但隨著武器和目標(biāo)數(shù)量的增加,編程實現(xiàn)越復(fù)雜,計算量也就越大。伴隨著科學(xué)技術(shù)的快速發(fā)展,出現(xiàn)了一些智能優(yōu)化算法,如遺傳算法、蟻群算法、粒子群算法等,并已應(yīng)用在求解WTA 問題上。文獻(xiàn)[5]將遺傳算法和模擬退算法相結(jié)合,建立了多個目標(biāo)優(yōu)化模型,但計算量大,運行時間較長;文獻(xiàn)[6]提出一種離散粒子群算法,對粒子群算法的速度和位置重新定義,并且引入啟發(fā)式策略迭代方案產(chǎn)生調(diào)整,但算法存在易陷入局部最優(yōu)的問題;文獻(xiàn)[7]提出一種多種群并行布谷鳥搜索算法,用于求解防空火力優(yōu)化分配模型,但其穩(wěn)定性較差。
針對現(xiàn)有的智能算法在求解WTA 過程中存在易陷入局部最優(yōu)的問題,本文引入改進(jìn)鯨魚優(yōu)化算法求解武器目標(biāo)優(yōu)化分配問題,通過差分進(jìn)化算法[8](Differential Evolution,DE)的變異策略和自適應(yīng)位置更新,增加鯨魚優(yōu)化算法的全局尋優(yōu)能力。在考慮實際戰(zhàn)場的情況下,建立WTA 模型,應(yīng)用改進(jìn)鯨魚優(yōu)化算法對其進(jìn)行求解,從而快速得到合理的WTA 方案。
鯨魚優(yōu)化算法是由Mirjalili 等人在2016 年觀察座頭鯨的捕食方式而提出的一種新型啟發(fā)式優(yōu)化算法[9]。鯨魚個體能識別并包圍獵物,將其抽象為3 個階段:搜索獵物、包圍獵物和泡泡網(wǎng)攻擊。
1.1.1 包圍獵物
鯨魚可以識別獵物并不斷減小其包圍范圍,將最優(yōu)解視為目標(biāo)獵物或靠近目標(biāo)獵物位置,其他鯨魚個體將不斷向其靠近,其數(shù)學(xué)模型如下:
其中,t 是迭代次數(shù),X*(t)是當(dāng)前最優(yōu)鯨魚位置向量,X(t)是當(dāng)前鯨魚位置向量,A、C 是系數(shù)向量,A·D是包圍步長。
通過如下公式計算A、C:
1.1.2 泡泡網(wǎng)攻擊
座頭鯨在包圍獵物時,以螺旋方式吐出氣泡將獵物包圍,在建立數(shù)學(xué)模型時,當(dāng)|A|≤1 時,采用式(5)模擬座頭鯨的螺旋方式狩獵行為,其數(shù)學(xué)模型如下:
1.1.3 搜索獵物
當(dāng)|A|>1 時,迫使鯨魚個體遠(yuǎn)離當(dāng)前代最優(yōu)鯨魚位置,使鯨魚個體之間隨機(jī)搜索獵物,不再受到當(dāng)前最優(yōu)鯨魚個體的影響,其數(shù)學(xué)模型如下:
其中,Xrand(t)表示當(dāng)前鯨魚種群中隨機(jī)鯨魚位置。
基本鯨魚優(yōu)化算法的全局探索過程只有一個位置更新公式,過于單一,全局尋優(yōu)能力不強(qiáng)。差分進(jìn)化算法的全局搜索能力強(qiáng),并且已證明將灰狼優(yōu)化(Grey Wolf Optimization,GWO)與差分進(jìn)化算法混合的優(yōu)化算法,可以進(jìn)一步提高GWO 對復(fù)雜優(yōu)化問題的尋優(yōu)能力[10]。由于差分進(jìn)化算法具有全局尋優(yōu)能力強(qiáng)的特點,并且變異策略DE/rand/1 結(jié)構(gòu)簡單,編程易于實現(xiàn)等優(yōu)點[11],本文將差分進(jìn)化算法的變異DE/rand/1 算子用于增加一個鯨魚位置更新公式,加強(qiáng)算法的全局尋優(yōu)能力,具體公式如下所示:
在鯨魚優(yōu)化算法中,p 是[0,1]范圍內(nèi)的隨機(jī)值,只有在p<0.5 且|A|≥1 兩個條件都滿足的條件下,鯨魚個體才會進(jìn)入全局探索過程中。這將導(dǎo)致算法在全局探索階段不夠充分,全局探索和局部開發(fā)之間存在不平衡問題,容易出現(xiàn)早熟現(xiàn)象,因此,本文將調(diào)整鯨魚位置更新過程,增大算法進(jìn)入全局探索過程的次數(shù),提高算法跳出局部最優(yōu)問題的能力。首先,本文中將常量0.5 改為一個自適應(yīng)變量x,如下所示:
這樣x 在算法迭代前期大于0.5,增大進(jìn)入全局探索的次數(shù),在后期x 小于0.5,將主要進(jìn)入局部開發(fā)過程中。
其次,不再將|A|與1 之間的比較關(guān)系作為鯨魚個體進(jìn)入尋找獵物和包圍獵物之間的依據(jù),而是在p 每次迭代過程中都會產(chǎn)生新的鯨魚個體,但是新的個體并不一定優(yōu)于上一代鯨魚個體,為增加求解效率,本文將新產(chǎn)生的鯨魚個體的適應(yīng)度值和上一代鯨魚個體的適應(yīng)度值先進(jìn)行比較,若優(yōu)于上一代的鯨魚個體,再替換鯨魚個體的位置,否則不替換,保留原有的鯨魚個體位置。替換鯨魚個體位置過程如下所示: 其中,X(t)表示當(dāng)前代鯨魚個體的位置信息,X(t-1)表示上一代鯨魚個體的位置信息,f(X(t))表示當(dāng)前代鯨魚個體的適應(yīng)度值,f(X(t-1))表示上一代鯨魚個體的適應(yīng)度值。 假設(shè)有M 個作戰(zhàn)武器單元,N 個來襲目標(biāo),其中武器單元i 的數(shù)量為Vi(i=1,…,M),每個武器單元i 中的武器性能相同,N 個來襲目標(biāo)的威脅值為Tj(j=1,…,N)。其中,武器單元i 對襲來目標(biāo)j 的毀傷概率為pij,用xij表示作戰(zhàn)武器單元i 對來襲目標(biāo)j 的分配數(shù)量,X=(xij)M×N表示武器的分配數(shù)量矩陣。 為更加真實地反映實際戰(zhàn)場情況并簡化數(shù)學(xué)模型,對模型有以下幾方面約束: 表1 武器對目標(biāo)毀傷概率表 圖1 編碼結(jié)構(gòu) 建立WTA 模型,以目標(biāo)的毀傷效果最大化為目標(biāo)函數(shù),構(gòu)造目標(biāo)函數(shù),但同時所包含的約束比較多,直接求解WTA 結(jié)果較為復(fù)雜,本文中巧妙地通過編碼規(guī)則,將約束條件在編碼中得以解決,這樣將有約束的問題轉(zhuǎn)化為無約束的問題,簡化了程序的編寫與計算和適應(yīng)度函數(shù)的建立,適應(yīng)度函數(shù)F(x)如下: 綜上所述,將改進(jìn)鯨魚優(yōu)化算法用于求解WTA步驟如下所示,圖2 為改進(jìn)鯨魚優(yōu)化算法流程。 圖2 改進(jìn)鯨魚優(yōu)化算法流程 步驟1:初始化。種群大小,初始迭代次數(shù)t=0,最大迭代次數(shù)tmax,鯨魚位置初始化編碼。 步驟2:計算當(dāng)前代鯨魚個體適應(yīng)度值,并記錄最優(yōu)鯨魚適應(yīng)度值和位置。 步驟3:鯨魚位置更新。在迭代中選擇式(10)~式(11)進(jìn)行鯨魚位置更新。 步驟4:篩選優(yōu)秀個體。根據(jù)式(12)將更新后的鯨魚位置與原鯨魚位置的適應(yīng)度值進(jìn)行比較,挑選優(yōu)秀鯨魚位置信息。 步驟5:判斷是否達(dá)到最大迭代次數(shù),若滿足輸出WTA 方案,否則,轉(zhuǎn)步驟2。 為測試本文所提算法在武器目標(biāo)優(yōu)化分配方面的性能,以文獻(xiàn)[12]中實驗數(shù)據(jù)進(jìn)行仿真測試,假設(shè)某次軍事行動中,共有4 個武器平臺,分別為M1,M2,M3,M4,5 個 來 襲 目 標(biāo) 分 別 為N1,N2,N3,N4,N5,其中,每個武器平臺的武器數(shù)量分別為V={4,4,2,5},武器平臺Mi對來襲目標(biāo)Nj的毀傷概率如表1 所示,來襲目標(biāo)威脅值T 如表2 所示。 表2 目標(biāo)威脅值表 改進(jìn)鯨魚優(yōu)化算法中,鯨魚種群大小為20,最大迭代次數(shù)為200。實驗環(huán)境在Intel(R)Core(TM)i7-8550 CPU、Windows 10(64 位)的操作系統(tǒng)上通過編程軟件MATLAB R2016a 設(shè)計實現(xiàn)。將改進(jìn)鯨魚優(yōu)化算法重復(fù)50 次實驗,得出如圖3 所示50 次實驗結(jié)果的最優(yōu)分配適應(yīng)度值分布圖。根據(jù)實驗結(jié)果挑選最優(yōu)分配方案的適應(yīng)度值為0.983 6,最優(yōu)分配方案如表3 所示,對目標(biāo)N1采用武器單元M1的2 個武器和武器單元M2的1 個武器進(jìn)行打擊,對目標(biāo)N2采用武器單元M4的3 個武器進(jìn)行打擊,對目標(biāo)N3采用武器單元M2的3 個武器進(jìn)行打擊,對目標(biāo)N4采用武器單元M1的1 個武器和武器單元M4的2 個武器進(jìn)行打擊,對目標(biāo)N5采用武器單元M1的1 個武器和武器單元M3的2 個武器進(jìn)行打擊。 圖3 50 次重復(fù)實驗分布 表3 最優(yōu)分配方案表 將基本鯨魚優(yōu)化算法與改進(jìn)鯨魚優(yōu)化算法作對比實驗,仿真效果如下頁圖4 所示,得出基本鯨魚優(yōu)化算法的最優(yōu)分配方案的適應(yīng)度值為0.940 6,可以明顯看出改進(jìn)鯨魚優(yōu)化算法優(yōu)于基本鯨魚優(yōu)化算法,同時也優(yōu)于文獻(xiàn)[12]利用遺傳算法求解得出的最優(yōu)值0.960 6。 圖4 兩種算法求解WTA 適應(yīng)度值對比 為驗證本文所提算法的優(yōu)越性,在相同的實驗環(huán)境下,將與文獻(xiàn)[13]所提遺傳算法和文獻(xiàn)[14]所提改進(jìn)粒子群算法,在求解武器目標(biāo)優(yōu)化分配問題中作對比,參數(shù)設(shè)置如下所示:種群大小為20,最大迭代次數(shù)為200。記錄最優(yōu)適應(yīng)度值、達(dá)到最優(yōu)分配結(jié)果的運行時間和迭代次數(shù),結(jié)果如表4 所示。使用文獻(xiàn)[13]遺傳算法迭代50 次,運行146.4 ms,找到最優(yōu)分配的適應(yīng)度值與基本鯨魚優(yōu)化算法相同為0.940 6;文獻(xiàn)[14]改進(jìn)粒子群算法迭代59 次,運行140.4 ms,找到最優(yōu)適應(yīng)度值為0.936 0,而本文所提算法迭代45 次,運行101.5 ms,找到最優(yōu)分配的適應(yīng)度值為0.983 6。由此可知,本文所提算法優(yōu)于文獻(xiàn)[13-14]中所提算法,說明本文提出的算法,是求解武器目標(biāo)優(yōu)化分配問題中更快速、更準(zhǔn)確地找到合理的武器分配方案的方法。 表4 3 種算法對比 WTA 問題是戰(zhàn)爭決策的核心問題,本文考慮實際的戰(zhàn)爭情況建立多約束WTA 的數(shù)學(xué)模型,同時針對原鯨魚優(yōu)化算法存在搜索精度低、易早熟的問題,提出一種改進(jìn)的鯨魚優(yōu)化算法用于該模型的求解。通過仿真表明,本文算法具有收斂精度高、收斂速度快等特點,在求解WTA 分配問題上具有一定優(yōu)勢,能夠給出更合理的分配方案。但是本文在建立WTA 數(shù)學(xué)模型時,只考慮了目標(biāo)毀傷最大化為目標(biāo)函數(shù),并未將目標(biāo)打擊成本、武器使用數(shù)量等目標(biāo)函數(shù)加入,所以多目標(biāo)的WTA 將是今后研究的方向。1.4 保留最優(yōu)個體
2 基于改進(jìn)鯨魚優(yōu)化算法的WTA
2.1 武器-目標(biāo)分配數(shù)學(xué)模型建立
2.2 編碼
2.3 適應(yīng)度函數(shù)
2.4 改進(jìn)算法求解WTA 步驟
3 仿真與分析
4 結(jié)論