孫文娟許 可宮 華
(1.沈陽理工大學(xué)理學(xué)院,沈陽 110159;2.遼寧省兵器工業(yè)智能優(yōu)化與控制重點(diǎn)實驗室,沈陽 110159)
火力分配是指根據(jù)作戰(zhàn)目標(biāo)、戰(zhàn)場態(tài)勢、武器性能等因素,將不同類型和一定數(shù)量的火力單元針對來襲目標(biāo)以某種準(zhǔn)則進(jìn)行分配,以有效攻擊敵方目標(biāo)的過程。 在地對空防御體系中,火力分配是決定作戰(zhàn)效果的關(guān)鍵因素,其任務(wù)是針對多個來襲目標(biāo),防御方能及時有效地分配防御武器,消除敵方威脅,使防御方所遭受的損失減少到最小[1]。 在火力分配問題的解決方案中,主要考慮的優(yōu)化目標(biāo)包括整體打擊效能最大[2]、防御方資源損失最小[3]、來襲目標(biāo)生存概率最小[4]以及被保護(hù)資產(chǎn)存留價值最大[5]等。 采用的優(yōu)化方法主要包括近似動態(tài)規(guī)劃方法[6],混合遺傳算法[7],蟻群算法[8]、蜂群算法[9]、布谷鳥搜索算法[10]、生物地理學(xué)優(yōu)化[11]等智能優(yōu)化算法。
在火力分配問題中,攻擊方和防御方之間往往存在著利益沖突。 對于某一方來說,不同優(yōu)化目標(biāo)之間也存在著對武器資源的競爭,而優(yōu)化模型很難考慮各競爭主體之間的沖突關(guān)系。 非合作博弈理論主要用于解決有約束、多人多目標(biāo)且目標(biāo)函數(shù)相互矛盾的決策問題,是研究具有競爭現(xiàn)象的理論和方法,因此非合作博弈建模是解決多目標(biāo)火力分配問題的有效工具。 針對火力分配中的競爭問題,大多以攻防雙方為博弈方,考慮不同的收益函數(shù),基于博弈理論建立相應(yīng)的火力分配模型。 張毅等[12]、Galati[13]、馬飛等[14]分別以作戰(zhàn)效能、目標(biāo)毀傷概率、目標(biāo)生存價值為收益,建立火力分配非合作博弈模型,采用啟發(fā)式遺傳-蟻群優(yōu)化算法及鄰域搜索算法進(jìn)行求解。 曾松林等[15]、周興旺等[16]針對火力資源分配問題,分別建立動態(tài)博弈模型及貝葉斯混合博弈模型,利用混合粒子群算法求解納什均衡。 針對多目標(biāo)火力分配問題,趙玉亮等[17]、Leboucher 等[18]分別建立了雙矩陣博弈模型及演化博弈模型,采用粒子群算法求解。 綜上可知,在利用博弈理論研究火力分配問題時,考慮攻防雙方之間競爭現(xiàn)象的較多。 而在多目標(biāo)火力分配問題中,各優(yōu)化目標(biāo)之間同樣存在對武器資源的競爭,利用博弈理論研究多目標(biāo)火力分配問題,通過納什均衡分配方案,使目標(biāo)之間的博弈策略實現(xiàn)最優(yōu),可以在保證作戰(zhàn)效能的同時,得到滿足多方利益的均衡火力分配方案。
本文針對地對空防御中的火力分配問題,以最大化總體毀傷概率和最小化使用武器價值為優(yōu)化目標(biāo),通過將優(yōu)化目標(biāo)映射為博弈方建立非合作博弈模型,結(jié)合禁忌搜索技術(shù)設(shè)計改進(jìn)遺傳算法NE-IGA 尋求納什均衡解,從而獲得使優(yōu)化目標(biāo)間達(dá)到均衡的地對空防御火力分配決策方案。
在地對空防御火力分配問題中,一般包含空中進(jìn)攻和地面防御兩種力量,分別記為敵方和我方。 假設(shè)在某次作戰(zhàn)中,敵方有n個空中來襲目標(biāo)攻擊我方陣地,我方防御陣地中有r種武器單元,第i(i=1,2,…,r)種武器單元中有mi個武器可用于防御,且不同性能的武器具有不同的作戰(zhàn)效能。 并進(jìn)一步假設(shè)如下:
1)每個武器只能攻打一個來襲目標(biāo),每個來襲目標(biāo)可以被多個武器攻打;
2)同種武器對同一來襲目標(biāo)的毀傷概率相同;
3)我方武器可以精準(zhǔn)打擊在攻擊能力范圍內(nèi)的來襲目標(biāo)。
火力分配的任務(wù)是為各個來襲目標(biāo)分配武器,達(dá)成在武器資源使用較少的基礎(chǔ)上毀傷效果最好的結(jié)果。
相關(guān)參數(shù)及變量說明見表1。
表1 參數(shù)及變量說明表
本文利用毀傷概率衡量火力分配方案的毀傷效果,在滿足作戰(zhàn)要求的前提下,通過攻擊空中來襲目標(biāo),使其毀傷概率達(dá)到最大,同時最小化我方武器資源的價值。 因此,目標(biāo)函數(shù)描述為
式中:f1為對所有來襲目標(biāo)的總毀傷概率;f2為使用武器的總價值。
為保障攻擊效果,在我方有一定數(shù)量武器的前提下,要求總毀傷概率不低于p,因此模型應(yīng)滿足以下約束,其中i=1,2,…,r。
考慮到來襲目標(biāo)的總體毀傷概率和使用武器的總價值兩個目標(biāo)函數(shù)之間存在著對武器資源的競爭,本文利用非合作博弈建模方法求解多目標(biāo)優(yōu)化問題。 以兩個目標(biāo)函數(shù)作為博弈方,分別表示為毀傷概率P和武器價值V,建立非合作博弈模型G={P,V;S1,S2;U1,U2},其中S1、S2分別表示博弈方P和V的策略集,U1、U2分別表示博弈方P和V的收益。
1)策略及策略組合。 令s1表示博弈方P對部分武器單元的決策,s2表示博弈方V對剩余部分武器單元的決策,構(gòu)成策略組合s,s=(s1,s2),其中s1∈S1,s2∈S2。 策略組合s對應(yīng)一個火力分配方案{X1,X2,…,Xr},其中Xi(i=1,2,…,r)表示博弈方對第i種武器單元的決策,用mi×n階矩陣表示為
滿足式(3) ~(5)的策略組合為可行策略組合,所有可行策略組合s的集合等價于多目標(biāo)優(yōu)化問題的可行域。
2)收益函數(shù)。 為了統(tǒng)一博弈方收益的優(yōu)化方向,令U1=f1,U2=-f2。
3)納什均衡。 在博弈G={P,V;S1,S2;U1,U2}中,如果對任一博弈方K(K=1,2),策略組合滿足
基于地對空防御火力分配問題非合作博弈模型,將多目標(biāo)優(yōu)化問題轉(zhuǎn)化為滿足式(7)的納什均衡的求解。
當(dāng)來襲目標(biāo)和防御武器數(shù)量較多時,由于解空間較大,根據(jù)式(7)利用定義求解納什均衡比較困難。 遺傳算法(GA)以其全局尋優(yōu)、魯棒性強(qiáng)等特點(diǎn),被廣泛應(yīng)用于各個領(lǐng)域,但在進(jìn)化后期,收斂速度較慢,容易陷入局部最優(yōu)。 而禁忌搜索的核心思想是標(biāo)記對應(yīng)已搜索的局部最優(yōu)解的對象,并在以后的迭代搜索中盡量避開,從而保證多樣化的有效搜索[19]。 因此,本文結(jié)合禁忌搜索技術(shù)設(shè)計基于納什均衡的改進(jìn)遺傳算法NE-IGA 求解火力分配問題的博弈模型,從而避免算法早熟收斂,優(yōu)化算法性能。
針對地對空防御火力分配問題,采用實數(shù)編碼表示待優(yōu)化問題的解。 將各武器按照武器單元順序編號,設(shè)武器總數(shù)為m,來襲目標(biāo)總數(shù)為n,用(c1,c2,…,cm)表示火力分配問題的一個方案。其中ck(k=1,2,…,m)為0 ~n的整數(shù),ck=0 表示第k個武器不攻打,ck=j(luò)(j=1,2,…,n)表示第k個武器攻打第j個來襲目標(biāo)。 如有兩個武器單元,共有6 個武器,武器數(shù)量分別為2 和4,則個體編碼(2,3,0,1,4,3)中的基因“2”表示武器單元1中的第1 個武器攻打第2 個來襲目標(biāo);基因“0”表示武器單元2 中的第1 個武器不攻打任何來襲目標(biāo)。
多目標(biāo)博弈中的納什均衡,每一個優(yōu)化目標(biāo)的決策都是給出其他優(yōu)化目標(biāo)策略后的最佳策略。 納什均衡求解算法的主要目的是使各優(yōu)化目標(biāo)盡可能地逼近自己的最優(yōu)解,并且不損害其他優(yōu)化目標(biāo)的利益。 為求解博弈模型的納什均衡,定義NJ為
式中:NJ為判斷第J個個體是否為納什均衡的指標(biāo)和分別為當(dāng)前種群中個體J的毀傷概率和武器價值;maxf1和minf2分別為各單目標(biāo)下的最優(yōu)毀傷概率及最優(yōu)武器價值。 當(dāng)越接近越接近minf2時,第J個個體對應(yīng)的NJ就會越小。 此時,每一個目標(biāo)函數(shù)都在試圖逼近其最優(yōu)值,并且任一目標(biāo)函數(shù)都不能單獨(dú)決定多目標(biāo)問題的解。 尋求NJ的最小值,就等價于尋求納什均衡。
3.3.1初始化參數(shù)
初始化問題及算法參數(shù),其中火力分配問題參數(shù):武器個數(shù)m,來襲目標(biāo)數(shù)n,優(yōu)化目標(biāo)f1和f2;遺傳算法參數(shù):種群大小Pos,最大迭代次數(shù)MI,交叉概率Pc,相似度t,納什均衡因子ε。 按照編碼規(guī)則隨機(jī)生成Pos個初始個體。
3.3.2選擇算子
采用二元錦標(biāo)賽選擇操作,在當(dāng)前種群中隨機(jī)選擇兩個個體,將適應(yīng)度值大的個體放入下一代種群,較小的放回原種群,以參加下一次選擇。
3.3.3交叉算子
為避免基本遺傳算法容易早熟的缺點(diǎn),采用兩點(diǎn)交叉方式,并利用禁忌搜索技術(shù)改進(jìn)交叉操作,產(chǎn)生子代個體。
1)在0 和1 之間生成隨機(jī)數(shù)rand(0,1),若rand(0,1)小于交叉概率Pc,進(jìn)行兩點(diǎn)交叉,即隨機(jī)選擇兩個交叉點(diǎn),交換兩個父代個體中位于交叉點(diǎn)之間的部分基因,生成兩個子代個體;否則不進(jìn)行。
2)禁忌搜索獲取子代個體。 以父代個體的平均適應(yīng)度值作為期望水平,將父代個體的適應(yīng)度值作為禁忌對象存在禁忌表中。 若子代個體的適應(yīng)度值大于期望水平,則保留該子代個體;若小于期望水平,查看禁忌表中是否有此適應(yīng)度值,如沒有,保留該子代個體,否則選擇適應(yīng)度值高的父代個體替代該子代個體。
3.3.4變異算子
采用均勻變異方式。 應(yīng)用相似度在個體長度中的占比判斷是否進(jìn)行變異操作。 相似度是指兩個個體相同位置處編碼相同的個數(shù),若相似度在整個編碼中占比大于t,則隨機(jī)生成需變異的個體位置進(jìn)行變異操作。
NE-IGA 流程如圖1 所示,其中I為當(dāng)前迭代次數(shù)。
圖1 NE-IGA 流程圖
本節(jié)通過實例驗證求解火力分配問題的博弈建模方法及NE-IGA 的可行性和有效性。 實驗采用Windows 10 操作系統(tǒng)、PyCharm Community Edition 2020.3 x64 編譯環(huán)境、Python 3.8 語言編程實現(xiàn)。
假設(shè)我方有5 種武器單元,包括:GPS/毫米波W1,誘餌彈/箔條W2,煙霧彈W3,防空導(dǎo)彈W4以及高炮W5,各武器單元的武器價值和數(shù)量如表2 所示。 有10 個敵方來襲目標(biāo),包括兩枚BGM-109C“戰(zhàn)斧”式巡航導(dǎo)彈T1、T2,兩臺F-16C 戰(zhàn)斗機(jī)T3、T4,1 枚AGM-86 巡航導(dǎo)彈T5,1 架MQ-9“死神”無人機(jī)T6,兩架AH-64A“阿帕奇”直升機(jī)T7、T8,1 架F-22 隱形戰(zhàn)斗機(jī)T9和1 架B-52H 戰(zhàn)略轟炸機(jī)T10,敵方來襲目標(biāo)的威脅度如表3 所示,各武器對不同來襲目標(biāo)的毀傷概率如表4 所示。
表2 我方武器價值及數(shù)量
表3 敵方來襲目標(biāo)的威脅度
表4 各武器對各來襲目標(biāo)的毀傷概率
本例中,設(shè)置參數(shù)Pos =30、MI=60、Pc=0.9、t=0.94、ε=0.01;結(jié)合武器單元種類及數(shù)量,設(shè)置毀傷概率下限p=0.9。
為驗證本文提出算法NE-IGA 的有效性,將多目標(biāo)優(yōu)化模型中目標(biāo)函數(shù)f1和f2采用線性加權(quán)方式變?yōu)閱文繕?biāo),由于兩個目標(biāo)優(yōu)化方向不同,將其權(quán)重分別取相反數(shù),并將加權(quán)后的單目標(biāo)作為適應(yīng)度函數(shù),比較基于禁忌搜索改進(jìn)的遺傳算法(TSGA)及基本遺傳算法(GA)求解結(jié)果。 其中TSGA 是在GA 的基礎(chǔ)上,利用禁忌搜索技術(shù)改進(jìn)交叉算子,改進(jìn)方法同NE-IGA。 TSGA 及GA 的選擇算子及變異算子以及算法其他參數(shù)設(shè)置同NE-IGA。 得到的火力分配方案如表5所示。
表5 三種算法獲得的火力分配方案
三種算法得到的火力分配方案的目標(biāo)函數(shù)值及武器總數(shù)如表6 所示。
表6 三種算法獲得方案的目標(biāo)函數(shù)值及武器總數(shù)
由表6 可知,與TSGA 及GA 求解多目標(biāo)優(yōu)化模型相比,本文提出的NE-IGA 求解博弈模型得到的分配方案效果較好,總體毀傷概率較高,武器價值和使用武器數(shù)量均最低。 與TSGA 相比,雖然NE-IGA 毀傷概率優(yōu)勢較小,但武器價值降低了13.2%;與GA 相比,NE-IGA 毀傷概率提高0.6%,武器價值降低了17.7%。 此外,由TSGA得到的分配方案中各目標(biāo)函數(shù)值均優(yōu)于GA。
本文利用非合作博弈理論研究地對空防御的火力分配問題。 針對以最大化毀傷概率和最小化武器價值作為優(yōu)化目標(biāo)的多目標(biāo)優(yōu)化問題,通過將目標(biāo)函數(shù)映射為博弈方,以對各武器的決策作為策略建立非合作博弈模型。 在遺傳算法的基礎(chǔ)上,為提高遺傳算法的尋優(yōu)能力,加入禁忌搜索技術(shù),設(shè)計了算法NE-IGA 以尋求博弈模型的納什均衡。 實驗結(jié)果驗證了本文模型及算法的可行性和有效性。 未來將應(yīng)用博弈理論對來襲目標(biāo)動態(tài)到達(dá)、威脅度動態(tài)變化等更為復(fù)雜的戰(zhàn)場環(huán)境進(jìn)行研究,設(shè)計更加高效的納什均衡求解算法。