田忠良,劉 昊
(中國人民解放軍31696部隊,遼寧 錦州 121000)
兵棋對抗推演是軍事演習(xí)中的常見對抗樣式,相比于實兵對抗推演,兵棋對抗基于敵我電子態(tài)勢信息和后臺數(shù)據(jù)庫,最大限度地擬合真實戰(zhàn)場環(huán)境和敵我實兵對抗態(tài)勢,力求還原現(xiàn)實對抗場景并推演戰(zhàn)法策略。由于無需動用實兵實裝,相比于實兵演習(xí)的組織保障需求更低,更能反映戰(zhàn)法策略的對抗綜合效果,通過對電子態(tài)勢的復(fù)盤分析查缺補漏,在反復(fù)推演中修正完善原有戰(zhàn)法策略。隨著人工智能技術(shù)日趨成熟并融入軍事指揮實踐,智能算法與兵棋對抗推演融合逐步成為計算機和人工智能領(lǐng)域的研究熱點,與此相關(guān)的研究成果推動軍事智能深化發(fā)展,并為部隊?wèi)?zhàn)斗力提升發(fā)揮日益顯著的作用。
隨著國內(nèi)外專家對其研究的逐步深入,如何更有效地利用其數(shù)據(jù)資源,使其作為戰(zhàn)法策略和兵力火力對抗載體,在更廣闊的空間中發(fā)揮出綜合使用價值,是今后一段時期內(nèi)重點研究的工作內(nèi)容。智能算法作為大數(shù)據(jù)和云計算的核心研究領(lǐng)域,與兵棋對抗平臺的有機結(jié)合,能夠發(fā)揮出二者的比較優(yōu)勢,即以兵棋對抗推演的數(shù)據(jù)資源作為支撐,以智能算法作為手段對敵我對抗演習(xí)的實時數(shù)據(jù)進(jìn)行分析處理,挖掘能夠輔助后續(xù)戰(zhàn)法策略擬制的高價值經(jīng)驗。國內(nèi)外相關(guān)研究成果眾多,文獻(xiàn)[1]以智能優(yōu)化算法為基礎(chǔ)構(gòu)建遺傳模糊系統(tǒng),進(jìn)而實現(xiàn)兵棋推演的關(guān)鍵點推理,取得較好的優(yōu)化效果;文獻(xiàn)[2]以模擬退火算法為基礎(chǔ)設(shè)計局部搜索算法,實現(xiàn)了簡單規(guī)則下的兵棋推演;文獻(xiàn)[3-4]則對兵棋推演中的路徑優(yōu)化問題進(jìn)行了深入探討,并提供了基于智能優(yōu)化算法的解決思路;文獻(xiàn)[5]以多智能體對抗進(jìn)化作為算法設(shè)計思路,實現(xiàn)簡單規(guī)則兵棋推演。在復(fù)雜兵棋推演中,文獻(xiàn)[6]深入探討了當(dāng)代戰(zhàn)役兵棋推演的規(guī)則體系,提出了基于復(fù)雜網(wǎng)絡(luò)的規(guī)則約束體系概念;文獻(xiàn)[7]以循環(huán)神經(jīng)網(wǎng)絡(luò)為智能體基礎(chǔ),實現(xiàn)了對兵棋推演的輔助決策;文獻(xiàn)[8]構(gòu)建了決策樹推理機以實現(xiàn)兵棋推演中的人機博弈對抗。在兵棋推演數(shù)據(jù)分析方面,文獻(xiàn)[9]詳細(xì)分析了基于AlphaGo的自我博弈的指揮控制智能化問題,提出了數(shù)據(jù)耕耘的自我增值思路;文獻(xiàn)[10]設(shè)計基于堆棧自編碼器的深度學(xué)習(xí)方法,利用兵棋實體決策大數(shù)據(jù)建立了評估模型;文獻(xiàn)[11-12]使用數(shù)據(jù)挖掘算法在兵棋推演數(shù)據(jù)中提取有價值信息并輔助智能決策;文獻(xiàn)[13-15]則從兵棋推演的文本數(shù)據(jù)中抽取有價值信息,以實現(xiàn)最大限度的語義理解,進(jìn)而實現(xiàn)人機結(jié)合的智能輔助決策。
本文以兵棋對抗推演平臺為測試對象,對其制權(quán)癱體階段的主要工作進(jìn)行梳理,找到智能算法應(yīng)用的切入點,嘗試使用智能算法一體化生成輔助決策建議,并優(yōu)化諸軍兵種聯(lián)合作戰(zhàn)的協(xié)調(diào)配合狀態(tài),以聯(lián)合火力打擊計劃形式約束諸軍兵種火力打擊部隊的制權(quán)癱體作戰(zhàn)行動。
制權(quán)癱體階段的目標(biāo)價值評估,主要是依據(jù)作戰(zhàn)決心對火力打擊的備選目標(biāo)確定火力打擊優(yōu)先級,通過量化分析算法形成目標(biāo)價值評分,并通過融合算法輸出目標(biāo)體系總體評分。常見的目標(biāo)價值評估主要有三種方法:專家評分法、多屬性融合評分法和體系價值評估法。專家評分法在演習(xí)中應(yīng)用范圍最廣,使用目標(biāo)屬性表依據(jù)目標(biāo)的各側(cè)面屬性依靠專家主觀評分確定量化評估分值,以此確定目標(biāo)的重要程度等級;多屬性評分法則在專家評分法基礎(chǔ)上,通過公式對目標(biāo)的多個屬性融合計算并形成統(tǒng)一的綜合評分值;體系價值評估法主要是從目標(biāo)關(guān)聯(lián)關(guān)系出發(fā),構(gòu)建目標(biāo)體系的復(fù)雜網(wǎng)絡(luò),并從網(wǎng)絡(luò)中觀察并確定制約體系價值的關(guān)鍵節(jié)點目標(biāo),最終形成火力打擊排序。從當(dāng)前演習(xí)效果看,專家評分法依然占據(jù)主流地位,體系價值評估尚未被指揮員接受,必須從算法層面研究擬制更為科學(xué)合理的輔助決策建議,使指揮員掌握當(dāng)前態(tài)勢下的目標(biāo)各方面性能參數(shù),為擬制更為合理的目標(biāo)排序提供量化依據(jù)。
制權(quán)癱體階段的諸軍兵種聯(lián)合火力打擊力量眾多,型號、彈種多樣,地域分布廣泛,制約關(guān)系復(fù)雜交錯,使聯(lián)合火力打擊計劃的擬制和優(yōu)化火力分配計算難度大增,如果依據(jù)傳統(tǒng)的以軍兵種參戰(zhàn)力量為主體的軍兵種火力打擊階段任務(wù)分工,聯(lián)合作戰(zhàn)指揮機構(gòu)只需將目標(biāo)按類別或重要程度、地域所屬劃分給諸軍兵種參戰(zhàn)力量,并由各參戰(zhàn)力量單獨擬制軍兵種火力打擊計劃并在規(guī)定時刻區(qū)分波次執(zhí)行即可,這種火力分配方式的缺點在于:沒有發(fā)揮出聯(lián)合作戰(zhàn)中諸軍兵種火力打擊力量的合力,沒有統(tǒng)一的計算平臺對目標(biāo)和力量進(jìn)行優(yōu)化分配,沒有對參戰(zhàn)部隊彈種的最佳使用方式進(jìn)行量化分析和統(tǒng)一調(diào)配,聯(lián)合作戰(zhàn)指揮機構(gòu)只發(fā)揮出了任務(wù)劃分職能,未擔(dān)當(dāng)起任務(wù)優(yōu)化和統(tǒng)籌職責(zé)。因此有必要引入智能算法優(yōu)化聯(lián)合火力分配。
制權(quán)癱體階段的火力打擊和評估通常區(qū)分波次執(zhí)行,每波次火力打擊都能區(qū)分為火力打擊執(zhí)行階段、打擊效果評估階段和補充火力打擊階段。參戰(zhàn)火力打擊力量在火力打擊執(zhí)行階段根據(jù)聯(lián)合火力打擊計劃對分配目標(biāo)按時間階段和彈藥量執(zhí)行火力打擊,在打擊效果評估階段根據(jù)目標(biāo)的毀傷效果統(tǒng)計敵方當(dāng)前各方面的性能指標(biāo)毀傷情況,而后根據(jù)戰(zhàn)役企圖對未達(dá)成作戰(zhàn)目的的目標(biāo)擬制補充火力打擊計劃,并執(zhí)行補充火力打擊。制權(quán)癱體階段一般由多個波次的火力打擊和評估環(huán)節(jié)交疊組成,即評估與打擊相互印證,用小范圍的火力打擊檢驗評估效果,又用評估效果修正火力打擊執(zhí)行缺漏。但在實際執(zhí)行過程中,評估和火力打擊規(guī)劃兩個環(huán)節(jié)難以有效結(jié)合,由于火力打擊計劃在戰(zhàn)前已經(jīng)反復(fù)推演并固化,當(dāng)評估結(jié)果與打擊預(yù)期存在較大偏差時,聯(lián)合作戰(zhàn)指揮機構(gòu)難以在有效時限內(nèi)修正并下發(fā)補充火力打擊計劃,進(jìn)而使評估與火力打擊脫離,難以發(fā)揮聯(lián)合火力打擊實效。
智能算法又稱為軟計算方法,相比于按規(guī)則設(shè)計的常規(guī)算法,智能算法最大的特點在于隨機性和不可復(fù)現(xiàn)性。隨機性表現(xiàn)為算法內(nèi)部大量采用隨機函數(shù)設(shè)計思路,為算法提供了多種可行的計算方向;不可復(fù)現(xiàn)性表現(xiàn)為算法每次執(zhí)行的結(jié)果不可精確預(yù)判,只能依據(jù)算法的過往執(zhí)行效果對結(jié)果范圍進(jìn)行一定程度上的預(yù)估,難以準(zhǔn)確復(fù)現(xiàn)兩種一模一樣的算法執(zhí)行結(jié)果。正是由于智能算法具備上述特征,其在復(fù)雜系統(tǒng)問題的求解中體現(xiàn)了超越常規(guī)算法的計算效率和廣闊的適用性。根據(jù)兵棋對抗推演在制權(quán)癱體階段的任務(wù)特點,智能算法主要應(yīng)用如圖1所示。
圖1 智能算法應(yīng)用示例
目標(biāo)選擇采用體系價值評估的方法實現(xiàn)目標(biāo)的火力打擊先后排序,具體執(zhí)行過程為:首先,根據(jù)專家評分表確定目標(biāo)的所屬種類、所屬子類、所屬部隊,據(jù)此構(gòu)建目標(biāo)關(guān)聯(lián)表,進(jìn)而形成目標(biāo)超網(wǎng)絡(luò);其后,統(tǒng)計各目標(biāo)的種類、子類和所屬部隊評分;最后,使用智能算法在目標(biāo)超網(wǎng)絡(luò)中實現(xiàn)目標(biāo)聚類分析,進(jìn)而判斷出目標(biāo)的體系價值評分并輸出。根據(jù)智能算法應(yīng)用的側(cè)重點,下面主要分析智能算法應(yīng)用于目標(biāo)超網(wǎng)絡(luò)并計算體系價值評分具體計算過程如下:
步驟1根據(jù)目標(biāo)的種類關(guān)系、子類關(guān)系和所屬部隊關(guān)系生成目標(biāo)關(guān)聯(lián)表。導(dǎo)入系統(tǒng)采集的基本目標(biāo)信息,目標(biāo)由包含不同功能屬性的同一打擊對象子目標(biāo)組合構(gòu)成,同一次火力打擊能夠?qū)ν荒繕?biāo)組合內(nèi)的所有子目標(biāo)構(gòu)成不同程度的損害。其中所屬部隊是目標(biāo)組合的最小劃分,也是火力打擊作用的對象,如“驅(qū)護(hù)艦X號艦”;目標(biāo)子類是目標(biāo)組合內(nèi)各子目標(biāo)根據(jù)其所屬功能具體劃分出的系統(tǒng)單元,如“艦隊防空火力系統(tǒng)”;目標(biāo)種類是各子目標(biāo)依據(jù)其具體自然屬性劃分出的類別單元,如“防空-空空導(dǎo)彈”。一般來說,以目標(biāo)劃分的精細(xì)度區(qū)分,子目標(biāo)>所屬部隊>目標(biāo)子類>目標(biāo)種類。獲取目標(biāo)的種類、子類和所屬部隊關(guān)系,3類關(guān)系如圖2所示。
圖2 采集信息表中3類關(guān)系
目標(biāo)關(guān)聯(lián)表生成原則為:若兩個目標(biāo)之間存在3類關(guān)系中任意一個,則判定目標(biāo)之間關(guān)聯(lián)度為1,否則為0。
步驟2生成目標(biāo)超網(wǎng)絡(luò)。依據(jù)敵方子目標(biāo)構(gòu)成的目標(biāo)關(guān)聯(lián)表,依據(jù)表內(nèi)關(guān)聯(lián)度為1在超網(wǎng)絡(luò)中連線的原則,生成目標(biāo)超網(wǎng)絡(luò),其中可依據(jù)目標(biāo)所屬的不同子類和所屬部隊劃分不同的子網(wǎng)絡(luò)。圖2的示例能夠轉(zhuǎn)換為超網(wǎng)絡(luò)如圖3所示。
圖3 超網(wǎng)絡(luò)示例
(1)
(2)
(3)
步驟4計算目標(biāo)的綜合評分。使用熵權(quán)理想點法將各子目標(biāo)的子類評分、種類評分和所屬部隊評分融合并輸出為綜合評分fi,熵權(quán)理想點算法首先根據(jù)各目標(biāo)的屬性值分布規(guī)律計算出各屬性值的熵權(quán)重,再依據(jù)理想點法生成正負(fù)理想點,并計算出加權(quán)屬性值與正負(fù)理想點之間的距離對比值作為輸出綜合評分。
(4)
聯(lián)合火力打擊計劃的擬制是制權(quán)癱體階段聯(lián)合作戰(zhàn)指揮機構(gòu)的重點工作內(nèi)容,計劃優(yōu)化包含如下工作:目標(biāo)量化評估優(yōu)選、火力打擊力量梳理、火力打擊限制條件梳理、初始計劃生成、最優(yōu)計劃輸出。智能算法借鑒了自然界生物進(jìn)化過程中的協(xié)作與競爭機制,通過設(shè)計智能體結(jié)構(gòu)模擬參與火力打擊的部隊彈種,利用智能體變異產(chǎn)生豐富多樣的“彈種-目標(biāo)”組合,通過多個智能體之間的搭配組合產(chǎn)生聯(lián)合火力打擊計劃,進(jìn)而實現(xiàn)聯(lián)合火力分配的優(yōu)化。智能體功能示例如圖4所示。
圖4 智能體功能示例
由圖4可知,智能體實現(xiàn)“彈種-目標(biāo)”組合的核心在于目標(biāo)排序表結(jié)構(gòu),其生成原則為:根據(jù)智能體的部隊彈種在目標(biāo)限制表中調(diào)用所有能夠打擊的目標(biāo);根據(jù)目標(biāo)屬性表中的所屬方排除非藍(lán)方目標(biāo)(鑒于實際對抗中存在紫方、綠方等中立目標(biāo));根據(jù)偵察情報排除未被發(fā)現(xiàn)或更新不及時目標(biāo)。將篩選出的目標(biāo)序號導(dǎo)入目標(biāo)排序表,并加入適量冗余項-1。其意義表述為:若選擇執(zhí)行冗余項,則部隊原地待命3分鐘不執(zhí)行火力打擊。智能體的使用流程為:若智能體參與生成火力打擊計劃,則根據(jù)目標(biāo)排序表依次選中靠前目標(biāo)序號并判斷是否能夠?qū)崿F(xiàn)火力打擊:超程不予打擊;部隊彈種剩余彈藥量不足不予打擊;部隊已殲滅不予打擊;目標(biāo)已殲滅不予打擊。如能夠執(zhí)行火力打擊則輸出“彈種-目標(biāo)”組合;如不能執(zhí)行則依次選中后續(xù)目標(biāo)序號,直至排序表所有目標(biāo)選擇完畢,退出循環(huán)?;诖?聯(lián)合火力分配算法的操作流程如下。
步驟1生成我方智能體種群。按照種群進(jìn)化原則,為所有部隊彈種生成對應(yīng)智能體,依據(jù)目標(biāo)綜合評分由高至低生成目標(biāo)排序表,并通過變異操作產(chǎn)生同類智能體。變異操作:隨機選中目標(biāo)排序表中兩個位置的目標(biāo)序號并交換,置壽命和智能體評分為0??紤]種群多樣性,種群內(nèi)相同部隊彈種的智能體數(shù)量至少為3個。
步驟2生成聯(lián)合火力打擊任務(wù)規(guī)劃。隨機抽取每個部隊彈種中的1個智能體搭配組合,選中智能體壽命+1,選中智能體目標(biāo)排序表中的目標(biāo)序號并生成“彈種-目標(biāo)”組合,根據(jù)目標(biāo)與部隊距離、射彈飛行速度、部隊機動速度、打擊間隔時間計算出任務(wù)規(guī)劃時刻和火力打擊時刻,進(jìn)而匯總生成聯(lián)合火力打擊計劃[10]。設(shè)第j個部隊彈種的經(jīng)緯度坐標(biāo)為bj和lj,第i個目標(biāo)的經(jīng)緯度坐標(biāo)為bi和li,則部隊與目標(biāo)之間距離dij計算公式為
(5)
(6)
(7)
(8)
下次任務(wù)規(guī)劃開始時刻t1計算公式為
t1=t0+gj
(9)
步驟3生成智能體反饋評分。將聯(lián)合火力打擊任務(wù)規(guī)劃代入對抗推演,并生成各目標(biāo)的毀傷程度和部隊的彈藥兵力損耗,進(jìn)而計算出對抗評分,將其反饋參與任務(wù)規(guī)劃生成的智能體組合。
步驟4種群淘汰更新。將種群內(nèi)同部隊彈種的最高分智能體變異產(chǎn)生新智能體,并替代同部隊彈種的最低分智能體。
步驟5重復(fù)上述步驟1-4,直至達(dá)成迭代上限,選取種群內(nèi)各部隊彈種最高分智能體搭配組合并生成聯(lián)合火力打擊任務(wù)規(guī)劃,作為優(yōu)化結(jié)果輸出。
對抗推演算法用于執(zhí)行聯(lián)合火力打擊任務(wù)規(guī)劃并最終輸出反饋評分,為了盡可能貼合實戰(zhàn)對抗環(huán)境,算法包含航空部隊損耗計算、目標(biāo)毀傷程度計算和反饋評分計算3個核心環(huán)節(jié)[8]。其中,防空部隊損耗計算流程如下:
步驟1計算當(dāng)前敵方體系總體防空能力。遍歷目標(biāo)屬性表,并計算所有防空目標(biāo)的當(dāng)前毀傷程度,設(shè)第i個目標(biāo)屬于防空目標(biāo),毀傷程度為hi,綜合評分為fi,匯總并計算敵方體系總體防空能力K,計算公式為
(10)
(11)
(12)
(13)
(14)
為了檢驗智能算法應(yīng)用于兵棋對抗推演的總體優(yōu)化效果,引入對比遺傳算法作為對比算法,同時選取手工火力打擊計劃作為對比結(jié)果,分析智能體優(yōu)化結(jié)果的分布特征和搭配規(guī)律。
本實驗設(shè)計使用熵權(quán)理想點法實現(xiàn)目標(biāo)子類、種類和所屬部隊評分的融合輸出,在算法選擇上稍顯突兀,因此選取求和公式作為對比融合算法計算兩種算法生成的目標(biāo)綜合評分。為了更好觀察對比效果,將橫坐標(biāo)目標(biāo)綜合評分按求和公式結(jié)果由大至小排序,輸出對比結(jié)果如圖5所示。
圖5 綜合評分算法對比
通過對比分析可知,求和公式優(yōu)于計算較為簡單,因此各目標(biāo)綜合評分之間的差異度較大,相比較而言,熵權(quán)理想點法的最大小值差異度在1以內(nèi),相對波動較小;在綜合評分比較上,求和公式?jīng)]有對3個屬性值賦予傾向性權(quán)重,但優(yōu)于所屬部隊評分相對于另2種屬性值區(qū)分度更高,因此求和公式主要反映了所屬部隊評分的波動情況,實際走勢也趨向于部隊屬性,對于目標(biāo)子類和種類評分的作用影響有限,而熵權(quán)理想點法對各屬性值賦予了傾向性熵權(quán)評分,更能反映3個屬性值的綜合波動效果,圖像上并未完全遵循所屬部隊評分走勢,因此后續(xù)實驗中采用熵權(quán)理想點法作為融合評分算法。
在對抗推演算法中,引入了火力打擊性價比概念,并用以輸出為智能體的反饋評分,作為智能體優(yōu)勝劣汰的生存依據(jù),為了檢查火力打擊性價比在對抗推演中對任務(wù)規(guī)劃智能提升的有效性,選取敵方平均毀傷程度作為對比反饋評分,對比結(jié)果如圖6所示。
圖6 反饋評分對比
通過對比分析可知,以目標(biāo)毀傷程度作為反饋評分時,隨著迭代次數(shù)增長,目標(biāo)平均體系價值評分持續(xù)走低,相比而言,以火力打擊性價比作為反饋評分的目標(biāo)毀傷程度降幅不如前者,差異值持續(xù)增大,并在 100 000 代后達(dá)到1 695.4分(占目標(biāo)初始體系評分的4.52%),如果僅以目標(biāo)毀傷程度作為評判標(biāo)準(zhǔn),則以目標(biāo)毀傷程度作為反饋評分更為高效;在對比二者部隊損失實力中,以目標(biāo)毀傷程度作為反饋評分的部隊損失持續(xù)增大,而以火力打擊性價比的反饋評分方法則緩慢走低,二者差異度由最初的0擴展為486.74(占部隊總實力的2.4%),表明以目標(biāo)毀傷程度作為反饋評分方法隨著優(yōu)化持續(xù)而導(dǎo)致部隊毀傷程度持續(xù)增長,這種增長不以敵方主觀意志為轉(zhuǎn)移,僅是對部隊火力打擊的被動反擊;在對比二者火力打擊性價比后,以目標(biāo)毀傷程度為反饋評分方法在多代迭代后的總體火力打擊性價比并未發(fā)生明顯提升,僅是在8.16~12.80之間波動,而以火力打擊性價比為反饋評分方法在 19 000 代前與前方法基本相同,但隨著代數(shù)推演和對抗經(jīng)驗積累,在26 000代后的打擊性價比產(chǎn)生明顯陡增(14.59),并在此后超越前方法,并在 100 000 代迭代后產(chǎn)生了最高分值18.75。綜上可知,以火力打擊性價比為反饋評分方法在綜合比較中優(yōu)于前方法,而如不計我方部隊損耗,以目標(biāo)毀傷程度為反饋評分方法更為適用。
為了檢驗算法在同類算法中的綜合對比性能,選取遺傳算法作為對照算法,取進(jìn)化代數(shù)為100代,觀察各代的最優(yōu)智能體評分結(jié)果,對比結(jié)果如圖7所示。
圖7 最優(yōu)智能體評分對比
通過對比分析可知,多智能體協(xié)同進(jìn)化方法明顯優(yōu)于同類的遺傳算法,原因主要在于協(xié)同進(jìn)化在短時間內(nèi)汲取同類智能體中的優(yōu)秀基因結(jié)構(gòu),使其綜合評分迅速上揚,評分水平明顯優(yōu)于遺傳算法;在長時間的迭代中,遺傳算法逐步改善最優(yōu)智能體的基因結(jié)構(gòu),使其綜合評分水平逐步趨近協(xié)同進(jìn)化方法的綜合評分;通過實驗可知,在時效性要求較高的領(lǐng)域可優(yōu)先選取協(xié)同進(jìn)化算法作為智能算法,如對時間要求不高且對算法編程復(fù)雜度要求較高,可選取簡單易行的遺傳算法作為智能算法。
選取以智能體組合作為最小變異單位的種群結(jié)構(gòu),分析最優(yōu)種群中的高分智能體組合產(chǎn)生的聯(lián)合火力打擊任務(wù)規(guī)劃,并與人工產(chǎn)生的任務(wù)規(guī)劃相比較,部隊損耗情況對比結(jié)果如圖8所示。
圖8 部隊損耗情況對比
通過對比分析可知,對于各類航空部隊編號單元,手工擬制任務(wù)規(guī)劃的毀傷程度維持在85%左右,而智能算法優(yōu)化的航空部隊毀傷程度維持在98%,各航空部隊毀傷程度保持一致的原因在于算法中對于毀傷程度計算取決于敵方防空體系的毀傷百分比,因此對于防空體系毀傷較大,則各航空部隊對應(yīng)的毀傷程度相應(yīng)降低,應(yīng)用智能算法優(yōu)化后的各航空部隊毀傷程度明顯優(yōu)于手工規(guī)劃。在任務(wù)規(guī)劃對比中,打擊各種類目標(biāo)的數(shù)量對比如圖9所示。
圖9 打擊各種類目標(biāo)數(shù)量對比
通過對比分析可知,優(yōu)化任務(wù)規(guī)劃的打擊子目標(biāo)總數(shù)明顯多于手工任務(wù)規(guī)劃子目標(biāo)數(shù)(5829>5212),在目標(biāo)種類中,機堡類目標(biāo)(戰(zhàn)時軍用機場備用機庫)增幅最大,高于手工規(guī)劃的131%;其次為傳感器站點類目標(biāo),增幅為32.62%;同時對于導(dǎo)彈部隊、防空-空空導(dǎo)彈、裝卸設(shè)施類目標(biāo)的打擊數(shù)量明顯降低,最大降幅達(dá)58.12%,考慮敵方防空體系降低,優(yōu)化任務(wù)規(guī)劃重點打擊了敵方的子目標(biāo)較少的防空目標(biāo),提升了子目標(biāo)打擊效率。對于剩余目標(biāo)統(tǒng)計分析,敵方目標(biāo)子類0數(shù)表明該目標(biāo)子類全部被殲滅;所屬部隊0數(shù)表明該所屬部隊對應(yīng)的目標(biāo)全部被殲滅,對應(yīng)對比結(jié)果如圖10所示。
圖10 剩余目標(biāo)和防空能力對比
通過對比分析可知,經(jīng)過智能算法優(yōu)化,剩余目標(biāo)中的目標(biāo)子類0數(shù)和所屬部隊0數(shù)明顯增長,分別提升了30%和34%,表明經(jīng)過優(yōu)化的敵方目標(biāo)中的具體類別數(shù)量明顯降低,網(wǎng)絡(luò)體系價值得到有效削弱;在防空能力降幅對比中,智能優(yōu)化方法能夠?qū)崿F(xiàn)對敵方更多的降幅(5.69%)。經(jīng)過綜合比較可知,智能優(yōu)化后的任務(wù)規(guī)劃明顯優(yōu)于指揮員手工擬制的任務(wù)規(guī)劃。
本文針對兵棋對抗推演中的制權(quán)癱體階段聯(lián)合火力打擊任務(wù)規(guī)劃問題,研究了智能算法應(yīng)用的可行性,設(shè)計了以多智能體協(xié)同進(jìn)化為設(shè)計理念的群體智能優(yōu)化算法,同時針對聯(lián)合火力打擊毀傷特點設(shè)計了對抗模擬平臺,通過計算機迭代進(jìn)化推演輸出優(yōu)化智能體,并分析對應(yīng)最優(yōu)任務(wù)規(guī)劃的結(jié)構(gòu)特點。實驗分析表明,本算法應(yīng)用于聯(lián)合火力打擊任務(wù)規(guī)劃相比于手工擬制任務(wù)規(guī)劃具備全方位的優(yōu)勢,能夠有效與兵棋對抗推演結(jié)合,并通過任務(wù)規(guī)劃優(yōu)化輔助指揮員決策,達(dá)成人機結(jié)合和智能決策的智能算法應(yīng)用目的。下一步將根據(jù)兵棋對抗推演的實戰(zhàn)特點設(shè)計更為貼近戰(zhàn)場環(huán)境的對抗算法,并引入綠、紫軍對抗環(huán)境,研究智能體在多元環(huán)境中的進(jìn)化規(guī)律。