劉昊, 張策, 丁文韜
(1.國防大學(xué) 聯(lián)合作戰(zhàn)學(xué)院, 河北 石家莊 050000; 2.國防大學(xué) 研究生院, 北京 100091)
聯(lián)合火力打擊任務(wù)規(guī)劃是根據(jù)聯(lián)合火力打擊任務(wù)等約束條件,運(yùn)用輔助決策工具對(duì)聯(lián)合火力打擊行動(dòng)進(jìn)行籌劃計(jì)算,包括計(jì)算兵力彈藥滿意度、輔助制定聯(lián)合火力打擊計(jì)劃、評(píng)估火力打擊效果等[1]。其核心問題是解決聯(lián)合作戰(zhàn)中的動(dòng)態(tài)火力分配問題,即根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)和敵我動(dòng)態(tài)博弈情況實(shí)時(shí)生成目標(biāo)打擊清單,動(dòng)態(tài)分配火力打擊力量和打擊目標(biāo),以實(shí)現(xiàn)聯(lián)合火力打擊效能的最大化[2]。其難點(diǎn)在于火力打擊任務(wù)規(guī)劃不僅計(jì)算我方火力分配的效能最大化,還必須考慮敵方火力打擊對(duì)我方造成的影響,這是因?yàn)閿澄页跏蓟鹆Ψ峙涞奈⑿〔顒e將導(dǎo)致最終打擊效果的千差萬別,極大地增加任務(wù)分配推演計(jì)算和算法實(shí)現(xiàn)的復(fù)雜度。
國內(nèi)外研究人員已經(jīng)針對(duì)任務(wù)規(guī)劃問題探索了多種解決方法,其中:特征評(píng)估法[3-5]通過算法公式計(jì)算影響戰(zhàn)果的評(píng)估指標(biāo),效率高但推廣性差;改進(jìn)遺傳算法[6-9]利用生物進(jìn)化思想尋找當(dāng)前狀態(tài)下的全局最優(yōu)解,構(gòu)造簡(jiǎn)單但環(huán)境依賴性大;動(dòng)態(tài)博弈法[10-13]通過博弈論形成敵我雙方之間的納什均衡,動(dòng)態(tài)適應(yīng)性強(qiáng)但計(jì)算復(fù)雜性劇增;神經(jīng)網(wǎng)絡(luò)法[14-16]模擬智能體的自學(xué)習(xí)能力,依靠經(jīng)驗(yàn)解決問題,理論完美但訓(xùn)練數(shù)據(jù)來源受限。上述方法存在的普遍問題是:關(guān)注靜態(tài)條件下對(duì)我方火力打擊效能的評(píng)估,未考慮將敵我雙方納入網(wǎng)絡(luò)體系實(shí)施對(duì)抗推演,使火力打擊計(jì)劃片面化、簡(jiǎn)單化;關(guān)注評(píng)估指標(biāo)的理論計(jì)算,未考慮對(duì)抗推演中的有效性檢驗(yàn),使火力打擊計(jì)劃偏離戰(zhàn)場(chǎng)實(shí)際;關(guān)注當(dāng)前態(tài)勢(shì)下的最優(yōu)分配結(jié)果,未考慮敵我雙方態(tài)勢(shì)變化的可能性,使火力打擊計(jì)劃更脆弱。
本文在總結(jié)前人方法的基礎(chǔ)上,借鑒自然界物種間的對(duì)抗進(jìn)化機(jī)理,在遺傳算法基礎(chǔ)上設(shè)計(jì)對(duì)抗進(jìn)化算法,實(shí)現(xiàn)敵我雙方任務(wù)規(guī)劃的無上限對(duì)抗進(jìn)化,產(chǎn)生出在當(dāng)前態(tài)勢(shì)及未來可能態(tài)勢(shì)下解決任務(wù)規(guī)劃問題的最優(yōu)個(gè)體,并通過仿真實(shí)驗(yàn)驗(yàn)證了該方法產(chǎn)生的最優(yōu)個(gè)體自我學(xué)習(xí)能力以及在解決聯(lián)合火力打擊任務(wù)規(guī)劃問題上的智能性。
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
并保證我方彈藥消耗比例do約束條件如下:
(9)
(10)
問題的難點(diǎn)在于:1)各節(jié)點(diǎn)的發(fā)現(xiàn)概率決定了目標(biāo)打擊清單,目標(biāo)打擊清單決定了各波次打擊任務(wù)的火力分配結(jié)果,火力分配差異影響最終評(píng)估結(jié)果,如何從不確定的發(fā)現(xiàn)概率中找到確定性的最優(yōu)化火力分配,是任務(wù)規(guī)劃問題的難點(diǎn)[17];2)敵我雙方均在尋找最優(yōu)化評(píng)估結(jié)果,且雙方火力分配的微小調(diào)整均對(duì)各自最終評(píng)估結(jié)果產(chǎn)生重要影響,如何實(shí)現(xiàn)敵我雙方的對(duì)抗推演評(píng)估也是算法難點(diǎn)。本文試圖構(gòu)造敵我雙方多波次的火力打擊對(duì)抗評(píng)估模型,通過對(duì)抗推演統(tǒng)計(jì)敵我雙方的評(píng)估函數(shù)分值,以此判斷勝負(fù)結(jié)果并找到最佳火力分配方法。
針對(duì)聯(lián)合火力打擊動(dòng)態(tài)分配問題難點(diǎn),智能對(duì)抗進(jìn)化算法設(shè)計(jì)目標(biāo)包括:1)實(shí)現(xiàn)由不確定的發(fā)現(xiàn)概率得到確定性的評(píng)估結(jié)果;2)建立敵我雙方互為評(píng)估條件的對(duì)抗評(píng)估機(jī)制。智能對(duì)抗進(jìn)化算法以遺傳算法為基礎(chǔ),引入雙種群對(duì)抗評(píng)估機(jī)制,在設(shè)置初始個(gè)體的基礎(chǔ)上實(shí)現(xiàn)敵我雙方種群間的對(duì)抗進(jìn)化,在眾多代繁衍后產(chǎn)生能夠解決聯(lián)合火力打擊任務(wù)規(guī)劃問題的最優(yōu)個(gè)體。算法流程圖如圖1所示。
圖1 智能對(duì)抗進(jìn)化算法流程圖Fig.1 Flow chart of intelligent confrontation evolution algorithm
超網(wǎng)絡(luò)概念是美國科學(xué)家Sheffi[18]在處理交織網(wǎng)絡(luò)時(shí)提出的,特指高于而又超于現(xiàn)存網(wǎng)絡(luò)的網(wǎng)絡(luò),體現(xiàn)出超越一般網(wǎng)絡(luò)的復(fù)雜性和涌現(xiàn)性。為了確定敵我火力分配任務(wù)的打擊排序,本文將敵我雙方節(jié)點(diǎn)區(qū)分為觀察單元、判斷決策單元、信息傳輸單元、行動(dòng)單元、其他單元5類;按照各目標(biāo)的信息通聯(lián)屬性,構(gòu)建出偵察情報(bào)網(wǎng)、指揮控制網(wǎng)、信息傳輸網(wǎng)、火力打擊網(wǎng),并在各子網(wǎng)基礎(chǔ)上構(gòu)建作戰(zhàn)超網(wǎng)絡(luò)。圖2為以敵方戰(zhàn)場(chǎng)態(tài)勢(shì)信息構(gòu)建的超網(wǎng)絡(luò)示例。
本文中的個(gè)體特指具備一定智能程度的任務(wù)規(guī)劃對(duì)象,即給定當(dāng)前狀態(tài)的目標(biāo)打擊清單,能夠唯一地輸出聯(lián)合火力打擊任務(wù)規(guī)劃的智能體。對(duì)于一個(gè)固定的目標(biāo)打擊清單,個(gè)體必能產(chǎn)生唯一對(duì)應(yīng)的火力打擊任務(wù)分配表。本文對(duì)DNA定義為:由隨機(jī)整數(shù)組成的二維動(dòng)態(tài)數(shù)組,整數(shù)值、組內(nèi)個(gè)數(shù)均不固定,用以模擬生物DNA隨機(jī)變異、由簡(jiǎn)單向復(fù)雜進(jìn)化的自然特性。個(gè)體數(shù)據(jù)結(jié)構(gòu)如表1所示(敵我雙方雙種群內(nèi)的個(gè)體結(jié)構(gòu)相同)。
圖2 敵方作戰(zhàn)超網(wǎng)絡(luò)示例Fig.2 Example of a friend-foe operation super-network
表1 個(gè)體數(shù)據(jù)結(jié)構(gòu)
繁殖變異用于產(chǎn)生新生個(gè)體,以優(yōu)秀個(gè)體作為父代,通過1/1 000的隨機(jī)變異操作產(chǎn)生不同于父代的子個(gè)體。繁殖變異算法流程圖如圖3所示。
圖3 繁殖變異算法流程圖Fig.3 Flow chart of reproductive mutation algorithm
設(shè)種群內(nèi)個(gè)體上限數(shù)目為1 000. 其中,輸入壓縮種群階段,種群中個(gè)體數(shù)目小于1 000;選中父?jìng)€(gè)體階段,在種群中選取最高評(píng)分且遺傳次數(shù)最少的個(gè)體作為父?jìng)€(gè)體,若存在多個(gè)個(gè)體,則采用輪盤法確定父?jìng)€(gè)體;復(fù)制新個(gè)體階段,將父?jìng)€(gè)體完整復(fù)制產(chǎn)生新個(gè)體;變異操作階段,通過千分之一的隨機(jī)變異操作修改新個(gè)體的DNA動(dòng)態(tài)數(shù)組信息;算法輸出規(guī)模為1 000的擴(kuò)充種群。
由于敵我雙方處于信息不透明狀態(tài),在初始目標(biāo)清單基礎(chǔ)上,火力打擊方必然會(huì)使己方處于觀察- 判斷- 決策- 打擊(OODA)循環(huán)中的節(jié)點(diǎn)發(fā)現(xiàn)概率增大,當(dāng)發(fā)現(xiàn)概率到達(dá)發(fā)現(xiàn)閾值時(shí)即被對(duì)方偵察,目標(biāo)清單上即顯示該節(jié)點(diǎn),因此每波次火力打擊后敵我雙方的目標(biāo)清單均需更新,用于剔除已消滅目標(biāo)并引入新發(fā)現(xiàn)目標(biāo)。更新目標(biāo)清單算法流程圖如圖4所示。
圖4 更新目標(biāo)清單算法流程圖Fig.4 Flow chart of target list updating algorithm
(11)
刪除已消滅節(jié)點(diǎn)階段,刪除毀傷程度超過80%的節(jié)點(diǎn);添加新發(fā)現(xiàn)節(jié)點(diǎn)階段,將發(fā)現(xiàn)概率超過80%的節(jié)點(diǎn)加入目標(biāo)清單。
轉(zhuǎn)錄是指以DNA為基礎(chǔ)產(chǎn)生蛋白質(zhì)酶以控制生物體性狀的過程,本文中特指在輸入目標(biāo)打擊清單后,個(gè)體DNA數(shù)組通過內(nèi)部算法,產(chǎn)生唯一對(duì)應(yīng)的火力打擊任務(wù)分配表的過程。具體算法步驟如下:
步驟1窮舉所有可能的火力分配任務(wù)。每個(gè)火力分配任務(wù)包含“打擊目標(biāo)編號(hào)、使用部隊(duì)編號(hào)、火力打擊起止時(shí)刻”。
步驟2數(shù)據(jù)非線性推演。為每個(gè)火力分配任務(wù)和DNA數(shù)組,對(duì)應(yīng)計(jì)算f(zi)函數(shù)并留存計(jì)算結(jié)果。設(shè)火力分配任務(wù)輸入值為目標(biāo)重要程度zi,DNA數(shù)組初始維數(shù)為10,對(duì)應(yīng)數(shù)組值為d,推演公式如下:
(12)
若為首段輸入,則輸入打擊目標(biāo)的重要程度;若為第i段輸入,則以zi=f(zi-1-1)代入f(zi)函數(shù)進(jìn)行計(jì)算。
步驟3判定是否實(shí)施該火力分配任務(wù)。若結(jié)果f(zi)<50,則不實(shí)施;反之則實(shí)施;按f(zi)的分值由大到小排序,選取前10的火力分配任務(wù)。
步驟4去冗余操作。去除超程任務(wù);去除彈藥不足任務(wù);去除兵力不足任務(wù);去除執(zhí)行沖突任務(wù);輸出最終的火力分配表如表2所示。
表2 個(gè)體對(duì)應(yīng)火力分配表示例
注:T為戰(zhàn)斗發(fā)起時(shí)刻。
根據(jù)OODA循環(huán)理論,火力打擊過程可抽象為“觀察(Observe)-判斷(Orient)-決策(Decide)-打擊(Act)”4種行動(dòng)的不斷循環(huán),則勝利的關(guān)鍵在于通過加快己方的OODA循環(huán),在敵人對(duì)己方前次行動(dòng)作出反應(yīng)之前發(fā)起新的行動(dòng),從而遲滯或打破敵人的OODA循環(huán),以達(dá)成制勝的目的。OODA循環(huán)理論可以解決敵我雙方火力打擊任務(wù)的排序問題。在敵我作戰(zhàn)超網(wǎng)絡(luò)中,偵察情報(bào)網(wǎng)對(duì)應(yīng)“觀察”環(huán)節(jié),指揮控制網(wǎng)對(duì)應(yīng)“判斷”和“決策”環(huán)節(jié),火力打擊網(wǎng)對(duì)應(yīng)“打擊”環(huán)節(jié),則可通過超網(wǎng)絡(luò)中各節(jié)點(diǎn)的通聯(lián)效率作為評(píng)判OODA循環(huán)效率的依據(jù)。
本文設(shè)置敵我雙方各火力打擊任務(wù)的排序規(guī)則如下:1)超網(wǎng)絡(luò)中觀察單元、判斷決策單元、行動(dòng)單元之間的循環(huán)越短,該行動(dòng)單元的OODA循環(huán)效率越高;2)超網(wǎng)絡(luò)中的各子網(wǎng)越健全,網(wǎng)絡(luò)中行動(dòng)單元的OODA循環(huán)效率越高;3)行動(dòng)單元的OODA循環(huán)效率越高,火力打擊排序越靠前。設(shè)超網(wǎng)絡(luò)中第i個(gè)單元的易毀傷程度為hi;與第t個(gè)行動(dòng)單元相連接的觀察單元數(shù)目為m,判斷決策單元數(shù)目為n,信息傳遞單元數(shù)目為k,分別對(duì)應(yīng)的單元編號(hào)為im、in、ik. 定義第t個(gè)行動(dòng)單元的觀察效率為Gt:與其相接的觀察單元重要程度越高,機(jī)動(dòng)能力越強(qiáng),越難以毀傷,則觀察效率越高。Gt的計(jì)算公式如下:
(13)
式中:him、zim、dim分別表示易毀傷程度、重要程度、機(jī)動(dòng)能力指標(biāo)。
定義判斷決策效率Ct:與其相連接的判斷決策單元重要程度越高,越難以毀傷,固定位置時(shí)間越長,則判斷決策效率越高。Ct的計(jì)算公式如下:
(14)
式中:hin、zin、din分別表示易毀傷程度、重要程度、機(jī)動(dòng)能力指標(biāo)。
定義信息傳輸效率St:與其相連接的信息傳輸單元重要程度越高,越難以毀傷,固定位置時(shí)間越長,則信息傳輸效率越高。St的計(jì)算公式如下:
(15)
式中:hik、zik、dik分別表示易毀傷程度、重要程度、機(jī)動(dòng)能力指標(biāo)。
定義OODA評(píng)估指標(biāo)Pt,其計(jì)算公式如下:
Pt=lg(max{Gt,1})×lg(max{Ct,1})×
lg(max{St,1}).
(16)
按Pt排序?qū)嵤┗鹆Υ驌?,更新打擊目?biāo)方的毀傷程度,更新實(shí)施打擊方的彈藥消耗和發(fā)現(xiàn)概率。設(shè)某個(gè)作戰(zhàn)單元在第p波次火力打擊中的易毀傷程度為hp,參與火力打擊的部隊(duì)毀傷能力為kp,兵力消耗比例為bp,更新各節(jié)點(diǎn)毀傷程度的計(jì)算公式為
(17)
更新發(fā)現(xiàn)概率的計(jì)算公式為
fp=fp-1+rand{Gt,Ct,St}×
rand{10,…,30}.
(18)
此外,每波打擊中隨機(jī)對(duì)一個(gè)目標(biāo)發(fā)現(xiàn)概率賦值100.
敵我雙方對(duì)抗評(píng)估用于在火力打擊結(jié)束后,通過敵我雙方兵力、彈藥損耗,計(jì)算出敵我雙方綜合評(píng)分的過程。對(duì)抗評(píng)估算法流程圖如圖5所示。
圖5 對(duì)抗評(píng)估算法流程圖Fig.5 Flow chart of confrontation evaluation algorithm
(19)
(20)
計(jì)算對(duì)抗評(píng)估參數(shù)階段,用T1描述在固定火力打擊次數(shù)情況下對(duì)更重要的節(jié)點(diǎn)實(shí)施火力打擊;用T2描述實(shí)際火力打擊次數(shù)和規(guī)定火力打擊次數(shù)的差異率;用T3描述各節(jié)點(diǎn)的平均毀傷程度。設(shè)第is個(gè)行動(dòng)單元的火力打擊次數(shù)為ris,重要程度為zis,對(duì)抗評(píng)估參數(shù)T1、T2、T3的計(jì)算公式如下:
(21)
(22)
(23)
計(jì)算綜合評(píng)分階段,使用熵權(quán)法將對(duì)抗評(píng)估參數(shù)降維為單一評(píng)估指標(biāo)。設(shè)敵我雙種群共進(jìn)行了v次對(duì)抗推演,則在第q次對(duì)抗推演中,第p項(xiàng)評(píng)估指標(biāo)對(duì)應(yīng)評(píng)估參數(shù)矩陣T中的子集為tpq. 首先對(duì)評(píng)估參數(shù)矩陣T做歸一化處理,得到歸一化矩陣P,其中子集ppq的計(jì)算公式如下:
(24)
然后計(jì)算每次對(duì)抗推演中每項(xiàng)評(píng)估參數(shù)對(duì)應(yīng)的熵值ep為
(25)
式中:當(dāng)ppq=0時(shí),ep=0.
計(jì)算每次對(duì)抗推演中每項(xiàng)評(píng)估參數(shù)對(duì)應(yīng)的權(quán)重tp為
(26)
最后計(jì)算并輸出本次對(duì)抗推演的綜合評(píng)分Mq為
(27)
對(duì)敵我雙方計(jì)算綜合評(píng)分,判斷評(píng)分高的一方為勝利方。
優(yōu)勝劣汰用于構(gòu)造敵我雙方動(dòng)態(tài)博弈環(huán)境,在博弈中勝者留存并繁衍后代,敗者淘汰以釋放資源。優(yōu)勝劣汰算法流程圖如圖6所示。
圖6 優(yōu)勝劣汰算法流程圖Fig.6 Flow chart of fittest algorithm
圖6中,結(jié)束條件設(shè)置為:當(dāng)我方種群中個(gè)體的勝利次數(shù)和敵方種群中個(gè)體的勝利次數(shù)比例超過某一閾值時(shí),可判定結(jié)束。
為了驗(yàn)證智能對(duì)抗進(jìn)化算法在聯(lián)合火力打擊任務(wù)規(guī)劃的優(yōu)越性,采用文獻(xiàn)[7]提供的改進(jìn)遺傳算法作為對(duì)比算法。仿真實(shí)驗(yàn)計(jì)算機(jī)配置如下:聯(lián)想筆記本電腦運(yùn)行MFC程序;Intel酷睿雙核處理器T7300 2.0 GHz;3 GB內(nèi)存;32位Windows7操作系統(tǒng);vc6.0編程環(huán)境。敵我雙方目標(biāo)態(tài)勢(shì)特征屬性如表3所示,各類目標(biāo)的網(wǎng)絡(luò)關(guān)聯(lián)情況示例如表4所示,火力打擊兵器毀傷屬性如表5所示。
表3 敵我雙方目標(biāo)態(tài)勢(shì)表示例
表4 營指揮所的目標(biāo)關(guān)聯(lián)表示例
表5 火力打擊兵器毀傷屬性表示例
表4為以營指揮所為中心的各目標(biāo)類型與其關(guān)聯(lián)情況。
表6為以炮兵陣地為火力打擊力量對(duì)各目標(biāo)類型實(shí)施火力打擊,能夠達(dá)成規(guī)定毀傷程度所需的打擊次數(shù)。運(yùn)用該算法設(shè)計(jì)制作“智能聯(lián)合火力打擊任務(wù)規(guī)劃軟件”以服務(wù)于作戰(zhàn)籌劃實(shí)踐。軟件操作界面如圖7所示。
表6 炮兵陣地的火力毀傷能力表示例
圖7 軟件操作界面Fig.7 Software operation interface
本文實(shí)驗(yàn)參數(shù)求取過程如下:隨機(jī)枚舉500個(gè)敵方火力打擊任務(wù)規(guī)劃,在調(diào)節(jié)我方各參數(shù)適用范圍基礎(chǔ)上計(jì)算個(gè)體的適應(yīng)度值,以500次仿真計(jì)算結(jié)果的平均值作為參數(shù)優(yōu)選參考依據(jù)。所用參數(shù)如表7所示。
為了檢驗(yàn)算法的適應(yīng)度變化情況,以敵我雙方雙種群為基礎(chǔ)實(shí)施自由對(duì)抗,每次對(duì)抗記為1代,并記錄我方個(gè)體對(duì)抗中的適應(yīng)度分值;同時(shí)引入文獻(xiàn)[7]中的改進(jìn)遺傳算法作為對(duì)比實(shí)驗(yàn),以敵方初始種群作為對(duì)抗環(huán)境代入改進(jìn)遺傳算法中計(jì)算各代最優(yōu)個(gè)體的適應(yīng)度分值。經(jīng)過500代迭代進(jìn)化的適應(yīng)度變化情況如圖8所示。
表7 參數(shù)取值范圍表
圖8 各代最優(yōu)個(gè)體適應(yīng)度分值統(tǒng)計(jì)Fig.8 Optimal individual fitness scores for each generation
實(shí)驗(yàn)結(jié)果表明:智能對(duì)抗進(jìn)化算法相比于改進(jìn)遺傳算法的適應(yīng)度結(jié)果,適應(yīng)度分值呈現(xiàn)階段性收斂和陡降狀態(tài),改進(jìn)遺傳算法由于敵方環(huán)境固定不變,適應(yīng)度分值收斂于固定分值,而后的進(jìn)化計(jì)算由于結(jié)果不變而導(dǎo)致進(jìn)化停滯;智能對(duì)抗進(jìn)化算法則處于敵我雙方動(dòng)態(tài)變化過程中,敵方環(huán)境的動(dòng)態(tài)變化導(dǎo)致我方最優(yōu)個(gè)體結(jié)構(gòu)做出動(dòng)態(tài)調(diào)整以應(yīng)對(duì)敵方環(huán)境變化,調(diào)整必然導(dǎo)致適應(yīng)度分值產(chǎn)生陡降,而每次陡降過程中產(chǎn)生的個(gè)體結(jié)構(gòu)有后代個(gè)體繼承并作為DNA傳遞,因此智能對(duì)抗進(jìn)化算法相比于改進(jìn)遺傳算法的環(huán)境適應(yīng)能力更強(qiáng)。
為了驗(yàn)證算法的自我學(xué)習(xí)能力和對(duì)抗優(yōu)越性,取智能對(duì)抗進(jìn)化算法中的敵方各代最優(yōu)個(gè)體作為對(duì)抗環(huán)境,取改進(jìn)遺傳算法經(jīng)過500代進(jìn)化獲得的最優(yōu)個(gè)體作為對(duì)比實(shí)驗(yàn)個(gè)體,通過智能對(duì)抗產(chǎn)生我方最優(yōu)個(gè)體,每次對(duì)抗記為1代,共推演400 000代,分析我方和對(duì)比實(shí)驗(yàn)與敵方最優(yōu)個(gè)體對(duì)抗的勝敗比率,以此判斷智能對(duì)抗進(jìn)化算法是否具備優(yōu)于遺傳算法的自我學(xué)習(xí)進(jìn)化能力。我方勝利次數(shù)統(tǒng)計(jì)如圖9所示。
圖9 各代最優(yōu)個(gè)體勝利次數(shù)統(tǒng)計(jì)Fig.9 Statistics of the victories of best individuals in each generation
實(shí)驗(yàn)結(jié)果表明:隨著對(duì)抗進(jìn)化迭代次數(shù)的增加,敵方最優(yōu)個(gè)體不斷改進(jìn)自身結(jié)構(gòu),改進(jìn)遺傳算法的最優(yōu)個(gè)體初期可獲勝,隨后被敵方最優(yōu)個(gè)體壓制,并在總體進(jìn)化進(jìn)程中無翻盤可能;智能對(duì)抗進(jìn)化算法中的我方最優(yōu)個(gè)體可通過改造自身結(jié)構(gòu)積累獲勝經(jīng)驗(yàn),具備隨時(shí)翻盤的可能。
為了驗(yàn)證智能對(duì)抗進(jìn)化算法獲得最優(yōu)個(gè)體的任務(wù)規(guī)劃能力優(yōu)越性,實(shí)驗(yàn)設(shè)計(jì)從敵方種群中隨機(jī)抽取1 000個(gè)個(gè)體作為對(duì)抗環(huán)境,以改進(jìn)遺傳算法獲得的最優(yōu)個(gè)體作為對(duì)比實(shí)驗(yàn)個(gè)體,使敵我雙方個(gè)體逐一對(duì)抗并記錄勝負(fù),以此判斷智能對(duì)抗進(jìn)化算法在任務(wù)規(guī)劃能力上的優(yōu)越性。最優(yōu)個(gè)體勝利情況統(tǒng)計(jì)如圖10所示。
圖10 最優(yōu)個(gè)體隨機(jī)對(duì)抗勝利次數(shù)統(tǒng)計(jì)Fig.10 Statistics of optimal individual random confrontation wins
實(shí)驗(yàn)結(jié)果表明,智能對(duì)抗進(jìn)化算法獲取的最優(yōu)個(gè)體在勝率上明顯優(yōu)于改進(jìn)遺傳算法,相比于智能對(duì)抗進(jìn)化產(chǎn)生的最優(yōu)個(gè)體,改進(jìn)遺傳算法獲取的最優(yōu)個(gè)體由于嚴(yán)重依賴固定的敵方環(huán)境而產(chǎn)生了過擬合,導(dǎo)致其在敵方環(huán)境變化上的適應(yīng)度分值明顯下降,并促使勝率低于智能對(duì)抗進(jìn)化的最優(yōu)個(gè)體。
為了驗(yàn)證算法對(duì)個(gè)體結(jié)構(gòu)改善情況,實(shí)驗(yàn)抽取對(duì)抗過程中產(chǎn)生的最優(yōu)個(gè)體并統(tǒng)計(jì)其存儲(chǔ)容量,以改進(jìn)遺傳算法的各代最優(yōu)個(gè)體存儲(chǔ)容量作為對(duì)比實(shí)驗(yàn)個(gè)體,結(jié)果如圖11所示。
圖11 最優(yōu)個(gè)體存儲(chǔ)容量統(tǒng)計(jì)Fig.11 Optimal individual storage capacity statistics
實(shí)驗(yàn)結(jié)果表明:隨著進(jìn)化代數(shù)的增加,改進(jìn)遺傳算法獲取的最優(yōu)個(gè)體存儲(chǔ)容量趨近收斂,并在多代進(jìn)化后陷入進(jìn)化停滯,個(gè)體結(jié)構(gòu)不再改變;智能對(duì)抗進(jìn)化獲取的最優(yōu)個(gè)體隨著對(duì)抗進(jìn)化代數(shù)的增加,個(gè)體數(shù)據(jù)結(jié)構(gòu)呈線性增長,伴隨著結(jié)構(gòu)復(fù)雜性的提升,個(gè)體對(duì)敵方動(dòng)態(tài)環(huán)境的適應(yīng)性相應(yīng)增強(qiáng)。
為了檢驗(yàn)算法的計(jì)算效率,取各代最優(yōu)個(gè)體實(shí)施對(duì)抗并統(tǒng)計(jì)時(shí)間消耗,以改進(jìn)遺傳算法的最優(yōu)個(gè)體作為對(duì)比實(shí)驗(yàn)個(gè)體,以隨機(jī)抽取的100個(gè)敵方個(gè)體作為對(duì)抗環(huán)境,取100次對(duì)抗平均時(shí)間作為評(píng)估指標(biāo),結(jié)果如圖12所示。
圖12 最優(yōu)個(gè)體對(duì)抗時(shí)間消耗統(tǒng)計(jì)Fig.12 Optimal individual vs. time consumption
實(shí)驗(yàn)結(jié)果表明,相比于改進(jìn)遺傳算法最優(yōu)個(gè)體,智能對(duì)抗進(jìn)化算法的最優(yōu)個(gè)體由于自身結(jié)構(gòu)復(fù)雜度提升,對(duì)抗時(shí)間消耗也相應(yīng)增大,但考慮到戰(zhàn)場(chǎng)中只使用智能對(duì)抗進(jìn)化的多代最優(yōu)個(gè)體,因此時(shí)間消耗在可承受范圍內(nèi)。
聯(lián)合火力打擊任務(wù)規(guī)劃的最終結(jié)果是生成輔助決心建議,因此將多代進(jìn)化的最優(yōu)個(gè)體和敵方當(dāng)前態(tài)勢(shì)獲取的實(shí)時(shí)個(gè)體進(jìn)行對(duì)抗,并生成對(duì)抗結(jié)果,轉(zhuǎn)化為輔助決心建議格式如下:依據(jù)當(dāng)前敵我態(tài)勢(shì)以及目標(biāo)打擊清單,我火力打擊綜合勝率為XX%,不能完成火力打擊任務(wù),建議補(bǔ)充兵力彈藥或能夠完成火力打擊任務(wù);建議使用X號(hào)個(gè)體作為火力打擊任務(wù)分配算法,其綜合勝率達(dá)XX%;預(yù)計(jì)執(zhí)行完火力打擊任務(wù)時(shí),我火力打擊部隊(duì)兵力剩余XX%,彈藥剩余XX%.
本文基于對(duì)抗進(jìn)化思想,在遺傳算法基礎(chǔ)上構(gòu)造出敵我雙方的對(duì)抗進(jìn)化機(jī)制,通過多代的優(yōu)勝劣汰和遺傳變異,積累應(yīng)對(duì)各種情況的遺傳因子,獲取能夠應(yīng)對(duì)各種情況的最優(yōu)個(gè)體,進(jìn)而實(shí)現(xiàn)聯(lián)合火力打擊任務(wù)規(guī)劃的自我進(jìn)化和迭代,產(chǎn)生了符合作戰(zhàn)實(shí)際需求的任務(wù)規(guī)劃。仿真實(shí)驗(yàn)結(jié)果表明,該算法相比于標(biāo)準(zhǔn)遺傳算法具有更大的靈活性,能夠動(dòng)態(tài)匹配目標(biāo)打擊清單和敵我雙方作戰(zhàn)態(tài)勢(shì),具備解決特定問題的人工智能算法基礎(chǔ)。