田 偉,王志梅,段 威
(1.中國人民解放軍92192部隊,浙江 寧波 315122;2.中國人民解放軍91001部隊,北京 100055)
武器目標分配(Weapon Target Assignment,WTA)問題[1-8]是聯(lián)合作戰(zhàn)火力規(guī)劃過程中亟待解決的重難點問題。為避免打擊不足或重復打擊,聯(lián)合火力打擊按照“偵、控、打、評”四個步驟循環(huán)往復進行,直至達成作戰(zhàn)目的。設定輸出一次火力分配方案為一個時間階段,其基本任務是在K個時段內,分配M個武器打擊N個目標,使得作戰(zhàn)效果最大化。WTA模型通常分為兩種:1)靜態(tài)武器目標分配(Static Weapon Target Assignment,SWTA)模型,即考慮某個時間段的武器目標分配;2)動態(tài)武器目標分配(Dynamic Weapon Target Assignment,DWTA)模型,即考慮離散時間段的武器目標分配。目前大多數(shù)文獻[9-16]都是針對SWTA問題進行建模,模型結構清晰、計算效率較高,但未考慮打擊順序對作戰(zhàn)效能的影響,并且簡單將目標毀傷效果、目標威脅系數(shù)等作為優(yōu)化目標,難以反映目標毀傷對使命任務達成的實際支撐作用。另外,戰(zhàn)爭的不確定性和戰(zhàn)場環(huán)境的復雜性,導致目標在時間和空間上具有不確定性,因此,傳統(tǒng)意義上的SWTA模型已不能滿足實際作戰(zhàn)指揮決策的需求,因此考慮時間因素影響的DWTA模型的研究逐漸成為近年來的研究重點。Hosein等人[8]在研究C3(Command, Control and Communication,C3)節(jié)點防衛(wèi)問題時,提出基于資源的WTA問題的動態(tài)版本,并為動態(tài)問題提供一種啟發(fā)式方法;王士同等人[17]基于SWTA建立了兩階段DWTA問題模型,用動態(tài)規(guī)劃方法解決SWTA問題;王正元博士[18]根據(jù)進攻炮彈摧毀目標的方式建立了4類坦克戰(zhàn)DWTA模型,但并未考慮時間約束;韓松臣教授[19]考慮新目標的隨機出現(xiàn),基于馬爾可夫決策過程建立了防空作戰(zhàn)DWTA模型,并提出策略優(yōu)化與匹配優(yōu)化相結合的求解算法,但對隨機事件的處理還需與實際做進一步結合。
當前,DWTA問題研究主要集中在求解方法上,對于模型的研究還比較有限,主要難點:1)有效反映時間因素對武器目標分配過程的影響;2)量化評價打擊目標毀傷對使命任務達成的支撐效果,即要求量化描述敵物理目標能力喪失與我使命任務達成概率之間的復雜因果影響關系。為此,本文引入時間窗口概念[20]建立DWTA模型的時間約束條件,同時,為克服貝葉斯網(wǎng)絡的條件概率知識獲取和概率推理的瓶頸,合理分析打擊目標毀傷與使命達成效果間因果影響強度的動態(tài)不確定性,在時間影響網(wǎng)絡(Time Influence Nets,TIN)[21]的基礎上,引入時延可變強度、隨機信度序列和隨機時間延遲等參數(shù),構建敵物理目標與我使命任務之間的隨機時間影響網(wǎng)絡(Stochastic Time Influence Network,STIN)模型[22-23],從而建立使命達成目標函數(shù)的數(shù)學模型。
聯(lián)合火力打擊行動是指在明確作戰(zhàn)目的的前提下,運用多軍兵種力量對敵目標系統(tǒng)實施火力打擊的作戰(zhàn)活動,DWTA問題可描述如下:假設我方武器系統(tǒng)由M個武器平臺組成,不同的武器具有不同的彈型、彈量、毀傷能力及射擊條件;初始狀態(tài)下探測到敵方目標系統(tǒng)由N個不同類型的目標組成,并且整個火力打擊過程中,敵方來襲目標隨機出現(xiàn);根據(jù)敵我武器裝備戰(zhàn)技術性能指標,結合演習演練數(shù)據(jù)積累,假設已知不同武器對不同目標的毀傷概率Pij(i=1,2,…,M;j=1,2,…,N);Xij為決策變量,當指派武器平臺i打擊目標j時Xij=1,否則Xij=0。則以輸出一次火力分配方案為一個打擊波次,聯(lián)合火力打擊DWTA過程即是在不確定的K個階段內合理分配“武器目標對”X(k)(k=1,2,…,K),以求使命達成概率最大化,總體火力分配方案可表示為W={X(1),X(2),…,X(K)}。其中,
j=1,2,…,N
(1)
需要說明的是,火力打擊過程中某個時段ks(ks=1,2,…,K)可能出現(xiàn)的新目標,將導致敵方目標系統(tǒng)動態(tài)變化,此時應基于ks時段前已執(zhí)行的火力分配方案{X(1),X(2),…,X(ks)},重新進行后續(xù)階段的武器目標優(yōu)化分配。
聯(lián)合火力打擊DWTA問題是一個典型的多目標約束優(yōu)化問題,它要求在有限時間內盡最快速度、最大可能實現(xiàn)作戰(zhàn)目的,達成使命任務,并最大化保存自身戰(zhàn)斗力。因此,聯(lián)合火力打擊DWTA模型具有三個目標函數(shù):1)使命達成概率最大化f1(W);2)剩余戰(zhàn)斗力最大化f2(W);3)行動時長最小化f3(W)。
其中,剩余戰(zhàn)斗力主要取決于武器平臺剩余彈量及對應彈型,已知不同彈型的毀傷能力,據(jù)此便可實現(xiàn)剩余戰(zhàn)斗力的定量表達;行動時長取決于階段數(shù)K以及各階段時間損耗,各階段耗時主要發(fā)生于“偵、控、評”三個環(huán)節(jié),而本文主要關注“打”的環(huán)節(jié),因此可僅用階段數(shù)K來表示行動時長;使命達成概率與敵各目標能力的喪失息息相關,但由于敵目標能力喪失與我使命達成概率之間的因果影響關系以及目標與目標之間的復雜關聯(lián)關系難以定量描述,從而導致使命達成概率難以解析表達。因此,如何合理表述目標之間以及敵目標能力喪失與我使命任務達成之間的復雜因果影響關系是解決問題的關鍵。
完成頂層使命任務可能需要達成多個作戰(zhàn)效果,并且作戰(zhàn)效果可進一步向下分解形成多個下級作戰(zhàn)子效果,直至直接對應物理目標,并且某目標的毀傷可能直接或間接造成其他目標能力的喪失,從而直接或間接支撐頂層使命任務的達成。由此可知,要想實現(xiàn)使命達成概率的量化表達,必須合理量化描述打擊目標之間、作戰(zhàn)效果之間、打擊目標與作戰(zhàn)效果之間的復雜因果影響關系。而隨機時間影響網(wǎng)絡是描述動態(tài)不確定性環(huán)境下因果影響關系的有效方法,廣泛應用于基于效果作戰(zhàn)(Effects-Based Operations,EBO)領域[24],能夠很好地描述作戰(zhàn)任務直接或間接效果產(chǎn)生和傳播時間的不確定性以及物理目標能力喪失和使命任務達成概率間因果影響強度的動態(tài)不確定性。
因此,本文首先對頂層使命任務進行分解,以頂層使命任務、完成使命任務須達到的作戰(zhàn)效果以及相應的下級子效果為節(jié)點、以使命節(jié)點與效果節(jié)點、效果節(jié)點與效果節(jié)點之間的影響關系為邊,構建使命任務層STIN模型;以打擊目標為節(jié)點,以目標節(jié)點之間的因果影響關系為邊,建立物理目標層STIN模型;最后以效果節(jié)點及其直接對應的目標節(jié)點之間的因果影響關系為邊連接使命任務層STIN模型和物理目標層STIN模型,從而實現(xiàn)使命達成概率的非解析表達。
隨機時間影響網(wǎng)絡數(shù)學模型描述為以下九元組:
STIN=〈Vm,Ve,Vt,E,C,Be,Bt,D,F〉
Vm:表示頂層使命任務節(jié)點構成的有限集合,一般為單節(jié)點集,集合元素類型為枚舉名稱。
Ve:表示效果節(jié)點構成的有限集合,集合元素類型為枚舉名稱。自頂向下分解頂層使命任務可得諸多效果節(jié)點及子效果節(jié)點,直至直接對應火力打擊目標。
Vt:表示打擊目標節(jié)點構成的有限集合,集合元素類型為順序編號。
E:表示節(jié)點之間構成的有向連邊集合,E=NmONe∪NeONt∪NtONt,集合元素類型為枚舉整數(shù),如0、-1和1。其中,NmONe表示使命節(jié)點與效果節(jié)點之間的有向連邊,NmONe?Nm?Ne;NeONt表示效果節(jié)點與打擊目標節(jié)點之間的有向連邊,NeONt?Ne?Nt;NtONt表示打擊目標節(jié)點相互之間的有向連邊,NtONt?Nt?Nt,?表示笛卡爾積。
C:表示使命節(jié)點和效果節(jié)點、效果節(jié)點和打擊目標節(jié)點以及打擊目標節(jié)點相互之間的時延可變強度集合。對于?e∈E,?Se∈C滿足映射fc:e|→Se,其中Se=fSe(Ωe)表示有向邊e相關的時延可變強度集合,Ωe表示有向邊e所對應的時間延遲集合。
Be:表示效果節(jié)點基準概率構成的有限集合,即效果節(jié)點達成的初始概率,取值范圍為[0,1]。
Bt:表示目標節(jié)點的基準概率集合,基準概率是指在沒有任何影響關系的條件下,目標節(jié)點能力喪失的概率,取值范圍為[0,1]。
D:表示節(jié)點之間的影響效果信息產(chǎn)生或傳遞的隨機時間延遲集合,對于?e∈E,?ξ∈D滿足fd:e|→ξ,其中,ξ~Pde(Ωe),集合Ωe是由非負整數(shù)組成的有限集合,表示隨機時間延遲ξ的取值空間,Pde(Ωe)表示定義在集合Ωe上的離散概率分布。
F:表示物理目標層STIN中目標毀傷概率函數(shù)構成的集合,其中第j個目標對應的毀傷概率函數(shù)為:y=fj(Z),其中,Z=(z1,z2,…,zm)為打擊該目標我方武器數(shù)目向量,即該目標的火力分配方案,輸出為第j個目標的毀傷概率,取值范圍為[0,1]。
此外,三個目標函數(shù)之間具有不可公度性和不相容性,本文采用效用函數(shù)法統(tǒng)一其量綱和數(shù)量級,分別構建效用函數(shù)g1(W)、g2(W)和g3(W),并且通過加權求和的方法引入決策者的主觀偏好意愿,從而解決多目標優(yōu)化問題。綜上,DWTA問題的目標函數(shù)描述為
maxg(W)=α1g1(W)+α2g2(W)-α3g3(W)
(2)
其中,α1+α2+α3=1。
聯(lián)合火力打擊行動的實施時刻受到各種各樣的約束限制,既有時間上的,也有空間上的;既有對敵的,也有對我的;既有主觀的;也有客觀的。從主客觀角度分析,可建立如下約束條件。
1.3.1 主觀約束
1)主觀時間約束
為控制作戰(zhàn)進程,可由指揮員定下其可接受的最長行動時長,即Kmax,則有
K<=Kmax
(3)
2)使命達成概率約束
為體現(xiàn)指揮員作戰(zhàn)決心,可由指揮員指定最低使命達成概率Dmin,則有
g1(W)≥Dmin
(4)
3)主觀策略約束
其是指指揮員針對我火力資源分配提出的戰(zhàn)法策略要求,是指揮員戰(zhàn)爭藝術的體現(xiàn),主要有:
①為避嫌重復打擊,限制目標j可被分配的最大武器單元數(shù)量為sj,則在整個作戰(zhàn)過程中,目標j需滿足條件:
(5)
②當k≤tCij (6) ③要求一個武器平臺在同一階段只能打擊一個目標,武器平臺i需滿足條件: (7) 1.3.2 客觀約束 1)客觀空間約束 主要指敵我空間位置條件對我火力分配過程的約束限制。設Pij(k)表示第k階段目標j相對于武器平臺i的航路捷徑,Pimax表示武器平臺i能夠打擊目標的最大航路捷徑;Vj(k)表示第k階段目標j的速度,Vimax表示武器平臺i能夠打擊目標的最大速度;θij(k)表示第k階段目標j相對于武器平臺i的航向角,θimax表示武器平臺i能夠打擊目標的最大航向角;Hj(k)表示第k階段目標j的高度,Himin,Himax分別表示武器平臺i能夠打擊目標的最小、最大高度。目標j若滿足條件: (Pij(k)≤Pimax)∧(Vj(k)≤Vimax)∧(θij(k)≤θimax)∧(Himin≤Hj(k)≤Himax) (8) 則可確定在第k(k=1,2,…,K)階段,目標j在武器平臺i的作戰(zhàn)空域內。 2)客觀時間約束 主要指戰(zhàn)場態(tài)勢的迅速演變對我火力分配過程提出的快速反應要求。在滿足目標空間約束的前提下,引入時間窗概念,設tDij、tCij分別表示目標j到達武器平臺i作戰(zhàn)空域遠界、近界的時間,如果目標j未進入武器平臺i的作戰(zhàn)空域,tDij=tCij=0;在第k個時間階段,目標j若滿足條件tDij≤k≤tCij,則武器平臺i對目標j具備打擊條件,否則Xij(k)=0,tEij=tCij-tDij稱為武器平臺i打擊目標j的時間窗口。 3)客觀資源約束 設武器平臺i的武器單元數(shù)量為bi,則在整個作戰(zhàn)過程中,武器平臺i需滿足條件: (9) 此外,目標函數(shù)實質上也對我火力分配過程提出一定要求,如使命達成概率最大化原則對我火力分配過程提出了對敵毀傷的相關要求,使命任務達成的根本驅動力即是對敵目標的物理毀傷;剩余戰(zhàn)斗力最大化則要求火力分配分案在滿足最低目標毀傷要求的前提下,優(yōu)先考慮彈藥充足且毀傷能力相對較弱的武器平臺,盡可能保存戰(zhàn)斗力;行動時長最小化目標函數(shù)則對我火力分配全過程提出主觀上的時間約束要求。 聯(lián)合作戰(zhàn)籌劃階段,深入分析作戰(zhàn)目的,充分利用敵、我情靜態(tài)數(shù)據(jù),根據(jù)戰(zhàn)場態(tài)勢實時構建動態(tài)隨機時間影響網(wǎng)絡模型,據(jù)此評估目標價值,生成打擊目標清單,結合既往演習演練數(shù)據(jù)積累,合理劃分作戰(zhàn)階段,從而建立如上聯(lián)合火力打擊DWTA模型,并求解得到最優(yōu)武器目標分配方案:W′={X′(1),X′(2),…,X′(K)}?;诖朔桨福瑢衬繕讼到y(tǒng)迅速實施聯(lián)合火力打擊。若在火力打擊第ks(ks=1,2,…,K)階段發(fā)現(xiàn)目標,則快速分析其與現(xiàn)有目標及使命任務的關聯(lián)關系,將其納入現(xiàn)有隨機時間影響網(wǎng)絡,并對后續(xù)第ks+1~K階段進行武器目標再分配。 設新目標系統(tǒng)的數(shù)量為N′,則第ks+1~K階段DWTA問題的數(shù)學模型如式(10)所示。 (10) 其中,W′={X′(1),X′(2),…,X′(ks),X″(ks+1),X″(ks+2),…,X″(K)}表示整個火力打擊過程各個階段的武器目標分配方案;j1表示原目標系統(tǒng)中的目標;j2表示新出現(xiàn)的目標;式(10)第一行表示打擊目標j的客觀空間約束條件;式(10)第2行表示武器平臺i在整個作戰(zhàn)過程中的武器單元數(shù)量約束;式(10)第3行表示武器平臺i在一個階段只能對一個目標進行打擊;式(10)第4行和式(10)第5行分別表示原目標系統(tǒng)中的目標和新出現(xiàn)的目標在整個作戰(zhàn)過程中可分配的武器單元數(shù)量約束;式(10)第6行和式(10)第7行表示在目標j突破武器平臺i的火力發(fā)射區(qū)近界或逃離其火力發(fā)射區(qū)遠界前,必須至少分配一個武器對其進行打擊;式(10)第8行表示武器平臺i打擊目標j需具備的時間條件;式(10)第9行表示聯(lián)合火力打擊行動最大時長約束;式(10)第10行表示指揮員定下的最低使命任務達成概率,體現(xiàn)了指揮員的作戰(zhàn)決心。 為驗證聯(lián)合火力打擊DWTA模型的可行性和有效性,本文以遠程精確對海打擊行動為例,進行仿真對比實驗。 想定如下,藍軍與紅軍發(fā)生沖突,紅軍需在兩小時內對藍軍信息指揮鏈路進行遠程精確打擊,在兩小時內,最多組織4個打擊波次完成聯(lián)合火力打擊行動,且要求毀癱藍軍通信體系至少70%以上,任務完成概率最少在60%以上。紅方具有5個火力單元Wi(i=1,2,…,5),分別配備不同的彈型,火力資源編組如表1所示,目前探測到藍軍目標21個,假設目標的航路捷徑、航向角、速度保持不變,基準概率均為0.1。 表1 紅方火力資源編組 作戰(zhàn)籌劃階段,紅軍首先確定目標毀傷概率函數(shù)y=fj(Z)(j=1,2,…,21),計算各目標到達各武器平臺發(fā)射區(qū)近界、遠界的時間,分析目標間的相互影響關系,確定物理目標層STIN的網(wǎng)絡結構,并確定各連邊隨機時間延遲和時延可變強度等參數(shù),構建物理目標層STIN;同步分解使命任務節(jié)點Mis得到效果節(jié)點E1、E2和E3,并給出與其相對應的物理目標節(jié)點,假設使命節(jié)點和效果節(jié)點的初始基準概率均為0;而后由專家指定使命節(jié)點與效果節(jié)點、效果節(jié)點與效果節(jié)點以及效果節(jié)點與其對應的目標節(jié)點之間的隨機時間延遲和時延可變影響強度,構建使命任務層STIN,并通過融合物理目標層STIN和使命任務層STIN,得到物理目標能力喪失和使命任務達成概率之間的STIN模型;最后圍繞達成作戰(zhàn)目的,依據(jù)上述構建的STIN模型精心選出7個打擊目標,待打擊目標Tj(j=1,2,…,7)與頂層使命任務Mis之間的遠程精確對海打擊STIN如圖1所示,連邊屬性如表2所示。 對于任一火力分配方案X(k)(1≤k≤4),使命達成效果均隨時間動態(tài)變化,根據(jù)網(wǎng)絡結構規(guī)模,本文選取使命節(jié)點第15個時間階段的隨機信度序列,作為火力分配方案的使命達成效果值,即使命任務達成概率。根據(jù)上述分析,引入指揮員主觀決策意愿,取α1=0.8,α2=0.1,α3=0.1,依據(jù)式(10)構建遠程精確對海打擊DWTA模型,采用文獻[23,25]中的概率傳播算法,用軟件進行求解,得最優(yōu)火力分配方案如表3所示,使命節(jié)點隨機信度序列如表4所示。 圖1 遠程精確對海打擊隨機時間影響網(wǎng)絡 表4 使命節(jié)點隨機信度序列 為檢驗模型的有效性,分別取加權系數(shù)為α1=0.4,α2=0.6,α3=0、α1=0.4,α2=0,α3=0.6和α1=0.6,α2=0.2,α3=0.2進行仿真對比實驗,實驗結果分別如表5、表6和表7所示。 表5 最優(yōu)火力分配方案(α1=0.4,α2=0.6,α3=0) 表6 最優(yōu)火力分配方案(α1=0.4,α2=0,α3=0.6) 表7 最優(yōu)火力分配方案(α1=0.6,α2=0.2,α3=0.2) 對比表3、表5和表6,使命達成概率效用函數(shù)值可知,過度關注追求剩余戰(zhàn)斗力最大化和行動時長最小化,可能導致出現(xiàn)對敵打擊不充分的情況;對比表3和表7可知,兩者使命達成概率效用函數(shù)值相差并不大,說明過度追求使命達成概率最大化有可能出現(xiàn)飽和打擊或過度打擊的情況;由此說明,該模型確能有效反映三個目標函數(shù)對指揮決策過程的影響。 為進一步檢驗模型的有效性,作戰(zhàn)實施階段,取α1=0.6,α2=0.2,α3=0.2對應的最優(yōu)火力分配方案對敵目標系統(tǒng)實施聯(lián)合火力打擊,打擊過程中敵目標隨機出現(xiàn),一旦出現(xiàn)新目標,立即分析其與現(xiàn)有目標節(jié)點、效果節(jié)點以及頂層使命任務節(jié)點之間的關聯(lián)關系,快速重構聯(lián)合火力打擊STIN模型,并依據(jù)式(10)重建聯(lián)合火力打擊DWTA模型,為下一階段DWTA過程做好準備。假設火力打擊第2階段發(fā)現(xiàn)新目標T8,其對目標節(jié)點T3和效果節(jié)點E1分別起促進作用,并且節(jié)點間影響強度如表8所示,求解得到第3階段最優(yōu)武器目標分配方案如表9所示,使命節(jié)點隨機信度序列如表10所示。 表8 T8與T3、E1之間的影響強度 表9 最優(yōu)火力分配方案(α1=0.6,α2=0.2,α3=0.2) 表10 使命節(jié)點隨機信度序列 由表7和表9可知,在發(fā)現(xiàn)高價值目標T8后,DWTA模型迅速調整下一階段打擊計劃,在補充打擊上階段價值相對較高目標的前提下,集中優(yōu)勢火力重點打擊新目標,取得了更好的打擊效果,使命達成概率效用函數(shù)值提升11.2%。實驗結果表明聯(lián)合火力打擊DWTA模型能夠有效處理新目標的隨機出現(xiàn),再一次驗證了模型的可行性和有效性。 本文以聯(lián)合火力打擊動態(tài)武器目標分配問題為應用背景,針對現(xiàn)有DWTA模型在描述時間因素對WTA過程的影響,以及量化評價目標毀傷對使命任務的支撐效果這兩個方面存在的不足,引入時間窗概念,基于隨機時間影響網(wǎng)絡的理論和方法,實現(xiàn)了聯(lián)合火力打擊DWTA問題使命達成目標函數(shù)的非解析表達。綜合考慮使命達成概率最大化、剩余戰(zhàn)斗力最大化、行動時長最小化原則,從主觀和客觀、時間和空間、對敵和對我等多個角度全面深入分析DWTA問題約束條件,構建了聯(lián)合火力打擊DWTA問題的約束滿足問題模型,并結合遠程精確對海打擊作戰(zhàn)案例,通過仿真對比實驗檢驗了方法的可行性和有效性。1.4 數(shù)學模型構建
3 仿真及驗證
4 結束語