陳啟宏,趙青松,*,邱 薇,陳 甲
(1.國(guó)防科技大學(xué)系統(tǒng)工程學(xué)院,湖南 長(zhǎng)沙 410073;2.中國(guó)人民解放軍96901部隊(duì),北京 100094;3.廣東省軍區(qū)綜合訓(xùn)練隊(duì),廣東 廣州 510501)
武器裝備體系是在一定的戰(zhàn)略指導(dǎo)、作戰(zhàn)指揮和保障條件下,為完成一定作戰(zhàn)使命,而由功能上相互聯(lián)系、相互作用的各種武器裝備系統(tǒng)組成的更高層次的系統(tǒng)。武器裝備體系發(fā)展規(guī)劃,是決策者基于作戰(zhàn)背景、目標(biāo)需求、資源約束等條件,增強(qiáng)武器裝備系統(tǒng)之間的協(xié)同作戰(zhàn)能力,尋找武器裝備發(fā)展的最優(yōu)方案,實(shí)現(xiàn)武器裝備體系整體作戰(zhàn)效益最大化的決策過(guò)程。因此,武器裝備體系發(fā)展規(guī)劃將直接影響武器裝備體系結(jié)構(gòu)以及體系之間的影響關(guān)系,是適應(yīng)未來(lái)一體化聯(lián)合作戰(zhàn)趨勢(shì)、提升體系總體作戰(zhàn)能力需要解決的重要問(wèn)題。
目前武器裝備發(fā)展規(guī)劃研究已經(jīng)取得了許多顯著性成果。文獻(xiàn)[6]從不確定信息的角度出發(fā),同時(shí)考慮不同決策者的目的、決策偏好,提出了基于目標(biāo)規(guī)劃的武器裝備發(fā)展方案選擇模型,采用層次分析(analytic hierarchy process,A HP)法對(duì)主要分析成分設(shè)置權(quán)重比例,對(duì)模型進(jìn)行求解。文獻(xiàn)[7]提出了一種武器裝備發(fā)展方案的評(píng)價(jià)模型:通過(guò)三角模糊函數(shù)將定性指標(biāo)和語(yǔ)義信息等進(jìn)行規(guī)范化處理,利用AHP對(duì)武器裝備發(fā)展方案的層次結(jié)構(gòu)進(jìn)行了分析并確定了相應(yīng)的權(quán)重,利用逼近理想解排序法(technique for order preference by similarity to an ideal solution,TOPSIS)原理對(duì)武器裝備發(fā)展方案進(jìn)行排序。文獻(xiàn)[8]基于能力滿(mǎn)足度,利用非線(xiàn)性?xún)?yōu)化算法對(duì)網(wǎng)絡(luò)信息武器裝備體系進(jìn)行優(yōu)化,得到比較滿(mǎn)意的優(yōu)化路線(xiàn)。
大部分武器裝備體系發(fā)展規(guī)劃研究只考慮了裝備之間的協(xié)同關(guān)系,只研究自身武器裝備體系發(fā)展規(guī)劃而忽略了對(duì)戰(zhàn)雙方武器裝備體系發(fā)展規(guī)劃過(guò)程中的博弈對(duì)抗特征以及對(duì)戰(zhàn)雙方裝備之間的威脅關(guān)系。
目前,基于博弈的武器裝備體系發(fā)展規(guī)劃的研究主要集中于武器裝備體系的構(gòu)建和演化研究,包括對(duì)武器裝備體系的對(duì)抗博弈進(jìn)行作戰(zhàn)網(wǎng)絡(luò)結(jié)構(gòu)建模分析和仿真優(yōu)化。文獻(xiàn)[16]和文獻(xiàn)[17]對(duì)武器裝備體系的動(dòng)態(tài)博弈過(guò)程進(jìn)行建模和仿真分析,將演化仿真與博弈論結(jié)合,提出了武器裝備體系結(jié)構(gòu)演化博弈方法及分析框架。文獻(xiàn)[18]考慮了對(duì)戰(zhàn)雙方不斷研制新裝備與反制裝備的對(duì)抗過(guò)程,構(gòu)建了軍事資源最優(yōu)化分配模型。此外,還有一些針對(duì)具體場(chǎng)景的研究應(yīng)用,解決武器裝備采購(gòu)、軍事運(yùn)輸、軍事競(jìng)爭(zhēng)等實(shí)際問(wèn)題。
但是,上述研究也存在以下不足:①裝備之間的協(xié)同配合考慮不足;②大部分研究集中于發(fā)展武器裝備種類(lèi)的宏觀(guān)層面,只關(guān)注發(fā)展哪些武器裝備,很少關(guān)注什么時(shí)候發(fā)展、發(fā)展周期、采購(gòu)數(shù)量和時(shí)間等具體實(shí)施層面;③往往只考慮己方的武器裝備發(fā)展,卻忽略實(shí)際裝備發(fā)展博弈對(duì)抗中對(duì)方裝備的發(fā)展情況。
因此,本文考慮武器裝備發(fā)展規(guī)劃的體系對(duì)抗特點(diǎn),基于博弈論的方法來(lái)建立武器裝備體系發(fā)展規(guī)劃動(dòng)態(tài)博弈框架,構(gòu)建了博弈方各階段策略集合已給出,策略選擇信息不完全(概率表示)的不完全信息武器裝備發(fā)展規(guī)劃動(dòng)態(tài)博弈模型,研究分析博弈方不同策略下演化形成的博弈脈絡(luò),評(píng)估博弈方策略在不同博弈場(chǎng)景下的威脅能力以及博弈方全局博弈過(guò)程總體威脅能力。
武器裝備體系是由具備偵察、信息處理、決策、火力打擊等功能的裝備單元連接形成的復(fù)雜系統(tǒng)?;贠ODA(observe-orient-decide-act)作戰(zhàn)理論提出的作戰(zhàn)環(huán)是將武器裝備體系作戰(zhàn)過(guò)程視為一個(gè)循環(huán)過(guò)程,形成作戰(zhàn)環(huán),具體可分為標(biāo)準(zhǔn)作戰(zhàn)環(huán)和廣義作戰(zhàn)環(huán),如圖1所示。標(biāo)準(zhǔn)作戰(zhàn)環(huán)中裝備實(shí)體數(shù)量為4個(gè),每個(gè)功能類(lèi)只包含一個(gè)裝備實(shí)體。廣義作戰(zhàn)環(huán)中,裝備實(shí)體數(shù)量超過(guò)4個(gè),相同功能類(lèi)的裝備實(shí)體之間存在指揮控制、協(xié)同替換、信息傳遞等關(guān)系,裝備實(shí)體的關(guān)聯(lián)作用關(guān)系愈加復(fù)雜。
圖1 標(biāo)準(zhǔn)作戰(zhàn)環(huán)與廣義作戰(zhàn)環(huán)示意圖Fig.1 Schematic diagram of standard operation loop and generalized operation loop
基于OODA作戰(zhàn)理論分析,本文將武器裝備功能分為3類(lèi):偵察功能、指控功能、打擊功能。將武器裝備實(shí)體抽象為4類(lèi)功能節(jié)點(diǎn):偵察節(jié)點(diǎn)、指控節(jié)點(diǎn)、打擊節(jié)點(diǎn)、目標(biāo)節(jié)點(diǎn),如表1所示。其中,紅藍(lán)雙方的功能節(jié)點(diǎn)互為對(duì)方目標(biāo)節(jié)點(diǎn)。一個(gè)武器裝備實(shí)體在任務(wù)過(guò)程中可以承擔(dān)多個(gè)功能類(lèi)型,抽象為武器裝備體系網(wǎng)絡(luò)中多個(gè)不同類(lèi)型的功能節(jié)點(diǎn),構(gòu)建形成不同的標(biāo)準(zhǔn)節(jié)點(diǎn)作戰(zhàn)環(huán)和廣義節(jié)點(diǎn)作戰(zhàn)環(huán)。
表1 武器裝備功能節(jié)點(diǎn)分類(lèi)Table 1 Classification of weapon equipment function nodes
考慮紅藍(lán)雙方在對(duì)抗條件下的邊關(guān)系建模,武器裝備體系中裝備之間的關(guān)系可抽象為功能邊,裝備功能節(jié)點(diǎn)之間的作用關(guān)系可分為4種,如表2所示。在武器裝備體系發(fā)展規(guī)劃中,各個(gè)功能節(jié)點(diǎn)通過(guò)功能邊關(guān)聯(lián)聯(lián)系,構(gòu)建形成不同的作戰(zhàn)環(huán),交織形成武器裝備體系復(fù)雜網(wǎng)絡(luò)。
表2 裝備作用關(guān)系與網(wǎng)絡(luò)功能邊的對(duì)應(yīng)關(guān)系Table 2 Correspondence between equipment action relationships and network function edges
根據(jù)武器裝備體系網(wǎng)絡(luò)功能邊關(guān)系,構(gòu)建武器裝備體系對(duì)抗網(wǎng)絡(luò)示意圖,如圖2所示。
圖2 裝備體系對(duì)抗網(wǎng)絡(luò)示意圖Fig.2 Equipment system confrontation network diagram
武器裝備體系規(guī)劃是一個(gè)博弈方遵循異步序貫?zāi)J剑嚯A段推進(jìn)的動(dòng)態(tài)博弈過(guò)程。各博弈方的行動(dòng)有先后順序,后行博弈方可以獲取先行博弈方策略、決策等有關(guān)信息后再進(jìn)行策略的選擇,從而進(jìn)一步影響下一階段的博弈過(guò)程。且在武器裝備體系發(fā)展規(guī)劃過(guò)程中,博弈方往往無(wú)法獲取敵方發(fā)展規(guī)劃的完全信息,因此武器裝備體系規(guī)劃屬于不完全信息的動(dòng)態(tài)博弈過(guò)程。
簡(jiǎn)化起見(jiàn),對(duì)武器裝備體系發(fā)展規(guī)劃過(guò)程做出如下假設(shè):
(1)由于多方博弈比較復(fù)雜,設(shè)置武器裝備體系發(fā)展規(guī)劃的博弈方為紅藍(lán)雙方。
(2)各階段博弈方策略集已經(jīng)給出。不完全信息表現(xiàn)為策略選擇的不確定,不確定一方采取特定策略條件下另一方會(huì)采取某種具體策略,采用貝葉斯概率來(lái)描述另一方選擇策略的可能性大小。
(3)武器裝備體系發(fā)展規(guī)劃中,只考慮武器裝備的研制費(fèi)用、研制周期和購(gòu)置費(fèi)用。武器裝備采購(gòu)列裝后,不考慮退役情況,且裝備的維護(hù)成本忽略不計(jì)。
博弈論著重于分析博弈方策略選擇之間的相互影響關(guān)系,突出博弈方之間合作和對(duì)抗的對(duì)立統(tǒng)一關(guān)系。博弈的基本要素有:局中人、策略集、贏得函數(shù)。
(1)局中人:本文中局中人為紅藍(lán)雙方?jīng)Q策者。={,},其中代表紅方,代表藍(lán)方。
(2)策略集:各類(lèi)武器裝備發(fā)展方案,={(W ,t,N ,),(W ,N )}。
其中,武器裝備發(fā)展方案的決策對(duì)象分為待研制裝備和已列裝裝備,決策變量如表3所示。
表3 發(fā)展規(guī)劃方案決策變量Table 3 Development planning scheme decision variables
利用龔帕茲(生長(zhǎng))曲線(xiàn)描述待研制裝備研制強(qiáng)度、研制費(fèi)用和研制周期之間的關(guān)系。研制周期和研制費(fèi)用的表達(dá)式為=(-)·A +(ln>0,>1),變化趨勢(shì)如圖3所示。
圖3 研制強(qiáng)度、研制周期、研制費(fèi)用之間的關(guān)系Fig.3 Relationship among strength,cycle and funds
其中,研制強(qiáng)度={0,1,2,3},=0時(shí),代表不研制該武器裝備;=1時(shí),隨著研制費(fèi)用投入增大,研制周期開(kāi)始縮短,但費(fèi)用不足仍是周期研制的主要限制約束,縮短幅度較??;=2時(shí),投入的研制費(fèi)用較為充足,隨著研制費(fèi)用投入增大,研制周期的縮短幅度較大;=3時(shí),人才、技術(shù)成熟程度、資源等成為研制周期的主要限制約束,研制周期縮短幅度較小,當(dāng)下降至最短研制周期后保持不變。
(3)贏得函數(shù):在武器裝備體系發(fā)展規(guī)劃的過(guò)程中,紅藍(lán)雙方不斷進(jìn)行博弈對(duì)抗,基于掌握的博弈信息,調(diào)整各階段的策略方案,反制降低對(duì)方的體系威脅能力。因此,紅藍(lán)雙方的贏得函數(shù)為:在一方進(jìn)行反制的動(dòng)態(tài)博弈條件下,另一方發(fā)展規(guī)劃方案在不同博弈場(chǎng)景對(duì)其造成的體系威脅能力均值。
在武器裝備體系規(guī)劃的動(dòng)態(tài)博弈中,博弈方并非絕對(duì)理性,會(huì)根據(jù)自身利益的改變不斷調(diào)整自身方案。假設(shè)紅方作為博弈先行方,每個(gè)階段中,紅方先做出決策時(shí),藍(lán)方根據(jù)紅方的策略,對(duì)己方武器裝備發(fā)展方案的偏好發(fā)生改變,趨向于選擇改善自身利益的策略。上一階段博弈雙方的方案決策又會(huì)對(duì)下一階段博弈方的方案決策產(chǎn)生影響,從而形成一個(gè)博弈方之間“你來(lái)我往”的反復(fù)博弈過(guò)程。
在博弈過(guò)程中,博弈方選擇不同的武器裝備發(fā)展規(guī)劃方案映射在武器裝備體系網(wǎng)絡(luò)中加入不同的武器功能節(jié)點(diǎn)。為了抵抗或削弱對(duì)方武器裝備對(duì)己方帶來(lái)的威脅,博弈雙方會(huì)選擇相應(yīng)的武器發(fā)展方案加入新的裝備功能節(jié)點(diǎn)對(duì)對(duì)方的功能節(jié)點(diǎn)(目標(biāo)節(jié)點(diǎn))進(jìn)行反制打擊,使得武器裝備體系對(duì)抗網(wǎng)絡(luò)變得越來(lái)越復(fù)雜化,如圖4所示。
圖4 動(dòng)態(tài)博弈過(guò)程Fig.4 Dynamic game process
以圖4的第2階段為例,簡(jiǎn)述武器裝備發(fā)展規(guī)劃的動(dòng)態(tài)博弈過(guò)程:在第1階段紅藍(lán)雙方方案選擇前提。在第2階段中,紅方首先研制新的武器裝備,新增功能節(jié)點(diǎn)I對(duì)藍(lán)方的功能節(jié)點(diǎn)S 和D 進(jìn)行打擊。藍(lán)方作為后行方選擇新增功能節(jié)點(diǎn)I 對(duì)紅方的功能節(jié)點(diǎn)I 和S進(jìn)行打擊,同時(shí)S被藍(lán)方的裝備節(jié)點(diǎn)回路覆蓋,代表節(jié)點(diǎn)被反制,對(duì)藍(lán)方的威脅能力降低。在第3階段中,紅方將在第2階段紅藍(lán)雙方的方案基礎(chǔ)上,進(jìn)一步考慮自身的方案決策。
設(shè)定威脅能力系數(shù)u 描述一個(gè)功能節(jié)點(diǎn)被對(duì)方裝備不同數(shù)量節(jié)點(diǎn)作戰(zhàn)環(huán)反制打擊的效果,如圖5所示。
圖5 威脅能力系數(shù)Fig.5 Threat capacity coefficient
武器裝備功能節(jié)點(diǎn)威脅能力系數(shù)u與對(duì)方裝備節(jié)點(diǎn)作戰(zhàn)環(huán)的覆蓋數(shù)量(∈N)的關(guān)系為
明確博弈雙方各階段的武器裝備發(fā)展方案,用采取方案概率的大小描述博弈方根據(jù)對(duì)方的策略選擇,趨于改善自身效益的己方方案偏好程度。各個(gè)階段博弈方輪流決策構(gòu)成了武器裝備體系規(guī)劃的不同博弈場(chǎng)景。
博弈子場(chǎng)景:每個(gè)階段紅藍(lán)雙方選取不同博弈策略構(gòu)成不同的博弈子場(chǎng)景。
博弈全時(shí)域場(chǎng)景:將博弈子場(chǎng)景按照時(shí)間維聯(lián)結(jié)構(gòu)成博弈全時(shí)域場(chǎng)景,即武器裝備體系演化的一種具體路徑。
博弈全局場(chǎng)景:通過(guò)資源約束,得到所有的可行全時(shí)域場(chǎng)景集合,構(gòu)成博弈全局場(chǎng)景,即動(dòng)態(tài)博弈樹(shù),如圖6所示。
圖6 動(dòng)態(tài)博弈樹(shù)(博弈全局場(chǎng)景)Fig.6 Dynamic game tree(game full situation scene)
通過(guò)體系網(wǎng)絡(luò)功能指標(biāo)的規(guī)范化和資源約束,明確武器裝備體系發(fā)展動(dòng)態(tài)博弈樹(shù)的可行演化路徑(即可行的武器裝備發(fā)展方案)。通過(guò)計(jì)算各個(gè)武器裝備發(fā)展方案對(duì)應(yīng)的紅藍(lán)雙方武器裝備體系網(wǎng)絡(luò)中包含的標(biāo)準(zhǔn)作戰(zhàn)環(huán)和廣義作戰(zhàn)環(huán)威脅能力之和,評(píng)估武器裝備發(fā)展方案對(duì)敵方體系的威脅能力。
(1)明確資源約束,規(guī)劃可行域。
資源約束主要包括費(fèi)用約束和時(shí)間約束。費(fèi)用約束主要考慮兩個(gè)方面:各個(gè)階段投入的費(fèi)用不能超過(guò)各個(gè)階段的費(fèi)用約束;各個(gè)階段投入的費(fèi)用總和不能超過(guò)總費(fèi)用約束。
時(shí)間約束主要考慮整個(gè)博弈過(guò)程的總時(shí)間約束。所有裝備的采購(gòu)和研制過(guò)程都應(yīng)該在給定的規(guī)劃期內(nèi)進(jìn)行。
(2)構(gòu)建博弈子場(chǎng)景,計(jì)算各階段子贏得函數(shù)。
在每個(gè)階段,紅藍(lán)雙方的博弈不同策略可以組成不同的博弈子場(chǎng)景。在博弈子情景下,計(jì)算武器裝備體系網(wǎng)絡(luò)下不同樣式作戰(zhàn)環(huán)的威脅能力。
計(jì)算標(biāo)準(zhǔn)作戰(zhàn)環(huán)威脅能力:作戰(zhàn)環(huán)的威脅能力主要取決于偵察、指控和打擊3類(lèi)節(jié)點(diǎn)的功能評(píng)價(jià)值。由于標(biāo)準(zhǔn)作戰(zhàn)環(huán)只包含4個(gè)節(jié)點(diǎn),標(biāo)準(zhǔn)作戰(zhàn)環(huán)的偵察、指控、打擊能力對(duì)應(yīng)偵察、指控、打擊節(jié)點(diǎn)的功能評(píng)價(jià)值。設(shè)定偵察節(jié)點(diǎn)、指控節(jié)點(diǎn)和打擊節(jié)點(diǎn)的功能評(píng)價(jià)值為d ,d ,d 。采用乘積形式計(jì)算標(biāo)準(zhǔn)作戰(zhàn)環(huán)的威脅能力,同時(shí)考慮對(duì)方作戰(zhàn)環(huán)覆蓋數(shù)對(duì)已方功能節(jié)點(diǎn)的影響,設(shè)定標(biāo)準(zhǔn)作戰(zhàn)環(huán)威脅能力的計(jì)算公式為
式中:u ,u,u 分別代表標(biāo)準(zhǔn)作戰(zhàn)環(huán)偵察、指控、打擊3類(lèi)節(jié)點(diǎn)的威脅能力系數(shù)。
計(jì)算廣義作戰(zhàn)環(huán)威脅能力:由于廣義作戰(zhàn)環(huán)中同功能類(lèi)(偵察、指控、打擊)下的節(jié)點(diǎn)數(shù)量不唯一,對(duì)廣義作戰(zhàn)環(huán)的偵察、指控、打擊能力產(chǎn)生影響。因此,在計(jì)算廣義作戰(zhàn)環(huán)威脅能力前,需要計(jì)算廣義作戰(zhàn)環(huán)的偵察能力d 、指控能力d 和打擊能力d 。假設(shè)一個(gè)廣義作戰(zhàn)環(huán)中包含個(gè)信息傳遞關(guān)系的偵察節(jié)點(diǎn),偵察節(jié)點(diǎn)之間存在信息傳遞和協(xié)同控制關(guān)系,則廣義作戰(zhàn)環(huán)的偵察能力d 計(jì)算公式為
結(jié)合計(jì)算得到的偵察、指控、打擊能力,采用乘積形式計(jì)算廣義作戰(zhàn)環(huán)的威脅能力為
計(jì)算各階段的子贏得函數(shù)(以計(jì)算紅方對(duì)藍(lán)方的體系威脅為例):設(shè)第個(gè)階段紅藍(lán)雙方中紅方對(duì)藍(lán)方的標(biāo)準(zhǔn)作戰(zhàn)環(huán)數(shù)量為,廣義作戰(zhàn)環(huán)數(shù)量為,則紅方第個(gè)階段對(duì)藍(lán)方的威脅能力值D
→為
(3)構(gòu)建全時(shí)域場(chǎng)景,計(jì)算全時(shí)域贏得函數(shù)。
將博弈子場(chǎng)景按照時(shí)間維聯(lián)結(jié)起來(lái)構(gòu)成全時(shí)域情景,得到各全時(shí)域情景下的贏得函數(shù)為
式中:為發(fā)展規(guī)劃的階段總數(shù);w 為各階段子贏得函數(shù)在全時(shí)域贏得函數(shù)的風(fēng)險(xiǎn)偏好系數(shù)。
入學(xué)教育是一項(xiàng)全面系統(tǒng)的工程,要依靠學(xué)校統(tǒng)籌教學(xué)資源、協(xié)調(diào)院系以及相關(guān)部門(mén)共同參與才能推進(jìn),現(xiàn)實(shí)情況多是研究生入學(xué)教育僅由學(xué)生工作部門(mén)承擔(dān),或者是依托培養(yǎng)院系自行設(shè)計(jì)完成,學(xué)校職能部門(mén)、學(xué)院系所教師、導(dǎo)師團(tuán)隊(duì)、在校學(xué)生等均普遍缺乏參與意識(shí),使研究生入學(xué)教育越來(lái)越被邊緣化。而且傳統(tǒng)的適應(yīng)性、集體式的入學(xué)教育并不能滿(mǎn)足研究生的個(gè)體發(fā)展需求,無(wú)法適應(yīng)人才培養(yǎng)的需要,需要系所、實(shí)驗(yàn)室、科研團(tuán)隊(duì)等更多與研究生實(shí)際學(xué)習(xí)生活聯(lián)系更為緊密的隊(duì)伍參與到入學(xué)教育中來(lái)。
計(jì)算各全時(shí)域情景的發(fā)生概率。以紅方作為先行方,全時(shí)域情景G發(fā)生的概率為
(4)構(gòu)建全局場(chǎng)景,計(jì)算全局贏得函數(shù)均值。
通過(guò)資源(時(shí)間和費(fèi)用)約束,確定出可行的全時(shí)域情景集合,并對(duì)發(fā)生的概率進(jìn)行歸一化處理,得到可行的全時(shí)域情景的概率分布。所有的可行全時(shí)域情景集合形成全局情景,依據(jù)歸一化處理后的概率,分別計(jì)算紅方和藍(lán)方在全局情景下的贏得函數(shù)期望值。通過(guò)紅藍(lán)雙方贏得函數(shù)期望值的大小來(lái)判斷紅藍(lán)雙方的總體威脅能力強(qiáng)弱。
式中:為可行全時(shí)域場(chǎng)景總數(shù);p 為第個(gè)可行全時(shí)域場(chǎng)景的發(fā)生概率。
設(shè)定武器裝備發(fā)展規(guī)劃階段分為兩階段,周期為10年,前5年為第1階段,后5年為第2階段。紅藍(lán)雙方的費(fèi)用約束均為30億元,紅藍(lán)雙方的武器裝備代號(hào)以及武器裝備的功能指標(biāo)仿真值(歸一化處理,0值代表不具備該功能)、武器裝備的采購(gòu)價(jià)格如表4所示。
表4 裝備功能指標(biāo)值、購(gòu)置費(fèi)用表Table 4 Function indicator and purchase price list of equipment
假設(shè)紅藍(lán)雙方每個(gè)階段的策略集都為兩個(gè)。第1階段,紅方的策略集為11={第1年采購(gòu)3件,3件,投入6億元研制(=2,=3)},12={第1年采購(gòu)2件,4件,1件,投入4億元研制(=1,=4)};藍(lán)方的策略集為11={第1年采購(gòu)1件,2件,2件,投入4億元研制(=2,=3)},12={第1年采購(gòu)2件,3件,2件,投入3億元研制(=1,=4)}。第2階段,紅方的策略集為21={第6年采購(gòu)1件,投入6億元研制(=3,=1),第8年采購(gòu)2件},22={第6年采購(gòu)1件,1件,投入6億元研制(=2,=2),第8年采購(gòu)1件,2件};藍(lán)方的策略集為21={第6年分別投入5億元和4億元研制(=2,=2)和(=2,=3),采購(gòu)1件,第9年采購(gòu)2件,第10年采購(gòu)1件},22={第6年采購(gòu)1件,投入5億元研制(=2,=3),第8年采購(gòu)2件}。其中,紅藍(lán)雙方待研制武器裝備的研制強(qiáng)度和研制周期(單位為年,數(shù)值均已經(jīng)過(guò)整數(shù)化)由設(shè)定的龔帕茲(生長(zhǎng))曲線(xiàn)得到。
各個(gè)階段的策略集按照時(shí)間維聯(lián)結(jié)得到紅藍(lán)雙方多階段方案。根據(jù)裝備功能節(jié)點(diǎn)連接關(guān)系,設(shè)定紅藍(lán)裝備體系的功能邊關(guān)系如圖7所示。功能節(jié)點(diǎn)中的數(shù)字代表武器裝備發(fā)展方案。某個(gè)功能節(jié)點(diǎn)中包含數(shù)字,該功能節(jié)點(diǎn)對(duì)應(yīng)的武器裝備包含在該武器裝備發(fā)展方案。
圖7 紅藍(lán)裝備體系的功能邊關(guān)系Fig.7 Function side relationship of red and blue equipment system
以紅方作為先行方,雙方多階段策略選擇的博弈樹(shù)及概率分布如圖8所示,構(gòu)建成16個(gè)博弈全時(shí)域場(chǎng)景。以藍(lán)方作為先行方,雙方多階段策略選擇的博弈樹(shù)及概率分布如圖9所示,構(gòu)建形成16個(gè)博弈全時(shí)域場(chǎng)景。
圖8 雙方動(dòng)態(tài)博弈樹(shù)及概率分布(紅方作為先行方)Fig.8 Dynamic game trees and probability distribution of both parties(red side as the forerunner)
圖9 雙方動(dòng)態(tài)博弈樹(shù)及概率分布(藍(lán)方作為先行方)Fig.9 Dynamic game trees and probability distribution of both parties(blue side as the forerunner)
設(shè)定武器裝備3類(lèi)功能節(jié)點(diǎn)的威脅削弱難度指數(shù)a均為1。以紅方作為先行方,根據(jù)式(4)~式(9),可得不同博弈可行全時(shí)域場(chǎng)景下的紅藍(lán)策略集各階段的威脅評(píng)估值,如圖10所示。
圖10 紅藍(lán)策略集各階段的威脅評(píng)估值Fig.10 Threat assessment value in each stage of the red and blue policy set
設(shè)定決策者對(duì)第1階段的風(fēng)險(xiǎn)偏好系數(shù)為0.2,對(duì)第2階段的風(fēng)險(xiǎn)偏好系數(shù)為0.8。通過(guò)資源約束判斷可行全時(shí)域場(chǎng)景集合,結(jié)合圖8和式(11)計(jì)算可行全時(shí)域場(chǎng)景集合的概率分布,并歸一化。根據(jù)式(10)計(jì)算得到紅藍(lán)雙方武器裝備發(fā)展方案在各個(gè)可行全時(shí)域場(chǎng)景下的威脅評(píng)估值,如表5所示。
表5 可行全時(shí)域場(chǎng)景下的紅藍(lán)方案威脅評(píng)估Table 5 Threat assessment of red and blue schemes in feasible all-time-domain scenarios
計(jì)算紅方和藍(lán)方武器裝備發(fā)展方案在不同全時(shí)域場(chǎng)景下的威脅能力均值,以紅方方案(11,21)為例,如表6所示。其中概率已經(jīng)經(jīng)過(guò)歸一化處理,同理計(jì)算其他方案的威脅能力均值。
表6 紅方方案(R11,R21)威脅能力評(píng)估表Table 6 Threat capability assessment of red scheme(R11,R21)
根據(jù)式(12)和式(13)分別計(jì)算紅藍(lán)雙方在全局場(chǎng)景下方案威脅能力均值,得到紅藍(lán)雙方發(fā)展方案威脅能力評(píng)估結(jié)果,如圖11和圖12所示。
圖11 紅方發(fā)展方案威脅能力評(píng)估Fig.11 Threat capability evaluation of the red side’s development scheme
圖12 藍(lán)方發(fā)展方案威脅能力評(píng)估Fig.12 Threat capability evaluation of the blue side’s development scheme
同理,考慮藍(lán)方作為先行方,計(jì)算紅方和藍(lán)方武器裝備發(fā)展方案威脅能力的均值,與紅方作為先行方的情況進(jìn)行比較,得到不同先行方的總體均值結(jié)果比較,如圖13所示。
圖13 不同先行方的結(jié)果比較Fig.13 Comparison results of different pioneers
現(xiàn)代戰(zhàn)爭(zhēng)的作戰(zhàn)形勢(shì)日趨復(fù)雜,針對(duì)不同的作戰(zhàn)背景和作戰(zhàn)目標(biāo),決策者對(duì)武器裝備體系發(fā)展不同階段的風(fēng)險(xiǎn)偏好系數(shù)也會(huì)發(fā)生變化,影響博弈結(jié)果。以紅方作為先行方,比較決策者第1階段不同風(fēng)險(xiǎn)偏好系數(shù)對(duì)方案威脅評(píng)估結(jié)果的影響,如圖14所示。
圖14 第1階段風(fēng)險(xiǎn)偏好系數(shù)對(duì)方案威脅能力評(píng)估的影響Fig.14 Impact of the first stage risk preference coefficient on threat capability evaluation of the scheme
通過(guò)分析發(fā)現(xiàn),在各方武器裝備發(fā)展方案中,紅方方案4(12,22)和藍(lán)方方案2(11,22)的威脅能力在各個(gè)全時(shí)域情景下的評(píng)估均值最大,可作為各方的最佳策略選擇。紅藍(lán)雙方的總體威脅能力大小體現(xiàn)出了雙方博弈的強(qiáng)弱比較。而總體威脅能力不僅受單個(gè)方案威脅能力的影響,同時(shí)還受先行方不同導(dǎo)致的全時(shí)域場(chǎng)景概率分布變化以及決策者對(duì)各個(gè)階段的風(fēng)險(xiǎn)偏好系數(shù)變化的影響。
本文主要開(kāi)展了基于動(dòng)態(tài)博弈的武器裝備體系發(fā)展規(guī)劃論證方法的相關(guān)研究,分析雙方武器裝備體系之間的對(duì)抗演化過(guò)程。構(gòu)建基于動(dòng)態(tài)博弈的武器裝備體系發(fā)展規(guī)劃的全局博弈脈絡(luò),評(píng)估紅藍(lán)雙方不同發(fā)展規(guī)劃方案在不同博弈場(chǎng)景下的威脅能力以及總體威脅能力均值,最后給出了具體示例,并進(jìn)行了求解和結(jié)果分析,為武器裝備體系發(fā)展規(guī)劃構(gòu)建一個(gè)新的定量決策模型,也可為類(lèi)似規(guī)劃問(wèn)題提供參考。下一步研究的主要工作包括:進(jìn)一步優(yōu)化武器裝備發(fā)展規(guī)劃方案的威脅評(píng)估方法、如何科學(xué)合理地計(jì)算確定對(duì)方不同策略選擇下已方策略選擇概率的變化。