基于動(dòng)態(tài)博弈的武器裝備體系發(fā)展規(guī)劃論證方法

2022-10-10 08:13:38陳啟宏趙青松

系統(tǒng)工程與電子技術(shù) 2022年10期

陳啟宏，趙青松，*，邱薇，陳甲

（1.國(guó)防科技大學(xué)系統(tǒng)工程學(xué)院，湖南長(zhǎng)沙 410073；2.中國(guó)人民解放軍96901部隊(duì)，北京 100094；3.廣東省軍區(qū)綜合訓(xùn)練隊(duì)，廣東廣州 510501）

0 引言

武器裝備體系是在一定的戰(zhàn)略指導(dǎo)、作戰(zhàn)指揮和保障條件下，為完成一定作戰(zhàn)使命，而由功能上相互聯(lián)系、相互作用的各種武器裝備系統(tǒng)組成的更高層次的系統(tǒng)。武器裝備體系發(fā)展規(guī)劃，是決策者基于作戰(zhàn)背景、目標(biāo)需求、資源約束等條件，增強(qiáng)武器裝備系統(tǒng)之間的協(xié)同作戰(zhàn)能力，尋找武器裝備發(fā)展的最優(yōu)方案，實(shí)現(xiàn)武器裝備體系整體作戰(zhàn)效益最大化的決策過(guò)程。因此，武器裝備體系發(fā)展規(guī)劃將直接影響武器裝備體系結(jié)構(gòu)以及體系之間的影響關(guān)系，是適應(yīng)未來(lái)一體化聯(lián)合作戰(zhàn)趨勢(shì)、提升體系總體作戰(zhàn)能力需要解決的重要問(wèn)題。

目前武器裝備發(fā)展規(guī)劃研究已經(jīng)取得了許多顯著性成果。文獻(xiàn)［6］從不確定信息的角度出發(fā)，同時(shí)考慮不同決策者的目的、決策偏好，提出了基于目標(biāo)規(guī)劃的武器裝備發(fā)展方案選擇模型，采用層次分析（analytic hierarchy process，A HP）法對(duì)主要分析成分設(shè)置權(quán)重比例，對(duì)模型進(jìn)行求解。文獻(xiàn)［7］提出了一種武器裝備發(fā)展方案的評(píng)價(jià)模型：通過(guò)三角模糊函數(shù)將定性指標(biāo)和語(yǔ)義信息等進(jìn)行規(guī)范化處理，利用AHP對(duì)武器裝備發(fā)展方案的層次結(jié)構(gòu)進(jìn)行了分析并確定了相應(yīng)的權(quán)重，利用逼近理想解排序法（technique for order preference by similarity to an ideal solution，TOPSIS）原理對(duì)武器裝備發(fā)展方案進(jìn)行排序。文獻(xiàn)［8］基于能力滿(mǎn)足度，利用非線(xiàn)性?xún)?yōu)化算法對(duì)網(wǎng)絡(luò)信息武器裝備體系進(jìn)行優(yōu)化，得到比較滿(mǎn)意的優(yōu)化路線(xiàn)。

大部分武器裝備體系發(fā)展規(guī)劃研究只考慮了裝備之間的協(xié)同關(guān)系，只研究自身武器裝備體系發(fā)展規(guī)劃而忽略了對(duì)戰(zhàn)雙方武器裝備體系發(fā)展規(guī)劃過(guò)程中的博弈對(duì)抗特征以及對(duì)戰(zhàn)雙方裝備之間的威脅關(guān)系。

目前，基于博弈的武器裝備體系發(fā)展規(guī)劃的研究主要集中于武器裝備體系的構(gòu)建和演化研究，包括對(duì)武器裝備體系的對(duì)抗博弈進(jìn)行作戰(zhàn)網(wǎng)絡(luò)結(jié)構(gòu)建模分析和仿真優(yōu)化。文獻(xiàn)［16］和文獻(xiàn)［17］對(duì)武器裝備體系的動(dòng)態(tài)博弈過(guò)程進(jìn)行建模和仿真分析，將演化仿真與博弈論結(jié)合，提出了武器裝備體系結(jié)構(gòu)演化博弈方法及分析框架。文獻(xiàn)［18］考慮了對(duì)戰(zhàn)雙方不斷研制新裝備與反制裝備的對(duì)抗過(guò)程，構(gòu)建了軍事資源最優(yōu)化分配模型。此外，還有一些針對(duì)具體場(chǎng)景的研究應(yīng)用，解決武器裝備采購(gòu)、軍事運(yùn)輸、軍事競(jìng)爭(zhēng)等實(shí)際問(wèn)題。

但是，上述研究也存在以下不足：①裝備之間的協(xié)同配合考慮不足；②大部分研究集中于發(fā)展武器裝備種類(lèi)的宏觀(guān)層面，只關(guān)注發(fā)展哪些武器裝備，很少關(guān)注什么時(shí)候發(fā)展、發(fā)展周期、采購(gòu)數(shù)量和時(shí)間等具體實(shí)施層面；③往往只考慮己方的武器裝備發(fā)展，卻忽略實(shí)際裝備發(fā)展博弈對(duì)抗中對(duì)方裝備的發(fā)展情況。

因此，本文考慮武器裝備發(fā)展規(guī)劃的體系對(duì)抗特點(diǎn)，基于博弈論的方法來(lái)建立武器裝備體系發(fā)展規(guī)劃動(dòng)態(tài)博弈框架，構(gòu)建了博弈方各階段策略集合已給出，策略選擇信息不完全（概率表示）的不完全信息武器裝備發(fā)展規(guī)劃動(dòng)態(tài)博弈模型，研究分析博弈方不同策略下演化形成的博弈脈絡(luò)，評(píng)估博弈方策略在不同博弈場(chǎng)景下的威脅能力以及博弈方全局博弈過(guò)程總體威脅能力。

1 武器裝備體系對(duì)抗網(wǎng)絡(luò)模型

武器裝備體系是由具備偵察、信息處理、決策、火力打擊等功能的裝備單元連接形成的復(fù)雜系統(tǒng)?；贠ODA（observe-orient-decide-act）作戰(zhàn)理論提出的作戰(zhàn)環(huán)是將武器裝備體系作戰(zhàn)過(guò)程視為一個(gè)循環(huán)過(guò)程，形成作戰(zhàn)環(huán)，具體可分為標(biāo)準(zhǔn)作戰(zhàn)環(huán)和廣義作戰(zhàn)環(huán)，如圖1所示。標(biāo)準(zhǔn)作戰(zhàn)環(huán)中裝備實(shí)體數(shù)量為4個(gè)，每個(gè)功能類(lèi)只包含一個(gè)裝備實(shí)體。廣義作戰(zhàn)環(huán)中，裝備實(shí)體數(shù)量超過(guò)4個(gè)，相同功能類(lèi)的裝備實(shí)體之間存在指揮控制、協(xié)同替換、信息傳遞等關(guān)系，裝備實(shí)體的關(guān)聯(lián)作用關(guān)系愈加復(fù)雜。

圖1 標(biāo)準(zhǔn)作戰(zhàn)環(huán)與廣義作戰(zhàn)環(huán)示意圖Fig.1 Schematic diagram of standard operation loop and generalized operation loop

基于OODA作戰(zhàn)理論分析，本文將武器裝備功能分為3類(lèi)：偵察功能、指控功能、打擊功能。將武器裝備實(shí)體抽象為4類(lèi)功能節(jié)點(diǎn)：偵察節(jié)點(diǎn)、指控節(jié)點(diǎn)、打擊節(jié)點(diǎn)、目標(biāo)節(jié)點(diǎn)，如表1所示。其中，紅藍(lán)雙方的功能節(jié)點(diǎn)互為對(duì)方目標(biāo)節(jié)點(diǎn)。一個(gè)武器裝備實(shí)體在任務(wù)過(guò)程中可以承擔(dān)多個(gè)功能類(lèi)型，抽象為武器裝備體系網(wǎng)絡(luò)中多個(gè)不同類(lèi)型的功能節(jié)點(diǎn)，構(gòu)建形成不同的標(biāo)準(zhǔn)節(jié)點(diǎn)作戰(zhàn)環(huán)和廣義節(jié)點(diǎn)作戰(zhàn)環(huán)。

表1 武器裝備功能節(jié)點(diǎn)分類(lèi)Table 1 Classification of weapon equipment function nodes

考慮紅藍(lán)雙方在對(duì)抗條件下的邊關(guān)系建模，武器裝備體系中裝備之間的關(guān)系可抽象為功能邊，裝備功能節(jié)點(diǎn)之間的作用關(guān)系可分為4種，如表2所示。在武器裝備體系發(fā)展規(guī)劃中，各個(gè)功能節(jié)點(diǎn)通過(guò)功能邊關(guān)聯(lián)聯(lián)系，構(gòu)建形成不同的作戰(zhàn)環(huán)，交織形成武器裝備體系復(fù)雜網(wǎng)絡(luò)。

表2 裝備作用關(guān)系與網(wǎng)絡(luò)功能邊的對(duì)應(yīng)關(guān)系Table 2 Correspondence between equipment action relationships and network function edges

根據(jù)武器裝備體系網(wǎng)絡(luò)功能邊關(guān)系，構(gòu)建武器裝備體系對(duì)抗網(wǎng)絡(luò)示意圖，如圖2所示。

圖2 裝備體系對(duì)抗網(wǎng)絡(luò)示意圖Fig.2 Equipment system confrontation network diagram

2 武器裝備體系規(guī)劃動(dòng)態(tài)博弈過(guò)程

武器裝備體系規(guī)劃是一個(gè)博弈方遵循異步序貫?zāi)Ｊ剑嚯A段推進(jìn)的動(dòng)態(tài)博弈過(guò)程。各博弈方的行動(dòng)有先后順序，后行博弈方可以獲取先行博弈方策略、決策等有關(guān)信息后再進(jìn)行策略的選擇，從而進(jìn)一步影響下一階段的博弈過(guò)程。且在武器裝備體系發(fā)展規(guī)劃過(guò)程中，博弈方往往無(wú)法獲取敵方發(fā)展規(guī)劃的完全信息，因此武器裝備體系規(guī)劃屬于不完全信息的動(dòng)態(tài)博弈過(guò)程。

簡(jiǎn)化起見(jiàn)，對(duì)武器裝備體系發(fā)展規(guī)劃過(guò)程做出如下假設(shè)：

（1）由于多方博弈比較復(fù)雜，設(shè)置武器裝備體系發(fā)展規(guī)劃的博弈方為紅藍(lán)雙方。

（2）各階段博弈方策略集已經(jīng)給出。不完全信息表現(xiàn)為策略選擇的不確定，不確定一方采取特定策略條件下另一方會(huì)采取某種具體策略，采用貝葉斯概率來(lái)描述另一方選擇策略的可能性大小。

（3）武器裝備體系發(fā)展規(guī)劃中，只考慮武器裝備的研制費(fèi)用、研制周期和購(gòu)置費(fèi)用。武器裝備采購(gòu)列裝后，不考慮退役情況，且裝備的維護(hù)成本忽略不計(jì)。

2.1 博弈要素分析

博弈論著重于分析博弈方策略選擇之間的相互影響關(guān)系，突出博弈方之間合作和對(duì)抗的對(duì)立統(tǒng)一關(guān)系。博弈的基本要素有：局中人、策略集、贏得函數(shù)。

（1）局中人：本文中局中人為紅藍(lán)雙方?jīng)Q策者。＝｛，｝，其中代表紅方，代表藍(lán)方。

（2）策略集：各類(lèi)武器裝備發(fā)展方案，＝｛（W ，t，N ，），（W ，N ）｝。

其中，武器裝備發(fā)展方案的決策對(duì)象分為待研制裝備和已列裝裝備，決策變量如表3所示。

表3 發(fā)展規(guī)劃方案決策變量Table 3 Development planning scheme decision variables

利用龔帕茲（生長(zhǎng)）曲線(xiàn)描述待研制裝備研制強(qiáng)度、研制費(fèi)用和研制周期之間的關(guān)系。研制周期和研制費(fèi)用的表達(dá)式為＝（-）·A ＋（ln＞0，＞1），變化趨勢(shì)如圖3所示。

圖3 研制強(qiáng)度、研制周期、研制費(fèi)用之間的關(guān)系Fig.3 Relationship among strength，cycle and funds

其中，研制強(qiáng)度＝｛0，1，2，3｝，＝0時(shí)，代表不研制該武器裝備；＝1時(shí)，隨著研制費(fèi)用投入增大，研制周期開(kāi)始縮短，但費(fèi)用不足仍是周期研制的主要限制約束，縮短幅度較??；＝2時(shí)，投入的研制費(fèi)用較為充足，隨著研制費(fèi)用投入增大，研制周期的縮短幅度較大；＝3時(shí)，人才、技術(shù)成熟程度、資源等成為研制周期的主要限制約束，研制周期縮短幅度較小，當(dāng)下降至最短研制周期后保持不變。

（3）贏得函數(shù)：在武器裝備體系發(fā)展規(guī)劃的過(guò)程中，紅藍(lán)雙方不斷進(jìn)行博弈對(duì)抗，基于掌握的博弈信息，調(diào)整各階段的策略方案，反制降低對(duì)方的體系威脅能力。因此，紅藍(lán)雙方的贏得函數(shù)為：在一方進(jìn)行反制的動(dòng)態(tài)博弈條件下，另一方發(fā)展規(guī)劃方案在不同博弈場(chǎng)景對(duì)其造成的體系威脅能力均值。

2.2 動(dòng)態(tài)博弈局勢(shì)構(gòu)建

在武器裝備體系規(guī)劃的動(dòng)態(tài)博弈中，博弈方并非絕對(duì)理性，會(huì)根據(jù)自身利益的改變不斷調(diào)整自身方案。假設(shè)紅方作為博弈先行方，每個(gè)階段中，紅方先做出決策時(shí)，藍(lán)方根據(jù)紅方的策略，對(duì)己方武器裝備發(fā)展方案的偏好發(fā)生改變，趨向于選擇改善自身利益的策略。上一階段博弈雙方的方案決策又會(huì)對(duì)下一階段博弈方的方案決策產(chǎn)生影響，從而形成一個(gè)博弈方之間“你來(lái)我往”的反復(fù)博弈過(guò)程。

在博弈過(guò)程中，博弈方選擇不同的武器裝備發(fā)展規(guī)劃方案映射在武器裝備體系網(wǎng)絡(luò)中加入不同的武器功能節(jié)點(diǎn)。為了抵抗或削弱對(duì)方武器裝備對(duì)己方帶來(lái)的威脅，博弈雙方會(huì)選擇相應(yīng)的武器發(fā)展方案加入新的裝備功能節(jié)點(diǎn)對(duì)對(duì)方的功能節(jié)點(diǎn)（目標(biāo)節(jié)點(diǎn)）進(jìn)行反制打擊，使得武器裝備體系對(duì)抗網(wǎng)絡(luò)變得越來(lái)越復(fù)雜化，如圖4所示。

圖4 動(dòng)態(tài)博弈過(guò)程Fig.4 Dynamic game process

以圖4的第2階段為例，簡(jiǎn)述武器裝備發(fā)展規(guī)劃的動(dòng)態(tài)博弈過(guò)程：在第1階段紅藍(lán)雙方方案選擇前提。在第2階段中，紅方首先研制新的武器裝備，新增功能節(jié)點(diǎn)I對(duì)藍(lán)方的功能節(jié)點(diǎn)S 和D 進(jìn)行打擊。藍(lán)方作為后行方選擇新增功能節(jié)點(diǎn)I 對(duì)紅方的功能節(jié)點(diǎn)I 和S進(jìn)行打擊，同時(shí)S被藍(lán)方的裝備節(jié)點(diǎn)回路覆蓋，代表節(jié)點(diǎn)被反制，對(duì)藍(lán)方的威脅能力降低。在第3階段中，紅方將在第2階段紅藍(lán)雙方的方案基礎(chǔ)上，進(jìn)一步考慮自身的方案決策。

設(shè)定威脅能力系數(shù)u 描述一個(gè)功能節(jié)點(diǎn)被對(duì)方裝備不同數(shù)量節(jié)點(diǎn)作戰(zhàn)環(huán)反制打擊的效果，如圖5所示。

圖5 威脅能力系數(shù)Fig.5 Threat capacity coefficient

武器裝備功能節(jié)點(diǎn)威脅能力系數(shù)u與對(duì)方裝備節(jié)點(diǎn)作戰(zhàn)環(huán)的覆蓋數(shù)量（∈N）的關(guān)系為

3 武器裝備發(fā)展方案威脅能力評(píng)估

明確博弈雙方各階段的武器裝備發(fā)展方案，用采取方案概率的大小描述博弈方根據(jù)對(duì)方的策略選擇，趨于改善自身效益的己方方案偏好程度。各個(gè)階段博弈方輪流決策構(gòu)成了武器裝備體系規(guī)劃的不同博弈場(chǎng)景。

博弈子場(chǎng)景：每個(gè)階段紅藍(lán)雙方選取不同博弈策略構(gòu)成不同的博弈子場(chǎng)景。

博弈全時(shí)域場(chǎng)景：將博弈子場(chǎng)景按照時(shí)間維聯(lián)結(jié)構(gòu)成博弈全時(shí)域場(chǎng)景，即武器裝備體系演化的一種具體路徑。

博弈全局場(chǎng)景：通過(guò)資源約束，得到所有的可行全時(shí)域場(chǎng)景集合，構(gòu)成博弈全局場(chǎng)景，即動(dòng)態(tài)博弈樹(shù)，如圖6所示。

圖6 動(dòng)態(tài)博弈樹(shù)（博弈全局場(chǎng)景）Fig.6 Dynamic game tree（game full situation scene）

通過(guò)體系網(wǎng)絡(luò)功能指標(biāo)的規(guī)范化和資源約束，明確武器裝備體系發(fā)展動(dòng)態(tài)博弈樹(shù)的可行演化路徑（即可行的武器裝備發(fā)展方案）。通過(guò)計(jì)算各個(gè)武器裝備發(fā)展方案對(duì)應(yīng)的紅藍(lán)雙方武器裝備體系網(wǎng)絡(luò)中包含的標(biāo)準(zhǔn)作戰(zhàn)環(huán)和廣義作戰(zhàn)環(huán)威脅能力之和，評(píng)估武器裝備發(fā)展方案對(duì)敵方體系的威脅能力。

（1）明確資源約束，規(guī)劃可行域。

資源約束主要包括費(fèi)用約束和時(shí)間約束。費(fèi)用約束主要考慮兩個(gè)方面：各個(gè)階段投入的費(fèi)用不能超過(guò)各個(gè)階段的費(fèi)用約束；各個(gè)階段投入的費(fèi)用總和不能超過(guò)總費(fèi)用約束。

時(shí)間約束主要考慮整個(gè)博弈過(guò)程的總時(shí)間約束。所有裝備的采購(gòu)和研制過(guò)程都應(yīng)該在給定的規(guī)劃期內(nèi)進(jìn)行。

（2）構(gòu)建博弈子場(chǎng)景，計(jì)算各階段子贏得函數(shù)。

在每個(gè)階段，紅藍(lán)雙方的博弈不同策略可以組成不同的博弈子場(chǎng)景。在博弈子情景下，計(jì)算武器裝備體系網(wǎng)絡(luò)下不同樣式作戰(zhàn)環(huán)的威脅能力。

計(jì)算標(biāo)準(zhǔn)作戰(zhàn)環(huán)威脅能力：作戰(zhàn)環(huán)的威脅能力主要取決于偵察、指控和打擊3類(lèi)節(jié)點(diǎn)的功能評(píng)價(jià)值。由于標(biāo)準(zhǔn)作戰(zhàn)環(huán)只包含4個(gè)節(jié)點(diǎn)，標(biāo)準(zhǔn)作戰(zhàn)環(huán)的偵察、指控、打擊能力對(duì)應(yīng)偵察、指控、打擊節(jié)點(diǎn)的功能評(píng)價(jià)值。設(shè)定偵察節(jié)點(diǎn)、指控節(jié)點(diǎn)和打擊節(jié)點(diǎn)的功能評(píng)價(jià)值為d ，d ，d 。采用乘積形式計(jì)算標(biāo)準(zhǔn)作戰(zhàn)環(huán)的威脅能力，同時(shí)考慮對(duì)方作戰(zhàn)環(huán)覆蓋數(shù)對(duì)已方功能節(jié)點(diǎn)的影響，設(shè)定標(biāo)準(zhǔn)作戰(zhàn)環(huán)威脅能力的計(jì)算公式為

式中：u ，u，u 分別代表標(biāo)準(zhǔn)作戰(zhàn)環(huán)偵察、指控、打擊3類(lèi)節(jié)點(diǎn)的威脅能力系數(shù)。

計(jì)算廣義作戰(zhàn)環(huán)威脅能力：由于廣義作戰(zhàn)環(huán)中同功能類(lèi)（偵察、指控、打擊）下的節(jié)點(diǎn)數(shù)量不唯一，對(duì)廣義作戰(zhàn)環(huán)的偵察、指控、打擊能力產(chǎn)生影響。因此，在計(jì)算廣義作戰(zhàn)環(huán)威脅能力前，需要計(jì)算廣義作戰(zhàn)環(huán)的偵察能力d 、指控能力d 和打擊能力d 。假設(shè)一個(gè)廣義作戰(zhàn)環(huán)中包含個(gè)信息傳遞關(guān)系的偵察節(jié)點(diǎn)，偵察節(jié)點(diǎn)之間存在信息傳遞和協(xié)同控制關(guān)系，則廣義作戰(zhàn)環(huán)的偵察能力d 計(jì)算公式為

結(jié)合計(jì)算得到的偵察、指控、打擊能力，采用乘積形式計(jì)算廣義作戰(zhàn)環(huán)的威脅能力為

計(jì)算各階段的子贏得函數(shù)（以計(jì)算紅方對(duì)藍(lán)方的體系威脅為例）：設(shè)第個(gè)階段紅藍(lán)雙方中紅方對(duì)藍(lán)方的標(biāo)準(zhǔn)作戰(zhàn)環(huán)數(shù)量為，廣義作戰(zhàn)環(huán)數(shù)量為，則紅方第個(gè)階段對(duì)藍(lán)方的威脅能力值D

→為

（3）構(gòu)建全時(shí)域場(chǎng)景，計(jì)算全時(shí)域贏得函數(shù)。

將博弈子場(chǎng)景按照時(shí)間維聯(lián)結(jié)起來(lái)構(gòu)成全時(shí)域情景，得到各全時(shí)域情景下的贏得函數(shù)為

式中：為發(fā)展規(guī)劃的階段總數(shù)；w 為各階段子贏得函數(shù)在全時(shí)域贏得函數(shù)的風(fēng)險(xiǎn)偏好系數(shù)。

入學(xué)教育是一項(xiàng)全面系統(tǒng)的工程，要依靠學(xué)校統(tǒng)籌教學(xué)資源、協(xié)調(diào)院系以及相關(guān)部門(mén)共同參與才能推進(jìn)，現(xiàn)實(shí)情況多是研究生入學(xué)教育僅由學(xué)生工作部門(mén)承擔(dān)，或者是依托培養(yǎng)院系自行設(shè)計(jì)完成，學(xué)校職能部門(mén)、學(xué)院系所教師、導(dǎo)師團(tuán)隊(duì)、在校學(xué)生等均普遍缺乏參與意識(shí)，使研究生入學(xué)教育越來(lái)越被邊緣化。而且傳統(tǒng)的適應(yīng)性、集體式的入學(xué)教育并不能滿(mǎn)足研究生的個(gè)體發(fā)展需求，無(wú)法適應(yīng)人才培養(yǎng)的需要，需要系所、實(shí)驗(yàn)室、科研團(tuán)隊(duì)等更多與研究生實(shí)際學(xué)習(xí)生活聯(lián)系更為緊密的隊(duì)伍參與到入學(xué)教育中來(lái)。

計(jì)算各全時(shí)域情景的發(fā)生概率。以紅方作為先行方，全時(shí)域情景G發(fā)生的概率為

（4）構(gòu)建全局場(chǎng)景，計(jì)算全局贏得函數(shù)均值。

通過(guò)資源（時(shí)間和費(fèi)用）約束，確定出可行的全時(shí)域情景集合，并對(duì)發(fā)生的概率進(jìn)行歸一化處理，得到可行的全時(shí)域情景的概率分布。所有的可行全時(shí)域情景集合形成全局情景，依據(jù)歸一化處理后的概率，分別計(jì)算紅方和藍(lán)方在全局情景下的贏得函數(shù)期望值。通過(guò)紅藍(lán)雙方贏得函數(shù)期望值的大小來(lái)判斷紅藍(lán)雙方的總體威脅能力強(qiáng)弱。

式中：為可行全時(shí)域場(chǎng)景總數(shù)；p 為第個(gè)可行全時(shí)域場(chǎng)景的發(fā)生概率。

4 示例分析

設(shè)定武器裝備發(fā)展規(guī)劃階段分為兩階段，周期為10年，前5年為第1階段，后5年為第2階段。紅藍(lán)雙方的費(fèi)用約束均為30億元，紅藍(lán)雙方的武器裝備代號(hào)以及武器裝備的功能指標(biāo)仿真值（歸一化處理，0值代表不具備該功能）、武器裝備的采購(gòu)價(jià)格如表4所示。

表4 裝備功能指標(biāo)值、購(gòu)置費(fèi)用表Table 4 Function indicator and purchase price list of equipment

假設(shè)紅藍(lán)雙方每個(gè)階段的策略集都為兩個(gè)。第1階段，紅方的策略集為11＝｛第1年采購(gòu)3件，3件，投入6億元研制（＝2，＝3）｝，12＝｛第1年采購(gòu)2件，4件，1件，投入4億元研制（＝1，＝4）｝；藍(lán)方的策略集為11＝｛第1年采購(gòu)1件，2件，2件，投入4億元研制（＝2，＝3）｝，12＝｛第1年采購(gòu)2件，3件，2件，投入3億元研制（＝1，＝4）｝。第2階段，紅方的策略集為21＝｛第6年采購(gòu)1件，投入6億元研制（＝3，＝1），第8年采購(gòu)2件｝，22＝｛第6年采購(gòu)1件，1件，投入6億元研制（＝2，＝2），第8年采購(gòu)1件，2件｝；藍(lán)方的策略集為21＝｛第6年分別投入5億元和4億元研制（＝2，＝2）和（＝2，＝3），采購(gòu)1件，第9年采購(gòu)2件，第10年采購(gòu)1件｝，22＝｛第6年采購(gòu)1件，投入5億元研制（＝2，＝3），第8年采購(gòu)2件｝。其中，紅藍(lán)雙方待研制武器裝備的研制強(qiáng)度和研制周期（單位為年，數(shù)值均已經(jīng)過(guò)整數(shù)化）由設(shè)定的龔帕茲（生長(zhǎng)）曲線(xiàn)得到。

各個(gè)階段的策略集按照時(shí)間維聯(lián)結(jié)得到紅藍(lán)雙方多階段方案。根據(jù)裝備功能節(jié)點(diǎn)連接關(guān)系，設(shè)定紅藍(lán)裝備體系的功能邊關(guān)系如圖7所示。功能節(jié)點(diǎn)中的數(shù)字代表武器裝備發(fā)展方案。某個(gè)功能節(jié)點(diǎn)中包含數(shù)字，該功能節(jié)點(diǎn)對(duì)應(yīng)的武器裝備包含在該武器裝備發(fā)展方案。

圖7 紅藍(lán)裝備體系的功能邊關(guān)系Fig.7 Function side relationship of red and blue equipment system

以紅方作為先行方，雙方多階段策略選擇的博弈樹(shù)及概率分布如圖8所示，構(gòu)建成16個(gè)博弈全時(shí)域場(chǎng)景。以藍(lán)方作為先行方，雙方多階段策略選擇的博弈樹(shù)及概率分布如圖9所示，構(gòu)建形成16個(gè)博弈全時(shí)域場(chǎng)景。

圖8 雙方動(dòng)態(tài)博弈樹(shù)及概率分布（紅方作為先行方）Fig.8 Dynamic game trees and probability distribution of both parties（red side as the forerunner）

圖9 雙方動(dòng)態(tài)博弈樹(shù)及概率分布（藍(lán)方作為先行方）Fig.9 Dynamic game trees and probability distribution of both parties（blue side as the forerunner）

設(shè)定武器裝備3類(lèi)功能節(jié)點(diǎn)的威脅削弱難度指數(shù)a均為1。以紅方作為先行方，根據(jù)式（4）～式（9），可得不同博弈可行全時(shí)域場(chǎng)景下的紅藍(lán)策略集各階段的威脅評(píng)估值，如圖10所示。

圖10 紅藍(lán)策略集各階段的威脅評(píng)估值Fig.10 Threat assessment value in each stage of the red and blue policy set

設(shè)定決策者對(duì)第1階段的風(fēng)險(xiǎn)偏好系數(shù)為0.2，對(duì)第2階段的風(fēng)險(xiǎn)偏好系數(shù)為0.8。通過(guò)資源約束判斷可行全時(shí)域場(chǎng)景集合，結(jié)合圖8和式（11）計(jì)算可行全時(shí)域場(chǎng)景集合的概率分布，并歸一化。根據(jù)式（10）計(jì)算得到紅藍(lán)雙方武器裝備發(fā)展方案在各個(gè)可行全時(shí)域場(chǎng)景下的威脅評(píng)估值，如表5所示。

表5 可行全時(shí)域場(chǎng)景下的紅藍(lán)方案威脅評(píng)估Table 5 Threat assessment of red and blue schemes in feasible all-time-domain scenarios

計(jì)算紅方和藍(lán)方武器裝備發(fā)展方案在不同全時(shí)域場(chǎng)景下的威脅能力均值，以紅方方案（11，21）為例，如表6所示。其中概率已經(jīng)經(jīng)過(guò)歸一化處理，同理計(jì)算其他方案的威脅能力均值。

表6 紅方方案（R11，R21）威脅能力評(píng)估表Table 6 Threat capability assessment of red scheme（R11，R21）

根據(jù)式（12）和式（13）分別計(jì)算紅藍(lán)雙方在全局場(chǎng)景下方案威脅能力均值，得到紅藍(lán)雙方發(fā)展方案威脅能力評(píng)估結(jié)果，如圖11和圖12所示。

圖11 紅方發(fā)展方案威脅能力評(píng)估Fig.11 Threat capability evaluation of the red side’s development scheme

圖12 藍(lán)方發(fā)展方案威脅能力評(píng)估Fig.12 Threat capability evaluation of the blue side’s development scheme

同理，考慮藍(lán)方作為先行方，計(jì)算紅方和藍(lán)方武器裝備發(fā)展方案威脅能力的均值，與紅方作為先行方的情況進(jìn)行比較，得到不同先行方的總體均值結(jié)果比較，如圖13所示。

圖13 不同先行方的結(jié)果比較Fig.13 Comparison results of different pioneers

現(xiàn)代戰(zhàn)爭(zhēng)的作戰(zhàn)形勢(shì)日趨復(fù)雜，針對(duì)不同的作戰(zhàn)背景和作戰(zhàn)目標(biāo)，決策者對(duì)武器裝備體系發(fā)展不同階段的風(fēng)險(xiǎn)偏好系數(shù)也會(huì)發(fā)生變化，影響博弈結(jié)果。以紅方作為先行方，比較決策者第1階段不同風(fēng)險(xiǎn)偏好系數(shù)對(duì)方案威脅評(píng)估結(jié)果的影響，如圖14所示。

圖14 第1階段風(fēng)險(xiǎn)偏好系數(shù)對(duì)方案威脅能力評(píng)估的影響Fig.14 Impact of the first stage risk preference coefficient on threat capability evaluation of the scheme

通過(guò)分析發(fā)現(xiàn)，在各方武器裝備發(fā)展方案中，紅方方案4（12，22）和藍(lán)方方案2（11，22）的威脅能力在各個(gè)全時(shí)域情景下的評(píng)估均值最大，可作為各方的最佳策略選擇。紅藍(lán)雙方的總體威脅能力大小體現(xiàn)出了雙方博弈的強(qiáng)弱比較。而總體威脅能力不僅受單個(gè)方案威脅能力的影響，同時(shí)還受先行方不同導(dǎo)致的全時(shí)域場(chǎng)景概率分布變化以及決策者對(duì)各個(gè)階段的風(fēng)險(xiǎn)偏好系數(shù)變化的影響。

5 結(jié)束語(yǔ)

本文主要開(kāi)展了基于動(dòng)態(tài)博弈的武器裝備體系發(fā)展規(guī)劃論證方法的相關(guān)研究，分析雙方武器裝備體系之間的對(duì)抗演化過(guò)程。構(gòu)建基于動(dòng)態(tài)博弈的武器裝備體系發(fā)展規(guī)劃的全局博弈脈絡(luò)，評(píng)估紅藍(lán)雙方不同發(fā)展規(guī)劃方案在不同博弈場(chǎng)景下的威脅能力以及總體威脅能力均值，最后給出了具體示例，并進(jìn)行了求解和結(jié)果分析，為武器裝備體系發(fā)展規(guī)劃構(gòu)建一個(gè)新的定量決策模型，也可為類(lèi)似規(guī)劃問(wèn)題提供參考。下一步研究的主要工作包括：進(jìn)一步優(yōu)化武器裝備發(fā)展規(guī)劃方案的威脅評(píng)估方法、如何科學(xué)合理地計(jì)算確定對(duì)方不同策略選擇下已方策略選擇概率的變化。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡