李偉湋, 高培雪, 陳 進, 路玉卿
(南京航空航天大學 a. 航天學院; b. 計算機科學與技術學院/人工智能學院/軟件學院; c. 高安全系統(tǒng)的軟件開發(fā)與驗證技術工信部重點實驗室,南京 210016)
隨著科技發(fā)展,無人機作戰(zhàn)成為現(xiàn)代戰(zhàn)爭中不可或缺的一環(huán),已逐步應用于戰(zhàn)爭中的偵查、評估和監(jiān)聽等各個方面.無人機態(tài)勢評估是指評估敵我雙方的戰(zhàn)斗力要素,對整體戰(zhàn)場態(tài)勢進行判斷,幫助飛行員做出正確決策.對敵機態(tài)勢進行合理評估是進行火力分配和機動決策的前提,在戰(zhàn)爭中發(fā)揮著關鍵作用.在評估過程中,無人機本身動力較小,容易受天氣、地形等環(huán)境因素影響.同時,無人機控制系統(tǒng)難以自主處理飛行過程中的突發(fā)事件[1].因此,深入研究無人機態(tài)勢評估刻不容緩.
近年來,眾多學者對無人機態(tài)勢評估展開研究,提出了多種態(tài)勢評估方法.較為常見的有以下幾種:文獻[2]提出了一種基于貝葉斯網(wǎng)絡的態(tài)勢評估方法;文獻[3]構(gòu)建云模型得到目標威脅評估云圖,實現(xiàn)了威脅評估;文獻[4]為了提高空戰(zhàn)中目標威脅評估模型的精度,構(gòu)建極限學習機來解決態(tài)勢評估問題.無人機態(tài)勢評估是信息融合的過程,將多種低層次的信息融合為高層次的信息,從而對目標進行態(tài)勢評估,得到威脅排序結(jié)果.因此,在一些研究中,將無人機態(tài)勢評估視為一種群體決策[5]或多屬性決策[6]的問題.由于作戰(zhàn)環(huán)境日趨復雜,且無人機容易受到環(huán)境影響,導致態(tài)勢信息具有明顯的不確定性和模糊性.為解決該問題,文獻[6]用直覺模糊集來處理信息的不確定性,使用隸屬度函數(shù)精確地描述了不確定信息,將其用于評估空中目標威脅程度.文獻[7]采用直覺模糊熵計算目標屬性權重,引入直覺模糊多準則妥協(xié)解排序(VIKOR)方法用以解決多目標威脅評估問題.文獻[5]將群體決策模型應用到目標威脅評估上,之后,文獻[8]針對目標威脅評估只能得到威脅排序需要進一步研究是否應該攻擊目標的問題,在直覺模糊環(huán)境下提出了一種基于三支決策的目標威脅評估算法.同時,文獻[9]將前景理論引入到?jīng)Q策問題中,文獻[10]將前景理論運用到空戰(zhàn)目標威脅評估中,文獻[11]進而提出一種基于前景理論和VIKOR法的威脅評估方法.
但當前的無人機態(tài)勢評估過程仍然存在以下兩個問題:其一,當前多數(shù)的態(tài)勢評估方法只能得到評估的排序結(jié)果,仍需飛行員主觀地選擇優(yōu)先攻擊的目標和數(shù)量,并且飛行員在決策過程中多為二支決策,即判斷是否對敵機進行攻擊,對于中等威脅的目標,需要更多的信息進行判斷,評估過程復雜,容易出現(xiàn)誤判,易導致決策錯誤;其二,外界的復雜環(huán)境會影響飛行員的個人偏好,不同的飛行員心理偏好不同,在整個空戰(zhàn)過程中,同一飛行員的心理傾向也會發(fā)生變化,而以往的評估過程中沒有考慮決策者的主觀偏好和風險態(tài)度,不能反映出真實的作戰(zhàn)場景.
針對上述問題,提出一種基于三支決策和累積前景價值理論的態(tài)勢評估方法.首先利用三支決策模型進行態(tài)勢評估,該模型在傳統(tǒng)決策問題的基礎上,為不確定性結(jié)果增加了延遲決策的選擇,更加符合人的決策認知;然后引入累積前景理論體現(xiàn)飛行員偏好的不確定性,在此過程中使用記分函數(shù)將直覺模糊數(shù)轉(zhuǎn)換為實數(shù),從而計算指標平均值,利用指標平均值和正負理想點得到參考點;為建立基于累積前景理論的三支決策模型,根據(jù)損失和結(jié)果之間的數(shù)量關系,得到對應的結(jié)果矩陣,之后通過比較一個目標的3種累積前景價值進行快速決策.此外,為了考慮不同類型飛行員面對相同戰(zhàn)場態(tài)勢時的區(qū)別,得出與實戰(zhàn)情景相符的評估結(jié)果,對3種類型的飛行員進行實驗,得到不同的評估結(jié)果.
設U是一個非空論域,則U上的一個直覺模糊集可以表示為:A′={〈x,μA(x),vA(x)〉|x∈U},其中,μA(x)為論域中的元素x屬于A′的隸屬度;vA(x)為元素x屬于A′的非隸屬度.μA(x):U→[0, 1]和vA(x):U→[0, 1]是論域上的兩個映射,對?x∈U,需滿足以下3個條件:μA(x)∈[0, 1],vA(x)∈[0, 1]以及μA(x)+vA(x)∈[0,1].定義πA(x)=1-μA(x)-vA(x)為直覺模糊集A′的猶豫度.
直覺模糊集中的元素被稱為直覺模糊數(shù).設E=(μE,vE)和F=(μF,vF)是兩個直覺模糊數(shù),與直覺模糊集的定義類似,μE、vE和πE分別為直覺模糊數(shù)E的隸屬度、非隸屬度和猶豫度,μF、vF和πF分別為直覺模糊數(shù)F的隸屬度、非隸屬度和猶豫度;其中,πE=1-μE-vE,πF=1-μF-vF.常見運算為
|πE-πF|)
(1)
S(E)=μE-vE
(2)
式中:d(E,F)為距離函數(shù),用于計算兩個直覺模糊數(shù)之間的距離;S(E)為記分函數(shù).
三支決策理論的基本思想是在實體評價函數(shù)上引入兩個閾值,并構(gòu)造所需的3個域,分別為正域、負域和邊界域,這3個域可以分別解釋為接受、拒絕和不承諾.根據(jù)貝葉斯決策過程,決策粗糙集由2個狀態(tài)和3種行動組成[12], 構(gòu)造狀態(tài)集和動作集,狀態(tài)集Ω={C,C}表示對象屬于集合C和不屬于集合C,動作集AC={aP,aB,aN},aP、aB和aN分別表示接受、進一步研究和拒絕動作,下標P、B和N分別為對象x采取接受、進一步研究和拒絕動作.不同狀態(tài)下執(zhí)行不同的動作會存在不同的損失,對應的損失函數(shù)矩陣如表1所示.其中,λPP、λBP和λNP分別為在狀態(tài)C中的對象采取接受、進一步研究和拒絕動作時的損失;λPN、λBN和λNN分別為不在狀態(tài)C中的對象采取接受、進一步研究和拒絕動作時的損失.同時,存在一個合理的損失函數(shù)條件:λPP≤λBP≤λNP,λNN≤λBN≤λPN.
表1 損失函數(shù)矩陣Tab.1 Loss function matrix
對于某一個對象x,其在狀態(tài)C中的概率為P(C|x),又稱為條件概率,根據(jù)條件概率大小可得到?jīng)Q策排序結(jié)果.對象x執(zhí)行不同的動作有不同的期望損失,如R(aP|x)為對象采取接受動作時的期望損失;R(aB|x)為對象采取進一步研究動作時的期望損失,R(aN|x)為對象采取拒絕動作時的期望損失.通過比較其執(zhí)行不同動作時的期望損失將對象劃分到正域、邊界域和負域中,分別用POS(C)、BND(C)和NEG(C)表示.由此可得決策規(guī)則(P)、(B)、(N)如下:
(P)如果R(aP|x)≤R(aB|x)和R(aP|x)≤R(aN|x),則x∈POS(C).
(B)如果R(aB|x)≤R(aP|x)和R(aB|x)≤R(aN|x),則x∈BND(C).
(N)如果R(aN|x)≤R(aB|x)和R(aN|x)≤R(aP|x),則x∈NEG(C).
1.3.1累積前景理論 Tversky等[13]提出了累積前景理論,其核心為累積前景價值,它由累積權重函數(shù)和價值函數(shù)兩部分組成,假設共有a1+a2+1個結(jié)果,記為x=x-a1,x-a1+1, …,xa2,每個結(jié)果發(fā)生的概率記為p=p-a1,p-a1+1, …,pa2.累積前景價值為
(3)
式中:πh為累積權重函數(shù),用來衡量風險對決策者的影響;v′(xh)為價值函數(shù),用來衡量決策者的主觀感受,其表達式為
(4)
計算累積權重函數(shù)時,首先計算單個概率權重函數(shù).由于人們通常更傾向于去做小概率事件,所以概率權重函數(shù)為
(5)
(6)
式中:w+(ph)和w-(ph)分別為決策者面對收益和損失的概率權重函數(shù);ph為xh的概率;φ和δ分別為風險收益態(tài)度系數(shù)和風險損失態(tài)度系數(shù),經(jīng)典取值為φ=0.61,δ=0.69.
為了對權重進行累加,將a1+a2+1個結(jié)果按升序排序為x-a1< … πh= (7) 1.3.2改進累積前景理論 對于式(4),一般情況下決策者對損失更加敏感,但在現(xiàn)實生活中,也存在決策者對收益更加敏感的場景,因此引入收益敏感系數(shù)ζ,表達決策者對收益的敏感度.同時擴大a和b的取值范圍,將其由前景理論認定的 01,分別對應決策者為冒險型、中間型和保守型,從而根據(jù)決策者的風險類型得出不同的決策結(jié)果.參照文獻[14],改進的價值函數(shù)為 (8) 式中:當θ=1,ζ>1時表示相對于損失,決策者對收益更加敏感;當θ>1,ζ=1時表示相對于收益,決策者對損失更加敏感. 針對以往的決策方法認為決策者處于完全理性的狀態(tài)并且只能得到威脅排序結(jié)果的問題,提出一種基于累積前景理論和三支決策的無人機態(tài)勢威脅評估方法. 該方法的數(shù)學描述和實現(xiàn)過程如下:假設敵機目標集合為T={T1,T2, …,Tm},每架敵機有n個指標:A={A1,A2, …,An}.評估矩陣為Z=(zij)m×n,目標為i∈{1, 2, …,m},指標為j∈{1, 2, …,n},zij為第i個目標在第j個指標上的值.Z為一個直覺模糊矩陣,每個數(shù)值都是直覺模糊數(shù),zij=〈μij,vij〉.其中,uij和vij分別為直覺模糊數(shù)zij的隸屬度和非隸屬度.該方法首先利用直覺模糊逼近于理想值的排序(TOPSIS)方法計算每個目標的條件概率,從而得到威脅排序結(jié)果;之后利用結(jié)果矩陣和損失矩陣之間的關系計算每個目標的結(jié)果矩陣;最后根據(jù)相關公式計算每個目標執(zhí)行不同動作時的累積前景價值,構(gòu)建新的三支決策規(guī)則進行比較,得到威脅分類結(jié)果. 步驟一確定目標的正負理想解. 正負理想解分別為 2.2.3 營養(yǎng)支持 結(jié)核病為全身慢性消耗性疾病。病程長,臨床癥狀重,術前營養(yǎng)狀況差,加之手術創(chuàng)傷、修復需要,術后加強營養(yǎng)治療對患者康復起著至關重要的作用。在靜脈輸入適量懸浮紅細胞、新鮮冰凍血漿、白蛋白、脂肪乳、復方氨基酸、葡萄糖、維生素和微量元素的同時,還留置鼻胃管,予整蛋白型腸內(nèi)營養(yǎng)劑、米湯、果汁等胃腸營養(yǎng)。每次鼻飼前先確認鼻胃管的深度,回抽胃液無明顯胃儲留再行鼻飼,鼻飼時盡量保持半臥位,避免因體位原因?qū)е挛竷?nèi)容物反流而引起誤吸,從而導致肺感染。拔除鼻胃管后鼓勵并指導患者進食高熱量、高蛋白、豐富維生素及礦物質(zhì)飲食,促進機體康復。 不同類型的指標有不同的取值,效益型指標是指其值越大結(jié)果越好的指標,成本型指標是指其值越小結(jié)果越好的指標. 對于效益型指標,其正負理想解分別為 對于成本型指標,其正負理想解分別為 步驟二計算每個目標的相對貼近度. 首先,計算第i個目標到正負理想點的距離,計算公式為 (9) (10) 式中:D(Ti,Z+)和D(Ti,Z-)分別為目標Ti到正理想解和負理想解的距離;wj為第j個指標的權重. 之后,計算第i個目標的相對貼近度為 (11) 式中:Pr(C|Ti)為第i個目標在狀態(tài)C中的條件概率;RC(Ti)為第i個目標的相對貼近度. 結(jié)果矩陣的構(gòu)造方法與三支決策中的損失函數(shù)矩陣類似,矩陣中各元素分別表示在不同狀態(tài)下執(zhí)行3種操作的結(jié)果,矩陣中各元素可以表示為X=[xPPxPNxBPxBNxNPxNN].與損失函數(shù)不同的是,結(jié)果矩陣的值既可以為正也可以為負. 步驟一計算目標在每個指標下的損失函數(shù)矩陣. 指標的最大值和最小值分別用zmax和zmin表示.對于直覺模糊數(shù)表示的指標值,效益型指標的最大值和最小值分別為zmax=(1, 0),zmin=(0, 1),成本型指標的最大值和最小值分別為zmax=(0, 1),zmin=(1, 0). (12) 步驟二計算目標在每個指標下的結(jié)果矩陣. (13) 步驟三計算目標在多個指標下的綜合結(jié)果矩陣. (14) 步驟一計算參考點. 首先使用記分函數(shù)將模糊矩陣轉(zhuǎn)換為一般矩陣.本文采用經(jīng)典的記分函數(shù),表示為 Sij=μij-vij (15) 式中:Sij為直覺模糊數(shù)zij的記分函數(shù)值. 之后,求一般矩陣的指標平均值: (16) 為避免信息丟失,引入正負理想點作為另外兩個參考點.同時,在實際空戰(zhàn)過程中飛行員的偏好在很大程度上是模糊的,因此本文采用模糊分析法[15]來確定偏好權重. 首先根據(jù)決策者對不同參考點的偏好程度建立模糊矩陣P=[prw]u×u,u為參考點的個數(shù),具體可表示為 (17) 之后對P進行一致化處理,先按行求和得到qr,再進行計算得到模糊一致矩陣Q=[qrw]u×u,表達式為 (18) (19) (20) (21) 式中:kr為第r個參考點的初始偏好權重;lr為第r個參考點的偏好權重. 步驟二計算每個目標的價值函數(shù). 以矩陣的形式表示結(jié)果,矩陣內(nèi)每個結(jié)果對應的價值函數(shù)為 (22) 步驟三計算每個目標的累積權重函數(shù). 首先計算權重函數(shù),表達式為 (23) (24) 式中:w+(pi)和w-(pi)分別為決策者面對收益和損失的概率權重函數(shù);pi為第i個目標的概率. 之后,計算累積權重函數(shù).價值函數(shù)單調(diào)遞增,因此對價值函數(shù)進行排序,獲得每個動作相關聯(lián)的累積權重函數(shù)為 (25) (26) 式中:Pr(C|Ti) 為第i個目標Ti屬于狀態(tài)C的概率;Pr(C|Ti)為目標Ti不屬于狀態(tài)C的概率;為第i個目標屬于狀態(tài)C時采取動作k的價值函數(shù);為第i個目標不屬于狀態(tài)C時采取動作k的價值函數(shù);為Pr(C|Ti)時第i個目標采取動作k的累積權重函數(shù);為Pr(C|Ti)時第i個目標采取動作k的累積權重函數(shù);k=P,B,N. 步驟四計算每個目標在不同操作下的累積前景價值. 由價值函數(shù)和累積權重函數(shù)可以計算3種不同操作下的累積前景價值.當價值函數(shù)不同時,累積權重函數(shù)不同,對應的計算方法也不同,具體公式為 (27) (28) (29) 式中:Vi(aP|Ti)、Vi(aB|Ti)和Vi(aN|Ti)分別為對目標Ti采取接受、進一步研究和拒絕動作得到的累積前景價值. 最后,根據(jù)累積前景價值最大的原則,每個目標的三支決策規(guī)則為 (P)如果滿足Vi(aP|Ti)≥Vi(aB|Ti)和Vi(aP|Ti)≥Vi(aN|Ti), 則Ti∈POS(C). (B)如果滿足Vi(aB|Ti)≥Vi(aP|Ti)和Vi(aB|Ti)≥Vi(aN|Ti), 則Ti∈BND(C). (N)如果滿足Vi(aN|Ti)≥Vi(aP|Ti)和Vi(aN|Ti)≥Vi(aB|Ti), 則Ti∈NEG(C). 采用文獻[16]中的無人機數(shù)據(jù)進行實驗分析,具體數(shù)據(jù)如下:假設我機在空戰(zhàn)中遭遇5架敵機,敵機目標集合表示為T={T1,T2, …,T5} ;每架敵機選取8個評估指標,即類型、距離、角度、速度、高度、干擾能力、穿透能力和防護等級,評估指標集合表示為A={A1,A2, …,A8},其中,距離、角度和高度為成本型指標,其余為效益型指標.歸一化多屬性直覺模糊信息矩陣Z如表2所示. 表2 歸一化多屬性直覺模糊信息矩陣Tab.2 Normalized multi-attribute intuitionistic fuzzy evaluation information matrix 通過公式計算得到每個目標的條件概率、不同狀態(tài)下的權重函數(shù)及結(jié)果矩陣,如表3~5所示. 使用記分函數(shù)將直覺模糊信息矩陣轉(zhuǎn)換為一般矩陣,利用公式計算得到η=(0.365,0.135, 0.5), 表3 每個目標的條件概率Tab.3 Conditional probability of each target 表4 每個目標的權重函數(shù)Tab.4 Weight function of each target 表5 每個目標的結(jié)果矩陣Tab.5 Outcome matrix of each target 通過計算得到指標平均值、正理想點和負理想點,再乘以對應的偏好權重,即可得到本文需要的參考點,具體算式為 0.518 8×0.5=-0.172 6 利用參考點、結(jié)果矩陣計算得到相應的價值函數(shù),并由價值函數(shù)和權重函數(shù)計算得到相應的累積前景價值,如表6所示.其中,VP、VB和VN分別為目標采取接受、進一步研究和拒絕動作時的累積前景價值. 表6 每個目標的累積前景價值Tab.6 Cumulative prospect value of each target 由表3可知,基于綜合直覺模糊信息矩陣的態(tài)勢評估的排序結(jié)果是T1>T3>T2>T4>T5.由表6可知,基于決策規(guī)則的直覺模糊信息矩陣的客觀分類結(jié)果是POS(C)={T1},BND(C)={T2,T3},NEG(C)={T4,T5}.這意味著首先應該攻擊和干擾T1,不攻擊和干擾T4和T5,需要更多的信息判斷是否要攻擊T2和T3. 3.2.1評估結(jié)果對比與分析 為了進一步說明本方法的有效性和優(yōu)越性,本文與文獻[7-8,16]的決策方法進行對比,簡要對4個方案的評估結(jié)果進行分析.其中,文獻[7]采用直覺模糊VIKOR方法,文獻[8]采用三支決策的方法,文獻[16]采用直覺模糊相似度量推理模型(IFSMRM)方法.4種決策方法仿真分析時使用同一組數(shù)據(jù),決策結(jié)果對比如表7所示. 表7 實驗結(jié)果對比Tab.7 Comparison of experimental results 在4種方法的評估結(jié)果中,本文方法與三支決策方法得到的排序結(jié)果一致,分類結(jié)果有所不同,說明決策者的心理態(tài)度會影響威脅評估結(jié)果.在戰(zhàn)場中考慮決策者心理具有研究價值,驗證了本文方法的正確性.本文方法與IFSMRM方法所得結(jié)果在目標T1和T3上不一致,與T3相比,T1的速度更快,類型指標的值更大,表示作戰(zhàn)能力更強,更容易發(fā)起攻擊,因此T1的威脅等級更高;IFSMRM方法預先設定了7個威脅等級,目標T1和T3在相同的威脅等級中,T2被劃分到下一個威脅等級中;T3與T2相比,距離、角度和高度等略小,但T3的類型也略小,表示其作戰(zhàn)能力稍差,因此二者的威脅程度相差不大,本文方法將T2與T3劃分到同一個區(qū)間是合理的,并且將目標劃分到3個區(qū)間符合人類心理認知,驗證了本方法的合理性.本文方法與VIKOR方法得到的排序結(jié)果不一致,與T3相比,T1的速度更快,類型指標值更大,表示作戰(zhàn)能力更強,更容易發(fā)起攻擊,因此T1的威脅等級更高;與T4相比,T2的速度較小,距離較遠,但其類型指標值遠大于T4,表示其作戰(zhàn)能力遠強于T4,有能力發(fā)動突然襲擊,因此T2的威脅等級更高,顯然本文方法更符合客觀分析. 與文獻[7]使用的VIKOR方法相比,本文方法得到的威脅評估結(jié)果更符合實際認知,且能提供客觀分類結(jié)果,更好地為決策者提供決策支持.與文獻[8]僅使用三支決策對比,兩者使用同樣的方法計算三支決策的條件概率,三支決策中威脅排序結(jié)果與概率大小保持一致,因此兩種方法得到的排序結(jié)果相同;同時本文方法將累積前景理論和三支決策相結(jié)合,將決策者的心理考慮到評估結(jié)果中,不同決策者可以根據(jù)自己的風險偏好選擇偏好權重,得到不同的參考點;同一決策者面對不同的戰(zhàn)場態(tài)勢,得到不同的參考點;由不同的參考點得到不同的分類結(jié)果,符合真實戰(zhàn)場環(huán)境,解決了以往態(tài)勢評估未考慮決策者心理的問題.與文獻[16]使用的IFSMRM方法對比,本文采用三支決策的方法,不僅得到了威脅排序結(jié)果,而且得到了對目標的具體操作,不同域的目標有不同的操作,有利于飛行員進行快速決策,解決了當前決策困難、易產(chǎn)生誤判的問題.并且無需事先設定威脅等級,可根據(jù)新的三支決策規(guī)則實時地做出威脅分類,選擇優(yōu)先作戰(zhàn)目標. 4種方法的目標威脅評估值如圖1所示.4種方法均通過比較目標威脅值得到威脅排序結(jié)果,即表7中的排序結(jié)果. 圖1 4種方法的目標威脅評估值Fig.1 Threat assessment results of 4 methods 3.2.2復雜度對比與分析 根據(jù)4種方法的具體流程,可得其時間復雜度均為O(mn).隨機進行10次實驗,方法耗時結(jié)果如圖2所示.在4種方法對比中,雖然本文方法耗時較高,但本文方法和其他方法具有相同且較低的時間復雜度,耗時仍然能夠滿足戰(zhàn)場實時性要求. 圖2 4種方法的耗時Fig.2 Time of 4 methods 為了驗證不同類型的飛行員在面對相同的戰(zhàn)場環(huán)境時會有不同的態(tài)勢評估結(jié)果,采用了3種典型的參數(shù)組合,如表8所示.表8中參數(shù)a=0.37,b=0.59,ζ=1,θ=1.51來源于文獻[17]中的實驗值;參數(shù)a=1,b=1,ζ=1,θ=2.25以及參數(shù)a=1.21,b=1.21,ζ=1,θ=2.25來源于文獻[14]中的實驗值;權重函數(shù)參數(shù)均來源于文獻[14]中的實驗值. 表8 3種典型的參數(shù)組合Tab.8 3 typical parameter combinations 為了清楚說明決策參數(shù)對目標態(tài)勢評估的影響,通過數(shù)值仿真得到了3種類型下的目標態(tài)勢評估關系.由表9和表10可知,在3種典型參數(shù)組合情況下,威脅評估結(jié)果總體比較穩(wěn)定,但是目標分類結(jié)果不同.因為威脅評估排序結(jié)果與條件概率的排序保持一致,所以不同類型的飛行員只影響分類結(jié)果.首先,冒險型決策者認為目標T2和T3都應該攻擊;中間型和保守型認為目標T2和T3需要更多的信息來判斷是否需要攻擊,說明不同類型的飛行員決策結(jié)果不同,受到了飛行員主觀心理因素的影響.其次,中間型和保守型的分類結(jié)果相同,但累積前景價值不同,保守型的目標T4和T5的累積前景價值更小,說明其不想攻擊的意愿更強烈,該決策結(jié)果符合人類認知.總體結(jié)果表明,在實際空戰(zhàn)中要充分考慮飛行員的心理,對飛行員類型進行判斷,從而使態(tài)勢評估結(jié)果更符合實際作戰(zhàn)情況. 表9 3種類型決策者的累積前景價值 表10 3種類型決策者的結(jié)果Tab.10 Results of 3 types of decision makers 為研究不同參數(shù)取值對態(tài)勢評估結(jié)果的影響情況,分析不同參數(shù)的靈敏度,如損失規(guī)避系數(shù)θ、風險態(tài)度系數(shù)a和b,使用最大累積前景價值Vmax=max{VP,VB,VN}比較態(tài)勢評估結(jié)果.損失規(guī)避系數(shù)θ對不同目標的最大累積前景價值Vmax的影響如圖3所示. 由圖3可知,隨著損失規(guī)避系數(shù)θ的不斷增加,目標T1、T2、T3、T4和T5的最大累積前景價值均處于下降趨勢,但目標所在的域不同,代表其威脅程度也不同.具體而言,隨著θ的增大,目標T1仍處于正域,采取攻擊操作的累積前景價值不斷減小,說明目標T1的威脅評估結(jié)果隨θ的增大而減小.隨著θ的增大,目標T2和T3從正域過渡到邊界域,采取不攻擊操作的累積前景價值不斷減小,說明目標T2和T3的威脅評估結(jié)果隨θ的增大而減小.隨著θ的增大,目標T4和T5仍處于負域,采取不攻擊操作的累積前景價值不斷減小,說明目標T4和T5的威脅評估結(jié)果隨θ的增大而增大.綜上說明,隨著損失規(guī)避系數(shù)θ的不斷增大,目標的威脅評估結(jié)果也呈現(xiàn)出不同的變化趨勢. 圖3 損失規(guī)避系數(shù)θ擾動Fig.3 Perturbation of loss avoidance coefficient θ 圖4為風險態(tài)度系數(shù)a對不同目標的最大累積前景價值Vmax的影響.由圖4可知,隨著a不斷增加,目標T2和T3的累積前景價值較大值均呈現(xiàn)出先下降后緩慢上升的趨勢;目標T1、T4和T5的累積前景價值較大值均呈現(xiàn)出下降趨勢.隨著a不斷增大,決策者類型從冒險型不斷向保守型過渡.在這個過程中,目標T2和T3從正域過渡到邊界域,目標T4從負域過渡到邊界域;目標T3、T4和T5的排序發(fā)生微小變化,說明不同類型的決策者會影響排序和分類結(jié)果. 圖4 風險態(tài)度系數(shù)a擾動Fig.4 Perturbation of risk-return attitude coefficient a 圖5為風險態(tài)度系數(shù)b對不同目標的最大累積前景價值Vmax的影響.由圖5可知,隨著b不斷增大,目標的累積前景價值最大值均呈現(xiàn)出上升的趨勢.但目標所在的域不同,代表其威脅程度也不同.具體而言,隨著b的增大,決策者類型從冒險型向保守型不斷過渡,在這個過程中,目標T1、T2和T3仍處于正域或邊界域,采取攻擊操作的累積前景價值不斷增大,說明目標的威脅評估結(jié)果隨b的增大而增大;目標T4和T5處于負域,采取不攻擊操作的累積前景價值不斷增大,說明目標T4和T5的威脅評估結(jié)果隨b的增大而減小.綜上說明,隨著風險態(tài)度系數(shù)b的不斷增大,目標的威脅評估結(jié)果也呈現(xiàn)出不同的變化趨勢. 圖5 風險態(tài)度系數(shù)b擾動Fig.5 Perturbation of risk-return attitude coefficient b 針對無人機態(tài)勢評估決策困難及未考慮復雜外界環(huán)境對決策者的影響問題,提出一種基于累積前景理論的三支決策模型,并據(jù)此進行了仿真實驗,主要結(jié)論如下: (1) 與傳統(tǒng)的態(tài)勢評估方法相比,基于累積前景與三支決策的態(tài)勢評估方法在對目標進行決策時,能夠使得分類結(jié)果更加合理,有利于飛行員做出快速決策,解決了決策困難的問題,更好地滿足戰(zhàn)場快速打擊的需求. (2) 與傳統(tǒng)的三支決策方法相比,本方法在決策過程中引入了累積前景價值,不同的決策者有不同的風險偏好,同一決策者在面對不同戰(zhàn)場態(tài)勢時心理也會發(fā)生變化,從而得到不同的參考點,可以反映出決策者的決策偏好和風險態(tài)度,使決策結(jié)果更符合現(xiàn)實場景. (3) 不同類型的飛行員在面對相同目標時會得到不同的態(tài)勢評估結(jié)果,表明在實際空戰(zhàn)中要充分考慮飛行員的心理,對飛行員類型進行判斷,從而使態(tài)勢評估結(jié)果更符合實際作戰(zhàn)情況.2 基于累積前景理論和三支決策的態(tài)勢評估方法
2.1 計算三支決策的條件概率
2.2 計算結(jié)果矩陣
2.3 計算每個目標的累積前景價值
3 仿真及實驗分析
3.1 仿真分析
3.2 實驗對比與分析
3.3 決策參數(shù)分析
3.4 參數(shù)敏感性分析
4 結(jié)論