国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于馬爾科夫鏈的平臺生存任務(wù)模型與航路評估

2018-03-08 08:53:18李小兵周新志
計算機測量與控制 2018年2期
關(guān)鍵詞:馬爾科夫航路代價

李小兵,周新志,寧 芊

(1.四川大學(xué) 電子信息學(xué)院, 成都 610065; 2.中國電子科技集團(tuán)公司第29研究所 電子信息控制重點實驗室, 成都 610036)

0 引言

在雷達(dá)武器威脅環(huán)境里,飛行平臺通常都需要執(zhí)行一些任務(wù),比如偵查敵方雷達(dá)部署情況,因此飛行平臺不僅需要關(guān)注自身生存率,同時還要考慮能任務(wù)完成的概率。平臺的生存率定義為無傷害返回的的概率[1],對于如何有效求解航路上飛行平臺的生存率問題,目前的研究還較少,已有的方法主要是直接從平臺與雷達(dá)武器的距離關(guān)系模型來建立生存模型,并在此基礎(chǔ)上計算飛行平臺的生存率[2-3]。這種方法只考慮了被發(fā)現(xiàn)和被打擊兩種狀態(tài),并且模型一旦建立就不容易擴展和修改,更重要的是忽略了狀態(tài)之間隨時間的依賴關(guān)系。在任務(wù)方面,目前的研究也主要集中在任務(wù)規(guī)劃方面[4-5],在計算任務(wù)完成率方面,已有的方法也是使用飛行平臺與任務(wù)中心的距離來建立任務(wù)模型,并在此基礎(chǔ)上得到任務(wù)完成的概率。

傳統(tǒng)方法沒能有效刻畫生存模型和任務(wù)模型,也沒能將生存模型和任務(wù)模型有機地統(tǒng)一起來,并且無法直觀地關(guān)注到平臺能完成任務(wù)且無傷害返回的概率。另外傳統(tǒng)方法不能有效地在生存和任務(wù)之間權(quán)衡,對航路的好壞進(jìn)行有效評估。近年來,為了突破傳統(tǒng)方法的制約,有些學(xué)者開始嘗試從隨機過程的角度來對飛行平臺的生存和任務(wù)建立模型,其中最有效地便是使用馬爾科夫鏈模型來建立飛行平臺的生存模型。

基于馬爾科夫鏈的方法,在最初只建立了來兩個狀態(tài)的生存模型[6],后來發(fā)展出了一種五狀態(tài)的生存模型[7-8]?;隈R爾科夫鏈的生存模型能直觀地展現(xiàn),航路上飛行平臺的生存狀態(tài)概率的變化。但是飛行平臺在關(guān)注生存的同時還需要考慮完成任務(wù)的概率,并且還能關(guān)注到不同航路的好壞。為此本文在基于馬爾科夫鏈的生存模型的基礎(chǔ)上加入任務(wù)模型,并建立生存任務(wù)聯(lián)合模型。在生存任務(wù)模型中,能得到無傷害完成任務(wù)的概率計算模型。為了度量航路的好壞,在生存任務(wù)聯(lián)合模型的基礎(chǔ)上,引入生存代價和任務(wù)獎勵,從而得到航路的代價,并以此代價度量航路好壞。

1 生存任務(wù)模型

1.1 生存模型

為了既能體現(xiàn)飛行平臺生存狀態(tài)的真實性和完整性,又能使建模簡單,在此選擇5個生存狀態(tài)。這5個狀態(tài)分別是未被發(fā)現(xiàn)U、被發(fā)現(xiàn)D、被跟蹤T、參與作戰(zhàn)E、被打擊H,通常未被發(fā)現(xiàn)狀態(tài)U作為初始狀態(tài)。H狀態(tài)是吸收態(tài),因為飛行平臺被打擊后會一直處于這個狀態(tài)。生存狀態(tài)之間是隨時間相互依賴的,當(dāng)平臺被跟蹤之前需先被雷達(dá)發(fā)現(xiàn),平臺從被跟蹤到被武器擊中這一過程中還需經(jīng)歷參與作戰(zhàn)這一狀態(tài)。飛行平臺還可以逃離雷達(dá)和武器區(qū),逃離時的狀態(tài)也只能是依次進(jìn)行,從參與作戰(zhàn)狀態(tài)到未被發(fā)現(xiàn)需要依次經(jīng)歷跟蹤和被發(fā)現(xiàn)兩個狀態(tài)。

刻畫生存狀態(tài)之間的依賴關(guān)系,需要用時間連續(xù)狀態(tài)離散的馬爾科夫鏈{X(t)|t>0},其中X(t)代表平臺在時刻t的生存狀態(tài)。時間連續(xù)狀態(tài)離散的馬爾科夫鏈具有馬爾科夫性,即過程的將來狀態(tài)與過程的歷史狀態(tài)無關(guān),只與過程的現(xiàn)在狀態(tài)有關(guān),其具體定義為式(1):

P[X(t+Δ)=j|X(t)=i]=λijΔ,

(1)

其中:i,j表示生存狀態(tài),P是轉(zhuǎn)移概率,λij為轉(zhuǎn)移強度,Δ為無限小時間。馬爾科夫性與平臺的前后狀態(tài)轉(zhuǎn)移關(guān)系保持了一致。由于馬爾科夫性的存在,因此連續(xù)時間離散狀態(tài)的馬爾科夫鏈可充分刻畫飛行平臺生存狀態(tài)之間的關(guān)系,具體模型如圖1所示。在圖1中,S表示雷達(dá)環(huán)境,W表示武器環(huán)境,O表示雷達(dá)武器之外的環(huán)境。

圖1 五狀態(tài)生存模型

1.2 生存任務(wù)聯(lián)合模型

平臺完成任務(wù)狀態(tài)也是隨機的,對于完成任務(wù)狀態(tài)的模型如圖2所示。在圖2中,I表示平臺還未完成任務(wù),F(xiàn)表示平臺完成任務(wù)。F是吸收態(tài),因為平臺一旦完成任務(wù)后就會一直在這個狀態(tài),因此不存在從F到I的轉(zhuǎn)移強度。平臺在任務(wù)執(zhí)行區(qū)域M之外一般不可能完成任務(wù),因此在任務(wù)執(zhí)行區(qū)之外λIF=0。

圖2 任務(wù)模型

為了能使平臺關(guān)注到完成任務(wù)且無傷害返回的概率psm,為此需要將生存模型和任務(wù)模型聯(lián)合起來,具體聯(lián)合形式如圖3所示。圖3中包含了所有可能存在的聯(lián)合狀態(tài)及狀態(tài)間的轉(zhuǎn)移關(guān)系,總共包含十個狀態(tài),UI、DI、TI、EI和HI分別為未被發(fā)現(xiàn)、被發(fā)現(xiàn)、被跟蹤、參與作戰(zhàn)和被打擊時還未完成任務(wù)的狀態(tài),同樣UF、DF、TF、EF和HF表示為相應(yīng)生存狀態(tài)時已完成任務(wù)的狀態(tài)。在聯(lián)合模型中,狀態(tài)UI一般作為起始狀態(tài)。

圖3 生存-任務(wù)模型

在圖3水平方向上,生存狀態(tài)并不取決于是否完成任務(wù),那么此方向的狀態(tài)轉(zhuǎn)移與生存模型里的狀態(tài)轉(zhuǎn)移保持一致。在垂直方向上,完成任務(wù)的概率并不取決于生存狀態(tài),那么此方向的狀態(tài)轉(zhuǎn)移與任務(wù)模型里的狀態(tài)轉(zhuǎn)移保持一致。當(dāng)平臺處于HI狀態(tài)時仍有機會轉(zhuǎn)移到HF狀態(tài),除非平臺完全被擊毀。于是在生存-任務(wù)模型里,平臺完成任務(wù)且無傷害返回的概率可表達(dá)為式(2):

psm=pUF+pDF+pTF+pEF

(2)

1.3 轉(zhuǎn)移強度與環(huán)境

生存任務(wù)模型中的轉(zhuǎn)移關(guān)系由轉(zhuǎn)移強度λ來刻畫。轉(zhuǎn)移強度由飛行平臺所在的環(huán)境提供,未被標(biāo)識的轉(zhuǎn)移強度為0,表示此環(huán)境下狀態(tài)轉(zhuǎn)移不可能發(fā)生。不同的環(huán)境提供不同的轉(zhuǎn)移強度。在環(huán)境O里λET>0,λTD>0,λDU>0,其他為0,表示離開雷達(dá)武器區(qū)域,朝著更安全的狀態(tài)轉(zhuǎn)移。在環(huán)境O的基礎(chǔ)上,環(huán)境S里增加了λUD>0,λDT>0,表示有被雷達(dá)發(fā)現(xiàn)和跟蹤的可能。環(huán)境W在環(huán)境S的基礎(chǔ)上還提供了λTE>0,λEH>0,表示有參與作戰(zhàn)和被打擊的可能。

狀態(tài)轉(zhuǎn)移強度的大小可由1/τij來衡量。在生存模型中,τij反映了地面雷達(dá)武器系統(tǒng)的平均反應(yīng)時間或狀態(tài)切換時間。在任務(wù)模型中,τij表示完成任務(wù)所需的平均時間。雷達(dá)武器威脅環(huán)境,提供的轉(zhuǎn)移強度模型使用三種模型[9]中的常數(shù)模型,實際具體的取值應(yīng)由領(lǐng)域?qū)<医o出。

雷達(dá)、武器及任務(wù)的物理模型,可抽象為二維圓域或三維球域,這樣不僅建模簡潔,又不會失去對雷達(dá)武器主要性質(zhì)的把握,更多關(guān)于雷達(dá)武器的模型可參考一些專家的建議[1]。武器通常被探測雷達(dá)包圍,因為武器需要雷達(dá)來探測、跟蹤及鎖定飛行目標(biāo)。當(dāng)然雷達(dá)與雷達(dá)以及武器與武器之間還可以相互重疊,以表示雷達(dá)之間以及武器之間能相互合作,對于在重疊區(qū)域的轉(zhuǎn)移強度的計算,可使用已有的方法[9]。另外飛行平臺能執(zhí)行任務(wù)的區(qū)域,通常被雷達(dá)武器包圍著,這是符合實際情況的。

2 航路評估

2.1 狀態(tài)概率計算

為了能評估航路上飛行平臺每個狀態(tài)概率隨時間的變化,需要求解狀態(tài)概率,連續(xù)時間離散狀態(tài)的馬爾科夫鏈框架為求解狀態(tài)概率提供了解決思路。首先構(gòu)造轉(zhuǎn)移強度矩陣Λ(t),然后通過求解(3)式所示的微分方程,以此得到狀態(tài)概率向量p(t)。

(3)

其中狀態(tài)概率向量p(t)的第j個元素為狀態(tài)j的概率pj(t),且狀態(tài)概率向量的初始形式為:

若以Λij(t)來表示轉(zhuǎn)移強度矩陣Λ(t)第i行第j列的元素,則Λij(t)的具體形式為:

由于飛行平臺在不同時間可能處于不同的威脅環(huán)境里,因此整個飛行航路上的轉(zhuǎn)移強度矩陣Λ(t)是隨時間變化的。設(shè)威脅環(huán)境k里的轉(zhuǎn)移強度矩陣為Λk,時間長度為tn,因而在航路上Λ(t)的取值為:

由于生存任務(wù)模型的狀態(tài)只有十個,是有限數(shù)量的,而且Λ(t)在某一時間段里為常矩陣,因此(3)式可用式(4)方法來求解。

p(tn) =eΛn-1 T·(tn -tn-1 )p(tn-1)

(4)

在(4)式中需要求解矩陣指數(shù),對于矩陣Λ的矩陣指數(shù)的求解方法為:

2.2 航路代價計算

在得到飛行平臺狀態(tài)概率的基礎(chǔ)上,為了在生存和任務(wù)兩方面度量航路的好壞,在此引入兩類代價,一類是單位時間狀態(tài)保持代價bi,一類是單位時間狀態(tài)轉(zhuǎn)移代價cij。用v(t)表示在時刻t飛行平臺在航路上的期望累積代價,累積代價量化了航路對于飛行平臺在生存和任務(wù)兩方面的好壞。記x(t)=[p(t),v(t)]T,于是有關(guān)期望累積代價的微分方程如式(5)和式(6)所示:

(5)

(6)

式(6)中A(t)是一個矩陣,其具體形式為:

求解式(6)使用式(7)所示的迭代方法。

x(tn) =eAn-1 ·(tn -tn-1 )x(tn-1)

(7)

代價參數(shù)bi是關(guān)于平臺生存狀態(tài)的代價。bH*=0,因為H是吸收態(tài),當(dāng)平臺處于此狀態(tài)便不再離開。當(dāng)平臺處于U狀態(tài)時,這時對于平臺來說是很安全的,因此bU*=0。當(dāng)平臺處于其他生存狀態(tài)時,應(yīng)當(dāng)假定bE*≥bT*≥bD*≥0,因為平臺處于狀態(tài)D、T和E時,受到的威脅逐漸增強。代價參數(shù)cij是關(guān)于生存狀態(tài)轉(zhuǎn)移的代價參數(shù),其中cE*,H*≥0,其他生存狀態(tài)轉(zhuǎn)移的代價為0,因為其他生存狀態(tài)轉(zhuǎn)移代價可歸于狀態(tài)代價。對于任務(wù)狀態(tài)轉(zhuǎn)移來說,平臺從未完成任務(wù)轉(zhuǎn)移到完成任務(wù)狀態(tài)的過程,應(yīng)當(dāng)?shù)玫絛F的獎勵,dF的大小衡量了任務(wù)的重要性。于是航路評估就可以在生存和任務(wù)之間進(jìn)行權(quán)衡,比如在任務(wù)區(qū),即使生存率會很低,如果任務(wù)很重要,則可能dF>cE*,H*。代價參數(shù)具體描述如式(8)和式(9):

b=[0,bD*,bT*,bE*,0]

(8)

(9)

3 仿真設(shè)計與結(jié)果分析

3.1 場景設(shè)置與仿真結(jié)果

圖4展示了一個二維場景,在此場景中放置了三個雷達(dá)和兩個武器,并放置了兩條航路和兩個任務(wù)區(qū),任務(wù)和武器都被雷達(dá)覆蓋。兩條航路的起點均為(0,0),終點均為(300,-25),航路2是由航路1通過改變有限個路標(biāo)點的Y方向的值得到,并以兩條航路中間的公共點作為分界點將航路分成前段和后段。

圖4 包含航路、雷達(dá)武器及任務(wù)的場景

環(huán)境O、S、W及M中的轉(zhuǎn)移強度設(shè)置如表1所示,平臺生存代價參數(shù)的設(shè)置如表2所示。平臺在0.3個單位時間(min)里以1.2 km的航程速度飛行。仿真結(jié)果中,圖5至圖8分別顯示了平臺在航路1和航路2上狀態(tài)概率隨時間的變化,圖中的曲線代表狀態(tài)概率面積圖的外側(cè)輪廓線。圖9顯示了兩條航路上完成任務(wù)且無傷害返回概率的變化。圖10顯示了完成任務(wù)的獎勵值dF分別取0、50、300和600時兩條航路上的代價變化。

表1 轉(zhuǎn)移強度設(shè)置

表2 生存代價參數(shù)設(shè)置

圖5 航路1有關(guān)任務(wù)未完成狀態(tài)的概率

圖6 航路1有關(guān)任務(wù)完成狀態(tài)的概率

圖7 航路2有關(guān)任務(wù)未完成狀態(tài)的概率

圖8 航路2有關(guān)任務(wù)完成狀態(tài)的概率

圖9 完成任務(wù)且無傷害返回概率

圖10 不同dF值時航路1(黑色)和 航路2(灰色)的代價變化

3.2 結(jié)果分析

圖5至圖8的狀態(tài)概率變化反映了兩條航路所經(jīng)過的環(huán)境。最開始平臺處于環(huán)境O,這時只有UI狀態(tài),當(dāng)飛行平臺進(jìn)入雷達(dá)環(huán)境S時,有關(guān)生存狀態(tài)D和T的概率迅速增加,而關(guān)于作戰(zhàn)E和被打擊H狀態(tài)只在平臺進(jìn)入武器環(huán)境W里發(fā)生。當(dāng)平臺經(jīng)過任務(wù)區(qū)M時,關(guān)于完成任務(wù)F狀態(tài)的概率開始增加。

在航路的前一段,航路2比航路1關(guān)于DI和TI的狀態(tài)概率增加得更多。這與航路2的前段經(jīng)過兩雷達(dá)的重疊區(qū)相一致,因為在雷達(dá)重疊區(qū)具有更強發(fā)現(xiàn)和跟蹤能力。在航路的后一段,雖然航路2經(jīng)過了武器重疊區(qū),但最終航路2與航路1的被打擊時已完成任務(wù)HF狀態(tài)概率相差不大,這與兩條航路后段經(jīng)過相同的任務(wù)區(qū),且兩武器區(qū)有相同的最好武器相一致。

從任務(wù)狀態(tài)概率來看,在圖6和圖8中,航路2比航路1關(guān)于完成任務(wù)F的狀態(tài)概率多一次增加的過程。這與航路2比航路1在前段多經(jīng)過一個任務(wù)區(qū)相一致。從圖9中的完成任務(wù)且無傷害返回的概率上看,航路2比航路1多一次上升過程,這與航路2的前半段經(jīng)過了一個任務(wù)區(qū)區(qū)相一致。在終點時,航路2的psm明顯大于航路1的psm,從這個角度來說,航路2好于航路1。如果平臺很注重能完成任務(wù)且能無傷害返回,那么此時就可為飛行平臺提供決策支持。

從psm的角度不能完全衡量航路的好壞,因為不能在任務(wù)和生存之間進(jìn)行權(quán)衡。圖10顯示了不同dF值時兩條航路累積代價的變化,其中較粗的黑實線是航路2的代價曲線,灰色曲線代表航路1的代價曲線。dF的不同取值衡量了任務(wù)相對生存的重要性。當(dāng)不考慮任務(wù)只考慮生存時,航路2的累積代價更高,此時航路1優(yōu)于航路2。當(dāng)dF=50時,航路2與航路1的代價都有所降低,且它們之間的差距在縮小,但航路2的代價依然高于航路1的代價。當(dāng)dF=300時,兩條航路最終的代價幾乎一樣,此時兩條航路無明顯好壞。當(dāng)dF=600時,航路2的代價明顯比航路1的代價低,這時航路2反而比航路1更好。

4 結(jié)論

本文采用馬爾科夫鏈的方法,將飛行平臺的生存和任務(wù)看作是隨機過程,并分別對生存和任務(wù)來建立模型,然后有效統(tǒng)一生存模型和任務(wù)模型。在生存任務(wù)模型的基礎(chǔ)上,對計算航路代價,并以此代價有效地衡量了航路有關(guān)生存和任務(wù)兩方面的好壞。基于馬爾科夫鏈的方法能直觀地展現(xiàn)了狀態(tài)和航路代價隨時間的變化,也展現(xiàn)了不同航路上能完成任務(wù)且無傷害返回的概率變化,并對航路進(jìn)行有效評估。狀態(tài)概率、航路代價都可為飛行平臺在生存和任務(wù)兩方面提供決策支持。

[1] Helldin T,Erlandsson T. Automation guidelines for introducing survivability analysis in future fighter aircraft[A]. Proceedings 28th Congress of International Council of the Aeronautical Sciences[C]. Brisbane,Australia:ICAS,2012:1-10.

[2] 郭鳳娟,張 安,張耀中,等. 高空無人偵察機生存力仿真研究[J]. 西北工業(yè)大學(xué)學(xué)報,2009,27(6):827-832.

[3] 李壽安,宋筆鋒,李東霞. 飛機在單個射彈打擊下的生存概率分析[J].哈爾濱工業(yè)大學(xué)學(xué)報,2009,41(3):121-124.

[4] 蔡凌峰,傅愛萍,成海東. 無人機任務(wù)動態(tài)重規(guī)劃方法[J].指揮信息系統(tǒng)與技術(shù),2013,4(6):31-36,79.

[5] 羅 賀,秦英祥,王國強,等. 一種無人機偵察能力評估模型[J].火力與控制指揮,2016,41(2):7-12.

[6] Erlandsson T,Niklasson L. An air-to-ground combat survivability model[J]. Journal of Defense Modeling and Simulation: Applications,Methodology,Technology,2015,12(3):273-287.

[7] Erlandsson T,Niklasson L. Comparing Air Mission Routes from a Combat Survial Perspective[A]. Proceedings of the 26th International Florida Artificial Intelligence Research Society Conference[C]. Palo Alto,California:AAAI Press,2013:58-63.

[8] Erlandsson T,Niklasson L. Automatic evaluation of air mission routes with respect to combat survial[J]. Information Fusion,2014,20(11):88-98.

猜你喜歡
馬爾科夫航路代價
基于疊加馬爾科夫鏈的邊坡位移預(yù)測研究
基于實時航路的PFD和ND的仿真研究
基于改進(jìn)的灰色-馬爾科夫模型在風(fēng)機沉降中的應(yīng)用
愛的代價
海峽姐妹(2017年12期)2018-01-31 02:12:22
代價
馬爾科夫鏈在教學(xué)評價中的應(yīng)用
應(yīng)召反潛時無人機監(jiān)聽航路的規(guī)劃
托勒密世界地圖與新航路的開辟
成熟的代價
基于Event改進(jìn)模型的交叉航路碰撞風(fēng)險評估
庆元县| 柘荣县| 叶城县| 和林格尔县| 墨江| 盐津县| 万年县| 马边| 沛县| 绵竹市| 仙居县| 西宁市| 寿阳县| 肥城市| 金沙县| 伊宁县| 交城县| 教育| 深水埗区| 阜平县| 武邑县| 鸡泽县| 涿州市| 西宁市| 雅江县| 崇义县| 抚宁县| 梧州市| 黑山县| 灵武市| 长汀县| 阆中市| 龙南县| 天峨县| 女性| 灌南县| 松滋市| 永州市| 江油市| 简阳市| 鄄城县|