吳學(xué)禮,董虎翼,闞海龍,甄 然
(1.河北科技大學(xué)電氣工程學(xué)院,河北石家莊 050018;2.河北省生產(chǎn)過(guò)程自動(dòng)化工程技術(shù)研究中心,河北石家莊 050018)
沖突解脫方法分為離散型和連續(xù)型2種解脫方法[1]。離散型解脫方法將解脫過(guò)程按等時(shí)間或等距離劃分,將整體航跡離散成多段航跡,多段最優(yōu)達(dá)到整體最優(yōu),以智能算法為代表;連續(xù)型解脫方法可用速度障礙法、最優(yōu)控制等方法計(jì)算出無(wú)威脅航線,通過(guò)調(diào)整航向、調(diào)整速度和調(diào)整高度3種解脫策略完成沖突解脫[2]。
離散化方法,如采用智能算法[3-8]進(jìn)行路徑規(guī)劃,規(guī)劃出的路徑存在無(wú)人機(jī)機(jī)動(dòng)次數(shù)較多的問(wèn)題,且為全局規(guī)劃算法,求解計(jì)算量大,不適合實(shí)時(shí)規(guī)劃。連續(xù)型方法,如速度障礙法[9-12],通過(guò)調(diào)整無(wú)人機(jī)的相對(duì)速度使其與保護(hù)區(qū)相切或相離,即可求解出相應(yīng)的解脫速度,消除潛在威脅,其缺點(diǎn)在于面對(duì)多機(jī)沖突解脫時(shí)無(wú)法求出最優(yōu)解。人工勢(shì)場(chǎng)法[13-14],障礙物周圍為斥力場(chǎng),目標(biāo)地點(diǎn)周圍為引力場(chǎng),通過(guò)引力與斥力的相互作用使無(wú)人機(jī)沿?zé)o沖突的航跡飛行,但人工勢(shì)場(chǎng)法會(huì)使無(wú)人機(jī)出現(xiàn)不符合轉(zhuǎn)角約束或速度約束的解。也有諸多學(xué)者采用其他方法對(duì)解脫方法有新的見(jiàn)解。文獻(xiàn)[15]提出了一種考慮風(fēng)力預(yù)測(cè)不確定性影響的飛行器沖突探測(cè)與解脫方法,將風(fēng)分量作為隨機(jī)變量,最接近距離和沖突概率作為發(fā)生飛行沖突的指標(biāo),考慮了合作型和非合作型解脫的情況。文獻(xiàn)[16]針對(duì)多機(jī)飛行沖突問(wèn)題,提出了一種深度強(qiáng)化學(xué)習(xí)算法,建立了基于馬爾可夫決策過(guò)程的多機(jī)飛行沖突問(wèn)題模型,采用獨(dú)立深度Q網(wǎng)絡(luò)算法對(duì)模型進(jìn)行求解。文獻(xiàn)[17]將解脫時(shí)產(chǎn)生的額外飛行距離作為代價(jià)函數(shù),針對(duì)該問(wèn)題提出雙層優(yōu)化策略,以航向解脫策略為基礎(chǔ),先利用隨機(jī)并行梯度下降法搜索初始解,再用序列二次規(guī)劃求得最優(yōu)解,最后采用蒙特卡洛法對(duì)算法進(jìn)行可靠性評(píng)價(jià)。以上研究都是基于單機(jī)解脫的研究或沒(méi)有考慮合作解脫。
為了節(jié)省空域資源,需要兩無(wú)人機(jī)或是多無(wú)人機(jī)共同完成沖突解脫,多方參與涉及到各方的利益分配問(wèn)題,基于博弈論的方法可使各方的利益達(dá)到最優(yōu)。文獻(xiàn)[18]將合作博弈概念用在沖突解脫過(guò)程中,利用最優(yōu)化理論將聯(lián)盟福利最優(yōu)解作為博弈雙方最優(yōu)解脫策略,實(shí)現(xiàn)了支付代價(jià)最小前提下的實(shí)時(shí)沖突解脫。文獻(xiàn)[19]提出了博弈中的效用函數(shù),構(gòu)建了合作博弈沖突解脫模型,提出以聯(lián)盟福利最優(yōu)解均衡各參與人效益,并仿真模擬了多架無(wú)人機(jī)沖突的情形,取得了較好效果。文獻(xiàn)[20]為解決沖突解脫過(guò)程中個(gè)體支付成本不公平的問(wèn)題,提出基于合作博弈“核仁解”概念的多機(jī)沖突解脫算法,再提出基于人工勢(shì)場(chǎng)法-蟻群法的沖突解脫混合求解策略。文獻(xiàn)[21]同樣提出了基于“核仁解”的無(wú)人機(jī)協(xié)作沖突解脫算法,構(gòu)建沖突解脫“分支”模型并設(shè)計(jì)額外支付成本矩陣,最后改進(jìn)遺傳算法進(jìn)行仿真。
本文針對(duì)文獻(xiàn)[9]依據(jù)速度障礙法建立了沖突探測(cè)模型,利用幾何關(guān)系推導(dǎo)出單無(wú)人機(jī)解脫所需改變的速度或航向角的情況,利用無(wú)人機(jī)運(yùn)動(dòng)學(xué)方程建立沖突探測(cè)模型,得到最小距離的時(shí)間公式,將最小距離視為安全距離,由此反解出所改變的速度或航向角。與文獻(xiàn)[9]相比,本方法省去了利用幾何關(guān)系一一推導(dǎo)所需改變的速度或航向角值。關(guān)于沖突解脫方法的改進(jìn)以博弈論中的鷹鴿博弈為模型,在雙方信息不完全的情況下,采用貝葉斯博弈分析鷹鴿博弈模型,基于各種策略的收益列出雙方期望效用函數(shù),通過(guò)分析期望效用決定博弈雙方采用何種解脫策略,而不是針對(duì)單機(jī)解脫的純策略進(jìn)行研究。
為了便于分析與計(jì)算,對(duì)模型進(jìn)行一些假設(shè)與規(guī)定,使問(wèn)題簡(jiǎn)化:
1)規(guī)定兩無(wú)人機(jī)在解脫初期時(shí)飛行狀態(tài)均不發(fā)生改變,做勻速飛行。根據(jù)外推法可以推測(cè)出何時(shí)、何位置發(fā)生飛行沖突;
2)為便于分析,使無(wú)人機(jī)都處于同一高度飛行,將三維問(wèn)題降維壓縮到二維平面;
圖1 無(wú)人機(jī)安全區(qū)域示意圖 Fig.1 Schematic diagram of UAV safety area
3)依據(jù)國(guó)際民航組織(ICAO)和空域安全專家組(SASP)的相關(guān)規(guī)定,基于雷達(dá)服務(wù)下的最小安全間隔為5 nmile(約9.26 km);
4)無(wú)人機(jī)的保護(hù)區(qū)域可以確定為以無(wú)人機(jī)質(zhì)心為中心的圓柱,在二維平面下忽略高度,安全區(qū)域?yàn)橐詿o(wú)人機(jī)質(zhì)心為中心,半徑R=5 nmile的圓,如圖1所示。
假設(shè)本機(jī)與入侵機(jī)的初始位置分別為A(X1,Y1)、B(X2,Y2);速度分別為V1,V2;航向角分別為α,β。由此可以列出本機(jī)與入侵機(jī)關(guān)于時(shí)間的運(yùn)動(dòng)方程:
本 機(jī):
(1)
入侵機(jī):
(2)
由式(1)和式(2)可以得到本機(jī)與入侵機(jī)關(guān)于時(shí)間的距離函數(shù)D(t):
(3)
為計(jì)算方便,將式(3)平方后展開(kāi),展開(kāi)后為關(guān)于時(shí)間t的一元二次函數(shù),配方后得到式(4):
(4)
當(dāng)
(5)
D2(t)有最小值:
(6)
(7)
在飛行初期依據(jù)此公式可以判斷何時(shí)發(fā)生飛行沖突,當(dāng)兩無(wú)人機(jī)的距離D (8) 依據(jù)此公式也可判斷無(wú)人機(jī)何時(shí)完成沖突解脫,當(dāng)執(zhí)行解脫策略后,將該時(shí)刻的位置作為初始位置,當(dāng)Dmin=R時(shí)沖突解脫結(jié)束。最小距離與兩無(wú)人機(jī)的速度V1,V2,航向角α,β有關(guān)。當(dāng)執(zhí)行其中一種解脫策略時(shí),必定有相應(yīng)的速度值或航向角值使Dmin=R,通過(guò)相應(yīng)的解脫策略改變至對(duì)應(yīng)的速度或航向角,那么在經(jīng)過(guò)時(shí)間t后,會(huì)出現(xiàn)兩機(jī)距離Dmin=R,進(jìn)而實(shí)現(xiàn)沖突解脫。 求解速度值或航向角值的方法公式比較繁瑣,尤其是求解航向角時(shí)涉及三角函數(shù),所以直接求解較為麻煩。用麻雀搜索算法來(lái)計(jì)算速度或航向角的變化值,設(shè)置算法的目標(biāo)函數(shù)F為兩無(wú)人機(jī)的距離公式D: D=(X1+V1cosα·t-X2-V2cosβ·t)2+(Y1+V1sinα·t-Y2-V2sinβ·t)2。 (9) 首先算法初始化輸入大量隨機(jī)的速度值或航向角值,然后由式(5)計(jì)算出兩無(wú)人機(jī)達(dá)到最小距離的時(shí)間,再代入距離函數(shù)中求得目標(biāo)函數(shù)值F: (10) 當(dāng)兩無(wú)人機(jī)相對(duì)距離D 鷹鴿博弈是博弈論模型中的一種,用來(lái)描述大自然中鷹和鴿子的生存與進(jìn)化。鷹作為一種天性兇猛的物種,鴿子作為一種天性溫順的物種。當(dāng)鷹與鷹發(fā)現(xiàn)食物時(shí)會(huì)相互競(jìng)爭(zhēng),會(huì)出現(xiàn)你死我活爭(zhēng)搶的場(chǎng)景;當(dāng)鴿子與鴿子發(fā)現(xiàn)食物時(shí)會(huì)相互分享,會(huì)出現(xiàn)謀求和平的場(chǎng)景;當(dāng)鷹與鴿子相遇時(shí)會(huì)出現(xiàn)鴿子逃走、鷹占據(jù)食物的場(chǎng)景。 表1 鷹鴿博弈收益矩陣Tab.1 Income matrix of eagle pigeon game 針對(duì)上述現(xiàn)象,基于博弈論的知識(shí)將上述現(xiàn)象的收益進(jìn)行整理與分類。假設(shè)得到的收益為v,鴿子與鴿子之間相互分享,各自收益為v/2;鷹與鷹之間相互競(jìng)爭(zhēng)會(huì)平分利益,但競(jìng)爭(zhēng)也會(huì)帶來(lái)c/2的損失,所以各自的收益為(v-c)/2;鴿子與鷹的相遇使得鷹的收益為v,鴿子收益為0。表1為收益矩陣。 鷹鴿博弈模型存在純策略均衡與混合策略均衡。純策略為完全偏向一種策略,即100%的選擇其中一種策略;混合策略則是參與人以某種概率隨機(jī)選擇不同策略,由于混合策略伴隨的是支付的不確定性,因此參與人關(guān)心的是其期望收益。 在博弈過(guò)程中己方只知道自己采取的策略,對(duì)于對(duì)手采取的策略不得而知,在對(duì)方信息不完全的情況下,利用靜態(tài)貝葉斯博弈來(lái)分析博弈參與者的期望收益。令G為貝葉斯博弈: G={N,{Ai}{Θi}{ui},p}, (11) 式中:N是玩家集;{Ai}是策略集,表示博弈雙方可采取每種策略組成的集合;{Θi}是狀態(tài)集,表示每一方所擁有的“私有信息”;{ui}表示效用;p為狀態(tài)集下的聯(lián)合分布率。 鷹鴿策略下的貝葉斯博弈,其中N={N1,N2};A={A1={鷹,鴿};A2={鷹,鴿}};Θ={Θ1={A1=鷹,A2=鷹,鴿;A1=鴿,A2=鷹,鴿};Θ2={A2=鷹,A1=鷹,鴿;A2=鴿,A1=鷹,鴿}}。 依據(jù)貝葉斯納什均衡的概念,在不完全信息靜態(tài)博弈中,博弈雙方行動(dòng)同時(shí)發(fā)生,沒(méi)有哪一方能夠有機(jī)會(huì)觀察其他方的選擇。在給定其他博弈方的策略條件下,每個(gè)博弈方的最優(yōu)策略依賴于自己的類型。如果每個(gè)博弈方不知道其他博弈方實(shí)際選擇什么策略,但是,只要知道其他博弈方有關(guān)類型的概率分布,就能夠正確地預(yù)測(cè)其他博弈方的選擇與其各自的有關(guān)類型之間的關(guān)系。因此,該博弈方選擇的依據(jù)就是在給定自己的類型,以及其他博弈方的類型與策略選擇之間關(guān)系的條件下,使得自己的期望收益最大化。 計(jì)算期望收益使用的是期望效應(yīng)函數(shù)。該理論闡述的是隨機(jī)變量X所屬集合X={Xi,i∈N+},其隨機(jī)變量的概率分布為 P(X=Xi)=Pi,i=1,2,…,n。 (12) 確定的選擇Xi的效用為u(Xi),那么該隨機(jī)變量的效用表示為 (13) 式中:E[u(X)]為離散型隨機(jī)變量X的期望效用;U(X)為期望效用函數(shù)。 在鷹鴿博弈中,博弈雙方都會(huì)采取鷹策略或是鴿策略其中一種,但一方無(wú)法完全確認(rèn)是哪一種策略。假設(shè)在鷹鴿博弈模型中,博弈方1選擇鷹的概率為p,選擇鴿子的概率為(1-p);博弈方2選擇鷹的概率為q,選擇鴿子的概率為(1-q)。 根據(jù)表1的收益矩陣可以列出博弈雙方的期望效用函數(shù): (14) 為了求出基于鷹鴿策略的貝葉斯納什均衡解,令博弈雙方的期望效用函數(shù)的偏導(dǎo)數(shù)為0,得到: (15) 解得 (16) 對(duì)于博弈1方來(lái)說(shuō)的最優(yōu)條件是博弈2方以v/c的概率選擇鷹策略,以(1-v/c)的概率選擇鴿策略;同理,對(duì)于博弈方2來(lái)說(shuō)最優(yōu)條件是博弈方1以v/c的概率選擇鷹策略,以(1-v/c)的概率選擇鴿策略。 此博弈的混合策略納什均衡解為 (17) 由于鷹鴿博弈歸根結(jié)底是因?yàn)楦?jìng)爭(zhēng)來(lái)獲取收益,所以獲得收益要小于競(jìng)爭(zhēng)帶來(lái)的損失,因此v 表2 解脫策略收益矩陣Tab.2 Income matrix of relief strategy 將此模型應(yīng)用到?jīng)_突解脫策略中,將調(diào)速策略和航向策略表示為模型中的鷹和鴿子。由于調(diào)速策略操作方便,沒(méi)有多余路程的消耗,收益較大,因此將鷹比作調(diào)速策略;航向策略需要改變航向,產(chǎn)生額外的飛行路程,將鴿子比作航向策略。將對(duì)應(yīng)策略替換為鷹鴿博弈收益矩陣中的各項(xiàng),詳細(xì)數(shù)據(jù)見(jiàn)表2。 1/3作為該模型的納什均衡解,將概率區(qū)間[0,1]改為3個(gè)正整數(shù)(0,1,2),從3個(gè)數(shù)中隨機(jī)選取1個(gè)數(shù),當(dāng)取值為0時(shí)表示概率值的取值在[0,1/3);取值為1時(shí)表示概率值為1/3;取值為2時(shí)表示概率值的區(qū)間為(1/3,1]。該值表示本機(jī)選擇調(diào)速策略的概率,如果小于1/3本機(jī)選擇航向解脫策略,反之選擇速度解脫策略。 依據(jù)解脫策略收益矩陣計(jì)算博弈雙方的期望效用可以得到: 1) 當(dāng)本機(jī)選擇調(diào)速策略的概率小于p*,即p<1/3,入侵機(jī)選擇的最優(yōu)解脫策略為調(diào)速策略; 2) 當(dāng)本機(jī)選擇調(diào)速策略的概率大于p*,即p>1/3,入侵機(jī)選擇的最優(yōu)解脫策略為航向策略; 3) 當(dāng)本機(jī)選擇調(diào)速策略的概率等于p*,即p=1/3,入侵機(jī)選擇二者之一無(wú)任何差異。 沖突解脫策略完成后,為節(jié)省無(wú)人機(jī)燃料的消耗、減少航跡的偏離,需要解脫完成后執(zhí)行恢復(fù)策略。執(zhí)行完調(diào)速策略后,各無(wú)人機(jī)分別將速度恢復(fù)至初始速度大?。粓?zhí)行完航向策略后,各無(wú)人機(jī)分別改變航向角至初始航線,之后繼續(xù)朝向目標(biāo)點(diǎn)飛行。在初步仿真完成后發(fā)現(xiàn),如若立即執(zhí)行航跡恢復(fù)策略會(huì)出現(xiàn)兩機(jī)距離仍在減小的情況,因此對(duì)2種解脫策略出現(xiàn)該情況進(jìn)行了分析與解決。 將無(wú)人機(jī)視為質(zhì)點(diǎn),通過(guò)式(5)求出的達(dá)到安全距離的時(shí)間是第1次本機(jī)與入侵機(jī)安全距離為相切狀態(tài)的時(shí)間。雖為相切狀態(tài),但此時(shí)恢復(fù)速度距離仍會(huì)減小,因此兩無(wú)人機(jī)仍需繼續(xù)按當(dāng)前速度飛行一段距離,這一段距離是由無(wú)人機(jī)的初始速度V計(jì)算而得。 圖2 調(diào)速策略恢復(fù)示意圖 Fig.2 Schematic diagram of speed regulation strategy recovery 假設(shè)本機(jī)、入侵機(jī)改變速度后,當(dāng)兩機(jī)距離為R時(shí)的位置記為A(x1,y1)、B(x2,y2),速度為V1′,V2′,兩機(jī)從A,B點(diǎn)按原速度V1,V2飛行,由式(5)計(jì)算出兩機(jī)距離為安全距離R的時(shí)間t1,經(jīng)過(guò)時(shí)間t1后兩無(wú)人機(jī)的位置記為A′(x1′,y1′)和B′(x2′,y2′),此時(shí)兩機(jī)為初始速度下的相切狀態(tài),如圖2所示。 以本機(jī)為例,本機(jī)仍需飛行的距離|AA′|,計(jì)算方法如下: (18) 當(dāng)無(wú)人機(jī)繼續(xù)飛行此段距離或在此之后恢復(fù)至初始速度,不會(huì)出現(xiàn)距離逐漸減小的情況。 圖3 航向策略恢復(fù)示意圖 Fig.3 Schematic diagram of heading strategy recovery 式(5)求出達(dá)到安全距離的時(shí)間是第1次兩機(jī)為相切狀態(tài)的時(shí)間,因此需要按當(dāng)前航向繼續(xù)飛行一段距離。用相對(duì)速度法的思想進(jìn)行分析,設(shè)VR為兩機(jī)的相對(duì)速度,VR=V2-V1,執(zhí)行航向策略后視入侵機(jī)為靜止,新的航向角為α,本機(jī)向入侵機(jī)的方向飛行,當(dāng)本機(jī)與入侵機(jī)的安全范圍(圓心記為O)為相切狀態(tài)時(shí)(切點(diǎn)記為P),此時(shí)兩機(jī)距離為R,兩機(jī)繼續(xù)沿當(dāng)前航向飛行,當(dāng)本機(jī)的位置在圓外一點(diǎn)(記為A″)且從該點(diǎn)引的2條切線其中一條為第1次本機(jī)與入侵機(jī)安全范圍為相切狀態(tài)時(shí)的切線,由切線長(zhǎng)定理可知,2條切線長(zhǎng)度相等(第2條切線與遠(yuǎn)航路交于A′)且2個(gè)切點(diǎn)(另一個(gè)切點(diǎn)記為P′)關(guān)于A″O對(duì)稱,如圖3所示。 則本機(jī)仍需飛行的距離記為|PA″|,計(jì)算方法如下: |PA″|=R·tanα, (19) 式中α為相對(duì)速度下的航向角,因此在計(jì)算飛行該段距離的時(shí)間時(shí)也應(yīng)使用相對(duì)速度VR計(jì)算。 針對(duì)上述2種恢復(fù)策略,雙機(jī)解脫時(shí)2架無(wú)人機(jī)都需執(zhí)行對(duì)應(yīng)的恢復(fù)策略,然而2種恢復(fù)策略下的飛行距離不同導(dǎo)致恢復(fù)時(shí)間不同,2種方法計(jì)算的位置均為2架無(wú)人機(jī)之間為安全距離的位置,在此位置或之后恢復(fù)航跡均不會(huì)出現(xiàn)距離減小的情況,計(jì)算出采取恢復(fù)策略的時(shí)間后,以恢復(fù)策略時(shí)間長(zhǎng)的時(shí)間為基準(zhǔn)。 仿真運(yùn)行環(huán)境為MATLAB R2016b。仿真選用的無(wú)人機(jī)類型是由中國(guó)研制的高空高速長(zhǎng)航時(shí)察打一體的無(wú)人機(jī)WJ-700“獵鷹”,該無(wú)人機(jī)航時(shí)可達(dá)20 h,航程超過(guò)10 000 km,最大速度可達(dá)700 km/h(194 m/s),飛行高度可在12 000 m以上。 圖4所示為沖突場(chǎng)景的3種類型。其中交叉沖突因?yàn)楹铰方徊娼堑那闆r分為2種類型。 圖4 飛行沖突類型Fig.4 Flight conflict types 表3 兩無(wú)人機(jī)初始狀態(tài)Tab.3 Initial states of two UAVs 為了驗(yàn)證本文方法的有效性,將上述3種沖突場(chǎng)景進(jìn)行仿真模擬。表3給出了各個(gè)場(chǎng)景下2架無(wú)人機(jī)的起始位置、速度及航向角。設(shè)置無(wú)人機(jī)飛行高度在10 000 m,飛行空域范圍為100 km×100 km,無(wú)人機(jī)安全區(qū)域半徑R=9.26 km,執(zhí)行解脫策略的位置為2倍的安全區(qū)域半徑,速度變化范圍V∈[0.5V,194 m/s],航向角變化范圍Δθ∈[-π/2,π/2]。 以下3種沖突場(chǎng)景,每一種場(chǎng)景都會(huì)試驗(yàn)2.3節(jié)中結(jié)論的1種。 場(chǎng)景1為兩機(jī)對(duì)向沖突的場(chǎng)景(見(jiàn)圖5—圖7)。該場(chǎng)景下不會(huì)出現(xiàn)兩機(jī)都執(zhí)行調(diào)速策略的情況,2架無(wú)人機(jī)均執(zhí)行航向解脫策略。 本機(jī)的航向角變化為22°—-8°—52°—22°,入侵機(jī)航向角變化為158°—167°—150°—158°。2架無(wú)人機(jī)航向角的變化均在約束范圍內(nèi)。 圖5 沖突解脫過(guò)程示意圖(場(chǎng)景1)Fig.5 Process of conflict resolution (scene 1) 圖6 解脫前后距離變化(場(chǎng)景1)Fig.6 Distance change before and after conflict resolution (scene 1) 圖7 航向角變化(場(chǎng)景1)Fig.7 Change of heading angle (scene 1) 場(chǎng)景2為兩機(jī)交叉沖突的場(chǎng)景(見(jiàn)圖8—圖10)。本機(jī)與入侵機(jī)的初始航向角分別為22°和59°,可以計(jì)算出此時(shí)2條初始航路的斜率分別為0.40和-1.67,由此得出2條航路的一次函數(shù),由2個(gè)函數(shù)的交點(diǎn)計(jì)算出航路交叉點(diǎn)為(50,50) km。根據(jù)兩機(jī)的起始點(diǎn)與航路交叉點(diǎn),使用向量法求夾角的方法可以求出航路交叉角。求得航路交叉角為80.84°,此時(shí)交叉沖突為銳角。 圖8 沖突解脫過(guò)程示意圖(場(chǎng)景2)Fig.8 Process of conflict resolution (scene 2) 圖9 解脫前后距離變化(場(chǎng)景2)Fig.9 Distance change before and after conflict resolution (scene 2) 圖10 速度與航向角變化(場(chǎng)景2)Fig.10 Change of speed and heading angle (scene 2) 經(jīng)過(guò)雙方博弈后,本機(jī)選擇航向解脫策略,入侵機(jī)選擇調(diào)速策略。本機(jī)航向角變化為22°—13°—31°—22°,入侵機(jī)速度由100 m/s變?yōu)?7 m/s。2架無(wú)人機(jī)航向角及速度的變化均在約束范圍內(nèi)。 場(chǎng)景3同樣為兩機(jī)交叉沖突場(chǎng)景(見(jiàn)圖11—圖13)。用上段提出的方法可以求出該航路交叉角為103.20°,此時(shí)交叉沖突為鈍角。雙方博弈后本機(jī)選擇速度解脫策略,入侵機(jī)選擇航向策略。 本機(jī)速度由90 m/s變?yōu)?44 m/s,入侵機(jī)航向角變化為129°—98°—158°。2架無(wú)人機(jī)航向角及速度的變化均在約束范圍內(nèi)。 圖11 沖突解脫過(guò)程(場(chǎng)景3)Fig.11 Process of conflict resolution (scene 3) 圖12 解脫前后距離變化(場(chǎng)景3)Fig.12 Distance change before and after conflict resolution (scene 3) 圖13 速度及航向角變化(場(chǎng)景3)Fig.13 Change of speed and heading angle (scene 3) 為了證明這種雙機(jī)解脫方法的有效性,除了以上的仿真外,在以上3種沖突場(chǎng)景下與文獻(xiàn)[9]的單機(jī)解脫方法進(jìn)行對(duì)比,對(duì)比結(jié)果如表4、表5所示。 表4 總飛行距離及時(shí)間對(duì)比Tab.4 Total flight distance and total flight time 表5 解脫策略下飛行距離及解脫時(shí)間對(duì)比Tab.5 Comparison of flight distance and release time under release strategy 其中場(chǎng)景1為對(duì)向沖突,單機(jī)解脫只能實(shí)現(xiàn)航向策略。主要研究對(duì)象為本機(jī),因此雙機(jī)解脫的總飛行距離及飛行時(shí)間只考慮本機(jī)到達(dá)目標(biāo)點(diǎn)的距離及時(shí)間。經(jīng)過(guò)計(jì)算,3種場(chǎng)景下解脫前的飛行距離均為107.7 km,解脫前的飛行時(shí)間為1 197 s,表4中的數(shù)據(jù)均為解脫后總飛行距離及時(shí)間。 場(chǎng)景2中兩無(wú)人機(jī)的航跡交叉角小于90°,導(dǎo)致兩無(wú)人機(jī)相對(duì)距離較近,航向策略下的單機(jī)解脫與雙機(jī)解脫的效果均不理想。綜合表4與表5,總體上雙機(jī)解脫時(shí)在解脫策略下的飛行距離要短于單機(jī)解脫的飛行距離,且從解脫時(shí)間角度相比,雙機(jī)解脫時(shí)間要短于單機(jī)解脫時(shí)間,也使得雙機(jī)解脫到達(dá)目標(biāo)地的總飛行時(shí)間要少于單機(jī)解脫, 表6 機(jī)動(dòng)次數(shù)對(duì)比Tab.6 Comparison of changes 綜合來(lái)看雙機(jī)解脫的效果要優(yōu)于單機(jī)解脫。 上文提到該方法在沖突解脫時(shí)機(jī)動(dòng)次數(shù)少,與智能算法相比有優(yōu)勢(shì)。為證明該方法在機(jī)動(dòng)次數(shù)少的有效性,與智能算法完成沖突解脫進(jìn)行對(duì)比,對(duì)比結(jié)果如表6所示。 本文提出了一種基于博弈論模型的雙機(jī)解脫方法,通過(guò)一定的規(guī)定與假設(shè),將空域中的無(wú)人機(jī)規(guī)定在同一高度飛行,將問(wèn)題降維到二維。雖然在某種場(chǎng)景下的效果不太理想,但總體上的效果是要優(yōu)于單機(jī)解脫,能保證無(wú)人機(jī)在空域內(nèi)發(fā)生沖突時(shí)快速解脫并到達(dá)目標(biāo)點(diǎn)。 該方法只研究了雙機(jī)解脫情況,針對(duì)多無(wú)人機(jī)沖突解脫問(wèn)題未來(lái)擬從以下方面進(jìn)行研究。 1) 由二維問(wèn)題轉(zhuǎn)換到三維研究,以無(wú)人機(jī)之間的相對(duì)距離、距目標(biāo)點(diǎn)遠(yuǎn)近等條件為每架無(wú)人機(jī)計(jì)算權(quán)重,以權(quán)重值設(shè)置解脫優(yōu)先級(jí); 2) 將解脫優(yōu)先級(jí)結(jié)合博弈策略為每架無(wú)人機(jī)設(shè)置相應(yīng)的解脫策略; 3) 為防止嚴(yán)重繞飛、解脫時(shí)間久等現(xiàn)象出現(xiàn),設(shè)置相應(yīng)的指標(biāo)來(lái)計(jì)算解脫策略改變值的大小。2 雙機(jī)解脫方法
2.1 鷹鴿博弈
2.2 基于鷹鴿策略的貝葉斯納什均衡
2.3 鷹鴿博弈在解脫策略中的應(yīng)用
3 航跡恢復(fù)
3.1 調(diào)速策略恢復(fù)
3.2 航向策略恢復(fù)
4 算例分析
5 結(jié) 語(yǔ)