国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

固定翼無人機(jī)編隊(duì)的啟發(fā)分布式模型預(yù)測控制

2021-12-02 04:58陸浩然王永峰鞠興龍
導(dǎo)航定位與授時(shí) 2021年6期
關(guān)鍵詞:代價(jià)編隊(duì)軌跡

陸浩然,王永峰,鞠興龍

(1.國防科技大學(xué)空天科學(xué)學(xué)院, 長沙 410073; 2.32178部隊(duì)科技創(chuàng)新研究中心, 北京 100012; 3.北京泊松技術(shù)有限公司, 北京 100089)

0 引言

隨著無人機(jī)技術(shù)的發(fā)展,多無人機(jī)聯(lián)合協(xié)同作戰(zhàn)成為未來現(xiàn)代空戰(zhàn)的發(fā)展趨勢。無人機(jī)協(xié)同作戰(zhàn)可提高無人機(jī)在復(fù)雜環(huán)境和大規(guī)模作戰(zhàn)任務(wù)中的任務(wù)執(zhí)行效率,同時(shí)增加任務(wù)的可靠性、擴(kuò)大任務(wù)區(qū)域的覆蓋范圍和拓展任務(wù)執(zhí)行能力[1]。作為無人機(jī)系統(tǒng)控制的前沿領(lǐng)域,無人機(jī)協(xié)同控制在編隊(duì)控制[2-3]、任務(wù)分配[4]、軌跡規(guī)劃[5]等方向都涌現(xiàn)出了較多的成果[6]。

無人機(jī)集群的編隊(duì)飛行是無人機(jī)協(xié)同作戰(zhàn)中的重點(diǎn)研究方向,通常指多架具有獨(dú)立自主功能的無人機(jī),基于任務(wù)需求以一定的隊(duì)形保持飛行并協(xié)同完成任務(wù)的功能。通過編隊(duì)飛行,無人機(jī)可以獲得氣動效率、油耗、打擊和搜索任務(wù)成功率及魯棒性等性能的提升。

常用的編隊(duì)控制方法[7]包括基于行為[8]、虛擬結(jié)構(gòu)[9]、領(lǐng)導(dǎo)者-跟隨者[10]以及一致性編隊(duì)控制等方法[11],這些控制方法各有優(yōu)缺點(diǎn),且在實(shí)際應(yīng)用中可相互組合。從行為模式角度看,無人機(jī)集群的編隊(duì)飛行包括編隊(duì)成型和編隊(duì)保持兩種模式。在實(shí)際的編隊(duì)飛行過程中,兩種行為模式會交替切換,集群中各無人機(jī)不僅需要盡可能滿足隊(duì)形約束、保持安全距離,還需要在靠近威脅區(qū)域時(shí)通過局部路徑規(guī)劃使各自繞行威脅區(qū)域,從而產(chǎn)生編隊(duì)臨時(shí)解散并再次成型的需求。因此,編隊(duì)飛行控制實(shí)際上包括隊(duì)形設(shè)計(jì)、路徑規(guī)劃、保持控制、重構(gòu)和避障防撞等多個設(shè)計(jì)目標(biāo)。目前的研究主要是針對不同的設(shè)計(jì)目標(biāo)單獨(dú)設(shè)計(jì)控制律[12-15],并在應(yīng)用中基于不同的任務(wù)場景進(jìn)行功能切換。然而在實(shí)際應(yīng)用中,通常希望可以采用單一的控制框架和盡量少的控制律設(shè)計(jì)來同時(shí)滿足所有控制目標(biāo),從而減少控制算法之間的耦合和控制器的復(fù)雜度。

為此,本文以分布式模型預(yù)測控制(Distributed Model Predictive Control,DMPC)框架[16-17]為基礎(chǔ),將隊(duì)形設(shè)計(jì)、路徑規(guī)劃、保持控制、重構(gòu)和避障防撞等編隊(duì)飛行控制目標(biāo)轉(zhuǎn)化為描述隊(duì)形、安全距離、速度及威脅區(qū)域的代價(jià)函數(shù)和相容性約束進(jìn)行聯(lián)合優(yōu)化,從而實(shí)現(xiàn)單一控制框架下的多控制目標(biāo)一體化控制。

同時(shí),針對分布式模型預(yù)測控制存在的長距離軌跡求解困難、鄰居軌跡信息交互通信量大,導(dǎo)致預(yù)測時(shí)域短的問題,文本采用了分階段的啟發(fā)式軌跡規(guī)劃算法,分別利用模型預(yù)測和多項(xiàng)式曲線進(jìn)行短期和長期軌跡規(guī)劃?;趧討B(tài)規(guī)劃的思想,利用長期軌跡規(guī)劃結(jié)果對模型預(yù)測控制的結(jié)果進(jìn)行優(yōu)化;同時(shí),利用多項(xiàng)式軌跡參數(shù)進(jìn)行鄰機(jī)軌跡信息交互,從而有效降低了軌跡交互所需的通信量,使控制系統(tǒng)具備更高的實(shí)用性。

1 分布式模型預(yù)測控制

如圖1所示,分布式模型預(yù)測控制將整個系統(tǒng)分割成若干子系統(tǒng),并為每個子系統(tǒng)分別設(shè)計(jì)模型預(yù)測控制器,各控制器之間存在一定的信息交換[18]。

圖1 分布式模型預(yù)測控制框圖[18]Fig.1 Schematic of distributed model predictive control

分布式模型預(yù)測控制的優(yōu)化問題可以定義為:對于子系統(tǒng)i=1,2,…,Na

(1)

使得對于所有的l=0,1,2,…,N-1

xi(k+l+1|k)=Aixi(k+l|k)+Biui(k+l|k)

(2)

ck(xi(k+l|k),ui(k+l|k))≥0

(3)

gk(xi(k+l|k),ui(k+l|k),xj(k+l|k),uj(k+l|k))≥0

(4)

xi(k+l+1|k)∈X

(5)

ui(k+l|k)∈U

(6)

其中,k為當(dāng)前時(shí)刻,l為預(yù)測時(shí)刻;k+l|k表示變量值為當(dāng)前時(shí)刻對l步后狀態(tài)的預(yù)測;Ji為本地子系統(tǒng)的代價(jià)函數(shù);xi與ui分別為本地子系統(tǒng)狀態(tài)和控制量;xj與uj分別為鄰居子系統(tǒng)狀態(tài)和控制量;ck為本地子系統(tǒng)約束;gk為本地子系統(tǒng)與鄰居子系統(tǒng)的耦合約束;X為系統(tǒng)狀態(tài)約束;U為系統(tǒng)輸入約束。

分布式模型預(yù)測控制具有易于建模、求解結(jié)果可直接用于控制等優(yōu)點(diǎn),然而該方法也存在一些固有缺陷。例如,模型預(yù)測的步長N受到無人機(jī)機(jī)載處理器算力限制,當(dāng)N過大時(shí)模型求解時(shí)間會超過控制周期,因此在控制過程中預(yù)測出的軌跡只能實(shí)現(xiàn)在離無人機(jī)當(dāng)前位置較近范圍內(nèi)的優(yōu)化。此外,分布式模型預(yù)測控制需要基于部分鄰機(jī)信息進(jìn)行優(yōu)化計(jì)算,例如為了滿足基于安全距離的約束,控制器求解時(shí)需要獲得鄰機(jī)在未來一定時(shí)間段內(nèi)的預(yù)期飛行軌跡。該問題通??梢栽诿總€子系統(tǒng)解優(yōu)化問題之后,將各規(guī)劃的軌跡點(diǎn)通過通信鏈路傳輸給鄰居來實(shí)現(xiàn)[19-20]。然而在實(shí)際應(yīng)用中,無人機(jī)集群的通信容量是非常寶貴的資源,且在實(shí)戰(zhàn)過程中極易受到干擾而導(dǎo)致通信中斷,因此需要盡量減少編隊(duì)控制過程中無人機(jī)之間的通信交互需求,從而提升算法的可靠性。

針對以上問題,本文采用啟發(fā)型分布式模型預(yù)測算法,利用長距離多項(xiàng)式軌跡規(guī)劃結(jié)果作為短距離模型預(yù)測控制的啟發(fā)項(xiàng),編隊(duì)成員間以多項(xiàng)式系數(shù)的形式交互軌跡信息,并將鄰機(jī)軌跡信息融入多項(xiàng)式軌跡規(guī)劃求解時(shí)的代價(jià)函數(shù),從而降低規(guī)劃控制過程中的計(jì)算量與通信量。

2 無人機(jī)編隊(duì)啟發(fā)型分布式模型預(yù)測控制

如圖2和圖3所示,啟發(fā)型分布式模型預(yù)測控制算法分為模型預(yù)測軌跡規(guī)劃、多項(xiàng)式軌跡規(guī)劃和軌跡組合篩選3個階段。

圖2 啟發(fā)型模型預(yù)測軌跡規(guī)劃Fig.2 Track planning based on heuristic distributed model predictive control

圖3 規(guī)劃過程各階段Fig.3 Plannings tages

在模型預(yù)測軌跡規(guī)劃階段,控制器基于目標(biāo)點(diǎn)信息、約束信息和本機(jī)狀態(tài)信息,在軌跡可行域中采樣多個模型預(yù)測軌跡終端點(diǎn),并利用模型預(yù)測控制方法計(jì)算出N個時(shí)間步長內(nèi)的控制量與到達(dá)終端點(diǎn)的軌跡。

在多項(xiàng)式軌跡規(guī)劃階段,依次以各模型預(yù)測軌跡終端為起點(diǎn),并在目標(biāo)點(diǎn)周圍區(qū)域采樣軌跡終點(diǎn),利用多項(xiàng)式曲線平滑連接不同的模型預(yù)測軌跡終端與采樣軌跡終點(diǎn)。利用獲取到的鄰機(jī)多項(xiàng)式軌跡參數(shù)生成對應(yīng)的鄰機(jī)軌跡,以規(guī)劃軌跡的曲率、軌跡與鄰機(jī)軌跡的距離、軌跡與障礙區(qū)域的距離作為代價(jià)函數(shù)對每條軌跡進(jìn)行評價(jià)。

多項(xiàng)式軌跡規(guī)劃結(jié)果本質(zhì)上是對模型預(yù)測終端代價(jià)的修正,用于評價(jià)采樣到的不同終端點(diǎn),起到啟發(fā)式規(guī)劃的效果。

最后,分別對模型預(yù)測軌跡和多項(xiàng)式軌跡的代價(jià)在各自類別內(nèi)進(jìn)行歸一化,再基于權(quán)重選取不同的模型預(yù)測軌跡和多項(xiàng)式軌跡形成軌跡組合,選取組合代價(jià)最小的軌跡作為最終規(guī)劃軌跡,獲取該軌跡中模型預(yù)測軌跡部分的第一個控制量作為下一個控制量進(jìn)行控制,實(shí)現(xiàn)規(guī)劃到控制的閉環(huán)。下面分別對算法各階段進(jìn)行具體介紹。

2.1 模型預(yù)測控制

本文研究的無人機(jī)編隊(duì)控制場景限制在平面坐標(biāo)系上,基于分布式模型預(yù)測算法框架,固定翼無人機(jī)編隊(duì)控制問題可轉(zhuǎn)化為以下幾個部分。

2.1.1 離散運(yùn)動模型

考慮到無人機(jī)自動駕駛儀可以生成加速度指令,無人機(jī)運(yùn)動模型直接采用二階積分器模型

(7)

其中,s、v、a分別為無人機(jī)位置、速度與加速度。將模型擴(kuò)張到x-y平面并離散化,可得

zi(k+l+1|k)=Aizi(k+l|k)+Biui(k+l|k)

(8)

其中,zi=[six,vix,siy,viy]T,zi為無人機(jī)運(yùn)動狀態(tài)向量;six和siy分別為無人機(jī)i在平面坐標(biāo)系x軸和y軸上的位置坐標(biāo);vix和viy分別為無人機(jī)i在平面坐標(biāo)系x軸和y軸方向上的速度分量;Ai和Bi為無人機(jī)運(yùn)動離散狀態(tài)方程的系數(shù);ui=[aix,aiy] 為無人機(jī)i在平面坐標(biāo)系x軸和y軸方向上的加速度分量。

2.1.2 速度約束

固定翼無人機(jī)無法在空中懸停,其飛行速度受到最大與最小值限制,其約束可表示為

(9)

其中,vi(k+l|k)=[vix(k+l|k),viy(k+l|k)]為無人機(jī)i在k時(shí)刻對k+l時(shí)刻的速度矢量預(yù)測;Vmin和Vmax分別為無人機(jī)允許的最小、最大速度。

2.1.3 安全距離約束

安全距離為2架無人機(jī)之間允許的最小間距,可表示為

(10)

其中,si(k+l|k)和sj(k+l|k)分別為無人機(jī)i與無人機(jī)j在k時(shí)刻對k+l時(shí)刻的位置預(yù)測;R為單架無人機(jī)的安全距離。

2.1.4 避障約束

無人機(jī)飛行路線需始終與障礙區(qū)域保持一定的距離,為降低計(jì)算量,將障礙簡化為以中心位置為圓心、具有一定半徑的圓,該約束表示為

(11)

其中,si(k+l|k)為無人機(jī)i在k時(shí)刻對k+l時(shí)刻的位置預(yù)測;so,j為障礙區(qū)域j的圓心位置;Ro,j為障礙區(qū)域半徑。

2.1.5 代價(jià)函數(shù)

模型預(yù)測控制的代價(jià)函數(shù)包括階段代價(jià)函數(shù)和終端代價(jià)函數(shù)。終端代價(jià)函數(shù)以及與之相關(guān)的終端集和終端控制器組成了終端成分三要素,這三要素的設(shè)計(jì)關(guān)系到模型預(yù)測控制的穩(wěn)定性與收斂性,對其進(jìn)行計(jì)算和證明是一個比較復(fù)雜的問題。在本文采用的算法框架下,通過在可行域中采樣獲得模型預(yù)測控制的終端狀態(tài),利用不同的終端狀態(tài)和終端代價(jià)函數(shù)引入啟發(fā)性和隨機(jī)性,以產(chǎn)生不同的軌跡,最后利用篩選機(jī)制去除不合理的軌跡,這樣可以避免對終端問題三要素的設(shè)計(jì)過程,增強(qiáng)控制器的通用性。

本文采用的代價(jià)函數(shù)為

Lif(xi(k+N|k),xref)

(12)

其中,階段代價(jià)函數(shù)定義為

(13)

終端代價(jià)函數(shù)定義為

(14)

其中,wS和wT分別為階段代價(jià)函數(shù)和終端代價(jià)函數(shù)的權(quán)重系數(shù);N為最大預(yù)測長度;sref為無人機(jī)的參考軌跡。

本文采用虛擬結(jié)構(gòu)法進(jìn)行隊(duì)形控制,所有無人機(jī)保持預(yù)設(shè)虛擬結(jié)構(gòu),跟隨虛擬結(jié)構(gòu)中心飛行。每架無人機(jī)的參考軌跡定義為由虛擬結(jié)構(gòu)中心運(yùn)動軌跡和虛擬結(jié)構(gòu)確定的一系列路徑坐標(biāo)點(diǎn)

sref=[sref(k),sref(k+1),…,sref(k+N)]

(15)

2.1.6 終端點(diǎn)采樣

如圖4所示,設(shè)N為最大預(yù)測長度,dt為兩次預(yù)測點(diǎn)之間的時(shí)間間隔,無人機(jī)的最大、最小速度分別為Vmax和Vmin;以無人機(jī)當(dāng)前位置為起點(diǎn),分別以VmaxNdt和VminNdt為半徑,在無人機(jī)當(dāng)前航向的一定偏差內(nèi)劃定弧形的采樣區(qū)域,并在采樣區(qū)域中的障礙區(qū)域外以一定位置間隔進(jìn)行終端點(diǎn)采樣。采樣的終端點(diǎn)引導(dǎo)了預(yù)測控制的軌跡方向,并且是下一步多項(xiàng)式規(guī)劃的起點(diǎn),這樣增加了預(yù)測的多樣性,從而實(shí)現(xiàn)了啟發(fā)式規(guī)劃。

圖4 模型預(yù)測軌跡終端點(diǎn)采樣Fig.4 End points sampling of MPC track

2.2 多項(xiàng)式規(guī)劃

2.2.1 多項(xiàng)式曲線

分別以各模型預(yù)測終端采樣點(diǎn)的位置速度狀態(tài)為起點(diǎn),各軌跡終端采樣點(diǎn)的位置速度狀態(tài)為終點(diǎn),求解軌跡在x軸和y軸上的分量隨時(shí)間變化的曲線。為保證軌跡加速度連續(xù),采用5次多項(xiàng)式曲線擬合

(16)

曲線約束為

(17)

其中,smpc(N)和vmpc(N)分別為模型預(yù)測軌跡終端點(diǎn)的位置和速度狀態(tài),作為多項(xiàng)式曲線的起點(diǎn)狀態(tài)約束;spoly(T)和vpoly(T)分別為多項(xiàng)式軌跡終端采樣點(diǎn)的位置和速度狀態(tài),作為多項(xiàng)式曲線的終點(diǎn)狀態(tài)約束。

利用多項(xiàng)式曲線進(jìn)行軌跡規(guī)劃的步驟,本質(zhì)上是用運(yùn)算量較小的方法對無人機(jī)在較長距離上的飛行軌跡進(jìn)行多次規(guī)劃采樣。通過評估每條采樣軌跡的代價(jià),并選取代價(jià)最優(yōu)的軌跡作為無人機(jī)在長距離上的期望運(yùn)動軌跡。

由于每條多項(xiàng)式曲線的起點(diǎn)是各模型預(yù)測軌跡終端,從動態(tài)規(guī)劃的角度看,基于不同起點(diǎn)的最優(yōu)多項(xiàng)式曲線的代價(jià)估計(jì)值可以視為對相應(yīng)模型預(yù)測軌跡終端狀態(tài)價(jià)值的評估。這樣通過采樣長期狀態(tài)價(jià)值對短期的模型預(yù)測軌跡價(jià)值進(jìn)行修正,使得對模型預(yù)測軌跡的評估和選擇更為準(zhǔn)確。

無人機(jī)集群軌跡規(guī)劃時(shí),需要將各成員的規(guī)劃軌跡信息發(fā)送給鄰居以避免在規(guī)劃過程中的軌跡聚集,實(shí)現(xiàn)防撞功能。傳統(tǒng)的多智能體軌跡信息交互方法需要將規(guī)劃出的軌跡坐標(biāo)點(diǎn)依次發(fā)送給周圍的鄰居,這樣發(fā)送的信息量與軌跡長度成正相關(guān),并且接收到鄰居軌跡坐標(biāo)點(diǎn)的成員無法基于自己的控制周期對鄰居軌跡點(diǎn)進(jìn)行修正。多項(xiàng)式曲線作為無人機(jī)在長距離上的期望軌跡,可以表示無人機(jī)未來的飛行意圖,因此可以作為軌跡交互信息發(fā)送給鄰機(jī)。使用多項(xiàng)式軌跡進(jìn)行信息交互時(shí),無論軌跡長度,只需要傳輸a0,x~a5,x和a0,y~a5,y這12個多項(xiàng)式系數(shù),可以顯著減少鄰居無人機(jī)之間交換軌跡信息時(shí)傳輸?shù)臄?shù)據(jù)量。接收到鄰居多項(xiàng)式軌跡系數(shù)的成員可以自行產(chǎn)生不同時(shí)刻或尺度的鄰居軌跡點(diǎn)進(jìn)行評估,有效增加了規(guī)劃上的便利性。

2.2.2 代價(jià)函數(shù)

軌跡規(guī)劃過程中需要降低的代價(jià)包括障礙代價(jià)、加速度代價(jià)以及鄰居最小間距代價(jià),其中障礙代價(jià)和鄰居最小間距代價(jià)可以用log障礙函數(shù)的形式表示

(18)

其中,s、so和ro分別為當(dāng)前無人機(jī)位置矢量、障礙圓心位置矢量和障礙區(qū)域半徑。當(dāng)s與so之間的距離大于ro時(shí),代價(jià)函數(shù)為0,當(dāng)s→so時(shí),CB→∞。在每條軌跡上采樣N個點(diǎn),以所有采樣點(diǎn)的障礙代價(jià)函數(shù)之和作為針對每個障礙的障礙代價(jià),則總的障礙代價(jià)函數(shù)可以表示為

(19)

其中,M為障礙區(qū)域總數(shù);N為每條軌跡的采樣點(diǎn)總數(shù);si為無人機(jī)在第i個采樣點(diǎn)的位置[sx,i,sy,i];so,j為第j個障礙區(qū)域的中心位置[so,j,so,j];ro,j為第j個障礙區(qū)域的半徑。

與障礙代價(jià)類似,鄰機(jī)最小間距代價(jià)可以表示為

(20)

其中,L為鄰機(jī)總數(shù);N為每條軌跡的采樣點(diǎn)總數(shù);si為無人機(jī)在第i個采樣點(diǎn)的位置[sx,i,sy,i];snbr,i,k為第k個鄰居在第i個采樣時(shí)刻的預(yù)測位置;rnbr,k為與第k個鄰居之間的安全距離。

為了優(yōu)化軌跡曲率,設(shè)置加速度代價(jià)函數(shù)

(21)

其中,ai為無人機(jī)在第i個采樣點(diǎn)的加速度矢量[ax,i,ay,i]。

此外,定義多項(xiàng)式軌跡終端點(diǎn)的代價(jià)函數(shù),當(dāng)T時(shí)刻終端采樣點(diǎn)越接近T時(shí)刻參考軌跡點(diǎn),代價(jià)越低

(22)

綜合以上各式,每條多項(xiàng)式軌跡總的代價(jià)函數(shù)可以表示為

Cpoly=wnbrCnbr+woCo+waCacc+wTECT,j

(23)

其中,wnbr、wo、wa和wTE分別為各代價(jià)的權(quán)重。

2.2.3 終端點(diǎn)采樣

如圖5所示,多項(xiàng)式規(guī)劃的終端點(diǎn)采樣方法是以T+Ndt時(shí)刻的虛擬結(jié)構(gòu)的參考位置為基準(zhǔn),在其周圍以一定位置間隔進(jìn)行采樣。虛擬結(jié)構(gòu)的參考軌跡有可能穿越障礙區(qū)域,因此對多項(xiàng)式規(guī)劃的終端進(jìn)行采樣有助于在不同方向上找到有效規(guī)避障礙區(qū)域的路徑。

圖5 多項(xiàng)式軌跡終端點(diǎn)采樣Fig.5 End points sampling of polynomial track

2.3 軌跡組合篩選

由于模型預(yù)測軌跡和多項(xiàng)式軌跡在求解時(shí)采用的代價(jià)函數(shù)與權(quán)重不同,因此兩種曲線的代價(jià)值并不等價(jià)。為了綜合評價(jià)組合而成的軌跡,需要先對兩種軌跡分別按類歸一化,再按類分配權(quán)重后,利用動態(tài)規(guī)劃選取綜合代價(jià)值最低的組合軌跡。

曲線代價(jià)值的歸一化表達(dá)式為

(24)

如圖6所示,軌跡組合選擇問題可以等價(jià)為從本機(jī)當(dāng)前位置出發(fā),經(jīng)過模型預(yù)測終端采樣點(diǎn),最終到達(dá)軌跡終端采樣點(diǎn)的小規(guī)模動態(tài)規(guī)劃問題。軌跡初始點(diǎn)到模型預(yù)測軌跡終端采樣點(diǎn)連線的權(quán)重為

wmpc,l=wmpcCnorm,l,mpc

(25)

圖6 軌跡組合篩選Fig.6 Track combination selection

模型預(yù)測軌跡終端采樣點(diǎn)到多項(xiàng)式軌跡終端采樣點(diǎn)連線的權(quán)重為

wpoly,l=wpolyCnorm,l,poly

(26)

其中,Cnorm,l,mpc表示第l條模型預(yù)測軌跡的歸一化代價(jià)函數(shù);wmpc為模型預(yù)測軌跡的權(quán)重;Cnorm,l,poly表示第l條多項(xiàng)式軌跡的歸一化代價(jià)函數(shù);wpoly為多項(xiàng)式軌跡的權(quán)重。通過求解該動態(tài)規(guī)劃問題即可得到最優(yōu)的組合曲線。

需要注意的是,與通常的軌跡規(guī)劃不同,該組合曲線的多項(xiàng)式部分僅作為模型預(yù)測控制的啟發(fā)項(xiàng),用于增大模型預(yù)測控制的預(yù)測范圍,所以并不需要其必須滿足約束條件。在實(shí)際應(yīng)用中,飛控系統(tǒng)在每個控制周期只使用模型預(yù)測控制規(guī)劃出的下一時(shí)刻控制量,所以模型預(yù)測軌跡部分也并非是在未來時(shí)刻必須跟隨飛行的指定軌跡,而是在每個控制周期都會基于當(dāng)前飛行狀態(tài)發(fā)生相應(yīng)變化。

此外,在進(jìn)行隊(duì)形控制時(shí),各無人機(jī)的控制目標(biāo)是跟隨本機(jī)與虛擬結(jié)構(gòu)隊(duì)形所對應(yīng)的參考軌跡。在分布式控制的架構(gòu)下,各無人機(jī)都基于自己的參考軌跡獨(dú)立規(guī)劃本機(jī)飛行軌跡,相鄰無人機(jī)的軌跡信息會影響到本機(jī)軌跡規(guī)劃過程中對采樣軌跡的評價(jià)和選擇。因此,若部分成員無人機(jī)因故障持續(xù)輸出與實(shí)際不符的軌跡信息,正常成員可能會因?yàn)檫x擇了避讓軌跡,產(chǎn)生軌跡上的短期擾動,但不會影響正常成員對虛擬結(jié)構(gòu)整體的跟隨,也不會導(dǎo)致整個控制系統(tǒng)崩潰。

2.4 算法流程

綜上所述,基于啟發(fā)型分布式模型預(yù)測算法的固定翼無人機(jī)編隊(duì)控制流程如下。

(1)離線階段:

給定無人機(jī)允許的速度范圍[Vmin,Vmax],模型預(yù)測控制預(yù)測長度N, 多項(xiàng)式軌跡時(shí)長T,各障礙區(qū)域中心與范圍半徑ro,鄰機(jī)之間安全距離rnbr,以及各代價(jià)函數(shù)的權(quán)重wS、wT、wnbr、wo、wa、wTE和兩類軌跡的權(quán)重wmpc、wpoly。

(2)在線階段,在K時(shí)刻:

1)獲取本機(jī)位置和當(dāng)前接收到的鄰機(jī)軌跡參數(shù);

2)對模型預(yù)測控制預(yù)測長度N和多項(xiàng)式軌跡時(shí)長T分別進(jìn)行模型預(yù)測軌跡終端點(diǎn)和多項(xiàng)式軌跡終端點(diǎn)采樣;

3)基于鄰機(jī)軌跡參數(shù)擬合所有鄰機(jī)軌跡;

4)求解所有當(dāng)前位置到模型預(yù)測終端采樣點(diǎn)的軌跡;

5)求解所有模型預(yù)測終端采樣點(diǎn)到多項(xiàng)式終端采樣點(diǎn)的軌跡;

6)利用軌跡組合篩選方法選取從當(dāng)前位置到多項(xiàng)式終端采樣點(diǎn)的軌跡;

7)在選取的組合軌跡中,將模型預(yù)測軌跡的第一步控制量u(k+1|k)施加于被控對象實(shí)施控制。

3 仿真實(shí)驗(yàn)及分析

考慮由9架無人機(jī)組成的固定翼無人機(jī)集群,利用本文提出的方法,仿真集群從無隊(duì)形的狀態(tài),繞過多個障礙區(qū)域,最終形成直線編隊(duì)的過程。仿真參數(shù)如表1所示。

表1 仿真參數(shù)

圖7 編隊(duì)成員飛行軌跡Fig.7 Flight paths of the UAVs

圖8 編隊(duì)成員收斂誤差變化Fig.8 Convergence errors of the UAVs

圖7所示為集群成員的飛行軌跡,圖8所示為集群在收斂為直線編隊(duì)過程中每架無人機(jī)與本機(jī)的虛擬結(jié)構(gòu)期望位置誤差的變化。9架無人機(jī)在起始區(qū)域不同位置、不同速度方向的初始狀態(tài)下起飛后,依次繞過5個障礙區(qū)域,最終形成橫向直線編隊(duì)飛行,并實(shí)現(xiàn)了編隊(duì)隊(duì)形的快速收斂。由于模型預(yù)測軌跡的代價(jià)函數(shù)只考慮了對期望軌跡的跟蹤,并將與障礙中心的距離視為約束條件,因此每架無人機(jī)在繞過障礙時(shí)都以盡量貼近障礙區(qū)域的軌跡運(yùn)行,從而實(shí)現(xiàn)代價(jià)函數(shù)的最小化。

圖9所示為編隊(duì)中的一架無人機(jī)在飛行過程中單次規(guī)劃的結(jié)果,基于本文提出的算法,無人機(jī)規(guī)劃出了多條模型預(yù)測軌跡和多項(xiàng)式軌跡,并從中篩選出了符合要求的組合軌跡。求解多項(xiàng)式軌跡時(shí),約束條件作為代價(jià)函數(shù)可以有效降低問題的復(fù)雜性,加快求解速度,同時(shí)避免求解失敗,但也會導(dǎo)致規(guī)劃出的多條多項(xiàng)式軌跡都穿越了障礙區(qū)域,然而在之后的組合軌跡選擇過程中,違反約束的軌跡會因?yàn)榇鷥r(jià)較高被排除,從而增強(qiáng)算法的可靠性。

圖9 單次規(guī)劃軌跡Fig.9 Planned track of a single step

圖10展示了無人機(jī)在飛行過程中單次軌跡規(guī)劃時(shí),鄰機(jī)軌跡信息對規(guī)劃結(jié)果的影響。無人機(jī)在未收到鄰機(jī)軌跡信息的情況下,首先選擇了一條曲率較小的組合路徑。無人機(jī)在收到周圍2架無人機(jī)的多項(xiàng)式軌跡系數(shù)后,為2架鄰機(jī)各生成了100個點(diǎn)的軌跡曲線,并將鄰居軌跡點(diǎn)加入本機(jī)的多項(xiàng)式軌跡代價(jià)函數(shù)重新評估各軌跡代價(jià)。由于原軌跡與鄰機(jī)軌跡過于接近,算法重新選擇了一條更為安全但彎曲的軌跡。若按照傳統(tǒng)按點(diǎn)傳輸?shù)能壽E信息交互方法,在一個規(guī)劃周期內(nèi)各智能體互相傳輸100個點(diǎn)的期望軌跡會對通信系統(tǒng)提出非常高的要求,而采用多項(xiàng)式系數(shù)進(jìn)行期望軌跡傳輸可以在不增加通信負(fù)擔(dān)的情況下,以任意尺度完整地生成鄰居期望軌跡并進(jìn)行評估。

圖10 鄰居軌跡信息對單步規(guī)劃的影響Fig.10 Impact of neighbor track on single step planning

4 結(jié)論

本文針對固定翼無人機(jī)編隊(duì)飛行控制過程中形成的多目標(biāo)優(yōu)化問題特點(diǎn),提出了基于分布式模型預(yù)測控制算法框架的一體化解決方案,該方法將隊(duì)形約束、安全距離、速度以及威脅區(qū)域等約束轉(zhuǎn)化為代價(jià)函數(shù)與相容性約束,并采用優(yōu)化求解器同時(shí)優(yōu)化,從而有效減少了編隊(duì)控制算法直接的耦合和控制器的復(fù)雜度。在算法應(yīng)用時(shí),本文充分結(jié)合模型預(yù)測軌跡規(guī)劃與多項(xiàng)式軌跡規(guī)劃的特點(diǎn),利用采樣等方法,將多項(xiàng)式軌跡規(guī)劃的結(jié)果作為短距離模型預(yù)測控制的啟發(fā)項(xiàng),同時(shí)與鄰機(jī)以多項(xiàng)式系數(shù)的形式交互軌跡信息,并將鄰機(jī)軌跡信息融入多項(xiàng)式軌跡規(guī)劃求解時(shí)的代價(jià)函數(shù),在增大了模型預(yù)測控制預(yù)測范圍的同時(shí),降低了規(guī)劃控制過程中的計(jì)算量與通信量,并通過仿真證明了方法的可行性。

在分布式模型預(yù)測控制框架下,未來的研究還可以對代價(jià)函數(shù)的結(jié)構(gòu)和參數(shù)設(shè)計(jì)進(jìn)行優(yōu)化,以實(shí)現(xiàn)大規(guī)模集群多約束狀態(tài)下的快速有效收斂;同時(shí),采用機(jī)器視覺、激光雷達(dá)主動探測并結(jié)合機(jī)器學(xué)習(xí)的方法對鄰居軌跡進(jìn)行更精確的估計(jì),從而實(shí)現(xiàn)完全無通信的集群編隊(duì)控制。

猜你喜歡
代價(jià)編隊(duì)軌跡
解析幾何中的軌跡方程的常用求法
軌跡
軌跡
愛的代價(jià)
幸災(zāi)樂禍的代價(jià)
代價(jià)
代價(jià)
藍(lán)天雙雄——?dú)灠薎I雙機(jī)編隊(duì)