固定翼無人機(jī)編隊(duì)的啟發(fā)分布式模型預(yù)測控制

2021-12-02 04:58陸浩然王永峰鞠興龍

導(dǎo)航定位與授時(shí) 2021年6期

陸浩然，王永峰，鞠興龍

(1.國防科技大學(xué)空天科學(xué)學(xué)院, 長沙 410073; 2.32178部隊(duì)科技創(chuàng)新研究中心, 北京 100012; 3.北京泊松技術(shù)有限公司, 北京 100089)

0 引言

隨著無人機(jī)技術(shù)的發(fā)展，多無人機(jī)聯(lián)合協(xié)同作戰(zhàn)成為未來現(xiàn)代空戰(zhàn)的發(fā)展趨勢。無人機(jī)協(xié)同作戰(zhàn)可提高無人機(jī)在復(fù)雜環(huán)境和大規(guī)模作戰(zhàn)任務(wù)中的任務(wù)執(zhí)行效率，同時(shí)增加任務(wù)的可靠性、擴(kuò)大任務(wù)區(qū)域的覆蓋范圍和拓展任務(wù)執(zhí)行能力[1]。作為無人機(jī)系統(tǒng)控制的前沿領(lǐng)域，無人機(jī)協(xié)同控制在編隊(duì)控制[2-3]、任務(wù)分配[4]、軌跡規(guī)劃[5]等方向都涌現(xiàn)出了較多的成果[6]。

無人機(jī)集群的編隊(duì)飛行是無人機(jī)協(xié)同作戰(zhàn)中的重點(diǎn)研究方向，通常指多架具有獨(dú)立自主功能的無人機(jī)，基于任務(wù)需求以一定的隊(duì)形保持飛行并協(xié)同完成任務(wù)的功能。通過編隊(duì)飛行，無人機(jī)可以獲得氣動效率、油耗、打擊和搜索任務(wù)成功率及魯棒性等性能的提升。

常用的編隊(duì)控制方法[7]包括基于行為[8]、虛擬結(jié)構(gòu)[9]、領(lǐng)導(dǎo)者-跟隨者[10]以及一致性編隊(duì)控制等方法[11]，這些控制方法各有優(yōu)缺點(diǎn)，且在實(shí)際應(yīng)用中可相互組合。從行為模式角度看，無人機(jī)集群的編隊(duì)飛行包括編隊(duì)成型和編隊(duì)保持兩種模式。在實(shí)際的編隊(duì)飛行過程中，兩種行為模式會交替切換，集群中各無人機(jī)不僅需要盡可能滿足隊(duì)形約束、保持安全距離，還需要在靠近威脅區(qū)域時(shí)通過局部路徑規(guī)劃使各自繞行威脅區(qū)域，從而產(chǎn)生編隊(duì)臨時(shí)解散并再次成型的需求。因此，編隊(duì)飛行控制實(shí)際上包括隊(duì)形設(shè)計(jì)、路徑規(guī)劃、保持控制、重構(gòu)和避障防撞等多個設(shè)計(jì)目標(biāo)。目前的研究主要是針對不同的設(shè)計(jì)目標(biāo)單獨(dú)設(shè)計(jì)控制律[12-15]，并在應(yīng)用中基于不同的任務(wù)場景進(jìn)行功能切換。然而在實(shí)際應(yīng)用中，通常希望可以采用單一的控制框架和盡量少的控制律設(shè)計(jì)來同時(shí)滿足所有控制目標(biāo)，從而減少控制算法之間的耦合和控制器的復(fù)雜度。

為此，本文以分布式模型預(yù)測控制(Distributed Model Predictive Control，DMPC)框架[16-17]為基礎(chǔ)，將隊(duì)形設(shè)計(jì)、路徑規(guī)劃、保持控制、重構(gòu)和避障防撞等編隊(duì)飛行控制目標(biāo)轉(zhuǎn)化為描述隊(duì)形、安全距離、速度及威脅區(qū)域的代價(jià)函數(shù)和相容性約束進(jìn)行聯(lián)合優(yōu)化，從而實(shí)現(xiàn)單一控制框架下的多控制目標(biāo)一體化控制。

同時(shí)，針對分布式模型預(yù)測控制存在的長距離軌跡求解困難、鄰居軌跡信息交互通信量大，導(dǎo)致預(yù)測時(shí)域短的問題，文本采用了分階段的啟發(fā)式軌跡規(guī)劃算法，分別利用模型預(yù)測和多項(xiàng)式曲線進(jìn)行短期和長期軌跡規(guī)劃?；趧討B(tài)規(guī)劃的思想，利用長期軌跡規(guī)劃結(jié)果對模型預(yù)測控制的結(jié)果進(jìn)行優(yōu)化；同時(shí)，利用多項(xiàng)式軌跡參數(shù)進(jìn)行鄰機(jī)軌跡信息交互，從而有效降低了軌跡交互所需的通信量，使控制系統(tǒng)具備更高的實(shí)用性。

1 分布式模型預(yù)測控制

如圖1所示，分布式模型預(yù)測控制將整個系統(tǒng)分割成若干子系統(tǒng)，并為每個子系統(tǒng)分別設(shè)計(jì)模型預(yù)測控制器，各控制器之間存在一定的信息交換[18]。

圖1 分布式模型預(yù)測控制框圖[18]Fig.1 Schematic of distributed model predictive control

分布式模型預(yù)測控制的優(yōu)化問題可以定義為：對于子系統(tǒng)i=1,2,…,Na

(1)

使得對于所有的l=0,1,2,…,N-1

xi(k+l+1|k)=Aixi(k+l|k)+Biui(k+l|k)

(2)

ck(xi(k+l|k),ui(k+l|k))≥0

(3)

gk(xi(k+l|k),ui(k+l|k),xj(k+l|k),uj(k+l|k))≥0

(4)

xi(k+l+1|k)∈X

(5)

ui(k+l|k)∈U

(6)

其中，k為當(dāng)前時(shí)刻,l為預(yù)測時(shí)刻；k+l|k表示變量值為當(dāng)前時(shí)刻對l步后狀態(tài)的預(yù)測；Ji為本地子系統(tǒng)的代價(jià)函數(shù)；xi與ui分別為本地子系統(tǒng)狀態(tài)和控制量；xj與uj分別為鄰居子系統(tǒng)狀態(tài)和控制量；ck為本地子系統(tǒng)約束；gk為本地子系統(tǒng)與鄰居子系統(tǒng)的耦合約束；X為系統(tǒng)狀態(tài)約束；U為系統(tǒng)輸入約束。

分布式模型預(yù)測控制具有易于建模、求解結(jié)果可直接用于控制等優(yōu)點(diǎn)，然而該方法也存在一些固有缺陷。例如，模型預(yù)測的步長N受到無人機(jī)機(jī)載處理器算力限制，當(dāng)N過大時(shí)模型求解時(shí)間會超過控制周期，因此在控制過程中預(yù)測出的軌跡只能實(shí)現(xiàn)在離無人機(jī)當(dāng)前位置較近范圍內(nèi)的優(yōu)化。此外，分布式模型預(yù)測控制需要基于部分鄰機(jī)信息進(jìn)行優(yōu)化計(jì)算，例如為了滿足基于安全距離的約束，控制器求解時(shí)需要獲得鄰機(jī)在未來一定時(shí)間段內(nèi)的預(yù)期飛行軌跡。該問題通?？梢栽诿總€子系統(tǒng)解優(yōu)化問題之后，將各規(guī)劃的軌跡點(diǎn)通過通信鏈路傳輸給鄰居來實(shí)現(xiàn)[19-20]。然而在實(shí)際應(yīng)用中，無人機(jī)集群的通信容量是非常寶貴的資源，且在實(shí)戰(zhàn)過程中極易受到干擾而導(dǎo)致通信中斷，因此需要盡量減少編隊(duì)控制過程中無人機(jī)之間的通信交互需求，從而提升算法的可靠性。

針對以上問題，本文采用啟發(fā)型分布式模型預(yù)測算法，利用長距離多項(xiàng)式軌跡規(guī)劃結(jié)果作為短距離模型預(yù)測控制的啟發(fā)項(xiàng)，編隊(duì)成員間以多項(xiàng)式系數(shù)的形式交互軌跡信息，并將鄰機(jī)軌跡信息融入多項(xiàng)式軌跡規(guī)劃求解時(shí)的代價(jià)函數(shù)，從而降低規(guī)劃控制過程中的計(jì)算量與通信量。

2 無人機(jī)編隊(duì)啟發(fā)型分布式模型預(yù)測控制

如圖2和圖3所示，啟發(fā)型分布式模型預(yù)測控制算法分為模型預(yù)測軌跡規(guī)劃、多項(xiàng)式軌跡規(guī)劃和軌跡組合篩選3個階段。

圖2 啟發(fā)型模型預(yù)測軌跡規(guī)劃Fig.2 Track planning based on heuristic distributed model predictive control

圖3 規(guī)劃過程各階段Fig.3 Plannings tages

在模型預(yù)測軌跡規(guī)劃階段，控制器基于目標(biāo)點(diǎn)信息、約束信息和本機(jī)狀態(tài)信息，在軌跡可行域中采樣多個模型預(yù)測軌跡終端點(diǎn)，并利用模型預(yù)測控制方法計(jì)算出N個時(shí)間步長內(nèi)的控制量與到達(dá)終端點(diǎn)的軌跡。

在多項(xiàng)式軌跡規(guī)劃階段，依次以各模型預(yù)測軌跡終端為起點(diǎn)，并在目標(biāo)點(diǎn)周圍區(qū)域采樣軌跡終點(diǎn)，利用多項(xiàng)式曲線平滑連接不同的模型預(yù)測軌跡終端與采樣軌跡終點(diǎn)。利用獲取到的鄰機(jī)多項(xiàng)式軌跡參數(shù)生成對應(yīng)的鄰機(jī)軌跡，以規(guī)劃軌跡的曲率、軌跡與鄰機(jī)軌跡的距離、軌跡與障礙區(qū)域的距離作為代價(jià)函數(shù)對每條軌跡進(jìn)行評價(jià)。

多項(xiàng)式軌跡規(guī)劃結(jié)果本質(zhì)上是對模型預(yù)測終端代價(jià)的修正，用于評價(jià)采樣到的不同終端點(diǎn)，起到啟發(fā)式規(guī)劃的效果。

最后，分別對模型預(yù)測軌跡和多項(xiàng)式軌跡的代價(jià)在各自類別內(nèi)進(jìn)行歸一化，再基于權(quán)重選取不同的模型預(yù)測軌跡和多項(xiàng)式軌跡形成軌跡組合，選取組合代價(jià)最小的軌跡作為最終規(guī)劃軌跡，獲取該軌跡中模型預(yù)測軌跡部分的第一個控制量作為下一個控制量進(jìn)行控制，實(shí)現(xiàn)規(guī)劃到控制的閉環(huán)。下面分別對算法各階段進(jìn)行具體介紹。

2.1 模型預(yù)測控制

本文研究的無人機(jī)編隊(duì)控制場景限制在平面坐標(biāo)系上，基于分布式模型預(yù)測算法框架，固定翼無人機(jī)編隊(duì)控制問題可轉(zhuǎn)化為以下幾個部分。

2.1.1 離散運(yùn)動模型

考慮到無人機(jī)自動駕駛儀可以生成加速度指令，無人機(jī)運(yùn)動模型直接采用二階積分器模型

(7)

其中，s、v、a分別為無人機(jī)位置、速度與加速度。將模型擴(kuò)張到x-y平面并離散化，可得

zi(k+l+1|k)=Aizi(k+l|k)+Biui(k+l|k)

(8)

其中，zi=[six,vix,siy,viy]T,zi為無人機(jī)運(yùn)動狀態(tài)向量；six和siy分別為無人機(jī)i在平面坐標(biāo)系x軸和y軸上的位置坐標(biāo)；vix和viy分別為無人機(jī)i在平面坐標(biāo)系x軸和y軸方向上的速度分量；Ai和Bi為無人機(jī)運(yùn)動離散狀態(tài)方程的系數(shù)；ui=[aix,aiy] 為無人機(jī)i在平面坐標(biāo)系x軸和y軸方向上的加速度分量。

2.1.2 速度約束

固定翼無人機(jī)無法在空中懸停，其飛行速度受到最大與最小值限制，其約束可表示為

(9)

其中，vi(k+l|k)=[vix(k+l|k),viy(k+l|k)]為無人機(jī)i在k時(shí)刻對k+l時(shí)刻的速度矢量預(yù)測；Vmin和Vmax分別為無人機(jī)允許的最小、最大速度。

2.1.3 安全距離約束

安全距離為2架無人機(jī)之間允許的最小間距，可表示為

(10)

其中，si(k+l|k)和sj(k+l|k)分別為無人機(jī)i與無人機(jī)j在k時(shí)刻對k+l時(shí)刻的位置預(yù)測；R為單架無人機(jī)的安全距離。

2.1.4 避障約束

無人機(jī)飛行路線需始終與障礙區(qū)域保持一定的距離，為降低計(jì)算量，將障礙簡化為以中心位置為圓心、具有一定半徑的圓，該約束表示為

(11)

其中，si(k+l|k)為無人機(jī)i在k時(shí)刻對k+l時(shí)刻的位置預(yù)測；so,j為障礙區(qū)域j的圓心位置；Ro,j為障礙區(qū)域半徑。

2.1.5 代價(jià)函數(shù)

模型預(yù)測控制的代價(jià)函數(shù)包括階段代價(jià)函數(shù)和終端代價(jià)函數(shù)。終端代價(jià)函數(shù)以及與之相關(guān)的終端集和終端控制器組成了終端成分三要素，這三要素的設(shè)計(jì)關(guān)系到模型預(yù)測控制的穩(wěn)定性與收斂性，對其進(jìn)行計(jì)算和證明是一個比較復(fù)雜的問題。在本文采用的算法框架下，通過在可行域中采樣獲得模型預(yù)測控制的終端狀態(tài)，利用不同的終端狀態(tài)和終端代價(jià)函數(shù)引入啟發(fā)性和隨機(jī)性，以產(chǎn)生不同的軌跡，最后利用篩選機(jī)制去除不合理的軌跡，這樣可以避免對終端問題三要素的設(shè)計(jì)過程，增強(qiáng)控制器的通用性。

本文采用的代價(jià)函數(shù)為

Lif(xi(k+N|k),xref)

(12)

其中，階段代價(jià)函數(shù)定義為

(13)

終端代價(jià)函數(shù)定義為

(14)

其中，wS和wT分別為階段代價(jià)函數(shù)和終端代價(jià)函數(shù)的權(quán)重系數(shù)；N為最大預(yù)測長度；sref為無人機(jī)的參考軌跡。

本文采用虛擬結(jié)構(gòu)法進(jìn)行隊(duì)形控制，所有無人機(jī)保持預(yù)設(shè)虛擬結(jié)構(gòu)，跟隨虛擬結(jié)構(gòu)中心飛行。每架無人機(jī)的參考軌跡定義為由虛擬結(jié)構(gòu)中心運(yùn)動軌跡和虛擬結(jié)構(gòu)確定的一系列路徑坐標(biāo)點(diǎn)

sref=[sref(k),sref(k+1)，…，sref(k+N)]

(15)

2.1.6 終端點(diǎn)采樣

如圖4所示，設(shè)N為最大預(yù)測長度，dt為兩次預(yù)測點(diǎn)之間的時(shí)間間隔，無人機(jī)的最大、最小速度分別為Vmax和Vmin；以無人機(jī)當(dāng)前位置為起點(diǎn)，分別以VmaxNdt和VminNdt為半徑，在無人機(jī)當(dāng)前航向的一定偏差內(nèi)劃定弧形的采樣區(qū)域，并在采樣區(qū)域中的障礙區(qū)域外以一定位置間隔進(jìn)行終端點(diǎn)采樣。采樣的終端點(diǎn)引導(dǎo)了預(yù)測控制的軌跡方向，并且是下一步多項(xiàng)式規(guī)劃的起點(diǎn)，這樣增加了預(yù)測的多樣性，從而實(shí)現(xiàn)了啟發(fā)式規(guī)劃。

圖4 模型預(yù)測軌跡終端點(diǎn)采樣Fig.4 End points sampling of MPC track

2.2 多項(xiàng)式規(guī)劃

2.2.1 多項(xiàng)式曲線

分別以各模型預(yù)測終端采樣點(diǎn)的位置速度狀態(tài)為起點(diǎn)，各軌跡終端采樣點(diǎn)的位置速度狀態(tài)為終點(diǎn)，求解軌跡在x軸和y軸上的分量隨時(shí)間變化的曲線。為保證軌跡加速度連續(xù)，采用5次多項(xiàng)式曲線擬合

(16)

曲線約束為

(17)

其中，smpc(N)和vmpc(N)分別為模型預(yù)測軌跡終端點(diǎn)的位置和速度狀態(tài)，作為多項(xiàng)式曲線的起點(diǎn)狀態(tài)約束；spoly(T)和vpoly(T)分別為多項(xiàng)式軌跡終端采樣點(diǎn)的位置和速度狀態(tài)，作為多項(xiàng)式曲線的終點(diǎn)狀態(tài)約束。

利用多項(xiàng)式曲線進(jìn)行軌跡規(guī)劃的步驟，本質(zhì)上是用運(yùn)算量較小的方法對無人機(jī)在較長距離上的飛行軌跡進(jìn)行多次規(guī)劃采樣。通過評估每條采樣軌跡的代價(jià)，并選取代價(jià)最優(yōu)的軌跡作為無人機(jī)在長距離上的期望運(yùn)動軌跡。

由于每條多項(xiàng)式曲線的起點(diǎn)是各模型預(yù)測軌跡終端，從動態(tài)規(guī)劃的角度看，基于不同起點(diǎn)的最優(yōu)多項(xiàng)式曲線的代價(jià)估計(jì)值可以視為對相應(yīng)模型預(yù)測軌跡終端狀態(tài)價(jià)值的評估。這樣通過采樣長期狀態(tài)價(jià)值對短期的模型預(yù)測軌跡價(jià)值進(jìn)行修正，使得對模型預(yù)測軌跡的評估和選擇更為準(zhǔn)確。

無人機(jī)集群軌跡規(guī)劃時(shí)，需要將各成員的規(guī)劃軌跡信息發(fā)送給鄰居以避免在規(guī)劃過程中的軌跡聚集，實(shí)現(xiàn)防撞功能。傳統(tǒng)的多智能體軌跡信息交互方法需要將規(guī)劃出的軌跡坐標(biāo)點(diǎn)依次發(fā)送給周圍的鄰居，這樣發(fā)送的信息量與軌跡長度成正相關(guān)，并且接收到鄰居軌跡坐標(biāo)點(diǎn)的成員無法基于自己的控制周期對鄰居軌跡點(diǎn)進(jìn)行修正。多項(xiàng)式曲線作為無人機(jī)在長距離上的期望軌跡，可以表示無人機(jī)未來的飛行意圖，因此可以作為軌跡交互信息發(fā)送給鄰機(jī)。使用多項(xiàng)式軌跡進(jìn)行信息交互時(shí)，無論軌跡長度，只需要傳輸a0,x～a5,x和a0,y～a5,y這12個多項(xiàng)式系數(shù)，可以顯著減少鄰居無人機(jī)之間交換軌跡信息時(shí)傳輸?shù)臄?shù)據(jù)量。接收到鄰居多項(xiàng)式軌跡系數(shù)的成員可以自行產(chǎn)生不同時(shí)刻或尺度的鄰居軌跡點(diǎn)進(jìn)行評估，有效增加了規(guī)劃上的便利性。

2.2.2 代價(jià)函數(shù)

軌跡規(guī)劃過程中需要降低的代價(jià)包括障礙代價(jià)、加速度代價(jià)以及鄰居最小間距代價(jià)，其中障礙代價(jià)和鄰居最小間距代價(jià)可以用log障礙函數(shù)的形式表示

(18)

其中，s、so和ro分別為當(dāng)前無人機(jī)位置矢量、障礙圓心位置矢量和障礙區(qū)域半徑。當(dāng)s與so之間的距離大于ro時(shí)，代價(jià)函數(shù)為0，當(dāng)s→so時(shí)，CB→∞。在每條軌跡上采樣N個點(diǎn)，以所有采樣點(diǎn)的障礙代價(jià)函數(shù)之和作為針對每個障礙的障礙代價(jià)，則總的障礙代價(jià)函數(shù)可以表示為

(19)

其中，M為障礙區(qū)域總數(shù)；N為每條軌跡的采樣點(diǎn)總數(shù)；si為無人機(jī)在第i個采樣點(diǎn)的位置[sx,i,sy,i]；so,j為第j個障礙區(qū)域的中心位置[so,j,so,j]；ro,j為第j個障礙區(qū)域的半徑。

與障礙代價(jià)類似，鄰機(jī)最小間距代價(jià)可以表示為

(20)

其中，L為鄰機(jī)總數(shù)；N為每條軌跡的采樣點(diǎn)總數(shù)；si為無人機(jī)在第i個采樣點(diǎn)的位置[sx,i,sy,i]；snbr,i,k為第k個鄰居在第i個采樣時(shí)刻的預(yù)測位置；rnbr,k為與第k個鄰居之間的安全距離。

為了優(yōu)化軌跡曲率，設(shè)置加速度代價(jià)函數(shù)

(21)

其中，ai為無人機(jī)在第i個采樣點(diǎn)的加速度矢量[ax,i,ay,i]。

此外，定義多項(xiàng)式軌跡終端點(diǎn)的代價(jià)函數(shù)，當(dāng)T時(shí)刻終端采樣點(diǎn)越接近T時(shí)刻參考軌跡點(diǎn)，代價(jià)越低

(22)

綜合以上各式，每條多項(xiàng)式軌跡總的代價(jià)函數(shù)可以表示為

Cpoly=wnbrCnbr+woCo+waCacc+wTECT,j

(23)

其中，wnbr、wo、wa和wTE分別為各代價(jià)的權(quán)重。

2.2.3 終端點(diǎn)采樣

如圖5所示，多項(xiàng)式規(guī)劃的終端點(diǎn)采樣方法是以T+Ndt時(shí)刻的虛擬結(jié)構(gòu)的參考位置為基準(zhǔn)，在其周圍以一定位置間隔進(jìn)行采樣。虛擬結(jié)構(gòu)的參考軌跡有可能穿越障礙區(qū)域，因此對多項(xiàng)式規(guī)劃的終端進(jìn)行采樣有助于在不同方向上找到有效規(guī)避障礙區(qū)域的路徑。

圖5 多項(xiàng)式軌跡終端點(diǎn)采樣Fig.5 End points sampling of polynomial track

2.3 軌跡組合篩選

由于模型預(yù)測軌跡和多項(xiàng)式軌跡在求解時(shí)采用的代價(jià)函數(shù)與權(quán)重不同，因此兩種曲線的代價(jià)值并不等價(jià)。為了綜合評價(jià)組合而成的軌跡，需要先對兩種軌跡分別按類歸一化，再按類分配權(quán)重后，利用動態(tài)規(guī)劃選取綜合代價(jià)值最低的組合軌跡。

曲線代價(jià)值的歸一化表達(dá)式為

(24)

如圖6所示，軌跡組合選擇問題可以等價(jià)為從本機(jī)當(dāng)前位置出發(fā)，經(jīng)過模型預(yù)測終端采樣點(diǎn)，最終到達(dá)軌跡終端采樣點(diǎn)的小規(guī)模動態(tài)規(guī)劃問題。軌跡初始點(diǎn)到模型預(yù)測軌跡終端采樣點(diǎn)連線的權(quán)重為

wmpc,l=wmpcCnorm,l,mpc

(25)

圖6 軌跡組合篩選Fig.6 Track combination selection

模型預(yù)測軌跡終端采樣點(diǎn)到多項(xiàng)式軌跡終端采樣點(diǎn)連線的權(quán)重為

wpoly,l=wpolyCnorm,l,poly

(26)

其中，Cnorm,l,mpc表示第l條模型預(yù)測軌跡的歸一化代價(jià)函數(shù)；wmpc為模型預(yù)測軌跡的權(quán)重；Cnorm,l,poly表示第l條多項(xiàng)式軌跡的歸一化代價(jià)函數(shù)；wpoly為多項(xiàng)式軌跡的權(quán)重。通過求解該動態(tài)規(guī)劃問題即可得到最優(yōu)的組合曲線。

需要注意的是，與通常的軌跡規(guī)劃不同，該組合曲線的多項(xiàng)式部分僅作為模型預(yù)測控制的啟發(fā)項(xiàng)，用于增大模型預(yù)測控制的預(yù)測范圍，所以并不需要其必須滿足約束條件。在實(shí)際應(yīng)用中，飛控系統(tǒng)在每個控制周期只使用模型預(yù)測控制規(guī)劃出的下一時(shí)刻控制量，所以模型預(yù)測軌跡部分也并非是在未來時(shí)刻必須跟隨飛行的指定軌跡，而是在每個控制周期都會基于當(dāng)前飛行狀態(tài)發(fā)生相應(yīng)變化。

此外，在進(jìn)行隊(duì)形控制時(shí)，各無人機(jī)的控制目標(biāo)是跟隨本機(jī)與虛擬結(jié)構(gòu)隊(duì)形所對應(yīng)的參考軌跡。在分布式控制的架構(gòu)下，各無人機(jī)都基于自己的參考軌跡獨(dú)立規(guī)劃本機(jī)飛行軌跡，相鄰無人機(jī)的軌跡信息會影響到本機(jī)軌跡規(guī)劃過程中對采樣軌跡的評價(jià)和選擇。因此，若部分成員無人機(jī)因故障持續(xù)輸出與實(shí)際不符的軌跡信息，正常成員可能會因?yàn)檫x擇了避讓軌跡，產(chǎn)生軌跡上的短期擾動，但不會影響正常成員對虛擬結(jié)構(gòu)整體的跟隨，也不會導(dǎo)致整個控制系統(tǒng)崩潰。

2.4 算法流程

綜上所述，基于啟發(fā)型分布式模型預(yù)測算法的固定翼無人機(jī)編隊(duì)控制流程如下。

(1)離線階段：

給定無人機(jī)允許的速度范圍[Vmin,Vmax]，模型預(yù)測控制預(yù)測長度N, 多項(xiàng)式軌跡時(shí)長T，各障礙區(qū)域中心與范圍半徑ro，鄰機(jī)之間安全距離rnbr，以及各代價(jià)函數(shù)的權(quán)重wS、wT、wnbr、wo、wa、wTE和兩類軌跡的權(quán)重wmpc、wpoly。

(2)在線階段，在K時(shí)刻：

1)獲取本機(jī)位置和當(dāng)前接收到的鄰機(jī)軌跡參數(shù)；

2)對模型預(yù)測控制預(yù)測長度N和多項(xiàng)式軌跡時(shí)長T分別進(jìn)行模型預(yù)測軌跡終端點(diǎn)和多項(xiàng)式軌跡終端點(diǎn)采樣；

3)基于鄰機(jī)軌跡參數(shù)擬合所有鄰機(jī)軌跡；

4)求解所有當(dāng)前位置到模型預(yù)測終端采樣點(diǎn)的軌跡；

5)求解所有模型預(yù)測終端采樣點(diǎn)到多項(xiàng)式終端采樣點(diǎn)的軌跡；

6)利用軌跡組合篩選方法選取從當(dāng)前位置到多項(xiàng)式終端采樣點(diǎn)的軌跡；

7)在選取的組合軌跡中，將模型預(yù)測軌跡的第一步控制量u(k+1|k)施加于被控對象實(shí)施控制。

3 仿真實(shí)驗(yàn)及分析

考慮由9架無人機(jī)組成的固定翼無人機(jī)集群，利用本文提出的方法，仿真集群從無隊(duì)形的狀態(tài)，繞過多個障礙區(qū)域，最終形成直線編隊(duì)的過程。仿真參數(shù)如表1所示。

表1 仿真參數(shù)

圖7 編隊(duì)成員飛行軌跡Fig.7 Flight paths of the UAVs

圖8 編隊(duì)成員收斂誤差變化Fig.8 Convergence errors of the UAVs

圖7所示為集群成員的飛行軌跡，圖8所示為集群在收斂為直線編隊(duì)過程中每架無人機(jī)與本機(jī)的虛擬結(jié)構(gòu)期望位置誤差的變化。9架無人機(jī)在起始區(qū)域不同位置、不同速度方向的初始狀態(tài)下起飛后，依次繞過5個障礙區(qū)域，最終形成橫向直線編隊(duì)飛行，并實(shí)現(xiàn)了編隊(duì)隊(duì)形的快速收斂。由于模型預(yù)測軌跡的代價(jià)函數(shù)只考慮了對期望軌跡的跟蹤，并將與障礙中心的距離視為約束條件，因此每架無人機(jī)在繞過障礙時(shí)都以盡量貼近障礙區(qū)域的軌跡運(yùn)行,從而實(shí)現(xiàn)代價(jià)函數(shù)的最小化。

圖9所示為編隊(duì)中的一架無人機(jī)在飛行過程中單次規(guī)劃的結(jié)果，基于本文提出的算法，無人機(jī)規(guī)劃出了多條模型預(yù)測軌跡和多項(xiàng)式軌跡，并從中篩選出了符合要求的組合軌跡。求解多項(xiàng)式軌跡時(shí)，約束條件作為代價(jià)函數(shù)可以有效降低問題的復(fù)雜性，加快求解速度，同時(shí)避免求解失敗，但也會導(dǎo)致規(guī)劃出的多條多項(xiàng)式軌跡都穿越了障礙區(qū)域，然而在之后的組合軌跡選擇過程中，違反約束的軌跡會因?yàn)榇鷥r(jià)較高被排除，從而增強(qiáng)算法的可靠性。

圖9 單次規(guī)劃軌跡Fig.9 Planned track of a single step

圖10展示了無人機(jī)在飛行過程中單次軌跡規(guī)劃時(shí)，鄰機(jī)軌跡信息對規(guī)劃結(jié)果的影響。無人機(jī)在未收到鄰機(jī)軌跡信息的情況下，首先選擇了一條曲率較小的組合路徑。無人機(jī)在收到周圍2架無人機(jī)的多項(xiàng)式軌跡系數(shù)后，為2架鄰機(jī)各生成了100個點(diǎn)的軌跡曲線，并將鄰居軌跡點(diǎn)加入本機(jī)的多項(xiàng)式軌跡代價(jià)函數(shù)重新評估各軌跡代價(jià)。由于原軌跡與鄰機(jī)軌跡過于接近，算法重新選擇了一條更為安全但彎曲的軌跡。若按照傳統(tǒng)按點(diǎn)傳輸?shù)能壽E信息交互方法，在一個規(guī)劃周期內(nèi)各智能體互相傳輸100個點(diǎn)的期望軌跡會對通信系統(tǒng)提出非常高的要求，而采用多項(xiàng)式系數(shù)進(jìn)行期望軌跡傳輸可以在不增加通信負(fù)擔(dān)的情況下，以任意尺度完整地生成鄰居期望軌跡并進(jìn)行評估。

圖10 鄰居軌跡信息對單步規(guī)劃的影響Fig.10 Impact of neighbor track on single step planning

4 結(jié)論

本文針對固定翼無人機(jī)編隊(duì)飛行控制過程中形成的多目標(biāo)優(yōu)化問題特點(diǎn)，提出了基于分布式模型預(yù)測控制算法框架的一體化解決方案，該方法將隊(duì)形約束、安全距離、速度以及威脅區(qū)域等約束轉(zhuǎn)化為代價(jià)函數(shù)與相容性約束，并采用優(yōu)化求解器同時(shí)優(yōu)化，從而有效減少了編隊(duì)控制算法直接的耦合和控制器的復(fù)雜度。在算法應(yīng)用時(shí)，本文充分結(jié)合模型預(yù)測軌跡規(guī)劃與多項(xiàng)式軌跡規(guī)劃的特點(diǎn)，利用采樣等方法，將多項(xiàng)式軌跡規(guī)劃的結(jié)果作為短距離模型預(yù)測控制的啟發(fā)項(xiàng)，同時(shí)與鄰機(jī)以多項(xiàng)式系數(shù)的形式交互軌跡信息，并將鄰機(jī)軌跡信息融入多項(xiàng)式軌跡規(guī)劃求解時(shí)的代價(jià)函數(shù)，在增大了模型預(yù)測控制預(yù)測范圍的同時(shí)，降低了規(guī)劃控制過程中的計(jì)算量與通信量，并通過仿真證明了方法的可行性。

在分布式模型預(yù)測控制框架下，未來的研究還可以對代價(jià)函數(shù)的結(jié)構(gòu)和參數(shù)設(shè)計(jì)進(jìn)行優(yōu)化，以實(shí)現(xiàn)大規(guī)模集群多約束狀態(tài)下的快速有效收斂；同時(shí)，采用機(jī)器視覺、激光雷達(dá)主動探測并結(jié)合機(jī)器學(xué)習(xí)的方法對鄰居軌跡進(jìn)行更精確的估計(jì)，從而實(shí)現(xiàn)完全無通信的集群編隊(duì)控制。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡