黃 蓉,周 軍,黃浩乾
(河海大學(xué)能源與電氣學(xué)院,江蘇 南京 211100)
蜂擁是指大量有共同運動目標(biāo)且可相互作用個體群的集結(jié)行為。自然界中大雁遷徙、蜜蜂筑巢等都屬于蜂擁現(xiàn)象。研究表明,雖然單個個體能力有限,但是個體互相交流和協(xié)作,卻能使生物種群完成個體無法或難以完成的復(fù)雜任務(wù)。具有蜂擁行為的生物群體可建模為多智能體系統(tǒng),而編隊控制是多智能體控制的主要課題之一?;诜鋼砜刂频亩嘀悄荏w系統(tǒng)協(xié)同與優(yōu)化方面表現(xiàn)出了良好的應(yīng)用前景。蜂擁控制研究中,Reynolds通過計算機仿真模擬出了鳥群、魚群的運動狀態(tài),提出了著名的Boid模型[1],為多智能體蜂擁問題研究奠定了基礎(chǔ)。Boid模型描述的多智能體蜂擁是指其運動遵守:①避碰,所有智能體間保持一定距離,避免碰撞;②速度匹配,所有智能體速度趨于一致;③聚合,所有智能體保持緊湊,避免分離。這三條行為規(guī)則也用來描述多智能體編隊的個體間關(guān)系,與定義于坐標(biāo)框架上的剛性編隊[2]相比,基于蜂擁拓?fù)涞亩嘀悄荏w編隊并不要求達成嚴(yán)格精準(zhǔn)的坐標(biāo)關(guān)系,而是應(yīng)滿足Reynolds行為規(guī)則,屬于柔性編隊。以下稱符合Reynolds行為規(guī)則的多智能體聚集形態(tài)為多智能體蜂擁編隊。
多智能體編隊與軌跡跟蹤控制(簡稱編隊跟蹤)是指智能體群體在形成編隊的同時跟蹤期望目標(biāo)或軌跡的多目標(biāo)控制問題,是多智能體控制領(lǐng)域的熱點問題。事實上,多智能體編隊跟蹤控制的理論與技術(shù)在實際工程中有著廣泛應(yīng)用前景。如無人機編隊飛行,交通路網(wǎng)中無人車輛自主行駛,救援移動機器人路徑規(guī)劃,衛(wèi)星數(shù)據(jù)通訊組網(wǎng)等。編隊跟蹤控制的關(guān)注點在于如何處理多智能體編隊形成/保持/變形及其軌跡跟蹤的協(xié)同控制,特別地,輸入/輸出受擾動、模型不確定性、群體運動特性局限、環(huán)境因素約束等也是需要顧及的問題。
對于跟蹤控制和擾動抑制問題[3],內(nèi)模原理控制器簡單,參數(shù)整定直觀,魯棒性強。在多智能體控制已有關(guān)于內(nèi)模原理研究[4-14]。如文獻[4]研究了有(無)領(lǐng)導(dǎo)兩情形下異構(gòu)多智能體輸出一致性;文獻[5]結(jié)合預(yù)測控制和內(nèi)模原理,研究了多智能體協(xié)同全局最優(yōu)預(yù)測跟蹤問題,得到了預(yù)測跟蹤一致性充分條件,并給出全局最優(yōu)預(yù)測控制器;針對非線性系統(tǒng),文獻[12]提出基于Lyapunov函數(shù)的內(nèi)模輸出反饋協(xié)議,研究了異構(gòu)最小相位非線性智能體輸出一致性;文獻[13]引入分散內(nèi)模,通過分散狀態(tài)反饋解決了下三角非線性不確定多智能體的協(xié)同全局魯棒輸出調(diào)節(jié)。以上研究均未考慮編隊問題。文獻[14]考慮具不確定性異構(gòu)離散非線性多智能體的編隊控制,通過引入內(nèi)部模型,使閉環(huán)系統(tǒng)對模型不確定性具魯棒性,但編隊形態(tài)是剛性的。研究僅考慮位置跟蹤而未考慮速度一致性,容易引起智能體碰撞且未考慮擾動,從而限制了實際應(yīng)用。
利用內(nèi)模原理,本文研究具外部擾動和期望軌跡的二階粒子型多智能體的基于虛擬領(lǐng)導(dǎo)者-平均值模型的編隊跟蹤控制問題,實現(xiàn)了蜂擁編隊的同時,使平均位置漸近跟蹤期望軌跡并抑制擾動,即“編隊形成”和“編隊跟蹤”的協(xié)同解決。方法的優(yōu)勢在于,編隊控制參數(shù)與跟蹤控制參數(shù)可分別設(shè)計;且多智能體隊列可通過權(quán)重矩陣做一定范圍的調(diào)整。數(shù)值仿真證實了方法的有效性。
首先,考慮N個二階積分粒子組成的多智能體系統(tǒng),每個個體都的狀態(tài)空間方程描述為:
(1)
式中,i∈={1,2,…,N},即是所有智能體標(biāo)號集合;qi(t),pi(t),ui(t)∈n分別代表智能體i在t時刻的位置、速度和加速度向量。為簡化符號,在不引起混亂前提下,時間變量t略去不寫。
其次,矩陣M∈n×n是范數(shù)加權(quán)矩陣,即
‖MΔqij‖=‖M(qi-qj)‖
基于此,多智能體間的γ-鄰域集定義為
i=:{j∈:if‖MΔqij‖<γ}
其中,γ>0是給定鄰域半徑,i是與智能體i有鄰接關(guān)系(數(shù)據(jù)交換)的所有智能體的下標(biāo)集合。
多智能體編隊控制是指設(shè)計分散控制律ui,使?jié)M足Reynolds準(zhǔn)則。對此,構(gòu)造文獻[15]的具虛擬領(lǐng)導(dǎo)者的蜂擁控制算法:
ui=-∑j∈Ni~φ(M(qj-qi))MTnij(M(qi-qj))
-∑j∈Niaij(M(qj-qi))MTM(pi-pj)
-[ΦTΦ(qi-qr)+Ψ(pi-pr)]
(2)
其中,Φ∈n×n非奇異, 0<Ψ=ΨT∈n×n,qr,pr,ur∈n代表虛擬領(lǐng)導(dǎo)者位置、速度和加速度控制向量。虛擬領(lǐng)導(dǎo)者非實際智能體,僅為多智能體提供跟隨其運動的導(dǎo)引。
為簡化描述(2),定義z=:qi-qj。于是
其中,ε>0是給定常數(shù)。
標(biāo)量脈沖函數(shù)ρ(·,·)定義為
其中,η∈(0,1)為給定值,ρ(z,η)∈[0,1]是光滑函數(shù)。另外,對于所有i,j∈,有
定義智能體i和j間的鄰接系數(shù)為
aij(M(qj-qi))
(3)
定義智能體平均位置和速度向量
簡單代數(shù)運算可以給出
(4)
稱為閉環(huán)多智能體的平均值模型。需將其轉(zhuǎn)換為平均值坐標(biāo)系下的等價關(guān)系。定義
引理1: 假設(shè)M≠0∈n×n,Φ∈n×n非奇異,且0<ΨT=Ψ∈n×n??紤]式(1)定義的多智能體,對其各個體分散施加擴展蜂擁控制算法(2)。若和則成立:
i) 多智能體以平均位置qa為中心保持聚合,即對任意t≥0,存在0<Υ<∞,使|qi-qa|<Υ。
ii) 所有智能體t→∞時速度趨向于一致,即
limt→∞p1=…=limt→∞pN=p*
這里p*為穩(wěn)態(tài)速度,且p*=limt→∞pa∈Rn。
iii) 多智能體從幾乎所有初始狀態(tài)出發(fā)的解軌跡都漸近收斂于加權(quán)矩陣M定義的廣義晶格結(jié)構(gòu)。
iv) 假設(shè)多智能體的初始動能嚴(yán)格小于某閾值條件,則對于所有t≥0,均無智能體碰撞發(fā)生。
引理1證明見文獻[15]的Appendix 1,此略。
引理1說明,在控制算法(2)下,多智能體穩(wěn)態(tài)能達到蜂擁編隊且保持穩(wěn)定。特別地,隊列形態(tài)可通過加權(quán)矩陣M進行一定調(diào)整。例如,穩(wěn)態(tài)關(guān)系式‖Mz‖=d,當(dāng)取rank(M) 當(dāng)多智能體進入穩(wěn)態(tài)后,個體位置和速度都在平均位置qa和速度pa附近。有鑒于此,考慮建立qa和pa與虛擬領(lǐng)導(dǎo)者控制ur的關(guān)系。由此,多智能體編隊的平均位置和速度就可由領(lǐng)導(dǎo)者通過ur設(shè)計來決定。為此,定義虛擬領(lǐng)導(dǎo)者狀態(tài)空間模型為 (5) 或簡潔地表達為 (6) 考慮存在控制輸入和外部擾動影響的虛擬領(lǐng)導(dǎo)者-平均值模型,其狀態(tài)空間描述為 (7) 這里,ω≠0是n維的確定性擾動,Bω∈4n×n是擾動輸入矩陣。設(shè)(7)對應(yīng)的輸出方程為: y=C? (8) 其中,y∈Rn×1是輸出向量。輸出矩陣為 關(guān)于由虛擬領(lǐng)導(dǎo)者-平均值方程(7)與輸出方程(8)組成增廣系統(tǒng)的可控性/可觀性,有 ii) 若β≠0,矩陣對(Λ(Φ,Ψ), [In,0,0,0])是可觀測的。這里(0)是n×n的全零塊。 命題1證明見附錄A。增廣系統(tǒng)可控性/可觀測性是實現(xiàn)基于內(nèi)模跟蹤控制的必要條件。 設(shè)式(7)與(8)的增廣系統(tǒng)輸出y(t)要跟蹤的期望軌跡為y0(t)∈Rn,則跟蹤誤差定義為: e(t)=y0(t)-y(t) 于是,多智能體蜂擁編隊與軌跡跟蹤控制的問題設(shè)定為:對各智能體和虛擬領(lǐng)導(dǎo)者設(shè)計分散控制律{ui}i=1,2,…N和虛擬控制輸入ur,滿足 (9) 備注1:式(9)前三式是蜂擁編隊條件,引理1保證了式(2)控制律下的蜂擁編隊;下面只考慮設(shè)計虛擬領(lǐng)導(dǎo)者控制向量ur以滿足式(9)的穩(wěn)態(tài)軌跡跟蹤。 引入內(nèi)模,是為了消除外部擾動對控制系統(tǒng)的影響,實現(xiàn)對給定參考輸入信號的無誤差跟蹤。由于y0(t)和ω(t)的穩(wěn)定振型隨時間收斂于零,不會對穩(wěn)態(tài)偏差產(chǎn)生影響,所以內(nèi)模設(shè)計只需考慮y0(t)和ω(t)中當(dāng)t→∞時不趨于零(不穩(wěn)定)的部分。 將跟蹤誤差e作為內(nèi)模方程的輸入,對應(yīng)的內(nèi)模狀態(tài)方程可構(gòu)造為: (10) 內(nèi)模方程構(gòu)造可基于參考輸入與外部擾動的狀態(tài)空間實現(xiàn)來完成,具體步驟如文獻[3,16]。 圖1 基于內(nèi)模原理的多智能編隊軌跡跟蹤控制 將圖1的鎮(zhèn)定補償器取為虛擬領(lǐng)導(dǎo)者-平均值增廣向量的狀態(tài)反饋,即 u2=Ke? 而設(shè)內(nèi)模補償器對虛擬領(lǐng)導(dǎo)者-平均值模型輸入為 u1=Kcxc 這樣,圖1系統(tǒng)的控制輸入ur即為引入對增廣系統(tǒng)的狀態(tài)反饋,具體形式有 (11) 從而,相應(yīng)的增廣系統(tǒng)ΣT的狀態(tài)空間模型是 (12) 引理2:對于式(12)定義的增廣虛擬領(lǐng)導(dǎo)者-平均值模型的閉環(huán)系統(tǒng)ΣT,假設(shè) i) 在L-A模型系統(tǒng)(6)中,(Λ(Φ,Ψ),Θ)是可控的,而(Λ(Φ,Ψ), [In,0,0,0])是可觀測的; ii) 虛擬領(lǐng)導(dǎo)者輸入向量維數(shù)與期望位置軌跡向量維數(shù)滿足dim(ur)=dim(y0)=n; iii) 對期望軌跡和擾動信號的不穩(wěn)定內(nèi)模的代數(shù)方程φ(s)=0的根λi(即矩陣Ac的特征值)有 (13) 則存在形如式(11)的靜態(tài)狀態(tài)反饋K使閉環(huán)系統(tǒng)(12)實現(xiàn)無靜差跟蹤。 引理2的證明可參見文獻[2](312-313頁)。 將式(2)的蜂擁控制與(12)式的軌跡跟蹤控制結(jié)合,多智能體群編隊跟蹤控制就得到了解決。 定理1: 考慮由式(1)描述的多智能體系統(tǒng),其虛擬領(lǐng)導(dǎo)者由式(5)定義。對各智能體分散作用的擴展蜂擁控制算法(2)中,假設(shè)M≠0∈n×n,Φ∈n×n非奇異和0<ΨT=Ψ∈n×n。進一步假設(shè)多智能體相對初始位置與速度滿足引理1的條件。最后,假設(shè)β≠0且,且內(nèi)模方程(10)的所有特征值滿足 det{μ(s)}≠0,?s∈λi(Ac) 這里η(s)和μ(s)定義見命題1。在上述條件下,存在靜態(tài)狀態(tài)反饋增益K,使多智能體從幾乎所有初始狀態(tài)出發(fā)的解軌跡都漸近收斂于由加權(quán)矩陣M定義的蜂擁編隊,且以平均位置軌跡qa為中心聚合。特別地,qa(∞)=y0(∞),即穩(wěn)態(tài)蜂擁編隊實現(xiàn)對期望軌跡的無靜差跟蹤。 證明:結(jié)論是引理1與2結(jié)合的結(jié)果。給定β≠0,η(s)和μ(s),命題1說明式(7)與(8)的增廣虛擬領(lǐng)導(dǎo)者-平均值模型是可控和可觀測的。所以要完成證明,只需要證明增廣虛擬領(lǐng)導(dǎo)者-平均值模型的特征值滿足引理2的秩條件(13)即可。為此,注意到 =4n+rank{μ(s)} 即,在給定條件下對內(nèi)模方程(10)的所有特征值均滿足秩等于4n+n的條件。證畢 圓點為多智能體位置,箭頭方向和長短代表智能體速度方向和大小,圓點間連線為鄰域關(guān)系。綠色實線為期望軌跡,綠色虛線為平均位置軌跡。 考慮6個三維智能體,初始位置給定,初始速度在[-1,1]×[-1,1]×[-1,1]的范圍隨機生成。領(lǐng)導(dǎo)者初始位置為[10;10;10],初始速度為[1;1;1]。 情況1:給“蝴蝶結(jié)”型期望軌跡和擾動分別為 給定如下的4n+nl=24個期望閉環(huán)極點 從圖2可以看出,初始時刻各智能體是混亂的,未形成蜂擁編隊,平均位置也未跟蹤參考輸入。到第18秒左右,平均位置跟蹤上了參考軌跡。到第60秒,平均位置跟蹤上了期望軌跡,群體也達成并保持著期望編隊,實現(xiàn)了蜂擁編隊和穩(wěn)態(tài)無靜差跟蹤。 圖2 多智能體的編隊跟蹤情況1 情況2:為了驗證提案控制方案的魯棒性,在外部擾動中加入未建模干擾,即設(shè)擾動為 仍取φ(s)=s4+5s2+4,且其余參數(shù)和情況1一致。數(shù)值仿真結(jié)果如圖3所示。 情況2的條件下,多智能體群依然可形成蜂擁編隊,且外部擾動有內(nèi)模方程未建模隨機干擾時,其編隊平均位置也依然能很好地跟蹤期望軌跡。這反映了內(nèi)??刂茖Ω蓴_具有魯棒性。 圖3 多智能體的編隊跟蹤情況2 本文針對多智能體蜂擁編隊與軌跡跟蹤控制問題,基于擴展蜂擁控制策略結(jié)合內(nèi)模原理進行了討論。方案中,蜂擁控制參數(shù)與跟蹤控制參數(shù)兩者的控制律設(shè)計互不影響,控制器設(shè)計過程無需反復(fù)調(diào)整修正。數(shù)值仿真說明,提案控制策略能抑制外部擾動并實現(xiàn)穩(wěn)態(tài)無靜差跟蹤參考軌跡,且對未建模噪聲有魯棒性。作為今后的研究課題,考慮實現(xiàn)多智能體蜂擁編隊的路徑在線規(guī)劃和跟蹤控制設(shè)計有著重要的工程意義。3.3 領(lǐng)導(dǎo)者-平均值模型及其軌跡特點
4 基于內(nèi)模原理的多智能體編隊跟蹤
4.1 虛擬領(lǐng)導(dǎo)者-平均值模型軌跡跟蹤問題設(shè)定
4.2 內(nèi)模控制方程的形成
4.3 內(nèi)模跟蹤控制系統(tǒng)的增益設(shè)計
4.4 多智能體編隊軌跡跟蹤設(shè)計
5 算例描述與數(shù)值仿真
6 總結(jié)