于鏑, 王亞潔, 趙博, 劉瓊
(1.北京信息科技大學(xué) 自動化學(xué)院, 北京 100192; 2.北京師范大學(xué) 系統(tǒng)科學(xué)學(xué)院, 北京 100875)
作為控制領(lǐng)域的前沿?zé)狳c問題,多智能體協(xié)同控制是指多個具有感知、通信和移動能力的智能體之間通過局部信息交互,實現(xiàn)所期望的整體組織行為,例如一致性控制[1]、跟蹤控制[2]和合圍控制[3]等,并且在無人機偵察救援、機器人協(xié)作搬運、智慧交通調(diào)度、微電網(wǎng)功率優(yōu)化等領(lǐng)域都有著廣泛應(yīng)用。
收斂速度是多智能體協(xié)同控制中重點關(guān)注的內(nèi)容。有限時間協(xié)同控制[4-5]是指多智能體系統(tǒng)能夠在有限時間內(nèi)達(dá)到控制目標(biāo),該方法具有收斂速率快、魯棒性強、控制精度高等優(yōu)點。但是收斂時間上界與系統(tǒng)初始值相關(guān),當(dāng)系統(tǒng)初始值未知或非常大時,收斂時間會趨于無窮甚至無法計算。實際應(yīng)用中某些多智能體系統(tǒng)需要在特定的時間內(nèi)實現(xiàn)協(xié)同,如航天器姿態(tài)同步、無人艇編隊、機器人搜救等,并且在系統(tǒng)初始狀態(tài)未知情況下便可以對收斂時間進行預(yù)測,這將對控制器的設(shè)計大有裨益。因此,固定時間穩(wěn)定[6]的概念應(yīng)運而生,其克服了有限時間控制中系統(tǒng)收斂時間對初始狀態(tài)的依賴,可以根據(jù)實際應(yīng)用需求進行系統(tǒng)固定時間控制器設(shè)計。當(dāng)前,在多智能體系統(tǒng)固定時間協(xié)同控制領(lǐng)域已涌現(xiàn)出許多優(yōu)秀成果[7-16]。采用牽制控制方法,文獻(xiàn)[7]考慮了系統(tǒng)有/無非線性項兩種情況,實現(xiàn)了含有外部擾動的1階多智能體系統(tǒng)固定時間的群組一致性。文獻(xiàn)[8]針對1階受擾非線性系統(tǒng),設(shè)計了包含符號函數(shù)項的控制協(xié)議,實現(xiàn)了固定時間跟蹤一致性。采用非光滑分析方法和切換控制思想,文獻(xiàn)[9]在具有有向生成樹的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)下,解決1階受擾多智能體系統(tǒng)的固定時間協(xié)同跟蹤問題。值得指出的是,上述成果均解決1階受擾多智能體網(wǎng)絡(luò)協(xié)同控制問題。由于同時考慮智能體動態(tài)的位置信息和速度信息,2階多智能體網(wǎng)絡(luò)相較1階多智能體網(wǎng)絡(luò)的控制協(xié)議設(shè)計更加復(fù)雜,并且網(wǎng)絡(luò)動態(tài)分析更加細(xì)致。因此,一些研究人員針對2階受擾多智能體系統(tǒng)的固定時間協(xié)同控制問題展開了研究。文獻(xiàn)[10]提出新型非奇異終端滑??刂茀f(xié)議,實現(xiàn)了多智能體系統(tǒng)固定時間合圍控制。采用固定時間觀測器和非奇異滑模面結(jié)合的方法,文獻(xiàn)[11]設(shè)計固定時間滑模跟蹤控制器,實現(xiàn)了多航天器系統(tǒng)的姿態(tài)協(xié)同。文獻(xiàn)[12]在細(xì)致均衡的有向圖下,采用齊次理論與積分滑模相結(jié)合的方法實現(xiàn)了多智能體系統(tǒng)一致性及跟蹤控制?;谧赃m應(yīng)擾動狀態(tài)觀測器和反步法,文獻(xiàn)[13]實現(xiàn)了固定時間有界群集編隊控制,并進行了仿真驗證。文獻(xiàn)[14]設(shè)計集成控制協(xié)議,解決了受擾2階多智能體系統(tǒng)的固定時間一致性問題;標(biāo)稱控制部分確保在積分滑模面上的固定時間收斂,不連續(xù)積分滑??刂苹蜻B續(xù)超扭控制部分用于補償干擾且固定時間收斂。文獻(xiàn)[15]設(shè)計固定時間跟蹤控制律,且基于系統(tǒng)狀態(tài)的相關(guān)信息更新控制參數(shù),實現(xiàn)了系統(tǒng)平滑跟蹤控制。在無速度信息的情況下,文獻(xiàn)[16]設(shè)計固定時間觀測器精確估計狀態(tài)信息,實現(xiàn)了固定時間一致性問題。
然而,上述文獻(xiàn)所提出的控制器均需采用周期性采樣信號進行控制,會造成大量系統(tǒng)通信計算資源的浪費。為解決該問題,諸多學(xué)者引入了事件觸發(fā)機制[17],當(dāng)預(yù)先設(shè)定的觸發(fā)函數(shù)滿足一定條件時,智能體之間才進行通信及控制協(xié)議的更新,在一定程度上減少了系統(tǒng)通信和計算資源的損耗。根據(jù)觸發(fā)函數(shù)的不同,事件觸發(fā)機制可分為靜態(tài)事件觸發(fā)[18-23]和動態(tài)事件觸發(fā)[24-27]兩類。其中靜態(tài)事件觸發(fā)分為基于固定閾值的事件觸發(fā)函數(shù)[18-19]以及基于系統(tǒng)相對狀態(tài)的事件觸發(fā)函數(shù)[20-23]。通過引入內(nèi)部動態(tài)變量,動態(tài)事件觸發(fā)機制[24-27]使得事件觸發(fā)函數(shù)閾值隨著測量誤差而自適應(yīng)地變化,從而避免了靜態(tài)事件觸發(fā)機制中因無視測量誤差大小而導(dǎo)致事件觸發(fā)函數(shù)閾值固定或變化規(guī)律一成不變的情況,增強了事件觸發(fā)機制的自適應(yīng)性。結(jié)合動態(tài)事件觸發(fā)機制,文獻(xiàn)[24]設(shè)計了線性多智能體系統(tǒng)的分布式編隊控制協(xié)議,并將其應(yīng)用到多機器人編隊控制中。文獻(xiàn)[25]將滑模控制算法與動態(tài)事件觸發(fā)機制相結(jié)合,實現(xiàn)了1階受擾多智能體系統(tǒng)的有限時間一致性控制。文獻(xiàn)[26]在動態(tài)事件觸發(fā)機制控制下,實現(xiàn)了1階時延系統(tǒng)的固定時間跟蹤控制。針對切換拓?fù)淝闆r,文獻(xiàn)[27]設(shè)計動態(tài)事件觸發(fā)控制協(xié)議,解決了受擾非線性多智能體系統(tǒng)實際固定時間一致性問題。
受上述文獻(xiàn)的啟發(fā),本文將針對2階受擾非線性多智能體系統(tǒng),研究其在有向拓?fù)湎鹿潭〞r間跟蹤控制問題,通過引入動態(tài)事件觸發(fā)機制,提出一種新型積分滑模固定時間控制方案。本文的主要貢獻(xiàn)與創(chuàng)新點總結(jié)如下:
1)不同于文獻(xiàn)[7-9,26,27]中控制對象為1階受擾多智能體系統(tǒng),本文研究2階受擾非線性多智能體系統(tǒng),且通過設(shè)計一個新型積分滑模面消除擾動對多智能體系統(tǒng)動態(tài)的影響,提高了系統(tǒng)魯棒性。
2)不同于文獻(xiàn)[18-21]中采用的靜態(tài)觸發(fā)機制,本文通過引入與測量誤差相關(guān)的動態(tài)變量,設(shè)計能夠?qū)崿F(xiàn)固定時間跟蹤控制的動態(tài)事件觸發(fā)函數(shù),使得動態(tài)事件觸發(fā)函數(shù)閾值自適應(yīng)地隨著測量誤差變化,從而增強事件觸發(fā)機制的自適應(yīng)性且降低觸發(fā)頻率,進一步節(jié)省通信和計算資源。
3)相較于文獻(xiàn)[4-5,25]中的有限時間控制,本文所提出的控制協(xié)議能在固定時間內(nèi)實現(xiàn)系統(tǒng)跟蹤控制,可以根據(jù)控制器參數(shù)來估計收斂時間,從而放寬了有限時間控制中收斂時間依賴于系統(tǒng)初始狀態(tài)的限制。
符號說明:本文中,‖·‖表示向量或矩陣的2-范數(shù),1n表示n維全1列向量。對于矩陣A∈Rn×n,其最大特征值和最小特征值分別用λmax(A)和λmin(A)表示。函數(shù)矢量sigα(x)=[sigα(x1),…,sigα(xn)]T,冪次函數(shù)sigα(xi)=|xi|αsgn(xi),其中x∈Rn且x=[x1,…,xn]T,α>0,符號函數(shù)矢量sgn(x)=[sgn(x1),…,sgn(xn)]T。對角陣diag(|x|α)={|x1|α,…,|xn|α}。
本文考慮由1個領(lǐng)導(dǎo)者和N個跟隨者所組成的多智能體系統(tǒng),將領(lǐng)導(dǎo)者標(biāo)記為智能體0,并假設(shè)跟隨者只接收領(lǐng)導(dǎo)者發(fā)送的信息,而領(lǐng)導(dǎo)者不接收任何信息。定義矢量B=(b1,b2,…,bN)T,如果智能體i能接收到來自領(lǐng)導(dǎo)者的信息則bi>0,否則bi=0。拓?fù)鋱D對應(yīng)的拉普拉斯矩陣為
式中:H=[hij]∈RN×N。
假設(shè)原點是下列非線性系統(tǒng)的平衡點
(1)
式中:x(t)∈Rn為系統(tǒng)狀態(tài);f(t,x(t)):R+×Rn→Rn是未知非線性函數(shù);x0為系統(tǒng)初始狀態(tài)。
定義1[6]若式(1)所描述的系統(tǒng)全局漸近穩(wěn)定且存在一個穩(wěn)定時間T(x0)>0,使得系統(tǒng)的任意解能夠在T(x0)內(nèi)收斂到平衡點,則稱系統(tǒng)(式(1))的原點是全局有限時間穩(wěn)定的。在此基礎(chǔ)上,若存在穩(wěn)定時間T≤Tmax,其中Tmax為與系統(tǒng)初始狀態(tài)無關(guān)的穩(wěn)定時間上界,則稱系統(tǒng)(式(1))的原點是全局固定時間穩(wěn)定的。
引理1[6]考慮系統(tǒng)(式(1)),若存在一個李雅普諾夫函數(shù)V(x)>0,并有a>0,b>0,0<α<1,β>1且滿足
(2)
則稱該系統(tǒng)能實現(xiàn)固定時間穩(wěn)定。此外,穩(wěn)定時間T滿足如下條件
(3)
引理2[27]令z1,z2,…,zi,…,zN≥0,有
在本文考慮的多智能體系統(tǒng)中,第i個跟隨者和領(lǐng)導(dǎo)者的動力學(xué)方程分別描述如下:
(4)
(5)
假設(shè)1圖包含有向生成樹,其中領(lǐng)導(dǎo)者為根節(jié)點。
假設(shè)2對于非線性函數(shù)h(·),存在一個正常數(shù)ρ,使得對于任意xi∈Rn,xj∈Rn,vi∈Rn,vj∈Rn,t≥0,有
‖h(xi,vi,t)-h(xj,vj,t)‖≤ρ(‖xi-xj‖+‖vi-vj‖)
(6)
假設(shè)2給出了矢量域上的QUAD條件[28],且所有的線性、分段線性連續(xù)函數(shù)和具有一致有界偏導(dǎo)數(shù)?f/?xi,i=1,2,…,N的非線性函數(shù),均滿足該條件。諸多眾所周知的實際應(yīng)用系統(tǒng)[29],如諧振子、微分驅(qū)動輪式機器人、拉格朗日型飛行器和機械手等,均滿足該Lipschitz類型條件。
本文的主要控制目的是針對2階受擾多智能體系統(tǒng),結(jié)合積分滑??刂品椒ê蛣討B(tài)事件觸發(fā)機制,設(shè)計一個切實可行的控制協(xié)議,使得跟隨者的狀態(tài)在固定時間內(nèi)跟蹤上領(lǐng)導(dǎo)者的狀態(tài),即實現(xiàn)固定時間跟蹤控制,不受擾動影響且有效節(jié)省通信資源。
圖1 控制方案示意圖Fig.1 Diagram of control scheme
為了克服擾動的影響并提高系統(tǒng)魯棒性,本文采用積分滑??刂品椒āM瑫r為了節(jié)約系統(tǒng)通信和計算資源,引入動態(tài)事件觸發(fā)機制,設(shè)計固定時間控制協(xié)議,實現(xiàn)多智能體系統(tǒng)跟蹤。
首先定義智能體跟蹤誤差為
(7)
定義積分滑模變量為
(8)
基于上述滑模面,設(shè)計事件觸發(fā)控制協(xié)議如下:
(9)
定義測量誤差如下:
(10)
式中:sj為滑模變量。則ui(t)可用測量誤差表示如下:
k5sj(t)-k6(‖φx(t)‖+‖φv(t)‖)1n)
(11)
式(11)寫成向量形式為
u(t)=E(t)+(H?In)-1(-k1φ(t)-sigαφ(t)-sigβφ(t)-k2sgn(s(t))-k3sigα(s(t))-k4sigβ(s(t))-k5s(t)-k6(‖φx(t)‖+‖φv(t)‖)1Nn)
(12)
下面設(shè)計一個新型的動態(tài)事件觸發(fā)函數(shù)來保證系統(tǒng)在固定時間內(nèi)實現(xiàn)跟蹤控制。受文獻(xiàn)[25]的啟發(fā),動態(tài)事件觸發(fā)函數(shù)和內(nèi)部動態(tài)變量分別設(shè)計為
gi(t)=‖Ei(t)‖2-k3‖si(t)‖α+1-k4‖si(t)‖β+1
(13)
(14)
式中:l1、l2>0;ηi(0)為動態(tài)變量初始值,ηi(0)>0。則當(dāng)動態(tài)事件觸發(fā)函數(shù)和內(nèi)部動態(tài)變量滿足
(15)
不同于文獻(xiàn)[18-19]中設(shè)計的包含不連續(xù)部分sgn(·)和連續(xù)部分sigα(·)的積分滑模面,本文設(shè)計只包含連續(xù)部分sigα(·)的積分滑模面,使得整個收斂過程更趨于平滑;同時,不同于文獻(xiàn)[18-19]實現(xiàn)1階受擾多智能體系統(tǒng)的固定時間協(xié)同控制,本文解決2階受擾多智能體系統(tǒng)的固定時間跟蹤控制問題,被控對象不同,更符合工程實踐需求。
文獻(xiàn)[14]和文獻(xiàn)[25]均基于網(wǎng)絡(luò)誤差的冪次函數(shù)(·)α設(shè)計積分滑模面。文獻(xiàn)[14]解決受擾2階多智能體系統(tǒng)固定時間協(xié)同跟蹤問題,但未考慮未知非線性動態(tài)對跟隨者運動性能的影響;且所設(shè)計的周期性采樣信號控制的固定時間控制器導(dǎo)致通信和計算資源浪費。文獻(xiàn)[25]實現(xiàn)了有限時間協(xié)同控制但不利于滿足應(yīng)用需求。而本文設(shè)計的積分滑模面適用于符合實際應(yīng)用的固定時間協(xié)同控制情況,具有更強的實用性。
在動態(tài)觸發(fā)機制式(13)~式(15)中,若l1=l2=0,則對應(yīng)靜態(tài)觸發(fā)機制,即如
(16)
此時,由于k3和k4均為固定的正常數(shù),當(dāng)多智能體系統(tǒng)趨近協(xié)同跟蹤時,靜態(tài)事件觸發(fā)機制會導(dǎo)致不必要信息的頻繁傳輸而浪費大量網(wǎng)絡(luò)通信和計算資源。
相較于文獻(xiàn)[25]中采用動態(tài)觸發(fā)機制下的積分滑模控制方案解決有限時間1階受擾多智能體系統(tǒng)協(xié)同一致問題,本文所提出的動態(tài)觸發(fā)機制下的新型積分滑??刂品桨附鉀Q了2階受擾多智能體系統(tǒng)固定時間協(xié)同跟蹤問題,避免了收斂時間對系統(tǒng)狀態(tài)初始值的依賴而直接可通過控制參數(shù)進行設(shè)計,更貼合實際應(yīng)用需求。同時,通過對智能體狀態(tài)和速度的動態(tài)分析,可以得到更加細(xì)致的動態(tài)協(xié)同過程,便于實際系統(tǒng)應(yīng)用。
本節(jié)證明采用本文所提出的控制協(xié)議及觸發(fā)函數(shù)可以實現(xiàn)系統(tǒng)的固定時間跟蹤。
定理1考慮由式(4)和式(5)所描述的多智能體系統(tǒng),當(dāng)滿足假設(shè)1和假設(shè)2時,控制協(xié)議(見式(9))和動態(tài)事件觸發(fā)條件(見式(15))作用下,若滿足如下參數(shù)條件
則多智能體系統(tǒng)能夠在固定時間內(nèi)實現(xiàn)跟蹤控制,且穩(wěn)定時間滿足
(17)
式中:c>0。
(18)
式中:In為n×n維單位矩陣;1N為n維列向量。
根據(jù)假設(shè)2,可得
基于柯西不等式,可得
sT(H?In)d-sTk2sgn (s)≤-(k2-ω‖H‖)‖s‖
基于楊氏不等式,可得
(19)
式中:λmax(HHT)為矩陣HHT的最大特征值。
(20)
因此滑模變量可以在固定時間T1內(nèi)到達(dá)滑模面。
(21)
式中:λmin為矩陣的最小特征值;INn為Nn×Nn維單位矩陣。因此式(21)可寫為
式中:
根據(jù)引理1得到穩(wěn)定時間T2為
(22)
由此可知根據(jù)多智能體系統(tǒng)可以在T≤T1+T2內(nèi)實現(xiàn)固定時間跟蹤控制。證畢。
綜上,相比于文獻(xiàn)[22]、文獻(xiàn)[23]的無向拓?fù)浼拔墨I(xiàn)[12]中的有向拓?fù)淝倚枰?xì)致均衡條件,本文所考慮的拓?fù)潢P(guān)系為有向拓?fù)?且只需有以領(lǐng)導(dǎo)者為根節(jié)點的有向生成樹,限制條件少,應(yīng)用更廣泛。
下面分析采用所提出的動態(tài)觸發(fā)機制,系統(tǒng)不存在Zeno現(xiàn)象。
定理2考慮由式(4)和式(5)所描述的多智能體系統(tǒng),如果動態(tài)事件觸發(fā)條件(見式(15))以及定理1的條件成立,則可以避免Zeno現(xiàn)象。
(23)
又因為
令Λ1=(ε1a+k6)(Najmax‖vj-vi‖+bj‖vj-v0‖),Λ2=(ε1b+ε2+k6)[ajmax(‖uj-ui‖+ω+ρ‖xj-xi‖+ρ‖vj-vi‖)+bj(‖uj‖+ω+ρ‖xj-x0‖+ρ‖vj-v0‖)],Λ3=ε2ε3,Λ4=k6λmax(H?In)(‖e2‖+ρ(‖e1‖+‖e2‖)+ω+‖u‖),可知Λ1、Λ2、Λ3、Λ4均為正數(shù)。則式(23)可寫為
則
同理可得
(24)
(25)
因此最小事件觸發(fā)間隔嚴(yán)格大于零,不存在Zeno現(xiàn)象。證畢。
考慮由1個領(lǐng)導(dǎo)者和5個跟隨者組成的多智能體系統(tǒng),其有向通信拓?fù)潢P(guān)系如圖2所示。
圖2 網(wǎng)絡(luò)拓?fù)銯ig.2 Network topology
定義第i個智能體的非線性函數(shù)和外部擾動為fi(t)=[-0.2(xi1(t)+sin (vi1(t))),-0.2(xi2(t)+cos (vi1(t)))]T
f0(t)=[-0.2(x01(t)+sin (v01(t))),-0.2(x02(t)+cos (v01(t)))]T
di(t)=[0.1cost,0.1sint]T,i=1,2,…,5。
參數(shù)選為k1=1.2,k2=0.3,k3=0.5,k4=0.8,k5=3.5,k6=2,a=1,b=2,α=0.5,β=1.5,l1=0.1,l2=0.3,ρ=0.2。通過式(16)計算得到穩(wěn)定時間上界Tmax≈165.6 s。
圖3和圖4分別描述了跟隨者和領(lǐng)導(dǎo)者的位置、速度變化軌跡,從中可以看出所有跟隨者均能夠在固定時間內(nèi)跟蹤上領(lǐng)導(dǎo)者的狀態(tài),收斂時間約為15 s,顯然實際收斂時間遠(yuǎn)小于Tmax。
圖3 智能體位置變化軌跡Fig.3 Position trajectories of agents
圖4 智能體速度變化軌跡Fig.4 Velocity trajectories of agents
圖5為動態(tài)輔助變量ηi,i=1,2,…,5的變化曲線。由于跟蹤控制前期智能體間相對狀態(tài)誤差較大而后期相對狀態(tài)誤差較小,ηi隨著時間自適應(yīng)地動態(tài)變化,并且在15 s左右趨于較小的正值。圖6為誤差‖Ei(t)‖2和觸發(fā)閾k3‖si(t)‖α+1+k4‖si(t)‖β+1+ηi(t)的變化曲線。由于動態(tài)輔助變量ηi的自適應(yīng)變化,動態(tài)事件觸發(fā)機制會自適應(yīng)調(diào)整觸發(fā)閾值,并且只有當(dāng)滿足動態(tài)事件觸發(fā)條件時才進行觸發(fā),從而避免了頻繁觸發(fā)而發(fā)送不必要信息。
圖5 動態(tài)輔助變量變化曲線Fig.5 Curves of dynamic auxiliary variables
圖6 誤差和觸發(fā)閾值的變化曲線Fig.6 Curves of errors and trigger threshold
本文所設(shè)計控制協(xié)議能實現(xiàn)系統(tǒng)的固定時間跟蹤,與文獻(xiàn)[25]中有限時間控制方法相比,系統(tǒng)穩(wěn)定時間不受初始狀態(tài)的影響。如圖7和圖8所示,在初始值較大的情況下,仍能在15 s左右實現(xiàn)跟蹤控制。
圖8 較大初始值下智能體速度軌跡Fig.8 Velocity trajectories of agents with large initial values
圖9表示在本文所提出的動態(tài)事件觸發(fā)策略下,跟隨者智能體觸發(fā)時刻圖。作為對比,圖10給出了采用靜態(tài)事件觸發(fā)策略(見式(16))時的智能體觸發(fā)時刻圖。為了更直觀表示,表1給出了15 s內(nèi)兩種不同觸發(fā)機制所對應(yīng)的觸發(fā)次數(shù),明顯看出動態(tài)觸發(fā)機制下觸發(fā)次數(shù)減少,從而達(dá)到有效降低控制器更新頻率、節(jié)約系統(tǒng)通信和計算資源的目的。
圖9 動態(tài)事件觸發(fā)機制下智能體觸發(fā)時刻Fig.9 Trigger time of agents under the dynamic triggering mechanism
圖10 靜態(tài)觸發(fā)機制下智能體觸發(fā)時刻Fig.10 Trigger time of agents under the static triggering mechanism
表1 動態(tài)觸發(fā)機制與靜態(tài)觸發(fā)機制次數(shù)比較
本文結(jié)合動態(tài)事件觸發(fā)機制,針對受擾非線性多智能體系統(tǒng),解決了有向拓?fù)淝闆r下的固定時間跟蹤控制問題?;谙鄬顟B(tài)誤差信息設(shè)計了積分滑模面,并通過引入內(nèi)部變量構(gòu)造了動態(tài)事件觸發(fā)函數(shù),從而提出了一種新型動態(tài)事件觸發(fā)固定時間跟蹤控制方案,不但有效抑制了外部擾動、滿足控制時間的需求,而且在避免Zeno現(xiàn)象的同時節(jié)省了網(wǎng)絡(luò)通信和計算資源,仿真驗證了該控制方案的有效性和可行性。在實際應(yīng)用中,由于網(wǎng)絡(luò)連接不穩(wěn)定,智能體間的拓?fù)潢P(guān)系會發(fā)生間斷性地變化,后續(xù)將研究多智能體系統(tǒng)在有向切換拓?fù)淝闆r下的動態(tài)事件觸發(fā)固定時間協(xié)同控制。