劉遠(yuǎn)山 楊洪勇 劉 凡 李玉玲 楊怡澤
(1.魯東大學(xué)信息與電氣工程學(xué)院,山東煙臺 264025;2.新南威爾士大學(xué)電氣工程與信息學(xué)院,悉尼)
受到自然界中動物集體運動(或者集群、編隊)行為的啟發(fā),人們發(fā)現(xiàn)由多個具有自主“計算”能力的個體組成的分布式網(wǎng)絡(luò)系統(tǒng)通常能夠完成相對復(fù)雜的任務(wù),且具有單個個體所不具有的能力.多智能體系統(tǒng)的一致性控制[1–4]作為分布式多智能體協(xié)同控制的基礎(chǔ),在智能交通、無人機編隊、分布式計算等領(lǐng)域的廣泛應(yīng)用引起了研究者的關(guān)注.
在實際的工程應(yīng)用中,控制系統(tǒng)總能受到未建模動態(tài),參數(shù)攝動和外部干擾等影響,這些不確定因素會嚴(yán)重影響著系統(tǒng)的動態(tài)性能.文獻(xiàn)[5]通過研究垂直軸磁懸浮軸承中的旋轉(zhuǎn)擾動,設(shè)計了一種非線性擾動觀測器來估計干擾,最終使得系統(tǒng)達(dá)到穩(wěn)定值.文獻(xiàn)[6–8]通過干擾觀測器可以有效估計外部擾動,設(shè)計了基于干擾觀測器的控制協(xié)議,使得具有固定拓?fù)浜妥儞Q拓?fù)涞亩嘀悄荏w系統(tǒng)達(dá)到一致穩(wěn)定.文獻(xiàn)[9]研究了存在外部干擾的時滯高階多智能體系統(tǒng),并利用L2–L∞方法研究了系統(tǒng)的一致性問題,并且得到了閉環(huán)系統(tǒng)達(dá)到一致的條件.針對直流–直流(direct current-direct current,DC–DC)降壓變換器的控制和魯棒性分析問題,文獻(xiàn)[10]提出了一種基于擾動觀測器的控制方法.該方法通過構(gòu)造干擾補償增益,消除了輸出電壓通道中不匹配的不確定性擾動.文獻(xiàn)[11]對現(xiàn)有的擾動或者不確定性估計方法進(jìn)行了系統(tǒng)和全面的回顧,討論了各種補償技術(shù)和集成干擾等不確定性補償.文獻(xiàn)[12]研究了帶有異質(zhì)擾動的一階多智能體系統(tǒng)的平均一致濾波問題,設(shè)計了干擾觀測器估計系統(tǒng)中存在的擾動,利用矩陣?yán)碚摵皖l域分析,在沒有和具有相同通信延遲的情況下分別得到了系統(tǒng)收斂的充要條件.在上述的研究中,大都考慮的是連續(xù)時間系統(tǒng)的情形,智能體的狀態(tài)信息不斷地在各個節(jié)點之間傳輸,這就會占用大量的網(wǎng)絡(luò)帶寬,并且消耗大量的能源.為了解決上述問題,文獻(xiàn)[13–15]中提出多智能體系統(tǒng)的事件觸發(fā)控制機制,分別研究了集中式觸發(fā)、分布式觸發(fā)和自觸發(fā)等控制策略.文獻(xiàn)[16]研究了分布式一階多智能體系統(tǒng)的領(lǐng)導(dǎo)跟隨一致性,文中提出控制協(xié)議中的領(lǐng)導(dǎo)者的控制協(xié)議為全局信息.文獻(xiàn)[17]研究并給出了非線性多智能體系統(tǒng)的基于Lyapunov方法和駐留時間方法兩種事件觸發(fā)機制的設(shè)計策略.文獻(xiàn)[18]針對強連通網(wǎng)絡(luò)提出一種自適應(yīng)事件觸發(fā)控制方案,該方案根據(jù)采樣數(shù)據(jù)動態(tài)改變系統(tǒng)參數(shù)實現(xiàn)觸發(fā)時刻間隔的動態(tài)調(diào)節(jié).文獻(xiàn)[19–20]中研究了異構(gòu)多智能體系統(tǒng)的輸出收斂問題,設(shè)計了一個事件觸發(fā)下的輸出控制機制.文獻(xiàn)[21]研究了基于事件觸發(fā)機制的高階非線性多智能體系統(tǒng)領(lǐng)導(dǎo)者跟隨一致性問題,控制協(xié)議采用基于相鄰智能體的相對輸出量的反饋控制方法,最終推導(dǎo)出系統(tǒng)一致收斂的充分條件.文獻(xiàn)[22]針對一階多智能體系統(tǒng)研究了其事件觸發(fā)的一致性問題,文中采用了領(lǐng)導(dǎo)跟隨結(jié)構(gòu)的自適應(yīng)一致性算法,智能體的控制輸入由集中式事件觸發(fā)條件決定.另外,考慮了多智能體系統(tǒng)在具有相同輸入延遲的情況,并且獲得了線性矩陣不等式形式的一致性收斂條件.
在實際應(yīng)用中,多智能體的輸入通道中不可避免地會存在外部擾動.干擾的存在會影響到系統(tǒng)的運動狀態(tài),所以研究干擾對系統(tǒng)產(chǎn)生的影響是十分必要的,但現(xiàn)在對于這個問題的研究相對較少.本文在總結(jié)前人研究工作的基礎(chǔ)上設(shè)計了一種線性干擾觀測器估計系統(tǒng)中出現(xiàn)的擾動,并提出了一種基于事件觸發(fā)機制的干擾主動控制協(xié)議,研究了具有干擾的多智能體系統(tǒng)一致收斂的充分條件.
符號說明:表示向量或矩陣的歐幾里德范數(shù);符號AT表示矩陣或向量A的轉(zhuǎn)置;使用1N(0N)來表示所有元素為1或者0的N維列向量,符號diag{x1,x2,…,xn}表示對角元素xi為對角矩陣;用符號A ?B表示矩陣A和B的Kronecker積.
智能體與外部系統(tǒng)之間的信息交流一般是通過無向圖或者有向圖來描述.一個圖可以被描述為G=(V,ε),其中:V={1,2,…,N}是一個與N個智能體相關(guān)聯(lián)的非空點集,ε ?V ×V是該智能體集合的邊集.(i,j)∈ε意味著節(jié)點i可以從節(jié)點j獲取信息,節(jié)點j叫做節(jié)點i的鄰居節(jié)點,節(jié)點i的鄰居的集合可以定義為Ni={j:(i,j)∈ε}.加權(quán)鄰接矩陣被定義為如果(i,j)∈ε,那么aij=aji>0,否則aij=0.在這里,本文假設(shè)aii=0,i∈IN,這就意味著每一個節(jié)點沒有自環(huán).與鄰接矩陣A相關(guān)聯(lián)的拉普拉斯矩陣定義為lij=?aij,
在本文中,考慮有N個跟隨者智能體和一個領(lǐng)導(dǎo)者智能體組成的多智能體系統(tǒng)的領(lǐng)導(dǎo)跟隨一致性問題.跟隨者智能體與外部的領(lǐng)導(dǎo)者智能體之間的通信拓?fù)鋱D用是一個節(jié)點集,并且是一個邊集;節(jié)點0代表領(lǐng)導(dǎo)者(外部系統(tǒng)).定義bi為跟隨者和領(lǐng)導(dǎo)者之間的連接權(quán)重,其中i=1,2,…,N.令B=diag{b1,b2,…,bN},如果第i個跟隨者與領(lǐng)導(dǎo)者連通,則bi >0,否則bi=0.
為了方便下面的公式推導(dǎo)與證明,提出以下引理:
引理1[21]L為圖G的Laplacian矩陣,
1)λ1=0是L中的一個特征值,且其對應(yīng)的特征向量為1,即滿足L1=0;
引理2[23]對于任意維度的矩陣M,N,P和Q,并且M和N是可逆矩陣,Kronecker積具有以下特性:
考慮一個帶有領(lǐng)導(dǎo)者的多智能體系統(tǒng),其中跟隨者i的動力學(xué)方程為
假設(shè)1假設(shè)干擾di(t)在控制通道中為諧波噪音或者周期性的噪聲,它可以用如下外部系統(tǒng)來表示:
定義1(領(lǐng)導(dǎo)跟隨一致性)如果對于任意的初始狀態(tài)x0(0)和xi(0),存在控制輸入ui(t)可以使得
對于所有的智能體i均成立,則多智能體系統(tǒng)(1)達(dá)到了領(lǐng)導(dǎo)跟隨一致性,其中i=1,2,…,N.
引理3假設(shè)多智能體系統(tǒng)(1)的狀態(tài)是可以獲得的,構(gòu)造系統(tǒng)(1)的干擾觀測器如下:
證定義干擾觀測器的干擾誤差
由干擾觀測器(3)和干擾估計誤差(4)得到
由于(W,Y)是可觀測的,則一定存在矩陣K,使得矩陣(W ?KY)是Hurwitz的,那么誤差系統(tǒng)(5)是漸近穩(wěn)定的.因此干擾觀測器的干擾估計誤差(t)能夠漸近地跟蹤系統(tǒng)(1)中的干擾實際值. 證畢.
針對帶有外部擾動的領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)(1),其傳統(tǒng)的連續(xù)時間下的一致性控制協(xié)議為
其中:r >0,α>0為待設(shè)計的控制協(xié)議的反饋控制增益,為干擾估計項.
為了降低跟隨者智能體控制協(xié)議的更新次數(shù),節(jié)約智能體有限的計算資源和能源的消耗,所以針對智能體i設(shè)計分布式事件觸發(fā)函數(shù)?i(t).由?i(t)0得到一系列離散的事件觸發(fā)時刻
其中:k=1,2,…代表第k次的事件觸發(fā)時刻,i=1,…,N.設(shè)計第i個智能體的分布式事件觸發(fā)下的領(lǐng)導(dǎo)跟隨一致性控制協(xié)議為
注1一致性控制協(xié)議(6)中所用到的采樣狀態(tài)量為在事件不被觸發(fā)的時間段內(nèi),兩個采樣值均存放在臨時的寄存器或者零階保持器中,當(dāng)?shù)趇個(或者第j個)智能體的事件分別被觸發(fā)的時候才會更新相應(yīng)的(或者
為了分析多智能體系統(tǒng)(1)在控制協(xié)議(6)的作用下能夠?qū)崿F(xiàn)領(lǐng)導(dǎo)跟隨一致性.定義狀態(tài)誤差ei(t)=那么
那么多智能體系統(tǒng)(1)變更為
定理1如果多智能體系統(tǒng)(1)的拓?fù)浣Y(jié)構(gòu)是固定拓?fù)?且具有一棵全局生成樹,領(lǐng)導(dǎo)者為根節(jié)點.對于任意的xi(t)|t=t0∈m選取合適的0<ηi <1,?i∈{1,2,…,N},設(shè)計分布式事件觸發(fā)函數(shù)如下:
其中:r >0,α>0為控制協(xié)議的控制增益,|Ni|表示了智能體i的直接相連的鄰居智能體的數(shù)目.在控制協(xié)議(6)的作用下,當(dāng)時,多智能體系統(tǒng)(1)可以實現(xiàn)領(lǐng)導(dǎo)跟隨一致性.
證構(gòu)造Lyapunov函數(shù)
對于狀態(tài)誤差ei(t),可以得到
所以
如果存在ηi∈(0,1]可以使得
注2由于該事件觸發(fā)條件是分布式的,對于智能體i只要滿足事件觸發(fā)控制器將會提取自身及其鄰居的狀態(tài)來更新控制器(6).
注3在分布式事件觸發(fā)函數(shù)(10)中的為方程(5)的解.因為在引理1中被證明是漸近穩(wěn)定的,所以是有界的.由于事件觸發(fā)函數(shù)(10)中實際干擾與估計的干擾值的誤差項是存在的,所以使得變得更容易滿足,并且該項使得(10)變?yōu)楦颖J氐挠|發(fā)條件.
當(dāng)兩個事件觸發(fā)時刻之間的間隔為0時,稱為芝諾效應(yīng).如果出現(xiàn)這種情況,則事件觸發(fā)機制不能被使用.為表明本文所提事件觸發(fā)策略不會在極小的時間段內(nèi)被觸發(fā)無限次,特給出如下定理及其證明.
定理2假設(shè)圖中Leader作為一個全局可達(dá)點,考慮帶有一個領(lǐng)導(dǎo)者的多智能體系統(tǒng)(1)–(2),應(yīng)用一致性協(xié)議(6)和分布式事件觸發(fā)函數(shù)(10).則多智能體系統(tǒng)(1)–(2)中的任意一個智能體q,得到的所有的觸發(fā)時刻為τ0… τk τk+1,它的任意兩個連續(xù)事件觸發(fā)時刻之間的間隔不小于
證構(gòu)造(t)/(t)的動力學(xué)方程如下:
當(dāng)t∈[tk,tk+1)時,
由于上式中ed(t)為觀測器的估計值與輸入通道中的外部擾動,通過上面的分析,可以得到所以可以將上式變?yōu)?/p>
解上式微分方程可得
所以,可以得到
證畢.
在這一部分,將利用MATLAB軟件來仿真驗證本文所提的控制算法和分布式事件觸發(fā)函數(shù).在本次實驗中考慮由4個Follower和1個Leader組成的多智能體網(wǎng)絡(luò)系統(tǒng).假設(shè)每個Follower智能體的鄰居為N1={4},N2={3,4},N3={2},N4={1,2},那么可以得到多智能體系統(tǒng)(1)如圖1所示的拓?fù)浣Y(jié)構(gòu).
圖1 多智能體系統(tǒng)的通信拓?fù)鋱DFig.1 Communication topology of multi-agent systems
那么多智能體系統(tǒng)(1)相應(yīng)的Laplacian矩陣和領(lǐng)導(dǎo)跟隨矩陣如下:
假設(shè)外源干擾信號由以下外部系統(tǒng)產(chǎn)生:
應(yīng)用線性矩陣不等式為了使矩陣(W ?KY)為Hurwitz的,那么可以選取干擾觀測增益K為[3 3]T.假設(shè)
分別為擾動系統(tǒng)(13)的初始狀態(tài).對于控制協(xié)議ui(t),選取
智能體的初始狀態(tài)為
在上述初始狀態(tài)下,按照給出的控制器來調(diào)控系統(tǒng)可以得到智能體位置狀態(tài)仿真圖2–3.
圖2 帶有外部擾動和干擾觀測器的多智能體系統(tǒng)的運動軌跡Fig.2 Trajectories of multi-agent systems with external disturbance observer
圖3 4個智能體干擾觀測器的觀測誤差Fig.3 Observation errors of 4 agents with the disturbance observer
系統(tǒng)仿真圖2是帶有外部擾動和干擾觀測器的多智能體系統(tǒng)的運動狀態(tài)的實際值,盡管多智能體的輸入通道中存在外部擾動的影響,但是由于控制協(xié)議中加入了擾動抑制項,4個跟隨者的位置狀態(tài)仍然可以一致起來并且跟蹤到領(lǐng)導(dǎo)者,表現(xiàn)出了較好的控制效果.由此可以看出采用本文的控制協(xié)議和分布式事件出發(fā)機制能夠抑制外部擾動的影響.
系統(tǒng)仿真圖3是干擾觀測器對受擾動多智能體系統(tǒng)(1)中每個智能體的干擾觀測誤差.干擾觀測器能夠計算出智能體的輸入通道中存在的擾動,各個智能體的觀測誤差很快趨近于0.說明干擾觀測器可以估計出時變的干擾,從而表現(xiàn)出良好的性能.
表1為帶有外部擾動的多智能體系統(tǒng)在分布式事件觸發(fā)機制下的事件觸發(fā)次數(shù)和觸發(fā)比率,由表中數(shù)據(jù)可以看出采用本文的控制協(xié)議可以大范圍降低智能體的采樣和控制器的更新次數(shù).
表1 4個跟隨者智能體的事件觸發(fā)次數(shù)和觸發(fā)比率(存在擾動帶有擾動抑制項)Table 1 Event-triggered times and ratios for 4 followers with disturbance rejection
由系統(tǒng)仿真圖4可以看出每個智能體的事件觸發(fā)時刻不是在同一時刻,表明本文設(shè)計的觸發(fā)機制確實是分布式的.選取智能體4觀察其誤差范數(shù),從系統(tǒng)仿真圖5中可以看出,在多智能體系統(tǒng)剛開始運行的時候觸發(fā)間隔較小且誤差范數(shù)相對較大,隨著時間的推移誤差范數(shù)在不斷減小且觸發(fā)時刻變得稀疏,這與預(yù)期的結(jié)果是一致的.
圖4 4個跟隨者智能體的分布式觸發(fā)時刻Fig.4 Distributed triggered intervals for 4 followers
圖5 智能體4的狀態(tài)誤差的范數(shù)Fig.5 Error norms of 4 agents
為了更好地表明本文提出的基于事件觸發(fā)的多智能體系統(tǒng)的干擾主動控制器的優(yōu)勢,在初始條件和控制參數(shù)相同的情況下與文獻(xiàn)[16]的結(jié)果進(jìn)行比較.系統(tǒng)仿真圖6是基于事件觸發(fā)的控制算法但是沒有對擾動進(jìn)行抑制的智能體系統(tǒng)的運動狀態(tài),從圖6中以看出如果不對通道中的外部干擾進(jìn)行適當(dāng)?shù)囊种?那么多智能體系統(tǒng)的位置狀態(tài)將不能達(dá)到漸進(jìn)一致,且無法追蹤到系統(tǒng)中領(lǐng)導(dǎo)者.系統(tǒng)仿真圖7表示每個智能體的事件觸發(fā)時刻,與系統(tǒng)仿真圖4相比較事件觸發(fā)時刻更加密集且不均勻的.
通過比較表1和表2可以發(fā)現(xiàn),當(dāng)存在外部擾動時,變化幅度較大的狀態(tài)會使得事件觸發(fā)機制變得更容易觸發(fā),從而增加了事件觸發(fā)的次數(shù)和頻率,本文基于分布式事件觸發(fā)和干擾主動控制的領(lǐng)導(dǎo)跟隨一致性算法不僅可以消除擾動的影響,更能減少事件觸發(fā)次數(shù)和節(jié)約多智能體系統(tǒng)的通信資源.
圖6 具有外部擾動但不帶干擾觀測器的多智能體系統(tǒng)的運動軌跡Fig.6 Trajectories of multi-agent systems without external disturbance observer
圖7 4個跟隨者智能體的分布式觸發(fā)時刻Fig.7 Distributed triggered intervals of 4 followers
表2 4個跟隨者智能體的事件觸發(fā)次數(shù)和觸發(fā)比率(無擾動抑制項)Table 2 Event-triggered times and ratios for 4 followers without disturbance rejection
本文考慮了帶有外部擾動的多智能體系統(tǒng)在固定無向拓?fù)浣Y(jié)構(gòu)下的領(lǐng)導(dǎo)跟隨一致性問題,提出了一種基于干擾觀測器的分布式事件觸發(fā)控制機制.控制器的狀態(tài)更新依賴于觸發(fā)函數(shù),本文在分布式事件觸發(fā)機制的控制下每個智能體可以實現(xiàn)領(lǐng)導(dǎo)跟隨一致.通過理論分析證明了本文所設(shè)計的分布式事件觸發(fā)機制不會存在芝諾行為.仿真結(jié)果表明本文所提事件觸發(fā)控制算法能夠抑制擾動,并且能實現(xiàn)多智能體系統(tǒng)的領(lǐng)導(dǎo)跟隨一致性.
實際的多智能體系統(tǒng)的拓?fù)浣Y(jié)構(gòu)往往不是固定不變的,所以,下一步的工作將是對在切換拓?fù)浜陀邢驁D的情況下的多智能體系統(tǒng)事件觸發(fā)領(lǐng)導(dǎo)跟隨一致性的研究.