唐 云,唐朝君,魏正元
重慶理工大學 理學院,重慶 400054
近年來,由于多智能體系統(tǒng)的協(xié)同控制在各方面都有應用,已逐漸引起許多學者的關注。協(xié)同控制在機器人協(xié)作、傳感器網絡、和軍事領域等方面都有體現(xiàn)[1-3],多智能體系統(tǒng)協(xié)同控制的目的是分析和設計一種控制協(xié)議,使得智能體之間通過相互協(xié)作能夠高效率和快速地完成單個智能體所不能完成的目標,這一問題通常被稱之為一致性問題。關于一致性問題的研究已經取得了許多的成果如文獻[4-9]。
關于多智能體系統(tǒng)的一致性控制策略,許多學者提出了不同的設計方法,早期一種連續(xù)控制策略的方法被提出[10],連續(xù)控制策略是建立在每個智能體的資源充足,可以連續(xù)的交換信息之上,但是在實際的應用中,智能體自身的資源是并不是無限的,而且連續(xù)控制策略會加大智能體的通信負擔和控制器的更新頻次,降低了智能體的工作時長,所以在控制過程中就造成了許多資源的浪費。為了減少在系統(tǒng)控制過程中資源浪費的問題,文獻[11]提出了一種周期采樣控制,在相同的時間間隔,所有的控制器統(tǒng)一更新,這種控制方法在一定程度上降低了資源損耗,但是依然存在資源浪費的現(xiàn)象。為了解決這一問題,文獻[12]就提出了一種基于事件觸發(fā)控制的控制策略,即當前采樣的測量值是否滿足預先設定的事件觸發(fā)函數(shù),若滿足事件觸發(fā)函數(shù),則控制器才會更新其狀態(tài)值,反之亦然。所以可以明顯的觀察出相較于傳統(tǒng)的采樣控制,事件觸發(fā)的控制協(xié)議,能保證系統(tǒng)的穩(wěn)定性,同時使得控制器不在連續(xù)更新狀態(tài),只在離散時刻處觸發(fā),有效地實現(xiàn)節(jié)約資源.當前關于事件觸發(fā)控制協(xié)議在一致性問題的研究中都有體現(xiàn)如文獻[13-17]。文獻[13,14]討論了無向拓撲下一階多智能體系統(tǒng)的一致性問題,提出了事件觸發(fā)控制策略,在這種控制策略下,資源浪費的問題被有效地解決,但系統(tǒng)是建立在無向拓撲上,沒有考慮現(xiàn)實中智能體的信息傳輸是有方向的,因此對有向拓撲的討論是有意義的。文獻[15]討論了領導跟隨事件觸發(fā)多智能體系統(tǒng)的一致性問題,在事件觸發(fā)控制策略下保證了跟隨者漸進收斂到領導者的狀態(tài)。文獻[16,17]中Dimarogonas和Johansson利用無向拓撲的特性,設計事件觸發(fā)控制協(xié)議,解決了多智能體系統(tǒng)的一致性問題,控制器是否觸發(fā)取決于是否滿足觸發(fā)條件(測量誤差相對于狀態(tài)函數(shù)范數(shù)的比值)但系統(tǒng)并沒有考慮非線性,為設計更貼近于生活的系統(tǒng),非線性系統(tǒng)的研究是有必要的。
基于以上原因的分析,在上述文獻的基礎上設計了更一般的系統(tǒng),研究了無領導事件觸發(fā)一致性,不同之處主要有兩點:第一,在許多網絡系統(tǒng)中,智能體的信息交流是既有方向又有權重,設計的智能體的通信拓撲圖是加權有向圖。第二,在現(xiàn)實生活中大多數(shù)物理系統(tǒng)都是非線性的[18],為了使系統(tǒng)更具有一般性,設計的系統(tǒng)是非線性的,同時上述的文獻的控制協(xié)議與設計的控制協(xié)議也不一樣,控制協(xié)議更具有一般性。
用三元組G=(V,E,A)表示智能體之間通信拓撲圖,其中V={v1,v2,…vn}表示頂點集,vi表示第i個智能體;E?V×V表示有向圖G的邊集;A=[aij]∈Rn×n表示有向圖G的鄰接矩陣。圖G是強連通的,如果滿足圖中任意兩個頂點之間都有一條有向路徑。設Ni={vj∈V|(vj,vi)∈E}表示頂點i的鄰居集。令加權有向圖G的Laplacian矩陣為L=[lij]∈RN×N其元素lij滿足以下定義:
若存在頂點序列vi1,vi2,…vim其中(vij,vij+1)∈V則稱從頂點vi1到頂點vim有一條有向路徑。如果有向圖中存在一個根節(jié)點,具有到其他所有節(jié)點的有向路徑,則稱該圖包含一棵有向生成樹。
引理1[19]設圖G是強連通的,則存在ξ=(ξ1,ξ2,…,ξN)T使得ξTL=0,其中ξi>0,i=1,2,…,N且
引理3[21]零是有向圖G的Laplacian矩陣L的特征值,1=(1,1,…,1)T∈Rn是其對應的右特征向量,其他非零特征值均具有正實部,如果有向圖G包含一個有向生成樹,則0是L的簡單特征值。
考慮由N個智能體組成的多智能體系統(tǒng),設第i個智能體的運動學方程可以表示為
(1)
其中,xi(t)∈R表示智能體i的狀態(tài),ui(t)∈R是智能體i的控制輸入,f(xi(t),t):R×R→R表示智能體i的非線性連續(xù)函數(shù)。
假設1假定系統(tǒng)式(1)的非線性函數(shù)f(xi(t),t):R×R→R,存在l∈(0,+∞)滿足:
|f(x,t)-f(y,t)|≤l|x-y|
(2)
定義1 對于智能體的任何初始狀態(tài)xi(0)(i=1,2,…,N),利用控制輸入ui(t),使得所有智能體i滿足:
則稱系統(tǒng)式(1)實現(xiàn)一致性。
證明:顯然FTLTLF是對稱矩陣,則對于任意的向量δ,有δTFTLTLFδ≥0。
只需要證明:δTFTLTLFδ=0可以推出δ=0。
首先研究如下的控制協(xié)議:
(3)
其中,ts表示智能體的第s次觸發(fā)時刻。
定義第i個智能體的狀態(tài)測量誤差為
(4)
u(t)=-e(t)-αy(t)t∈[ts,ts+1)
(5)
由式(1)和式(5)可以得到:
(6)
其中:f(x(t),t)=(f(x1(t),t),…,f(xN(t),t))T
則:
(7)
定理1:對于多智能體系統(tǒng)式(1),假設有向圖G是強連通的,控制增益滿足:
(8)
限定觸發(fā)條件滿足:
(9)
ξmax=max{ξ1,ξ2,…,ξN},i=1,2,…N
在控制協(xié)議式(3)下,系統(tǒng)式(1)可以達到一致。
證明:對系統(tǒng)式(1)構造Lyapunov函數(shù)
(10)
對V(t)求導得:
(11)
由(7)式可以得:
‖y(t)‖‖M‖‖L‖‖e(t)‖+
yT(t)MLf(x(t),t)
(12)
令,H=yT(t)MLf(x(t),t)。
則:
H=yT(t)ML[f(x(t),t)-f(x1(t),t)1N]=
(13)
由假設1可知:
(14)
由式(12)和式(14),就可以得到:
‖y(t)‖‖M‖‖L‖‖e(t)‖+
(15)
‖y(t)‖‖M‖‖L‖‖e(t)‖+
‖y(t)‖‖M‖‖L‖‖e(t)‖
(16)
根據(jù)式(9),得到
(17)
(18)
(19)
由假設1和定理1的證明過程可得:
(20)
因為
(21)
(22)
定理得證。
注:在控制協(xié)議式(3)中,假設系統(tǒng)中的智能體具有相同的觸發(fā)時刻,觸發(fā)時刻的計算需要用到全局信息,因此控制協(xié)議式(3)是集中式的控制協(xié)議。
設第i個智能體的狀態(tài)測量偏差為
(23)
(24)
證明:對系統(tǒng)式(1)構造Lyapunov函數(shù):
(25)
對V(t)求導得:
(26)
由式(7)可以得:
|yT(t)MLe(t)|
(27)
令Q=yT(t)MLe(t),則可以得到:
(28)
根據(jù)定理1,式(27)和式(28)可得:
(29)
(30)
(31)
其余的證明和定理3類似,再結合式(24),可以解出:
定理得證。
考慮含有4個智能體的多智能體系統(tǒng),系統(tǒng)通信拓撲對應的Laplacian矩陣如下:
設非線性函數(shù)f(xi(t))=sin(xi(t)),4個智能體的初始狀態(tài)隨機的選取為:x1(0)=-3,x2(0)=-2,x3(0)=1,x4(0)=2。
經過計算得到λ*=λmin(FTLTLF)=0.585 8,取l=1,M=diag{1,1,1,1},經過計算分析取α=30。
對于集中式的控制協(xié)議式(3),選取參數(shù)α=30,σ=0.5時,圖1給出智能體的狀態(tài)軌跡,圖2給出了系統(tǒng)的狀態(tài)誤差隨時間的變化,明顯看出所有智能體只在特定的時刻才能觸發(fā)。
圖1 集中式事件觸發(fā)機制下系統(tǒng)的軌跡Fig. 1 The trajectory of the system under centralized event-triggering mechanism
圖2 集中式事件觸發(fā)機制下系統(tǒng)狀態(tài)誤差變化Fig. 2 Changes of system state errors under centralizedevent-triggering mechanism
對于分布式事件觸發(fā)式(2)中,參數(shù)的值分別取為:α=30,σ1=0.5;σ2=0.5;σ3=0.5;σ4=0.5;智能體的狀態(tài)軌跡如圖3所示,為了方便描述系統(tǒng)誤差狀態(tài)變化選取智能體3的圖像,如圖4所示。
圖3 分布式事件觸發(fā)機制下系統(tǒng)的軌跡Fig. 3 The trajectory of the system under the distributedevent-triggering mechanism
圖4 分布式事件觸發(fā)下智能體3的狀態(tài)誤差變化Fig. 4 Changes of state errors of Agent 3 triggered by distributed events
可以看出系統(tǒng)式(1)在兩種協(xié)議下,都能實現(xiàn)一致性。
研究了有向網絡拓撲下,基于事件觸發(fā)的非線性動態(tài)的多智能體系統(tǒng)一致性問題??紤]到系統(tǒng)自身和網絡寬帶的資源是有限的,為了有效利用資源,降低系統(tǒng)控制過程中的資源消耗問題,提出事件觸發(fā)控制協(xié)議,設置了兩種不同的一致性控制協(xié)議,假設智能體的通信拓撲是強連通的,設計一種集中式的控制協(xié)議,即系統(tǒng)中的每個智能體都具有相同的觸發(fā)時刻,控制器不在連續(xù)的更新狀態(tài),只在離散時刻更新狀態(tài),利用矩陣理論和代數(shù)圖論等相關知識,得出系統(tǒng)在集中式控制協(xié)議下實現(xiàn)一致性的充分條件。其次討論分布式控制協(xié)議,即智能體只需要利用鄰居智能體和自身的信息,將集中式的結論推廣到分布式的一致性協(xié)議上,得出在分布式協(xié)議下系統(tǒng)可以實現(xiàn)一致性,最后通過數(shù)值仿真,也驗證了所提理論的正確性。
下一步工作就是在此基礎之上討論動態(tài)事件觸發(fā)的一致性問題,即觸發(fā)條件不僅可以利用當前智能體的狀態(tài)和測量偏差的狀態(tài),還與智能體觸發(fā)前的智能體狀態(tài)建立聯(lián)系,使得設計的觸發(fā)條件更加精確。其次考慮智能體之間不僅有協(xié)作還有競爭關系,即討論二分一致性問題,使所構建系統(tǒng)更加貼近生活實際,最后,再進一步考慮高階多智能體系統(tǒng)領導跟隨一致性問題。