馬文周, 柏曉明
(合肥工業(yè)大學(xué) 數(shù)學(xué)學(xué)院,安徽 合肥 230601)
多智能體系統(tǒng)通常是指由大量具有通信連接的智能體所組成的系統(tǒng)。借助智能體間的信息交換,系統(tǒng)在整體上可以呈現(xiàn)出單一智能體所不具備的行為,這種系統(tǒng)在生物、工程和社會(huì)等領(lǐng)域廣泛存在。多智能體系統(tǒng)的一個(gè)基本問題就是趨同問題;趨同問題就是設(shè)計(jì)合適的分布式協(xié)議,最終使多智能體系統(tǒng)的每個(gè)智能體的狀態(tài)達(dá)到一致。文獻(xiàn)[1-8]中的控制協(xié)議大都建立在多智能體之間的連續(xù)通訊的基礎(chǔ)上,這將消耗大量的通訊資源。為了達(dá)到節(jié)省通訊資源的目的,事件驅(qū)動(dòng)方法被引入了網(wǎng)絡(luò)控制系統(tǒng)中,即只有在滿足事件驅(qū)動(dòng)觸發(fā)條件時(shí),多智能體之間才互相通訊。
基于事件驅(qū)動(dòng)的控制是現(xiàn)在網(wǎng)絡(luò)控制系統(tǒng)中的一個(gè)熱門話題[9-18]。文獻(xiàn)[9]證明了經(jīng)典事件驅(qū)動(dòng)策略控制下,控制系統(tǒng)無芝諾行為發(fā)生,可有效節(jié)省通訊資源。文獻(xiàn)[10-16]分別探討了在無噪聲假設(shè)下不同類型有效的事件驅(qū)動(dòng)觸發(fā)方案以及事件驅(qū)動(dòng)控制協(xié)議,其中文獻(xiàn)[11]提出了一種區(qū)別于以往的集中事件觸發(fā)方案,能更有效地降低智能體間通訊頻率,且避免了芝諾行為的發(fā)生。文獻(xiàn)[17-18]探討了在有乘性系統(tǒng)噪聲存在下的帶事件驅(qū)動(dòng)的多智能體系統(tǒng)一致性問題,并且分別給出了在有噪聲假設(shè)下的有效的事件觸發(fā)方案以及事件驅(qū)動(dòng)控制協(xié)議,其中文獻(xiàn)[17]通過隨機(jī)變量期望的上下界函數(shù)以及引入的一個(gè)內(nèi)部動(dòng)態(tài)變量在保證系統(tǒng)的均方一致性的同時(shí)避免了芝諾行為的發(fā)生;文獻(xiàn)[18]通過隨機(jī)變量的期望以及引入一個(gè)內(nèi)部變量的方法保證系統(tǒng)的均方一致性與無芝諾行為發(fā)生。
本文參考文獻(xiàn)[17-18]方法,采用文獻(xiàn)[11]的事件驅(qū)動(dòng)控制協(xié)議證明了在該事件驅(qū)動(dòng)控制下帶領(lǐng)導(dǎo)者的線性隨機(jī)多智能體系統(tǒng)可以達(dá)到均方一致,且無芝諾行為發(fā)生;最后通過數(shù)值模擬,驗(yàn)證了理論分析的正確性。
本文中‖·‖表示向量2范數(shù)與矩陣的2誘導(dǎo)范數(shù)。(Ω,F,{Ft}t≥0,P)為完備概率空間,其中,Ω為樣本空間;F為σ-域;{Ft}t≥0為濾子;P為概率測(cè)度。
A=[aij]∈RN×N為圖G的鄰接矩陣,當(dāng)且僅當(dāng)(i,j)∈E時(shí),aij=1,aii=0,其余aij=0。定義對(duì)角矩陣D=diag{d1,d2,…,dN},當(dāng)且僅當(dāng)頂點(diǎn)i可以從領(lǐng)導(dǎo)者處獲取信息時(shí),di=1,其余di=0。定義拉普拉斯矩陣為:
記H=L+D。
考慮帶N個(gè)跟隨者的多智能體趨同控制系統(tǒng):
(1)
其中:i=1,2,…,N;xi(t)∈Rn表示多智能體狀態(tài);x0(t)表示領(lǐng)導(dǎo)者狀態(tài);ui(t)∈Rn表示智能體i的控制輸入;A∈Rn×n、B∈Rn×m、C∈Rn×n都為多常數(shù)矩陣;wi(t)表示定義在概率空間(Ω,F,{Ft}t≥0,P)上的一維布朗運(yùn)動(dòng)。
定義測(cè)量誤差為:
(2)
本文使用事件驅(qū)動(dòng)控制協(xié)議為:
(3)
其中,K=BTP,P為滿足假設(shè)條件的正定矩陣。跟隨者i的控制輸入由上一次事件驅(qū)動(dòng)時(shí)跟隨者與領(lǐng)導(dǎo)者的狀態(tài)以及時(shí)間間隔t-tk計(jì)算得來。
用δi(t)=xi(t)-x0(t)表示跟隨者i逼近領(lǐng)導(dǎo)者狀態(tài)的程度。
dδ(t)=(IN×N?A)δ(t)-(H?BK)(δ(t)+
e(t))dt+(IN×N?C)δ(t)dw(t)
(4)
事件觸發(fā)時(shí)間序列{tk}定義如下:
tk+1=inf{t>tk|E‖(IN?N?K)e(t)‖2-
βE(‖H?K)δ(t)‖2)-λ(t)>0}
(5)
其中
E‖(IN×N?K)e(t)‖2)-σλ(t)
(6)
且β,σ>0;λN>0為矩陣H的最大特征值。領(lǐng)導(dǎo)者的所有跟隨者共享同一個(gè)事件觸發(fā)時(shí)間序列。
假設(shè)1 代數(shù)黎卡提不等式
CTPC+I<0
(7)
有正定解。其中,λ1、λN分別為矩陣H的最小、最大特征值。
本文使用文獻(xiàn)[11]中事件驅(qū)動(dòng)控制策略,參考文獻(xiàn)[17-18],在其事件觸發(fā)機(jī)制中引入隨機(jī)變量的期望以及一個(gè)內(nèi)部動(dòng)態(tài)變量,使該事件驅(qū)動(dòng)控制策略在有乘性噪聲的環(huán)境中依舊能有效地避免芝諾行為,且文章事件觸發(fā)機(jī)制中考慮了增益矩陣K,這與文獻(xiàn)[17-18]均不相同。
引理1[19]當(dāng)且僅當(dāng)圖G是連通圖時(shí),由圖G決定的矩陣H正定。
顯然,若圖G中存在m個(gè)連通分量,且每一個(gè)連通分量都可以從領(lǐng)導(dǎo)者處獲取信息,各連通分量間互相不通訊。單獨(dú)每個(gè)連通分量與領(lǐng)導(dǎo)者決定的矩陣Hi正定,由圖G決定的矩陣:
也為正定矩陣。
(8)
若μ2(A)<0,則
μ2(A)≥-(‖A-1‖)-1≥-‖A‖
(9)
引理4[22](Gronwall不等式) 設(shè)r(t)、h(t)、y(t)是定義在[a,b]上的連續(xù)函數(shù),r(t)≥0,h(t)≥0,且對(duì)?t∈[a,b],都有:
則
若h(t)為常數(shù)h,則
引理5系統(tǒng)(1)中,對(duì)于?t∈[tk,tk+1),E(‖(IN?N?K)e(t)‖2)與E(‖(H?K)δ(t)‖2)分別存在如下上界函數(shù)、下界函數(shù):
Γ1(δ(tk),t-tk)≥E(‖(IN×N?K)e(t)‖2)
(10)
Γ2(δ(tk),t-tk)≤E(‖(H?K)δ(t)‖2)
(11)
其中
Γ1(δ(tk),t-tk)=
(exp{2μ2(A)(t-tk)}-exp{a(t-tk)});
Γ2(δ(tk),t-tk)=
(exp{-b(t-tk)}-exp{2μ2(A)(t-tk)})+
E‖H?Kδ(tk)‖2exp{-b(t-tk)};
λmin(KTK)為矩陣KTK的最小非0特征值。
證明設(shè)
Γ(t)=‖(IN×N?K)e(t)‖2,t∈[tk,tk+1)。
由Dynkin公式得:
E(‖(IN×N?K)e(t+ε)‖2|Ft)=
‖(IN×N?K)e(t)‖2+
eT(s)(IN×N?CTKTKC)e(s))ds|Ft]
由ε的任意性以及富比尼定理可知:
D+EΓ(t)=2EeT(t)(IN×N?KTKA)e(t)+
EeT(t)(IN×N?CTKTKC)e(t)≤
‖KKT‖)E‖(IN×N?K)e(t)‖2+
由(8)式得:
E‖(H?K)δ(tk)‖2exp{2μ2(A)(t-tk)},
其中,λmin(HH?KTK)為矩陣HH?KTK的最小非0特征值。
由(8)式、(9)式易知a-2μ2(A)>0。由引理3及
Γ(tk)=E(‖(IN?N?K)e(tk)‖2)=0,
即得(10)式。
同理,可設(shè)
Φ(t)=-E‖(H?K)δ(t)‖2,
得
D+(EΦ(t))≤
E‖(H?K)δ(tk)‖2exp{2μ2(A)(t-tk)}。
由比較法則以及Φ(tk)=-E‖(H?K)δ(tk)‖2即得(11)式。
證明設(shè)
顯然有S1>0,S2>0。
等式Γ1(δ(tk),T)=βΓ2(δ(tk),T)兩邊同時(shí)除以exp{2μ2(A)T},則有:
S1(exp{(a-2μ2(A))T}-1)=
βS2(exp{(-b-2μ2(A))T}-1)+
βexp{(-b-2μ2(A))T}。
設(shè)
f(T)=S1(exp{(a-2μ2(A))T}-1)-
βS2(exp{(-b-2μ2(A))T}-1)-
βexp{(-b-2μ2(A))T}
(12)
而
f(0)=-1<0
(13)
(14)
f′(T)=(a-2μ2(A))S1exp{(a-2μ2(A))T}+
(b+2μ2(A))βS2exp{(-b-2μ2(A))T}+
(b+2μ2(A))βexp{(-b-2μ2(A))T}>0
(15)
故f(T)在T∈(0,+∞)上單調(diào)遞增。由(13)式、(14)式可知,方程f(T)=0存在唯一大于0的解T*。
當(dāng)a≥b,μ2(A)>0時(shí),設(shè)
g(T)=S1(exp((a+2μ2(A))T)-1)-
βS2(exp((-a-2μ2(A))T)-1)-
βexp((-a-2μ2(A))T),
顯然g(T)也是單調(diào)遞增函數(shù),且f(T)≤g(T)。
同上易證,存在T*,使得0=g(T*)≥f(T*)。
記y=exp{(a+2μ2(A))T},令g(T)=0,即
S1y2+(βS2-S1)y-βS2-β=0。
解上述方程,舍去負(fù)值,解得:
同理,
因?yàn)镾3>0且y*>1,所以有T*>0。
易知,T*由僅與系統(tǒng)參數(shù)矩陣、增益矩陣、由拓?fù)浯_定的矩陣H、常數(shù)β有關(guān)。
證明設(shè)
(16)
dV(t)=LV(t)dt+
ej(t)-ei(t)]-di(δi(t)+ei(t))}+
δT(t)(IN×N?(ATP+PA+CTPC)-
H?2PBBTP)δ(t)-
δT(t)(H?2PBTBP)e(t)≤
δT(t)(IN×N?(ATP+PA+CTPC)-
H?2PBBTP)δ(t)+
δT(t)(H?PBBTP)δ(t)+
eT(t)(H?PBBTP)e(t)≤
δT(t)(IN×N?(ATP+PA+CTPC)-
H?PBBTP))δ(t)+
λNeT(t)(IN×N?PBBTP)e(t)
(17)
由(5)式、(6)式與引理1易知λ(t)≥0。
設(shè)S(t)=V(t)+λ(t),由(6)式、(7)式、(17)式可得:
E(δT(t)(IN×N?(ATP+PA+CTPC)-
H?PBBTP))δ(t)+
βλNδT(t)(HH?PBBTP)δ(t)-σλ(t)≤
E(δT(t)(IN×N?(ATP+PA+CTPC)-
H?PBBTP))δ(t)+
E(LS(t))≤E(δT(t)|IN×N?
CTPC)δ(t))-σλ(t)≤
-E(δT(t)δ(t))-σλ(t)≤
-E(δT(t)δ(t))
(18)
而
對(duì)?t∈[t0,+∞),有
(19)
由引理4可得:
(20)
顯然
且?guī)ьI(lǐng)導(dǎo)者的系統(tǒng)可達(dá)均方一致。
由引理6及(5)式、(6)式、(10)式、(11)式可知,對(duì)?t∈[tk,+∞),若
E(‖(IN×N?K)e(t)‖2)-
βE(‖(H?K)δ(t)‖2)-λ(t)=0
存在解t1,則有t1-tk≥T*。
假設(shè)在上述事件驅(qū)動(dòng)下,存在k,使得tk+1-tk=τk 由(15)式可知,f(T)為單調(diào)遞增函數(shù)且f(T*)=0,因此 Γ1(δ(tk),τk)-βΓ2(δ(tk),τk)<0。 若事件驅(qū)動(dòng)在tk+1時(shí)觸發(fā),λ(tk+1)>0,則 0=E(‖(IN×N?K)e(tk+1)‖2)- βE(‖(H?K)δ(tk+1)‖2)- λ(tk+1)≤Γ1(δ(tk),τk)- βΓ2(δ(tk),τk)-λ(tk+1) ≤ Γ1(δ(tk),τk)-βΓ2(δ(tk),τk)<0。 矛盾! 因此在上述事件驅(qū)動(dòng)控制下,任意2個(gè)時(shí)間驅(qū)動(dòng)觸發(fā)時(shí)刻間的時(shí)間間隔不會(huì)小于T*,故系統(tǒng)無芝諾行為發(fā)生。 考慮帶領(lǐng)導(dǎo)者的多智能體系統(tǒng)如下: 考慮有1個(gè)領(lǐng)導(dǎo)者7個(gè)跟隨者的有向圖,將領(lǐng)導(dǎo)者的所有跟隨者分屬于2個(gè)聯(lián)通子圖,如圖1所示。 每個(gè)聯(lián)通子圖可自領(lǐng)導(dǎo)者處獲取信息。 圖1 有領(lǐng)導(dǎo)者及2個(gè)聯(lián)通子圖的有向圖 取β=0.03,求得滿足定理1要求的增益矩陣為: 取σ=1,做仿真模擬,如圖2、圖3所示。可見系統(tǒng)趨同效果良好。 事件驅(qū)動(dòng)觸發(fā)時(shí)刻圖如圖4所示。在該事件驅(qū)動(dòng)下,系統(tǒng)多智能體間通訊次數(shù)為545次,較之連續(xù)通訊600 00次,可節(jié)省大量通訊資源,且最小事件間隔為0.002 8,無芝諾行為發(fā)生,見表1所列。 圖2 智能體狀態(tài)趨同效果圖 圖4 事件觸發(fā)時(shí)刻圖 表1 事件觸發(fā)次數(shù)與時(shí)間間隔 本文基于事件驅(qū)動(dòng)方法對(duì)有乘性噪聲的線性對(duì)多智能體系統(tǒng)的均方一致性進(jìn)行了研究,利用隨機(jī)分析和微分方程穩(wěn)定性理論方法證明了帶領(lǐng)導(dǎo)者的線性隨機(jī)多智能體系統(tǒng)在該控制策略下可達(dá)均方一致,并證明了該事件觸發(fā)方案能夠避免芝諾行為的發(fā)生。最后通過仿真,驗(yàn)證了該事件觸發(fā)方案可有效減少多智能體間通訊次數(shù),避免芝諾行為。3 數(shù)值模擬
4 結(jié) 論