周紹磊,趙學(xué)遠(yuǎn),王帥磊,祁亞輝
(海軍航空大學(xué), 山東 煙臺(tái) 264001)
近年來,隨著多智能體系統(tǒng)一致性問題的研究日益深入,將多智能體系統(tǒng)一致性的分布式控制思想及方法,應(yīng)用到多智能體編隊(duì)控制中也取得了大量成果[1-3]。文獻(xiàn)[4]中利用多智能體之間相對(duì)距離信息,基于鴿群行為設(shè)計(jì)了最優(yōu)編隊(duì)控制器,使得系統(tǒng)形成編隊(duì),并在復(fù)雜運(yùn)動(dòng)下能夠有效地保持編隊(duì)隊(duì)形。文獻(xiàn)[5]中利用一致性思想設(shè)計(jì)了控制器,使得一類特殊的高階系統(tǒng)形成編隊(duì)。為了解決離散的多智能體系統(tǒng)編隊(duì)控制問題,文獻(xiàn)[6]中設(shè)計(jì)了一致性分布式控制器。在無向圖下,文獻(xiàn)[7]中為二階系統(tǒng)設(shè)計(jì)了分布式控制器,使其能夠形成編隊(duì)。雖然以上文獻(xiàn),為了實(shí)現(xiàn)編隊(duì)控制,所采用的都是一致性的方法和思想,但是所設(shè)計(jì)的控制都要求通信拓?fù)浔3謱?shí)時(shí)無線通信。如文獻(xiàn)[8]所述,這種通信方式占用傳感器70%的能源,不僅浪費(fèi)通信帶寬,而且也消耗了大量計(jì)算資源。因此,將文獻(xiàn)[9]中提出的事件觸發(fā)的控制策略應(yīng)用到多智能體的編隊(duì)控制當(dāng)中,能夠有效地降低傳感器對(duì)于高頻數(shù)據(jù)采集的要求,在兩次事件觸發(fā)的時(shí)間間隔內(nèi),多智能體系統(tǒng)不需要進(jìn)行通訊,能量消耗大幅降低,整個(gè)系統(tǒng)能夠更高效地完成任務(wù)?;谑录|發(fā)的編隊(duì)控制問題在文獻(xiàn)[10-12]中也有所研究,但與之不同的是,本文研究的是有向拓?fù)錀l件下的,多智能體編隊(duì)控制問題,提出了一種新的解決事件觸發(fā)下多智能體系統(tǒng)編隊(duì)控制問題的解決方案,利用Laplacian矩陣的特殊性質(zhì),將高階系統(tǒng)編隊(duì)控制問題簡(jiǎn)化為了低階系統(tǒng)的漸近穩(wěn)定性問題。
引理1[13]拓?fù)鋱DG的Laplacian矩陣L至少有一個(gè)零特征值,其他非零特征值均具有正實(shí)部;如果有向圖G包含有一個(gè)有向生成樹,則0是L的簡(jiǎn)單特征值,1N是其對(duì)應(yīng)的右特征向量。
引理2[14]對(duì)于圖的Laplacian矩陣L∈RN×N,那么存在一個(gè)矩陣M∈RN×N-1使得L=ME,其中E∈R(N-1))×N,其特定形式為
進(jìn)一步,如果圖包含一個(gè)有向生成樹,那么矩陣M是列滿秩的,且矩陣EM的特征值是L的非零特征值,則Re(λ(EM))>0。
考慮N個(gè)多智能體構(gòu)成的多智能體系統(tǒng),其中每個(gè)智能體的運(yùn)動(dòng)模型描述如下
(1)
其中,xi∈Rn,ui∈Rp分別為第i個(gè)智能體的系統(tǒng)狀態(tài)和控制輸入。
定義1:對(duì)于多智能體系統(tǒng)(1)和任意的初始狀態(tài),如果存在一個(gè)控制器使得
(2)
成立,則稱多智能體系統(tǒng)(1)能夠形成編隊(duì)。其中hi(t)表示多智能體系統(tǒng)的編隊(duì)隊(duì)形,即每個(gè)智能體xi(t)的期望狀態(tài),本文所研究的編隊(duì)隊(duì)形hi(t)為時(shí)變編隊(duì)隊(duì)形,相比于固定編隊(duì)更具有意義。
本研究把基于事件觸發(fā)函數(shù)設(shè)計(jì)一個(gè)控制器,使得多智能體系統(tǒng)的狀態(tài)滿足定義1作為主要研究問題。事件觸發(fā)函數(shù)的設(shè)計(jì)多智能體系統(tǒng)僅在事件觸發(fā)函數(shù)等于零的時(shí)刻進(jìn)行通信,降低了多智能體系統(tǒng)的通信頻率。
僅依靠鄰居智能體之間的相對(duì)狀態(tài)信息,基于事件驅(qū)動(dòng)的多智能體系統(tǒng)一致性分布式控制器按如下設(shè)計(jì)
(xi(tk)-hi(t))]+wi(t)
(3)
其中:tk為系統(tǒng)第k次事件觸發(fā)時(shí)刻,k=0,1,2,…,wi為待設(shè)計(jì)的輔助控制輸入函數(shù)。當(dāng)事件未觸發(fā)時(shí),系統(tǒng)內(nèi)部無線通信保持靜默狀態(tài);事件觸發(fā)時(shí),多智能體系統(tǒng)內(nèi)部按照相關(guān)通信拓?fù)鋱D進(jìn)行通信,這樣有效地節(jié)省了通信帶寬和計(jì)算資源,所需要的事件觸發(fā)函數(shù)在后文進(jìn)行設(shè)計(jì)。
將式(3)代入式(1)可得
(xi(tk)-hi(t))]+wi(t)
(4)
進(jìn)一步整理可得
(IN?In)w(t)
(5)
令θi(t)=xi(t)-hi(t)可得
(6)
其中θj(tk)=xj(tk)-hj(t),θi(tk)=xi(tk)-hi(t)
進(jìn)一步整理可得
(7)
定義狀態(tài)誤差
ei(t)=xi(tk)-xi(t)
(8)
將其代入式(7)可得
(9)
因此當(dāng)
(10)
時(shí)系統(tǒng)(1)形成編隊(duì)。至此系統(tǒng)(1)的編隊(duì)控制問題轉(zhuǎn)化為系統(tǒng)式(9)的一致性問題。
令
(11)
則有
(12)
因此可以得到
(EM?In)ξ(t)-(E?In)w(t)
(13)
所以
(14)
故多智能體系統(tǒng)(1)能夠形成編隊(duì)h(t)的充要條件是
(15)
且系統(tǒng)
(16)
是漸進(jìn)穩(wěn)定的。
引理3:在采用基于事件驅(qū)動(dòng)的一致性控制器(3)作用下,系統(tǒng)(1)能夠形成編隊(duì)h(t),當(dāng)事件觸發(fā)函數(shù)為
(17)
其中λ為(EM)?In的最小特征值。||·||為矩陣范數(shù),其中δ為常數(shù),且滿足0<δ<1。
證明:構(gòu)造李雅普諾夫函數(shù)
V(t)=ξ(t)Tξ(t)
(18)
對(duì)式(18)沿著系統(tǒng)(16)求導(dǎo)可得
(19)
根據(jù)引理2可知λ>0,因此
(20)
即
(21)
所以
(22)
令
(23)
將式(23)代入式(20)可得
(24)
因此所設(shè)計(jì)的事件驅(qū)動(dòng)函數(shù)(17)能夠使得系統(tǒng)(16)漸進(jìn)穩(wěn)定,此時(shí)即系統(tǒng)(1)能夠形成編隊(duì)h(t)。
引理4:根據(jù)引理3所設(shè)計(jì)的事件驅(qū)動(dòng)函數(shù),不存在Zeno現(xiàn)象,即兩次事件驅(qū)動(dòng)的時(shí)間間隔嚴(yán)格大于0,其最小時(shí)間間隔為
(25)
證明:類比文獻(xiàn)[15]由式(23)可得
(26)
因此可得
(27)
則有
(28)
因此事件驅(qū)動(dòng)的時(shí)間間隔與φ的增長(zhǎng)速率成正比。故φ的增長(zhǎng)速率達(dá)到最大值當(dāng)且僅當(dāng)
(29)
令φ(t,φ0)為當(dāng)初始值為φ0,在時(shí)刻t的值。設(shè)φ(t,0)是式(29)的解。求解可以得到
(30)
在式(30)中,φ的增長(zhǎng)速率最大,為了求解最短的事件觸發(fā)時(shí)間間隔Δtmin,將其代入式(23),取等號(hào),求得
證畢。
考慮在三維運(yùn)動(dòng)的4架無人機(jī)構(gòu)成的多智能體系統(tǒng),其中動(dòng)力學(xué)模型由式(1)描述,xi表示第i架無人機(jī)位置信息,ui表示第i架無人機(jī)的控制輸入。無人機(jī)之間通信拓?fù)浣Y(jié)構(gòu)如圖1所示。
圖1 通信拓?fù)鋱D
由通信拓?fù)浣Y(jié)構(gòu),得到Laplacian矩陣為
無人機(jī)初始狀態(tài)為
xi1,xi2,xi3代表第i架無人機(jī)在三維坐標(biāo)系中x軸坐標(biāo),y軸坐標(biāo),z軸坐標(biāo)。
編隊(duì)隊(duì)形設(shè)計(jì)為
其中hi1(t)、hi2(t)、hi3(t)表示第i個(gè)智能體的期望編隊(duì)。
在控制器(3)的作用下,4架無人機(jī)構(gòu)成的系統(tǒng)能夠形成編隊(duì),當(dāng)編隊(duì)形成時(shí),系統(tǒng)第一個(gè)狀態(tài)與編隊(duì)之間誤差隨時(shí)間變化如圖2所示,其余兩個(gè)狀態(tài)與編隊(duì)誤差與之相似,故在此不予展示。
圖2 系統(tǒng)狀態(tài)與編隊(duì)誤差xi1-hi1, i=1,2,3,4
結(jié)合圖2分析,4架無人機(jī)在5.5 s時(shí)系統(tǒng)狀態(tài)與所要實(shí)現(xiàn)的編隊(duì)狀態(tài)誤差達(dá)成一致,此后一直保持一致狀態(tài),根據(jù)定義1可以知道編隊(duì)能夠形成。
圖3~圖5分別為4架無人機(jī)在t=2 s,t=5.5 s,t=20 s三維空間中形成的編隊(duì)。
通過x的三維狀態(tài),將4架無人機(jī)在三維空間位置呈現(xiàn)在圖3~圖5。對(duì)圖2的分析,可知在5.5 s時(shí),系統(tǒng)形成編隊(duì),因此當(dāng)5.5 s時(shí),圖4上的4架無人機(jī)系統(tǒng)在三維空間中形成平行四邊形編隊(duì),圖3為2 s時(shí)4架無人機(jī)在三維空間位置,明顯看出其未形成平行四邊形,即仍未達(dá)成編隊(duì)。由于本文設(shè)計(jì)的編隊(duì)為時(shí)變編隊(duì),因此隨著時(shí)間的變化,無人機(jī)系統(tǒng)形成的編隊(duì)隊(duì)形也是時(shí)變的,對(duì)比20 s(圖5)時(shí)和5.5 s(圖4)時(shí)4架無人機(jī)位置可知,4架隊(duì)形均為平行四邊形,但是兩個(gè)平行四邊形對(duì)應(yīng)頂點(diǎn)位置的無人機(jī)不同,即編隊(duì)隊(duì)形為時(shí)變的平行四邊形。
圖3 t=2 s時(shí)編隊(duì)隊(duì)形
圖4 t=5.5 s時(shí)編隊(duì)隊(duì)形
圖5 t=20 s時(shí)編隊(duì)隊(duì)形
使4架無人機(jī)形成以上時(shí)變編隊(duì),使用的式 給出的基于事件觸發(fā)的控制器,為了顯示的清晰,將基于事件觸發(fā)函數(shù)(17)設(shè)計(jì)的控制器觸發(fā)時(shí)間間隔由圖6表示,其表示0~10 s內(nèi)的觸發(fā)時(shí)間間隔,圖6中橫坐標(biāo)為事件觸發(fā)時(shí)刻,縱坐標(biāo)為兩次事件觸發(fā)時(shí)間間隔。
從圖6的事件驅(qū)動(dòng)時(shí)間間隔看出,兩次事件觸發(fā)最小間隔為0.007 9 s,最大的時(shí)間間隔為0.197 s,平均時(shí)間間隔為0.042 9 s。根據(jù)公式計(jì)算最小時(shí)間間隔為0.007 3 s,由此觀之實(shí)際仿真當(dāng)中最小觸發(fā)時(shí)間間隔是大于所要求的最小時(shí)間間隔,所設(shè)計(jì)的控制器有效,平均時(shí)間間隔和最大時(shí)間間隔明顯大于系統(tǒng)所要求的最小時(shí)間間隔。
因此基于事件驅(qū)動(dòng)下設(shè)計(jì)的一致性控制器能夠使得系統(tǒng)形成時(shí)變編隊(duì),并有效降低智能體之間的通信壓力。
圖6 t=0-10 s內(nèi)事件觸發(fā)事件間隔tk+1-tk
1) 本研究基于事件觸發(fā)設(shè)計(jì)的分布式控制器,使得多智能體系統(tǒng)在事件觸發(fā)時(shí)刻,進(jìn)行通訊,兩次事件觸發(fā)時(shí)間間隔內(nèi)無線通信保持休眠,節(jié)約了資源,減少了連續(xù)通信對(duì)系統(tǒng)造成的負(fù)擔(dān)。
2) 所研究的拓?fù)浣Y(jié)構(gòu)為一般的有向拓?fù)洌ㄟ^對(duì)Laplacian矩陣的特殊分解,將編隊(duì)控制問題轉(zhuǎn)為穩(wěn)定性問題分析,降低了編隊(duì)控制的難度,同時(shí)降低了通信要求。