基于事件觸發(fā)的多智能體系統(tǒng)編隊(duì)控制

2020-01-10 00:59周紹磊趙學(xué)遠(yuǎn)王帥磊祁亞輝

兵器裝備工程學(xué)報(bào) 2019年12期

周紹磊，趙學(xué)遠(yuǎn)，王帥磊，祁亞輝

(海軍航空大學(xué)，山東煙臺(tái) 264001)

近年來，隨著多智能體系統(tǒng)一致性問題的研究日益深入，將多智能體系統(tǒng)一致性的分布式控制思想及方法，應(yīng)用到多智能體編隊(duì)控制中也取得了大量成果[1-3]。文獻(xiàn)[4]中利用多智能體之間相對(duì)距離信息，基于鴿群行為設(shè)計(jì)了最優(yōu)編隊(duì)控制器，使得系統(tǒng)形成編隊(duì)，并在復(fù)雜運(yùn)動(dòng)下能夠有效地保持編隊(duì)隊(duì)形。文獻(xiàn)[5]中利用一致性思想設(shè)計(jì)了控制器，使得一類特殊的高階系統(tǒng)形成編隊(duì)。為了解決離散的多智能體系統(tǒng)編隊(duì)控制問題，文獻(xiàn)[6]中設(shè)計(jì)了一致性分布式控制器。在無向圖下，文獻(xiàn)[7]中為二階系統(tǒng)設(shè)計(jì)了分布式控制器，使其能夠形成編隊(duì)。雖然以上文獻(xiàn)，為了實(shí)現(xiàn)編隊(duì)控制，所采用的都是一致性的方法和思想，但是所設(shè)計(jì)的控制都要求通信拓?fù)浔３謱?shí)時(shí)無線通信。如文獻(xiàn)[8]所述，這種通信方式占用傳感器70%的能源，不僅浪費(fèi)通信帶寬，而且也消耗了大量計(jì)算資源。因此，將文獻(xiàn)[9]中提出的事件觸發(fā)的控制策略應(yīng)用到多智能體的編隊(duì)控制當(dāng)中，能夠有效地降低傳感器對(duì)于高頻數(shù)據(jù)采集的要求，在兩次事件觸發(fā)的時(shí)間間隔內(nèi)，多智能體系統(tǒng)不需要進(jìn)行通訊，能量消耗大幅降低，整個(gè)系統(tǒng)能夠更高效地完成任務(wù)?；谑录|發(fā)的編隊(duì)控制問題在文獻(xiàn)[10-12]中也有所研究，但與之不同的是，本文研究的是有向拓?fù)錀l件下的，多智能體編隊(duì)控制問題，提出了一種新的解決事件觸發(fā)下多智能體系統(tǒng)編隊(duì)控制問題的解決方案，利用Laplacian矩陣的特殊性質(zhì)，將高階系統(tǒng)編隊(duì)控制問題簡(jiǎn)化為了低階系統(tǒng)的漸近穩(wěn)定性問題。

1 預(yù)備知識(shí)

引理1[13]拓?fù)鋱DG的Laplacian矩陣L至少有一個(gè)零特征值，其他非零特征值均具有正實(shí)部；如果有向圖G包含有一個(gè)有向生成樹，則0是L的簡(jiǎn)單特征值，1N是其對(duì)應(yīng)的右特征向量。

引理2[14]對(duì)于圖的Laplacian矩陣L∈RN×N，那么存在一個(gè)矩陣M∈RN×N-1使得L=ME，其中E∈R(N-1))×N，其特定形式為

進(jìn)一步，如果圖包含一個(gè)有向生成樹，那么矩陣M是列滿秩的,且矩陣EM的特征值是L的非零特征值，則Re(λ(EM))>0。

2 問題描述

考慮N個(gè)多智能體構(gòu)成的多智能體系統(tǒng)，其中每個(gè)智能體的運(yùn)動(dòng)模型描述如下

(1)

其中，xi∈Rn，ui∈Rp分別為第i個(gè)智能體的系統(tǒng)狀態(tài)和控制輸入。

定義1：對(duì)于多智能體系統(tǒng)(1)和任意的初始狀態(tài)，如果存在一個(gè)控制器使得

(2)

成立，則稱多智能體系統(tǒng)(1)能夠形成編隊(duì)。其中hi(t)表示多智能體系統(tǒng)的編隊(duì)隊(duì)形，即每個(gè)智能體xi(t)的期望狀態(tài)，本文所研究的編隊(duì)隊(duì)形hi(t)為時(shí)變編隊(duì)隊(duì)形，相比于固定編隊(duì)更具有意義。

本研究把基于事件觸發(fā)函數(shù)設(shè)計(jì)一個(gè)控制器，使得多智能體系統(tǒng)的狀態(tài)滿足定義1作為主要研究問題。事件觸發(fā)函數(shù)的設(shè)計(jì)多智能體系統(tǒng)僅在事件觸發(fā)函數(shù)等于零的時(shí)刻進(jìn)行通信，降低了多智能體系統(tǒng)的通信頻率。

3 控制器設(shè)計(jì)

僅依靠鄰居智能體之間的相對(duì)狀態(tài)信息，基于事件驅(qū)動(dòng)的多智能體系統(tǒng)一致性分布式控制器按如下設(shè)計(jì)

(xi(tk)-hi(t))]+wi(t)

(3)

其中：tk為系統(tǒng)第k次事件觸發(fā)時(shí)刻，k=0,1,2,…,wi為待設(shè)計(jì)的輔助控制輸入函數(shù)。當(dāng)事件未觸發(fā)時(shí)，系統(tǒng)內(nèi)部無線通信保持靜默狀態(tài)；事件觸發(fā)時(shí)，多智能體系統(tǒng)內(nèi)部按照相關(guān)通信拓?fù)鋱D進(jìn)行通信，這樣有效地節(jié)省了通信帶寬和計(jì)算資源，所需要的事件觸發(fā)函數(shù)在后文進(jìn)行設(shè)計(jì)。

將式(3)代入式(1)可得

(xi(tk)-hi(t))]+wi(t)

(4)

進(jìn)一步整理可得

(IN?In)w(t)

(5)

令θi(t)=xi(t)-hi(t)可得

(6)

其中θj(tk)=xj(tk)-hj(t)，θi(tk)=xi(tk)-hi(t)

進(jìn)一步整理可得

(7)

定義狀態(tài)誤差

ei(t)=xi(tk)-xi(t)

(8)

將其代入式(7)可得

(9)

因此當(dāng)

(10)

時(shí)系統(tǒng)(1)形成編隊(duì)。至此系統(tǒng)(1)的編隊(duì)控制問題轉(zhuǎn)化為系統(tǒng)式(9)的一致性問題。

令

(11)

則有

(12)

因此可以得到

(EM?In)ξ(t)-(E?In)w(t)

(13)

所以

(14)

故多智能體系統(tǒng)(1)能夠形成編隊(duì)h(t)的充要條件是

(15)

且系統(tǒng)

(16)

是漸進(jìn)穩(wěn)定的。

引理3：在采用基于事件驅(qū)動(dòng)的一致性控制器(3)作用下，系統(tǒng)(1)能夠形成編隊(duì)h(t)，當(dāng)事件觸發(fā)函數(shù)為

(17)

其中λ為(EM)?In的最小特征值。||·||為矩陣范數(shù)，其中δ為常數(shù)，且滿足0<δ<1。

證明：構(gòu)造李雅普諾夫函數(shù)

V(t)=ξ(t)Tξ(t)

(18)

對(duì)式(18)沿著系統(tǒng)(16)求導(dǎo)可得

(19)

根據(jù)引理2可知λ>0，因此

(20)

即

(21)

所以

(22)

令

(23)

將式(23)代入式(20)可得

(24)

因此所設(shè)計(jì)的事件驅(qū)動(dòng)函數(shù)(17)能夠使得系統(tǒng)(16)漸進(jìn)穩(wěn)定，此時(shí)即系統(tǒng)(1)能夠形成編隊(duì)h(t)。

引理4：根據(jù)引理3所設(shè)計(jì)的事件驅(qū)動(dòng)函數(shù)，不存在Zeno現(xiàn)象，即兩次事件驅(qū)動(dòng)的時(shí)間間隔嚴(yán)格大于0，其最小時(shí)間間隔為

(25)

證明：類比文獻(xiàn)[15]由式(23)可得

(26)

因此可得

(27)

則有

(28)

因此事件驅(qū)動(dòng)的時(shí)間間隔與φ的增長(zhǎng)速率成正比。故φ的增長(zhǎng)速率達(dá)到最大值當(dāng)且僅當(dāng)

(29)

令φ(t,φ0)為當(dāng)初始值為φ0，在時(shí)刻t的值。設(shè)φ(t,0)是式(29)的解。求解可以得到

(30)

在式(30)中，φ的增長(zhǎng)速率最大，為了求解最短的事件觸發(fā)時(shí)間間隔Δtmin，將其代入式(23)，取等號(hào)，求得

證畢。

4 仿真驗(yàn)證

考慮在三維運(yùn)動(dòng)的4架無人機(jī)構(gòu)成的多智能體系統(tǒng)，其中動(dòng)力學(xué)模型由式(1)描述，xi表示第i架無人機(jī)位置信息，ui表示第i架無人機(jī)的控制輸入。無人機(jī)之間通信拓?fù)浣Y(jié)構(gòu)如圖1所示。

圖1 通信拓?fù)鋱D

由通信拓?fù)浣Y(jié)構(gòu)，得到Laplacian矩陣為

無人機(jī)初始狀態(tài)為

xi1,xi2,xi3代表第i架無人機(jī)在三維坐標(biāo)系中x軸坐標(biāo)，y軸坐標(biāo)，z軸坐標(biāo)。

編隊(duì)隊(duì)形設(shè)計(jì)為

其中hi1(t)、hi2(t)、hi3(t)表示第i個(gè)智能體的期望編隊(duì)。

在控制器(3)的作用下，4架無人機(jī)構(gòu)成的系統(tǒng)能夠形成編隊(duì)，當(dāng)編隊(duì)形成時(shí)，系統(tǒng)第一個(gè)狀態(tài)與編隊(duì)之間誤差隨時(shí)間變化如圖2所示，其余兩個(gè)狀態(tài)與編隊(duì)誤差與之相似，故在此不予展示。

圖2 系統(tǒng)狀態(tài)與編隊(duì)誤差xi1-hi1, i=1,2,3,4

結(jié)合圖2分析，4架無人機(jī)在5.5 s時(shí)系統(tǒng)狀態(tài)與所要實(shí)現(xiàn)的編隊(duì)狀態(tài)誤差達(dá)成一致，此后一直保持一致狀態(tài)，根據(jù)定義1可以知道編隊(duì)能夠形成。

圖3～圖5分別為4架無人機(jī)在t=2 s，t=5.5 s，t=20 s三維空間中形成的編隊(duì)。

通過x的三維狀態(tài)，將4架無人機(jī)在三維空間位置呈現(xiàn)在圖3～圖5。對(duì)圖2的分析，可知在5.5 s時(shí)，系統(tǒng)形成編隊(duì)，因此當(dāng)5.5 s時(shí)，圖4上的4架無人機(jī)系統(tǒng)在三維空間中形成平行四邊形編隊(duì)，圖3為2 s時(shí)4架無人機(jī)在三維空間位置，明顯看出其未形成平行四邊形，即仍未達(dá)成編隊(duì)。由于本文設(shè)計(jì)的編隊(duì)為時(shí)變編隊(duì)，因此隨著時(shí)間的變化，無人機(jī)系統(tǒng)形成的編隊(duì)隊(duì)形也是時(shí)變的，對(duì)比20 s(圖5)時(shí)和5.5 s(圖4)時(shí)4架無人機(jī)位置可知，4架隊(duì)形均為平行四邊形，但是兩個(gè)平行四邊形對(duì)應(yīng)頂點(diǎn)位置的無人機(jī)不同，即編隊(duì)隊(duì)形為時(shí)變的平行四邊形。

圖3 t=2 s時(shí)編隊(duì)隊(duì)形

圖4 t=5.5 s時(shí)編隊(duì)隊(duì)形

圖5 t=20 s時(shí)編隊(duì)隊(duì)形

使4架無人機(jī)形成以上時(shí)變編隊(duì)，使用的式給出的基于事件觸發(fā)的控制器，為了顯示的清晰，將基于事件觸發(fā)函數(shù)(17)設(shè)計(jì)的控制器觸發(fā)時(shí)間間隔由圖6表示，其表示0～10 s內(nèi)的觸發(fā)時(shí)間間隔，圖6中橫坐標(biāo)為事件觸發(fā)時(shí)刻，縱坐標(biāo)為兩次事件觸發(fā)時(shí)間間隔。

從圖6的事件驅(qū)動(dòng)時(shí)間間隔看出，兩次事件觸發(fā)最小間隔為0.007 9 s，最大的時(shí)間間隔為0.197 s，平均時(shí)間間隔為0.042 9 s。根據(jù)公式計(jì)算最小時(shí)間間隔為0.007 3 s，由此觀之實(shí)際仿真當(dāng)中最小觸發(fā)時(shí)間間隔是大于所要求的最小時(shí)間間隔，所設(shè)計(jì)的控制器有效，平均時(shí)間間隔和最大時(shí)間間隔明顯大于系統(tǒng)所要求的最小時(shí)間間隔。

因此基于事件驅(qū)動(dòng)下設(shè)計(jì)的一致性控制器能夠使得系統(tǒng)形成時(shí)變編隊(duì)，并有效降低智能體之間的通信壓力。

圖6 t=0-10 s內(nèi)事件觸發(fā)事件間隔tk+1-tk

5 結(jié)論

1) 本研究基于事件觸發(fā)設(shè)計(jì)的分布式控制器，使得多智能體系統(tǒng)在事件觸發(fā)時(shí)刻，進(jìn)行通訊，兩次事件觸發(fā)時(shí)間間隔內(nèi)無線通信保持休眠，節(jié)約了資源，減少了連續(xù)通信對(duì)系統(tǒng)造成的負(fù)擔(dān)。