魏小杰,蔣海軍,于志永
(新疆大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院,新疆 烏魯木齊 830046)
多智能體系統(tǒng)(MASs) 是近幾十年來分布式人工智能發(fā)展的重要分支,可以用于解決復(fù)雜的實(shí)際問題[1?2].一致性作為MASs 中有代表性的群體行為[3],是指所有智能體在適當(dāng)?shù)目刂茀f(xié)議下達(dá)到相同的狀態(tài).在實(shí)際應(yīng)用中,系統(tǒng)中可能同時(shí)存在競爭和合作的行為,例如多機(jī)器人團(tuán)隊(duì)的運(yùn)動(dòng)比賽等[4?5].因此文獻(xiàn)[6] 研究了具有拮抗行為的MASs 二部一致性.
在一致性研究中,收斂速度是衡量一致性行為的重要指標(biāo).與漸進(jìn)收斂性相比,固定時(shí)間收斂性更加符合實(shí)際應(yīng)用.因此,基于文獻(xiàn)[7] 中給出的固定時(shí)間穩(wěn)定性理論,通過設(shè)計(jì)連續(xù)的控制器,文獻(xiàn)[8] 研究了系統(tǒng)的有限時(shí)間和固定時(shí)間二部一致性.為了減少控制過程中的能源消耗,文獻(xiàn)[9] 提出了事件觸發(fā)控制方法.在文獻(xiàn)[10]中,通過設(shè)計(jì)事件觸發(fā)控制算法研究了具有時(shí)滯和外部干擾的MASs 固定時(shí)間一致性.然而,很少有學(xué)者研究事件觸發(fā)控制協(xié)議下具有時(shí)滯和干擾的MASs 二部一致性.
本文的主要內(nèi)容總結(jié)如下:(1) 基于事件觸發(fā)控制方法設(shè)計(jì)了具有時(shí)滯和干擾的MASs 分布式控制協(xié)議.(2) 運(yùn)用代數(shù)圖理論、固定時(shí)間穩(wěn)定性理論,給出MASs 實(shí)現(xiàn)二部一致的相關(guān)準(zhǔn)則.(3) 為了避免符號(hào)函數(shù)在控制中產(chǎn)生的抖振現(xiàn)象,設(shè)計(jì)了具有飽和函數(shù)的事件觸發(fā)控制協(xié)議,并證明系統(tǒng)在提出的兩個(gè)控制協(xié)議下不會(huì)產(chǎn)生Zeno 行為.
在本文中,RN和RN×M分別表示N 維實(shí)數(shù)向量空間和N×M 維實(shí)數(shù)矩陣空間.對于實(shí)對稱矩陣G,G>0(或G<0) 表示G 是正定(或負(fù)定)矩陣,GT表示矩陣G 的轉(zhuǎn)置.sign(·) 表示符號(hào)函數(shù).‖·‖ 表示向量的2-范數(shù)或矩陣的2-范數(shù),|·| 表示向量的1-范數(shù)或標(biāo)量的絕對值.
考慮由M 個(gè)智能體組成的網(wǎng)絡(luò).其中網(wǎng)絡(luò)拓?fù)溆蔁o向有符號(hào)圖G 表示,G 是一個(gè)三元組G={V,E,A},其中V={v1,v2,···,vM} 是節(jié)點(diǎn)集,E ?V×V 是邊集,A=[aij]∈RM×M是鄰接矩陣.若(vj,vi)∈E,vi和vj互為鄰居,則aij/=0 并且記vi的鄰居節(jié)點(diǎn)集為Ni={j:(vj,vi)∈E}.假設(shè)網(wǎng)絡(luò)拓?fù)銰 是無向的且不含有自環(huán),則有aij=aji,aii=0(i,j=1,2,···,M).記節(jié)點(diǎn)的度矩陣為H=diag(h1,h2,···,hM),hi=定義拉普拉斯矩陣L=[lij]∈RM×M為L=H?A.L 的元素表示如下
如果對于任意的兩個(gè)節(jié)點(diǎn)vi和vj之間存在路徑,則稱無向有符號(hào)圖G 是連通的.如果可以將頂點(diǎn)集V 劃分為滿足條件V1∩V2=? 和V1∪V2=V 的子集V1和V2,并且子集V1(或V2) 中的內(nèi)部節(jié)點(diǎn)vi和vj之間保持合作關(guān)系,即aij≥0,而子集V1和V2中的節(jié)點(diǎn)存在競爭關(guān)系,即對?vi∈V1,vj∈V2有aij<0,則稱圖G 是結(jié)構(gòu)平衡的.否則,稱符號(hào)圖G 是結(jié)構(gòu)不平衡的.
引理1[6]若結(jié)構(gòu)平衡符號(hào)圖G 的鄰接矩陣為A ∈RM×M,則存在一個(gè)規(guī)范變換U=diag(σ1,σ2,···,σM)(σi∈{?1,1}),使得UAU 的項(xiàng)都是非負(fù)的.
注1在MASs 二部一致性中,結(jié)構(gòu)平衡是網(wǎng)絡(luò)拓?fù)浔仨殱M足的條件,如果符號(hào)圖G 結(jié)構(gòu)不平衡,則MASs 會(huì)收斂到同一狀態(tài),不會(huì)達(dá)到二部一致.該結(jié)果也會(huì)在數(shù)值模擬中被驗(yàn)證.
引理2[6]定義一個(gè)新的拉普拉斯矩陣LU,其元素表示如下
則L 和LU有相同的特征值.
引理3[11]對無符號(hào)的連通無向圖其拉普拉斯矩陣滿足下列性質(zhì):
(3) 若1Ts=0,則有≥λ2sTs.
注2對符號(hào)圖G,因?yàn)猷徑泳仃嘇 既有正權(quán)重又有負(fù)權(quán)重,則拉普拉斯矩陣L 不滿足行和為零.因此,引理2 定義了一個(gè)滿足行和為零的新拉普拉斯矩陣LU,那么二部一致性問題可以轉(zhuǎn)化為一般的一致性問題來解決.
設(shè)第i 個(gè)智能體的動(dòng)力系統(tǒng)為
其中:si(t),ui(t),τi,ri(t)(i=1,2,···,M) 分別代表第i 個(gè)智能體的狀態(tài)信息,控制輸入,時(shí)滯和未知干擾.
假設(shè)1存在一個(gè)正的常數(shù)r,使得
定義1對于MASs (1),如果存在一個(gè)不依賴系統(tǒng)初始狀態(tài)的有界常數(shù)T >0,滿足?σiσjsj(t)|=0,i=1,2,···,M,且對于t>T 時(shí),有si(t)=σiσjsj(t),則稱系統(tǒng)(1) 在固定時(shí)間內(nèi)達(dá)到二部一致.記T 為停息時(shí)間估計(jì).
引理4[7]對于MASs (1),存在一個(gè)連續(xù)的徑向無界函數(shù)F(t),滿足下列不等式:≤?μFp(s(t))?νFq(s(t)),其中μ,ν >0,p ∈(0,1) 且q ∈(1,∞).那么系統(tǒng)(1) 在固定時(shí)間T(s) 內(nèi)達(dá)到一致,并且T(s) 滿足T(s)≤Tmax=此外,若對F(t)存在一個(gè)常數(shù)ω>0 滿足不等式˙F(s(t))≤?μFp(s(t))?νFq(s(t))+ω,則稱系統(tǒng)(1) 達(dá)到了魯棒固定時(shí)間一致.
引理5[12]對于常數(shù)ξ1,ξ2,···,ξK≥0,有下列不等式成立
首先,利用事件觸發(fā)控制方法,構(gòu)造第i 個(gè)智能體的控制輸入如下
為了簡化(3),定義yi(t) 為
因此,事件觸發(fā)控制器可以簡化為
定義測量誤差為
構(gòu)造第i 個(gè)智能體的觸發(fā)函數(shù)為
定理1對于MASs (1),考慮具有觸發(fā)函數(shù)(8)的控制協(xié)議(6),若假設(shè)1 成立而且網(wǎng)絡(luò)拓?fù)銰 是結(jié)構(gòu)平衡且無向連通的有符號(hào)圖,當(dāng)控制增益α 和β 滿足
則MASs (1) 可以實(shí)現(xiàn)固定時(shí)間二部一致,且停息時(shí)間T(s) 估計(jì)為
其中:a>0,b>0 是常數(shù),γ ∈(1,∞).
證明構(gòu)造一個(gè)新變量
根據(jù)引理2 和引理3,有以下不等式成立
其中:λ2和λM是LU的最小非零特征值和最大特征值.
根據(jù)引理4,可以得到
注3從定理1 可以看出,固定時(shí)間穩(wěn)定性理論下的停息時(shí)間與系統(tǒng)的初始值無關(guān).與文獻(xiàn)[8] 相比,本文創(chuàng)新的地方是在動(dòng)力學(xué)系統(tǒng)中考慮了時(shí)滯和干擾的影響,并采用了事件觸發(fā)控制方法研究MASs 的固定時(shí)間二部一致性.
下面我們證明事件觸發(fā)控制器(3) 下MASs 不會(huì)產(chǎn)生Zeno 現(xiàn)象.
定理2對于MASs (1),若定理1 的條件成立,則觸發(fā)函數(shù)(8) 不會(huì)發(fā)生Zeno 行為.
證明由(12) 式可得≤2λMV(t)≤2λMV(0),其中V(0)=
進(jìn)一步,求ei(t) 的右上導(dǎo)數(shù),可得
φ1和的定義如下
由觸發(fā)條件gi(t)≥0,有
注4在控制協(xié)議(3) 中使用了符號(hào)函數(shù),當(dāng)誤差趨于0 時(shí),控制ui(t) 會(huì)產(chǎn)生振蕩現(xiàn)象.為了克服這一不足,引入飽和函數(shù)進(jìn)一步改進(jìn)控制器(6).
利用飽和函數(shù),第i 個(gè)智能體的控制器設(shè)計(jì)成如下形式
第i 個(gè)智能體的測量誤差和觸發(fā)函數(shù)分別表示為以下形式
定理3對于MASs (1),考慮具有觸發(fā)函數(shù)(24)的控制協(xié)議(22),若假設(shè)1 成立而且網(wǎng)絡(luò)拓?fù)銰 是結(jié)構(gòu)平衡且無向連通的有符號(hào)圖,其中增益參數(shù)α 和β 與定理1 相同,則MASs (1) 可以實(shí)現(xiàn)固定時(shí)間二部一致性.此外,系統(tǒng)可以避免Zeno 現(xiàn)象.
因此,類似于定理1 的分析可知在固定時(shí)間內(nèi)MASs (1) 達(dá)到二部一致.
考慮由5 個(gè)智能體組成的多智能體系統(tǒng)(1),其中結(jié)構(gòu)平衡的網(wǎng)絡(luò)拓?fù)淙鐖D1 所示,結(jié)構(gòu)不平衡的網(wǎng)絡(luò)拓?fù)淙鐖D2 所示.圖中黑線表示智能體之間的合作關(guān)系,紅線表示競爭關(guān)系.
圖1 結(jié)構(gòu)平衡圖G1
圖2 結(jié)構(gòu)不平衡圖G2
在系統(tǒng)(1) 中τi=0.03,ri(t)=0.05cos(t),i=1,2,3,4,5,顯然,未知干擾滿足|ri(t)|≤=0.05.記圖G1的拉普拉斯矩陣為L1,通過計(jì)算可得L1的特征值λ2(L1)=1.491 4.分別在兩個(gè)例子中考慮有符號(hào)函數(shù)和飽和函數(shù)的固定時(shí)間事件觸發(fā)控制算法.
例1 (符號(hào)函數(shù))對MASs (1),考慮事件觸發(fā)控制算法(6).其中α=1.138 7,β=0.827 6,γ=ξ=0.6,通過計(jì)算,定理1 的條件成立,并且Tmax=10.選取系統(tǒng)的初始條件為:s1(0)=?2;s2(0)=?4;s3(0)=1;s4(0)=5;s5(0)=1.則MASs (1) 的狀態(tài)如圖3 所示.每個(gè)智能體的觸發(fā)時(shí)刻如圖4 所示.顯然,系統(tǒng)在控制協(xié)議下能實(shí)現(xiàn)二部一致.
圖3 si (i=1,2,3,4,5) 的軌線
圖4 智能體在控制器(6) 和觸發(fā)函數(shù)(8) 下的觸發(fā)時(shí)刻
例2 (飽和函數(shù))對MASs (1),考慮事件觸發(fā)控制算法(22).其中參數(shù)θ=0.01,其他參數(shù)取值與例1 相同,可以驗(yàn)證定理3 的條件成立.選取系統(tǒng)的初始條件為:s1(0)=3;s2(0)=?6;s3(0)=3;s4(0)=2;s5(0)=4.則MASs (1) 的狀態(tài)如圖5 所示.每個(gè)智能體的觸發(fā)時(shí)刻如圖6 所示.
圖5 si (i=1,2,3,4,5) 的軌線
圖6 智能體在控制器(22) 和觸發(fā)函數(shù)(24) 下的觸發(fā)時(shí)刻
此外,如果網(wǎng)絡(luò)拓?fù)涫遣黄胶獾?如圖2 所示).在控制協(xié)議(6)和(22)下,系統(tǒng)的狀態(tài)軌跡分別如圖7 和圖8 所示,即所有智能體的狀態(tài)收斂于同一個(gè)值.
圖7 控制協(xié)議(6) 下si (i=1,2,3,4,5) 的軌線
圖8 控制協(xié)議(22) 下si(i=1,2,3,4,5) 的軌線
本文基于事件觸發(fā)控制方法,研究了具有時(shí)滯和未知干擾的MASs 固定時(shí)間二部一致性.通過設(shè)計(jì)兩種不同的控制協(xié)議,并運(yùn)用固定時(shí)間穩(wěn)定性理論給出MASs 實(shí)現(xiàn)二部一致性的準(zhǔn)則,證明了在控制協(xié)議下Zeno 現(xiàn)象不會(huì)發(fā)生.最后,給出兩個(gè)數(shù)值例子驗(yàn)證了協(xié)議的可行性.
新疆大學(xué)學(xué)報(bào)(自然科學(xué)版)(中英文)2021年6期