丁 勐,陳 蓓
(上海工程技術(shù)大學(xué) 電子電氣工程學(xué)院,上海 201620)
多智能體系統(tǒng)(Multi-Agent Systems,MASs)由多個(gè)帶有自治性的智能體組成,其目標(biāo)是將復(fù)雜系統(tǒng)構(gòu)建成易于管理、智能體之間能夠進(jìn)行通信和協(xié)調(diào)作業(yè)的系統(tǒng)。隨著網(wǎng)絡(luò)通信與控制技術(shù)的不斷進(jìn)步與融合,多智能體系統(tǒng)已經(jīng)發(fā)展為復(fù)雜系統(tǒng)分析與模擬的重要思想方法與工具,研究內(nèi)容涉及智能體的目標(biāo)、技能、規(guī)劃以及讓智能體之間采取協(xié)調(diào)一致的行動(dòng)來完成任務(wù)。近年來,多智能體系統(tǒng)在編隊(duì)控制[1]、水下協(xié)同控制[2]以及無人機(jī)集群控制[3]等領(lǐng)域得到了廣泛應(yīng)用。
一致性問題[4-8]是多智能體系統(tǒng)中協(xié)同控制領(lǐng)域的基本問題。為解決多智能體系統(tǒng)一致性問題,學(xué)者們提出多種控制方法,包括預(yù)測控制[9]、自適應(yīng)控制[10]、模糊控制[11]以及滑??刂芠12]等。其中,滑模控制憑借對外界干擾和參數(shù)不確定性的強(qiáng)魯棒性,在多智能體系統(tǒng)一致性問題中得到了學(xué)者的廣泛關(guān)注[13-15]。文獻(xiàn)[14]研究有向拓?fù)渚W(wǎng)絡(luò)中二階多智能體系統(tǒng)的固定時(shí)間一致性跟蹤問題,針對雙積分器多智能體系統(tǒng)設(shè)計(jì)了滑模面并在其基礎(chǔ)上構(gòu)造非線性一致性協(xié)議。文獻(xiàn)[15]針對機(jī)器人多智能體系統(tǒng)的一致性跟蹤問題提出了一種基于投影遞歸神經(jīng)網(wǎng)絡(luò)的最優(yōu)滑??刂萍夹g(shù)。
在控制領(lǐng)域中,度是評價(jià)系統(tǒng)性能的一個(gè)重要指標(biāo)。對于多智能體系統(tǒng)而言,實(shí)現(xiàn)有限時(shí)間一致性跟蹤具有顯著的實(shí)際意義。根據(jù)達(dá)成一致性的收斂速度,可分為漸進(jìn)一致性[16]和有限時(shí)間一致性[17-19]。在文獻(xiàn)[20]搭建的多智能體系統(tǒng)中,當(dāng)時(shí)間趨向無窮大時(shí),一致性跟蹤誤差會(huì)根據(jù)設(shè)計(jì)的滑??刂坡傻竭_(dá)指定的滑模面,然后沿著滑模面移動(dòng),最終收斂到0。與漸進(jìn)一致性相比,有限時(shí)間一致性要求系統(tǒng)的狀態(tài)在有限時(shí)間內(nèi)收斂到指定范圍。為確保有限時(shí)間一致性跟蹤,文獻(xiàn)[21]提出了一種分布式非奇異快速終端滑模方法來加快系統(tǒng)的收斂速度,并且給出了達(dá)到一致性的時(shí)間上界。
但是,上述工作大多基于理想的網(wǎng)絡(luò)通訊環(huán)境,即信息可以在智能體之間完整傳輸。實(shí)際上,在網(wǎng)絡(luò)通信下,不可避免地存在時(shí)滯和隨機(jī)干擾等因素的影響,難以保證理想的通信環(huán)境。近年來,信道衰落下多智能體系統(tǒng)的一致性問題開始受到關(guān)注。文獻(xiàn)[22]分別對不同數(shù)量智能體系統(tǒng)進(jìn)行討論,建立信道衰落模型,根據(jù)固定拓?fù)湎碌姆抡鏀?shù)據(jù)得到信道衰落對于多智能體系統(tǒng)一致性的影響。文獻(xiàn)[23]設(shè)計(jì)了一種分布式控制器以解決具有信道衰落現(xiàn)象的離散時(shí)間多智能體系統(tǒng)一致性問題。
本文針對信道衰落下二階多智能體系統(tǒng)的有限時(shí)間一致性控制問題,根據(jù)從鄰居智能體接收到的衰落數(shù)據(jù)得到一致性誤差函數(shù),構(gòu)造非奇異終端滑模面,提出一種有限時(shí)間一致性控制策略。在該策略作用下,誤差函數(shù)的狀態(tài)將在有限時(shí)間到達(dá)并保持在所設(shè)計(jì)的滑模面上,最終實(shí)現(xiàn)多智能體系統(tǒng)的有限時(shí)間一致性跟蹤。
本文采用的數(shù)學(xué)符號(hào):Rn和Rm×n分別表示n維的歐式空間和m×n的實(shí)矩陣集,?表示Kronecker積,sgn(x)表示符號(hào)函數(shù),符號(hào)|·|和‖·‖分別表示歐幾里得范數(shù)和向量范數(shù),1N=[1,1,…,1]T,0N=[0,0,…,0]T。
由一個(gè)領(lǐng)導(dǎo)者和N個(gè)跟隨者組成二階多智能體系統(tǒng),其動(dòng)力學(xué)模型為
(1)
其中,xi(t)∈Rm、vi(t)∈Rm、ui(t)∈Rm、fi(t)∈Rm分別為第i個(gè)跟隨者的位置、速度、控制輸入和擾動(dòng);x0(t)∈Rm、v0(t)∈Rm、u0(t)∈Rm、f0(t)∈Rm分別為領(lǐng)導(dǎo)者的位置、速度、控制輸入和擾動(dòng)。
假設(shè)1假設(shè)式(1)中的干擾fi(t)和f0(t)滿足Lipschitz條件(干擾上界μ為Lipschitz常數(shù))
‖fi(t)-f0(t)‖≤μ‖vi(t)-v0(t)‖
(2)
為了實(shí)現(xiàn)多智能體系統(tǒng)的有限時(shí)間一致性,定義第i個(gè)跟隨者的一致性誤差函數(shù)為
(3)
其中,ε1i(t)和ε2i(t)分別為跟隨者的跟蹤位置和速度誤差狀態(tài)變量;aij為鄰接矩陣A中的一個(gè)元素;領(lǐng)導(dǎo)者的度矩陣hi決定了領(lǐng)導(dǎo)者和跟隨者i之間是否有信息交互,hi>0說明跟隨者i可以接收領(lǐng)導(dǎo)者發(fā)送的信息。
將一致性跟蹤誤差簡化為緊湊形式
(4)
H?diag(h1,h2,…,hN)。
對式(4)求導(dǎo)得到
(5)
由于時(shí)滯、隨機(jī)噪聲等干擾因素的影響,信息在跟隨者之間傳輸不可避免地受到信道衰落影響。考慮到追隨者之間傳輸信號(hào)的振幅大小可能受到隨機(jī)干擾,網(wǎng)絡(luò)信道可以視為具有增益的連續(xù)信道。
假設(shè)2本文考慮的信道衰落現(xiàn)象只發(fā)生在跟隨者的信息交互中,假設(shè)領(lǐng)導(dǎo)者和跟隨者之間的信息傳遞過程中不存在衰落現(xiàn)象。
考慮如下衰落模型
(6)
基于式(6)的信道衰落模型,推出式(3)為
(7)
其中,Λ1(t)?diag(0,φ12(t),…,φ1N(t)),…,ΛN(t)?diag(φN1(t),φN2(t),…,0)。
(8)
引理1[24]如果有向圖G存在有向生成樹,則矩陣L+H可逆。
引理2Cp不等式:假設(shè)存在實(shí)數(shù)a、b和p,且p>0,則滿足
(|a|+|b|)p≤Cp(|a|p+|b|p)
(9)
其中,Cp的值滿足
(10)
(11)
其中,0<β<1,c>0。則非線性函數(shù)f(x)是局部有限時(shí)間穩(wěn)定,并給出關(guān)于初始狀態(tài)x0的有限時(shí)間上界
(12)
第i個(gè)智能體的滑模面函數(shù)設(shè)計(jì)為
(13)
其中,c和α均為標(biāo)量且c>0,1<α<2。
將式(12)化簡為緊湊形式
(14)
(15)
根據(jù)式(5)和式(15),得到式(14)導(dǎo)數(shù)如下所示。
(16)
由于信道衰落現(xiàn)象,智能體之間無法進(jìn)行正常的信息交互,第i個(gè)跟隨者無法從其他跟隨者處接收到準(zhǔn)確完整的信息,則信道衰落下的滑模面函數(shù)為
(17)
將式(17)改寫為緊湊形式
(18)
設(shè)計(jì)滑模控制器如下所示。
(19)
本文提出了基于終端滑??刂频挠邢迺r(shí)間一致控制算法。在此控制算法下,多智能體的跟蹤誤差量可以在有限時(shí)間內(nèi)到達(dá)設(shè)計(jì)的非奇異終端滑模面上,并沿著滑模面趨于穩(wěn)定,保證多智能體系統(tǒng)的有限時(shí)間一致性。
本文基于構(gòu)造的非奇異終端滑??刂坡?借助Lyapunov函數(shù)方法分析在信道衰落現(xiàn)象下多智能體系統(tǒng)的一致性和可達(dá)性。
定理1考慮多智能體系統(tǒng)在信道衰落下,滑模控制器能夠保證非奇異終端滑模面可達(dá)性。
證明構(gòu)造Lyapunov函數(shù)
(20)
對式(20)求導(dǎo)得
(21)
根據(jù)式(19),得
(22)
由假設(shè)1,可知
‖f(t)-1N?f0(t)‖≤(‖fi(t)-1N?f0(t)‖),…,
(‖fN(t)-1N?f0(t)‖)≤
‖(μ‖vi(t)-1N?v0(t)‖),…,
(μ‖vN(t)-1N?v0(t)‖)≤
μ|‖(L+H)-1?ε2(t)‖
(23)
因此,由式(23)進(jìn)一步推出式(22)如下所示。
(24)
對式(24)兩邊取數(shù)學(xué)期望,可得
(25)
根據(jù)上述關(guān)系式,代入式(25)可得
(26)
定理2考慮多智能體系統(tǒng)在信道衰落現(xiàn)象下,本文設(shè)計(jì)的滑模函數(shù)和滑??刂坡赡軌虮WC多智能體系統(tǒng)的有限時(shí)間一致性。
證明構(gòu)造Lyapunov函數(shù)
(27)
對其求導(dǎo)可得
(28)
當(dāng)s(t)=0時(shí),推出
(29)
根據(jù)式(29)和Cp不等式(引理2),有
(30)
由式(30),可得
(31)
由1個(gè)領(lǐng)導(dǎo)者和4個(gè)跟隨者組成二階多智能體系統(tǒng),其中智能體之間的通信拓?fù)淙鐖D1所示。
圖1 多智能體系統(tǒng)的通信拓?fù)銯igure 1. Communication topolopy of MASs
在圖1中,實(shí)線表示跟隨者之間的信息交互方向,且不存在信道衰落現(xiàn)象,信息可以完整傳遞,虛線表示跟隨者之間的信息交互方向且存在信道衰落現(xiàn)象,信息傳遞過程中幅值衰減。假設(shè)智能體之間的鄰接權(quán)值為1。
根據(jù)跟隨者和領(lǐng)導(dǎo)者之間的拓?fù)浣Y(jié)構(gòu)可以得到該多智能體系統(tǒng)的鄰接矩陣A、領(lǐng)導(dǎo)者的入度矩陣B和拉普拉斯矩陣L。
領(lǐng)導(dǎo)者的控制輸入為u0=[cos(t),sin(t)]T,滑??刂破髦械膮?shù)設(shè)計(jì)為c=1.0,k=0.1,α=1.5,擾動(dòng)參數(shù)μ=0.1。領(lǐng)導(dǎo)者的初始位置和速度狀態(tài)量為x0=[10,-10]T,v0=[10,-10]T,跟隨者的位置和速度的初始值為:x1=[10,-2]T,v1=[20,-2]T,x2=[15,15]T,v2=[20,3]T,x3=[25,5]T,v3=[15,0]T,x4=[45,15]T,v4=[35,0]T。
仿真結(jié)果如圖2~圖5所示。其中,圖2為多智能體系統(tǒng)在指定的滑模面和滑??刂坡上碌臓顟B(tài)軌跡曲線。從圖2可以看出,跟隨者(i=1,2,3,4)可以準(zhǔn)確地跟蹤領(lǐng)導(dǎo)者,多智能體系統(tǒng)一致性達(dá)成。
圖2 多智能體的狀態(tài)軌跡Figure 2. State trajectories of the multi-agents
圖3和圖4分別顯示了每個(gè)跟隨者的位置誤差和速度誤差函數(shù)軌跡曲線。其中,上標(biāo)e1iq和e2iq分別為第i個(gè)跟隨者的第q個(gè)狀態(tài)量的位置和速度誤差曲線。從圖3和圖4可以看出,位置誤差和速度誤差在有限時(shí)間內(nèi)收斂。觀察跟隨者3和跟隨者4,可以看出其位置誤差和速度誤差函數(shù)軌跡在收斂的過程中動(dòng)態(tài)性能差于跟隨者1和跟隨者2,這是由于在信道衰落現(xiàn)象的影響下,跟隨者3和跟隨者4只能接收跟隨者1和跟隨者2發(fā)送的衰落信息,而跟隨者1和跟隨者2可以接受領(lǐng)導(dǎo)者的準(zhǔn)確信息。圖5為跟隨者的滑模函數(shù)s(t)狀態(tài)軌跡,其中,上標(biāo)siq為第i個(gè)跟隨者的第q個(gè)狀態(tài)量的滑動(dòng)變量曲線。其中,跟隨者3和跟隨者4的軌跡表明,雖然由于信道衰落影響下產(chǎn)生的震蕩現(xiàn)象影響了跟隨者3和跟隨者4一致性達(dá)成的收斂過程,但本文設(shè)計(jì)的分布式滑??刂扑惴ㄈ阅芸朔诺浪ヂ鋵ο到y(tǒng)的影響,最終多智能體系統(tǒng)的有限時(shí)間一致性得以保證。
圖3 跟隨者的位置誤差(a)跟隨者1的位置誤差 (b)跟隨者2的位置誤差 (c)跟隨者3的位置誤差 (d)跟隨者4的位置誤差 Figure 3. Position error of the followers(a)Position error of the followers 1 (b)Position error of the followers 2 (c)Position error of the followers 3 (d)Position error of the followers 4
圖4 跟隨者的速度誤差(a)跟隨者1的速度誤差 (b)跟隨者2的速度誤差 (c)跟隨者3的速度誤差 (d)跟隨者4的速度誤差 Figure 4. Velocity error of the followers(a)Velocity error of the followers 1 (b)Velocity error of the followers 2 (c)Velocity error of the followers 3 (d)Velocity error of the followers 4
圖5 跟隨者的滑動(dòng)變量(a)跟隨者1的滑動(dòng)變量 (b)跟隨者2的滑動(dòng)變量 (c)跟隨者3的滑動(dòng)變量 (d)跟隨者4的滑動(dòng)變量 Figure 5. Sliding variables of the followers(a)Sliding variables of the followers 1 (b)Sliding variables of the followers 2 (c)Sliding variables of the followers 3 (d)Sliding variables of the followers 4
本文針對信道衰落下的二階多智能體系統(tǒng)有限時(shí)間一致性跟蹤問題提出了基于滑??刂频姆植际娇刂扑惴?。根據(jù)智能體的拓?fù)浣Y(jié)構(gòu)搭建了數(shù)學(xué)模型,基于誤差函數(shù)設(shè)計(jì)一致性協(xié)議將系統(tǒng)的一致性問題轉(zhuǎn)化為誤差系統(tǒng)的穩(wěn)定性問題。在此基礎(chǔ)上,構(gòu)造合適的Lyapunov函數(shù),證明了滑模面有限時(shí)間可達(dá)性和多智能體系統(tǒng)的穩(wěn)定性。最后,通過仿真實(shí)驗(yàn)可以看出該多智能體系統(tǒng)能夠達(dá)成一致性,且過程中各智能體的動(dòng)態(tài)性能存在顯著差異,這是由信道衰落現(xiàn)象所引起的。