陳 冰, 陳陽(yáng)舟, 詹璟原
(1.北京工業(yè)大學(xué)信息學(xué)部, 北京 100124; 2.教育部數(shù)字社區(qū)工程中心, 北京 100124)
多智能體網(wǎng)絡(luò)是由具備感知、通信、執(zhí)行能力的多個(gè)智能體構(gòu)成的網(wǎng)絡(luò)系統(tǒng). 近年來(lái),多智能體網(wǎng)絡(luò)的協(xié)作控制在無(wú)人機(jī)編隊(duì)、移動(dòng)車(chē)輛的協(xié)調(diào)合作和隊(duì)形控制、傳感器網(wǎng)絡(luò)以及交通網(wǎng)絡(luò)信號(hào)燈協(xié)調(diào)控制等領(lǐng)域得到了廣泛的應(yīng)用. 多智能體系統(tǒng)的狀態(tài)一致性是指智能體之間通過(guò)信息交換和相互協(xié)調(diào)使所有智能體的狀態(tài)趨于共同值[1]. 同樣,在日常生活中也存在通過(guò)多個(gè)智能體之間的相互協(xié)作來(lái)共同完成一項(xiàng)任務(wù)的現(xiàn)象,類(lèi)似于生物群聚集的自然現(xiàn)象,如大雁南飛、魚(yú)群游動(dòng)、螞蟻覓食、蜜蜂筑巢等生物行為,體現(xiàn)了多智能體之間的協(xié)同大大提高個(gè)體行為的智能化程度,進(jìn)而更高效地完成很多個(gè)體無(wú)法完成的活動(dòng). 實(shí)際情況中的多智能體系統(tǒng)具有個(gè)體的數(shù)量多,并且智能體之間的相互作用關(guān)系也較復(fù)雜. 因此,大部分學(xué)者研究多智能體系統(tǒng)時(shí),利用相關(guān)的圖論知識(shí)將它建模成圖,從而解決多智能體協(xié)同控制問(wèn)題. 目前,盡管多智能體系統(tǒng)一致性理論研究取得了豐富的成果,但還存在一些不足. 例如,多智能體系統(tǒng)在一般有向通信拓?fù)錀l件下具有采樣數(shù)據(jù)丟失的一致性問(wèn)題研究還不充分.
由于數(shù)字傳感器和控制器的廣泛應(yīng)用,采樣控制被運(yùn)用到多智能體網(wǎng)絡(luò)中,控制協(xié)議只在預(yù)定的采樣時(shí)刻進(jìn)行信息交換和控制更新. 文獻(xiàn)[2]直接將連續(xù)系統(tǒng)離散化,建立了一個(gè)基于采樣數(shù)據(jù)的一致性協(xié)議. 文獻(xiàn)[3]利用采樣控制得出了二階采樣多智能體系統(tǒng)一致性的充要條件. 文獻(xiàn)[4-5]基于數(shù)據(jù)采樣控制器研究了領(lǐng)導(dǎo)- 跟隨多智能體網(wǎng)絡(luò)一致性問(wèn)題. 文獻(xiàn)[6]分別針對(duì)固定和馬爾可夫切換拓?fù)淝闆r提出了基于采樣觀測(cè)器的一致性協(xié)議. 文獻(xiàn)[7]考慮了狀態(tài)不可測(cè)的二階無(wú)向圖多智能體系統(tǒng)的事件觸發(fā)保性能一致性問(wèn)題,采用觸發(fā)條件和Lyapunov穩(wěn)定性方法,給出了保性能輸出反饋一致性的一些充分條件. 文獻(xiàn)[8]討論了位置和速度采樣的二階多智能體網(wǎng)絡(luò)一致性的牽引控制. 文獻(xiàn)[9]研究了具有切換拓?fù)浜陀型ㄐ旁肼暻闆r下的二階多智能體系統(tǒng)的平均一致性問(wèn)題,結(jié)果表明均方平均一致的充分條件是: 一致性控制增益滿足近似性條件,并且每個(gè)采樣時(shí)刻的通信拓?fù)鋱D是一個(gè)具有生成樹(shù)的平衡圖. 文獻(xiàn)[10]采用模型預(yù)測(cè)控制方法研究了周期采樣系統(tǒng)和連續(xù)時(shí)間一階系統(tǒng)一致性問(wèn)題,給出了解析解以及系統(tǒng)漸近一致的理論證明. 文獻(xiàn)[11]解決了具有網(wǎng)絡(luò)時(shí)變時(shí)延和動(dòng)態(tài)變拓?fù)涞碾x散時(shí)間的多智能體系統(tǒng)一致性問(wèn)題. 文獻(xiàn)[12-13]分別研究了連續(xù)時(shí)間二階多智能體系統(tǒng)的量化一致性問(wèn)題. 文獻(xiàn)[14]利用脈沖系統(tǒng)穩(wěn)定性理論和圖論,得到了保證基于采樣數(shù)據(jù)多智能體系統(tǒng)一致的充要條件.
智能體之間通過(guò)共享的通信網(wǎng)絡(luò)傳輸信息,通信信道中會(huì)存在網(wǎng)絡(luò)時(shí)延、數(shù)據(jù)丟包、有限帶寬等情況,將會(huì)給多智能體網(wǎng)絡(luò)系統(tǒng)的穩(wěn)定性及控制性能帶來(lái)極大影響,因此,對(duì)其進(jìn)行分析和研究顯得非常重要. 近幾年,針對(duì)具有采樣數(shù)據(jù)丟失情況的多智能體系統(tǒng)的一致性問(wèn)題的研究成果較少,關(guān)于此類(lèi)問(wèn)題現(xiàn)有的研究成果[15-18]主要針對(duì)無(wú)向通信拓?fù)浠蛴邢蚱胶馔ㄐ磐負(fù)淝闆r,并且文獻(xiàn)中僅考慮了一階或二階多智能體系統(tǒng)特殊情況. 文獻(xiàn)[15]研究了具有連續(xù)時(shí)間丟包的數(shù)據(jù)采樣多智能體系統(tǒng)一致性問(wèn)題,采用正交矩陣作為變換矩陣,對(duì)系統(tǒng)進(jìn)行結(jié)構(gòu)分解,實(shí)現(xiàn)了具有丟包和時(shí)延的采樣數(shù)據(jù)多智能體一致性. 文獻(xiàn)[16]討論了連續(xù)時(shí)間有領(lǐng)導(dǎo)者的多智能體系統(tǒng)的采樣數(shù)據(jù)丟包情況下的一致性,通過(guò)引入誤差變量,將一致性問(wèn)題轉(zhuǎn)化為誤差系統(tǒng)的穩(wěn)定性問(wèn)題,并將采樣數(shù)據(jù)看作時(shí)變時(shí)延數(shù)據(jù),通過(guò)構(gòu)造Lyapunov-Krasovskii泛函,利用積分不等式技術(shù)得出了領(lǐng)導(dǎo)- 跟隨多智能體系統(tǒng)達(dá)到一致的充分條件. 文獻(xiàn)[17-18]針對(duì)離散時(shí)間系統(tǒng)網(wǎng)絡(luò)中存在隨機(jī)通信通道故障并且各通信通道的數(shù)據(jù)丟失情況是相互獨(dú)立的領(lǐng)導(dǎo)- 跟隨多智能體系統(tǒng),利用Lyapunov方法和線性矩陣不等式(linear matrix inequality,LMI)設(shè)計(jì)控制協(xié)議增益,得出了所有智能體狀態(tài)達(dá)到漸近一致的充分條件. 但上述文獻(xiàn)的結(jié)論都是基于通信拓?fù)錇闊o(wú)向圖或是有向平衡圖.
本文在現(xiàn)有研究基礎(chǔ)上,考慮一般高階線性多智能體系統(tǒng)在有向通信拓?fù)湎麓嬖诓蓸訑?shù)據(jù)丟包時(shí)的一致性問(wèn)題,其中隨機(jī)丟包由Bernoulli隨機(jī)過(guò)程描述. 基于通信拓?fù)鋱D的有向生成樹(shù)的關(guān)聯(lián)矩陣構(gòu)造線性變換將一致性問(wèn)題等價(jià)轉(zhuǎn)化成一個(gè)降階系統(tǒng)的漸近穩(wěn)定性問(wèn)題,應(yīng)用漸近穩(wěn)定性理論給出隨機(jī)丟包情況下的多智能體系統(tǒng)狀態(tài)一致性條件,并采用線性矩陣不等式方法將分布式一致性協(xié)議的設(shè)計(jì)轉(zhuǎn)化為求解一個(gè)凸優(yōu)化問(wèn)題,并進(jìn)一步分析采樣周期的允許邊界、隨機(jī)丟包概率與拉普拉斯矩陣之間的相互影響關(guān)系.
考慮N個(gè)智能體構(gòu)成的多智能體系統(tǒng),其中第i個(gè)智能體的狀態(tài)方程為
(1)
式中,xi∈Rn,ui∈Rm分別為第i個(gè)智能體的狀態(tài)變量與控制輸入變量(或稱為控制協(xié)議).
假設(shè)智能體i能獲取其鄰居智能體j∈Ni相對(duì)于自身的狀態(tài)信息,并且假設(shè)智能體i獲得采樣數(shù)據(jù)
(2)
考慮具有采樣數(shù)據(jù)丟包的控制協(xié)議
(3)
式中,K為需要設(shè)計(jì)的反饋增益矩陣.隨機(jī)變量α(tk)為滿足Bernoulli分布的{0,1}序列,滿足
(4)
定義1如果對(duì)智能體i的任意初始狀態(tài)xi(0)滿足
則稱多智能體系統(tǒng)(1)在控制協(xié)議(3)作用下?tīng)顟B(tài)達(dá)到均方漸近一致.
定義2如果一個(gè)有向圖除根節(jié)點(diǎn)以外的其他所有節(jié)點(diǎn)都只有一個(gè)父節(jié)點(diǎn),則稱一個(gè)有向圖為一棵樹(shù);如果存在一棵包含該有向圖所有節(jié)點(diǎn)的樹(shù),則稱一個(gè)有向圖包含一棵有向生成樹(shù).
本文假設(shè)多智能體系統(tǒng)的有向通信拓?fù)鋱D包含有向生成樹(shù).
在控制協(xié)議(3)的作用下,系統(tǒng)(1)的全狀態(tài)閉環(huán)形式為
(5)
現(xiàn)在討論如何通過(guò)線性變換將系統(tǒng)(1)在控制協(xié)議(3)下的一致性問(wèn)題等價(jià)地轉(zhuǎn)化為降階系統(tǒng)的漸近穩(wěn)定性問(wèn)題.由上述假設(shè),通信拓?fù)鋱DG的一棵有向生成樹(shù)包含N個(gè)節(jié)點(diǎn)和N-1條有向邊,可選取該有向生成樹(shù)的關(guān)聯(lián)矩陣來(lái)構(gòu)造線性變換.
(6)
式中,1N為元素全為1的N維列向量.逆矩陣W-1可表示為
利用矩陣(6)構(gòu)造系統(tǒng)(5)的線性變換
(7)
則進(jìn)一步系統(tǒng)(5)轉(zhuǎn)化為
(8)
(9)
式中:
引理1[19]系統(tǒng)(9)等價(jià)變?yōu)?/p>
(10a)
(10b)
式中:
為分析系統(tǒng)(10a)在采樣數(shù)據(jù)丟包情況下的穩(wěn)定性,首先給出幾個(gè)相關(guān)引理.
成立.
引理3[21]對(duì)任意向量a、b和一個(gè)正定矩陣Φ,有
-2aTb≤aTΦa+bTΦ-1b
下面給出使系統(tǒng)(10a)均方漸近指數(shù)穩(wěn)定的一個(gè)充分條件.
定理1多智能體系統(tǒng)(1)在控制協(xié)議(3)作用下?tīng)顟B(tài)達(dá)到均方漸近一致的充分條件是: 存在正定對(duì)稱矩陣X∈Rn×n,標(biāo)量β>0以及矩陣Y∈Rm×n,使得
(11)
成立.式中
若不等式(11)的可行解為X和Y,則控制協(xié)議(3)中的反饋增益矩陣可取為K=YX-1.
證明針對(duì)系統(tǒng)(10a)構(gòu)造Lyapunov函數(shù)
V(t)=yT(t)(IN-1?P)y(t)
對(duì)V(t)關(guān)于時(shí)間求導(dǎo),得到
(12)
根據(jù)式(10a),得出
(13)
利用引理3來(lái)獲取式(13)中第1項(xiàng)的上界,可得
(14)
根據(jù)引理2,式(14)中的第2項(xiàng)可寫(xiě)為
同樣,對(duì)式(13)第3項(xiàng)利用引理3獲得該項(xiàng)的上界,可得
(15)
(16)
由式(16)可得
(17)
其中標(biāo)量β>0.
應(yīng)用引理3,式(16)進(jìn)一步轉(zhuǎn)化為
(18)
根據(jù)式(17)(18),可得
(19)
令
接下來(lái)證明
(20)
利用反證法,假設(shè)式(19)不成立,至少存在一個(gè)t*滿足E{V(t*)}>E{V(tk)}.由t∈[tk,tk+1),t-tk<τ,以及式(19)得出
(21)
式(20)表明E{V(tk)}自tk時(shí)刻起在較短時(shí)間內(nèi)是逐漸減小的,因此,存在t**∈[tk,t*]滿足
(22)
由式(19)可知
(23)
令φ(t)=eβtV(t)/V(tk),并由式(19)(20),t∈[tk,tk+1), 可得出
(24)
對(duì)式(24)兩邊在[tk,tk+1]進(jìn)行積分,得到
(25)
由式(25)以及t-tk<τ, 得出
(26)
然后
E{V(tk+1)}≤σV(tk)≤σ2V(tk-1)≤…≤
σk+1E{V(t0)}
(27)
例1考慮二階多智能體系統(tǒng)包含6個(gè)節(jié)點(diǎn),每個(gè)智能體系統(tǒng)的模型參數(shù)為
假設(shè)通信權(quán)值均gij=1,由圖1可知系統(tǒng)的拉普拉斯矩陣為
圖1 有向拓?fù)銯ig.1 Directed topology
根據(jù)式(6)構(gòu)建的非奇異變換矩陣為
選擇采樣周期τ=0.05滿足定理1中的條件.假定系統(tǒng)的初始值為
具有丟包的數(shù)據(jù)采樣多智能體系統(tǒng)(1)在信息拓?fù)?3)下的狀態(tài)軌跡如圖2所示.圖3為隨機(jī)變量α(·)Bernoulli 0-1分布圖.
圖2 例1中多智能體系統(tǒng)的狀態(tài)軌跡Fig.2 State trajectories of multiagent systems in example 1
圖3 例1的隨機(jī)變量α(·)分布Fig.3 Stochastic variable α(·) distribution of example 1
例2智能體個(gè)數(shù)及其通信拓?fù)鋱D同例1,但每個(gè)智能體的狀態(tài)方程(1)的參數(shù)矩陣為
選擇采樣周期τ=0.2來(lái)滿足定理1中的條件.假定系統(tǒng)的初始值為
具有丟包的數(shù)據(jù)采樣多智能體系統(tǒng)(1)在信息拓?fù)?3)下的狀態(tài)軌跡如圖4所示.圖5為隨機(jī)變量α(·)Bernoulli 0-1分布圖.
圖4 例2中多智能體系統(tǒng)的狀態(tài)軌跡Fig.4 State trajectories of multiagent systems in example 2
圖5 例2的隨機(jī)變量α(·)分布Fig.5 Stochastic variable α(·) distribution of example 2
1) 為克服文獻(xiàn)[15]特殊情況下的無(wú)向通信拓?fù)浠蛴邢蚱胶鈭D的不足,在此基礎(chǔ)上本文針對(duì)一般有向通信拓?fù)淝闆r下的采樣數(shù)據(jù)丟失的多智能體系統(tǒng)一致性問(wèn)題進(jìn)行研究,采用有向生成樹(shù)的關(guān)聯(lián)矩陣進(jìn)行線性變換,將數(shù)據(jù)采樣的多智能體的漸近狀態(tài)一致性問(wèn)題轉(zhuǎn)化為相應(yīng)系統(tǒng)的漸近穩(wěn)定性問(wèn)題.
2) 利用LMIs分析了轉(zhuǎn)化后系統(tǒng)的穩(wěn)定性,得出了采樣周期的允許邊界、隨機(jī)丟包概率和拉普拉斯矩陣之間的相互關(guān)系,證明了在滿足系統(tǒng)穩(wěn)定性條件與采樣周期允許范圍內(nèi)使得所有智能體狀態(tài)達(dá)到漸近一致.
3) 仿真結(jié)果表明,多智能體系統(tǒng)狀態(tài)分量仍能各自漸近地達(dá)到一致,從而實(shí)現(xiàn)了多智能體系統(tǒng)協(xié)調(diào)控制的目的.
4) 雖然本文對(duì)周期采樣的多智能體系統(tǒng)進(jìn)行了研究,但是該方法可以擴(kuò)展到非周期采樣以及丟包概率在每條通道上不同分布的情況.該方法在不同情況下的拓展研究將是下一步的研究目標(biāo).