高林慶,王超,哈登喆,耿華,侯帥
(1.河北工程大學(xué) 水利水電學(xué)院, 河北 邯鄲 056038;2.河北工程大學(xué) 信息與電氣工程學(xué)院, 河北 邯鄲 056038;3.天津大學(xué) 建筑工程學(xué)院,天津 300072)
近年來(lái),多智能體系統(tǒng)快速發(fā)展,已在軍事裝備[1]、移動(dòng)機(jī)器人[2]、洪澇風(fēng)險(xiǎn)評(píng)估[3]、多車編隊(duì)[4]等眾多領(lǐng)域取得了廣泛應(yīng)用,而其一致性問(wèn)題屬于基本且重要的熱點(diǎn)問(wèn)題.一致性是指多智能體系統(tǒng)中智能體的某個(gè)或某些狀態(tài)在一定時(shí)間內(nèi)趨于一致.眾多學(xué)者對(duì)多智能體系統(tǒng)的一致性問(wèn)題展開了廣泛研究[5-7].
同質(zhì)多智能體系統(tǒng)的一致性問(wèn)題研究已取得了豐碩的成果,Chen等[8]定義了由動(dòng)態(tài)連續(xù)時(shí)間智能體和動(dòng)態(tài)離散時(shí)間智能體構(gòu)成的有未知干擾的混合系統(tǒng)二階一致性問(wèn)題,并利用領(lǐng)導(dǎo)者和跟隨者網(wǎng)絡(luò)下的滑??刂品椒ń鉀Q該問(wèn)題,最終利用仿真驗(yàn)證了該方法的有效性.Huang等[9]提出一種由李雅普諾夫有向理論和矩陣?yán)碚撗苌目刂茀f(xié)議,以使二階非線性智能體系統(tǒng)中不同組內(nèi)的智能體達(dá)到延遲一致性,而使相同組內(nèi)的智能體達(dá)到相同的一致性. Chen等[10]基于耦合強(qiáng)度、李雅普諾夫矩陣特征值和通訊結(jié)構(gòu)提出了一種基于固定和變化拓?fù)涞某掷m(xù)保持控制協(xié)議,以改進(jìn)有內(nèi)部通訊二階多智能體領(lǐng)導(dǎo)者和跟隨者系統(tǒng)的一致性性能.Zuo等[11]對(duì)帶有高階積分器動(dòng)態(tài)特性的智能體系統(tǒng)提出了一種分布式一致性觀察器來(lái)評(píng)估領(lǐng)導(dǎo)者狀態(tài),并通過(guò)仿真驗(yàn)證了該方法的可行性.Guo等[12]研究了具有有向圖的高階多智能體一致性的干擾抑制問(wèn)題,僅依賴于每個(gè)智能體及其鄰居的狀態(tài)信息,提出了一種采取以完全分布式方式開發(fā)的干擾抑制協(xié)議,并給出了保證穩(wěn)定性的充分條件.上述研究通常是解決多智能體的一致性問(wèn)題,即一致性問(wèn)題由多個(gè)同構(gòu)的智能體構(gòu)成,并去解決響應(yīng)問(wèn)題.然而在實(shí)際工作中,智能體間的動(dòng)力學(xué)模型和特性往往存在差異,即存在多個(gè)異質(zhì)的智能體.例如,在救援救災(zāi)過(guò)程中的多智能體的特性是不同的,不僅僅會(huì)包括單一的一階、二階或者高階智能體,該情況會(huì)包含復(fù)雜的不同階次的智能體.
眾多學(xué)者針對(duì)異質(zhì)多智能體開展了相關(guān)的研究工作.Wang等[13]研究了二階非線性多智能體系統(tǒng)在馬爾可夫切換拓?fù)湎骂I(lǐng)導(dǎo)跟隨者的一致性問(wèn)題,針對(duì)異質(zhì)和均勻多智能體系統(tǒng),分別設(shè)計(jì)了一種不連續(xù)的分布式自適應(yīng)的非線性控制率和一種滑膜控制率,并以船舶航向控制仿真系統(tǒng)為例驗(yàn)證了該控制方案的有效性.該異質(zhì)智能體階次相同,但是其動(dòng)態(tài)特性是不同的.有學(xué)者研究了動(dòng)態(tài)特性相同,但是智能體階次不相同的混合階的異質(zhì)多智能體.Zheng和Wang[14]通過(guò)研究線性一致性協(xié)議和飽和一致性協(xié)議,解決了一階和二階積分器型異質(zhì)多智能體系統(tǒng)的一致性問(wèn)題.
Geng等[15]研究了混合階多智能體在有向網(wǎng)絡(luò)條件下的一致性問(wèn)題,提出了2種基于線性濾波器、圖論和矩陣?yán)碚摰囊恢滦詥?wèn)題解決協(xié)議,并取得了良好的預(yù)測(cè)效果.Sun等[16]研究了包含有一階和二階多動(dòng)態(tài)特性智能體的有向拓?fù)洚愘|(zhì)多智能體系統(tǒng),提出了一種針對(duì)無(wú)領(lǐng)導(dǎo)者和領(lǐng)導(dǎo)跟隨者的具有時(shí)間延遲的分布式控制協(xié)議.耿華等[17]研究了無(wú)向網(wǎng)絡(luò)中帶有一階靜態(tài)領(lǐng)導(dǎo)者或二階動(dòng)態(tài)領(lǐng)導(dǎo)者的混合階多智能體系統(tǒng)的一致性問(wèn)題.
綜上,在領(lǐng)導(dǎo)-跟隨混合階多智能體系統(tǒng)的相關(guān)研究中,一些研究人員針對(duì)智能體具有同階次不同動(dòng)力學(xué)特性以及不同階次不同動(dòng)力學(xué)特性的多智能體系統(tǒng)的一致性問(wèn)題進(jìn)行了相關(guān)的研究,其中不同階不同動(dòng)力學(xué)特性的研究中,一、二階的異質(zhì)系統(tǒng)是主要研究對(duì)象.然而,在現(xiàn)實(shí)的人機(jī)協(xié)同、多種類無(wú)人機(jī)編隊(duì)和不同類智能車協(xié)同救災(zāi)時(shí),由多類不同階次智能體構(gòu)成的異質(zhì)系統(tǒng)是建模的最佳選擇.基于此現(xiàn)實(shí)需求,考慮部分跟隨者在協(xié)調(diào)控制中存在舒適度的條件約束,將這類智能體描述為三階智能體.由此,本文首先研究一種由一階、二階和三階混合智能體構(gòu)成的領(lǐng)導(dǎo)-跟隨混合階多智能體系統(tǒng)的一致性,其次,分別設(shè)計(jì)了無(wú)向通信網(wǎng)絡(luò)和有向通信網(wǎng)絡(luò)下的一致性控制協(xié)議,解決了不同通信條件下的一致性聚集問(wèn)題.
定義圖為G=(V,E),所有頂點(diǎn)構(gòu)成的集合V={v1,v2,…,vn}稱為點(diǎn)集;所有邊構(gòu)成的集合E={e1,e2,…,en}稱為邊集.圖中的頂點(diǎn)代表多智能體系統(tǒng)中的智能體,邊代表智能體之間的信息交互關(guān)系.其中E?V×V,V×V相當(dāng)于{(a,b)│a∈V,b∈V},邊ek可由其兩頂點(diǎn)表示為ek=(vi,vj),進(jìn)一步地,(vi,vj)表示頂點(diǎn)vj可以把信息傳輸給頂點(diǎn)vi.
根據(jù)圖中的邊有無(wú)方向,可以將圖分為無(wú)向圖和有向圖,任一邊都沒有方向的圖為無(wú)向圖,若圖中的邊帶有指示方向的箭頭,則稱這樣的圖為有向圖.無(wú)向圖中,每條邊的2頂點(diǎn)可以相互傳遞信息,而有向圖中,帶有箭頭邊上的2頂點(diǎn)間只能依箭頭方向單向傳遞信息.在有向圖G中,如果2個(gè)頂點(diǎn)vi和vj之間有一條從vi到vj的有向路徑,同時(shí)還有一條從vj到vi的有向路徑則稱頂點(diǎn)vi和vj強(qiáng)連通,如果有向圖G中每2個(gè)頂點(diǎn)都強(qiáng)連通,稱圖G為強(qiáng)連通圖.
對(duì)于含有n個(gè)頂點(diǎn)的圖G,定義元素aij,當(dāng)頂點(diǎn)vj指向頂點(diǎn)vi時(shí),aij等于1,否則,aij等于0,則稱以aij為元素的n×n階矩陣為圖G的鄰接矩陣,用符號(hào)表示為A=[aij]∈Rn×n.與頂點(diǎn)vi相關(guān)聯(lián)的邊的數(shù)量稱為頂點(diǎn)vi的度,在無(wú)向圖G中的度矩陣D=diag{di}表示頂點(diǎn)vi的度所構(gòu)成的對(duì)角矩陣,有向圖G中度矩陣D=diag{di}表示頂點(diǎn)vi的入度所構(gòu)成的對(duì)角矩陣.對(duì)于含有n個(gè)頂點(diǎn)的圖G,其度矩陣用D表示,其鄰接矩陣用A表示,定義L=D-A=(lij)n×n為圖G的拉普拉斯矩陣.
引理1[18]有向圖G具有n個(gè)結(jié)點(diǎn),其拉普拉斯矩陣L至少有1個(gè)零特征值,且所有的非零特征值均具有正實(shí)部.L只有1個(gè)零特征值,當(dāng)且僅當(dāng)有向圖G有1個(gè)生成樹.此時(shí),向量l=[1,…,1]T是零特征值對(duì)應(yīng)的特征向量.
異質(zhì)多智能體系統(tǒng)由1個(gè)領(lǐng)導(dǎo)者和n個(gè)跟隨者組成.其跟隨者中,有l(wèi)個(gè)一階積分器智能體,(m-l)個(gè)二階積分器智能體,(n-m)個(gè)三階積分器智能體組成,0 (1) 其中xi(t)∈R為位置信息,ui(t)∈R為控制輸入. 二階智能體的動(dòng)態(tài)方程為 (2) 其中xi(t)∈R為位置信息,vi(t)∈R為速度信息,ui(t)∈R為控制輸入. 三階智能體的動(dòng)態(tài)方程為 (3) 其中xi(t)∈R為位置信息,vi(t)∈R為速度信息,zi(t)∈R為加速度信息,ui(t)∈R為控制輸入. 領(lǐng)導(dǎo)者為靜態(tài)領(lǐng)導(dǎo)者,編號(hào)為n+1,其動(dòng)態(tài)方程為 (4) 其中c為一給定常數(shù). 定義1由式(1)~(4)組成的領(lǐng)導(dǎo)-跟隨異質(zhì)多智能體系統(tǒng),其實(shí)現(xiàn)一致性聚集,如果對(duì)于任何初始條件,以下方程成立: 引理2[19]對(duì)于如下所定義的線性濾波器 本節(jié)分別研究了無(wú)向通信和有向通信網(wǎng)絡(luò)條件下,由一階、二階和三階組成的領(lǐng)導(dǎo)-跟隨異質(zhì)多智能體系統(tǒng)的一致性聚集問(wèn)題. 由式(1)~(4)組成的混合階多智能體系統(tǒng)中的n個(gè)跟隨者之間是無(wú)向通信的,編號(hào)為1~l,l+1~m,m+1~n的智能體分別是一階、二階和三階的智能體. 對(duì)每個(gè)二階智能體設(shè)計(jì)如下線性濾波器 (5) 對(duì)每個(gè)三階智能體設(shè)計(jì)如下2個(gè)線性濾波器 (6) 為簡(jiǎn)便起見,本文以下內(nèi)容將帶變量t的符號(hào)省略t,如xi(t)、ui(t)、γ1i(t)分別簡(jiǎn)記為xi、ui、γ1i等. 一致性協(xié)議設(shè)計(jì)如下所示: (7) 式(7)中,A=[αij]n×n為加權(quán)鄰接矩陣,aij為A的元素,B=diag{bi(n+1)}為跟隨者與領(lǐng)導(dǎo)者鄰接矩陣,bi(n+1)為B的元素,α1>0,α2>0,α3>0為濾波器參數(shù).ε=[x1,…,xl,γ1(l+1),…,γ1(m),γ3(m+1),…,γ3(n)]T為狀態(tài)向量,εi、εj分別為ε的第i個(gè)、第j個(gè)分量. 基于上述一致性協(xié)議,可得定理1. 定理1假設(shè)系統(tǒng)由式(1)~(4)組成,跟隨者之間的通信拓?fù)涫枪潭o(wú)向連通的,如果條件α1=α2=α3=1成立,應(yīng)用協(xié)議(7),可解決混合階多智能體系統(tǒng)的聚集問(wèn)題. 證明:應(yīng)用一致性協(xié)議(7)后,閉環(huán)系統(tǒng)可表示為 (8) (9) 將公式(9)寫成誤差形式,則如下式所示: (10) 利用李雅普諾夫直接法構(gòu)造李雅普諾夫函數(shù)如下: (11) 對(duì)式(11)求導(dǎo)后則得到 (12) 由于跟隨者拓?fù)鋱D是無(wú)向連通的,因此可得 (13) 應(yīng)用拉塞爾不變集原理可得不變集 (14) 也就是 (15) 由對(duì)稱性可得 (16) 當(dāng)t→∞時(shí),可知 ei=xi-xn+1=0i=1,2,…,l, (17) 由α1=1,可推得ei收斂于0. 同理α2=α3=1,可知當(dāng)i=l+1,l+2,…,m和i=m+1,m+2,…,n時(shí),ei收斂于0,xi-xn+1也收斂于0. 系統(tǒng)是由式(1)~(4)組成的混合階多智能體系統(tǒng),跟隨者是通信拓?fù)?是有向的,基于上述設(shè)計(jì)線性濾波器的方法,提出如下一致性協(xié)議: (18) 式中,A=[αij]n×n為加權(quán)鄰接矩陣,aij為A的元素,α1>0,α2>0,α3>0為濾波器參數(shù).ε=[x1,…,xl,γ1(l+1),…,γ1(m),γ3(m+1),…,γ3(n)]T為狀態(tài)向量,εi、εj為ε的第i個(gè)、第j個(gè)分量. 基于上述一致性協(xié)議,可得定理2. 定理2假設(shè)跟隨者之間通訊拓?fù)鋱D是固定有向的,且強(qiáng)連通的,基于濾波器(5)~(6)以及上述一致性協(xié)議,在α1=1,α2-α3≠0,α2α3=1條件滿足時(shí),一致性問(wèn)題可得到解決. 證明:領(lǐng)導(dǎo)者動(dòng)態(tài)方程為 (19) 由于領(lǐng)導(dǎo)者只發(fā)送信息而不接受信息,所以所有α(n+1)i=0領(lǐng)導(dǎo)者動(dòng)態(tài)方程可改寫成 (20) 基于一致性協(xié)議可將閉環(huán)領(lǐng)導(dǎo)跟隨系統(tǒng)寫成下式 (21) 寫成向量形式 (22) 其中 (23) 由引理1可知,上述系統(tǒng)可實(shí)現(xiàn)一致性,假設(shè)一致性狀態(tài)為[k,…,k]T,k∈R,也就是 (24) 線性濾波器狀態(tài)滿足下式 (25) 求解上述方程,可知 (26) 已知α1=1,α2-α3≠0,α2α3=1,故一致性實(shí)現(xiàn),即 (27) 一致性狀態(tài)k由0特征值對(duì)應(yīng)的右特征向量和左特征向量以及初始條件決定,即 (28) 異質(zhì)多智能體系統(tǒng)由一階、二階和三階智能體組成,編號(hào)1、2的智能體為一階智能體,編號(hào)3、4的智能體為二階智能體,編號(hào)5、6的智能體為三階智能體,編號(hào)7的智能體為靜態(tài)領(lǐng)導(dǎo)者. 算例1令α1=1,α2=1,α3=1,跟隨者之間的通信拓?fù)鋱D是固定無(wú)向連通的,如圖1所示.由圖1可知,跟隨者之間的鄰接矩陣A以及跟隨者與領(lǐng)導(dǎo)者之間的鄰接矩陣B. 圖1 固定無(wú)向通訊拓?fù)銯ig.1 Fixed undirected communication topology diagram 設(shè)定位置初始值[x1,x2,x3,x4,x5,x6]=[-1,-3,0,-4,1,-5],速度初始值[v3,v4,v5,v6]=[2,-1,2,-2],加速度初始值為[z5,z6]=[1,-1],靜態(tài)領(lǐng)導(dǎo)者位置x7=2.圖2、圖3和圖4顯示了各智能體參數(shù)軌跡的變化過(guò)程. 圖2 無(wú)向多智能體位置軌跡變化Fig.2 Undirected multi-agent position trajectory variation 圖3 無(wú)向多智能體速度軌跡變化Fig.3 Undirected multi-agent velocity trajectory variation 圖4 無(wú)向多智能體加速度軌跡變化Fig.4 Undirected multi-agent acceleration trajectory variation 通過(guò)觀察圖2、圖3和圖4,可以發(fā)現(xiàn),5號(hào)和6號(hào)智能體的加速度隨時(shí)間的增加趨近于零,3號(hào)、4號(hào)、5號(hào)和6號(hào)智能體的速度隨時(shí)間的增加趨近于零,1號(hào)、2號(hào)、3號(hào)、4號(hào)、5號(hào)和6號(hào)智能體與7號(hào)智能體(領(lǐng)導(dǎo)者)的位置誤差趨近于零,跟隨者與領(lǐng)導(dǎo)者的位置趨近一致且保持靜止,領(lǐng)導(dǎo)者-跟隨者的一致性得到解決.該仿真結(jié)果驗(yàn)證了定理1的正確性和一致性協(xié)議(7)的有效性. 算例2令α1=1,α2=8,α3=0.125,滿足定理2成立的條件,即α1=1,α2-α3≠0,α2α3=1.類似算例1,將異質(zhì)智能體以一種較為簡(jiǎn)單的交互方式有向連接,如圖5所示.根據(jù)圖5,可以得到鄰接矩陣A和B,矩陣A表示跟隨者之間可以進(jìn)行有向交互,矩陣B表示領(lǐng)導(dǎo)者僅把信息有向傳遞給2號(hào)智能體. 圖5 有向通訊拓?fù)銯ig.5 Directed communication topology 假設(shè)位置初始值[x1,x2,x3,x4,x5,x6]=[-1,-3,0,-4,1,-5],速度初始值[v3,v4,v5,v6]=[2,-1,2,-2],加速度初始值為[z5,z6]=[1,-1],靜態(tài)領(lǐng)導(dǎo)者位置x7=2.圖6、圖7和圖8顯示了各智能體參數(shù)軌跡的變化過(guò)程. 圖6 有向多智能體位置軌跡變化Fig.6 Directed multi-agent position trajectory variation 圖7 有向多智能體速度軌跡變化Fig.7 Directed multi-agent velocity trajectory variation 圖8 有向多智能體加速度軌跡變化Fig.8 Directed multi-agent acceleration trajectory variation 通過(guò)觀察圖6、圖7和圖8,可以發(fā)現(xiàn),5號(hào)和6號(hào)智能體的加速度隨時(shí)間的增加趨近于零,3號(hào)、4號(hào)、5號(hào)和6號(hào)智能體的速度隨時(shí)間的增加趨近于零,1號(hào)、2號(hào)、3號(hào)、4號(hào)、5號(hào)和6號(hào)智能體與7號(hào)智能體(領(lǐng)導(dǎo)者)的位置誤差趨近于零,跟隨者與領(lǐng)導(dǎo)者的位置趨近一致且保持靜止,領(lǐng)導(dǎo)者-跟隨者的一致性得到解決.該仿真結(jié)果驗(yàn)證了定理2的正確性和一致性協(xié)議(18)的有效性. 研究了領(lǐng)導(dǎo)-跟隨混合階異質(zhì)多智能體系統(tǒng)的一致性問(wèn)題.首先,在領(lǐng)導(dǎo)-跟隨無(wú)向通訊網(wǎng)絡(luò)條件下,提出了一種解決混合階異質(zhì)多智能體系統(tǒng)聚集問(wèn)題的一致性協(xié)議,并通過(guò)仿真實(shí)驗(yàn)驗(yàn)證本文提出的方法能夠有效地解決一階、二階和三階混合階多智能體系統(tǒng)的一致性問(wèn)題;其次,提出了一種一致性協(xié)議來(lái)解決領(lǐng)導(dǎo)-跟隨有向通訊網(wǎng)絡(luò)條件下一階、二階和三階混合階異質(zhì)多智能體系統(tǒng)的一致性問(wèn)題.為復(fù)雜情況中無(wú)向和有向通訊網(wǎng)絡(luò)條件下多智能體系統(tǒng)的運(yùn)行提供了有效解決方案.此外,本文提出的一致性協(xié)議可以擴(kuò)展至更高階的無(wú)向和有向通訊網(wǎng)絡(luò)條件下的多智能體系統(tǒng)中,并可以有效應(yīng)用于洪澇災(zāi)害防范、水面無(wú)人船、水下無(wú)人潛水器、抗震救災(zāi)機(jī)器人等多智能體中.2 主要結(jié)論
2.1 無(wú)向網(wǎng)絡(luò)中的一致性聚集問(wèn)題
2.2 有向網(wǎng)絡(luò)下混合階多智能體系統(tǒng)聚集問(wèn)題
3 仿真實(shí)驗(yàn)
4 結(jié)論