徐敏敏,金曉宏,雷 斌,陳 浩
(武漢科技大學(xué)機(jī)械自動(dòng)化學(xué)院,湖北 武漢,430081)
復(fù)雜條件下多智能體系統(tǒng)編隊(duì)一致性控制
徐敏敏,金曉宏,雷 斌,陳 浩
(武漢科技大學(xué)機(jī)械自動(dòng)化學(xué)院,湖北 武漢,430081)
針對噪聲信號使多智能體系統(tǒng)難以形成一致的問題,綜合運(yùn)用代數(shù)圖理論、矩陣論等知識,結(jié)合一致性形成條件和現(xiàn)有的一致性協(xié)議,提出一種改進(jìn)的帶有噪聲的一致性控制算法。該算法能夠使系統(tǒng)狀態(tài)量與控制輸入量收斂到一個(gè)很小的范圍,從而大大弱化噪聲對系統(tǒng)的影響。將這種改進(jìn)算法應(yīng)用到多智能體編隊(duì)控制中并進(jìn)行仿真,仿真結(jié)果表明,采用改進(jìn)的一致性控制算法后,多智能體運(yùn)動(dòng)軌跡波動(dòng)小,軌跡曲線平滑,各運(yùn)動(dòng)參數(shù)趨于一致,具有良好的編隊(duì)一致性。
多智能體;編隊(duì)控制;一致性;噪聲干擾;運(yùn)動(dòng)軌跡;仿真分析
近年來,隨著計(jì)算機(jī)技術(shù)、通訊技術(shù)的發(fā)展,具有成本低、魯棒性好、可靠性高等特點(diǎn)的多智能體系統(tǒng)在網(wǎng)絡(luò)擁塞控制[1]、群集運(yùn)動(dòng)[2]等領(lǐng)域得到了廣泛的應(yīng)用。一致性控制是多智能體系統(tǒng)最基本的協(xié)調(diào)合作控制方式之一,但當(dāng)系統(tǒng)存在噪聲尤其是隨機(jī)噪聲時(shí),智能體間的狀態(tài)很難實(shí)現(xiàn)精確的一致。為此,對噪聲環(huán)境下多智能體行為一致性問題的研究備受關(guān)注。伍巧鳳等[3]采用對多智能體輸入和初始狀態(tài)誤差迭代修正的分布式學(xué)習(xí)控制算法,探討了系統(tǒng)存在噪聲情況下多智能體在有限時(shí)間內(nèi)的一致性問題;Lin等[4]采用無窮階魯棒的方法,通過對模型降階的簡化,探討了在延時(shí)干擾作用下的多智能體網(wǎng)絡(luò)的一致性問題;Liu等[5]通過引入時(shí)變一致性增益并構(gòu)造一個(gè)恰當(dāng)?shù)睦钛牌罩Z夫函數(shù),討論了在有固定拓?fù)浜驮肼晽l件下多智能體的均方一致性。
現(xiàn)有探討帶噪聲的多智能體一致性問題的研究工作中,主要集中在考慮多智能體一致性的收斂速度問題,而未見談及噪聲過大帶來的實(shí)際影響,也沒有涉及應(yīng)該選取何種控制算法來抑制噪聲以使得多智能體的運(yùn)動(dòng)在較短的時(shí)間內(nèi)實(shí)現(xiàn)各運(yùn)動(dòng)參數(shù)一致,為此,本文對此展開討論。
1.1 模型描述及一致性協(xié)議
設(shè)每個(gè)智能體的動(dòng)力學(xué)模型為:
(1)
式中:ξi∈和ζi∈分別表示第i個(gè)智能體的狀態(tài)量和控制輸入量。
如果式(1)所示多智能體系統(tǒng)能夠達(dá)到一致,那么對于任何的初始狀態(tài),都存在一個(gè)時(shí)間T0,使得每個(gè)智能體的狀態(tài)滿足:
(2)
式中:T0為多智能體運(yùn)動(dòng)的具體時(shí)刻點(diǎn)。
則多智能體系統(tǒng)在時(shí)刻T0可以達(dá)到一致。連續(xù)時(shí)間一致性協(xié)議為:
(3)
式中:aij(t)為交互圖在時(shí)刻t的鄰接矩陣中的元素其中,ei(i=1,2,…,n)為兩個(gè)節(jié)點(diǎn)連接組成的邊,E為信息交互圖的邊集,E={e1,e2,e3,…,en}。
式(3)的矩陣形式為:
(4)
式中:C為交互矩陣,C()=A()+D()=[cij],其中,A為鄰接矩陣,A()=[aij(t)];D為主對角矩陣,D()=[dij]。
式(3)的解為
ξ(t)=etCξ(0)
(5)
1.2 生成一致性的條件
多智能體系統(tǒng)的噪聲是指現(xiàn)實(shí)中多智能體之間在信息交流過程中存在著的干擾信息,包括通訊滯后、通信信道堵塞、信息傳遞的不對稱性和有限性以及多智能體編隊(duì)在通訊過程中的各種信息失真[7]。
在信息的接收端和發(fā)送端同時(shí)存在噪聲時(shí),其一致性算法為:
[ξj(t)+ρj(t)]}
(6)
式中:ρi(t)、ρj(t)分別為系統(tǒng)的接收端與發(fā)射端隨時(shí)間變化的任意噪聲的函數(shù),其矩陣形式為
(7)
式(7)的解為:
ξ(t)=et C[ξ(0)+ρ(0)]+In[ρ(t)-ρ(0)]
(8)
由式(8)可看出,前半部分et C[ξ(0)+ρ(0)]可以形成一致;后半部分In[ρ(t)-ρ(0)]中有不確定的函數(shù),可能會(huì)導(dǎo)致Δξ=|ξi(t)-ξj(t)|收斂不到一致,不能達(dá)到式(2)的狀態(tài)。而在現(xiàn)實(shí)情況中恰恰存在著很多種噪聲形式,如:ρ(t)=t2、ρ(t)=ln(t)、ρ(t)=1/t或者更為復(fù)雜的復(fù)合函數(shù),如果采用式(6)算法極有可能達(dá)不到預(yù)期的效果,因此,必須對控制算法進(jìn)行改進(jìn)。取正弦函數(shù)來表示多個(gè)智能體之間彼此進(jìn)行信息交流過程中發(fā)射端與接收端的噪聲并將其限制為有界量,則控制算法為:
(9)
(10)
其解為:
et C[ξ(0)+sinρ(0)]+1nsinρ(t)
(11)
則:
ξ(t)=et Cξ(0)+1nsinρ(t)
(12)
從式(12)的分析結(jié)果可以得出指數(shù)函數(shù)和正弦函數(shù)在一段時(shí)間后收斂于|Δρ|≤1,表明系統(tǒng)能夠達(dá)到幾乎一致的狀態(tài)。
編隊(duì)控制是指用特定的算法去控制一群智能體,使它們間的相對距離形成一致,并最終朝著相同的方向運(yùn)動(dòng),且相鄰的智能體不發(fā)生碰撞。它包括多智能體的角度對齊行為、聚集和分散行為[8]。
3.1 多智能體系統(tǒng)運(yùn)動(dòng)模型
多智能體系統(tǒng)運(yùn)動(dòng)模型如下:
(13)
式中:xi(t)和yi(t)為第i個(gè)智能體在時(shí)刻t的位置狀態(tài);θi(t)為第i個(gè)智能體的方向角;vi(t)為第i個(gè)智能體在時(shí)刻t的速度;ωi(t)為第i個(gè)智能體在時(shí)刻t的角速度。
3.2 角度對齊行為一致性算法
角度對齊行為一致性算法是指采用一致性算法來控制多智能體系統(tǒng)的方向角在某一個(gè)時(shí)刻達(dá)到一致并在此時(shí)刻后仍保持一致。
取[ξi(t),ζi(t)]=[θi(t),ωi(t)],則帶有噪聲的多智能體對齊行為算法為:
[θj(t)+ρj(t)]}
(14)
式(14)改進(jìn)后的對齊行為一致性算法為:
[θj(t)+sinρj(t)]}
(15)
3.3 聚集和分散行為一致性算法
聚集和分散行為一致性算法用于控制多智能體的相對距離形成一致。帶有噪聲的一階系統(tǒng)聚集和分散行為一致性算法如下:
(16)
(17)
式中:d為多智能體間行為達(dá)到一致后要保持的距離,為一大于零的設(shè)定常量;γ為一設(shè)定的很小正常量,0<γ?1。
式(16)、式(17)校正后的一致性算法分別為:
(18)
(19)
4.1 多智能體系統(tǒng)的初始條件設(shè)定
以5個(gè)智能體系統(tǒng)為例進(jìn)行分析。5個(gè)智能體的初始位置分別為:[xi,yi] =[(10, 5) (20, 6) (10, 0) (3, 5) (6, 5)];初始角度為:θi=[30, -40, 70, 120, 60];同時(shí)取需要保持的距離為d=3,則當(dāng)5個(gè)智能體的初始角速度都為零時(shí),多智能體間的信息交互固定拓?fù)浣Y(jié)構(gòu)如圖1所示。
圖1中,每個(gè)圓圈代表一個(gè)智能體,有向線段代表智能體之間的信息傳遞方向。與圖1所示的固定拓?fù)鋱D對應(yīng)的交互矩陣為:
在本例中,噪聲用如下函數(shù)表示:
(20)
(21)
4.2 編隊(duì)一致性控制仿真
采用圖1所示的信息交互圖進(jìn)行多智能體編隊(duì)控制仿真,取γ=0.1。圖2所示為采用改進(jìn)前算法控制的系統(tǒng)編隊(duì)軌跡仿真結(jié)果,圖3所示為采用式(14)、式(17)和式(18)相結(jié)合的改進(jìn)后算法控制的系統(tǒng)編隊(duì)軌跡仿真結(jié)果。對比圖2與圖3可以看出,在相同的初始條件下,圖2的曲線曲率較大,在一定時(shí)間后其方向角激烈變動(dòng),且不能達(dá)到預(yù)期的編隊(duì)距離,使得多智能體的編隊(duì)難以保持整齊的隊(duì)形,而圖3的軌跡曲線很好地避開了這些問題,系統(tǒng)運(yùn)行變得更平滑、穩(wěn)定,而且更合理,方向角在較小的范圍內(nèi)就基本上達(dá)到一致。
Fig.2Tracks of the system's formation controlled by the original algorithm
Fig.3 Tracks of the system’s formation controlled by the improved algorithm
為了更好地說明改進(jìn)算法的有效性,給出了算法改進(jìn)后智能體編隊(duì)的角度隨時(shí)間變化關(guān)系的仿真結(jié)果,如圖4所示。由圖4可見,在第5秒后,編隊(duì)中各智能體的方向角已經(jīng)幾乎相同,且變動(dòng)很小,表明系統(tǒng)得到了很好的校正,使編隊(duì)的一致性得到了加強(qiáng)。
圖5所示為在初始條件不變的情況下,采用改進(jìn)后算法得出的各智能體在x和y兩個(gè)方向上的速度變化量隨時(shí)間變化的曲線。從圖5可以看出,各智能體的速度沒有大的突變,曲線平滑,表明系統(tǒng)運(yùn)行平穩(wěn)。
Fig.4 Angles of multi-agent formation controlled by the improved algorithm
本文給出了帶噪聲的多智能體系統(tǒng)一致性改進(jìn)算法,包括角度對齊行為一致性算法及聚集和分散行為一致性算法,結(jié)果表明,任意有界噪聲函數(shù)都可以轉(zhuǎn)換成正弦函數(shù)。
通過選取正弦噪聲,借助數(shù)值計(jì)算對多智能體編隊(duì)進(jìn)行一致性控制。計(jì)算結(jié)果表明,經(jīng)過一小段路程的運(yùn)動(dòng)后,各智能體編隊(duì)的方向角開始出現(xiàn)一致,同時(shí)各智能體間的距離保持為設(shè)定值不變,驗(yàn)證了本文改進(jìn)算法的有效性。
[1] 高秀娥,趙鑫. 數(shù)據(jù)中心網(wǎng)絡(luò)擁塞控制算法的研究[J]. 信息技術(shù), 2015(4):87-89,93.
[2] 萬明. 多機(jī)器人群集運(yùn)動(dòng)控制與避障研究[D]. 南京:南京郵電大學(xué), 2011.
[3] 伍巧鳳, 劉山.初始誤差修正的多智能體一致性迭代學(xué)習(xí)控制[J].計(jì)算機(jī)工程與應(yīng)用, 2014, 50(1): 29-35.
[4] Lin Peng, Jia Yingmin, Li Lin. Distributed robust H∞consensus control in directed networks of agents with time-delay [J]. Systems & Control Letters, 2008, 57(8): 643-653.
[5] Liu Xueliang, Xu Bugong, Xie Lihua. Mean square consensus control for second order multi-agent systems under fixed topologies and measurement noises[J]. Advanced Material Research, 2011, 403-408: 4036-4043.
[6] 雷斌. 群體機(jī)器人系統(tǒng)合作控制問題研究[D]. 武漢:武漢理工大學(xué), 2009.
[7] Cheng Long, Hou Zengguang, Tan Min, et al. Necessary and sufficient conditions for consensus of double-integrator multi-agent systems with measurement noises[J]. IEEE Trans on Automatic Control, 2011, 56(8):1958-1963.
[8] 潘福臣, 陳雪波, 李琳. 群集系統(tǒng)的軟控制[J].控制與決策, 2008, 23(8): 953-956.
[責(zé)任編輯 鄭淑芳]
Consensus control for multi-agent system formation under complex conditions
XuMinmin,JinXiaohong,LeiBin,ChenHao
(College of Machinery and Automation, Wuhan University of Science and Technology, Wuhan 430081, China)
Aimed at at the problem that it is difficult for multi-agent system to form consensus under the impact of the noise signal,an improved consensus control algorithm with noise was proposed by applying algebraic graph and matrix theory comprehensively and considering the formation conditions and existing protocol of consenus. This algorithm enables the state variables and control inputs of the system to converge to a small range and thus can offset the influence of the noise on the system. Simulation of multi-agent formation control has been conducted by using this improred algorithm.Simulation data show that the motion trajectory of multi-agent has a small fluctuation, the track curves are smoother,the motion parameters are consistent and the system has good formation consensus.
multi-agent; formation control; consensus; noise interference; motion trajectory; simulation analysis
2015-05-18
國家自然科學(xué)基金資助項(xiàng)目(61305110).
徐敏敏(1989-),男,武漢科技大學(xué)碩士生.E-mail:13026335464@163.com
雷 斌(1979-),男,武漢科技大學(xué)副教授,博士.E-mail:leibin@wust.edu.cn
TF066
A
1674-3644(2015)05-0373-04