張 瀟 姜玉蓮
(長(zhǎng)春工業(yè)大學(xué)電氣與電子工程學(xué)院 長(zhǎng)春 130012)
近年來(lái),由于多智能體系統(tǒng)在各領(lǐng)域的廣泛應(yīng)用,使得人們對(duì)多智能體系統(tǒng)協(xié)調(diào)控制的研究興趣不斷增加[1-4]。其中,編隊(duì)控制作為該領(lǐng)域的重點(diǎn)研究方向之一,在飛行器、車輛、機(jī)器人等領(lǐng)域[5-7]得到了普遍的應(yīng)用。無(wú)人飛行器主要分為無(wú)人機(jī)和衛(wèi)星兩類,其中衛(wèi)星集群主要有成本低、測(cè)量精度高、容錯(cuò)率低等優(yōu)點(diǎn)[8]。
一般來(lái)說(shuō),編隊(duì)控制的主要問(wèn)題是設(shè)計(jì)合適的控制協(xié)議,達(dá)成編隊(duì)目標(biāo)使各個(gè)智能體之間能夠?qū)崿F(xiàn)和保持預(yù)定的幾何形狀,完成相應(yīng)的合作任務(wù),如監(jiān)視、勘探、搜索和救援、運(yùn)送大型物體和控制衛(wèi)星陣列等。編隊(duì)控制主要有基于行為(behavior-based)法[7]、虛擬結(jié)構(gòu)(virtual structure)法[9]和領(lǐng)導(dǎo)跟隨(leader-following)法[10]。基于行為法定義了無(wú)人飛行器運(yùn)動(dòng)的一系列基本行為,通過(guò)綜合行為實(shí)現(xiàn)運(yùn)動(dòng)控制。該方法有明確的隊(duì)形反饋,但是對(duì)群體的行為沒(méi)有明確意義,無(wú)法保證系統(tǒng)穩(wěn)定性。虛擬結(jié)構(gòu)法將整個(gè)編隊(duì)隊(duì)形看作剛體,每個(gè)無(wú)人飛行器與剛體上的點(diǎn)進(jìn)行對(duì)應(yīng)。該方法無(wú)法根據(jù)環(huán)境的變化改變隊(duì)形,系統(tǒng)靈活性不足。領(lǐng)導(dǎo)跟隨法通過(guò)引入“領(lǐng)導(dǎo)者”,從而讓無(wú)人飛行器系統(tǒng)收斂到一個(gè)特定的軌跡[11]。該方法數(shù)學(xué)分析簡(jiǎn)單,隊(duì)形易保持,系統(tǒng)的穩(wěn)定性有保證,因此被廣泛應(yīng)用。文獻(xiàn)[12]基于一致性算法實(shí)現(xiàn)了多航天器系統(tǒng)的編隊(duì)飛行。文獻(xiàn)[13]針對(duì)多無(wú)人飛行器系統(tǒng),提出了一致性理論和分散式模型預(yù)測(cè)控制。文獻(xiàn)[14]通過(guò)領(lǐng)導(dǎo)跟隨法和人工勢(shì)場(chǎng)法,解決了多自治水下機(jī)器人(autonomous underwater vehicle, AUV)編隊(duì)的避障問(wèn)題。文獻(xiàn)[15]基于雁群行為設(shè)計(jì)了一種控制協(xié)議,實(shí)現(xiàn)了多無(wú)人飛行器編隊(duì)重構(gòu)。
多無(wú)人飛行器系統(tǒng)中,信息交互是保證多無(wú)人飛行器編隊(duì)安全穩(wěn)定控制的前提,由于信息傳輸和處理速度有限,相鄰飛行器之間的交互不可避免地存在時(shí)滯,特別是通信時(shí)滯。當(dāng)通信時(shí)滯較大時(shí),很可能因?yàn)轱w行器無(wú)法完成正常的信息交流從而導(dǎo)致編隊(duì)失敗,因此研究具有通訊時(shí)滯的編隊(duì)控制具有十分重要的現(xiàn)實(shí)意義[16]。
本文主要研究了有向通信網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)下,帶有通信時(shí)滯的無(wú)人飛行器系統(tǒng)的編隊(duì)控制問(wèn)題。首先根據(jù)多智能體一致性理論提出多無(wú)人飛行器編隊(duì)控制協(xié)議,然后利用負(fù)矩陣分析法給出了控制參數(shù)矩陣的特征值的取值范圍,通過(guò)Lyapunov穩(wěn)定性理論得到系統(tǒng)穩(wěn)定的充分條件,并求解線性矩陣不等式(linear matrix inequality, LMI)求得通訊時(shí)滯的最大值,最后通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了本文方法的有效性。
有向圖G=(ν,ε,A)包含n個(gè)節(jié)點(diǎn),表示n個(gè)多無(wú)人飛行器,其中ν={v1,v2,…,vn}表示節(jié)點(diǎn)集合,ε?ν×ν為圖G邊的集合,圖G邊的權(quán)值矩陣矩陣為A=[aij],當(dāng)(vi,vj)∈ε,且個(gè)體j能直接獲得個(gè)體i的信息時(shí),aij=1;若(vi,vj)?ε,則aij=0。圖G的Laplacian矩陣為L(zhǎng)=(lij),其中,
在有向圖中,如果存在一個(gè)節(jié)點(diǎn)使得任意節(jié)點(diǎn)到這個(gè)節(jié)點(diǎn)都有有向路徑,則稱其為強(qiáng)連通圖。
記H=L+D,其中D是對(duì)角矩陣,當(dāng)領(lǐng)導(dǎo)者信息能被跟隨者接收時(shí),di=1;否則,di=0。下面的引理展現(xiàn)H的正穩(wěn)定性與圖G的連通性之間的關(guān)系。
引理1[1]當(dāng)且僅當(dāng)圖G包含生成樹(shù),矩陣H=L+D是正穩(wěn)定的。
本文研究的多無(wú)人飛行器系統(tǒng)由n個(gè)無(wú)人飛行器和一個(gè)領(lǐng)導(dǎo)者無(wú)人飛行器構(gòu)成,其中的無(wú)人飛行器是以文獻(xiàn)[17]中的衛(wèi)星集群系統(tǒng)作為本文的主要研究對(duì)象,第i個(gè)無(wú)人飛行器的動(dòng)力學(xué)線性方程為
(1)
其中,xi、yi、zi表示第i個(gè)無(wú)人飛行器的位置分量信息;uxi、uyi、uzi為控制輸入;ω0表示無(wú)人飛行器的角速率。
取ri=[xi,yi,zi]T表示第i個(gè)跟隨者無(wú)人飛行器的位置信息,ui=[uxi,uyi,uzi]T表示第i個(gè)跟隨者無(wú)人機(jī)的控制輸入,這時(shí),多無(wú)人飛行器系統(tǒng)模型式(1)可以改寫為
(2)
其中,
領(lǐng)導(dǎo)者的動(dòng)力學(xué)方程如下:
(3)
記(h0-hi)∈R3表示領(lǐng)導(dǎo)者與第i個(gè)跟隨者的期望距離,ri(t)-r0(t)是領(lǐng)導(dǎo)者與第i個(gè)無(wú)人飛行器的實(shí)際距離。為明確編隊(duì)控制目標(biāo),本文給出以下定義。
定義1當(dāng)領(lǐng)導(dǎo)者與跟隨者之間的距離誤差和速度誤差分別滿足:
考慮到各個(gè)無(wú)人飛行器之間存在通訊時(shí)滯,在有向通信網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)下,為實(shí)現(xiàn)多無(wú)人飛行器系統(tǒng)編隊(duì)飛行,本文提出如下控制協(xié)議:
ui(t)=-A1[ri(t)-hi-r0(t)+h0]
+di[F1(r0(t-τ)-h0-ri(t-τ)+hi)
(4)
其中,F(xiàn)1,F(xiàn)2∈R3×3是控制參數(shù)矩陣且F1>0,F(xiàn)2>0,τ是相鄰無(wú)人飛行器之間通訊時(shí)滯。
(5)
設(shè)復(fù)系數(shù)多項(xiàng)式R(z)=ζ0+ζ1z+…+ζnzn,令ζi∈C,i=0,1,…,n。將z=i?代入R(z)得R(i?)=α(?)+iβ(?)。其中,i為虛數(shù)單位,α(?),β(?)∈R,首先給出引理2、3和4,以方便得到本文結(jié)果。
引理2[18]對(duì)于一個(gè)復(fù)系數(shù)多項(xiàng)式R(z),當(dāng)且僅當(dāng)對(duì)應(yīng)的多項(xiàng)式α(?),β(?)是交錯(cuò)的并且α(0)β′(0)-α′(0)β(0)>0時(shí),R(z)是赫爾維茨(Hurwitz)穩(wěn)定。其中,α′(0)和β′(0)分別是α(0)和β(0)的導(dǎo)數(shù)。
引理3[19]若多項(xiàng)式α(?),β(?)滿足以下2個(gè)條件,則它們是交錯(cuò)的。
(1)α(?)=0,β(?)=0均只有互異的實(shí)根,即α1<α2<…<αk,β1<β2<…<βk′。
(2) 當(dāng)|k-k′|≤1且當(dāng)α(?)=0,β(?)=0的根滿足以下3種情況:
引理4[20]設(shè)向量x,y∈Rn,對(duì)于任意的正定矩陣N∈Rn×n,有2xTy≤xTN-1x+yTNy。
(6)
其中,H=L+D,F(xiàn)1,F2∈R3×3且F1>0,F(xiàn)2>0。
(7)
根據(jù)牛頓-萊布尼茨(Newton-Leibniz)公式有:
(8)
結(jié)合式(7)和(8),可得到:
其中,
(9)
則M是Hurwitz穩(wěn)定,其中θ是矩陣H的特征值。
證明取M的任意一個(gè)特征值z(mì),則M的特征多項(xiàng)式為:
det(zI2np-M)
其中,H的第i個(gè)特征值用θi表示,f1,f2為F1,F(xiàn)2的任意特征值。令z=i?,代入R(z)得:
R(i?)=-?2+f2[Re(θi)+iIm(θi)]i?
+f1[Re(θi)+iIm(θi)]
(10)
進(jìn)而得到α(?)=-?2-Im(θi)f2?+Re(θi)f1,β(?)=Re(θi)f2?+Im(θi)f1。
令α1<β1<α2得:
(11)
定理1對(duì)于系統(tǒng)式(11),當(dāng)控制參數(shù)矩陣的任意特征值f1和f2滿足
(12)
且存在對(duì)稱矩陣J>0,T>0,Q>0,同時(shí)J、T、Q∈R2n×2n滿足:
(13)
則多無(wú)人飛行器系統(tǒng)式(11)能夠?qū)崿F(xiàn)編隊(duì)飛行,其中,
η11=J[(In?A)-(H?B)]
+τ(In?A)TQ(In?A)
+[(In?A-(H?B)]TJ+T
η12=-τ(In?A)TQ(H?B)
η22=-T+τ(H?B)TQ(H?B)
η13=J(H?B)
證明構(gòu)造新的Lyapunov函數(shù)為
求導(dǎo)得:
(14)
-2γT(t)J(H?B)γ(t-τ)
=-2γT(t)J(H?B)γ(t)
+τγT(t)J(H?B)Q-1[(H?B)J]Tγ(t)
-2γT(t)J(H?B)γ(t)
+τγT(t)J(H?B)Q-1[(H?B)J]Tγ(t)
+τγT(t)(In?A)TQ(In?A)γ(t)
-τγT(t)(In?A)TQ(H?B)γ(t-τ)
-τγT(t-τ)(H?B)TQ(In?A)γ(t)
+τγT(t-τ)(H?B)TQ(H?B)γ(t-τ)
-γT(t-τ)Tγ(t-τ)
+τ(In?A)TQ(In?A)
+[(In?A-(H?B)]TJ+T
+τJ(H?B)Q-1(H?B)J
圖1 通信拓?fù)鋱D
(a) 通信時(shí)滯τ=0.1 s時(shí)的位置誤差
(b) 通信時(shí)滯τ=0.1 s時(shí)的速度誤差
圖3 通信時(shí)滯τ=0.1 s時(shí)系統(tǒng)的編隊(duì)運(yùn)動(dòng)軌跡
與跟隨者無(wú)人飛行器的編隊(duì)飛行軌跡,表明在t=0 s時(shí)刻,無(wú)人飛行器的位置隨機(jī)分布,經(jīng)過(guò)一段時(shí)間后4個(gè)跟隨者無(wú)人飛行器追隨領(lǐng)導(dǎo)者實(shí)現(xiàn)編隊(duì),并保持一個(gè)五邊形的隊(duì)形飛行,更為直觀地驗(yàn)證系統(tǒng)在編隊(duì)控制協(xié)議式(4)的作用下,能夠漸近實(shí)現(xiàn)穩(wěn)定性。
為進(jìn)一步驗(yàn)證控制參數(shù)F1、F2和通信時(shí)滯對(duì)系統(tǒng)編隊(duì)控制的重要性,本文另提供2部分仿真結(jié)果。
(2)當(dāng)控制參數(shù)滿足條件式(9),設(shè)定通信時(shí)滯τ>τ0,即超出通信時(shí)滯上界τ0時(shí),經(jīng)過(guò)仿真計(jì)算,線性矩陣不等式(13)無(wú)可行解。
(a) 位置誤差
(b) 速度誤差
本文解決了有向通信拓?fù)浣Y(jié)構(gòu)下帶有通信時(shí)滯的二階多無(wú)人飛行器系統(tǒng)的編隊(duì)控制問(wèn)題,提出了新的編隊(duì)控制律?;趫D論、矩陣論和Lyapunov穩(wěn)定性理論,利用負(fù)矩陣分析法將控制參數(shù)矩陣的特征值限定在一定范圍內(nèi)并給出了多無(wú)人飛行器系統(tǒng)能夠穩(wěn)定編隊(duì)飛行的充分條件,且通過(guò)求解線性矩陣不等式,得到系統(tǒng)漸近實(shí)現(xiàn)編隊(duì)時(shí)的最大通訊時(shí)滯允許上界。最后,通過(guò)仿真驗(yàn)證了所得理論結(jié)果的正確性和有效性,并證明了控制參數(shù)矩陣和通信時(shí)滯上界對(duì)多無(wú)人飛行器系統(tǒng)實(shí)現(xiàn)編隊(duì)目標(biāo)的重要性。