魏志強(qiáng),翁哲鳴,化永朝,董希旺,任章
1.復(fù)旦大學(xué) 工程與應(yīng)用技術(shù)研究院,上海 200433
2.航天三院 創(chuàng)新研究院,北京 100074
3.北京航空航天大學(xué) 人工智能研究院,北京 100191
4.北京航空航天大學(xué) 自動(dòng)化科學(xué)與電氣工程學(xué)院,北京 100191
無(wú)人集群協(xié)同控制近年來(lái)受到國(guó)內(nèi)外的廣泛關(guān)注與重視,并在航空航天領(lǐng)域展現(xiàn)出強(qiáng)大的應(yīng)用潛力,例如無(wú)人機(jī)蜂群攻擊、多導(dǎo)彈協(xié)同突防、多衛(wèi)星協(xié)同探測(cè)等。目前,集群系統(tǒng)協(xié)同控制領(lǐng)域已經(jīng)產(chǎn)生了眾多緊密相關(guān)而又各有側(cè)重的研究分支,包括一致性控制(Consensus control)、編隊(duì)控制(Formation control)、合圍控制(Containment control)等。一致性控制是集群系統(tǒng)協(xié)同控制的基礎(chǔ)性問(wèn)題,其目標(biāo)是使得集群中所有智能體的狀態(tài)或輸出能夠?qū)崿F(xiàn)一致[1]。編隊(duì)控制是指通過(guò)設(shè)計(jì)合適的控制協(xié)議(控制器),使得集群中所有智能體的狀態(tài)或輸出,在對(duì)應(yīng)空間內(nèi)形成并保持特定的相對(duì)陣位關(guān)系[2]。在合圍控制中,集群中的智能體被分為領(lǐng)導(dǎo)者和跟隨者兩類,通過(guò)設(shè)計(jì)分布式控制器,使得所有跟隨者的狀態(tài)或者輸出,能夠進(jìn)入到多領(lǐng)導(dǎo)者狀態(tài)或輸出所形成的凸包內(nèi)部[3]。
在傳統(tǒng)的合圍控制的研究中,通常假設(shè)多領(lǐng)導(dǎo)者之間不存在交互與協(xié)同。然而,在實(shí)際應(yīng)用場(chǎng)景中,領(lǐng)導(dǎo)者往往需要協(xié)同來(lái)保持特定的時(shí)變編隊(duì)隊(duì)形,且能夠跟蹤參考航跡或者特定目標(biāo)進(jìn)行運(yùn)動(dòng),以更好地滿足任務(wù)需求。例如,高低搭配的多導(dǎo)彈系統(tǒng)協(xié)同攻擊時(shí),要求高配置的導(dǎo)彈通過(guò)協(xié)同形成期望的相對(duì)陣位關(guān)系,同時(shí)低配置的導(dǎo)彈需要能夠在高配置的導(dǎo)彈的導(dǎo)引下準(zhǔn)確落入攻擊區(qū)域。該場(chǎng)景下就出現(xiàn)了更為復(fù)雜的編隊(duì)-合圍跟蹤(Formation-containment tracking)控制問(wèn)題,集群系統(tǒng)存在層內(nèi)的不同協(xié)同控制目標(biāo)以及層間的協(xié)同耦合,一方面要求多領(lǐng)導(dǎo)者形成特定的編隊(duì)并跟蹤參考軌跡或目標(biāo)運(yùn)動(dòng),另一方面要求跟隨者能夠進(jìn)入領(lǐng)導(dǎo)者所形成編隊(duì)的內(nèi)部。針對(duì)線性集群系統(tǒng),文獻(xiàn)[4]提出了編隊(duì)-合圍跟蹤控制的數(shù)學(xué)定義與控制框架,并給出了分層耦合情況下的分布式控制器多步設(shè)計(jì)方法。
現(xiàn)有的協(xié)同控制方法一般假設(shè)集群系統(tǒng)是同構(gòu)的,即要求集群中的所有個(gè)體具有相同的動(dòng)力學(xué)與運(yùn)動(dòng)學(xué)模型[5]。然而,同構(gòu)集群作為群體協(xié)同的基本形態(tài),存在智能涌現(xiàn)模式單一及協(xié)同能力薄弱等局限性。異構(gòu)集群跨域協(xié)同可以充分發(fā)揮無(wú)人機(jī)、無(wú)人車、無(wú)人艇等不同無(wú)人系統(tǒng)的優(yōu)勢(shì),以結(jié)構(gòu)耦合和功能互補(bǔ)的方式實(shí)現(xiàn)集群智能的倍增,例如,多無(wú)人機(jī)-無(wú)人車空地協(xié)同偵察[6]、多無(wú)人機(jī)-無(wú)人艇空海協(xié)同巡邏[7]等。目前異構(gòu)集群系統(tǒng)編隊(duì)控制及合圍控制的研究尚處于起步階段,相關(guān)的研究成果較少。對(duì)于編隊(duì)問(wèn)題,文獻(xiàn)[8-12]利用輸出調(diào)節(jié)策略,提出了基于分布式觀測(cè)器的分環(huán)編隊(duì)控制策略,并給出了異構(gòu)模型約束下時(shí)變編隊(duì)跟蹤的可行性條件及穩(wěn)定性判據(jù)。文獻(xiàn)[13-16]中假設(shè)存在多個(gè)同構(gòu)領(lǐng)導(dǎo)者,提出了能夠驅(qū)動(dòng)異構(gòu)跟隨者輸出收斂到多領(lǐng)導(dǎo)者凸包內(nèi)部的分布式合圍控制方法。
進(jìn)一步地,文獻(xiàn)[17]研究了高階異構(gòu)集群系統(tǒng)的編隊(duì)-合圍跟蹤控制問(wèn)題,基于輸出調(diào)節(jié)策略構(gòu)造了間歇通信條件下的編隊(duì)-合圍跟蹤協(xié)議。文獻(xiàn)[18]考慮了異構(gòu)集群系統(tǒng)在離散通信條件下的輸出編隊(duì)-合圍跟蹤問(wèn)題,文獻(xiàn)[19]則基于自適應(yīng)控制理論設(shè)計(jì)了完全分布式的編隊(duì)-合圍跟蹤控制器。文獻(xiàn)[17-19]中皆假設(shè)跟蹤-領(lǐng)導(dǎo)者為自治系統(tǒng),這會(huì)嚴(yán)格限制集群整體運(yùn)動(dòng)參考軌跡的類型,且不能表示具有未知機(jī)動(dòng)的非合作目標(biāo),存在一定的應(yīng)用局限性。此外,文獻(xiàn)[17-19]中期望的領(lǐng)導(dǎo)者輸出的凸組合是由集群系統(tǒng)的作用拓?fù)錄Q定的,故當(dāng)存在切換拓?fù)鋾r(shí),領(lǐng)導(dǎo)者的凸組合也會(huì)發(fā)生變化,將使得跟隨者的瞬時(shí)輸出很有可能會(huì)超出多領(lǐng)導(dǎo)者所形成的凸包,這意味著文獻(xiàn)[17-19]中的方法無(wú)法直接應(yīng)用于切換拓?fù)涞膱?chǎng)景。
針對(duì)上述技術(shù)挑戰(zhàn),研究了同時(shí)存在切換通信拓?fù)渑c領(lǐng)導(dǎo)者未知輸入的高階異構(gòu)無(wú)人集群的編隊(duì)-合圍跟蹤控制問(wèn)題。將各智能體分為“跟蹤-領(lǐng)導(dǎo)者”“編隊(duì)-領(lǐng)導(dǎo)者”“跟隨者”3 類,跟蹤-領(lǐng)導(dǎo)者用以生成整個(gè)集群的參考軌跡,控制目標(biāo)是使得編隊(duì)-領(lǐng)導(dǎo)者的輸出形成期望的時(shí)變編隊(duì)跟蹤,同時(shí)跟隨者的輸出能夠收斂到編隊(duì)-領(lǐng)導(dǎo)者輸出所形成的凸包內(nèi)部。與現(xiàn)有研究相比,主要?jiǎng)?chuàng)新點(diǎn)如下:①采用具有時(shí)變輸入的跟蹤-領(lǐng)導(dǎo)者來(lái)生成集群系統(tǒng)的整體參考軌跡或表示待跟蹤的非合作目標(biāo),所提出的控制器對(duì)于具有未知輸入的集群參考軌跡仍能有效跟蹤,克服了現(xiàn)有編隊(duì)-合圍控制方法無(wú)法有效控制集群整體宏觀運(yùn)動(dòng)的缺陷;②基于自適應(yīng)控制與滑模變結(jié)構(gòu)控制理論,對(duì)編隊(duì)-領(lǐng)導(dǎo)者與跟隨者分別設(shè)計(jì)了基于邊的分布式觀測(cè)器,能夠同時(shí)應(yīng)對(duì)切換拓?fù)渑c領(lǐng)導(dǎo)者時(shí)變輸入的影響;③利用多編隊(duì)-領(lǐng)導(dǎo)者狀態(tài)的分布式估計(jì)值,提出了一種預(yù)先定義的合圍控制策略,使得跟隨者的收斂目標(biāo)值不依賴于通信拓?fù)?,從而擺脫了已有合圍控制方法不適應(yīng)切換拓?fù)涞木窒蕖?/p>
異構(gòu)無(wú)人集群的通信拓?fù)淇捎脠DG={V,E,W}表 示,V={v1,v2,…,vN}表示節(jié)點(diǎn)集合,E ?{(vi,vj):vi,vj∈V;i≠j} 表示邊集合,W=[wij]∈RN×N表示具有非負(fù)權(quán)重wij的鄰接矩陣。令εij=(vi,vj)表示圖G中從節(jié)點(diǎn)vi到節(jié)點(diǎn)vj的一條邊。權(quán)重wij>0 當(dāng)且僅當(dāng)εji∈E,否 則wij=0。用Ni={vj∈V:(vj,vi)∈E }表示節(jié) 點(diǎn)vi的鄰居集合。將圖G的入度矩陣定義為D=,其中,表示節(jié) 點(diǎn)vi的入度。定義圖G的拉普拉斯矩陣為L(zhǎng)=D-W。
利用一組有序邊(v1,v2),(v2,v3),...,(vk-1,vk)表示從節(jié)點(diǎn)v1到節(jié)點(diǎn)vk的有向路徑。如果對(duì)于任意εij∈E 都有εji∈E,且wij=wji,則圖G被稱為無(wú)向圖,否則稱之為有向圖。對(duì)于無(wú)向圖,如果任意2 個(gè)不同的節(jié)點(diǎn)之間都存在至少一條路徑,則稱無(wú)向圖是連通的。對(duì)于有向圖,如果圖G中至少存在一個(gè)根節(jié)點(diǎn)到其他所有節(jié)點(diǎn)都有有向路徑,則稱圖G具有一個(gè)生成樹(shù)。
引理1[1]對(duì)于具有N個(gè)節(jié)點(diǎn)的無(wú)向圖G,可得如下性質(zhì):
1)L具有至少一個(gè)0 特征值,1N是0 特征值對(duì)應(yīng)的一個(gè)特征向量,滿足L1N=0。
2)如果G是連通的,則0 是L的單一特征值,剩余N-1 個(gè)特征值均是正的。
考慮由N+M+1 個(gè)智能體所構(gòu)成的高階異構(gòu)無(wú)人集群系統(tǒng),其中:i=0 表示跟蹤-領(lǐng)導(dǎo)者(Tracking-Leader);i=1,2,…,N表示編隊(duì)-領(lǐng)導(dǎo)者(Formation-Leader);i=N+1,N+2,…,N+M表示跟隨者(Follower)。
定義1 根據(jù)協(xié)同任務(wù)需求,將集群系統(tǒng)中的智能體分為跟蹤-領(lǐng)導(dǎo)者、編隊(duì)-領(lǐng)導(dǎo)者和跟隨者。跟蹤-領(lǐng)導(dǎo)者用以生成集群系統(tǒng)整體運(yùn)動(dòng)的參考軌跡;編隊(duì)-領(lǐng)導(dǎo)者需要在形成期望的時(shí)變編隊(duì)構(gòu)型的同時(shí),實(shí)現(xiàn)對(duì)跟蹤-領(lǐng)導(dǎo)者運(yùn)動(dòng)軌跡的跟蹤;跟隨者的輸出需要收斂到編隊(duì)-領(lǐng)導(dǎo)者輸出所形成的凸包內(nèi)。跟蹤-領(lǐng)導(dǎo)者沒(méi)有鄰居,編隊(duì)-領(lǐng)導(dǎo)者的鄰居只包括領(lǐng)導(dǎo)者,跟隨者的鄰居為編隊(duì)-領(lǐng)導(dǎo)者或其他的跟隨者。
為進(jìn)一步解釋上述定義,圖1 給出一個(gè)多無(wú)人機(jī)-無(wú)人車(Unmanned Aerial Vehicle Unmanned Ground Vehicle,UAV-UGV)系統(tǒng)以編隊(duì)-合圍跟蹤的方式協(xié)同穿越危險(xiǎn)區(qū)域的示意圖。圖中跟蹤-領(lǐng)導(dǎo)者表示從出發(fā)地到目的地預(yù)先規(guī)劃的軌跡,編隊(duì)-領(lǐng)導(dǎo)者表示配備有探測(cè)裝置的無(wú)人機(jī),而跟隨者表示沒(méi)有安裝探測(cè)傳感器的無(wú)人車。通過(guò)協(xié)同控制使得多無(wú)人機(jī)形成期望的時(shí)變編隊(duì)隊(duì)形且能夠跟蹤參考航跡,同時(shí)基于鄰居信息交互,讓沒(méi)有探測(cè)傳感器的跟隨者無(wú)人車收斂到多無(wú)人機(jī)所形成編隊(duì)的內(nèi)部。這樣就可以保證無(wú)人車在移動(dòng)過(guò)程中一直處在無(wú)人機(jī)形成的安全區(qū)域內(nèi),以相對(duì)較小的代價(jià)使整個(gè)多機(jī)器人系統(tǒng)穿越危險(xiǎn)區(qū)域,安全地運(yùn)動(dòng)到目的地。
圖1 多無(wú)人機(jī)-無(wú)人車系統(tǒng)協(xié)同穿越危險(xiǎn)區(qū)域示意圖Fig.1 Example for cooperative crossing dangerous area of multi UAV-UGV swarm systems
需要指出的是,定義1 中的跟蹤-領(lǐng)導(dǎo)者不僅可以表示預(yù)先設(shè)計(jì)的虛擬參考軌跡,還可以代表某一具有全局定位能力的實(shí)際個(gè)體,用以控制整個(gè)集群系統(tǒng)的宏觀運(yùn)動(dòng)。此外,跟蹤-領(lǐng)導(dǎo)者還可以表示非合作目標(biāo),例如,多彈協(xié)同攔截場(chǎng)景中的來(lái)襲目標(biāo)。
考慮如下的跟蹤-領(lǐng)導(dǎo)者的模型:
式中:v0(t)∈Rq、r0(t)∈Rl和y0(t)∈Rp分別表示跟蹤-領(lǐng)導(dǎo)者的狀態(tài)、控制輸入與輸出;S、E與F為常值矩陣;要求v0(t)是有界的。將編隊(duì)-領(lǐng)導(dǎo)者和跟隨者的模型表示如下:
式中:xi(t)∈Rni、ui(t)∈Rmi和yi(t)∈Rp分別表示智能體(ii=1,2,…,N+M)的狀態(tài)、控制輸入與輸出;Ai、Bi與Ci為常值矩陣。由式(1)和式(2)可知,所考慮的異構(gòu)不僅存在于領(lǐng)導(dǎo)者和跟隨者之間,也包括編隊(duì)-領(lǐng)導(dǎo)者內(nèi)部以及跟隨者內(nèi)部。
為了涵蓋跟蹤-領(lǐng)導(dǎo)者為非合作目標(biāo)的場(chǎng)景,假設(shè)其控制輸入r0(t)對(duì)于所有編隊(duì)-領(lǐng)導(dǎo)者和跟隨者都是未知的。例如,在多飛行器協(xié)同攔截的場(chǎng)景中,跟蹤-領(lǐng)導(dǎo)者代表攔截目標(biāo),r0(t)則表示攔截目標(biāo)的未知機(jī)動(dòng)。要求r0(t)滿足以下的有界條件。
假設(shè)1 跟蹤-領(lǐng)導(dǎo)者的未知輸入r0(t)是有界的,存在正常數(shù)η使得
對(duì)于編隊(duì)-領(lǐng)導(dǎo)者(i=1,2,…,N),利用時(shí)變向量刻畫其期望的 時(shí)變輸 出編隊(duì),其 中,hyi(t)(i=1,2,…,N)是分段連續(xù)可導(dǎo)的。
定義2 對(duì)于任意給定的有界初始狀態(tài),如果下式成立:
則稱編隊(duì)-領(lǐng)導(dǎo)者實(shí)現(xiàn)了期望的時(shí)變輸出編隊(duì)跟蹤。
定義3 對(duì)于任意跟隨者k,存在非負(fù)常數(shù)ρk,j(k∈{N+1,N+2,…,N+M},j=1,2,…,N)滿足,使得
成立,則稱異構(gòu)集群系統(tǒng)式(2)實(shí)現(xiàn)了輸出合圍。
定義4 如果對(duì)于任意的編隊(duì)-領(lǐng)導(dǎo)者i(i∈{1,2,…,N})以及跟隨者k(k∈{N+1,N+2,…,N+M}),有式(3)和式(4)同時(shí)成立,則稱高階異構(gòu)集群系統(tǒng)式(1)與式(2)實(shí)現(xiàn)了期望的輸出編隊(duì)-合圍跟蹤。
研究了集群系統(tǒng)的編隊(duì)-合圍跟蹤問(wèn)題,引入跟蹤-領(lǐng)導(dǎo)者來(lái)配置集群系統(tǒng)的整體運(yùn)動(dòng)。從定義2~定義4 可知,時(shí)變編隊(duì)跟蹤問(wèn)題、合圍問(wèn)題以及一致性跟蹤問(wèn)題均可以統(tǒng)一到編隊(duì)-合圍跟蹤問(wèn)題的一般框架內(nèi)。在定義3 中,通過(guò)非負(fù)權(quán)重ρk,j來(lái)刻畫多編隊(duì)-領(lǐng)導(dǎo)者輸出的凸組合,通過(guò)不同取值組合的ρk,j,可以將編隊(duì)-領(lǐng)導(dǎo)者所形成編隊(duì)內(nèi)部的任意一點(diǎn)作為跟隨者k的期望跟蹤目標(biāo)。值得指出的是,ρk,j的取值與通信拓?fù)錈o(wú)關(guān),可以根據(jù)實(shí)際任務(wù)需求進(jìn)行預(yù)先設(shè)計(jì),更加具有實(shí)際意義。
考慮集群系統(tǒng)存在切換拓?fù)涞膱?chǎng)景,將所有可能的 作用拓 撲的下 標(biāo)集合記為Z={1,2,…,z}。令[tl,tl+1)(l=0,1,2,…)表示一個(gè)無(wú)限序列的一致有界非重疊時(shí)間區(qū)間,其中,tl+1-tl≥τd>0。作用拓 撲在時(shí) 刻tl+1發(fā)生切換。令σ(t):[0,∞)→{1,2,…,z}表示切換信號(hào),其取值為當(dāng)前圖的序號(hào)。在時(shí)刻t,作用圖和對(duì)應(yīng)的拉普拉斯矩陣分別記為為保證各編隊(duì)-領(lǐng)導(dǎo)者都能在合圍控制中發(fā)揮作用,要求各跟隨者鄰居集合的并集包含所有的編隊(duì)-領(lǐng)導(dǎo)者。
對(duì)于編隊(duì)-領(lǐng)導(dǎo)者(ii=1,2,…,N),期望的時(shí)變輸出編隊(duì)向量hyi(t)由以下的局部外系統(tǒng)產(chǎn)生:
假設(shè)3 如下的調(diào)節(jié)器方程:
有解(Xi,Ui)(i=1,2,…,N)。
假設(shè)4 如下的局部調(diào)節(jié)器方程:
有解(Xhi,Uhi)(i=1,2,…,N)。
假設(shè)5 如下的調(diào)節(jié)器方程:
有解(Xi,j,Ui,j)(i=N+1,N+2,…,N+M;j=1,2,…,N)。
考慮如下的編隊(duì)-合圍跟蹤控制器:對(duì)于編隊(duì)-領(lǐng)導(dǎo)者(ii=1,2,…,N),有
在編隊(duì)-領(lǐng)導(dǎo)者(ii=1,2,…,N)的控制器式(9)中表示對(duì)v0的分布式估計(jì)值,表示自適 應(yīng)控制增益;τi表示時(shí)變編隊(duì)跟蹤補(bǔ)償輸入;表 示待設(shè)計(jì)的正常數(shù);K1i、Khi、K2i、?i和Γi表示待確定的增益矩陣。在跟隨 者i(i=N+1,N+2,…,N+M)的控制器式(10)中,有:
異構(gòu)集群系統(tǒng)編隊(duì)-合圍跟蹤控制設(shè)計(jì)框圖如圖2 所示。下面給出確定式(9)和式(10)中控制參數(shù)的算法。
圖2 異構(gòu)集群系統(tǒng)編隊(duì)-合圍跟蹤控制設(shè)計(jì)框圖Fig.2 Design diagram for formation-containment tracking control of heterogeneous swarm systems
算法1 對(duì)于編隊(duì)-領(lǐng)導(dǎo)者和跟隨者,采用以下步驟設(shè)計(jì)編隊(duì)-合圍跟蹤控制器式(9)和式(10)。
步驟1 分別選取常值矩陣(Xi,Ui)(i=1,2,…,N),(Xhi,Uhi)(i=1,2,…,N),(Xi,j,Ui,j)(i=N+1,N+2,…,N+M,j=1,2,…,N)使得假設(shè)3~假設(shè)5 中的調(diào)節(jié)器方程成立。
步驟2 設(shè)計(jì)編隊(duì)-領(lǐng)導(dǎo)者(ii=1,2,…,N)的控制器式(9)。對(duì)于由局部外系統(tǒng)式(5)所產(chǎn)生的期望時(shí)變輸出編隊(duì)向量hyi(t),檢驗(yàn)是否存在補(bǔ)償輸入τi,使得編隊(duì)-合圍跟蹤可行性條件成立:
如果式(12)對(duì)于各個(gè)編隊(duì)-領(lǐng)導(dǎo)者都成立,則算法繼續(xù);否則,期望輸出編隊(duì)hy(t)在所設(shè)計(jì)的控制器下是不可行的,算法停止。自適應(yīng)參數(shù)的更新律為
步驟3 設(shè)計(jì)跟隨者i(i=N+1,N+2,…,N+M)的控制器式(10)。自適應(yīng)參數(shù)(j∈{1,2,…,N})和的更新律如下:
編隊(duì)可行性條件式(12)揭示了可行的時(shí)變編隊(duì)與編隊(duì)-領(lǐng)導(dǎo)者異構(gòu)動(dòng)力學(xué)特性的匹配關(guān)系,利用局部外系統(tǒng)式(5)中的ri(t)和控制器式(9)中的時(shí)變編隊(duì)補(bǔ)償輸入τi(t)來(lái)擴(kuò)展可行的編隊(duì)集合,使得異構(gòu)集群在所提出的控制器下能夠形成更多類型的時(shí)變編隊(duì)。為了給出更直觀的可行性條件式(12)的檢驗(yàn)方法,根據(jù)文獻(xiàn)[2,8]中的非奇異變換,不失一般性地假設(shè)矩陣Bi是列滿秩的,則存在非奇異矩陣,其,使得和成立。在式(12)兩邊同時(shí)左乘變換矩陣Γi,則編隊(duì)-合圍跟蹤可行性條件式(12)可以分解為
對(duì)于給定的異構(gòu)集群系統(tǒng)模型和期望的時(shí)變編隊(duì)向量,可以事先明確,因此,易于檢驗(yàn)條件是 否滿足,同時(shí)可以直接設(shè)計(jì)補(bǔ)償輸入τi(t)=利用上述非奇異分解方法,能夠更直觀地檢驗(yàn)編隊(duì)-合圍跟蹤可行性條件式(12),并且給出補(bǔ)償輸入τi(t)的計(jì)算表達(dá)式。此外,如式(13)和式(14)所示,自適應(yīng)增益通過(guò)基于邊的鄰居誤差進(jìn)行動(dòng)態(tài)更新,能夠分布式地調(diào)整,避免了對(duì)切換拓?fù)涓鱾€(gè)拉普拉斯矩陣的特征值、領(lǐng)導(dǎo)者系統(tǒng)矩陣的特征值等全局信息的依賴。
以下定理給出了高階異構(gòu)無(wú)人集群系統(tǒng)式(1)和式(2)實(shí)現(xiàn)編隊(duì)-合圍跟蹤的充分條件。
定理1 假設(shè)1~假設(shè)5 成立。如果由式(5)所生成的期望編隊(duì)向量hy(t)滿足可行性條件式(12),則存在切換拓?fù)涞母唠A異構(gòu)集群系統(tǒng)式(1)和式(2)能夠在由算法1 所確定的控制器式(9)和式(10)的作用下,實(shí)現(xiàn)期望的輸出編隊(duì)-合圍跟蹤。
證明 以下將首先證明編隊(duì)-領(lǐng)導(dǎo)者能夠?qū)崿F(xiàn)期望的輸出時(shí)變編隊(duì)跟蹤,進(jìn)而證明跟隨者的輸出能夠收斂到編隊(duì)-領(lǐng)導(dǎo)者輸出所形成的凸包。對(duì)于編隊(duì)-領(lǐng)導(dǎo)者(ii∈{1,2,…,N}),令表示對(duì)跟蹤-領(lǐng)導(dǎo)者狀態(tài)的分布式估計(jì)誤差,則由式(1)和式(9)可得:
考慮如下的共同Lyapunov 函數(shù):
沿軌跡式(17)對(duì)V1求導(dǎo)可得:
將式(20)代入式(19)則有:
對(duì)于編隊(duì)-領(lǐng)導(dǎo)者(ii=1,2,…,N),將控制器式(9)代入系統(tǒng)方程式(2)。令?i=xi-Xhi hi-Xiv0,則有:
將Khi=Uhi-K1i Xhi、K2i=Ui-K1i Xi與Bi?i-Xi E=0 代入式(31),可得:
注釋1 雖然文獻(xiàn)[17-19]考慮了編隊(duì)-合圍跟蹤問(wèn)題,但都要求跟蹤-領(lǐng)導(dǎo)者為自治系統(tǒng),不具有控制輸入,這會(huì)嚴(yán)重限制跟蹤領(lǐng)導(dǎo)者所產(chǎn)生參考信號(hào)的類型。引入了具有時(shí)變未知輸入的跟蹤-領(lǐng)導(dǎo)者見(jiàn)式(1)來(lái)生成集群系統(tǒng)的整體參考軌跡,進(jìn)一步研究了高階異構(gòu)集群系統(tǒng)的編隊(duì)-合圍跟蹤控制問(wèn)題,所提出的控制器對(duì)于具有未知輸入的集群參考軌跡仍能有效跟蹤。從定理1 的證明過(guò)程可知,編隊(duì)-領(lǐng)導(dǎo)者的狀態(tài)與控制輸入對(duì)跟隨者的合圍誤差都存在影響,如式(37)和式(55)所示,對(duì)跟隨者設(shè)計(jì)的合圍控制器需要能夠有效補(bǔ)償編隊(duì)-領(lǐng)導(dǎo)者的時(shí)變編隊(duì)跟蹤運(yùn)動(dòng)所帶來(lái)的耦合作用,因此,所考慮的編隊(duì)-合圍跟蹤控制問(wèn)題比孤立的編隊(duì)跟蹤問(wèn)題和合圍問(wèn)題更具有挑戰(zhàn)性。
注釋2 與文獻(xiàn)[23]中基于節(jié)點(diǎn)的方法不同,本文將自適應(yīng)控制增益與非線性補(bǔ)償函數(shù)分配到了作用拓?fù)渲械母鳁l邊。采用基于邊的自適應(yīng)分布式觀測(cè)器,能夠構(gòu)造共同Lyapunov 函數(shù)V1與V3,進(jìn)而可以證明閉環(huán)系統(tǒng)在切換拓?fù)湎碌姆€(wěn)定性。因此,本文提出的基于邊的自適應(yīng)編隊(duì)控制方法能夠同時(shí)應(yīng)對(duì)切換拓?fù)渑c領(lǐng)導(dǎo)者時(shí)變輸入的影響。
注釋3 文獻(xiàn)[24-29]考慮了具有分層架構(gòu)的兩層式編隊(duì)-合圍控制問(wèn)題,其中都假設(shè)通信拓?fù)涫枪潭ǖ?。在現(xiàn)有的合圍控制與編隊(duì)-合圍控制的研究文獻(xiàn)[13-19,24-29]中,期望的領(lǐng)導(dǎo)者狀態(tài)/輸出的凸組合是由集群系統(tǒng)的作用拓?fù)錄Q定的,故當(dāng)存在切換拓?fù)鋾r(shí),領(lǐng)導(dǎo)者的凸組合也會(huì)發(fā)生變化。在這種情況下,跟隨者的瞬時(shí)狀態(tài)/輸出很有可能會(huì)超出多領(lǐng)導(dǎo)者所形成的凸包,這意味著文獻(xiàn)[13-19,24-29]中的現(xiàn)有合圍控制方法難以直接應(yīng)用于切換拓?fù)涞膱?chǎng)景。基于對(duì)多領(lǐng)導(dǎo)者狀態(tài)的分布式估計(jì)值,提出了一種預(yù)先定義的合圍控制策略,采用給定的非負(fù)權(quán)重ρi,j(j∈FL)來(lái)刻畫多領(lǐng)導(dǎo)者期望的凸組合,使得跟隨者的收斂目標(biāo)值不依賴于作用拓?fù)?,從而?shí)現(xiàn)了切換拓?fù)錀l件下高階異構(gòu)集群系統(tǒng)的編隊(duì)-合圍跟蹤控制。假設(shè)編隊(duì)-領(lǐng)導(dǎo)者之間以及跟隨者之間的拓?fù)涫菬o(wú)向的,有向切換拓?fù)湎碌木庩?duì)合圍跟蹤控制問(wèn)題更具有挑戰(zhàn)性,是值得未來(lái)重點(diǎn)研究的方向之一。
將編隊(duì)-合圍跟蹤控制方法應(yīng)用到多無(wú)人機(jī)-無(wú)人車異構(gòu)系統(tǒng)的空地協(xié)同巡邏應(yīng)用場(chǎng)景,其中,跟蹤-領(lǐng)導(dǎo)者i=0 代表異構(gòu)多機(jī)器人系統(tǒng)的整體參考軌跡,編隊(duì)-領(lǐng)導(dǎo)者i=1,2,3,4 表示四旋翼無(wú)人機(jī),跟隨者i=5,6,…,10 表示麥克納姆輪無(wú)人車。多無(wú)人機(jī)在空中形成期望的編隊(duì)跟蹤,同時(shí)多無(wú)人車能夠收斂到多無(wú)人機(jī)所形成凸包在地面的投影內(nèi),多機(jī)器人系統(tǒng)以編隊(duì)-合圍跟蹤的形式執(zhí)行協(xié)同巡邏任務(wù)。由于四旋翼無(wú)人機(jī)的高度方向可以單獨(dú)控制,以下僅考慮二維平面(X-Y平面)內(nèi)的運(yùn)動(dòng)情況。假設(shè)多機(jī)器人系統(tǒng)的作用拓?fù)浯嬖谇袚Q,所有可能的拓?fù)淙鐖D3 所示,設(shè)作用 拓?fù)湓谥g每5 s 切換一次,且其初始作用拓?fù)錇?/p>
考慮如圖3 所示的跟蹤-領(lǐng)導(dǎo)者模型:
圖3 可能的作用拓?fù)銯ig.3 Possible topologies
設(shè)其未知控制輸入為
基于文獻(xiàn)[30]中的內(nèi)外環(huán)控制架構(gòu),四旋翼無(wú)人機(jī)在外回路(位置-速度回路)的運(yùn)動(dòng)學(xué)模型可由式(2)近似表示,其中分別取?x1=?x2=0,?v1=?v2=0,?x3=?x4=-1,?v3=?v4=-1。采用文獻(xiàn)[31]中的反饋線性化技術(shù),麥克納姆輪無(wú)人車的運(yùn)動(dòng)學(xué)模型也可近似由式(2)表示,其中,Ai=02×2,Bi=I2,Ci=I(2i=5,6,…,10)。各無(wú)人機(jī)的狀態(tài)變量由位置與速度組成,輸出為位置;各無(wú)人車的狀態(tài)與輸出皆表示位置。
4 架無(wú)人機(jī)作為編隊(duì)-領(lǐng)導(dǎo)者,在指定高度進(jìn)行定高飛行,即在Z軸方向進(jìn)行單獨(dú)控制。要求無(wú)人機(jī)在X-Y平面內(nèi)形成正方形編隊(duì),期望的輸出編隊(duì)向量表示為,其中,hy1=[ -1,1]T,hy2=[1,1]T,hy3=[1,-1]T,hy4=[ -1,-1]T。為生成hy,易知局部外系統(tǒng)式(5)中的矩陣可選取為Hi=02×2,Ri=02×2,Yi=I(2i=1,2,3,4)。6 輛無(wú)人車需要收斂到多無(wú)人機(jī)所形成的凸包在地面的投影內(nèi),為刻畫各無(wú)人車的期望收斂值,定義權(quán)重向量ρi=[ρi,1,ρi,2,ρi,3,ρi,4(]i=5,6,…,10),并選取
利用算法1 對(duì)編隊(duì)-合圍跟蹤控制器式(9)和式(10)進(jìn)行設(shè)計(jì)。首先,分別選取X1=X2=I4,U1=U2=I2?[0 0],X3=X4=I4,U3=U4=I2?[1 1],Xhi=I2?[1 0]T,Uhi=-?xi I2(i=1,2,3,4),Xi,j=I2?[1 0],Ui,j=I2?[0 1](i=5,6,…,10;j=1,2,3,4),可以驗(yàn)證假設(shè)3~假設(shè)5 中的調(diào)節(jié)器方程成立。然后,設(shè)計(jì)編隊(duì)-領(lǐng)導(dǎo)者無(wú)人機(jī)(ii=1,2,3,4)的控制器式(9)。由于Ri=02×2,令補(bǔ)償輸入τi=02×1,可知可行性條件式(12)對(duì)于各個(gè)編隊(duì)-領(lǐng)導(dǎo)者都成立。選取自適 應(yīng)參數(shù)的初 值為j=0,1,…,4)。令μ=1,K11=K12=I2?[-2 -2],K13=K14=I2?[-1 -1],?i=I2,i=1,2,3,4。最后,設(shè)計(jì)跟隨者無(wú)人車(ii=5,6,…,10)的控制器式(10)。令自適應(yīng)參數(shù)與的初值為選取K3i=-I2和?i,j=02×(2j=1,2,3,4)。跟蹤-領(lǐng)導(dǎo)者的初始狀態(tài)為v0(0)=[ -20,0,0,-1]T,編隊(duì)-領(lǐng)導(dǎo)者與跟隨者的初始狀態(tài)由隨機(jī)數(shù)產(chǎn)生。
圖4 給出了無(wú)人機(jī)-無(wú)人車異構(gòu)集群系統(tǒng)在t=30 s 內(nèi)的位置軌跡以及在不同時(shí)刻的位置截圖(t=0,15,25,30 s),其中,五角星表示跟蹤-領(lǐng)導(dǎo)者i=0;菱形、上三角形、圓形與右三角形分別表示編隊(duì)-領(lǐng)導(dǎo)者無(wú)人機(jī)i=1,2,3,4;正方形表示 跟隨者 無(wú)人車i=5,6,…,10。圖5 與圖 6 分別給出了編隊(duì)-領(lǐng)導(dǎo)者的輸出編隊(duì)跟蹤誤差以及跟隨者的輸出合圍誤差曲線。由圖4~圖6 可知,4 架無(wú)人機(jī)形成了期望的正方形編隊(duì),且能夠?qū)崿F(xiàn)對(duì)跟蹤-領(lǐng)導(dǎo)者運(yùn)動(dòng)軌跡的跟蹤,同時(shí)六輛跟隨者無(wú)人車能夠收斂到多無(wú)人機(jī)所形成的凸包在地面的投影內(nèi)。因此,多無(wú)人機(jī)-無(wú)人車異構(gòu)集群系統(tǒng)實(shí)現(xiàn)了期望的輸出編隊(duì)-合圍跟蹤。
圖4 多無(wú)人機(jī)-無(wú)人車系統(tǒng)在t=30 s 內(nèi)的位置軌跡以及在指定時(shí)刻t=0,15,25,30 s 的位置截圖Fig.4 Position trajectories with t=30 s and snapshots at t=0,15,25,30 s for multi UAV-UGV swarm systems
圖5 編隊(duì)-領(lǐng)導(dǎo)者的輸出編隊(duì)跟蹤誤差曲線Fig.5 Output formation tracking errors for formation-leaders
圖6 跟隨者的輸出合圍誤差曲線Fig.6 Output containment errors for followers
為了進(jìn)一步展示所提出的控制方法能夠適用于時(shí)變編隊(duì)場(chǎng)景,將編隊(duì)-領(lǐng)導(dǎo)者的期望編隊(duì)構(gòu)型設(shè)置為時(shí)變旋轉(zhuǎn)圓形編隊(duì)。對(duì)于編隊(duì)-領(lǐng)導(dǎo)者無(wú)人機(jī)(ii=1,2,3,4),分別選取期望的時(shí)變編隊(duì)向量為
圖7 給出了無(wú)人機(jī)-無(wú)人車異構(gòu)集群的位置軌跡以及在指定時(shí)刻的位置截圖,可以看出4 架無(wú)人機(jī)實(shí)現(xiàn)了期望的時(shí)變旋轉(zhuǎn)編隊(duì)構(gòu)型,且跟隨者無(wú)人車能夠收斂到時(shí)變編隊(duì)的內(nèi)部,即無(wú)人機(jī)-無(wú)人車異構(gòu)集群實(shí)現(xiàn)了期望的編隊(duì)-合圍跟蹤。
圖7 無(wú)人機(jī)時(shí)變旋轉(zhuǎn)編隊(duì)下t=30 s 內(nèi)集群位置軌跡以及在指定時(shí)刻t=0,20,25,30 s 的位置截圖Fig.7 Position trajectories with t=30 s and snapshots at t=0,20,25,30 s with time-varying rotating formation for UAVs
研究了切換拓?fù)湎赂唠A異構(gòu)集群系統(tǒng)的輸出編隊(duì)-合圍跟蹤控制問(wèn)題,主要結(jié)論如下:
1)采用具有時(shí)變輸入的跟蹤-領(lǐng)導(dǎo)者來(lái)生成集群系統(tǒng)的整體參考軌跡,克服了現(xiàn)有編隊(duì)-合圍控制無(wú)法有效控制集群整體宏觀運(yùn)動(dòng)的缺陷。
2)基于自適應(yīng)控制與滑模變結(jié)構(gòu)控制理論,對(duì)編隊(duì)-領(lǐng)導(dǎo)者與跟隨者分別設(shè)計(jì)了基于邊的分布式觀測(cè)器,能夠同時(shí)應(yīng)對(duì)切換拓?fù)渑c領(lǐng)導(dǎo)者時(shí)變輸入的影響。
3)利用多編隊(duì)-領(lǐng)導(dǎo)者狀態(tài)的分布式估計(jì)值,提出了一種預(yù)先定義的合圍控制策略,使得跟隨者的收斂目標(biāo)值不依賴于作用拓?fù)洌M(jìn)而擺脫了已有編隊(duì)-合圍控制方法不適應(yīng)于切換拓?fù)涞木窒蕖?/p>
4)提出了對(duì)分布式編隊(duì)-合圍跟蹤控制器的參數(shù)進(jìn)行設(shè)計(jì)的算法,給出了分層耦合條件下高階異構(gòu)無(wú)人集群系統(tǒng)實(shí)現(xiàn)輸出編隊(duì)-合圍跟蹤的充分條件。