蘇 博,王洪斌,高 靜
(1.燕山大學電氣工程學院,河北秦皇島 066004;2.燕山大學工業(yè)計算機控制工程河北省重點實驗室,河北秦皇島 066004)
海洋資源的開發(fā)及利用是各國完備戰(zhàn)略資源的重要手段,自主水下機器人(autonomous underwater vehicle,AUV)作為一種海洋探索的輔助智能工具,在資源勘探、海洋環(huán)境監(jiān)測、軍事偵察、海洋防衛(wèi)等領域發(fā)揮著重要的作用[1–3].AUV作業(yè)環(huán)境復雜、作業(yè)范圍不斷拓展,需要多AUV協(xié)同作業(yè),提升水下作業(yè)的高質化、高效化,因此對多AUV一致性和編隊控制提出了更高要求[4].虛擬領航者–跟隨者編隊方法,因其具有控制簡單、隊形結構實現(xiàn)難度低等優(yōu)點,成為編隊控制中應用最廣泛的策略之一[5].
以往的領航–跟隨多AUV系統(tǒng)是在連續(xù)通信策略下實現(xiàn)控制,領航AUV需要連續(xù)不斷的將自身狀態(tài)信息傳輸給跟隨AUV.然而,多AUV間進行連續(xù)性信息傳輸,不僅會導致網(wǎng)絡擁塞,增加通訊負擔,還會造成不必要的信息傳輸,耗費通信資源.事件觸發(fā)機制通過抑制控制器的更新次數(shù),減少個體之間信息傳輸?shù)念l率,節(jié)約控制器傳輸網(wǎng)絡資源.文獻[6]針對具有外部干擾的線性多智能體系統(tǒng),提出一種分布式事件觸發(fā)一致性協(xié)議,有效的減輕整個通信網(wǎng)絡的通信負擔.隨后,針對一類相互關聯(lián)的隨機非線性系統(tǒng),基于事件觸發(fā)的動態(tài)輸出反饋自適應模糊分散控制問題得到研究[7].文獻[8]討論了一個歐拉–拉格朗日多智能體系統(tǒng)的編隊控制與跟蹤問題,采用事件觸發(fā)機制減少智能體之間的通信數(shù)量,從而減少能耗.文獻[9]針對不確定性非線性系統(tǒng),提出了固定時間和事件觸發(fā)相結合的控制策略,解決了智能體一致性控制問題,但是被控對象為一階系統(tǒng).文獻[10]針對單輸入單輸出系統(tǒng)的跟蹤控制問題,提出了基于事件觸發(fā)策略的固定時間控制方案.文獻[11]研究了基于事件觸發(fā)機制的水下機器人固定時間編隊控制問題,但并未考慮外界擾動對系統(tǒng)穩(wěn)定性能的影響.
AUV系統(tǒng)模型具有強非線性、耦合性、復雜性等非線性動力學問題,模型參數(shù)攝動及外界復雜作業(yè)環(huán)境并存,這些不確定因素會嚴重影響多AUV編隊系統(tǒng)的動態(tài)性能.文獻[12–13]針對自主水面船舶編隊控制提出了自適應神經(jīng)網(wǎng)絡技術處理系統(tǒng)外界擾動,保證系統(tǒng)信號一致最終有界.文獻[14]提出了模糊自適應技術處理系統(tǒng)外界擾動.眾所周知,擾動觀測器是一種重建外部不確定信息的關鍵技術.文獻[15]提出了有界穩(wěn)定觀測器的設計方案.為了得到更快的收斂速度及抗干擾能力,文獻[16]針對系統(tǒng)存在的參數(shù)攝動和外界擾動,提出了有限時間穩(wěn)定觀測器,實時估計復合擾動,從而保證控制系統(tǒng)的有限時間穩(wěn)定收斂.雖然基于有限時間的觀測器可對擾動精確估計,但其收斂時間嚴重依賴于初始觀測誤差,限制了應用的可行性.
實現(xiàn)多AUV編隊快速收斂是控制系統(tǒng)的重要性能指標.以往多數(shù)AUV編隊控制是漸近穩(wěn)定的[17],或者是有限時間穩(wěn)定的[18–19],則系統(tǒng)的收斂時間隨著初值的變大而無限增長,大大削弱了系統(tǒng)的收斂性能.同時,實際工程中狀態(tài)信息初始值很難獲知.固定時間控制理論[20]是基于有限時間算法提出的,不僅具備提高系統(tǒng)收斂速度,且收斂時間僅取決于控制器的設計參數(shù),克服了對系統(tǒng)初始狀態(tài)的依賴.對于收斂時間嚴格的系統(tǒng),基于固定時間理論設計控制器更符合實際應用的需求.近年來,固定時間理論先后在多智能體一致性[21]、電力系統(tǒng)[22]、遙操作機械臂[23]等領域取得了一定研究成果.以上研究為解決多AUV編隊控制快速收斂提供了理論支撐.
綜上,本文針對多AUV編隊控制過程中,存在的模型參數(shù)攝動、外界洋流干擾、網(wǎng)絡資源耗費等問題,提出一種基于固定時間模糊擾動觀測器和事件觸發(fā)策略相融合的控制算法.主要創(chuàng)新工作如下:
1) 設定AUV模型參數(shù)不確定性和外界擾動為集總擾動,基于固定時間理論和模糊自適應算法,構造了固定時間收斂的自適應模糊擾動觀測器,實現(xiàn)對集總擾動的精確估計.所設計的觀測器是實際固定時間穩(wěn)定的,且收斂時間最大值取決于控制器設計參數(shù),與系統(tǒng)狀態(tài)初始值無關,提高了觀測器收斂速度.
2) 基于擾動觀測器、反步法、指令濾波技術、固定時間理論及虛擬領航軌跡概念,將分布式事件觸發(fā)機制應用到多AUV編隊控制研究中,構造事件觸發(fā)函數(shù),提出了事件觸發(fā)編隊控制策略,減少了系統(tǒng)傳輸網(wǎng)絡的通信能耗,確保整個閉環(huán)系統(tǒng)是固定時間穩(wěn)定的;同時通過理論證明,事件觸發(fā)控制過程中無Zeno行為,保證控制器設計的合理性.最后通過對多AUV系統(tǒng)進行仿真實驗,驗證了算法的可行性.
由虛擬領航跟隨結構組成的AUV隊列,見圖1所示.圖1每個跟隨AUV相對位置和姿態(tài)信息已知.假設所有AUV都有固定的姿態(tài),則AUV的水平面運動學及動力學模型[5]為:
圖1 領航–跟隨多AUV編隊示意圖Fig.1 The diagram of leader-follower formation of multi-AUVs
其中:η=[x y ψ]T和υ=[u v r]T為全局坐標系中的位置和線性速度,且ψ為艏向角;系統(tǒng)控制輸入為τ=[τuτvτr]T;τw=[τwuτwvτwr]T為外界海流擾動.M和D(υ)分別表示慣性矩陣和阻尼矩陣.其形式如下:
其 中:mu=m ?Xu˙,mv=m ?Yv˙,mr=Iz?Nr˙,m>0為AUV質量.Xu˙,Yv˙,Nr˙為附加質量,Iz是轉動慣量.
其中:D(υ)∈R3×3為非線性阻尼矩陣,元素du=?(Xu+Xu|u|u),dv=?(Yv+Yv|v||v|),dr=?(Nr+Nr|r||r|).R(ψ)∈R3×3為旋轉矩陣,滿足等式R(ψ)RT(ψ)=I3×3.
其中C(υ)∈R3×3為科里奧利和向心力矩陣.由于AUV 模型的參數(shù)容易受到自身特性、工作條件、外部環(huán)境變化等因素的影響,因此可以將AUV模型的參數(shù)改寫為含有不確定項形式:M=M0+?M,C=C0+?C,D=D0+?D.M0,C0,D0均為標稱矩陣,?M,?C,?D為參數(shù)不確定性,式(2)重新整理如下:
其中由參數(shù)不確定項和外界海流擾動組成的集總擾動表示如下:
基于虛擬領航控制方法,引入虛擬軌跡概念,將編隊控制問題轉化為軌跡跟蹤問題[17,26].虛擬軌跡由領航AUV期望的編隊構型形成.橫向距離dx=,縱向距離.虛擬領航者代表期望的參考位置,代替真實領航者作為跟隨者的參考,當跟隨者到達虛擬領航者的位置時,意味著編隊處于期望的運動狀態(tài),此時跟隨者和領航者之間保持著預定的距離和角度.
在慣性坐標系下,虛擬軌跡描述為如下形式:
方程(8)簡寫如下:
其中:L=[dxdy0]T,ηl=[xlylψl]T代表領航位置坐標,ηv=[xvyvψv]T表示虛擬領航者位置.
引理1[20]若V:Rn →R+∪{0}是連續(xù)的徑向有界函數(shù):
1)V(x)=0?x=0,
2) 若任意的x(t)滿足不等式
則系統(tǒng)是全局固定時間穩(wěn)定的,式中:γ1,γ2,α,β均是正常數(shù),0<α<1,β >1.其收斂時間T有界且獨立于系統(tǒng)的初始值,滿足不等式
3) 若任意的x(t)滿足不等式
則該系統(tǒng)是實際固定時間穩(wěn)定的,且存在正常數(shù)γ1,γ2,α,β和θ,0<α<1,β >1,0<θ <1.使得收斂時間T滿足
假設1領航AUV的狀態(tài)可用.
假設2領航AUV的軌跡是有界的且導數(shù)存在,其一階導數(shù)和二階導數(shù)均存在且有界.
控制目標:對于模型(1)和(7)組成的AUV系統(tǒng),設計固定時間自適應模糊干擾觀測器實時觀測外界集總擾動,基于反步法、指令濾波器、固定時間控制理論和分布式事件觸發(fā)機制為跟隨AUV設計編隊控制律,使跟隨AUV實現(xiàn)對虛擬領航AUV的軌跡跟蹤,進而完成編隊控制,所提出的控制方法降低網(wǎng)絡能耗的同時,保證所有閉環(huán)信號達到實際固定時間穩(wěn)定,即
其中:T ∈[0,∞)為系統(tǒng)收斂時間,用下標v,f來區(qū)分虛擬領航AUV和跟隨AUV.
首先設計固定時間自適應模糊干擾觀測器,估計系統(tǒng)集總擾動;然后基于觀測器,固定時間理論,事件觸發(fā)策略,設計分布式編隊控制器.基于事件觸發(fā)機制的編隊控制器用來降低網(wǎng)絡傳輸負擔,系統(tǒng)的采樣時刻只發(fā)生在事件觸發(fā)條件函數(shù)為真時,因此可以通過判斷事件觸發(fā)條件有效較少控制器觸發(fā)次數(shù),從而節(jié)約有限的網(wǎng)絡資源.
結合固定時間理論與模糊控制設計自適應固定時間模糊干擾觀測器,實現(xiàn)對系統(tǒng)復合擾動的觀測估計.含一元模糊化、乘積推理、加權平均反模糊化以及隸屬度函數(shù)為高斯函數(shù)的模糊系統(tǒng)表達式如下:
式中:ω為模糊系統(tǒng)的輸入向量;λ0=[y1y2···yi]T為可調參數(shù)向量;ξ0(ω)=[ξ1(ω)ξ2(ω)···ξi(ω)]T為模糊基函數(shù)向量,ξ0(ω)的第j項定義如下形式:
文中觀測器設計不考慮此情況.
用t0,t1,···,tk來表示事件觸發(fā)時間序列,其中tk表示跟隨AUV的觸發(fā)時間.基于固定時間模糊干擾觀測器的事件觸發(fā)控制律設計如下:
式中:0
定義事件觸發(fā)測量誤差為
構造事件觸發(fā)編隊控制器的設計過程分兩步.
步驟1定義跟隨AUV位置跟蹤誤差為
根據(jù)式(1)和式(9),對z1(t)求導得
其中:變換矩陣R(ψ)?1=R(ψ)T,R˙(ψ)=R(ψ)S(rl).其中rl為領導者的艏遙角速度,
選擇運動學控制器
其中kj >0,j=1,2.為了避免反復求導帶來的微分爆炸問題,引入指令濾波器,定義αvf=[αvfuαvfvαvfr]T作為其輸入,得到新變量和,其表達式為
其中:φ1和ι1是濾波器輸出信號,且參數(shù)滿足μ>0和? ∈(0,1],分別表示濾波器的固有頻率和阻尼比,且選取φ1(0)=αvfi(0),ι1(0)=0.
定理2考慮被控對象(1)和(7)組成的AUV系統(tǒng),將事件觸發(fā)機制引入多AUV編隊控制策略中,結合固定時間自適應模糊干擾觀測器,設計出基于事件觸發(fā)的控制器(33),將觸發(fā)條件函數(shù)選取為下式:
式(47)中,當f(t)≥0時,事件被觸發(fā)的同時進行控制器更新,測量誤差將收斂到零.當f(t)<0時,則多AUV編隊系統(tǒng)滿足實際固定時間穩(wěn)定,收斂時間存在最大上界Tz,表達式后續(xù)給出.
證為了保證多AUVs編隊控制系統(tǒng)閉環(huán)穩(wěn)定性,構造正定Lyapunov函數(shù)
將干擾觀測器引入到事件觸發(fā)控制中,根據(jù)定理1和不等式放縮原理可得
事件觸發(fā)條件函數(shù)選取見式(47).當f(t)≥0時,此時事件觸發(fā)控制器進行更新,直到測量誤差為零;當f(t)<0時,控制器不再進行更新觸發(fā),由引理1可知,式(52)是實際固定時間收斂.式(52)簡寫為如下形式:
其中0<θ <1.綜上所述,基于固定時間干擾觀測器和事件觸發(fā)機制的分布式編隊控制算法總收斂時間滿足Tz≤T1+T2.
事件觸發(fā)通訊策略若存在Zeno行為會使其控制器被無限次觸發(fā),導致能源進一步耗費從而使得控制策略間接失效,因此關鍵問題是排除Zeno行為.通過證明任意兩次觸發(fā)間隔{tk+1?tk,k ∈N}存在一個正下界,即可說明事件觸發(fā)過程無Zeno行為.由e0(t)=τf(tk)?τf(t),t ∈[tk,tk+1),并且根據(jù)式(34)和引理2得
對由3艘AUV組成的系統(tǒng)進行編隊控制的仿真研究,其中AUV0和AUV1,AUV2代表1個虛擬領航者和2個跟隨者.多AUV系統(tǒng)模型參數(shù)選取見表1.領航AUV的軌跡描述如下:
表1 AUV的模型參數(shù)Table 1 Model parameters of AUV
期望編隊隊形參數(shù)選取如下:
為了驗證算法收斂時間不依賴于系統(tǒng)初態(tài),AUV1和AUV2給定不同的初始狀態(tài),具體取值見表2.干擾觀測器
表2 AUVs的任意初始狀態(tài)Table 2 The times of event-triggered for follower AUVs
控制器參數(shù)
系統(tǒng)模型參數(shù)攝動選取為標稱值20%,外界海流擾動描述如下:
工況1:依據(jù)本文所提算法及上述參數(shù)對跟隨AUV不同初始狀態(tài)(詳見表2數(shù)據(jù))進行仿真,仿真結果如圖2–10所示.圖2為位置跟蹤誤差z1(t),z1(t)很好的收斂到原點附近.圖3為速度誤差z2(t).圖4–5分別為跟隨AUVs的運動學控制器αvf和動力學控制器τf(tk).
圖2 位置跟蹤誤差Fig.2 The position tracking error
圖3 速度跟蹤誤差Fig.3 The velocity tracking error
圖4 虛擬控制律Fig.4 The virtual control law
圖6給出干擾觀測器的仿真結果,圖中跟隨AUV的初始值選取不同,但從其收斂時間一致的情況可以看出,干擾觀測器是固定時間穩(wěn)定的.圖7給出10 s內跟隨AUV的事件觸發(fā)時刻示意圖,隨著系統(tǒng)的穩(wěn)定,控制器觸發(fā)間隔越來越大,觸發(fā)時刻變得稀疏,這與預期的結果一致.同時,從仿真圖可以觀察到數(shù)據(jù)傳輸是非周期的.此外,存在很多時刻事件沒有被觸發(fā),此時并不需要無線網(wǎng)絡進行數(shù)據(jù)傳輸,從而節(jié)約了網(wǎng)絡傳輸能耗,降低網(wǎng)絡擁塞.圖8給出跟隨AUV1和跟隨AUV2取相同角度平面軌跡示意圖,圖8跟隨AUV的起始點和表2數(shù)據(jù)初始狀態(tài)吻合,表明在不同的初始狀態(tài)下,系統(tǒng)收斂的時刻不受影響.
圖5 控制輸入Fig.5 The control input
圖6 干擾及估計Fig.6 Disturbance and its estimation
圖7 事件觸發(fā)時刻Fig.7 The event-triggered interval
圖8 平面軌跡圖Fig.8 The trajectory of plane(refer to same perspectives of virtual leader)
圖9 平面軌跡圖(參考虛擬領航者角度不同)Fig.9 The trajectory of plane(refer to different perspectives of virtual leader)
圖10 跟隨AUV1的控制輸入Fig.10 The control input of AUV1
圖11 跟隨AUV1的事件觸發(fā)間隔Fig.11 Triggering instants for the follower AUV1
工況2:為了更直觀的說明干擾觀測器的有效性,僅考慮外界海洋干擾.圖12給出了擾動及其估計仿真結果,圖中di(i=1,2,3)代表系統(tǒng)所受的外界擾動,和分別代表跟隨者AUV1和AUV2估計值(初始狀態(tài)不同).由圖可見干擾估計值快速收斂到實際值曲線上,準確的估計出集總擾動,從而能夠實時的補償外部擾動對編隊系統(tǒng)的影響.
圖12 干擾及估計Fig.12 Disturbance and its estimate
表3數(shù)據(jù)為跟隨AUV1和AUV2的總觸發(fā)次數(shù)統(tǒng)計結果,表明編隊控制過程中沒有發(fā)生Zeno行為.由此可知,本文將事件觸發(fā)通訊機制引入到多AUV編隊系統(tǒng)中是有效的,同時和以往連續(xù)通訊機制相比,在有限傳輸網(wǎng)絡帶寬條件下,減少了信息通訊次數(shù)從而進一步降低通信能耗,節(jié)省了網(wǎng)絡資源.
表3 跟隨者AUVs的事件觸發(fā)次數(shù)Table 3 The times of event-triggered for follower AUVs
工況3:針對AUV2給出的初始狀態(tài),僅考慮系統(tǒng)外界海洋干擾,將本文所提出的固定時間事件觸發(fā)控制器與有限時間反步方法和漸近穩(wěn)定反步算法進行比較,仿真結果見圖13–15所示.圖13–14給出了3種算法下的誤差圖,從圖中可以看出固定時間具有較快的收斂速度,有限時間收斂時間受系統(tǒng)初始值影響,初始值選取不適合時,會導致收斂時間加長.
圖13 跟隨者AUV2的位置跟蹤誤差Fig.13 The position tracking error of follower AUV2
圖14 跟隨者AUV2的速度跟蹤誤差Fig.14 The velocity tracking error of follower AUV2
有限時間反步控制律設計如下:
其中:參數(shù)k3=diag{3,3,3},k5=diag{5,5,5},a2=0.7.
漸近穩(wěn)定反步控制律設計如下:
其中:k3=diag{1,1,1},k5=diag{5,5,5}.
圖15分別給出了3種控制算法下軌跡平面圖,虛擬AUV設定的參考角度依次是5π/4,3π/4,7π/4.從仿真結果可見,3種控制算法的起始點一致,在固定時間控制器作用下跟隨AUV1可以較快的跟蹤上虛擬軌跡,每個跟隨AUV都和領航者保持一定的距離和角度,進而完成編隊控制.
圖15 3種控制算法下跟隨AUV2軌跡Fig.15 Trajectory of follower 2 under three methods
針對多AUV分布式編隊控制問題,本文提出了基于固定時間自適應模糊干擾觀測器的事件觸發(fā)控制策略,解決了多AUV編隊系統(tǒng)節(jié)約傳輸網(wǎng)絡通信資源及提高編隊收斂速率的問題.設計了固定時間自適應模糊干擾觀測器,用來實時逼近系統(tǒng)集總擾動,保證系統(tǒng)觀測誤差實際固定時間收斂;提出了基于事件觸發(fā)策略的編隊控制策略,實現(xiàn)編隊系統(tǒng)固定時間穩(wěn)定.所提出的控制方法加快了系統(tǒng)的收斂速度,其收斂時間不受系統(tǒng)初值影響,克服了實際工程中不易精確獲得系統(tǒng)初態(tài)的難題;同時引入事件觸發(fā)策略,減少了控制器傳輸網(wǎng)絡中的信息傳輸能耗,進而提高了有限通信資源的利用率,延長網(wǎng)絡壽命.