劉國慶,趙 林
(青島大學(xué)自動化學(xué)院,青島266071)
近年來,飛行器編隊飛行成了一個熱門的研究課題,因其能夠使用一些小型廉價且高性能的飛行器協(xié)同工作來代替大型的航空器去執(zhí)行復(fù)雜的空間任務(wù),例如空間信號的采集和處理、空間的檢測和成像等[1]。對于多飛行器執(zhí)行空間任務(wù),其姿態(tài)跟蹤能力顯得尤為重要,為此很多學(xué)者提出了不同的控制方案,如最優(yōu)控制策略[2],虛擬結(jié)構(gòu)控制方案[3],行為控制方法[4]等。最近,一些基于圖論的方法研究了多智能體系統(tǒng)的分布式跟蹤控制[5-7],并且將該方法進(jìn)一步應(yīng)用于多飛行器編隊飛行的研究[8]。盡管上述方案已經(jīng)解決了多飛行器編隊飛行的姿態(tài)控制問題,但是他們的控制系統(tǒng)都是漸近穩(wěn)定的,收斂速率沒有達(dá)到實際的期望,會影響控制系統(tǒng)的性能。
在飛行器的編隊飛行中,快速的收斂速率對于飛行器的姿態(tài)跟蹤控制來說非常重要。由于有限時間控制方案能夠提供更好的收斂能力和抗干擾能力,因此很多相關(guān)的控制策略被提出。具體來說,主要有兩種有限時間控制策略,一種是齊次性方法,很多學(xué)者基于此方法研究了多剛體飛行器的分布式姿態(tài)調(diào)節(jié)問題[9]和姿態(tài)包容控制問題[10],但當(dāng)多飛行器系統(tǒng)具有慣性不確定性和未知的外部擾動時,齊次性方法就會失效[9-10];另一種是基于有限時間李雅普諾夫穩(wěn)定性理論的方法,其中終端滑??刂品椒ê图觾绶e分法常用于處理各種多智能體的有限時間控制問題[11-14]。雖然終端滑模方法可以解決系統(tǒng)中存在的干擾,但由于引入了符號函數(shù),控制系統(tǒng)會產(chǎn)生抖振現(xiàn)象[11-12]??紤]到加冪積分法會導(dǎo)致系統(tǒng)出現(xiàn)高增益問題[13-14],因此,有必要找到一種既能提供高精度高性能又能保證系統(tǒng)快速收斂并避免控制系統(tǒng)抖振的策略。
對飛行器系統(tǒng)來說,由于其動態(tài)方程是強(qiáng)非線性的,對其精確的控制非常困難。反步控制作為一種有效的非線性控制器設(shè)計方法,可以很好地解決這一問題并提高編隊飛行的性能[15]??紤]到在反步控制設(shè)計過程中必須使用虛擬控制信號的導(dǎo)數(shù),這將導(dǎo)致計算復(fù)雜性問題出現(xiàn),因此,基于反步控制的動態(tài)面控制技術(shù)被提出[16-17],通過構(gòu)造一階濾波器巧妙地解決了計算復(fù)雜性問題。然而,在控制方案中引入一階濾波器引起的濾波誤差沒有得到補(bǔ)償。為了補(bǔ)償由命令濾波器引起的濾波誤差以獲得更好的控制效果,同時避免反步設(shè)計中存在的計算爆炸問題,有限時間命令濾波反步控制方案被提出以解決各種多智能體系統(tǒng)的控制問題[18-19],并被進(jìn)一步用于研究多飛行器編隊的姿態(tài)包容控制中[20],但該控制方案忽略了多飛行器系統(tǒng)慣性矩陣的不確定性。考慮到飛行器在姿態(tài)變化過程中,由于附件的質(zhì)量重心位移和外部環(huán)境的干擾,飛行器的慣性矩陣和控制系統(tǒng)將不可避免地隨之受到影響,因此,具有未知慣性矩陣和外部干擾的控制系統(tǒng)應(yīng)該被重點研究。
受以上問題的啟發(fā),本文提出了基于有限時間命令濾波反步和自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制技術(shù)的多剛體飛行器分布式有限時間姿態(tài)跟蹤控制方案,可以很好地解決所提到的問題。
本文研究了具有N個跟隨飛行器和1個領(lǐng)導(dǎo)飛行器的多飛行器姿態(tài)編隊控制問題。對于N個跟隨者和1 個領(lǐng)導(dǎo)者之間的通信用有向圖論理論來描述,關(guān)于有向圖論的具體描述可參考文獻(xiàn)[18]。第i個跟隨飛行器的動力學(xué)模型被描述為如下方程:其中:Ji∈R3×3,ωi=[ωi,1,ωi,2,ωi,3]T∈R3×1分別是對稱慣性矩陣和飛行器的角速度;=[0,-ωi,3,ωi,2;ωi,3,0,-ωi,1;-ωi,2,ωi,1,0 ]代表ωi的反對稱矩陣;ui和di分別是控制力矩和有界的外部擾動力矩陣。采用修正羅德里格斯參數(shù)pi∈R3來描述飛行器的姿態(tài):
其中:εi是主旋轉(zhuǎn)角,oi是歐拉坐標(biāo)軸,基于修正羅德里格斯參數(shù)我們有如下運動學(xué)方程:
其中,雅可比矩陣Ti定義如下:
基于式(1)和(2),定義Q=T-1i可以得到歐拉-拉格朗日型函數(shù):
其中,
進(jìn)一步定義qi,1=pi,qi,2=,式(5)可以寫成:
假設(shè)1.Ji和di都是未知的,r為領(lǐng)導(dǎo)者的姿態(tài)輸出,r和其一階導(dǎo)數(shù)是已知平滑且有界的信號。
性質(zhì)1.未知干擾滿足是一個正常數(shù)。
性質(zhì)2.對于正定有界的對稱慣性矩陣Joi滿足不等式其中λmin,λmax都是正常數(shù)。
性質(zhì)3.對于J˙io滿足反對稱性質(zhì)qTi(Jio-2Coi)qi=0。
引理1[18].假設(shè)存在一個連續(xù)的正定函數(shù)V(t),滿足+l1V+l2Vμ≤0,其中l(wèi)1,l2都是正常數(shù),μ∈(0,1),V(t)能夠在有限時間T≤t0+(1/(l1(1-μ))內(nèi)收斂到平衡點。
在設(shè)計控制策略的過程中,考慮設(shè)計如下有限時間命令濾波器:
其中,hi,1,z>0,hi,2,z>0,二者都是命令濾波器的增益。
現(xiàn)在我們構(gòu)造多飛行器的一致性姿態(tài)跟蹤誤差,即第i個跟隨者的誤差定義為:
其中,πi,2=χi,1,且χi,1是命令濾波器的輸出?;谟邢迺r間命令濾波反步技術(shù)設(shè)計如下虛擬控制信號和控制器:
其 中,ki,z,,?i,z,z=1,2,s=1,…,n都是正常數(shù),γ∈(0,1),γ=且γ1,γ2都是奇數(shù)。
為了消除濾波誤差,建立如下誤差補(bǔ)償信號:
其中,ιi,δi都是正常數(shù)。
此外,補(bǔ)償跟蹤誤差信號定義為:
定理1.對于多飛行器姿態(tài)跟蹤控制系統(tǒng)(1)~(2)在假設(shè)1 的情況下,使用有限時間命令濾波器(7),選擇控制信號αi,1,ui=T-1i,誤差補(bǔ)償信號(10)和自適應(yīng)控制律(11),則可以保證一致性跟蹤誤差在有限時間收斂到原點的足夠小的鄰域內(nèi)且閉環(huán)系統(tǒng)中的所有信號都是有界的。
證.首先,選擇如下李雅普諾夫函數(shù):
求導(dǎo)可得:
把式(9)~(10)帶入式(14)可得:
選擇第二個李雅普諾夫函數(shù)為:
求導(dǎo)可得:
對于未知非線性動態(tài)Λi=[Λi,1,…Λi,n]T,基于神經(jīng)網(wǎng)絡(luò)逼近技術(shù)[18],可以表示為:
其中Wi,s=[wi,s,1,wi,s,2,…wi,s,l]T是權(quán)重向量;νi,s=然后基于楊不等式可得:
其中?i,s是正數(shù)。進(jìn)一步考慮如下不等式:
把式(20)~(21)帶入式(18)可得:
進(jìn)一步構(gòu)造關(guān)于誤差補(bǔ)償?shù)睦钛牌罩Z夫函數(shù)
其中k0=min{ki,1-1/2,ki,2},
因為=vi+ηi,選擇如下李雅普諾夫函數(shù):
求導(dǎo)可得:
定義=θi-,進(jìn)一步構(gòu)造如下李雅普諾夫函數(shù):
求導(dǎo)可得:
基于性質(zhì)(2)和不等式:
其中,κi>,可以得到:
所以式(29)可以寫為:
其中:Φ1=min{2ki,1,(2(ki,2-1/2))/λmax,2k0,2oi},Φ2=min{[?i,1-φi,1/ (1+γ)]2(1+γ)/2,[?i,2-φi,2/(1+γ)](2λmax)2/(1+γ),(φi,s/(1+γ))2(1+γ)/2,(2oi)(1+γ)/2},
進(jìn)一步有:
或者:
根據(jù)式(33)或式(34)我們可以得到在有限時間內(nèi)vi,s,ηi,s,會收斂到如下范圍內(nèi):
姿態(tài)跟蹤誤差將在有限時間收斂到:
在這一部分中,通過具體的例子來說明給定控制方案的有效性,一個領(lǐng)導(dǎo)飛行器和三個跟隨飛行器之間的通信拓?fù)浣Y(jié)構(gòu)如圖1所示。多飛行器系統(tǒng)的慣性矩陣選擇為Ji=+ΔJ,其中ΔJ=diag{0.1sin(t),0,0;0,0.2cos(t),0;0,0,0.1 sin(0.5t)},分別為:
初始值分別為ω1=ω2=ω3=[0,0,0]T,p1(0)=[-0.8,1.5,1]T,p2(0)=[0.6,1,1.3]T,p3(0)=[0.7,0.8,1.1]T。領(lǐng)導(dǎo)者的輸出信號選擇為r(t)=[sin(t)+0.5,cos(t)+0.5,sin(t)+1]T,額外干擾設(shè)為di=0.2[sin(t),cos(t),sin(t)]T,控制器參數(shù)選擇 為ki,1=ki,2=5,γ=3/5,ζi,1=si,2=25,φi,1=φi,2=2,hi,1,z=hi,2,z=220,δi=1,ιi=1。
圖1 飛行器之間的通信拓?fù)銯ig.1 The communication topology among spacecrafts
圖2 pi和r,i=1,2,3的三維響應(yīng)曲線Fig.2 The response curves of pi and r,i=1,2,3 in 3-D
圖3 ,i,m=1,2,3的響應(yīng)曲線Fig.3 The response curves of ,i,m=1,2,3
圖2用3D 圖展示了三個跟隨飛行器的姿態(tài)在有限時間內(nèi)全部跟蹤上期望的姿態(tài)。圖3給出了飛行器的一致性跟蹤誤差曲線圖,可以看出在有限時間內(nèi)誤差能夠收斂到充分小。圖4展示了自適應(yīng)律中的估計參數(shù)隨時間的變化曲線。用總體跟蹤誤差來對比本文提出的有限時間命令濾波控制方案和文獻(xiàn)[17]提出的有限時間動態(tài)面方法以及文獻(xiàn)[16]提出的自適應(yīng)動態(tài)面方法的性能,圖5可以看出本文所涉及的控制方案和有限時間控制方案都能夠?qū)崿F(xiàn)有限時間收斂,但是本文提出的方案有更好的暫態(tài)性能和更小的穩(wěn)態(tài)誤差。
圖4 ,i=1,2,3的響應(yīng)曲線Fig.4 The response curves of ,i=1,2,3
圖5 不同控制算法下的OTE軌跡Fig.5 The trajectories of OTE under different control algorithms
本文基于命令濾波反步方案構(gòu)造了自適應(yīng)有限時間控制器,成功解決了飛行器編隊的分布式姿態(tài)跟蹤控制問題,盡管系統(tǒng)中存在額外干擾和未知的慣性矩陣。在所提出的方案中,有限時間命令濾波解決了存在于反步設(shè)計中的計算爆炸問題,并且保證了飛行器系統(tǒng)的有限時間收斂速率。針對系統(tǒng)中未知的慣性矩陣和額外干擾,神經(jīng)網(wǎng)絡(luò)結(jié)合自適應(yīng)方法能夠很好地處理。誤差補(bǔ)償機(jī)制的建立彌補(bǔ)了濾波誤差,保證了較小的靜態(tài)誤差和較好的跟蹤性能。證明了總體跟蹤誤差能夠在有限的時間內(nèi)收斂到期望的原點的鄰域范圍內(nèi)。通過仿真可以看出閉環(huán)系統(tǒng)有很好的收斂性能和抗干擾能力。