夏冬冬,岳曉奎
1. 西北工業(yè)大學(xué) 航天飛行動力學(xué)技術(shù)國家級重點實驗室,西安 710072 2. 西北工業(yè)大學(xué) 航天學(xué)院,西安 710072
由于空間任務(wù)的日益頻繁和深入,各國都相繼開展或?qū)嵤┝嗽谲壏?wù)技術(shù)研究。具體研究任務(wù)形式有:對報廢航天器的離軌操作,對失效航天器的在軌維修,對燃料耗盡航天器的在軌加注等等。總之,航天器的在軌服務(wù)成為目前航天技術(shù)必須面對和亟需解決的一個關(guān)鍵課題[1]。
為了對目標(biāo)航天器進(jìn)行在軌服務(wù),通常服務(wù)航天器首先需要捕獲目標(biāo)航天器。在捕獲前服務(wù)航天器需要能夠與目標(biāo)航天器同步運(yùn)動,以便對接;捕獲后兩者的組合體可能需要穩(wěn)定或者重定向等[2],這些都需要控制航天器姿態(tài)和角速度能夠跟蹤上一個預(yù)定的參考軌跡。但是,由于燃料的消耗、航天器構(gòu)型的變換或模塊的轉(zhuǎn)移以及對目標(biāo)的捕獲組成雙星復(fù)合系統(tǒng)等,都會造成系統(tǒng)的慣性特性(質(zhì)量、質(zhì)心、轉(zhuǎn)動慣量矩陣)等發(fā)生較大變化,并且這個變化通常事先是未知的[3]。因此,本文研究慣性參數(shù)未知的航天器姿態(tài)跟蹤控制具有重大的實際意義。
針對被控對象中含有參數(shù)不確定的模型,自適應(yīng)控制由于不需要被控對象的先驗信息而得到了廣泛的研究[4]。傳統(tǒng)的自適應(yīng)控制方法是基于等價確定性(Certainty Equivalence, CE)[3-5]原則而設(shè)計的。但是由于CE方法中參數(shù)估計更新律是通過Lyapunov函數(shù)導(dǎo)數(shù)中干擾項的精確抵消而來的,導(dǎo)致其更新律中不含有自身的負(fù)反饋項。參數(shù)估計誤差和跟蹤誤差的直接耦合,造成了系統(tǒng)閉環(huán)性能的下降。
針對該問題,Astolfi等[6-7]開創(chuàng)性提出了一種非等價確定性(Non-Certainty Equivalence, Non-CE)理論:浸入與不變(Immersion and Invariance, I&I)理論。通過在參數(shù)估計中增加一項關(guān)于狀態(tài)的修正項,從而間接將未知參數(shù)引入到參數(shù)估計動態(tài)當(dāng)中。通過合理設(shè)計,可以把參數(shù)估計誤差動態(tài)與其自身直接建立起聯(lián)系,這在CE方法中是做不到的。但是,由于理論上,獲得修正項的具體形式需要求解一個偏微分方程(Partial Differential Equation, PDE)。對于一階系統(tǒng),方程的解析解總是存在并很容易通過積分求解;但對于高階系統(tǒng),方程有解析解需要滿足比較嚴(yán)格的條件,在實際情形中一般不滿足,通常被稱為“可積分性障礙(Integrability Obstacle)”,這使得其應(yīng)用受到極大的限制[8-11]。
針對該障礙,Seo和Akella[8-9]提出了一種基于濾波方法(Filter-based)的控制器,通過巧妙構(gòu)造一個指數(shù)收斂的增廣濾波系統(tǒng),然后通過增廣濾波狀態(tài)設(shè)計修正項和控制器,使得整個閉環(huán)系統(tǒng)具有I&I理論的特點,從而間接地避免了求解PDE。雖然該方法給I&I控制器設(shè)計提供了一種新的思路,但是缺點是低通濾波器降低了系統(tǒng)的帶寬;并且對增廣系統(tǒng)濾波,會導(dǎo)致閉環(huán)系統(tǒng)的階數(shù)急劇增加,大大加重了計算負(fù)擔(dān)。
Karagiannis等[11-12]開創(chuàng)性地將動態(tài)放縮法(Dynamic Scaling)運(yùn)用到I&I 控制器設(shè)計當(dāng)中,該方法考慮參數(shù)回歸矩陣不滿足可積條件,通過引入狀態(tài)濾波器,按照一定方式替換掉回歸矩陣中的積分變量使得其可積并得到其近似解,然后運(yùn)用動態(tài)放縮技術(shù)將近似解和真解之間誤差部分消除。由于動態(tài)放縮法相比于Seo和Akella[8-9]提出的增廣濾波法,只需對被積狀態(tài)設(shè)計濾波器,因此明顯地降低了閉環(huán)系統(tǒng)的階數(shù),優(yōu)勢比較突出,吸引了一大批研究者的關(guān)注[13-18],極大推進(jìn)了I&I理論的發(fā)展。但是,基于動態(tài)放縮法的控制器設(shè)計過程中,動態(tài)放縮因子為單調(diào)遞增函數(shù),盡管能夠證明有界,但是事先并不知會增大到多大;而控制器和濾波器動態(tài)反饋增益系數(shù)與放縮因子的平方呈線性關(guān)系,這些因素會導(dǎo)致控制器反饋增益很大,可能會出現(xiàn)不希望的瞬態(tài)特性。
Yang等[17]首次將動態(tài)放縮法的I&I理論運(yùn)用到航天器的姿態(tài)控制模型中。針對參數(shù)回歸矩陣不可積的困難,通過添加一個補(bǔ)償矩陣使其可積,然后利用構(gòu)造的角速度濾波器或者參考角速度信號來抵消補(bǔ)償矩陣的影響,并用動態(tài)放縮技術(shù)將其影響消除。并且針對動態(tài)放縮因子單調(diào)遞增所帶來“高增益”控制現(xiàn)象,通過使用“三標(biāo)量動態(tài)(three scalar dynamics)”方法構(gòu)造一個動態(tài)調(diào)節(jié)系數(shù),使遞減的調(diào)節(jié)系數(shù)中和放縮因子的增長。雖然該文章也提出了基于動態(tài)放縮法I&I控制器,但是需要額外設(shè)計標(biāo)量動態(tài),并且需要事先知道慣性矩陣的最小特征值的下界,這給實際應(yīng)用帶來了困難。
Wen等[18]同樣將動態(tài)放縮法和I&I方法應(yīng)用在姿態(tài)跟蹤模型上,采用的是文獻(xiàn)[11]中的回歸矩陣改造技巧,但是創(chuàng)新地提出了修正縮放因子和附加調(diào)節(jié)系數(shù)動態(tài),使得控制器中不需要慣量矩陣最小特征值,也能約束縮放因子在一個事先確定的上界內(nèi)。但是該方法只是將反饋增益與縮放因子從平方線性關(guān)系修正到呈線性關(guān)系,仍需要調(diào)節(jié)系數(shù)來中和縮放因子的增長。
目前國內(nèi)相關(guān)的研究[19-23]只是將I&I理論結(jié)合一些backstepping或者滑??刂品椒☉?yīng)用到一些較簡單的實際模型中。所考慮的模型都是可以拆分成一維的子系統(tǒng)的級聯(lián)形式,此時的PDE可以直接通過積分求解,不存在不可解的問題。而本文中姿態(tài)控制、機(jī)械臂等強(qiáng)耦合非線性多維系統(tǒng)并不能直接利用I&I方法進(jìn)行設(shè)計,因為其PDE并不能直接積分求解,國內(nèi)文獻(xiàn)在這方面并沒有深入研究。
本文針對航天器姿態(tài)跟蹤控制模型,采用I&I理論,提出了一種新的參數(shù)回歸矩陣改造方式,解決了“可積分性障礙”。通過引入全新的縮放因子形式,利用動態(tài)放縮技術(shù)證明了矩陣改造帶來的誤差不影響閉環(huán)系統(tǒng)的穩(wěn)定性,并且設(shè)計的姿態(tài)跟蹤自適應(yīng)控制器不需要縮放因子信息,也不需要慣量矩陣的最小特征值信息,有效地減小了閉環(huán)系統(tǒng)復(fù)雜度和閉環(huán)系統(tǒng)階數(shù),并且保證了跟蹤誤差的漸近收斂。
本文結(jié)構(gòu)如下:第1節(jié)對本文所研究的問題進(jìn)行了詳細(xì)描述;第2節(jié)對本文提出的矩陣改造方法進(jìn)行了介紹,并依據(jù)該方法給出了一種新的I&I姿態(tài)跟蹤控制律;且第2節(jié)用Lyapunov方法證明了所設(shè)計控制器的穩(wěn)定性;第3節(jié)通過數(shù)值仿真,將本文設(shè)計的控制器與CE方法的控制器和Filter-based方法的控制器進(jìn)行了對比分析,表明了本文設(shè)計方法的有效性和優(yōu)越性;最后,在第4節(jié)中對相關(guān)研究內(nèi)容作了簡單總結(jié)。
航天器姿態(tài)跟蹤問題中,通常會涉及到3個坐標(biāo)系:慣性坐標(biāo)系FI、本體坐標(biāo)系FB和期望坐標(biāo)系FD。由于姿態(tài)控制只考慮本體坐標(biāo)系的相對方位,而不考慮其質(zhì)心的位置,所以以上3個坐標(biāo)系均以航天器質(zhì)心O為原點。其中,慣性坐標(biāo)系作為基準(zhǔn)坐標(biāo)系,本體坐標(biāo)系和期望坐標(biāo)系的姿態(tài)均是相對于慣性坐標(biāo)系而言;本體坐標(biāo)系與航天器固連,其坐標(biāo)軸的方位也就代表了航天器的方位;期望坐標(biāo)系是一個引入的假想坐標(biāo)系,坐標(biāo)軸的相對方位由要跟蹤的期望方位確定。坐標(biāo)系的示意圖如圖1所示。姿態(tài)跟蹤的任務(wù)就是控制航天器,使其固連的本體坐標(biāo)系與期望坐標(biāo)系重合。
圖1 坐標(biāo)系示意圖
本文采用全局無奇異的四元數(shù)來描述剛體的姿態(tài)動力學(xué)方程
(1)
(2)
由四元數(shù)q得到的從FI到FB的坐標(biāo)變換矩陣為
(3)
(4)
從FD到FB的坐標(biāo)變換矩陣為
(5)
角速度跟蹤誤差為
ωe=ω-Reωd=ω-Ω
(6)
式中:Ω=Reωd為ωd在本體坐標(biāo)系中表達(dá)的期望角速度。
這里不加推導(dǎo)地給出航天器姿態(tài)跟蹤的動力學(xué)模型為[17-18]
(7)
(8)
(9)
由于J為實對稱常量矩陣,可以寫為
J包含6個未知參數(shù),可以設(shè)未知參數(shù)向量為
為了方便后面控制器的設(shè)計,將式(9)改造為
(10)
式中:kq>0和kω>0分別為姿態(tài)誤差反饋增益系數(shù)和角速度誤差反饋增益系數(shù),為待定常數(shù);根據(jù)線性參數(shù)化性質(zhì):
Wθ=-ω×Jω+Jω×Ω-JΩd+J(kqqev+kωωe)
(11)
式中:W=W(ω,qev,Ω,Ωd)∈R3×6為參數(shù)回歸矩陣。
考慮如下形式的控制器設(shè)計:
(12)
(13)
根據(jù)I&I方法,參數(shù)估計一般由2項組成,因此考慮如下的參數(shù)估計形式:
(14)
(15)
(16)
為了保證閉環(huán)系統(tǒng)最終收斂到流形面M上,需要求解一個偏微分方程,從而得出修正項β的具體形式
(17)
但是,式(17)有解的條件是WT∈R6×3為雅克比矩陣,即
(18)
(19)
式(19)是一個很強(qiáng)的限制條件,在強(qiáng)耦合非線性系統(tǒng)中,參數(shù)回歸矩陣一般不滿足該條件。在本文航天器姿態(tài)跟蹤模型中,由式(11)得到的參數(shù)回歸矩陣WT由于叉乘矩陣ω×的存在,使得WT不滿足式該條件,也即式(17)不可解。因此,按照傳統(tǒng)I&I控制器設(shè)計方法在這里遇到了極大的阻礙。
觀察式(11)并將其分解為
Wθ=J(kqqev-kωΩ-Ωd)+kωJω+
(-ω×Jω+Jω×Ω)=
(W1+W2+W3)θ
(20)
對于Jx=M(x)θ,可得其參數(shù)回歸矩陣形式為
(21)
W1=M(kqqev-kωΩ-Ωd),W2=kωM(ω)
(22)
(23)
(24)
(25)
(26)
(27)
式中:kf為濾波器反饋增益,是一個待定的變量。那么,可以將修正項β(ω,φ)設(shè)計為
β(ω,φ)=γ(β1+β2+β3)
(28)
并且有
(29)
為了后續(xù)敘述的簡潔性和嚴(yán)謹(jǐn)性,首先給出L2和L∞范數(shù)的定義。
則稱f(t)是平方可積的,或稱f(t)∈L2;若其∞-范數(shù)滿足:
則稱f(t)是有界的,或稱f(t)∈L∞。
接下來,根據(jù)以上內(nèi)容,可以得出以下定理。
定理1對于航天器系統(tǒng)(7)~系統(tǒng)(9),在慣量矩陣完全未知的條件下,若控制器(12)中參數(shù)估計由式(15)和式(28)組成;需要的反饋增益分別為
kq=1+δq,kω=1.5+δω
(30)
kf=1+δd+δf
(31)
式中:δq,δω,δf>0為任意正常數(shù);δd為一個動態(tài)增益,其動態(tài)為
(32)
證明參見以下分析過程。
為了方便以下的穩(wěn)定性證明,定義如下的縮放參數(shù)估計誤差:
(33)
式中:R為縮放因子,由輔助縮放因子r確定,其定義式為
(34)
式中:jm為慣量矩陣J的最小特征值;f(r)為上界縮放為1的某一飽和函數(shù),例如雙曲正切函數(shù)、反正切函數(shù)、sigmoid函數(shù)等。輔助縮放因子r的動態(tài)為
(35)
注意到,若選取r(0)>0,不管f(r)是雙曲正切函數(shù)、反正切函數(shù),還是sigmoid函數(shù),都能保證f(r)>0和f′(r)>0;并且根據(jù)f(r)的有界性,存在某一合適常數(shù)C,可以保證lnf(r)+C>0。因此,式(35)總是有意義的。
通過式(32)和式(33),可得以下2個性質(zhì):
(36)
jmf(r)
(37)
對式(31)求導(dǎo),并利用式(27)和式(34)可得
(38)
若選擇以縮放參數(shù)估計誤差z為變量的Lyapunov函數(shù)為
(39)
對式(39)求導(dǎo),結(jié)合式(38)和楊不等式,得到
(40)
首先考慮以下Lyapunov函數(shù):
(41)
(42)
注意到,式(30)自動滿足kq+kω>0.5,從而式(42)的正定性得到保證。
分別對式(38)和式(39)求導(dǎo)得到
(43)
R(qev+ωe)TJ-1Wz
(44)
定義如下Lyapunov函數(shù):
(45)
對式(45)求導(dǎo),并結(jié)合式(30)、式(31)、式(38)、式(43)和式(44)得到
(46)
(47)
接著定義如下Lyapunov函數(shù):
(48)
(49)
對以上Lyapunov函數(shù)求導(dǎo),可得
(50)
(51)
最后定義總的Lyapunov函數(shù)為
V=Vc+Vf+VR
(52)
根據(jù)式(46)、式(50)和式(51)的結(jié)果,對式(52)求導(dǎo)得
(53)
經(jīng)過以上分析過程,有以下幾點改進(jìn)和創(chuàng)新值得說明一下:
(54)
這在CE控制方法中是保證不了的,也是I&I控制方法相對于CE方法的一大改進(jìn)。
注2本文通過設(shè)計一種新穎的縮放因子式(34),使得其滿足性質(zhì)式(37)。而通過飽和函數(shù)f(r)的引入,使得控制器增益中不再含有r2或者r,這在文獻(xiàn)[12-18]中是做不到的。并且注意到,根據(jù)飽和函數(shù)f(r)的有界性,控制器中不再需要縮放因子R和r的信息,縮放因子的引入只是為了穩(wěn)定性的證明,這是對已有基于動態(tài)放縮法I&I控制器的一大突破。
注3從式(48)發(fā)現(xiàn),通過在濾波器增益式(31)kf中添加動態(tài)項式(32)δd,使得增益式(31)中不再需要Lipschitz常數(shù)L,從而避免了復(fù)雜的矩陣推導(dǎo)來確定L的過程,例如文獻(xiàn)[17-18]中的推導(dǎo)過程。
對所設(shè)計的自適應(yīng)跟蹤控制器進(jìn)行仿真,驗證本文所提出設(shè)計方案的有效性和優(yōu)越性。仿真中,慣量矩陣J取為
被跟蹤的期望角速度軌跡設(shè)定為
ωd(t)=[0.3(1-e-0.01t2)cost+te-0.01t2(0.08π+
初始條件設(shè)定為
被跟蹤的期望姿態(tài)可以根據(jù)初始姿態(tài)和期望角速度得出。控制器的常數(shù)參數(shù)設(shè)定為:kp=10,kd=20,δf=0.5。
得到的仿真曲線如圖2所示。
圖2 各項參數(shù)隨時間變化曲線
總之,本組仿真算例證明了本文所提出的跟蹤控制器的有效性,并且增大調(diào)節(jié)增益γ、λ值能夠一定程度加快閉環(huán)跟蹤誤差的收斂。但是,需要指出的是,盡管γ、λ值能夠使得閉環(huán)系統(tǒng)更快地收斂,但是實際應(yīng)用中并不是γ,λ值越大越好。這是因為本文的控制器和仿真均是基于姿態(tài)和角速度能夠?qū)崟r精確測量的假設(shè),而實際情況中可能存在測量噪聲、高頻干擾以及未建模動態(tài)的影響,更大的γ,λ值將增大系統(tǒng)的帶寬,使其更容易受到這些影響。所以,在實際應(yīng)用中,應(yīng)該綜合閉環(huán)系統(tǒng)的快速性和魯棒性,對γ,λ值進(jìn)行合理的選定。
為了驗證本文所設(shè)計控制器的優(yōu)越性,該組仿真將比較CE-based控制器[5]、Filter-based控制器[8]和本文提出的控制器的跟蹤性能。為了保證對比的公平性,首先通過調(diào)節(jié)各控制器的反饋增益,保證3種控制器在理想情況下(慣量矩陣已知)跟蹤誤差的漸近收斂速度一致,然后,設(shè)定慣量矩陣未知,通過數(shù)值仿真,得到的跟蹤性能曲線如圖3所示。
從圖3(a)和圖3(b)可以看到,本文提出的控制器相比于CE-based和Filter-based控制器有更快的收斂速度和更高的跟蹤精度。從圖3(c)發(fā)現(xiàn),初始過渡階段,CE-based控制器和Filter-based控制器所需的控制量非常大,并且有著非常嚴(yán)重的瞬態(tài),在穩(wěn)態(tài)階段,F(xiàn)ilter-based控制器所需的控制量和本文提出的已經(jīng)基本趨于相同了,但是CE-based控制器所需的控制量更大,這也可以從圖3(a)和圖3(b)可以看出,CE-based控制器的穩(wěn)態(tài)時閉環(huán)跟蹤誤差比較大,并存在一定的振蕩,這會額外消耗一定的控制量。
造成這樣的原因主要有:首先,從控制器設(shè)計原理上,本文所提控制器和Filter-based控制器都是基于非等價確定性原則(Non-CE-based)設(shè)計的,相對于CE-based控制器在原理上就具有優(yōu)越性,因為CE-based控制器只是單純地將Lyapunov函數(shù)中關(guān)于參數(shù)不確定項抵消掉,并且只要參數(shù)估計沒有收斂到真值,閉環(huán)系統(tǒng)就會一直存在一個外干擾附加到理想系統(tǒng)上;其次本文提出的控制器中濾波系數(shù)kf中的動態(tài)增益在系統(tǒng)運(yùn)行過程中使得系統(tǒng)等效控制增益變大,加快了閉環(huán)系統(tǒng)向理想系統(tǒng)(流形面上的等效系統(tǒng))的收斂。并且Filter-based控制器將狀態(tài)、回歸矩陣和控制量均進(jìn)行一階低通濾波構(gòu)造出一個指數(shù)收斂的増廣狀態(tài),這嚴(yán)重增大了閉環(huán)系統(tǒng)的階數(shù)和復(fù)雜性,在計算上造成很大負(fù)擔(dān)并且引入了很多的舍入誤差,并且指數(shù)收斂増廣狀態(tài)的初值必須根據(jù)其他狀態(tài)初值來設(shè)置使其為零,不然不就會有一個指數(shù)收斂的外干擾附加在理想系統(tǒng)上,因此本文所提控制器相對于Filter-based控制器更加簡潔和高效。
圖3 跟蹤性能隨時間變化曲線
綜上,對于跟蹤精度要求高和燃料有限且寶貴的航天在軌服務(wù)任務(wù)來說,本文所提出的控制器相對于CE-based控制器和Filter-based控制器有著不可比擬的優(yōu)勢。
在工程應(yīng)用中,系統(tǒng)中會不可避免地存在一些干擾,例如外界干擾、測量誤差等。為了驗證本文設(shè)計控制器的魯棒性,在原有的系統(tǒng)模型(9)中加入有界外干擾:
d=
圖4 控制誤差范數(shù)和隨時間變化曲線
圖5 控制力矩范數(shù)隨時間變化曲線
圖6 估計誤差范數(shù)隨時間變化曲線
總之,通過該組仿真可以看出,本文設(shè)計的控制器存在有界外干擾時,仍能保證閉環(huán)系統(tǒng)的有界收斂,只是之前的漸近穩(wěn)定品質(zhì)已經(jīng)喪失了,但仍可將跟蹤誤差控制在零附近的一個很小鄰域內(nèi),表明控制器具有一定的魯棒性。
本文針對慣性參數(shù)不確定情況下航天器的姿態(tài)跟蹤,基于浸入與不變方法設(shè)計了一種自適應(yīng)控制器。首先分析了浸入與不變理論應(yīng)用在航天器姿態(tài)跟蹤動力學(xué)模型,存在偏微分方程不存在解析解的問題;然后針對該問題,本文提出了一種矩陣改造方法,使得參數(shù)回歸矩陣滿足可積條件,并通過引入一種全新的縮放因子,采用動態(tài)放縮法證明了矩陣改造前后的誤差對閉環(huán)系統(tǒng)的影響可以消除;最后根據(jù)本文提出的矩陣改造方案設(shè)計出了一種新的I&I姿態(tài)自適應(yīng)跟蹤控制器,保證了跟蹤誤差的漸近收斂。文章的創(chuàng)新之處在于采用全新的縮放因子,使得控制器執(zhí)行過程中不需縮放因子信息,也不需要慣量矩陣的先驗信息;并且在濾波器反饋增益中加入動態(tài)自適應(yīng)增益項,使得不需要去確定矩陣范數(shù)上界,總之本文設(shè)計控制器相比于已有的基于動態(tài)放縮法的I&I控制器具有更簡單的形式和更低的閉環(huán)系統(tǒng)階數(shù)。文章最后通過數(shù)值仿真驗證和對比得出了本文設(shè)計控制器的有效性和優(yōu)越性??傊?,本文的設(shè)計思想和方法對參數(shù)不確定的自適應(yīng)控制器設(shè)計具有一定的指導(dǎo)和借鑒意義。