管宇,趙石磊,張迎春,賈慶賢
(1.哈爾濱工業(yè)大學(xué)衛(wèi)星技術(shù)研究所,哈爾濱150001;2.哈爾濱理工大學(xué)軟件學(xué)院,哈爾濱150040)
隨著以完成高精度和高穩(wěn)定度為航天任務(wù)的小衛(wèi)星概念的提出和應(yīng)用,對(duì)衛(wèi)星姿態(tài)控制系統(tǒng)的可靠性和安全性提出了更高的要求.由于在軌衛(wèi)星長(zhǎng)期工作在失重、高低溫等惡劣環(huán)境下,而且衛(wèi)星部件故障具有不可修復(fù)性,因此,研究衛(wèi)星姿控系統(tǒng)的容錯(cuò)控制對(duì)提高衛(wèi)星在軌自主運(yùn)行可靠性有著重要的理論意義和應(yīng)用價(jià)值.
目前,針對(duì)衛(wèi)星容錯(cuò)控制方法的研究在理論和應(yīng)用上都取得了一定的研究成果[1-4].例如,Cai[5]針對(duì)受外部干擾作用以及推力器失效故障的航天器姿態(tài)跟蹤問題,設(shè)計(jì)了一種自適應(yīng)姿態(tài)容錯(cuò)控制器.Hou[6]基于控制有效因子設(shè)計(jì)了兩級(jí)Kalman濾波器的故障診斷系統(tǒng),實(shí)現(xiàn)了對(duì)衛(wèi)星姿態(tài)控制系統(tǒng)傳感器和執(zhí)行器故障的有效估計(jì).現(xiàn)有智能容錯(cuò)控制方法大多利用神經(jīng)網(wǎng)絡(luò)方法[7-8],通過對(duì)權(quán)值的自動(dòng)調(diào)節(jié)來實(shí)現(xiàn)自適應(yīng)容錯(cuò)控制,但由于神經(jīng)網(wǎng)絡(luò)存在權(quán)值在線調(diào)節(jié)復(fù)雜,網(wǎng)絡(luò)結(jié)構(gòu)難于確定等缺點(diǎn),在很大程度上限制了其應(yīng)用.核學(xué)習(xí)方法[9-10]能逼近任意非線性函數(shù),且能夠利用所謂的“核技巧”通過內(nèi)積運(yùn)算來越過非線性映射,從而避免了維數(shù)災(zāi)難以及因“降維”所導(dǎo)致的性能下降問題,已被廣泛地應(yīng)用于非線性系統(tǒng)參數(shù)辨識(shí)、控制等領(lǐng)域,也為非線性故障的診斷及容錯(cuò)控制提供了新的途徑.
文獻(xiàn)[11]采用內(nèi)??刂圃恚o出了多狀態(tài)時(shí)滯系統(tǒng)的容錯(cuò)控制器設(shè)計(jì)方法,但沒有考慮非線性情況下的容錯(cuò)控制問題.文獻(xiàn)[9]將多核學(xué)習(xí)支持向量機(jī)方法應(yīng)用于變壓器故障診斷,但沒有進(jìn)一步考慮故障的補(bǔ)償.本文針對(duì)衛(wèi)星模型存在的非線性和外部干擾特性,考慮傳感器和執(zhí)行機(jī)構(gòu)存在故障的姿態(tài)控制問題,在充分利用星上硬件冗余條件基礎(chǔ)上,提出一種將在線核學(xué)習(xí)方法與自適應(yīng)內(nèi)??刂葡嘟Y(jié)合的容錯(cuò)控制方法.該方法在繼承自適應(yīng)內(nèi)??刂苾?yōu)點(diǎn)的同時(shí),引入了一種基于正交匹配追蹤思想的在線核學(xué)習(xí)算法,利用所提出的在線學(xué)習(xí)算法來補(bǔ)償原系統(tǒng)的逆模型,有效地保證了故障后原系統(tǒng)與補(bǔ)償后的逆模型保持逆的關(guān)系,使得故障后系統(tǒng)能夠有效地跟蹤輸入信號(hào),達(dá)到自適應(yīng)容錯(cuò)控制的目標(biāo).最后,將該方法應(yīng)用于衛(wèi)星的姿態(tài)控制.
衛(wèi)星非線性動(dòng)力學(xué)模型方程為
式中:φ、θ、ψ分別為參考坐標(biāo)系的3個(gè)姿態(tài)角:滾轉(zhuǎn)角、俯仰角和偏航角,ωo為軌道角速度,Ix、Iy、Iz為各軸的轉(zhuǎn)動(dòng)慣量,Tx、Ty、Tz分別為3個(gè)軸上的控制量,即執(zhí)行機(jī)構(gòu)產(chǎn)生的控制力矩,Tdx、Tdy、Tdz分別為3個(gè)軸上的外部干擾力矩.
考慮非線性系統(tǒng)u(t)=[TxTyTz]T∈R為系統(tǒng)輸入,y(t)=[φ θ ψ]T∈R為系統(tǒng)輸出,R為有界緊集,系統(tǒng)輸入輸出階次分別為m和n(m≤n).則動(dòng)力學(xué)模型可描述為
式中:F(g)是定義在R上關(guān)于各變量連續(xù)的非線性函數(shù),且滿足線性增長(zhǎng)性條件,即存在正常數(shù)ηi(1≤i≤m+n)使下式成立.
針對(duì)由微分方程描述的衛(wèi)星非線性系統(tǒng),先利用在線核學(xué)習(xí)算法求得其逆系統(tǒng),再將逆系統(tǒng)與原非線性系統(tǒng)復(fù)合成偽線性系統(tǒng)引入內(nèi)??刂浦?,實(shí)現(xiàn)故障后系統(tǒng)的自適應(yīng)容錯(cuò)控制.系統(tǒng)結(jié)構(gòu)如圖1所示,其中內(nèi)??刂浦袃?nèi)部模型為理想的α階積分環(huán)節(jié),內(nèi)模控制器為濾波器與模型逆的乘積,偽線性系統(tǒng)的輸入為u,輸出為y*,閉環(huán)系統(tǒng)的參考輸入為r,輸出為y,d為干擾力矩.基于核學(xué)習(xí)算法的在線補(bǔ)償模塊用于辨識(shí)系統(tǒng)發(fā)生故障時(shí)產(chǎn)生的變化:無故障時(shí),誤差值小于算法所設(shè)定的門限,辨識(shí)算法不啟動(dòng).故障發(fā)生時(shí),逆系統(tǒng)與原系統(tǒng)輸出之間的誤差變大,核學(xué)習(xí)算法利用力矩差值作為目標(biāo)函數(shù)進(jìn)行在線學(xué)習(xí),對(duì)故障狀況下的系統(tǒng)進(jìn)行補(bǔ)償.
圖1 基于在線補(bǔ)償?shù)腎MCFig.1 IMC based on online compensation
設(shè)圖1中偽線性系統(tǒng)的傳遞函數(shù)為G(s),內(nèi)部模型為Gm(s),內(nèi)模控制器為GIMC(s).由于非線性建模誤差的存在,G(s)可看成若干線性定常系統(tǒng)組成的模型集合π,在頻域中可描述為
引理1 對(duì)于單位負(fù)反饋控制系統(tǒng),具有建模誤差的被控對(duì)象傳遞函數(shù)為 Gp(s),其模型為Gm(s),控制器傳遞函數(shù)為Gc(s),則保證閉環(huán)系統(tǒng)穩(wěn)定的充要條件為
定理1 對(duì)于圖1所描述的內(nèi)??刂葡到y(tǒng),保證閉環(huán)系統(tǒng)穩(wěn)定的充要條件為
證明:由圖1可知系統(tǒng)的閉環(huán)傳遞函數(shù)為
其等效開環(huán)傳遞函數(shù)為
從而,可以得到單位負(fù)反饋系統(tǒng)控制器的傳函:
式(1)由引理1可得
顯然可得
證畢.
本文所設(shè)計(jì)的自適應(yīng)容錯(cuò)控制系統(tǒng)中的內(nèi)??刂破鳛镚IMC(s)=F(s)(s),代式(2)有
當(dāng)衛(wèi)星系統(tǒng)出現(xiàn)故障后,系統(tǒng)模型發(fā)生未知變化,要精確求得系統(tǒng)的逆模型難以實(shí)現(xiàn).本文提出了一種基于正交匹配追蹤的在線核學(xué)習(xí)算法,通過輸入輸出樣本辨識(shí)出逆系統(tǒng)的結(jié)構(gòu),對(duì)故障后逆系統(tǒng)進(jìn)行補(bǔ)償.
圖2 基于在線補(bǔ)償?shù)谋孀R(shí)結(jié)構(gòu)Fig.2 Identification structure based on online compensation
假設(shè)非線性系統(tǒng)Σ:u→y的動(dòng)力學(xué)模型可用一個(gè)輸入到輸出的非線性映射算子θ表示為
式中:yinv為可微函數(shù)為逆映射算子.
本文采用基于正交匹配追蹤的在線核學(xué)習(xí)算法補(bǔ)償故障后偽線性系統(tǒng)的α階積分逆系統(tǒng).
假設(shè)H為信號(hào)空間,集合D為N維希爾伯特空間中的向量集合,定義目標(biāo)函數(shù)f∈H的一個(gè)最優(yōu)估計(jì)為[,通過參數(shù) αn,gγn∈D 的選擇使殘差函數(shù)‖f-~f‖最小化.匹配追蹤就是在集合D中尋找最能準(zhǔn)確表示f內(nèi)積結(jié)構(gòu)的子集來線性表示f函數(shù),利用D在空間上的正交映射來連續(xù)估計(jì)f函數(shù).對(duì)于f的k階模型可分解為
式中:Rkf表示第k次估計(jì)后的殘差.
由k階估計(jì)模型更新到k+1階時(shí),表示為
式中:<γk,xn> =0,n=1,2,…,k.
利用輔助模型方程(5),可以表示由k階模型,更新到k+1階估計(jì)模型的形式,且表示為
匹配追蹤算法的思想是尋找xnk+1∈D/Dk,使得
如果|<Rkf,xnk+1> |<δ,δ>0,則算法終止.輔助方程中bk可以通過求解方程Vk=Akbk獲得,δ>0確保了Ak的非奇異性,可得bk=(Ak)-1Vk,其中
將在線核學(xué)習(xí)方法引入正交匹配追蹤算法可以分解成以下3個(gè)問題:
2)基向量的取舍:使新樣本加入集合Dk中的計(jì)算的問題.當(dāng)一個(gè)新的樣本被觀測(cè)到后,由于在線算法在每個(gè)時(shí)刻獲得的觀測(cè)量不可能都與集合Dk中的向量正交,因此這里分2種情況來求解
情況1 新觀測(cè)樣本xk+1經(jīng)映射后不能被集合Dk中的映射樣本{φ(x1),φ(x2),…,φ(xs)}線性表示,即 < γk,φ(xn)> ,γk≠0 時(shí).式中:表示系數(shù)向量n=1,2,…,k.
情況2 新觀測(cè)樣本xk+1經(jīng)映射后的φ(xk+1)能夠被集合Dk中映射樣本{φ(x1),φ(x2),…,φ(xs)}線性表示,即 γk≈0 時(shí),根據(jù) Backfitting 算法[13],需要對(duì)整個(gè)表達(dá)式進(jìn)行更新,更新式可以寫成:
3)核矩陣的遞歸計(jì)算:為了能夠減少在線計(jì)算量,這里給出2種情況下核矩陣的迭代方程,以減少在線計(jì)算量.根據(jù)上述的2種情況:
情況1 新觀測(cè)量xk+1映射后的φ(xk+1)能線性表示,不需要更新集合 Dk時(shí),(Ak+1)-1=(Ak)-1.
情況2 新觀測(cè)量xk+1映射后的φ(xk+1)不能線性表示時(shí),即Ak+1≠Ak,可通過下面的公式迭代計(jì)算得到(Ak+1)-1:
綜合上述分析,基于正交匹配追蹤的在線核學(xué)習(xí)算法可表述為:
初始化:選取參數(shù) v,δ(v,δ>0),令
1)獲得新樣本(xk+1,yk+1);
2)如果|<Rkf,xk+1> |<δ,返回1),獲取新本;否則,計(jì)算 bk+1=(Ak)-1kk+1,δk+1=~kk+1-
若 δk+1< v,則按照式 (7)計(jì)算 αk+1,且(Ak+1)-1=(Ak)-1,Dk+1=Dk;
否則,按照式(8)計(jì)算 αk+1,并更新(Ak+1)-1,Dk+1=Dk∪{xk+1}.
3)返回1),獲取新樣本.
為了驗(yàn)證本文中提出的自適應(yīng)容錯(cuò)控制方法的有效性,將在線補(bǔ)償?shù)膫尉€性系統(tǒng)引入到內(nèi)模控制中,并應(yīng)用Matlab/Simulink軟件分別對(duì)系統(tǒng)傳感器和執(zhí)行機(jī)構(gòu)故障進(jìn)行了仿真分析,衛(wèi)星的轉(zhuǎn)動(dòng)慣量為 Ib=diag(1.977,2.466,2.577),kg·m2.衛(wèi)星的執(zhí)行機(jī)構(gòu)選為反作用飛輪,且外部干擾力矩分別為Tdx=A0(3cosω0+1),Tdy=A0(1.5sin ω0t+3cosω0t),Tdz=A0(3sin ω0t+1),其中,A0=1.5 ×10-5N·m為干擾力矩幅值.衛(wèi)星初始值設(shè)定為ω0=0.001 105 8,rad/s初始角度誤差為[-0.18,-0.74,0.22],rad; 初 始 角 速 度 誤 差 為[0.008 727 8,-0.009 831 3,-0.004 362 2],rad/s.
由于涉及的故障為時(shí)間t的函數(shù),因此輸入中加入了時(shí)間因素并對(duì)輸入輸出進(jìn)行歸一化處理,且選取高斯核函數(shù)的寬度取為σ=1,在線辨識(shí)方法參數(shù)選為 δ=0.001,v=0.001.另外,內(nèi)模控制中的濾波器選取二型濾波器,為了減小控制量,濾波器參數(shù)設(shè)置為λf=1,使系統(tǒng)能夠完全抑制階躍和斜坡擾動(dòng).
假設(shè)x軸傳感器在t=100 s時(shí)姿態(tài)角發(fā)生大小為1 rad階躍型故障,而其他傳感器正常工作,仿真結(jié)果如圖3所示.
圖3 傳感器故障下容錯(cuò)控制仿真結(jié)果Fig.3 Simulation results of fault-tolerant control system with sensor failure
可見,x軸傳感器發(fā)生故障時(shí),由于采用內(nèi)??刂品椒?,系統(tǒng)能夠自適應(yīng)地調(diào)節(jié)傳感器故障,故障消失后,系統(tǒng)仍能有效跟蹤輸入,故障并不影響輸出,因此不需要在線補(bǔ)償調(diào)整.
假設(shè)x軸反作用飛輪在t=50∶150 s時(shí)發(fā)生大小為0.5 sin t(N·m)的故障,而其他反作用飛輪正常工作.由于考慮的執(zhí)行機(jī)構(gòu)故障為非線性故障且為時(shí)間t的函數(shù),因此,仿真中在線辨識(shí)模型的輸入部分加入了時(shí)間因素,仿真結(jié)果如圖4所示.可見,執(zhí)行器發(fā)生故障時(shí),逆模型已不能正確表示故障后的系統(tǒng)逆模,造成輸出偏差較大,在線補(bǔ)償算法啟動(dòng),對(duì)系統(tǒng)逆模型誤差進(jìn)行補(bǔ)償,補(bǔ)償后的系統(tǒng)能夠有效跟蹤輸入,衛(wèi)星的指向精度降低于0.2°.
圖4 執(zhí)行機(jī)構(gòu)故障下容錯(cuò)控制仿真結(jié)果Fig.4 Simulation results of fault-tolerant control system with actuator failure
針對(duì)衛(wèi)星存在外部干擾力矩影響和傳感器、執(zhí)行機(jī)構(gòu)存在失效故障的問題,本文提出了一種基于在線核學(xué)習(xí)算法補(bǔ)償?shù)淖赃m應(yīng)容錯(cuò)控制方法.該方法通過辨識(shí)干擾所造成的模外動(dòng)態(tài)誤差,可有效補(bǔ)償故障后系統(tǒng)的逆模型,使之能夠準(zhǔn)確地表達(dá)故障系統(tǒng)的逆.并且,將故障后逆模型與原系統(tǒng)組成的偽線性系統(tǒng)引入衛(wèi)星姿態(tài)系統(tǒng)的內(nèi)??刂七M(jìn)行仿真驗(yàn)證,仿真結(jié)果表明該方法在保證系統(tǒng)一定性能品質(zhì)的情況下,能夠?qū)崿F(xiàn)故障的容錯(cuò)控制,具有一定的應(yīng)用前景.
[1]GAO Z F,JIANG B,SHI P.Sensor fault estimation and compensation for microsatellite attitude control systems[J].International Journal of Control Automation and Systems,2010,8(2):228-237.
[2]JIN J,KO S,RYOO C K.Fault tolerant control for satellites with four reaction wheels[J].Control Engineering Practice,2008,16(10):1250-1258.
[3]VARMA S,KUMAR K D.Fault tolerant satellite attitude control using solar radiation pressure based on nonlinear adaptive sliding mode[J].Acta Astronautica,2010,66(3):486-500.
[4]HENRY D.Fault diagnosis of microscope satellite thrusters using H-infinity/H-filters[J].Journal of Guidance,Control,and Dynamics,2008,31(3):699-711.
[5]CAIW C,LIAO X H,SONG Y D.Indirect robustadaptive fault-tolerant control for attitude tracking of spacecraft[J].Journal of Guidance,Control,and Dynamics,2008,31(5):1456-1463.
[6]HOU Q,CHENG Y H,LU N Y,et al.Study on FDD and FTC of satellite attitude control system based on the effectiveness factor[C]//2nd International Symposium on Systems and Control in Aerospace and Astronautics.Shenzhen,China,2008:1096-1101.
[7]朱大奇,孔敏.基于平衡學(xué)習(xí)的CMAC神經(jīng)網(wǎng)絡(luò)非線性滑模容錯(cuò)控制[J].控制理論與應(yīng)用,2008,25(1):81-86.ZHUDaqi,KONGMin.Fault-tolerant controlofnonlinear system based on balanced learning CMAC neural network[J].Control Theory& Applications,2008,25(1):81-86.
[8]趙峻,孫偉,王雪松.基于神經(jīng)網(wǎng)絡(luò)的非線性系統(tǒng)軌跡線性化自適應(yīng)容錯(cuò)控制[J].控制與決策,2011,26(6):902-906.ZHAO Jun,SUNWei,WANG Xuesong.Adaptive fault-tolerant control of nonlinear systems using trajectory linearization based on neural network[J].Control and Decision,2011,26(6):902-906.
[9]尹玉娟,王媚,張金江,等.一種自主核優(yōu)化的二值粒子群優(yōu)化-多核學(xué)習(xí)支持向量機(jī)變壓器故障診斷方法[J].電網(wǎng)技術(shù),2012,36(7):249-254.YIN Yujuan,WANGMei,ZHANG Jinjiang,et al.An autonomic kernel optimization method to diagnose transformer faults bymulti-kernel learning supportvector classifier based on binary particle swarm optimization[J].Power System Technology,2012,36(7):249-254.
[10]SONG H Z,ZHONG L,HAN B.Structural damage detection by integrating independent component analysis and support vector machne[J].International Journal of Systems Science,2006,37(13):961-967.
[11]吳軍生,翁正新,田作華,等.基于廣義內(nèi)??刂频臅r(shí)滯系統(tǒng)主動(dòng)容錯(cuò)控制設(shè)計(jì)[J].上海交通大學(xué)學(xué)報(bào),2009,43(3):417-421.WU Junsheng,WENG Zhengxin,TIAN Zuohua,et al.Active fault tolerant control design for time-delay systems based on generalized internal model control[J].Journal of Shanghai Jiaotong University,2009,43(3):417-421.
[12]PATIY C,REZAIIFAR R.Orthogonal matching pursuit:recursive function approximation with applications to wavelet decomposition[C]//Proceedings of the Twenty-seventh Asilomar Conference on Signals Systems and Computers.Pacific Grove,USA,1993,40-44.
[13]PASCAL V,YOSHUA B.Kernel matching pursuit[J].Machine Learning,2002,48(1/2/3):165-187.