劉子龍,竇鵬程
(上海理工大學 光電信息與計算機工程學院,上海 200093)
近年來,隨著四旋翼無人機市場的發(fā)展,有越來越多的人關(guān)注到這一行業(yè).由于它低成本和簡單的構(gòu)造,使得其在商業(yè)上中大量使用并且很多人選擇這項研究工作.精確的姿態(tài)和位置控制是滿足四旋翼飛行器任務要求的基本和必要條件,因為四旋翼具有高耦合、非線性、內(nèi)部不確定性以及不可預測的外部環(huán)境干擾,所以控制系統(tǒng)應有較強的抗干擾能力和魯棒性.
針對以上四旋翼無人機的控制問題,目前相關(guān)的控制算法有PID控制[1,5,6]、線性二次型調(diào)節(jié)器[2,3]、滑??刂芠7-9]、反步法[7,12]、魯棒控制[10]、自適應控制[11]等.但這些方法依賴精確的數(shù)學模型,且容易受到內(nèi)部不確定性和未知干擾的影響.文獻[5]提出了一種基于增強學習算法的四旋翼PID調(diào)節(jié)方案,利用強化學習的PPO算法來調(diào)整控制器的增益;文獻[6]建立了四旋翼飛行器非線性模型,與PID控制器串聯(lián)形成完整的控制系統(tǒng)模型,經(jīng)過對PID參數(shù)調(diào)優(yōu)可以在較短時間內(nèi)實時控制進行響應,但是文獻[5,6]控制器參數(shù)的調(diào)整過程較為耗時且控制性能有限,因此對于復雜多變的飛行環(huán)境需要一些更魯棒、實時的控制算法.文獻[7]等提到了滑模法,該方法具有響應速度快、魯棒性強的特點,但容易引起系統(tǒng)抖振.文獻[12]提出了反步積分控制器設計位置回路和姿態(tài)回路,仿真結(jié)果表明該方法具有良好的跟蹤效果和較強的空氣擾動抑制能力,但是其抗擾性能是在事先建立了外界干擾的精確模型基礎之上.關(guān)于姿態(tài)控制,文獻[13,14,17]提出了姿態(tài)角度-角速度雙閉環(huán)控制策略:文獻[13]采用自抗擾控制和比例-微分控制;文獻[14]分別采用自抗擾控制和積分滑??刂疲晃墨I[17]采用串級自抗擾控制;驗證了自抗擾控制的有效性.
迭代學習控制(Iterative Learning Control)是由Arimoto等人在1984年提出[15],通過在以前試驗的控制輸入中添加一個校正項來生成新的控制輸入,這個校正項就是前一次或者前幾次試驗時測的誤差信息.迭代學習控制具有擬人的學習過程與特性,不依賴于系統(tǒng)的精確數(shù)學模型,能在給定時間范圍內(nèi),以簡單的算法通過每次迭代更新控制輸入信號來減少期望參考軌跡信號于系統(tǒng)輸出之間的誤差.因此,迭代學習控制對外界干擾和系統(tǒng)不確定性具有一定的魯棒性[19].
韓京清提出的自抗擾控制[4,16],用于處理具有不確定性和外部干擾的非線性系統(tǒng).自抗擾控制通過擴張狀態(tài)觀測器(ESO)估計狀態(tài)和實時干擾,是一種不依賴于精確系統(tǒng)模型的控制方法,具有跟蹤速度快、控制精度高和抗干擾能力強等特點.因此,采用自抗擾控制對四旋翼姿態(tài)存在內(nèi)部強耦合和外界不確定干擾的情況是一個可行的方法.
本文基于以上考慮,一方面為提高系統(tǒng)的抗擾性,另一方面在不人為進行參數(shù)調(diào)整情況下盡可能多滿足四旋翼大范圍和快速性的運動場景.在位置軌跡跟蹤上,提出一種反步積分-迭代學習控制器(BI-ILC),旨在充分發(fā)揮反步積分法具有軌跡跟蹤性能強等優(yōu)點,由于四旋翼的重復飛行是一種常見行為,因此結(jié)合迭代學習控制能改善非線性對象的跟蹤性能,可以保證隨著迭代次數(shù)的增加而漸進的實現(xiàn)跟蹤.在姿態(tài)環(huán)使用自抗擾控制,無需詳細模型就能估計和補償未知擾動.上述策略結(jié)合形成雙通道控制,達到最優(yōu)的控制效果,李雅普諾夫穩(wěn)定性理論和仿真驗證了該方法的有效性.
不妨做出下述假定:
1)設定四旋翼無人機的結(jié)構(gòu)嚴格對稱,運動過程活動范圍較小,整體考慮的情況下視為理想模型;
2)設定四旋翼無人機收到的地心引力不會隨著機體的運動而產(chǎn)生變化,且忽略外部其他干擾因素.
得到的四旋翼無人機動力學模型[20]如式(1)、式(2)所示:
(1)
(2)
式中,m是四旋翼的質(zhì)量;g是重力加速度常數(shù);ω是單個螺旋槳的轉(zhuǎn)速;b是一個定值;d是固定系數(shù);Fi(i=1,2,3,4)=bω2各自代表電機轉(zhuǎn)動時帶動相應的螺旋槳所生成的拉力;l是質(zhì)心與螺旋槳的中心距離;U1是總的升降力矩;U2是橫滾力矩;U3是俯仰力矩;U4是偏航力矩.
位置控制器設計分為高度控制器設計和水平控制器設計,二者具有相似性,下面以高度控制器為例.從四旋翼數(shù)學模型(1)中可以看出,四旋翼高度由控制同時受姿態(tài)角的影響.高度通道的狀態(tài)方程為:
(3)
3.1.1 反步積分控制
首先定義高度跟蹤誤差為:
e=x1d-x1
(4)
其中,x1d為期望的高度軌跡.
對式(4)進行求導,即:
(5)
為使e→0,選擇Lyapunov函數(shù)V1為:
(6)
計算式(6)的導數(shù)為:
(7)
將x2d當作虛擬控制量,則當期望的虛擬控制為:
(8)
通過式(8)可得虛擬控制x2與期望虛擬控制x2d的誤差為:
(9)
對式(9)進行求導,即:
(10)
為使e,δ→0,選取:
(11)
計算式(11)的導數(shù)為:
(12)
此時,通過式(9)和式(10)可得高度輸入控制量U1為:
(13)
在實際飛行過程中,滾轉(zhuǎn)角φ和俯仰角θ在很小的范圍內(nèi)變化,可近似為0,因此cosφ≈1,cosθ≈1.
3.1.2 迭代學習控制
迭代學習控制是設計控制算法在t時刻產(chǎn)生的k次迭代輸入信號uk(t),使得在t∈[0,T]時間內(nèi)的跟蹤性能得到提高.結(jié)合四旋翼模型(1)考慮可重復非線性系統(tǒng):
(14)
式中,t∈[0,T],x、f(x)∈Rn,B(x)∈Rn×r,y、g(x)∈Rm,u∈Rr.
采用如下形式的PD型學習律:
(15)
其中t∈[0,T],Γ(yk(t))、L為增益矩陣.
定理1.設公式(14)及公式(15)滿足條件:
1)‖I-Γ(g(x))gx(x)B(x)‖≤ρ≤1 (x∈Rn)
2)xk(0)=x0(k=0,1,2…)
(16)
由于:
(17)
可知,存在:
(18)
式中,0<θi(t)<1,i=1,2,…,m.
使:
(19)
因此,
(20)
式(20)兩端取范數(shù),則有:
(21)
式中,
k=γM2b1kB+γb2kg+γM2kf+γlM2,l=‖L‖;
自抗擾控制對“總擾動”進行觀測,不僅實現(xiàn)內(nèi)部解耦,同時抑制外部擾動.自抗擾控制器包括跟蹤微分器(TD)、擴張狀態(tài)觀測器(ESO)和非線性誤差反饋控制律(NLSEF).所提出的四旋翼姿態(tài)控制策略如圖1所示.
圖1 四旋翼橫滾角控制結(jié)構(gòu)圖Fig.1 Quadrotor roll angle control structure diagram
以四旋翼橫滾通道為例,設計自抗擾控制器.將四旋翼模型(1)的橫滾角寫成如公式(22)所示:
(22)
式中,u是橫滾通道控制輸入;x1是橫滾角;x2是橫滾角速度;x3是橫滾通道擾動總和.
1)跟蹤微分器(TD)
安排過渡過程擴大了比例系數(shù)和微分系數(shù)的選取范圍,降低了整定難度,也提高了控制器的魯棒性,使控制器有更好的適應性.其形式如公式(23)所示:
(23)
式中,v是期望信號;v1是期望信號的跟蹤值;v2是期望跟蹤值的微分;r是速度因子;h是濾波因子.
2)擴張狀態(tài)觀測器(ESO)
ESO是整個系統(tǒng)的核心,它可以估計出系統(tǒng)的內(nèi)部不確定量和外部干擾然后用狀態(tài)誤差反饋控制律對系統(tǒng)的總干擾進行補償.其形式如公式(24)所示:
(24)
式中,b0=1/Ix;e是觀測值與實際值的差值;zi(i=1,2,3)是觀測器對系統(tǒng)狀態(tài)xi(i=1,2,3)的觀測值;δ是濾波因子;βi(i=1,2,3)是觀測器增益,均為可調(diào)參數(shù).
fal(e,α,δ)的表達式如公式(25)所示:
(25)
式中,α是常值.
3)非線性狀態(tài)誤差反饋(NLSEF)
利用非線性函數(shù)對誤差和誤差的微分進行處理,之后進行加權(quán),依據(jù)“小誤差大增益,大誤差小增益”的設計思路.其形式如公式(26)所示:
(26)
式中,k1,k2是控制器增益,均為可調(diào)參數(shù).
在本節(jié)中,依據(jù)前面所建立的四旋翼數(shù)學模型和所提出的控制器在Simulink環(huán)境下搭建四旋翼仿真系統(tǒng),分別驗證位置環(huán)和姿態(tài)環(huán)算法的有效性.四旋翼無人機模型參數(shù)如表1所示.四旋翼無人機高度通道仿真參數(shù)和橫滾角通道仿真參數(shù)如表2和表3所示.
表1 四旋翼無人機的系統(tǒng)參數(shù)Table 1 System parameters of Quadrotor UAV
表2 四旋翼無人機高度通道仿真參數(shù)Table 2 Height simulation parameters of Quadrotor UAV
表3 四旋翼無人機橫滾角通道仿真參數(shù)Table 3 Roll angle simulation parameters of Quadrotor UAV
設無人機的初始狀態(tài)在坐標系原點,選取期望高度變化為正弦曲線.仿真結(jié)果如圖2~圖6所示.
在沒有外界干擾的情況下,由圖2可知,跟蹤軌跡與期望軌跡基本一致.在加入了高斯白噪聲信號后,如圖3所示的反步積分控制器出現(xiàn)明顯的震蕩;如圖4所示所提出的反步積分-迭代學習控制器高度跟蹤軌跡在一定時間內(nèi)漸進收斂到它的期望值,且誤差在很小的范圍之內(nèi).圖5所示為在相同條件下,無迭代學習控制器和增加迭代學習控制器的局部放大效果對比.如圖6所示為四旋翼位置初始值為0,隨著迭代次數(shù)的增加,實際跟蹤軌跡逐漸趨向期望軌跡,誤差收斂到極小值.由上述仿真結(jié)果可知,反步積分器可以使系統(tǒng)穩(wěn)定達到期望的軌跡,但在內(nèi)部不確定和外部干擾的情況下,會影響跟蹤的效果,結(jié)合了迭代學習控制器后可以在不改變原有控制器參數(shù)的情況下提高系統(tǒng)的穩(wěn)定性,保證系統(tǒng)具有良好的性能和平滑的軌跡,這表明所提出的反步積分-迭代學習控制方法是有效的.
圖4 有擾動情況下反步積分-迭代學習控制跟蹤圖Fig.4 BI-ILC tracking diagramwith disturbance
選取無人機初始姿態(tài)為0°,設定橫滾角度為20°.響應曲線如圖7~圖9所示.
如圖7所示為自抗擾控制器的響應曲線,并與使用較為廣泛的串級PID控制器進行對比,可以看出,自抗擾控制在快速性和穩(wěn)定性等方面都明顯更優(yōu)于串級PID控制.加入相同干擾信號的結(jié)果如圖8和圖9所示,在同樣不調(diào)整控制器參數(shù)的情況下,自抗擾控制器能更好地抑制干擾,具有較強的魯棒性.
圖7 無擾動情況下內(nèi)環(huán)姿態(tài)跟蹤圖Fig.7 Attitude tracking diagram without disturbance
本文描述了一種控制策略,將反步積分-迭代學習控制器和自抗擾控制器運用在位置-姿態(tài)雙閉環(huán)控制系統(tǒng)上.通過李雅普諾夫穩(wěn)定性分析,深入研究了四旋翼控制系統(tǒng)的穩(wěn)定性和控制性能.此外,進行了仿真分析驗證.結(jié)果表明所提控制策略能有效的控制四旋翼系統(tǒng),且在不確定性情況下仍能達到預期的性能指標,改善了四旋翼的飛行性能,保證了四旋翼的高穩(wěn)定性.下一步的研究,將結(jié)合所設計的控制器應用到實際的四旋翼無人機.