基于性能指標約束的一類輸入死區(qū)非線性系統(tǒng)最優(yōu)控制

2019-12-12 06:54郭子杰白偉偉魯仁全

自動化學報 2019年11期

郭子杰白偉偉周琪魯仁全

不確定非線性系統(tǒng)控制問題一直是控制領(lǐng)域內(nèi)研究的熱點和難點[1?8].以模糊邏輯系統(tǒng),神經(jīng)網(wǎng)絡為基礎的自適應控制設計方法,打破了以往系統(tǒng)中非線性函數(shù)要滿足某些限定條件或參數(shù)化的限制[1],解決了不滿足匹配條件及不確定的非線性系統(tǒng)的控制器設計問題.并廣泛應用于純反饋和嚴格反饋的單輸入單輸出系統(tǒng)[2?3],多輸入多輸出系統(tǒng)[4?5],以及多智能體系統(tǒng)[6]中.值得注意的是,基于backstepping 技術(shù)的控制設計方法在每一步都需要對已設計的虛擬控制器進行反復求導,從而產(chǎn)生“計算爆炸”問題.而動態(tài)面控制技術(shù)通過在backstepping 設計的每一步中引入一階低通濾波器,有效地避免了這一問題[9].在此基礎上,文獻[10]提出一種命令濾波方法,利用誤差補償機制消除動態(tài)面技術(shù)中濾波誤差對系統(tǒng)性能的影響.上述工作為不確定非線性系統(tǒng)控制提供了一種簡便化,結(jié)構(gòu)化的方法,但以上成果均沒有考慮最優(yōu)控制問題.

最優(yōu)控制是一類考慮系統(tǒng)控制性能和節(jié)能效應的控制策略[11].傳統(tǒng)的動態(tài)規(guī)劃(Dynamic programming,DP)采用按照時間階段逆向遞推的方法有效解決了最優(yōu)控制問題[12],但其后向求解的模式往往會導致“維數(shù)災”現(xiàn)象的發(fā)生[13].自適應動態(tài)規(guī)劃(Adaptive dynamic programming,ADP)方法作為DP 方法的近似解法,彌補了DP 方法的不足,為求解復雜非線性系統(tǒng)最優(yōu)控制問題提供了新的思路[14].Murray 等[15]首先針對連續(xù)系統(tǒng)提出了一種迭代ADP算法,并從數(shù)學上證明了該算法的可行性.Vamvoudakis 等[16]提出了基于策略迭代的在線ADP 方法,克服了迭代ADP 算法無法適應系統(tǒng)變化的缺點.上述的研究成果對ADP 理論的發(fā)展具有里程碑的意義.為了保證系統(tǒng)運行時的穩(wěn)定性,文獻[15?16]所提出的方法要求給定一個初始穩(wěn)定的控制策略.針對此問題,Zargarzadeh 等[17]提出一種基于單網(wǎng)絡評價技術(shù)的在線ADP 算法,并采用新的參數(shù)訓練方法,突破了初始穩(wěn)定控制策略的限制.近年來,ADP 受到國內(nèi)學者的廣泛關(guān)注[18?22],已經(jīng)成為一種重要的優(yōu)化控制方法.

目前,采用ADP 方法研究非線性系統(tǒng)的最優(yōu)控制問題已經(jīng)取得了一系列研究成果,然而針對帶有輸入死區(qū)和指定性能約束條件的非線性系統(tǒng)所做的研究較少.事實上,死區(qū)作為一類非光滑非線性函數(shù)經(jīng)常出現(xiàn)在機械連接,液壓制動器和傳感器等實際工程系統(tǒng)中,極大地影響系統(tǒng)的性能,甚至引起系統(tǒng)不穩(wěn)定[23].對此,文獻[24?25]借助死區(qū)的斜率來解決輸入死區(qū)問題.另一方面,工程中希望控制器不僅能夠保證系統(tǒng)穩(wěn)定,而且使系統(tǒng)跟蹤誤差在一定條件下收斂.文獻[26]通過預先設定跟蹤性能函數(shù),提出一種指定性能方法,使得系統(tǒng)的跟蹤誤差保持在兩個指定性能函數(shù)組成的有限范圍內(nèi),解決了控制器設計參數(shù)調(diào)節(jié)難的問題.

基于以上討論,本文針對一類考慮指定性能和具有輸入死區(qū)約束的嚴格反饋非線性系統(tǒng),提出一種自適應模糊最優(yōu)控制方法.本文的主要工作如下:1)結(jié)合命令濾波技術(shù)和backstepping 方法設計了一種前饋控制器,與文獻[19,27]的方法相比,本文采用命令濾波技術(shù)不但能克服“計算爆炸”問題,而且能補償濾波器誤差,取得更好的控制效果.2)設計了一種新的ADP 結(jié)構(gòu)對誤差系統(tǒng)進行優(yōu)化,利用單網(wǎng)絡在線逼近器求解近似最優(yōu)控制器.3)本文解決了一類考慮輸入死區(qū)和指定性能約束的非線性嚴格反饋系統(tǒng)的優(yōu)化控制問題.最后,通過實例仿真驗證所提控制方法的有效性.

1 問題描述

考慮一類嚴格反饋系統(tǒng):

其中,v∈R是死區(qū)輸入信號,Mr和Ml表示死區(qū)的斜率,al和ar是斷點,Mr,Ml,ar,al都是正常數(shù).

假設1[24].存在一個正常數(shù)?滿足|v|≤?.

假設2[25].給定的參考信號x1d及其一階導數(shù)是光滑的、已知的且有界.

死區(qū)輸入(2)可簡化為

其中,ρ(t)是分段且有界的函數(shù),滿足

根據(jù)以上討論,可得

則稱系統(tǒng)的暫態(tài)性能滿足指定性能的要求.其中,δmin,δmax>0 是可調(diào)節(jié)的參數(shù),指定性能函數(shù)取為μ(t)=(μ0?μ∞)e?nt+μ∞,函數(shù)μ(t)是嚴格單調(diào)遞減的函數(shù),n>0,μ0=μ(0),μ∞=limt→∞μ(t),那么μ0>μ∞>0,而且滿足δmaxμ(0).上面不等式可以等價于以下等式

本論文的控制目的:針對一類考慮指定性能和具有輸入死區(qū)約束的非線性嚴格反饋系統(tǒng)設計一種自適應模糊最優(yōu)控制器,保證閉環(huán)系統(tǒng)中所有信號都是一致最終有界的,誤差信號收斂到以“0”為中心的鄰域內(nèi),并且滿足指定性能要求,同時代價函數(shù)達到最小值.

引理1[19].對任意給定的精度? >0,都存在模糊邏輯系統(tǒng)wT?(Z)能逼近任意連續(xù)的非線性函數(shù)F(Z), 使得F(Z)=wT?(Z)+?(Z), 其中|?(Z)|≤?,這里F(Z)是定義在緊集 ?Z ∈Rq上的函數(shù),w是理想權(quán)重向量,定義為

引理2[19](Young's 不等式).對于任意x,y ∈Rn,有以下不等式成立:

其中,a>0,b>1,q >1且 (b?1)(q?1)=1 .

2 控制器設計

在本節(jié)中,首先結(jié)合backstepping 方法和命令濾波技術(shù),設計前饋控制器Ua.然后,采用自適應動態(tài)規(guī)劃方法設計出最優(yōu)反饋控制器U?.最后,整個控制輸入Uw=Ua+U?.

2.1 前饋控制器設計

首先進行如下坐標變換

其中,x1d為參考信號,λi是虛擬控制輸入xid通過一階命令濾波器的輸出.是前饋虛擬控制輸入,為最優(yōu)反饋虛擬控制輸入.最后一步中定義v=va+v?,va為前饋實際控制輸入,v?為最優(yōu)反饋實際控制輸入.一階命令濾波器表達式為

其中,τi是時間常數(shù).為了消除濾波器誤差λi?xid的影響,設計誤差補償信號ζi(2≤i ≤n?1)為

其中,ci >0是設計參數(shù),ζ(0)=0 .

定義補償跟蹤誤差為

結(jié)合式(5)～(11),對求導可得

第1步:考慮如下Lyapunov 函數(shù)

設計前饋虛擬控制器和自適應律如下:

根據(jù)式(15)和式(16),對V1求導有

第i步(2≤i ≤n?1):考慮如下Lyapunov 函數(shù)

設計前饋虛擬控制器和自適應律如下:

根據(jù)式(17)～(19),對Vi求導有

第n步:考慮如下Lyapunov 函數(shù)

設計前饋控制器va和自適應律如下:

根據(jù)式(20)和式(21),對Vn求導有

根據(jù)Young's 不等式,對式(22)不等式右邊第2、6 項變換如下

將式(23)和式(24)代入式(22),可得

如前所述,系統(tǒng)(1)的控制輸入Uw=[x2d,...,xnd,v]T由兩部分Ua和U?構(gòu)成,前饋控制器的表達式如式(15),(17),(18),(20)所示.由式(25)可知,前饋控制器Ua不能保證整個閉環(huán)系統(tǒng)的穩(wěn)定性.因此,需要設計最優(yōu)反饋控制器使得Uw能夠保證被控系統(tǒng)(1)穩(wěn)定.

2.2 最優(yōu)反饋控制器設計

本節(jié)中,設計最優(yōu)反饋控制器U?使如下誤差仿射系統(tǒng)穩(wěn)定,并且使得代價函數(shù)達到最小.

定義系統(tǒng)(26)的代價函數(shù)為

其中,Q(Z)是半正定的罰函數(shù),R=RT>0 .

根據(jù)代價函數(shù)(27),定義哈密頓函數(shù)如下

其中,?zV(Z)是V(Z)對Z的偏導,通過求解=0,解得最優(yōu)控制輸入

將式(29)代入式(28)可得最優(yōu)控制輸入的充分必要條件:此時哈密頓函數(shù)最小.其中,E=PGR?1GTPT,且V?(0)=0.

引理3[27].對于系統(tǒng)(26),代價函數(shù)(27),最優(yōu)控制器(29),存在徑向無界且連續(xù)可導的Lyapunov 函數(shù)J(Zs),J(Z),使得其中此外, Λ(Z)>0 是一個半正定函數(shù)矩陣,滿足當∥Z∥=0,有∥Λ(Z)∥=0;當?min≤∥Z∥≤?max,有Λmin≤∥Λ(Z)∥≤Λmax,?min,?max,Λmin,Λmax都是正常數(shù); limZ→∞Λ(Z)=∞,同時使等式Q(Z)+U?TRU?=(Z)Λ(Z)成立,其中,那么可得

根據(jù)引理1,利用模糊邏輯系統(tǒng)逼近最優(yōu)代價函數(shù),可得

其中,wc為理想的權(quán)值,?(Z)為模糊基函數(shù),ε(Z)為逼近誤差.則最優(yōu)代價函數(shù)的梯度為

將式(30)分別代入式(28),(29)可得

利用模糊邏輯系統(tǒng)對代價函數(shù)進行估計,則有

將式(34)代入式(28),得到哈密頓函數(shù)的估計為

為使最小,利用梯度下降法設計得

根據(jù)自適應律(16),(19),(21),引入附加項,可得

定理1.針對一類考慮指定性能和具有輸入死區(qū)約束的嚴格反饋非線性系統(tǒng)(1),設計前饋虛擬控制器(15),(17),(18),前饋實際控制器(20),反饋最優(yōu)控制器(34)及自適應律(36)和(38),通過選擇合適的參數(shù)使得閉環(huán)系統(tǒng)內(nèi)所有信號一致最終有界,跟蹤誤差以最優(yōu)的方式收斂且滿足指定性能要求.

證明.見附錄A.

3 實例仿真

本節(jié)將通過一類機械臂系統(tǒng)仿真驗證所提出自適應模糊最優(yōu)控制方法的有效性和可行性.帶有輸入死區(qū)約束的機械臂系統(tǒng)動力學方程如下:

其中,x1,x2分別為連桿角速度和角加速度,M=1 kg為連桿總質(zhì)量,g=9.8 m/s2為重力加速度,l=1 m 為機械臂連桿的質(zhì)心距連桿的轉(zhuǎn)動中心的距離,D=2 N·m·s/rad 為連桿轉(zhuǎn)動的粘性摩擦系J=1 kg·m2數(shù),為連桿轉(zhuǎn)動慣量.

參考信號x1d=sin(t).死區(qū)參數(shù)Mr=3,Ml=1,ar=1.5,al=3.模糊隸屬度函數(shù)為4,5.初始值為x1(0)=1.4 ,x2(0)=?0.2 .=[1,1,1,?1,?1]T.性能函數(shù)μ=2.5e?0.5t+0.05,δmin=0.6,δmax=0.8.設計參數(shù)為c1=10,c2=50,γ1=1,γ2=1,σ1=50 ,σ2=50 ,β1=0.01 ,β2=0.01,給定系統(tǒng)代價函數(shù)(27)中R=[0.2,0;0,0.01],其余參數(shù)初始值均為0.

圖1 參考信號 x1d和輸出信號yFig.1 Reference signal x1d and output y

圖2 的軌跡和指定性能邊界曲線Fig.2 Trajectories of and performance bounds

仿真結(jié)果如圖1～4 所示,圖1 給出了參考信號x1d和系統(tǒng)輸出信號y的跟蹤軌跡,系統(tǒng)輸出y在5 s 內(nèi)跟蹤上參考信號,表明本文的控制方法能使系統(tǒng)輸出具有良好的跟蹤效果.圖2 給出了跟蹤誤差的軌跡曲線,由圖中可以看出跟蹤誤差收斂于以原點為中心的有界鄰域內(nèi),滿足預設性能的要求,并且穩(wěn)態(tài)誤差小于0.01.圖3 給出了代價函數(shù)權(quán)值和哈密頓函數(shù)的估計值的變化曲線,表明權(quán)值信號能快速收斂到目標權(quán)值并使得哈密頓函數(shù)趨于0.圖4 描繪了執(zhí)行器輸入信號v和執(zhí)行器輸出信號u的響應曲線.由仿真結(jié)果可知本文提出的控制方案使得閉環(huán)系統(tǒng)內(nèi)所有信號都是有界的,保證了系統(tǒng)的穩(wěn)定性.

圖3 代價函數(shù)權(quán)值?和哈密頓函數(shù)?的軌跡(i=1,2,3,4,5)Fig.3 Thetrajectoriesof cost functions weights w?ci andHamiltonian ?(Z,?)(i=1,2,3,4,5)

圖4 執(zhí)行器輸入信號 v 和執(zhí)行器輸出信號uFig.4 Trajectories of actuator input v and actuator output u

4 結(jié)束語

本文針對一類參數(shù)未知的嚴格反饋非線性系統(tǒng),考慮輸入死區(qū)和指定性能兩個約束條件,提出了一種自適應模糊最優(yōu)控制方法.首先在backstepping 方法和命令濾波技術(shù)的基礎上,利用死區(qū)斜率信息和性能指標函數(shù)設計了前饋控制器.進而采用單網(wǎng)絡的ADP 方法,設計了最優(yōu)反饋控制器.最后采用Lyapunov 函數(shù)穩(wěn)定性理論證明了閉環(huán)系統(tǒng)的穩(wěn)定性.仿真結(jié)果表明了本文設計方法能夠有效解決考慮死區(qū)和指定性能的嚴格反饋系統(tǒng)的優(yōu)化控制問題.

附錄A

選取Lyapunov 函數(shù)為