梅中偉, 朱芳來(lái)
(同濟(jì)大學(xué)電子與信息工程學(xué)院,上海 201804)
對(duì)于一個(gè)具有重復(fù)運(yùn)行性質(zhì)的系統(tǒng),迭代學(xué)習(xí)能夠通過(guò)改變控制輸入使系統(tǒng)的輸出軌跡漸近地跟蹤給定的期望軌跡。迭代學(xué)習(xí)不需要知道系統(tǒng)參數(shù),適合于那些難以建模和對(duì)軌跡控制精度要求非常高的系統(tǒng)。傳統(tǒng)的迭代學(xué)習(xí)[1-3]的一個(gè)缺點(diǎn)是難以找到一個(gè)同時(shí)描述控制系統(tǒng)在時(shí)域上的動(dòng)態(tài)特性和在迭代方向上的學(xué)習(xí)率的數(shù)學(xué)模型。2D(Two Dimensional)系統(tǒng)包含兩個(gè)動(dòng)態(tài)過(guò)程,表征系統(tǒng)在水平和垂直方向上的動(dòng)態(tài)變化,而迭代學(xué)習(xí)同樣包含了兩個(gè)過(guò)程,時(shí)間過(guò)程上的動(dòng)態(tài)特性和迭代過(guò)程,因此可以將2D系統(tǒng)理論和迭代學(xué)習(xí)很好地結(jié)合在一起。
近年,許多學(xué)者在原有的基于2D系統(tǒng)理論的迭代學(xué)習(xí)控制[4]基礎(chǔ)上進(jìn)行了更為深入的研究。文獻(xiàn)[5]研究了含可變初始條件的離散系統(tǒng)的迭代學(xué)習(xí);文獻(xiàn)[6]將2D系統(tǒng)理論應(yīng)用于線性離散系統(tǒng),給出了一種經(jīng)一次迭代輸出誤差即收斂至零的控制方法;文獻(xiàn)[7]針對(duì)一類含輸入時(shí)滯的非線性離散系統(tǒng)提出了一種迭代算法,使得系統(tǒng)能在不確定初始狀態(tài)下跟蹤誤差收斂到零;文獻(xiàn)[8]利用2D系統(tǒng)理論討論了開(kāi)閉環(huán)迭代學(xué)習(xí)控制并給出了系統(tǒng)收斂的充分必要條件;文獻(xiàn)[9]提出了一種基于Roesser模型的MIMO系統(tǒng)學(xué)習(xí)率的參數(shù)選取方法,并給出了受擾動(dòng)的線性時(shí)變離散系統(tǒng)輸出收斂的充分條件;文獻(xiàn)[10]通過(guò)引入以往控制信息對(duì)當(dāng)前控制的影響函數(shù),構(gòu)造了一個(gè)具有較快收斂速度的新型迭代學(xué)習(xí)算法并利用2D理論證明了其收斂性;文獻(xiàn)[11]在文獻(xiàn)[6]的基礎(chǔ)上將2D線性時(shí)變離散系統(tǒng)的ILC過(guò)程轉(zhuǎn)變?yōu)?D線性時(shí)不變離散系統(tǒng)的ILC過(guò)程,并給出了兩類特殊的線性時(shí)變離散系統(tǒng)收斂的充分和必要條件。
本文針對(duì)含有非線性項(xiàng)的時(shí)變系統(tǒng),提出了一種基于Roesser模型的2D學(xué)習(xí)率,與傳統(tǒng)的非線性系統(tǒng)差分型迭代學(xué)習(xí)率進(jìn)行了比較,證明改進(jìn)后的學(xué)習(xí)率具有更快的收斂速度。最后,對(duì)一個(gè)實(shí)際系統(tǒng)進(jìn)行了數(shù)值仿真,并與差分型算法進(jìn)行比較,驗(yàn)證了文中所提方法的正確性。
2D時(shí)變系統(tǒng)的Roesser模型可由式(1)定義
考慮如下含非線性項(xiàng)的時(shí)變離散系統(tǒng)
式中:x(t)∈Rn,u(t)∈Rm,y(t)∈Rp分別為系統(tǒng)的狀態(tài)向量,輸入向量和輸出向量;f(x,t)為非線性項(xiàng),是關(guān)于狀態(tài)向量x(t)和時(shí)間t的非線性函數(shù),并且滿足Lipschitz條件;A(t),B(t),C(t)為具有適當(dāng)維度的實(shí)矩陣。設(shè)式(2)滿足如下幾個(gè)假設(shè)。
假設(shè)1 非線性項(xiàng)f(x,t)滿足全局Lipschitz條件,即對(duì)任意的 t∈[0,T]存在常數(shù) kf,使得‖f(x1,t) -f(x2,t)‖≤kf‖x1- x2‖。
假設(shè)2 每次迭代的初始條件總是相同的,即xk(0)=xd(0)。其中:xk(0)表示第k次的初始狀態(tài);xd(0)表示期望軌跡的初始狀態(tài)。
假設(shè)3 矩陣C(t)B(t-1)滿秩。
迭代學(xué)習(xí)控制可以做如下描述:對(duì)于給定的式(2),在滿足邊界條件x(0)=x0的前提下,尋找一個(gè)理想控制輸入u(t),t=0,1,…,N -1,使得系統(tǒng)能夠完全跟蹤期望輸出軌跡 yr(t),t=0,1,…,N。下面給出一種通用的ILC學(xué)習(xí)律
式中,Δu(t,k)是對(duì)第k次控制輸入的修正量。將式(2)寫成2D Roesser模型
邊界條件為
記迭代學(xué)習(xí)的第k次和第k+1次狀態(tài)值之差為η(t,k)=x(t-1,k+1) -x(t-1,k),非線性項(xiàng)之差為Δf(t,k)=f(x(t-1,k+1),t-1) - f(x(t-1,k),t-1),輸出誤差為 e(t,k)=yr(t) - y(t,k)。由式(4)和式(5)可知
結(jié)合式(6)和式(7)
令
將式(9)代入式(8)中,可得
為了將式(10)轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)的2D Roesser模型,取
由于非線性項(xiàng)滿足 Lipschitz條件 Δf(t,k)≤K·,即Δf(t,k)存在一定的上限 ε,故一定存在這樣的離散函數(shù)K4(t)和K5(t)使得Δf(t,k)=K4(t)·η(t,k)+K5(t)e(t,k)。將 Δf(t,k)代入到式(11)中,整理得
其中
假設(shè)R(t)=
由于第k+1次系統(tǒng)的狀態(tài)未知,所以無(wú)法直接使用上述學(xué)習(xí)率。在算法中使用開(kāi)環(huán)差分型迭代學(xué)習(xí)率[12]對(duì)第k+1次的狀態(tài)進(jìn)行估計(jì)。
基于以上推論給出下面的校正算法。
1) 當(dāng) k=0 時(shí),u0(t)=0,x(0)=x0,并取 K(t,k)=β(t,k)(C(t)B(t- 1))T[C(t)B(t- 1)(C(t)B(t-1))T]-1,K2(t)=(C(t)B(t-1))T[C(t)B(t-1)(C(t)·B(t-1))T]-1,K1(t)= - K2(t)C(t)A(t-1),K3(t)=- (C(t)B(t-1))T[C(t)B(t-1)(C(t)B(t-1))T]-1·C(t),其中 β(t,k)為一個(gè)待定參數(shù)使得 K(t,k)滿足‖I-K(t,k)C(t+1)B(t)‖≤p<1,設(shè)置最大迭代次數(shù)為 Kmax。
2) 如果 k<Kmax或者
則從引理1可以得到如下定理。
定理1對(duì)于含有非線性項(xiàng)的線性離散系統(tǒng),若存在矩陣 K1(t)和 K2(t)使得‖R(t)‖<1,t=1,2,…,則迭代學(xué)習(xí)控制率1,2,…,N,設(shè)置 Fflag=0,否則設(shè)置 Fflag=1。根據(jù)步驟1)計(jì)算 y(t,0),并用開(kāi)環(huán)迭代學(xué)習(xí)率計(jì)算 u(t,1)的預(yù)估值 uα(t,1),即 uα(t,1)=u(t,0)+K(t+1)·(e(t+1,0) -e(t,0))。從而將 uα(t,1)代入式(2)可得系統(tǒng)的狀態(tài)值 xα(t,1)以及 y(t,1)的估計(jì)值 yα(t,1)。
3)根據(jù) yα(t,1),得出第一次的誤差估計(jì)值eα(t,1)。將 eα(t,1)、xα(t,1) 分別當(dāng)作 e(t,1) 和x(t,1),從而可以使用學(xué)習(xí)率 u(t,k+1)=u(t,k)+K1(t+1)[x(t,k+1) - x(t,k)]+K2(t+1)e(t+1,k)+K3(t+1)[f(x(t,k+1),t) - f(x(t,k),t)]得出校正后的 y(t,1)。
校正算法流程如圖1所示。
圖1 校正算法結(jié)構(gòu)流程圖Fig.1 The flow chart of the correction algorithm
本文所用的仿真示例來(lái)源于文獻(xiàn)[6],在原系統(tǒng)的基礎(chǔ)上加入了非線性項(xiàng)
對(duì)于此仿真實(shí)例,取初始條件 x(0)=0,K(t,k)的值取為 K(t,k)=0.5(C(t)B(t-1))T[C(t)B(t-1)·(C(t)B(t-1))T]-1,期望軌跡為 yd(t)=1.5 sin(0.06t),t=0,1,2,…,N。仿真結(jié)果如圖2 ~圖4 所示。
從圖2可以看到系統(tǒng)在式(14)的作用下,輸出曲線逐漸逼近于給定的期望曲線;圖3顯示了最后一次迭代的時(shí)候系統(tǒng)的輸出曲線已經(jīng)完全和給定的期望軌跡重合;圖4所示為差分型ILC學(xué)習(xí)率和校正算法收斂速度的比較,從圖中可以看出改進(jìn)后的算法具有更快的收斂速度,并且跟蹤性能良好。
圖2 系統(tǒng)在式(14)作用下每次迭代產(chǎn)生的輸出曲線和期望輸出曲線Fig.2 Tracking performance of ILC system output at different time-steps and iterations using ILC rule(14)
圖3 最后一次迭代的輸出曲線和期望輸出曲線Fig.3 Tracking performance of ILC system output at the last iteration
圖4 差分型ILC學(xué)習(xí)率和校正算法收斂速度比較Fig.4 The total squared error at different numbers of iterations using the proposed ILC rule(14)and discrete differentiating ILC rules
本文基于2D系統(tǒng)理論,對(duì)含非線性項(xiàng)的時(shí)變離散系統(tǒng)提出了一種改進(jìn)的學(xué)習(xí)率,將2D系統(tǒng)理論引入非線性系統(tǒng)的迭代學(xué)習(xí)控制,拓寬了2D系統(tǒng)理論應(yīng)用于迭代學(xué)習(xí)控制的范疇。與傳統(tǒng)的非線性系統(tǒng)的迭代學(xué)習(xí)率相比,本文提出的學(xué)習(xí)率可以有效地提高迭代學(xué)習(xí)的收斂速度,在經(jīng)過(guò)有限次的迭代后能使系統(tǒng)輸出完全跟蹤給定的輸出曲線。
[1] LONGMAN R W.Iterative learning control and repetitive control for engineering practice[J].International Journal of Control,2000,73(10):930-954.
[2] 皮道映,孫優(yōu)賢.非線性時(shí)變系統(tǒng)開(kāi)閉環(huán)P型迭代學(xué)習(xí)控制的收斂性[J].自動(dòng)化學(xué)報(bào),1999,25(3):351-354.
[3] 蔣思中,朱芳來(lái),王心開(kāi),等.模糊增益PD型迭代學(xué)習(xí)算法及其應(yīng)用[J].電光與控制,2009,16(8):72-74.
[4] KUREK J E,ZAREMBA M B.Iterative learning control synthesis based on 2-D system theory[J].J of Intell Robot Syst.1993,38(1):121-125.
[5] FANG Y,CHOW T W S.2-D analysis for iterative learning control for discrete-time systems with variable initial conditions[J].IEEE Transactions on Circuits and Systems-I:Fundamental Theory and Applications,2003,50(5):722-727.
[6] LI X D,HO J K L,CHOW T W S.Iterative learning control for linear time-variant discrete systems based on 2-D system theory[J].IEE Proc:Control Theory and Applications,2005,152(1):13-18.
[7] LI X D,CHOW T W S,HO J K L.Iterative learning control for a class of nonlinear discrete-time systems with multiple input delays[J].International Journal of Systems Science,2008,39(4):361-369.
[8] 蔣思中,王改云.基于2-D系統(tǒng)理論的D型開(kāi)閉環(huán)迭代學(xué)習(xí)控制[J].電光與控制,2010,17(1):37-39.
[9] 黃彧偉,張國(guó)山.受擾動(dòng)2-D線性時(shí)變系統(tǒng)的迭代學(xué)習(xí)控制[J].控制理論與應(yīng)用,2007,24(6):999-1003.
[10] 林輝,回立川.基于影響函數(shù)的迭代控制器2-D分析與設(shè)計(jì)[J].信息與控制,2009,38(5):558-562.
[11] LI X D,HO J K L.Further results on iterative learning control with convergence conditions for linear timevariant discrete systems[J].International Journal of Systems Science,2011,42(6):989-996.
[12] SAAB S S.Robustness and convergence rate of a discrete-time learning control algorithm for a class of nonlinear systems[J].International Journal of Robust Nonlinear Control,1999,9(9):559-571.