李國軍,周國民,陳東杰,許中石
(1.浙江警察學(xué)院公共基礎(chǔ)部,浙江杭州310053;2.浙江警察學(xué)院計算機(jī)與信息技術(shù)系,浙江杭州310053)
學(xué)習(xí)本是指人們通過閱讀、聽講、思考、研究、實踐等途徑獲得知識或技能的過程,目前已被廣泛引申到其他領(lǐng)域。控制領(lǐng)域的學(xué)習(xí)大致可分為三類:單一目標(biāo)學(xué)習(xí),多目標(biāo)學(xué)習(xí)以及量化的生物學(xué)習(xí)。經(jīng)過研究者的不斷努力,學(xué)習(xí)控制理論體系已日益完善并成為控制方法論中的一個重要分支。學(xué)習(xí)控制主要包括迭代學(xué)習(xí)控制和重復(fù)學(xué)習(xí)控制[1]。迭代學(xué)習(xí)控制(iterative learning control,簡稱ILC)適用于在有限區(qū)間重復(fù)作業(yè)的場合,利用先前的控制輸入和輸出產(chǎn)生當(dāng)前次的輸入,以便改進(jìn)輸出效果,經(jīng)過多次迭代以后,系統(tǒng)能夠?qū)崿F(xiàn)完全無誤差跟蹤[2-3]。重復(fù)學(xué)習(xí)控制同樣著眼于利用受控對象和目標(biāo)軌跡的周期性或重復(fù)性,利用上一周期的輸入輸出信息來改善當(dāng)前的控制輸入,以期獲得理想的輸出效果。最大的區(qū)別在于迭代學(xué)習(xí)控制目標(biāo)是在有限區(qū)間上達(dá)到完全跟蹤,而重復(fù)學(xué)習(xí)控制目標(biāo)是在無限區(qū)間上達(dá)到漸近跟蹤。由于設(shè)計簡單、在線計算量小、控制效果好,學(xué)習(xí)控制被應(yīng)用于工業(yè)機(jī)器人控制、化工過程控制等場合。
應(yīng)用ILC方法時,要求每次的初始定位必須處于某個理想位置,但實際上無法做到。實際應(yīng)用時只能在某個指定區(qū)間實現(xiàn)完全跟蹤。在此情形下,可放松對初始定位條件的限制,即每次迭代時的初始狀態(tài)可不相同。重復(fù)學(xué)習(xí)控制對初始定位操作不作要求,從而回避了迭代學(xué)習(xí)控制中的初始定位問題,一定程度上推廣了重復(fù)學(xué)習(xí)控制的應(yīng)用范圍。
在有初態(tài)偏差的情形下,為了實現(xiàn)完全跟蹤,研究者做了大量有益的工作[4-22]。目前的解決方法主要分為兩類,一類是壓縮映射方法,另一類是Lyapunov-like方法。LEE等[9]和PARK等[10]提出了一種基于固定初態(tài)誤差的修正方法,能在指定區(qū)間實現(xiàn)完全跟蹤;針對線性連續(xù)多智能系統(tǒng),李國軍等[12]提出了一種用step-by-step控制器修正高階多智能體的初態(tài)誤差方法,但該方法只能修正固定初態(tài)誤差,無法修正任意初態(tài)誤差;LI等[13]提出了一種針對任意初態(tài)誤差的修正方法,但無法完全修正初始誤差,而且只適用于一階系統(tǒng)。對于相對高階離散系統(tǒng),在初態(tài)偏差滿足某種特定條件下,LI等[14]實現(xiàn)了精確跟蹤;對于迭代時變不確定系統(tǒng),MEMG等[15]實現(xiàn)了有界跟蹤。對于任意初態(tài)誤差的情形,一般采用Lyapunov-like分析方法[16-22];CHIEN等[18]應(yīng)用邊界層方法達(dá)到了漸近跟蹤;文獻(xiàn)[19-21]利用吸引子達(dá)到了實際完全跟蹤;YIN等[22]提出了一種離散自適應(yīng)ILC方法,能確保系統(tǒng)沿著迭代軸漸近收斂、沿著時間軸在指定區(qū)間內(nèi)逐點收斂。
無論是迭代學(xué)習(xí)控制還是重復(fù)學(xué)習(xí)控制都有自己的優(yōu)勢。但一般的過程控制,既不滿足迭代學(xué)習(xí)控制有限區(qū)間重復(fù)作業(yè)的要求,也不滿足重復(fù)學(xué)習(xí)控制中目標(biāo)軌跡具有周期性或重復(fù)性的特點。本文針對任意初態(tài)下帶有擾動的線性定常系統(tǒng),利用迭代學(xué)習(xí)控制的思想,提出了一種新的學(xué)習(xí)控制算法,該算法將受控過程分成無窮個子過程,不僅可利用上一子過程的輸入輸出信息來調(diào)節(jié)當(dāng)前的輸入,而且還可通過初始修正策略獲得更快更好的控制效果。該算法系統(tǒng)穩(wěn)定,且當(dāng)子過程長度趨向零時,可實現(xiàn)任意小誤差跟蹤。
考慮線性定常系統(tǒng)
其中,t∈ [0,∞ ),x(t)∈Rn,y(t)∈Rr,u(t)∈Rm分別表示系統(tǒng)狀態(tài)、控制輸入和輸出向量,ω(t)∈Rn為系統(tǒng)擾動。A,B,C是合適維數(shù)的系統(tǒng)參數(shù)矩陣,并且B,C可逆。
設(shè)yd(t)是給定的期望軌跡,xd(t)是給定的期望狀態(tài),e(t)=yd(t)-y(t)表示輸出誤差。
假設(shè) 初始狀態(tài)x(0)隨機(jī),并且狀態(tài)x(t)可測。
為便于收斂性分析,采用以下形式來描述系統(tǒng)(1):
其中,t∈[0,h]指有限時間,h為預(yù)設(shè)的時間常量;k=0,1,2,…,可以理解為迭代次數(shù);xk(t)∈Rn,yk(t)∈Rr,uk(t)∈Rm,ωk(t)∈Rn(相應(yīng)可以簡寫為xk,yk,uk,ωk)分別表示系統(tǒng)狀態(tài)、控制輸入、輸出和擾動向量。
設(shè)yk,d(t)和xk,d(t)(可簡寫為yk,d和xk,d)分別表示kh+t時刻的期望軌跡和期望狀態(tài),ek(t)=yk,d(t)-yk(t)表示kh+t時刻的輸出誤差。
由系統(tǒng)(2)和系統(tǒng)(1),有
同理,yk(t),yk,d(t),xk,d(t),ωk(t)和ek(t)也具有類似于式(3)的性質(zhì)。
本節(jié)的任務(wù)是設(shè)計一套控制算法,使得系統(tǒng)(2)能跟蹤期望軌跡。為此,提出下面的控制律:
其中,
事實上,控制律中的函數(shù)Θ(t)并不唯一,但須滿足以下性質(zhì):
性質(zhì)對函數(shù)Θ(t),有
注1此性質(zhì)表明,Θ(t)函數(shù)經(jīng)過1次積分后具有與脈沖函數(shù)類似的作用。而實際中,脈沖函數(shù)是不存在的,因此可用此函數(shù)代替脈沖函數(shù)。
這一節(jié)著重分析系統(tǒng)(2)在應(yīng)用控制律(4)以后的收斂性。上節(jié)提出的控制律(4)中,引入了初始修正函數(shù)Θ(t),關(guān)于初始修正函數(shù)有以下定理:
定理如果初始狀態(tài)是任意有限值,C,B,I+CBΓ1都是可逆矩陣,并且滿足
那么,修正控制律(4)能使系統(tǒng)(2)跟蹤目標(biāo)軌跡,并且當(dāng)k→∞時,跟蹤誤差可達(dá)任意小。
證明為書寫方便,記
當(dāng)t∈[kh,(k+1)h)時,可得
上式兩端同乘以矩陣C,整理后可得
代入Ξk(0)和Ξk+1(0)的表達(dá)式,進(jìn)一步化簡上式,可得
上式兩端同時左乘(I+CBΓ1)-1,可得
假設(shè)軌跡
可實現(xiàn),相應(yīng)的誤差記為e*k(t)=yk*,d(t)-yk(t),而且
由式(6)和(7)得
時,有
且當(dāng)t=h時,根據(jù)Θ(t)函數(shù)的性質(zhì)有
由式(7)有
注2由β的定義知
事實上,如果系統(tǒng)(2)無擾動,只需采用以下控制律即可:
其中,
在此情形下,
上式兩端同乘以C并代入Ξ(0),化簡后可得
因此,當(dāng)t≥h時,誤差e(t)≡ 0。
考慮連續(xù)系統(tǒng)
顯然,該系統(tǒng)不穩(wěn)定。其作業(yè)區(qū)間為[0,20],系統(tǒng)的跟蹤軌跡為yd,1(t)=cos(0.1πt),yd,2(t)=sin(0.1πt)。系統(tǒng)擾動為rand(rand表示0~1之間的隨機(jī)數(shù)),系統(tǒng)運行之前的初始狀態(tài)為x1(0)=0,x2(0)=0??刂圃鲆姒?=0.8,Γ1=0.8,修正時間h=0.2。仿真結(jié)果如圖1~圖3所示。
圖1 期望軌跡yd(t)和實際軌跡y(t)Fig.1 Desired trajectoryyd(t)and actual trajectoryy(t)
從圖1和圖2中可以看出,系統(tǒng)在初始階段并未跟蹤上目標(biāo)軌跡,而是經(jīng)過若干個周期的修正后才實現(xiàn)跟蹤,但仍無法達(dá)到完全跟蹤。
圖2 實際跟蹤誤差e(t)Fig.2 Actual tracking errore(t)
圖3 控制量u(t)Fig.3 Actual tracking erroru(t)
從圖3中可以看出,系統(tǒng)以0.2為周期不斷進(jìn)行修正,直至誤差為零。由于跟蹤過程中存在隨機(jī)擾動,控制器存在輕微顫振。
若系統(tǒng)無擾動,則只需經(jīng)過1次修正即可達(dá)到完全跟蹤。
討論了帶有擾動的線性定常系統(tǒng)的學(xué)習(xí)控制問題,基于迭代學(xué)習(xí)控制思想,借助壓縮映射手段,提出了一種帶修正因子的控制策略。對于連續(xù)系統(tǒng),通過不斷修正跟蹤誤差,將誤差控制在一定范圍,當(dāng)修正區(qū)間長度趨于零時,可實現(xiàn)任意小誤差跟蹤。特別地,當(dāng)系統(tǒng)無擾動時,可在指定區(qū)間實現(xiàn)完全跟蹤。本文從理論和實踐兩方面驗證了算法的有效性。