范雄梅,明 森,姚江燕,楊 婕
(1.中北大學(xué)大數(shù)據(jù)學(xué)院,太原 030051;2.中北大學(xué)數(shù)學(xué)學(xué)院,太原 030051)
迭代學(xué)習(xí)控制(iterative learning control,ILC)是在1984 年由ARIMOTO S 等提出的一種控制方法,其對(duì)重復(fù)運(yùn)動(dòng)的控制系統(tǒng)軌跡跟蹤性能具有改善作用[1]。該控制方法算法簡(jiǎn)潔,而且可以不依賴于動(dòng)態(tài)系統(tǒng)的精確數(shù)學(xué)模型,適用于處理不確定、強(qiáng)耦合、非線性、難以建模的復(fù)雜系統(tǒng)。因此,迭代學(xué)習(xí)控制在機(jī)器人控制領(lǐng)域的應(yīng)用被廣泛關(guān)注。
目前,已經(jīng)相繼出現(xiàn)了P 型、PD 型、PID 型學(xué)習(xí)律,均可寫為
值得指出的是微分系數(shù)Γ,比例系數(shù)L,積分系數(shù)ψ 在PID 算法中的作用各不相同。微分項(xiàng)的作用是使系統(tǒng)的動(dòng)態(tài)特性得到改善;比例項(xiàng)的作用是使系統(tǒng)動(dòng)作靈敏,速度加快,穩(wěn)態(tài)誤差減小;積分項(xiàng)的作用是消除穩(wěn)態(tài)誤差,從而提高系統(tǒng)的控制性能。
許多學(xué)者利用迭代學(xué)習(xí)控制算法對(duì)移動(dòng)機(jī)器人軌跡跟蹤控制進(jìn)行了研究。文獻(xiàn)[2]利用P 型開(kāi)閉環(huán)迭代學(xué)習(xí)控制算法使移動(dòng)機(jī)器人跟蹤期望軌跡。文獻(xiàn)[3]引入狀態(tài)補(bǔ)償項(xiàng),并設(shè)計(jì)新的迭代學(xué)習(xí)增益矩陣,優(yōu)化了移動(dòng)機(jī)器人的軌跡跟蹤效果。結(jié)合PD 型開(kāi)閉環(huán)迭代學(xué)習(xí)律,文獻(xiàn)[4]研究了移動(dòng)機(jī)器人的軌跡跟蹤迭代學(xué)習(xí)控制,仿真結(jié)果說(shuō)明了其收斂速度優(yōu)于其他算法。文獻(xiàn)[5-6]提出了迭代學(xué)習(xí)控制與智能控制相結(jié)合的算法,該算法不依賴于系統(tǒng)的數(shù)學(xué)模型,為研究非完整移動(dòng)機(jī)器人運(yùn)動(dòng)控制問(wèn)題提供了新方法。更多相關(guān)的研究見(jiàn)文獻(xiàn)[7-15]。
在迭代學(xué)習(xí)控制算法中,關(guān)于學(xué)習(xí)增益矩陣的選取目前尚未完善。由于控制算法在無(wú)限時(shí)間收斂是無(wú)意義的,因此,提高迭代學(xué)習(xí)控制算法的收斂速度值得研究。本文通過(guò)對(duì)學(xué)習(xí)律進(jìn)行改進(jìn),在滿足迭代學(xué)習(xí)控制收斂穩(wěn)定時(shí),收斂速度會(huì)明顯加快。在PD 型開(kāi)閉環(huán)迭代學(xué)習(xí)律中添加狀態(tài)補(bǔ)償項(xiàng),并設(shè)計(jì)新的迭代學(xué)習(xí)增益矩陣,從而提高跟蹤精度。
輪式移動(dòng)機(jī)器人(wheeled mobile robot,WMR)的運(yùn)動(dòng)學(xué)方程可描述為
其中,x 和y 是WMR 的坐標(biāo)位置、θp是WMR 的方位角、vp,wp分別為WMR 的線速度和角速度,表示移動(dòng)機(jī)器人的控制輸入。
為了利用迭代學(xué)習(xí)控制算法對(duì)移動(dòng)機(jī)器人進(jìn)行軌跡跟蹤控制,現(xiàn)對(duì)式(1)進(jìn)行離散化處理,即得其離散運(yùn)動(dòng)學(xué)方程
其中,ΔT 為采樣時(shí)間。
引入迭代學(xué)習(xí)控制算法,選取WMR 的速度作為系統(tǒng)輸入up(k)=(vp(k),wp(k))T;WMR 的位姿作為系統(tǒng)輸出y(k)=(xp(k),yp(k),θp(k))T;期望位姿狀態(tài)為q(k)=(xd(k),yd(k),θd(k))T??紤]到實(shí)際系統(tǒng)存在噪聲和干擾,則移動(dòng)機(jī)器人的運(yùn)動(dòng)學(xué)模型可表示為
其中,i 為迭代次數(shù);k 為離散時(shí)間,且1≤k≤N(k∈N;N 表示自然數(shù)集);N 為采樣數(shù);β(k)為狀態(tài)干擾;γ(k)為輸出測(cè)量噪聲,
式(3)和式(4)滿足如下性質(zhì)和假設(shè)條件。
性質(zhì)1 考慮理想情形,選取βi(k)=0,γi(k)=0,k∈N,則期望軌跡為
qd(k+1)=qd(k)+B(qd(k),k)ud(k)yd(k)=Cqd(k)
性質(zhì)2 矩陣B(qi(k),k)為滿秩矩陣,有界且滿足Lipschitz 條件||B(qi(k),k)||≤bB,||B(q1(k),k)-B(q2(k),k)||≤cB||q1-q2||,其中,k∈N,bB>0,cB>0 為常數(shù)。
1)控制輸入有界max1≤k≤N||ui(k)||≤bu,其中,N為采樣數(shù),bu≥0 為常數(shù)。
2)狀 態(tài) 干 擾 和 輸 出 噪 聲 有 界:maxi∈N*maxk∈N||βi(k)||≤bβ,maxi∈N*maxk∈N||γi(k)||≤bγ,其中,bβ>0,bγ>0 為常數(shù)。
3)每次迭代軌跡從qd(0)的鄰域開(kāi)始:||qd(0)-qi(0)||≤b0,其中,b0>0,i∈N*。
則移動(dòng)機(jī)器人的軌跡跟蹤問(wèn)題即確定up(k)=(vp(k),wp(k))T,使得xp(k)→xd(k),yp(k)→yd(k)和θp(k)→θd(k)。
根據(jù)控制算法中是否包含當(dāng)前輸出誤差信息,迭代學(xué)習(xí)控制可以分為開(kāi)環(huán)學(xué)習(xí)和閉環(huán)學(xué)習(xí),基本結(jié)構(gòu)如下頁(yè)圖1 和圖2 所示。
圖1 開(kāi)環(huán)學(xué)習(xí)的基本結(jié)構(gòu)Fig.1 The basic structure of open-loop learning
圖2 閉環(huán)學(xué)習(xí)的基本結(jié)構(gòu)Fig.2 The basic structure of closed-loop learning
本文采用改進(jìn)的PD 型開(kāi)閉環(huán)迭代學(xué)習(xí)控制律,其離散形式為:
其中,ei(k)=yd(k)-yi(k)為系統(tǒng)第i 次運(yùn)行時(shí)的跟蹤誤差。L1,L2表示有界學(xué)習(xí)增益矩陣,L3為補(bǔ)償增益矩陣,滿足||L1(k)||≤bL1,||L2(k)||≤bL2,||L3(k)||≤bL3,bL1,bL2,bL3>0。由于[ei+1(k)-ei(k)]與-[yi+1(k)-yi(k)]相等,所以用L3(k)(ei+1(k)-ei(k))來(lái)補(bǔ)償在k 時(shí)刻第i+1 次迭代與第i 次迭代之間的迭代誤差。添加狀態(tài)補(bǔ)償項(xiàng),不僅提高算法收斂的速度,而且弱化了初始條件和Lipschitz 條件的限制,從而提高跟蹤精度。對(duì)于移動(dòng)機(jī)器人而言,縮短了其軌跡跟蹤時(shí)間,同時(shí)有效防止外界干擾。
由式(5)的迭代學(xué)習(xí)控制律,移動(dòng)機(jī)器人軌跡跟蹤的控制結(jié)構(gòu)原理如圖3 所示。
圖3 移動(dòng)機(jī)器人迭代學(xué)習(xí)控制系統(tǒng)結(jié)構(gòu)Fig.3 Iterative learning control system structure for mobile robot
對(duì)式(5)中的學(xué)習(xí)增益矩陣進(jìn)行改進(jìn),可得
定理1 若式(3)~式(4)滿足假設(shè)1)~假設(shè)3),采用控制律式(6),當(dāng)?shù)螖?shù)i→∞時(shí),||ui(k)-ud(k)||,||yi(k)-yd(k)||,||qi(k)-qd(k)||有界并收斂于bβ,bγ,b0(若忽略所有干擾,則ui(k),yi(k),qi(k)分別收斂于ud(k),yd(k),qd(k))的充分條件為||[I+L2(k)B(qi(k),k)]-1[I-L2(k)B(qi(k),k)]||=ρ<1
其必要條件為||[I+L2(0)B(0)]-1[I-L2(0)B(0)]||<1。
詳細(xì)證明見(jiàn)文獻(xiàn)[7]。
本文利用Matlab 工具對(duì)移動(dòng)機(jī)器人運(yùn)動(dòng)學(xué)模型進(jìn)行仿真,若不考慮干擾和噪聲,給出P 型開(kāi)閉環(huán)迭代學(xué)習(xí)控制算法對(duì)不同軌跡曲線的跟蹤效果。
1)圓軌跡跟蹤:參考軌跡xd(t)=cosπt,yd(t)=sinπt,θd(t)=πt+π/2,初始狀態(tài)xd(0)=1,yd(0)=0,θd(0)=π/2。如圖4 ~圖6 所示。
圖4 圓軌跡隨迭代次數(shù)的跟蹤過(guò)程Fig.4 The tracking process of circular trajectory with times of iterations
圖5 圓軌跡迭代180 次的結(jié)果Fig.5 The result for 180 iterations of circular trajectory
圖6 圓軌跡誤差迭代收斂過(guò)程Fig.6 Iterative convergence process of circular trajectory errors
2)正弦曲線軌跡跟蹤:參考軌跡xd(t)=t,yd(t)=sint,θd(t)=tan-1(cost),初始狀態(tài)xd(0)=0,yd(0)=0,θd(0)=π/4。如下頁(yè)圖7~圖9 所示。
圖7 正弦軌跡隨迭代次數(shù)的跟蹤過(guò)程Fig.7 The tracking process of sinusoidal trajectory with times of iterations
圖8 正弦軌跡迭代180 次的結(jié)果Fig.8 The result for 180 iterations of sinusoidal trajectory
圖9 正弦軌跡誤差迭代收斂過(guò)程Fig.9 Iterative convergence process of sinusoidal trajectory error
3)指數(shù)軌跡跟蹤:參考軌跡xd(t)=t,yd(t)=et,θd(t)=tan-1(et),初始狀態(tài)xd(0)=0,yd(0)=1,θd(0)=π/4。如圖10~圖12 所示。
圖11 指數(shù)軌跡迭代180 次的結(jié)果Fig.11 The result for 180 iterations of exponential trajectory
圖12 指數(shù)軌跡誤差迭代收斂過(guò)程Fig.12 Iterative convergence process of exponential trajectory error
圖13 圓軌跡隨迭代次數(shù)的跟蹤過(guò)程Fig.13 The tracking process of circular trajectory with times of iterations
圖14 圓軌跡迭代20 次的結(jié)果Fig.14 The result for 20 iterations of circular trajectory
由圖4~圖12 可知,不同參考軌跡的跟蹤效果也不同。指數(shù)軌跡跟蹤迭代過(guò)程比正弦軌跡迭代過(guò)程和圓軌跡迭代過(guò)程快,正弦軌跡跟蹤迭代過(guò)程比圓軌跡迭代過(guò)程稍快。仿真結(jié)果表明,軌跡越簡(jiǎn)單,收斂過(guò)程越快。
下文給出改進(jìn)前和改進(jìn)后的PD 型開(kāi)閉環(huán)迭代學(xué)習(xí)控制算法對(duì)正弦軌跡跟蹤效果的影響。
改進(jìn)前,采用文獻(xiàn)[4]中的PD 型學(xué)習(xí)控制律
由圖18 可知,改進(jìn)后的迭代學(xué)習(xí)控制算法在迭代次數(shù)為10 次時(shí)完全收斂,跟蹤誤差在10 次之后趨于0,在迭代20 次時(shí),基本保持穩(wěn)定。而改進(jìn)前的迭代學(xué)習(xí)控制算法在迭代20 次時(shí)才完全收斂,如圖15 所示。通過(guò)比較可知,改進(jìn)后的迭代學(xué)習(xí)控制算法優(yōu)于改進(jìn)前的迭代學(xué)習(xí)控制算法。
圖15 圓軌跡誤差迭代收斂過(guò)程Fig.15 Iterative convergence process of circular trajectory errors
圖16 圓軌跡隨迭代次數(shù)的跟蹤過(guò)程Fig.16 The tracking process of circular trajectory with times of iterations
圖17 圓軌跡迭代20 次的結(jié)果Fig.17 The result for 20 iterations of circular trajectory
圖18 圓軌跡誤差迭代收斂過(guò)程Fig.18 Iterative convergence process of circular trajectory errors
本文運(yùn)用迭代學(xué)習(xí)控制算法對(duì)輪式移動(dòng)機(jī)器人的軌跡跟蹤問(wèn)題進(jìn)行了研究。在不考慮干擾和噪聲的情況下,對(duì)已有的PD 型開(kāi)閉環(huán)迭代學(xué)習(xí)控制算法進(jìn)行改進(jìn),從而提出一種具有狀態(tài)補(bǔ)償項(xiàng)的PD型開(kāi)閉環(huán)迭代學(xué)習(xí)控制算法。通過(guò)改進(jìn)前后的比較,可知改進(jìn)后的迭代學(xué)習(xí)過(guò)程更快收斂于期望值且誤差更小。表明本文提出的迭代學(xué)習(xí)控制算法對(duì)移動(dòng)機(jī)器人的軌跡跟蹤控制具有良好的控制效果。