楊亮亮,張 暉,張 華,魯文其
(浙江理工大學機械與自動控制學院,浙江杭州 310018)
在高速高精度運動控制中,一般采用反饋加前饋的二自由度復合控制策略[1–2].其中反饋控制器用來保證系統(tǒng)的穩(wěn)定性和對擾動及參數(shù)攝動的魯棒性,前饋控制器用以提高系統(tǒng)響應速度以及軌跡跟蹤性能[3–5].常見的前饋控制方法有兩種,一種是基于前饋力注入的控制方法;另外一種是基于模型的前饋控制.基于前饋力注入的前饋控制方法一般通過最優(yōu)化方法獲取最優(yōu)前饋力后將其注入到控制系統(tǒng)中以獲得最優(yōu)控制性能,但是由于最優(yōu)前饋力是軌跡的泛函,當軌跡發(fā)生變化時,需要重新計算最優(yōu)前饋力,否則會導致控制性能惡化[6–9],因此,基于前饋力注入的設計方法一般用于固定軌跡的重復運動場合.而基于模型的前饋控制器設計方法其前饋控制器一般為被控對象模型的逆,因此,不會因為運動軌跡的變化而導致性能惡化,但是當對象為非最小相位系統(tǒng)時,其模型逆是不穩(wěn)定的,基于該模型逆設計的前饋控制器會導致前饋力過大超出執(zhí)行器輸出范圍[1–2,7,10–11].針對這一問題,Zou等[10,12]提出了有限時間預覽的穩(wěn)定逆的方法,但是該方法不僅要通過辨識方法獲取被控對象模型,對于復雜系統(tǒng)模型建立難度較大,而且穩(wěn)定逆逼近設計的方法相對比較復雜且對預覽時間有要求.
另一種基于模型的前饋控制方法是將前饋控制器參數(shù)化,得到的最優(yōu)參數(shù)與系統(tǒng)的模型有關,同樣不會隨著軌跡的變化而變化,也能實現(xiàn)良好的跟蹤性能[13–20].該方法避免了繁瑣的模型辨識過程,并且該前饋控制器是一個穩(wěn)定的有限脈沖響應濾波器[21–22].Boeren等[21–23]提出了引入基函數(shù)方法對前饋控制器參數(shù)化[24–25].文獻[21]采用基函數(shù)對前饋控制器進行參數(shù)化,通過最小二乘法進行最優(yōu)參數(shù)辨識,并運用在兩質(zhì)量運動模型上,驗證了前饋參數(shù)化算法能夠?qū)崿F(xiàn)不依賴參數(shù)模型而實現(xiàn)較高的軌跡跟蹤性能,但是當被控對象非單位分子時,算法性能會惡化.文獻[23]中改進了參數(shù)化前饋控制算法,加入了輸入整形濾波器,并對整形濾波器以及前饋控制器進行參數(shù)化,然后再經(jīng)過最小二乘法進行參數(shù)辨識,得到參數(shù)最優(yōu)值,適用于被控對象非單位分子的情況.文獻[26]在輸入整形與前饋參數(shù)化的基礎上,通過梯度下降法求解最優(yōu)前饋控制器,并運用于伺服控制平臺,實現(xiàn)良好的變軌跡跟蹤性能.這些方法中采用最小二乘法或梯度法進行最優(yōu)參數(shù)辨識,其中最小二乘法的性能指標只是誤差的二范數(shù),雖能夠通過一次迭代得到最優(yōu)參數(shù),但是對于執(zhí)行器受約束的情況,可能會導致得到的最優(yōu)前饋力超出了執(zhí)行器的輸出范圍,同樣,梯度法的性能指標也只是誤差的二范數(shù),其只能限制誤差隨辨識參數(shù)的變化快慢,未能考慮執(zhí)行器輸出受限時,前饋力超出其輸出范圍的問題.
因此,本文在文獻[23]的基礎上提出一種改進的前饋算法,改進算法的最優(yōu)控制目標函數(shù)考慮了系統(tǒng)的誤差,控制信號的迭代變化以及控制信號能量大小,通過數(shù)據(jù)驅(qū)動的方法逐步迭代達到參數(shù)最優(yōu)值,從而適用在執(zhí)行器受約束情況下的非重復性軌跡跟蹤任務,使運動控制系統(tǒng)在執(zhí)行器受約束時能夠?qū)崿F(xiàn)對非重復性軌跡的良好跟蹤性能.
本文結(jié)構如下: 第2節(jié)問題定義中介紹了參數(shù)化輸入整形濾波器與前饋控制器的前饋控制,并分析了現(xiàn)有控制方法辨識參數(shù)無約束造成的影響;第3節(jié)對改進算法的輸入整形濾波器與前饋控制器的參數(shù)辨識;第4節(jié)對改進算法與現(xiàn)有算法進行了比較,并對改進算法的參數(shù)收斂性進行了分析;第5節(jié)通過仿真與實驗對算法進行驗證,并對仿真與實驗結(jié)果進行分析;第6節(jié)進行總結(jié).
參數(shù)化輸入整形濾波器與前饋控制器控制系統(tǒng)框架如圖1所示.控制系統(tǒng)中輸入整形濾波器Ty對參考軌跡進行整形,前饋控制器Tff改善伺服性能,反饋控制器Cfb保證系統(tǒng)閉環(huán)穩(wěn)定,被控對象P為離散單輸入單輸出線性時不變系統(tǒng).系統(tǒng)傳遞函數(shù)可寫為
圖1 控制系統(tǒng)框架Fig.1 Control system framework
此外,r為事先規(guī)劃好的輸入軌跡信號,ry為整形輸入軌跡信號,y為輸出信號,ey為整形輸入信號與輸出信號的誤差,uff為前饋控制信號,ufb為反饋控制信號,u為被控對象的控制信號,v為干擾信號,其中規(guī)定敏感函數(shù)為T=CfbTy+Tff,系統(tǒng)敏感函數(shù)為S=(1+P Cfb)?1.
參考輸入軌跡為S型點到點軌跡[27],如圖2所示.當t ∈[t1,t2]時,為執(zhí)行段;當t ∈[t2,t3]時,為穩(wěn)定段,其中t1為運動起始時刻,t2為軌跡達到終點時刻,t3為軌跡達到終點位置后經(jīng)過一段時間后的運動穩(wěn)定時刻.
圖2 S型點到點參考軌跡Fig.2 S-shaped point-to-point reference trajectory
通過引入基函數(shù)將輸入整形濾波器Ty和前饋控制器Tff參數(shù)化為
式中:
其中:A(z?1,θ),B(z?1,θ)分別為輸入整形濾波器和前饋控制器的參數(shù)化多項式,θ為參數(shù)化基函數(shù)多項式要辨識的參數(shù),na,nb為組成Ty和Tff的基函數(shù)的個數(shù),Ts為采樣時間.基函數(shù)φi(z?1)可將輸入軌跡分解為各階導數(shù),例如在A(z?1,θ)中的加速度基函數(shù)φ2(z?1)可表示為
對應的參數(shù)θ2為系統(tǒng)質(zhì)量.
為了簡化符號的表達,辨識參數(shù)和基函數(shù)向量形式表示為
在圖1的控制框架中,第j+1次輸入整形濾波器和前饋控制器的更新公式為
文獻[22–23,26,28–29]中,為了使穩(wěn)定段誤差e最小,目標函數(shù)均定義為
由圖1可知ry=Tyr,圖2中在穩(wěn)定段時Ty|z=1=1,此時ry=r,但執(zhí)行段有一段延時,延時時長等于Ty中基函數(shù)的個數(shù)na.故當t ∈[t2+na,t3]時
因此在穩(wěn)定段目標函數(shù)J可寫為
由圖1可知
在文獻[21,23]中,根據(jù)式(11)通過最小二乘法獲得辨識參數(shù)的變化量θ?為
其中
由式(13)辨識參數(shù)θ的變化量θ?是無約束的,能夠使辨識參數(shù)θ一次得到最優(yōu)值.由圖1,式(7)–(8)可知,當θ?變化量過大可能導致前饋控制信號uff過大,從而造成控制信號u過大,對于執(zhí)行器受約束的系統(tǒng),控制信號過大會造成超出執(zhí)行器輸出范圍而導致性能惡化.
因此,一方面為了控制θ變化步長,另一方面為了防止控制信號u輸出過大超出執(zhí)行器的輸出范圍,本文引入新的目標性能函數(shù)式(15),對控制信號u和控制信號變化量?u進行約束,從而達到對辨識參數(shù)的約束.
迭代控制系統(tǒng)框架如圖1所示,在不考慮干擾v的情況下,由第j次迭代測量得到,uj,yj的數(shù)據(jù),可得
S與SP都跟參數(shù)模型有關,為了消除對模型的依賴,根據(jù)式(17)–(18)將其轉(zhuǎn)化為基于數(shù)據(jù)驅(qū)動的形式
在第j+1次迭代,由上述式子可知
參數(shù)的最小二乘估計,就是使目標函數(shù)J取極小值的參數(shù)θ?.使上式(32)取得極小值,求J對θ?的一階導數(shù),并令其為0,則
其中:λ為控制信號變化量的約束參數(shù),ρ是控制信號的約束參數(shù).要得到?,?L需要求解T?1,如果T?1不穩(wěn)定,可通過文獻[7,10]中方法進行穩(wěn)定逆逼近,也可參考文獻[11]中3種穩(wěn)定近似逆進行求解,相對于穩(wěn)定逆逼近,穩(wěn)定近似逆設計更為簡單,本文對于不穩(wěn)定逆采用穩(wěn)定近似逆的零相位誤差跟蹤技術[11,28].
文獻[21,23]中最小二乘法辨識參數(shù)如式(13)所示,文獻[26,29–30]中采用梯度下降法求解最優(yōu)前饋控制器,通過計算誤差ey對辨識參數(shù)的梯度值,來求解最優(yōu)參數(shù)值,其迭代學習律為
由式(13)(34)(38)可知,現(xiàn)有的最小二乘法是無約束的,未考慮執(zhí)行器的執(zhí)行能力,梯度下降法直接通過ρ影響辨識參數(shù)變化量θ?的收斂速度,相對于現(xiàn)有方法,本文算法是針對執(zhí)行器有約束的情況,通過約束參數(shù)λ和ρ直接限制控制信號變化量和控制能量的大小,同時間接的去約束辨識參數(shù)變化量θ?來影響辨識參數(shù)θ的收斂速度和收斂值,可以更直接有效防止執(zhí)行器超出輸出范圍.
輸入整形濾波器Ty和前饋控制器Tff均為有限脈沖響應濾波器,而在式(25)中誤差ey與有限脈沖響應濾波器參數(shù)成線性關系,由文獻[15,26]可知誤差ey是全局收斂的.由式(25)可知
因此可知,辨識參數(shù)θ收斂.
由式(34)可知通過調(diào)整約束參數(shù)λ和參數(shù)ρ,即可約束θ的變化量,當λ=0且ρ=0時,即是退化為式(13)的最小二乘算法.當ρ保持不變,λ取值越大,θ變化量越小,θ收斂到最優(yōu)值越慢,系統(tǒng)前饋控制信號達到最優(yōu)值的速度越慢,從而使得誤差收斂速度越慢,反之,則收斂速度越快.當λ保持不變,ρ越大,對控制信號約束作用越大,辨識參數(shù)變化量越小,誤差收斂值越大,反之誤差收斂值越小.
綜上所述,改進的前饋參數(shù)化算法實現(xiàn)步驟如下:
1) 選取θ初值和合適的約束參數(shù)λ和ρ.
2) 測量,uj,yj的值.
3) 通過測量值uj,yj計算
6) 不斷重復步驟2)–5),直到系統(tǒng)收斂到最優(yōu)跟蹤性能.
采用MATLAB/Simulink對上述控制算法進行仿真.仿真時參考軌跡采用四階S型點到點軌跡規(guī)劃如圖3所示.仿真對象模型如下所示:
圖3 四階S型點到點軌跡Fig.3 Fourth-order S-shaped point-to-point trajectory
其中采樣時間為Ts=5.0×10?4s.
反饋控制器Cfb為
建立輸入整形濾波器Ty和前饋制器Tff參數(shù)化多項式為
選取初始值θ1=[0 0 0 0 0.1 0 0]T,仿真實驗的執(zhí)行器的輸出范圍選為?25 N~25 N.
圖4為當約束參數(shù)ρ保持不變,只考慮約束參數(shù)λ變化時,穩(wěn)定段誤差的二范數(shù)隨迭代次數(shù)變化的曲線.由圖可知當ρ=1×10?10時,λ越小,穩(wěn)定段誤差二范數(shù)衰減到最優(yōu)的速度越快.
圖4 ρ=1×10?10時,約束參數(shù)λ對誤差二范數(shù)的影響曲線Fig.4 Curve of the effect for the constraint parameter λ on the two-norm for the error when ρ=1×10?10
圖5為當約束參數(shù)λ保持不變時,只考慮約束參數(shù)ρ變化時,穩(wěn)定段誤差的二范數(shù)隨迭代次數(shù)變化的曲線.由圖可知當λ=1×10?8時,ρ越小,穩(wěn)定段誤差二范數(shù)收斂值越小.
圖5 λ=1×10?8時,約束參數(shù)ρ 對誤差二范數(shù)的影響曲線Fig.5 Curve of the effect for the constraint parameter ρ on the two-norm for the error when λ=1×10?8
表1為當約束參數(shù)λ保持不變時,不同約束參數(shù)ρ下的控制信號最大值,由表可知當λ=1×10?8時,ρ越小控制信號的最大值越大;從上述兩個試驗可以看出通過約束參數(shù)λ可以調(diào)整算法的迭代收斂速度,通過約束參數(shù)ρ可以調(diào)整算法迭代收斂最優(yōu)值與控制信號最大值的大小.
表1 不同約束參數(shù)ρ 下的控制信號最大值(λ=1×10?8)Table 1 The maximum value of the control signal with different constraint parametersρ(λ=1×10?8)
因此,執(zhí)行器受約束的運動控制系統(tǒng)在運用改進算法時,可以根據(jù)執(zhí)行器的輸出范圍選擇合適的約束參數(shù)λ和ρ,來調(diào)整所提出算法的收斂速度和所需的控制信號.
整段軌跡的迭代前后誤差ey如圖6所示.圖7為迭代前后的穩(wěn)定段誤差e變化曲線.由圖可知,第1次迭代時最大軌跡跟蹤誤差為10?4m量級,第20次迭代時最大軌跡跟蹤誤差降為10?6m量級.上述仿真實驗結(jié)果表明改進算法實現(xiàn)了當前約束參數(shù)下(λ=1×10?8,ρ=1×10?10)不超出執(zhí)行器輸出范圍的軌跡最優(yōu)跟蹤性能.
圖6 λ=1×10?8,ρ=1×10?10時,迭代誤差比較Fig.6 Comparison of iterative errors when λ=1×10?8,ρ=1×10?10
圖7 λ=1×10?8,ρ=1×10?10時,穩(wěn)定段迭代誤差比較Fig.7 Comparison of iterative errors in the settling section when λ=1×10?8,ρ=1×10?10
辨識參數(shù)θ變化曲線如圖8所示,由圖可知,辨識參數(shù)θ1~θ7在第7次迭代后收斂到最優(yōu)值,最優(yōu)值如表2所示,該結(jié)果驗證了改進算法辨識參數(shù)的收斂性.
圖8 λ=1×10?8,ρ=1×10?10時,辨識參數(shù)θ 變化曲線Fig.8 The variation curve of identification parameter θ when λ=1×10?8,ρ=1×10?10
表2 參數(shù)θ最優(yōu)值(λ=1×10?8,ρ=1×10?10)Table 2 The optimal value of the parameter θ(λ=1×10?8,ρ=1×10?10)
圖9為文獻[17]中現(xiàn)有無約束參數(shù)的算法(λ=0,ρ=0)與所提出有約束參數(shù)的改進算法(挑選λ=1×10?8,ρ=1×10?10)控制信號曲線的比較圖.由圖可知,在無約束參數(shù)算法運行的情況下,控制信號最大值超出執(zhí)行器輸出范圍?25 N~25 N,加入約束后的改進算法控制信號最大值未超出執(zhí)行器輸出范圍.
圖9 加入約束參數(shù)前后的控制信號u的比較Fig.9 Comparison of control signals u before and after adding constraint parameters
本文的實驗平臺為圖10所示兩個直線電動機構成的X-Y運動平臺,兩個直線電動機均采用Baldor公司的LMCF02C-HCO,電動機的連續(xù)推力為58 N,峰值推力為173 N,直線電動機的運動位置由GSI公司分辨率為0.5μm的光柵尺測量,讀數(shù)頭型號為MII1600-40.伺服驅(qū)動器為Baldor公司的FMH2A03TR-EN23,采用電流控制方式.由于位于上層直線電動機具有相對較低的慣量,為了驗證高速高精性能,實際試驗時采用下層直線電動機鎖死,只對上層直線電動機進行試驗.由于電動機的連續(xù)推力為58 N,因此為了保證實驗的安全性和驗證算法的有效性,實驗平臺的執(zhí)行器的推力輸出范圍選為?60 N~60 N.
圖10 直線伺服電機實驗平臺Fig.10 Linear servo motor experiment platform
實驗的反饋控制器采用PID反饋控制,其參數(shù)如表3所示.
表3 PID參數(shù)Table 3 PID parameters
實驗采用參考軌跡如圖11所示,四階S型點到點軌跡,伺服采樣時間為5×10?4s,迭代運行20次,參數(shù)初始值θ1=[0 0 0 0 0.1 0 0]T,輸入整形濾波器和前饋控制器參數(shù)化多項式與仿真實驗一致,實驗過程中采集輸出軌跡,誤差和控制信號數(shù)據(jù).
圖11 四階S型點到點參考軌跡Fig.11 Fourth-order S-shaped point-to-point reference trajectory
圖12為當約束參數(shù)ρ保持不變時,只考慮約束參數(shù)λ變化時,穩(wěn)定段誤差的二范數(shù)隨迭代次數(shù)變化的曲線.由圖可知當ρ=1×10?6時,λ越小,穩(wěn)定段誤差二范數(shù)衰減到最優(yōu)的速度越快.圖13為當約束參數(shù)λ保持不變時,只考慮約束參數(shù)ρ變化時,穩(wěn)定段誤差的二范數(shù)隨迭代次數(shù)變化的曲線,由圖可知當λ=0.001時,ρ越小,穩(wěn)定段誤差二范數(shù)的收斂值越小.
圖12 ρ=1×10?6時,約束參數(shù)λ對誤差二范數(shù)的影響曲線Fig.12 Curve of the effect for the constraint parameter λ on the two-norm for the error when ρ=1×10?6
圖13 λ=0.001時,約束參數(shù)ρ對誤差二范數(shù)的影響曲線Fig.13 Curve of the effect for the constraint parameter ρ on the two-norm for the error when λ=0.001
表4為當約束參數(shù)λ保持不變時,不同約束參數(shù)ρ下的控制信號最大值,由表可知當λ=0.001時,ρ越小控制信號的最大值越大.上述實驗結(jié)果與仿真實驗結(jié)果一致,表明了算法可以通過約束參數(shù)λ調(diào)整算法的迭代收斂速度,通過約束參數(shù)ρ調(diào)整算法迭代收斂最優(yōu)值與控制信號最大值的大小.
表4 不同約束參數(shù)ρ下的控制信號最大值(λ=0.001)Table 4 The maximum value of the control signal with different constraint parameters ρ(λ=0.001)
整段軌跡的迭代前后誤差ey如圖14所示.圖15為穩(wěn)定段迭代前后的誤差e變化曲線,由圖可知,實驗效果與仿真一致,由第1次、第2 次和第20 次穩(wěn)定段誤差的變化趨勢可知,穩(wěn)定段誤差得到了明顯的抑制,表明了改進算法能夠?qū)崿F(xiàn)在當前約束參數(shù)下(λ=0.001,ρ=1×10?6)不超出執(zhí)行器輸出范圍的軌跡最優(yōu)跟蹤性能.
圖14 λ=0.001,ρ=1×10?6 時,迭代誤差比較Fig.14 Comparison of iterative errors when λ=0.001,ρ=1×10?6
圖15 λ=0.001,ρ=1×10?6 時,穩(wěn)定段迭代誤差比較Fig.15 Comparison of iterative errors in the settling section when λ=0.001,ρ=1×10?6
辨識參數(shù)θ變化曲線,如圖16所示,由圖可知,辨識參數(shù)θ1~θ7在第5次迭代收斂到最優(yōu)值,辨識參數(shù)的最優(yōu)值如表5所示.實驗結(jié)果進一步驗證了改進算法辨識參數(shù)的收斂性.
表5 參數(shù)θ 最優(yōu)值(λ=0.001,ρ=1×10?6)Table 5 The optimal value of the parameter θ(λ=0.001,ρ=1×10?6)
圖16 λ=0.001,ρ=1×10?6 時,辨識參數(shù)θ變化曲線Fig.16 The variation curve of identification parameter θ when λ=0.001,ρ=1×10?6
為了驗證改進算法在執(zhí)行器約束下對非重復性軌跡的性能,實驗選用的參考軌跡如圖17所示.非重復性軌跡實驗,前10次迭代采用圖中參考軌跡1,后10次迭代采用參考軌跡2.該實驗采用與上述實驗同樣的控制結(jié)構、伺服采樣時間和初值,約束參數(shù)選為λ=0.001,ρ=1×10?6.
圖17 非重復性軌跡實驗中四階S型點到點參考軌跡1和2Fig.17 Fourth-order S-shaped point-to-point reference trajectories 1 and 2 in non-repetitive trajectory experiment
非重復性軌跡實驗中,穩(wěn)定段誤差二范數(shù)變化曲線如圖18所示,前10次迭代穩(wěn)定段誤差二范數(shù)收斂到最優(yōu)值,在第11次迭代軌跡發(fā)生變化時,穩(wěn)定段誤差二范數(shù)的值略微上升,但與軌跡1性能差別不大,在經(jīng)過一次迭代后又收斂到最優(yōu)值,與軌跡1時的最優(yōu)性能一致.
圖18 非重復性軌跡實驗誤差二范數(shù)的變化曲線Fig.18 The variation curve of the two-norm error for the non-repetitive trajectory experiment
非重復性點到點軌跡運動實驗中,運行軌跡1達到收斂時的控制信號曲線如圖19所示,運行軌跡2 達到收斂時的控制信號曲線如圖20所示.由圖可知,兩條軌跡運行達到收斂時的控制信號最大值均為未超出執(zhí)行器的輸出范圍.非重復性軌跡實驗結(jié)果表明了改進算法在執(zhí)行器約束下對非重復性點到點軌跡具有一定的魯棒性.
圖19 運行軌跡1時的控制信號u曲線Fig.19 Control signal u curve when running trajectory 1
圖20 運行軌跡2時的控制信號u曲線Fig.20 Control signal u curve when running trajectory 2
為了實現(xiàn)在執(zhí)行器受約束情況下非重復性點到點軌跡的最優(yōu)跟蹤,本文提出了一種在執(zhí)行器約束情況下參數(shù)化輸入整形濾波器和前饋控制器的數(shù)據(jù)驅(qū)動控制算法.算法運用了數(shù)據(jù)驅(qū)動的方法進行迭代更新辨識最優(yōu)參數(shù),不依賴被控對象數(shù)學模型,并通過限制控制信號變化量和控制能量來達到對辨識參數(shù)的約束,從而滿足在執(zhí)行器約束條件下實現(xiàn)非重復性軌跡跟蹤,并且跟蹤誤差和辨識參數(shù)收斂到最優(yōu)值.通過仿真和實驗驗證: 本文算法能夠?qū)崿F(xiàn)在執(zhí)行器約束下對點到點軌跡的最優(yōu)跟蹤性能,并且對非重復性點到點軌跡具有一定的魯棒性.