陳 壯,王憲倫,陳 閃
(1.芯恩(青島)集成電路有限公司,山東 青島 266000;2.青島科技大學機電工程學院,山東 青島 266061;3.青島濱海學院機電工程學院,山東 青島 266555)
機器人抓取物體的工作看似簡單,實際上是多耦合的非線性軌跡解算過程[1]。對于機器人末端執(zhí)行器的軌跡規(guī)劃,一般將末端執(zhí)行器的笛卡爾坐標系由運動學算法映射到關節(jié)空間中,解算并擬合得到理想的抓取角位移軌跡和角加速度,將關節(jié)變量轉換成脈沖值發(fā)送給伺服電機完成各軸的協(xié)同動作。但是實際上機器人常處于微振動的環(huán)境中,不可避免地受到自身共振和地面振動的不確定撓動,導致抓取軌跡與擬合的軌跡偏離。為了使機器人高精度跟蹤抓取軌跡,需要在已知機器人的運動學和動力學模型的前提下構造軌跡跟蹤控制系統(tǒng)。
Yu等[2]為了減輕內外部的干擾耦合對無人直升機螺旋槳操控的影響,建立了ADRC自抗撓模型,對比PID控制算法,提高了系統(tǒng)的動態(tài)穩(wěn)定性。Wang等[3]將自抗撓模型應用于交流電,估計逆變器的周期性負載擾動。廖薇等[4]構造了ADRC模型使得海洋絞車適用于不同線纜直徑和重量的工況,即使當環(huán)境變化時,控制器也能保持良好的動態(tài)性能,對比了PID控制器,證明了ADRC有較快的響應速度和抗干擾能力。
自抗擾控制(ADRC)算法是在PID控制理論基礎上延伸發(fā)展而來的[5],能自主抵抗機器人內外部的各類干擾,具備高精度的軌跡跟蹤能力,并且其關鍵參數(shù)也可以根據(jù)實際跟蹤能力進一步優(yōu)化。
實驗用的是加拿大Kinova公司研發(fā)的MICO2仿人六軸串聯(lián)機器人,在關節(jié)空間下對應位置和時間的拉格朗日動力學方程的一般形式為
(1)
(2)
(3)
標準二階ADRC由微分跟蹤器(TD)、非線性狀態(tài)誤差反饋(NLSEF)和擴張狀態(tài)觀測器(ESO)獨立的3部分組成,如圖1所示。變量q為機器人各關節(jié)軸輸出的角位移,設定變量qc為機器人關節(jié)擬合軌跡的任意位置,變量qc1為輸入軌跡qc的跟蹤信號,qc2為輸入軌跡qc微分后速度的跟蹤信號,它們由ESO實時提取跟蹤值qc1和qc2,從而確保跟蹤值的穩(wěn)定性。κ為系統(tǒng)內外的不確定干擾;τ為考慮內外干擾引入的系統(tǒng)補償量。
圖1 二階ADRC框架模型
跟蹤值qc1和qc2的二階非線性跟蹤微分器TD函數(shù)形式為
(4)
k=fh(qc1-q,qc2,r0,μ),r為跟蹤速度控制因子,一般|k|≤r;r0為r的整數(shù)倍,一般按實際控制需求選擇合適的倍數(shù);h為軌跡采樣周期,μ為噪聲濾波控制因子,一般為h的20倍;fh為控制反饋跟蹤函數(shù)。
ESO是自抗擾控制器的核心,用于跟蹤變量,估計并補償不確定撓動以消除系統(tǒng)噪聲,這也是PID沒有的功能。設變量z1為qc1的估計值,變量z2為qc2的估計值,變量z3為擴張變態(tài)變量。β1、β2、β3為ESO內部參數(shù),構建ESO算法為
(5)
至此,已經(jīng)通過ESO估計了機器人內外不確定撓動,為了使撓動的抵消變得可控,引入非線性狀態(tài)誤差反饋(NLSEF)。NLSEF是自抗擾控制器特有的組成部分,流程如圖2所示,用于調整增益限制系統(tǒng)撓動,調節(jié)速度在較小的范圍內波動從而避免超調。已知TD跟蹤得到的角位移qc1和速度qc2,以及ESO得到軌跡估計值z1和速度估計值z2。對應數(shù)值做差法運算得到跟蹤誤差e1和e2。結合控制反饋跟蹤函數(shù)fh,得到NLSEF表達式為
(6)
c為阻尼系數(shù)。
圖2 NLSEF計算流程
外部干擾對軌跡的影響,主要體現(xiàn)在末端執(zhí)行器角位移變量的瞬時幅值存在噪聲且角加速度響應延遲[6-7]。選擇Kinova MICO2的第3關節(jié)軸跟蹤已規(guī)劃的關節(jié)角位移變量q為例,驗證二階ADRC設計的可行性。ADRC跟蹤結果如圖3所示。由圖3可知,當存在干擾時,第3關節(jié)軸反饋的實際關節(jié)角位移受噪聲干擾的影響較明顯,明顯偏離理想的規(guī)劃軌跡,而經(jīng)過ADRC估計并補償擾動后使得跟蹤控制的角位移能夠近似向規(guī)劃的軌跡趨近。
圖3 第3關節(jié)關節(jié)角位移軌跡
ADRC算法在運算效率和跟蹤干擾等方面都優(yōu)于PID算法,甚至不依賴于數(shù)學模型。各部分參數(shù)的優(yōu)化起著至關重要的作用??紤]到閉環(huán)系統(tǒng)的動態(tài)特性,為了避免因數(shù)據(jù)量較大而造成誤差信號時滯現(xiàn)象,需要根據(jù)誤差補償值動態(tài)微調ESO的內部參數(shù)β1、β2、β3以及NLSEF的參數(shù)kp。參數(shù)kp的選取影響著目標值跟蹤精度,過大會出現(xiàn)超調現(xiàn)象,因此需要從非線性控制率層面抑制系統(tǒng)超調,減小振蕩。
進一步解算kp的最優(yōu)解,設計了一種基于遺傳算法優(yōu)化徑向基網(wǎng)絡算法(GA-RBF)實時優(yōu)化ADRC。RBF神經(jīng)網(wǎng)絡能精準快速逼近設定值,同時由遺傳算法(GA)的強魯棒性并行搜索優(yōu)化徑向基函數(shù)(RBF)的網(wǎng)絡權值并避免局部極小值,盡可能完善RBF神經(jīng)網(wǎng)絡[8-9]。RBF高斯逼近激活函數(shù)為
(7)
隱含層激活函數(shù)φ(‖x-ui‖)一般為
φ(‖x-ui‖)=exp(-‖x-ui‖2/σ2)
(8)
‖x-ui‖為基函數(shù)與輸入矩陣的差向量;g矩陣為權值;σ為函數(shù)寬度閾值參數(shù),影響RBF徑向范圍;p為神經(jīng)元數(shù)量;ui為第i個節(jié)點的聚類中心。
通常采用GA并行全局搜索RBF的最優(yōu)解。GA優(yōu)化RBF網(wǎng)絡的權值流程如圖4所示。設定二進制編碼,迭代種群規(guī)模為N,借鑒生物繁殖理念,選擇過程則以評價染色體的方式擇優(yōu)交叉組合產生新的后代,交叉概率和變異概率則跟隨適應度改變。當滿足迭代閾值時,停止迭代并輸出此時種群中最大適應度的個體作為最優(yōu)權值。網(wǎng)絡權值預測數(shù)值變化情況如圖5所示。
圖4 GA優(yōu)化RBF網(wǎng)絡的權值流程
圖5 網(wǎng)絡權值預測數(shù)值變化
由圖5可知,在迭代初期,RBF的網(wǎng)絡權值g有較大的波動,使得預測值不可靠,隨著迭代進化次數(shù)的增加使得權值預測值逐步趨于穩(wěn)定。這也意味著GA預測的最小誤差也跟隨迭代進化次數(shù)的增加逐步收斂至0。使得在當前ADRC跟蹤模型下,預測了合適的RBF網(wǎng)絡權值g,通過RBF網(wǎng)絡優(yōu)化了NLSEF,微調參數(shù)kp,最終實現(xiàn)更高的逼近精度。
第3關節(jié)角位移變量q由GA-RBF優(yōu)化后的ADRC跟蹤結果與規(guī)劃軌跡作差,得到絕對誤差偏移量δ,如圖6所示。通過偏移幅值清楚地看出該關節(jié)的各離散點的跟蹤誤差臨界波動較小,角位移絕對誤差偏移量δ基本上能控制在-0.25~0.25 rad范圍內,且誤差可控。從而將算法映射到機器人的6個關節(jié)軸,各軸協(xié)同工作使得機器人末端執(zhí)行器實時跟隨已規(guī)劃的軌跡工作。
圖6 ADRC跟蹤誤差
機器人普遍存在來自內外界的不確定性干擾,為了使得機器人更好地遵循規(guī)劃好的軌跡運行。本文以Kinova MICO2為例,在關節(jié)空間下建立了ADRC關節(jié)角位移跟蹤模型。為了確保ADRC適用于各類復雜環(huán)境,保證其閉環(huán)誤差跟蹤穩(wěn)定性。建立GA-RBF網(wǎng)絡進一步優(yōu)化了NLSEF參數(shù)kp,控制角位移跟蹤誤差在一定時間內穩(wěn)定在可接受的范圍內,表明GA-RBF優(yōu)化的ADRC使機器人實際工作軌跡向著規(guī)劃軌跡收斂。