徐向榮,朱永飛,查文斌,周 攀
(安徽工業(yè)大學(xué) 機(jī)械工程學(xué)院,安徽 馬鞍山 243000)
近年,國(guó)內(nèi)外工廠大都實(shí)現(xiàn)自動(dòng)化或半自動(dòng)化生產(chǎn)過(guò)程,生產(chǎn)效率得到了大幅度提升,生產(chǎn)成本得到大幅改善,另一方面自動(dòng)化過(guò)程和控制方法相關(guān),傳統(tǒng)的控制方法主要是依照精確數(shù)學(xué)模型的PID控制,而工廠中的機(jī)械臂是非線性,時(shí)變性的,因此模糊控制作為解決上述問(wèn)題強(qiáng)有力工具被引入到一類模型不精確且復(fù)雜系統(tǒng)的控制當(dāng)中,取得了良好的效果。而且工廠中的機(jī)器人大都經(jīng)過(guò)示教等方式進(jìn)行重復(fù)性的操作問(wèn)題,比如搬運(yùn)物體、激光切割等,伴隨著外界環(huán)境干擾,機(jī)器人本體磨損等因素,重復(fù)性的操作準(zhǔn)確性勢(shì)必下降,而迭代學(xué)習(xí)控制方法針對(duì)上述描述問(wèn)題非常適合,對(duì)于非線性強(qiáng)耦合系統(tǒng)處理起來(lái)非常簡(jiǎn)便,所以模糊控制與迭代學(xué)習(xí)控制相結(jié)合的方法被廣泛運(yùn)用。
為提高模糊控制器的整體性能,結(jié)合人工蜂群算法自動(dòng)識(shí)別模糊規(guī)則表中的值、模糊化參數(shù)和反模糊化參數(shù)的最優(yōu)配置,針對(duì)夾持式壓電智能板,并綜合考慮外界擾動(dòng)因素,結(jié)合P型迭代控制方法設(shè)計(jì)了一種模糊迭代控制器進(jìn)行數(shù)值研究[1];研究了具有不精確通信拓?fù)浣Y(jié)構(gòu)的二階線性參數(shù)化多智能體系統(tǒng)(MAS)的完美共識(shí)問(wèn)題,提出了基于T-S模型的模糊自適應(yīng)迭代學(xué)習(xí)協(xié)調(diào)控制方法[2];對(duì)于永磁直線同步電動(dòng)機(jī)(PMLSM)執(zhí)行重復(fù)性任務(wù),提出了將迭代學(xué)習(xí)控制與模糊控制相結(jié)合的分段模糊迭代學(xué)習(xí)控制方法,以抑制不確定因素對(duì)系統(tǒng)的影響,有效地提高了收斂速度和位置跟蹤精度[3];通過(guò)建立偏心軸的加工數(shù)學(xué)模型以此分析偏心軸磨床X-C軸的跟蹤誤差關(guān)系,引入模糊自適應(yīng)PID迭代學(xué)習(xí)控制算法,有效提高了偏心軸的加工精度[4]。
上述文獻(xiàn)中的實(shí)驗(yàn)雖然取得了預(yù)期中的效果,但是其中設(shè)計(jì)的模糊控制器中的模糊規(guī)則設(shè)定下來(lái)之后是更改不了的,在實(shí)際應(yīng)用當(dāng)中,對(duì)于機(jī)械臂等非線性系統(tǒng),模糊控制所依賴的控制規(guī)則在設(shè)定后往往改變不了,當(dāng)系統(tǒng)在受到外界溫度濕度條件的干擾和自身摩擦發(fā)熱等因素時(shí),會(huì)使得系統(tǒng)模型發(fā)生改變,而原本設(shè)計(jì)的模糊規(guī)則是針對(duì)受影響之前的系統(tǒng)模型,所以此時(shí)的模糊規(guī)則需要根據(jù)模型的變化進(jìn)行適時(shí)調(diào)整,鑒于此本文提出一種自調(diào)整因子模糊PD型迭代學(xué)習(xí)控制方法,通過(guò)調(diào)整因子的自我修改能力去實(shí)時(shí)修改模糊控制中的規(guī)則,盡可能地滿足模型改變帶來(lái)的對(duì)模糊規(guī)則的影響,并結(jié)合迭代學(xué)習(xí)控制實(shí)現(xiàn)收斂速度和減小誤差的雙層優(yōu)化效果,同時(shí)也增強(qiáng)了系統(tǒng)的自適應(yīng)性。
機(jī)械臂的動(dòng)態(tài)性能可由基于拉格朗日的力學(xué)分析方法建立的非線性微分方程描述:
(1)
機(jī)械臂動(dòng)力學(xué)特性主要體現(xiàn)在以下兩方面:
2)M(q)為對(duì)稱正定矩陣,正數(shù)m1和m2,滿足以下不等式:m1‖x‖2≤xTM(q)x≤m2‖x‖2[6]。
圖1 基本模糊控制器結(jié)構(gòu)
模糊控制規(guī)則的生成一方面來(lái)自由實(shí)際生產(chǎn)中的操作人員和專家對(duì)系統(tǒng)進(jìn)行控制的經(jīng)驗(yàn)和知識(shí)再經(jīng)反復(fù)論證修改所得,另一方面來(lái)自對(duì)系統(tǒng)進(jìn)行多次試驗(yàn)測(cè)試,從輸入和輸出的數(shù)據(jù)中歸納總結(jié)。如果參數(shù)發(fā)生漂移,就要設(shè)法修正系統(tǒng)控制規(guī)則以滿足工作需求,而且常規(guī)的模糊控制器結(jié)構(gòu)較為簡(jiǎn)單,當(dāng)控制系統(tǒng)受干擾出現(xiàn)變化時(shí),模糊規(guī)則編寫(xiě)之后很難適應(yīng)系統(tǒng)變化,可同引入調(diào)整因子對(duì)模糊規(guī)則進(jìn)行修改以滿足控制對(duì)象的變化,因此文中設(shè)計(jì)一種自調(diào)整因子模糊控制器用來(lái)解決上述出現(xiàn)的情況。
大多數(shù)情況下,模糊處理后U的結(jié)果可用式(2)表示:
U=αE+(1-α)Ec(0<α<1)
(2)
式中,α是調(diào)整因子,其作用具體體現(xiàn)在系統(tǒng)誤差較大時(shí),應(yīng)提高模糊規(guī)則中的誤差權(quán)重,當(dāng)系統(tǒng)誤差較小時(shí),系統(tǒng)正趨于穩(wěn)定狀態(tài),此時(shí)應(yīng)提高模糊規(guī)則中誤差變化率的權(quán)重,以此保證系統(tǒng)盡快穩(wěn)定。
自調(diào)整因子模糊控制器是在基本模糊控制器的基礎(chǔ)上加上自調(diào)整因子控制部分,控制器的具體架構(gòu)如圖2所示,仍然以誤差和誤差變化率作為自整定部分的輸入量,調(diào)整修正因子便可實(shí)現(xiàn)對(duì)模糊規(guī)則的實(shí)時(shí)更改,接著利用更改后的模糊規(guī)則再進(jìn)行控制,從而在根本上提高模糊控制器的性能。
圖2 自調(diào)整因子模糊控制器結(jié)構(gòu)
自調(diào)整因子α的變化也經(jīng)模糊控制推出,用系統(tǒng)產(chǎn)生的E以及Ec作為α模糊控制器的輸入變量,相當(dāng)于系統(tǒng)中存在兩個(gè)模糊控制器,即在系統(tǒng)模糊控制器中又加入一個(gè)α模糊控制器,自整定部分的模糊控制器最后輸出為調(diào)整因子α,系統(tǒng)模糊控制器中的模糊規(guī)則受到α模糊控制器的控制,并根據(jù)α的輸出變化值進(jìn)行適時(shí)變化,控制器的輸入論域和輸出論域分別設(shè)置為[-0.4,0.4]和[0,1],并設(shè)置5個(gè)輸出量模糊子集,即:{VS(很小),S(小),M(中),B(大),VB(很大)}[7],α的模糊控制規(guī)則和α的隸屬度函數(shù)設(shè)置如表1和圖3所示。
表1 α的模糊控制規(guī)則表
圖3 α的隸屬度函數(shù)
迭代學(xué)習(xí)控制通過(guò)迭代修正達(dá)到控制對(duì)象的改善,控制對(duì)象的數(shù)學(xué)模型可以不精確,在一定時(shí)間范圍內(nèi)可以對(duì)控制對(duì)象的運(yùn)動(dòng)軌跡實(shí)現(xiàn)精確跟蹤[8]。假定根據(jù)期望控制輸入信號(hào)ud(t)和輸出信號(hào)yd(t),在運(yùn)行時(shí)間t(0 ek(t)=yd(t)-yk(t) (3) 迭代學(xué)習(xí)控制包括閉環(huán)學(xué)習(xí)和開(kāi)環(huán)學(xué)習(xí)兩種方法,文中采用前者算法進(jìn)行控制研究,閉環(huán)學(xué)習(xí)算法利用第k+1次的運(yùn)行誤差作為每一次迭代的輸入量,即: uk+1(t)=L(uk(t),ek+1(t)) (4) 式中,L為線性或非線性算子,ek+1(t)為k+1次的運(yùn)行誤差。 閉環(huán)PD迭代學(xué)習(xí)控制律可表示為: uk+1(t)= (5) 由式(5)可以知道,迭代學(xué)習(xí)控制律中的參數(shù)一旦確定,便不能改變,在參數(shù)的選擇上往往多次手動(dòng)改變,繁瑣且效率低。因此需要對(duì)控制律參數(shù)進(jìn)行實(shí)時(shí)調(diào)整以此獲得最優(yōu)參數(shù),所以采取自調(diào)整因子模糊控制器與迭代學(xué)習(xí)相結(jié)合的辦法對(duì)PD參數(shù)進(jìn)行實(shí)時(shí)修改,以改善系統(tǒng)的動(dòng)態(tài)性能。 自調(diào)整因子模糊PD迭代學(xué)習(xí)控制器結(jié)構(gòu)如圖4所示,以每一次迭代學(xué)習(xí)控制運(yùn)行后產(chǎn)生的Ek及Eck作為控制器的輸入變量,自調(diào)整因子α對(duì)系統(tǒng)模糊控制器中的模糊規(guī)則起到調(diào)整作用,在經(jīng)過(guò)模糊化、近似推理和清晰化處理后輸出的變量是修正后的PD參數(shù)補(bǔ)償ΔKP和ΔKD,在經(jīng)過(guò)與初始設(shè)定的PD參數(shù)相加后最終得出迭代學(xué)習(xí)控制律中KP和KD參數(shù)[10],從而在關(guān)節(jié)角度跟蹤上達(dá)到誤差最小化的效果。 圖4 迭代學(xué)習(xí)控制方法結(jié)構(gòu) (6) 式中,KPI和KDI為初始設(shè)定參數(shù),ΔKP和ΔKD是經(jīng)模糊控制后的輸出量。 根據(jù)模糊變量子集數(shù)目越多,控制性能越好的原則,對(duì)系統(tǒng)模糊控制中的輸入以及輸出變量的模糊子集均設(shè)置為7個(gè)模糊子集,即:{NB(負(fù)大),NM(負(fù)中),NS(負(fù)小),ZO(零),PS(正小),PM(正中),PB(正大)},模糊推理方法主要包括Mamdani推理法[11]、Larsen推理法和Zadeh推理法,其中Mamdani推理法是比較經(jīng)典而又使用起來(lái)簡(jiǎn)單的方法,根據(jù)輸入和輸出量的數(shù)目并利用If語(yǔ)句編寫(xiě)模糊規(guī)則即可,機(jī)械臂是一個(gè)多輸入多輸出的耦合系統(tǒng),所以控制規(guī)則的編寫(xiě)形式為: IfEkisNBandEckisNB, thenKPisPB,KDisPS[12]。 其余的模糊控制規(guī)則均按此編寫(xiě),Ek和Eck的初始論域設(shè)置為[-0.4,0.4],經(jīng)模糊處理后輸出的ΔKP和ΔKD設(shè)置為[-0.5,0.5],隸屬度函數(shù)采用trimf函數(shù)[13],以輸入量Ek為例,具體形式如圖5所示。 圖5 E的隸屬度函數(shù) 最后利用面積重心法[14]對(duì)輸出變量進(jìn)行反模糊處理,即將經(jīng)過(guò)模糊控制的輸出信號(hào)變成實(shí)際中的具體值。以參數(shù)ΔKP為例: (7) 式中,Pi為隸屬程度,kp*和Δkp分別表示論域中的模糊化變量和解模糊后輸出量。 所以經(jīng)過(guò)帶有自調(diào)整因子的模糊控制之后得到的系統(tǒng)迭代學(xué)習(xí)控制律為: (ΔKD+KDI)ek+1(t) (8) 根據(jù)之前經(jīng)驗(yàn)得到的KP和KD的模糊規(guī)則如表2和表3所示。上述規(guī)則和隸屬度函數(shù)的類型及其輸入輸出變量的論域均在Matlab中的Fuzzy工具箱中進(jìn)行編寫(xiě)和設(shè)置。 表3 KD的模糊控制規(guī)則表 實(shí)驗(yàn)以雙關(guān)節(jié)機(jī)械手為對(duì)象,如圖6所示。l、r和m表示連桿的長(zhǎng)度、質(zhì)心到端點(diǎn)的距離以及連桿質(zhì)量,各個(gè)參數(shù)的具體數(shù)值在表4和表5中給出[15]。 表4 連桿尺寸參數(shù) 表5 連桿質(zhì)量和轉(zhuǎn)動(dòng)慣量 圖6 雙關(guān)節(jié)機(jī)械手結(jié)構(gòu)圖 EkE NBNMNSZOPSPMPBNBPBPBPMPMPSZOZONMPBPBPMPSPSZONSNSPMPMPMPSZONSNSZOPMPMPSZONSNMNMPSPSPSZONSNSNMNMPMPSZONSNMNMNMNBPBZOZONMNMNMNBNB (9) 式中, M(q) = 設(shè)置迭代學(xué)習(xí)控制律中的固定參數(shù)分別為KPI=180和KDI==800,時(shí)間周期為T(mén)=3 s,迭代次數(shù)為20。外界的干擾因素綜合設(shè)置為τd=0.3sin(t),兩個(gè)關(guān)節(jié)的期望軌跡分別設(shè)為yd1=sin(3t)和yd2=cos(3t)?;谝陨戏治觯赟imulink中搭建仿真實(shí)驗(yàn)?zāi)P?,如圖7所示,同時(shí)為驗(yàn)證文中所提算法的有效性,實(shí)驗(yàn)結(jié)果將分別與迭代學(xué)習(xí)控制、模糊自適應(yīng)迭代學(xué)習(xí)控制進(jìn)行比較,將迭代學(xué)習(xí)控制記為“ILC”, 模糊自適應(yīng)迭代學(xué)習(xí)控制記為“FILC”,自調(diào)整因子模糊迭代學(xué)習(xí)控制記為“AFILC”,仿真結(jié)果如圖7所示。 圖7 自調(diào)整因子模糊PD型迭代學(xué)習(xí)控制SIMULINK仿真圖 圖8、圖9和圖10分別是經(jīng)過(guò)ILC、FILC和AFILC算法控制得出的機(jī)械手經(jīng)過(guò)20次迭代的軌跡跟蹤過(guò)程。圖11和圖12是機(jī)械手進(jìn)行迭代學(xué)習(xí)控制過(guò)程中的角度絕對(duì)值誤差的收斂過(guò)程。 圖8 20次ILC的機(jī)械手角度跟蹤過(guò)程 圖9 20次FILC的機(jī)械手角度跟蹤過(guò)程 圖10 20次AFILC的機(jī)械手角度跟蹤過(guò)程 圖11 20次機(jī)械手關(guān)節(jié)1角度絕對(duì)值誤差收斂過(guò)程 圖12 20次機(jī)械手關(guān)節(jié)2角度絕對(duì)值誤差收斂過(guò)程 對(duì)比圖8~10可以發(fā)現(xiàn),3種方法在最終都能較好地實(shí)現(xiàn)機(jī)械手的軌跡跟蹤過(guò)程,ILC在開(kāi)始存在較大的軌跡跟蹤誤差,隨著迭代過(guò)程的進(jìn)行,軌跡逐漸達(dá)到期望軌跡的數(shù)值,而FILC和AFILC從剛開(kāi)始便基本上與期望位置保持一致水平,軌跡跟蹤效果較好。 觀察圖11和圖12可以發(fā)現(xiàn),AFILC和FILC方法下關(guān)節(jié)1和關(guān)節(jié)2的角度誤差在迭代進(jìn)行第二次的時(shí)候就基本上趨于零。特別是對(duì)于關(guān)節(jié)2,ILC方法在迭代次數(shù)達(dá)到20次后依然未趨于零,且處于上下波動(dòng)中,雖然誤差也已經(jīng)達(dá)到0.005 rad以下,但相比于另外兩種方法明顯性能上略差,也說(shuō)明了所提的模糊迭代學(xué)習(xí)控制的誤差收斂速度較快的特性。 鑒于圖11和圖12中的AFILC和FILC兩種方法的誤差絕對(duì)值比較接近,同時(shí)為了更好地比較軌跡跟蹤效果,繪制了3種方法控制下兩個(gè)關(guān)節(jié)的角度誤差圖和角速度誤差圖,分別如圖13~圖14和圖15~圖16所示。 圖13 關(guān)節(jié)1角度跟蹤誤差 圖14 關(guān)節(jié)2角度跟蹤誤差 圖15 關(guān)節(jié)1角速度跟蹤誤差 圖16 關(guān)節(jié)2角速度跟蹤誤差 表6 控制性能參數(shù)表 從表6可以直接看出,AFILC算法的系統(tǒng)誤差方差相比其他兩種控制方法都要小很多,穩(wěn)定性較好,雖然第二個(gè)關(guān)節(jié)的誤差最小值要高于其他兩種方法,但關(guān)節(jié)誤差范圍明顯更小,整體上AFILC算法要明顯優(yōu)于另外兩種方法。 圖15和圖16是3種控制方法關(guān)節(jié)角速度誤差變化過(guò)程圖,從圖中可以看出FILC在關(guān)節(jié)1和關(guān)節(jié)2的角速度跟蹤中產(chǎn)生的誤差波動(dòng)較大,這是因?yàn)槟:?guī)則在初始設(shè)定后不能進(jìn)行適時(shí)修正的原因,作為對(duì)比,AFILC產(chǎn)生角速度的誤差明顯小于FILC,但略高于ILC,表明模糊規(guī)則受到了調(diào)整因子的影響,體現(xiàn)出了AFILC方法的自適應(yīng)性。 對(duì)于工業(yè)生產(chǎn)中機(jī)械臂經(jīng)常進(jìn)行搬運(yùn)物體等重復(fù)性的操作從而導(dǎo)致運(yùn)動(dòng)精確度下降問(wèn)題,提出一種自調(diào)整因子模糊PD型迭代學(xué)習(xí)控制方法。設(shè)計(jì)了自調(diào)整因子模糊控制器,提高了系統(tǒng)的自適應(yīng)性,并融合迭代學(xué)習(xí)控制方法得出系統(tǒng)的控制律,在SIMULINK中進(jìn)行機(jī)械臂的運(yùn)動(dòng)控制仿真實(shí)驗(yàn),結(jié)果表明,所提控制方法產(chǎn)生的誤差最終可以達(dá)到0.000 1 rad,且角度誤差在進(jìn)行第二次迭代時(shí)便趨于零,整體的控制效果較好,具有很強(qiáng)的實(shí)際意義。2.4 自調(diào)整因子模糊PD迭代學(xué)習(xí)控制器設(shè)計(jì)
3 仿真實(shí)驗(yàn)
4 結(jié)束語(yǔ)