廖列法,楊翌虢
(江西理工大學(xué)信息工程學(xué)院,江西贛州 341000)
隨著工業(yè)自動(dòng)化的不斷發(fā)展,動(dòng)態(tài)系統(tǒng)的最優(yōu)控制得到了迅速發(fā)展并取得了顯著成效.最優(yōu)控制是使被控系統(tǒng)的性能指標(biāo)實(shí)現(xiàn)最優(yōu)化的一種綜合策略,可概括為:對(duì)一個(gè)受控的動(dòng)力學(xué)系統(tǒng)或運(yùn)動(dòng)學(xué)過(guò)程,設(shè)計(jì)最佳的控制策略,使系統(tǒng)的運(yùn)動(dòng)在由某個(gè)初始狀態(tài)轉(zhuǎn)移到指定的目標(biāo)狀態(tài)的同時(shí),其性能指標(biāo)(稱為泛函)值為最優(yōu).最優(yōu)控制問(wèn)題廣泛存在實(shí)際的生產(chǎn)中,例如,對(duì)于行星著陸器的動(dòng)力下降階段的控制問(wèn)題,期望對(duì)參考軌跡的跟蹤效果優(yōu)良以及燃料消耗最少;對(duì)于機(jī)械臂系統(tǒng)的控制問(wèn)題,期望機(jī)械臂系統(tǒng)的跟蹤誤差越小越好[1]等.
針對(duì)非線性雙二次型目標(biāo)泛函由跟蹤誤差及控制動(dòng)作規(guī)律共同決定的問(wèn)題,其控制規(guī)律具有時(shí)變、多輸入變量、強(qiáng)耦合及動(dòng)態(tài)震蕩等特性,如何在系統(tǒng)控制過(guò)程中使用不大的控制量來(lái)保持較小的跟蹤誤差成為了影響控制系統(tǒng)泛函關(guān)鍵因素之一.近年來(lái),針對(duì)非線性系統(tǒng)的控制規(guī)律的設(shè)計(jì)成為了國(guó)內(nèi)外學(xué)者研究熱點(diǎn),如精確線性化[2-3]、自適應(yīng)控制[4-5]、滑模控制[6-7]、模糊控制[8-9]、反演控制[10]及神經(jīng)網(wǎng)絡(luò)控制[11-13]等.文獻(xiàn)[14]針對(duì)單輸入單輸出非線性系統(tǒng),提出自適應(yīng)最優(yōu)控制法,實(shí)現(xiàn)自適應(yīng)動(dòng)態(tài)規(guī)劃及動(dòng)態(tài)面技術(shù),文獻(xiàn)[15-16]針對(duì)非線性系統(tǒng)設(shè)計(jì)自適應(yīng)神經(jīng)網(wǎng)絡(luò)前饋控制器,解決狀態(tài)反饋?zhàn)顑?yōu)控制問(wèn)題,等等.以上文獻(xiàn)提高了控制器的自適應(yīng)最優(yōu)控制.而文獻(xiàn)[17-18],通過(guò)引入額外的神經(jīng)元,并作用于動(dòng)態(tài)拉格朗日乘子,實(shí)現(xiàn)約束二次型優(yōu)化問(wèn)題的最優(yōu)求解;文獻(xiàn)[19-20]使用不連續(xù)的硬限制激活函數(shù),實(shí)現(xiàn)對(duì)二次規(guī)劃模型的優(yōu)化求解.但以上所述文獻(xiàn)未對(duì)雙二次型泛函中二次項(xiàng)系數(shù)權(quán)衡比重問(wèn)題展開(kāi)研究,即控制能量和控制誤差的權(quán)值比重問(wèn)題.本文針對(duì)機(jī)械臂控制系統(tǒng)最優(yōu)問(wèn)題提出一種新型的二階段疊加優(yōu)化的雙二次型最優(yōu)泛函求解模型,在控制精度、收斂性、計(jì)算復(fù)雜度及數(shù)值穩(wěn)定性等方面進(jìn)行了優(yōu)化,同時(shí)實(shí)現(xiàn)非線性系統(tǒng)中用不大的控制量來(lái)保持較小的控制誤差的最優(yōu)控制目標(biāo).
在本文中,如圖1所示為基于非線性多關(guān)節(jié)機(jī)械臂系統(tǒng).
圖1 多關(guān)節(jié)機(jī)械臂系統(tǒng)Fig.1 Multi-joint robotic arm system
首先,在控制器的設(shè)計(jì)方面,設(shè)計(jì)一種線性誤差函數(shù),作用于非線性控制方程,并采用徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)自適應(yīng)逼近非線性控制方程中存在的不確定項(xiàng),構(gòu)成閉環(huán)最優(yōu)反饋系統(tǒng).在自適應(yīng)激勵(lì)函數(shù)的設(shè)計(jì)上,本文對(duì)比分析了常見(jiàn)的Gaussian 函數(shù)、Sigmoid函數(shù)及Tan-Sigmoid 函數(shù),理論分析及數(shù)值驗(yàn)證了激勵(lì)函數(shù)為Gaussian函數(shù)的RBF網(wǎng)絡(luò)能有效避免局部極值,提高自適應(yīng)穩(wěn)定性;其次,引入一種新型的類(lèi)遞歸神經(jīng)網(wǎng)絡(luò)[21]求解帶約束條件的雙二次規(guī)劃問(wèn)題,對(duì)比現(xiàn)有求解模型,例如基于拉格朗日神經(jīng)網(wǎng)絡(luò)[22]、基于梯度的神經(jīng)網(wǎng)絡(luò)[23]及雙神經(jīng)網(wǎng)絡(luò)[24]等.本文理論分析及數(shù)值實(shí)例仿真驗(yàn)證了所提模型有效提高非線性系統(tǒng)的控制精度、穩(wěn)定性、魯棒性及自適應(yīng)性.實(shí)現(xiàn)在非線性系統(tǒng)中用不大的控制量來(lái)保持較小的控制誤差的非線性雙二次型泛函最優(yōu)控制.
本文的主要貢獻(xiàn)有:
1)針對(duì)實(shí)現(xiàn)最優(yōu)控制的核心問(wèn)題,主要實(shí)現(xiàn)以下3個(gè)目的:其一,保持系統(tǒng)從初始態(tài)到末端態(tài)時(shí)系統(tǒng)實(shí)際狀態(tài)緊跟系統(tǒng)理想狀態(tài)變化,即保持跟蹤誤差趨于0值附近的控制跟蹤目的;其二,通過(guò)限制系統(tǒng)控制動(dòng)作矢量的幅值及平滑性來(lái)保證系統(tǒng)的穩(wěn)定運(yùn)行,即降低系統(tǒng)實(shí)現(xiàn)代價(jià)的節(jié)能目的;其三,設(shè)計(jì)自適應(yīng)逼近控制律及雙二次型求解模型,實(shí)現(xiàn)穩(wěn)定逼近及快速收斂,即系統(tǒng)控制律的穩(wěn)定逼近及快速收斂的目的.
2)針對(duì)非線性機(jī)械臂控制系統(tǒng),設(shè)計(jì)一種線性誤差函數(shù),作用于非線性控制方程,并采用一種基于神經(jīng)網(wǎng)絡(luò)自適應(yīng)逼近控制器,構(gòu)成全局穩(wěn)定的閉環(huán)反饋系統(tǒng),實(shí)現(xiàn)線性函數(shù)對(duì)非線性系統(tǒng)的控制目的.
3)對(duì)比不同的激勵(lì)函數(shù)自適應(yīng)算法逼近控制律,理論說(shuō)明及數(shù)值仿真驗(yàn)證了采用基于Gaussian函數(shù)RBF神經(jīng)網(wǎng)絡(luò),可以達(dá)到快速學(xué)習(xí)并避免局部極值的目的,有效提高系統(tǒng)的控制精度、穩(wěn)定性、魯棒性及自適應(yīng)性.
4)設(shè)計(jì)復(fù)合雙二次規(guī)劃模型,將待求參數(shù)復(fù)合成一個(gè)未知矢量,同時(shí)本文設(shè)計(jì)一種新型的類(lèi)遞歸神經(jīng)網(wǎng)絡(luò)求解法[21]求解待帶約束的雙二次規(guī)劃模型,有效提高了有限時(shí)間收斂速度,實(shí)現(xiàn)本文所述模型對(duì)非線性系統(tǒng)的最優(yōu)控制目的.
本文行文組織結(jié)構(gòu)為:首先,雙二次型目標(biāo)泛函最優(yōu)控制描述及機(jī)械臂動(dòng)力學(xué)方程的建立;其次,神經(jīng)網(wǎng)絡(luò)自適應(yīng)逼近控制器的設(shè)計(jì);再次,雙二次型泛函模型的構(gòu)建與求解;最后,基于二關(guān)節(jié)機(jī)械臂控制系統(tǒng)數(shù)值仿真驗(yàn)證本文所提模型.
1)連續(xù)時(shí)間非線性雙二次型目標(biāo)泛函為
式中:M1∈Rn×n,M2∈Rn×n且M1=≥0,M2=≥0為加權(quán)矩陣;(t)∈Rn×1為跟蹤誤差矢量;u(t)∈Rn×1為最優(yōu)控制動(dòng)作矢量;t0和tf分別表示初始狀態(tài)時(shí)刻及末端狀態(tài)時(shí)刻;T(t)M1(t)表示控制過(guò)程中狀態(tài)偏差;uT(t)M2u(t)表示控制過(guò)程中所消耗的控制能量.
2)設(shè)計(jì)n關(guān)節(jié)機(jī)械臂動(dòng)力學(xué)方程為
式中:θ∈Rn為廣義節(jié)點(diǎn)位置坐標(biāo)矢量;∈Rn,∈Rn分別為廣義速度矢量及加速度矢量;W∈Rn×n為關(guān)節(jié)空間動(dòng)力學(xué)模型的慣性矩陣;C∈Rn×n表示離心力、法向力和哥氏力之和;G∈Rn×1表示為重力項(xiàng);τd∈Rn×1為其他未知外加擾動(dòng);τ?∈Rn為動(dòng)力學(xué)控制輸入.
1)控制器的設(shè)計(jì).
定義θ的跟蹤函數(shù)為
式中θd(t)為理想狀態(tài)下的廣義節(jié)點(diǎn)位置坐標(biāo)矢量,則
定義線性誤差函數(shù)為
設(shè)計(jì)控制律為
設(shè)計(jì)定義Lyapunov函數(shù)為
2)自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)逼近及穩(wěn)定性分析.
注1正則化徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)由3層組成:第1層是由輸入節(jié)點(diǎn)組成,輸入節(jié)點(diǎn)的個(gè)數(shù)等于輸入向量x的維數(shù);第2層為隱含層,是由直接與輸入節(jié)點(diǎn)相連接的節(jié)點(diǎn)組成,一個(gè)隱含節(jié)點(diǎn)對(duì)應(yīng)一個(gè)訓(xùn)練數(shù)據(jù)點(diǎn),其個(gè)數(shù)與訓(xùn)練數(shù)據(jù)點(diǎn)的個(gè)數(shù)相同;第3層為輸出層,包括若干個(gè)線性單元,每個(gè)線性單元與所有的隱含節(jié)點(diǎn)相連,即表示為網(wǎng)絡(luò)的最終輸出是由各個(gè)隱含節(jié)點(diǎn)輸出的線性加權(quán)和.其網(wǎng)絡(luò)如圖2所示.
圖2 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 RBF neural network structure
設(shè)計(jì)激勵(lì)函數(shù)為Gaussion函數(shù)的RBF神經(jīng)網(wǎng)絡(luò)對(duì)式控制系統(tǒng)進(jìn)行RBF自適應(yīng)逼近,如圖3所示,基于Gaussion函數(shù)的RBF神經(jīng)網(wǎng)絡(luò)算法為
式中:x 為RBF 神經(jīng)網(wǎng)絡(luò)的輸入信號(hào),ci和σ 分別為RBF網(wǎng)絡(luò)隱節(jié)點(diǎn)中心向量及標(biāo)準(zhǔn)化常數(shù).
圖3 采用RBF自適應(yīng)逼近Fig.3 Using RBF adaptive approximatio n
采用基于Gaussion函數(shù)為激勵(lì)函數(shù)的RBF神經(jīng)網(wǎng)絡(luò)自適應(yīng)逼近訓(xùn)練式(6)中f(q),則輸出自適應(yīng)逼近值(q)為
將式(12)代入式(7)得逼近控制律為
令Lyapunov函數(shù)為
設(shè)計(jì)RBF網(wǎng)絡(luò)自適應(yīng)律為
式 中:縮放因子Z=diag{z1,z2,···,zn},z1,z2,···,zn為常量,則
設(shè)計(jì)控制誤差s=(sn+sd)sgn r,則式(16)可化為
根據(jù)LaSalle不變集原理,Lyapunov函數(shù)收斂,得證系統(tǒng)穩(wěn)定.
3)針對(duì)f(q)整體中各項(xiàng)分別自適應(yīng)RBF逼近.
控制律如式(13)所示,其中被控對(duì)象中f(q)如式(6)所示,采用RBF網(wǎng)絡(luò)對(duì)f(q)中各項(xiàng)分別進(jìn)行逼近,得
式中:ΓΘ為網(wǎng)絡(luò)自適應(yīng)律,δΘ為其激活函數(shù),如式(11b)所示,其Θ分別代表M,C,G,F,求得自適應(yīng)逼近估計(jì)值分別為此處神經(jīng)網(wǎng)絡(luò)輸入信號(hào)為x=θ,x=或(θ,),求得其自適應(yīng)逼近值.則式(6)中f(q)的自適應(yīng)逼近值(q)為
綜上所述,控制系統(tǒng)逼近控制律如式(13)所示,RBF網(wǎng)絡(luò)自適應(yīng)逼近律如式(17)所示,則自適應(yīng)逼近狀態(tài)下的機(jī)械臂動(dòng)力學(xué)方程式(2)可化為
4)BP網(wǎng)絡(luò)及RBF網(wǎng)絡(luò)設(shè)計(jì)逼近器對(duì)比.
從理論上而言,BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)類(lèi)似,都可以任意精度逼近任何非線性函數(shù),兩者的主要區(qū)別為在非線性映射上采用了不同的作用函數(shù),其逼近性能也不同.
若設(shè)計(jì)基于Sigmoid函數(shù)或Tan-Sigmoid作為激活函數(shù)的BP 網(wǎng)絡(luò),則式(11b)變更為
如圖4所示,Sigmoid 函數(shù)的特點(diǎn)是將(?∞,+∞)范圍內(nèi)的數(shù)據(jù)映射到有限區(qū)間(0,1),Sigmoid函數(shù)將偏離原點(diǎn)區(qū)域的數(shù)據(jù)壓縮,而靠近原點(diǎn)區(qū)域的數(shù)據(jù)則被放大,經(jīng)Sigmoid函數(shù)處理之后,絕對(duì)值大的數(shù)據(jù)變?yōu)楦咏咏?而絕對(duì)值較小的數(shù)據(jù)則由于區(qū)間被放大顯著更為稀疏.而Tan-Sigmoid函數(shù)將輸出限定在有限區(qū)間(?1,1)之內(nèi)(如圖4所示).從理論上來(lái)看,BP網(wǎng)絡(luò)中激勵(lì)函數(shù)采用Sigmoid函數(shù)或Tan-Sigmoid函數(shù),其兩者函數(shù)值在輸入空間中無(wú)限大范圍內(nèi)為非零值,即作用函數(shù)為全局的.而RBF網(wǎng)絡(luò)采用的激勵(lì)函數(shù)為Gaussion函數(shù)(如圖4所示),其函數(shù)在無(wú)限大范圍內(nèi)趨近于零,即作用函數(shù)是局部的.綜上所述,通過(guò)如圖4所示對(duì)比可知,采用Gaussion函數(shù)作為隱含層激勵(lì)函數(shù)的RBF網(wǎng)絡(luò)具備收斂速度快、穩(wěn)定性好、唯一逼近、無(wú)局部極小值等優(yōu)點(diǎn).
圖4 Sigmoid函數(shù)、Tan-Sigmoid函數(shù)及Gaussian函數(shù)訓(xùn)練原始數(shù)據(jù)對(duì)比效果Fig.4 Contrast effect of training original data of Sigmoid function,Tan-Sigmoid function and Gauss function
1)二次型目標(biāo)泛函約束方程的建立.
設(shè)計(jì)自由度為n 的多機(jī)械臂系統(tǒng)控制方程為τj=Pu,其中u為如式(1)所示的最優(yōu)控制動(dòng)作矢量(待求矢量),P∈R1×n為將控制動(dòng)作矢量u映射到廣義空間的線性變換.則:
機(jī)械系統(tǒng)參考控制動(dòng)作值為
式中:F為如注2所示,由動(dòng)力學(xué)機(jī)械系統(tǒng)約束引起的雅可比約束;λ1為比例縮放因子.聯(lián)立式(22)和式(24)并代入(t)=(t)?(t)得
注2以二關(guān)節(jié)機(jī)械臂系統(tǒng)為例,關(guān)節(jié)末端節(jié)點(diǎn)位置直角坐標(biāo)(x,y)與關(guān)節(jié)角位置(θ1,θ2)關(guān)系,即速度級(jí)(正向)運(yùn)動(dòng)學(xué)方程及逆運(yùn)動(dòng)學(xué)方程[25].
如圖5所示為二關(guān)節(jié)為例的運(yùn)動(dòng)學(xué)示意圖,其運(yùn)動(dòng)學(xué)方程為
圖5 二關(guān)節(jié)機(jī)械臂運(yùn)行學(xué)示意圖Fig.5 Operational schematic diagram of two-joint manipulator
1)加速度級(jí)運(yùn)動(dòng)學(xué)方程.
對(duì)式(26)兩邊分別對(duì)時(shí)間t求導(dǎo)得其操作速度和廣義關(guān)節(jié)速度關(guān)系為
2)逆運(yùn)動(dòng)學(xué)方程.
對(duì)式(26)求其平方和:
如注2所示,根據(jù)機(jī)器人學(xué)動(dòng)力學(xué)相關(guān)理論[25]可得:對(duì)于n自由度,m個(gè)末端運(yùn)動(dòng)參數(shù)(n>m)的機(jī)械臂運(yùn)動(dòng)系統(tǒng),其加速度級(jí)運(yùn)動(dòng)學(xué)方程為
在本控制系統(tǒng)設(shè)計(jì)中,其機(jī)械臂關(guān)節(jié)末端速度(vx,vy)保持勻速運(yùn)動(dòng),令機(jī)械臂關(guān)節(jié)末端加速度=(,)=0,則設(shè)計(jì)系統(tǒng)正向運(yùn)動(dòng)學(xué)方程為
由式(1)連續(xù)時(shí)間非線性雙二次型目標(biāo)泛函得
1)等式約束條件為
2)不等式約束條件為
其物理意義為機(jī)械系統(tǒng)非零控制動(dòng)作矢量與電機(jī)正常反應(yīng)和摩擦力所引起的動(dòng)作矢量應(yīng)小于控制律,通過(guò)限制系統(tǒng)控制動(dòng)作矢量的幅值間接體現(xiàn)最優(yōu)控制的目的.其中為式(13)所求數(shù)值.
2)雙二次型性能泛函指標(biāo)模型的建立.
連續(xù)時(shí)間非線性雙二次型性能目標(biāo)泛函可抽象為二次規(guī)劃的復(fù)合(雙二次型)求解問(wèn)題
式中:M∈Rn為正定矩陣;Ax=b為等式約束,A∈Rm×n,b∈Rn; l ≥Ex ≥h 為不等式約束,E∈Rj×n,h∈Rl,l∈Rj,h∈Rj,m 式中:κ1,κ2為調(diào)節(jié)比例因子,0為零向量. 3)雙二次型模型的求解. 根據(jù)其拉格朗日乘子法KKT條件[26],式(34)中不等式約束條件等價(jià)于l?Ex<0,Ex?h<0,則求解式(34)等價(jià)于求解 設(shè)存在飽和函數(shù)g(ρEx+μ),使得?ρ>0,使得 令M為正定矩陣且矩陣A滿秩,求解拉格朗日方程可得 由式(37)可知AM?1AT可逆,則rank(AM?1AT)=rank(A)且滿秩.令 將式(39)代入飽和函數(shù)式(36)得 使用一層神經(jīng)網(wǎng)絡(luò)訓(xùn)練式(40)得關(guān)于μ的狀態(tài)方程為 式中:ε為比例縮放因子,sigr定義為 式中:r∈R,0 注3如圖6所示為y=x,y=sgn x,y=sigr(x),其中:r=0.1,0.2,0.4,0.6,0.8;sgn x意為符號(hào)函數(shù).當(dāng)x>0時(shí),sgn x=1;當(dāng)x=0時(shí),sgn x=0;當(dāng)x<0時(shí),sgn x=?1. y=sigr(x)函數(shù)在0 圖6 y=x,y=sgn x和y=sigr(x),r=0.1,0.2,0.4,0.6,0.8的對(duì)比Fig.6 Comparisons of y=x,y=sgn x and y=sigr(x),r=0.1,0.2,0.4,0.6,0.8 引理1[27]假設(shè)M∈Rn×n且M ?0,A∈Rm×n(m 4)雙二次型收斂性分析. 引理2[21]設(shè)ES1ET的最大及最小特征值分別為ε1,εq,式中:E∈Rj×n,S1=∈Rn×n.令 式 中:D=diag{d1,d2,···,dq}∈Rq×q且di∈R,0≥di≥1(i=1,2,···,q);I為適當(dāng)維度的單位矩陣;ρ∈R,0 ≥ρ ≥2/εq,則 成立,并且x(A+AT)x=0,S1ETx=0成立.綜上,當(dāng)ε>0, 0 的解,則該神經(jīng)網(wǎng)絡(luò)收斂. 如果矩陣ES1ET滿足滿秩條件,則該神經(jīng)網(wǎng)絡(luò)會(huì)收斂,收斂時(shí)間不超過(guò) 二關(guān)節(jié)機(jī)械臂系統(tǒng)動(dòng)力學(xué)方程為 式中:g=9.8為重力加速度;A=[a1a2a3a4a5a6],其值的大小是與臂長(zhǎng)臂重有關(guān)的物理量,取A=[3.6 0.5 1.3 0.7 6.0 0.7];取自適應(yīng)RBF網(wǎng)絡(luò)中c,σ分別為 取自適應(yīng)RBF網(wǎng)絡(luò)輸入θd為 則輸入 系統(tǒng)廣義節(jié)點(diǎn)位置實(shí)際坐標(biāo)矢量θ初始值為隨機(jī)生成, 此取θt=0=[0.2 0]T,則t=0=[?0.2 0]T;取自適應(yīng)律因子Z=diag{z1,z2,···,zn}中z1=z2=···=zn=1.5,此處n=9,該值與c取值有關(guān),控制律參數(shù)取 誤差項(xiàng)s中取εN=0.2,εd=0.1,雅可比約束矩陣為 式中B=[b1b2]為與二桿機(jī)械臂臂長(zhǎng)有關(guān)的物理量,取B=[1.0 1.2]. 在二次模型求解中,取κ1=1,κ2=1.6,取 取w1=w2=w3=1,取狀態(tài)方程比例因子ε=10?9,r=0.8,ρ=0.03進(jìn)行數(shù)值模擬仿真. 如圖7所示為關(guān)節(jié)1和關(guān)節(jié)2的角度跟蹤及角速度跟蹤.初始階段,隨機(jī)初始狀態(tài)角度及角速度產(chǎn)生了震蕩狀態(tài),在本實(shí)例仿真中,產(chǎn)生較大擾動(dòng)震幅的主要原因是RBF網(wǎng)絡(luò)隱含節(jié)點(diǎn)的中心向量ci及標(biāo)準(zhǔn)化常數(shù)σi的取值相關(guān)聯(lián),而中心向量和標(biāo)準(zhǔn)化常數(shù)的取值及求解問(wèn)題,目前作為一個(gè)困難問(wèn)題[28],本文未對(duì)其展開(kāi)討論;隨后階段,當(dāng)趨勢(shì)趨于平穩(wěn)狀態(tài)時(shí)與理想值趨于吻合,驗(yàn)證了系統(tǒng)的穩(wěn)定性.通過(guò)圖8可以看出,其各參數(shù)、各維度趨于平穩(wěn)狀態(tài)時(shí),其理想數(shù)值吻合度較好,再次驗(yàn)證了本文所述系統(tǒng)模型的穩(wěn)定性. 圖7 關(guān)節(jié)1及關(guān)節(jié)2的角度跟蹤和角速度跟蹤Fig.7 Position tracking and speed tracking for link 1 and 2 如圖8所示為如式(2)所示機(jī)械臂動(dòng)力學(xué)方程中W,C,G,Ff的理想狀態(tài)下輸入及如式(22)所示基于Gaussian的RBF網(wǎng)絡(luò)自適應(yīng)逼近輸入數(shù)值跟蹤曲線,通過(guò)如圖9所示為關(guān)節(jié)1和關(guān)節(jié)2的動(dòng)力學(xué)方程的控制輸入,其曲線趨于平穩(wěn). 圖8 動(dòng)力學(xué)方程中W矩陣、C矩陣、G矩陣、Ff矩陣數(shù)值跟蹤Fig.8 The numerical tracking of W matrix,C matrix,G matrix,Ffmatrix in kinetic equation 如圖11所示,對(duì)于選取不同的激勵(lì)函數(shù)所設(shè)計(jì)出的控制律有不同的自適應(yīng)逼近性能,通過(guò)對(duì)比采用Sigmoid函數(shù)、Tan-Sigmoid函數(shù)及Gaussian函所設(shè)計(jì)出的控制器擬合曲線可知,采用Gaussian函數(shù)作為隱含層中激勵(lì)函數(shù)的RBF網(wǎng)絡(luò)具備收斂速度快、穩(wěn)定性好、唯一逼近、無(wú)局部極小值等優(yōu)點(diǎn),可以實(shí)現(xiàn)快速學(xué)習(xí)并避免局部極小值等特性. 圖9 關(guān)節(jié)1及關(guān)節(jié)2動(dòng)力學(xué)控制輸入Fig.9 Kinetic control input for link 1 and link 2 圖10 f(q)跟蹤及RBF自適應(yīng)逼近Fig.10 f(q)tracking and RBF adaptive approximation 圖11 基于Sigmoid函數(shù)、Tan-Sigmoid函數(shù)及Gaussian函數(shù)自適應(yīng)逼近f(q)效果對(duì)比Fig.11 Comparison of the effect of adaptive approximation of f(q)based on Sigmoid function,Tan-Sigmoid function and Gaussian function 對(duì)于雙二次型模型的性能指標(biāo)泛函指標(biāo)的求解,選取r=0.8,仿真時(shí)間為7×10?8s,μ0為隨機(jī)輸入,取 如圖12所示,其數(shù)值在有限時(shí)間內(nèi)穩(wěn)定收斂,驗(yàn)證了所采用的新型類(lèi)遞歸神經(jīng)網(wǎng)絡(luò)求解法能在求解雙二次型泛函問(wèn)題上具備較快的收斂速度;如圖13所示,各項(xiàng)數(shù)值在有限時(shí)間趨于穩(wěn)定,其數(shù)值仿真輸出為 圖12 雙二次型泛函狀態(tài)方程μ收斂時(shí)間Fig.12 Di-quadratic functional state equationμconvergence time 圖13 雙二次型性能泛函各項(xiàng)指標(biāo)輸出?,u,λFig.13 Di-quadratic performance functional indicators output ?,u,λ 綜上所得:求得其式(1)中最優(yōu)跟蹤誤差和最優(yōu)控制動(dòng)作律分別為 即為式(1)所示待求參數(shù),實(shí)現(xiàn)基于機(jī)械臂系統(tǒng)的最優(yōu)控制. 通過(guò)數(shù)值模擬仿真驗(yàn)證了雙二次型性能最優(yōu)泛函本質(zhì):使用不大的控制量,來(lái)保持較小的控制誤差,以達(dá)到所耗費(fèi)的能量和控制誤差的綜合最優(yōu). 針對(duì)本文所提模型,主要從兩大方面進(jìn)行對(duì)比分析,其一:神經(jīng)網(wǎng)絡(luò)自適應(yīng)逼近算法中激勵(lì)函數(shù)的設(shè)計(jì)對(duì)比;其二:帶約束條件的復(fù)合雙二次型模型的解法對(duì)比. 1)激勵(lì)方式從選取Gaussion函數(shù)(本文模型所提RBF網(wǎng)絡(luò))Sigmoid函數(shù)或Tan-Sigmoid函數(shù)(后兩者稱為BP網(wǎng)絡(luò))等方面在自適應(yīng)性(收斂性)及其收斂時(shí)間、計(jì)算復(fù)雜度方面的對(duì)比如表1所示. 表1 激勵(lì)函數(shù)模型各項(xiàng)指標(biāo)對(duì)比Table 1 Comparison of indicators of excitation function model 2)對(duì)于帶約束條件的復(fù)合雙二次型模型的求解,對(duì)比現(xiàn)有求解模型在理論誤差、空間復(fù)雜度及收斂時(shí)間等方面性能對(duì)比如表2所示. 表2 復(fù)合雙二次型模型的求解各項(xiàng)指標(biāo)對(duì)比Table 2 Comparison of index for solving composite bi-quadratic model 通過(guò)表1及表2在兩個(gè)主要方面對(duì)比可知,本文所提模型在自適應(yīng)性、收斂性及收斂時(shí)間、理論誤差、計(jì)算復(fù)雜度及空間復(fù)雜度等方面性能得到改善,理論分析及數(shù)值仿真驗(yàn)證了本文所提模型. 本文針對(duì)非線性機(jī)械臂系統(tǒng)中權(quán)衡控制能量與控制誤差比重的最優(yōu)控制問(wèn)題,通過(guò)以下3個(gè)方面出發(fā)進(jìn)行討論說(shuō)明,即:1)保持跟蹤誤差趨于0值附近的跟蹤問(wèn)題;2)限制系統(tǒng)控制動(dòng)作矢量達(dá)到降低系統(tǒng)實(shí)現(xiàn)代價(jià)的節(jié)能問(wèn)題;3)設(shè)計(jì)自適應(yīng)逼近控制律及優(yōu)化復(fù)合雙二次型求解模型,實(shí)現(xiàn)穩(wěn)定快速收斂問(wèn)題.針對(duì)以上3個(gè)方面,本文提出了一種基于神經(jīng)網(wǎng)絡(luò)二階段疊加優(yōu)化的雙二次型最優(yōu)泛函求解模型,實(shí)現(xiàn)在非線性機(jī)械臂控制系統(tǒng)中用不大的控制能量來(lái)保證較小的控制誤差的綜合最優(yōu)控制.首先,設(shè)計(jì)一種線性誤差函數(shù),實(shí)現(xiàn)對(duì)非線性控制方程的控制,設(shè)計(jì)基于RBF網(wǎng)絡(luò)以任意精度自適應(yīng)逼近非線性方程,實(shí)現(xiàn)對(duì)非線性系統(tǒng)的最優(yōu)控制;其次,設(shè)計(jì)復(fù)合雙二次型模型,將待求參數(shù)復(fù)合成一個(gè)未知矢量,并設(shè)計(jì)一種新型的類(lèi)遞歸神經(jīng)網(wǎng)絡(luò)求解帶約束條件的雙二次規(guī)劃問(wèn)題,實(shí)現(xiàn)模型求解的快速收斂;最后,通過(guò)理論分析及數(shù)值仿真驗(yàn)證了所提模型有效提高非線性系統(tǒng)的自適應(yīng)性、控制精度、穩(wěn)定性及魯棒性等,實(shí)現(xiàn)非線性系統(tǒng)的綜合最優(yōu)控制.3 仿真實(shí)例與分析
3.1 仿真實(shí)例
3.2 比較分析
4 結(jié)論