張 雷,胡云安,張 楊,王佩飛
(海軍航空工程學(xué)院a.控制工程系;b.研究生管理大隊(duì),山東煙臺(tái)264001)
基于Backstepping的嚴(yán)格反饋極值搜索系統(tǒng)控制器設(shè)計(jì)
張雷a,胡云安a,張楊a,王佩飛b
(海軍航空工程學(xué)院a.控制工程系;b.研究生管理大隊(duì),山東煙臺(tái)264001)
針對(duì)一類(lèi)含不確定參數(shù)的嚴(yán)格反饋型極值搜索系統(tǒng)的控制問(wèn)題,將極值搜索方法和反演(Backstepping)控制方法相結(jié)合,設(shè)計(jì)出系統(tǒng)狀態(tài)的極值參考軌跡,利用Backstepping控制方法逐步遞推選取適當(dāng)?shù)腖yapunov函數(shù)設(shè)計(jì)控制器和不確定參數(shù)自適應(yīng)估計(jì)律,實(shí)現(xiàn)目標(biāo)函數(shù)的極值搜索。仿真表明所提出控制器設(shè)計(jì)方法的有效性。
嚴(yán)格反饋;不確定參數(shù);極值搜索系統(tǒng);自適應(yīng)估計(jì)律
實(shí)際控制系統(tǒng)中,系統(tǒng)的參考輸出量與輸入量之間通??梢詷?gòu)成某種未知的參考軌跡,這種參考軌跡關(guān)系意味著在參考輸入的作用下,系統(tǒng)的輸出軌跡中存在一個(gè)全局最優(yōu)輸出值(極大值或者極小值)[1-2]。面對(duì)實(shí)際的極值搜索被控對(duì)象,有時(shí)很難準(zhǔn)確而完整地掌握和分析它結(jié)構(gòu)和機(jī)理,這不可避免地導(dǎo)致了系統(tǒng)模型建立的不夠準(zhǔn)確;同時(shí),考慮到系統(tǒng)參數(shù)可能存在的不確定性等因素影響,最終導(dǎo)致研究人員很難準(zhǔn)確地知曉系統(tǒng)的參考軌跡形式并實(shí)現(xiàn)未知參考軌跡的尋優(yōu)[3-4]。長(zhǎng)期以來(lái),人們?yōu)榱四軌蛘业綄?shí)現(xiàn)未知參考軌跡尋優(yōu)的方法進(jìn)行了不斷的探索。這些尋優(yōu)方法被統(tǒng)稱(chēng)為最優(yōu)化方法,或者優(yōu)化方法,已發(fā)展比較成熟的方法如粒子群方法[5-6]、遺傳方法[7]、模擬退火方法[8]等方法都具有較好的搜索效果,但這些方法都是從數(shù)值計(jì)算的角度去解決尋優(yōu)問(wèn)題,且要求系統(tǒng)的參考軌跡是已知或至少部分已知的。如何從控制的角度采用適當(dāng)?shù)目刂品椒?,在?shí)際系統(tǒng)的參考軌跡不能確定的情況下,仍能夠使得系統(tǒng)的輸出量自適應(yīng)地收斂并穩(wěn)定于輸出量的全局最優(yōu)輸出值,從而使控制過(guò)程中期望的控制目標(biāo)最優(yōu)化,這是控制界學(xué)者一直致力于解決的一類(lèi)問(wèn)題,而極值搜索方法首次從控制的角度解決了未知參考軌跡的尋優(yōu)問(wèn)題[9]。文獻(xiàn)[10]針對(duì)一類(lèi)含不確定參數(shù)的極值搜索系統(tǒng)的控制問(wèn)題,設(shè)計(jì)最優(yōu)控制器,使目標(biāo)函數(shù)沿期望狀態(tài)軌跡收斂至其對(duì)應(yīng)的函數(shù)極值。文獻(xiàn)[11]針對(duì)多變量參數(shù)不確定極值搜索系統(tǒng)進(jìn)行了控制器設(shè)計(jì),保證了系統(tǒng)的穩(wěn)定性。
20世紀(jì)90年代初,Kanellakopoulos[12]首次提出了反演(Backstepping)控制方法,在逐步遞推的設(shè)計(jì)過(guò)程中引入虛擬控制量的概念,并基于Lyapunov穩(wěn)定性理論給出了控制器的設(shè)計(jì)過(guò)程。對(duì)于嚴(yán)格反饋非線性系統(tǒng)而言,自適應(yīng)Backstepping[13]能夠在參數(shù)未知的情況下得到很強(qiáng)的穩(wěn)定性結(jié)論,而魯棒自適應(yīng)backstepping控制則能夠處理模型中存在不確定項(xiàng)和外部干擾的情況。對(duì)于確定的嚴(yán)格反饋非線性系統(tǒng),利用傳統(tǒng)的Backstepping控制器便可得到全局漸近穩(wěn)定的結(jié)論,Yao等[14-15]將自適應(yīng)技術(shù)與Backstepping控制方法相結(jié)合,解決了具有參數(shù)不確定性的嚴(yán)格反饋非線性系統(tǒng)的控制問(wèn)題,Wang[16],Zhang[17],Polycarpou[18]等分別利用神經(jīng)網(wǎng)絡(luò)對(duì)系統(tǒng)中的未知非線性函數(shù)進(jìn)行估計(jì),解決了含有未知函數(shù)的嚴(yán)格反饋非線性系統(tǒng)的控制問(wèn)題,以上文獻(xiàn)都為本文Backstepping控制器設(shè)計(jì)提供了參考。
本文針對(duì)一類(lèi)含不確定參數(shù)的嚴(yán)格反饋型單輸入極值搜索系統(tǒng)的極值搜索問(wèn)題,將極值搜索方法和Backstepping控制方法相結(jié)合,設(shè)計(jì)出能使目標(biāo)函數(shù)搜索到極值的極值參考軌跡;利用Backstepping控制方法,逐步遞推選取適當(dāng)?shù)腖yapunov函數(shù)進(jìn)行控制器設(shè)計(jì)。仿真表明了所設(shè)計(jì)的不確定參數(shù)自適應(yīng)估計(jì)律能實(shí)現(xiàn)本文的控制目標(biāo)。
考慮如下形式的一類(lèi)含不確定參數(shù)的嚴(yán)格反饋型單輸入極值搜索系統(tǒng):
假設(shè)1:目標(biāo)函數(shù)y=J(x1,θ)存在唯一極值點(diǎn),且對(duì)應(yīng)的系統(tǒng)狀態(tài)量滿足:
本文將設(shè)計(jì)自適應(yīng)估計(jì)律對(duì)不確定參數(shù)θ進(jìn)行估計(jì),對(duì)式(3)進(jìn)行微分可得:
由式(4)可得狀態(tài)量x1的參考軌跡x1,d應(yīng)滿足
式中,kd∈?+為設(shè)計(jì)常數(shù)。
將式(5)代入式(4)可得
由式(3)可得Ves≥0成立且僅在時(shí)存在Ves=0。由式(4)可得極值參考軌跡x1,d如式(5)所示時(shí)成立且僅在時(shí)存在。當(dāng)狀態(tài)量x1將沿著極值參考軌跡x1,d向著使的方向趨近時(shí),最終可達(dá)到對(duì)應(yīng)的極值點(diǎn)處,此時(shí)目標(biāo)函數(shù)取得極值。
控制目標(biāo):目標(biāo)函數(shù)搜索到其對(duì)應(yīng)的極值處,閉環(huán)系統(tǒng)中的所有信號(hào)有界。
目標(biāo)函數(shù)搜索其對(duì)應(yīng)極值的過(guò)程即是狀態(tài)量準(zhǔn)確跟蹤極值參考軌跡且不確定參數(shù)量被準(zhǔn)確估計(jì)的過(guò)程。
假設(shè)2:極值參考軌跡 x1,d及其高階導(dǎo)數(shù)為有界光滑函數(shù)。
假設(shè)3:存在常數(shù) T0、μ0>0對(duì)于函數(shù)向量存在
采用Backstepping技術(shù)對(duì)預(yù)設(shè)性能控制器進(jìn)行設(shè)計(jì),不確定參數(shù)θ的估計(jì)誤差為,通過(guò)自適應(yīng)方法對(duì)不確定參數(shù)進(jìn)行估計(jì)。以n=3為例,控制系統(tǒng)原理框圖如圖1所示。
第1步:考慮系統(tǒng)(1)中的第1個(gè)子系統(tǒng),設(shè)不確定參數(shù)θ的估計(jì)誤差為,構(gòu)造Lyapunov函數(shù),對(duì)V1求一階導(dǎo)數(shù)可得:
針對(duì)式(8)設(shè)計(jì)x2的虛擬軌跡:
式中,k1>0為設(shè)計(jì)參數(shù)。
由式(8)、(9)可得:
式中,z2=x2-x2,d。
當(dāng)x2能夠準(zhǔn)確跟蹤x2,d時(shí),即z2趨近于0。
圖1 當(dāng)n=3時(shí)控制系統(tǒng)原理框圖Fig.1 Block diagram of control system forn=3
第2步:考慮系統(tǒng)(1)中的第2個(gè)子系統(tǒng)
針對(duì)式(12)設(shè)計(jì)x3的虛擬軌跡
式中,k2>0為設(shè)計(jì)參數(shù)。
定義z3=x3-x3,d,由式(12)、(13)可得:
第3步:考慮系統(tǒng)(1)中的第3個(gè)子系統(tǒng)
針對(duì)式(16)設(shè)計(jì)x4的虛擬軌跡
式中,k3>0為設(shè)計(jì)參數(shù)。
定義z4=x4-x4,d,由式(15)、(16)可得
針對(duì)式(20)設(shè)計(jì)xi+1的虛擬軌跡
式中,ki>0為設(shè)計(jì)參數(shù)。
定義zi+1=xi+1-xi+1,d,由式(19)、(20)可得:
參考式(23),設(shè)計(jì)實(shí)際控制量和參數(shù)估計(jì)律分別為:
式(24)、(25)中:kn>0為設(shè)計(jì)參數(shù);。
將參考Backstepping方法設(shè)計(jì)的控制輸入量式(24)和自適應(yīng)估計(jì)律式(25)代入式(23)可得:
定理1:考慮系統(tǒng)(1)所描述的一類(lèi)參數(shù)不確定嚴(yán)格反饋非線性系統(tǒng),在假設(shè)1~4成立的前提下,采用極值參考軌跡如式(5)所示,虛擬控制器設(shè)計(jì)如式(21)、(22)所示,實(shí)際控制輸入量如式(24)所示,自適應(yīng)估計(jì)律如式(25)所示,可以得到如下結(jié)論:
1)目標(biāo)函數(shù)J(x1,θ)搜索到其對(duì)應(yīng)的極值處;
2)系統(tǒng)(1)是漸進(jìn)穩(wěn)定的且閉環(huán)系統(tǒng)中的所有信號(hào)有界。
需要特別強(qiáng)調(diào)的是,對(duì)于極值參考軌跡x1,d設(shè)計(jì)中的關(guān)于目標(biāo)函數(shù)的導(dǎo)數(shù)和計(jì)算過(guò)程中所用到的虛擬控制量導(dǎo)數(shù),采用解析法進(jìn)行求解。
針對(duì)如下對(duì)象進(jìn)行仿真分析,數(shù)學(xué)模型如下:
式(27)中:x1、x2為系統(tǒng)狀態(tài)變量;θ=1為不確定參數(shù);為目標(biāo)函數(shù),具有全局極大值
參考式(5)設(shè)計(jì)狀態(tài)量x1的極值參考軌跡x1,d為:
采用本節(jié)所設(shè)計(jì)的Backstepping控制方法進(jìn)行仿真分析,系統(tǒng)的狀態(tài)變量初始值分別為,參數(shù)估計(jì)初始值為,極值參考軌跡 x1,d初始值為??刂破鲄?shù):g=2, kd=1,k1=2,k2=4。仿真結(jié)果如圖2~8所示。
圖2 目標(biāo)函數(shù)J(x1,θ)仿真圖Fig.2 Simulation result of objective functionJ(x1,θ)
圖3 不確定參數(shù)估計(jì)值仿真圖Fig.3 Simulation result of uncertain parameter estimated value
圖4 狀態(tài)變量x1和極值參考軌跡x1,d仿真圖Fig.4 Simulation result of state variablex1and extremum reference trajectoryx1,d
圖5 狀態(tài)變量x1跟蹤誤差z1Fig.5 Simulation result of state variablex1tracking errorz1
圖6 狀態(tài)變量x2和參考軌跡x2,d仿真圖Fig.6 Simulation result of state variablex2and reference trajectoryx2,d
圖7 狀態(tài)變量x2跟蹤誤差z2Fig.7 Simulation result of state variablex2tracking errorz2
圖8 控制輸入量u仿真圖Fig.8 Simulation result of control inputu
由圖2可知:設(shè)計(jì)的極值參考軌跡x1,d有效,目標(biāo)函數(shù)能夠準(zhǔn)確收斂至全局極大值處;由圖3可知:設(shè)計(jì)的估計(jì)律能夠準(zhǔn)確估計(jì)不確定參數(shù);由圖4、5可知:狀態(tài)量x1能夠準(zhǔn)確跟蹤極值參考軌跡x1,d最終收斂至處;由圖6、7可知:狀態(tài)量x2能夠準(zhǔn)確跟蹤極值參考軌跡x2,d;由圖8可知:控制輸入量u有界。通過(guò)仿真分析可知:本文設(shè)計(jì)的Backstepping控制方法可以實(shí)現(xiàn)控制目標(biāo)且效果較好。
本文針對(duì)一類(lèi)含不確定參數(shù)的嚴(yán)格反饋型單輸入極值搜索系統(tǒng)的極值搜索問(wèn)題。首先,設(shè)計(jì)出能使目標(biāo)函數(shù)搜索到極值點(diǎn)的極值參考軌跡;其次,利用Backstepping控制方法逐步遞推選取適當(dāng)?shù)腖yapunov函數(shù)進(jìn)行控制器設(shè)計(jì);最后,設(shè)計(jì)不確定參數(shù)的自適應(yīng)估計(jì)律,滿足控制目標(biāo)。仿真驗(yàn)證了本文設(shè)計(jì)方法可行有效。
[1]KRSTIC M,WANG H H.Stability of extremum seeking feedback for general nonlinear dynamic systems[J].Automatica,2000,36(4):595-601.
[2]BLACKMAN B F.Extremum-seeking regulators[C]//An Exposition of Adaptive Control.New York:IEEE,1962:36-50.
[3]ADETOLA V,GUAY M.Parameter convergence in adaptive extremum-seeking control[J].Automatica,2007,43(1):105-110.
[4]左斌,胡云安,施建洪.極值搜索算法的研究與進(jìn)展[J].海軍航空工程學(xué)院學(xué)報(bào),2006,21(6):611-617. ZUO BIN,HU YUNAN,SHI JIANHONG.Research and development of extremum seeking algorithm[J]. Journal of Naval Aeronautical Engineering Institute,2006,21(6):611-617.(in Chinese)
[5]高立群,李若平,鄒德旋.全局粒子群優(yōu)化算法[J].東北大學(xué)學(xué)報(bào):自然科學(xué)版,2011,32(11):1538-1541. GAO LIQUN,LI RUOPING,ZOU DEXUAN.A global particle swarm optimization algorithm[J].Journal of Northeastern University:Natural Science,2011,32(11):1538-1541.(in Chinese)
[6]雷翻翻,高岳林.約束優(yōu)化問(wèn)題的改進(jìn)粒子群優(yōu)化算法[J].蘭州理工大學(xué)學(xué)報(bào),2011,37(4):84-89. LEI FANFAN,GAO YUELIN.Improved partical swarm optimization algorithm for solving constrained optimization problems[J].Journal of Lanzhou University of Technology,2011,37(4):84-89.(in Chinese)
[7]劉慶波,余躍慶.基于遺傳算法的欠驅(qū)動(dòng)機(jī)器人模糊控制器設(shè)計(jì)[J].系統(tǒng)仿真學(xué)報(bào),2008,20(8):2097-2100. LIU QINGBO,YU YUEQING.Fuzzy controller design for under actuated robots based on GA method[J].Jour-nal of System Simulation,2008,20(8):2097-2100.(in Chinese)
[8]梁毓明,徐立鴻.基于改進(jìn)模擬退火混合算法的移動(dòng)機(jī)器人全局路徑規(guī)劃[J].控制與決策,2010,25(2):237-240. LIANG YUMING,XU LIHONG.Mobile robot global path planning based modified simulated annealing hybrid algorithm[J].Control and Decision,2010,25(2):237-240.(in Chinese)
[9]左斌,李靜,胡云安.極值搜索算法研究及其應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2014:1-2. ZUO BIN,LI JING,HU YUAN.Research on extremum seeking algorithm and its application[M].Beijing:National Defense Industry Press,2014:1-2.(in Chinese)
[10]GUAY M,ZHANG T.Adaptive extremum seeking control of nonlinear dynamic systems with parametric uncertainties[J].Automatica,2003,39(7):1283-1293.
[11]SHAKIBA YAGHOUBI,MARYAM DEHGHANI.Adaptive extremum seeking control of a nonlinear system using backstepping technique[C]//23rdIranian Conference on Electrical Engineering.Iranian:IEEE,2015:960-965.
[12]KANELLAKOPOULOS I,KOKOTOVIC P V,MORSE A S.Systematic design of adaptive controllers for feedback linearizable systems[J].IEEE Transactions on Automatic Control,1991,36(11):1241-1253.
[13]SETO D,ANNASWAMY A M,BAILLIEUL J.Adaptive control of nonlinear systems with a triangular structure [J].IEEE Transactions on Automatic Control,1994,39(7):1411-1428.
[14]YAO B,TOMIZUKA M.Adaptive robust control of MIMO nonlinear systems in semi-strict feedback forms[J]. Automatica,2001,37(9):1305-1321.
[15]YAO B,TOMIZUKA M.Adaptive robust control of SISO nonlinear systems in a semi-strict feedback form[J].Automatica,1997,33(5):893-900.
[16]WANG D,HUANG J.Neural network-based adaptive dynamic surface control for a class of uncertain nonlinear systems in strict-feedback form[J].IEEE Transactions on Neural Networks,2005,16(1):195-202.
[17]ZHANG T,GE S S,HANG C C.Adaptive neural network control for strict-feedback nonlinear systems using backstepping design[J].Automatica,2000,36(12):1835-1846.
[18]POLYCARPOU M M.Stable adaptive neural control scheme for nonlinear systems[J].IEEE Transactions on Automatic Control,1996,41(3):447-451.
Controller Design for Strict-Feedback Extremum Seeking Systems Based on Backstepping
ZHANG Leia,HU Yunana,ZHANG Yanga,WANG Peifeib
(Naval Aeronautical and Astronautical University a.Department of Control Engineering;b.Graduate Students’Brigade,Yantai Shandong 264001,China)
To solve control problems of strict-feedback extremum seeking systems with uncertain parameter,extremum seeking control method and Backstepping control method were combined.System state extremum reference trajectory was designed.Backstepping controller and uncertain parameter adaptive estimation law were designed based on the appropriate Lyapunov functions selected by recurrence method,objective function extremum seeking was realized.Simulation result showed that the proposed controller design method was effectiveness.
strict-feedback;uncertain parameter;extremum seeking systems;adaptive estimation law
TP273+.23
A
1673-1522(2016)04-0401-06
10.7682/j.issn.1673-1522.2016.04.001
2016-05-14;
2016-06-02
國(guó)家自然科學(xué)基金資助項(xiàng)目(60674090)
張雷(1988-),男,博士生。