熊 凱,孟 斌,王麗嬌
(1.北京控制工程研究所,北京100190;2.空間智能控制技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京100190)
時(shí)變參數(shù)辨識(shí)梯度算法穩(wěn)定性分析*
熊 凱1,2,孟 斌1,2,王麗嬌1,2
(1.北京控制工程研究所,北京100190;2.空間智能控制技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京100190)
研究用于時(shí)變參數(shù)辨識(shí)的梯度算法穩(wěn)定性問(wèn)題.基于隨機(jī)過(guò)程有界性判據(jù)對(duì)時(shí)變參數(shù)辨識(shí)梯度算法進(jìn)行了穩(wěn)定性分析,給出了梯度算法穩(wěn)定的充分條件.指出在待辨識(shí)參數(shù)變化率有界,觀測(cè)噪聲是零均值白噪聲,且系統(tǒng)滿足持續(xù)激勵(lì)條件的情況下,梯度算法參數(shù)選擇滿足一定條件時(shí),能夠確保參數(shù)辨識(shí)誤差的有界性.上述研究與以往工作的不同之處在于穩(wěn)定性證明過(guò)程中僅要求待辨識(shí)參數(shù)的變化率是有界的,而不要求參數(shù)變化率是零均值白噪聲.
參數(shù)辨識(shí);梯度算法;隨機(jī)過(guò)程;穩(wěn)定性
參數(shù)辨識(shí)作為一種數(shù)學(xué)建模工具,已在工程上獲得日益廣泛的應(yīng)用,其重要應(yīng)用背景是工業(yè)過(guò)程自動(dòng)控制.通過(guò)參數(shù)辨識(shí),可以在不掌握復(fù)雜工業(yè)過(guò)程內(nèi)部機(jī)理的條件下,利用過(guò)程的輸入輸出信息來(lái)建立過(guò)程的數(shù)學(xué)模型.常用的系統(tǒng)參數(shù)辨識(shí)方法包括最小二乘(LS)算法、卡爾曼濾波(KF)算法和梯度算法等[1-2],其中,梯度算法具有應(yīng)用簡(jiǎn)便、計(jì)算量小等優(yōu)點(diǎn),基于特征建模的自適應(yīng)控制即采用梯度算法進(jìn)行模型參數(shù)辨識(shí)[3].應(yīng)當(dāng)指出,對(duì)于參數(shù)變化規(guī)律未知的時(shí)變系統(tǒng),參數(shù)辨識(shí)算法給出的參數(shù)估計(jì)值不可能收斂于參數(shù)真值,也就是說(shuō),時(shí)變參數(shù)估計(jì)不存在一致收斂性.在這種情況下,為了考察辨識(shí)算法跟蹤時(shí)變參數(shù)的能力,評(píng)價(jià)時(shí)變參數(shù)辨識(shí)算法的性能,通常不分析辨識(shí)算法的收斂性,而是對(duì)辨識(shí)算法的穩(wěn)定性進(jìn)行研究,即分析參數(shù)估計(jì)誤差的有界性.隨機(jī)過(guò)程有界性判據(jù)是對(duì)時(shí)變參數(shù)辨識(shí)算法穩(wěn)定性進(jìn)行研究的重要理論工具,該判據(jù)曾用于擴(kuò)展卡爾曼濾波(EKF)算法及其他非線性濾波算法的穩(wěn)定性分析[4-6].
具有穩(wěn)定性是一個(gè)參數(shù)辨識(shí)算法正常工作的基本要求.在工程實(shí)踐中,常常得不到未知參數(shù)準(zhǔn)確的先驗(yàn)信息,如果待辨識(shí)參數(shù)的初始值選的不準(zhǔn),對(duì)其估計(jì)值會(huì)產(chǎn)生什么影響,這是參數(shù)辨識(shí)算法穩(wěn)定性研究需要解決的問(wèn)題.一般認(rèn)為,如果隨著估計(jì)時(shí)間的增長(zhǎng),參數(shù)估計(jì)誤差有界,并且估計(jì)誤差逐漸不受初始誤差的影響,則該估計(jì)算法是穩(wěn)定的.影響參數(shù)辨識(shí)算法穩(wěn)定性的因素很多,參數(shù)變化率和測(cè)量噪聲特性的變化,或參數(shù)辨識(shí)算法中的參數(shù)調(diào)整都可能導(dǎo)致估計(jì)誤差的動(dòng)態(tài)特性發(fā)生顯著變化,甚至改變參數(shù)辨識(shí)算法的穩(wěn)定性[2].如果能夠給出參數(shù)辨識(shí)算法穩(wěn)定的充分條件,將有助于找出影響算法穩(wěn)定性的因素,并為算法中的參數(shù)調(diào)整提供可靠的依據(jù).
在以往的時(shí)變參數(shù)辨識(shí)算法穩(wěn)定性分析研究中,往往假定待辨識(shí)參數(shù)的變化率是零均值白噪聲[7].但是,對(duì)于一些特定的問(wèn)題,如特征模型參數(shù)辨識(shí)問(wèn)題而言,待辨識(shí)參數(shù)變化率不一定為0,上述假設(shè)不符合實(shí)際情況.針對(duì)這一問(wèn)題,本文在對(duì)參數(shù)辨識(shí)梯度算法進(jìn)行穩(wěn)定性分析的過(guò)程中,僅要求待辨識(shí)參數(shù)的變化率是有界的,而不要求參數(shù)變化率是零均值白噪聲.考慮到對(duì)于通常的工業(yè)過(guò)程,待辨識(shí)參數(shù)總是在一定范圍內(nèi)變化的,參數(shù)變化率有界的假設(shè)條件在實(shí)際系統(tǒng)中更易于得到滿足.
本節(jié)給出時(shí)變參數(shù)辨識(shí)梯度算法的形式.所研究的系統(tǒng)模型如下所示:
其中,θk∈Rl為待辨識(shí)時(shí)變參數(shù)向量,k表示離散的時(shí)間,yk∈R為系統(tǒng)測(cè)量輸出,φk∈Rl是已知信息向量,測(cè)量噪聲vk∈ R是零均值白噪聲,其統(tǒng)計(jì)特性為
wk是未知參數(shù)變化率.本文假設(shè)wk是有界的,即
參數(shù)辨識(shí)梯度算法的目的是確定未知參數(shù) θk的估計(jì)值,使得由確定的觀測(cè)量的預(yù)測(cè)值接近于實(shí)際觀測(cè)量yk+1.該算法是一種遞推算法,即需要給定初始值,第k步的估計(jì)值在第k -1步估計(jì)值的基礎(chǔ)上,根據(jù)觀測(cè)量yk進(jìn)行修正獲得.針對(duì)如式(1)和式(2)所示的系統(tǒng)模型,時(shí)變參數(shù)辨識(shí)梯度算法的計(jì)算公式可寫(xiě)為如下形式:
其增益陣為
其中,λ1和λ2為梯度算法的設(shè)計(jì)參數(shù).減小梯度算法中的參數(shù) λ1將增大估計(jì)值和的接近程度,從而改善參數(shù)估計(jì)結(jié)果的平穩(wěn)性,但同時(shí)會(huì)減弱觀測(cè)量對(duì)參數(shù)估計(jì)值的修正作用;減小梯度算法中的參數(shù)λ2可以增強(qiáng)觀測(cè)量對(duì)參數(shù)估計(jì)值的修正作用,增強(qiáng)算法對(duì)時(shí)變參數(shù)的跟蹤能力,但同時(shí)會(huì)增大測(cè)量噪聲vk對(duì)參數(shù)估計(jì)的干擾.參數(shù)λ1和λ2的選取可看作對(duì)參數(shù)辨識(shí)平穩(wěn)性和跟蹤能力的折衷.
為了便于后面的穩(wěn)定性分析,定義辨識(shí)算法的參數(shù)估計(jì)誤差為
隨機(jī)過(guò)程有界性判據(jù)是本文進(jìn)行時(shí)變參數(shù)辨識(shí)梯度算法穩(wěn)定性分析的理論基礎(chǔ),該判據(jù)可歸納為如下所示的引理形式[4].文中帶有隨機(jī)變量的不等式表示依概率1成立,表示歐氏范數(shù).
那么?k∈N,隨機(jī)變量ξk滿足
該判據(jù)通過(guò)比較V(ξk)和V(ξk-1)二者的均值(V(ξk-1)=E(V(ξk-1)|ξk-1))來(lái)判斷E(‖ξk‖2)是否有界.V(ξk)可視為能量函數(shù).顯然,如果直觀上可以理解為系統(tǒng)的能量是不斷下降的.引理1可視為李雅普諾夫定理的改進(jìn)形式,只要證明V(ξk-1)小于一個(gè)正數(shù) μ減去與一個(gè)與 V(ξk-1)成比例的項(xiàng)所得的差.引理1表明,如果不等式(8)和(9)成立,那么由式(10),隨著時(shí)間 k的增長(zhǎng),隨機(jī)變量ξk將逐漸不受其初始值ξ0的影響.這一結(jié)論與參數(shù)辨識(shí)算法穩(wěn)定對(duì)估計(jì)誤差的要求是一致的,因此,引理1比較適合用于分析參數(shù)辨識(shí)算法的穩(wěn)定性.
本節(jié)給出時(shí)變參數(shù)辨識(shí)梯度算法穩(wěn)定性分析過(guò)程中需要用到的一個(gè)重要引理,并給出相應(yīng)證明.
引理2.定義轉(zhuǎn)移矩陣
其中,φk∈Rl,N為正整數(shù),
如果φk滿足條件
并且參數(shù)λ1和λ2滿足下列條件
那么,下列不等式成立
其中,符號(hào)λmax(·)表示矩陣的最大特征值,正常數(shù)ρ的取值如下所示
本文中矩陣不等式A≥B表示A-B≥0,即A-B為半正定矩陣.構(gòu)造差分方程
其中,xk是矩陣的最大特征值對(duì)應(yīng)的單位特征向量,即xk使下式成立
并且,
由式(17)和式(20)易知
其次,由已知條件式(13)還可得到
對(duì)上式兩邊取跡得
符號(hào)tr(·)表示取矩陣的跡.考慮到
結(jié)合式(22)和(24)可得
式(25)左右兩邊加λ2得到
或
由式(27)和式(21)等號(hào)左邊可寫(xiě)為
分別考察式(28)括號(hào)中的兩項(xiàng).先考察第 1項(xiàng),由式(18)和式(11)可得
直接計(jì)算二者的差
由假設(shè)條件式(14)易知
因此,
將式(32)代入式(29)得到
或
同理,
將以上各式相加,并由式(18)~(20)可知
根據(jù)式(35)可得,式(28)括號(hào)中的第一項(xiàng)可寫(xiě)為再考察式(28)括號(hào)中的第二項(xiàng)
將式(25)代入式(37)可得
或
同理,
考察xk+i-xk的范數(shù),由范數(shù)的性質(zhì)和柯西不等式可得
將以上各式相加可得
由假設(shè)條件式(14)易知
因此,
又由式(35)可知
將式(45)和式(44)代入式(42)可得
將式(46)代入式(38),式(28)括號(hào)中的第二項(xiàng)可寫(xiě)為
將式(36)和式(47)代入式(28),得到
又由式(21)可知
由式(49)可得引理2的結(jié)論.
引理2中的條件(13)通常被稱為持續(xù)激勵(lì)條件,該條件是引理2成立的關(guān)鍵,也是時(shí)變參數(shù)辨識(shí)梯度算法估計(jì)誤差有界的充分條件之一.
本節(jié)基于引理1和引理2對(duì)時(shí)變參數(shù)辨識(shí)梯度算法的穩(wěn)定性進(jìn)行分析,主要結(jié)果可歸納為如下定理.
定理1.考慮如式(1)和式(2)所示的系統(tǒng)和如式(5)所示的參數(shù)辨識(shí)梯度算法.如果存在正常數(shù)α、β、qmax、rmax、φmax和φmin,使得下列不等式成立
并且,梯度算法中的參數(shù)λ1和λ2滿足
其中,
那么,參數(shù)估計(jì)誤差ξt滿足如下所示的有界性條件
其中,
證明.定理1的證明圍繞引理1中兩個(gè)條件的驗(yàn)證進(jìn)行,并需要用到引理2的結(jié)論.選擇能量函數(shù)
顯然,對(duì)于vmax=vmin=1,引理1中的條件式(8)成立.下面根據(jù)假設(shè)條件驗(yàn)證引理1中的條件式(9).
由式(1)、(2)和(5),可得參數(shù)估計(jì)誤差的表達(dá)式為
根據(jù)Lk+i,k的定義式(11)可得
采用類似方法可得
以此類推,得到
其中,
k=Nt時(shí),參數(shù)估計(jì)誤差可寫(xiě)為
接下來(lái),將式(66)代入式(59),并求能量函數(shù)V(ξt)的條件均值.
由不等式
可得
將式(69)代入式(67)可得
根據(jù)引理2的結(jié)論(15)可得
將式(71)兩邊減去能量函數(shù)V(ξt),得到與引理1中的式(9)相似的形式
其中,γ如式(56)所示,
下面考察μt與μ的關(guān)系.先考察μt表達(dá)式(73)右邊的第1項(xiàng).
其中,
由式(32)可知
將式(77)代入式(76)得到
將式(78)和式(75)代入式(74)可得
再考察μt表達(dá)式(73)右邊的第2項(xiàng).
由式(77)可知
將式(81)代入式(80),并應(yīng)用假設(shè)條件式(51)和式(52)可得
將式(82)和式(79)代入 μt表達(dá)式(73),與 μ的表達(dá)式(57)相比可得
顯然,μ>0.
進(jìn)而,考察γ的取值.由條件式(53)和式(54)可知
根據(jù)式(86)和γ的表達(dá)式(56)可知
由引理2中的結(jié)論式(15)得
或
由等式
和不等式(89)可得
最后,由式(72)和式(83)可得,存在常數(shù) μ>0,0<γ≤1,使得以下不等式成立,
引理1中的條件式(8)和式(9)均得到驗(yàn)證,應(yīng)用引理1可得定理1中的結(jié)論.
定理1表明,在時(shí)變參數(shù)辨識(shí)系統(tǒng)滿足持續(xù)激勵(lì)條件,且待辨識(shí)參數(shù)的變化率wk和測(cè)量噪聲 vk方差有界的情況下,通過(guò)在參數(shù)辨識(shí)梯度算法中選擇適當(dāng)?shù)膮?shù)λ1和λ2,能夠確保估計(jì)誤差ξt的有界性.通過(guò)定理1的結(jié)論式(55)和式(57)不難看出,隨著在參數(shù)辨識(shí)梯度算法的迭代運(yùn)行,其估計(jì)誤差上界漸近的不受初始誤差ξ0影響,估計(jì)誤差上界的取值與參數(shù)變化率和測(cè)量噪聲方差的上界qmax和rmax有關(guān).特別是如果參數(shù)變化率和測(cè)量噪聲方差均為0,那么梯度算法的估計(jì)誤差 ξt將隨著時(shí)間的推移(t→∞)收斂到0.將式(84)代入ρ的表達(dá)式(58),并應(yīng)用式(85),易于驗(yàn)證
本文對(duì)一種辨識(shí)算法-時(shí)變參數(shù)辨識(shí)梯度算法進(jìn)行了穩(wěn)定性分析.基于隨機(jī)過(guò)程有界性判據(jù),給出了時(shí)變參數(shù)辨識(shí)梯度算法穩(wěn)定的充分條件.結(jié)果表明,在待辨識(shí)參數(shù)變化率有界,觀測(cè)噪聲是零均值白噪聲,且系統(tǒng)滿足持續(xù)激勵(lì)條件的情況下,通過(guò)在參數(shù)辨識(shí)梯度算法中選擇適當(dāng)?shù)膮?shù),能夠確保參數(shù)估計(jì)誤差的有界性.并且,對(duì)于確定性時(shí)不變系統(tǒng),梯度算法的參數(shù)估計(jì)誤差收斂,即誤差隨時(shí)間增長(zhǎng)趨近于0.以上工作有望對(duì)特征模型時(shí)變參數(shù)辨識(shí)算法穩(wěn)定性問(wèn)題的研究起到促進(jìn)作用.
[1] 丁鋒,楊慧中,紀(jì)志成.時(shí)變系統(tǒng)辨識(shí)方法及其收斂定理[J].江南大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,5(1): 115-126 Ding F,Yang H Z,Ji Z C.Time-varying system identification methods and convergence theorems[J].Journal of Southern Yangtze University(Natural Science Edition),2006,5(1):115-126
[2] 陳增強(qiáng),林茂瓊,袁著祉.遞推阻尼最小二乘的收斂性與穩(wěn)定性[J].應(yīng)用數(shù)學(xué)和力學(xué),2000,21(2):209-214 Chen Z Q,Lin M Q,Yuan Z Z.Convergence and stability of recursive damped least square algorithm[J].Applied Mathematics and Mechanics,2000,21(2):209-214
[3] 吳宏鑫,胡軍,解永春,基于特征模型的智能自適應(yīng)控制[M].中國(guó)科學(xué)技術(shù)出版社,2009 Wu H X,Hu J,Xie Y C.Characteristic model-based intelligent adaptive control[M].China Science and Technology Press,2009
[4] Reif K,Gunther S,Yaz E,et al.Stochastic stability of the discrete-time extended Kalman filter[J].IEEE Transactions on Automatic Control,1999,44(4):714-728
[5] Xiong K,Zhang H Y,Chan CW.Performance evaluation of UKF-based nonlinear filtering[J].Automatica,2006,42:261-270
[6] Xiong K,Liu L,Liu Y.Nonlinear robust filter design for satellite attitude determination[J].IET Control Theory&Applications,2010,4(7):1222-1234
[7] 丁鋒,丁韜,楊家本,等,時(shí)變參數(shù)遺忘梯度估計(jì)算法的收斂性[J].自動(dòng)化學(xué)報(bào),2002,8(6):962-968 Ding F,Ding T,Yang J B,et al.Convergence of forgetting gradient estimation algorithm for time-varying parameters[J].Acta Automatica Sinica,2002,8(6):962-968
Stability Analysis of Tim e-Varying Param eter Identification G radient A lgorithm
XIONG Kai1,2,MENG Bin1,2,WANG Lijiao1,2
(1.Beijing Institute of Control Engineering,Beijing 100190,China; 2.Science and Technology on Space Intelligent Control Laboratory,Beijing 100190,China)
The stability of a gradient algorithm for time-varying parameter identification is studied in this paper.The stability of the time-varying parameter identification gradient algorithm is analyzed by using the stochastic process boundedness criterion.The sufficient conditions to ensure the stability of the gradient algorithm are demonstrated.It is shown that if the rate of variation of the parameter to be identified is bounded,and themeasurement noise is zero-mean white noise,under the persistent excitation condition,the identification error given by the properly designed gradient algorithm is bounded in the sence ofmean square.This analysis is different from prior works in that it is not necessary to assume that the parameter variation is the zero-mean white noise in the proof of the theory.
parameter identification;gradient algorithm;stochastic process;stability
V4
A
1674-1579(2012)05-0014-07
熊 凱(1976—),男,高級(jí)工程師,研究方向?yàn)榉蔷€性濾波和航天器自主導(dǎo)航.孟 斌(1973—),女,高級(jí)工程師,研究方向?yàn)樽赃m應(yīng)控制、奇異控制、航空航天控制;王麗嬌(1986—),女,博士研究生,研究方向?yàn)楹教炱髯赃m應(yīng)控制.
*國(guó)家自然科學(xué)基金資助項(xiàng)目(61074103).
2012-03-08
DO I:10.3969/j.issn.1674-1579.2012.05.003