林玉倩,尹月霞,孫 夢,王 馨,莊光明
(聊城大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,山東 聊城 252059)
馬爾科夫跳變系統(tǒng)作為一種混合隨機(jī)系統(tǒng),在電力系統(tǒng)、BM/C3、太陽能熱系統(tǒng)等領(lǐng)域具有很強(qiáng)的實(shí)際應(yīng)用價(jià)值,在過去幾十年里得到了許多非常重要的研究結(jié)果[1-6]。馬爾科夫跳變系統(tǒng)與時(shí)間演化和事件機(jī)制有關(guān),且對于突發(fā)現(xiàn)象的建模,它可用于表示隨機(jī)故障和環(huán)境的突發(fā)性變化,對模塊進(jìn)行更新,改變子系統(tǒng)之間的互聯(lián)性等[7-9]。眾所周知,馬爾可夫過程決定了不同模式的跳變和突變,而在跳變或者轉(zhuǎn)換過程中概率測度則決定了馬爾科夫跳變系統(tǒng)的行為[10-13]。
由于隨機(jī)系統(tǒng)在機(jī)械系統(tǒng)、經(jīng)濟(jì)學(xué)、人類操作系統(tǒng)等領(lǐng)域的廣泛應(yīng)用,近幾十年來受到了廣泛的關(guān)注。在實(shí)際應(yīng)用中,這些系統(tǒng)往往受到噪聲的破壞,如布朗運(yùn)動(dòng),且許多研究問題都與H反饋控制和濾波有關(guān)[14]。在文獻(xiàn)[15]中,給出了一種簡潔的連續(xù)隨機(jī)系統(tǒng)的H控制器,并用耦合非線性矩陣不等式表示。文獻(xiàn)[16]研究了參數(shù)不確定性和時(shí)滯隨機(jī)系統(tǒng)的H控制,其中假設(shè)所有狀態(tài)變量對狀態(tài)反饋控制都可行。近年來,隨機(jī)馬爾科夫跳變系統(tǒng)受到了廣泛的關(guān)注,并且出現(xiàn)了各種有意義的隨機(jī)馬爾科夫跳變系統(tǒng)的研究結(jié)果[17-21]。
在許多情況下,時(shí)滯往往是許多動(dòng)態(tài)系統(tǒng)性能差和不穩(wěn)定的根源[22]。在此基礎(chǔ)上,時(shí)滯系統(tǒng)的穩(wěn)定性問題,特別是時(shí)變時(shí)滯系統(tǒng)的穩(wěn)定性問題在過去幾十年中受到了廣泛關(guān)注[23-27]。文獻(xiàn)[28]研究了對于時(shí)變時(shí)滯系統(tǒng)的H狀態(tài)反饋控制問題,并采用了修正的代數(shù)Riccati方程和線性矩陣不等式方法。
在大多數(shù)相關(guān)文獻(xiàn)中,假設(shè)動(dòng)態(tài)系統(tǒng)的狀態(tài)是完全可測的,并且狀態(tài)反饋控制可以輕松實(shí)現(xiàn)[29]。然而,在實(shí)踐中,不可避免的是狀態(tài)信息并不總是完全可測的。針對這種情況,控制器的分析和設(shè)計(jì)主要涉及兩種方法,第一種方法是設(shè)計(jì)一個(gè)基于觀測器的控制器,通過觀測器可以重構(gòu)動(dòng)態(tài)系統(tǒng)的狀態(tài)[30,31]。第二種方法是設(shè)計(jì)一個(gè)動(dòng)態(tài)輸出反饋控制器,利用動(dòng)態(tài)系統(tǒng)的測量輸出信號實(shí)現(xiàn)反饋控制[32,33]。在實(shí)際控制應(yīng)用與實(shí)施中,當(dāng)系統(tǒng)狀態(tài)不可用時(shí),由于完整的狀態(tài)信息難以獲取而系統(tǒng)輸出信號易于獲取,輸出反饋控制策略就顯得非常重要。
另一方面,非脆弱性現(xiàn)象在現(xiàn)實(shí)系統(tǒng)中是不可避免的,非脆弱控制策略的研究不僅集中在理論分析上,而且在實(shí)際應(yīng)用中也得到了廣泛關(guān)注[34-37]。非脆弱控制是指設(shè)計(jì)一個(gè)反饋控制器,使控制器不受由數(shù)值舍入誤差、固有誤差或執(zhí)行器退化等引起的增益的不確定性影響。據(jù)作者有限的知識所知,具有時(shí)變時(shí)滯的隨機(jī)馬爾科夫跳變系統(tǒng)的非脆弱魯棒H動(dòng)態(tài)輸出反饋控制的問題仍然是開放并充滿挑戰(zhàn)的。
受上述問題的啟發(fā),本文將研究具有時(shí)變時(shí)滯隨機(jī)馬爾科夫跳變系統(tǒng)非脆弱H動(dòng)態(tài)輸出反饋控制器的問題。主要目標(biāo)是研究具有更快收斂速度和更好準(zhǔn)確性的時(shí)變時(shí)滯隨機(jī)馬爾科夫跳變系統(tǒng)魯棒指數(shù)均方穩(wěn)定問題;設(shè)計(jì)的動(dòng)態(tài)輸出反饋控制器能確保魯棒指數(shù)均方穩(wěn)定和閉環(huán)隨機(jī)馬爾科夫跳變系統(tǒng)的H性能指標(biāo); 設(shè)計(jì)的動(dòng)態(tài)輸出反饋控制器具有非脆弱的特性,并保證閉環(huán)隨機(jī)馬爾科夫跳變系統(tǒng)的魯棒性。
本文研究的具有時(shí)變時(shí)滯的隨機(jī)馬爾科夫跳變系統(tǒng)
(1)
其中x(t)∈Rn是系統(tǒng)的狀態(tài),φ(t)是初始狀態(tài),z(t)∈Rq是估計(jì)輸出,u(t)∈Rm是控制輸入,v(t)∈Rp是屬于L2[0,+)的擾動(dòng)輸入,y(t)∈Rr是測量輸出,ω(t)是概率空間(Ω,F,P)上的Wiener過程。{rt}是右連續(xù)的馬爾科夫過程且獨(dú)立于ω(t),{rt}在有限集合S={1,2,…,N}中取值。πij是馬爾科夫過程的轉(zhuǎn)移率[4]。τ1(t,rt)和τ2(t,rt)是系統(tǒng)狀態(tài)中的時(shí)變時(shí)滯,對?rt=i∈S,滿足
(2)
其中h1,h2,u1,u2是實(shí)常數(shù)標(biāo)量,h=max{h1,h2}.A(rt),Ad(rt),B1(rt),B2(rt),B3(rt),C(rt),Cd(rt),D1(rt),D2(rt),E(rt),Ed(rt),Gd(rt)是已知的常數(shù)矩陣。
在本文中,將考慮如下全階非脆弱動(dòng)態(tài)輸出反饋控制器
(3)
其中ζ(t)∈Rm是控制器狀態(tài),AΔK(rt)=AK(rt)+ΔAK(rt),BΔK(rt)=BK(rt)+ΔBK(rt),CΔK(rt)=CK(rt)+ΔCK(rt),AK(rt),BK(rt),CK(rt)是動(dòng)態(tài)輸出反饋控制器的未知參數(shù),且
(4)
ΔCK(rt)=L2(rt)F(rt)Ec(rt),
(5)
其中L1(rt)∈Rn×r,L2(rt)∈Rm×r,Ea(rt)∈Rr×n,Eb(rt)∈Rr×l,Ec(rt)∈Rr×n,是已知的實(shí)常數(shù)矩陣。將式(4)代入式(1)得閉環(huán)系統(tǒng)
(6)
定義1[9]對于未加控制輸入u(t)的隨機(jī)馬爾科夫跳變系統(tǒng)(6),如果?d>0,c>0使得
(7)
成立,其中φ是r0的初始狀態(tài),則稱未加控制輸入u(t)的隨機(jī)馬爾科夫跳變系統(tǒng)(6)是魯棒指數(shù)均方穩(wěn)定的。
定義2[11]對于隨機(jī)馬爾科夫跳變系統(tǒng)(6),若對于標(biāo)量α>0,γ>0和任一非零v(t)∈L2[0,+) 有
(8)
成立,其中φ是r0的初始狀態(tài),則稱隨機(jī)馬爾科夫跳變系統(tǒng)(6)滿足H性能指標(biāo)γ。
定理1 未加控制輸入u(t)的隨機(jī)馬爾科夫跳變系統(tǒng)(6)是魯棒指數(shù)均方穩(wěn)定并滿足H性能指標(biāo)γ,如果對?rt=i∈S, ?ε1>0,ε2>0和矩陣Pi>0,Q1>0,Q2>0使得以下的線性矩陣不等式成立
(9)
證明首先,考慮當(dāng)v(t)=0時(shí),系統(tǒng)(6)為
dη(t)=[Ac(rt)η(t)+Acd(rt)Hη(t-τ1(t,rt))]dt+Ecd(rt)Hη(t-τ2(t,rt))dω(t),
(10)
讓η(t)=η(t+θ),θ∈[-h,0],且取L-K函數(shù)
V(ηt,rt)=V1(ηt,rt)+V2(ηt,rt)+V3(ηt,rt)+V4(ηt,rt)+V5(ηt,rt),
(11)
令A(yù)為隨機(jī)過程{ηt,rt}的弱無窮小微分算子,根據(jù)It公式,可得
(12)
(13)
(14)
(15)
(16)
因此,由(2)和(11)-(16)可推出
(17)
其中x(t-τ1i(t))=Hη(t-τ1i(t),x(t-τ2i(t))=Hη(t-τ2i(t))。且對于j≠i,πii≤0馬爾科夫轉(zhuǎn)移率πij≥0,并令η=max{|πii|,i∈S},有
(18)
則有
(19)
其中
因此,通過Dynkin公式,得到具有時(shí)變時(shí)滯的隨機(jī)馬爾科夫跳變系統(tǒng)(6)是隨機(jī)穩(wěn)定的。為證具有時(shí)變時(shí)滯的隨機(jī)馬爾科夫跳變系統(tǒng)(6)是魯棒指數(shù)均方穩(wěn)定的,我們指出
AV(ηt,i)≤-a|η(t)|2,
(20)
其中a=λmin(-Vi)>0。則
dV(ηt,i)≤-a|η(t)|2dt+2η(t)TPiEcdiHη(t-τ2i(t))dω(t)。
(21)
令β>0使
βb-a+2βbheβh(1+ηh)=0,
(22)
其中b=max{λmax(Pi),λmax(HTQ1H),λmax(HTQ2H)}。
考慮到
(23)
(24)
其次,對于初始條件v(t)∈L2[0,)有
dV(ηt,i)=A1V(ηt,i)dt+2η(t)TPiEcdi(t)Hη(t-τ2i(t))dω(t),
(25)
其中V(ηt,t)在(11)中已給出,且
(26)
則有
(27)
其中
則對T>0,有J(T)<0,故系統(tǒng)(6)在零初始條件以及ω(t)≠0時(shí)滿足H性能指標(biāo)γ。定理得證。
定理2 對于標(biāo)量γ>0和給定的標(biāo)量εl>0,l=1,2,…,7,存在一個(gè)非脆弱動(dòng)態(tài)輸出反饋控制器(3)使得閉環(huán)系統(tǒng)(6)滿足魯棒指數(shù)均方穩(wěn)定和H性能指標(biāo),如果對所有的rt=i∈S,存在矩陣Pi>0,R>0,Q1>0,Xi>0,Yi>0,Q2>0,Yi,Φi和Ψi使得以下的線性矩陣不等式成立
(28)
其中
+(1+ηh)HT(Q1+Q2)H,
此時(shí),非脆弱動(dòng)態(tài)輸出反饋控制器(4)的參數(shù)可表示為
(29)
其中Si和Wi是可逆的且滿足
(30)
證明注意,總存在可逆矩陣Si和Wi使得(30)成立,并且我們從(28)可得
(31)
(32)
(33)
則(28)可重寫為
(34)
其中
對于給定的標(biāo)量εl>0,l=1,2,…7,且矩陣Q1>0,Q2>0,由(34)可以發(fā)現(xiàn)
(35)
其中
通過Schur補(bǔ)滿足定理1的公式(9)。此時(shí)期望得到的非脆弱輸出反饋控制器(3)可由(29)實(shí)現(xiàn)。定理得證。
注釋1定理2給出了利用非脆弱動(dòng)態(tài)輸出反饋控制器解決隨機(jī)馬爾科夫跳變系統(tǒng)魯棒H控制問題的充分條件。其中當(dāng)εl>0,l=1,2,…7,是給定的,Yi,Φi,Ψi,Q1>0,Xi>0,Yi>0,Q2>0是未知的,(28)是一個(gè)線性矩陣不等式,這就定義了一個(gè)凸解集,因此(28)可以通過全局收斂的凸規(guī)劃工具求解[14]。對于(28)中的Q2,Q1是以非線性形式出現(xiàn)的,而這種情況在處理具有時(shí)滯的輸出反饋控制問題時(shí)經(jīng)常會遇到的情況[14]。但在狀態(tài)反饋控制器的設(shè)計(jì)中,通常可以通過求解一個(gè)嚴(yán)格的線性矩陣不等式來得到理想的控制器,且須要確定的參數(shù)要少得多。因此,輸出反饋控制器的設(shè)計(jì)要比狀態(tài)反饋情況復(fù)雜得多。
當(dāng)u1=0.06,u2=0.7,h=4.5時(shí),解線性矩陣不等式(28)和方程(30),可以獲得H性能指標(biāo)γ=5.8633和非脆弱動(dòng)態(tài)輸出反饋控制器(4)的參數(shù)如
圖1給出了基于馬爾科夫跳變轉(zhuǎn)移率矩陣Π的動(dòng)態(tài)輸出反饋控制器閉環(huán)隨機(jī)馬爾科夫跳變系統(tǒng)狀態(tài)x(t),圖2展示了基于馬爾科夫跳變轉(zhuǎn)移率矩陣Π的非脆弱動(dòng)態(tài)輸出反饋控制器的狀態(tài),圖3描繪了基于馬爾科夫跳變轉(zhuǎn)移率矩陣Π的增廣系統(tǒng)狀態(tài)η(t),圖4繪制了基于馬爾科夫跳變轉(zhuǎn)移率矩陣Π的估計(jì)輸出狀態(tài)z(t)。
圖1 基于跳變轉(zhuǎn)移率矩陣Π的動(dòng)態(tài)輸出反饋控制器閉環(huán)隨機(jī)跳變系統(tǒng)狀態(tài)x(t)
圖2 基于馬爾科夫跳變轉(zhuǎn)移率矩陣Π的非脆弱動(dòng)態(tài)輸出反饋控制器狀態(tài)
圖3 基于馬爾科夫跳變轉(zhuǎn)移率矩陣Π的增廣系統(tǒng)狀態(tài)η(t)
圖4 基于馬爾科夫跳變轉(zhuǎn)移率矩陣Π的估計(jì)輸出狀態(tài)z(t)
本文具體研究了具有時(shí)變時(shí)滯的隨機(jī)馬爾科夫跳變系統(tǒng)的非脆弱H動(dòng)態(tài)輸出反饋控制器問題。目的是設(shè)計(jì)一個(gè)全階非脆弱動(dòng)態(tài)輸出反饋控制器以證明閉環(huán)隨機(jī)馬爾科夫跳變系統(tǒng)的指數(shù)均方穩(wěn)定和H性能指標(biāo)。并且用線性矩陣不等式對非脆弱動(dòng)態(tài)輸出反饋控制器的存在條件進(jìn)行了改進(jìn)。最后通過實(shí)際例子-工業(yè)非等溫連續(xù)攪拌釜反應(yīng)器,驗(yàn)證了本文方法的有效性和正確性。在未來的工作中,將重點(diǎn)討論在理論上時(shí)變時(shí)滯的最大值問題,并引入自由權(quán)矩陣技術(shù)來獲得具有一般的導(dǎo)數(shù)約束時(shí)滯相關(guān)的充分條件。