蘇 磊,李 峰,夏榮盛,汪 婧,沈 浩
(安徽工業(yè)大學(xué)電氣與信息工程學(xué)院,安徽 馬鞍山 243032)
隨著中、美、德等國提出了一系列以智能制造和工業(yè)現(xiàn)代化為主題的國家發(fā)展戰(zhàn)略,現(xiàn)代制造系統(tǒng)、智能電網(wǎng)等復(fù)雜工業(yè)系統(tǒng)工業(yè)化與信息化的深度融合成為當(dāng)下的研究挑戰(zhàn)。此類系統(tǒng)的動態(tài)演化不僅受時間遷移的影響,還受一些突發(fā)離散因素的影響,如電網(wǎng)中互聯(lián)結(jié)構(gòu)變化、內(nèi)部元件故障、輸電線路遭遇雷擊等。復(fù)雜跳躍系統(tǒng)是一類由連續(xù)時間變量和離散事件共同驅(qū)動的動態(tài)系統(tǒng)模型,可對上述情形進(jìn)行有效建模。為了推動工業(yè)系統(tǒng)兩化深度融合和智能化升級,認(rèn)識復(fù)雜跳躍系統(tǒng)的一般規(guī)律、分析系統(tǒng)性能與控制需求成為控制領(lǐng)域亟需解決的基礎(chǔ)理論問題[1-4]。從數(shù)學(xué)的角度,復(fù)雜跳躍系統(tǒng)常被看作是一類特殊的隨機(jī)系統(tǒng),基于此,復(fù)雜跳躍系統(tǒng)也可被認(rèn)為是一類由馬爾科夫鏈來表征系統(tǒng)跳躍信號的混雜切換系統(tǒng)的特殊情況。系統(tǒng)參數(shù)在離散時間點(diǎn)隨機(jī)變化,并由馬爾科夫過程控制。近年,由于復(fù)雜跳躍系統(tǒng)的廣泛適用性而受到極大關(guān)注,其相關(guān)理論與方法已成功應(yīng)用到經(jīng)濟(jì)[5]、飛行[6]、電力[7]、通信[8]和網(wǎng)絡(luò)化控制[9]等領(lǐng)域。經(jīng)過多年的研究,有關(guān)復(fù)雜跳躍系統(tǒng)的成果被相繼報道。鑒于此,從復(fù)雜跳躍系統(tǒng)的建模、分析與控制綜合三方面綜述近年的研究成果,并指出復(fù)雜跳躍系統(tǒng)在非線性以及網(wǎng)絡(luò)化方面面臨的挑戰(zhàn)。
連續(xù)時間復(fù)雜跳躍系統(tǒng)的一般表達(dá)式如下:
其中:x(t) ∈Rnx,為系統(tǒng)狀態(tài)向量;u(t) ∈Rnu,為控制輸入;ω(t) ∈Rnω,為外部擾動;y(t) ∈Rny,為系統(tǒng)輸出向量。跳躍過程{r(t),t≥0} 是一個連續(xù)時間、離散狀態(tài)的隨機(jī)跳躍過程。依據(jù)隨機(jī)跳躍過程屬于不同的數(shù)學(xué)模型,連續(xù)時間復(fù)雜跳躍系統(tǒng)有不同的形式,通常考慮的是馬爾科夫過程和半馬爾科夫過程。
1) 隨機(jī)過程{r(t),t≥0} 是一個連續(xù)時間、離散狀態(tài)的齊次馬爾科夫過程,且在一個有限的集合Γ?{1 ,2,…,N} 內(nèi)取值,各模態(tài)之間的跳躍服從如下所示的模態(tài)轉(zhuǎn)移速率。
2)跳躍過程{r(t),t≥0} 是一個連續(xù)時間、離散狀態(tài)的齊次半馬爾科夫過程,且取值在一個有限的集合Γ?{1 ,2,…,N} ,各模態(tài)之間的跳躍服從如下所示的模態(tài)轉(zhuǎn)移速率。
一般地,當(dāng)跳躍過程{r(t),t≥0}是馬爾科夫過程,這類系統(tǒng)稱為馬爾科夫跳躍系統(tǒng);當(dāng)跳躍過程r(t)是半馬爾科夫過程,這類系統(tǒng)稱為半馬爾科夫跳躍系統(tǒng)。
離散時間復(fù)雜跳躍系統(tǒng)的建模、控制以及濾波與連續(xù)時間復(fù)雜跳躍系統(tǒng)處理的方式相似,但也存在概念和模型上的區(qū)別。離散時間復(fù)雜跳躍系統(tǒng)的一般表達(dá)式如下:
其中:x(k) ∈Rnx,為狀態(tài)向量;u(k) ∈Rnu,為控制輸入;ω(k) ∈Rnω,為外部擾動;y(k) ∈Rny,為系統(tǒng)輸出向量。跳躍過程{ }r(k),k≥0 是一個隨機(jī)跳躍過程。依據(jù)隨機(jī)跳躍過程屬于不同的數(shù)學(xué)模型,離散時間復(fù)雜跳躍系統(tǒng)有不同的形式,通??紤]的是離散時間馬爾科夫過程和離散時間半馬爾科夫過程。離散時間馬爾科夫過程對模態(tài)之間互相跳躍的轉(zhuǎn)移率稱為轉(zhuǎn)移概率而不是轉(zhuǎn)移速率,且轉(zhuǎn)移概率矩陣中的元素行和為1[10]。
1)離散齊次馬爾科夫過程。跳躍過程{r(k),k≥0} 取值在一個有限的集合Γ?{1 ,2,…,N} ,各模態(tài)之間的跳躍服從模態(tài)轉(zhuǎn)移概率Pr(rk+1=j|rk=i) =πij。其中πij≥0,表示系統(tǒng)從上一個模態(tài)i跳躍到模態(tài)j的概率。此外,轉(zhuǎn)移概率滿足關(guān)系式∑j∈Γπij= 1,?i∈Γ。進(jìn)一步將轉(zhuǎn)移概率寫成矩陣形式Π=[πij]。
2)離散半馬爾科夫過程需要很多定義,鑒于論文篇幅所限,在此省略,具體參閱文獻(xiàn)[11]。
穩(wěn)定性是控制系統(tǒng)正常運(yùn)行的基礎(chǔ),復(fù)雜跳躍系統(tǒng)通常涉及到的穩(wěn)定性有漸近均方穩(wěn)定、指數(shù)均方穩(wěn)定、隨機(jī)穩(wěn)定和幾乎漸近穩(wěn)定4種。前3種穩(wěn)定性相互等價,且均確保第4種穩(wěn)定,其證明可參閱文獻(xiàn)[12]。
轉(zhuǎn)移速率信息是否完備對連續(xù)時間復(fù)雜跳躍系統(tǒng)穩(wěn)定性的判斷有一定的影響。研究初期,均假設(shè)復(fù)雜跳躍系統(tǒng)的跳躍模態(tài)及模態(tài)之間轉(zhuǎn)移速率是完全已知的,且產(chǎn)生了許多有關(guān)復(fù)雜跳躍系統(tǒng)綜合問題的優(yōu)秀成果。Xiao 等[13]通過模態(tài)量化狀態(tài)反饋方法解決了單輸入馬爾科夫跳躍線性系統(tǒng)的鎮(zhèn)定問題,在給定量化粗糙度測量的情況下,采用模態(tài)相關(guān)的對數(shù)量化器和線性狀態(tài)反饋律實(shí)現(xiàn)了馬爾科夫跳躍線性系統(tǒng)均方二次穩(wěn)定的最優(yōu)粗糙度;Zhang 等[14]研究了一類不確定奇異馬爾科夫跳躍系統(tǒng)的魯棒有限時間穩(wěn)定問題,給出了相應(yīng)的隨機(jī)有限時間有界性的充分條件,并將其簡化為凸優(yōu)化的可解性問題;Wu 等[15]利用時滯劃分方法及兩個模態(tài)相關(guān)、雙重積分項的新李雅普諾夫泛函,導(dǎo)出了考慮系統(tǒng)的兩個時滯相關(guān)無源性條件,并給出了相關(guān)隨機(jī)穩(wěn)定性準(zhǔn)則;Lin 等[16]基于強(qiáng)隨機(jī)無源性理論,研究了互聯(lián)非線性隨機(jī)馬爾科夫跳躍系統(tǒng)的反饋等價問題和全局穩(wěn)定問題。
但是,在很多實(shí)際情況下(如因地理位置受限,無法直接對設(shè)備進(jìn)行測量或設(shè)備本身存在不確定性而無法獲得具體數(shù)據(jù)等)無法滿足轉(zhuǎn)移速率完全已知的條件。因此,對馬爾科夫跳躍系統(tǒng)的建模進(jìn)行擴(kuò)展,進(jìn)一步研究轉(zhuǎn)移速率部分未知甚至完全未知的情形,具體描述如下:
式 中? 表 示 未 知 的 轉(zhuǎn) 移 速 率。 為 了 簡 化,一 般 定 義 集 合Ui=∪?i∈Γ。 其 中,?{j|對于j∈Γ,λij是已知的},?{j|對于j∈Γ,λij是未知的}。 此 外,若≠?,則 可 進(jìn) 一 步 描 述?{,,…,} ,其中m為非負(fù)整數(shù),滿足1 ≤m≤N且∈Z+,1 ≤≤N,j= 1,2,…,m,表示集合為轉(zhuǎn)移速率矩陣第i行中的第j個已知元素。若= ?,則表示轉(zhuǎn)移速率完全未知的情形。
Zhang等[17]利用自由權(quán)矩陣方法,得到了具有部分未知或完全未知轉(zhuǎn)移速率的馬爾科夫跳躍系統(tǒng)的穩(wěn)定性判據(jù),討論了具有轉(zhuǎn)移速率部分已知的馬爾科夫跳躍線性系統(tǒng)的穩(wěn)定性問題,優(yōu)點(diǎn)是所提決策變量較少。Wang等[18]解決了部分未知轉(zhuǎn)移速率和執(zhí)行器飽和條件下,馬爾科夫跳躍系統(tǒng)的隨機(jī)穩(wěn)定問題及部分已知轉(zhuǎn)移速率的連續(xù)馬爾科夫跳躍線性系統(tǒng)的穩(wěn)定和綜合問題。
上述結(jié)果中連續(xù)馬爾科夫跳躍系統(tǒng)對轉(zhuǎn)移速率的要求有一定約束,即其模態(tài)在相互跳躍過程中的轉(zhuǎn)移速率是時不變的,如果轉(zhuǎn)移速率是時變的,結(jié)果將不再適用。為此,進(jìn)一步考慮轉(zhuǎn)移速率時變的情況,此時的馬爾科夫跳躍系統(tǒng)變?yōu)榉驱R次馬爾科夫跳躍系統(tǒng)。Ding等[19]研究了連續(xù)時間非齊次馬爾科夫跳躍系統(tǒng)的穩(wěn)定性問題;Yin等[20]進(jìn)一步研究了積分非齊次馬爾科夫跳躍系統(tǒng)的隨機(jī)穩(wěn)定性問題;Ren等[21]引入狀態(tài)和輸入的時滯,解決了該類系統(tǒng)的穩(wěn)定與控制問題。文獻(xiàn)[19-21]均是基于凸多面體結(jié)構(gòu)描述連續(xù)時間非齊次馬爾科夫跳躍系統(tǒng)的時變轉(zhuǎn)移速率。
此外,連續(xù)馬爾科夫跳躍系統(tǒng)模態(tài)在相互跳躍過程中的駐留時間服從指數(shù)分布,這一限制的約束性較強(qiáng)。實(shí)際上,由于外部環(huán)境干擾及系統(tǒng)設(shè)備本身的老化、故障等因素,系統(tǒng)模態(tài)在相互跳躍過程中的駐留時間可能服從其他分布,此時馬爾科夫跳躍系統(tǒng)無法滿足建模要求。為克服這一問題,探索建立一個新的數(shù)學(xué)模型,即半馬爾科夫跳躍模型,其轉(zhuǎn)移速率如式(3)。起初假設(shè)一個時變量存在已知的上下界,Huang 等[22]為降低穩(wěn)定條件的保守性,提出加入轉(zhuǎn)移速率的上下界,并應(yīng)用一種新的劃分方案;Wang等[23]基于時變轉(zhuǎn)移概率的下界、上界和奇異值分解方法,提出一個隨機(jī)穩(wěn)定條件;Yang 等[24]提出采用一種時變增益調(diào)度方法來解決一類半馬爾科夫跳躍線性系統(tǒng)的時變增益調(diào)度問題,構(gòu)造了更一般的李雅普諾夫函數(shù),該函數(shù)不僅依賴于系統(tǒng)模態(tài),還依賴于當(dāng)前系統(tǒng)模式中的駐留時間,這種方法可將普通時不變李雅普諾夫函數(shù)作為特殊情況。
但已知轉(zhuǎn)移速率上下界的處理方式仍具一定的保守性。對此學(xué)者們提出了一種駐留時間服從威布爾分布的半馬爾科夫模型,該模型進(jìn)一步降低了保守性,不再需要已知轉(zhuǎn)移速率的上下界信息。Zhang 等[25]假設(shè)轉(zhuǎn)移速率隨已知邊界而時變,駐留時間在半馬爾科夫過程中服從威布爾分布,將傳統(tǒng)的非線性約束如單邊、單邊約束等推廣到增量二次約束;Wang等[26]探討了切換信號受非指數(shù)分布的半馬爾科夫過程控制的隨機(jī)系統(tǒng)均方穩(wěn)定性問題;Qi等[27]針對具有時變時滯的連續(xù)時間正模糊半馬爾科夫跳躍系統(tǒng),分析了隨機(jī)穩(wěn)定性和增益問題,考慮的系統(tǒng)涉及與威布爾分布相關(guān)的半馬爾科夫隨機(jī)過程,模糊半馬爾科夫跳躍正系統(tǒng)描述的Lotka-Volterra種群模型等系統(tǒng)需考慮運(yùn)行過程中的突然變化,為此建立了一個與時變延遲上界有關(guān)的隨機(jī)穩(wěn)定性的充分判據(jù)。
在一些實(shí)際工程應(yīng)用中,系統(tǒng)的模態(tài)并不可以直接被獲取。為克服這一難題,研究者們從觀察者的角度刻畫這一現(xiàn)象并建立了隱馬爾科夫跳躍模型。Xiao等[28]考慮了在連續(xù)時間下同時包含隱藏狀態(tài)和觀測狀態(tài)的隱馬爾科夫跳躍系統(tǒng),通過構(gòu)造合適的李雅普諾夫泛函,得到了保證目標(biāo)系統(tǒng)隨機(jī)有限時間穩(wěn)定的充分條件;Wang等[29]解決了同時具有兩個切換信號的分段齊次馬爾科夫鏈的正馬爾科夫跳躍系統(tǒng)的均方穩(wěn)定問題;謝雨飛等[30]在隱馬爾科夫模型和無線通信子系統(tǒng)的基礎(chǔ)上,討論了具有隨機(jī)和間歇性故障的診斷方法,給出了參數(shù)訓(xùn)練和故障診斷算法;王亞婷等[31]討論了一種基于隱馬爾科夫模型、多層次殘差的分布式拒絕服務(wù)攻擊檢測方法,可用相關(guān)公式提取分布式拒絕服務(wù)攻擊的可觀測和隱式參數(shù),排列隱含狀態(tài)和觀測狀態(tài)轉(zhuǎn)移概率矩陣,通過計算和分析分布式拒絕服務(wù)攻擊因子來判斷多級殘差網(wǎng)絡(luò)中是否存在分布式拒絕服務(wù)攻擊。
離散時間復(fù)雜跳躍系統(tǒng)對轉(zhuǎn)移概率部分已知或完全未知的處理和連續(xù)時間復(fù)雜跳躍系統(tǒng)類似,在假設(shè)轉(zhuǎn)移概率完全已知和確定的情況下,離散時間復(fù)雜跳躍系統(tǒng)的綜合問題得到廣泛研究。Fan等[32]考慮到系統(tǒng)同時具有混合延遲和隨機(jī)擾動,通過構(gòu)造與跳躍信號相關(guān)的新李雅普諾夫函數(shù),分析了具有部分不穩(wěn)定子系統(tǒng)的離散時間馬爾科夫跳躍神經(jīng)網(wǎng)絡(luò)均方指數(shù)穩(wěn)定性問題。基于時滯劃分方法,Wu等[33]解決了具有時變時滯和分段常數(shù)躍遷概率的離散奇異馬爾科夫跳躍系統(tǒng)的隨機(jī)穩(wěn)定性分析問題,對考慮的系統(tǒng)建立了時滯相關(guān)穩(wěn)定性判據(jù),給定的結(jié)果不僅取決于時變延遲,還取決于延遲分區(qū)的數(shù)量。Lee 等[34]通過構(gòu)造與有限路徑相關(guān)的李雅普諾夫函數(shù),研究了不確定離散時間馬爾科夫跳躍線性系統(tǒng)的一致穩(wěn)定性和鎮(zhèn)定問題。基于積分型隨機(jī)李雅普諾夫函數(shù)方法,Wang等[35]求解了一類不確定馬爾科夫線性雙曲型偏微分方程系統(tǒng)的隨機(jī)指數(shù)穩(wěn)定性問題。
然而,準(zhǔn)確獲取所有轉(zhuǎn)移概率是相當(dāng)困難的。為此,學(xué)者們進(jìn)一步對離散時間馬爾科夫跳躍系統(tǒng)的建模進(jìn)行擴(kuò)展,研究轉(zhuǎn)移概率部分未知甚至完全未知的情形。Ma等[36]討論了時變時滯離散時間奇異馬爾科夫跳躍系統(tǒng)的隨機(jī)穩(wěn)定性和鎮(zhèn)定問題,在充分了解轉(zhuǎn)移概率情況下,給出了系統(tǒng)正則、因果和隨機(jī)穩(wěn)定的時滯相關(guān)條件;Liu 等[37]在考慮轉(zhuǎn)移概率不確定情況下,研究了具有馬爾科夫跳躍和乘性噪聲的隨機(jī)線性系統(tǒng)的濾波問題,給出了濾波誤差系統(tǒng)是隨機(jī)穩(wěn)定且滿足H∞性能的充分條件;Shen 等[38]研究了部分已知轉(zhuǎn)移概率的離散馬爾科夫跳躍系統(tǒng)的有限時間穩(wěn)定問題,考慮的系統(tǒng)是已知上界不確定和完全未知的。
上述研究的離散馬爾科夫跳躍系統(tǒng)要求模態(tài)在跳躍過程中轉(zhuǎn)移概率是時不變的,但如果轉(zhuǎn)移概率是時變的,會導(dǎo)致模型在許多實(shí)際場景中不適用。為此,進(jìn)一步考慮轉(zhuǎn)移概率是時變的情況,此時的馬爾科夫跳躍系統(tǒng)為非齊次馬爾科夫跳躍系統(tǒng)。Wang等[39]研究了具有時滯的非齊次馬爾科夫跳躍系統(tǒng)的穩(wěn)定性問題,考慮的系統(tǒng)是在離散時域中,因此轉(zhuǎn)移概率的非齊次性被認(rèn)為是有限分段齊次的。
另一方面,由于限制離散馬爾科夫跳躍系統(tǒng)模態(tài)在相互跳躍過程中的駐留時間是服從幾何分布的,導(dǎo)致模型許多實(shí)際場景不適用。為此,提出了離散時間半馬爾科夫跳躍模型。對于離散時間半馬爾科夫模型,駐留時間并不局限于無記憶分布,系統(tǒng)在某一時刻的跳轉(zhuǎn)不僅取決于下一時刻跳轉(zhuǎn)的模態(tài)信息,也取決于先前經(jīng)歷模態(tài)的信息。故半馬爾科夫過程建模隨機(jī)跳躍系統(tǒng)的能力比馬爾科夫的強(qiáng),且能更準(zhǔn)確地描述系統(tǒng)的跳躍動力學(xué)。學(xué)者們對離散時間半馬爾科夫系統(tǒng)的研究興趣激增,在具有半馬爾科夫躍遷參數(shù)的復(fù)雜跳躍系統(tǒng)穩(wěn)定性和鎮(zhèn)定研究方面取得了重要成果?;赥akagi-Sugeno(T-S)模型,Zhang 等[40]在文獻(xiàn)[15]的基礎(chǔ)上將得到的理論結(jié)果進(jìn)一步推廣到非線性情況??紤]到鎮(zhèn)定控制器模態(tài)與系統(tǒng)可能存在延時,Ning 等[41]在控制器模式切換存在時滯情況下,討論了離散半馬爾科夫跳躍系統(tǒng)的穩(wěn)定性與鎮(zhèn)定控制器設(shè)計??紤]到概率質(zhì)量函數(shù)的不同,Zhang 等[42]在駐留時間的指數(shù)調(diào)制周期分布情況下,研究了離散半馬爾科夫跳躍系統(tǒng)的穩(wěn)定性與鎮(zhèn)定控制器設(shè)計。上述結(jié)果多基于離散半馬爾科夫系統(tǒng)駐留時間具有上界的前提,然而在一些用離散半馬爾科夫系統(tǒng)描述的實(shí)際系統(tǒng)中,駐留時間不僅存在上界,還存在下界。Ning等[43]給出了該情況下相應(yīng)的穩(wěn)定性分析和鎮(zhèn)定控制器設(shè)計方法;Wang等[44]進(jìn)一步分析了一類離散時間半馬爾科夫跳躍線性系統(tǒng)的穩(wěn)定性綜合問題,并給出了這類系統(tǒng)駐留時間無界的充分穩(wěn)定條件,通過將切換過程駐留時間截斷為有界,得到了具有部分未知半馬爾科夫核閉環(huán)系統(tǒng)的穩(wěn)定控制器的存在條件。
由于難以獲得駐留時間或模態(tài)躍遷的準(zhǔn)確統(tǒng)計信息,只有部分半馬爾科夫信息的情況下,Shen等[45]研究了具有離散半馬爾科夫跳躍奇異攝動系統(tǒng)的鎮(zhèn)定問題,分析了半馬爾科夫跳躍序列的李雅普諾夫函數(shù)的變化趨勢,首次建立了離散時間半馬爾科夫跳躍系統(tǒng)的均方指數(shù)穩(wěn)定性判據(jù)。Ning 等[46]利用半馬核方法解決了具有駐留時間上界的離散半馬爾科夫跳躍系統(tǒng)的隨機(jī)穩(wěn)定性與鎮(zhèn)定問題,其中半馬核元素的底層系統(tǒng)被認(rèn)為是部分已知的,比半馬爾科夫跳躍系統(tǒng)完全可用的情形更具一般性?;赥-S模糊模型,Ning等[47]將文獻(xiàn)[46]的結(jié)果進(jìn)一步推廣到離散非線性半馬爾科夫跳躍系統(tǒng)。
馬爾科夫跳躍系統(tǒng)在經(jīng)濟(jì)、飛行控制和機(jī)器人等領(lǐng)域有較強(qiáng)的應(yīng)用背景,前期的成果主要集中在馬爾科夫跳躍系統(tǒng)的穩(wěn)定性和鎮(zhèn)定[48]、二次最優(yōu)控制[49]和魯棒控制[50]等方面,研究方法主要是基于Riccati方程。隨著控制理論與數(shù)學(xué)學(xué)科的發(fā)展,矩陣不等式技術(shù)成為研究控制問題的有力工具,使得馬爾科夫跳躍系統(tǒng)的魯棒控制、模型降階、受限控制和時滯等問題得到深入研究。
對于連續(xù)時間復(fù)雜跳躍系統(tǒng)控制問題,同樣需要考慮系統(tǒng)轉(zhuǎn)移速率是否完全已知,一般包含完全已知、部分未知和一般化的轉(zhuǎn)移速率;還要考慮系統(tǒng)模態(tài)信息能否獲取,并用于控制器設(shè)計。從模態(tài)信息是否可獲取的角度,設(shè)計的控制器為模態(tài)依賴與模態(tài)獨(dú)立的控制器。
Zhang等[51]提出了一種基于新型轉(zhuǎn)移概率的模態(tài)無關(guān)保成本控制方法,建立了相應(yīng)控制器存在的充分條件。Shen 等[52]討論了T-S 模糊馬爾科夫跳躍系統(tǒng)的有限時間事件觸發(fā)H∞控制問題,建立了一個充分考慮異步前提的閉環(huán)模糊馬爾科夫跳躍系統(tǒng)有限時間有界H∞性能分析的充分條件。Tao等[53]為描述系統(tǒng)與控制器之間傳輸不完全的現(xiàn)象,采用一種模態(tài)相關(guān)的隨機(jī)測量衰落模型,通過引入兩個相互獨(dú)立且依賴于模態(tài)的衰落信道系數(shù),準(zhǔn)確描述由系統(tǒng)模態(tài)變化引起的通信工作負(fù)載波動;為實(shí)現(xiàn)控制器的可靠性,引入一個附加矩陣,并利用不等式技術(shù)求解設(shè)計控制器的增益。魯棒控制性能被用來分析系統(tǒng)的穩(wěn)定性已得到廣泛應(yīng)用,但尋求最優(yōu)解的研究也在逐步開展,如劉越等[54]闡述了線性馬爾科夫跳躍系統(tǒng)最優(yōu)控制的研究現(xiàn)狀與進(jìn)展。
滑模控制是一系列變結(jié)構(gòu)控制,對系統(tǒng)參數(shù)的變化和外部擾動不敏感,特別是對非線性系統(tǒng)的控制具有魯棒性。在復(fù)雜跳躍系統(tǒng)存在非線性元素時多使用滑模技術(shù),故學(xué)者們陸續(xù)提出了有關(guān)復(fù)雜跳躍系統(tǒng)的滑??刂品椒?。Zhu等[55]利用凸優(yōu)化方法,結(jié)合多步狀態(tài)轉(zhuǎn)移概率,推導(dǎo)了在控制力可能不足以保證完全漸近穩(wěn)定性情況下的到達(dá)概率和滑動概率;Li等[56]設(shè)計了具有執(zhí)行器故障的馬爾科夫跳躍非線性系統(tǒng)的自適應(yīng)滑模控制器,設(shè)計的控制器可在有限時間內(nèi)將系統(tǒng)的狀態(tài)軌跡驅(qū)動到滑模面,并能在線估計執(zhí)行器故障、非線性項邊界和外部擾動的有效性損失;Cao等[57]采用滑??刂品椒ㄔO(shè)計滑模控制器,在所有控制信道都可能發(fā)生執(zhí)行器故障和不匹配的外部干擾情況下,使?fàn)顟B(tài)軌跡在指定的有限時間間隔內(nèi)被驅(qū)動到滑模面。
綜上,作為一個關(guān)鍵因素,馬爾科夫跳躍過程中的所有轉(zhuǎn)移率被認(rèn)為是完全已知的。盡管部分學(xué)者采用線性系統(tǒng)魯棒控制方法研究轉(zhuǎn)移速率矩陣存在多胞或范數(shù)有界型不確定性,但這種類型的不確定性仍要求轉(zhuǎn)移速率矩陣中每個元素都有可用信息。對于物理系統(tǒng),轉(zhuǎn)移速率的獲取通常通過實(shí)驗(yàn)測量得到,由于測量條件的制約,轉(zhuǎn)移速率矩陣會出現(xiàn)某些元素在一定范圍內(nèi)變化和無法被測量的現(xiàn)象,致使不能直接使用基于轉(zhuǎn)移速率為完全已知的方法研究系統(tǒng)的穩(wěn)定性、控制、濾波和跟蹤等問題。為克服上述不足,Yao等[58]解決了部分轉(zhuǎn)移速率未知的狀態(tài)延遲馬爾科夫跳躍系統(tǒng)H∞控制問題;Zheng等[59]基于滑模控制方法,研究了一類具有部分未知轉(zhuǎn)移速率的連續(xù)時間馬爾科夫跳躍線性不確定系統(tǒng)的魯棒穩(wěn)定問題;Park 等[60]給出了部分未知轉(zhuǎn)移速率和輸入飽和的馬爾科夫跳躍模糊系統(tǒng)低保守性的控制條件,在充分考慮模糊權(quán)值性質(zhì)的情況下,將所有可能的松弛變量納入放縮過程中,推導(dǎo)出了較不保守的穩(wěn)定條件。
上述研究大多假定系統(tǒng)模態(tài)的所有信息可直接獲取,這種假設(shè)在實(shí)際網(wǎng)絡(luò)環(huán)境中并不總是滿足的。為此,連續(xù)時間隱馬爾科夫跳躍系統(tǒng)的控制問題近年也得到大量關(guān)注。Wang等[61]設(shè)計一種異步事件觸發(fā)的滑模控制律,以保證得到的閉環(huán)系統(tǒng)軌跡能夠在有限時間間隔內(nèi)被強(qiáng)制到預(yù)定義的滑模面;Ren 等[62]利用T-S模糊模型方法研究了連續(xù)時間正隱馬爾科夫跳躍系統(tǒng)的有限時間異步控制問題;Han 等[63]研究了連續(xù)隨機(jī)馬爾科夫跳躍系統(tǒng)基于耗散的異步邊界控制問題,考慮到系統(tǒng)模態(tài)與控制器模態(tài)之間的非同步行為,引入一種更一般不完全觀測概率矩陣和一般未知轉(zhuǎn)移速率矩陣的隱馬爾科夫模型,其中未知轉(zhuǎn)移速率矩陣包含不確定性,將此研究推廣到空間域,使系統(tǒng)的狀態(tài)變化不僅和時間有關(guān)也和空間有關(guān)。
上述傳統(tǒng)的連續(xù)隱馬爾科夫模型一般包含系統(tǒng)模態(tài)間的跳躍概率及探測器間的檢測概率。Stadtmann等[64]突破傳統(tǒng)隱馬爾科夫模型的約束,提出了一種創(chuàng)新型的隱馬爾科夫模型,該模型包含3 種概率,即系統(tǒng)模態(tài)之間的跳躍概率、探測器對系統(tǒng)模態(tài)的檢測概率以及探測器模態(tài)之間的跳躍概率。與文獻(xiàn)[63]相比,探測器模態(tài)之間跳躍概率的引入使探測器探測到的模態(tài)包含完整信息,在沒有信息的情況下使獲得的結(jié)果更具通用性。對于創(chuàng)新型的隱馬爾科夫模型,用基于探測器的控制方法來保證系統(tǒng)的H2性能。
為保證系統(tǒng)具有良好的抗模型不確定或外部干擾的性能,魯棒控制問題被關(guān)注。Hu等[65]提出了不確定采樣數(shù)據(jù)馬爾科夫跳躍系統(tǒng)的魯棒控制解決方案;Zhang等[66]研究了一類離散時間馬爾科夫跳躍系統(tǒng)基于耗散異步控制問題;Liu等[67]通過最優(yōu)輸出反饋控制方法設(shè)計了具有丟包和輸入延遲的多參數(shù)混合負(fù)載均衡系統(tǒng)的控制器;魏雪雪等[68]針對一類帶有時滯和噪聲的離散時間馬爾科夫跳躍系統(tǒng),研究基于觀測器的有限時間H∞控制問題,給出有限時間H∞有界的定義,設(shè)計基于觀測器的有限時間H∞控制器,使所得閉環(huán)誤差系統(tǒng)是有限時間有界的,且滿足規(guī)定的干擾衰減水平。
綜上,作為關(guān)鍵因素,馬爾科夫跳躍過程中的所有轉(zhuǎn)移率被認(rèn)為是完全已知的。然而實(shí)際應(yīng)用中,很難獲得轉(zhuǎn)移概率的確切值,認(rèn)為不確定的轉(zhuǎn)移概率是在一個沒有精確知識的可能區(qū)間給出的。Costa等[69]求解轉(zhuǎn)移概率不確定且考慮狀態(tài)和控制變量約束的離散時間馬爾科夫跳躍系統(tǒng)的二次最優(yōu)控制問題;Li等[70]討論了部分已知轉(zhuǎn)移概率下,具有時滯和兩個馬爾科夫鏈的離散時間馬爾科夫跳躍系統(tǒng)狀態(tài)反饋控制器的設(shè)計。另一種建模不確定轉(zhuǎn)移速率或轉(zhuǎn)移概率的方法是范數(shù)有界描述,Karan等[71]利用隨機(jī)李雅普諾夫函數(shù)方法和Kronecker 積變換技術(shù)導(dǎo)出了連續(xù)和離散時間馬爾科夫跳躍系統(tǒng)的充分條件集。與轉(zhuǎn)移概率中假定的多面體或范數(shù)有界的不確定性不同的研究包括文獻(xiàn)[72]中高斯躍遷概率密度函數(shù)量化轉(zhuǎn)移概率的不確定性信息。
當(dāng)轉(zhuǎn)移概率是時變的,對應(yīng)的離散馬爾科夫系統(tǒng)則為非齊次的。目前離散非齊次馬爾科夫系統(tǒng)主要有3 種處理方法:將時變轉(zhuǎn)移概率用凸多孢來描述;考慮時變的轉(zhuǎn)移概率是周期變化的;考慮分段齊次的轉(zhuǎn)移概率。Yin等[73]用凸多孢來描述時變轉(zhuǎn)移概率,研究了離散非齊次馬爾科夫系統(tǒng)的控制問題;Zhang等[74]研究了一類轉(zhuǎn)移概率是周期變化的馬爾科夫跳躍系統(tǒng)的非脆弱H∞控制問題;Dong等[75]研究了一類分段齊次轉(zhuǎn)移概率的離散時間非齊次馬爾科夫跳躍非線性系統(tǒng)的擴(kuò)展耗散滑??刂?。
另一方面,現(xiàn)有成果多集中于馬爾科夫跳躍系統(tǒng)線性動力學(xué)的控制設(shè)計方面。T-S 模糊模型因具有強(qiáng)大的逼近能力而被廣泛用于處理非線性問題,該模型由一組IF-THEN 規(guī)則組成,描述一組線性子系統(tǒng)的輸入輸出關(guān)系,線性子系統(tǒng)通過隸屬函數(shù)進(jìn)行加權(quán)[76]。在假設(shè)轉(zhuǎn)移概率完全已知和確定的情況下,T-S模糊馬爾科夫跳躍系統(tǒng)得到廣泛應(yīng)用。Wu等[77]利用模糊控制方法研究了不確定離散時間馬爾科夫跳躍非線性系統(tǒng)的魯棒鎮(zhèn)定問題,提出了一種改進(jìn)的線性矩陣不等式,以緩解微分過程中隨機(jī)李雅普諾夫矩陣與包含控制器變量系統(tǒng)矩陣間的相互關(guān)系;Shen 等[78]研究了T-S 模糊離散時間馬爾科夫跳躍系統(tǒng)的有限時間事件觸發(fā)H∞控制問題。
針對離散時間馬爾科夫跳躍系統(tǒng)的模態(tài)信息無法獲取,Costa 等[79]提出了基于探測器的方法,其主要思想是盡管系統(tǒng)模態(tài)信息無法直接獲取,但利用探測器估計的狀態(tài)設(shè)計控制器。這種基于隱馬爾科夫模型的控制器設(shè)計方法不僅有自身的轉(zhuǎn)移概率信息,還需觀測概率信息。正如前面提到的,馬爾科夫跳躍系統(tǒng)可能無法獲取轉(zhuǎn)移概率信息,同理觀測概率信息也可能無法完全獲取。因此,基于隱馬爾科夫模型的控制器設(shè)計方法需考慮轉(zhuǎn)移概率信息部分未知及觀測概率部分未知的情況。Song 等[80]考慮部分未知的觀測概率情況,研究了一類具有時變時滯和隨機(jī)擾動的不確定馬爾科夫跳躍系統(tǒng)的異步滑模控制問題。為了一般化,Li等[81-82]考慮轉(zhuǎn)移概率信息部分未知及觀測概率部分未知的情況,基于T-S模糊模型將所得的結(jié)果推廣到非線性系統(tǒng)。
考慮到離散半馬爾科夫跳躍系統(tǒng)中轉(zhuǎn)移概率可能未知,Shen 等[83]研究了具有不完全半馬核信息和執(zhí)行器故障的半馬爾科夫跳躍非線性系統(tǒng)的容錯模糊控制問題。針對離散半馬爾科夫跳躍系統(tǒng)中系統(tǒng)模態(tài)信息可能未知,Li 等[84]考慮了未知概率信息情況?;赥-S 模糊模型,Cai 等[85]考慮了非線性離散隱半馬爾科夫跳躍系統(tǒng)的控制問題,將得到的結(jié)果推廣到具有不完全半馬核信息情況。
狀態(tài)反饋是現(xiàn)代控制系統(tǒng)中最常用的控制策略之一。實(shí)際應(yīng)用中系統(tǒng)的狀態(tài)很難直接測量,加之系統(tǒng)會受到外部擾動或環(huán)境噪聲的干擾,直接獲取系統(tǒng)狀態(tài)更困難,為此引入狀態(tài)濾波和估計。狀態(tài)濾波是通過測量系統(tǒng)的輸入和輸出來估計系統(tǒng)的狀態(tài),常用的濾波方法有Kalman濾波、線性最小均方差濾波和H∞濾波等。Kalman濾波器的設(shè)計需精確已知系統(tǒng)模型且噪聲輸入為嚴(yán)格高斯過程[86],應(yīng)用局限性大。實(shí)際應(yīng)用中當(dāng)噪聲為非高斯過程時,較多關(guān)注H∞濾波、無源性濾波、能量-峰值(L2-L∞)濾波、耗散濾波等的設(shè)計。目前為止,復(fù)雜跳躍系統(tǒng)在濾波問題上取得了重要進(jìn)展。復(fù)雜跳躍系統(tǒng)的濾波器/狀態(tài)估計器從結(jié)構(gòu)看主要為與模態(tài)相關(guān)和模態(tài)無關(guān)的濾波器。模態(tài)相關(guān)的濾波器能完全獲取系統(tǒng)工作模態(tài)信息,能保證濾波器與系統(tǒng)的工作模態(tài)一致;模態(tài)無關(guān)的濾波器/狀態(tài)估計器只有單一的工作模態(tài),與系統(tǒng)工作模態(tài)無關(guān)。
Shen 等[87]提出了理想可靠的濾波器設(shè)計方法,通過使用期望濾波器的簡單表達(dá)式計算濾波器的參數(shù);Wu 等[88]考慮了具有時滯的奇異馬爾科夫跳躍系統(tǒng)的H∞濾波問題,在有界實(shí)引理和馬爾科夫過程跳躍率部分已知的情況下,給出了保證模態(tài)無關(guān)濾波器存在的充分條件;Liu 等[89]針對馬爾科夫跳躍線性系統(tǒng)因無法獲取模態(tài)信息而無法濾波的問題,設(shè)計了一種獨(dú)立于模態(tài)信息的濾波器;顏秋林等[90]研究了帶有時滯的廣義馬爾科夫跳躍系統(tǒng)的H∞濾波問題,其中時滯依賴有界實(shí)引理。陳淼等[91]針對一類具有馬爾科夫跳躍參數(shù)的Ito 類型不確定隨機(jī)時滯系統(tǒng),討論魯棒非脆弱濾波器的設(shè)計,在被控對象及濾波器同時存在不確定性的情況下,使閉環(huán)濾波誤差系統(tǒng)的魯棒隨機(jī)指數(shù)均方穩(wěn)定,且干擾抑制性能指標(biāo)小于給定上界。
當(dāng)系統(tǒng)模態(tài)信息完全無法獲取時,模態(tài)無關(guān)濾波器非常有用,但由于其忽略所有可用的模態(tài)信息,存在一定的保守性。為此,F(xiàn)ang等[92]用隱馬爾科夫跳躍原理表示目標(biāo)系統(tǒng)與濾波器之間的異步情況;Ren等[93]討論了一類具有不完全轉(zhuǎn)移速率的馬爾科夫跳躍非線性系統(tǒng)的有限時間異步濾波問題。另一方面,影響網(wǎng)絡(luò)化控制系統(tǒng)穩(wěn)定性的一個主要因素是數(shù)據(jù)包在信道傳輸過程中存在時延。Liu 等[94]研究了網(wǎng)絡(luò)化控制系統(tǒng)中存在傳輸和網(wǎng)絡(luò)誘導(dǎo)時延等通信缺陷的穩(wěn)定性問題,提出一種基于記憶的混合系統(tǒng),由己知公式計算得到最大允許傳輸時延,依靠具有記憶的混合系統(tǒng)李雅普諾夫泛函方法進(jìn)行穩(wěn)定性分析,獲得相應(yīng)的穩(wěn)定性條件?;隈R爾科夫跳躍系統(tǒng)的特點(diǎn),模擬網(wǎng)絡(luò)化控制系統(tǒng)中出現(xiàn)隨機(jī)時延、數(shù)據(jù)丟失等情況進(jìn)行濾波估計引起廣泛關(guān)注,Zhang等[95]研究了一類轉(zhuǎn)移概率部分未知的離散時間馬爾科夫跳躍線性系統(tǒng)H∞濾波問題,利用線性矩陣不等式推導(dǎo)得到濾波誤差系統(tǒng)隨機(jī)穩(wěn)定且有界的實(shí)引理,數(shù)值示例證明其方法有效可行。
制藥、發(fā)酵、石油化工等領(lǐng)域普遍缺乏在線傳感器。因此,狀態(tài)估計是控制學(xué)科中的一個重要研究課題。Xia 等[96]利用T-S 模糊模型,研究了一類非線性半馬爾科夫跳躍系統(tǒng)的擴(kuò)展耗散估計問題,提出了保證估計誤差系統(tǒng)的漸近穩(wěn)定性和擴(kuò)展耗散性質(zhì)的充分條件;Li等[97]研究了一類具有利普希茨型非線性和轉(zhuǎn)移速率不確定或未知情況下的非線性馬爾科夫跳躍系統(tǒng)的故障估計問題;Zha等[98]研究了受網(wǎng)絡(luò)攻擊的事件觸發(fā)非線性馬爾科夫跳躍系統(tǒng)的有限時間H∞異步狀態(tài)估計問題,提出采用一種自適應(yīng)事件觸發(fā)方案來應(yīng)對網(wǎng)絡(luò)資源的容量約束,建立了一種新的狀態(tài)估計誤差系統(tǒng)模型。
離散時間馬爾科夫跳躍系統(tǒng)的濾波問題也受到廣泛關(guān)注,Kalman濾波、基于交互多模型算法的濾波、線性最小均方誤差估計等濾波方法應(yīng)用較多??紤]到系統(tǒng)中驅(qū)動的附加噪聲統(tǒng)計量可能不準(zhǔn)確,且這也是一種常見情況,H∞濾波因?yàn)V波理論背景強(qiáng)大而被大量關(guān)注。在離散時間域,Seiler 等[99]從二階矩穩(wěn)定性角度推導(dǎo)了馬爾科夫跳躍系統(tǒng)H∞濾波的充要條件;Hua 等[100]基于模糊規(guī)則相關(guān)的李雅普諾夫函數(shù),采用模式相關(guān)的對數(shù)量化器,得到保證濾波誤差系統(tǒng)隨機(jī)穩(wěn)定且具有給定的H∞或l2-l∞性能指標(biāo)的充分條件,解決了離散時間T-S 模糊非齊次馬爾科夫跳躍系統(tǒng)的H∞濾波和l2-l∞濾波問題;Cheng 等[101]解決了一類具有平均駐留時間切換、時變轉(zhuǎn)移概率、離散時間的馬爾科夫跳躍系統(tǒng)有限時間估計問題,建立了保證馬爾科夫跳躍系統(tǒng)具有有限時間有界的充分條件和濾波有限時間有界性。
若模態(tài)跳躍信息不可用,則需采用與模態(tài)無關(guān)的濾波方法。Blackmore等[102]提出了主動估計方案,其中控制輸入用來區(qū)分實(shí)際模態(tài)序列和可能的模態(tài)序列。在不確定轉(zhuǎn)移概率方面,Yang等[103]研究了具有不確定躍遷概率的馬爾科夫神經(jīng)網(wǎng)絡(luò)的事件觸發(fā)問題,給出了估計誤差系統(tǒng)均方指數(shù)極限有界的充分條件。當(dāng)轉(zhuǎn)移概率不確定時,對系統(tǒng)狀態(tài)的估計更困難。Tugnait[104]提出了一種自適應(yīng)狀態(tài)估計的次優(yōu)算法,其中極大似然估計方法被用于估計轉(zhuǎn)移概率。
考慮到系統(tǒng)模態(tài)信息可能無法直接獲取,Todorov 等[105]引入一種基于檢測器的離散馬爾科夫狀態(tài)空間聚類,這種設(shè)置中,集群對應(yīng)于可由單個檢測器響應(yīng)識別的狀態(tài)集;除賦予控制器給定簇中馬爾科夫狀態(tài)之間的加權(quán)概念外,在給定發(fā)射概率的情況下,要求在不超過N步的時間內(nèi)返回狀態(tài)簇?;陔[馬爾科夫模型,Li 等[106]研究了離散時間馬爾科夫跳躍神經(jīng)網(wǎng)絡(luò)的H∞濾波問題,給出一種改進(jìn)的神經(jīng)元激活函數(shù)分割方法,其中系統(tǒng)模態(tài)不能直接獲取,由隱馬爾科夫模型提供估計的模態(tài)。在離散時間半馬爾科夫跳躍系統(tǒng)方面,Cai等[107]基于隱半馬爾科夫模型,提出了觀測模態(tài)依賴的狀態(tài)估計器設(shè)計方法。
目前,復(fù)雜跳躍系統(tǒng)主要研究對象有馬爾科夫跳躍系統(tǒng)、半馬爾科夫跳躍系統(tǒng)和隱馬爾科夫跳躍系統(tǒng),基于轉(zhuǎn)移速率/概率是否時變,可將上述三類系統(tǒng)分為齊次的和非齊次。需要指出的是,相對于齊次復(fù)雜跳躍系統(tǒng),非齊次復(fù)雜跳躍系統(tǒng)的控制綜合與狀態(tài)估計問題的研究成果較少。此外,復(fù)雜跳躍系統(tǒng)相關(guān)的控制和濾波/狀態(tài)估計問題,主要考慮轉(zhuǎn)移速率/概率的信息是否可知及系統(tǒng)模態(tài)信息是否可知兩方面。盡管結(jié)果多種多樣,但復(fù)雜跳躍系統(tǒng)在非線性以及網(wǎng)絡(luò)化方面面臨挑戰(zhàn),未來工作可從以下方面考慮。
1)復(fù)雜非線性跳躍系統(tǒng)的建模、分析與控制。已有學(xué)者對復(fù)雜非線性跳躍系統(tǒng)進(jìn)行了研究,如采取1型T-S模型處理非線性復(fù)雜跳躍系統(tǒng)。然而,該種方法的建模需要完備的隸屬度信息,存在一定的局限性。隨著對T-S 模型研究的深入,區(qū)間2型的T-S 模型可以描述隸屬度函數(shù)的不確定性,比1型T-S 模型更加一般?,F(xiàn)有一些基于區(qū)間2型的T-S 模型來處理復(fù)雜非線性跳躍系統(tǒng)的研究成果,但還有待進(jìn)一步完備。此外,現(xiàn)有的復(fù)雜非線性跳躍系統(tǒng)的研究多集中于非線性馬爾科夫跳躍系統(tǒng),在非線性半馬爾科夫跳躍系統(tǒng)、非線性隱馬爾科夫跳躍系統(tǒng)等種類復(fù)雜非線性跳躍系統(tǒng)的研究并不多見。因此,如何處理復(fù)雜非線性跳躍系統(tǒng)的建模、分析與控制問題仍是重難點(diǎn)問題。
2)網(wǎng)絡(luò)化復(fù)雜跳躍系統(tǒng)的分析與控制。隨著信息物理系統(tǒng)和人工智能的發(fā)展,現(xiàn)代控制系統(tǒng)與網(wǎng)絡(luò)通訊密不可分。目前網(wǎng)絡(luò)化環(huán)境下復(fù)雜跳躍系統(tǒng)的研究主要集中于:考慮單一的網(wǎng)絡(luò)誘導(dǎo)現(xiàn)象,如網(wǎng)絡(luò)時滯、網(wǎng)絡(luò)數(shù)據(jù)丟包等,在實(shí)際復(fù)雜網(wǎng)絡(luò)環(huán)境中,網(wǎng)絡(luò)誘導(dǎo)現(xiàn)象可能同時出現(xiàn)多種;網(wǎng)絡(luò)安全沒有得到充分考慮,分析數(shù)據(jù)安全問題的研究大多是使用Bernoulli隨機(jī)過程來模擬隨機(jī)的攻擊,并考慮攻擊概率完全已知的情況。然而,在沒有大量數(shù)據(jù)支持下,攻擊者的攻擊概率是無法精確獲取的,且大部分研究只考慮了單一網(wǎng)絡(luò)攻擊情況,沒有延伸到更加復(fù)雜的網(wǎng)絡(luò)攻擊情況。通常在復(fù)雜網(wǎng)絡(luò)環(huán)境下,系統(tǒng)受到的攻擊可能不只來自單一類型的攻擊,攻擊者可能在條件允許的情況下,對系統(tǒng)實(shí)施復(fù)雜的混合攻擊。因此,如何建立合適的數(shù)學(xué)模型描述復(fù)雜跳躍系統(tǒng)可能遭遇的多種網(wǎng)絡(luò)攻擊情況,解決其安全控制和濾波問題,也是復(fù)雜跳躍系統(tǒng)面臨的頗具挑戰(zhàn)性問題。
3)基于學(xué)習(xí)的復(fù)雜跳躍系統(tǒng)控制/濾波、安全控制/安全估計。隨著工業(yè)互聯(lián)網(wǎng)和人工智能技術(shù)的迅速發(fā)展,工業(yè)現(xiàn)場產(chǎn)生的大量在線、離線數(shù)據(jù)給復(fù)雜跳躍系統(tǒng)的控制與決策提供了新思路,即如何在保證設(shè)定的控制效果前提下放寬對模型結(jié)構(gòu)和參數(shù)信息獲取的要求。學(xué)習(xí)控制是較好的解決方案之一,是一種基于數(shù)據(jù)的前向?qū)W習(xí)控制方法,在執(zhí)行-評價網(wǎng)絡(luò)的框架下,通過在線或離線迭代學(xué)習(xí)實(shí)現(xiàn)控制器的更新,可一定程度上克服復(fù)雜跳躍系統(tǒng)建模困難的問題。目前,基于學(xué)習(xí)的控制研究已得到一定發(fā)展,但針對復(fù)雜跳躍系統(tǒng)基于學(xué)習(xí)的控制和濾波、系統(tǒng)安全控制與安全估計等問題的研究卻不充分,值得進(jìn)一步研究。