鄭曉宏,董國偉,周 琪,魯仁全
(廣東工業(yè)大學廣東省智能決策與協(xié)同控制重點實驗室,廣東廣州 510006)
近年來,多智能體系統(tǒng)協(xié)同控制在傳感器網(wǎng)絡、移動機器人和無人機編隊等眾多領(lǐng)域有著巨大的應用前景[1–6],而一致性跟蹤問題作為多智能體系統(tǒng)協(xié)同控制的基本問題之一,更是受到了專家學者的廣泛關(guān)注[7–13].文獻[11]將代數(shù)圖論與控制方法相結(jié)合研究了二階多智能體的一致性問題.針對高階非線性多智能體系統(tǒng),文獻[12–13]提出了自適應神經(jīng)網(wǎng)絡一致性控制方案.眾所周知,隨機干擾在工程系統(tǒng)中往往是不可避免的,是影響系統(tǒng)穩(wěn)定的主要因素之一,因此對于隨機系統(tǒng)的研究一直是控制領(lǐng)域的熱點[14–17].文獻[15]提出人工勢場法解決了一類隨機多智能體編隊的避障問題.文獻[16–17]利用反步法技術(shù)討論了一類隨機多智能體系統(tǒng)的自適應控制.但由于反步法的應用需要對系統(tǒng)中的虛擬控制器進行反復求導,會造成“復雜性爆炸”問題.為了克服這個困難,文獻[18]針對一類嚴格反饋非線性系統(tǒng),引入了動態(tài)面技術(shù),在此基礎(chǔ)上設計了魯棒自適應跟蹤控制算法.文獻[19]則結(jié)合動態(tài)面技術(shù)解決了帶有死區(qū)輸入的嚴格反饋隨機多智能體系統(tǒng)的控制問題.
值得注意的是,以上提及的研究成果不能直接應用于非嚴格反饋形式的系統(tǒng)中,相比于嚴格反饋系統(tǒng),非嚴格反饋系統(tǒng)中的非線性項包含了所有的狀態(tài)變量,采用上述控制方法如傳統(tǒng)的反步法進行控制器設計會產(chǎn)生代數(shù)環(huán)問題.文獻[20–21]運用神經(jīng)網(wǎng)絡的性質(zhì)突破了傳統(tǒng)反步法控制設計應用于非嚴格反饋系統(tǒng)的限制.盡管現(xiàn)有研究對非線性隨機系統(tǒng)的自適應控制研究已經(jīng)取得了很大進展,但卻很少有同時考慮輸出約束和執(zhí)行器故障對非嚴格反饋隨機多智能體系統(tǒng)造成的影響.
事實上,許多控制系統(tǒng)需要系統(tǒng)輸出保持在一定范圍內(nèi),否則在系統(tǒng)運行過程中會導致性能下降.對此,利用障礙李雅普諾夫函數(shù)特性能為處理輸出約束問題提供有效途徑[22–25].另一方面,控制系統(tǒng)會因復雜的工作環(huán)境、部件老化等因素的影響發(fā)生故障,故障的存在嚴重影響了系統(tǒng)的穩(wěn)定性,甚至會造成安全隱患,所以研究系統(tǒng)的故障問題是十分有必要的[25–29].基于以上討論,本文對含有輸出約束和執(zhí)行器故障的非嚴格反饋的隨機多智體系統(tǒng),提出自適應神經(jīng)網(wǎng)絡容錯控制的設計方案.
本文的主要貢獻如下:1)采用的系統(tǒng)模型為非嚴格反饋形式的非線性隨機多智能體系統(tǒng),更具有一般性.此外,系統(tǒng)中的隨機干擾和非線性項是完全未知的,且消除了一般研究中隨機干擾的有界假設;2)在反步法設計中結(jié)合動態(tài)面技術(shù)解決“復雜性爆炸”問題的同時,引入神經(jīng)網(wǎng)絡的性質(zhì)[21],克服了非嚴格反饋形式產(chǎn)生代數(shù)環(huán)的問題;3)基于自適應神經(jīng)網(wǎng)絡容錯控制的設計方法,同時考慮輸出約束和執(zhí)行器故障問題,使本文的控制方案更具有適用性.
本文的組織結(jié)構(gòu)如下:第2節(jié)詳細介紹了系統(tǒng)的數(shù)學模型和相關(guān)的準備工作;第3節(jié)提出了一種自適應神經(jīng)網(wǎng)絡容錯控制設計方案及其穩(wěn)定性分析,第4節(jié)通過仿真研究驗證了該方法的有效性;第5節(jié)對本文的工作進行總結(jié).
為了方便系統(tǒng)分析,引入圖論知識來描述多智能體之間的通訊拓撲關(guān)系.本文用G=(?,I)表示有向圖,其中:?={?1,…,?N}代表智能體的非空節(jié)點集,I ??×?代表邊集合.(?j,?i)∈I表示第j個智能體能接收到第i個智能體的信息,鄰接節(jié)點集合表示為Ni={?j|(?j,?i)∈I}.有向圖G的通訊拓撲關(guān)系用鄰接矩陣A=[aij]∈N×N表示,其中aij0.有向圖G的拉普拉斯矩陣定義為L=Λ ?A,其中Λ=為入度矩陣,為第i個智能體的入度.如果有向圖G含有生成樹,說明至少存在一個根節(jié)點,該根節(jié)點到其它任一節(jié)點都有有向路徑.如果節(jié)點0是生成樹的根節(jié)點,定義H=diag{a10,a20,…,aN0},則矩陣L+H為非奇異.
考慮由N個跟隨者和1個領(lǐng)導者組成的非嚴格反饋隨機多智能體系統(tǒng),第i個多智能體的動態(tài)模型如下:
本文考慮的執(zhí)行器故障類型為偏差和增益故障,偏差故障的表達式如下:其中wi(t)為有界函數(shù),且增益故障的表達式如下:
其中ri為未知失控率,滿足0ri <1.因此,根據(jù)文獻[26],結(jié)合兩種故障類型得
控制目標:針對含有輸出約束和執(zhí)行器故障的非嚴格反饋隨機多智體系統(tǒng)(1),提出一種自適應神經(jīng)網(wǎng)絡容錯控制的設計方案,使閉環(huán)系統(tǒng)中所有信號依概率有界,系統(tǒng)一致跟蹤誤差收斂到原點的鄰域內(nèi).
假設1[26]領(lǐng)導者的輸出信號yr是光滑函數(shù),且都有界,即
為了處理系統(tǒng)(1)中的執(zhí)行器故障問題,本文引入了Nussbaum增益技術(shù),Nussbaum函數(shù)一般具有以下性質(zhì):
許多函數(shù)滿足以上性質(zhì),本文選擇exp(ξ2)cosξ2.
引 理1[20]定 義為Nussbaum函數(shù),其中ξi(t)在區(qū)間[0,tf]為光滑函數(shù),如果存在正定徑向無界的函數(shù)V(t,x)滿足以下不等式:
則E(V(t,x)),ξi(t)和在區(qū)間[0,tf]是有界的.其中:?為微分算子,E(·)為期望算子,ki為設計參數(shù),同時C >0和0.
考慮隨機系統(tǒng)如下:
其中:x∈為系統(tǒng)狀態(tài)向量,是r維的標準維納過程.
定義1[21]考慮系統(tǒng)(3),假設存在一個正定、徑向無界并且二次連續(xù)可微的函數(shù)V(x),其微分算子?定義如下:
其中tr{·}代表矩陣的跡.
引理2[21]給定任意精度ε>0且t →∞時,存在E|yi(t)?yr(t)|4ε,則表明在有向圖下,系統(tǒng)(1)中的領(lǐng)導者和跟隨者之間的跟蹤誤差依概率半全局一致最終有界.
定義2[24]定義在包含原點的開放域Ξ的系統(tǒng)dx=f(x)dt+g(x)d?中,障礙李雅普諾夫函數(shù)V(x)為正定連續(xù)的標量函數(shù),且其在Ξ中的每一個點都存在一階偏導數(shù),根據(jù)V(x)→∞時,x收斂于Ξ的邊界的性質(zhì),則存在b為正常數(shù)且?t0時,V(x(t))b成立.
本文采用的障礙李雅普諾夫函數(shù)形式如下:
其中:log(·)表示自然對數(shù),ki,b為si,1的約束.
引理3[24]對于任意的正常數(shù)ki,b,如果所有的si,1都能夠滿足|si,1| 系統(tǒng)(1)中的未知非線性函數(shù)可以用如下徑向基神經(jīng)網(wǎng)絡來逼近處理,具體形式如下: 其中:θ=[θ1θ2… θκ]T為權(quán)重向量,基函數(shù)向量表示為φ(ζ)=[φ1(ζ)φ2(ζ)… φκ(ζ)]T,并且高斯函數(shù)φi(ζ)的形式如下: 其中:i=[1 2… κ],ιi=[ιi1ιi2… ιiq]T為高斯函數(shù)的中心向量,ωi表示高斯函數(shù)的寬度.一般來說,對于定義在緊集? ?上的未知非線性函數(shù)f(ζ),能用具有足夠多節(jié)點的徑向基神經(jīng)網(wǎng)絡(4)逼近到任意精度?>0,即 其中:?(ζ)表示逼近誤差,??為常數(shù),θ?為理想加權(quán)向量,具體定義為θ?:= 引理4[21]狀態(tài)向量=[x1x2… xq]T,且為徑向基神經(jīng)網(wǎng)絡的基函數(shù)向量,對于任意正數(shù)pq,則 本節(jié)將對系統(tǒng)(1)設計神經(jīng)網(wǎng)絡控制器,首先,基于通信拓撲,對第i個跟隨者系統(tǒng)進行坐標變換如下: 其中:si,h為誤差面,zi,h為濾波誤差,αi,h和分別為虛擬控制器和濾波器輸出信號.令ai0,qi,k=1,k=2,…,ni ?1.ai0為正常數(shù),表示領(lǐng)導者和跟隨者之間的通訊關(guān)系,當且僅當?shù)趇個跟隨者能夠接收到領(lǐng)導者的信息時,ai0=1,否則ai0=0. 為了設計方便,定義以下符號和參數(shù):λi,?,li,?,μi,?,ci,?,σi,?表示正設計參數(shù);定義令為Θi,?的估計,則估計誤差定義i,?=[xi,1xi,2… xi,?]T,其中?=1,…,k. 步驟1結(jié)合式(1)和式(6)可得 選取李雅普諾夫函數(shù)為 結(jié)合式(1)和式(7),則?Vi,1為 將式(9)–(11)代入式(8)中得 由Young’s不等式得 結(jié)合式(13)–(16),則式(12)可重寫如下: 為了避免對αi,2反復偏微分,定義在時間常數(shù)τi,2下,讓αi,2通過一階濾波器得到則 根據(jù)文獻[18],濾波誤差zi,2的動態(tài)方程為 上式中Bi,2和Ci,2是基于式(14)中αi,2的偏導獲得.故存在常數(shù)滿足以下不等式: 步驟2(2kni ?1)由式(1)和式(6)可得 選取李雅普諾夫函數(shù)為 結(jié)合式(1)和式(17),則?Vi,k為 根據(jù)Young’s不等式得 將式(19)–(23)代入式(18)得 其中ηi,k為正設計參數(shù),且 由式(5)得 由Young’s不等式和引理4可得 虛擬控制器αi,k+1設計如下: 再由Young’s不等式得 結(jié)合式(25)–(29),式(24)可以重寫為 在時間常數(shù)τi,k+1下,讓αi,k+1通過一階濾波器得到則 濾波誤差zi,k+1的動態(tài)方程表示如下: 步驟3由式(1)–(2)和式(6)可得 選取李雅普諾夫函數(shù)為 結(jié)合式(1)和式(31),則?Vi,ni為 其中 當k=ni時,將式(25)–(26)代入式(33)中,則控制器ui和ξi的動態(tài)方程如下: 當k=ni時,應用式(29),同時結(jié)合式(34)–(36),式(33)可化簡為 根據(jù)式(37)–(39),則?V為 則式(40)可重寫為 定理1對于含有輸出約束和執(zhí)行器故障的非嚴格反饋隨機多智體系統(tǒng)(1),通過設計實際控制器(34),中間虛擬控制器(14)和(27)以及參數(shù)自適應律(15)(28)(36),保證了閉環(huán)系統(tǒng)中的所有信號是依概率半全局一致最終有界,且通過合理選擇設計參數(shù),跟蹤誤差能夠收斂到原點的鄰域內(nèi). 考慮由4個跟隨者和1個領(lǐng)導者組成的非嚴格反饋形式的隨機多智能體系統(tǒng),具體形式如下: 領(lǐng)導者的輸出信號yr=sin(0.5t)+0.5 sin(1.5t).圖1表示智能體之間的通訊拓撲圖,由圖1可知,跟隨者的鄰接矩陣 且H=diag{0,1,0,0}. 圖1 通訊拓撲圖Fig.1 Communication topology 選擇適當?shù)脑O計參數(shù)為 其中i=1,2,3,4.設置跟隨者的初始狀態(tài)如下: 且設置自適應參數(shù)的初始狀態(tài)如下: 系統(tǒng)的仿真結(jié)果如圖2–6所示.圖2為跟隨者輸出信號yi與領(lǐng)導者輸出信號yr的跟蹤軌跡曲線,其跟蹤誤差軌跡則由圖3表示,圖4描述了系統(tǒng)控制器ui的軌跡曲線,圖5–6則為自適應參數(shù)的軌跡曲線.由以上仿真結(jié)果可知,本文所提出的方案保證了系統(tǒng)的穩(wěn)定性,同時驗證了設計的控制器能保證跟蹤性能,系統(tǒng)的輸出信號能夠被限定在指定范圍內(nèi). 圖2 領(lǐng)導者和跟隨者的輸出信號Fig.2 Output signals of the followers and leader 圖3 跟蹤誤差si,1Fig.3 Tacking errors si,1 圖4 控制器uiFig.4 Controllers ui 圖5 自適應參數(shù)i,1Fig.5 Adaptive parametersi,1 圖6 自適應參數(shù)Fig.6 Adaptive parameters 本文針對一類非嚴格反饋的非線性隨機多智能體系統(tǒng),考慮了在輸出約束和執(zhí)行器故障情況下的協(xié)同控制一致性問題,結(jié)合有向拓撲圖知識設計了一種基于神經(jīng)網(wǎng)絡的自適應容錯控制方案.在反步法的基礎(chǔ)上,構(gòu)造障礙李雅普諾夫函數(shù)解決了輸出約束問題,綜合考慮動態(tài)面技術(shù)和Nussbaum函數(shù),設計了一種有效的自適應容錯控制器.最后通過李雅普諾夫穩(wěn)定性定理,證明了閉環(huán)系統(tǒng)的穩(wěn)定性.本文提出的自適應神經(jīng)網(wǎng)絡控制方案擴展了嚴格反饋非線性系統(tǒng)的研究成果,未來的研究將把本文的結(jié)果推廣到有限時間或固定時間的非線性隨機多智能體中.2.5 徑向基神經(jīng)網(wǎng)絡
3 神經(jīng)網(wǎng)絡控制器設計和穩(wěn)定性分析
4 仿真研究
5 總結(jié)