沈 超,周振超
(遼寧科技學院 電氣與自動化工程學院,遼寧 本溪 117004)
近年來,隨著計算機與電子通訊技術的迅猛發(fā)展,分布式控制的多智能體網(wǎng)絡逐漸成了研究熱點。智能體是集智能處理器、傳感器以及執(zhí)行器于一身,并以此完成預期目標的具有自學習能力的自治實體。因此,多智能體系統(tǒng)就是由多個智能體構(gòu)成的、可以獨立測量和感知其周圍環(huán)境,并基于一定的通信協(xié)議交換網(wǎng)絡狀態(tài)信息,通過相應的計算來指導其自身行動,最終達到協(xié)作目的的自治網(wǎng)絡[1]。所以,多智能體網(wǎng)絡能夠有效地處理現(xiàn)實世界中分布式動態(tài)變化網(wǎng)絡的控制問題,對解決網(wǎng)絡中的復雜性問題有明顯的優(yōu)勢[2]。多智能體網(wǎng)絡已被廣泛應用于工業(yè)、農(nóng)業(yè)、國防軍事和日常生活中,并成為一種對復雜系統(tǒng)進行分析、設計和建模的行之有效的方法和工具[3]。
然而,多智能體系統(tǒng)常常由于在實際應用環(huán)境下不可避免地存在非線性因素,而使多智能體系統(tǒng)的一致性性能受到嚴重影響。對此,自適應控制技術可以有效地解決該問題[4]。因此,文章在實際系統(tǒng)存在死區(qū)輸入非線性的情形下,設計了多智能體一致性自適應跟蹤控制系統(tǒng)。該多智能體一致性跟蹤系統(tǒng)的硬件部分由基于自適應H∞控制策略的控制器模塊與通訊模塊組成。系統(tǒng)的軟件部分由自適應控制模塊和智能體調(diào)度模塊組成,以保證多智能體系統(tǒng)的一致性運行。實驗結(jié)果表明,所設計的多智能體系統(tǒng)一致性得到了顯著改善, 體現(xiàn)了該多智能體系統(tǒng)一致性設計的有效性。
多智能體一致性跟蹤系統(tǒng)的硬件部分基于H∞控制策略,設計了自適應控制器單元與通訊單元。
為了滿足多智能體系統(tǒng)的一致性要求,利用多智能體的自學習特性,采用一款自適應控制器,該控制器由電源、中央處理模塊、存儲器模塊、輸入輸出模塊和通訊模塊構(gòu)成[5]。
根據(jù)多智能體系統(tǒng)的設計需求,采用TCP/IP協(xié)議作為系統(tǒng)交換信息的通訊協(xié)議。該協(xié)議能夠?qū)崿F(xiàn)不同應用程序之間的鏈接與數(shù)據(jù)信息交換。
節(jié)點與服務器交互方式主要包括面向連接與面向無線連接兩種方式。面向連接方式可靠性較高,能夠確保數(shù)據(jù)的可靠交換,并且對于未接收的數(shù)據(jù),會自動啟動重新傳輸機制。因此,本多智能體一致性系統(tǒng)采用面向連接方式實現(xiàn)數(shù)據(jù)信息的交換。
多智能體一致性跟蹤系統(tǒng)的軟件部分以上面設計的硬件單元為平臺,包括了自適應控制模塊與智能體調(diào)度模塊。
自適應控制單元的核心就是設計自適應控制器。存在外部非線性輸入的多智能體系統(tǒng)如下:
(1)
τi=Ni(ui)
(2)
其中,xi∈R為系統(tǒng)狀態(tài);τi∈R為輸入;θ1i∈Rm為未知參數(shù)向量;ωi∈Rm為回歸向量;未知參數(shù)bi>0,以及ui(t)為實際控制輸入信號??刂颇繕耸菍崿F(xiàn)領導者-跟隨者的一致性跟蹤。Ni(ui)表示式(3)所示的死區(qū)輸入非線性[6]方程。
τ=[τ1,…,τN]T=N(u)
=[N1(u1),…,NN(uN)]T
(3)
(4)
其中,bli<0
相應地死區(qū)特性如下:
(5)
(6)
(7)
輸入信號τi如下:
τi=mri(ui-bri)σr(τi)+mli(ui-bli)σl(τi)
(8)
以下對輸入死區(qū)非線性的特性進行估計,
(9)
(10)
(11)
其中,τdi為理想輸入信號,并且可得:
(12)
(13)
ω2i=[uixri(τdi),xri(τdi),uixli(τdi),xli(τdi)]T
(14)
以下估計τi與τdi間的誤差,
(15)
(16)
(17)
總殘差項d0i滿足
|d0i|<∞
(18)
自適應控制器設計如下,定義為:
Ω2=diag(ω21,…,ω2N)
(19)
(20)
(21)
τd=[τd1,…,τdN]T
(22)
d0=[d01,…,d0N]T
(23)
由此可得一致性跟蹤[7]:
(24)
(25)
si(t)=xi(t)-xri(t)
(26)
(27)
(28)
(29)
由此可得:
(30)
從而可得多智能體系統(tǒng)為:
(31)
(32)
Ω1=diag(ω11,…,ω1N)
(33)
(34)
U0=diag(u10,…,uN0)
(35)
(36)
(37)
B=diag(b1,…,bN)
(38)
N0=[n10,…,nN0]T
(39)
1=[1,…,1]T
(40)
v=[v1,…,vN]T
(41)
其中,-Mc為赫爾維茨矩陣。
以下設計自適應H∞一致控制器,選定正定函數(shù)W0為:
(42)
b=[b1,…,bN]T
(43)
(44)
(45)
V=diag(v1,…,vN)
(46)
(47)
根據(jù)式(47)引入如下虛擬系統(tǒng)
(48)
f=0
(49)
(50)
(51)
該虛擬系統(tǒng)由控制輸入V通過H∞準則來鎮(zhèn)定,d1、d2、d3可看作系統(tǒng)的外部干擾[9],因此引入如下HJI (Hamilton-Jacobi-Isaacs)方程及其解V0。
+q=0
(52)
(53)
(54)
從而得
(55)
(56)
其中,K為對角正定矩陣。 根據(jù)式(55)可得,相應的H∞控制的解v為:
(57)
(58)
由此可得如下部分自適應控制系統(tǒng)。
(59)
且有:
(60)
(61)
(62)
(63)
(64)
定理2 完全自適應控制系統(tǒng)(9)、(27)、(44)、(45)、(57)、(61)、(62)一致有界,且有:
(65)
對于系統(tǒng)一致性跟蹤誤差xi-x0的穩(wěn)定性分析,定義
(66)
(67)
(68)
(69)
從而
(70)
其中,-Mα是基于網(wǎng)絡圖假設的赫爾維茨矩陣。由此可得如下全局自適應控制系統(tǒng)。
定理3 全局自適應控制系統(tǒng)(9)、(27)、(44)、(45)、(57)、(61)、(62)一致有界,且有:
(71)
智能體調(diào)度的具體步驟如下:
Step1 創(chuàng)建信使命令傳輸給分布式調(diào)度者,并調(diào)用API函數(shù)執(zhí)行該命令;
Step2 等待信使傳入自身的窗口句柄,在接收到窗口句柄后,將其作為命令參數(shù)傳輸給各智能體;
Step3 各個智能體通過對接收到的命令參數(shù)進行分析,從而對智能體進行調(diào)度[10]。
通過以上設計的硬件單元與軟件單元,實現(xiàn)了多智能體一致性系統(tǒng)的穩(wěn)定運行。
為了驗證所設計的多智能體系統(tǒng)的一致性性能,在Matlab軟件環(huán)境中進行了相關仿真參數(shù)設置(取等),通過與現(xiàn)有非自適應系統(tǒng)性能對比分析,進行了所設計的多智能體一致性系統(tǒng)的仿真實驗,得到了相應的多智能體系統(tǒng)狀態(tài)隨時間變化的過程曲線,如圖1所示。
圖1 多智能體系統(tǒng)狀態(tài)隨時間的變化曲線
通過圖1不難看出,隨著系統(tǒng)運行時間的推移,傳統(tǒng)的非自適應多智能體系統(tǒng)的狀態(tài)表現(xiàn)出持續(xù)發(fā)散的特征,而所設計的自適應多智能體系統(tǒng)的狀態(tài)卻能夠逐漸達到穩(wěn)定,系統(tǒng)一致性得到了顯著改善,驗證了系統(tǒng)設計方法的有效性。
針對外部輸入非線性對多智能體系統(tǒng)一致性性能的影響,基于自適應控制算法設計了一種多智能體跟蹤系統(tǒng)。該設計顯著地改善了系統(tǒng)的一致性性能,可以滿足系統(tǒng)在外部環(huán)境存在非線性輸入的應用需求,為多智能體系統(tǒng)的推廣與應用提供了一定的參考方向。