楊娜娜, 孟新友, 玄海燕
(1. 蘭州理工大學 理學院, 甘肅 蘭州 730050; 2. 蘭州理工大學 經濟管理學院, 甘肅 蘭州 730050)
多智能體系統(tǒng)(MASs)協(xié)同控制因其廣泛的應用背景,如無人機編隊、航天器飛行、傳感器網絡等,受到多學科專家們的極大關注[1-2].一致性問題作為MASs協(xié)同問題研究中最基本且重要的課題,是指在分布式控制協(xié)議下,智能體的狀態(tài)或輸出通過與其鄰居共享信息而達到一個共同值[3-4],包括帶頭節(jié)點一致性[5-7]和無頭節(jié)點一致性[8-10],現(xiàn)如今已成為MASs領域的一個研究熱點.
此外,實際中,存在大量的系統(tǒng)是可重復運行的[11].在這樣的實際背景下,迭代學習控制(ILC) 方法作為一種智能控制算法被提出[12-13].ILC 可以有效解決有限時間區(qū)間上可重復運行系統(tǒng)的高精度軌跡跟蹤問題,具有控制算法簡單、不需要知道具體的數(shù)學模型等優(yōu)點.目前,隨著對ILC的深入研究,已經與一些先進控制相結合,產生了諸多新型的控制算法,如自適應控制[14]、模糊控制[15]、最優(yōu)控制[16]等.
值得一提的是,許建新等[12-16]都是將ILC方法用于單個系統(tǒng)的研究,而近些年來,很多學者[17-22]已將ILC用于MASs 協(xié)同問題的研究,其中文獻[17~20]利用自適應ILC 的方法分別研究了一階、二階和高階非線性MASs的協(xié)同控制問題;Meng等[21]將ILC與輸出反饋方法相結合,處理了高階非線性MASs的有限時間一致性問題;Yang等[22]提出了最優(yōu)控制器增益的設計方法,使得一致性誤差的λ-范數(shù)以最快的速度收斂,但這些文獻[17-22]都沒有考慮到未知外部干擾的影響.實際工程中,由于復雜環(huán)境等因素,系統(tǒng)的外部干擾是比較常見的,會對系統(tǒng)的穩(wěn)定產生一定影響,有時可能導致系統(tǒng)不穩(wěn)定.因此,在系統(tǒng)的控制器設計時,有必要考慮外部干擾,且具有一定的實際意義.
因此,本文在一類MASs中考慮未知外部干擾,并通過坐標變換,將一致性問題推廣到編隊問題,解決了區(qū)間[0,T]上的完全一致性和編隊問題,即MASs 的協(xié)同控制問題.
在重復環(huán)境下,考慮一類 MASs:
(1)
假設2所有的智能體滿足對接條件,即:
定義第i個從節(jié)點與頭節(jié)點之間的一致性誤差向量為
(2)
再定義第i個從節(jié)點的分布式誤差向量為
(3)
且由誤差(2,3),得:
(4)
ek=-((L+B)?In)(xk-1N?x0)=
-(H?In)δk
其中:
另外,由誤差(2),得誤差動態(tài)為
(5)
基于以上的誤差動態(tài)(5),設計第i個從節(jié)點的分布式控制協(xié)議為
其中:Q是任意正定矩陣.
此時,誤差動態(tài)(5)可集中寫為
(8)
其中:
(9)
(10)
其中:
定理1對于具有通信拓撲圖G′的MASs (1), 當假設1、2成立時,設計的控制協(xié)議(6,7)以及參數(shù)自適應律(9,10)能夠使得所有從節(jié)點在區(qū)間[0,T]上隨著迭代次數(shù)的無限增加與頭節(jié)點達到完全一致,即
同時,閉環(huán)系統(tǒng)內的所有信號有界.
證明構造如下的復合能量函數(shù)(CEF):
(11)
(1) 考查Ek(t)第k次和k-1次之間的差分:
(12)
其中,由式(8,12)中的第1項可變形為
(13)
再由式(9),第3項變形為
(14)
由式(10),第5項變?yōu)?/p>
(15)
再將式(13~15)代入式(12),得:
(16)
其中:λmin(H)和λmin(Q)是正定矩陣H和Q的最小特征值.
又因為
2NTεΔk+1
(17)
其中最后一個不等式由文獻[21]中的Lemma 2.2 得到.因此:
(18)
此時,可以選擇充分大的r>0, 使得
(QA+ATQ)-2rλmin(H)λmin(Q)I≤-σI
(19)
對于σ>0總成立.從而有
(δk(0))T(H?Q)δk(0)-
(δk-1(t))T(H?Q)δk-1(t)+
(20)
令t=T,則由假設2和自適應律(9,10)可知:
(21)
即
Ek(T)≤Ek-1(T)+2NTεΔk+1
(22)
(2) 證明閉環(huán)系統(tǒng)所有信號的有界性.
由式(12),可得:
Ek(t)=ΔEk(t)+Ek-1(t)≤
(δk(0))T(H?Q)δk(0)-
(δk-1(t))T(H?Q)δk-1(t)+
Ek-1(T)+2NTεΔk+1
(23)
則
Ek(t)≤Ek-1(T)+2NTεΔk+1
(24)
且
(25)
另外,由文獻[21]中的Lemma 2.1:
Ek(t)≤E0(T)+K
(26)
從式(26)可以看到,如果E0(T)有界,就能保證Ek(t)是一致有界的.所以,下面證明E0(t)的有界性.因為
(27)
對式(27)兩端求導,得
(28)
其中:
2NTεΔ1=2Nεa
(29)
則
(30)
所以:
(31)
(3) 證明[0,T]上的完全一致性.
從式(21),可得:
(32)
則
(33)
綜上,定理1得證.
對于?t∈[0,T],若每個從節(jié)點與頭節(jié)點之間能夠形成期望的距離,這意味著MASs(1)實現(xiàn)了編隊控制.
定義:
(34)
其中:Δi是第i個從節(jié)點與頭節(jié)點之間期望的距離.
第i個從節(jié)點與頭節(jié)點之間的編隊誤差為
(35)
此外,第i個從節(jié)點的分布式編隊誤差定義為
(36)
假設3假設所有智能體滿足對接條件,即
(i=1,2,…,N;s=2,3,…,n)
且x0(0)=x0(T).
為了驗證本文算法的有效性和實用性,給出一個網絡化LC振蕩器系統(tǒng)[24],此系統(tǒng)可以看作是一個MASs,由5個從振蕩器和1個頭振蕩器組成,其網絡通信拓撲圖如圖1所示.
圖1 通信拓撲圖(0表示頭節(jié)點)Fig.1 Communication topology graph(0 denotes the leader)
由圖1得到,只有第1個從節(jié)點可以得到頭節(jié)點的信息,且L和B分別為
第i個振蕩器的動態(tài)描述為
(37)
其中:i=1,2,…,6;ci(t)、vi(t)、L′和C分別是電流、電壓、電感和電容.
(38)
其中:
h1、h2、l1和l2是[0,1]上的隨機數(shù),t∈[0,2].
另外,x0(t)=[sin(πt),cos(πt)]T,滿足假設2.
對于MASs(38),運用本文所設計的協(xié)議(6,7) 和自適應律(10,11).
情形1:完全一致性問題.
經過40次迭代的仿真結果如圖2和圖3所示.圖2是智能體第40次迭代的狀態(tài)軌跡圖,可以看到所有從節(jié)點的狀態(tài)向量與頭節(jié)點的狀態(tài)向量在[0,2]上完全重合.圖3是一致性誤差沿迭代軸的演化曲線圖,顯示所有從節(jié)點與頭節(jié)點的一致性誤差是一致趨于零的.故圖2和圖3都說明,在區(qū)間[0,2]上,所有從節(jié)點隨著迭代次數(shù)的無限增加,能夠完全跟蹤上頭節(jié)點,實現(xiàn)了完全一致性.圖4表明,閉環(huán)系統(tǒng)的其他變量都有界,進而驗證了定理1的成立.
圖2 第40次迭代的狀態(tài)軌跡Fig.2 State trajectories the 40th iteration
圖3 一致性誤差沿迭代軸的演化曲線
圖4 其他變量沿迭代軸的演化曲線Fig.4 Evolution curves of other variables along the iteration axis
iterative axis
情形2:編隊問題.
迭代75次仿真結果如圖5 所示,可以看出,智能體的狀態(tài)向量形成了期望的編隊.
圖5 情形2的仿真結果
本文旨在解決一類MASs的學習協(xié)同控制問題,其中MASs受到外部時變有界干擾.通過設計具有微分型參數(shù)自適應律的時變增益,避免了控制增益對通信拓撲的依賴,同時,設計的輔助控制協(xié)議,補償了從節(jié)點動態(tài)中的外部干擾.最終,實現(xiàn)了有限時間區(qū)間上的完全一致性,并通過定義新的狀態(tài)變量與誤差,將編隊問題轉化為一致性問題而解決.