胡順偉,陳向勇, 邱建龍,趙 峰
(臨沂大學(xué)自動(dòng)化與電氣工程學(xué)院,山東臨沂 276005)
一致性控制是多智能體系統(tǒng)協(xié)同控制的關(guān)鍵問(wèn)題。一致性控制旨在利用智能體自身和相鄰智能體的狀態(tài)信息設(shè)計(jì)控制器,實(shí)現(xiàn)群體狀態(tài)的趨同。當(dāng)前,一致性思想已在微電網(wǎng)均衡調(diào)壓、無(wú)人機(jī)協(xié)同,以及編隊(duì)控制中得到了廣泛的應(yīng)用,因此備受關(guān)注,相關(guān)的成果也接連涌現(xiàn)。
文獻(xiàn)[6-7]研究了一類(lèi)線性多智能體系統(tǒng),通過(guò)設(shè)計(jì)動(dòng)態(tài)事件觸發(fā)協(xié)議,在不需要全局信息的情況下實(shí)現(xiàn)了無(wú)領(lǐng)導(dǎo)者的一致性控制。文獻(xiàn)[8]則通過(guò)狀態(tài)分解的方法,實(shí)現(xiàn)了可以隱藏初始狀態(tài)信息的平均一致性控制。文獻(xiàn)[9]通過(guò)在觸發(fā)間隔引入估計(jì)器,減少了相鄰觸發(fā)間隔的狀態(tài)偏移,實(shí)現(xiàn)了有領(lǐng)導(dǎo)者的跟蹤一致性控制。相較于無(wú)領(lǐng)導(dǎo)者一致性和初值平均一致性,有領(lǐng)導(dǎo)者的跟隨一致性問(wèn)題復(fù)雜度更高,更具有挑戰(zhàn)性。文獻(xiàn)[10]研究了在切換拓?fù)湎掠蓄I(lǐng)導(dǎo)者的線性多智能體系統(tǒng),利用系統(tǒng)在觸發(fā)時(shí)刻的狀態(tài)設(shè)計(jì)了控制器,實(shí)現(xiàn)了不依賴于全局信息的領(lǐng)導(dǎo)-跟隨一致性控制。文獻(xiàn)[11]設(shè)計(jì)了一個(gè)虛擬領(lǐng)導(dǎo)者,利用非周期間歇通信機(jī)制,解決了帶時(shí)滯非線性多智能體系統(tǒng)的領(lǐng)導(dǎo)-跟隨問(wèn)題。文獻(xiàn)[12]分別設(shè)計(jì)了集中式和分布式的控制器,在兩種情況下分別實(shí)現(xiàn)了領(lǐng)導(dǎo)-跟隨漸近一致性控制。在上述文獻(xiàn)研究中,領(lǐng)導(dǎo)者的動(dòng)力學(xué)模型不存在控制輸入且模型相對(duì)保守。目前,對(duì)領(lǐng)導(dǎo)者存在控制輸入的動(dòng)力學(xué)模型的研究還相對(duì)較少,具有一定的研究意義和研究前景。
此外,隨著工業(yè)生產(chǎn)要求的提高,智能體往往要求完成多目標(biāo)任務(wù),智能體之間的信息交互不再是簡(jiǎn)單的合作關(guān)系,而是伴隨著合作-競(jìng)爭(zhēng)的信息交互。在合作-競(jìng)爭(zhēng)信息交互下,具有合作信息交互的智能體的狀態(tài)趨于相同值,具有競(jìng)爭(zhēng)信息交互的智能體的狀態(tài)趨于相反值。這種情況下,傳統(tǒng)的群體一致性控制器變得不再適用,需要一些新的分組協(xié)議來(lái)實(shí)現(xiàn)這種控制目標(biāo)。文獻(xiàn)[13]通過(guò)引入預(yù)設(shè)時(shí)間函數(shù),在事件觸發(fā)機(jī)制下實(shí)現(xiàn)了一階多智能體系統(tǒng)的分組一致性控制。文獻(xiàn)[14]討論了合作、強(qiáng)競(jìng)爭(zhēng)、弱競(jìng)爭(zhēng)三種交互關(guān)系,設(shè)計(jì)了一種切換控制律,實(shí)現(xiàn)了異構(gòu)二階多智能體系統(tǒng)分組一致。文獻(xiàn)[15]設(shè)計(jì)了一個(gè)非光滑控制器,利用自適應(yīng)控制消除了對(duì)全局信息的依賴,解決了線性多智能體系統(tǒng)的領(lǐng)導(dǎo)-跟隨一致性問(wèn)題。然而,這些研究所提出的方法只適用于具有一階、二階或線性動(dòng)力學(xué)模型的多智能體系統(tǒng),而實(shí)際中多智能體系統(tǒng)模型大多是非線性的。
需要指出的是,一些領(lǐng)導(dǎo)-跟隨一致性控制問(wèn)題中所研究的領(lǐng)導(dǎo)者模型是不具有控制輸入的,此類(lèi)模型保守性較大,適用范圍較小。理論上,這種模型可以看作領(lǐng)導(dǎo)者的控制輸入為零時(shí)的一類(lèi)特殊情況。其次,相關(guān)文獻(xiàn)往往僅考慮了單一合作或競(jìng)爭(zhēng)的信息交互,對(duì)于合作-競(jìng)爭(zhēng)交互給系統(tǒng)帶來(lái)的影響并沒(méi)有進(jìn)一步的研究和說(shuō)明。事實(shí)上,合作-競(jìng)爭(zhēng)交互共存時(shí)給系統(tǒng)帶來(lái)的影響是顯著的,它不僅體現(xiàn)在實(shí)現(xiàn)一致性行為軌跡上的不同,而且在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)上也發(fā)生了明顯的變化,一些群體一致性拓?fù)浣Y(jié)構(gòu)性質(zhì)也變得不再適用。此外,非線性問(wèn)題一直是系統(tǒng)控制的難點(diǎn)和重點(diǎn),在考慮動(dòng)態(tài)領(lǐng)導(dǎo)者和合作-競(jìng)爭(zhēng)機(jī)制后,實(shí)現(xiàn)非線性多智能體系統(tǒng)一致性更具困難和挑戰(zhàn)。
基于上述分析,本文主要研究了在合作-競(jìng)爭(zhēng)交互下具有動(dòng)態(tài)領(lǐng)導(dǎo)者的非線性多智能體系統(tǒng)的分組一致性控制問(wèn)題。主要貢獻(xiàn)如下:
1)相較于文獻(xiàn)[10]和文獻(xiàn)[12]中不具有控制輸入的領(lǐng)導(dǎo)者動(dòng)力學(xué)模型,本文考慮了具有非零控制輸入的領(lǐng)導(dǎo)者,并且領(lǐng)導(dǎo)者的輸入對(duì)每個(gè)跟隨者都是未知的。傳統(tǒng)的零輸入領(lǐng)導(dǎo)者可看作是本文的一種特殊情況。
2)本文考慮了合作-競(jìng)爭(zhēng)交互機(jī)制,相較于文獻(xiàn)[16-18]中單一合作或競(jìng)爭(zhēng)交互,本文研究的問(wèn)題復(fù)雜度更高。
3)利用分組機(jī)制設(shè)計(jì)的控制器,適用范圍更加廣泛,本文設(shè)計(jì)的控制器不僅適用于合作-競(jìng)爭(zhēng)交互的智能體系統(tǒng),對(duì)于單一合作或競(jìng)爭(zhēng)交互的多智能體系統(tǒng)也適用。
考慮如下由1個(gè)領(lǐng)導(dǎo)者和個(gè)跟隨者組成的非線性多智能體系統(tǒng)
(1)
其中,∈和∈分別代表領(lǐng)導(dǎo)者智能體的狀態(tài)和控制輸入。∈,∈分別代表跟隨者智能體的狀態(tài)和控制輸入。:×→是在時(shí)間上連續(xù)可微的已知的非線性函數(shù)。、是具有適當(dāng)維數(shù)的常數(shù)矩陣。
在文獻(xiàn)[8]和文獻(xiàn)[9]中,領(lǐng)導(dǎo)者不帶有控制輸入,這可以看作是系統(tǒng)(1)在()=0時(shí)的一種特殊情況。而本文中研究的領(lǐng)導(dǎo)者具有控制輸入且與跟隨者的相對(duì)狀態(tài)無(wú)關(guān),其相對(duì)于跟隨者是未知的。
與系統(tǒng)(1)相關(guān)的符號(hào)圖是結(jié)構(gòu)平衡的,并且包含一個(gè)由領(lǐng)導(dǎo)者作為根節(jié)點(diǎn)的有向生成樹(shù)。如果領(lǐng)導(dǎo)者是智能體的鄰居,則0=1,否則0=0。
若符號(hào)圖是結(jié)構(gòu)平衡的,則存在一個(gè)符號(hào)矩陣=diag(,,…,),使得矩陣所有項(xiàng)都是非負(fù)的。其中,當(dāng)節(jié)點(diǎn)處于同組時(shí)=1,當(dāng)節(jié)點(diǎn)處于不同組時(shí)=-1。
(,)是可穩(wěn)的。
非線性函數(shù)滿足下列不等式
(2)
其中,>0是一個(gè)常數(shù)。
假設(shè)1是實(shí)現(xiàn)分組一致性控制的一般假設(shè)條件,在此條件下滿足圖拉普拉斯矩陣的一些特殊性質(zhì)。假設(shè)2是保證Riccati不等式可解的條件。假設(shè)3中()是一致有界的,這在實(shí)際控制中是可行的。假設(shè)4是一類(lèi)Lipschitz-like條件,用于解決分組一致性控制中非線性函數(shù)帶來(lái)的困難。
當(dāng)如下條件(3)被滿足時(shí),系統(tǒng)(1)可實(shí)現(xiàn)領(lǐng)導(dǎo)-跟隨分組一致性控制。
(3)
跟隨者智能體和領(lǐng)導(dǎo)者之間的狀態(tài)誤差定義為
()=()-()
(4)
由引理1和上述等式可知,本文主要解決的問(wèn)題是在合作-競(jìng)爭(zhēng)交互的多智能體系統(tǒng)(1)中設(shè)計(jì)分組控制器和,使得
(5)
成立,從而實(shí)現(xiàn)系統(tǒng)(1)的領(lǐng)導(dǎo)-跟隨分組一致性控制。
首先,對(duì)誤差系統(tǒng)(4)求導(dǎo)可得
=()+()+(,)-
(()+()+(,))
(6)
為了在符號(hào)圖中實(shí)現(xiàn)系統(tǒng)(1)的分組跟隨一致性控制,設(shè)計(jì)如下的控制器
(7)
其中,,>0,是在下文中被設(shè)計(jì)的參數(shù);∈表示智能體與智能體屬于同一組,∈表示智能體與智能體屬于不同組;表示領(lǐng)導(dǎo)者與跟隨者是否同組,同組=1,不同組=-1。
合作-競(jìng)爭(zhēng)交互在控制器(6)中體現(xiàn)為同組智能體之間為合作關(guān)系,其狀態(tài)最終趨于相同值;不同組智能體之間為競(jìng)爭(zhēng)關(guān)系,其狀態(tài)最終趨于相反值。本文考慮的是二分組情況,智能體的鄰居智能體只屬于或,且∈∪,這種分組機(jī)制相較于文獻(xiàn)[17]和文獻(xiàn)[20]中群體一致性更具有應(yīng)用前景。
結(jié)合上述所設(shè)計(jì)的控制器(7),式(6)可改寫(xiě)為如下緊湊形式
(?)sgn((?)())-
(?)()+()
(8)
其中,=+,=diag(,,…,0)表示領(lǐng)導(dǎo)者與跟隨者的通信關(guān)系,表示由個(gè)跟隨者智能體組成的通信拓?fù)鋱D的拉普拉斯矩陣,
(9)
之后,對(duì)誤差進(jìn)行如下變換
(10)
(11)
+-2++<0
(12)
選擇Lyapunov函數(shù)為
(13)
對(duì)式(13)求導(dǎo)可得
)()
(14)
結(jié)合假設(shè)4,式(15)成立
(15)
(?)sgn()+(?)sgn()
(16)
根據(jù)假設(shè)3可知
(17)
成立,因此,式(14)可寫(xiě)為
(18)
控制器(7)可以進(jìn)一步轉(zhuǎn)化為(19),控制器(19)可以有效地消除抖振現(xiàn)象。
(19)
考慮由1個(gè)領(lǐng)導(dǎo)者和5個(gè)跟隨者構(gòu)成的多智能體系統(tǒng),如圖1所示,其中,領(lǐng)導(dǎo)者0和智能體1,2,3為同組;智能體4和5為同組。
圖1 通信拓?fù)鋱DFig.1 Communication topology
由圖1可以計(jì)算出
選擇系統(tǒng)的參數(shù)如下
可得
設(shè)定系統(tǒng)初始狀態(tài)值為
仿真結(jié)果如下:圖2所示為智能體0~5隨時(shí)間發(fā)生變化的狀態(tài)軌跡圖,圖3所示為跟隨者1~5與領(lǐng)導(dǎo)者0的狀態(tài)誤差軌跡圖,圖4所示為每個(gè)跟隨者的控制輸入軌跡圖。從圖2可以看出,跟隨者1、2、3和領(lǐng)導(dǎo)者0的狀態(tài)最終趨于一致,而跟隨者4、5和領(lǐng)導(dǎo)者0的狀態(tài)最終趨于相反值。從圖3可以看出,同組的狀態(tài)差收斂于0,不同組的狀態(tài)和收斂于0。從圖4可以看出,由于設(shè)計(jì)了較大的反饋增益參數(shù),控制輸入量在前0.5s內(nèi)較大,收斂較快。通過(guò)仿真分析可知,在所設(shè)計(jì)的控制器(19)下,實(shí)現(xiàn)了動(dòng)態(tài)領(lǐng)導(dǎo)者下的系統(tǒng)(1)的分組-跟隨一致性控制。圖5所示為系統(tǒng)(1)在反饋控制器()=ξ()時(shí)的狀態(tài)誤差軌跡,與圖3的結(jié)果進(jìn)行比較,可以發(fā)現(xiàn),在相同時(shí)段內(nèi)本文所設(shè)計(jì)的控制器可以實(shí)現(xiàn)更好的收斂性能。
(a)
(b)
(a)
(b)
(a)
(b)
(a)
(b)
在一定的取值范圍內(nèi),,選取的越大,則系統(tǒng)初始時(shí)刻的控制輸入量越大,系統(tǒng)的收斂速度越快,控制量曲線越抖。因此,這里需要視情況折中處理,而在理論上選擇的是滿足條件的邊界值。 事實(shí)上,存在不滿足假設(shè)條件的參數(shù)也可以使系統(tǒng)穩(wěn)定,因?yàn)槎ɡ?給出的是一個(gè)充分條件而非必要條件。
本文研究了一類(lèi)非線性多智能體系統(tǒng)的領(lǐng)導(dǎo)-跟隨一致性控制問(wèn)題。1)考慮領(lǐng)導(dǎo)者智能體具有非零控制輸入的情況,基于鄰居智能體的相對(duì)狀態(tài)信息,設(shè)計(jì)了分布式控制器。2)仿真結(jié)果表明,本文設(shè)計(jì)的控制方案可以使得具有動(dòng)態(tài)領(lǐng)導(dǎo)者的非線性多智能體系統(tǒng)在合作-競(jìng)爭(zhēng)交互網(wǎng)絡(luò)中實(shí)現(xiàn)分組-跟隨一致性控制。3)未來(lái)的研究工作將考慮時(shí)滯影響,在有限時(shí)間內(nèi)實(shí)現(xiàn)分組一致性控制。此外,本文設(shè)計(jì)的控制器是基于連續(xù)狀態(tài)的,如何設(shè)計(jì)一個(gè)利用離散狀態(tài)的脈沖控制器或事件觸發(fā)控制器也是下一步的研究方向。