具有動(dòng)態(tài)領(lǐng)導(dǎo)者的多智能體系統(tǒng)分組一致性控制

2022-10-09 01:57胡順偉陳向勇邱建龍

導(dǎo)航定位與授時(shí) 2022年5期

胡順偉，陳向勇, 邱建龍，趙峰

(臨沂大學(xué)自動(dòng)化與電氣工程學(xué)院，山東臨沂 276005)

0 引言

一致性控制是多智能體系統(tǒng)協(xié)同控制的關(guān)鍵問(wèn)題。一致性控制旨在利用智能體自身和相鄰智能體的狀態(tài)信息設(shè)計(jì)控制器，實(shí)現(xiàn)群體狀態(tài)的趨同。當(dāng)前，一致性思想已在微電網(wǎng)均衡調(diào)壓、無(wú)人機(jī)協(xié)同，以及編隊(duì)控制中得到了廣泛的應(yīng)用，因此備受關(guān)注，相關(guān)的成果也接連涌現(xiàn)。

文獻(xiàn)[6-7]研究了一類(lèi)線性多智能體系統(tǒng)，通過(guò)設(shè)計(jì)動(dòng)態(tài)事件觸發(fā)協(xié)議，在不需要全局信息的情況下實(shí)現(xiàn)了無(wú)領(lǐng)導(dǎo)者的一致性控制。文獻(xiàn)[8]則通過(guò)狀態(tài)分解的方法，實(shí)現(xiàn)了可以隱藏初始狀態(tài)信息的平均一致性控制。文獻(xiàn)[9]通過(guò)在觸發(fā)間隔引入估計(jì)器，減少了相鄰觸發(fā)間隔的狀態(tài)偏移，實(shí)現(xiàn)了有領(lǐng)導(dǎo)者的跟蹤一致性控制。相較于無(wú)領(lǐng)導(dǎo)者一致性和初值平均一致性，有領(lǐng)導(dǎo)者的跟隨一致性問(wèn)題復(fù)雜度更高，更具有挑戰(zhàn)性。文獻(xiàn)[10]研究了在切換拓?fù)湎掠蓄I(lǐng)導(dǎo)者的線性多智能體系統(tǒng)，利用系統(tǒng)在觸發(fā)時(shí)刻的狀態(tài)設(shè)計(jì)了控制器，實(shí)現(xiàn)了不依賴于全局信息的領(lǐng)導(dǎo)-跟隨一致性控制。文獻(xiàn)[11]設(shè)計(jì)了一個(gè)虛擬領(lǐng)導(dǎo)者，利用非周期間歇通信機(jī)制，解決了帶時(shí)滯非線性多智能體系統(tǒng)的領(lǐng)導(dǎo)-跟隨問(wèn)題。文獻(xiàn)[12]分別設(shè)計(jì)了集中式和分布式的控制器，在兩種情況下分別實(shí)現(xiàn)了領(lǐng)導(dǎo)-跟隨漸近一致性控制。在上述文獻(xiàn)研究中，領(lǐng)導(dǎo)者的動(dòng)力學(xué)模型不存在控制輸入且模型相對(duì)保守。目前，對(duì)領(lǐng)導(dǎo)者存在控制輸入的動(dòng)力學(xué)模型的研究還相對(duì)較少，具有一定的研究意義和研究前景。

此外，隨著工業(yè)生產(chǎn)要求的提高，智能體往往要求完成多目標(biāo)任務(wù)，智能體之間的信息交互不再是簡(jiǎn)單的合作關(guān)系，而是伴隨著合作-競(jìng)爭(zhēng)的信息交互。在合作-競(jìng)爭(zhēng)信息交互下，具有合作信息交互的智能體的狀態(tài)趨于相同值，具有競(jìng)爭(zhēng)信息交互的智能體的狀態(tài)趨于相反值。這種情況下，傳統(tǒng)的群體一致性控制器變得不再適用，需要一些新的分組協(xié)議來(lái)實(shí)現(xiàn)這種控制目標(biāo)。文獻(xiàn)[13]通過(guò)引入預(yù)設(shè)時(shí)間函數(shù)，在事件觸發(fā)機(jī)制下實(shí)現(xiàn)了一階多智能體系統(tǒng)的分組一致性控制。文獻(xiàn)[14]討論了合作、強(qiáng)競(jìng)爭(zhēng)、弱競(jìng)爭(zhēng)三種交互關(guān)系，設(shè)計(jì)了一種切換控制律，實(shí)現(xiàn)了異構(gòu)二階多智能體系統(tǒng)分組一致。文獻(xiàn)[15]設(shè)計(jì)了一個(gè)非光滑控制器，利用自適應(yīng)控制消除了對(duì)全局信息的依賴，解決了線性多智能體系統(tǒng)的領(lǐng)導(dǎo)-跟隨一致性問(wèn)題。然而，這些研究所提出的方法只適用于具有一階、二階或線性動(dòng)力學(xué)模型的多智能體系統(tǒng)，而實(shí)際中多智能體系統(tǒng)模型大多是非線性的。

需要指出的是，一些領(lǐng)導(dǎo)-跟隨一致性控制問(wèn)題中所研究的領(lǐng)導(dǎo)者模型是不具有控制輸入的，此類(lèi)模型保守性較大，適用范圍較小。理論上，這種模型可以看作領(lǐng)導(dǎo)者的控制輸入為零時(shí)的一類(lèi)特殊情況。其次，相關(guān)文獻(xiàn)往往僅考慮了單一合作或競(jìng)爭(zhēng)的信息交互，對(duì)于合作-競(jìng)爭(zhēng)交互給系統(tǒng)帶來(lái)的影響并沒(méi)有進(jìn)一步的研究和說(shuō)明。事實(shí)上，合作-競(jìng)爭(zhēng)交互共存時(shí)給系統(tǒng)帶來(lái)的影響是顯著的，它不僅體現(xiàn)在實(shí)現(xiàn)一致性行為軌跡上的不同，而且在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)上也發(fā)生了明顯的變化，一些群體一致性拓?fù)浣Y(jié)構(gòu)性質(zhì)也變得不再適用。此外，非線性問(wèn)題一直是系統(tǒng)控制的難點(diǎn)和重點(diǎn)，在考慮動(dòng)態(tài)領(lǐng)導(dǎo)者和合作-競(jìng)爭(zhēng)機(jī)制后，實(shí)現(xiàn)非線性多智能體系統(tǒng)一致性更具困難和挑戰(zhàn)。

基于上述分析，本文主要研究了在合作-競(jìng)爭(zhēng)交互下具有動(dòng)態(tài)領(lǐng)導(dǎo)者的非線性多智能體系統(tǒng)的分組一致性控制問(wèn)題。主要貢獻(xiàn)如下：

1)相較于文獻(xiàn)[10]和文獻(xiàn)[12]中不具有控制輸入的領(lǐng)導(dǎo)者動(dòng)力學(xué)模型，本文考慮了具有非零控制輸入的領(lǐng)導(dǎo)者，并且領(lǐng)導(dǎo)者的輸入對(duì)每個(gè)跟隨者都是未知的。傳統(tǒng)的零輸入領(lǐng)導(dǎo)者可看作是本文的一種特殊情況。

2)本文考慮了合作-競(jìng)爭(zhēng)交互機(jī)制，相較于文獻(xiàn)[16-18]中單一合作或競(jìng)爭(zhēng)交互，本文研究的問(wèn)題復(fù)雜度更高。

3)利用分組機(jī)制設(shè)計(jì)的控制器，適用范圍更加廣泛，本文設(shè)計(jì)的控制器不僅適用于合作-競(jìng)爭(zhēng)交互的智能體系統(tǒng)，對(duì)于單一合作或競(jìng)爭(zhēng)交互的多智能體系統(tǒng)也適用。

1 預(yù)備知識(shí)

1.1 圖論

1.2 問(wèn)題描述

考慮如下由1個(gè)領(lǐng)導(dǎo)者和個(gè)跟隨者組成的非線性多智能體系統(tǒng)

(1)

其中，∈和∈分別代表領(lǐng)導(dǎo)者智能體的狀態(tài)和控制輸入。∈，∈分別代表跟隨者智能體的狀態(tài)和控制輸入。:×→是在時(shí)間上連續(xù)可微的已知的非線性函數(shù)。、是具有適當(dāng)維數(shù)的常數(shù)矩陣。

在文獻(xiàn)[8]和文獻(xiàn)[9]中，領(lǐng)導(dǎo)者不帶有控制輸入，這可以看作是系統(tǒng)(1)在()=0時(shí)的一種特殊情況。而本文中研究的領(lǐng)導(dǎo)者具有控制輸入且與跟隨者的相對(duì)狀態(tài)無(wú)關(guān)，其相對(duì)于跟隨者是未知的。

與系統(tǒng)(1)相關(guān)的符號(hào)圖是結(jié)構(gòu)平衡的，并且包含一個(gè)由領(lǐng)導(dǎo)者作為根節(jié)點(diǎn)的有向生成樹(shù)。如果領(lǐng)導(dǎo)者是智能體的鄰居，則0=1，否則0=0。

若符號(hào)圖是結(jié)構(gòu)平衡的，則存在一個(gè)符號(hào)矩陣=diag(,,…,)，使得矩陣所有項(xiàng)都是非負(fù)的。其中，當(dāng)節(jié)點(diǎn)處于同組時(shí)=1，當(dāng)節(jié)點(diǎn)處于不同組時(shí)=-1。

(,)是可穩(wěn)的。

非線性函數(shù)滿足下列不等式

(2)

其中，>0是一個(gè)常數(shù)。

假設(shè)1是實(shí)現(xiàn)分組一致性控制的一般假設(shè)條件，在此條件下滿足圖拉普拉斯矩陣的一些特殊性質(zhì)。假設(shè)2是保證Riccati不等式可解的條件。假設(shè)3中()是一致有界的，這在實(shí)際控制中是可行的。假設(shè)4是一類(lèi)Lipschitz-like條件，用于解決分組一致性控制中非線性函數(shù)帶來(lái)的困難。

當(dāng)如下條件(3)被滿足時(shí)，系統(tǒng)(1)可實(shí)現(xiàn)領(lǐng)導(dǎo)-跟隨分組一致性控制。

(3)

跟隨者智能體和領(lǐng)導(dǎo)者之間的狀態(tài)誤差定義為

()=()-()

(4)

由引理1和上述等式可知，本文主要解決的問(wèn)題是在合作-競(jìng)爭(zhēng)交互的多智能體系統(tǒng)(1)中設(shè)計(jì)分組控制器和，使得

(5)

成立，從而實(shí)現(xiàn)系統(tǒng)(1)的領(lǐng)導(dǎo)-跟隨分組一致性控制。

2 主要結(jié)果

首先，對(duì)誤差系統(tǒng)(4)求導(dǎo)可得

=()+()+(,)-

(()+()+(,))

(6)

為了在符號(hào)圖中實(shí)現(xiàn)系統(tǒng)(1)的分組跟隨一致性控制，設(shè)計(jì)如下的控制器

(7)

其中，,>0，是在下文中被設(shè)計(jì)的參數(shù)；∈表示智能體與智能體屬于同一組，∈表示智能體與智能體屬于不同組；表示領(lǐng)導(dǎo)者與跟隨者是否同組，同組=1，不同組=-1。

合作-競(jìng)爭(zhēng)交互在控制器(6)中體現(xiàn)為同組智能體之間為合作關(guān)系，其狀態(tài)最終趨于相同值；不同組智能體之間為競(jìng)爭(zhēng)關(guān)系，其狀態(tài)最終趨于相反值。本文考慮的是二分組情況，智能體的鄰居智能體只屬于或，且∈∪，這種分組機(jī)制相較于文獻(xiàn)[17]和文獻(xiàn)[20]中群體一致性更具有應(yīng)用前景。

結(jié)合上述所設(shè)計(jì)的控制器(7)，式(6)可改寫(xiě)為如下緊湊形式

(?)sgn((?)())-

(?)()+()

(8)

其中，=+，=diag(,,…,0)表示領(lǐng)導(dǎo)者與跟隨者的通信關(guān)系，表示由個(gè)跟隨者智能體組成的通信拓?fù)鋱D的拉普拉斯矩陣，

(9)

之后，對(duì)誤差進(jìn)行如下變換

(10)

(11)

+-2++<0

(12)

選擇Lyapunov函數(shù)為

(13)

對(duì)式(13)求導(dǎo)可得

)()

(14)

結(jié)合假設(shè)4，式(15)成立

(15)

(?)sgn()+(?)sgn()

(16)

根據(jù)假設(shè)3可知

(17)

成立，因此，式(14)可寫(xiě)為

(18)

控制器(7)可以進(jìn)一步轉(zhuǎn)化為(19)，控制器(19)可以有效地消除抖振現(xiàn)象。

(19)

3 數(shù)值仿真

考慮由1個(gè)領(lǐng)導(dǎo)者和5個(gè)跟隨者構(gòu)成的多智能體系統(tǒng)，如圖1所示，其中，領(lǐng)導(dǎo)者0和智能體1，2，3為同組；智能體4和5為同組。

圖1 通信拓?fù)鋱DFig.1 Communication topology

由圖1可以計(jì)算出

選擇系統(tǒng)的參數(shù)如下

可得

設(shè)定系統(tǒng)初始狀態(tài)值為

仿真結(jié)果如下：圖2所示為智能體0～5隨時(shí)間發(fā)生變化的狀態(tài)軌跡圖，圖3所示為跟隨者1～5與領(lǐng)導(dǎo)者0的狀態(tài)誤差軌跡圖，圖4所示為每個(gè)跟隨者的控制輸入軌跡圖。從圖2可以看出，跟隨者1、2、3和領(lǐng)導(dǎo)者0的狀態(tài)最終趨于一致，而跟隨者4、5和領(lǐng)導(dǎo)者0的狀態(tài)最終趨于相反值。從圖3可以看出，同組的狀態(tài)差收斂于0，不同組的狀態(tài)和收斂于0。從圖4可以看出，由于設(shè)計(jì)了較大的反饋增益參數(shù)，控制輸入量在前0.5s內(nèi)較大，收斂較快。通過(guò)仿真分析可知，在所設(shè)計(jì)的控制器(19)下，實(shí)現(xiàn)了動(dòng)態(tài)領(lǐng)導(dǎo)者下的系統(tǒng)(1)的分組-跟隨一致性控制。圖5所示為系統(tǒng)(1)在反饋控制器()=ξ()時(shí)的狀態(tài)誤差軌跡，與圖3的結(jié)果進(jìn)行比較，可以發(fā)現(xiàn)，在相同時(shí)段內(nèi)本文所設(shè)計(jì)的控制器可以實(shí)現(xiàn)更好的收斂性能。

(a)

(b)

(a)

(b)

(a)

(b)

(a)

(b)

在一定的取值范圍內(nèi)，,選取的越大，則系統(tǒng)初始時(shí)刻的控制輸入量越大，系統(tǒng)的收斂速度越快，控制量曲線越抖。因此，這里需要視情況折中處理，而在理論上選擇的是滿足條件的邊界值。事實(shí)上，存在不滿足假設(shè)條件的參數(shù)也可以使系統(tǒng)穩(wěn)定，因?yàn)槎ɡ?給出的是一個(gè)充分條件而非必要條件。

4 結(jié)論

本文研究了一類(lèi)非線性多智能體系統(tǒng)的領(lǐng)導(dǎo)-跟隨一致性控制問(wèn)題。1)考慮領(lǐng)導(dǎo)者智能體具有非零控制輸入的情況，基于鄰居智能體的相對(duì)狀態(tài)信息，設(shè)計(jì)了分布式控制器。2)仿真結(jié)果表明，本文設(shè)計(jì)的控制方案可以使得具有動(dòng)態(tài)領(lǐng)導(dǎo)者的非線性多智能體系統(tǒng)在合作-競(jìng)爭(zhēng)交互網(wǎng)絡(luò)中實(shí)現(xiàn)分組-跟隨一致性控制。3)未來(lái)的研究工作將考慮時(shí)滯影響，在有限時(shí)間內(nèi)實(shí)現(xiàn)分組一致性控制。此外，本文設(shè)計(jì)的控制器是基于連續(xù)狀態(tài)的，如何設(shè)計(jì)一個(gè)利用離散狀態(tài)的脈沖控制器或事件觸發(fā)控制器也是下一步的研究方向。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡