国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

含約束和通信時滯的多智能體系統(tǒng)包含控制

2022-04-02 05:26侯海良
計算機技術(shù)與發(fā)展 2022年3期
關(guān)鍵詞:跟隨者時滯控制算法

張 旺,侯海良

(湖南人文科技學(xué)院 信息學(xué)院,湖南 婁底 417000)

0 引 言

近幾年來,隨著人工智能的普及,多智能體系統(tǒng)協(xié)同控制受到了廣泛關(guān)注。包含控制作為其中一個重要的分支,在實際中有著廣泛的應(yīng)用前景,如無人機護航編隊、多機器人協(xié)同避障等。文獻[1]提出了一種走走停停的控制策略,解決了固定無向通信拓撲下的包含問題,并首次明確了包含控制的目標(biāo)是將一組跟隨者智能體驅(qū)動到由領(lǐng)導(dǎo)者構(gòu)成的凸區(qū)域內(nèi)。文獻[2-4]研究了固定網(wǎng)絡(luò)下的包含控制問題。文獻[5-6]研究了無向切換網(wǎng)絡(luò)的包含控制問題。文獻[7]分別研究了領(lǐng)導(dǎo)者運動和靜止兩種情況下有向切換網(wǎng)絡(luò)的包含控制問題。以上研究均未考慮時滯問題,實際上由于信息采集、傳輸、處理等需要時間,時滯問題不可避免,必定會對控制產(chǎn)生影響。文獻[8-11]研究了固定網(wǎng)絡(luò)下考慮通信時滯的包含控制問題。文獻[12]提出了一種基于投影的非線性包含控制算法,解決了有向切換網(wǎng)絡(luò)中存在通信時滯的包含控制問題。文獻[13]分別針對一階和二階系統(tǒng)提出了兩種不同的包含控制算法,解決了有向切換網(wǎng)絡(luò)中存在通信時滯的包含控制問題。文獻[14]將文獻[13]的研究內(nèi)容拓展到離散系統(tǒng)中,并改進了包含控制算法。

上述研究[1-14]假定智能體的控制輸入和狀態(tài)可以任意變化。但在實際應(yīng)用中,受物理條件的限制,智能體運動不可避免地要受到一些約束,如受能耗影響,機器人的速度只可能在一定范圍內(nèi)變化。文獻[15-16]研究了受約束的多智能體系統(tǒng)控制問題,其所受約束為凸性,這往往與實際不符。例如艦艇在水中可以朝各個方向運動,速度最快的方向為艦艇的前進方向,各個方向的運動速度形成了一個非凸區(qū)域。在文獻[15-16]研究的基礎(chǔ)上,文獻[17-19]進一步研究了受非凸速度約束以及非凸輸入約束的控制問題。需要強調(diào)的是文獻[15-19]都是研究多智能體系統(tǒng)一致性問題。文獻[20]提出了一種基于投影的非線性包含控制算法,解決了連續(xù)系統(tǒng)輸入受約束的包含控制問題。

文獻[1-20]中提到的系統(tǒng)均是離散的或者連續(xù)的。在實際應(yīng)用中通常智能體使用的控制器為計算機或微處理器,智能體的狀態(tài)信息需要經(jīng)過采樣后傳輸給鄰居智能體,且在某些特定的環(huán)境中只能獲得采樣數(shù)據(jù)。與連續(xù)系統(tǒng)相比,采樣系統(tǒng)只需要對采樣數(shù)據(jù)進行傳輸,減少了通信能耗。與離散系統(tǒng)相比,采樣系統(tǒng)不需要將控制系統(tǒng)做離散化處理,且進行周期采樣得到的數(shù)據(jù)便于處理。文獻[21-22]研究了固定網(wǎng)絡(luò)下采樣系統(tǒng)的包含控制問題。文獻[23]研究了切換網(wǎng)絡(luò)和通信時滯的采樣系統(tǒng)包含控制問題,但都沒有考慮采樣系統(tǒng)的約束問題。

該研究受輸入約束和通信時滯影響的采樣多智能體系統(tǒng)包含控制問題,提出了一種基于投影的分布式協(xié)調(diào)控制算法。首先針對跟隨者智能體設(shè)計了一種基于投影的非線性包含控制算法,將所有跟隨者智能體到凸包的最大距離定義為李雅普諾夫函數(shù),根據(jù)李雅普諾夫穩(wěn)定性理論證明只要每個跟隨者智能體能直接或間接至少收到一個領(lǐng)導(dǎo)者的信息,受限包含控制問題就能解決。最后通過數(shù)字案例證明了該包含控制方法的有效性。

1 圖論與預(yù)備知識

G(ν,ε,A)表示含n個節(jié)點的有向圖,ε?{(i,j):i,j∈ν}表示邊集,ν={1,2,…,n}表示節(jié)點集,A=[aij]∈n×n表示鄰接矩陣的權(quán)值。aij≥0表示邊的權(quán)值,(j,i)∈ε表示節(jié)點i能接收到節(jié)點j接收的消息,當(dāng)(j,i)∈ε且i≠j時有aij>0,否則aij=0。在有向圖G(ν,ε,A)中,有向路徑由有序邊序列(i1,i2),(i2,i3),…構(gòu)成,其中(ij,ij+1)∈ν。多個有向圖G1,G2,…,GN的并集為GM,GM仍是一個有向圖,且GM的邊集等于全部有向圖Gj,j=1,2,…,M邊集的并集。+表示所有正整數(shù)的集合,g表示g維實列向量的集合?!瑇‖表示向量x的標(biāo)準歐幾里得范數(shù)。PY(x)表示x在封閉區(qū)域Y上的投影,定義為:

引理1:設(shè)凸集Q∈r為非空封閉凸集,γi∈r表示任意向量,如果ai≥0,i=(1,2,…,n)滿足那么有

定義1:設(shè)Ui?r是一個有界的非空封閉集合,當(dāng)x=0時,SUi(0)=0,當(dāng)x≠0時,則將SUi(x)稱為約束算子。此外其中均是正常數(shù)。

約束算子SUi(x)的物理意義是找到與矢量x方向相同的矢量SUi(x)使其滿足‖SUi(x)‖≤‖x‖,并且對于任意θ∈[0,1],都滿足θSUi(x)∈Ui。值得指出的是,該約束算子不要求Ui為凸性(如圖1所示)。

圖1 約束算子示意圖

2 問題提出及系統(tǒng)設(shè)計

設(shè)多智能體系統(tǒng)由l+n個智能體組成,包括l個領(lǐng)導(dǎo)者智能體(下文簡稱領(lǐng)導(dǎo)者)和n個跟隨者智能體(下文簡稱跟隨者),F(xiàn)={1,2,…,n}表示跟隨者集合,L={n+1,n+2,…,n+l}表示領(lǐng)導(dǎo)者集合。xi(k)∈r表示跟隨者在kT時刻的位置,ui(k)∈r表示跟隨者在kT時刻的控制輸入。T>0表示采樣周期,為了簡便起見,后面統(tǒng)一用k表示kT。所有領(lǐng)導(dǎo)者和跟隨者構(gòu)成了通信拓撲圖G(ν,ε,A)的節(jié)點集。

xi(k+1)=xi(k)+SUi(ui(k))T

(1)

考慮通信時滯影響,設(shè)計包含控制算法為:

ci(k)[xi(k)-PYi(k)(xi(k))]

(2)

式中,τij(i≠j)為跟隨者i與j之間的通信時滯,τij<τmax,τmax為最大通信時滯。如果aij>0,假設(shè)aij>λ,λ為一個正常數(shù)。跟隨者i如果能至少接收到一個領(lǐng)導(dǎo)者的信息,則有ci(k)>0,否則ci(k)=0。同樣假設(shè)如果ci(k)>0,則ci(k)≥λ。

3 穩(wěn)定性分析

為了便于后續(xù)分析,定義一個新的變量hi(k),當(dāng)k≥0時有:

xi(k))-ci(k)(xi(k)-PYi(k)(xi(k)))]T=

τij)-xi(k))-hi(k)Tci(k)(xi(k)-

PYi(k)(xi(k)))=

hi(k)Tci(k)xi(k)+hi(k)Tci(k)PYi(k)(xi(k))=

hi(k)Tci(k)PYi(k)(xi(k))

(3)

假設(shè)1:在kT時刻,通信拓撲圖的并集中任意跟隨者與領(lǐng)導(dǎo)者之間至少存在一條有向的路徑。

(4)

根據(jù)式(3)和引理1可得:

(5)

因為Yi(k)?Y,所以PYi(k)(xi(k))=PY(PYi(k)(xi(k)))。

‖xi(k+1)-PY(xi(k+1))‖≤

hi(k)Tci(k)V(k)+hi(k)Tci(k)≤

(1-hi(k)ci(k)T)V(k)

(6)

由假設(shè)2可得0≤(1-hi(k)ci(k)T)≤1,即V(k)≤V(k+1)=‖xi(k+1)-PY(xi(k+1))‖,可得出V(k)為單調(diào)非增,即跟隨者到凸區(qū)域Y的最大距離不會增大。為了最終能實現(xiàn)包含控制,必須證明V(k)會隨時間減小,下面分兩步來證明。

第一步:對于任意跟隨者i∈F,當(dāng)k≤κ且0≤ζ1<1時,如果有‖xi(κ)-PY(xi(κ))‖≤ζ1V(k),那么對于0≤ζ2<1,有‖xi(κ+1)-PY(xi(κ+1))‖≤ζ2V(k)。

根據(jù)公式(6)有:

‖xi(κ+1)-PY(xi(κ+1))‖≤

ci(κ)))](1-ζ1)V(k)≤[1-(1-

ΨmaxT)](1-ζ1)V(k)

(7)

根據(jù)假設(shè)2和式(7)可推導(dǎo)出‖xi(κ+1)-PY(xi(κ+1))‖≤ζ2V(k),此時ζ2=1-(1-ΨmaxT)(1-ζ1)。

第二步:對于任意跟隨者iz∈F,設(shè)iz能接收到iw∈F∪L的信息,即aiziw(κ)>0,有aiziw(κ)≥λ;ciz(κ)>0,有ciz(κ)≥λ。當(dāng)k≤κ時,如果有‖xiw(κ-τiziw)-PY(xiw(κ-τiziw))‖≤ζ1V(k),那么有‖xiz(κ+1)-PY(xiz(κ+1))‖≤ζ2V(k),此時0≤ζ1<1,0≤ζ2<1。

證明過程如下:

‖xiz(κ+1)-PY(xiz(κ+1))‖≤

aiziw(κ)TV(k)-aiziw(κ)T(1-ζ1)V(k)≤

[1-hiz(κ)Tciz(κ)]V(k)-aiziw(κ)T(1-

ζ1)V(k)≤(1-aiziw(κ)T(1-ζ1))V(k)≤

(1-λT(1-ζ1))V(k)

(8)

由式(8)可得‖xiz(κ+1)-PY(xiz(κ+1))‖≤ζ2V(k),此時ζ2=1-λT(1-ζ1),很顯然0<ζ2<1。

根據(jù)假設(shè)1至少存在一個跟隨者if1∈F在kT時刻能接收到領(lǐng)導(dǎo)者的消息,即ci(k)≥λ。由第二步可得‖xif1(k+1)-PY(xif1(k+1))‖<ζif1V(k),通過第一步運用遞歸法則可得,對于任意S≥1有ζif1,SV(k)>‖xif1(k+S+1)-PY(xif1(k+S+1))‖,此時0<ζif1,S<1。

同理,存在一個跟隨者if2,f2≠f1在(k+1+τif1if2)T時刻能接收到if1或者部分領(lǐng)導(dǎo)者的消息。根據(jù)第二步可得‖xif2(k+τif1if2+1)-PY(xif2(k+τif1if2+1))‖<ζif2,1V(k),此時0<ζf2,1<1。通過使用遞歸法則可得,‖xif2(k+τif1if2+1+S)-PY(xif2(k+τif1if2+1+S))‖<ζif2,S+1V(k),此時0<ζif2,S+1<1、S≥1。

4 數(shù)值仿真

為了證明控制算法的有效性,本節(jié)通過兩次仿真案例對設(shè)計的算法進行驗證。在第一次仿真中考慮由6個智能體n1,n2,…,n6和4個領(lǐng)導(dǎo)者m1,m2,m3,m4構(gòu)成的多智能體系統(tǒng),其通信拓撲如圖2所示(多智能體系統(tǒng)通信拓撲1),由三個拓撲結(jié)構(gòu)G1,G2,G3組成,在系統(tǒng)運行過程中每隔1秒切換一次拓撲,顯然G1∪G2∪G3滿足假設(shè)1的條件。令aij(k)=1.5,ci(k)=0.23,采樣周期T=0.2,顯然滿足假設(shè)2的條件。

圖2 多智能體系統(tǒng)通信拓撲1

將所有跟隨者的輸入約束范圍設(shè)置為由半圓x2+(y-0.75)2=0.75(y≥0.75)、x2+(y+0.75)2=0.75(y≤-0.75)與四條線段y=-x+1.5(0.75x≥-1.5)、y=x+1.5(-0.75>x>-1.5)圍成的非凸區(qū)域中。如圖3所示(跟隨者輸入約束1),所有跟隨者的控制輸入均約束在設(shè)置的非凸區(qū)域中。運動軌跡結(jié)果如圖4所示(跟隨者運動軌跡1),6個智能體初始位置不同,最后均能運動到由4個領(lǐng)導(dǎo)者構(gòu)成的凸區(qū)域中。

第二次仿真采用的通信拓撲如圖5所示(多智能體系統(tǒng)通信拓撲2),三個拓撲結(jié)構(gòu)對應(yīng)的通信時滯為0.1 s,0.2 s,0.3 s。仿真結(jié)果如圖6、7所示,假設(shè)多智能體系統(tǒng)包括n1,n2,…,n6等6個跟隨者和L1,L2,L3,L4等4個領(lǐng)導(dǎo)者。通信拓撲按照Ga,Gb,Gc順序依次切換,每個拓撲的持續(xù)時間為1 s,顯然Ga∪Gb∪Gc滿足假設(shè)1的條件。假設(shè)三個拓撲結(jié)構(gòu)中智能體間的通信時滯分別為0.1 s,0.2 s,0.3 s。

圖3 跟隨者輸入約束1 圖4 跟隨者運動軌跡1

圖5 多智能體系統(tǒng)通信拓撲2

令aij(k)=0.12,ci(k)=0.1,采樣周期T=0.2,顯然能使假設(shè)2滿足。4個領(lǐng)導(dǎo)者的初始位置為:L1:(-1,1),L2:(1,1),L3:(-1,-1),L4:(1,-1)。6個跟隨者的初始位置分別為:n1:(-3,3),n2:(0,3),n3:(3,3)n4:(-3,-3),n5:(0,-3),n6:(3,-3)。將所有跟隨者的輸入約束范圍設(shè)置為:半圓(x-0.5)2+y2=0.5(x≥0.5)、(x+0.5)2+y2=0.5(x≤-0.5)與四條線段y=-x+1(0-0.5)、y=x+1(0≥x>-0.5)構(gòu)成的非凸區(qū)域中。如圖6所示(跟隨者輸入約束2),所有跟隨者控制輸入均約束在設(shè)定的非凸區(qū)域內(nèi)。由圖7(跟隨者運動軌跡2)可以看出,在所提出的控制器的作用下,6個跟隨者由不同的初始位置出發(fā)最終運動到領(lǐng)導(dǎo)者構(gòu)成的凸區(qū)域中。數(shù)值仿真結(jié)果說明系統(tǒng)在提出的控制器的作用下能解決含輸入約束和通信時滯的包含控制問題。

圖6 跟隨者輸入約束2 圖7 跟隨者運動軌跡2

5 結(jié)束語

該文研究了受輸入約束的多智能體系統(tǒng)包含控制問題,考慮了跟隨者受通信時滯影響,同時該系統(tǒng)通信拓撲為有向切換的。針對該問題設(shè)計了一種基于鄰居位置信息以及投影的包含控制算法,將跟隨者與凸區(qū)域的距離構(gòu)建為李雅普諾夫函數(shù),運用凸分析、模型轉(zhuǎn)換等方法首先證明了領(lǐng)導(dǎo)者與凸區(qū)域的距離不會隨時間變化增大,接著證明了所有能與領(lǐng)導(dǎo)者直接或間接通信的跟隨者與凸區(qū)域間的距離隨時間變化減小,最終所有跟隨者與凸區(qū)域間的距離收斂到0,即所有控制輸入受約束的跟隨者均能進入到由領(lǐng)導(dǎo)者構(gòu)成的凸區(qū)域中。最后通過數(shù)值仿真證明了理論結(jié)果的正確性。文中考慮的系統(tǒng)為一階采樣系統(tǒng),下一步工作將探究受輸入約束和時延影響的二階采樣多智能體系統(tǒng)包含控制問題以及動態(tài)領(lǐng)導(dǎo)者的情況。

猜你喜歡
跟隨者時滯控制算法
多機動控位水雷隊形控制技術(shù)
基于模型預(yù)測控制算法的智能密度控制系統(tǒng)在選煤廠的應(yīng)用
基于Backstepping的非線性無人船航向控制算法
隨機時滯微分方程的數(shù)值算法實現(xiàn)
變時滯間隙非線性機翼顫振主動控制方法
不確定時滯奇異攝動系統(tǒng)的最優(yōu)故障估計
中立型隨機時滯微分方程的離散反饋鎮(zhèn)定
由城市臺的“跟隨者”到縣域“三農(nóng)”媒體的 “領(lǐng)導(dǎo)者”
從“跟隨者”到“引領(lǐng)者”
—— 甕福集團PPA項目成為攪動市場的“鯰魚”
跟隨者
陆川县| 北川| 南昌市| 黑水县| 普兰县| 常德市| 将乐县| 民和| 昌宁县| 嘉祥县| 香港 | 云南省| 北京市| 新蔡县| 曲麻莱县| 荥阳市| 大方县| 西城区| 保靖县| 剑川县| 靖州| 淮北市| 咸宁市| 铁岭市| 正定县| 仁怀市| 潮州市| 济宁市| 福州市| 鹤庆县| 博兴县| 吉林省| 黔西| 湄潭县| 鹰潭市| 榕江县| 富裕县| 通许县| 沙坪坝区| 庆安县| 抚顺市|