国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

具有偽領(lǐng)導(dǎo)者的多智能體系統(tǒng)動態(tài)牽制蜂擁控制算法

2021-12-05 03:09:22高晶英何斯日古楞
關(guān)鍵詞:控制算法領(lǐng)導(dǎo)者時(shí)刻

高晶英,徐 旭,何斯日古楞

(1.呼和浩特民族學(xué)院 數(shù)學(xué)與大數(shù)據(jù)學(xué)院,呼和浩特 010051;2.吉林大學(xué) 數(shù)學(xué)學(xué)院,長春 130012)

多智能體系統(tǒng)蜂擁控制問題來源于自然界各種生物群體的蜂擁現(xiàn)象,它們通過彼此之間的相互協(xié)作尋找食物或躲避天敵.蜂擁控制的目的有3個(gè),即避免相鄰個(gè)體之間碰撞;相鄰個(gè)體之間盡量保持聚集;所有個(gè)體的速度盡量保持一致.目前多智能體系統(tǒng)蜂擁控制研究取得了豐富成果,文獻(xiàn)[1]研究了有切換拓?fù)浣Y(jié)構(gòu)的多智能體蜂擁控制問題,提出一種局部自適應(yīng)牽制控制算法使得當(dāng)多智能體網(wǎng)絡(luò)不時(shí)刻連通時(shí)也能達(dá)到蜂擁狀態(tài).文獻(xiàn)[2]提出了高頻反饋魯棒控制算法,當(dāng)智能體運(yùn)動方程含未知參數(shù)時(shí)該算法可以保證多智能體系統(tǒng)有很好的收斂性和魯棒性.文獻(xiàn)[3]研究了具有擾動非線性系統(tǒng)的多智能體蜂擁控制問題,為了解決每個(gè)智能體動力系統(tǒng)的非線性性,引入了一些輔助變量,通過定義有限勢能函數(shù)保證了多智能體系統(tǒng)的蜂擁控制.文獻(xiàn)[4]在Cucker-Smale模型的基礎(chǔ)上得到了改進(jìn)模型,該算法可以實(shí)現(xiàn)在有限時(shí)間內(nèi)使得多智能體系統(tǒng)達(dá)到蜂擁狀態(tài).文獻(xiàn)[5]為了減少智能體之間的信息交流次數(shù),采用了有限域delaunay圖表示智能體之間的網(wǎng)路拓?fù)浣Y(jié)構(gòu),同時(shí)刪除與智能體網(wǎng)絡(luò)連通性無關(guān)的邊,以此提高蜂擁控制算法靈活性.文獻(xiàn)[6]研究了含未知參數(shù)非線性系統(tǒng)多智能體自適應(yīng)有限時(shí)間蜂擁控制算法,構(gòu)造了有限勢函數(shù)保證多智能體網(wǎng)絡(luò)的連通性.

大部分蜂擁控制算法有一個(gè)虛擬領(lǐng)導(dǎo)者,該虛擬領(lǐng)導(dǎo)者可以看作給多智能體系統(tǒng)的指令,但由于可能的外界干擾或內(nèi)部故障,無法保證多智能體系統(tǒng)時(shí)刻獲取該指令,從而達(dá)不到蜂擁的目的.針對該情況,本文考慮了沒有虛擬領(lǐng)導(dǎo)者且具有切換拓?fù)浣Y(jié)構(gòu)動態(tài)牽制蜂擁控制問題,每個(gè)智能體的運(yùn)動方程表示為更一般的二階系統(tǒng)[7-8].為了使得所有智能體能夠聚集在一起,首先引入了偽領(lǐng)導(dǎo)者的概念,從整個(gè)智能體網(wǎng)絡(luò)選擇評價(jià)指標(biāo)最低的節(jié)點(diǎn)作為群體臨時(shí)領(lǐng)導(dǎo)者,其次從每個(gè)子網(wǎng)絡(luò)中選擇評價(jià)指標(biāo)最低的節(jié)點(diǎn)作為牽制節(jié)點(diǎn)使其能夠收到偽領(lǐng)導(dǎo)者的反饋信息,從而使所有智能體圍繞在偽領(lǐng)導(dǎo)者周圍.基于動態(tài)牽制策略,給出了一種新的控制協(xié)議使得具有一般二階模型多智能體系統(tǒng)在無需假設(shè)智能體網(wǎng)絡(luò)連通的情況下達(dá)到蜂擁控制目標(biāo).最后給出了一些數(shù)值模擬結(jié)果,進(jìn)一步證實(shí)算法的有效性.

本文算法與已有的成果有3個(gè)方面的不同,首先大部分多智能體系統(tǒng)蜂擁控制算法當(dāng)中每個(gè)智能體動力學(xué)方程為簡單的二階系統(tǒng),而本文算法中由更一般的二階系統(tǒng)表示每個(gè)智能體的運(yùn)動方程,這更符合實(shí)際情況.其次,以往蜂擁控制算法都具有一個(gè)虛擬領(lǐng)導(dǎo)者,該虛擬領(lǐng)導(dǎo)者可作為整個(gè)智能體網(wǎng)絡(luò)的運(yùn)動參考目標(biāo),本文沒有設(shè)置虛擬領(lǐng)導(dǎo)者,而是引入一種偽領(lǐng)導(dǎo)者的概念,偽領(lǐng)導(dǎo)者真實(shí)存在且從整個(gè)智能體網(wǎng)絡(luò)中選出.最后,大部分蜂擁控制算法需要假設(shè)智能體網(wǎng)絡(luò)的連通性,本文在無需假設(shè)智能體網(wǎng)絡(luò)連通的情況下,采用動態(tài)牽制策略能夠保證整個(gè)智能體網(wǎng)絡(luò)的連通性.

1 問題闡述

考慮n個(gè)智能體在m維歐式空間上移動,每個(gè)智能體的運(yùn)動方程表示為

其中qi(t),pi(t)∈Rm分別是智能體i在t時(shí)刻的位置向量和速度向量,ui(t)∈Rm為智能體i在t時(shí)刻的控制輸入向量.矩陣X和Y是2×2矩陣,Im是m階單位矩陣,?表示Kronecker積.此時(shí),多智能體系統(tǒng)蜂擁控制問題可以轉(zhuǎn)化為當(dāng)ui(t)滿足什么條件時(shí)n個(gè)智能體達(dá)到蜂擁狀態(tài).

2 偽領(lǐng)導(dǎo)者和牽制節(jié)點(diǎn)的選擇

多智能體網(wǎng)絡(luò)不連通且沒有虛擬領(lǐng)導(dǎo)者時(shí),可以從多個(gè)智能體當(dāng)中選擇一個(gè)智能體作為臨時(shí)的領(lǐng)導(dǎo)者,稱該智能體為偽領(lǐng)導(dǎo)者.本文提出的動態(tài)牽制算法的做法是在每個(gè)拓?fù)淝袚Q時(shí)刻,把整個(gè)網(wǎng)絡(luò)分成若干個(gè)連通子網(wǎng)絡(luò),然后從每個(gè)子網(wǎng)絡(luò)中選擇一個(gè)智能體作為牽制節(jié)點(diǎn),即能夠收到偽領(lǐng)導(dǎo)者的反饋信息.

其中d1,d2∈(0,1].式(2)可以看作是一個(gè)智能體與其他智能體之間勢能和動能的加權(quán)總和.評價(jià)指標(biāo)公式的實(shí)際運(yùn)算顯示第1項(xiàng)的值遠(yuǎn)大于第2項(xiàng),使得第1項(xiàng)具有主導(dǎo)地位.為了使第2項(xiàng)的作用變大,增加了兩個(gè)參數(shù)d1、d2調(diào)整第1項(xiàng)和第2項(xiàng)的比值.式(2)的幾何意義為越接近智能體網(wǎng)絡(luò)中心位置的智能體越有可能被選作偽領(lǐng)導(dǎo)者.選完偽領(lǐng)導(dǎo)者之后,重新排列智能體的標(biāo)號使得偽領(lǐng)導(dǎo)者的下標(biāo)變成1,圖1中的正方形代表偽領(lǐng)導(dǎo)者.

圖1 動態(tài)牽制策略

偽領(lǐng)導(dǎo)者與虛擬領(lǐng)導(dǎo)者不一樣,虛擬領(lǐng)導(dǎo)者可以帶領(lǐng)整個(gè)智能群體到達(dá)某個(gè)提前給定的目的地,而偽領(lǐng)導(dǎo)者不能,因?yàn)閭晤I(lǐng)導(dǎo)者也是眾多智能體當(dāng)中的一個(gè)智能體,它會受到周圍智能體的影響從而無法實(shí)現(xiàn)虛擬領(lǐng)導(dǎo)者的作用.但是偽領(lǐng)導(dǎo)者仍然有領(lǐng)導(dǎo)者的部分作用,它可以把自己的反饋信息傳達(dá)給牽制節(jié)點(diǎn),使得整個(gè)智能體網(wǎng)路最終能夠達(dá)到連通.由于偽領(lǐng)導(dǎo)者是多個(gè)智能體當(dāng)中的一員,它的運(yùn)動方程依然使用公式(1)表示.根據(jù)選擇偽領(lǐng)導(dǎo)者的方法,它會隨著拓?fù)浣Y(jié)構(gòu)變化而改變.

牽制節(jié)點(diǎn)依然采用類似式(2)的方法選擇,不同點(diǎn)在于牽制節(jié)點(diǎn)是從每個(gè)連通網(wǎng)絡(luò)中選擇而偽領(lǐng)導(dǎo)者是從整個(gè)智能體網(wǎng)絡(luò)中選取,所以選擇每個(gè)連通網(wǎng)絡(luò)中評價(jià)指標(biāo)最低的節(jié)點(diǎn)作為該子網(wǎng)絡(luò)的牽制節(jié)點(diǎn).對于具有切換拓?fù)浣Y(jié)構(gòu)的多智能體系統(tǒng),由于每個(gè)智能體不斷更新自己的位置,因此任意兩個(gè)智能體之間的連邊在某一個(gè)時(shí)刻可能會斷開,有時(shí)候?qū)е碌?類非牽制節(jié)點(diǎn)出現(xiàn).這些第2類非牽制節(jié)點(diǎn)由于收不到偽領(lǐng)導(dǎo)者的信息,有可能永遠(yuǎn)不會與剩下的智能體網(wǎng)絡(luò)連通.為了第2類非牽制節(jié)點(diǎn)能夠重新回到智能體網(wǎng)絡(luò)當(dāng)中,在每個(gè)拓?fù)淝袚Q時(shí)刻把整個(gè)智能體網(wǎng)絡(luò)(除去偽領(lǐng)導(dǎo)者)分成若干個(gè)連通子網(wǎng)絡(luò),之后從每個(gè)子網(wǎng)絡(luò)中選擇評價(jià)指標(biāo)最低的節(jié)點(diǎn)作為牽制節(jié)點(diǎn),使得在每個(gè)時(shí)刻所有節(jié)點(diǎn)都能夠直接或間接的收到偽領(lǐng)導(dǎo)者的反饋信息,最終整個(gè)網(wǎng)絡(luò)能夠達(dá)到連通的目的.圖1(b)為智能體網(wǎng)絡(luò)在某時(shí)刻切換之后的拓?fù)浣Y(jié)構(gòu),從該拓?fù)浣Y(jié)構(gòu)可以看出當(dāng)出現(xiàn)新的子網(wǎng)絡(luò),則根據(jù)動態(tài)牽制策略,從每個(gè)新的子網(wǎng)絡(luò)中再選出一個(gè)節(jié)點(diǎn)作為牽制節(jié)點(diǎn),以此來保證整個(gè)網(wǎng)絡(luò)的連通性,圖中三角形表示新的牽制節(jié)點(diǎn).

3 控制輸入的設(shè)計(jì)

控制的目的為使多智能體系統(tǒng)(1)能夠達(dá)到蜂擁狀態(tài),根據(jù)前面得到的結(jié)論,偽領(lǐng)導(dǎo)者的控制輸入定義如下:u1=(-ξ21q1+v1)/ζ2.

(3)

其中第1項(xiàng)表示偽領(lǐng)導(dǎo)者的狀態(tài)反饋項(xiàng),第2項(xiàng)v1表示偽領(lǐng)導(dǎo)者的協(xié)作控制項(xiàng),v1定義如下形式:

每個(gè)智能體i的控制輸入定義如下:ui=(wi+vi)/ζ2,i=2,…,n

(5)

其中第1項(xiàng)wi為智能體i的狀態(tài)反饋項(xiàng),第2項(xiàng)vi為智能體i的協(xié)作控制項(xiàng).設(shè)計(jì)控制輸入的目的是使所有智能體的速度達(dá)到一致且智能體之間不會發(fā)生碰撞.為了達(dá)到該目的,第1項(xiàng)wi可以考慮如下形式:

wi=-ξ21qi.

(6)

第2項(xiàng)vi可以考慮如下形式:

(7)

其中c1,c2>0,q1和p1分別是偽領(lǐng)導(dǎo)者的位置和速度向量,v1是偽領(lǐng)導(dǎo)者的協(xié)作控制項(xiàng),由于偽領(lǐng)導(dǎo)者受到它周圍智能體的影響,所以它的速度是隨時(shí)間變化的,因此式(7)中加入了偽領(lǐng)導(dǎo)者的協(xié)作控制輸入部分.如果第i個(gè)智能體是牽制節(jié)點(diǎn),則hi(t)=1,否則hi(t)=0.勢函數(shù)ψα(z)和鄰接矩陣A(t)=(aij(t))n×n的表達(dá)式已在文獻(xiàn)[10]中給出.每個(gè)智能體在t時(shí)刻的鄰域定義為:Ni(t)={j∈V|‖qj(t)-qi(t)‖σ

為了使矩陣X和Y里的元素取的更廣泛,在每個(gè)智能體的控制輸入當(dāng)中都加入了wi=-ξ21qi項(xiàng),如果定義wi=0,則可以得到矩陣X中的元素必須滿足ξ11=ξ21=0,這使得矩陣X中的元素取值范圍變得非常小,并且該條件也包含在假設(shè)里面.總之,取wi=-ξ21qi好于wi=0.

式(3)~(7)可以寫成統(tǒng)一形式:

其中i=1,2,…,n且如果i=1,則δi=1;否則δi=0.

假設(shè)1多智能體網(wǎng)絡(luò)中每個(gè)智能體的動力學(xué)方程中矩陣(X,Y)滿足以下條件:ζ2ξ11-ζ1ξ21=0.

基于以上假設(shè),動力學(xué)方程(9)可以改寫為以下形式:

4 算法的穩(wěn)定性分析

為了給出蜂擁控制算法在控制輸入(8)下的穩(wěn)定性分析,定義系統(tǒng)的總能量函數(shù)如下:

并且得到以下結(jié)論.

定理1n個(gè)智能體的運(yùn)動方程由式(1)給出,并且用式(8)控制每個(gè)智能體.假如初始能量Q0=Q(t0)有限,并且ξ12,ξ22,ζ1和ζ2取合適的值使得μ1>0,μ2≥0和μ3≤0,則所有智能體的速度逐漸達(dá)到一致并且智能體之間不會發(fā)生碰撞.

證明t1,t2,…表示一系列拓?fù)淝袚Q時(shí)刻,并且在每兩個(gè)連續(xù)的切換時(shí)刻[ty,ty+1),y=0,1,…內(nèi)網(wǎng)絡(luò)G(t)的拓?fù)浣Y(jié)構(gòu)是不變的,由于拓?fù)浣Y(jié)構(gòu)的切換性,總能量函數(shù)Q(t)在切換時(shí)刻是不連續(xù)的,但在每個(gè)[ty,ty+1),y=0,1,…內(nèi)是可微的.

且式(11)可以改寫為

(14)

由勢函數(shù)和鄰接矩陣的對稱性,總能量函數(shù)Q(t)求關(guān)于時(shí)間t的導(dǎo)數(shù),可以得到:

其中Hk(t)∈Rρk(t)×ρk(t)是第k個(gè)連通子網(wǎng)絡(luò)對應(yīng)的對角矩陣,如果第i(1≤i≤ρk(t))智能體是牽制節(jié)點(diǎn),則Hk(t)的第i對角元素是1,否則Hk(t)的第i對角元素是0.

下面給出每個(gè)智能體之間避免碰撞的證明.首先在第1個(gè)時(shí)間區(qū)間[t0,t1)內(nèi)討論智能體之間的碰撞問題.假設(shè)Q0=Q(t0)<ψα(0),可以得到在t∈[t0,t1)時(shí)刻Q(t)≤Q0<ψα(0),如果存在某個(gè)時(shí)刻ts∈[t0,t1)使得兩個(gè)不同的智能體k和智能體l在時(shí)刻ts發(fā)生碰撞,即qk(ts)=ql(ts),則有

5 數(shù)值模擬結(jié)果與討論

本文模擬了n=30個(gè)智能體在控制輸入(8)的影響下在2維平面上運(yùn)動.30個(gè)智能體的初始位置和初始速度分別由區(qū)間[0,20]×[0,20]和[-1,1]×[-1,1]隨機(jī)生成.每個(gè)智能體的感應(yīng)半徑為r=4,c1=0.3,c2=0.5,其它參數(shù)定義如文獻(xiàn)[10]所示.在動力學(xué)方程(1)中矩陣X和Y取值為

圖2給出了30智能體網(wǎng)絡(luò)的初始拓?fù)浣Y(jié)構(gòu)最終拓?fù)浣Y(jié)構(gòu).在圖2中,實(shí)心圓點(diǎn)表示牽制節(jié)點(diǎn),空心圓點(diǎn)表示非牽制節(jié)點(diǎn),正方形表示偽領(lǐng)導(dǎo)者的位置,直線表示智能體之間的鄰域關(guān)系,箭頭表示智能體的速度方向及大小.從圖2(a)可以看出初始網(wǎng)路有很高的不連通性.通過本文算法,所有的智能體網(wǎng)絡(luò)連通且速度達(dá)到一致并且與偽領(lǐng)導(dǎo)者的速度一樣(圖2(b)).

圖2 30個(gè)智能體初始和最終拓?fù)浣Y(jié)構(gòu)圖

圖3(a)給出了所有智能體的運(yùn)動軌跡,可以清楚地看到每個(gè)智能體之間保持相對固定的距離并且所有智能體以相同的速度移動.圖3(b)給出了本文算法前10s內(nèi)的牽制節(jié)點(diǎn)變化及數(shù)量,很容易看到牽制節(jié)點(diǎn)個(gè)數(shù)隨著時(shí)間的增長而下降.但是在某些時(shí)刻會出現(xiàn)牽制節(jié)點(diǎn)個(gè)數(shù)增長情況,這是因?yàn)橹悄荏w網(wǎng)絡(luò)拓?fù)溲莼^程中有新的第2類非牽制節(jié)點(diǎn)出現(xiàn),為了能夠把第2類非牽制節(jié)點(diǎn)轉(zhuǎn)換成第1類非牽制節(jié)點(diǎn),需要重新選擇牽制節(jié)點(diǎn),這會導(dǎo)致牽制節(jié)點(diǎn)的增長.隨著多智能體網(wǎng)絡(luò)漸進(jìn)蜂擁過程中,所有智能體逐漸調(diào)整它們的位置到期望距離并且漸漸調(diào)整它們的速度與偽領(lǐng)導(dǎo)者一樣,這會減少第2類非牽制節(jié)點(diǎn)的出現(xiàn)且最終整個(gè)網(wǎng)絡(luò)達(dá)到連通.圖3(c)顯示了所有智能體的平均速度與偽領(lǐng)導(dǎo)者速度的誤差,很顯然該誤差逐漸趨于零,這說明所有智能體的速度與偽領(lǐng)導(dǎo)者的速度一樣,得到的模擬結(jié)果與定理1中的理論結(jié)果一致.

圖3 30個(gè)智能體的蜂擁控制模擬結(jié)果

6 結(jié)語

本文給出了一種新的動態(tài)牽制蜂擁控制算法,使一群智能體跟隨偽領(lǐng)導(dǎo)者達(dá)到蜂擁,并且考慮每個(gè)智能體的動力學(xué)方程為更一般形式的二階系統(tǒng).首先從整個(gè)多智能體網(wǎng)絡(luò)中選擇評價(jià)指標(biāo)最低的智能體作為多智能體網(wǎng)絡(luò)的偽領(lǐng)導(dǎo)者,之后在每個(gè)拓?fù)淝袚Q時(shí)刻,把除去偽領(lǐng)導(dǎo)者以外的多智能體網(wǎng)絡(luò)分成若干個(gè)連通子網(wǎng)絡(luò),每個(gè)連通子網(wǎng)絡(luò)中選擇評價(jià)指標(biāo)最低的節(jié)點(diǎn)作為牽制節(jié)點(diǎn),即能夠收到偽領(lǐng)導(dǎo)者的反饋信息,從而實(shí)現(xiàn)蜂擁控制.同時(shí)給出了算法的穩(wěn)定性分析,并得到所有智能體的速度逐漸達(dá)到一致且智能體之間不會發(fā)生碰撞.

猜你喜歡
控制算法領(lǐng)導(dǎo)者時(shí)刻
冬“傲”時(shí)刻
捕獵時(shí)刻
基于ARM+FPGA的模塊化同步控制算法研究
閉目塞聽,才是領(lǐng)導(dǎo)者的第一大忌
真誠是領(lǐng)導(dǎo)者的最高境界
街拍的歡樂時(shí)刻到來了
一種優(yōu)化的基于ARM Cortex-M3電池組均衡控制算法應(yīng)用
金圣節(jié)能清凈劑 節(jié)能減排領(lǐng)導(dǎo)者
汽車零部件(2014年1期)2014-09-21 11:58:39
一天的時(shí)刻
一種非圓旋轉(zhuǎn)工件支撐裝置控制算法
山东| 麻栗坡县| 漳州市| 宜宾市| 青岛市| 阿鲁科尔沁旗| 南靖县| 寻甸| 金堂县| 稷山县| 成都市| 清徐县| 日照市| 长宁县| 泸水县| 安塞县| 丰宁| 手机| 台中市| 河北省| 喀喇沁旗| 修水县| 仪征市| 集安市| 营口市| 泰州市| 广西| 麟游县| 都江堰市| 米易县| 昌黎县| 县级市| 钦州市| 长白| 北票市| 名山县| 壶关县| 香格里拉县| 泰州市| 武汉市| 镇江市|