李 楊,徐 峰,謝光強(qiáng),黃向龍
LI Yang,XU Feng,XIE Guangqiang,HUANG Xianglong
廣東工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,廣州 510006
School of Computing,Guangdong University of Technology,Guangzhou 510006,China
多智能體技術(shù)(multi-agent technology)的應(yīng)用研究起源于20世紀(jì)80年代并在90年代中期獲得了廣泛的認(rèn)可,發(fā)展至今,已然成為分布式人工智能(Distributed Artificial Intelligence)領(lǐng)域中的一個(gè)熱點(diǎn)話題,其智能性主要體現(xiàn)在感知、規(guī)劃、推理、學(xué)習(xí)以及決策等方面。多智能體系統(tǒng)(multi-agent system)的目標(biāo)是讓若干個(gè)具備簡單智能卻便于管理控制的系統(tǒng)能通過相互協(xié)作實(shí)現(xiàn)復(fù)雜智能[1],使得在降低系統(tǒng)建模復(fù)雜性的同時(shí),提高系統(tǒng)的魯棒性、可靠性、靈活性。目前,采用智能體技術(shù)的多智能體系統(tǒng)已經(jīng)廣泛應(yīng)用于交通控制、智能電網(wǎng)、生產(chǎn)制造、無人機(jī)控制等眾多領(lǐng)域。
智能體(Agent)是處于某個(gè)特定的環(huán)境下的計(jì)算機(jī)系統(tǒng),該系統(tǒng)可以根據(jù)自身對(duì)環(huán)境的感知,按照已有的知識(shí)或者通過自主學(xué)習(xí),并與其他智能體進(jìn)行溝通協(xié)作,在其所處的環(huán)境自主地完成設(shè)定的目標(biāo)。通常,單個(gè)智能體求解問題的能力通常是十分有限的,但是將多個(gè)自治的智能體組合起來協(xié)作求解某些問題的能力通常很強(qiáng)大。多智能體系統(tǒng)就是指可以相互協(xié)作的多個(gè)簡單智能體為完成某些全局或者局部目標(biāo)使用相關(guān)技術(shù)組成的分布式智能系統(tǒng)[2],其中,多智能體技術(shù)在構(gòu)建多智能體系統(tǒng)中充當(dāng)至關(guān)重要的作用。多智能體系統(tǒng)提供一種新的方法來控制大規(guī)模分布式和自適應(yīng)復(fù)雜系統(tǒng),如過程控制、智能人機(jī)交互、分布式計(jì)算。目前多智能體系統(tǒng)主要研究兩個(gè)方面:(1)如何利用該技術(shù)建立一個(gè)靈活、可擴(kuò)展的軟硬件系統(tǒng);(2)如何利用該技術(shù)進(jìn)行建模[3]。
多智能體系統(tǒng)的主要具有以下的特點(diǎn):
(1)自主性。在多智能體系統(tǒng)中,每個(gè)智能體都能管理自身的行為并做到自主的合作或者競爭。
(2)容錯(cuò)性。智能體可以共同形成合作的系統(tǒng)用以完成獨(dú)立或者共同的目標(biāo),如果某幾個(gè)智能體出現(xiàn)了故障,其他智能體將自主地適應(yīng)新的環(huán)境并繼續(xù)工作,不會(huì)使整個(gè)系統(tǒng)陷入故障狀態(tài)。
(3)靈活性和可擴(kuò)展性。MAS系統(tǒng)本身采用分布式設(shè)計(jì),智能體具有高內(nèi)聚低耦合的特性,使得系統(tǒng)表現(xiàn)出極強(qiáng)的可擴(kuò)展性。
(4)協(xié)作能力。多智能體系統(tǒng)是分布式系統(tǒng),智能體之間可以通過合適的策略相互協(xié)作完成全局目標(biāo)。
從20世紀(jì)70年代出現(xiàn)分布式人工智能后,早期的研究人員主要將研究重心放在分布式問題求解(Distributed Problem-Solving Systems)中,試圖在系統(tǒng)設(shè)計(jì)階段便確定系統(tǒng)行為,對(duì)每個(gè)智能體預(yù)先設(shè)定各自的行為。但這種封閉性和確定性的設(shè)計(jì)理念使得系統(tǒng)的自適應(yīng)性、魯棒性和靈活性等方面表現(xiàn)不足,限制了DAI的工程應(yīng)用[4]。20世紀(jì)80年代,研究人員逐漸將重心轉(zhuǎn)移到多智能體系統(tǒng),在智能體分析建模上不再基于確定行為的假設(shè),Rao在Bratman的哲學(xué)思想的基礎(chǔ)上提出了面向智能體的BDI(Belief-Desire-Intention)模型,使用信念-愿望-意圖哲學(xué)思想描述智能體的思維狀態(tài)模型,刻畫了最初的MAS系統(tǒng)智能體的行為分析,提高了智能體的推理和決策能力。與此同時(shí),相關(guān)研究學(xué)者為了解決傳統(tǒng)的分布式問題求解領(lǐng)域無法很好地對(duì)社會(huì)系統(tǒng)進(jìn)行建模等相關(guān)問題,也將注意力集中在智能體社會(huì)群體屬性上,從開放的分布式人工智能角度出發(fā),重點(diǎn)研究多智能體的協(xié)商和規(guī)劃方式,如G.Zlotkin和J.Rosenechein提出的基于對(duì)策論的協(xié)商策略,使得各智能體在僅擁有局部信息的前提下依舊可以進(jìn)行沖突消除,麻省理工大學(xué)的S.E.Conry等人提出的多級(jí)協(xié)商協(xié)議同樣是使用局部信息對(duì)非局部狀態(tài)的影響進(jìn)行推理,以適應(yīng)環(huán)境的改變。
伴隨著多智能體技術(shù)在無線傳感器濾波、生物醫(yī)學(xué)、無人機(jī)編隊(duì)控制等各領(lǐng)域的深入應(yīng)用,該技術(shù)也遇到了諸多瓶頸,例如對(duì)復(fù)雜系統(tǒng)建模規(guī)模的過程引入龐大的智能體數(shù)量而引起的通信代價(jià)過大實(shí)時(shí)性不夠等問題,而當(dāng)系統(tǒng)本身的計(jì)算資源和存儲(chǔ)資源極度受限下的情況下,如何保證智能體之間的正常協(xié)作規(guī)劃也是一個(gè)具有挑戰(zhàn)的問題。近年來,為了克服這些局限,研究學(xué)者們?cè)谟?jì)算機(jī)軟硬件發(fā)展的大趨勢(shì)下,提出了大量的研究成果,取得了許多突破性的進(jìn)展,主要體現(xiàn)在如下方面。
近十幾年來,由于集群控制領(lǐng)域,如無人機(jī)控制領(lǐng)域、水下協(xié)同作業(yè)和機(jī)器人編隊(duì)控制等相關(guān)領(lǐng)域的發(fā)展,一致性問題逐漸成為廣泛學(xué)者的關(guān)注的重點(diǎn),不同類型的多智能體一致性協(xié)議體現(xiàn)了多智能體技術(shù)在各領(lǐng)域應(yīng)用中的不同需求。大量的學(xué)者針對(duì)不同的應(yīng)用場(chǎng)景提出了許多衍生的一致性協(xié)議,在本文中,將選取工程應(yīng)用中常需要考慮的帶時(shí)滯一致性、有限時(shí)間一致性和領(lǐng)導(dǎo)者跟隨者一致性問題展開討論。
2.1.1 帶時(shí)滯的一致性問題研究
通信是多智能體協(xié)作的重要基礎(chǔ),但在實(shí)際的應(yīng)用過程中,由于控制器性能、網(wǎng)絡(luò)帶寬及傳輸信道的差異通常會(huì)使得系統(tǒng)網(wǎng)絡(luò)出現(xiàn)各種不理想狀況,按照網(wǎng)絡(luò)影響因素的不同可將一致性研究約束劃分為[5]:通信時(shí)滯、輸入時(shí)滯、測(cè)量噪聲、數(shù)據(jù)丟包、量化誤差。其中,通信時(shí)滯在工程應(yīng)用中最為常見,也是影響系統(tǒng)穩(wěn)定的關(guān)鍵因素之一,如無線傳感器網(wǎng)絡(luò)信息融合中的網(wǎng)絡(luò)信道時(shí)延、水下協(xié)同作業(yè)的傳輸介質(zhì)時(shí)延等。研究通信時(shí)滯對(duì)系統(tǒng)收斂性的影響是多智能體技術(shù)在工程中應(yīng)用的重要基礎(chǔ),接下來重點(diǎn)闡述各階系統(tǒng)在通信時(shí)滯下的一致性問題。
在一階多智能體系統(tǒng)中,Olfati-Saber等人[6]較早地對(duì)有向固定拓?fù)?、有向切換拓?fù)湟约盁o向網(wǎng)絡(luò)在帶時(shí)滯情況下對(duì)其收斂性進(jìn)行分析,得出一階固定無向網(wǎng)絡(luò)在時(shí)滯條件下智能體收斂到平均一致的充要條件,當(dāng)時(shí)滯不超過一定的上限閾值時(shí),系統(tǒng)仍能保持穩(wěn)定。隨后,Lin等人[7]在具有時(shí)滯的聯(lián)合連通拓?fù)涠A多智能體系統(tǒng)中利用線性矩陣不等式(LMIs)得到系統(tǒng)平均一致性的充分條件。Zhang等人[8]將包含噪音、時(shí)變時(shí)滯以及數(shù)據(jù)包丟失的二階多智能體通信網(wǎng)絡(luò)中引入排隊(duì)機(jī)制,使得該智能體系統(tǒng)被建模成具有隨機(jī)切換拓?fù)涞墓潭〞r(shí)滯系統(tǒng),并得出系統(tǒng)均方魯棒一致性的充要條件。在研究高階集群系統(tǒng)時(shí),Xi等人[9]利用狀態(tài)空間分解法將具有時(shí)變時(shí)滯和高階群集系統(tǒng)狀態(tài)空間分解為一致子空間和互補(bǔ)一致子空間,將高階系統(tǒng)一致性問題轉(zhuǎn)化為不帶時(shí)滯和外部干擾多個(gè)子系統(tǒng)同時(shí)穩(wěn)定的問題,并在此基礎(chǔ)上給出了具有時(shí)變時(shí)滯高階系統(tǒng)一致性函數(shù)的顯式表達(dá)式,同時(shí),Zhou等人[10]證明在已知時(shí)滯的情況下,可以利用全狀態(tài)反饋和基于觀測(cè)器的輸出反饋控制協(xié)議解決任意大有界時(shí)滯的一致性問題,此外,王振華等人[11]在閉左半平面的高階多智能體系統(tǒng)中給出了與時(shí)滯無關(guān)和與時(shí)滯相關(guān)的兩種趨同條件,并揭示了智能體系統(tǒng)結(jié)構(gòu)、通信時(shí)滯和網(wǎng)絡(luò)拓?fù)涞年P(guān)系。而在擴(kuò)展到非線性多智能體系統(tǒng)時(shí),Chen等人[12]使用Lyapunov-Krasovskii函數(shù)和Young不等式消除時(shí)滯的影響并引入魯棒控制項(xiàng)處理外部干擾,設(shè)計(jì)出基于神經(jīng)網(wǎng)絡(luò)的分布式自適應(yīng)魯棒控制協(xié)議獲得非線性多智能體系統(tǒng)在外部噪聲和時(shí)間延遲下的一致性。但是隨后,Wang等人[13]指出了Chen所使用的技術(shù)將會(huì)導(dǎo)致分布式控制算法中的奇異性,進(jìn)一步提出使用σ函數(shù)以克服該技術(shù)的局限性。此外,國內(nèi)的明平松等人[14]在隨機(jī)時(shí)滯多智能體一致性研究上展開了詳細(xì)的總結(jié)和梳理。
2.1.2 有限時(shí)間一致性問題研究
多智能體一致性按照收斂速度可劃分為漸進(jìn)時(shí)間一致性、有限時(shí)間一致性和限定時(shí)間一致性。相比漸進(jìn)時(shí)間一致性,有限時(shí)間一致性需要系統(tǒng)狀態(tài)在某一限定時(shí)間內(nèi)收斂到某一范圍內(nèi),使得系統(tǒng)更快實(shí)現(xiàn)一致同步。許多實(shí)時(shí)控制的應(yīng)用場(chǎng)合對(duì)收斂速度的要求都比較高,特別是控制領(lǐng)域,所以研究有限時(shí)間一致性更具有工程意義。而相比于有限時(shí)間一致性,使系統(tǒng)在固定時(shí)間內(nèi)收斂的限定時(shí)間一致性的相關(guān)研究目前尚處于起步階段,因此,接下來重點(diǎn)對(duì)有限時(shí)間一致性的技術(shù)發(fā)展進(jìn)行闡述。
在2006年,借助連續(xù)系統(tǒng)和非連續(xù)系統(tǒng)的有限時(shí)間穩(wěn)定性理論,Cortés[15]在非平滑穩(wěn)定性分析的基礎(chǔ)上,率先提出非平滑梯度流在有限時(shí)間一致性協(xié)議,能保證一階離散多智能體系統(tǒng)在有限時(shí)間能達(dá)到收斂范圍。Wang等人[16]將有限時(shí)間的控制思想擴(kuò)展到具有單積分器動(dòng)力學(xué)的多智能體系統(tǒng)中,提出了基于連續(xù)狀態(tài)反饋的一階多智能體系統(tǒng)有限時(shí)間控制模型,并將有限時(shí)間李雅普諾夫穩(wěn)定理論應(yīng)用到有限時(shí)間一直性理論和分析中。隨后,基于李雅普諾夫方法和齊次性,Wang和Hong[17]進(jìn)一步提出面向二階多智能體網(wǎng)絡(luò)的有限時(shí)間一致性協(xié)議,該協(xié)議保證系統(tǒng)在有限時(shí)間內(nèi)實(shí)現(xiàn)一致。與此同時(shí),Cao等人[18]提出分散滑模估計(jì)器實(shí)現(xiàn)一階和二階的多自主車輛在有限時(shí)間編隊(duì)跟蹤。Li等人[19]在Wang和Hong研究的基礎(chǔ)上針對(duì)二階無領(lǐng)導(dǎo)多智能體系統(tǒng)提出基于加冪積分方法設(shè)計(jì)出基于連續(xù)有限時(shí)間一致性協(xié)議,能使系統(tǒng)在無干擾下實(shí)現(xiàn)有限時(shí)間的狀態(tài)一致,并能在有干擾情況下實(shí)現(xiàn)任意兩個(gè)智能體之間的穩(wěn)態(tài)誤差均能在有限時(shí)間達(dá)到一個(gè)區(qū)域。而Sun等人[20]研究由一階和二階智能體組成混合階數(shù)的異構(gòu)多智能體系統(tǒng)有限時(shí)間一致性問題,并得出切換拓?fù)浜凸潭ㄍ負(fù)湎掠邢迺r(shí)間一致性的一些充分條件。Du等人[21]將遞歸設(shè)計(jì)方法與加冪積分技術(shù)融合,使用遞歸方式構(gòu)建李雅普諾夫函數(shù),進(jìn)而提出基于鄰居的分布式高階有限時(shí)間一致性協(xié)議,使領(lǐng)導(dǎo)-追隨者系統(tǒng)能實(shí)現(xiàn)有限時(shí)間一致而不需要領(lǐng)導(dǎo)者的速度信息。另一個(gè)角度,Zhou等人[22]將非均勻控制方法與加冪積分技術(shù)融合,通過設(shè)計(jì)有限時(shí)間觀測(cè)器,構(gòu)建出基于輸出反饋的高階多智能體有限時(shí)間一致性協(xié)議。在非線性系統(tǒng)研究中,Zuo等人[23]利用李雅普諾夫函數(shù)構(gòu)造無向網(wǎng)絡(luò)的魯棒有限時(shí)間一致性協(xié)議,并證明該協(xié)議的收斂時(shí)間在任何初始條件下均有上界。Defoort等人[24]在Zuo的基礎(chǔ)上推導(dǎo)出一些條件選擇一階非線性系統(tǒng)的控制器增益,使得系統(tǒng)無論在何種初始條件下,均可在限定時(shí)間內(nèi)收斂,達(dá)成限定時(shí)間一致性。
蔣國平等人[25]就國內(nèi)外基于收斂速度的多智能體一致性研究進(jìn)行了詳細(xì)的總結(jié)及分析。
近年來,有限時(shí)間一致性研究已經(jīng)擴(kuò)展到了許多特定領(lǐng)域的應(yīng)用中,如異構(gòu)多智能體控制研究[26]、跟蹤控制研究[27]等,但是在異構(gòu)多智能體的有限時(shí)間一致性、不匹配擾動(dòng)下的有限時(shí)間一致性以及限定時(shí)間一致性的相關(guān)研究均較少,值得學(xué)者們進(jìn)一步研究。
2.1.3 領(lǐng)導(dǎo)跟隨者一致性研究
領(lǐng)導(dǎo)跟隨者控制方法是多智能體系統(tǒng)協(xié)同控制一致性的重要方法,所以領(lǐng)導(dǎo)跟隨者一致性研究一直都是多智能體編隊(duì)控制研究的熱點(diǎn)。領(lǐng)導(dǎo)跟隨者一致性控制的控制目標(biāo)是多智能體系統(tǒng)內(nèi)的各個(gè)智能體通過不斷的衍化最終實(shí)現(xiàn)一致性,并且該一致狀態(tài)是系統(tǒng)內(nèi)一個(gè)或多個(gè)領(lǐng)導(dǎo)者的期望狀態(tài)。
從領(lǐng)導(dǎo)者數(shù)量角度來看,按照領(lǐng)導(dǎo)者的數(shù)量可以將多智能體系統(tǒng)分為單領(lǐng)導(dǎo)者系統(tǒng)和多領(lǐng)導(dǎo)者系統(tǒng),在僅具有較少智能體數(shù)量的系統(tǒng)中,單領(lǐng)導(dǎo)者設(shè)計(jì)會(huì)使得系統(tǒng)更開銷更小并且一致性收斂速度更快,然而在具有大量智能體的中大型系統(tǒng)中,相比于單領(lǐng)導(dǎo)者而言,多領(lǐng)導(dǎo)者的系統(tǒng)可以使得每個(gè)領(lǐng)導(dǎo)者負(fù)擔(dān)減小,能明顯降低系統(tǒng)的通信和計(jì)算負(fù)荷,但是多領(lǐng)導(dǎo)系統(tǒng)設(shè)計(jì)上更為復(fù)雜,需要確定系統(tǒng)協(xié)同的共同目標(biāo)。
由系統(tǒng)模型角度來看,領(lǐng)導(dǎo)跟隨者一致性研究依舊沿著線性一階、二階、高階到通用類型的思路進(jìn)行。Hong等人[28]在一階切換拓?fù)湎到y(tǒng)中研究單領(lǐng)導(dǎo)者追蹤一致性問題,為了使得跟隨者可以跟蹤速度時(shí)刻變化并且無法直接測(cè)量的領(lǐng)導(dǎo)者智能體,在每個(gè)跟隨者智能體控制器上設(shè)計(jì)基于鄰居的狀態(tài)估計(jì)規(guī)則,隨后,Hong等人[29]將領(lǐng)導(dǎo)者速度無法實(shí)時(shí)測(cè)量的問題擴(kuò)展到二階切換拓?fù)涠嘀悄荏w系統(tǒng)中,設(shè)計(jì)出具有二階分布式觀測(cè)器的追隨者智能體,并借助全局的Lyapunov函數(shù)證明了在嘈雜環(huán)境中也可以估計(jì)系統(tǒng)的跟蹤誤差。Peng等人[30]進(jìn)一步的在領(lǐng)導(dǎo)者速度無法實(shí)時(shí)測(cè)量的研究中考慮時(shí)變時(shí)延問題,利用Lyapunov-Krasovski函數(shù)分析出在領(lǐng)導(dǎo)者鄰接矩陣時(shí)不變和時(shí)變兩種情況下系統(tǒng)跟蹤誤差一致并最終有界的充分條件。Zhu等人[31]研究固定和切換拓?fù)?、非均勻時(shí)變時(shí)滯的二階多智能體領(lǐng)導(dǎo)跟隨者一致性問題,給出了固定拓?fù)湎聦?shí)現(xiàn)一致性的充要條件,并給出在假設(shè)領(lǐng)導(dǎo)者全局可達(dá)總周期足夠大的條件下實(shí)現(xiàn)一致性的充分條件。Ni等人[32]使用圖論、Riccati不等式和Lyapunov不等式研究高階線性多智能體的領(lǐng)導(dǎo)跟隨者一致性問題,詳細(xì)分析了單領(lǐng)導(dǎo)者一致性問題在固定和切換拓?fù)湎碌目刂茀f(xié)議與信息交互。Wen等人[33]在高階線性多智能體中研究跟隨者偶然丟失控制輸入的一致性問題,通過構(gòu)造切換拓?fù)湎碌腖yapunov函數(shù)以及M-矩陣?yán)碚?,給出了實(shí)現(xiàn)分布式一致性追蹤的充分條件。Sun等人[34]研究高階多智能體在未知干擾的條件下魯棒一致性跟蹤問題,提出一種連續(xù)魯棒狀態(tài)反饋控制算法,給出了半全局漸進(jìn)一致跟蹤的充分條件。Qin等人[35]基于靜態(tài)反饋控制器設(shè)計(jì)通用的線性多智能體系統(tǒng)中領(lǐng)導(dǎo)跟隨一致性協(xié)議。
目前,領(lǐng)導(dǎo)跟隨者一致性的相關(guān)研究主要集中在線性系統(tǒng),而帶領(lǐng)導(dǎo)者的非線性系統(tǒng)一致性問題研究相對(duì)較少。在實(shí)際應(yīng)用場(chǎng)景中,如機(jī)器人編隊(duì)控制中,智能體大多具有很強(qiáng)的非線性,所以面向非線性系統(tǒng)的領(lǐng)導(dǎo)跟隨者一致性研究也具有極其重要的實(shí)際意義。
在多智能體的協(xié)同控制中,智能體之間通常需要借助通信網(wǎng)絡(luò)頻繁的交換自身局部信息,傳統(tǒng)的網(wǎng)絡(luò)采樣控制方法時(shí)基于時(shí)間的周期采樣方式,而在事件觸發(fā)機(jī)制中控制器的采樣時(shí)刻由設(shè)計(jì)者定義的特定事件控制。周期性采樣方式是采用類似輪詢方式,控制器在某個(gè)間隔中交換自身的信息并更新相應(yīng)的控制輸出,對(duì)系統(tǒng)的計(jì)算和通信能力要求較高。但是在實(shí)際應(yīng)用過程中,特別是在無線傳感器網(wǎng)絡(luò)控制、嵌入式無人機(jī)協(xié)同控制等領(lǐng)域,存在網(wǎng)絡(luò)帶寬和計(jì)算節(jié)點(diǎn)資源相對(duì)有限等問題,資源開銷較小的事件觸發(fā)機(jī)制相比于時(shí)間觸發(fā)方式更能滿足這類型應(yīng)用的需求。
早期,?str?m等人[36]在一階單閉環(huán)反饋控制系統(tǒng)中研究事件觸發(fā)機(jī)制對(duì)控制效果的影響,控制器只有當(dāng)測(cè)量誤差超過某一設(shè)定值后才進(jìn)行采樣輸出,實(shí)驗(yàn)表明基于事件的觸發(fā)機(jī)制的控制效果優(yōu)于時(shí)間觸發(fā)機(jī)制。與此同時(shí),?rzén等人[37]在PID控制中采用事件觸發(fā)機(jī)制并進(jìn)行了雙容水箱控制實(shí)驗(yàn),證明了該機(jī)制能有效降低控制器使用率。隨后,為了解決微型控制器的調(diào)度穩(wěn)定性問題,Tabuada[38]依賴于控制器的反饋機(jī)制提出了基于確定性事件觸發(fā)的實(shí)時(shí)調(diào)度算法,研究如何在保證系統(tǒng)穩(wěn)定和收斂性的情況下,放寬對(duì)控制器更新頻率的要求。更進(jìn)一步,Dimarogonas等人[39]在Tabuada研究的基礎(chǔ)上提出了集中式、分布式事件觸發(fā)機(jī)制的一階多智能體系統(tǒng)一致性控制模型,這類的觸發(fā)事件定義為特定的測(cè)量誤差與狀態(tài)函數(shù)范數(shù)的比率,此外,還設(shè)計(jì)根據(jù)上一次控制器更新時(shí)刻的自身與鄰居狀態(tài)值共同確定下一次更新時(shí)間的自觸發(fā)式控制策略,在保證控制效果的同時(shí)有效地降低了智能體的通信與計(jì)算負(fù)荷。之后,大量的學(xué)者將事件觸發(fā)策略廣泛應(yīng)用于各協(xié)同控制領(lǐng)域,例如采樣數(shù)據(jù)一致性問題[40]、異構(gòu)多智能體協(xié)同問題[41]等。
值得一提的是,雖然基于事件觸發(fā)策略能有效降低智能體采樣頻率,但若是在很短時(shí)間內(nèi),事件條件被連續(xù)多次觸發(fā)后,便形成Zeno現(xiàn)象,導(dǎo)致控制器輸出不穩(wěn)定。如何確定事件觸發(fā)的最小時(shí)間間隔是該策略在應(yīng)用過程中的關(guān)鍵性問題之一。
多智能體技術(shù)常用來對(duì)復(fù)雜系統(tǒng)進(jìn)行建模,當(dāng)不具備任何實(shí)際經(jīng)驗(yàn)的情況下,面向多智能體的仿真平臺(tái)通常是研究人員探索復(fù)雜系統(tǒng)不可或缺的工具。但由于仿真系統(tǒng)規(guī)模龐大,智能體數(shù)量眾多,在仿真過程中需要大量的計(jì)算,若采用NetLogo等傳統(tǒng)的多智能體仿真平臺(tái),極易遇到計(jì)算瓶頸。近年,在分布式共享存儲(chǔ)、多核CPU(如Xeon Phi)、并行GPU等分布式硬件平臺(tái)日趨成熟的基礎(chǔ)上,研究人員將并行計(jì)算相關(guān)技術(shù)運(yùn)用在多智能體仿真中,提出PDMAS技術(shù)。PDMAS平臺(tái)一方面將多智能體建模中出現(xiàn)的龐大計(jì)算量分散到計(jì)算集群中各計(jì)算節(jié)點(diǎn)中,突破計(jì)算瓶頸,另一方面對(duì)仿真人員屏蔽底層的并行計(jì)算實(shí)現(xiàn)細(xì)節(jié),使得仿真人員在無需具備專業(yè)的并行編程能力的條件下依舊可以使用PDMAS平臺(tái)提供的接口進(jìn)行分布式并行仿真,降低MAS技術(shù)門檻。在串行MAS仿真平臺(tái)中,研究人員重點(diǎn)關(guān)注如何模擬智能體結(jié)構(gòu)、行為等方面,但向PDMAS過渡后,由分布式并行計(jì)算引入的負(fù)載均衡、智能體同步、關(guān)鍵路徑優(yōu)化等問題吸引了研究人員更多的注意力。近幾年出現(xiàn)具有代表性的PDMAS仿真平臺(tái)包括有:薩萊諾大學(xué)ISIS實(shí)驗(yàn)室設(shè)計(jì)的D-MASON、英國謝菲爾德大學(xué)設(shè)計(jì)的Flame和阿貢國家實(shí)驗(yàn)室設(shè)計(jì)的RepastHPC等。Rousset等人[42]詳細(xì)介紹了目前主流的PDMAS平臺(tái)并在性能方面對(duì)各仿真平臺(tái)進(jìn)行了全面的對(duì)比。
多智能體技術(shù)主要用于系統(tǒng)的控制決策,提高系統(tǒng)的魯棒性、可靠性、靈活性,因此幾乎所有涉及智能推理、規(guī)劃決策、協(xié)同控制等領(lǐng)域的相關(guān)問題均可以通過多智能體技術(shù)來處理,以下將主要介紹多智能體技術(shù)在工程技術(shù)領(lǐng)域的應(yīng)用。
伴隨著人工智能的發(fā)展,機(jī)器人控制領(lǐng)域也將有新的突破,目前,將具有強(qiáng)大感知推理能力的多智能體技術(shù)應(yīng)用于機(jī)器人控制領(lǐng)域已經(jīng)屢見不鮮,其中最具代表性的是將智能體技術(shù)融入到輔助機(jī)器人中提高單個(gè)機(jī)器人的語義理解和認(rèn)知能力,以及將多智能體一致性理論應(yīng)用到機(jī)器人編隊(duì)控制,用以提高多個(gè)機(jī)器人的協(xié)調(diào)協(xié)作能力。
3.1.1 智能輔助機(jī)器人的構(gòu)建
在設(shè)計(jì)智能輔助機(jī)器人中,工程師通常將研究重心放在如何讓智能機(jī)器人具備常識(shí)性的推理,具備與人類進(jìn)行平滑交流的能力。以家居智能為例,為了使得機(jī)器人可以更加主動(dòng)地使用自然語言與人進(jìn)行交流,并根據(jù)周圍環(huán)境情況輔助弱勢(shì)群體完成復(fù)雜的日常生活活動(dòng),Ayari等人[43]針對(duì)智能機(jī)器人無法主動(dòng)地輔助人類進(jìn)行復(fù)雜活動(dòng)的問題,在環(huán)境智能的基礎(chǔ)上提出將自然語言處理領(lǐng)域的NKRL(Narrative Knowledge Representation Language)融入到多智能體框架HARMS(Humans,software Agents,Robots,Machines and Sensors)的混合模型。該模型使智能機(jī)器人具備更強(qiáng)的上下文語境認(rèn)知能力,讓機(jī)器人具備更強(qiáng)的感知和思考的能力,讓智能設(shè)備和機(jī)器人為弱勢(shì)群體提供合適的輔助服務(wù)(如圖1[43])。Gemignani等人[44]在環(huán)境智能的基礎(chǔ)上研究機(jī)器人系統(tǒng)的新式語義映射,通過人機(jī)交互的機(jī)制讓機(jī)器人自主學(xué)習(xí),并結(jié)合機(jī)器人當(dāng)前所處的環(huán)境,增強(qiáng)智能機(jī)器人對(duì)外界的認(rèn)知和推理決策能力。
圖1 機(jī)器人與弱勢(shì)群體交流
3.1.2 領(lǐng)導(dǎo)跟隨者一致性在機(jī)器人控制中的應(yīng)用
編隊(duì)控制的目的是使多個(gè)機(jī)器人達(dá)到理想的隊(duì)形并在此基礎(chǔ)上協(xié)作完成一些特定的任務(wù)。按是否含有隊(duì)形參考信息將編隊(duì)控制分為不含參考信息的編隊(duì)生成問題和含有參考信息的編隊(duì)跟蹤,其中,領(lǐng)導(dǎo)者跟隨者一致性理論常用于編隊(duì)跟蹤問題的相關(guān)研究上,在擁有領(lǐng)導(dǎo)者的機(jī)器人系統(tǒng)中,領(lǐng)導(dǎo)者機(jī)器人往往承擔(dān)接收系統(tǒng)輸入的任務(wù),而跟隨者機(jī)器人從領(lǐng)導(dǎo)者獲取信息,最終實(shí)現(xiàn)一致性編隊(duì)控制。
針對(duì)大規(guī)模編隊(duì)控制通信速度和帶寬限制,Ren等人[45]率先提出一種新的分布式領(lǐng)導(dǎo)跟隨者體系結(jié)構(gòu),該體系結(jié)構(gòu)允許包含任意數(shù)量的領(lǐng)導(dǎo)者以及跟隨者小組,在各智能體僅交換局部信息的條件下完成對(duì)組群的時(shí)變軌跡追蹤,實(shí)現(xiàn)分布式一致性編隊(duì)控制(如圖2[45])。隨后,Ren[46]還在固定領(lǐng)導(dǎo)下的有向固定網(wǎng)絡(luò)拓?fù)浜涂勺冾I(lǐng)導(dǎo)下的有向切換拓?fù)浣Y(jié)構(gòu)中分析了一致性跟蹤的收斂性。進(jìn)一步,在Ren的基礎(chǔ)上,Chen等人[47]在研究帶有攝像頭的非完整移動(dòng)機(jī)器人主從隊(duì)形生成問題上,設(shè)計(jì)出一種不帶距離狀態(tài)的視覺編隊(duì)形成策略,使得機(jī)器人在隊(duì)形生成時(shí)不需要進(jìn)行傳統(tǒng)的距離估計(jì),消除了估計(jì)誤差對(duì)控制的影響。與此同時(shí),徐志強(qiáng)等人[48]在群體機(jī)器人隊(duì)形一致性控制上,為了克服系統(tǒng)中的噪聲影響,將領(lǐng)導(dǎo)者和跟隨者劃分為多個(gè)子系統(tǒng),并為每個(gè)子系統(tǒng)設(shè)計(jì)獨(dú)立的一致協(xié)調(diào)控制器和觀測(cè)器。另一方面,為了避免無人機(jī)在運(yùn)動(dòng)過程中發(fā)生碰撞,Kuriki[49]設(shè)計(jì)基于人工勢(shì)場(chǎng)法的避免碰撞控制協(xié)議和一致性編隊(duì)控制算法,并分析一致性編隊(duì)控制算法的收斂性。張瑞雷等人[50]針對(duì)車式移動(dòng)機(jī)器人的編隊(duì)問題,利用反補(bǔ)法,構(gòu)造軌跡跟蹤的李雅普諾夫函數(shù),并通過使該函數(shù)負(fù)定來實(shí)現(xiàn)機(jī)器人編隊(duì)控制。
圖2 多機(jī)器人編隊(duì)控制
3.1.3 有限時(shí)間一致性在機(jī)器人控制中的應(yīng)用
在實(shí)際控制過程中,許多諸如機(jī)器人足球比賽,飛行器的軌跡跟蹤等實(shí)時(shí)控制場(chǎng)合對(duì)智能體系統(tǒng)狀態(tài)收斂速度提出了較高的要求,有限時(shí)間一致性的理論研究有效地提高了系統(tǒng)的這方面性能。
在帶領(lǐng)導(dǎo)者的多機(jī)器人有限時(shí)間一致性跟蹤控制中,針對(duì)輸入擾動(dòng)等問題,Khoo等人[51]通過修改系統(tǒng)誤差函數(shù)實(shí)現(xiàn)智能體之間相對(duì)狀態(tài)的分離,實(shí)現(xiàn)二階機(jī)器人系統(tǒng)的有限時(shí)間跟蹤控制。進(jìn)一步,Ou等人[52]在研究多個(gè)非完整輪式移動(dòng)機(jī)器人有限時(shí)間跟蹤的動(dòng)態(tài)模型中,提出將跟蹤動(dòng)態(tài)誤差轉(zhuǎn)化為每個(gè)移動(dòng)機(jī)器人內(nèi)的兩個(gè)子系統(tǒng),并分別在兩個(gè)子系統(tǒng)設(shè)計(jì)有限時(shí)間跟蹤控制協(xié)議。隨后,Ou等人[53]在非完整輪式移動(dòng)機(jī)器人的基礎(chǔ)上考慮基于視覺伺服的有限時(shí)間一致性跟蹤問題,針對(duì)具有未知攝像頭參數(shù)的移動(dòng)機(jī)器人設(shè)計(jì)跟蹤算法,使得移動(dòng)機(jī)器人群體可以在有限時(shí)間內(nèi)收斂到期望狀態(tài)。同時(shí),Zhang等人[54]使用級(jí)聯(lián)控制方法設(shè)計(jì)移動(dòng)機(jī)器人軌跡有限時(shí)間跟蹤控制算法,并在仿真中證實(shí)了該算法具有良好的收斂性。Cheng等人[55]在領(lǐng)導(dǎo)者跟隨者結(jié)構(gòu)下研究具有高階動(dòng)態(tài)模型的多個(gè)非完整輪式移動(dòng)機(jī)器人有限時(shí)間隊(duì)形生成問題,在積分滑??刂品椒ǖ幕A(chǔ)上設(shè)計(jì)出基于擾動(dòng)觀測(cè)器的有限時(shí)間反饋控制器。另一方面,Nair等人[56]提出一種基于積分滑模的有限時(shí)間事件觸發(fā)編隊(duì)控制策略,將新定義的測(cè)量誤差作為事件觸發(fā)的條件,并在先鋒P3-DX和火鳥VI機(jī)器人中證明了該策略能在編隊(duì)控制中避免Zeno現(xiàn)象,并提高系統(tǒng)的收斂速度以魯棒性。
3.1.4 帶時(shí)滯一致性在機(jī)器人控制中的應(yīng)用
隨著機(jī)器人控制策略的重心由集中式向分布式過渡,分散化的控制策略在極大地提高了系統(tǒng)的魯棒性及容錯(cuò)能力的同時(shí)也放大了時(shí)滯對(duì)系統(tǒng)收斂性的影響,為了減少時(shí)滯對(duì)系統(tǒng)控制效果的影響,保障系統(tǒng)穩(wěn)定運(yùn)行,研究人員提出許多不同的時(shí)滯解決方案。
Ding等人[57]設(shè)計(jì)出在時(shí)變時(shí)延和自時(shí)延條件下的領(lǐng)導(dǎo)跟隨者一致性協(xié)議,并使用李雅普諾夫函數(shù)和線性矩陣不等式證明當(dāng)時(shí)滯處于某一界限下,所有無人機(jī)節(jié)點(diǎn)均可以達(dá)到漸進(jìn)一致。李少斌等人[58]針對(duì)固定通信拓?fù)湎戮哂袝r(shí)變通信時(shí)滯的無人機(jī)系統(tǒng),提出分布式編隊(duì)控制算法,并以線性不等式的形式給出了系統(tǒng)穩(wěn)定的條件。同時(shí),郭偉強(qiáng)[59]在無人機(jī)編隊(duì)控制中給出了具有時(shí)變通信時(shí)滯的編隊(duì)一致性控制算法,最終在仿真實(shí)驗(yàn)中驗(yàn)證了該算法在帶時(shí)滯的環(huán)境下能夠使得誤差快速收斂。另一方面,魏瑞軒等人[60]針對(duì)復(fù)雜環(huán)境下無人機(jī)編隊(duì)重構(gòu)控制中存在通信時(shí)滯的問題,設(shè)計(jì)了基于信息濾波算法的信息補(bǔ)償方法解決因通信延遲帶來的信息不一致問題。
相對(duì)于眾多的帶時(shí)滯一致性理論的突破,該方面應(yīng)用在實(shí)際工程中的案例卻較少,在帶時(shí)滯的一致性問題上出現(xiàn)了較明顯的理論和應(yīng)用脫節(jié)現(xiàn)象。其中,導(dǎo)致這現(xiàn)象的重要原因在于不同的工程領(lǐng)域會(huì)有不同的環(huán)境條件。理論研究往往研究某一類問題的簡化模型,而工程應(yīng)用中的常出現(xiàn)多類型時(shí)滯、時(shí)變時(shí)滯、不確定時(shí)滯、噪聲干擾、通信節(jié)點(diǎn)不穩(wěn)定等混雜的苛刻條件,此外,將理論應(yīng)用于實(shí)際還需要考慮系統(tǒng)資源、通信成本等現(xiàn)實(shí)工程問題。
鑒于多智能體技術(shù)具自主性、反應(yīng)性、協(xié)作能力等特征,學(xué)者們嘗試將多智能體技術(shù)融入到無線傳感器網(wǎng)絡(luò)中,提高傳感器網(wǎng)絡(luò)的節(jié)點(diǎn)的濾波效果以及整體的信息處理能力。但是將多智能體技術(shù)應(yīng)用到僅擁有有限的計(jì)算和存儲(chǔ)資源嵌入式傳感器設(shè)備中并非易事,在部署無線傳感器網(wǎng)絡(luò)過程中,首要問題是如何降低智能體對(duì)物理資源的依賴。目前,克服該問題常見方法包括:設(shè)計(jì)基于事件觸發(fā)的采樣機(jī)制和優(yōu)化智能體結(jié)構(gòu)及其控制算法。
Dimarogonas等人[39]通過事件驅(qū)動(dòng)策略減少控制器的更新頻率及降低通信量,從而降低智能體對(duì)物理資源的依賴程度,Muldoon等人[61]使用基于Adopt和Max-Sum算法的多智能體分布式約束優(yōu)化算法,降低了無線傳感器網(wǎng)絡(luò)自組織和協(xié)調(diào)過程中對(duì)感測(cè)設(shè)備的性能及功率上的要求。在材料整合結(jié)構(gòu)健康和負(fù)荷監(jiān)測(cè)系統(tǒng)中,Bosse等人[62]使用自組織移動(dòng)多智能體系統(tǒng)和逆數(shù)值方法處理傳感器收集的數(shù)據(jù),考慮到傳感器資源有限,在采樣過程中采用事件觸發(fā)方式采樣而非周期采樣,只有當(dāng)特定傳感器的值發(fā)生顯著變化時(shí)才進(jìn)行全局采樣。另一方面,Chen等人[63]將事件觸發(fā)機(jī)制和二進(jìn)制一致性結(jié)合,并設(shè)定事件觸發(fā)條件為傳感器節(jié)點(diǎn)當(dāng)前和最后一次廣播的狀態(tài)誤差,降低了控制策略的能量損耗。Chelbi等人[64]無線傳感器網(wǎng)絡(luò)的信息路由協(xié)議研究中,提出動(dòng)態(tài)事件聚類路由協(xié)議,通過將某一區(qū)域的傳感器策略值進(jìn)行聚類,確定事件發(fā)生的可信度,避免不必要的信息傳遞。
多智能體相關(guān)技術(shù)主要被應(yīng)用于多智能體系統(tǒng)的協(xié)同控制和信息融合,故在設(shè)計(jì)復(fù)雜系統(tǒng)中,工程師常結(jié)合多智能體技術(shù)以解決實(shí)際中遇到的難題,提高系統(tǒng)各項(xiàng)性能。
在智能電網(wǎng)控制中,Cady等人[65]將有限時(shí)間一致性應(yīng)用于孤島交流微電網(wǎng)頻率調(diào)節(jié)的分布式控制體系中。Chen等人[66]針對(duì)分布式電力系統(tǒng)出現(xiàn)的時(shí)滯問題,提出基于帶時(shí)滯一致性的能源優(yōu)化調(diào)度算法。Zhou等人[67]結(jié)合事件觸發(fā)機(jī)制協(xié)調(diào)各節(jié)點(diǎn)間的有功功率,使得微電網(wǎng)間的關(guān)聯(lián)連接器數(shù)量大大減少。此外,多智能體技術(shù)還被應(yīng)用在航空航天控制[68]、工業(yè)生產(chǎn)[69]、故障診斷[70]、交通控制[71]、網(wǎng)絡(luò)負(fù)載均衡[72]等各個(gè)方面。
目前,多智能體在各領(lǐng)域應(yīng)用所面臨的主要問題包括:(1)多智能體技術(shù)與現(xiàn)有系統(tǒng)的兼容性問題;(2)多智能體分布式控制算法復(fù)雜,對(duì)設(shè)備的通信、計(jì)算等資源要求過高;(3)多智能體系統(tǒng)對(duì)復(fù)雜環(huán)境的抗干擾能力稍顯不足。
為進(jìn)一步提高多智能體的推理決策和協(xié)作控制能力,將該技術(shù)更廣泛的應(yīng)用于工程領(lǐng)域,今后的多智能體技術(shù)應(yīng)用研究方向重點(diǎn)集中在以下幾個(gè)方面:
(1)帶不匹配擾動(dòng)的有限時(shí)間一致性理論研究。目前有限時(shí)間一致性上的研究重點(diǎn)集中在匹配擾動(dòng)下的一階或二階有限時(shí)間一致性問題上,但是在無人機(jī)控制、軍事協(xié)同作戰(zhàn)和微電網(wǎng)控制等諸多領(lǐng)域上,系統(tǒng)工作中通常遇到不匹配擾動(dòng),極大地影響系統(tǒng)的收斂速度和穩(wěn)定性,因此不匹配擾動(dòng)下的有限時(shí)間一致性是這方面的未來的重點(diǎn)研究方向。
(2)多時(shí)滯一致性理論研究。在某些領(lǐng)域中,系統(tǒng)資源是相當(dāng)有限的,比如交通信號(hào)控制、無線傳感器網(wǎng)絡(luò)控制,通常存在物理資源緊缺、設(shè)備異構(gòu)等情況,導(dǎo)致系統(tǒng)出現(xiàn)諸如網(wǎng)絡(luò)通信不良、信息處理能力不對(duì)稱等問題,由此,難免會(huì)出現(xiàn)多種不同類型和不同大小的時(shí)滯,各智能體所受到的影響也各不相同。研究如何更好地處理多時(shí)滯以及不對(duì)稱時(shí)滯等問題將會(huì)是非常有意義的工作。
(3)多智能體技術(shù)兼容性的應(yīng)用研究。多智能體技術(shù)實(shí)際應(yīng)用中,為了降低系統(tǒng)部署成本,需要考慮該技術(shù)與當(dāng)前設(shè)備、裝置的兼容性問題。比如在生產(chǎn)制造領(lǐng)域中,企業(yè)通常希望能在不更換現(xiàn)有設(shè)備、裝置及生產(chǎn)線的條件下,提高企業(yè)的軟硬件生產(chǎn)系統(tǒng)工作的靈活性、通用性及可擴(kuò)展性。提高多智能體技術(shù)的兼容性是未來該技術(shù)在實(shí)際應(yīng)用中進(jìn)一步推廣的關(guān)鍵環(huán)節(jié)。
(4)面向融合技術(shù)的應(yīng)用研究。在多智能體技術(shù)在應(yīng)用的過程中,往往可以融合其他技術(shù)提高系統(tǒng)各項(xiàng)性能。如故障診斷中使用多分類器提高故障識(shí)別率,在生產(chǎn)制造過程中借助大數(shù)據(jù)處理技術(shù)為智能體決策尋求最優(yōu)解等。因此,多智能體技術(shù)和其他技術(shù)相融合是未來研究值得關(guān)注的一個(gè)方向。
多智能體技術(shù)是一直都是分布式人工智能領(lǐng)域中最重要的研究方向之一。在經(jīng)歷過去20年的多智能體技術(shù)高速發(fā)展時(shí)期后,如何結(jié)合實(shí)際的應(yīng)用背景構(gòu)建更加靈活、更具有適應(yīng)性的多智能體模型、如何降低多層次復(fù)雜系統(tǒng)的協(xié)作和溝通代價(jià)成為了現(xiàn)階段面臨的迫切任務(wù)。相信多智能體技術(shù)經(jīng)過不斷地研究和完善,將會(huì)在智能控制、智能家居、智能故障診斷等諸多前沿領(lǐng)域發(fā)揮著至關(guān)重要的推動(dòng)作用,進(jìn)一步推動(dòng)人工智能體的發(fā)展,為復(fù)雜系統(tǒng)的優(yōu)仿真和控制提供更高效的方法。
參考文獻(xiàn):
[1]劉金琨,爾聯(lián)潔.多智能體技術(shù)應(yīng)用綜述[J].控制與決策,2001,16(2):133-140.
[2]謝光強(qiáng),章云.多智能體系統(tǒng)協(xié)調(diào)控制一致性問題研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2011,28(6):2035-2039.
[3]He Yongjing,Wang Wei,Wu Xuezhi,et al.An overview of applications of MAS in smart distribution network with DG[C]//IEEE 2nd International Future Energy Electronics Conference,Taipei,China,2015:1-5.
[4]石純一,王克宏,王學(xué)軍,等.分布式人工智能進(jìn)展[J].模式識(shí)別與人工智能,1995(s1):76-96.
[5]曹劼.基于事件驅(qū)動(dòng)的網(wǎng)絡(luò)化多智能體系統(tǒng)的一致性問題研究[D].江蘇無錫:江南大學(xué),2016.
[6]Olfati-Saber R,Murray R M.Consensus problems in networks of agents with switching topology and timedelays[J].IEEE Transactions on Automatic Control,2004,49(9):1520-1533.
[7]Lin P,Jia Y.Consensus of a class of second-order multiagent systems with time-delay and jointly-connected topologies[J].IEEE Transactions on Automatic Control,2010,55(3):778-784.
[8]Zhang Y,Tian Y P.Consensus of data-sampled multi-agent systems with random communication delay and packet loss[J].IEEE Transactions on Automatic Control,2010,55(4):939-943.
[9]Xi J,Shi Z,Zhong Y.Consensus and consensualization of high-order swarm systems with time delays and external disturbances[J].Journal of Dynamic Systems Measurement&Control,2012,134(4):041011.
[10]Zhou B,Lin Z.Consensus of high-order multi-agent systems with large input and communication delays[M].[S.l.]:Pergamon Press Inc,2014.
[11]王振華,徐娟娟,張煥水.受未知通信時(shí)滯影響的高階多智能體系統(tǒng)的趨同[J].控制理論與應(yīng)用,2015,32(3):295-303.
[12]Chen C L P,Wen G X,Liu Y J,et al.Adaptive consensus control for a class of nonlinear multiagent time-delay systems using neural networks[J].IEEE Transactions on Neural Networks&Learning Systems,2014,25(6):1217-1226.
[13]Wang D,Ma H,Liu D.Distributed control algorithm for bipartite consensus of the nonlinear time-delayed multiagent systems with neural networks[M].[S.l.]:Elsevier Science Publishers B V,2016.
[14]明平松,劉建昌.隨機(jī)多智能體系統(tǒng)一致穩(wěn)定性分析[J].控制與決策,2016(3):385-393.
[15]Cortés J.Finite-time convergent gradient flows with applications to network consensus[J].Automatica,2006,42(11):1993-2000.
[16]Wang L,F(xiàn)eng X.Finite-time consensus problems for networks of dynamic agents[J].IEEE Transactions on Automatic Control,2010,55(4):950-955.
[17]Wang X,Hong Y.Finite-time consensus for multi-agent networks with second-order agent dynamics[J].IFAC Proceedings Volumes,2008,41(2):15185-15190.
[18]Cao Y,Ren W,Meng Z.Decentralized finite-time sliding mode estimators with applications to formation tracking[J].Systems&Control Letters,2010,59(9):522-529.
[19]Li S,Du H,Lin X.Finite-time consensus algorithm for multi-agent systems with double-integrator dynamics[J].Journal of Tianjin University of Technology,2013,47(8):1706-1712.
[20]Sun F,Zhu W.Finite-time consensus for heterogeneous multi-agent systems with mixed-order agents[J].International Journal of Systems Science,2015,46(11):1961-1970.
[21]Du H,Wen G,Chen G,et al.A distributed finite-time consensus algorithm for higher-order leaderless and leaderfollowing multiagent systems[J].IEEE Transactions on Systems Man&Cybernetics Systems,2017,47(7):1625-1634.
[22]Zhou Y,Yu X,Sun C,et al.Higher order finite-time consensus protocol for heterogeneous multi-agent systems[J].International Journal of Control,2015,88(2):285-294.
[23]Zuo Zongyu,Tie Lin.Distributed robust finite-time nonlinear consensus protocols for multi-agent systems[J].International Journal of Systems Science,2016,47(6):1366-1375.
[24]Defoort M,Polyakov A,Demesure G,et al.Leader-follower fixed-time consensus for multi-agent systems with unknown non-linear inherent dynamics[J].Control Theory&Applications Iet,2015,9(14):2165-2170.
[25]蔣國平,周映江.基于收斂速率的多智能體系統(tǒng)一致性研究綜述[J].南京郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2017,37(3):15-25.
[26]朱美玲,趙蕊,徐勇.異構(gòu)多智能體系統(tǒng)有限時(shí)間一致性分析[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(18):46-50.
[27]Zhao Y,Duan Z,Wen G,et al.Distributed finite-time tracking control for multi-agent systems:An observerbased approach[J].Systems&Control Letters,2013,62(1):22-28.
[28]Hong Yiguang,Hu Jiangping,Gao Linxin.Tracking control for multi-agent consensus with an active leader and variable topology[J].Automatica,2007,42(7):1177-1182.
[29]Hong Y,Chen G,Bushnell L.Distributed observers design for leader-following control of multi-agent networks[J].Automatica,2008,44(3):846-850.
[30]Peng K,Yang Y.Leader-following consensus problem with a varying-velocity leader and time-varying delays[J].Physica A Statistical Mechanics&Its Applications,2009,388(2):193-208.
[31]Zhu Wei,Cheng Daizhan.Leader-following consensus of second-order agents with multiple time-varying delays[J].Automatica,2010,46(12):1994-1999.
[32]Ni W,Cheng D.Leader-following consensus of multiagent systems under fixed and switching topologies[J].Systems&Control Letters,2010,59(3/4):209-217.
[33]Wen G,Hu G,Yu W,et al.Consensus tracking for higherorder multi-agent systems with switching directed topologies and occasionally missing control inputs[J].Systems&Control Letters,2013,62(12):1151-1158.
[34]Sun C,Hu G,Xie L.Robust consensus tracking for a class of high-order multi-agent systems[J].International Journal of Robust&Nonlinear Control,2016,26(3):578-598.
[35]Qin J,Yu C,Gao H.Coordination for linear multiagent systems with dynamic interaction topology in the leaderfollowing framework[J].IEEE Transactions on Industrial Electronics,2014,61(5):2412-2422.
[36] ?str?m K J,Bo B.Comparison of periodic and event based sampling for first order stochastic systems[J].Proceedings of Ifac World Congress,1999.
[37] ?rzén K E.A simple event-based PID controller[J].Proceedings of Ifac World Congress,1999.
[38]Tabuada P.Event-triggered real-time scheduling of stabilizing control tasks[J].IEEE Transactions on Automatic Control,2007,52(9):1680-1685.
[39]Dimarogonas V D,F(xiàn)razzoli E,Johansson K H.Distributed event-triggered control for multi-agent systems[J].IEEE Transactions on Automatic Control,2012,57(5):1291-1297.
[40]Guo G,Ding L,Han Q L.A distributed event-triggered transmission strategy for sampled-data consensus of multiagent systems[J].Automatica,2014,50(5):1489-1496.
[41]Hu W,Liu L.Cooperative output regulation of heterogeneous linear multi-agent systems by event-triggered control[J].IEEE Transactions on Cybernetics,2016,47(1):105-116.
[42]Rousset A,Herrmann B,Lang C,et al.A survey on parallel and distributed multi-agent systems for high performance computing simulations[J].Computer Science Review,2016,22:27-46.
[43]Ayari N,Chibani A,Amirat Y,et al.A semantic approach for enhancing assistive services in ubiquitous robotics[J].Robotics and Autonomous Systems,2016,75(SI):17-27.
[44]Gemignani G,Capobianco R,Bastianelli E,et al.Living with robots interactive environmental knowledge acquisition[J].Robotics and Autonomous Systems,2016,78:1-16.
[45]Ren W,Sorensen N.Distributed coordination architecture for multi-robot formation control[M].[S.l.]:North-Holland Publishing Co,2008.
[46]Ren W.Consensus tracking under directed interaction topologies:Algorithms and experiments[C]//American Control Conference,2008:742-747.
[47]Chen X,Jia Y.Adaptive leader-follower formation control of non-holonomic mobile robots using active vision[J].Control Theory&Applications Iet,2015,9(8):1302-1311.
[48]徐志強(qiáng),陳雪波.包含原理的群體機(jī)器人隊(duì)形一致協(xié)調(diào)控制[J].智能系統(tǒng)學(xué)報(bào),2015(2):301-306.
[49]Kuriki Y,Namerikawa T.Consensus-based cooperative formation control with collision avoidance for a multi-UAV system[C]//American Control Conference,2014:2077-2082.
[50]張瑞雷,李勝,陳慶偉.車式移動(dòng)機(jī)器人動(dòng)態(tài)編隊(duì)控制方法[J].機(jī)器人,2013,35(6):651-656.
[51]Khoo S,Xie L,Man Z.Robust finite-time consensus tracking algorithm for multirobot systems[J].IEEE/ASME Transactions on Mechatronics,2009,14(2):219-228.
[52]Ou M,Du H,Li S.Finite-time tracking control of multiple nonholonomic mobile robots[J].Journal of the Franklin Institute,2012,349(9):2834-2860.
[53]Ou M,Li S,Wang C.Finite-time tracking control for multiple non-holonomic mobile robots based on visual servoing[J].Asian Journal of Control,2014,16(3):2175-2188.
[54]Zhang Y,Liu G,Luo B.Finite-time cascaded tracking control approach for mobile robots[J].Information Sciences,2014,284:31-43.
[55]Cheng Y,Jia R,Du H,et al.Robust finite-time consensus formation control for multiple nonholonomic wheeled mobile robots via output feedback[J].International Journal of Robust&Nonlinear Control,2017(9).
[56]Nair R R,Behera L,Kumar S.Event-triggered finite-time integral sliding mode controller for consensus-based formation of multirobot systems with disturbances[J].IEEE Transactions on Control Systems Technology,2017,PP(99):1-9.
[57]Ding Y,Wei C,Bao S.Decentralized formation control for multiple UAVs based on leader-following consensus with time-varying delays[C]//Chinese Automation Congress,2014:426-431.
[58]李少斌,陳炎財(cái),楊忠,等.具有通信延遲的多無人機(jī)編隊(duì)飛行控制[J].信息與控制,2012,41(2):142-146.
[59]郭偉強(qiáng).基于一致性理論的無人機(jī)編隊(duì)控制器設(shè)計(jì)[D].哈爾濱:哈爾濱工業(yè)大學(xué),2013.
[60]魏瑞軒,茹常劍,祁曉明.通信延遲條件下無人機(jī)編隊(duì)重構(gòu)的自主安全控制[J].控制理論與應(yīng)用,2013,30(9):1099-1108.
[61]Muldoon C,O’hare G,O’grady M,et al.Distributed constraint optimisation for resource limited sensor networks[J].Science of Computer Programming,2013,78(5):583-593.
[62]Bosse S,Lechleiter A.A hybrid approach for structural monitoring with self-organizing multi-agent systems and inverse numerical methods in material-embedded sensor networks[J].Mechatronics,2016,34:12-37.
[63]Chen Z,Huang Y,Li D,et al.Event-triggered binary consensus in WSNs with fading channels[C]//Control Conference,2016:8360-8365.
[64]Chelbi S,Duvallet C,Abdouli M,et al.Event-driven wireless sensor networks based on consensus[C]//2016 IEEE/ACS 13th International Conference of Computer Systems and Applications,2016.
[65]Cady S T,Dominguez-garcia A D,Hadjicostis C N.Finite-time approximate consensus and its application to distributed frequency regulation in islanded AC microgrids[C]//Hawaii International Conference on System Sciences,2015:2664-2670.
[66]Chen G,Zhao Z.Delay effects on consensus-based distributed economic dispatch algorithm in microgrid[J].IEEE Transactions on Power Systems,2018,33(1):602-612.
[67]Zhou J,Zhang H,Sun Q,et al.Event-based distributed active power sharing control for interconnected AC and DC microgrids[J].IEEE Transactions on Smart Grid,2017(99).
[68]He X,Wang Q,Yu W.Finite-time distributed cooperative attitude tracking control for multiple rigid spacecraft[J].Applied Mathematics&Computation,2015,256:724-734.
[69]Leit?o P,Karnouskos S,Ribeiro L,et al.Smart agents in industrial cyber-physical systems[J].Proceedings of the IEEE,2016,104(5):1086-1101.
[70]Tian F,Yan Z,Bing X U,et al.Fault diagnosis based on multi agent system for active distribution system[J].Electric Power Automation Equipment,2016(6).
[71]Khamis M,Gomaa W.Adaptive multi-objective reinforcement learning with hybrid exploration for traffic signal control based on cooperative multi-agent framework[J].Engineering Applications of Artificial Intelligence,2014,29:134-151.
[72]Amelina N,F(xiàn)radkov A,Jiang Y,et al.Approximate consensus in stochastic networks with application to load balancing[J].IEEE Transactionson Information Theory,2015,61(4):1739-1752.