張虹
摘 要:火災(zāi)是發(fā)生最頻繁且極具破壞性的災(zāi)害之一,滅火機(jī)器人的廣泛應(yīng)用對其路徑規(guī)劃能力提出了更高的要求。本文提出一種利用多智能體系統(tǒng)建立一種有機(jī)有效的協(xié)作模型,使功能相對獨(dú)立的智能體能夠互相協(xié)作完成復(fù)雜的滅火任務(wù)的方法,以提高撲滅惡性火災(zāi)的能力。
關(guān)鍵詞:多智能體;協(xié)作;滅火機(jī)器人
近年來,火災(zāi)是發(fā)生最頻繁且極具破壞性的災(zāi)害之一,給國家財(cái)產(chǎn)和人員造成了難以計(jì)數(shù)的損失。滅火機(jī)器人屬于特種移動(dòng)機(jī)器人范疇,它作為特種消防設(shè)備可以替代消防隊(duì)員接近火災(zāi)現(xiàn)場實(shí)施有效的滅火救援作業(yè),開展各項(xiàng)火場偵察任務(wù),尤其是在危險(xiǎn)性大或消防隊(duì)員不易接近的場合,滅火機(jī)器人的應(yīng)用將大大提高消防部門撲滅惡性火災(zāi)的能力,對減少國家財(cái)產(chǎn)損失和滅火救援人員的傷亡具有重要的作用。滅火機(jī)器人集人工智能、信息處理、圖像處理、無線通訊等專業(yè)技術(shù)為一體,跨計(jì)算機(jī)、自動(dòng)控制、機(jī)械、電子等多學(xué)科,成為當(dāng)前移動(dòng)機(jī)器人研究的重點(diǎn)之一。目前,越來越多的滅火機(jī)器人己應(yīng)用到各種危險(xiǎn)場合,滅火機(jī)器人的廣泛應(yīng)用對其路徑規(guī)劃能力提出了更高的要求。傳統(tǒng)的移動(dòng)機(jī)器人基本上都采用專用處理器和專用操作系統(tǒng),這已不能滿足現(xiàn)代滅火機(jī)器人的發(fā)展要求,隨著嵌入式系統(tǒng)的發(fā)展,滅火機(jī)器人正向經(jīng)濟(jì)化、小型化、智能化和通用型方向發(fā)展。
一、互聯(lián)網(wǎng)+大數(shù)據(jù)時(shí)代人工智能的發(fā)展
智能包含感知能力、記憶與思維能力、學(xué)習(xí)和自適應(yīng)能力、決策與行為能力。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,分為弱人工智能、強(qiáng)人工智能和超人工智能。從目前人工智能的應(yīng)用場景來看,當(dāng)前人工智能仍是以特定應(yīng)用領(lǐng)域?yàn)橹鞯娜跞斯ぶ悄?,如圖像識別、語音識別等生物識別分析,如智能搜索、智能推薦、智能排序等智能算法等。而未來隨著運(yùn)算能力、數(shù)據(jù)量的大幅增長以及算法的提升,機(jī)器智能將在大數(shù)據(jù)中從感知、記憶和存儲(chǔ)向認(rèn)知、自主學(xué)習(xí)、決策與執(zhí)行進(jìn)階。在工程實(shí)踐中,經(jīng)常使用仿生的一些算法或理論,比如粒子群算法,遺傳算法,禁忌搜索,神經(jīng)網(wǎng)絡(luò)等。這些算法或理論都有一些共同的特征(比如仿生),通稱為“智能算法”。它們在解決一些復(fù)雜的工程問題時(shí)大有用武之地。但隨著互聯(lián)網(wǎng)+大數(shù)據(jù)時(shí)代的強(qiáng)勢來臨,迫切地需要開發(fā)新人工智能算法。
二、基于多智能體的滅火機(jī)器人系統(tǒng)
智能體系統(tǒng)(multi-gent system,MAS)一直是人工智能研究的熱點(diǎn)領(lǐng)域。但是多智能體在弱通信環(huán)境中無法做出有效決策以及在巨大災(zāi)難環(huán)境中多智能體遇到的“維數(shù)災(zāi)難”這兩個(gè)問題,從而無法提高智能體學(xué)習(xí)和決策能力。而發(fā)生火災(zāi)的場所就是一個(gè)通信環(huán)境差的災(zāi)難環(huán)境。多智能體系統(tǒng)的協(xié)作是人工智能研究的熱點(diǎn)。多智能體系統(tǒng)通過建立一種有效的智能協(xié)作模型,使功能獨(dú)立的智能體能夠互相協(xié)作完成復(fù)雜的滅火任務(wù)。目前,多智能體協(xié)作技術(shù)已經(jīng)廣泛應(yīng)用于智能機(jī)器人、軌道交通、智能制造、網(wǎng)絡(luò)自動(dòng)化與智能化、商業(yè)管理等領(lǐng)域。
在多智能體領(lǐng)域中,基于行為的方法是一個(gè)受到廣泛認(rèn)可的智能體協(xié)同控制算法?;谛袨榈姆椒ú恍枰鶕?jù)不同的環(huán)境去建立不同的數(shù)學(xué)模型,也可稱之為免模型算法,具有不錯(cuò)的魯棒性。但是智能體的行為選擇策略往往是預(yù)先人工設(shè)定好的,面對復(fù)雜多變的環(huán)境,缺乏自適應(yīng)能力。因此,只依靠基于行為的方法,無法解決復(fù)雜智能博弈對抗問題。在21世紀(jì)初期,越來越多的研究者開始將機(jī)器學(xué)習(xí)的方法與基于行為的算法相結(jié)合,提出新的智能體控制技術(shù),使得智能體逐漸開始擁有自主學(xué)習(xí)的能力。但是單一的智能體學(xué)習(xí)方法,往往不能滿足多智能體系統(tǒng)的需要。受到生物學(xué)和社會(huì)學(xué)的啟發(fā),基于多智能體的特點(diǎn),研究者們逐漸開始將不同類型的機(jī)器學(xué)習(xí)方法與傳統(tǒng)基于行為的方法相融合,試圖尋找更好的合作方式。而這種跨學(xué)科將多方法融合的思路,對于提高智能體的學(xué)習(xí)效率,擴(kuò)大多智能體的應(yīng)用范圍及提高多智能體的協(xié)同能力具有重要的實(shí)踐意義。
總體來看,在智能體的發(fā)展研究過程中,多智能體面對復(fù)雜多變的環(huán)境時(shí)應(yīng)該具有協(xié)調(diào)性、自適應(yīng)性和自組織性。因此,多智能體中的每個(gè)獨(dú)立的智能體首先必須具有獨(dú)立的自主決策能力與面對動(dòng)態(tài)變化的自適應(yīng)能力。另外在多智能體系統(tǒng)中,不能忽視智能體之間的合作和競爭,必須要考慮到整體的利益,即協(xié)同能力。本文在對多智能體系統(tǒng)分析的基礎(chǔ)上,針對目前協(xié)作模型存在的問題,提出一種通用的滅火多智能體協(xié)作模型,三個(gè)關(guān)鍵模塊是:滅火任務(wù)處理模塊,滅火協(xié)商模塊,滅火協(xié)調(diào)規(guī)劃模塊。滅火任務(wù)處理模塊對復(fù)雜任務(wù)的三個(gè)處理步驟為:滅火任務(wù)分解、滅火任務(wù)組織關(guān)系、滅火任務(wù)重要屬性處理。確定了滅火協(xié)商模塊中的協(xié)商模型及相應(yīng)的滅火協(xié)商協(xié)議和滅火協(xié)商流程。按照提出的滅火多智能體協(xié)作模型構(gòu)建了滅火執(zhí)行智能體和滅火管理智能體結(jié)構(gòu)。并對滅火任務(wù)處理模塊提出一種可自學(xué)習(xí)尋徑避障軌跡的智能群算法應(yīng)對復(fù)雜環(huán)境下(大數(shù)據(jù))的滅火。通過對可能的軌跡進(jìn)行編碼、適應(yīng)度評價(jià)、群聚、強(qiáng)局部搜索能力的混沌模式、自學(xué)習(xí)等一系列操作步驟,經(jīng)過一定代數(shù)的迭代獲得最優(yōu)的行進(jìn)策略和軌跡方案。多個(gè)智能體多方協(xié)作,共同完成滅火任務(wù)。
三、總結(jié)
多智能體深度強(qiáng)化學(xué)習(xí)在單智能體強(qiáng)化學(xué)習(xí)基礎(chǔ)上增加了智能體數(shù)量并通過在算法中加入博弈對抗和通信協(xié)調(diào)機(jī)制使多個(gè)智能體具有群體性、分布性和自主性等特點(diǎn),具備學(xué)習(xí)推理和自組織協(xié)調(diào)能力?,F(xiàn)有的多智能體多用于解決維度較低、智能體個(gè)數(shù)較少的問題,隨著深度學(xué)習(xí)技術(shù)的突破以及與仿生算法結(jié)合的成功,使得多智能體深度強(qiáng)化學(xué)習(xí)方法在應(yīng)對面對外界復(fù)雜多變的環(huán)境中取得一定進(jìn)展。多智能體系統(tǒng)中每個(gè)智能體之間可通過通信和協(xié)作機(jī)制達(dá)成(默契),在學(xué)習(xí)過程中不僅考慮自身利益,更重要的是考慮如何最大化整體利益。每個(gè)智能體在與環(huán)境的不斷交互中學(xué)習(xí)并提升協(xié)同能力和決策能力。將其應(yīng)用在滅火中,是一個(gè)有益的嘗試和探索。但是仍然存在一些難題需要以后繼續(xù)研究。
參考文獻(xiàn)
[1]基于Q學(xué)習(xí)的RoboCup多智能體決策優(yōu)化.周戎.南京郵電大學(xué).2018-11-14碩士
[2]國內(nèi)多智能體系統(tǒng)應(yīng)用研究歸納——共詞分析視角[J].邢曉昭,望俊成.數(shù)字圖書館論壇2013-04-25期刊
[3]基于差分進(jìn)化算法多智能體任務(wù)分配熊遠(yuǎn)武[J].趙嶺忠,翟仲毅.計(jì)算機(jī)工程與設(shè)計(jì)2019-10-14
[4]RoboCup救援仿真平臺(tái)中多智能體滅火策略.楊祥.南京郵電大學(xué).2015-03-01
[5]RoboCup機(jī)器人救援仿真中多智能體協(xié)作模型的研究與建立.錢程.東南大學(xué).2018-06-30
[6]基于深度強(qiáng)化學(xué)習(xí)的智能博弈對抗關(guān)鍵技術(shù)[J].曹雷.指揮信息系統(tǒng)與技術(shù).2019-11-11