房芳 馬旭東 錢堃 梁志偉
(1東南大學(xué)復(fù)雜工程系統(tǒng)測量與控制教育部重點(diǎn)實(shí)驗(yàn)室,南京 210096)(2南京郵電大學(xué)自動化學(xué)院,南京 210046)
未來移動機(jī)器人真正成為人類便捷友好的助手,首先需要能夠適應(yīng)在與人共存、高度動態(tài)的應(yīng)用環(huán)境中與人和諧共處[1-2].這對于機(jī)器人能夠在已知應(yīng)用環(huán)境模型中根據(jù)任務(wù)需求進(jìn)行任務(wù)規(guī)劃起著關(guān)鍵的作用.同時,為了有效降低機(jī)器人成本、提高機(jī)器人執(zhí)行任務(wù)的能力,智能環(huán)境或智能空間[3-5]與機(jī)器人相結(jié)合已成為必然趨勢.
機(jī)器人規(guī)劃研究主要在于機(jī)器人處于有噪音的各類環(huán)境模型中,各種感知信息都在一定程度上具有不確定性,這樣機(jī)器人就需要將感知和執(zhí)行進(jìn)行整合來進(jìn)行直接規(guī)劃.Hoffman 和 Breazeal[6-7]的研究表明機(jī)器人對人的行為識別和推理以及機(jī)器人據(jù)此進(jìn)行自身任務(wù)規(guī)劃及執(zhí)行能夠有效提高人機(jī)合作與交互能力.而智能環(huán)境恰好能夠通過其復(fù)雜聯(lián)合感知和執(zhí)行能力對其空間中的服務(wù)對象人行為進(jìn)行監(jiān)控識別和推測.在Montreuil等[8]提出的人機(jī)聯(lián)合任務(wù)規(guī)劃器HATP(human aware task planner),以及 Galindo 等[9]提出的人機(jī)協(xié)作規(guī)劃方法中,機(jī)器人并沒有考慮服務(wù)對象人的行為動作習(xí)慣,而只是簡單預(yù)測人的行為規(guī)劃提供給機(jī)器人規(guī)劃器.Mausam[10]提出的 CoMDPs(concurrent markov processes)方法是完全可觀的MDPs(markov decision processes)擴(kuò)展,同時提出如何計(jì)算得到一系列能夠被同時安全執(zhí)行且具有一定持續(xù)時間的規(guī)劃行為,但該方法僅針對機(jī)器人單一智能體且隨機(jī)的行為動作執(zhí)行時間大大增加了計(jì)算負(fù)擔(dān),并不適合機(jī)器人在線規(guī)劃任務(wù).針對以上應(yīng)用,本文研究在移動機(jī)器人傳統(tǒng)的確定型任務(wù)規(guī)劃和執(zhí)行中,考慮服務(wù)對象人類存在等動態(tài)環(huán)境,并充分利用智能服務(wù)構(gòu)件,通過機(jī)器人任務(wù)規(guī)劃和執(zhí)行與在線再規(guī)劃-執(zhí)行,達(dá)到優(yōu)化服務(wù)功能.
為體現(xiàn)機(jī)器人的主動性,本系統(tǒng)采用一種以機(jī)器人為中心的服務(wù)構(gòu)件化的移動機(jī)器人系統(tǒng)基本架構(gòu),如圖1所示.
該系統(tǒng)由移動機(jī)器人和環(huán)境智能節(jié)點(diǎn)兩部分組成,它們同處在一個環(huán)境當(dāng)中,相互之間通過網(wǎng)絡(luò)相連,這里的網(wǎng)絡(luò)可以是無線的,也可以是有線的,既包括局域網(wǎng),也包括互聯(lián)網(wǎng).因此,這里的環(huán)境包括本地環(huán)境和互聯(lián)網(wǎng)環(huán)境,環(huán)境智能節(jié)點(diǎn)也包括本地智能節(jié)點(diǎn)和互聯(lián)網(wǎng)智能節(jié)點(diǎn).環(huán)境智能節(jié)點(diǎn)實(shí)際上就是各個輔助資源設(shè)備,它們分布在空間中,可以固定地嵌入環(huán)境,也可以具備一定移動性,例如移動小車、活動機(jī)械臂等等,它們都有獨(dú)立的IP,以網(wǎng)絡(luò)節(jié)點(diǎn)的形式提供訪問.在整個架構(gòu)中,機(jī)器人作為系統(tǒng)的核心,負(fù)責(zé)完成各種任務(wù),而環(huán)境智能節(jié)點(diǎn)則是互相協(xié)作起來為其提供各種各樣的輔助,協(xié)助其完成任務(wù).
圖1 以機(jī)器人為中心的分布式智能系統(tǒng)
由于分布式機(jī)器人系統(tǒng)的分布性和自主性的特點(diǎn),以及所處觀測環(huán)境的動態(tài)特性,本文采用A-gent映射各個智能構(gòu)件,將整個分布式構(gòu)件化機(jī)器人系統(tǒng)構(gòu)建成一個MAS系統(tǒng)[11],按照構(gòu)件智能水平的高低將其劃分成3個不同層次的Agent:A1,A2和IAAs(interaction agents),其中A1表示智能水平最高的移動機(jī)器人,其主要作用是總體任務(wù)規(guī)劃和分配,同時能夠?qū)Νh(huán)境中的其他智能構(gòu)件進(jìn)行控制和協(xié)調(diào).A2表示環(huán)境中其他的智能構(gòu)件節(jié)點(diǎn),通過任務(wù)建模、匹配、篩選完成任務(wù)分配過程,并將獲得的子任務(wù)分解成一系列具體的機(jī)器人可執(zhí)行的動作序列.IAAs表示和機(jī)器人有行為交互的服務(wù)對象人智能體,通過與A1的交互和協(xié)商解決避免人機(jī)沖突/阻塞和不友好的問題.本文提出在完全分布式結(jié)構(gòu)的基礎(chǔ)上,加入集中式結(jié)構(gòu)的優(yōu)點(diǎn),引入復(fù)合Agent和移動Agent概念,建立一種高可靠性的分布式機(jī)器人系統(tǒng)的多Agent結(jié)構(gòu),具體結(jié)構(gòu)如圖2所示.
圖2 機(jī)器人系統(tǒng)多Agent結(jié)構(gòu)
與完全分布式結(jié)構(gòu)不同的是,將集中式結(jié)構(gòu)和分布式結(jié)構(gòu)相結(jié)合,同時引入復(fù)合Agent和移動Agent技術(shù),對機(jī)器人Agent和智能構(gòu)件Agent進(jìn)行了重新定義,將其功能分成兩部分:A'1和A'2,其中A'1的功能是總體任務(wù)全局規(guī)劃,能夠?qū)φ麄€系統(tǒng)進(jìn)行整體集中監(jiān)控,具體功能主要是根據(jù)服務(wù)對象人智能體的日程安排和其返回的狀態(tài)進(jìn)行任務(wù)分析,確定系統(tǒng)將要執(zhí)行的任務(wù)計(jì)劃,并在自動任務(wù)發(fā)現(xiàn)分配機(jī)制的基礎(chǔ)上完成任務(wù)分配和規(guī)劃,同時對智能節(jié)點(diǎn)進(jìn)行監(jiān)督控制.正常情況下只有機(jī)器人節(jié)點(diǎn)上的A'1起作用,其他智能構(gòu)件上的A'1不發(fā)揮作用.通常整個系統(tǒng)的規(guī)劃功能通過機(jī)器人A'1與智能構(gòu)件A'2共同完成.同時A'1具有移動性,在機(jī)器人節(jié)點(diǎn)功能失效時可由智能構(gòu)件節(jié)點(diǎn)上的A'1代替,這種移動智能體技術(shù)增加了整個規(guī)劃系統(tǒng)的可靠性和穩(wěn)定性.A'2的主要功能是任務(wù)的分解執(zhí)行,正常情況下只有智能構(gòu)件節(jié)點(diǎn)上的A'2起作用,只有當(dāng)其功能失效時才會轉(zhuǎn)移到機(jī)器人節(jié)點(diǎn)的A'2上.在這種集中式和分布式相結(jié)合的系統(tǒng)架構(gòu)下,任何時刻都有且只有一個節(jié)點(diǎn)負(fù)責(zé)整體任務(wù)規(guī)劃與執(zhí)行控制,因此能夠保證系統(tǒng)的全局最優(yōu)性和可控性.另外,提出基于語義功能建模與匹配的自動任務(wù)發(fā)現(xiàn)分配機(jī)制,并在此基礎(chǔ)上實(shí)現(xiàn)了機(jī)器人系統(tǒng)自動任務(wù)規(guī)劃與執(zhí)行策略,各Agent間通過建模、匹配、篩選完成任務(wù)分配過程,有效解決了環(huán)境動態(tài)未知性帶來的問題.同時引入IAAs智能體,提出一系列人機(jī)和諧相處的規(guī)則,有效實(shí)現(xiàn)對人友好的機(jī)器人自主任務(wù)規(guī)劃與執(zhí)行,提高了系統(tǒng)對服務(wù)對象人的適應(yīng)性,滿足人機(jī)和諧相處的需求.
將整個分布式構(gòu)件化機(jī)器人系統(tǒng)的任務(wù)規(guī)劃與控制分為任務(wù)計(jì)劃層、任務(wù)分配層、IAAs管理層、自主規(guī)劃層和構(gòu)件管理層5個層次,如圖3所示.
其中任務(wù)計(jì)劃層根據(jù)IAAs的日程安排和IAAs管理層返回的狀態(tài)進(jìn)行任務(wù)分析,確定系統(tǒng)將要激活的任務(wù)計(jì)劃.任務(wù)由多個分解的子任務(wù)構(gòu)成,子任務(wù)的執(zhí)行優(yōu)先級各不相同,因此還需要按照各個子任務(wù)的優(yōu)先級順序?qū)ζ溥M(jìn)行排序、組合等,從而最終確定其執(zhí)行順序,同時對整個系統(tǒng)任務(wù)進(jìn)行監(jiān)控與協(xié)調(diào),對由于動態(tài)環(huán)境而沒有完成的任務(wù)進(jìn)行掛起或收回,再根據(jù)其任務(wù)優(yōu)先級和執(zhí)行時間重新進(jìn)行規(guī)劃.
圖3 分布式構(gòu)件化機(jī)器人系統(tǒng)層次結(jié)構(gòu)圖
任務(wù)分配層主要完成任務(wù)對智能構(gòu)件和機(jī)器人的分配過程,同時滿足既定的優(yōu)化目標(biāo).引入語義網(wǎng)技術(shù),提出基于語義功能建模與匹配的自動任務(wù)發(fā)現(xiàn)分配機(jī)制,并在此基礎(chǔ)上實(shí)現(xiàn)了機(jī)器人系統(tǒng)自動任務(wù)規(guī)劃與執(zhí)行策略,各Agent間通過建模、匹配、篩選完成任務(wù)分配過程,有效解決了環(huán)境動態(tài)未知性帶來的問題.
IAAs管理層主要負(fù)責(zé)對和機(jī)器人有行為交互的服務(wù)對象智能體進(jìn)行構(gòu)建和更新管理,為了進(jìn)行對人友好的機(jī)器人自主任務(wù)規(guī)劃與執(zhí)行,借鑒人際相處中的若干習(xí)慣原則,如不侵犯他人的個人空間、人機(jī)交互最小范圍、對他人保持可視性、遵守行駛靠向、預(yù)測并禮讓他人等,對此類原則進(jìn)行量化,構(gòu)建約束條件融入機(jī)器人任務(wù)規(guī)劃器中.
自主規(guī)劃層主要在機(jī)器人節(jié)點(diǎn)和各個智能構(gòu)件節(jié)點(diǎn)上運(yùn)行,將獲得的子任務(wù)分解成一系列具體的機(jī)器人可執(zhí)行的動作序列,包括建立自主規(guī)劃模型和開發(fā)高效的規(guī)劃執(zhí)行算法,這部分功能在各個智能節(jié)點(diǎn)上自主運(yùn)行,而不需與其他節(jié)點(diǎn)協(xié)作執(zhí)行.
構(gòu)件管理層對輔助機(jī)器人的各種智能構(gòu)件進(jìn)行集中管理和監(jiān)控,從而能夠合理高效地利用智能環(huán)境中的構(gòu)件資源.分布式構(gòu)件化機(jī)器人系統(tǒng)中的構(gòu)件資源多種多樣,如智能視覺節(jié)點(diǎn)、移動小車等,必須對這些資源進(jìn)行全局監(jiān)控和管理.在構(gòu)件管理層的統(tǒng)一管理下,各個智能構(gòu)件將其功能模型與任務(wù)需求模型進(jìn)行匹配,篩選出符合要求的任務(wù)并按功能相似度排序,從而形成可直接調(diào)用的候選服務(wù)列表,當(dāng)異常事件發(fā)生時,如節(jié)點(diǎn)出現(xiàn)故障,構(gòu)件管理層即可通過網(wǎng)絡(luò)發(fā)出故障信號并再次向機(jī)器人或其他構(gòu)件發(fā)出資源請求信息,從而重新進(jìn)行任務(wù)分配和規(guī)劃執(zhí)行功能.
多Agent協(xié)商(任務(wù)規(guī)劃分配)模型如圖4所示.機(jī)器人Agent是分布式機(jī)器人系統(tǒng)任務(wù)規(guī)劃的組織者和管理者,是與服務(wù)對象智能體IAAs的唯一接口,負(fù)責(zé)定期從IAAs獲取新任務(wù),并將任務(wù)及時分配和執(zhí)行.其他服務(wù)構(gòu)件Agent均在機(jī)器人Agent的控制下通過建模、匹配、篩選完成任務(wù)分配過程,并分解執(zhí)行得到的子任務(wù),并向機(jī)器人A-gent進(jìn)行任務(wù)執(zhí)行結(jié)果反饋操作,從而最終通過機(jī)器人Agent反饋給IAAs,有效解決了環(huán)境動態(tài)未知性帶來的問題.通過這種任務(wù)分配、執(zhí)行方式可以最大程度上實(shí)現(xiàn)智能構(gòu)件環(huán)境下機(jī)器人系統(tǒng)的自主運(yùn)行,增強(qiáng)系統(tǒng)的穩(wěn)定性和可靠性.機(jī)器人智能體對服務(wù)構(gòu)件智能體的查詢請求中包含任務(wù)需求模型描述,服務(wù)構(gòu)件智能體先采用自己的匹配算法判斷是否反饋,但只完成一部分匹配工作(例如只關(guān)注入口參數(shù)的匹配,即先保證機(jī)器人提供的入口參數(shù)能夠支持任務(wù)運(yùn)行),另一部分則交給機(jī)器人完成(例如出口參數(shù)的匹配,保證任務(wù)能夠提供所需信息).這樣,最終得到的是“雙方都認(rèn)可的服務(wù)”.
圖4 任務(wù)規(guī)劃分配模型
本文建立了智能服務(wù)構(gòu)件環(huán)境下機(jī)器人任務(wù)規(guī)劃與執(zhí)行系統(tǒng)基本框架.通過機(jī)器人Agent、智能構(gòu)件Agent與交互人Agent之間不斷的協(xié)作過程完成任務(wù)的規(guī)劃、分配與執(zhí)行.通過一系列人機(jī)和諧相處的規(guī)則,使任務(wù)分配對服務(wù)對象人具有一定適應(yīng)性.該架構(gòu)將機(jī)器智能分散到智能構(gòu)件中,有效解決規(guī)劃問題中計(jì)算量過大的瓶頸問題.
References)
[1]Karola P,Sebastian W,Christian S J,et al.Attitude of German museum visitors towards an interactive art guide robot[C]//Proceedings of the 6th ACM/IEEE International Conference on Human-Robot Interaction.Lausanne,Switzerland,2011:227-228.
[2]Taha T,Miro J V,Dissanayake G.A POMDP framework for modelling human interaction with assistive robots[C]//IEEE International Conference on Robots and Automation.Shanghai,China,2011:544-549.
[3]Luo R C,Zhan J W,Cheng W H,et al.Networkbased multimodal human-robot interactions in ubiquitous computing environment[C]//IEEE International Conference on Robotics and Biomimetics(ROBIO).Bangkok,Thailand,2009:131-136.
[4]金欣,輔助移動機(jī)器人的智能環(huán)境服務(wù)構(gòu)件開發(fā)及其應(yīng)用[D].南京:東南大學(xué)自動化學(xué)院,2010.
[5]Qian Kun,Ma Xudong,Dai Xianzhong,et al.Semantic service composition mechanism for componentbased robotic system[C]//Proceeding of 37th Annual Conference of IEEE Industrial Electronics Society.Melbourne,Australia,2011:3192-3197.
[6]Hoffman G,Breazeal C.Cost-based anticipatory action selection for human-robot fluency[J].IEEE Transactions on Robotics,2007,23(5):592-561.
[7]Hoffman G,Breazeal C.Effects of anticipatory action on human-robot teamwork—efficiency,fluency,and perception of team[C]//Proceedings of the International Conference on Human-Robot Interaction.Washington,DC,USA,2007:1-8.
[8]Montreuil V,Clodict A,Ransan M,et al.Planning human centered robot activities[C]//IEEE International Conference on Systems, Man and Cybernetics.Montreal,Cook Islands,2007:2476-2481.
[9]Galindo C,F(xiàn)ernandez-Madrigal Juan-Antonio,Gonzalez J.Multihierarchical interactive task planning:application to mobile robotics[J].IEEE Transactions on Systems Man and Cybernetics Part B-Cybernetics,2008,38(3):785-798.
[10]Mausam Weld D S.Planning with durative actions in stochastic domains[J].Journal of Artificial Intelligence Research,2008,31:33-82.
[11]張正強(qiáng).基于MAS的分布式成像衛(wèi)星系統(tǒng)任務(wù)規(guī)劃與控制問題研究[D].湖南:國防科學(xué)技術(shù)大學(xué)信息系統(tǒng)與管理學(xué)院,2006.