倪詩(shī)翔,王偉強(qiáng),蘇衍宇,吳冬梅
(1.哈爾濱工業(yè)大學(xué)機(jī)器人技術(shù)及系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,黑龍江哈爾濱150001;2.解放軍電子工程學(xué)院,安徽合肥 230031)
面向室外環(huán)境的單機(jī)器人輻射場(chǎng)尋源算法
倪詩(shī)翔1,王偉強(qiáng)2,蘇衍宇1,吳冬梅1
(1.哈爾濱工業(yè)大學(xué)機(jī)器人技術(shù)及系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,黑龍江哈爾濱150001;2.解放軍電子工程學(xué)院,安徽合肥 230031)
隨著機(jī)器人技術(shù)的發(fā)展,自主移動(dòng)機(jī)器人已經(jīng)成功運(yùn)用在危險(xiǎn)生物、化學(xué)、輻射及火災(zāi)環(huán)境中,機(jī)器人的應(yīng)用有效降低了危險(xiǎn)環(huán)境對(duì)人的危害。在熱輻射場(chǎng)、核輻射場(chǎng)、強(qiáng)電磁輻射場(chǎng)和聲場(chǎng)中使用機(jī)器人搜尋輻射源,能最大程度減少人暴露在輻射環(huán)境中的時(shí)間,同時(shí),這種搜尋方式準(zhǔn)確、高效,具有極大的實(shí)用價(jià)值。
上述多種輻射場(chǎng)和聲場(chǎng)有類似的分布特性,即在空氣中輻射強(qiáng)度隨著距輻射源的距離增大按固定的規(guī)律遞減,遇到阻擋物時(shí),發(fā)生反射、折射和衍射現(xiàn)象,阻擋物背后的強(qiáng)度分布呈不規(guī)則狀態(tài),且任意位置的強(qiáng)度分布無(wú)時(shí)變。因此,可以提出一種同時(shí)適用于上述4種輻射場(chǎng)的尋源算法。
目前,國(guó)際國(guó)內(nèi)對(duì)聲源和火源的定位搜尋研究較為成熟,對(duì)于放射源和其他電磁輻射源的搜尋研究尚處于起步階段[1]。對(duì)于聲源的搜尋,多采用麥克風(fēng)陣列的方法,利用多個(gè)聲音信號(hào)接收器來(lái)實(shí)現(xiàn)[2-4],而對(duì)于火源的搜尋,則多采用紅外探測(cè)器探測(cè)環(huán)境中溫度最高點(diǎn)來(lái)實(shí)現(xiàn)[5-6]。現(xiàn)有的場(chǎng)源定位搜尋算法都需要一套龐大且復(fù)雜的系統(tǒng)作為支持,不能靠單個(gè)移動(dòng)機(jī)器人來(lái)實(shí)現(xiàn),這使得尋源的成本極高,而且對(duì)于不同環(huán)境的適應(yīng)性極差。
針對(duì)上述2個(gè)問(wèn)題,提出了一種基于高斯過(guò)程回歸,采用單個(gè)移動(dòng)機(jī)器人實(shí)現(xiàn)對(duì)電磁輻射和聲輻射源進(jìn)行定位搜尋的方法,該尋源算法的實(shí)施不需要環(huán)境中復(fù)雜系統(tǒng)的支持,使得搜尋大大簡(jiǎn)化。同時(shí),通過(guò)對(duì)WiFi信號(hào)源搜尋的實(shí)驗(yàn),驗(yàn)證了所提算法的有效性。
在某一存在輻射源的環(huán)境中,輻射強(qiáng)度值最大的一點(diǎn)就是輻射源所在點(diǎn)。根據(jù)已知的某些點(diǎn)的輻射強(qiáng)度值,運(yùn)用回歸方法可以預(yù)測(cè)出未知點(diǎn)的輻射強(qiáng)度值。
傳統(tǒng)的回歸方法有神經(jīng)網(wǎng)絡(luò)法和支持向量機(jī)法等,但是這些方法只輸出預(yù)測(cè)值,不能給出對(duì)預(yù)測(cè)值分布的估計(jì)。高斯過(guò)程回歸與傳統(tǒng)方法不同,不僅可以獲得預(yù)測(cè)值,同時(shí)也能得到預(yù)測(cè)值的分布情況,即高斯分布的均值和方差,這十分有利于對(duì)輻射源的搜尋。
高斯過(guò)程是一組隨機(jī)變量的集合,該集合中的任意有限個(gè)隨機(jī)變量都服從多元高斯分布,對(duì)于一個(gè)定義在指標(biāo)集{χ}上的高斯過(guò)程{g(x):x∈χ,g(x)∈R}而言,它的均值函數(shù)為:
根據(jù)高斯過(guò)程存在性定理,可以通過(guò)將任意的實(shí)函數(shù)和正定函數(shù)分別作為均值函數(shù)和協(xié)方差函數(shù),來(lái)構(gòu)造一個(gè)高斯過(guò)程:
p是構(gòu)造均值函數(shù)和協(xié)方差函數(shù)所用的參數(shù),其維數(shù)由選擇的函數(shù)決定。典型的協(xié)方差函數(shù)有線性函數(shù)、布朗運(yùn)動(dòng)函數(shù)、平方指數(shù)高斯過(guò)程函數(shù)(SE函數(shù))和奧恩斯坦-烏倫貝克過(guò)程函數(shù)等。
1.2 預(yù)測(cè)
對(duì)于給定的訓(xùn)練集
xi和yi分別為自變量和因變量。n∈N1表示訓(xùn)練集的大小,高斯過(guò)程回歸模型假設(shè)它的各個(gè)因變量,是取樣自某未知分布的獨(dú)立同分布隨機(jī)變量,并將它描述為:
1.3 訓(xùn)練
訓(xùn)練集確定時(shí),高斯過(guò)程回歸的預(yù)測(cè)結(jié)果由因變量的先驗(yàn)分布決定。在選定均值函數(shù)和協(xié)方差函數(shù)后,該分部則由這2個(gè)函數(shù)和獨(dú)立噪聲的參數(shù)共同決定。這種定義先驗(yàn)分布的參數(shù)被稱為超參數(shù),即:
因此,高斯過(guò)程回歸的訓(xùn)練過(guò)程包括2個(gè)環(huán)節(jié):
a.確定均值函數(shù)和協(xié)方差函數(shù)。
b.通過(guò)最大似然法確定超參數(shù)。
均值函數(shù)和協(xié)方差函數(shù)需要根據(jù)具體問(wèn)題選定,超參數(shù)則常通過(guò)求解如下優(yōu)化問(wèn)題獲得:
其中,L(θ)=-log p(^y=y(tǒng)|x),p(^y=y(tǒng)|x)是出現(xiàn)訓(xùn)練集樣本^y=y(tǒng)時(shí)先驗(yàn)概率分布的概率密度函數(shù)值。
2.1 方法概論
本文所研究的控制算法主要分為2步:高斯過(guò)程回歸對(duì)平面輻射場(chǎng)的在線預(yù)測(cè);求解最優(yōu)化問(wèn)題獲得機(jī)器人的移動(dòng)方向。算法的流程如圖1所示。
該算法的原理如下:
a.機(jī)器人進(jìn)入搜尋區(qū)域,測(cè)出其所在柵格的輻射場(chǎng)強(qiáng)值,獲取所在柵格鄰域(附近8個(gè)柵格)的信息,包括柵格中有無(wú)障礙物和各柵格已經(jīng)走過(guò)的次數(shù),使用高斯過(guò)程回歸預(yù)測(cè)出鄰域中各柵格場(chǎng)強(qiáng)的均值和方差。
b.機(jī)器人計(jì)算附近鄰域中各柵格的回報(bào)函數(shù),選取回報(bào)函數(shù)值最大的柵格作為下一步的路徑點(diǎn)。
c.機(jī)器人移動(dòng)到下一個(gè)柵格,測(cè)量該柵格的場(chǎng)強(qiáng)值,獲取鄰域各柵格的信息,之后根據(jù)已知的全部實(shí)際場(chǎng)強(qiáng)值繼續(xù)預(yù)測(cè)附鄰域各柵格場(chǎng)強(qiáng)的均值和方差。
d.重復(fù)步步驟b和步驟c,直至機(jī)器人行走至輻射場(chǎng)強(qiáng)大于閾值的柵格。
圖1 算法流程
2.2 搜索區(qū)域的離散化
對(duì)于輻射源的搜尋,當(dāng)機(jī)器人到達(dá)與輻射源距離足夠小的位置時(shí)即可認(rèn)為搜尋成功,因此,采用參考文獻(xiàn)[8]的方法對(duì)搜索區(qū)域進(jìn)行離散化,用邊長(zhǎng)lc的正方形柵格劃分搜索區(qū)域。在搜索過(guò)程中,機(jī)器人可以從一個(gè)柵格移動(dòng)到另一個(gè)柵格,測(cè)量輻射強(qiáng)度值只在柵格的中心點(diǎn)處進(jìn)行,以該點(diǎn)的輻射強(qiáng)度值代表該柵格的輻射強(qiáng)度值。
在初始時(shí)刻,機(jī)器人對(duì)環(huán)境未知,機(jī)器人每行走一步可以通過(guò)自身的傳感器獲得附近8個(gè)柵格的信息,機(jī)器人的鄰域即定義為其附近的8個(gè)柵格。
假設(shè)一個(gè)矩形搜索區(qū)域在X和Y方向的長(zhǎng)度分別為L(zhǎng)X和LY,則X和Y方向可劃分的柵格數(shù)M、N分別為:
ceil(x)為取不小于x的最小整數(shù)。由此,定義搜索區(qū)域S為:
對(duì)于離散化的柵格,若某一柵格中存在障礙物則認(rèn)為該柵格不可進(jìn)入,將該柵格標(biāo)記為黑色,如果某一柵格中任何位置都不存在障礙物,則該柵格為可進(jìn)入柵格,將該柵格標(biāo)記為白色。
2.3 基于高斯過(guò)程回歸的環(huán)境輻射強(qiáng)度分布估計(jì)
為完成對(duì)輻射源的搜尋,需要得知輻射源在環(huán)境平面中的位置,故需要對(duì)環(huán)境平面的輻射強(qiáng)度分布進(jìn)行估計(jì)。解決這一問(wèn)題的原理是讓機(jī)器人在環(huán)境平面不同位置測(cè)量輻射強(qiáng)度值,使用高斯過(guò)程回歸利用有限的信息推測(cè)全局信息。
定義高斯過(guò)程回歸的訓(xùn)練集為:
x1,x2分別為機(jī)器人所在點(diǎn)的笛卡爾坐標(biāo)值;Ix為x點(diǎn)處的實(shí)際輻射強(qiáng)度值。
使用高斯過(guò)程回歸,首先要確定均值函數(shù)和協(xié)方差函數(shù)。本文采用無(wú)阻擋環(huán)境下的輻射強(qiáng)度分布函數(shù)作為高斯過(guò)程回歸的均值函數(shù),采用平方指數(shù)函數(shù)作為協(xié)方差函數(shù),即
其中,σf值取8.2,l值取17。
對(duì)于給定的訓(xùn)練集D,高斯過(guò)程回歸針對(duì)8個(gè)預(yù)測(cè)點(diǎn)的輸出是均值μ和方差σ,μ表示場(chǎng)強(qiáng)的預(yù)測(cè)值,σ表示預(yù)測(cè)值的不確定度。
2.4 回報(bào)函數(shù)求解
回報(bào)函數(shù)U為3個(gè)函數(shù)的乘積,即
此處,u1(x*)為Deisenroth等提出的高斯過(guò)程信息熵[9],參數(shù)ρ和β控制機(jī)器人行走的趨勢(shì),當(dāng)ρ較大時(shí),機(jī)器人趨向于朝場(chǎng)強(qiáng)大的方向行走,當(dāng)β較大時(shí),機(jī)器人趨向于朝信息量更大的方向行走。尋源過(guò)程中采用動(dòng)態(tài)的ρ和β參數(shù)值,即
u2(x*)控制機(jī)器人向沒(méi)有走過(guò)的地方行走,其中n(x*)為機(jī)器人經(jīng)過(guò)x*點(diǎn)的次數(shù)。
u3(x*)實(shí)現(xiàn)機(jī)器人的避障性能,對(duì)于有障礙物的柵格,u3(x*)及U(x*)將始終為0。
機(jī)器人在某一個(gè)柵格處通過(guò)上式計(jì)算出附近8個(gè)柵格的回報(bào)函數(shù)后,選取回報(bào)函數(shù)值最大的柵格作為下一步的路徑點(diǎn)。
在真實(shí)的室外環(huán)境中驗(yàn)證了基于高斯過(guò)程回歸的輻射源定位算法,并給出具體的實(shí)驗(yàn)設(shè)置和實(shí)驗(yàn)結(jié)果。
3.1 實(shí)驗(yàn)設(shè)置
實(shí)驗(yàn)環(huán)境為一個(gè)300 m×200 m的室外環(huán)境,如圖2所示。圖2中白色部分為道路,是機(jī)器人的可行域,其他部分是建筑物、樹(shù)叢以及河流等阻擋物,是不可通行的區(qū)域。黑色圓點(diǎn)處為輻射源所在位置,三角形處為機(jī)器人的初始位置。
圖2 搜索區(qū)域地圖
用邊長(zhǎng)lc=5 m正方形柵格對(duì)地圖進(jìn)行柵格化,得到離散化的地圖如圖3所示。
圖3 柵格化的搜索區(qū)域
實(shí)驗(yàn)所用機(jī)器人為實(shí)驗(yàn)室研制的TJ-1機(jī)器人。機(jī)器人本體載有1臺(tái)PC機(jī)作為機(jī)器人的上位機(jī),激光測(cè)距儀(URG-04LX)用于檢測(cè)障礙物,WiFi信號(hào)接收器(TL-WN722N)作為輻射強(qiáng)度檢測(cè)儀,GPS定位器(MEMSICNAV 440,定位精度2.5 m)用于機(jī)器人定位。電磁波輻射源是TLWDR6500無(wú)線路由器,該路由器產(chǎn)生2.4 GHz的WiFi信號(hào)。
實(shí)驗(yàn)中,以機(jī)器人所在柵格的笛卡爾坐標(biāo)值作為訓(xùn)練集的自變量,以接收到的WiFi信號(hào)的功率作為輻射強(qiáng)度值,即訓(xùn)練集的因變量,輻射強(qiáng)度的閾值設(shè)定為-42 dBm。由于機(jī)器人的起始位置接近地圖的左上角,因此在搜尋前假定放射源位于地圖的右下角,由此確定均值函數(shù)中的超參數(shù)為(56,38)。
3.2 實(shí)驗(yàn)結(jié)果
機(jī)器人搜尋輻射源的過(guò)程如圖4所示。圖4a為搜尋初期,機(jī)器人向假定的輻射源所在位置靠近,同時(shí)獲得盡量多的環(huán)境信息,擴(kuò)大訓(xùn)練集。圖4b為搜尋的中期,機(jī)器人在探索更多的未知區(qū)域。圖4c為搜尋的后期,機(jī)器人在獲得了足夠大的訓(xùn)練集后,迅速靠近輻射源。圖4d為搜尋的結(jié)果,機(jī)器人最終停留在輻射源所在柵格中。
圖4 輻射源搜尋結(jié)果
將高斯過(guò)程回歸引入輻射源的搜尋,提出了一種全新的輻射場(chǎng)尋源算法,研究?jī)?nèi)容包括:對(duì)搜索區(qū)域進(jìn)行柵格化,采用高斯過(guò)程回歸預(yù)測(cè)鄰域輻射強(qiáng)度值,通過(guò)求回報(bào)函數(shù)的最大值對(duì)機(jī)器人進(jìn)行局部軌跡規(guī)劃,通過(guò)多次局部軌跡規(guī)劃使機(jī)器人到達(dá)全局最優(yōu)點(diǎn)。
在提出算法后,通過(guò)WiFi輻射場(chǎng)尋源實(shí)驗(yàn)驗(yàn)證了算法的有效性。實(shí)驗(yàn)結(jié)果證明,該算法能夠以單機(jī)器人在300 m×200 m的室外環(huán)境中定位WiFi信號(hào)源。算法對(duì)輻射源的定位精度取決于柵格的邊長(zhǎng)lc。
[1] Krishnanand K N.Glowworm swarm optimization:a multimodal function optimization paradigm with applications to multiple signal source localization tasks[D].Indian:Department of Aerospace Engineering,Indian Institute of Science,2007.
[2] 趙秀粉.基于麥克風(fēng)陣列的聲源定位技術(shù)研究[D].成都:電子科技大學(xué),2013.
[3] Tuma J,Janecka P,Vala M,et al.Sound source localization[C]//2012 13th International Carpathian Control Conference(ICCC),2012:740-743.
[4] Valin J M,Michaud F,Rouat J,et al.Robust sound source localization using a microphone array on a mobile robot[C]//International Conference on Intelligent Robots and Systems,2003:1228-1233.
[5] Wang S,Berentsen M,Kaiser T.Signal processing algorithms for fire localization using temperature sensor arrays[J].Fire Safety Journal,2005,40(8):689-697.
[6] 康一梅,楊恩博,楊鑫凱.基于改進(jìn)蟻群算法的火源定位策略研究[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(2):207-210.
[7] Seeger M.Gaussian processes for machine learning[J].International Journal of Neural Systems,2004,14(2):69-106.
[8] 王陽(yáng),孟慶浩,李騰,等.室內(nèi)通風(fēng)環(huán)境下基于模擬退火算法的單機(jī)器人氣味源定位[J].機(jī)器人,2013,35(3):283-291.
[9] Deisenroth M P,Rasmussen C E,Peters J.Gaussian process dynamic programming[J].Neurocomputing,2009,72(7):1508-1524.
A Radiation Source Searching Algorithm Used for a Single Robot in Outdoor Environment
NI Shixiang1,WANG Weiqiang2,SU Yanyu1,WU Dongmei1
(1.State Key Laboratory of Robotics and System,Harbin Institute of Technology,Harbin 150001,China;2.Electronic Engineering Institute of PLA,Hefei 230031,China)
針對(duì)室外熱輻射場(chǎng)、核輻射場(chǎng)、強(qiáng)電磁輻射場(chǎng)和聲場(chǎng)的輻射源搜尋,提出了一種基于高斯過(guò)程回歸的單機(jī)器人輻射源搜尋算法。首先將連續(xù)的搜尋環(huán)境離散化,采用高斯過(guò)程回歸預(yù)測(cè)機(jī)器人鄰域中的輻射強(qiáng)度,然后將局部路徑規(guī)劃考慮為一個(gè)優(yōu)化問(wèn)題,求取優(yōu)化目標(biāo)函數(shù)的最大值獲得機(jī)器人的下一步路徑點(diǎn),最后通過(guò)多次局部路徑規(guī)劃引導(dǎo)機(jī)器人到達(dá)全局最優(yōu)點(diǎn)。為驗(yàn)證所提算法的有效性,在300 m×200 m的室外環(huán)境中進(jìn)行了實(shí)驗(yàn)。
室外環(huán)境;單機(jī)器人;尋源算法;輻射場(chǎng)
Aiming at searching the source of thermal radiation fields,nuclear radiation fields,strong electromagnetic radiation fields and sound fields in outdoor environment,a source searching algorithm based on Gaussian Process Regression using a single robot is proposed.First of all,the continuous searching area is discretized with square grids,and the radiation intensity of adjacent grids is predicted by Gaussian Process Regression.Then a local path planning is considered to be an optimization problem and the next path point is obtained by solving the problem.Finally,the robot is guided to the global optimal point through repeated local path planning.To verify the proposed algorithm,an experiment in an environment of 300 m×200 m has been conducted.
outdoor environments;single robot;source searching algorithm;radiation field
TP241
A
1001-2257(2015)09-0067-05
倪詩(shī)翔(1990-),男,四川西昌人,碩士研究生,研究方向?yàn)樘胤N環(huán)境移動(dòng)機(jī)器人;王偉強(qiáng) (1976-),男,安徽合肥人,工程師,研究方向?yàn)榻ㄖc環(huán)境建模技術(shù);蘇衍宇 (1986-),男,湖南株洲人,博士研究生,研究方向?yàn)橹悄軝C(jī)器人控制及工業(yè)自動(dòng)化;吳冬梅 (1968-),女,黑龍江哈爾濱人,博士研究生導(dǎo)師,教授,研究方向?yàn)獒t(yī)療機(jī)器人技術(shù)。
2015-04-27