宋程, 賀昱曜, 楊盼盼, 雷小康
1.西北工業(yè)大學(xué) 航海學(xué)院, 陜西 西安 710072; 2.長安大學(xué) 電子與控制工程學(xué)院, 陜西 西安 710064 3.西安建筑科技大學(xué) 信息與控制工程學(xué)院, 陜西 西安 710055
?
基于局部概率可靠度的信息趨向源搜索方法
宋程1, 賀昱曜1, 楊盼盼2, 雷小康3
1.西北工業(yè)大學(xué) 航海學(xué)院, 陜西 西安 710072; 2.長安大學(xué) 電子與控制工程學(xué)院, 陜西 西安 710064 3.西安建筑科技大學(xué) 信息與控制工程學(xué)院, 陜西 西安 710055
信息趨向搜索方法能夠?qū)崿F(xiàn)對(duì)稀疏線索源的有效搜索,但在局部線索稠密或近源區(qū)域存在趨近效率降低及局部自陷問題。為有效引導(dǎo)機(jī)器人向高信息區(qū)域運(yùn)動(dòng)以趨近源,提出了一種基于局部概率可靠度的信息趨向搜索方法。該方法引入一個(gè)與線索捕獲與否相關(guān)的局部概率可靠度,通過調(diào)節(jié)局部概率擾動(dòng)對(duì)信息熵下降方向的影響,實(shí)現(xiàn)在線索稠密和近源區(qū)域的高效趨近。仿真結(jié)果表明,提出的基于局部概率可靠度的信息趨向方法能明顯提升搜索性能,且可有效逃脫局部自陷。
信息熵;稀疏線索;源搜索;局部自陷;信息趨向
近年來,利用稀疏線索和局部信息來搜索追蹤目標(biāo)日益受到機(jī)器人領(lǐng)域研究者的關(guān)注[1-2]。利用機(jī)器人攜帶傳感器自主探測和發(fā)現(xiàn)目標(biāo)(源)釋放的線索——化學(xué)物質(zhì)、光、熱等, 進(jìn)而追蹤此類線索至其源頭位置,是一種搜尋目標(biāo)(源)的有效手段,其在事故救援、泄露檢查[3]、污染源搜尋[4]等方面有著十分廣闊的應(yīng)用前景。
通常在流體環(huán)境中,目標(biāo)釋放的線索被撕裂成煙絲或碎片狀,導(dǎo)致其檢測間斷和稀疏,無法獲得較為穩(wěn)定的濃度梯度,對(duì)搜索者追蹤源頭帶來了嚴(yán)峻的挑戰(zhàn)。然而在自然界中,許多動(dòng)物利用稀疏的氣味線索能夠在復(fù)雜的環(huán)境中尋找食物、配偶、巢穴。例如,雄蛾利用觸角在幾百米外就可以嗅到雌蛾釋放的信息素,從而確定雌蛾位置[5]。鯊魚可以嗅出濃度只有百萬分之一的血腥味,對(duì)數(shù)公里外的獵物進(jìn)行追捕[6]。動(dòng)物在稀薄氣味線索環(huán)境下的嗅覺溯源能力為機(jī)器人搜索釋放源提供了參考和啟發(fā)。
隨著信息論成功解釋了很多生物現(xiàn)象,研究者認(rèn)為“信息”是許多生物嗅覺溯源行為的底層驅(qū)動(dòng)機(jī)制[7]。Vergassola等[8]從信息論角度研究嗅覺行為機(jī)理,首次提出了以信息趨向性(infotaxis)獲取最大信息增益的源搜索策略(亦稱為信息熵決策),成功地揭示了嗅覺溯源現(xiàn)象。Zhang[9]和Voges[10]對(duì)信息趨向性方法和常規(guī)的嗅覺行為模仿方法進(jìn)行了定量比較分析,發(fā)現(xiàn)信息趨向性方法在湍流和噪聲環(huán)境中的搜索效率優(yōu)于嗅覺行為模仿方法。Rodriguez等[11]進(jìn)一步指出,信息趨向性方法對(duì)噪聲和湍流環(huán)境具有良好的魯棒性。最近,Martinez和Moraud等[12-13]發(fā)現(xiàn)信息趨向性的搜索路徑類似于雄蛾追蹤雌蛾的路徑軌跡,這在一定程度上印證了信息趨向性方法符合生物嗅覺溯源行為的機(jī)理。
雖然信息趨向性方法非常適用于線索稀疏情形下源搜索,在搜索效率上表現(xiàn)出比現(xiàn)有基于行為的方法以及基于模型的方法更為優(yōu)越的性能[10,12],并且在路徑形態(tài)上更接近于自然界中生物的溯源嗅覺行為路徑。但是,該方法存在固有缺陷,即在局部線索稠密或近源區(qū)域的搜索性能卻不盡理想[11]。實(shí)驗(yàn)表明,在局部線索稠密或近源區(qū)域的趨近效率低下,搜索路徑存在大量的折轉(zhuǎn),并可能發(fā)生局部自陷問題。Voges等[10]指出信息趨向性搜索策略在近源區(qū)域趨近率低下的原因在于熵降方向發(fā)生頻繁轉(zhuǎn)變增加了許多橫向運(yùn)動(dòng)而非逆風(fēng)運(yùn)動(dòng),致使趨近效率降低。為了克服這一缺陷,Masson等[14]加入了最大似然行為這一生物重要的認(rèn)知方式,以自由能做為決策手段,避免了自陷行為。但是,該方法基于近似貝葉斯后驗(yàn)概率,且依賴于犧牲搜索效率的參數(shù)選擇。Ristic等[15]將巴氏距離結(jié)合到信息趨向策略中,有效提高了趨近效率,但巴氏距離的引入急劇增加了計(jì)算量。
本文在分析源趨近過程中源位置估計(jì)概率遷移對(duì)期望信息梯度影響的基礎(chǔ)上,分析了經(jīng)典信息趨向性方法(infotaxis)存在的不足,指出了一種基于局部概率可靠度的信息趨向源搜索方法(R-infotaxis)。通過引入局部概率可靠度,充分發(fā)揮信息熵在線索稠密和近源區(qū)域的引導(dǎo)作用,得到更為準(zhǔn)確的信息熵下降方向,使經(jīng)典信息趨向方法中搜索與利用的平衡更傾向于搜索。通過在平均路徑長度、趨近效率、信息收集速率等方面與經(jīng)典信息趨向性方法的對(duì)比分析, 驗(yàn)證了所提方法的可行性和有效性。
利用機(jī)器人進(jìn)行源搜索任務(wù),需構(gòu)建包含濃度、風(fēng)速、位置等信息的源線索空間分布的擴(kuò)散模型和傳感器檢測模型。源搜索的基本思路是根據(jù)機(jī)器人的實(shí)時(shí)運(yùn)動(dòng)和檢測到的信息,結(jié)合上述模型采用貝葉斯推理得出源位置的概率分布。本節(jié)對(duì)其中涉及的基本模型加以介紹。
1.1 擴(kuò)散模型
在真實(shí)環(huán)境中,擴(kuò)散的化學(xué)物質(zhì)分子被湍流所擾亂,結(jié)構(gòu)不規(guī)則。在此,采用湍流環(huán)境下常用的統(tǒng)計(jì)氣體擴(kuò)散模型刻畫線索不連續(xù)和隨機(jī)的分布特性。該模型將捕獲線索視為粒子遇碰,以遇碰概率描述線索的空間分布。若設(shè)搜索者在位置r處對(duì)源r0=(x0,y0)釋放的線索進(jìn)行捕獲,則在二維空間中,位置r處的線索捕獲率(采樣率)R(r|r0)為[8]
(1)
1.2 檢測模型
對(duì)于在流體中擴(kuò)散的化學(xué)物質(zhì),傳感器所檢測到的濃度在時(shí)間和空間上存在劇烈波動(dòng),其瞬間濃度梯度易出現(xiàn)突變。為了避免具體濃度數(shù)值的不準(zhǔn)確性,本文采用二值檢測傳感器[16]對(duì)采樣濃度進(jìn)行處理,即當(dāng)傳感器的檢測濃度數(shù)值大于某一閾值便認(rèn)為捕獲線索,感知結(jié)果為“1”。受此作用,在位置r的線索捕獲近似為一個(gè)泊松過程。因此,在有限時(shí)間間隔Δt內(nèi),傳感器在位置r處捕獲z次線索服從泊松分布,其概率為
(2)
式中,λp=R(r|r0)·Δt,其與線索捕獲率成正比。
1.3 貝葉斯推理
由于線索捕獲率與離源距離有關(guān),在機(jī)器人軌跡Γt上發(fā)生的檢測序列[rt1,rt2,…,rtn]就攜帶了源位置信息??衫秘惾~斯推理從軌跡Γt中得到源位置r0概率分布Pt(r0)。定義軌跡Γt的可能性為
(3)
基于此,機(jī)器人經(jīng)歷軌跡Γt后源位置的貝葉斯后驗(yàn)概率Pt(r0|Γt)為[8]
(4)
若不存儲(chǔ)全部路徑信息,則貝葉斯后驗(yàn)概率Pt(r0|Γt)遷移為
(5)
式中,η為機(jī)器人在時(shí)間間隔Δt內(nèi)捕獲線索的次數(shù),Zt+Δt為歸一化常數(shù)。
傳統(tǒng)源搜索策略包括基于濃度的化學(xué)趨向性方法、基于風(fēng)向的風(fēng)趨向性方法等。然而在湍流環(huán)境下,由于局部濃度突變及風(fēng)向不穩(wěn)定,使得化學(xué)趨向性和風(fēng)趨向性方法搜索效率低下甚至不可行。信息趨向性方法將濃度、風(fēng)向、風(fēng)速等融合為“信息”這一單一要素作為搜索者實(shí)施搜索的線索,能有效克服湍流環(huán)境下的源搜索問題[13]。
在信息趨向性方法中,信息熵被作為衡量源位置不確定性的測度。信息熵的變化被作為一種瞬時(shí)勢場,驅(qū)使機(jī)器人向熵降最快的方向移動(dòng),當(dāng)熵值減為0時(shí),即不確定性消失,則認(rèn)為找到源。
(6)
基于(6)式得出的熵減量,選取搜索者當(dāng)前所有可行方向中下降幅度最大者作為搜索者最佳移動(dòng)方向,如此往復(fù),直到源被確認(rèn)。因而信息趨向性方法的本質(zhì)是將源位置的搜索過程轉(zhuǎn)換為信息源的趨近過程。這一策略尤其適用于稀疏線索環(huán)境,然而,該方法由于局部頻繁捕獲引起探索與利用失調(diào)導(dǎo)致在線索稠密或近源區(qū)域產(chǎn)生趨近效率下降和自陷等問題。下文將對(duì)此予以討論并給出改進(jìn)方案。
記搜索者的當(dāng)前位置為rt,候選的行進(jìn)方向?yàn)閞j={·,→,↑,←,↓},分別對(duì)應(yīng)于原處、左、右、前、后5個(gè)方向。在理想情況下,(6)式中的A項(xiàng)僅在源位置后驗(yàn)估計(jì)概率較大且準(zhǔn)確可靠時(shí)發(fā)揮作用。實(shí)際源搜索過程則不然,局部源存在概率Pt(rj)的擾動(dòng)影響A項(xiàng)在信息熵降的比重。
首先考察搜索者當(dāng)前位置rt處捕獲線索與否對(duì)源存在概率Pt(rj)影響,根據(jù)(5)式可得
(7)
該式表明Pt(rj) 受rt處是否捕獲線索的影響。具體而言,(1)若在rt處未能捕獲線索,Pt(rj) 在Pt-Δt(rj)的基礎(chǔ)上減小,即源在rj處的可能性減小。(2)若在r處捕獲到線索,Pt(rj) 在Pt-Δt(rj)的基礎(chǔ)上增大,即源在rj處的可能性增大。
在(6)式中,候選方向rj處源位置后驗(yàn)概率分布Pt(rj)起到調(diào)節(jié)探索(即B項(xiàng))與利用(即A項(xiàng))在信息梯度中相對(duì)權(quán)重的作用。然而,由(7)式可知,搜索過程中Pt(rj)會(huì)存在以下3種擾動(dòng)情況:
1) 捕獲線索與否是個(gè)隨機(jī)過程,其對(duì)于候選運(yùn)動(dòng)方向的后驗(yàn)概率影響很大,尤其是捕獲線索后,Pt(rj)突然增大。
2) 若機(jī)器人在鄰近位置相繼捕獲線索,由此產(chǎn)生的疊加效應(yīng)使得Pt(rj)擾動(dòng)加劇。這一情況在線索稠密和近源區(qū)域表現(xiàn)尤為突出。
3) 在捕獲線索較少時(shí),路徑Γt未包含足夠的源位置信息,導(dǎo)致(5)式估計(jì)出的Pt(rj)不可靠。
由于上述后驗(yàn)概率Pt(rj)的擾動(dòng)存在,使利用項(xiàng)A在信息熵降中比重失調(diào)。尤其是當(dāng)鄰近位置相繼捕獲線索時(shí),Pt(rj)出現(xiàn)突變增大,導(dǎo)致A項(xiàng)在ΔES(rt→rj)中的權(quán)重增加,致使全局的信息熵被局部不可靠概率干擾,機(jī)器人在局部選擇非最佳的前進(jìn)方向。因而,經(jīng)典信息趨向性方法容易產(chǎn)生自陷和趨近效率低下問題。
3.1 局部概率可靠度
鑒于信息趨向方法中的“利用”是以最大似然作為實(shí)現(xiàn)方式。Pt(rj)表現(xiàn)了最大似然的作用強(qiáng)度,其在線索稠密條件下的突然增大會(huì)導(dǎo)致局部最大似然的“過度”作用。事實(shí)上,貝葉斯推理后驗(yàn)概率分布梯度穩(wěn)定性決定了最大似然的可靠程度:遷移變化劇越烈(即梯度越不穩(wěn)定),采用最大似然趨向源位置的可靠度越低;反之,越平緩,梯度越穩(wěn)定,可靠度越高。通過前面分析已知,當(dāng)線索稠密或近源區(qū)域頻繁捕獲線索,Pt(rj)遷移變化劇烈;當(dāng)脫離這個(gè)區(qū)域,Pt(rj)遷移變化平緩。據(jù)此規(guī)律,考慮引入局部概率可靠度加以克服。
記當(dāng)前時(shí)刻至搜索者前次捕獲線索的時(shí)間間隔為tlast,局部概率可靠度β是關(guān)于tlast的函數(shù)。當(dāng)搜索者在位置rt處捕獲到線索時(shí),候選方向rj的源分布概率Pt(rj)突然遷變,此時(shí)可靠度β=0,隨著時(shí)間tlast的增加,局部概率不發(fā)生突然遷變,可靠度β隨之恢復(fù)到1。據(jù)此,將β設(shè)計(jì)成如下形式
(8)
式中,a>0為調(diào)節(jié)參數(shù)。該式實(shí)現(xiàn)可靠度在線索捕獲時(shí)引起局部概率擾動(dòng)情況下動(dòng)態(tài)切換過程。
3.2 改進(jìn)的信息趨向性方法
基于前文分析及相關(guān)定義,本文提出一種基于局部概率可靠度的信息趨向方法。該方法的下一步移動(dòng)到周圍柵格(或者靜止不動(dòng))導(dǎo)致的熵的減小量為
(9)
相較于(6)式、(9)式得到的信息熵減能夠消除局部概率Pt(rj)擾動(dòng)的影響,充分發(fā)揮信息熵這一全局量的引導(dǎo)作用,得到更為準(zhǔn)確的信息梯度方向。當(dāng)機(jī)器人頻繁捕獲線索時(shí),β的引入減弱局部概率擾動(dòng)對(duì)信息梯度影響;當(dāng)脫離局部多次捕獲區(qū)域(即線索稠密和近源區(qū)域),局部概率恢復(fù)對(duì)信息梯度影響。這樣可以避免由局部概率擾動(dòng)引起的趨近效率降低和局部自陷問題。
Infotaxis方法包含“熵減期望”和“最大似然”兩種引導(dǎo)策略。其中熵減期望為探索的實(shí)現(xiàn)方式,最大似然是利用的實(shí)現(xiàn)方式。探索與利用的平衡是以熵減期望和最大似然的權(quán)衡為準(zhǔn)則。熵減期望引導(dǎo)搜索向著期望獲得更多線索的方向(概率集中的區(qū)域),而最大似然趨向估計(jì)的源分布概率最大的位置。與經(jīng)典信息趨向性方法相比,(9)式的最大不同在于通過局部概率可靠度減弱頻繁捕獲線索時(shí)最大似然的作用??煽慷圈略谛畔②呄蚍椒ㄖ杏靡哉{(diào)整最大似然和信息熵梯度的平衡關(guān)系,在Pt(rj)突然增加時(shí)不至于使最大似然作用過度。
另外值得注意的是,本文所提方法與經(jīng)典信息趨向性方法在源確認(rèn)方面認(rèn)知不同。在經(jīng)典信息趨向性方法中,機(jī)器人沿熵降的方向行進(jìn),信息熵為0時(shí)源被確認(rèn),這是信息論視角角下的源確認(rèn)問題。然而我們研究發(fā)現(xiàn)到達(dá)源位置時(shí)的信息熵并不為零。因此,對(duì)于機(jī)器人而言,到達(dá)即為確認(rèn)(源確認(rèn)方法見文獻(xiàn)[17])而非信息論角度下的確認(rèn),這是經(jīng)典信息趨向方法認(rèn)識(shí)上的偏差,其由(6)式中A項(xiàng)作用過強(qiáng)導(dǎo)致。在本文所提方法中,利用局部概率可靠度使捕獲線索頻繁時(shí)傾向于B項(xiàng),即強(qiáng)化探索的作用,更有利于趨近源位置。
3.3 算法流程
基于局部概率可靠度的信息趨向性方法的具體步驟如下:
Step1 初始化后驗(yàn)概率Pt(r0)和信息熵St;
Step2 計(jì)算在每個(gè)rj處期望捕獲線索次數(shù)h(rj),h(rj)=Δt∫Pt(rx)R(rj|rx)drx。進(jìn)而計(jì)算在rj處Δt時(shí)間內(nèi)捕獲k次線索的概率ρk(rj)=hke-h/k!;
Step4 計(jì)算可靠度β;根據(jù)公式(9)計(jì)算由位置rt移動(dòng)到rj可能引起的信息熵變化ΔES(rt→rj),選擇其中ΔES(rt→rj)變化最大的rj作為最佳移動(dòng)位置;
Step5 記錄在t時(shí)刻位置rt移動(dòng)到t+Δt時(shí)刻位置rj的時(shí)間Δt內(nèi),捕獲的線索數(shù)量η=0,1,2,…;
Step6 根據(jù)公式(5)更新后驗(yàn)概率Pt(r0)為Pt+Δt(r0)以及相應(yīng)的信息熵由St更新為St+Δt;
Step7 返回step2,直至到達(dá)源所在位置結(jié)束。
本節(jié)通過數(shù)值仿真實(shí)驗(yàn),分析比較本文所提R-infotaxis方法與經(jīng)典infotaxis方法利用稀疏線索源搜索性能,驗(yàn)證所提方法的可行性和有效性。
4.1 仿真環(huán)境
實(shí)驗(yàn)中采用Balkovsky的格構(gòu)煙羽模型生成煙羽,實(shí)現(xiàn)方法詳見文獻(xiàn)[18],并考慮增加了氣味粒子的短暫壽命。實(shí)驗(yàn)的仿真參數(shù)設(shè)置如下[9]:粒子擴(kuò)散率D=1,粒子生命周期τ=50,源釋放率Q=1,平均風(fēng)速V=1,傳感器的測量半徑α=0.5。搜索空間為100×100,源的位置隨機(jī)指定。可靠度β的計(jì)算式(8)中參數(shù)a=100。所有數(shù)值仿真在MATLAB中進(jìn)行。
4.2 分析指標(biāo)
為了便于分析和評(píng)價(jià)機(jī)器人的搜索性能,定義以下一組指標(biāo):
1) 路徑長度:機(jī)器人完成搜索任務(wù)所經(jīng)歷的軌跡長度,即從起始位置到達(dá)源所在位置的歐式距離,是衡量搜索方法優(yōu)劣的基本指標(biāo)。
2) 趨近效率:逆風(fēng)運(yùn)動(dòng)在搜索過程中所有運(yùn)動(dòng)中所占的比重。機(jī)器人在搜索過程中運(yùn)動(dòng)包括橫越運(yùn)動(dòng)(traverse)、逆風(fēng)運(yùn)動(dòng)(upwind)和順風(fēng)運(yùn)動(dòng)(downwind)3種運(yùn)動(dòng)形式。其中,逆風(fēng)運(yùn)動(dòng)對(duì)源搜索最為有效,可用于評(píng)價(jià)搜索運(yùn)動(dòng)的有效性(路徑質(zhì)量)。
3) 信息收集速率:源搜索過程中信息熵時(shí)間演化曲線的斜率。源搜索任務(wù)可視為趨向信息源的過程,源趨近過程中的線索捕獲即為信息收集。信息熵的變化可以實(shí)時(shí)反映這一過程的進(jìn)度。
4.3 仿真結(jié)果
為了直觀展示R-infotaxis的源搜索性能,圖1給出了一組不同起始位置下R-infotaxis方法的典型搜索路徑。為了便于比較,圖中同時(shí)給出了相同條件下經(jīng)典infotaxis方法的搜索路徑??梢钥闯?從不同的起始位置出發(fā),2種方法均能完成源搜索任務(wù),但兩者的搜索路徑存在顯著差異。(1)路徑細(xì)節(jié)方面,經(jīng)典infotaxis方法的搜索路徑曲折,存在較多折轉(zhuǎn),且折轉(zhuǎn)多發(fā)生于線索剛捕獲時(shí);R-infotaxis的路徑更為平直,尤其在近源區(qū)域,其路徑徑直奔向源位置。(2)經(jīng)典infotaxis路徑中多次出現(xiàn)局部重復(fù)搜索的自陷問題(如圖1a)所示)。由此可見,R-infotaxis的搜索表現(xiàn)好于infotaxis。
圖1 經(jīng)典infotaxis方法與R-infotaxis方法的搜索路徑比較
圖2進(jìn)一步展示了機(jī)器人搜索的動(dòng)態(tài)過程,圖中灰色部分顯示源位置的后驗(yàn)概率Pt(r0),其灰度反映了源存在概率的高低。從中可以看出:(1)隨著機(jī)器人運(yùn)動(dòng)不斷捕獲線索,源位置估計(jì)概率發(fā)生遷移,最終高概率區(qū)域涵蓋源所在位置;(2)infotaxis方法在相繼捕獲線索時(shí),鄰近區(qū)域概率突增(灰度加深,如圖2a)~圖2c)所示),容易誘發(fā)局部回轉(zhuǎn)甚至引發(fā)自陷問題;反觀R-infotaxis方法即便在連續(xù)捕獲線索的情況下基本不受局部概率增加的影響,不發(fā)生折轉(zhuǎn),傾向于前向運(yùn)動(dòng)(如圖2d)~圖2f)所示)。
圖2 infotaxis(a~c)和R-infotaxis(d~f)搜索的動(dòng)態(tài)過程
上述仿真實(shí)例定性地驗(yàn)證了R-infotaxis方法對(duì)經(jīng)典infotaxis方法的搜索性能提升。下面利用Monte Carlo仿真實(shí)驗(yàn),基于路徑長度、趨近效率、信息收集效率等量化指標(biāo)對(duì)兩者做進(jìn)一步比較實(shí)驗(yàn)研究。為減少誤差,下述所有結(jié)果均取50次獨(dú)立仿真的平均值,仿真條件如圖1a)所示。
1) 路徑長度
表1給出了路徑長度統(tǒng)計(jì)結(jié)果,可以看出,(1)本文提出的R-infotaxis方法平均路徑長度相對(duì)于經(jīng)典infotaxis方法縮短了約20%;(2)在最短路徑方面,較經(jīng)典方法可縮短近28%;(3)在最長路徑方面,R-infotaxis較經(jīng)典方法優(yōu)勢不甚顯著,這表明R-infotaxis能以更短路徑完成源搜索任務(wù)。
表1 搜索路徑長度比較
2) 趨近效率
圖3給出了搜索路徑中逆風(fēng)、橫越、順風(fēng)等運(yùn)動(dòng)成分(依據(jù)折轉(zhuǎn)方向統(tǒng)計(jì))的占比分布??梢钥闯觯?1) 3種運(yùn)動(dòng)中逆風(fēng)運(yùn)動(dòng)占比最高,顯示出整體徑向趨近于源(見圖1a));橫越風(fēng)運(yùn)動(dòng)占比適中,有利于探索范圍的擴(kuò)展;順風(fēng)和停留運(yùn)動(dòng)占比最少,可減少無效運(yùn)動(dòng)。(2) 相較經(jīng)典infotaxis而言,R-infotaxis方法提高了逆風(fēng)運(yùn)動(dòng)的比重,由51.3%提高到62.4%, 這是搜索路徑質(zhì)量得以提高的主要因素;橫越風(fēng)運(yùn)動(dòng)由39.5%降到34.3%,無效運(yùn)動(dòng)也降到極低的3.3%, 這些減少可一定程度上減少回轉(zhuǎn)。究其原因,這是由于可靠度 的引入,使得前向性得到加強(qiáng),搜索者傾向于逆流而上,同時(shí)保持一定的橫越風(fēng)運(yùn)動(dòng),以保持橫向搜索能力。
圖3 運(yùn)動(dòng)成份對(duì)比
3) 信息收集速率
為了量化分析R-infotaxis方法與經(jīng)典infotaxis方法的信息收集速率的差異,圖4給出了圖1a)所示R-infotaxis和infotaxis搜索過程對(duì)應(yīng)的信息熵時(shí)間演化曲線和相應(yīng)的線索捕獲量。
圖4 信息熵變化曲線
從中可以看出,整個(gè)搜索過程可以明顯分成2個(gè)階段:(1)初始階段(0~80),兩者曲線基本重合,這表明在線索稀疏情況下信息收集速率無較大差異。(2)后期階段(>80),R-infotaxis的熵曲線下降趨勢明顯快于infotaxis,這表明R-infotaxis具有更快的信息收集速率,即趨向信息源的進(jìn)程更快。出現(xiàn)上述情形的原因在于:初始階段線索稀疏,R-infotaxis方法退化為經(jīng)典infotaxis方法,故兩者的信息熵時(shí)間演化曲線基本重合;之后,隨著線索捕獲逐漸增多,R-infotaxis方法中最大似然作用減弱,機(jī)器人繼續(xù)沿著期望熵降方向行進(jìn),而infotaxis方法受局部最大似然作用較強(qiáng),局部折轉(zhuǎn)增加,導(dǎo)致其信息收集速率低于R-infotaxis方法??傮w而言,本文提出的R-infotaxis方法擁有更高的信息收集速率。
綜合以上多方面對(duì)比,本文提出的R-infotaxis方法較經(jīng)典infotaxis方法的搜索性能更為優(yōu)良,其搜索路徑更短、趨近效率更高、信息收集速率更快。
針對(duì)經(jīng)典infotaxis方法在線索稠密和近源區(qū)域存在趨近效率低下及自陷的問題,通過分析得出了局部概率擾動(dòng)是局部最大似然過渡作用,導(dǎo)致趨近效率降低。據(jù)此引入了局部概率可靠度,用以調(diào)整在線索頻繁捕獲時(shí)最大似然作用強(qiáng)度。進(jìn)而,提出了一種新的基于概率可靠度的信息趨向方法,從而保證以良好的趨近效率趨近源。最后實(shí)驗(yàn)比較了本文提出的基于概率可靠度的信息趨向方法和經(jīng)典信息趨向方法的搜索性能,分別考察了平均路徑長度、信息收集速率、趨近效率。結(jié)果表明,基于局部概率可靠度的信息趨向方法在這些方面的表現(xiàn)優(yōu)于經(jīng)典信息趨向方法,更適應(yīng)于局部稠密和稀疏等復(fù)雜的環(huán)境。
[1] Ishida H, Wada Y, Matsukura H. Chemical Sensing in Robotic Applications: A Review[J]. IEEE Sensors Journal, 2012, 12(11): 3163-3173
[2] Lilienthal A J, Loutfi A, Duckett T. Airborne Chemical Sensing With Mobile Robots[J]. Sensors, 2006, 6(11): 1616-1678
[3] Ishida H, Nakayama G, Nakamoto T, et al. Controlling a Gas/Odor Plume-Tracking Robot Based On Transient Responses Of Gas Sensors[J]. IEEE Sensors Journal, 2005, 5(3):537-545
[4] Woodfin R L. Trace Chemical Sensing of Explosives[M]. John Wiley & Sons, 2006
[5] Vickers N J. Mechanisms of Animal Navigation in Odor Plumes[J]. The Biological Bulletin, 2000, 198(2): 203-212
[6] Gardiner J M, Atema J. The Function of Bilateral Odor Arrival Time Differences in Olfactory Orientation of Sharks[J]. Current Biology, 2010, 20(13): 1187-1191
[7] Linsker R. Perceptual Neural Organization : Some Approaches Based on Network Models and Information Theory[J]. Annual Review of Neuroscience, 1990, 13(1): 257-281
[8] Vergassola M, Villermaux E, Shraiman I. “Infotaxis” As a Strategy for Searching without Gradients[J]. Nature, 2007, 445(7126): 406-409
[9] 張思齊, 崔榮鑫, 徐德民. 稀疏環(huán)境中信息趨向性搜索算法性能分析[J]. 機(jī)器人, 2013, 35(4): 432-438
Zhang S Q, Cui R X, Xu D M. Performance Analysis on The Infotaxis Algorithm for Searching in Dilute Environments[J]. Robot, 2013, 35(4): 432-438 (in Chinese)
[10] Voges N, Chaffiol A, Lucas P, et al. Reactive Searching and Infotaxis in Odor Source Localization[J]. Plos Computational Biology, 2014, 10(10):e1003861-e1003861
[11] Rodrguez J D, Gmez-Ullate D, Meja-Monasterio C. Limits on the Performance of Infotaxis under Inaccurate modelling of the Environment[J]. Eprint Arxiv, 2014, 1408(1873): 1-8
[12] Martinez D, Martin-Moraud E. Reactive and Cognitive Search Strategies for Olfactory Robots[J]. Neuromorphic Olfaction, 2013(5): 153-172
[13] Moraud E M, Martinez D. Effectiveness and Robustness of Robot Infotaxis for Searching in Dilute Conditions[J]. Frontiers in Neurorobotics, 2010, 4(4):1-8
[14] Masson J B. Olfactory Searches with Limited Space Perception[J]. Proceedings of the National Academy of Sciences, 2013, 110(28): 11261-11266
[15] Ristic B, Skvortsov A, Gunatilaka A. A Study of Cognitive Strategies for an Autonomous Search[J]. Information Fusion, 2016, 28(C):1-9
[16] Ristic B, Gunatilaka A, Gailis R. Achievable Accuracy in Gaussian Plume Parameter Estimation Using a Network of Binary Sensors[J]. Information Fusion, 2015, 25(32): 42-48
[17] Hayes A T, Martinoli A, Goodman R M. Distributed Odor Source Localization[J]. IEEE Sensors Journal, 2002, 2(3): 260-271
[18] Balkovsky E, Shraiman B I. Olfactory Search at High Reynolds Number[J]. Proceedings of the National Academy of Sciences, 2002, 99(20): 12589-12593
An Infotaxis Strategy for Seeking a Dispersion Source Using Local Probabilistic Reliability
Song Cheng1, He Yuyao1, Yang Panpan2, Lei Xiaokang3
1.School of Marine Science and Technology, Northwestern Polytechnical University, Xi′an 710072, China 2.School of Electronic and Control Engineering, Chang′an University, Xi′an 710064, China 3.School of Information and Control Engineering, Xi′an University of Architecture and Technology, Xi′an 710055, China
Infotaxis search can effectively navigate the robot to a dispersion source using sporadic cues. But low efficiency and local self-trapping problems come out in the dense cues or near-source area for this method. After analyzing the causes of these problems, a novel infotaxis method based on a local probability reliability is proposed. In this method, a reliability factor related to cues capturing is introduced. It is used to adjust the influence of the local probability disturbance on the drop trend of information entropy. Through guiding the robot to high information zone, the dispersion source can be approached. The simulation results demonstrate that the proposed infotaxis method presents a good search performance in sparse and dense cues environment, which can also effectively escape from local self-trapping.
entropy, sporadic cues, source seeking, local self-trapping, infotaxis
2016-03-17
國家自然科學(xué)基金(61271143)資助
宋程(1987—), 西北工業(yè)大學(xué)博士研究生, 主要從事智能導(dǎo)航和控制研究。
TP273
A
1000-2758(2016)05-0843-08