楊忠 劉華春
摘要:傳統(tǒng)的尋路算法通常用在已知地形結(jié)構(gòu)的基礎(chǔ)上規(guī)劃路線,而掃地機(jī)器人的工作環(huán)境通常是陌生的,傳統(tǒng)尋路算法在此失效。該文結(jié)合BP神經(jīng)網(wǎng)絡(luò)的特性,提出一種基于BP神經(jīng)網(wǎng)絡(luò)的掃地機(jī)器人尋路算法,目標(biāo)是使掃地機(jī)器人能夠在任何陌生的環(huán)境中正確地完成尋路任務(wù),通過分析掃地機(jī)器人的清掃模式,建立觀察模型和運(yùn)動(dòng)模型,利用MatLab實(shí)現(xiàn)對(duì)應(yīng)的BP神經(jīng)網(wǎng)絡(luò),并對(duì)傳統(tǒng)BP網(wǎng)絡(luò)激勵(lì)函數(shù)進(jìn)行了優(yōu)化,最后經(jīng)過訓(xùn)練和仿真驗(yàn)證了算法的有效性和實(shí)用性。
關(guān)鍵詞:尋路算法;掃地機(jī)器A-;BP神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):TPl8
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2017)10-0156-03
隨著科技的不斷進(jìn)步,智能家居理念逐步滲透了現(xiàn)代生活中,智能掃地機(jī)器人日益流行起來,很多廠家都開始生產(chǎn)智能掃地機(jī)器人。過去機(jī)器人通常只能完成一些簡單的任務(wù),但隨著人工智能、傳感器技術(shù)的發(fā)展,機(jī)器人的功能得到了很大的升級(jí)和改善,加上網(wǎng)絡(luò)推廣,智能掃地機(jī)器人已經(jīng)真正地進(jìn)入人們的日常生活。智能掃地機(jī)器人能在無人監(jiān)督的情況下通過紅外線傳感器、超聲波傳感器、陀螺儀、電子羅盤、室內(nèi)GPS等傳感器設(shè)備掃描并學(xué)習(xí)房間局部戶型結(jié)構(gòu),規(guī)劃路徑完成房間的清潔任務(wù)。通常由于所處位置的局限性和現(xiàn)代住房結(jié)構(gòu)復(fù)雜等因素,難以獲得完整準(zhǔn)確的戶型結(jié)構(gòu)圖,而要求用戶事先將戶型圖輸入機(jī)器人也不現(xiàn)實(shí),因此清掃路徑的規(guī)劃是整個(gè)清掃活動(dòng)的難點(diǎn)。目前通常采取線性算法進(jìn)行路徑規(guī)劃,通過傳統(tǒng)程序設(shè)計(jì)模式編程實(shí)現(xiàn)。這種方式導(dǎo)致掃地機(jī)器人智能程度不高,在遇到一些特殊情況時(shí),導(dǎo)致整個(gè)清掃工作中斷。
1.問題分析
掃地機(jī)器人按清掃路線形式可分為規(guī)劃式和隨機(jī)式兩類。目前,掃地機(jī)器人大部分都采取隨機(jī)式掃地機(jī),即不規(guī)劃路線,掃到哪算哪,碰到障礙物自己走開。規(guī)劃式清掃模式:掃地機(jī)器人感知四周的環(huán)境,然后規(guī)劃行走的路徑,有效地遍歷各個(gè)區(qū)域,完成各個(gè)區(qū)域的打掃。規(guī)劃式清掃模式的行走路徑方式有螺旋式行走模式,S形行走模式,五邊形行走模式。其中,以螺旋行走模式的清掃效率最高,它最大程度的避免了重復(fù)路線。但單一的規(guī)劃式清潔模式,始終不能完美解決障礙物問題,螺旋行走模式以程序的形式編寫進(jìn)掃地機(jī)器人控制中心計(jì)算機(jī),它只能以固定不變的路徑完成清掃任務(wù),在途中若遇到形狀復(fù)雜、面積較大的障礙物,如茶幾,甚至人、寵物等隨機(jī)移動(dòng)的物體時(shí),路線即被中斷。目前多采取在主路徑規(guī)劃算法中嵌套避開障礙物的算法,如繞行障礙物后校正角度返回原路徑,或從拓?fù)鋵W(xué)的角度提出新算法如等單元分解法來解決掃地機(jī)器人遍歷過程中遇到障礙的問題,但這些解決辦法通常產(chǎn)生較大的角度誤差,缺乏靈活性,增大了重復(fù)路徑的概率,甚至在一些特殊情況下方法失效。為此,引入神經(jīng)網(wǎng)絡(luò)算法結(jié)合以上的螺旋式行走模式,提出一種基于BP神經(jīng)網(wǎng)絡(luò)的尋路算法,從而達(dá)到在陌生的環(huán)境中掃地機(jī)器人“完全自主”完成清掃任務(wù)的目標(biāo)。
2.BP神經(jīng)網(wǎng)絡(luò)(簡介原理)
BP網(wǎng)絡(luò)全稱為(Back Propagation Network),它是最早由科學(xué)家Rumelhart和McCelland提出,是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。其特點(diǎn)是在理論上可根據(jù)問題規(guī)模無限擴(kuò)大網(wǎng)絡(luò)規(guī)模,通過學(xué)習(xí)算法存儲(chǔ)海量的輸入一輸出模式映射關(guān)系,相較傳統(tǒng)的通過線性數(shù)學(xué)方程描述映射關(guān)系的方法,BP網(wǎng)絡(luò)有著不可比擬的優(yōu)勢。BP網(wǎng)絡(luò)在學(xué)習(xí)過程中采用最速下降法,并通過反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小。BP神經(jīng)網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)包括輸入層、隱層和輸出層,圖1展示了一個(gè)簡單的三層BP網(wǎng)絡(luò)。
3.系統(tǒng)模型
根據(jù)BP神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)建立輸入和輸出模型,即運(yùn)動(dòng)模型和觀測模型。
5.仿真實(shí)驗(yàn)
在利用神經(jīng)網(wǎng)絡(luò)建立尋路模型的過程中,最重要的一步就是對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,從而確定網(wǎng)絡(luò)中各神經(jīng)元之間的連接權(quán)值。在訓(xùn)練之前,需要將樣本數(shù)據(jù)集隨機(jī)分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)兩部分。編程對(duì)掃地機(jī)器人尋路過程進(jìn)行仿真實(shí)驗(yàn),其中用二維數(shù)組對(duì)戶型結(jié)構(gòu)進(jìn)行保存,以螺旋式行走模式為基礎(chǔ)算法,編程生成2000組數(shù)據(jù)作為樣本,選取其中1200組作為訓(xùn)練樣本對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,600組作為測試,200組仿真,網(wǎng)絡(luò)設(shè)置1個(gè)隱藏層,隱藏層神經(jīng)元數(shù)為20,修正權(quán)系數(shù)為0.9,初始學(xué)習(xí)速率為0.3,初始連接權(quán)值隨機(jī)生成,網(wǎng)絡(luò)輸出形式表示為矢量(v,ω),其中,v為線速度,ω為旋轉(zhuǎn)角速度。調(diào)用matlab創(chuàng)建BP網(wǎng)絡(luò):newff(0 6),(20,2),tansig,logsigEX,traingdx,其中l(wèi)ogsigEX為改進(jìn)后的激勵(lì)函數(shù)。
6.實(shí)驗(yàn)結(jié)果分析
利用matlab對(duì)掃地機(jī)器人尋路模型BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練結(jié)果如圖3所示,從圖中可以看出網(wǎng)絡(luò)在87次訓(xùn)練時(shí)趨于穩(wěn)定,之后的權(quán)值調(diào)整幾乎為零,網(wǎng)絡(luò)達(dá)到收斂,在后繼測試中,基于BP神經(jīng)網(wǎng)絡(luò)算法的螺旋式尋路算法很好完成了掃地機(jī)器人路徑尋優(yōu)任務(wù),有效地解決了障礙物導(dǎo)致的清掃路徑重復(fù),提高了清潔效率。
7.結(jié)論
分析了目前掃地機(jī)器人尋路算法所存在的問題,基于BP神經(jīng)網(wǎng)絡(luò),提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的掃地機(jī)器人尋路算法。建立了掃地機(jī)器人的運(yùn)動(dòng)模型和觀測模型,根據(jù)模型設(shè)計(jì)出三層BP神經(jīng)網(wǎng)絡(luò),利用matlab對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和仿真實(shí)驗(yàn),仿真實(shí)驗(yàn)結(jié)果表明基于BP神經(jīng)網(wǎng)絡(luò)的掃地機(jī)器人尋路算法有效避免了路徑重復(fù),解決了前述障礙物問題,算法具有一定實(shí)用價(jià)值。