趙詣 李徽
摘要:在視覺同步定位與建圖算法中,定位問題一直困擾著研究者們。閉環(huán)誤差、絕對定位誤差和相對定位誤差決定著機器人工作的精確度。本文提出了一種加入開運算的地面紋理識別算法,并通過所識別的信息來構建準確的地圖,達到提高室內服務機器人定位精度的目的。
關鍵詞:開運算;地面紋理;紋理識別
中圖分類號:TP242.6 文獻標識碼:A
隨著科技的進步,智能機器人已經隨處可見。從小型的家用掃地機器人到飯店的機器人服務員,室內服務機器人和我們的生活已經密不可分。視覺同步定位及建圖(以下簡稱視覺SLAM)技術,以其優(yōu)秀的定位導航性能被廣泛應用于無人駕駛和特殊地區(qū)的室內導航[1]?,F(xiàn)在也有許多國內外研究者在研究如何將視覺SLAM技術應用到室內服務機器人上,然而這些研究普遍存在一個問題,那就是在大型空間中,由于環(huán)境的空曠以及缺少能提供定位的特征,回環(huán)檢測誤差和絕對定位誤差一直無法保證[2]。許多研究者都致力于研究通過建筑的結構線來進行定位,然而地面的紋理卻很少被人關注,通過垂直向下的相機獲取紋理來構建線性路標圖,非常符合貝葉斯濾波的前提條件。如果使用這些線性路標建圖,可以極大減少絕對定位誤差,提高室內服務機器人的定位精度[3]。但傳統(tǒng)的圖像處理算法處理地面紋理時非常容易出現(xiàn)失誤,因此本文在傳統(tǒng)流程中加入了開運算算法,具體流程如下圖1。
1 邊界提取
家用地板基本都是拼接而成,而其接縫對于視覺SLAM來說就是良好的線性特征。而通過攝像機采集到的圖像基本都存在一定的噪聲。所以在識別圖像之前,我們需要對圖像使用高斯變換來去除這些噪點。對圖像使用高斯變換之后,圖像明顯更加平滑,圖像中的大部分噪點也消除了。
在濾波之后,我們需要提取圖像中的有用信息,而照片中的地面紋理大多隱藏在色塊之間。通過將圖像轉化成灰度圖,我們可以使用Canny邊緣檢測將圖像中的邊界以二值圖的方式輸出,方便我們之后的處理[4]。在經過數次Canny邊緣檢測的高低閾值調整之后,高低閾值分別定為35和15。
2 開運算
Canny邊緣檢測后的效果依舊達不到實驗所需的程度。由于地板邊緣的圓角或邊緣的缺口,圖像中出現(xiàn)了許多小“毛邊”。而開運算就是用來處理這些毛邊的。先進行腐蝕運算再進行膨脹運算的過程被稱為開運算。腐蝕運算的作用是消除目標像素周圍的“毛邊”,但同樣也有一些正確的邊界被去除了。這時,我們要使用膨脹運算將錯誤去除的邊界補充回來。同時,因為處理對象基本都為直線,所以在使用開運算時,需要通過程序控制其處理結果向直線靠攏。經過試驗發(fā)現(xiàn),大部分的邊界可以在一次開運算后去除,但仍有一部分樣本需要進行2次開運算后才能去除。為了穩(wěn)妥起見[5],本文使用的算法將會迭代使用3次開運算。通過迭代使用開運算之后,我們得到了極其平滑的圖像,對比開運算處理之前的圖像,圖像中直線的識別率和識別準確率大大提高。
3 霍夫變換
霍夫變換,就是一個可以讓電腦自己學會找直線的算法,霍夫變換這個概念在1962年被提出,后于1972年由Richard Duda和Peter Hart推廣使用,但是當時計算機還非常落后,到1980年前后個人計算機才開始普及,所以當時的應用并不廣泛。在今天,人工智能飛速發(fā)展,特征提取的需求越來越大,人工對于數據進行標記所耗費的時間和精力太大,霍夫變換這種可以在復雜場景中提取特征的算法就有了非常廣泛的應用。技術人員在使用霍夫變換時,先建個坐標系:正交直角坐標系,以圖片的左上角作為起始點,以像素作為標度,那么它們對應的曲線就會經過同一點,這個點就是原圖中的直線的原點距和角方向所對應的參數點,這條直線上的所有點所描出的曲線都會經過這個點。在霍夫變換后的仿射參數空間,這個點就會被點亮。我們可以通過尋找霍夫變換后的參數空間上的亮點來確定原空間上的直線的位置的方向。但是在這一過程中需要注意的是,傳統(tǒng)的霍夫變換是采用y=ax+b的斜截式來表示點的坐標,會得出許多近似結果,同時也無法得到線條兩個端點的坐標。所以我們需要使用其改進版本的漸進概率霍夫變換來解決這個問題。漸進概率霍夫變換采用的是極坐標下的點和線方程來表達,并通過概率方法獲得兩個端點及其坐標,識別之后的直線可以轉換成向量形式方便建圖,完美地契合了我們的要求。
4 實驗和結論
實驗平臺使用的是桌面級的志強E3 1230v3處理器,分別對垂直向下的相機所采集的高低質量圖像(1920×1080像素以及480×320像素)進行了分析。A組圖像使用瓷磚地板,共采集10張圖片,改變分辨率處理后為20張;B組圖像使用木地板,圖片數量與A組相同;C組圖像使用大理石地板,圖片數量與A組相同;D組圖像則從家中隨機地點選擇10張照片包含不同地板拼接處,同樣進行分辨率處理。
在實驗結果中,A組的高分辨率圖像中存在4張圖像受瓷磚地板反光影響,識別出錯誤的直線,而低分辨率的圖像中,則不存在這個問題,全部識別正確;B組的高分辨率圖像中,由于木地板拼接邊緣不平整出現(xiàn)了大量“毛邊”,但經過3次開運算迭代后,沒有出現(xiàn)誤識別的情況,低分辨率組同樣沒有出現(xiàn)誤識別;C組的高分辨率圖像中,有8張圖片出現(xiàn)了誤識別,而低分辨率組則有3張出現(xiàn)了誤識別,這是由于粗糙的大理石地板具有幾何形狀的紋理所導致的,算法誤將其幾何紋理識別成了接縫;D組中的圖像全部識別正確,開運算有效去除了兩種不同地板拼接時產生的毛邊。
總而言之,本文所提到的圖像處理方法存在以下幾點不足。
(1)在處理高分辨率圖像時算法多次出現(xiàn)誤識別,從Canny邊緣檢測的結果中能發(fā)現(xiàn)主要原因是高分辨率的圖像所包含的噪點以及邊界處理后的毛邊更多,3次迭代開運算都無法將其去除,有的圖片甚至需要迭代高斯變換濾波。但多次迭代算法雖然能提高精確度,卻大大增加了運算時間。在處理高分辨率的圖像時,即便使用桌面級的處理器,仍需要0.7~1.2s才能獲得結果,算力低下的微處理器更加無法勝任。
(2)地板的反光、紋理對實驗影響嚴重,由于Cannny邊緣檢測同樣會把反光以及地板本身的紋理檢測出來,所以在圖像分辨率高的情況下,影響比較嚴重。
在面對高分辨率圖像時,實驗算法的成功率不高,時間也不符合所需要求,但對于低分辨率的圖像,算法的成功率很高,每張圖片的平均處理時間也不到0.1s,非常適合處理連續(xù)輸入的圖像,符合視覺SLAM的實時反饋要求。同時,通過優(yōu)化室內服務機器人的外形,如加遮光物、提供人造光源等來優(yōu)化攝像環(huán)境,也能一定程度上減輕反光對結果的影響[6]。最后對于大理石地板本身具有的紋理,其同樣可以作為地面紋理進行建圖,增加室內服務機器人的定位精度。在今后的研究中,筆者會著重研究如何解決這些問題,并使用現(xiàn)有成果繼續(xù)構建路標以及地圖。
參考文獻
[1] 仉新,張禹,蘇曉明.移動機器人自主定位和導航系統(tǒng)設計與實現(xiàn)[J].機床與液壓,2020,48(10):88-91.
[2] 王小濤,張家友,王邢波,等.基于FastSLAM的繩系機器人同時定位與地圖構建算法[J/OL].航空學報:1-10[2020-08-05].http://kns.cnki.net/kcms/detail/11.1929.V.20200521.1548.010.html.
[3] 李鑫,仲訓昱,彭俠夫,等.基于多分辨率搜索與多點云密度匹配的快速ICP-SLAM方法[J/OL].機器人:1-12[2020-08-05].https://doi.org/10.13973/j.cnki.robot.190595.
[4] 王勇.基于混沌特征向量的動態(tài)紋理識別[D].上海:上海交通大學.2017.
[5] 王佳奕,葛玉榮.基于Contourlet變換和支持向量機的紋理識別方法[J].計算機應用.2018,03(1):19-22.
[6] 徐久成,李曉艷,張靈均,等.基于粗糙粒模型的圖像紋理識別和檢索[J].模式識別與人工智能.2018(4):15-18.