国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

單目視覺移動(dòng)機(jī)器人導(dǎo)航算法研究現(xiàn)狀及趨勢

2021-03-09 16:40:56方東君李維剛
關(guān)鍵詞:單目移動(dòng)機(jī)器人機(jī)器人

蔣 林,方東君,雷 斌,李維剛

1.武漢科技大學(xué) 冶金裝備及其控制教育部重點(diǎn)實(shí)驗(yàn)室,武漢430081

2.武漢科技大學(xué) 機(jī)器人與智能系統(tǒng)研究院,武漢430081

移動(dòng)機(jī)器人在人們生活中的應(yīng)用愈加廣泛,如家政、救災(zāi)、安防等方面。為了使機(jī)器人能按照人的需求完成任務(wù),需要機(jī)器人能擁有自主判斷周遭環(huán)境并進(jìn)行路徑規(guī)劃的能力。目前,移動(dòng)導(dǎo)航機(jī)器人常用的傳感器按照安裝位置可以分為內(nèi)部與外部傳感器[1]:內(nèi)部傳感器例如激光、雷達(dá)、視覺、IMU等,從環(huán)境中提取特征點(diǎn)建立模擬環(huán)境,間接性為機(jī)器人提供環(huán)境信息,易受噪聲影響;外部傳感器有GPS、導(dǎo)軌、標(biāo)志物等,通過預(yù)先標(biāo)定,直接為機(jī)器人提供環(huán)境信息,受噪聲影響較小。由于GPS在室內(nèi)失效、標(biāo)志物繁瑣且各個(gè)室內(nèi)環(huán)境布局各不相同,不能布置導(dǎo)軌等因素導(dǎo)致外部傳感器已逐漸不能滿足多樣化的環(huán)境應(yīng)用,而激光、視覺等內(nèi)部傳感器近年來由于其可跟隨性和較好的魯棒性,在機(jī)器人導(dǎo)航領(lǐng)域的研究中占據(jù)了主導(dǎo)市場。

激光雷達(dá)擁有精確、快速、計(jì)算量小的特點(diǎn),在機(jī)器人導(dǎo)航中可以較為方便地獲取環(huán)境深度信息,但存在價(jià)格昂貴、體積大等問題[2]。視覺傳感器便宜、輕量、信息豐富,且擁有較好的隱蔽性,但計(jì)算量大、對(duì)環(huán)境假設(shè)性強(qiáng)且易受干擾[3]。一系列實(shí)驗(yàn)證明,視覺傳感器受磁場或傳感器相互間干擾影響較小,將視覺應(yīng)用到機(jī)器人上是目前最為接近人類的方式使機(jī)器人感知到環(huán)境[4]。在采樣速率上,由于可以使用高速的視頻采集卡,所以視覺傳感器的速率遠(yuǎn)高于激光雷達(dá)。從前面兩者的外型、應(yīng)用等方面的比較不難看出,將視覺傳感器融入移動(dòng)機(jī)器人導(dǎo)航技術(shù)對(duì)智能機(jī)器人的發(fā)展有不可估量的作用。

在視覺導(dǎo)航算法中,有單目、雙目、RGB-D、多目相機(jī)作為主流的應(yīng)用傳感器。雙目系統(tǒng)可以簡便地計(jì)算出深度且距離不受限,但隨著精度要求的提高,配置和計(jì)算量上負(fù)擔(dān)也很大,如文獻(xiàn)[5-6]提出的雙目定位、導(dǎo)航系統(tǒng);RGB-D相機(jī)雖然有距離限制,但可以主動(dòng)獲取深度信息且計(jì)算簡便,如文獻(xiàn)[7]即是利用該優(yōu)勢提出RGBDSLAM實(shí)現(xiàn)了比ORBSLAM更高的定位精度;單目相機(jī)相比于前面兩者擁有成本低、距離不受限的優(yōu)勢,而且在機(jī)器人應(yīng)用中的魯棒性和效率上達(dá)到了不錯(cuò)的平衡?,F(xiàn)階段的單目導(dǎo)航算法經(jīng)過學(xué)者的努力已實(shí)現(xiàn)目標(biāo)檢測、單目測距、跟蹤等任務(wù),文獻(xiàn)[8-14]是在單目的基礎(chǔ)上實(shí)現(xiàn)了導(dǎo)航與定位,取得了不錯(cuò)的效果,但仍存在尺度不確定性和初始化問題,這兩個(gè)問題也是單目算法發(fā)展史上最大的障礙。此外,由于視覺傳感器的使用對(duì)環(huán)境的辨識(shí)度要求比較高,在多樣化的場景下使用單目視覺導(dǎo)航算法仍面臨著不同的困難,故單目視覺導(dǎo)航算法目前在室內(nèi)應(yīng)用較多,而更復(fù)雜和不確定的室外環(huán)境則是雙目或多目視覺應(yīng)用居多。綜上可見,對(duì)單目視覺的進(jìn)一步研究攻克環(huán)境的復(fù)雜性、不確定性,于機(jī)器人導(dǎo)航發(fā)展而言,具有極其重要的意義。

最初的單目視覺導(dǎo)航算法以檢測固定標(biāo)識(shí)為核心,該類算法首先被應(yīng)用于工業(yè)搬運(yùn)(AGV),后來在海岸巡檢中也得到利用[3],最常用的有canny、sobel等邊緣檢測算子作為算法支撐。但此類方法核心在于依靠標(biāo)記進(jìn)行位姿估計(jì)和路徑規(guī)劃,十分依賴于明顯標(biāo)志或邊緣痕跡,從而對(duì)環(huán)境有限制,當(dāng)?shù)孛鏇]有標(biāo)志或痕跡復(fù)雜時(shí),上述方法應(yīng)用效果不佳甚至失效。經(jīng)過一段時(shí)間的發(fā)展,有學(xué)者從圖像入手,利用單目獲取的圖像中包含的環(huán)境信息作為移動(dòng)機(jī)器人導(dǎo)航的重要決策因素,在這一時(shí)期內(nèi),出現(xiàn)了SIFT(Scale Invariant Feature Transform)、SURF(Speeded Up Robust Features)等眾多從圖像中檢測特征點(diǎn)的算子。該類算法較之前的區(qū)別在于機(jī)器人可不再依靠固定標(biāo)志,能從圖像中主動(dòng)判斷環(huán)境中的障礙信息,其最具代表性的是將特征檢測和濾波結(jié)合的改進(jìn)FAST算法[15],同時(shí)具備了快速和精確兩大特性。

由于單目易受到光照、陰影等因素影響,單一的邊緣或特征檢測算子不足以達(dá)到理想的導(dǎo)航效果,后有學(xué)者從顏色空間模型入手,使得圖像更為貼切人類的視覺規(guī)律,代表性的有文獻(xiàn)[16]所提出的HSI顏色空間模型,將獲取的圖像特殊處理后再進(jìn)行檢測。以前者為參考,有學(xué)者開始將語義信息與單目視覺融合,提高了環(huán)境信息的利用率與導(dǎo)航魯棒性。與此同時(shí),多傳感器融合憑借互補(bǔ)的優(yōu)勢成為時(shí)下的研究熱點(diǎn),如單目與雷達(dá)的結(jié)合全面提升了單目導(dǎo)航的精確性,如文獻(xiàn)[4]為了實(shí)現(xiàn)檢測速度、位姿估計(jì)以及導(dǎo)航魯棒性的全面提升,結(jié)合單目、雷達(dá)以及語義地圖三者優(yōu)勢提出了融合導(dǎo)航系統(tǒng)。

除對(duì)周圍環(huán)境檢測識(shí)別外,移動(dòng)路徑規(guī)劃也是移動(dòng)機(jī)器人導(dǎo)航算法中極其重要的一部分。主流的路徑規(guī)劃按照范圍主要分為全局路徑規(guī)劃和局部路徑規(guī)劃,單目視覺移動(dòng)機(jī)器人在未知環(huán)境中僅能依靠攝像機(jī)在有限的視場范圍內(nèi)獲取有限的局部環(huán)境信息,所以在初次環(huán)境建模中,使用局部路徑規(guī)劃能有更好的效果,若要向指定點(diǎn)前進(jìn),則全局與局部結(jié)合會(huì)產(chǎn)生更好的效果。SLAM(Simultaneous Localization And Mapping)根據(jù)使用傳感器不同分為激光SLAM和視覺SLAM,可使機(jī)器人在完全未知的環(huán)境中創(chuàng)建地圖,同時(shí)利用地圖進(jìn)行自主定位和導(dǎo)航。SLAM最初由Davison等[17]實(shí)現(xiàn)并建立了應(yīng)用模型,直到Klein和Murray[18]提出將跟蹤和建圖線程并行運(yùn)行的方法,基于關(guān)鍵幀的SLAM憑借更高的精度有了立足之地?,F(xiàn)在,廣大學(xué)者更是從深度學(xué)習(xí)、語義、多傳感器融合等諸多方面開發(fā)SLAM在導(dǎo)航方面的潛在應(yīng)用價(jià)值。

根據(jù)實(shí)際需要以及已有的單目視覺導(dǎo)航算法,可以將視覺移動(dòng)機(jī)器人導(dǎo)航的主要任務(wù)理解為:首先通過機(jī)器人自身所配的傳感器對(duì)作業(yè)環(huán)境進(jìn)行檢測以確定位置,然后將所檢測到的距離、特征點(diǎn)等環(huán)境信息傳給控制臺(tái),再由控制臺(tái)對(duì)環(huán)境進(jìn)行分析決策出合適的路徑規(guī)劃。

為了移動(dòng)機(jī)器人在作業(yè)過程中可以實(shí)現(xiàn)僅依靠單目攝像頭便能完成測障、路徑規(guī)劃等任務(wù)的效果,對(duì)室內(nèi)移動(dòng)機(jī)器人的作業(yè)環(huán)境作以下假設(shè)[10]:

(1)移動(dòng)機(jī)器人在初始位置處沒有障礙物;

(2)移動(dòng)機(jī)器人作業(yè)環(huán)境中整體地面平整;

(3)在移動(dòng)機(jī)器人作業(yè)上空沒有懸掛障礙物;

(4)移動(dòng)機(jī)器人視場內(nèi)所檢索到的障礙物與地面的交界線在圖像中可見。

并將單目視覺導(dǎo)航算法劃分為障礙物檢測、定位和導(dǎo)航三個(gè)部分。下面將以時(shí)間為線,對(duì)單目視覺導(dǎo)航算法各部分的典型算子進(jìn)行分析、總結(jié)。

1 單目視覺障礙物檢測算法

利用視覺傳感器提取周圍環(huán)境特征是視覺移動(dòng)機(jī)器人導(dǎo)航的基礎(chǔ),如角點(diǎn)、邊緣等具有特殊環(huán)境信息的特征。在Nevatia R提出的模板匹配方法首次被應(yīng)用在障礙檢測算法后,越來越多的人開始在數(shù)學(xué)運(yùn)算和像素上著手突破。同時(shí),以Harris角點(diǎn)檢測算法[17]為代表的基于特征點(diǎn)的描述算子也展現(xiàn)出良好的應(yīng)用效果。在此基礎(chǔ)上,各式基于環(huán)境特征點(diǎn)信息的視覺算法在障礙檢測領(lǐng)域中得到了廣泛的研究。

1.1 特征檢測與匹配算子

無論是在結(jié)構(gòu)化環(huán)境或者是非結(jié)構(gòu)化環(huán)境中,總會(huì)存在光照等影響因素,從而導(dǎo)致常規(guī)的特征提取與匹配算法在圖像處理中的應(yīng)用效果不夠理想,表1總結(jié)了近年來最為常用且具代表性的特征匹配算法在檢測速度、精度以及特征提取性能比對(duì)。

表1 特征匹配算子

SIFT是Lowe提出的尺度不變特征檢測法,該算法的獨(dú)特在于使用了歐氏距離比率判斷一定范圍內(nèi)的特征點(diǎn)是否匹配,并佐以閾值進(jìn)行輔助,相比普通的算法擁有更高的精度。

SURF由于其計(jì)算量小的優(yōu)勢,在速度上比SIFT快了一個(gè)數(shù)量級(jí),從而更適用于實(shí)時(shí)匹配要求高的場景,而SIFT不僅提取量大,計(jì)算量也大,故速度上相比表中的幾類算法均要慢許多,但SIFT是基于浮點(diǎn)內(nèi)核計(jì)算特征點(diǎn)的,故在精度上的效果比SURF略高,適用于匹配精度較高的場景。

ORB(ORiented Brief)[19]是BRIEF算法的改進(jìn)版。原BRIEF的優(yōu)點(diǎn)在于其速度,其缺點(diǎn)是不具備旋轉(zhuǎn)不變性、對(duì)噪聲敏感以及不具備尺度不變性。而ORB即是為了解決BRIEF算法中前兩個(gè)缺點(diǎn)而誕生的,穩(wěn)定性更強(qiáng),且由于有FAST(Features from Accelerated Segment Test)的加持,速度也得到了很大的提升,故在計(jì)算機(jī)視覺領(lǐng)域內(nèi),ORB算法的綜合性能在各種測評(píng)里相比其他特征提取算法幾乎是最好的。有學(xué)者對(duì)前三種算法進(jìn)行測驗(yàn),得出ORB算法比SIFT算法快100倍,比SURF算法快10倍的結(jié)論。

FAST是專門用來快速檢測興趣點(diǎn)的算子,只需要對(duì)比幾個(gè)像素,就可以判斷是否為關(guān)鍵點(diǎn)[4]。該算法檢測的核心是以某個(gè)點(diǎn)為中心作一個(gè)圓,根據(jù)圓上的像素值判斷該點(diǎn)是否為關(guān)鍵點(diǎn),這樣可以大幅度地提高檢測效率,并且其判斷的標(biāo)準(zhǔn)不同于前面的檢測算法,是憑圓上所有像素的強(qiáng)度值是否都與圓心的強(qiáng)度值明顯不同來進(jìn)行認(rèn)定的,這使得檢測速度非常快,因此十分適合需要優(yōu)先考慮速度的應(yīng)用,如實(shí)時(shí)視覺跟蹤、目標(biāo)識(shí)別等。

標(biāo)準(zhǔn)RANSAC算法[20]是一種應(yīng)用廣泛的誤匹配剔除算法,但該算法隨著匹配點(diǎn)個(gè)數(shù)增加,算法迭代次數(shù)會(huì)迅速上升,降低了算法的計(jì)算速度。一點(diǎn)RANSAC[20]與普通RANSAC相比,前者采用先驗(yàn)信息,降低了數(shù)據(jù)集的大小,減少了RANSAC迭代次數(shù),從而降低了計(jì)算成本,速度也有所提升。

此外,融合特征匹配法往往能展現(xiàn)出比單一算子更好的效果,如文獻(xiàn)[20]分析了一點(diǎn)RANSAC導(dǎo)航算法匹配失效問題,并用SIFT算子作為輔助匹配,解決了視覺主動(dòng)匹配失效問題,提升了導(dǎo)航精度;文獻(xiàn)[21]將擴(kuò)展卡爾曼濾波和一點(diǎn)RANSAC算法結(jié)合,在確保計(jì)算精度的同時(shí),有效降低了算法迭代次數(shù),使機(jī)器人定位與導(dǎo)航的時(shí)效性得到了保證。文獻(xiàn)[15]將改進(jìn)的FAST算法與基于擴(kuò)展卡爾曼濾波的一點(diǎn)RANSC算法結(jié)合,在角點(diǎn)提取過程中剔除了部分邊緣點(diǎn)和局部非極大值點(diǎn),提高了角點(diǎn)提取的速度與質(zhì)量,在保證算法魯棒性的同時(shí)有效降低了算法迭代次數(shù),提高了算法的實(shí)時(shí)性,而且在周圍環(huán)境發(fā)生變化時(shí)也能夠保持較高的匹配精度和魯棒性。

還有諸如LBP、Harr等很多的特征檢測算法,大致檢測方法與上類似,只是各自的側(cè)重點(diǎn)不同,對(duì)于不同的應(yīng)用環(huán)境應(yīng)該選用與之相應(yīng)的算法。

1.2 基于HSI顏色空間的特征檢測

在使用視覺對(duì)障礙物進(jìn)行檢測的過程中,光照條件是一個(gè)干擾極大的因素。當(dāng)移動(dòng)機(jī)器人處于未知環(huán)境下時(shí),光照條件也無法預(yù)測,而目前使用最多的顏色空間模型多數(shù)是面向硬件的,與人類感知顏色的規(guī)律還是有不小的差距,其中以RGB顏色模型為代表[10]。相關(guān)實(shí)驗(yàn)證明,HSI顏色空間模型建立在人類對(duì)顏色感知的基礎(chǔ)上,相比RGB更符合人類的視覺規(guī)律。將HSI模型應(yīng)用在特征檢測領(lǐng)域可以有效降低光照等因素帶來的影響,從而大幅度提高檢測的準(zhǔn)確性與魯棒性。

通過HSI顏色空間進(jìn)行障礙物邊緣檢測有獨(dú)特的優(yōu)勢[8]:

(1)在HSI模型中色度分量與亮度分量是分開的,圖像的彩色信息和I分量無關(guān),有利于避免光強(qiáng)變化對(duì)彩色圖像處理帶來的影響。

(2)根據(jù)轉(zhuǎn)換公式可以推得H分量具備以下特征:①對(duì)RGB三分量的等比例變化具有不變性;②對(duì)RGB三分量的等量偏移具有不變性。轉(zhuǎn)換公式如下:式中,H為色調(diào),S為飽和度,I為亮度。

(3)在HSI模型中,色調(diào)H和飽和度S互相獨(dú)立并與人的感知緊密相連,使得HSI模型非常適合模擬人的彩色感知視覺特性進(jìn)行處理分析。

從以上關(guān)系可知,獨(dú)立出來的顏色成分受光照變化影響很小,因此在室內(nèi)環(huán)境中能夠有效地避免由于陰影和光照變化給圖像信息處理帶來的影響,保證了從圖像信息中檢測出障礙物準(zhǔn)確率。

文獻(xiàn)[16]提出將HSI顏色空間模型應(yīng)用于單目視覺機(jī)器人障礙物檢測模塊。從提取方式上看,該算法優(yōu)勢在于使用了非極大值抑制、閾值選取,使獲取的圖像邊緣更加細(xì)膩且二值化后更明顯,邊緣像素點(diǎn)掃描法為精確提取邊緣也作出了巨大貢獻(xiàn)。此外,從圖像效果上看,該算法將圖像劃分為可行駛區(qū)域和障礙區(qū)域,大幅減小了光照等因素對(duì)障礙物檢測造成的影響,提高了障礙物檢測的精度。

文獻(xiàn)[8]提出一種基于HSI顏色空間模型改進(jìn)的單目導(dǎo)航算法,與文獻(xiàn)[16]不同的是該算法采用了分量處理和區(qū)域生長分割法,進(jìn)一步提高了檢測效果,并在對(duì)像素操作過程中,采用隸屬度劃分并建立模糊規(guī)則庫,進(jìn)一步提高了視覺控制系統(tǒng)的魯棒性和輸出命令的可靠性。

1.3 背景差分法與幀間差分法

背景差分法是對(duì)視頻圖像序列中的當(dāng)前幀與背景圖像做差分運(yùn)算,得到的二值圖像中就標(biāo)注了運(yùn)動(dòng)目標(biāo)的區(qū)域[22]。應(yīng)用于移動(dòng)機(jī)器人的障礙物檢測時(shí),隨著移動(dòng)機(jī)器人的不斷運(yùn)動(dòng),視頻圖像的背景也在不斷變化,所以需要進(jìn)行背景圖像的更新,然后再對(duì)當(dāng)前幀和背景圖像做差分運(yùn)算。而圖像中的運(yùn)動(dòng)目標(biāo)和背景圖像在灰度上存在的差異為區(qū)分是否為運(yùn)動(dòng)目標(biāo)提供了條件,通過閾值處理即可分辨。

由于背景差分法的的原理比較簡單,檢測運(yùn)動(dòng)目標(biāo)的速度快且易于實(shí)現(xiàn),所以被廣泛使用于動(dòng)態(tài)障礙物檢測過程中。為了應(yīng)用該法解決單目移動(dòng)機(jī)器人測障問題,參考動(dòng)態(tài)障礙物考慮靜態(tài)物體。在機(jī)器人移動(dòng)過程中,變換參考系,機(jī)器人的移動(dòng)使得相機(jī)捕獲的障礙物圖像成為連續(xù)移動(dòng)的序列,從而將環(huán)境理解為動(dòng)態(tài)場景。將背景差分法融入以上模型,需要著重考慮機(jī)器人移動(dòng)中設(shè)為背景的單幀更新,為保障檢測精確性可以加入去噪等手段。

幀間差分法是對(duì)視頻序列中的相鄰兩幀圖像做差分運(yùn)算,當(dāng)某像素點(diǎn)前后兩幀圖像的灰度差絕對(duì)值大于閾值時(shí),標(biāo)記該位置為運(yùn)動(dòng)區(qū)域[22]。該算法通過對(duì)圖像中的所有像素點(diǎn)進(jìn)行灰度值對(duì)比得到運(yùn)動(dòng)目標(biāo)的輪廓。

該算法不同于背景差分法,將前一幀圖像作為背景圖像,然后對(duì)當(dāng)前圖像做差分運(yùn)算。相比于背景差分法而言,少了背景模型的更新這一步,使得計(jì)算過程更加簡單,計(jì)算量也相應(yīng)降低,而且對(duì)光線的變化敏感度也墊底。但從提取效果上看,幀間差分算法只能提取出運(yùn)動(dòng)目標(biāo)的邊界,對(duì)幀間的時(shí)間間隔和閾值的選取有較高的要求,這一點(diǎn)與背景差分法略有不足。如以下兩種情況,當(dāng)物體運(yùn)動(dòng)速度較快而幀間的視覺間隔較大時(shí),物體在前后兩幀圖像中沒有重疊,這種情況下幀間差分法的檢測結(jié)果為兩個(gè)分開的物體;當(dāng)物體運(yùn)動(dòng)速度較慢而幀間的時(shí)間間隔較小時(shí),物體在前后兩幀圖像中幾乎完全重疊,此時(shí)該算法會(huì)檢測不到物體。

1.4 基于圖像金字塔改進(jìn)的光流法

1.4.1 基于KLT特征點(diǎn)跟蹤的光流計(jì)算

LK(Lucas-Kanade)光流算法是對(duì)圖像序列中的相鄰兩幀圖像計(jì)算光流信息,該算法的原理有3個(gè)假設(shè)前提[23]:(1)前后兩幀圖像的亮度恒定不變;(2)前后兩幀圖像的時(shí)間連續(xù),且物體的運(yùn)動(dòng)速度不大,即“小運(yùn)動(dòng)”;(3)空間一致,空間中相鄰區(qū)域的運(yùn)動(dòng)情況相似且這些區(qū)域在圖像上的投影也在臨近區(qū)域。其中,假設(shè)1是為了保證約束方程的等號(hào)成立不受亮度變化的影響,假設(shè)2是為了保證該算法能夠找到運(yùn)動(dòng)目標(biāo)點(diǎn),假設(shè)3則是為了保證相鄰圖像同一窗口中所有點(diǎn)的偏移量都相等。此外,光流約束方程中未知量的約束不夠會(huì)導(dǎo)致孔徑問題。

基于KLT(Kanade-Lucas-Tomasi Tracking Method)特征點(diǎn)跟蹤的光流法是在LK的基礎(chǔ)上提出的,最大的優(yōu)勢是利用了LK光流算法的局部約束性,變劣為優(yōu),以LK對(duì)足夠小的領(lǐng)域空間內(nèi)光流矢量不變特性來求解光流。在特征點(diǎn)提取上依靠的是Tomasi算法對(duì)每幀的特征點(diǎn)進(jìn)行提取[22]。

對(duì)于KLT算法,主要在于選取以特征點(diǎn)(x,y)為中心的鄰域建立上式所述的LK光流方程,同時(shí)對(duì)t+r時(shí)刻選取的特征點(diǎn)(x,y),都可以由t時(shí)刻對(duì)應(yīng)的特征點(diǎn)(x,y)經(jīng)特征變換d=(ox,oy)進(jìn)行計(jì)算得到。從以上可以看出,KLT光流算法的實(shí)質(zhì)即在于對(duì)特征點(diǎn)變化量的求解。

1.4.2 圖像金字塔改進(jìn)KLT

在利用基于KLT特征點(diǎn)跟蹤的光流算法對(duì)動(dòng)態(tài)障礙物的檢測過程中,有可能出現(xiàn)相鄰兩幀間特征點(diǎn)匹配檢測到障礙物目標(biāo)區(qū)域以外的點(diǎn)的情況,即在匹配過程中,產(chǎn)生不穩(wěn)定的匹配特征點(diǎn)。這些不穩(wěn)定的匹配特征點(diǎn)會(huì)對(duì)動(dòng)態(tài)障礙物持續(xù)提取和檢測產(chǎn)生較大的影響,容易造成檢測的失準(zhǔn),而該問題主要是由于提取的兩幀圖像之間運(yùn)動(dòng)幅度較大所導(dǎo)致的。

圖像金字塔算法的出現(xiàn)為解決上述問題提供了出路,當(dāng)像素降低到一定程度時(shí),原本較大的像素間運(yùn)動(dòng)就能變小,這就能實(shí)現(xiàn)在提取兩幀間較大運(yùn)動(dòng)的同時(shí),保證特征點(diǎn)匹配的穩(wěn)定性。如圖1所示,規(guī)定原始圖像為零層,首先對(duì)原始圖像進(jìn)行Tomasi特征點(diǎn)提取,然后對(duì)初始提取的圖像進(jìn)行二次采樣,得到第二層金字塔,依次利用N次采樣結(jié)果,使原始相鄰幀間較大的運(yùn)動(dòng)逐漸轉(zhuǎn)化為微小運(yùn)動(dòng),直到滿足幀間KLT特征點(diǎn)跟蹤的約束條件。

圖1 金字塔光流法

采用金字塔LK光流法可以檢測出運(yùn)動(dòng)速度過快的運(yùn)動(dòng)目標(biāo),取消了LK光流法中的第2和第3個(gè)假設(shè),擴(kuò)大了算法的適用范圍。但是該算法的計(jì)算量很大,對(duì)硬件條件的要求較高,而且不能消除光照等外部環(huán)境條件對(duì)檢測結(jié)果的影響,這就使得該算法存在一定的局限性。

針對(duì)這個(gè)問題,文獻(xiàn)[24]提出了一種綜合測障法,先對(duì)圖像視頻序列進(jìn)行幀間差分運(yùn)算,得到運(yùn)動(dòng)目標(biāo)區(qū)域,再進(jìn)行金字塔式的光流運(yùn)算。該算法結(jié)合了前面所述幀間差分法與金字塔光流法的特點(diǎn),既避免了光照環(huán)境對(duì)檢測結(jié)果的影響(消除了1假設(shè)),還可以檢測到運(yùn)動(dòng)速度過大的目標(biāo)(消除了2、3假設(shè))。相比于傳統(tǒng)的金字塔LK光流法,該算法的計(jì)算量較低,算法的處理速度較快,因而更加滿足系統(tǒng)對(duì)實(shí)時(shí)性的要求。

光流估計(jì)算法中,除了基于梯度和匹配的方法外,還有許多正處于研究中的方法?;谀芰康姆椒ǎ阂卜Q基于頻率的方法,在使用該類方法的過程中,要獲得均勻流場的準(zhǔn)確的速度估計(jì),就必須對(duì)輸入的圖像進(jìn)行時(shí)空濾波處理,即對(duì)時(shí)間和空間的整合,但是這樣會(huì)降低光流的時(shí)間和空間分辨率。基于頻率的方法往往會(huì)涉及大量的計(jì)算,另外,要進(jìn)行可靠性評(píng)價(jià)也比較困難。

基于相位的方法:Fleet和Jepson最先提出將相位信息用于光流計(jì)算的思想。當(dāng)計(jì)算光流的時(shí)候,相比亮度信息,圖像的相位信息更加可靠,所以利用相位信息獲得的光流場具有更好的魯棒性?;谙辔坏墓饬魉惴ǖ膬?yōu)點(diǎn)是:對(duì)圖像序列的適用范圍較寬,而且速度估計(jì)比較精確,但也存在著一些問題:第一,基于相位的模型有一定的合理性,但是有較高的時(shí)間復(fù)雜性;第二,基于相位的方法通過兩幀圖像就可以計(jì)算出光流,但如果要提高估計(jì)精度,就需要花費(fèi)一定的時(shí)間;第三,基于相位的光流計(jì)算法對(duì)圖像序列的時(shí)間混疊是比較敏感的。

神經(jīng)動(dòng)力學(xué)方法:是利用神經(jīng)網(wǎng)絡(luò)建立的視覺運(yùn)動(dòng)感知的神經(jīng)動(dòng)力學(xué)模型,它是對(duì)生物視覺系統(tǒng)功能與結(jié)構(gòu)比較直接的模擬。盡管光流計(jì)算的神經(jīng)動(dòng)力學(xué)方法還很不成熟,然而對(duì)它的研究卻具有極其深遠(yuǎn)的意義。隨著生物視覺研究的不斷深入,神經(jīng)方法無疑會(huì)不斷完善,也許光流計(jì)算乃至計(jì)算機(jī)視覺的根本出路就在于神經(jīng)機(jī)制的引入。神經(jīng)網(wǎng)絡(luò)方法是光流技術(shù)的一個(gè)發(fā)展方向。

2 單目視覺移動(dòng)機(jī)器人定位

在單目視覺移動(dòng)機(jī)器人作業(yè)過程中,除了要用單目相機(jī)對(duì)視場內(nèi)障礙物進(jìn)行檢測外,計(jì)算障礙物與本體之間的距離對(duì)后面進(jìn)行路徑規(guī)劃也是相當(dāng)重要的。雖然雙目和多目視覺測距的精度相比單目較高,但其主要問題在于需要精確的配準(zhǔn)和條件約束,耗時(shí)的配準(zhǔn)過程對(duì)實(shí)時(shí)視覺導(dǎo)航來說具有不可忽略的影響,而且要使基線和攝像機(jī)光軸嚴(yán)格地處于同一平面上,這對(duì)于攝像機(jī)的架設(shè)及測量平臺(tái)穩(wěn)定性的要求極高[25]。單目測距是利用一個(gè)攝像機(jī)獲得的圖片得出環(huán)境的深度信息,具有操作簡單和成本低等優(yōu)點(diǎn),但是傳統(tǒng)單目測距方法存在精度較低、需要固定參照物和無法適應(yīng)遠(yuǎn)距離測量場合等缺陷,根據(jù)測量原理可以劃分為基于已知物體和已知運(yùn)動(dòng)兩類算法。

Yamaguti N等[14]提出利用物體的已知運(yùn)動(dòng)和前后采集到的兩幅圖像比例的變化,得出障礙物與機(jī)器人本體之間距離的算法,該類測量方法需要依靠特征匹配的精度來保證測量精度,易干擾性強(qiáng),而且需要對(duì)多幅圖像進(jìn)行處理,計(jì)算量大。相對(duì)的,基于已知物體的測量方法核心是對(duì)每一個(gè)特征點(diǎn)進(jìn)行分析計(jì)算,測量結(jié)果擁有較高的精確度,但也因此有較大的計(jì)算量,而且還依賴于特征點(diǎn)提取算法的精度,易受影響。

小孔成像模型被應(yīng)用為最初的測距模型,在此基礎(chǔ)上衍生出各類適用特定環(huán)境的測距算法。文獻(xiàn)[10]用攝像機(jī)模型幾何關(guān)系推導(dǎo)法對(duì)圖像坐標(biāo)和機(jī)器人坐標(biāo)進(jìn)行換算實(shí)現(xiàn)單目測距。該算法根據(jù)小孔成像模型,將單目視覺簡化為攝像機(jī)投影模型,需要人工測量相機(jī)視場邊緣和地面交線位置以及光軸和地面的交點(diǎn)距離,也即表示該單目測距法僅適用于相機(jī)有固定傾斜角度,且光軸與地面相交的環(huán)境。文獻(xiàn)[11]表示通過攝像機(jī)標(biāo)定可以將已知世界坐標(biāo)某點(diǎn)投射到成像平面上的圖像坐標(biāo)求出,并提出將物體投影面積區(qū)域的形心代替障礙物的特征點(diǎn),從而計(jì)算障礙物到機(jī)器人的距離。該算法對(duì)于攝像機(jī)而言,若不能保證攝像頭的軸線垂直于被測目標(biāo)平面,對(duì)于這種傾斜用肉眼無法進(jìn)行修正,故距離目標(biāo)越遠(yuǎn),誤差越大。

路標(biāo)分為自然路標(biāo)和人工路標(biāo),從已有的相關(guān)文獻(xiàn)來看,目前基于自然路標(biāo)的視覺導(dǎo)航受環(huán)境不確定因素影響大,算法復(fù)雜。相比于自然路標(biāo),人工路標(biāo)輔助機(jī)器人定位技術(shù),具有路標(biāo)特征穩(wěn)定、定位算法簡單等優(yōu)勢。文獻(xiàn)[26]提出了基于二維碼的人工路標(biāo),在物流無人倉庫也有所應(yīng)用。雖然該路標(biāo)包含的信息量大,但是二維碼的識(shí)別速度慢,難以滿足實(shí)時(shí)性的要求,而且識(shí)別的準(zhǔn)確率受機(jī)器人與二維碼的距離影響較大。文獻(xiàn)[27]提出了在路面進(jìn)行車輛測距的方法,路標(biāo)識(shí)別率高達(dá)90%,測距誤差不超過10%。該方法實(shí)際上也是借助網(wǎng)絡(luò)申請(qǐng)獲取到標(biāo)線、指示牌等標(biāo)記的真實(shí)尺度,從而為解決單目尺度問題奠定了基礎(chǔ),而且通過毫米波雷達(dá)輸出前車距離信息,擁有高精度的優(yōu)勢,且豐富了ADAS系統(tǒng)測距。

對(duì)應(yīng)點(diǎn)標(biāo)定法是最早被大范圍應(yīng)用的深度信息獲取方法,擁有簡便、高效等優(yōu)勢,但是在標(biāo)定中如果點(diǎn)的世界坐標(biāo)對(duì)應(yīng)的圖像坐標(biāo)不夠精確,轉(zhuǎn)換結(jié)果會(huì)因此而波動(dòng),同時(shí),標(biāo)定是在攝像機(jī)的高度和各角度都已確定的情況下進(jìn)行,任意一個(gè)參數(shù)的變化都將導(dǎo)致重新標(biāo)定,因此該方法的局限性在于僅適用于攝像機(jī)位置固定的情況。文獻(xiàn)[28]使用對(duì)應(yīng)坐標(biāo)標(biāo)定法,在機(jī)器人運(yùn)動(dòng)時(shí),觀測點(diǎn)也隨之進(jìn)行移動(dòng),在實(shí)際測量中,變化的量是攝像頭與目標(biāo)之間的距離以及導(dǎo)航偏角,這些變化在圖像上也是有反應(yīng)的,因此兩個(gè)時(shí)刻采集到的圖片也是不同的,反映到圖像上就是目標(biāo)像素點(diǎn)的大小,以及目標(biāo)偏移中心位置的距離。

除了前面所提到的標(biāo)定點(diǎn)法外,攝像機(jī)內(nèi)部參數(shù)的標(biāo)定效果對(duì)測距結(jié)果也是有非常巨大的影響。文獻(xiàn)[25]提出了基于B對(duì)偶空間幾何學(xué)的攝像機(jī)內(nèi)參數(shù)計(jì)算方法,采用幀間差分與運(yùn)動(dòng)模板相融合的方法自動(dòng)提取目標(biāo)的輪廓信息,根據(jù)影射幾何能精確地計(jì)算距離,但在攝像機(jī)俯仰角上更傾向于小俯仰角的應(yīng)用場景。

近幾年單目測距技術(shù)發(fā)展迅速,除了上述常用方法外,還有如單幀靜態(tài)法、序列圖像法、平移視差法等單目測距算法均是在基于小孔成像的原理上根據(jù)不同應(yīng)用環(huán)境進(jìn)行改進(jìn),但基本原理不變。光流常用于障礙物的檢測和對(duì)象跟蹤,在測距上的應(yīng)用也是基于前面所述的方法。三維重構(gòu)技術(shù)通過單目相機(jī)不僅能夠獲取深度信息,還能根據(jù)需求計(jì)算出對(duì)象的三維結(jié)構(gòu),擁有很高的研究價(jià)值。

3 路徑規(guī)劃導(dǎo)航

路徑規(guī)劃是移動(dòng)機(jī)器人導(dǎo)航最基本的環(huán)節(jié)之一,它是按照任務(wù)要求搜索一條從起始狀態(tài)到目標(biāo)狀態(tài)的最優(yōu)或近似最優(yōu)的無碰撞路徑,主要有全局路徑規(guī)劃和局部路徑規(guī)劃兩類。其中,局部路徑規(guī)劃能幫助機(jī)器人判斷周圍環(huán)境有無障礙物并判斷如果避開障礙物,適用于初次環(huán)境建模以及存在動(dòng)態(tài)障礙物的環(huán)境,而全局路徑規(guī)劃更適用于在地圖已知的情況下為機(jī)器人規(guī)劃一條從起點(diǎn)到終點(diǎn)的路徑。表2對(duì)比了近年常用的經(jīng)典路徑搜索算法。

Dijkstra在搜索時(shí)不考慮方向,以廣度優(yōu)先,“盲目”式搜索,導(dǎo)致需要經(jīng)過大量的計(jì)算才能得出路徑,但是得出的路徑效果很不錯(cuò),且一定最短。A*相比Dijkstra增加了有向式搜索,整體搜索方向按照終點(diǎn)坐標(biāo)位置為準(zhǔn),逐個(gè)搜索,減少了其他方向的計(jì)算,從而獲得更快的速度,但是該有向式搜索的缺陷在于沒有考慮兩點(diǎn)之間的障礙情況,導(dǎo)致會(huì)出現(xiàn)“貼”著障礙物行走的情況,甚至有較大的拐點(diǎn)。JPS是在A*上更進(jìn)一步的優(yōu)化算法,用跳點(diǎn)搜索的方式取代了逐個(gè)鄰居判斷的方式,在時(shí)間和路徑平滑上均獲得了極大的提升。

表2 路徑規(guī)劃算法

RRT與前面幾種算法的差異在于施加了對(duì)狀態(tài)空間中的采樣點(diǎn)進(jìn)行碰撞檢測,避免了空間建模,從而在速度上有很大優(yōu)勢,但路徑時(shí)概率完備且不最優(yōu)。人工勢場和遺傳算法在路徑規(guī)劃中的應(yīng)用差異主要在于速度上,人工視場的速度快,但在復(fù)雜的環(huán)境下會(huì)出現(xiàn)局部極小點(diǎn)。

從上述對(duì)比可以看出,目前單一的搜索算法很少能同時(shí)具備耗時(shí)短、路徑優(yōu)的性質(zhì),將多算法的優(yōu)點(diǎn)融合在一起形成新的搜索方法會(huì)是未來提升機(jī)器人路徑搜索能力的必然方向。

3.1 經(jīng)典導(dǎo)航方法

慣性導(dǎo)航系統(tǒng)(Inertial Navigation System,INS)是一種自主式的導(dǎo)航系統(tǒng),其優(yōu)點(diǎn)是可提供連續(xù)的導(dǎo)航信息,短期的定位精度和穩(wěn)定性好,但是INS的誤差會(huì)隨時(shí)間累積而增大,所以不能長期獨(dú)立工作。文獻(xiàn)[29]提出將人工路標(biāo)和INS組合進(jìn)行導(dǎo)航的算法。該算法優(yōu)勢在于通過對(duì)已知距離的路標(biāo)拍攝解決了單目相機(jī)缺少尺度的問題,并與Kalman濾波進(jìn)行數(shù)據(jù)融合,有效減小了INS的累計(jì)誤差。衛(wèi)星-慣導(dǎo)組合定位系統(tǒng)結(jié)合了衛(wèi)星定位導(dǎo)航的高精度、可通訊和慣性導(dǎo)航的獨(dú)立性強(qiáng)、可獲取姿態(tài)的特點(diǎn),能夠?yàn)檩d體提供包括姿態(tài)、位置以及速度等導(dǎo)航信息,實(shí)現(xiàn)了優(yōu)勢互補(bǔ),但該方法不適用于室內(nèi)等不便接收衛(wèi)星信號(hào)的環(huán)境。

采用里程計(jì)法的室內(nèi)機(jī)器人利用安裝在車輪上的光電編碼器記錄車輪的轉(zhuǎn)數(shù),進(jìn)而獲得機(jī)器人相對(duì)于上一采樣時(shí)刻位置和姿態(tài)的改變量,通過這些位移量的累積就可以估計(jì)機(jī)器人的位置,然而由于存在車輪打滑、地面不平等多種外在因素的影響,以及光電編碼器自身系統(tǒng)誤差隨著位移積累,導(dǎo)致機(jī)器器人定位精度下降很快,從而不適宜長距離導(dǎo)航。視覺里程計(jì)(VO)通過利用相鄰圖像匹配特征點(diǎn)坐標(biāo)的變化來估計(jì)載體的位姿變化情況。由于VO是通過一系列前后幀的對(duì)比來估計(jì)相機(jī)的運(yùn)動(dòng)情況,所以不可避免地會(huì)造成誤差的累計(jì)。目前VO的研究已經(jīng)能夠?qū)崿F(xiàn)單目視覺下實(shí)時(shí)圖像特征提取及相機(jī)定位,但在魯棒性、準(zhǔn)確性方面尚有很大的改善空間,VO與慣性測量結(jié)合能夠更有效應(yīng)對(duì)復(fù)雜非結(jié)構(gòu)化環(huán)境,取得良好的導(dǎo)航效果。

SLAM是在基于幾何方法的研究領(lǐng)域內(nèi)最熱門的一項(xiàng)路徑規(guī)劃技術(shù)?;谝曈X的SLAM(VSLAM)技術(shù)不僅能實(shí)現(xiàn)定位,還能構(gòu)建周圍的環(huán)境地圖,對(duì)自主定位和路徑規(guī)劃起到重要的作用。但是在VSLAM中,除了VO前端,還要進(jìn)行后端優(yōu)化、回環(huán)檢測以及建圖,計(jì)算量相比于VO顯著提高,對(duì)數(shù)據(jù)處理終端計(jì)算能力有很高的要求,定位與建圖的實(shí)時(shí)性較差。

3.2 單目SLAM算法

單目SLAM近年來發(fā)展迅速,由最初的基于濾波的方法發(fā)展到基于關(guān)鍵幀的方法,Klein和Murray[30]提出的PTAM算法作為基于關(guān)鍵幀的代表算法,首次將跟蹤定位和構(gòu)圖作為并行線程處理。單目SLAM體積小、重量輕、實(shí)際應(yīng)用簡單,但由于單目不能直接測距,所以早期的單目SLAM被稱為“只有角度的SLAM”。距離未知導(dǎo)致單目SLAM存在以下問題:需要初始化、尺度不確定、尺度漂移。

目前,圖像特征匹配是初始化的主流策略,匹配好的特征點(diǎn)可以給出一組2D-2D像素點(diǎn)的對(duì)應(yīng)關(guān)系,但由于是單目,沒有距離信息。后續(xù)的相機(jī)運(yùn)動(dòng)就可以通過3D-2D的點(diǎn)匹配信息來估計(jì)(PnP)。在初始化分解本質(zhì)矩陣時(shí),由于平移和旋轉(zhuǎn)是乘在一起的,所以初始化時(shí)既需要平移也需要旋轉(zhuǎn),而且分解的結(jié)果顯示,對(duì)平移量乘以任意非零常數(shù),仍滿足對(duì)極約束,這就導(dǎo)致了單目的尺度不確定性問題。故從應(yīng)用上來說,單目需要一個(gè)帶平移的初始化過程,且存在尺度不確定問題,這是它理論上的障礙。此外,SLAM中會(huì)有噪聲影響,改變了單目估計(jì)值與真實(shí)值之間的比值,再加上比例的不確定性,尺度漂移成了單目SLAM誤差的一主要來源。

盡管單目SLAM存在以上問題,但由于相機(jī)系統(tǒng)比較簡單、裝載方便、價(jià)格便宜等優(yōu)勢,依然得到了很大的發(fā)展,其主要研究工作可以分為:基于外觀的方法、基于特征的方法。在基于外觀的方法中,文獻(xiàn)[5]提取攝像頭運(yùn)動(dòng)的近似旋轉(zhuǎn)和平移速度信息的方法在室內(nèi)定位上取得了不錯(cuò)的效果。但該方法采用提取移動(dòng)場景中的中心區(qū)域進(jìn)行模板跟蹤,且僅依靠圖像像素的亮度信息進(jìn)行配準(zhǔn),這在一定程度上造成了系統(tǒng)的不穩(wěn)定。基于特征的方法是選取圖像上面比較明顯的、可重復(fù)檢測的特征點(diǎn)和特征線以及語義更加豐富的面信息在連續(xù)的圖像間進(jìn)行跟蹤,具有較強(qiáng)的魯棒性,但是該方法在特征提取和配準(zhǔn)的時(shí)候?qū)?huì)增加SLAM制圖的耗時(shí)時(shí)長,導(dǎo)致計(jì)算時(shí)長將會(huì)大量增加。

因單目SLAM受到單目視覺原理上的尺度漂移和地標(biāo)數(shù)量造成的計(jì)算量過大兩個(gè)難點(diǎn)的限制,在文獻(xiàn)[4]中提出了語義信息與SLAM耦合的新方法,擁有很好的魯棒性和準(zhǔn)確性,該算法核心在于用過濾器和加權(quán)機(jī)制將上下文語義信息添加到特征關(guān)聯(lián)和SLAM位姿優(yōu)化中,這種方式可以有效地提高SLAM系統(tǒng)的魯棒性和準(zhǔn)確性。

為了進(jìn)一步提高單目SLAM建圖和抗噪能力,有學(xué)者提出在SLAM里面加入幾何約束,從而提高三維建模的速度和穩(wěn)定性。如文獻(xiàn)[31]將線和面的特征引入單目SLAM的三維地圖構(gòu)建過程中,并采用分步濾除端點(diǎn)對(duì)齊的直線匹配方法搜索法和基于直線匹配增強(qiáng)的平面聚類方法,實(shí)驗(yàn)證明該算法相對(duì)于基于點(diǎn)特征的SLAM制圖法在穩(wěn)定性和效率上有明顯的優(yōu)勢,但對(duì)環(huán)境要求較高,需在紋理明顯的環(huán)境下使用。

前面是從算法層面研究如何提高導(dǎo)航精度、穩(wěn)定等性能,而對(duì)于尺度、遮擋之類的問題,僅從算法出發(fā)明顯不能實(shí)現(xiàn)質(zhì)的飛躍,此時(shí),多傳感器融合技術(shù)成為提升導(dǎo)航性能的突破點(diǎn),表3比較了近年來常用的多傳感器融合技術(shù)的特性。

表3 多傳感器融合算法

IMU不僅價(jià)格低廉,而且能幫單目確定尺度、測量快速的運(yùn)動(dòng)以及在相機(jī)被遮擋時(shí)提供短時(shí)間的位姿估計(jì),文獻(xiàn)[32]提出用單目+IMU做SLAM這個(gè)新穎的概念,以IMU彌補(bǔ)單目在尺度和測量上的缺陷,使其構(gòu)建的地圖更加精確和穩(wěn)定,大幅提升了機(jī)器人自主導(dǎo)航的魯棒性;激光雷達(dá)精度高、計(jì)算小、速度快,便于檢測深度信息,文獻(xiàn)[1]為了在利用環(huán)境顏色信息的同時(shí)也提高深度信息的估計(jì),用單目提取的圖像結(jié)合激光估計(jì)的深度信息,為機(jī)器人提供地圖構(gòu)建和定位信息來源,大幅度提高了導(dǎo)航精度;陀螺儀和編碼器結(jié)合的里程計(jì)對(duì)距離的計(jì)算有很高的精度,可以輔助定位,文獻(xiàn)[13]用里程計(jì)結(jié)合單目攝像頭,提出基于穩(wěn)定性和正確性的數(shù)據(jù)融合策略,使得機(jī)器人在導(dǎo)航中對(duì)位姿的估計(jì)更精確。

此外,文獻(xiàn)[4]通過從單目視覺中提取的特征在雷達(dá)深度地圖中的對(duì)應(yīng)關(guān)系以獲得相對(duì)于關(guān)鍵幀的姿態(tài)數(shù)據(jù),同時(shí)通過CNN獲得語義信息使得地圖中每一個(gè)點(diǎn)都與特定的語義特征相關(guān)聯(lián),進(jìn)一步提高了機(jī)器人導(dǎo)航精度。文獻(xiàn)[33]將ORBSLAM得到的位置信息轉(zhuǎn)化到慣導(dǎo)系統(tǒng)的地理導(dǎo)航中作為觀測量估計(jì)慣導(dǎo)系統(tǒng)的狀態(tài)誤差量,并結(jié)合卡爾曼濾波模型估計(jì)慣導(dǎo)系統(tǒng)的誤差,以O(shè)RBSLAM/INS組合的形式實(shí)現(xiàn)了機(jī)器人導(dǎo)航。就目前對(duì)單目SLAM的尺度、初始化等問題的解決方案中,這一類多傳感器融合策略被認(rèn)為是一種很不錯(cuò)的解決方案。

到目前為止,在單目SLAM中以O(shè)RB-SLAM為最經(jīng)典的算法,該算法同時(shí)也可應(yīng)用在雙目與RGB-D相機(jī)上,采用關(guān)鍵幀配準(zhǔn)方法,配合詞袋實(shí)現(xiàn)了大幅提高實(shí)現(xiàn)特征點(diǎn)的檢索和匹配效率。實(shí)驗(yàn)測試表明:基于ORB-SLAM算法僅利用單目視覺的軌跡與地面真實(shí)情況相比存在較大的尺度漂移、平移和旋轉(zhuǎn)漂移;基于激光雷達(dá)深度圖輔助的ORB-SLAM2方法利用深度信息可減小尺度漂移,但是由于存在沒有特征的平面墻和地板以及傳感器誤差,依然存在平移和旋轉(zhuǎn)漂移。綜上所述,在目前情況下,單一的定位方式很難同時(shí)滿足高精度、高實(shí)時(shí)性、高可靠性的要求,因此多源信息融合已成為當(dāng)前導(dǎo)航定位的主要研究方向。

4 總結(jié)

單目視覺導(dǎo)航技術(shù)已經(jīng)取得了較為客觀的技術(shù)成果,打破了最原始的障礙壁壘,并在提高定位精度、最優(yōu)化等方面不斷突破。

在障礙物檢測上,目前應(yīng)用在移動(dòng)機(jī)器人上的識(shí)別算法主要側(cè)重于某單項(xiàng)性能的提升,如SIFT、SURF、FAST三者的檢測速度和精度近乎成反比例發(fā)展,在獲得高精度的同時(shí)失去了速度,在占領(lǐng)速度優(yōu)勢時(shí)又失去了精度的保障。針對(duì)該方面的問題可從以下幾個(gè)方向進(jìn)行研究:

(1)多檢測算子融合,以長補(bǔ)短。在此方向下,ORB算法是目前最為典型的應(yīng)用,結(jié)合FAST的速度和BRIFE描述精度,使其在速度和精度上同時(shí)獲得了提升。

(2)結(jié)合顏色空間模型。如在HSI模型下,可以類似于人眼對(duì)色彩的敏感性對(duì)易造成噪聲的色彩進(jìn)行濾波等處理,在降低噪聲后再采用速度上優(yōu)勢明顯的檢測算子也能得到不錯(cuò)的效果,魯棒性也會(huì)比單一的應(yīng)用有所提高。

(3)深度學(xué)習(xí)。近年來深度學(xué)習(xí)在人工智能方面聲名大噪,通過強(qiáng)大的數(shù)據(jù)庫提供的先驗(yàn)信息比對(duì),無論是在速度、精度還是穩(wěn)定性上都有很大的優(yōu)勢,但對(duì)數(shù)據(jù)庫的依賴較強(qiáng)。

在測距定位方面,單目攝像頭不像雙目或多目可直接測出精度,目前在不依靠人為輔助的情況下僅有通過移動(dòng)構(gòu)成三角進(jìn)行計(jì)算,但依然存在尺度性問題,針對(duì)該問題可從以下方面進(jìn)行研究:

(1)融合傳感器技術(shù)。在機(jī)器人本體上搭載距離傳感器如激光等,可直接彌補(bǔ)單目攝像頭在距離上的短板,還避免了類似多目相機(jī)的計(jì)算誤差。

(2)光流測距。光流作為目標(biāo)跟蹤領(lǐng)域的經(jīng)典,憑借可以較為直觀地獲取目標(biāo)在成像坐標(biāo)系上的移動(dòng)距離服務(wù)于測量定位領(lǐng)域。

(3)三維重構(gòu)。在進(jìn)行二維導(dǎo)航時(shí)也可參考三維地圖的定位方式進(jìn)行計(jì)算,而在構(gòu)圖時(shí)就對(duì)第三根軸的信息進(jìn)行歸一或其他處理。

在路徑規(guī)劃以及整體導(dǎo)航結(jié)構(gòu)方面,VSLAM是時(shí)下最熱的移動(dòng)機(jī)器人導(dǎo)航理論,無論是單目測障還是空間定位都是作為前端服務(wù)于SLAM這個(gè)概念,但尺度漂移、導(dǎo)航精度差仍未得到良好的解決,針對(duì)該問題可從以下方面進(jìn)行研究:

(1)多傳感器融合。有了距離傳感器的加持,可以有效地解決尺度問題,甚至諸如IMU等傳感器還能在空間定位中予以幫助,無論是在建圖還是在導(dǎo)航上比單一的VSLAM都擁有更好的魯棒性。

(2)語義地圖。相比于點(diǎn)云地圖,語義地圖更符合視覺導(dǎo)航充分利用環(huán)境信息的定義,該地圖在導(dǎo)航上的應(yīng)用主要是加入地面水平的假設(shè),使環(huán)境中放入地圖的物體都保持在“同一個(gè)水平面”上,從而有效地提升了地圖的精度,那機(jī)器人定位和導(dǎo)航的精度也就提高了。

綜上所述,未來單目視覺導(dǎo)航算法應(yīng)主要從提高環(huán)境信息利用率、增強(qiáng)障礙檢測效果、提高機(jī)器人空間定位、構(gòu)建更精確的地圖等方面提高機(jī)器人綜合導(dǎo)航能力,滿足人們對(duì)移動(dòng)機(jī)器人實(shí)時(shí)性、精度、魯棒性等要求。根據(jù)前面對(duì)目前單目導(dǎo)航算法存在問題及對(duì)應(yīng)解決方案得知,在可預(yù)見的未來,單目視覺導(dǎo)航算法整體應(yīng)以下面幾種趨勢發(fā)展。

(1)多傳感器融合。如IMU、激光雷達(dá)等傳感器,與相機(jī)結(jié)合可在充分利用環(huán)境信息的同時(shí)也獲取較高的定位精度。此外,傳統(tǒng)的導(dǎo)航方式也并非一無是處,如可以借助INS在短期良好的定位精度和穩(wěn)定性優(yōu)勢為其他算法提供幫助,衛(wèi)星-慣導(dǎo)組合便是這一經(jīng)典融合,若能將其與時(shí)下的VSLAM結(jié)合,即可在很大程度上解決VSLAM的尺度以及精度等問題。

(2)深度學(xué)習(xí)。盡管深度學(xué)習(xí)更多的是基于數(shù)據(jù)庫的處理,但仍不失為移動(dòng)機(jī)器人導(dǎo)航的良好輔助,通過深度學(xué)習(xí)可以優(yōu)化地圖,提高定位、導(dǎo)航精度,語義地圖在導(dǎo)航中的應(yīng)用即可體現(xiàn)諸多由深度學(xué)習(xí)帶來的優(yōu)勢,不同于僅從傳感器入手,該方法更傾向于先驗(yàn)信息,從而帶來更好的穩(wěn)定性和魯棒性。

猜你喜歡
單目移動(dòng)機(jī)器人機(jī)器人
移動(dòng)機(jī)器人自主動(dòng)態(tài)避障方法
一種單目相機(jī)/三軸陀螺儀/里程計(jì)緊組合導(dǎo)航算法
單目SLAM直線匹配增強(qiáng)平面發(fā)現(xiàn)方法
基于Twincat的移動(dòng)機(jī)器人制孔系統(tǒng)
基于CAD模型的單目六自由度位姿測量
機(jī)器人來幫你
認(rèn)識(shí)機(jī)器人
機(jī)器人來啦
認(rèn)識(shí)機(jī)器人
基于單目立體視覺的三坐標(biāo)在線識(shí)別技術(shù)研究
阳西县| 宜都市| 乐安县| 旌德县| 德江县| 察雅县| 赤壁市| 呼和浩特市| 武宣县| 揭阳市| 中超| 西峡县| 宜君县| 大名县| 张家港市| 舞钢市| 麻阳| 遂宁市| 三明市| 南乐县| 夏邑县| 襄城县| 辽中县| 晋城| 轮台县| 云阳县| 上杭县| 永年县| 红安县| 白银市| 双牌县| 囊谦县| 偃师市| 平武县| 张家口市| 沐川县| 略阳县| 神池县| 忻州市| 尉犁县| 大关县|