李曉明,王蘭柱,田亞平
(山西大學(xué)數(shù)學(xué)科學(xué)學(xué)院,山西太原 030006)
*全向視覺中數(shù)據(jù)噪聲對(duì)參數(shù)估計(jì)的影響
李曉明,王蘭柱,田亞平
(山西大學(xué)數(shù)學(xué)科學(xué)學(xué)院,山西太原 030006)
針對(duì)全向視覺中特有的數(shù)據(jù)特性,對(duì)圖像中不同區(qū)域的數(shù)據(jù)噪聲提出了不同假設(shè),并在此假設(shè)下分析了數(shù)據(jù)噪聲對(duì)線性參數(shù)估計(jì)的影響,研究表明,盡管遠(yuǎn)離圖像中心區(qū)域的數(shù)據(jù)誤差較大,但這些數(shù)據(jù)對(duì)參數(shù)估計(jì)的影響是非常大的.此外,還提出了一種分步選擇數(shù)據(jù)點(diǎn)的方法,首先選擇較高精度的數(shù)據(jù)得到初始參數(shù)估計(jì)值,然后逐步選擇更多的數(shù)據(jù)點(diǎn)以保證得到盡可能多的數(shù)據(jù)點(diǎn),而且所選擇的數(shù)據(jù)點(diǎn)盡可能覆蓋圖像的邊緣區(qū)域.實(shí)驗(yàn)結(jié)果表明,文章提出的方法可以得到更精確和更穩(wěn)定的參數(shù)估計(jì).
全向視覺;數(shù)據(jù)噪聲;參數(shù)估計(jì)
利用圖像對(duì)應(yīng)點(diǎn)估計(jì)模型參數(shù)是計(jì)算機(jī)視覺中的一類典型問(wèn)題,如基本矩陣的估計(jì)、運(yùn)動(dòng)參數(shù)的估計(jì)、平面單應(yīng)矩陣的估計(jì)等.文獻(xiàn)中有大量與此相關(guān)的研究成果[1-4].標(biāo)準(zhǔn)的參數(shù)估計(jì)方法通常包括如下三個(gè)步驟[2]:(1)確定圖像間的對(duì)應(yīng)點(diǎn);(2)采用線性算法進(jìn)行初始估計(jì);(3)采用某些統(tǒng)計(jì)優(yōu)化標(biāo)準(zhǔn)通過(guò)非線性優(yōu)化方法來(lái)進(jìn)一步提高估計(jì)的精度.然而,第三步或最終的估計(jì)結(jié)果對(duì)前兩步得到的初始估計(jì)是非常敏感的.本文主要研究全向視覺參數(shù)估計(jì)問(wèn)題的第二步,即線性估計(jì)問(wèn)題.
線性算法的不確定性,如上述提到的第二步,主要源自第一步的數(shù)據(jù)噪聲.與傳統(tǒng)透視相機(jī)相比,由于全向相機(jī)的非線性投影使得它的數(shù)據(jù)噪聲更加嚴(yán)重.以魚眼相機(jī)為例,圖1給出了一幅典型的魚眼圖像.從圖中可以看出,魚眼圖像中不同區(qū)域的變形差異很大,靠近圖像中心的區(qū)域,其畸變與普通透視圖像相似,離圖像中心越遠(yuǎn)的區(qū)域,其畸變程度與透視圖像相差越大.
圖1 魚眼圖像靠近圖像邊緣的區(qū)域變形嚴(yán)重Fig.1 Much more distortion at the region near the border of a fisheye image
不同程度的變形導(dǎo)致數(shù)據(jù)的噪聲情況不同.目前,針對(duì)全向視覺的特征檢測(cè)和匹配方法很少,大多數(shù)情況下仍采用針對(duì)寬基線透視圖像開發(fā)的基于仿射不變量的方法來(lái)實(shí)現(xiàn)特征檢測(cè)和匹配[5-7].由于魚眼圖像局部并不滿足仿射不變結(jié)構(gòu),因此可以想象,如果將這類基于仿射不變量的方法直接應(yīng)用到全向圖像中會(huì)帶來(lái)一些相應(yīng)的問(wèn)題.比如說(shuō),在圖像不同區(qū)域,其特征的檢測(cè)精度可能不同,一般來(lái)說(shuō),離圖像中心越遠(yuǎn)的區(qū)域,整體上誤差比靠近圖像中心區(qū)域的誤差要大;再比如,圖像中錯(cuò)誤匹配點(diǎn)通常比透視圖像中更多等等.本文我們將這些問(wèn)題統(tǒng)稱為數(shù)據(jù)噪聲問(wèn)題.如果這類問(wèn)題不能很好地解決,必將對(duì)后續(xù)的參數(shù)估計(jì)問(wèn)題產(chǎn)生災(zāi)難性的后果.就我們所知,目前還很少見這方面的相關(guān)研究.
為了抵抗數(shù)據(jù)噪聲的影響,文獻(xiàn)[8-9]建議利用大量的對(duì)應(yīng)點(diǎn)并且用最小二乘法或統(tǒng)計(jì)技術(shù)來(lái)平滑噪聲.在他們的研究中,作者假定圖像中數(shù)據(jù)噪聲為高斯模型,并沒有考慮錯(cuò)誤數(shù)據(jù)(outliers)和不同區(qū)域噪聲不同的情況,然而錯(cuò)誤數(shù)據(jù)可能導(dǎo)致不可預(yù)知的后果,噪聲模型的偏差可能會(huì)影響最終模型估計(jì)的準(zhǔn)確性.針對(duì)數(shù)據(jù)中存在錯(cuò)誤匹配的情況,Micusik和Pajdla[10]提出了一種基于RANSAC[11]的全向相機(jī)極幾何估計(jì)方法.并且他們的研究還發(fā)現(xiàn),位于圖像中心區(qū)域的對(duì)應(yīng)點(diǎn)對(duì)模型具有較強(qiáng)的適應(yīng)性,而那些遠(yuǎn)離中心區(qū)域的對(duì)應(yīng)點(diǎn)對(duì)模型擬合起至關(guān)重要的作用.然而,在實(shí)際應(yīng)用中的主要問(wèn)題是由于越靠近圖像邊緣,對(duì)應(yīng)點(diǎn)匹配越困難,而且特征點(diǎn)定位精度也越低.所以,針對(duì)全向視覺的數(shù)據(jù)特點(diǎn),研究如何提高參數(shù)估計(jì)性能具有重要的意義.
本文以魚眼圖像運(yùn)動(dòng)參數(shù)估計(jì)為例,研究了數(shù)據(jù)噪聲對(duì)參數(shù)估計(jì)的影響,并提出了一種可行的實(shí)施策略.第一,以前文獻(xiàn)中假設(shè)不同區(qū)域的數(shù)據(jù)噪聲模型是相同的,針對(duì)魚眼圖像變形的特點(diǎn),我們對(duì)不同區(qū)域采用不同的噪聲模型進(jìn)行了實(shí)驗(yàn)分析,結(jié)果發(fā)現(xiàn),如果僅選擇較高精度的對(duì)應(yīng)點(diǎn),這些點(diǎn)通常不能很好的覆蓋圖像邊緣區(qū)域,導(dǎo)致最終的模型估計(jì)精度降低;第二,為了包含更多遠(yuǎn)離圖像中心的數(shù)據(jù)點(diǎn),設(shè)定一個(gè)較大的誤差容差閾值是必要的,但實(shí)驗(yàn)發(fā)現(xiàn),設(shè)定一個(gè)單一閾值并不是最優(yōu)的,我們給出的策略是采用分步迭代的方法,逐步選擇越來(lái)越多的數(shù)據(jù)點(diǎn).結(jié)果表明,使用這種策略,一方面可以得到更多的數(shù)據(jù)點(diǎn),另一方面,數(shù)據(jù)集中包括了更多的遠(yuǎn)離圖像中心的數(shù)據(jù)點(diǎn).這兩方面對(duì)噪聲數(shù)據(jù)下的線性估計(jì)問(wèn)題是非常有利的,并使得運(yùn)動(dòng)參數(shù)的最終估計(jì)在精確度和穩(wěn)定性上得到了明顯提高.
本文組織如下:第1節(jié)介紹一些線性估計(jì)和魯棒估計(jì)技術(shù)的相關(guān)知識(shí);第2節(jié)是建立在仿真實(shí)驗(yàn)基礎(chǔ)上的數(shù)據(jù)噪聲對(duì)參數(shù)估計(jì)的影響分析;第3節(jié)給出了一種實(shí)用的全向視覺線性參數(shù)估計(jì)技術(shù);最后一節(jié)是全文結(jié)論.
以魚眼圖像本質(zhì)矩陣為例,首先回顧一下標(biāo)準(zhǔn)的8點(diǎn)線性估計(jì)方法[12].假設(shè)兩幅圖像的對(duì)應(yīng)點(diǎn)集合為(mi,′),i=1,2,…n,其中mi,′是對(duì)應(yīng)像素點(diǎn)的測(cè)量坐標(biāo),如果攝像機(jī)已標(biāo)定,根據(jù)成像模型和攝像機(jī)內(nèi)參數(shù)可以計(jì)算出這些對(duì)應(yīng)點(diǎn)所對(duì)應(yīng)的空間向量 Xi和′,那么這些對(duì)應(yīng)的空間向量之間滿足極幾何約束[13]:EX i=0,其中E是3×3的本質(zhì)矩陣.如果給定至少8對(duì)圖像對(duì)應(yīng)點(diǎn),那么可用SVD分解方法求出 E的初始線性估計(jì).由于本質(zhì)矩陣是一個(gè)自由度為5,秩為2的奇異矩陣,因此,得到 E的初始值后,標(biāo)準(zhǔn)的方法是,采用H artley提出的方法[12]進(jìn)行強(qiáng)制約束,使得本質(zhì)矩陣滿足這些奇異約束條件.
我們知道,本質(zhì)矩陣可分解為 E=T×R,其中,T和R分別為兩攝像機(jī)的平移向量和旋轉(zhuǎn)矩陣.采用Hartley的方法[12],可以從本質(zhì)矩陣分解出旋轉(zhuǎn)矩陣 R和相差一個(gè)比例因子的平移向量T.分解出運(yùn)動(dòng)參數(shù)T和R后,通常采用非線性優(yōu)化算法(如Levenberg-Marquart)在五參數(shù)空間(三個(gè)旋轉(zhuǎn)參數(shù)和兩個(gè)平移參數(shù))通過(guò)優(yōu)化技術(shù)進(jìn)一步提高估計(jì)精度.
RANSAC魯棒估計(jì)算法[11]的基本思想是在進(jìn)行參數(shù)估計(jì)時(shí),不是不加區(qū)分地對(duì)待所有可用的輸入數(shù)據(jù),而是首先利用對(duì)應(yīng)于具體問(wèn)題所設(shè)計(jì)的搜索方法迭代地篩選出那些與所估計(jì)參數(shù)一致的“內(nèi)點(diǎn)”(inliers),然后再利用所篩選出的所有inliers來(lái)估計(jì)參數(shù).換句話說(shuō)就是,隨機(jī)選取一個(gè)最小數(shù)據(jù)點(diǎn)集獲得一個(gè)模型,并計(jì)算這個(gè)模型的一致集,最大一致集對(duì)應(yīng)的模型即為最優(yōu)模型.
在RANSAC算法中,一個(gè)重要的參數(shù)是誤差容差閾值t,該參數(shù)用來(lái)判斷數(shù)據(jù)點(diǎn)是否與當(dāng)前模型一致.盡管理論上該參數(shù)應(yīng)該采用基于統(tǒng)計(jì)理論的方法確定,但由于統(tǒng)計(jì)的復(fù)雜性,一般根據(jù)經(jīng)驗(yàn)確定.
這里的影響分析是基于仿真實(shí)驗(yàn)的.首先生成一定數(shù)量的空間三維點(diǎn),然后根據(jù)投影模型分別投影到兩幅圖像,對(duì)這些圖像點(diǎn)疊加不同的噪聲,然后對(duì)采用線性估計(jì)方法計(jì)算得到的運(yùn)動(dòng)參數(shù)進(jìn)行數(shù)據(jù)分析.實(shí)驗(yàn)內(nèi)容包括3部分:(1)噪聲模型的影響分析;(2)數(shù)據(jù)噪聲的影響分析;(3)RANSAC策略的影響分析.
(1)系統(tǒng)參數(shù)
相機(jī)的內(nèi)參數(shù)是根據(jù)真實(shí)相機(jī)的配置設(shè)定的:
傳感器:尼康D90(分辨率4288×2848)
鏡頭:Sigma 4.5mm f2.8 EX DC圓形魚眼鏡頭 HSM,標(biāo)稱視角為180°,焦距為4.5mm,投影模型采用等角模型(equisolid angle projection).
外參數(shù)采用適中配置:T=[500,0,200]T,R=[0,0,π/6]T,需要說(shuō)明的是,我們也曾對(duì)類似的平移參數(shù)和旋轉(zhuǎn)參數(shù)進(jìn)行了實(shí)驗(yàn),結(jié)論基本是一致的,這里不再附上其他運(yùn)動(dòng)參數(shù)配置下的實(shí)驗(yàn)結(jié)果.
(2)數(shù)據(jù)生成
空間點(diǎn)是在一個(gè)半球空間按照均勻分布生成的.空間點(diǎn)P(x,y,z)的x和y方向取值范圍都為[-∞,+∞],z方向,即深度方向從200到10 000(該參數(shù)接近一般的應(yīng)用配置),空間點(diǎn)的數(shù)量為300.隨機(jī)生成的空間點(diǎn),通過(guò)已知的攝像機(jī)內(nèi)外參數(shù)分別投影到兩幅魚眼圖像,得到原始的理想對(duì)應(yīng)點(diǎn).然后再疊加不同的噪聲,得到需要的實(shí)驗(yàn)數(shù)據(jù).
實(shí)驗(yàn)中所用的外點(diǎn)(錯(cuò)誤匹配點(diǎn)),直接在圖像中隨機(jī)生成.
(3)噪聲模型
假設(shè)離圖像中心越遠(yuǎn)的區(qū)域,對(duì)應(yīng)點(diǎn)的平均測(cè)量誤差越大,我們對(duì)不同區(qū)域采用不同的噪聲模型來(lái)仿真這種情況.實(shí)驗(yàn)中,圓形的魚眼圖像按面積等分為三個(gè)區(qū)域(如圖1)所示,噪聲模型采用混合高斯模型,表示為:
其中μi分別表示區(qū)域i(i=1,2,3)中噪聲的均值和方差.對(duì)于中心區(qū)域來(lái)說(shuō),μ1=0,采用標(biāo)準(zhǔn)高斯噪聲.中間區(qū)域和最外區(qū)域的均值分別為μ2=1,μ3=2,方差都為σ=1的混合高斯模型.為了實(shí)驗(yàn)的簡(jiǎn)單化,我們假定僅第二幅圖像數(shù)據(jù)受噪聲干擾.
(4)誤差度量
(5)關(guān)于RANSAC
RANSACV算法中的誤差容差t采用角度誤差,即球面向量與它對(duì)應(yīng)的極平面的夾角誤差,而不是常用的幾何距離誤差.通過(guò)簡(jiǎn)單的計(jì)算得知,對(duì)于我們采用的攝像機(jī)系統(tǒng)而言,圖像坐標(biāo)一個(gè)像素的距離誤差近似相當(dāng)于0.001 3弧度的角度誤差.
首先,我們對(duì)理想數(shù)據(jù)疊加兩種不同噪聲的情況進(jìn)行了誤差分析,一種是標(biāo)準(zhǔn)高斯噪聲,即圖像中所有區(qū)域都采用標(biāo)準(zhǔn)高斯噪聲;另一種是不同區(qū)域疊加不同的混合高斯噪聲.在這部分實(shí)驗(yàn)中,數(shù)據(jù)中沒有添加錯(cuò)誤匹配點(diǎn)(outliers),參與線性擬合的數(shù)據(jù)是所有誤差小于3σ的點(diǎn).表1(P63)是兩類噪聲數(shù)據(jù)采用線性算法得到的運(yùn)動(dòng)參數(shù)相對(duì)誤差的均值和標(biāo)準(zhǔn)差,n是多次實(shí)驗(yàn)中對(duì)應(yīng)點(diǎn)的平均數(shù)量.可以看出,兩種噪聲下的數(shù)據(jù)點(diǎn)基本相同,但標(biāo)準(zhǔn)高斯噪聲下的估計(jì)誤差小于混合高斯噪聲的情況.這也說(shuō)明,如果僅僅考慮數(shù)據(jù)噪聲的情況,采用基于標(biāo)準(zhǔn)高斯噪聲的假設(shè),其最終結(jié)果偏于樂觀.在接下來(lái)的實(shí)驗(yàn)中,我們假定圖像點(diǎn)受混合高斯噪聲干擾.
表1 不同噪聲模型的誤差比較Table 1 Error comparison for two different noise models
假設(shè)整個(gè)數(shù)據(jù)集中沒有錯(cuò)誤匹配點(diǎn),數(shù)據(jù)僅受噪聲污染,噪聲模型仍選用混合高斯模型.這部分我們主要分析選擇不同精度的數(shù)據(jù)(或者說(shuō)不同噪聲的數(shù)據(jù))對(duì)線性估計(jì)的影響.不同噪聲數(shù)據(jù)的選擇,我們采用RANSAC算法來(lái)實(shí)現(xiàn).RANSAC算法中用不同的誤差容差t得到不同的子集,通常,取較小的t意味著選取較高精度的對(duì)應(yīng)點(diǎn).由表2可知,隨著t的增大,最終參數(shù)估計(jì)值的誤差均值和標(biāo)準(zhǔn)差都逐步變小.這主要是因?yàn)?第一,當(dāng)t增大時(shí),參與最終模型擬合的內(nèi)點(diǎn)數(shù)增加了,這對(duì)噪聲數(shù)據(jù)的線性估計(jì)是非常有利的;第二,基于我們的假設(shè),遠(yuǎn)離圖像中心區(qū)域的對(duì)應(yīng)點(diǎn)誤差較大,當(dāng)t增大后,參與模型擬合的數(shù)據(jù)覆蓋了更大的圖像范圍,即可以選擇更多遠(yuǎn)離圖像中心的對(duì)應(yīng)點(diǎn)參與模型擬合,正如文獻(xiàn)[10]所述,遠(yuǎn)離圖像中心的數(shù)據(jù)對(duì)全向模型擬合是非常重要的.我們也曾對(duì)不同t時(shí)的內(nèi)點(diǎn)分布進(jìn)行了統(tǒng)計(jì),結(jié)果和預(yù)期是一致的,即t越大,內(nèi)點(diǎn)中包含的遠(yuǎn)離圖像中心的點(diǎn)越多.
需要注意的是,傳統(tǒng)的透視圖像中,通常先選擇較大的t得到初始的參數(shù)估計(jì),然后,在初始模型的約束下,通過(guò)減小t來(lái)逐步選擇高精度點(diǎn)來(lái)提高參數(shù)估計(jì)的精度[14],然而,我們的實(shí)驗(yàn)發(fā)現(xiàn),如果圖像中不同區(qū)域的噪聲情況不同的話,如本文所探討的全向視覺的情況,那么這種誤差容差t的選擇策略是不妥的,這將會(huì)造成大多數(shù)內(nèi)點(diǎn)集中在圖像中心區(qū)域,嚴(yán)重影響最終的參數(shù)估計(jì)精度.
表2 不同噪聲數(shù)據(jù)下的誤差比較Table 2 Error comparison for data with different noise
在實(shí)際應(yīng)用中,不可避免地存在錯(cuò)誤匹配點(diǎn)(外點(diǎn)).在這部分實(shí)驗(yàn)中,我們對(duì)實(shí)驗(yàn)數(shù)據(jù)不僅疊加了噪聲,還在原來(lái)數(shù)據(jù)的基礎(chǔ)上添加了不同比例的外點(diǎn),噪聲模型仍采用混合高斯模型,外點(diǎn)比例以10%的間隔從10%變化到50%,這種同時(shí)帶有噪聲和外點(diǎn)的數(shù)據(jù)更符合實(shí)際情況.我們知道,對(duì)數(shù)據(jù)中包含有外點(diǎn)的參數(shù)估計(jì)問(wèn)題,通常需要采用魯棒估計(jì)技術(shù),這里我們選用基于RANSAC的魯棒估計(jì)方法.
在RANSAC魯棒估計(jì)方法中,誤差容差t是一個(gè)重要的參數(shù),通過(guò)這個(gè)參數(shù)來(lái)判斷數(shù)據(jù)點(diǎn)是否為模型的內(nèi)點(diǎn),通常這個(gè)參數(shù)根據(jù)經(jīng)驗(yàn)決定.一般說(shuō)來(lái),誤差容差選得越大,得到的內(nèi)點(diǎn)越多,但內(nèi)點(diǎn)中也包含了更多大誤差的數(shù)據(jù)點(diǎn).表3(P64)列出了實(shí)驗(yàn)結(jié)果.為了得到更多的內(nèi)點(diǎn),選擇誤差容差t為0.006 5,s為外點(diǎn)比例,n為多次實(shí)驗(yàn)的平均內(nèi)點(diǎn)數(shù)量.與表2中的第五行數(shù)據(jù)相比,在有外點(diǎn)的情況下,最終的估計(jì)精度要低于沒有外點(diǎn)的情況,而且外點(diǎn)比例越大,精度降低得越多,這與我們的想象也是一致的.
盡管為了得到更多的內(nèi)點(diǎn),希望選擇的誤差容差t要大一些,但我們的實(shí)驗(yàn)發(fā)現(xiàn),這種方法并不是最優(yōu)的.這里我們提出一種新的RACSAC策略,這種策略得到的結(jié)果更加準(zhǔn)確,穩(wěn)定和可靠.首先,用較小的t得到較高精度的對(duì)應(yīng)點(diǎn),雖然內(nèi)點(diǎn)數(shù)并不是足夠多,但通過(guò)擬合這些內(nèi)點(diǎn)得到的模型不會(huì)遠(yuǎn)離真實(shí)模型,即盡管得到的這個(gè)模型不夠精確,但通常不會(huì)是一個(gè)隨機(jī)結(jié)果.接著,用逐漸增大的t得到與當(dāng)前模型一致的新內(nèi)點(diǎn)集,并用新內(nèi)點(diǎn)集來(lái)求解校正模型.重復(fù)這一過(guò)程,直到內(nèi)點(diǎn)數(shù)達(dá)到穩(wěn)定或t達(dá)到預(yù)先給定的閾值tmax.實(shí)驗(yàn)中,tmax設(shè)為0.006 5弧度,t以0.001 3弧度的間隔從0.001 3變化到0.006 5.通過(guò)比較表3和表4對(duì)應(yīng)行的數(shù)據(jù)可以發(fā)現(xiàn),其最終性能大大提高.第一,旋轉(zhuǎn)矩陣誤差的均值和標(biāo)準(zhǔn)差分別提高了37%和49%;平移幅度誤差的均值和標(biāo)準(zhǔn)差分別提高68%和74%.第二,用這種方法得到的內(nèi)點(diǎn)數(shù)基本等于對(duì)應(yīng)點(diǎn)總數(shù)(注意,原始數(shù)據(jù)點(diǎn)共300個(gè)),但是傳統(tǒng)的采用固定容差的RANSAC方法則達(dá)不到這個(gè)目標(biāo).第三,這種方法對(duì)外點(diǎn)數(shù)量也是魯棒的.
表3 采用固定容差RANSAC策略的誤差Table 3 Error with a fixed tolerance in RANSAC strategy
表4 采用可變?nèi)莶頡ANSAC策略的誤差Table 4 Error with a varied tolerance in RANSAC strategy
基于上一節(jié)的仿真實(shí)驗(yàn)誤差分析,我們給出一種魚眼圖像運(yùn)動(dòng)參數(shù)線性估計(jì)的方法:
(1)確定圖像對(duì)應(yīng)點(diǎn)(文獻(xiàn)中有大量經(jīng)典的方法),記為集合S.
(2)從S中選擇較高精度的數(shù)據(jù)集S0,用線性算法來(lái)估計(jì)初始基本矩陣 E0.這里數(shù)據(jù)集S0是用小的誤差容差t0通過(guò)RANSAC算法得到的,這將得到一個(gè)可靠但不是非常準(zhǔn)確的初始模型 E0.
(3)選擇大于當(dāng)前誤差容差ti-1的新的誤差容差ti,接著確定與當(dāng)前模型 Ei-1一致的新內(nèi)點(diǎn)集Si,最后用線性算法確定新的模型 Ei.
(4)重復(fù)(3)直到ti達(dá)到預(yù)先給定的閾值tmax或內(nèi)點(diǎn)數(shù)量達(dá)到穩(wěn)定.
(5)用文獻(xiàn)[12]中的方法,分解最后的本質(zhì)矩陣 E,得到初始的運(yùn)動(dòng)參數(shù):旋轉(zhuǎn)矩陣 R和平移向量T.
需要說(shuō)明的是,在運(yùn)動(dòng)估計(jì)問(wèn)題中,除了對(duì)應(yīng)點(diǎn)的數(shù)量外,對(duì)應(yīng)點(diǎn)的分布也是影響最終結(jié)果的一個(gè)重要因素,在本章我們的實(shí)驗(yàn)分析中,數(shù)據(jù)是采用均勻分布生成的,因此最終的結(jié)果誤差都比較小.實(shí)際問(wèn)題中,如果數(shù)據(jù)點(diǎn)在圖像中分布不均勻時(shí),文獻(xiàn)[10]中給出了一種bucketing技術(shù),通過(guò)在圖像中的不同區(qū)域選擇數(shù)據(jù)來(lái)擬合模型,是一種很有效的策略.另外,得到運(yùn)動(dòng)參數(shù)的初始線性估計(jì)之后,如果有必要的話,用非線性算法即標(biāo)準(zhǔn)算法中的第三步,能進(jìn)一步提高運(yùn)動(dòng)參數(shù)的估計(jì)精度.
由于魚眼圖像的非線性變形,使得它的數(shù)據(jù)噪聲嚴(yán)重,定位誤差比較大.對(duì)于數(shù)據(jù)受噪聲干擾的運(yùn)動(dòng)參數(shù)的線性估計(jì),為了抵抗噪聲,需要建立大量充足的對(duì)應(yīng)點(diǎn),且點(diǎn)的分布盡量均勻,且運(yùn)用恰當(dāng)?shù)聂敯艏夹g(shù)是必不可少的.本文我們對(duì)魚眼圖像運(yùn)動(dòng)估計(jì)中的數(shù)據(jù)噪聲、魯棒技術(shù)對(duì)運(yùn)動(dòng)估計(jì)的影響進(jìn)行了實(shí)驗(yàn)和分析,并給出了一種運(yùn)動(dòng)參數(shù)估計(jì)的實(shí)用策略.使用這種策略,一方面可以得到更多的數(shù)據(jù)點(diǎn),這對(duì)噪聲數(shù)據(jù)下的線性估計(jì)問(wèn)題是非常有利的,另一方面,數(shù)據(jù)集中包括了更多的遠(yuǎn)離圖像中心的數(shù)據(jù)點(diǎn).這兩方面都使得運(yùn)動(dòng)參數(shù)的最終估計(jì)在精確度和穩(wěn)定性上得到了明顯提高,是一種實(shí)用的全向視覺參數(shù)估計(jì)方法.
[1] Zhang Z.Determining the Epipolar Geometry and Its Uncertainty:a Review[J].International Journal of Computer Vision,1998,27(2):161-198.
[2] Weng J Y,Huang T S.Motion and Structure from Two Perspective Views:Algorithms,Error Analysis and Error Estimation[J].IEEE Trans on Patter Analysis and Machine Intelligence,1989,11(5):451-476.
[3] Huang T S,Netravali A N.Motion and Structure from Feature Correspondences:A Review[C]//Proc.of the IEEE,1994,82(2):252-268.
[4] John Lim,Nick Barnes,LI Hong-dong.Estimating Relative Camera Motion from the Antipodal-Epipolar Constraint[J].IEEE Trans on Patter Analysis and Machine Intelligence,2010,32(10):1907-1914.
[5] Mikolajczyk K,Tuytelaars T,Schmid C,et al.A Comparison of Affine Region Detectors[J].International Journal of Computer Vision,2005,65(1/2):43-72.
[6] Mikolajczyk K,Schmid C.A Performance Evaluation of Local Descrip to rs[J].IEEE Trans on Pattern Analysis and M achine Intelligence,2005,27(10):1615-1630.
[7] Svoboda T,Pajdla T.Matching in Catadioptric Images with Appropriate Window s and Outliers Removal[C]//Proceedings of the 9th International Conference on Computer Analysis of Images and Patterns,2001:733-740.
[8] Spetsakis M E,Aloimonos Y.Optimal Visual Motion Estimation:a Note[J].IEEE Trans on Patter Analysis and M achine Intelligence,1992,14:959-964.
[9] Weng J,Ahuja N,Huang T S.Optimal Motion and Structure Estimation[J].IEEE Trans on Patter Analysis and M achine Intelligence,1993,15:864-884.
[10] Micusik B,Pajdla T.U sing RANSAC for Omnidirectional Camera Model Fitting[C]//Proc of the 8th Computer Vision Winter Workshop,Valtice Czech Republic,2003:153-158.
[11] Fischler M A,Bolles R C.Random Sample Consensus:A Paradigm for Model Fitting with Applications to Image Analysis and Automated Cartography[J].Communication of the ACM,1981,24(6):381-395.
[12] Hartley R.Multiple View Geometry in Computer Vision[M].2nd ed,Cambridge University Press,2003.
[13] Micusik B.Two View Geometry of Omnidirectional Cameras[D].Phd.Thesis,Czech Technical University,Prague,Czech Republic,2004.
[14] Matas J,Chum O,Urban M,et al.Robust Wide Baseline Stereo from Maximally Stable Extremal Regions[C]//Proc.of 13thBritish Machine Vision Conference,Cardiff,UK,pp.384-393,2002.
Im pact of Data Noise on Parameter Estimation in Omnidirectional Vision
L IXiao-ming,WANG Lan-zhu,TIAN Ya-ping
(School of Mathematical Science,Shanxi University,Taiyuan030006,China)
Based on the characteristics of data noise in context of omnidirectional vision,we assume different noise models for different regions in an omnidirectional image,and the effect of data noise on linear parameter estimation is studied.The results indicated that those data far from the image center have very important impact on the parameter estimation,though the data are less accurate.Furthermore,we also give a data selection method which is performed gradually.The initial model is estimated by using high precision data,and then mo re and mo re data are selected to ensure getting as more points as possible,meanwhile,the data selected should cover more regions near the image border.The experiment results show that this method can obtain more accurate and stable final estimate.
omnidirectional vision;data noise;parameter estimation
TP391
A
0253-2395(2011)01-0060-06*
2010-09-20;
2010-10-28
國(guó)家自然科學(xué)基金(60773132);山西省自然科學(xué)基金(2009011020-1)
李曉明(1965-),男,山西靈石人,博士,副教授,主要研究方向?yàn)橛?jì)算機(jī)視覺和圖像配準(zhǔn).E-mail:lixm@sxu.edu.cn