李耀軍 潘 泉 趙春暉
(1.西安電子工程研究所 西安 710100;2.西北工業(yè)大學(xué) 西安 710072)
寬基線一詞用于圖像配準(zhǔn)領(lǐng)域時(shí),泛指待配準(zhǔn)圖像間存在著明顯的差異,如較大的位置、角度、尺度及光照等變化[1]。寬基線條件下圖像中即使是同一特征,所表示出來(lái)的光學(xué)、幾何等特性都有很大不同,加上噪聲、模糊、遮擋等其它因素存在,都大大增加了寬基線圖像配準(zhǔn)的難度。寬基線圖像配準(zhǔn)中對(duì)圖像幾何變換、光照變換、噪聲影響、圖像畸變等因素都能夠保持穩(wěn)定性的特征,稱為不變特征(Invariant Feature)[1]。鑒于不變特征在圖像配準(zhǔn)領(lǐng)域的顯著優(yōu)勢(shì)與巨大應(yīng)用價(jià)值,國(guó)內(nèi)外不少學(xué)者對(duì)此展開(kāi)了研究[1-10]。
在衛(wèi)星導(dǎo)航不可用的情況下,利用景象匹配精確定位輔助慣性導(dǎo)航,是目前無(wú)人機(jī)容錯(cuò)型導(dǎo)航系統(tǒng)可靠的備用方案之一??紤]到無(wú)人機(jī)平臺(tái)的特殊性,如飛行姿態(tài)實(shí)時(shí)變化,導(dǎo)致實(shí)時(shí)圖和基準(zhǔn)圖之間存在大角度旋轉(zhuǎn)、劇烈光照變化等差異,傳統(tǒng)的模板匹配算法由于需要借助無(wú)人機(jī)平臺(tái)的實(shí)時(shí)運(yùn)動(dòng)狀態(tài),如姿態(tài)、高度等,預(yù)先估計(jì)出實(shí)時(shí)圖相對(duì)于基準(zhǔn)圖的旋轉(zhuǎn)因子和尺度因子,然后再進(jìn)行配準(zhǔn)。這不僅增加了系統(tǒng)的復(fù)雜度,而且通過(guò)航向偏差得到的旋轉(zhuǎn)角度精度較低,難于補(bǔ)償圖像仿射變換或投影變換帶來(lái)的誤差。與傳統(tǒng)模板匹配算法相比,基于不變特征的配準(zhǔn)算法在精度和魯棒性方面均具有較大優(yōu)勢(shì)。
SURF 特征,即快速魯棒特征[7](Speeded-Up Robust Features,SURF),它是一種新的局部不變特征算子。SURF 對(duì)子區(qū)域的梯度信息進(jìn)行了整合,有效解決了幾何變換、畸變、仿射變換、視角變換、亮度變換、噪聲干擾等情況下的匹配問(wèn)題。Oconaire C等[8]使用SURF 特征進(jìn)行圖像定位,Gossow D 等[9]利用SURF 特征進(jìn)行目標(biāo)探測(cè),Zhang Zhanyu 等[10]使用SURF 實(shí)現(xiàn)視覺(jué)同步定位于構(gòu)圖(SLAM)等。
圖像領(lǐng)域中奇異值[11](singular value decomposition,SVD)作為圖像的一種代數(shù)特征,已經(jīng)在圖像識(shí)別中得到成功應(yīng)用。圖像的奇異值具有良好的穩(wěn)定性,奇異值反映了圖像的一種代數(shù)本質(zhì),這種本質(zhì)不是直觀的,而是一種內(nèi)在屬性,它具備代數(shù)和幾何上的不變性[12]。通過(guò)對(duì)實(shí)時(shí)圖與基準(zhǔn)圖進(jìn)行奇異值分解后,將不易受隨機(jī)因素干擾的信息作為該模式的特征提取出來(lái),具有增強(qiáng)識(shí)別精度、減少運(yùn)算量和提高運(yùn)算速度的作用,且奇異值特征具有良好的可區(qū)分性、穩(wěn)定性和獨(dú)立性[13]。
面向無(wú)人機(jī)視覺(jué)導(dǎo)航,針對(duì)景象匹配的核心技術(shù)和難點(diǎn)問(wèn)題之一,即寬基線條件下的景象匹配,提出一種基于SVD-SURF 的寬基線魯棒景象匹配(SVD-SURF-Based Wide Baseline Robust Scene Matching,S2WB-RSM)算法。深入研究實(shí)時(shí)圖與基準(zhǔn)圖之間發(fā)生較大平移、旋轉(zhuǎn)、尺度變化、亮度變化等條件下的魯棒特征檢測(cè)、描述與快速、精確匹配問(wèn)題。
若矩陣A∈Rm×n,則存在正交矩陣U={u1,u2,…,um}∈Rm×m,V={v1,v2,…,vn}∈Rn×n,使得UTAV=diag{σ1,σ2,…,σp}=W,p=min(m,n),即A=UWVT,則稱為A 的奇異值分解。其中,σ1≥σ2≥…≥σp≥0,σi(i=1,2,…,p)為A 的奇異值,是AAT或ATA 的特征值的平方根,即
a.特征向量
定義 設(shè)A 是n 階方陣,若有數(shù)λ 和非零向量x,使得
稱數(shù)λ 是A 的特征值,非零向量x 是A 對(duì)應(yīng)于特征值λ 的特征向量。
b.奇異值特征向量的幾何性質(zhì)
奇異值向量具有如下幾何性質(zhì)[11,15,16]:
· 穩(wěn)定性。由于奇異值特征向量具有良好的穩(wěn)定性,所以它對(duì)圖像噪音、圖像光照條件引起的灰度變化具有不敏感的特性。
· 轉(zhuǎn)置不變性。A 和AT有相同的奇異值,即對(duì)應(yīng)于同一個(gè)奇異值特征向量。
· 旋轉(zhuǎn)不變性。圖像A 和旋轉(zhuǎn)后的圖像有相同的奇異值特征向量。
· 位移不變性。對(duì)圖像的位移變換可歸結(jié)為對(duì)圖像矩陣作行(或列)的置換,原始圖像A 與其交換兩行(或兩列)后的圖像有相同的SVD 特征向量。
· 鏡像變換不變性。若對(duì)任何一個(gè)正交于x的向量y,有關(guān)系T(y+ax)=y-ax,其中,a 是實(shí)常數(shù),則稱變換T 為鏡像變換。奇異值特征向量具有鏡像變換不變性。
c.奇異值特征向量降維[17]
根據(jù)奇異值分解的定義,m×n 維圖像矩陣奇異值分解后,得到的奇異值個(gè)數(shù)為p=min(m,n)。如果對(duì)p 個(gè)奇異值特征進(jìn)行匹配,由于p 值較大,導(dǎo)致計(jì)算量較大,嚴(yán)重影響匹配的實(shí)時(shí)性。若根據(jù)定理1 和定理2 對(duì)奇異值特征向量進(jìn)行降維[12],保留圖像矩陣的較大奇異值,即忽略較小奇異值,再進(jìn)行匹配,則可大大減小計(jì)算量,極大提高匹配的實(shí)時(shí)性。
定理1 若矩陣A ∈Rm×n,A 的SVD 由上述定義給出,且σ1≥σ2≥…≥σr?σr+1=…=σp=0,p=min(m,n),則其中,Ur={u1,u2,…,ur},Vr={v1,v2,…,vr},Wr=diag(σ1,σ1,…,σr)。
圖1 原圖像和重建后的圖像
定理1 將矩陣表示成了秩r 矩陣的和,同時(shí)將矩陣中向量組的相關(guān)性問(wèn)題轉(zhuǎn)化為矩陣的非零奇異值個(gè)數(shù)問(wèn)題。此時(shí),矩陣的秩等于非零奇異值個(gè)數(shù)。
定理2 假設(shè)A ∈Rm×n,A 的SVD 由上述定義給出,且rank(A)=r ≥s,m,n,r,s 均為正整數(shù)。若Ws因此,rank(As)=rank(Ws)=s,則‖A
定理2 表明,在Frobenious 范數(shù)意義下,As是在空間Rm×n
s (秩為s 的m×n 維矩陣構(gòu)成的線性空間)中A 的一個(gè)降秩最佳逼近。也即是說(shuō),在Frobenious范數(shù)意義下,As是A 中所有秩為s 矩陣的一個(gè)最佳逼近。從定理1 與定理2 可知,奇異值特征向量降維是舍棄某些較小奇異值的過(guò)程。將圖像矩陣進(jìn)行奇異值分解,再通過(guò)奇異值特征向量降維可獲得圖像矩陣的有效秩。這里,有效秩為所保留的奇異值個(gè)數(shù)。由保留奇異值生成的新圖像矩陣是原始圖像矩陣在Frobenious 范數(shù)意義下的一個(gè)降秩最佳逼近[17]。
奇異值特征向量降維時(shí)要在計(jì)算復(fù)雜度和正確識(shí)別率之間權(quán)衡。選的特征數(shù)太少影響識(shí)別,太多會(huì)增加計(jì)算量。圖2 從左向右依次是原圖像及其相應(yīng)的提取5、10、15、20、30 個(gè)特征重建后的圖像。從圖1 中可以看出30 個(gè)特征重建后的圖像和原圖很接近,從直觀上說(shuō)明奇異值特征向量降維是可行的,并可大幅度減小特征匹配的計(jì)算量,提高景象匹配的實(shí)時(shí)性。
d.奇異值特征向量排序[13]
奇異值向量中的特征均為從大到小排序,亦即,所有類別樣本的奇異值向量具有結(jié)構(gòu)相似的模式特征,這種特征雖然具有獨(dú)立性,但其可區(qū)分性和穩(wěn)定性較弱。如果直接將該矢量輸入支持向量機(jī)訓(xùn)練,則其學(xué)習(xí)能力和推廣能力都很差。對(duì)特征矢量的分量進(jìn)行重排序,從而使得相同類別圖像具有相同的結(jié)構(gòu)特征和不同類別圖像具有不同的結(jié)構(gòu)特征,從而使其特征具有可區(qū)分性、穩(wěn)定性和獨(dú)立性。文獻(xiàn)[15]給出了詳細(xì)過(guò)程。
為實(shí)現(xiàn)S2WB-RSM 算法,首先需要對(duì)實(shí)時(shí)圖與基準(zhǔn)圖分別進(jìn)行奇異值分解、特征向量降維和歸一化及排列。在此基礎(chǔ)上,構(gòu)建了SURF 尺度空間,運(yùn)用快速Hessian 矩陣定位極值點(diǎn),計(jì)算出實(shí)時(shí)圖的64 維SURF 特征描述子,基于SVD 完成特征向量的特征計(jì)算,利用SVD 算法建立匹配矩陣并獲得特征點(diǎn)間的對(duì)應(yīng)關(guān)系。然后,基于Hessian 矩陣跡完成特征點(diǎn)匹配。最后,使用隨機(jī)抽樣一致性(RANSAC)方法剔除出格點(diǎn),實(shí)現(xiàn)位置參數(shù)的精確估計(jì)。
S2WB-RSM 算法奇異值特征向量提取共六個(gè)步驟,具體如下:Setp 1:圖像數(shù)字化;Setp 2:圖像灰度化;Setp 3:圖像奇異值分解;Setp 4:特征值向量提取;Setp 5:特征值向量排序;Setp 6:前k 較大特征向量提取。
表1 圖像縮放變換時(shí)奇異值特征矢量的前k 個(gè)歸一化分量(k=10)
矩陣奇異值分解具有穩(wěn)定性。當(dāng)圖像縮放程度不大時(shí),奇異值特征矢量的誤差可視為小范圍內(nèi)的噪聲擾動(dòng),對(duì)景象匹配的配準(zhǔn)誤差影響并不大。所以,奇異值特征矢量的不變性可顯著提高景象匹配的魯棒性。表1 顯示了圖像縮放變換時(shí)奇異值特征矢量的前k 個(gè)歸一化分量,其中
通過(guò)計(jì)算圖像縮放變換時(shí)奇異值特征矢量的前10 個(gè)分量,驗(yàn)證了圖像奇異值特征矢量在縮放變換下具有的不變性。實(shí)驗(yàn)表明,該性質(zhì)與奇異值特征矢量在其他變換條件下的不變性一樣,是奇異值特征矢量作為圖像代數(shù)特征的一個(gè)重要體現(xiàn)。
為了實(shí)現(xiàn)SURF 特征提取與匹配,首先構(gòu)建SURF尺度空間,運(yùn)用快速Hessian 矩陣定位極值點(diǎn),計(jì)算出航空?qǐng)D像的64 維SURF 特征描述子;然后,基于Hessian 矩陣跡完成特征點(diǎn)匹配;最后,使用RANSAC 方法剔除出格點(diǎn),實(shí)現(xiàn)位置參數(shù)的精確估計(jì)。
上述SURF 特征提取與匹配過(guò)程主要包括兩個(gè)部分:無(wú)人機(jī)航空序列圖像的SURF 特征描述子提取和無(wú)人機(jī)航空序列圖像的SURF 特征點(diǎn)匹配。具體實(shí)現(xiàn)步驟如下:Setp 1:多尺度空間構(gòu)建;Setp 2:快速Hessian 矩陣檢測(cè);Setp 3:SURF 特征描述子提取;Setp 4:基于Hessian 矩陣跡的特征點(diǎn)匹配;Setp 5:基于RANSAC 的局部參數(shù)估計(jì)。
a.復(fù)雜度分析
主要從兩個(gè)過(guò)程對(duì)S2WB-RSM 算法的復(fù)雜度進(jìn)行分析與優(yōu)化:多尺度空間構(gòu)建和特征描述子的建立。下文以尺度不變特征變換(SIFT)算法為參照,對(duì)S2WB-RSM 算法的復(fù)雜度作深入分析。在多尺度空間構(gòu)建方面,高斯拉普拉斯(LOG)算子被認(rèn)為是準(zhǔn)確性最高的,但其在算法的時(shí)間復(fù)雜度方面卻很欠缺,SIFT 算法采用的高斯差分(DOG)算子,在很大程度上近似于LOG 算子,但因?yàn)椴捎昧艘噪A差分來(lái)近似作為尺度空間的值,避免了梯度的求解,從而降低了時(shí)間復(fù)雜度,但仍不可避免的要在構(gòu)建尺度空間時(shí)要對(duì)每個(gè)點(diǎn)作不同的浮點(diǎn)高斯卷積運(yùn)算,程序的時(shí)間復(fù)雜度仍很大。而算法在特征點(diǎn)的提取方面采用了另外的一種方法,即使用Hessian矩陣的值作為點(diǎn)該尺度空間的值,Hessian 矩陣采用的方法在原理上和LOG 算子也有很大的相似處,二維的高斯函數(shù)是LOG 算子的基礎(chǔ),Hessian 矩陣的分量Dxx、Dxy、Dyy,分別和高斯函數(shù)的二階方向?qū)?shù)?2g(σ)/?x2、?2g(σ)/?x?y、?2g(σ)/?y2對(duì)應(yīng)的相似關(guān)系,因此采用Hessian 矩陣的方陣值來(lái)表示多尺度空間的值有近似的效果,而且由于算法事先已經(jīng)計(jì)算出了圖像的積分圖像,若計(jì)算任意區(qū)域的點(diǎn)則只要采用查表法就可實(shí)現(xiàn),避免了DOG 算子在構(gòu)建尺度空間時(shí)進(jìn)行大量的浮點(diǎn)運(yùn)算,從而加速的尺度空間的構(gòu)建過(guò)程。
在特征描述子的建立方面,兩者的復(fù)雜度也有稍微的不同。SIFT 算法為了得到更穩(wěn)定的特征點(diǎn),在局部區(qū)域進(jìn)行了特征點(diǎn)的重新估算,在主方向的基礎(chǔ)上,找到了其副方向,并對(duì)特征點(diǎn)的方向進(jìn)行了旋轉(zhuǎn),保證了特征點(diǎn)的方向不變性,并用臨近區(qū)域點(diǎn)的加權(quán)特征值生成最終的128 維特征向量。而算法是對(duì)局部區(qū)域在x,y 方向求出了harr 函數(shù)的小波相位,并用高斯加權(quán)最終生成需要的64 維特征向量,因此,算法在時(shí)間復(fù)雜度方面較SIFT 優(yōu)勢(shì)明顯。
b.實(shí)時(shí)性與精確性分析
本次實(shí)驗(yàn)數(shù)據(jù)來(lái)自某型無(wú)人機(jī)實(shí)測(cè)數(shù)據(jù),基準(zhǔn)圖分辨率為5m/pixel,速度約120km/h,航高2000m,直線平飛,相機(jī)幀率25fps,尺寸320 ×240pixel,數(shù)據(jù)記錄30min。實(shí)驗(yàn)驗(yàn)證如表2 所示,S2WB-RSM 算法的實(shí)時(shí)性較強(qiáng)(≥30Hz),所耗時(shí)間幾乎是基于SURF 特征算法的1/10;而且匹配精度較高(≤10m),精度提高近一倍,比較適合于無(wú)人機(jī)視覺(jué)導(dǎo)航應(yīng)用。
表2 S2WB-RSM 算法的實(shí)時(shí)性和精確性參數(shù)統(tǒng)計(jì)表
S2WB-RSM 算法主要包括SVD 特征計(jì)算模型、多尺度空間構(gòu)建、快速Hessian 矩陣檢測(cè)、SURF 特征描述子提取、基于Hessian 矩陣跡的特征點(diǎn)匹配以及基于RANSAC 的局部參數(shù)估計(jì)等六個(gè)過(guò)程。具體流程如圖2 所示。
圖2 S2WB-RSM 算法流程圖
a.SVD 特征計(jì)算模型
對(duì)實(shí)時(shí)圖與基準(zhǔn)圖分別進(jìn)行奇異值分解、奇異值特征向量降維、特征矢量歸一化(實(shí)現(xiàn)奇異值特征的比例不變性,把所有數(shù)據(jù)歸一到區(qū)間[-1,1])、特征矢量排列等步驟后構(gòu)成特征庫(kù),用于SURF 特征提取與特征匹配;由于奇異值特征向量從較大維數(shù)降低到較小的維數(shù),從而大幅度減小了計(jì)算量,同時(shí)提高了匹配的可靠性。
b.多尺度空間構(gòu)建[18]
相鄰尺度差和高斯二階導(dǎo)的大小有關(guān),采用9 ×9 濾波器,高斯二階導(dǎo)的大小定為3,其濾波器大小的1/3,即9×1/3=3。計(jì)算下一個(gè)濾波器的大小,為了保證濾波器的中心位于像素點(diǎn)上,要對(duì)第一層的濾波器增加偶數(shù)像素。這樣濾波器的大小就增加了6 像素,即下一層的濾波器的大小變?yōu)?5。濾波器尺寸可用size=3+5s 公式計(jì)算。其中,s 是σ 的倍數(shù)。
c.快速Hessian 矩陣檢測(cè)
對(duì)于圖像I 中一個(gè)給定的點(diǎn)X=(x,y),Hessian矩陣中采用近似的高斯核函數(shù),即箱式濾波器Dxx、Dxy、Dyy,9×9 的濾波器是對(duì)高斯核函數(shù)在σ=1.2 處的近似。為保持計(jì)算精度,引入高斯核函數(shù)和高斯核函數(shù)的比例因子ω,Hessian 矩陣的行列式變形為
實(shí)驗(yàn)中ω 取常量0.9,對(duì)位置估計(jì)精度影響較小,且可大幅降低算法復(fù)雜度。
d.SURF 特征描述子提取
極值點(diǎn)的主方向計(jì)算首先以極值點(diǎn)為中心選取半徑為6d 的圓形區(qū)域(d 即極值點(diǎn)所在尺度),計(jì)算哈爾小波在x 和y 方向上的響應(yīng)值,記為hx、hy。以σ=3s 為加權(quán)因子對(duì)兩個(gè)響應(yīng)值高斯加權(quán),記為Whx、Why。對(duì)Whx、Why用直方圖統(tǒng)計(jì)并將360°均分為72 組,以極值點(diǎn)為中心的圓均分為6 個(gè)區(qū),統(tǒng)計(jì)各60° 扇區(qū)內(nèi)的Whx、Why,記為∑Whx、∑Why,同時(shí)計(jì)算該區(qū)的梯度值,梯度值最大區(qū)域所在的方向即為該極值點(diǎn)的主方向,以∑Whx、∑Why反正切計(jì)算出主方向度數(shù)。
為了提取極值點(diǎn)描述子,需要在極值點(diǎn)周圍選取20 ×20 大小的區(qū)域。首先以極值點(diǎn)為中心,將區(qū)域的方向旋轉(zhuǎn)到極值點(diǎn)的方向。將這個(gè)正方形區(qū)域分成4 ×4 共16 個(gè)子區(qū)域,每個(gè)子區(qū)域里有(20/4=5)5 ×5 的像素。這里之所以選擇4 ×4 大小的子區(qū)域,在每一個(gè)子區(qū)域分別計(jì)算每個(gè)像素點(diǎn)在哈爾小波x 和y 方向上的響應(yīng)值。
計(jì)算完所有的像素的響應(yīng)值后,對(duì)所有的dx,dy,以極值點(diǎn)為中心進(jìn)行高斯加權(quán)(σ=3.35),分別記為dx,dy,然后求和,記為∑dx,∑dy。并對(duì)dx,dy 絕對(duì)值求和,記為∑| dx|,∑| dy|,均存入特征向量并歸一化,使得描述子具有光照、尺度不變性,這樣就形成了一個(gè)四維的向量:v=對(duì)16 個(gè)子區(qū)域分別求特征向量,形成一個(gè)16 ×4=64 維的特征向量,利用該方法對(duì)一對(duì)實(shí)時(shí)圖和基準(zhǔn)圖進(jìn)行了SURF 特征點(diǎn)提取。利用該方法對(duì)一對(duì)實(shí)時(shí)圖和基準(zhǔn)圖進(jìn)行了SURF 特征點(diǎn)提取,如圖3 所示。
圖3 SURF 特征點(diǎn)提取及基于Hessian 矩陣跡的特征點(diǎn)匹配
e.基于Hessian 矩陣跡的特征點(diǎn)匹配
在Hessian 矩陣跡計(jì)算完畢之后,對(duì)Hessian 矩陣主對(duì)角線求和,即
其中,dx、dy 仍然是積分圖像想濾波器的x 和y方向上的響應(yīng)值。在進(jìn)行相似性度量的時(shí)候,首先判斷Hessian 矩陣的跡的符號(hào),如果trace(i)是大于0的數(shù),令描述子等于1,反之,令描述子等于-1。
若兩個(gè)描述子的trace(i)相同,可繼續(xù)比較。反之,后面的描述子則不需要再比較。比較時(shí)需先分別計(jì)算實(shí)時(shí)圖描述子discriptorsensed和基準(zhǔn)圖描述子discriptorref的歐氏距離,即
計(jì)算最近鄰匹配點(diǎn)distf和次近鄰匹配點(diǎn)dists,若distf/distf≤1,則二者匹配。基于Hessian 矩陣跡的特征點(diǎn)匹配結(jié)果如圖4 所示。
圖4 實(shí)時(shí)圖中心位置及其在基準(zhǔn)圖上的定位結(jié)果
f.基于RANSAC 的局部參數(shù)估計(jì)
RANSAC 算法具體流程如下:a.隨機(jī)選擇N 個(gè)樣本;b.根據(jù)抽取樣本估計(jì)模型數(shù);c.用估計(jì)模型計(jì)算各匹配點(diǎn)對(duì)間的距離,將距離小于閾值的匹配點(diǎn)作為內(nèi)點(diǎn);d.上述過(guò)程重復(fù)k 次,選擇一個(gè)包含內(nèi)點(diǎn)最多的點(diǎn)集,重新計(jì)算模型參數(shù)。各參數(shù)計(jì)算關(guān)系為:
其中外點(diǎn)概率為ε;采樣點(diǎn)對(duì)數(shù)為q;k 次采樣至少有1 次全部是內(nèi)點(diǎn)的概率為P。
用RANSAC 算法求解給定兩幅圖像間的變換參數(shù),剔除外點(diǎn)后,符合匹配要求的內(nèi)點(diǎn)共46 對(duì),圖3 和圖4 的實(shí)驗(yàn)結(jié)果顯示了SURF 出格點(diǎn)提出后的內(nèi)點(diǎn)配對(duì)結(jié)果、實(shí)時(shí)圖基于RANSAC 估計(jì)參數(shù)的變換結(jié)果以及實(shí)時(shí)圖中心在基準(zhǔn)圖上的定位結(jié)果。
為驗(yàn)證S2WB-RSM 算法在無(wú)人機(jī)實(shí)際工作環(huán)境下有效性,選取了SIFT 特征與使用的SVD-SURF特征做實(shí)驗(yàn)對(duì)比,分別就圖像配準(zhǔn)的精確性、魯棒性和實(shí)時(shí)性進(jìn)行驗(yàn)證。由可見(jiàn)光圖像數(shù)據(jù)驗(yàn)證S2WBRSM 算法的精確性,由SAR 圖像數(shù)據(jù)驗(yàn)證S2WBRSM 算法的魯棒性,最后,通過(guò)并行計(jì)算實(shí)驗(yàn)來(lái)驗(yàn)證S2WB-RSM 算法的實(shí)時(shí)性。
實(shí)驗(yàn)數(shù)據(jù):無(wú)人機(jī)的實(shí)時(shí)圖來(lái)自某次飛行試驗(yàn)記錄(uvs110722-003.AVI,jingxiangpipei-16.mat)。uvs110722-003.AVI 視頻時(shí)長(zhǎng)701s,圖像分辨率為640 ×480,幀率為30fps。對(duì)于光電平臺(tái)記錄數(shù)據(jù)共53851 條記錄(包括無(wú)人機(jī)的經(jīng)度、緯度、高度、速度、俯仰角、偏航角、滾轉(zhuǎn)角等字段)。數(shù)據(jù)顯示起始幀大地坐標(biāo)為(33.65309110°,109.1199911°)。實(shí)驗(yàn)截取1:30~2:38 之間視頻數(shù)據(jù),對(duì)應(yīng)平臺(tái)記錄數(shù)據(jù)即6914~12138 條,共5224 條?;鶞?zhǔn)圖來(lái)自預(yù)先制備的衛(wèi)星正射影像圖,分辨率為5m/pixel。實(shí)驗(yàn)從中連續(xù)抽取800 幀圖像序列作為實(shí)時(shí)圖。實(shí)驗(yàn)環(huán)境:PC 機(jī),奔騰2.0GCPU,1G 內(nèi)存,Windows XP操作系統(tǒng),VC++開(kāi)發(fā)平臺(tái)。無(wú)人機(jī)SAR 圖像的基準(zhǔn)圖和實(shí)時(shí)圖均來(lái)自美國(guó)桑迪亞國(guó)家重點(diǎn)實(shí)驗(yàn)室公布的網(wǎng)站數(shù)據(jù)。
實(shí)時(shí)圖尺寸為320 ×240 像素,為序列圖像?;鶞?zhǔn)圖大小為640 ×480 像素,為分塊圖像,采用圖號(hào)調(diào)用方式。對(duì)源圖像統(tǒng)一采用Daubechies 小波基進(jìn)行圖像壓縮,以提高景象匹配的實(shí)時(shí)性[19]。
a.可見(jiàn)光實(shí)時(shí)圖序列適配區(qū)連續(xù)景象匹配
基于可見(jiàn)光實(shí)時(shí)圖序列的連續(xù)景象匹配實(shí)驗(yàn)結(jié)果數(shù)據(jù)如表3 所示,實(shí)驗(yàn)結(jié)果曲線如圖5 與圖6所示。
表3 基于可見(jiàn)光實(shí)時(shí)圖序列的連續(xù)景象匹配對(duì)比實(shí)驗(yàn)數(shù)據(jù)
圖5 基于SVD-SIFT 特征的可見(jiàn)光實(shí)時(shí)圖序列配準(zhǔn)結(jié)果
圖6 基于SVD-SURF 特征的可見(jiàn)光實(shí)時(shí)圖序列配準(zhǔn)結(jié)果
無(wú)人機(jī)平臺(tái)景象匹配在實(shí)際工作中通常是以實(shí)時(shí)圖序列為配準(zhǔn)對(duì)象,其配準(zhǔn)精度直接反應(yīng)了匹配算法能否滿足實(shí)際要求。由于可見(jiàn)光實(shí)時(shí)圖與基準(zhǔn)圖差異較大,從表3 可以看出基于SVD-SIFT 特征的匹配算法配準(zhǔn)精度較低,共有73.3%的配準(zhǔn)點(diǎn)滿足無(wú)人機(jī)導(dǎo)航任務(wù)要求(配準(zhǔn)誤差≤2 像素);基于SVD-SURF 特征的S2WB-RSM 算法則有86.6%的配準(zhǔn)點(diǎn)滿足無(wú)人機(jī)任務(wù)需求的實(shí)際要求(配準(zhǔn)誤差≤2 像素),在匹配精確性方面略顯優(yōu)勢(shì)。
b.SAR 實(shí)時(shí)圖序列適配區(qū)連續(xù)景象匹配
本實(shí)驗(yàn)將SAR 圖像序列用于連續(xù)景象匹配,其實(shí)驗(yàn)結(jié)果數(shù)據(jù)如表4 所示,實(shí)驗(yàn)結(jié)果曲線如圖7 與圖8 所示。雖然SAR 成像受氣象條件的影響較小,實(shí)時(shí)圖與基準(zhǔn)圖比較相似,但是,由于SAR 圖像信噪比較低,加之分辨率較低(實(shí)驗(yàn)數(shù)據(jù)分辨率為0.5米/像素),特征提取比較困難,從而導(dǎo)致配準(zhǔn)誤差比可見(jiàn)光的大一些。表4 統(tǒng)計(jì)顯示,SAR 圖像序列的基于SVD-SIFT 特征的算法與基于SVD-SURF 的S2WB-RSM 算法配準(zhǔn)最大誤差分別為6 個(gè)像素和4個(gè)像素,實(shí)驗(yàn)結(jié)果表明,對(duì)于低信噪比圖像,S2WBRSM 算法的魯棒性較好。
表4 基于SAR 實(shí)時(shí)圖序列的連續(xù)景象匹配對(duì)比實(shí)驗(yàn)數(shù)據(jù)
圖7 基于SVD-SIFT 特征的SAR 實(shí)時(shí)圖序列配準(zhǔn)結(jié)果
圖8 基于SVD-SURF 特征的SAR 實(shí)時(shí)圖序列配準(zhǔn)結(jié)果
表5 SVD-SIFT 算法一次小波分解耗時(shí)統(tǒng)計(jì)
表6 S2WB-RSM 算法一次小波分解耗時(shí)統(tǒng)計(jì)
采用小波圖像分解時(shí),兩種快速景象匹配算法耗時(shí)如表5 與表6 所示,實(shí)驗(yàn)統(tǒng)計(jì)數(shù)據(jù)表明SVDSURF 算法比SVD-SIFT 算法在實(shí)時(shí)性能方面分別提高26.5% 和33.3%。因此,在實(shí)時(shí)性方面,S2WB-RSM 算法可并行計(jì)算且實(shí)時(shí)性明顯高于SVD-SIFT 算法。
綜上所述,與SVD-SIFT 算法相比,S2WB-RSM算法計(jì)算量較小,加之SVD 特征向量穩(wěn)定性優(yōu)勢(shì),在低信噪比圖像配準(zhǔn)方面誤差更小。而且,在多區(qū)域景象匹配并行計(jì)算方面,S2WB-RSM 算法比SVDSIFT 算法更具有實(shí)時(shí)性。因此,S2WB-RSM 算法性能更符合無(wú)人機(jī)系統(tǒng)對(duì)景象匹配導(dǎo)航算法的實(shí)時(shí)性、精確性和魯棒性要求。
面向無(wú)人機(jī)視覺(jué)導(dǎo)航,基于圖像奇異值特征的良好區(qū)分性、穩(wěn)定性和獨(dú)立性,提出了適合無(wú)人機(jī)平臺(tái)的S2WB-RSM 算法,通過(guò)選取SIFT 特征與SVDSURF 特征做實(shí)驗(yàn)對(duì)比,分別就圖像配準(zhǔn)的精確性、魯棒性和實(shí)時(shí)性進(jìn)行測(cè)試,充分顯示了奇異值特征的穩(wěn)定性優(yōu)勢(shì)以及SURF 特征的快速魯棒優(yōu)勢(shì),同時(shí),驗(yàn)證了S2WB-RSM 算法能夠適應(yīng)航空序列圖像的一定的旋轉(zhuǎn)、尺度變換及噪聲干擾,具有較強(qiáng)的實(shí)時(shí)性、精確性和魯棒性,該算法為下一階段無(wú)人機(jī)載嵌入式視覺(jué)導(dǎo)航系統(tǒng)的研制奠定了重要基礎(chǔ)。
[1]M.Brown,D.G.Lowe.Automatic panoramic image stitching using invariant features [J].International Journal of Computer Vision,2007,74(1) :59-73.
[2]K.Mikolajczyk,C.Schmid.A performance evaluation of local descriptors [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(10) :1615-1630.
[3]D.G.Lowe.Distinctive image features from scale-invariant keypoints [J].International Journal of Computer Vision.2004,60(2) :91-110.
[4]K.Mikolajczyk,T.Tuytelaars,C.Schmid,et.al.A comparison of affine region detectors[J].International Journal of Computer Vision,2005,65(1) :43-72.
[5]V.Chandrasekhar,M.Makar,G.Takacs,et.al.Survey of SIFT compression schemes[C].Proceedings of International Conference on Pattern Recognition (ICPR),Istanbul,Turkey,August 2010.
[6]Brown M,Lowe D G.Automatic panoramic image stitching using invariant features [J].International Journal of Computer Vision,2007,74(1) :59-73.
[7]Bay H,Ess A,Tuytelaars T,et al.Speededup robust features (SURF) [J].Computer Vision and Image Understanding,2008,7(3) :346-359.
[8]Oconaire C,Blighe M,Oconno N.Sense Cam image localisation using hierarchical SURF trees[J].Springer Verlag Berlin Heidelberg,2009,9(1) :15-26.
[9]Gossow D,Pellenz J,Paulus D.Danger sign detection using color histograms and SURF matching [C].IEEE International Workshop on Safety,Security and Rescue Robotics.Tohoku,Japanese:IEEE,2008,3 (1) :13-18.
[10]Zhang Zhanyu,Huang Yalou,Li Chao,et al.Monocular vision simultaneous localization and mapping using SURF[C].World Congress on Intelligent Control and Automation.Chongqing,China,2008,5 (11) :1651-1656.
[11]Hong Z.Algebraic feature extraction of image for recognition [J].Pattern Recognition,1991,24(3) :211-219.
[12]周德龍.人臉識(shí)別技術(shù)研究[D].西安:西北工業(yè)大學(xué),2000.
[13]甘俊英,張有為.一種基于奇異值特征的神經(jīng)網(wǎng)絡(luò)人臉識(shí)別新途徑[J].電子學(xué)報(bào),2004,32(1) :170-173.
[14]KlemaV C,Laub A J.Singular value decomposition:its computation and some applications[J].IEEE Trans-actions on Automatic Control,1980,25(2) :164-176.
[15]Gan junying,Zhang Youwei.A New Approach for Face Recognition Based on Singular Value Features and Neural Networks[J].Acta Electronica Sinica,2004,32(1) :170-173.
[16]顧曉波.基于支持向量機(jī)的彩色圖像的人眼定位及人臉檢測(cè)[D].上海:上海師范大學(xué),2007.
[17]李曉東,費(fèi)樹(shù)岷,張濤.基于奇異值特征和支持向量機(jī)的人臉識(shí)別[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,38(6) :981-985.
[18]徐秀云.基于特征點(diǎn)的景象匹配技術(shù)研究[D].南京:南京理工大學(xué),2009.
[19]李耀軍,潘泉等.基于空間關(guān)系幾何約束的無(wú)人機(jī)景象匹配導(dǎo)航[J].計(jì)算機(jī)應(yīng)用研究,2010,27(10) :3822-3825,3846.