崔 星 華
(吉林建筑大學(xué)計算機(jī)科學(xué)與工程學(xué)院,長春 130118)
作為計算機(jī)視覺與模式識別的交叉領(lǐng)域,圖像模式識別的目標(biāo)可理解為[1]:發(fā)覺目標(biāo)之間的重要差異.針對在圖像的模式識別算法中存在的基于全局特征和基于局部特征算法,本文僅探討基于局部特征的SIFT/SURF算法.目前,認(rèn)為基于局部特征的識別與匹配算法有以下3個主要步驟:① 在不同的局部區(qū)域使用探測器提取特征點;② 對特征點附近一定范圍內(nèi)的區(qū)域提取其特征并構(gòu)造特征向量,進(jìn)而形成描述器;③ 通過匹配不同圖像中的描述器,進(jìn)而對特征點進(jìn)行匹配,達(dá)到識別的目的.
尺度不變特征變換(SIFT)是在局部特征匹配領(lǐng)域中應(yīng)用效果較好的算法之一[2],被人們不斷深入地研究和改進(jìn),總結(jié)出了改進(jìn)算法.Lowe于2004年提出、目前普遍認(rèn)為是標(biāo)準(zhǔn)的、且較為成熟的SIFT算法[3].
(1) SIFT的檢測方案. SIFT檢測器是說明特征點的位置的,這里選用尺度不變算法來證明特征點的尺度不變性.則有:
L(x,y,δ)=G(x,y,kδ)*I(x,y)
(1)
由上式得L(x,y,δ):
這里L(fēng)(x,y)為輸入;*為卷積運算;δ為尺度變量.
為了保證極值,人們構(gòu)造如下函數(shù):
D(x,y,δ)=G(x,y,kδ)-G(x,y,δ)
(2)
可證明,DoG與LoG之間的換算關(guān)系:
由上述定義,探測過程是DoG與L(x,y)的卷積操運算,達(dá)到生成DoG的過程,即:
DI(x,y,δ)=D(x,y,δ)*I(x,y)=[G(x,y,kδ)-G(x,y,δ)]*I(x,y)
(3)
(2) SIFT方案. SIFT算法主要用來描述特征點的變化,這里選用直方圖法進(jìn)行單位化,保證抗旋轉(zhuǎn)和照度變換的能力.則有:
(4)
(5)
其中,m(x,y)為梯度;θ(x,y)為方向.
SIFT算法具有尺度不變、抗旋轉(zhuǎn)等特性,但是在應(yīng)用過程中發(fā)現(xiàn)存在如下問題:① 當(dāng)圖像分辨率較高時,計算速度將顯著下降;② 當(dāng)特征向量維數(shù)較高時,匹配速度明顯下降.
因此,在處理大量信息的時候,特別是圖庫內(nèi)動態(tài)查找、圖像視覺導(dǎo)航等應(yīng)用場合中,SIFT計算速度慢的缺陷就尤為明顯.
SURF算法是對SIFT運算存在的問題進(jìn)行了改進(jìn),并獲得顯著成功,已在實踐中得到驗證[4].
(1) SUFR的檢測器方案. 不同于SIFT,SURF的檢測器基Hessian矩陣.Hessian矩陣由下式定義:
(6)
在實際應(yīng)用中,對高斯函數(shù)進(jìn)行離散化.
box-filter濾波器系數(shù)被Hessian矩陣的F范數(shù)所約束,其表達(dá)式為:
可得出:det(H)=DxxDyy-(0.9Dxy)2
(7)
由上式,濾波響應(yīng)按其模型的大小進(jìn)行規(guī)范,使F范數(shù)在任意的濾波器上都是常數(shù).
(2) SURF的描述方案. 與SIFT不同的是SURF用Haar小波來計算興趣點周圍的水平和垂直方向的梯度相應(yīng),小波尺度與box-filter所逼近的一致.這里SURF描述的檢測范圍是4*4的子區(qū)域,所以描述器是一個64維的特征向量.在保證旋轉(zhuǎn)性不變、抗剪切和抗照度的條件下,對SURF做單位化處理.此時,同樣具備旋轉(zhuǎn)不變特征,SURF的描述器維度比SIFT少了一半,因此匹配速度會明顯加快.
本文采用兩組圖片進(jìn)行對比實驗,硬件平臺為聯(lián)想Y450-TSI,軟件平臺為MATLAB7.8a分別選取了標(biāo)準(zhǔn)和模糊的兩組圖片進(jìn)行試驗,旨在比較不同環(huán)境下兩種算法的效果.
(1) 標(biāo)準(zhǔn)圖片. 如圖1,左側(cè)是原始圖片,右側(cè)是旋轉(zhuǎn)90°且加入δ=0.02干擾的圖片;
(2) 實拍圖組. 如圖2,圖片是實拍的教室場景,左右分別為水平和垂直拍攝,并加入模糊干擾;
圖1 標(biāo)準(zhǔn)圖組
圖2 實拍圖組
(3) 數(shù)據(jù)統(tǒng)計. 實驗對比數(shù)據(jù)見表1.
表1 實驗數(shù)據(jù)統(tǒng)計對比
(1) 特征點提取
a.無論是標(biāo)準(zhǔn)圖還是測試圖,SIFT所提取的特征點數(shù)都大大多于SURF;
b.這兩種算法在較標(biāo)準(zhǔn)圖片提取的特征點數(shù)遠(yuǎn)多于加入模糊干擾的圖片提取的特征點數(shù);
c.在加入少量性噪聲時,兩種算法的魯棒性較強(qiáng).SIFT的檢測則有更好的抗噪性;
d.提取速度,SURF是SIFT的8~17倍,在進(jìn)行實時和批量數(shù)據(jù)處理時,有較強(qiáng)的應(yīng)用價值.
(2) 匹配性
a.標(biāo)準(zhǔn)圖片.在匹配數(shù)和匹配率上,SURF都比SIFT高,因為SURF提取的特征點的魯棒性強(qiáng),且這類特征點具有的較高復(fù)現(xiàn)率.SURF是通過提取魯棒性強(qiáng)的點來抑制魯棒性弱的點達(dá)到加速;
b.實拍圖片.由于加入運動模糊,使兩種算法的匹配數(shù)和匹配率都大大降低,其中SURF在匹配率這一項上下降明顯而SIFT反倒略有上升.一方面說明運動模糊使得具有強(qiáng)魯棒性的特征點大大減少;另一方面說明SURF雖然提升了運算速度、降低了算法復(fù)雜度但是并未改善算法穩(wěn)定性;
c.匹配時間上看,SURF比SIFT快10~30倍.
(3) 總耗時
SURF的運算速度比SIFT快得多,是SIFT的7倍以上,說明SURF對實時性處理和批量圖片搜素具有實用價值.
參 考 文 獻(xiàn)
[1] Forsyth David.Computer Vision:A modern approach[M].Prentice Hall,2002:3-18.
[2] Lowe David.Object:Recognition from Local Scale-Invariant[C].ICCV,1999.
[3] Lowe David.Distictive image feature form scale-invariant keypoints[C].IJCV,2004.
[4] Mehrotra H, Majhi B,Gupta P.Annular Iris Recognition Using SURF[C].ICPR,2009.