葛明濤 海潔
引言:隨著光電子技術(shù)和數(shù)字序列圖像處理及分析技術(shù)的深入發(fā)展,由運(yùn)動(dòng)恢復(fù)形狀的研究越來(lái)越受到研究人員的重視。本文在特征點(diǎn)檢測(cè)方面,分類總結(jié)了現(xiàn)有的二維圖像特征(興趣點(diǎn))檢測(cè)方法,分析了不同方法各自的優(yōu)缺點(diǎn),并著重分析和評(píng)價(jià)了幾種典型的興趣點(diǎn)檢測(cè)方法的性能。
一、研究背景和意義
隨著光電子技術(shù)和數(shù)字序列圖像處理及分析技術(shù)的深入發(fā)展,由運(yùn)動(dòng)恢復(fù)形狀(Structure/Shape From Motion)的研究越來(lái)越受到研究人員的重視。這一方法的巨大吸引力來(lái)源于它吸收了單目視覺(jué)設(shè)備簡(jiǎn)單和多目視覺(jué)的精確性兩方面的優(yōu)點(diǎn)。利用單個(gè)攝像機(jī)和對(duì)象之間的相對(duì)運(yùn)動(dòng),以及有相對(duì)運(yùn)動(dòng)的條件下拍攝的連續(xù)幾幅圖像,就可以比較精確的恢復(fù)出對(duì)象的三維表面形狀。而為了精確的恢復(fù)出對(duì)象的三維表面形狀,就必須知道攝像機(jī)的內(nèi)部參數(shù)。近年來(lái),攝像機(jī)的自標(biāo)定受到了普遍關(guān)注,成為計(jì)算機(jī)視覺(jué)研究的一個(gè)熱點(diǎn)。這一問(wèn)題的成功解決,將會(huì)成為計(jì)算機(jī)視覺(jué)研究的一個(gè)重大理論突破,對(duì)于由運(yùn)動(dòng)恢復(fù)形狀等應(yīng)用有著重大的意義,同時(shí)也會(huì)對(duì)計(jì)算機(jī)視覺(jué)的工程應(yīng)用,特別是軍事應(yīng)用提供更加簡(jiǎn)單、易行、經(jīng)濟(jì)、實(shí)用的手段。
二、興趣點(diǎn)檢測(cè)
(一)興趣點(diǎn)檢測(cè)方法分類
目前的興趣點(diǎn)檢測(cè)方法大致可以分為四類:基于邊緣的檢測(cè)方法、基于灰度的檢測(cè)方法、基于參數(shù)模型的檢測(cè)方法以及基于局部能量的檢測(cè)方法等。其中,基于局部能量的檢測(cè)方法在頻域空間內(nèi)進(jìn)行興趣點(diǎn)的檢測(cè),避免了興趣點(diǎn)形狀的限制。它假定圖像信號(hào)在其興趣點(diǎn)處的傅立葉分量具有最大的相位一致性,而相位一致性正比于局部能量[1],故可通過(guò)計(jì)算局部能量來(lái)尋找這些興趣點(diǎn)。這種方法的優(yōu)點(diǎn)是可以檢測(cè)到各種類型的興趣點(diǎn),而且定位精度也很準(zhǔn)確。其主要缺點(diǎn)為:計(jì)算量相當(dāng)大,而且也沒(méi)有統(tǒng)一的閾值可用來(lái)標(biāo)記興趣點(diǎn)。
(二)一維對(duì)數(shù)-Gabor濾波器
為了有效地計(jì)算特征點(diǎn)的相位一致性,需要首先計(jì)算特征的局部能量。為此,這里簡(jiǎn)要介紹一下計(jì)算局部能量時(shí)所用的濾波器。
Field[2]提出了對(duì)數(shù)-Gabor濾波器,其轉(zhuǎn)移函數(shù)為:
(1)
其中 為濾波器的中心頻率。
由定義可知,對(duì)數(shù)-Gabor濾波器的直流分量為零,并且其轉(zhuǎn)移函數(shù)一直向高頻端延伸。此外,對(duì)數(shù)-Gabor函數(shù)也與人類視覺(jué)系統(tǒng)的細(xì)胞響應(yīng)在對(duì)數(shù)頻率尺度下的對(duì)稱性這一特性相符合。因此,本文選用對(duì)數(shù)-Gabor小波來(lái)計(jì)算興趣點(diǎn)的相位一致性。
(三)基于相位一致性的興趣點(diǎn)檢測(cè)方法
與傳統(tǒng)的興趣點(diǎn)檢測(cè)方法一樣,局部能量對(duì)于圖像的亮度和反差較為敏感,不同圖像計(jì)算得到的局部能量圖具有很大差別,故興趣點(diǎn)閾值的選取往往較為困難。另一方面,由于圖像信號(hào)在其興趣點(diǎn)處的傅立葉分量具有最大的相位一致性,故可以通過(guò)計(jì)算圖像的相位一致性來(lái)檢測(cè)圖像中的興趣點(diǎn)(即二維特征)。因?yàn)橄辔灰恢滦允且粋€(gè)無(wú)量綱的量,其取值范圍被標(biāo)準(zhǔn)化為0和1之間,并且相位一致性對(duì)圖像的亮度和反差具有不變性,所以為特征顯著性的度量提供了一個(gè)統(tǒng)一的方法。一維信號(hào)的相位一致性可表示為[2]:
(2)
其中, 和 分別為信號(hào)的傅立葉分量的振幅和相位, 為加權(quán)均值相角。
(a) 梯形邊及其頻域分量 (b) 三角波及其頻域分量
圖2 兩種常見(jiàn)一維圖像特征及其頻域分量
圖2給出了兩種常見(jiàn)一維信號(hào)特征及其傅立葉展開(kāi)式的前7項(xiàng)。由圖可以看出,只有在圖像特征點(diǎn)處,其頻域分量才具有最大的相位一致性。
三、特征點(diǎn)匹配
當(dāng)前,解決兩視角下特征配準(zhǔn)問(wèn)題的方法可大致分為兩類:連續(xù)的方法和離散的方法。對(duì)于特征匹配問(wèn)題,存在兩種不同的解決方案。第一種方案是,對(duì)于給定的圖像序列,首先計(jì)算圖像的速度場(chǎng)(如光流場(chǎng)),這里的每一個(gè)速度向量逼近不同圖像中兩點(diǎn)之間的相關(guān)性,因此,計(jì)算得到的速度場(chǎng)就對(duì)應(yīng)配準(zhǔn)的特征。第二種方案是,首先方面在每幅圖像中提取特征點(diǎn),然后利用某種方法進(jìn)行特征的匹配。
連續(xù)的方法。這類方法直接計(jì)算圖像的向量場(chǎng),而不是進(jìn)行顯示的特征配準(zhǔn)。計(jì)算得到的速度場(chǎng)就對(duì)應(yīng)配準(zhǔn)的特征,每一個(gè)速度向量逼近不同圖像中兩點(diǎn)之間的相關(guān)性。在實(shí)際應(yīng)用中,光流場(chǎng)經(jīng)常被用于逼近實(shí)際圖像面中的速度場(chǎng)。這類方法要求幀間的運(yùn)動(dòng)較小,并且圖像具有平滑的灰度函數(shù)。可以基于圖像灰度函數(shù)的時(shí)空變化來(lái)計(jì)算光流場(chǎng)。盡管灰度流與3-D速度的投影并不完全相同,在某種假設(shè)下,它們非常相似。
離散的方法。這類方法允許圖像間具有較大的運(yùn)動(dòng)。此外,由于離散特征較灰度值更為穩(wěn)定,故離散的方法不受灰度值變化的影響,并且不要求圖像灰度是連續(xù)的。
四、總結(jié)
近年來(lái),隨著光電子技術(shù)和數(shù)字序列圖像處理及分析技術(shù)的深入發(fā)展,由運(yùn)動(dòng)恢復(fù)形狀(Structure/Shape From Motion)的研究越來(lái)越受到研究人員的重視。此外,許多導(dǎo)航或控制任務(wù),如目標(biāo)跟蹤、障礙避免或map building等需要攝像機(jī)(或目標(biāo))的運(yùn)動(dòng)參數(shù)和場(chǎng)景的歐氏結(jié)構(gòu)信息。為了得到這些信息,我們必須首先確定攝像機(jī)的內(nèi)部參數(shù),即實(shí)現(xiàn)攝像機(jī)的標(biāo)定。本文正是從攝像機(jī)標(biāo)定過(guò)程的幾個(gè)關(guān)鍵步驟入手,分別對(duì)特征點(diǎn)提取,序列圖像中的特征點(diǎn)匹配以攝像機(jī)自標(biāo)定算法進(jìn)行了研究和討論。
參考文獻(xiàn)
[1]吳冠勇,攝像機(jī)內(nèi)參數(shù)估計(jì)的若干研究.碩士論文:合肥,安徽大學(xué),2004.
[2]David A. Forsyth and Jean Ponce, Computer Vision: A Modern Approach. Pearson Education,2002.
[3]馬頌德,張正友.計(jì)算機(jī)視覺(jué)——計(jì)算理論與算法基礎(chǔ).北京:科學(xué)出版社,1998.