謝云璇
摘 要:目標(biāo)識(shí)別是現(xiàn)代智能監(jiān)控系統(tǒng)的重要組成部分,其中基于匹配的目標(biāo)識(shí)別是一個(gè)重要的研究方向。該文對(duì)其國(guó)內(nèi)外研究現(xiàn)狀和應(yīng)用背景進(jìn)行綜述,介紹了幾種常用的基于匹配的目標(biāo)識(shí)別方式,對(duì)進(jìn)一步的算法選擇和研究提供了參考。
關(guān)鍵詞:匹配 目標(biāo)識(shí)別 角點(diǎn)檢測(cè) 現(xiàn)狀
中圖分類號(hào):V243.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2017)01(c)-0110-02
1 目標(biāo)識(shí)別算法的研究現(xiàn)狀
現(xiàn)代智能監(jiān)控系統(tǒng)主要分為目標(biāo)識(shí)別和跟蹤兩部分,而最重要的是目標(biāo)識(shí)別部分。其算法主要分為:(1)基于統(tǒng)計(jì)模式識(shí)別的算法;(2)基于匹配的識(shí)別算法。
1.1 基于統(tǒng)計(jì)的識(shí)別算法
該算法原理是將目標(biāo)識(shí)別當(dāng)作從樣本中區(qū)分出目標(biāo)所屬種類,識(shí)別前需用大量樣本對(duì)分類器進(jìn)行訓(xùn)練。支持向量機(jī)(SVM)是Corinna Cortes和Vapnik等于1995年首先提出的,在小樣本分類學(xué)習(xí)中有性能和速度上的明顯優(yōu)勢(shì)。
1.2 基于匹配的識(shí)別算法
模板匹配是在圖像域直接利用像素灰度匹配,簡(jiǎn)單、實(shí)時(shí)性好,但抗干擾能力、適應(yīng)性和魯棒性均不高。
因此,學(xué)者們提出了基于特征匹配的目標(biāo)識(shí)別算法。2004年,Hahnel和Klunder等提出利用顏色、紋理特征對(duì)人進(jìn)行識(shí)別。同年,Csurka等提出利用一組特征點(diǎn)分類識(shí)別物體。2005年,Berg等提出通過(guò)物體的形狀特征進(jìn)行識(shí)別。2007年,Ullman提出基于圖像塊機(jī)制的目標(biāo)識(shí)別方法。2009年,Cao等人提出基于角點(diǎn)特征匹配的目標(biāo)識(shí)別方法?;谔卣髌ヅ涞姆椒ㄗ畲蟮膬?yōu)點(diǎn)是對(duì)于幾何變形和亮度變化不敏感,且算法的魯棒性較好。
2 基于模板匹配的目標(biāo)識(shí)別
2.1 概述
基于模板匹配的目標(biāo)識(shí)別因計(jì)算量小、識(shí)別率高等優(yōu)點(diǎn)已被應(yīng)用于汽車、指紋、人臉等多領(lǐng)域,其對(duì)視頻或連續(xù)圖像中跟蹤特定目標(biāo)也有很好的準(zhǔn)確性。
2.2 常用的模板匹配算法
FS算法是實(shí)現(xiàn)模板匹配最簡(jiǎn)單有效的算法,但易受像素值影響,不一定能正確匹配。文獻(xiàn)[2]使用NCC作為度量方法,兼顧了穩(wěn)定性和匹配速度。文獻(xiàn)[3]使用漢明距離定義模板與識(shí)別窗間的匹配相似性,減少了計(jì)算量。文獻(xiàn)[3]基于圖像描述子方法進(jìn)行目標(biāo)識(shí)別,減少了計(jì)算量。
快速模板匹配算法大致可分為以下幾種。
(1)快速傅里葉變換算法(FFT算法)。匹配結(jié)果與FS算法一致,但無(wú)需搜索候選窗口,而是計(jì)算模板在圖像各個(gè)位置上的相似度值。
(2)全搜索等價(jià)算法。一般采用逐層篩選策略,匹配結(jié)果同F(xiàn)S算法,但速度更快。
(3)非全搜索等價(jià)算法。采用搜索查找空間,或在特征空間中近似匹配的策略加快匹配速度,但其結(jié)果不一定與FS算法一致。
3 基于特征匹配的目標(biāo)識(shí)別
3.1 目標(biāo)特征概述
圖像的特征一般可以分為以下幾種。
(1)直觀性特征:①基于邊緣的方法:常用拉氏算子、Mary算子等進(jìn)行邊緣檢測(cè)。Nevada在1980年提出一個(gè)較成功的直線特征提取案例。Alireza等在2002年引入模糊理論選擇邊緣點(diǎn)。②基于區(qū)域的方法:通常用于建筑等區(qū)域信息較強(qiáng)的目標(biāo)。孫琪等人在2001年介紹了一種在紅外圖像中提取出橋梁的方法。③基于紋理的方法:以灰度共生矩陣為基礎(chǔ)的紋理特征提取是一種常見(jiàn)的有效方法。
(2)灰度的統(tǒng)計(jì)特征。主要是指直方圖特征等,目前常引入統(tǒng)計(jì)上的各階矩作為特征。
(3)代數(shù)特征。將圖像作為矩陣看待,對(duì)其進(jìn)行各種代數(shù)變換,或矩陣分解以得到目標(biāo)特征。
(4)變換系數(shù)特征。對(duì)圖像進(jìn)行Fourier變換、小波變換等,能從時(shí)域、頻域等多方面分析,能更本質(zhì)地反映目標(biāo)。
3.2 基于角點(diǎn)特征的目標(biāo)識(shí)別
角點(diǎn)就是極值點(diǎn),目前仍無(wú)明確的數(shù)學(xué)定義。通過(guò)檢測(cè)角點(diǎn)進(jìn)行目標(biāo)識(shí)別加快了計(jì)算速度,使實(shí)時(shí)處理成為可能。
目前,角點(diǎn)檢測(cè)算法主要分為:(1)基于圖像邊緣信息的角點(diǎn)檢測(cè)算法;(2)基于圖像灰度信息的角點(diǎn)檢測(cè)算法;(3)基于小波變化的角點(diǎn)檢測(cè)算法。
3.2.1 基于圖像邊緣信息的角點(diǎn)檢測(cè)算法
此類算法將角點(diǎn)視作由2條或多條邊界線相交而成的點(diǎn)。
20世紀(jì)70年代,A.Rosenfeld等和H.Freeman等提出用角點(diǎn)強(qiáng)度k來(lái)計(jì)算角點(diǎn)。1983年,J.Ponce和M.Brady提出將圖像對(duì)x,y求偏導(dǎo)數(shù)來(lái)求角點(diǎn)。同年,A.P.Witkin提出采用自適應(yīng)彎曲度求取角點(diǎn)的方法。1986年,Asada等改進(jìn)A.Rosenfeld的算法,提出先進(jìn)行邊緣平滑以去除干擾。1993年,Cooper利用鏈碼處像素坐標(biāo)估計(jì)最大曲率值來(lái)求角點(diǎn)。1996年,Hsin-Teng和Wu-Chin Hu利用多邊形近似邊界鏈,將交點(diǎn)作為角點(diǎn)。2004年,鐘寶江和廖文和提出了隱式精化數(shù)字化曲線策略,推出一種新的角點(diǎn)強(qiáng)度公式。
此類算法對(duì)邊緣提取算法依賴性較強(qiáng),邊緣線中斷將嚴(yán)重影響檢測(cè)結(jié)果。
3.2.2 基于圖像灰度信息的角點(diǎn)檢測(cè)算法
此類算法主要通過(guò)計(jì)算梯度及曲率來(lái)檢測(cè)角點(diǎn),大致分為:(1)基于方向?qū)?shù);(2)直接基于圖像的亮度對(duì)比關(guān)系。
此類算法最早由Kitchen-Rosenfeld提出。Moravec提出利用灰度方差提取“興趣算子”來(lái)提取角點(diǎn)。1988年,Harris等人改進(jìn)了Moravec算子,提出了著名的Harris角點(diǎn)檢測(cè)算子。1997年,Smith和Brady提出了具有很強(qiáng)抗噪聲性能的SUSAN提取算子。1998年,Trajkovic和Hedley就是基于同值分割吸收核(USAN)算法提出了一種快速角點(diǎn)檢測(cè)方法——MIC算法。
此類算法缺點(diǎn)是定位精度較低。
3.2.3 基于小波變化的角點(diǎn)檢測(cè)算法
小波變換對(duì)分析圖像局部特征十分有效。根據(jù)尺度空間的圖像分析理論,1992年,Rattarangsi提出基于尺度空間的角點(diǎn)檢測(cè)思想。1998年,Mokhtarian和Suomela基于尺度空間提出一種高尺度檢測(cè)角點(diǎn),降低尺度改善角點(diǎn)定位的新的角點(diǎn)檢測(cè)算法。
王展等人采用二階導(dǎo)數(shù)零交叉邊緣檢測(cè)算子以及圍線跟蹤算法提取邊緣曲線,用一組自相似二進(jìn)Gabor小波變換濾波器將頻域分為多個(gè)子帶,對(duì)兩不同尺度濾波器輸出求差并取模,根據(jù)結(jié)果判定該點(diǎn)是否是角點(diǎn)。
4 結(jié)語(yǔ)
基于匹配的目標(biāo)識(shí)別是圖像識(shí)別、目標(biāo)跟蹤等研究領(lǐng)域非常重要的研究方向,其中特征匹配、焦點(diǎn)檢測(cè)、小波變換等都具有廣泛的應(yīng)用范圍。該文介紹了多種基于匹配的目標(biāo)識(shí)別方式,分析其發(fā)展和優(yōu)缺點(diǎn),對(duì)進(jìn)一步的算法選擇和研究提供了參考。
參考文獻(xiàn)
[1] Lewis JP.Fast Template Matching[J].Vision Interface ,1995,32(4):351-361.
[2] Kim Jeesun,Cvejic Erin,Davis Chris.Tracking eyebrows and head gestures associated with spoken prosody[J].Speech Communication, 2014(57):317-330.
[3] Zhang J,Marszalek M,Lazebnik S,et al.Local Features and Kernels for Classification of Texture and Object Categories: A Comprehensive Study[J].International Journal of Computer Vision,2007,73(2):213-238.