傅瑞罡,王平,高穎慧
(國(guó)防科學(xué)技術(shù)大學(xué)電子科學(xué)與工程學(xué)院ATR重點(diǎn)實(shí)驗(yàn)室,長(zhǎng)沙 410073)
一種基于圖像切線方向感受野的輪廓檢測(cè)方法
傅瑞罡,王平,高穎慧
(國(guó)防科學(xué)技術(shù)大學(xué)電子科學(xué)與工程學(xué)院ATR重點(diǎn)實(shí)驗(yàn)室,長(zhǎng)沙 410073)
輪廓檢測(cè)是實(shí)現(xiàn)基于形狀的目標(biāo)識(shí)別任務(wù)的關(guān)鍵,然而由于圖像背景中存在大量的無(wú)關(guān)干擾成分,因此要從自然場(chǎng)景中自動(dòng)地檢測(cè)出目標(biāo)的輪廓是非常困難的。人類可以很容易地從環(huán)境中識(shí)別物體,這得益于人類的視覺(jué)感知機(jī)制。根據(jù)此機(jī)制,建立了基于圖像切線方向感受野的輪廓檢測(cè)方法。本方法用Gabor函數(shù)模擬感受野中心神經(jīng)元的響應(yīng),非經(jīng)典感受野的建模充分考慮了鄰域刺激與相對(duì)位置、距離、朝向之間的關(guān)系。本方法與傳統(tǒng)的基于人類視覺(jué)感知機(jī)制方法的最大不同在于圖像點(diǎn)的切線方向選擇對(duì)應(yīng)朝向的中心神經(jīng)元,物理意義明確。實(shí)驗(yàn)結(jié)果表明:該方法能更有效地抑制紋理邊緣并減少輪廓自身的破壞,具有更好的檢測(cè)準(zhǔn)確性和穩(wěn)定性。
輪廓;人類視覺(jué)感知機(jī)制;感受野;切線方向
輪廓提取是機(jī)器視覺(jué)和圖像理解中的基礎(chǔ)問(wèn)題。由于輪廓通常掩藏在紋理中,因此在復(fù)雜背景條件下檢測(cè)出目標(biāo)輪廓是輪廓檢測(cè)算法的難點(diǎn)。傳統(tǒng)的邊緣檢測(cè)算法對(duì)輪廓與紋理不加區(qū)分,檢測(cè)結(jié)果中往往包含大量的偽輪廓信息。
輪廓提取方法受到學(xué)術(shù)界的廣泛關(guān)注[1-11],基于人類視覺(jué)感知機(jī)制的輪廓提取算法是其中重要的一股分支。科學(xué)家對(duì)人類的視覺(jué)感知機(jī)制研究已有多年,研究結(jié)果表明[1]:人類大腦視皮層中,絕大部分的V1區(qū)神經(jīng)元具有方向選擇性,它會(huì)對(duì)視野中特定區(qū)域的刺激產(chǎn)生響應(yīng),描述這些神經(jīng)元響應(yīng)的區(qū)域稱為感受野(也稱經(jīng)典感受野)。當(dāng)外界刺激與其感受野朝向重合時(shí),神經(jīng)元活動(dòng)最活躍;當(dāng)外界刺激與感受野朝向正交時(shí),神經(jīng)元的活動(dòng)最低迷。同時(shí),感受野的活動(dòng)還受其外部周邊區(qū)域的影響,這片周邊區(qū)域被稱為非經(jīng)典感受野,非經(jīng)典感受野對(duì)感受野既有抑制作用也有增強(qiáng)作用。得益于視覺(jué)系統(tǒng)神經(jīng)元的這種感受野特性,人類能很容易地觀察到物體的輪廓信息而忽略紋理信息。
Grigorescu等[2]利用非經(jīng)典感受野的抑制特性進(jìn)行輪廓檢測(cè),雖然減少了環(huán)境紋理的影響,但只研究了抑制作用,且只考慮了各向異性抑制和各向同性抑制兩種極端情況。桑農(nóng)等[11]提出的方法雖然在鄰域神經(jīng)元的抑制作用上考慮得更加詳盡,但忽略了神經(jīng)元間存在增強(qiáng)作用。杜曉鳳等[6]綜合上述缺陷并改進(jìn)了輪廓提取算法。
但是,上述這些方法沒(méi)有給出明確的感受野朝向意義,同幅圖像的某一像素對(duì)應(yīng)的感受野朝向會(huì)隨著方法任一參數(shù)的變化而變化。本文在對(duì)比Gabor函數(shù)特性和感受野特性后,提出由像素的切線方向選擇對(duì)應(yīng)朝向的中心神經(jīng)元,并綜合考慮非經(jīng)典感受野的增強(qiáng)抑制作用,提出一種新的輪廓提取算法。經(jīng)仿真實(shí)驗(yàn)驗(yàn)證,該輪廓提取算法能有效、準(zhǔn)確地提取圖像中的輪廓。
1.1 中心神經(jīng)元響應(yīng)
二維Gabor函數(shù)常用于模擬簡(jiǎn)單神經(jīng)元的響應(yīng),因?yàn)樗苡行У孛枋霾溉閯?dòng)物的視皮層簡(jiǎn)單細(xì)胞感受野剖面[11]。本文通過(guò)Gabor函數(shù)來(lái)模擬感受野中心神經(jīng)元響應(yīng)。
二維Gabor函數(shù)形式為
圖1 奇偶Gabor函數(shù)
用奇(φ=π/2)、偶(φ=0)Gabor濾波器分別卷積輸入圖像I,得Godd,Geven:
為了得到具有位移不變性的輪廓,本文將2個(gè)相位濾波結(jié)果組合構(gòu)成Gabor能量濾波器[8]來(lái)模擬細(xì)胞的響應(yīng)函數(shù),其表達(dá)式為
本文實(shí)驗(yàn)中設(shè)σ=2.4,σ/λ=0.56,γ=0.5,θ置為輸入圖像切線方向角O(x,y)。
1.2 圖像切線方向場(chǎng)O(x,y)
本文將θ置為圖像的切線方向角,如圖2所示。使用Sobel算子求輸入圖像I(x,y)的水平、豎直方向上的偏導(dǎo)數(shù)Δx,Δy,求切線角度O(x,y)= atan(Δy/Δx)。此時(shí)O(x,y)的取值范圍為[-π/2,π/2],執(zhí)行操作將O(x,y)的取值范圍調(diào)整至[0,π)。假設(shè)有n種朝向的神經(jīng)元,于是將[0,π)均等劃分為n個(gè)子區(qū)間,第i個(gè)子區(qū)間為[(2i+1)π/2n,(2i+3)π/ 2n),i=-1,0,…,n-2。若O(x,y)落于區(qū)間[(2i+1)π/2n,(2i+3)π/2n),則置O(x,y)=(i +1)π/n。圖3為圖像神經(jīng)元響應(yīng)的流程。
圖2 Gabor函數(shù)中的朝向參數(shù)θ選為圖像的切線方向
圖3 圖像神經(jīng)元響應(yīng)流程,n=16
1.3 非經(jīng)典感受野模擬
非經(jīng)典感受野描述的是經(jīng)典感受野的外周區(qū)域,對(duì)經(jīng)典感受野具有增強(qiáng)抑制作用。圖4很好地展現(xiàn)了這種現(xiàn)象。
圖4 現(xiàn)象展示
從圖4可以看到:雖然中間的小方形線段與斜線同等粗細(xì),但是小方形線段卻顯得比斜線亮很多。這是因?yàn)樵谛本€背景下,人類視覺(jué)神經(jīng)元的非經(jīng)典感受野對(duì)斜線的成像起了抑制作用,而對(duì)于方形線段,這種抑制作用相對(duì)小很多。
假定(x',y')是中心神經(jīng)元的周邊神經(jīng)元坐標(biāo),中心神經(jīng)元(x,y)有增強(qiáng)區(qū)域P和抑制區(qū)域N。定義感受野中心(x,y)的綜合響應(yīng)強(qiáng)度如下:
其中,a,b為控制常數(shù)。
本文采用環(huán)狀區(qū)L來(lái)模擬神經(jīng)元(x,y)的非經(jīng)典感受野。抑制區(qū)域位于與中心神經(jīng)元朝向垂直方向的兩側(cè),沿著中心神經(jīng)元朝向的是增強(qiáng)區(qū)域[5]。
圖5 環(huán)形感受野L,r=σ,R=2σ,φ=15°
其中:θ是位于坐標(biāo)(x,y)的神經(jīng)元的朝向,在θ上下各偏轉(zhuǎn)φ/2的位置為增強(qiáng)區(qū)域P,其余為抑制區(qū)域N??紤]到距離的影響,系數(shù)應(yīng)隨與中心距離的增加而變小。在本文中,系數(shù)由DoG+(x',y',σ)函數(shù)生成:
對(duì)于增強(qiáng)區(qū)域,Δθ越小,增強(qiáng)效果越強(qiáng),用cos(Δθ)模擬;對(duì)于抑制區(qū)域,Δθ越小,抑制效果越強(qiáng),用exp(-8(Δθ/π)1.5)模擬。
綜合上述位置、距離和方向的影響后得到:
1.4 細(xì)化
本文采用Canny算法[4]中的非最大值抑制方法對(duì)1.3節(jié)產(chǎn)生的能量圖結(jié)果G'(x,y)進(jìn)行細(xì)化處理,即:只有當(dāng)該點(diǎn)的強(qiáng)度大于沿該點(diǎn)梯度方向上的2個(gè)相鄰像素的強(qiáng)度時(shí)才保留該點(diǎn),否則置為零。本文采用線性插值法計(jì)算該點(diǎn)梯度方向上2個(gè)相鄰像素的強(qiáng)度。圖6是本文細(xì)化方法的簡(jiǎn)單示意。
圖6 細(xì)化方法示意
如圖6所示,若G'(j,i)<G'(j-1,i-1)* bleft+G'(j,i-1)*aleft或G'(j,i)<G'(j+1,i+1) *aright+G'(j,i-1)*bright,那么G'(j,i)置為零。
1.5 二值化
用雙門限分割法做進(jìn)一步二值化處理。[Tl,Th]為雙門限,Th為大于Gabor能量圖G'(x,y)中(1-p)像素點(diǎn)的能量值,Tl=0.5Th。
1)計(jì)算輸入圖像的切線方向場(chǎng);
2)用奇偶Gabor濾波器對(duì)輸入圖像濾波,得到圖像的Gabor能量圖(即神經(jīng)元的響應(yīng));
3)用1.3節(jié)介紹的模型計(jì)算非經(jīng)典感受野的抑制區(qū)、增強(qiáng)區(qū)系數(shù),并通過(guò)式(1)求解非經(jīng)典感受野影響后的能量圖;
4)對(duì)得到的能量圖做非最大抑制處理,實(shí)現(xiàn)細(xì)化;
5)用雙門限分割法進(jìn)行二值化;
6)性能評(píng)估。
算法實(shí)現(xiàn)流程見(jiàn)圖7。
本文在標(biāo)準(zhǔn)的邊緣檢測(cè)圖像數(shù)據(jù)庫(kù)(來(lái)源于http://www.cs.rug.nl/~imaging)中抽取2幅圖像Hyena,Elephant_2作為輸入圖像,同時(shí)選擇經(jīng)典的Canny算子[4]和Non-CRF的各向同性算法[2]與本文算法進(jìn)行比較。圖8展示了各輪廓提取算法的定性比對(duì)結(jié)果。
圖7 算法實(shí)現(xiàn)流程
圖8 各算法的定性比對(duì)
比較Hyena的各輸出圖像可以看到:本文方法明顯抑制了紋理邊緣;雖然該方法相比各向同性算法對(duì)Elephant_2圖像的紋理邊緣抑制得并不明顯,但觀察象鼻的連續(xù)性可以發(fā)現(xiàn),本方法有效減少了輪廓破壞,改進(jìn)了傳統(tǒng)邊緣檢測(cè)方法的輪廓提取效率。
為了定量地比較這3種算法的效果,本文采用文獻(xiàn)[10]中的評(píng)測(cè)方法。假設(shè)EDO和BDO分別表示理想輸出圖像DO的邊緣和背景的像素集; ED和BD分別表示各種算法的輸出圖像D的輪廓和背景的像素集。那么,真實(shí)的輪廓集合可以表示為E=ED∩EDO,遺漏的輪廓集合可以表示為EFN=BD∩EDO,虛假的輪廓可以表示為EFP=ED∩BDO。
然而,由于細(xì)化后實(shí)際得到的圖像D的輪廓點(diǎn)坐標(biāo)幾乎不可能完全與理想輪廓圖DO中的輪廓點(diǎn)坐標(biāo)吻合,所以本實(shí)驗(yàn)中,凡在理想輸出輪廓點(diǎn)坐標(biāo)附近4×4鄰域內(nèi),D中有點(diǎn)存在,就認(rèn)為是找到了該理想輪廓點(diǎn)。
其中,card(X)代表求集合X中的元素的個(gè)數(shù)。
從式(2)可以看出:P是[0,1]范圍的一個(gè)數(shù)值,如果算法能將理想的輪廓完全提取出來(lái)并且沒(méi)有將背景錯(cuò)誤地檢測(cè)為輪廓,那么P= 1;一般情況下P小于1,如果錯(cuò)誤的檢測(cè)越多,P就越趨近于0。
表1 各算法的評(píng)測(cè)值P比對(duì)
表1列出了各種算法效果較好時(shí)的測(cè)評(píng)值P,其中canny的參數(shù)設(shè)為p=0.1,σ=2.4(Hyena); p=0.1,σ=2.4(Elephant_2)。Isotropic方法的參數(shù)σ=2.0,p=0.1,α=1.0(Hyena);σ=2.0,p= 0.1,α=1.0(Elephant_2)。本文方法的參數(shù)σ= 2.4,a=1.2,b=2.7,p=0.04(Hyena);σ=2.4,a=1.4,b=2.8,p=0.03(Elephant_2)。
可以明顯看到:本文提出的方法評(píng)測(cè)值大于其他方法的評(píng)測(cè)值,即本文方法極大地提高了輪廓檢測(cè)性能。
輪廓檢測(cè)是實(shí)現(xiàn)基于形狀的目標(biāo)識(shí)別任務(wù)的關(guān)鍵。只有盡可能地提取完整的目標(biāo)輪廓,才能使目標(biāo)識(shí)別更加準(zhǔn)確。本文提出的輪廓檢測(cè)方法基于人類視覺(jué)感知機(jī)制,由圖像點(diǎn)的切線方向選擇對(duì)應(yīng)的神經(jīng)元,然后在充分考慮非經(jīng)典感受野的各種特性后,建立了新的非經(jīng)典感受野模型。
最后的實(shí)驗(yàn)結(jié)果表明:在復(fù)雜背景情況下的目標(biāo)輪廓檢測(cè)中,本文方法比傳統(tǒng)方法表現(xiàn)出了更好的性能,輪廓更加清晰,且更易抑制背景中的紋理。但是由于Sobel算子容易受到圖像噪聲的影響,因此如何提升算法的抗噪能力是后續(xù)的主要工作。
[1]Dragoi V,Sur M.Dynamic properties of recurrent inhibition in primary visual cortex:contrast and orientation dependence of contextual effects[J].J Neurophysiol,2000,83(2):1019-1030.
[2]Grisgorescu C,Petkov N,Westenberg M A.Contour detection based on nonclassical receptive field inhibition[J].IEEE Transactions on Image Proccessing,2003,12 (7):729-739.
[3]Li Dongyang,Wang Ping,Gao Yinghui,et al.Contour extraction improved by gradient saliency detection[C]//5th International Congress on Image and Signal Processing.Chengdu:[s.n.],2012:1009-1012.
[4]Canny J.A computatational approach to edge detection[J].IEEE Trans.PAMI,1986,8(6):679-698.
[5]Kapadia M K,Westheimer G,Gilbert C D.Spatial distribution of contextual interactions in primary visual cortex and in visual perception[J].Neurophysiol,2000,84(4): 2048-2062.
[6]Du Xiao-feng,Li Cui-h(huán)u,Li Jing.Contour detection based on compound receptive field[J].Journal of Electrics and Information Technology,2009,31(7):1630-1634.
[7]Shou Tian-de,Zhou Yi-feng.Orientation and direction sensitivity of cells in subcortical structures of the visual system[J].Acta Physiologica Sinica,1996,48(2):105-112.
[8]Tan T N.Texture edge detection by modeling visual cortical channels[J].Pattern Recognition,1995,28(9):1283-129.
[9]蔡超,王夢(mèng).基于視覺(jué)感知機(jī)制的輪廓檢測(cè)方法[J].華中科技大學(xué)學(xué)報(bào):自然科學(xué)版,2011,39(7):22-25.
[10]Grisgorescu C,Petkov N,Westenberg M A.Contour and boundary detection improved by surround suppression of texture edges[J].Image and Vision Computing,2004,22 (8):609-622.
[11]Sang Nong,Tang Qi-ling,Zhang Tian-xu.Contour detection based on inhibition of primary visual cortex[J].Journal of Infrared and Millimeter Waves,2007,26(1): 47-51.
(責(zé)任編輯 楊黎麗)
Contour Detection Method Based on Receptive Field towards the Tangential Direction
FU Rui-gang,WANG Ping,GAO Ying-h(huán)ui
(School of Electronic Science and Engineering,ATR Key Laboratory,National University of Defense Technology,Changsha 410073,China)
Contour detection plays an important role in shape-based object recognition tasks.It is an intractable problem of how to detect the contour of object from natural scenes automatically.Thanks to the human visual perception system,human can identify objects easily.According to this system,this paper presents a contour detection method based on receptive field towards the tangential direction.This method simulated the response function of single visual cell by Gabor function.A new non-classical receptive field model was constructed by fully considering the difference in distance,position and direction between neighboring stimuli and the central neuron.The salient difference between this method and those traditional methods based on human visual perception system is that the preferred orientation is selected by the direction of tangent and this gives“the preferred orientation”a physical meaning.The experimental results show that our model has a better detection accuracy and stability.Key words:contour;human visual perception system;receptive field;the tangential direction
TP301
A
1674-8425(2014)04-0083-06
10.3969/j.issn.1674-8425(z).2014.04.018
2014-01-15
傅瑞罡(1992—),男,浙江浦江人,碩士研究生,主要從事圖像處理研究。
傅瑞罡,王平,高穎慧.一種基于圖像切線方向感受野的輪廓檢測(cè)方法[J].重慶理工大學(xué)學(xué)報(bào):自然科學(xué)版,2014(4):83-88.
format:FU Rui-gang,WANG Ping,GAO Ying-h(huán)ui.Contour Detection Method Based on Receptive Field towards the Tangential Direction[J].Journal of Chongqing University of Technology:Natural Science,2014(4):83-88.