湯海林
(廣東白云學(xué)院計(jì)算機(jī)系,廣州 510450)
MSER在圖像局部特征檢測中的應(yīng)用研究
湯海林
(廣東白云學(xué)院計(jì)算機(jī)系,廣州510450)
區(qū)域檢測技術(shù)是圖像處理領(lǐng)域中的一個(gè)經(jīng)典研究方向,通過對(duì)圖像局部區(qū)域的特征提取,實(shí)現(xiàn)圖像區(qū)域分割。傳統(tǒng)區(qū)域檢測方法是通過對(duì)圖像中具有相同性質(zhì)的像元進(jìn)行分類,再通過將像元連接成區(qū)域,以實(shí)現(xiàn)對(duì)圖像中的區(qū)域檢測功能。該方法可實(shí)現(xiàn)對(duì)圖像區(qū)域檢測,但對(duì)圖像的旋轉(zhuǎn)、尺度及仿射不變性的適應(yīng)性較差,且對(duì)圖像特征提取的依賴性較強(qiáng),不具備較強(qiáng)的魯棒性。
最大穩(wěn)定極值區(qū)域MSER(Maximally Stable Extremal Regions)采用地形中分水嶺的概念來求解穩(wěn)定局部區(qū)域,它基于魯棒性的寬基線立體重建。圖像中的極值區(qū)域是寬基線立體重建中的顯著區(qū)域(Distinguished Regions,DRs),且必須具備可區(qū)分、仿射不變性、穩(wěn)定等特性[1]。極值區(qū)域在圖像坐標(biāo)轉(zhuǎn)換中變化是緊密的,且圖像密度變化是隨著緊密變化,最大穩(wěn)定極值區(qū)域是極值區(qū)域的穩(wěn)定子集。
MSER檢測算法通過對(duì)待提取的原始圖像預(yù)處理后,形成灰度圖像,采用二維函數(shù)表示,即將每個(gè)像素的坐標(biāo)值(x,y)映射為灰度值。在MSER中,通過提取圖像中穩(wěn)定區(qū)域的檢測因子,確定其區(qū)域面積變化率函數(shù)的局部最小值來形成對(duì)圖像檢測。
在原始圖像中檢測出具有獨(dú)特性、穩(wěn)定性的最大穩(wěn)定區(qū)域即MSER所要實(shí)現(xiàn)的功能。MSER算法中必須具有一系列的相關(guān)閾值,以輸出MSER檢測子的嵌套區(qū)域。MSER的數(shù)據(jù)定義如下:
(1)圖像I是一個(gè)區(qū)域D到灰度S的映射:I:D?Z2→S,且滿足條件:S具有自反、非對(duì)稱和傳遞的,且S={1,2,…,255}。
(2)領(lǐng)域關(guān)系:A?D×D。文中采用四領(lǐng)域,對(duì)于點(diǎn)p,q∈D,當(dāng)且僅當(dāng)時(shí),p,q互為領(lǐng)域關(guān)系,p∈A(q)&&q∈A(p)。
(3)區(qū)域Q。Q是D的一個(gè)連通子集,對(duì)于任意p,q∈D,存在一個(gè)序列 p,a1,a2,…,an,q和p∈A(a1),…,ai∈A(ai+1),…,an∈A(q)。
(4)區(qū)域邊界?Q。?Q={q∈DQ:?p∈Q:q∈A(p)}。即?Q不屬于區(qū)域Q,但區(qū)域Q中至少存在一個(gè)像元與其構(gòu)成鄰接關(guān)系。
(5)極值區(qū)域Q。極值區(qū)域Q?D,對(duì)于所有的p∈Q,q∈?Q:I(p)>I(q)(最大極值區(qū)域)或I(p)
最大極值穩(wěn)定區(qū)域(MSER)。設(shè)Q1,Qi-1,Qi…為一系列的相互包含的極值區(qū)域,即Qi?Qi+1。若極值區(qū)域Qi*為最大極值區(qū)域,當(dāng)且僅當(dāng)區(qū)域變化率q(i)=|Qi+Δ Qi-Δ|/|Qi|在i*處取得局部極小值。|·|表示為區(qū)域的面積,Δ∈S,Δ為微小的灰度變化。
在MSER提取算法中,將每個(gè)MSER表示局部灰度極大值的空間坐標(biāo)及其所對(duì)應(yīng)的閾值。在MSER內(nèi)根據(jù)圖像面積變化率給MSER定位找到擁有最大灰度值的像素[2],其空間位置(x,y)就是MSER的空間位置。
由于MSER檢測算法是從嵌套的極值區(qū)域中提取出來的,其可能存在多個(gè)極值區(qū)域,通過定義穩(wěn)定性方程取得局部最小值時(shí)所對(duì)應(yīng)的閥值來確定其極值區(qū)域[3]。MSER的檢測算法如下:
(1)對(duì)給定的圖像根據(jù)灰度值排序,如是彩色圖形,必須進(jìn)行灰度化;該過程采用BinSort的快速排序算法,時(shí)間復(fù)雜度為O(n)。BinSort算法根據(jù)按箱排序的原理,將排序的序列各個(gè)數(shù)組分類到不同的箱中,將箱自動(dòng)排序后,再將各箱串連起來。
(2)按升序或降序?qū)⑴判蚝蟮南袼胤湃雸D像中,連接區(qū)域的列表和面積使用合并-查找算法實(shí)現(xiàn)。對(duì)圖像中多個(gè)極值區(qū)域之間的關(guān)系通過組件樹的數(shù)據(jù)結(jié)構(gòu)來組織,并通過樹的搜索獲得極值區(qū)域面積的變化,從而可計(jì)算出極值區(qū)域變化率。
圖像極值區(qū)域Qi是一個(gè)圖像灰度等級(jí)集合 Si={x:I (x)≤i}下的連接區(qū)域,將圖像灰度值排序后分別放入圖像矩陣中,從而生成灰度遞增的列表,從灰度0開始搜索每個(gè)像素,并且從矩陣的左上角開始掃描,直到將所有灰度值的像素掃描完成,將所得到的掃描像素點(diǎn)的坐標(biāo)連接起來,該記錄即是灰度值增長過程,從而形成組件之間的連接關(guān)系。通過對(duì)組件樹的搜索,在灰度值范圍內(nèi)計(jì)算區(qū)域的相對(duì)變化率,在該組件樹的分支上求得的局部最小值即是MSER區(qū)域。
(3)在二值化圖像中任意連通區(qū)域Qi中,當(dāng)二值化閾值在[i-Δ,i+Δ]變化時(shí),連通區(qū)域也相應(yīng)的變化為Qi+Δ和Qi-Δ,這個(gè)變化范圍內(nèi)具有極小變化率q(i)區(qū)域即是MSER。
在完成圖像中MSER的區(qū)域檢測后,形成的圖像不利于進(jìn)行歸一化和提取特征描述,必須進(jìn)行橢圓擬合。通過橢圓擬合可對(duì)區(qū)域形狀結(jié)構(gòu)的位置、尺寸和方向信息進(jìn)行重構(gòu)[4],以橢圓的中心作為MSER的重心,橢圓的兩個(gè)軸分別通過重心,形成兩個(gè)軸的二階中心矩在長軸和短軸方向達(dá)到最大和最小。
利用圖像矩將圖像中區(qū)域擬合成橢圓?;诰氐牟蛔冃詰?yīng)用是圖像矩對(duì)形狀描述的有效方式。圖像矩的定義如下:
對(duì)于圖像 I(x,y)中的某個(gè)區(qū)域 ξ,其中 (p+q)維幾何矩定義為:
(2)由于MSER是一個(gè)離散的二值化的區(qū)域,在區(qū)域內(nèi)的像元值為1,區(qū)域外的圖像值為0,因此圖像(p+ q)階二維幾何矩陣轉(zhuǎn)化為:
(3)基于圖像I(x,y),利用二維幾何矩陣計(jì)算區(qū)域的重心。中心二階矩表示為:
將原點(diǎn)移到ξ的重心并進(jìn)行計(jì)算,得到中心矩陣:
(4)橢圓區(qū)域擬合中長軸方向θ代表區(qū)域的方向,長半軸ω和短半軸ι表示區(qū)域的形狀,利用圖像中心二階矩陣U計(jì)算得:
其中,λ1和λ2為二階矩陣的兩個(gè)特征值。
在MSER的區(qū)域擬合成橢圓后,為能構(gòu)造具有仿射不變性的特征描述子,需將橢圓擬合區(qū)域擴(kuò)大為橢圓特征測量區(qū),其區(qū)域一般為擬合區(qū)域尺度的3倍。擴(kuò)大后的區(qū)域進(jìn)行歸一化為指定大小的區(qū)域,從而可在歸一化后的區(qū)域中提取特征、描述子[5]。通過歸一化,可檢測到每個(gè)MSER橢圓形特征測量區(qū)歸一化成具有仿射不變性的局部圖像區(qū)域。
基于目標(biāo)區(qū)域的圖像檢索方法對(duì)圖像的仿射不變性具有較強(qiáng)的適應(yīng)用性,而最大穩(wěn)定極值區(qū)域(MSER)算法是目前對(duì)圖像區(qū)域提取算法中應(yīng)用效果最好的技術(shù),MSER通過對(duì)圖像內(nèi)容進(jìn)行分割和提取,獲取圖像中最穩(wěn)定、最具代表性的特征區(qū)域檢測技術(shù),通過提取最大穩(wěn)定區(qū)域,利用SIFT描述子對(duì)區(qū)域進(jìn)行向量表述,提高特征提取時(shí)間復(fù)雜度。
通過MSER檢測算法可將圖像中不規(guī)則區(qū)域轉(zhuǎn)化為橢圓形區(qū)域,實(shí)現(xiàn)MSER與SIFT描述子的結(jié)合,使得特征區(qū)域易于描述和匹配,但MSER并不適應(yīng)于所有類型的圖像,如何實(shí)現(xiàn)多種不變性區(qū)域檢測子是圖像檢測技術(shù)發(fā)展的未來方向。
[1]陳濤.圖像仿射不變特征提取方法研究[D].長沙:國防科學(xué)技術(shù)大學(xué),2006.
[2]黃劍華.視頻圖像文本信息提取關(guān)鍵技術(shù)的研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2007.
[3]宋文,肖建丁.基于筆畫寬度變換的自然場景文本檢測方法[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(9).
[4]劉洋,薛向陽,路紅等.一種基于邊緣檢測和線條特征的視頻字符檢測算法[J].計(jì)算機(jī)學(xué)報(bào),2005,28(3).
[5]汪文芳.基于手機(jī)終端的自然場景下的文字定位與識(shí)別[D].西安電子科技大學(xué),2010.
Image Feature;Maximally Stable Extremal Regions;Image Detection;Region
Research on the Application of MSER in Image Local Feature Detection
TANG Hai-lin
(Department of Computer Science,Guangdong Baiyun University,Guangzhou 510450)
1007-1423(2015)34-0007-03
10.3969/j.issn.1007-1423.2015.34.002
湯海林(1980-),男,江西九江人,碩士,講師,研究方向?yàn)閳D像處理與識(shí)別
2015-11-20
2015-12-01
基于圖像斑點(diǎn)檢測技術(shù)具有尺度和旋轉(zhuǎn)的不變性,但對(duì)仿射不變性適應(yīng)性較差,MSER是對(duì)圖像中穩(wěn)定區(qū)域的檢測技術(shù),它對(duì)圖像旋轉(zhuǎn)、尺度及仿射不變性都具有強(qiáng)的適應(yīng)性。對(duì)MSER檢測技術(shù)的數(shù)據(jù)定義、檢測算法的實(shí)現(xiàn)及區(qū)域擬合的應(yīng)用作詳細(xì)的分析,通過圖像中穩(wěn)定區(qū)域提取,可獲得最優(yōu)圖像特征因子,再通過區(qū)域的擬合,可實(shí)現(xiàn)橢圓區(qū)域的二階矩陣,其實(shí)現(xiàn)算法具有易實(shí)現(xiàn)、速度快、效率高的特點(diǎn),該算法在目標(biāo)區(qū)域和空間一致性上具有較好的應(yīng)用效果。
圖像特征;MSER;圖像檢測;區(qū)域
The image speckle detection technology has the invariance of scale and rotation,but it is poor adaptability to affine invariance.MSER is a stable region detection technology,which has strong adaptability to the image rotation,scale and affine invariance.Analyzes the definition of MSER detection technology,the realization of the detection algorithm and the application of regional fitting in details.To extract the stable region in image,it can get the optimized image characteristic factor.Then by regional fitting,it can implement the second-order matrix of elliptical area.This algorithm has the characteristics of easy implementation,fast speed and high efficiency.The algorithm has better effect on the target area and space consistency.