張瑜慧
(宿遷學(xué)院三系,江蘇 宿遷 223800)
責(zé)任編輯:魏雨博
圖像檢索是多媒體技術(shù)與數(shù)字圖像處理領(lǐng)域的一個研究熱點(diǎn)。描述圖像內(nèi)容的視覺特征一般有顏色、紋理、形狀和空間關(guān)系等。形狀是人們對圖像理解的重要內(nèi)容之一,現(xiàn)有的形狀描述算法一般分為基于目標(biāo)輪廓的形狀描述子和基于區(qū)域的形狀描述子兩大類[1-2]。
一個好的形狀描述子應(yīng)具備對平移、縮放和旋轉(zhuǎn)的不變性,同時應(yīng)具有緊致性和計算的簡單性,當(dāng)然還應(yīng)具有較強(qiáng)的形狀區(qū)分能力[3]。利用傅里葉變換將圖像從空間域轉(zhuǎn)換到頻域,提取圖像形狀在頻域中的表示是一種有效的方法。但這類方法的檢索性能緊密依賴于目標(biāo)邊界的提取結(jié)果,如果邊界提取不準(zhǔn)確,將會導(dǎo)致最終的檢索準(zhǔn)確率低,而且這種方法易受噪聲等外部干擾的影響。
一般數(shù)字圖像是通過正方形網(wǎng)格采樣得到的,圖像的坐標(biāo)默認(rèn)是笛卡爾直角坐標(biāo),且坐標(biāo)原點(diǎn)在圖像的左上角。直接對其進(jìn)行傅里葉變換,雖然也能得到頻譜描述,但是無法得到不變的形狀描述子,即若對圖像進(jìn)行平移、縮放和旋轉(zhuǎn)變換,將會得到不同的特征描述。
給定一個二值圖像I={f(x,y);0≤x<M,0≤y<N},I的質(zhì)心坐標(biāo)(xc,yc)定義為
式中:A是圖像面積,定義為
極坐標(biāo)表示法以質(zhì)心(xc,yc)為中心,由像素離質(zhì)心的距離r和θ=0°所夾角度來表示像素的坐標(biāo)(r,θ)。由笛卡爾直角坐標(biāo)系轉(zhuǎn)換為極坐標(biāo)系的公式為
相比于直角坐標(biāo),極坐標(biāo)表示圖像的優(yōu)點(diǎn)是不受圖形平移和縮放的影響。
形狀矩陣是表示區(qū)域形狀信息的一個有效工具。具體操作為:以質(zhì)心為圓心,以最大質(zhì)心距離為半徑形成目標(biāo)區(qū)域的最小外接圓。將圓半徑等距離劃分成M份,形成M個同心圓。之后將極軸從0°~360°逆時針旋轉(zhuǎn),記錄極角為(K×360/N)°(K為0~N-1之間的整數(shù))時極軸與同心圓交點(diǎn)處的像素信息。即使用極坐標(biāo)光柵系統(tǒng)對圖像進(jìn)行重新采樣,形成一個記錄圖像形狀信息的、大小為M×N的形狀矩陣。矩陣的行對應(yīng)同心圓,列對應(yīng)半徑[4]。利用形狀矩陣表示圖像,大大減少了參與后續(xù)計算的數(shù)據(jù)量。由于極坐標(biāo)的極點(diǎn)位于區(qū)域質(zhì)心,且是對最大質(zhì)心距離進(jìn)行等距離劃分,所以形狀矩陣滿足對圖像的平移和縮放不變性[5]。
文獻(xiàn)[5]提到,當(dāng)圖像發(fā)生旋轉(zhuǎn)時,其對應(yīng)形狀矩陣的行向量將發(fā)生相應(yīng)的循環(huán)移位。但分析形狀矩陣的具體產(chǎn)生過程可以發(fā)現(xiàn),若圖像旋轉(zhuǎn)某個角度,對其進(jìn)行極坐標(biāo)光柵系統(tǒng)采樣后得到的形狀矩陣也會發(fā)生變化,且這種變化并不是循環(huán)移位。圖1通過仿真驗證了本文的分析,其中圖1c是對圖1a順時針旋轉(zhuǎn)90°后得到的圖形,圖1b、圖1d分別是圖1a和圖1c的形狀矩陣。由圖1可以清楚地看到,這兩個矩陣的行向量之間并不存在循環(huán)移位關(guān)系。因此,文獻(xiàn)[5]對形狀矩陣進(jìn)行相位修正,并不能保證描述子的旋轉(zhuǎn)不變性,同時在進(jìn)行相位修正后還會引入誤差,這將直接導(dǎo)致檢索的準(zhǔn)確率降低。
圖1 圖形及旋轉(zhuǎn)后圖形的形狀矩陣
圖像I={f(x,y);0≤x<M,0≤y<N}的二維DFT定義為
其幅度和相位分別為
式中:R(u,v)是復(fù)數(shù)F(u,v)的實部;I(u,v)是虛部。
由DFT變換的性質(zhì)可知,圖像I平移后,幅度不發(fā)生變化,僅相位發(fā)生變化。因此一般情況下,可直接使用幅度信息描述形狀。
用于評估形狀描述子性能的植物葉片圖像主要從野外采集而來。典型的葉片形狀如圖2所示,其中包括三葉草、牽?;?、楓葉等8種植物葉子。每類圖像采集30幅圖片,其中20幅是同類不同個體的圖像,另外10幅由從20幅圖像中隨機(jī)挑選的某幾幅進(jìn)行旋轉(zhuǎn)、縮放、平移等幾何變換得到。再加上一些不同形狀的干擾葉片圖像(如圖2第2行所示),組成一個300幅圖像的小型形狀數(shù)據(jù)庫。其中,有些形狀類似,如圖1中第1行的形狀5與第2行形狀7相似,第1行形狀3與第2行形狀4相似,第1行形狀6與第2行形狀3相似,等等。
圖2 典型的植物葉片形狀
提取傅里葉描述子的具體步驟如下:
1)對彩色圖像進(jìn)行二值化。首先將圖像庫中的彩色圖像轉(zhuǎn)換為灰度圖像,動態(tài)設(shè)定閾值,再將像素的取值二值化,獲取二值圖像f(x,y)。
2)求取圖像的質(zhì)心(xc,yc)。
3)坐標(biāo)系轉(zhuǎn)換。以質(zhì)心為極坐標(biāo)的極點(diǎn),將圖像的坐標(biāo)系由直角坐標(biāo)轉(zhuǎn)變?yōu)闃O坐標(biāo)系。
4)提取圖像的形狀矩陣。以質(zhì)心為圓心,以最大極徑為半徑形成一個最小外接圓。將圓半徑等距離劃分成M份,極角分成N等分,形成大小為M×N的形狀矩陣。
5)二維離散傅里葉變換。對形狀矩陣進(jìn)行二維離散傅里葉變換,得到形狀矩陣在頻域中的表示F(u,v)。
6)獲取傅里葉描述子。獲得幅度譜|F(u,v)|,將低頻系數(shù)作為形狀描述子。
在具體操作時,形狀矩陣的大小M×N,以及低頻系數(shù)的個數(shù)是根據(jù)檢索性能進(jìn)行確定的。實驗取M=N=30,即形狀矩陣的行數(shù)和列數(shù)都是30。由于圖像的高頻反映圖像的細(xì)節(jié)內(nèi)容,而低頻部分反映圖像的概貌,因此可以用傅里葉變換的低頻系數(shù)作為表示圖像形狀的描述子。由于系數(shù)個數(shù)的多少也會對檢索性能產(chǎn)生影響,因此實驗分別取4,9,16,25,36,49 和64 個系數(shù)作為形狀特征,并分別在測試集上進(jìn)行檢索。對6種不同形狀各隨機(jī)抽取4幅圖像作為查詢圖像,分別在測試集上檢索相似圖像計算其查準(zhǔn)率,求取平均值,得出每種形狀的平均查準(zhǔn)率,最后求取6種形狀檢索準(zhǔn)確率的平均值。結(jié)果如圖3所示,當(dāng)特征數(shù)從4上升到16時,查準(zhǔn)率上升了16個百分點(diǎn),效果明顯。而當(dāng)特征數(shù)從16增加到64,準(zhǔn)確率只上升了6個百分點(diǎn),檢索準(zhǔn)確率增長緩慢。在對檢索準(zhǔn)確率和特征維數(shù)進(jìn)行權(quán)衡后,本文將特征維數(shù)即系數(shù)個數(shù)確定為49。
圖3 不同特征數(shù)下的平均查準(zhǔn)率
為了測試本文算法的性能,實驗將幾種不同算法與之進(jìn)行比較,包括Hu不變矩[6]、最小外接矩形(目標(biāo)與最小外接矩形的面積比作為形狀特征)[7]、最小外接圓(同心圓等面積劃分N等份,再對每一區(qū)域求取信息熵作為形狀特征)[8]、對圖像邊界的極坐標(biāo)信息進(jìn)行傅里葉變換得到的傅里葉描述子,以及PFD[5]這5種算法。
利用上述6種形狀特征,分別對圖2中的前6種形狀進(jìn)行檢索,每類隨機(jī)選取4幅圖像作為查詢圖像,在剩余的圖像中檢索相似圖像,計算平均查準(zhǔn)率,繪制不同形狀特征對不同葉子形狀的平均檢索查準(zhǔn)率圖(如圖4所示)。圖中行標(biāo)識1~6分別代表6種不同形狀,列代表查詢準(zhǔn)確率。從圖4可以看出,除了形狀5之外,本文算法對其余形狀的檢索準(zhǔn)確率相較其他算法更加優(yōu)越,尤其是形狀1,3和4,但第6種形狀的優(yōu)勢不明顯。實驗表明算法對于復(fù)雜形狀的檢索具有明顯優(yōu)勢,原因在于形狀矩陣中包含了圖像形狀較多的細(xì)節(jié)信息。6種形狀特征的平均檢索準(zhǔn)確率分別為:71.25%,48.33%,55.00%,64.38%,77.5%,91.04%。由結(jié)果可以看出本文算法比查準(zhǔn)率次高算法PFD的平均準(zhǔn)確率高出13%以上。
最后為了測試噪聲對算法性能的影響程度,實驗分別對測試集中的圖像添加高斯噪聲和椒鹽噪聲,再統(tǒng)計6種葉片形狀的平均檢索準(zhǔn)確率。具體數(shù)據(jù)如圖5所示。從圖中可以看出,具有噪聲的圖像的檢索準(zhǔn)確度大約下降10個百分點(diǎn)。分析原因在于噪聲導(dǎo)致圖像質(zhì)心,尤其是最大極徑發(fā)生改變,從而導(dǎo)致對應(yīng)的形狀矩陣發(fā)生改變,最終傅里葉描述子也發(fā)生相應(yīng)變化。但是檢索結(jié)果還是比較令人滿意,原因在于算法利用傅里葉變換的低頻系數(shù)作為描述子,而噪聲對低頻系數(shù)影響較小,因此,本文的算法對噪聲具有一定的穩(wěn)健性。
圖4 不同形狀特征對不同形狀的平均檢索查準(zhǔn)率(%)
圖5 噪聲對檢索性能的影響
本文提出一種利用形狀矩陣表示圖像的空間域信息,之后進(jìn)行二維離散傅里葉變換將形狀信息從空域變換到頻域,最后提取低頻系數(shù)作為形狀描述子的方法。用野外采集的植物葉子圖像庫進(jìn)行測試實驗結(jié)果顯示,該算法要明顯優(yōu)于Hu不變矩等其他5種算法。但是如何增強(qiáng)本文算法對噪聲的穩(wěn)健性,以及使其對圖像旋轉(zhuǎn)具有不變性還有待進(jìn)一步研究。
[1]閆雅楠,夏定元.結(jié)合邊緣檢測和區(qū)域分割的形狀特征提?。跩].電視技術(shù),2007,31(3):12-15.
[2]魏怡,何一偉,倪海峰,等.形狀描述法在圖像檢索中的應(yīng)用綜述[J].系統(tǒng)工程與電子技術(shù),2009,31(7):1755-1761.
[3] LU G J,SAJJANHAR A.Region-based shape representation and simlilarity measure suitable for content-based image retrieval[J].Multimedia Systems,1999,7(2):165-174.
[4]GOSHTASB A.Description and discrimination of planar shape using shape matrices[J].IEEE Trans.Pattern Anal.Mach.Intell.,1985,7(6):738-743.
[5]王斌.一種不變的基于傅立葉變換的區(qū)域形狀描述子[J].電子學(xué)報,2012,40(1):84-88.
[6] HU M K.Visual pattern recognition by moment invariants[J].IRE Trans.Information Theory,1962,11(2):179-187.
[7]盧蓉,范勇,陳念年.一種提取目標(biāo)圖像最小外接矩形的快速算法[J].計算機(jī)工程,2010,36(23):178-180.
[8]孫強(qiáng)強(qiáng).基于內(nèi)容的二值商標(biāo)圖像檢索研究[D].揚(yáng)州:揚(yáng)州大學(xué),2008.