余 勝 謝 莉
(湖南人文科技學(xué)院物理與信息工程系 湖南 婁底 417000)
基于內(nèi)容的圖像檢索 (Content Based Image Retrieval,CBIR)是當(dāng)前計(jì)算機(jī)視覺(jué)領(lǐng)域研究的熱點(diǎn)問(wèn)題之一,其利用圖像自身的形狀、 顏色和紋理等特征實(shí)現(xiàn)圖像的自動(dòng)檢索,克服了基于文本的圖像檢索需要大量人工對(duì)圖像進(jìn)行文字標(biāo)注的不足。 基于內(nèi)容的圖像檢索綜合了低層的圖像理解算法,提供了更加有效的檢索方法,并可增加反饋環(huán)節(jié),進(jìn)一步優(yōu)化檢索結(jié)果。
形狀特征是數(shù)字圖像的一個(gè)重要視覺(jué)特征,跟顏色特征和紋理特征相比,其是圖像的中間層特征,更能描述圖像的視覺(jué)特征。 常用的形狀描述方法分為基本區(qū)域的表示法和基本輪廓線的表示法兩大類。 基于區(qū)域的表示法從目標(biāo)圖像的整個(gè)區(qū)域檢測(cè)形狀特征算法計(jì)算量非常大,而基于輪廓線的表示法僅描述對(duì)目標(biāo)圖像進(jìn)行邊緣檢測(cè)后的邊緣點(diǎn),計(jì)算量較小,準(zhǔn)確度高。 直方圖對(duì)灰度圖像中各個(gè)灰度值的分布情況進(jìn)行了統(tǒng)計(jì),其具有旋轉(zhuǎn)、平移不變性。 本文提出了一種基于圖像邊緣的梯度方向直方圖進(jìn)行圖像檢索。 實(shí)驗(yàn)結(jié)果表時(shí),本文算法具有很好的檢索性能。
邊緣是指圖像周?chē)袼鼗叶戎涤须A躍變化或屋頂變化的像素的集合,是一個(gè)有幅值和方向的矢量。 當(dāng)前傳統(tǒng)的邊緣檢測(cè)方法有一階微分算子、 二階微分算子和Canny 算子。本文選擇一階微分算子中的Prewitt 算子實(shí)現(xiàn)圖像的邊緣檢測(cè)。
對(duì)邊緣圖像中的每一個(gè)邊緣點(diǎn)構(gòu)造邊緣梯度方向直方圖h(n),該直方圖表示邊緣點(diǎn)方向角落在第n 級(jí)點(diǎn)的高斯加權(quán)模之和。 即將360°的角度空間量化為36 級(jí),因此有1≤n≤36。 在以邊緣點(diǎn)為中心的鄰域內(nèi)用高斯圓形窗口函數(shù)對(duì)每個(gè)像素的梯度模作高斯加權(quán),即m′(i,j)=m(i,j)×w(i,j)。 其中,w(i,j)為窗口內(nèi)點(diǎn)(i,j)的高斯系數(shù)。 再以這些像素點(diǎn)的梯度矢量方向?yàn)樗饕?統(tǒng)計(jì)分別落在36 級(jí)角度空間的梯度模之和。 即一幅邊緣圖像可以得到一個(gè)36 維的梯度方向直方圖H(n),H(n)=[h(1),h(2),…,h(36)]。
本實(shí)驗(yàn)使用的是MPEG-7 形狀測(cè)試庫(kù),共有20 類圖像,每一類20 幅,共400 幅bmp 格式的圖像。本實(shí)驗(yàn)返回9 幅圖像,9 幅圖像依次按與待檢索圖像之間的街區(qū)距離進(jìn)行升序排列。 如圖1 所示,從仿真結(jié)果可以看出,待檢索圖像與第1幅返回圖像間的距離為0, 說(shuō)明這兩幅圖像的形狀特征完全相同。
本文提出了一種基于圖像形狀特征的圖像檢索方法,利用圖像的邊緣方向直方圖很好的描述了圖像的形狀特征。 仿真實(shí)驗(yàn)表明,本文所提出的算法具有很好的檢索性能。
[1]李博,楊丹張,小洪.一種新的基于梯度方向直方圖的圖像配準(zhǔn)方法[J].計(jì)算機(jī)應(yīng)用研究,2007,3:312-314.
[2]張小虎,李由,李立春.一種基于梯度方向直方圖的直線輪廓提取新方法[J].光學(xué)技術(shù),2006,6:824-826.
[3]劉永俊,孫強(qiáng)強(qiáng).一種新的商標(biāo)圖像檢索方法[J].常熟理工學(xué)院學(xué)報(bào):自然科學(xué),2010,4:106-109.