巫青山 向宇靜 牛光學(xué)
摘 要:本文深入研究了唐卡圖像的特征,并研究了適合唐卡的顏色、紋理、形狀及多種特征融合的提取方法,并設(shè)計(jì)了基于特征融合的唐卡圖像檢索系統(tǒng),最后得出結(jié)論:將唐卡圖像的多特征融合后檢索系統(tǒng)的準(zhǔn)確性有一定了提高。
關(guān)鍵詞:圖像檢索;特征提?。惶卣髌ヅ?;特征融合
“唐卡”,系藏文音譯,用彩緞裝裱后懸掛供奉的宗教卷軸畫。唐卡藝術(shù)品種繁多,取材廣泛涉及到宗教畫、傳記畫、歷史畫、反映生活習(xí)俗的風(fēng)俗畫等,其特點(diǎn)圖像人物畫法復(fù)雜、顏色豐富、色彩分布相對勻稱。唐卡藝術(shù)是千百年來藏民族在文化、歷史發(fā)展中積累的重要遺產(chǎn),具有獨(dú)特的藝術(shù)風(fēng)格和濃厚的宗教色彩,在經(jīng)濟(jì)、文化、宗教和社會(huì)各方面發(fā)揮著越來越大的作用[1]。越來越多的唐卡圖像以電子的方式來存儲(chǔ)、管理和傳播,以滿足人們對唐卡藝術(shù)的欣賞和查詢。研究如何從唐卡圖像庫中快速并且準(zhǔn)確地檢索出用戶所需要的唐卡圖像具有重要意義。文獻(xiàn)[2]已經(jīng)實(shí)現(xiàn)基于內(nèi)容的唐卡圖像檢索,沒有考慮唐卡圖像的紋理特征,只是將顏色特征和形狀特征融合。本文在基于內(nèi)容的圖像檢索技術(shù)基礎(chǔ)之上,深入研究了唐卡圖像的特征,并研究了適合唐卡的顏色、紋理、形狀及多種特征融合的提取方法,設(shè)計(jì)了基于特征融合的唐卡圖像檢索系統(tǒng)。
1 唐卡圖像顏色特征提取
顏色特征是人們識(shí)別事物的主要感知特征之一,是用于區(qū)別不同事物的最簡單、最有效的方法。提取唐卡圖像的顏色特征要考慮以下問題:顏色空間模型的選擇、顏色特征的描述、顏色特征匹配等問題。
1.1 RGB顏色模型
RGB顏色模型是最常用的顏色模型,用由R(紅)、G(綠)、B(藍(lán))三個(gè)分量組成的三維空間[3]中的點(diǎn)來表示一種顏色,所有顏色都可以由R、G、B三個(gè)變量組合而成,三個(gè)分量取值范圍為0~1。原點(diǎn)(0,0,0)代表黑色,點(diǎn)(1,1,1)代表白色,從黑色到白色的對角線是圖像的一條灰色線。
1.2 顏色特征描述
由于對圖像進(jìn)行旋轉(zhuǎn)、放大或縮小等操作時(shí)顏色直方圖具有不變性,因而顏色直方圖是對顏色特征進(jìn)行描述的最常用的一種方法。顏色直方圖公式[3]:
其中L表示特征可取值的個(gè)數(shù),k表示圖像特征取值,N表示圖像像素的總數(shù),nk表示圖像中具有特征值為k的像素的個(gè)數(shù)。
在利用直方圖對顏色特征進(jìn)行描述前,先要對顏色進(jìn)行量化[4]。在本文中,我們首先將圖像的顏色空間劃分為13小個(gè)顏色區(qū)間的,然后再統(tǒng)計(jì)圖像顏色落在每個(gè)小區(qū)間的像素?cái)?shù)量,從而得到R、G、B三分量的顏色直方圖。
1.3 顏色特征匹配
常見顏色特征匹配算法:直方圖匹配法、直方圖相交法、距離法、中心矩法等。根據(jù)1.2中提取的顏色直方圖,本文采用直方圖匹配法對顏色特征進(jìn)行匹配,計(jì)算公式[3]如下:
其中Q(i)表示待檢測圖像的顏色直方圖中第i個(gè)柱的值,K(i)表示提取圖像庫中圖像的顏色直方圖中第i個(gè)顏色柱的值,L柱的個(gè)數(shù),W(i)表示權(quán)重。
2 唐卡圖像紋理特征
紋理指從整體上看表面呈現(xiàn)出某種規(guī)律,可以看成相同的表面組成,但從局部上看表面呈現(xiàn)出雜亂無序。紋理也可理解為圖像灰度在空間上的變化和反復(fù)[5],是人們視覺系統(tǒng)對物體表面現(xiàn)象的感知。
2.1 Tamura紋理特征
Tamura紋理特征[7]是由Tamura等人提出,該算法的基礎(chǔ)是人類視覺系統(tǒng)對紋理的感知,所有的紋理在視覺系統(tǒng)上都有意義,主要用粗糙度、對比度、方向度來描述圖像的紋理特征。
(1)粗糙度:最基本的紋理特性,反映圖像的紋理粒度的特性。計(jì)算粗糙度的步驟如下:
第一步:計(jì)算大小為2k×2k的圖像中活動(dòng)窗口中像素的平均強(qiáng)度值,計(jì)算公式[6]如下:
其中k=0、1、2、3、4、5,f(i,j)表示點(diǎn)(i,j)處的像素灰度值。
第二步:計(jì)算每個(gè)像素在水平方向上和垂直方向互不重疊的窗口之間的平均強(qiáng)度差,計(jì)算公式[6]如下:
第三步:取水平方向上和垂直方向上平均強(qiáng)度差值最大者,并作為當(dāng)前像素的領(lǐng)域均值差值。
第四步:從多領(lǐng)域尺寸中設(shè)置一個(gè)最佳尺寸,并在L(代表領(lǐng)域尺寸個(gè)數(shù))個(gè)領(lǐng)域均值差值中求得最大值,計(jì)算公式[6]如下:
第五步:計(jì)算整幅圖像的灰度圖像的紋理粗糙度F,其中m、n分別表示圖像的寬和高,計(jì)算公式[6]如下:
(2)方向度:描述紋理的散布或集中方向,對圖像紋理的全局描述。方向度在像素梯度的基礎(chǔ)上求得的,其計(jì)算步驟如下:
第一:計(jì)算像素梯度,計(jì)算公式[6]如下:
其中Vh、Vv分別是通過圖像卷積 所得的水平和垂直方向上的變化量。
第二步:設(shè)定域值D,先對θ進(jìn)行離散化,統(tǒng)計(jì)域值D小于 —G—的像素?cái)?shù)量并構(gòu)造方向角局部邊緣概率直方圖。
第三步:采用二階矩累積方法計(jì)算方向度,計(jì)算公式[6]如下:
其中δ表示直方圖歸一化系數(shù),np為直方圖中峰波的個(gè)數(shù),p為峰波的值,ωp為峰波兩側(cè)之間距離,βp表示為峰波中心位置,H為直方圖,β為量化后的方向角。
(3)對比度:用于統(tǒng)計(jì)像素亮度的分布,其大小由灰度級(jí)動(dòng)態(tài)范圍、直方圖上黑白兩部分兩極化的程度、邊緣銳化、重復(fù)模式的周期決定。對比度計(jì)算公式[6]如下: ,其中b=A/a2,A為四次矩,a為方差,n取8、4、2、1、1/2、1/4、1/8。
(4)在設(shè)定不同的閾值情況下,利用Tamura紋理特征提取唐卡示例圖1的紋理值如下表1。
2.2 紋理特征匹配
依據(jù)2.1中利用Tamura算法提取唐卡圖像在紋理特征上的粗糙度F、方向度M和對比度N三個(gè)分量,本文采用以下公式描述待檢測圖像的F、M、N三個(gè)分量與特征庫中圖像的F、M、N之間的關(guān)系。
其中(DF,DM,DN)、(KF,KM,KN)分別表示待檢測圖像和特征庫中圖像的紋理特征在粗糙度F、方向度M和對比度N上的值。α、β、γ分別表示在粗糙度F、方向度M和對比度N三個(gè)分量上的權(quán)重因子,表示所提取的紋理特征側(cè)重與某一分量。Dist(F,M,N)的值表示兩幅圖像的紋理特征之間的差距。
3 唐卡圖像形狀特征
形狀特征描述圖像中目標(biāo)形狀的特點(diǎn)以及空間區(qū)域特點(diǎn),并且不會(huì)因?yàn)橥饨缫蛩氐母淖兌兓D壳盀橹?,形狀特征還沒有確切的定義[7]。本文采用邊緣直方圖描述唐卡圖像的形狀特征。
3.1 邊緣直方圖算法
⑴Canny算子思想.提取圖像中目標(biāo)的邊緣特征采用Canny算子[8]。Canny算子通過設(shè)定的兩個(gè)閾值來檢測強(qiáng)邊緣和弱邊緣。設(shè)定高閾值為T1,低閾值為T2,圖像中目標(biāo)邊緣上的任一點(diǎn)(x,y)的梯度幅值為M(x,y)。若M(x,y)>T1,則表明點(diǎn)(x,y)一定在圖像中的目標(biāo)邊緣上;若M(x,y) ⑵邊緣直方圖算法。第一步:先將圖像轉(zhuǎn)化成灰度圖像,再利用二維高斯函數(shù)對圖像進(jìn)行降噪。二維高斯函數(shù)公式[9]如下: 其中δ是信噪比參數(shù),f?(x,y)表示待降噪的圖像,f(x,y)代表降噪后的圖像。 第二步:計(jì)算圖像中各點(diǎn)處的梯度幅度和梯度方向。計(jì)算公式[9]如下: 第三步:將邊緣梯度方向值進(jìn)行量化成36份,即從-1800~1800量化到0~36,得到唐卡圖像的邊緣直方圖2。 3.2 形狀特征匹配 基于上述3.1中提取圖像的邊緣直方圖,本文采用1.3中顏色特征匹配的方法對形狀特征進(jìn)行匹配。 本文通過基于特征融合的唐卡圖像檢索實(shí)驗(yàn)系統(tǒng),并得出結(jié)論:唐卡圖像的多特征融合后檢索系統(tǒng)的準(zhǔn)確性有一定了提高,同時(shí)增加了檢索時(shí)間;若只針對唐卡圖像的單一特征檢索實(shí)驗(yàn),在顏色特征、形狀特征、紋理特征之中,顏色特征作為檢索條件的準(zhǔn)確性最高;分析只融合兩種特征的實(shí)驗(yàn)結(jié)果發(fā)現(xiàn):顏色特征作為檢索條件的準(zhǔn)確性最高,紋理特征其次,形狀特征最低,這可能與提取特征的算法和參數(shù)設(shè)定有關(guān)。要想大幅度的提高唐卡圖像檢索系統(tǒng)的效率和準(zhǔn)確性,今后研究需要建立一個(gè)與人感知更為貼近的唐卡圖像特征模型,探索出一種更能表達(dá)和描述唐卡圖像特征的方法,并且將唐卡圖像的低層特征與高層特征相結(jié)合起來。 [參考文獻(xiàn)] [1]王維蘭,唐仕喜,錢建軍,粱弼.基于內(nèi)容的唐卡圖像數(shù)據(jù)庫檢索系統(tǒng)[J].湛江師范學(xué)院學(xué)報(bào),2008,03:91-95. [2]李曉杰.基于內(nèi)容的唐卡圖像檢索技術(shù)研究[D].西北民族大學(xué),2011. [3]章毓晉.基于內(nèi)容的視覺信息檢索[M].北京:科學(xué)出版社,2003.