孫琦龍+張明亮
摘要:針對(duì)國內(nèi)外還沒有可供研究人員和公眾使用的藏毯類非物質(zhì)文化遺產(chǎn)數(shù)字化資源平臺(tái)這一狀況,論述了在藏毯圖像中運(yùn)用顏色特征實(shí)現(xiàn)圖像檢索的可行性。根據(jù)藏毯圖像的顏色特征,分析了目前一些HSV顏色空間量化的缺陷,按照圖像顏色在HSV空間中相同或不同的分布特點(diǎn),提出了一種改進(jìn)的188維顏色空間量化方法。通過對(duì)藏毯圖像采用平均分塊的策略,將一幅圖像平均分為25個(gè)子塊,每一個(gè)子塊的像素?cái)?shù)為6400。經(jīng)過對(duì)實(shí)驗(yàn)數(shù)據(jù)的分析,比較了不同維數(shù)顏色空間量化的查準(zhǔn)率與時(shí)間消耗,最終實(shí)現(xiàn)了在藏毯圖像檢索中采用188維顏色空間量化的方法。
關(guān)鍵詞:計(jì)算機(jī)應(yīng)用;藏毯;圖像;量化;特征
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.3969/j.issn.1003-6970.2016.03.009
0引言
非物質(zhì)文化遺產(chǎn)的保護(hù)和繼承,是當(dāng)今全世界所有國家、地區(qū)和民族面臨的新課題,加牙藏毯織毯技藝已經(jīng)被國務(wù)院列為第一批國家級(jí)非物質(zhì)文化遺產(chǎn)項(xiàng)目。2014年,加牙藏族織毯技藝傳習(xí)所又被列為非物質(zhì)文化遺產(chǎn)傳習(xí)所,其傳統(tǒng)工藝的保護(hù)已引起人們的關(guān)注和重視。藏毯在藏族傳統(tǒng)藝術(shù)的基礎(chǔ)上,吸收、融合了漢族、印度和尼泊爾宗教藝人的精華,并且形成了具有自己獨(dú)特的藏族藝術(shù)風(fēng)格的工藝美術(shù)品,其圖案設(shè)計(jì)和色彩源于藏傳佛教文化,藝術(shù)價(jià)值極高,是珍貴的非物質(zhì)文化遺產(chǎn)。隨著近年來非物質(zhì)文化遺產(chǎn)保護(hù)工作的不斷深入,以及非物質(zhì)文化遺產(chǎn)數(shù)字化、信息化的科技進(jìn)步,全國各地的非物質(zhì)文化遺產(chǎn)數(shù)據(jù)庫建設(shè)步伐在不斷加快。借助于藏毯的數(shù)字化保護(hù)服務(wù)平臺(tái),在分析藏毯的紋理特征、色彩分布和形狀特征的基礎(chǔ)上,即可以支持基于文字以及圖像屬性的查詢,又可以通過提取藏毯圖像的關(guān)鍵特征值來實(shí)現(xiàn)基于內(nèi)容的圖像檢索。本文在研究基于內(nèi)容的圖像檢索技術(shù)基礎(chǔ)上,經(jīng)過改進(jìn),提出并實(shí)現(xiàn)了一種基于HSV顏色空間的藏毯圖像檢索方法。
1基于內(nèi)容的圖像檢索方法
基于內(nèi)容的圖像檢索(Content-Based Im-ageRetrieval,CBIR)近年來已成為提高圖像檢索的有效手段,傳統(tǒng)的基于文本的圖像檢索技術(shù),通過圖像的描述文字和用戶輸入的關(guān)鍵字進(jìn)行比較,檢索結(jié)果不僅效果差并且不能對(duì)未標(biāo)注文本信息的圖像進(jìn)行檢索?;贑BIR技術(shù)的圖像檢索系統(tǒng),采用相似性匹配算法計(jì)算關(guān)鍵圖像特征與特征庫中圖像特征的相似度,然后按照相似度從大到小的順序?qū)⑵ヅ鋱D像反饋給用戶。用戶可根據(jù)自己的滿意程度,選擇是否修改查詢條件,繼續(xù)查詢,以達(dá)到令人滿意的查詢。CBIR的實(shí)現(xiàn)依賴于兩個(gè)關(guān)鍵技術(shù):圖像特征提取和匹配。目前比較成熟的檢索算法大部分是基于圖像的顏色、紋理、形狀特征來檢索,而在基于內(nèi)容的圖像檢索中,作為圖像最直觀而明顯的特征和基本要素,顏色特征是在基于內(nèi)容的圖像檢索中最早、最廣泛使用的視覺特征,常用的顏色特征包括顏色直方圖、顏色距、顏色聚合向量、顏色協(xié)方差矩陣等。
2 HSV顏色空間
相對(duì)于其它圖像特征,顏色特征非常穩(wěn)定,不局限于圖像的大小和方向,并且對(duì)于旋轉(zhuǎn)、平移、尺度變化,甚至各種變形都不敏感,表現(xiàn)出相當(dāng)強(qiáng)的魯棒性,因此在基于內(nèi)容的圖像檢索中發(fā)揮著重要的作用,這也使得顏色特征成為圖像檢索中應(yīng)用最為廣泛的底層視覺特征。
2.1顏色模型
2.1.1 RGB
在RGB模型中,紅,綠、藍(lán)這3個(gè)基本顏色的不同組合構(gòu)成了所有顏色,將這三種顏色劃分成256(0-255)個(gè)等級(jí)。各個(gè)分量的數(shù)值越小,亮度越低。數(shù)值越大,亮度越高。如(0,0,0)表示黑色,而(255,255,255)又表示白色。一般通過一個(gè)真彩色像素用8位表示三個(gè)顏色分量時(shí),需要24位(3個(gè)字節(jié))來表示RGB的三種顏色,總共可以表示16777216種。
2.1.2 HSV
HSV(hue,saturation,value)模型對(duì)用戶來說是一種直觀的顏色模型,直接對(duì)應(yīng)于人眼的視覺特征,H表示色度、S表示飽和度、V表示亮度。模型對(duì)應(yīng)于圓柱坐標(biāo)系中的一個(gè)圓錐形子集,它包含RGB模型中的R=I,G=I,B=I三個(gè)面。色度H用角度度量,取值范圍為0°~360°,從紅色開始按逆時(shí)針方向計(jì)算,紅色為0°,綠色為120°,藍(lán)色為240°。它們的補(bǔ)色是:黃色為60°,青色為180°,品紅為300°;從圓錐橫截面的圓心到橫截面圓周點(diǎn)的距離被定義為飽和度(S),飽和度S取值范圍為0~1,S取值越大,表示色彩越純,取值越小,表示色彩越灰。從圓錐的橫截面圓心到圓錐頂點(diǎn)的距離被定義為亮度(V)。亮度V表示色彩的明亮程度,取值范圍為0~Ⅰ,Ⅴ和光強(qiáng)度之間并沒有直接的聯(lián)系。
2.2顏色特征
顏色直方圖是目前最常用的顏色特征提取方法,絕大多數(shù)對(duì)顏色特征的提取和描述算法都是以顏色直方圖為基礎(chǔ)。其主要做法就是統(tǒng)計(jì)圖像中各種顏色出現(xiàn)的頻數(shù),它不關(guān)心顏色所處的空間位置。顏色直方圖將顏色空間劃分為若干小的顏色區(qū)間,每個(gè)區(qū)間對(duì)應(yīng)于顏色直方圖的一個(gè)柄,然后統(tǒng)計(jì)落在每個(gè)小區(qū)間的像素?cái)?shù)量,最終得到顏色直方圖。在顏色直方圖坐標(biāo)中,橫坐標(biāo)表示顏色柄的劃分值,縱坐標(biāo)表示每個(gè)柄區(qū)間中包含的圖像像素總和。直方圖均衡主要用于處理圖像由于過度曝光或者曝光不足造成的前景背景過量或過暗的情況,可以增強(qiáng)圖像的對(duì)比度,擴(kuò)展圖像灰度范圍。
3傳統(tǒng)的HSV顏色空間量化
如果分別對(duì)HSV顏色空間的三個(gè)分量:H、S、V建立顏色直方圖進(jìn)行特征提取和匹配,則會(huì)帶來檢索的低匹配性。所以要對(duì)H、S、V三個(gè)分量進(jìn)行非等間隔分割,將色調(diào)H分成8份;飽和度S的范圍由圓心向圓周過渡,將其分為三份;亮度V劃分為Black,Gray,White三份,各自量化區(qū)間為:
按照以上的量化區(qū)間,HSV顏色空間被劃分為72個(gè)不同的空間區(qū)域,再通過量化公式I=9H+3S+V計(jì)算,將三個(gè)簡化后的顏色分量合成一維特征向量值,Ⅰ的取值范圍為[0,71],這就將整個(gè)HSV顏色空間量化為72種顏色,最終得到72柄的一維顏色直方圖。
4一種改進(jìn)的HSV顏色空間量化方法
4.1顏色空間量化
由于藏毯圖案較鮮艷且復(fù)雜,所以采用顏色量化聚類方法,用少量主體色代表整個(gè)藏毯圖像的特征。將藏毯圖像從RGB顏色轉(zhuǎn)換到HSV顏色空間后,計(jì)算顏色之間的距離來測量圖像的相似度。在理論分析中,雖然采用比較高維的量化可以提高檢索精度,但目前的數(shù)據(jù)庫表一行的容量最大為8060字節(jié),所以只能使用降維方法。根據(jù)以往的經(jīng)驗(yàn)分析,在藏毯圖像的某些空間中可能會(huì)出現(xiàn)像素稀疏的情況,所以把HSV顏色空間量化成188維。根據(jù)圖像顏色在HSV顏色空間188維中的相同或不同的分布特點(diǎn),均勻地選取若干個(gè)量化點(diǎn),然后將其他量化點(diǎn)按顏色相似距離最短的原則組合為一個(gè)聚類,從而達(dá)到既能聚類出代表圖像的顏色又能減少顏色數(shù)目的目的。本文采用的預(yù)處理辦法是直方圖均衡,采用直方圖均衡的目的是去除光照條件對(duì)灰度的影響。具體聚類如下:
H:H空間分為45類,取值為0~44,h均勻間隔為8,即h=(0,8,16,32……,360),
S:S空間分為4類,S取值為0~3,S均勻間隔步距0.25(0.173,0.423,0.673,0.923),
V:V空間分為4類,V取值為0~3,V均勻間隔步距0.25(0,0.25,0.5,0.75),
然后按照以上的量化級(jí)構(gòu)造一維特征矢量,把3個(gè)顏色分量合成一維特征矢量:
L=4H+3S+V,根據(jù)上述公式,計(jì)算L的取值范圍為[0,187],最終獲得188柄一維直方圖。
4.2圖像分塊策略
對(duì)藏毯圖像采用平均分塊策略,將一幅圖像平均分為25個(gè)子塊,用于存儲(chǔ)這25個(gè)子塊的顏色特征。根據(jù)藏毯圖像的基本特征,對(duì)圖像子塊的權(quán)重做等分處理,既各個(gè)子塊的權(quán)重為1/25。本文實(shí)驗(yàn)中以普通藏毯圖像為例,每個(gè)子塊分類的結(jié)果如下:數(shù)組中的每個(gè)數(shù)字代表該類中像素點(diǎn)的個(gè)數(shù)。由于實(shí)驗(yàn)圖像庫中圖像大小是400×400個(gè)像素點(diǎn),所以平均分成25個(gè)子塊后,每一個(gè)子塊的像素?cái)?shù)為6400。
4.3實(shí)驗(yàn)結(jié)果
通過以上實(shí)驗(yàn)數(shù)據(jù)對(duì)比,188維量化時(shí)的查準(zhǔn)率略高于155維量化時(shí)的查準(zhǔn)率,二者時(shí)間消耗也相差不大,大概在5s左右。雖然188維量化時(shí)與652維量化時(shí)查準(zhǔn)率有所下降,但時(shí)間的消耗也較低,652維量化消耗的總時(shí)間為45s,188維量化消耗的總時(shí)間為32s。綜合以上分析,說明采用188維量化方法,在藏毯圖像的檢索中較為可行。
5結(jié)語
為了更好的開展藏毯類非物質(zhì)文化遺產(chǎn)的預(yù)見性保護(hù)工作,本文根據(jù)藏毯圖像的顏色特征,分析了目前HSV顏色空間量化的缺陷,按照圖像顏色在HSV空間中相同或不同的分布特點(diǎn),提出并實(shí)現(xiàn)了一種改進(jìn)的188維顏色空間量化方法。通過對(duì)藏毯圖像采用平均分塊的策略,經(jīng)過反復(fù)實(shí)驗(yàn)和對(duì)實(shí)驗(yàn)數(shù)據(jù)的分析,比較了不同維數(shù)顏色空間量化的查準(zhǔn)率與時(shí)間消耗,最終找到了一種較為合適的提高藏毯圖像檢索查準(zhǔn)率的方法,為非物質(zhì)文化遺產(chǎn)的保護(hù)和繼承提供了技術(shù)支撐。