孫琦龍,張明亮
?
一種基于HSV顏色空間的藏毯圖像檢索方法
孫琦龍,張明亮
針對國內(nèi)外還沒有可供研究人員和公眾使用的藏毯類非物質(zhì)文化遺產(chǎn)數(shù)字化資源平臺這一狀況,分析了在藏毯圖像中運用基于內(nèi)容的圖像檢索系統(tǒng)技術(shù)的可行性。通過對藏毯圖像的顏色特征分析,針對傳統(tǒng)HSV顏色空間量化的缺陷,根據(jù)圖像顏色在HSV空間153維中的相同或不同的分布特點,將其他量化點按顏色相似距離最短的原則組合為一個聚類,從而達(dá)到既能聚類出代表圖像的顏色又能減少顏色數(shù)目的目的。通過查準(zhǔn)率與時間消耗的比較,實現(xiàn)了一種優(yōu)化的153維量化方法。
藏毯;圖像;量化;特征
藏毯在藏族傳統(tǒng)藝術(shù)的基礎(chǔ)上,吸收、融合了漢族、印度和尼泊爾宗教藝人的精華,并且形成了具有自己獨特的藏族藝術(shù)風(fēng)格的工藝美術(shù)品,其圖案設(shè)計和色彩源于藏傳佛教文化,藝術(shù)價值極高,是珍貴的非物質(zhì)文化遺產(chǎn)。隨著近年來非物質(zhì)文化遺產(chǎn)保護(hù)工作的不斷深入,以及非物質(zhì)文化遺產(chǎn)數(shù)字化、信息化的科技進(jìn)步,全國各地非物質(zhì)文化遺產(chǎn)數(shù)據(jù)庫建設(shè)步伐不斷加快,在分析藏毯的紋理特征、色彩分布和形狀特征的基礎(chǔ)上,即可以支持基于文字以及圖像屬性的查詢,又可以提取藏毯圖像的關(guān)鍵特征值來實現(xiàn)基于內(nèi)容的圖像檢索。利用非結(jié)構(gòu)化的存儲和檢索技術(shù),不僅使數(shù)據(jù)存儲的類型更加靈活多樣,同時提高了藏毯圖像檢索的效率。本文在研究基于內(nèi)容的圖像檢索方法的基礎(chǔ)上,經(jīng)過改進(jìn),提出了一種針對藏毯圖像的基于HSV顏色空間的圖像檢索算法,為藏毯這一非物質(zhì)文化遺產(chǎn)的保護(hù)和繼承提供了技術(shù)支撐平臺。
基于內(nèi)容的圖像檢索(Content-Based ImageRetrieval,CBIR)近年來已成為提高圖像檢索的有效手段,傳統(tǒng)的基于文本的圖像檢索技術(shù),通過圖像的描述文字和用戶輸入的關(guān)鍵字進(jìn)行比較,檢索結(jié)果不僅效果差并且不能對未標(biāo)注文本信息的圖像進(jìn)行檢索[1]。基于CBIR技術(shù)的圖像檢索系統(tǒng),采用相似性匹配算法計算關(guān)鍵圖像特征與特征庫中圖像特征的相似度,然后按照相似度從大到小的順序?qū)⑵ヅ鋱D像反饋給用戶。用戶可根據(jù)自己的滿意程度,選擇是否修改查詢條件,繼續(xù)查詢,以達(dá)到令人滿意的查詢[2]。CBIR的實現(xiàn)依賴于兩個關(guān)鍵技術(shù):圖像特征提取和匹配,而圖像特征提取又分為低層視覺和語義內(nèi)容。目前比較成熟的檢索算法大部分是基于圖像的低層特征,即利用圖像的顏色、紋理、形狀特征來檢索。而在基于內(nèi)容的圖像檢索中,顏色作為圖像的一種重要視覺信息,己得到廣泛應(yīng)用。顏色是圖像內(nèi)容組成的基本要素,作為圖像最直觀而明顯的特征,顏色特征是在基于內(nèi)容的圖像檢索中最早、最廣泛使用的視覺特征,常用的顏色特征包括顏色直方圖、顏色距、顏色聚合向量、顏色協(xié)方差矩陣等。
相對于其它的圖像特征,顏色特征非常穩(wěn)定,不局限于圖像的大小和方向,并且對于旋轉(zhuǎn)、平移、尺度變化,甚至各種變形都不敏感,表現(xiàn)出相當(dāng)強(qiáng)的魯棒性,因此在基于內(nèi)容的圖像檢索中發(fā)揮著重要的作用,這也使得顏色特征成為圖像檢索中應(yīng)用最為廣泛的底層視覺特征。
2.1 顏色模型
2.1.1 RGB
在RGB模型中,紅、綠、藍(lán)這3個基本顏色的不同組合構(gòu)成了所有顏色,將這3種顏色劃分成256(0-255)個等級。各個分量的數(shù)值越小,亮度越低;數(shù)值越大,亮度越高。如(0,0,0)表示黑色,而(255,255,255)又表示白色。一般通過一個真彩色像素用8位表示3顏色分量時,需要24位(3個字節(jié))來表示RGB的三種顏色,總共可以表示16777216種。RGB顏色模型通常采用單位立方體來表示,在正方體的主對角線上,各原色的強(qiáng)度相等,產(chǎn)生由暗到明的白色,也就是不同的灰度值。正方體的其它6個角點分別為紅、黃、綠、青、藍(lán)和品紅,RGB顏色模型所覆蓋的顏色域取決于與硬件相關(guān)的顯示設(shè)備熒光點的顏色特征。
2.1.2 HSV
HSV(hue,saturation,value)模型對用戶來說是一種直觀的顏色模型,直接對應(yīng)于人眼的視覺特征,H表示色度、S表示飽和度、V表示亮度。HSV模型對應(yīng)于一個圓錐形子集,包含RGB模型中的R、G、B3個面。色度H定義為繞圓錐中心軸的角度,取值范圍為0°~360°,從紅色開始按逆時針方向計算,紅色為0°,綠色為120°,藍(lán)色為240°。飽和度S定義為橫截面圓心到橫截面圓周點的距離,取值范圍為0~1,S取值越大,表示色彩越純,取值越小,表示色彩越灰。亮度V定義為圓錐橫截面的圓心到圓錐頂點的距離,表示色彩的明亮程度,取值范圍為0~1。
2.2 顏色特征提取
常用的顏色特征提取方法都建立在顏色直方圖的基礎(chǔ)上,主要做法就是統(tǒng)計圖像中各種顏色出現(xiàn)的頻數(shù),它不關(guān)心顏色所處的空間位置。顏色直方圖將顏色空間劃分為若干小的顏色區(qū)間,每個區(qū)間對應(yīng)于顏色直方圖的一個柄,然后統(tǒng)計落在每個小區(qū)間的像素數(shù)量,最終得到顏色直方圖。在顏色直方圖坐標(biāo)中,橫坐標(biāo)表示顏色柄的劃分值,縱坐標(biāo)表示每個柄區(qū)間中包含的圖像像素總和。
HSV的顏色空間包含3個分量:H、S、V,如果分別對這3個分量建立顏色直方圖進(jìn)行特征提取和匹配,則會帶來檢索的“偽相似度”和相反的結(jié)果集。所以在降低顏色數(shù)量的同時,一方面不削弱各種顏色間的關(guān)聯(lián),另一方面又能提高檢索精度和檢索效率,對H、S、V 3個分量進(jìn)行非等間隔分割。將色調(diào)H分成8份,飽和度S的范圍由圓心向圓周過渡,將其分為3份,亮度V劃分為Black,Gray,White3份,各自量化區(qū)間為:
HSV顏色空間被劃分為72個不同的空間區(qū)域,再將三個簡化后的顏色分量合成一維特征向量值,就將整個HSV顏色空間量化為72種顏色,減少了HSV顏色空間的有效顏色數(shù)量,簡化了顏色特征提取的復(fù)雜度。通過量化公式I=9H+3S+V計算,最終得到72柄的一維顏色直方圖,I的取值范圍為[0,71]。
4.1 聚類顏色
1、藏毯圖案較鮮艷且復(fù)雜,采用顏色量化中的聚類方法,用少量的代表色代表整個藏毯圖像。首先將藏毯圖像從RGB顏色轉(zhuǎn)換到HSV顏色空間,因為在HSV顏色空間中,根據(jù)兩種顏色之間的距離來評價顏色的相似度??紤]到藏毯圖像顏色特征在整個空間中的分布狀況,雖然采用比較大維的量化可以提高檢索效果,但考慮到計算量和存儲容量的限制問題,因為數(shù)據(jù)庫表中一行的容量最大為8060字節(jié),所以只能使用量化降維方法。同時,為了避免出現(xiàn)某些空間中像素數(shù)量非常稀疏的情況,使量化更為有效,把HSV顏色空間量化成153維,根據(jù)圖像顏色在HSV空間153維中的相同或不同的分布特點,均勻地選取若干個量化點,然后將其他量化點按顏色相似距離最短的原則組合為一個聚類,從而達(dá)到既能聚類出代表圖像的顏色又能減少顏色數(shù)目的目的,經(jīng)過反復(fù)實驗,得到像素點分布在153維時量化降維處理結(jié)果最佳。具體處理方法為:
在實驗中提取圖像中每一個像素點的RGB值并轉(zhuǎn)化為HSV顏色空間后,簡單聚類如下:
H:H空間分為36類,取值為0~35,h均勻間隔為10,即h=(0,10,20,30……,360);
S:S空間分為4類,S取值為0~3,S均勻間隔步距0.25(0.173,0.423,0.673,0.923);
V:V空間分為4類,V取值為0~3,V均勻間隔步距0.25(0,0.25,0.5,0.75)。
然后按照以上的量化級構(gòu)造一維特征矢量,把3個顏色分量合成一維特征矢量:L=4H+3S+V,這樣,H、S、V3個分量在一維矢量上分布開來.根據(jù)上述公式,計算L的取值范圍為[0,152],最終獲得153柄的一維直方圖。
4.2 平均分塊策略
采用平均分塊策略,將一幅圖像平均分為25塊,編號為H0~H24,分別存儲這25個子塊的顏色特征,經(jīng)過處理之后用于相似度計算,同時根據(jù)采集到的藏毯圖像特點決定各個子塊的權(quán)重。在圖像庫中圖像中間子塊(H6、H7、H8、H11、H12、H13、H16、H17、H18)的權(quán)重較大,因此,本文中對圖像中間子塊的權(quán)重做加大處理。分配方式如下:中間9個子塊權(quán)重為1 /3,其中每個子塊的權(quán)重為1 /27,周圍16個子塊的權(quán)重為1 /24。本文實驗中以普通藏毯圖像為例,每個子塊H分類的結(jié)果如下:數(shù)組中的每個數(shù)字代表該類中的像素點的個數(shù)。由于實驗圖像庫中圖像大小是400×400個像素點,平均分成25塊后,每一塊的像素數(shù)為6400:
H[0]:610 1113 4020 36 27 283016 6033465078200300 531 810 1086 900400 180 160 166180160 150 161200 22160 1021;
H[1]:5 0 11 20 30 8 263356 757618 25 26 1064 17 300 531 566 168100 128 188 190262 282 358400 440 527 881 460 166 16;
H[2]:1025 0 22 605066 55 20 26 36 56 76 180 667776 678900601201 569011098 112 201232 287 169 170 1866033 1020931 11 10;
H[3]:10216 101720132021 26565080166155 136169700902 1008 536366456162 9919819930020016016 10 302029 11 31;
H[4]:201012 0 0 17 628 1629 2020 30 2022 68 909280299 372 600516 160 190160420399616 689660200 186200 100 20 2013;
H[5]:10 0 20 12 16263025 20 33 23 1006416072 135 190851608090 216300606206382181 350 336 286300326 330323200506506618 2011 16 1000 10;
H[6]:1027 203002615 5037 70 86120 67 80 50 119 369 778610 268268506 156303 303518500440330 100 25 27 30 1630 16
H[7]:16 2010 18 30608090627986 101196 156 102 156296 206506600638286366368369226267196309 180109 8090102016;
H[8]:1010 26303060118 582960136 162 155 228 226 216 400506800606250280293 283 211326281 271 80 100 2019 16 6038 16;
H[9]:1610 20 21 1632 1068 72 60 66 103 185 217 216310 200 308 380 318 621 555 572 327 340 353 403 201129 160 4611 10 1810 16;
H[10]:12 20 20 26 60 3963566887 55 297 205 403 368506508335 386 516 210287 378 298297 190 267 5697 86 56 35 462836;
H[11]:10 1121 3030 38 38 6325 33 69 72 106236217336 316506668562466567313 322260170 285165 80 23 107 60 566651 22;
H[12]:12 203331 5930 1867 139 80 226 266227 209358 266 304 565 510328 231 366303 363367339 106 165 61 70106 53 60 30 1616;
H[13]:2016 4032 59 65 12035 80 105 98 222 267 292 330 220 568 560360 379 352 286290223 260 186189168118 203 8662 3028 2031;
H[14]:20 332650 4659100 68203 182 227 109215 301 306 316563 506381 368 363 288 319 333 153 216 138191 8060 50 30 20 3020 30;
H[15]:30 233640 467910268200162 120209305 211 219 336460506391 372503 388 206203 253 216 21891 18070 38 50 20 211810;
H[16]:50 303950 518411258100182 135216312305240 335400 401496300501318 200209 203 266 200109150100 30 5830 11235;
H[17]:40 365638598010050156156100198300288299 305388 400466300466 426200267 212 16819920010013550 3638203830;
H[18]:50364061 705811010210611799 210220 190287 315376399468416400340 301277 198167 210 109108168 100 8678305840;
H[19]:30524056 606290102117109167 226231 209216 308366 363445 268398406 350 261187198 156176 11198108 116 9088503852;
H[20]:28435930 897610198111121146 200 212 178198298 409 313466 398387396 370 290 156 140 168 196 101126 98 100 6078663856;
H[21]:105666 76 98 7616719890178226 212 226 278277 267 397 349 413426368 410 267 256 156 109 112 116100 100 6358765340;
H[22]:33405778109116187162198219298 200 265301 217 378 336 409398400360 307 216 189 198 160 111116 93 786060 51;
H[23]:5056 78 98 11612890200 216228 266 196 138316 286 309 316 298393 387 396 289 305 201 258 200 151126 100 685051 40;
H[24]:304088 100 117 198102198 200186199203 201323 308 313 320 299358 367 368 379 315 200187100 167109 1021686550 40。
4.3 實驗結(jié)果
如表1所示:
表1 查準(zhǔn)率比較表
綜合以上結(jié)果并結(jié)合時間消耗和計算量的大?。ú捎?52維時計算量較大),說明采用153維量化方法的檢索查準(zhǔn)率較高,并且時間消耗也不大。故本文提出改進(jìn)的HSV顏色空間量化方法較為可行。
通過對藏毯圖像的顏色特征分析,各種典型的基于顏色特征的提取技術(shù),分析了在藏毯圖像中運用基于內(nèi)容的圖像檢索系統(tǒng)技術(shù)的可行性。針對傳統(tǒng)HSV顏色空間量化的缺陷,根據(jù)圖像顏色在HSV空間153維中的分布特點,將其他量化點按顏色相似距離最短的原則組合為一個聚類,從而達(dá)到既能聚類出代表圖像的顏色又能減少顏色數(shù)目的目的。通過實現(xiàn)的一種優(yōu)化的153維量化方法,使藏毯圖像檢索的查準(zhǔn)率明顯提高,為非物質(zhì)文化遺產(chǎn)的保護(hù)和繼承提供了技術(shù)支撐平臺。
[1] 孫浪,唐雁,何熒,謝松山,苗宗霞.一種有效的多特征圖像檢索方法[J].西南大學(xué)學(xué)報 2014(12):162-170
[2] 陳劍雄,張蓓.簡析圖像檢索系統(tǒng)中的CBIR技術(shù)[J],《貴圖學(xué)刊》2010(2):47-49
[3] 李薇,李秉茂.基于顏色、形狀和紋理的多特征融合圖像檢索[J],航空計算技術(shù) 2013(11):88-90
[4] 趙宏偉,陳霄,石景海,馬凌蛟.綜合顏色和形狀特征的交通標(biāo)志圖像檢索算法[J],吉林大學(xué)學(xué)報( 工學(xué)版)2013(3):128-132
[5] 劉麗,匡綱要.圖像紋理特征提取方法綜述[J].中國圖像圖形學(xué)報 2009(4):622-635
[6] 徐慧英,袁杰,趙建民.一種基于顏色和紋理的圖像檢索方法[J].計算機(jī)科學(xué) 2009(5):282-286
[7] 王維蘭,錢建軍,楊旦春等.基于頻率譜變化量的唐卡圖像特征提取與表示[J].計算機(jī)工程與應(yīng)用.2011(22):183-187
[8] 周明全,耿國華,韋娜.基于內(nèi)容圖像檢索技術(shù)[M].北京:清華大學(xué)出版社,22-35
[9] 楊琤,董曉宇,鄒士年.雪域高原上的地毯奇葩——少數(shù)民族特需商品傳統(tǒng)生產(chǎn)工藝和技術(shù)保護(hù)工程巡禮之三[J].中國民族.2009(3):27-30
[10] 彭冬梅.面向剪紙藝術(shù)的非物質(zhì)文化遺產(chǎn)數(shù)字化保護(hù)技術(shù)研究[D].杭州.浙江大學(xué).2008:32-39
[11] 宋本蓉.非物質(zhì)文化遺產(chǎn)保護(hù)視野下的傳統(tǒng)手工技藝[D],中國藝術(shù)研究,2010,10-12
[12] 李憶湘.在發(fā)展中進(jìn)行非遺保護(hù),在傳承中促進(jìn)產(chǎn)業(yè)發(fā)展[A].2010中國文化遺產(chǎn)保護(hù)與傳承高峰論壇???,2010.5.22.
[13] 賴偉權(quán).地方高校圖書館對非物質(zhì)文化遺產(chǎn)的數(shù)字化保護(hù)研究[J].《中國科教創(chuàng)新導(dǎo)刊》.2012(28):253-254.
Method of Image Retrieval Based on HSV Color Space
Sun Qilong, Zhang Mingliang
(Department of Computer, Qinghai University For Nationalities, Xining 810007, China)
There is still none digital resource platforms for the intangible cultural heritage of Tibetan carpet, which can be used by the researchers and the public. By analyzing the color feature of Tibetan carpet image, according to the same or different distribution characteristics of the traditional HSV color space, the other points are clustered into a cluster based on the same or different distribution characteristics in the HSV space, which can achieve the purpose of reducing the number of colors by clustering the color of the representative images. By comparing the precision and time consumption, it achieves an optimized 153 dimensional quantization method.
Tibetan Carpet; Image; Quantification; Features
1007-757X(2016)04-0009-03
TP311
A
(2015.10.13)
教育部“春暉計劃”合作科研項目(項目編號:Z2014024)
孫琦龍(1970-),男,青海人,青海民族大學(xué)計算機(jī)學(xué)院,教授,研究方向:數(shù)據(jù)庫、軟件工程,西寧,810007
張明亮(1976-),男,青海人,青海民族大學(xué)計算機(jī)學(xué)院,講師,研究方向:圖形圖像,西寧,810007