孫琦龍++張明亮
摘要:針對(duì)國(guó)內(nèi)外還沒(méi)有可供研究人員和公眾使用的藏毯類非物質(zhì)文化遺產(chǎn)數(shù)字化資源平臺(tái)這一狀況,分析了在藏毯圖像中運(yùn)用基于內(nèi)容的圖像檢索系統(tǒng)技術(shù)的可行性。通過(guò)對(duì)藏毯圖像的顏色特征分析,針對(duì)傳統(tǒng)HSV顏色空間量化的缺陷,使量化更為有效,把HSV顏色空間量化成188維,實(shí)現(xiàn)了在基于JAVA的框架中計(jì)算顏色直方圖的方法,采用相似距離衡量直方圖的相似度??紤]時(shí)間消耗并通過(guò)查準(zhǔn)率的比較,藏毯圖像檢索的查準(zhǔn)率明顯提高。
關(guān)鍵詞:藏毯;圖像;量化;特征
中圖分類號(hào):TP311
文獻(xiàn)標(biāo)識(shí)碼:A
DOI:10.3969/j.issn.1003-6970.2015.08.006
0 引言
藏毯在藏族傳統(tǒng)藝術(shù)的基礎(chǔ)上,吸收、融合了漢族、國(guó)外宗教藝人的精華,并且形成了具有自己獨(dú)特的藏族藝術(shù)風(fēng)格的工藝美術(shù)品,其圖案設(shè)計(jì)和色彩源于藏傳佛教文化,藝術(shù)價(jià)值極高,是珍貴的非物質(zhì)文化遺產(chǎn)。隨著近年來(lái)非物質(zhì)文化遺產(chǎn)保護(hù)工作的不斷深入,以及非物質(zhì)文化遺產(chǎn)數(shù)字化、信息化的科技進(jìn)步,全國(guó)各地非物質(zhì)文化遺產(chǎn)數(shù)據(jù)庫(kù)建設(shè)步伐不斷加快,在分析藏毯的紋理特征、色彩分布和形狀特征的基礎(chǔ)上,即可以支持基于文字以及圖像屬性的查詢,又可以提取藏毯圖像的關(guān)鍵特征值來(lái)實(shí)現(xiàn)基于內(nèi)容的圖像檢索。本文在研究基于內(nèi)容的圖像檢索方法的基礎(chǔ)上,經(jīng)過(guò)改進(jìn),提出了一種針對(duì)藏毯圖像基于HSV顏色空間量化的圖像檢索實(shí)現(xiàn)方法,為藏毯這一非物質(zhì)文化遺產(chǎn)的保護(hù)和繼承提供了技術(shù)支撐平臺(tái)。
1 基于內(nèi)容的圖像檢索方法
傳統(tǒng)的基于文本的圖像檢索技術(shù),主要利用數(shù)據(jù)庫(kù)管理系統(tǒng)對(duì)圖像采用人工描述并進(jìn)行管理和檢索,通過(guò)圖像的描述文字和用戶輸入的關(guān)鍵字進(jìn)行比較,但由于人工標(biāo)注效率低和自身的主觀偏差性,比較的結(jié)果不僅效果差,而且不能對(duì)圖像中所包含的顏色、紋理等不能用文本信息標(biāo)注的特征進(jìn)行檢索?;趦?nèi)容的圖像檢索(Content-Based ImageRetrieval,CBIR)近年來(lái)已成為提高圖像檢索的有效手段。基于CBIR技術(shù)的圖像檢索系統(tǒng),采用相似性匹配算法計(jì)算關(guān)鍵圖像特征與特征庫(kù)中圖像特征的相似度,然后按照相似度從大到小的順序?qū)⑵ヅ鋱D像反饋給用戶。用戶可根據(jù)自己的滿意程度,選擇是否修改查詢條件,繼續(xù)查詢,以達(dá)到令人滿意的查詢。CBIR的實(shí)現(xiàn)依賴于兩個(gè)關(guān)鍵技術(shù):圖像特征提取和匹配,圖像特征提取分為低層視覺(jué)和語(yǔ)義內(nèi)容,比較成熟的檢索算法大部分是基于圖像的低層特征,即利用圖像的顏色、紋理、形狀、空間關(guān)系特征來(lái)檢索。在基于內(nèi)容的圖像檢索中,顏色作為圖像的重要視覺(jué)信息已成為圖像內(nèi)容組成的基本要素,顏色特征成為在基于內(nèi)容的圖像檢索中最早、最廣泛使用的視覺(jué)特征,目前常用的顏色特征包括顏色直方圖、顏色距、顏色聚合向量、顏色協(xié)方差矩陣等。紋理是物體表面的結(jié)構(gòu)模式,反映了圖像中同質(zhì)現(xiàn)象的視覺(jué)特征,它體現(xiàn)了物體表面的具有緩慢變化或者周期性變化的表面結(jié)構(gòu)組織排列屬性,其本質(zhì)是刻畫像素的鄰域灰度空間分布規(guī)律,典型的分析方法有:空間域紋理分析、頻率域紋理分析、空間/頻率域聯(lián)合紋理分析和基于分形模型的紋理分析方法。對(duì)于某些紋理和顏色信息不夠豐富的圖像來(lái)說(shuō),基于顏色和紋理的方法就無(wú)法滿足檢索需要,這是可借助于形狀特征來(lái)描述,形狀是最難描述的圖像特征,它不隨周圍環(huán)境,如顏色的變化而變化,是物體的穩(wěn)定特征。基于形狀特征的圖像檢索主要是檢測(cè)或分割出目標(biāo)輪廓,并針對(duì)其進(jìn)行形狀特征的提取或直接針對(duì)圖像尋找適當(dāng)?shù)氖噶刻卣?,目前基于形狀特征的圖像檢索主要有基于輪廓和基于區(qū)域的方法??臻g關(guān)系指圖像中分割出來(lái)的多個(gè)目標(biāo)之間相互的空間位置或相對(duì)方向關(guān)系,通常分為兩類:相對(duì)空間位置信息和絕對(duì)空間位置信息。提取圖像空間關(guān)系特征有兩種方法:一種方法是對(duì)圖像進(jìn)行自動(dòng)分割,根據(jù)劃分出的對(duì)象或顏色區(qū)域提取圖像特征,并建立索引;另一種方法是簡(jiǎn)單將圖像均勻地劃分為若干規(guī)則區(qū)域后分別提取特征,并建立索引。
2 顏色特征
顏色是彩色圖像最底層、最直觀的物理特征,是一種全局特征,它描述了圖像或圖像區(qū)域所對(duì)應(yīng)的景物的表面性質(zhì)。作為圖像最直觀而明顯的特征,顏色特征是基于像素點(diǎn)的特征,所有屬于圖像或圖像區(qū)域的像素都有各自的貢獻(xiàn)。相對(duì)于其它的圖像特征如紋理和形狀來(lái)講,顏色特征非常穩(wěn)定,不局限于圖像的大小和方向,并且對(duì)于旋轉(zhuǎn)、平移、尺度變化,甚至各種變形都不敏感,表現(xiàn)出相當(dāng)強(qiáng)的魯棒性,因此在基于內(nèi)容的圖像檢索中發(fā)揮著重要的作用,這也使得顏色特征成為圖像檢索中應(yīng)用最為廣泛的底層視覺(jué)特征。
2.1 顏色模型
顏色空間也稱彩色模型, 它的用途是在某些標(biāo)準(zhǔn)下用通??山邮艿姆绞綄?duì)彩色加以說(shuō)明。本質(zhì)上,彩色模型是坐標(biāo)系統(tǒng)和子空間的闡述。RGB色彩模式是工業(yè)界的一種顏色標(biāo)準(zhǔn),在RGB模型中,RGB即是代表紅、綠、藍(lán)三個(gè)通道的顏色,通過(guò)對(duì)紅(R)、綠(G)、藍(lán)(B)三個(gè)顏色通道的變化以及它們相互之間的疊加來(lái)構(gòu)成了所有顏色,是目前運(yùn)用最廣的顏色系統(tǒng)之一。將這三種顏色劃分成256(0-255)個(gè)等級(jí),這三原色光以不同的比例復(fù)合后,對(duì)人的眼睛可以形成與各種頻率的可見(jiàn)光等效的色覺(jué)。目前大部分的數(shù)字圖像都是用這種顏色空間表達(dá)的,然而,RGB空間結(jié)構(gòu)并不符合人們對(duì)顏色相似性的主觀判斷,故而采用符合人們對(duì)顏色主觀認(rèn)識(shí)的HSV模型。HSV(hue,saturation,value)模型對(duì)用戶來(lái)說(shuō)是一種直觀的顏色模型,直接對(duì)應(yīng)于人眼的視覺(jué)特征,H表示色度、S表示飽和度、V表示亮度。HSV模型對(duì)應(yīng)于一個(gè)圓錐形子集,包含RGB模型中的R、G、B三個(gè)面。色度H定義為繞圓錐中心軸的角度,取值范圍為0°~ 360°,從紅色開始按逆時(shí)針?lè)较蛴?jì)算,紅色為0°,綠色為120°,藍(lán)色為240°。飽和度S定義為橫截面圓心到橫截面圓周點(diǎn)的距離,取值范圍為0~1,S取值越大,表示色彩越純,取值越小,表示色彩越灰。亮度V定義為圓錐橫截面的圓心到圓錐頂點(diǎn)的距離,表示色彩的明亮程度,取值范圍為0~1。HSV對(duì)用戶來(lái)說(shuō)是一種直觀的顏色模型。我們可以從一種純色彩開始,即指定色彩角H,并讓V=S=l,然后我們可以通過(guò)向其中加入黑色和白色來(lái)得到我們需要的顏色。
2.2 顏色特征提取
常用的顏色特征提取方法都建立在顏色直方圖的基礎(chǔ)上,計(jì)算顏色直方圖需要將顏色空間劃分成若干個(gè)小的顏色區(qū)間,每個(gè)小區(qū)間成為直方圖的一個(gè)bin。然后統(tǒng)計(jì)圖像中各種顏色出現(xiàn)的頻數(shù),在統(tǒng)計(jì)的過(guò)程中不關(guān)心顏色所處的空間位置,每一種顏色出現(xiàn)的頻數(shù)對(duì)應(yīng)在相應(yīng)的bin中,最終得到顏色直方圖。在顏色直方圖坐標(biāo)中,橫坐標(biāo)表示顏色柄的劃分值,縱坐標(biāo)表示每個(gè)bin區(qū)間中包含的圖像像素總和。一般來(lái)說(shuō),bin的數(shù)目越多,直方圖對(duì)顏色的分辨能力就越強(qiáng),檢索效果也會(huì)越強(qiáng)。但有時(shí)bin數(shù)目越多的顏色空間劃分方法不一定能夠提高檢索效果,那是因?yàn)樵谟械膶?shí)際應(yīng)用中,表示主要顏色的bin能夠表達(dá)圖像中大部分像素的顏色,所以,過(guò)多的顏色空間對(duì)主體顏色的貢獻(xiàn)較少,反而加大了計(jì)算負(fù)擔(dān)。除此之外,bin的數(shù)目增加后的顏色直方圖即增加了計(jì)算負(fù)擔(dān),又不利于在大型圖像庫(kù)中建立索引,同時(shí)也帶來(lái)了數(shù)據(jù)庫(kù)中存儲(chǔ)空間的容量問(wèn)題。直方圖均衡主要用于處理圖像由于過(guò)度曝光或者曝光不足造成的前景背景過(guò)量或過(guò)暗的情況,可以增強(qiáng)圖像的對(duì)比度,擴(kuò)展圖像灰度范圍。本文結(jié)合藏毯圖像的顏色特點(diǎn),在劃分合適數(shù)量的顏色空間基礎(chǔ)上實(shí)現(xiàn)顏色特征的提取,最終提高圖像的檢索效果。
3 傳統(tǒng)的HSV顏色空間非均勻量化
HSV的顏色空間包含三個(gè)分量:H、S、V,對(duì)H、S、V三個(gè)分量進(jìn)行非均勻分割。將色調(diào)H分成8份,飽和度S的范圍由圓心向圓周過(guò)渡,將其分為三份,亮度V劃分為Black,Gray,White三份,各自量化區(qū)間為:
HSV顏色空間被劃分為72個(gè)不同的空間區(qū)域,再將三個(gè)簡(jiǎn)化后的顏色分量合成一維特征向量值,就將整個(gè)HSV顏色空間量化為72種顏色,減少了HSV顏色空間的有效顏色數(shù)量,簡(jiǎn)化了顏色特征提取的復(fù)雜度。通過(guò)量化公式I=9H+3S+V計(jì)算,最終得到72柄的一維顏色直方圖,I的取值范圍為[0,71]。
4 一種改進(jìn)的HSV顏色空間量化方法
4.1 HSV顏色空間188維量化
通常而言,在圖像的生成、傳輸、變換過(guò)程中,由于受到噪聲的干擾,會(huì)導(dǎo)致圖像輸出質(zhì)量失真,影響對(duì)于圖像的識(shí)別,因此在圖像識(shí)別之前要對(duì)其進(jìn)行預(yù)處理。藏毯圖案較鮮艷且復(fù)雜,考慮到藏毯圖像顏色特征在整個(gè)空間中的分布狀況,采用顏色量化中的聚類方法,用少量的代表色代表整個(gè)藏毯圖像。雖然采用比較大維的量化可以提高檢索效果,但考慮到計(jì)算量和存儲(chǔ)容量的限制問(wèn)題,所以使用量化降維方法。為了避免出現(xiàn)某些空間中像素?cái)?shù)量非常稀疏的情況,使量化更為有效,把HSV顏色空間量化成188維,根據(jù)圖像顏色在HSV空間188維中的相同或不同的分布特點(diǎn),均勻地選取若干個(gè)量化點(diǎn),然后將其他量化點(diǎn)按顏色相似距離最短的原則組合為一個(gè)聚類,從而達(dá)到既能聚類出代表圖像的顏色又能減少顏色數(shù)目的目的。具體處理方法為:
在實(shí)驗(yàn)中提取圖像中每一個(gè)像素點(diǎn)的RGB值并轉(zhuǎn)化為HSV顏色空間后,簡(jiǎn)單聚類如下:
H:H空間分為45類,取值為0~44,h均勻間隔為8,即h=(0,8,16,……,360),
S:S空間分為4類,S取值為0~3,S均勻間隔步距0.3(0.07,0.37, 0.67, 0.97),
V:V空間分為4類,V取值為0~3,V均勻間隔步距0.3(0,0.3,0.6,0.9),
然后按照以上的量化級(jí)構(gòu)造一維特征矢量,把3個(gè)顏色分量合成一維特征矢量:L=4H+3S+V,這樣,H、S、V3個(gè)分量在一維矢量上分布開來(lái).根據(jù)上述公式,計(jì)算L的取
值范圍為[0, 187],最終獲得188柄的一維直方圖。
4.2 在Java EE框架下利用OpenCV對(duì)藏毯圖像實(shí)現(xiàn)相似度的檢索
對(duì)188柄的一維直方圖的計(jì)算過(guò)程,通過(guò)Opencv的calcHist()方法計(jì)算出圖像的顏色直方圖。
h_bins=45,s_bins=4;
hist_size[]={h_bins,s_bins};
h_ranges[]={0, 180};
s_ranges[]={0, 255};
Ipllmage* src=cvLoadlmage ("image");
Ipllmage* hsv=cvCreateImage(cvGetSize(src),8,3); ;
Ipllmage* h_plane=cvCreateImage(cvGetSize(src),8,1);
Ipllmage* s_plane=cvCreateImage(cvGetSize(src),8,1);
Ipllmage* v_plane=cvCreateImage(cvGetSize(src),8,1);
pllmage* planes[]={h_plane, s_plane};
float* ranges[]={h_ranges, s_ranges};
float* ranges[]={h_ranges, s_ranges, v_ranges};
cvCvtColor(src, hsv, CV_BGR2HSV);
cvCvtPixToPlane(hsv, h_plane, s_plane, v_plane, 0);
CvHistogram * hist=cvCreateHist(2, hist_size, CV_HIST_ARRAY, ranges,2)
cvCalcHist(planes, hist,0,0);
cvGetMinMaxHistValue(hist,0,&max_value,0,0);
int height=120;
int width=(h_bins*s_bins*v_bins*5);
IplImage*hist_img=cvCreateImage(cvSize(width, height),8,3);
cvZero(hist_img);
在OpenCV庫(kù)中調(diào)用cvcompareHIst()方法計(jì)算顏色特征向量相似度,經(jīng)過(guò)試驗(yàn),發(fā)現(xiàn)用此方法使用直方圖模型比對(duì)兩張藏毯圖像圖片,比對(duì)的結(jié)果越接近于1,兩張圖片的相似性就越高。具體方法如下:
Double compareHist(const CvHistoram* histl, const CvHistoram* hist2, CV_COMP_CORREL Correlation)
4.3 實(shí)驗(yàn)結(jié)果
綜合以上查準(zhǔn)結(jié)果并結(jié)合時(shí)間消耗、存儲(chǔ)空間和計(jì)算量的大小,說(shuō)明采用188維量化方法的檢索查準(zhǔn)率較高,并且時(shí)間消耗也不大,故本文提出改進(jìn)的方法較為可行。
5 結(jié)語(yǔ)
通過(guò)對(duì)藏毯圖像的顏色特征分析,各種典型的基于顏色特征的提取技術(shù),分析了在藏毯圖像中運(yùn)用基于內(nèi)容的圖像檢索系統(tǒng)技術(shù)的可行性。針對(duì)傳統(tǒng)HSV顏色空間量化的缺陷,使量化更為有效,把HSV顏色空間量化成188維,實(shí)現(xiàn)了在基于JAVA的框架中計(jì)算顏色直方圖的方法,采用Correlation相似距離衡量直方圖的相似度,根據(jù)相似度大小匹配待查詢的圖像,最終返回與待查詢藏毯圖像相同或相似的圖像結(jié)果集,藏毯圖像檢索的查全率與查準(zhǔn)率明顯提高,為非物質(zhì)文化遺產(chǎn)的保護(hù)和繼承提供了技術(shù)支撐平臺(tái)。