吳發(fā)輝
(武夷學(xué)院 福建武夷山 354300)
茶湯是有顏色的,在分類過程中須對顏色進(jìn)行處理,實際應(yīng)用中,常見的顏色處理模型有RGB 模型、CMY 模型、HSV 模型、Lab 模型以及 HIS 模型等[1],其中 HIS 模型是從人的視覺系統(tǒng)出發(fā),符合人眼特性比較適合用于茶湯的計算機識別。
(一)HIS 彩色模型。每一種顏色都是由色調(diào)(Hue)、飽和度(Saturation 或Chroma)和亮度(Intensity 或Brightness)三要素來表示,HIS 模型就是從人的視覺系統(tǒng)出發(fā),直接使用顏色三要素來描述顏色。其中色調(diào)是決定顏色的本質(zhì),是彩色中最重要的屬性,物體反射光線中占優(yōu)勢的波長的差別來決定了色調(diào)的不同,不同的波長產(chǎn)生不同的顏色感覺,便有了紅、黃、藍(lán)等各類色彩的相貌稱謂。飽和度是指顏色的深淺和濃淡程度,飽和度越高,顏色越深。飽和度的深淺和白色的比例有關(guān),白色所占比例越高,飽和度越低。亮度是眼睛對光源和物體表面的明暗程度的感覺,主要是由光線強弱決定的一種視覺經(jīng)驗,光線越強,亮度越大。
HIS 彩色空間可以用一個圓錐空間模型來描述,如圖1所示。人們通常把色調(diào)和飽和度統(tǒng)稱為色度,用來表示顏色的類別和深淺程度。在圖中圓錐中間的橫截面圓就是色度圓,而圓錐向上或向下延伸的便是亮度分量的表示。
圖1 HIS模型示意圖
從圖1可得:(1)I(亮度)的分量與圖像的顏色信息無關(guān);(2)H(色調(diào))和S(飽和度)分量與人眼獲得顏色的方式密切相關(guān)。這是由于人的視覺對顏色濃淡的敏感程度遠(yuǎn)遠(yuǎn)弱于對亮度的敏感程度,為了便于顏色處理和識別,人的視覺神經(jīng)系統(tǒng)常采用HIS 彩色空間,它相比于RGB(Red,Green,Blue)或其它色彩空間更符合人的視覺特性,描述也很接近人眼感知色彩的方式。在圖像處理和計算機視覺中大量算法都可在HSI色彩空間中方便地使用,選擇HIS色彩空間作為彩色圖像處理的模型進(jìn)行圖像分析和處理,以達(dá)到不同色彩的物體進(jìn)行分類,可大大簡化其工作量。
由于通過相機采集到的茶葉茶湯圖片是RGB 格式的,為了使圖像色彩更能符合人眼的視覺要求,本研究在圖像處理時將RGB模型轉(zhuǎn)換為HIS模型,以便更準(zhǔn)確的實現(xiàn)茶葉的分類。此外,由于HIS 空間中亮度和灰色度具有可分離特性,使得圖像處理和機器視覺中大量灰度處理算法都可以在HIS彩色空間中方便地使用。
HIS 彩色模型和RGB 彩色模型只是同一物理量的不同表示法,它們之間存在著轉(zhuǎn)換關(guān)系。給定一幅RGB 格式的圖像,每一個RGB像素和H分量可以用下面的公式得到[2]:
此處
飽和度分量由下式給出:
最后,強度分量為:
假定RGB 值歸一化為[0,1]范圍內(nèi),色調(diào)可以用第一個式子得到的值除以360度歸一化為[0,1]范圍內(nèi),而其它兩個HIS分量已經(jīng)在[0,1]范圍之內(nèi)[3]。
(二)茶湯圖像預(yù)處理。利用計算機圖像處理技術(shù)實現(xiàn)茶葉分類分為三個階段:首先對原始圖像進(jìn)行圖像預(yù)處理,選擇圖像的關(guān)鍵部分;接著是圖像特征提取階段,計算機對提取的圖像進(jìn)行關(guān)鍵的加工處理,從圖像中提取物體的客觀特征的顏色信息;最后是識別階段。
茶葉茶湯圖像預(yù)處理主要有以下幾種方法:
1.圖像增強。在實際應(yīng)用中,由于圖像在電路傳輸時所產(chǎn)生噪聲影響,或圖像光線不足導(dǎo)致的圖像灰度過于集中等問題,使得圖像質(zhì)量下降,因此獲取的原始圖片圖像清晰度并不很高,常是模糊的或根本難以看清。為了改善圖像質(zhì)量,在圖像分析前對圖像進(jìn)行預(yù)處理是不可缺少的。目前在圖像預(yù)處理所用的改善圖像質(zhì)量的方法常用的有圖像增強和圖像復(fù)原兩種。因為本研究對茶湯圖像處理的目的是進(jìn)行分類,所謂的分類是指按照種類、等級或性質(zhì)分別歸類,圖像中最能體現(xiàn)某種物體所具有的且與其它種物體不同的屬性才能做為分類的依據(jù),而圖像增強可以對圖像感興趣的特征進(jìn)行有選擇的突出,衰減不需要的特征,從而減少圖像的復(fù)雜度,提高圖像的可懂性,所以運用圖像增強對茶葉茶湯進(jìn)行圖像預(yù)處理是最佳選擇。
2.圖像平滑。在圖像預(yù)處理時圖像平滑是一種可以減少和抑制圖像噪聲影響的數(shù)字圖像處理技術(shù)[4],是用于突出圖像的寬大區(qū)域、低頻成分、主干部分或抑制圖像噪聲和干擾高頻成分的圖像處理方法,目的是使圖像亮度平緩漸變,減小突變梯度,改善圖像質(zhì)量。圖像平滑的方法包括插值方法,線性平滑方法,卷積法等多種方法,而中值濾波是一種常用的非線性平滑技術(shù),在圖像處理中,是經(jīng)典的平滑噪聲的方法,它是把鄰域圖像的像素按灰度進(jìn)行排序,然后選取該組中間值作為輸出像素值,中值濾波器對與周圍像素灰度值差別較大的像素不那么敏感,在降噪的同時引起的模糊效應(yīng)較低。因此運用中值濾波這種非線性的信號處理方法進(jìn)行圖像預(yù)處理,它在一定條件下可以克服如最小均方濾波、均值濾波帶來的圖像細(xì)節(jié)模糊,而且可以有效的濾除脈沖干擾和圖像噪聲。它不同于卷積的鄰域運算,中值濾波將一個包含奇數(shù)個像素的滑動窗口G在圖像上移動,將領(lǐng)域中的像素按灰度級排序,取其中間值作為輸出像素。
中值濾波的數(shù)學(xué)描述:
若S為像素(x0,y0)的鄰域集合(包含(x0,y0)),(x,y)表示S中的元素,f(x,y)表示(x,y)點的灰度值,|S|表示集合S中元素的個數(shù),Sort表示排序,則對(x0,y0)平滑可以表示為
窗口G可以是方形(m×n),長方形(m×n)或者是十字形等,中值濾波可以表示為:
對于方形與長方形窗口,上式可以表示為:
3.圖像直方圖均衡化。茶葉茶湯的圖像在采集的時候容易受到諸多環(huán)境因素的影響,如光線、拍攝角度等,采集到的茶葉圖像的品質(zhì)會有所下降,這樣不利于后續(xù)的圖像處理,因此需要利用計算機,借助一些特殊的圖像處理方法來降低這些不良因素的影響,改善圖像的質(zhì)量,提高圖像的使用價值。為了改善圖像的質(zhì)量,需要使用直方圖修正方法實現(xiàn)圖像增強。針對不同的原始圖像有各自特點的直方圖,通過分析一幅圖像的直方圖的形狀,能判斷圖像的黑白對比度以及圖像的清晰度。如果一幅圖像的直方圖的效果不能滿足需求,就使用直方圖均衡化處理對圖像做適當(dāng)?shù)男薷模瑢⒃紙D像的不均衡的直方圖變成一幅具有均勻分布的新圖像[5],直方圖均衡化拓展了像素元素的動態(tài)范圍,從而達(dá)到了使圖像清晰的效果。
直方圖均衡化的數(shù)學(xué)描述為:
數(shù)字圖像中灰度級為γk的像素出現(xiàn)的概率為:
式中N是一幅圖像的總像素數(shù),nk為第k級灰度的像素數(shù),γk表示第k個灰度級,P(γk)表示該灰度級出現(xiàn)的概率。對該數(shù)字圖像進(jìn)行直方圖均衡化時對應(yīng)的離散形式為:
茶葉特征選擇是茶葉分類的重要前提,要是茶葉特征選擇不對,那么對茶葉分類的準(zhǔn)確性將產(chǎn)生偏差。
在HIS模型中主要特征參數(shù)有3個,分別是茶葉茶湯圖像的所有像素點的H、I、S的值,同時分析數(shù)據(jù),計算3個分量的平均值和標(biāo)準(zhǔn)差。
通過提取茶湯顏色特征,計算這些數(shù)據(jù),比較不同茶湯的顏色特征,實現(xiàn)茶葉的分類。
(一)圖像截取功能。為了排除圖像中無關(guān)部分的影響,將樣本圖像截取有用的部分,使接下來的圖像預(yù)處理不受背景的無關(guān)因素的干擾。圖像截取如圖2所示。
圖2 圖像截取
(二)圖像預(yù)處理模塊。圖像預(yù)處理主是對茶湯圖像先進(jìn)行去噪平滑,排除一些不良因素對圖像質(zhì)量的影響,再進(jìn)行中值濾波,中值濾波的目的是為了減少圖像的噪聲,最后還要將圖像從RGB 彩色模型轉(zhuǎn)換為更符合人眼感官的HIS模型。圖像預(yù)處理結(jié)果如下:
圖3 圖像預(yù)處理
圖像預(yù)處理模塊代碼如下:
%執(zhí)行RGB轉(zhuǎn)換HIS
num=0.5*((r-g)+(r-b));den=sqrt((r-g).^2+(r-b).^(g-b));
theta=acos(num./(den+eps));%·防止除數(shù)為0
H=theta;H(b>g)=2*pi-H(b>g);
H=H/(2*pi); num=min(min(r,g),b);
den=r+g+b;den(den==0)=eps;%·防止除數(shù)為0
S=1-3.*num./den;H(S==0)=0;
I=(r+g+b)/3; HIS=cat(3,H,I,S);
(三)圖像特征數(shù)據(jù)提取功能。圖像特征數(shù)據(jù)提取功能是將轉(zhuǎn)換為HIS模型的圖像的H分量和S分量的均值和方差計算出來,是后續(xù)實現(xiàn)茶葉茶湯的分類重要顏色特征數(shù)據(jù)。圖像特征數(shù)據(jù)提取模塊的截圖如圖4所示。
圖4 圖像數(shù)據(jù)特征提取
通過MATLAB自帶的mean2()函數(shù)和std2()函數(shù)[7]分別計算轉(zhuǎn)換成HIS模式的茶湯圖像的H分量和S分量的均值和方差,用于茶葉的分類。模塊代碼如下所示:
global HIS;
mH=mean2(HIS(:,:,1));%求 H 分量的均值
stdH=std2(HIS(:,:,1));%求 H 分量的方差
mS=mean2(HIS(:,:,2));%求S分量的均值
stdS=std2(HIS(:,:,2));%求 S分量的方差
根據(jù)圖像特征數(shù)據(jù)提取的顏色特征,通過對比兩幅圖像的顏色特征,可用于對圖像中的茶湯分類。本實驗是通過提取H分量和S分量的顏色特征,即求得H分量和S分量的均值和標(biāo)準(zhǔn)差的方法。