趙天豪
摘要:在綠松石和翡翠的分級中,顏色分級是非常重要的一個(gè)考慮因素。目前,對于綠松石和翡翠的顏色分級主要采取人工方法,十分費(fèi)力且容易受主觀因素影響。筆者嘗試使用聚類的方法對綠松石和翡翠進(jìn)行自動(dòng)顏色分級,從而實(shí)現(xiàn)以一種客觀的量化標(biāo)準(zhǔn)對二者顏色分級,同時(shí)減少人工時(shí)間消耗。實(shí)驗(yàn)結(jié)果表明,使用基于聚類的綠松石和翡翠自動(dòng)顏色分類的方法可以在一定程度上實(shí)現(xiàn)對二者顏色的自動(dòng)分類,但是不能完全取代人工分類,本方法可以作為一種前置的自動(dòng)分類方法,為后續(xù)的人工分級提供一定的依據(jù)。
關(guān)鍵詞:綠松石;翡翠;聚類;圖像處理;主顏色
DOI:10.12433/zgkjtz.20232438
隨著人工智能領(lǐng)域的發(fā)展,使用聚類算法對圖像進(jìn)行處理是聚類算法的一大應(yīng)用方向。
基于綠松石和翡翠的顏色分級時(shí)存在的受主觀因素影響、大批量樣品分類費(fèi)時(shí)費(fèi)力等問題,根據(jù)現(xiàn)有的顏色分級標(biāo)準(zhǔn)通過計(jì)算機(jī)實(shí)現(xiàn)對于二者顏色的自動(dòng)分類,使用客觀的量化指標(biāo)消除分類時(shí)的主觀因素的影響以及對于分類環(huán)境的要求,也可以節(jié)約大量的綠松石或翡翠進(jìn)行顏色分類的時(shí)間。
一、圖像收集與預(yù)處理
(一)圖像收集
本次實(shí)驗(yàn)所收集綠松石圖像共計(jì)209張,顏色包括綠色、綠藍(lán)色、藍(lán)綠色、藍(lán)色、黃色、橙色;翡翠圖像共計(jì)133張,顏色包括綠色、紫色及紅黃色翡翠。
(二)圖像分割
在處理圖像前,為了消除圖像背景對于結(jié)果的影響,使用Grabcut的圖像分割程序?qū)G松石和翡翠圖像進(jìn)行圖像分割。
二、綠松石與翡翠顏色聚類分析
(一)量化標(biāo)準(zhǔn)的選取
在對綠松石和翡翠圖像使用聚類方法進(jìn)行顏色自動(dòng)分類之前,首先要有自動(dòng)顏色分類的量化依據(jù)。在《綠松石 分級》(GB/T? 36169—2018)中給出了綠松石的色相、飽和度和明度不同分類的HSV值的參考值,而在《翡翠 分級》(GB 23885—2019)中在對翡翠分級時(shí),色相給出的供參考的量化指標(biāo)是光譜色主波長參考值,彩度給出的供參考的量化指標(biāo)是由CIE XYZ顏色空間得到的色純度值,明度給出的供參考的量化指標(biāo)是色卡灰度標(biāo)尺參考值。考慮到翡翠分類國標(biāo)中使用的量化指標(biāo)不容易計(jì)算,筆者采用綠松石分級國家標(biāo)準(zhǔn)中使用的HSV值作為二者顏色分類的量化指標(biāo)。
對于綠松石,直接使用綠松石國家標(biāo)準(zhǔn)的不同HSV值對應(yīng)的分級類別進(jìn)行分類。對于明度和飽和度參考值,筆者對原標(biāo)準(zhǔn)中的百分比進(jìn)行相應(yīng)的轉(zhuǎn)換。對于兩個(gè)類別的邊緣值均認(rèn)為屬于上一類別。
對于翡翠,翡翠分類在國家標(biāo)準(zhǔn)中未給出色相、飽和度和明度不同級別對應(yīng)的參考值。筆者依據(jù)綠松石國家標(biāo)準(zhǔn)中對于飽和度和明度不同級別的參考值對翡翠的飽和度和明度進(jìn)行分類。翡翠色相類別不同且存在不能用色相分類的無色翡翠,因此,筆者暫時(shí)不對無色翡翠分類,對色相的翡翠依照opencv中的不同顏色對應(yīng)H值劃分色相類別與色相參考值,見表1。
(二)基于聚類的綠松石和翡翠顏色自動(dòng)分類算法
筆者共設(shè)計(jì)了兩個(gè)基于聚類算法的算法來實(shí)現(xiàn)綠松石和翡翠的自動(dòng)顏色分類。兩個(gè)算法的基本步驟如下:
1.算法一
(1) 提取一張圖像所有像素點(diǎn)的HSV值。
(2) 為了去除雜色影響根據(jù)H值,對像素點(diǎn)進(jìn)行篩選,對篩選后的像素點(diǎn)的HSV值進(jìn)行聚類。
(3) 定義含有像素點(diǎn)最多的簇為主顏色簇,提取主顏色簇的簇中心點(diǎn)作為該張圖像的顏色特征值,對所有經(jīng)過圖像進(jìn)行如上操作提取出各種的顏色特征值。
(4) 對所有圖像的顏色特征值再進(jìn)行聚類,提取這一次聚類的每個(gè)簇的簇中心點(diǎn)對應(yīng)的HSV值。
(5) 根據(jù)HSV值所對應(yīng)的顏色分類結(jié)果認(rèn)為屬于該簇內(nèi)的所有特征值對應(yīng)的圖像均屬于該顏色分類結(jié)果。
算法一流程示意見圖1。
2.算法二
(1) 用戶輸入一張圖像或者一個(gè)包含圖像的文件夾,提取讀取到的圖像的像素的HSV值。
(2) 在提取之前先對像素進(jìn)行篩選,篩選出H值不符合的像素,排除背景顏色或無關(guān)顏色對后續(xù)處理的影響。
(3) 之后對篩選出的像素的HSV值進(jìn)行聚類,選取出包含像素點(diǎn)最多的簇,若該簇包含的像素點(diǎn)數(shù)量小于篩選后總像素點(diǎn)數(shù)量的40%就認(rèn)為該綠松石或翡翠為雜色綠松石或翡翠,若該簇包含的像素點(diǎn)數(shù)量大于篩選后總像素點(diǎn)數(shù)量的40%則進(jìn)行后續(xù)處理。
(4) 提取主顏色簇簇中心點(diǎn)的HSV值及主顏色簇中隨機(jī)99個(gè)像素點(diǎn)的HSV值。
(5) 根據(jù)《綠松石 分級》(GB/T? 36169—2018)對像素點(diǎn)的H、S和V值進(jìn)行分成不同的類別(翡翠H值的分類依據(jù)不同顏色對于的H值范圍),然后將前面選取的100個(gè)點(diǎn)的HSV值進(jìn)行分類。
(6) 統(tǒng)計(jì)每類中分到的像素點(diǎn)的數(shù)量,認(rèn)為該綠松石/翡翠的顏色分類即為包含像素點(diǎn)最多的類別對于的顏色分類。
算法二流程見圖2。
(三) 基于算法一的綠松石和翡翠顏色自動(dòng)分類
1.基于算法一的綠松石和翡翠顏色自動(dòng)分類結(jié)果展示
對所有綠松石圖像的特征值進(jìn)行聚類,選用K-means++算法且聚類數(shù)為8時(shí)每個(gè)族中心點(diǎn)的HSV值(表示為H,S,V三元組的形式)及HSV值對應(yīng)的分類見表2。
從表2中可以看出,當(dāng)聚類數(shù)選為8時(shí),實(shí)際只將綠松石分為了(綠,濃,明)(黃,艷,暗)(綠,濃,亮)(黃,艷,明)(黃,中,明)和(綠,艷,明)共計(jì)6類。色相只分出了兩個(gè)類別。出現(xiàn)了分類明顯錯(cuò)誤的情況,綠松石被分到(黃,艷,暗)這一類中。聚類的DB指數(shù)為0.98,CH指數(shù)為133。
對所有翡翠圖像的特征值進(jìn)行聚類,選用K-means++算法且聚類數(shù)為8時(shí)每個(gè)族中心點(diǎn)的HSV值(表示為H,S,V三元組的形式)及HSV值對應(yīng)的分類,見表3。
從表3中可以看出這次將翡翠分為8類。色相分出了綠、紫、紅三個(gè)類別,飽和度分出了全部三個(gè)級別,而明度分出了明和暗兩個(gè)級別。聚類的DB指數(shù)為1.03,CH指數(shù)為85。
2.算法一結(jié)果分析
使用算法一對綠松石和翡翠進(jìn)行顏色自動(dòng)分類,結(jié)果表明,該算法對于翡翠的分類效果較好,能夠分出更多級別的翡翠,這可能是因?yàn)榫G松石的色相類別較接近,將翡翠分為4類。而翡翠的色相類別范圍較大,因此,相對效果較好。另外,使用DB指數(shù)和CH指數(shù)對二者的聚類結(jié)果進(jìn)行評價(jià),雖然對綠松石進(jìn)行聚類的DB指數(shù)和CH指數(shù)都優(yōu)于對翡翠進(jìn)行聚類的情況。實(shí)際是翡翠的分類效果更好,這也說明在評價(jià)聚類效果時(shí),不能僅從聚類的評價(jià)指標(biāo)對聚類效果進(jìn)行評價(jià)。
(四)基于算法二的綠松石和翡翠顏色自動(dòng)分類
對所有處理后的綠松石和翡翠圖像使用算法二進(jìn)行顏色自動(dòng)分類。算法二的分類效果較好,可以將不同色相、明度及飽和度的綠松石和翡翠圖像進(jìn)行分類。
但是,對于兩類綠松石分類效果較差:一類是綠松石鐵線的存在導(dǎo)致其將該綠松石分為雜色;另一類是雜色綠松石可能會(huì)被分為純色綠松石。原因在于算法中進(jìn)行雜色的判斷時(shí)閾值設(shè)置過低,因此,需要調(diào)高算法中對雜色的判斷時(shí)的閾值,對被分為純色的雜色綠松石進(jìn)行再次分類。
結(jié)果表明,當(dāng)閾值達(dá)到80時(shí),所有雜色綠松石識別為雜色。說明在對綠松石自動(dòng)顏色分類時(shí),對于綠松石是否為雜色需要較高的閾值才能判斷準(zhǔn)確,但是此時(shí)可能將純色綠松石識別為雜色。因此,對于雜色綠松石的判斷可以先設(shè)置一定的閾值梯度逐步篩選出純色綠松石后剩下的即為雜色綠松石。
而算法二對于翡翠圖像的分類效果好于綠松石圖像的分類效果。
三、結(jié)論
綜合根據(jù)上述兩種基于聚類算法的綠松石和翡翠顏色自動(dòng)分類算法的實(shí)現(xiàn)思想、實(shí)現(xiàn)步驟和顏色分類結(jié)果,可以得出以下結(jié)論:
(1) 算法一思想及實(shí)現(xiàn)較為簡單,但是對綠松石和翡翠的顏色自動(dòng)分類效果較差。不過,因?yàn)槭褂盟惴ㄒ粚?shí)際上不用預(yù)先得知最后聚類中的每個(gè)簇中心點(diǎn)HSV值對應(yīng)的顏色分類級別,僅僅是根據(jù)寶石圖像的HSV值的相似性將它們分類,所以當(dāng)對一種沒有根據(jù)HSV值顏色空間分類的寶石進(jìn)行分類時(shí),可以使用該算法粗略分類。
(2) 算法二實(shí)現(xiàn)相對復(fù)雜,但是對綠松石和翡翠的顏色自動(dòng)分類效果較好,雖然仍存在一定程度的誤差,但是可以作為人工分類前的前置分類使用。
參考文獻(xiàn):
[1]中華人民共和國自然資源部.綠松石? 分級:GB/T 36169—2018[S]. 北京: 中國標(biāo)準(zhǔn)出版社, 2018.
[2]中華人民共和國國土資源部.翡翠? 分級:GB/T 23885—2009[S]. 北京: 中國標(biāo)準(zhǔn)出版社, 2009.