周 敬,張建偉,張光龍,周 強
(成都大學(xué) 電子信息與電氣工程學(xué)院,四川 成都 610106)
傳統(tǒng)的茶葉生產(chǎn)過程中,等級劃分大都依賴于人工篩選,而茶葉的外觀感官是最常用的一種分級檢測方法[1-2].科技的發(fā)展促使一些新興的檢測方法出現(xiàn),主要包括電化學(xué)分析檢測方法及機器視覺分級方法.常見的電化學(xué)分析檢測方法有2-Norm方法[3]、采用香氣的化學(xué)物質(zhì)的敏感性傳感器的方法[4]及近紅外、傅立葉變換光譜和拉曼光譜法[5]等.但在茶葉分類中,電化學(xué)分析檢測方法無法對茶葉外觀進行區(qū)分,而外觀特征又是反映茶葉等級最重要的特征,因此機器視覺分級方法逐漸發(fā)展起來.在機器視覺分級方法中,顏色特征最為直觀且呈現(xiàn)形式比較穩(wěn)定[6].Bakhshipour等[7]基于圖像處理對5種綠茶和5種紅茶進行分類,總共從圖像中提取83種圖像信息,包括18種顏色、13種紋理和52種基于小波的特征,并將其引入決策樹分類器以區(qū)分不同的茶類別.Laddi等[8]根據(jù)茶葉顆粒的質(zhì)地特征,分析了10種分級茶葉樣品,并基于圖像處理獲得了“熵”“對比度”“均質(zhì)性”“相關(guān)性”和“能量”等5種質(zhì)地特征,對茶葉成分進行了分析,結(jié)果顯示分級茶葉樣品與質(zhì)地特征之間的相關(guān)性.本研究通過對以上現(xiàn)有檢測方法的分析發(fā)現(xiàn),針對多種茶葉的分類檢測方法較多,而針對一種茶葉生產(chǎn)中具體質(zhì)量分級的檢測方法很少.
為了進一步提高茶葉生產(chǎn)過程的自動化與智能化,本研究將基于茶葉的混合顏色特征的計算機視覺技術(shù)引入茶葉生產(chǎn)分級中,不僅提高生產(chǎn)效率和降低成本,也將極大推動茶葉生產(chǎn)的智能化發(fā)展.
在茶葉分級的計算機視覺系統(tǒng)設(shè)計中,圖像的采集是首先且最為重要的一步.茶葉成像效果的優(yōu)劣直接影響到后面的茶葉特征提取與檢測,因此,茶葉圖像采集設(shè)備的選型需要以所提取的特征為基礎(chǔ),盡可能突出采集圖像的顏色特征.為了更好地設(shè)計茶葉分級檢測平臺,首先對視覺系統(tǒng)中的相機、鏡頭及光源等關(guān)鍵模塊進行選型.為了保證茶葉圖像的分辨率和各種顏色分量的穩(wěn)定性,本研究選用以SONY IMX249彩色圖像傳感器為核心的工業(yè)相機.該傳感器色彩還原度較好,而且靈敏度高.為更好地配合IMX249傳感器,相機光學(xué)鏡頭選用500萬分辨率與16 mm焦距的低畸變工業(yè)鏡頭.而光源的選擇主要考慮形狀和光譜2個參數(shù).對于光源的形狀,環(huán)形光由于中心對稱且打光均勻,成為本研究的首選;對于光譜,考慮到茶葉各個顏色空間的比例,本研究采用均勻白色光源.基于機器視覺的茶葉分級檢測系統(tǒng)示意圖如圖1所示.
圖1 基于機器視覺的茶葉分級檢測系統(tǒng)示意圖
由于受到環(huán)境、光源及設(shè)備等各種外在因素的影響,直接采集的圖像會存在噪聲及背景等無用信息,不能直接用于特征提取與分類[9],因此,通過圖像處理算法對采集的圖像進行預(yù)處理操作.主要的預(yù)處理包括以下步驟:圖像平滑與濾波、邊緣檢測、圖像分割及圖像定位等.圖像預(yù)處理過程如圖2所示.
圖2 圖像預(yù)處理過程
為了提取到每片茶葉的顏色信息,需要分割出茶葉的位置和區(qū)域,則首先采用高斯濾波對茶葉圖像進行平滑濾波去噪.選擇高斯濾波器的主要原因是,由于成像系統(tǒng)存在隨機噪聲,而高斯濾波對于隨機噪聲具有較好的抑制效果.
接著,分別對濾波后的圖像進行邊緣檢測和圖像分割.邊緣檢測是采用canny算子提取樣本茶葉的邊緣信息.相比其他算子,canny算子的優(yōu)勢是邊緣定位更準確且能提取出更細的單像素邊緣,有利于鏈碼更精確地記錄所有茶葉邊界信息.
本研究采用大津法對茶葉圖像進行背景分割.由于邊緣信息包含的顏色信息較少,將通過閾值分割的區(qū)域去除邊緣檢測所得到的邊緣信息,則剩余區(qū)域會作為顏色特征提取的主區(qū)域,從而實現(xiàn)最終的茶葉圖像定位.
人工感官審評分級是傳統(tǒng)的分級方法,需要由通過評估資格測試并在標準評估室中評估茶樣品的專業(yè)人員進行.目前茶葉感官品質(zhì)評價的主要依據(jù)是國家標準GB/T 23776-2018[10].該標準把茶葉的感官評審分成2類因子:外部因子和內(nèi)部因子.外部因子指茶葉外觀方面的評價,內(nèi)部因子是茶葉成分含量等方面.本研究依據(jù)人工感知的視覺特征對茶葉數(shù)字化處理并量化分級指標.
茶葉的色澤是茶葉評述中非常重要的因素,與茶湯的顏色、香氣和味道等內(nèi)部因子密切相關(guān),是區(qū)分茶品質(zhì)等級的重要因素之一[11].由于通常使用RGB和HSI色彩空間模型[12]來描述物體的顏色信息,但是對于茶葉而言,單獨某種顏色空間不足以用來完成分類檢測,因此本研究提出了對于樣本混合顏色空間的特征提取.
RGB顏色模型主要包含紅色、綠色、藍色3種顏色分量[13],其數(shù)學(xué)模型如圖3所示.
圖3 RGB顏色模型
為了更好地將RGB顏色模型與茶葉顏色進行關(guān)聯(lián),需要了解茶葉基本工藝流程.茶葉基本工藝流程主要有攤放、殺青、揉捻及干燥等4個階段.優(yōu)質(zhì)的綠茶茶葉炒青后呈現(xiàn)翠綠的顏色,劣質(zhì)的綠茶茶葉炒青后顏色往往偏黑.優(yōu)劣茶葉樣本的顏色區(qū)別如圖4所示.
圖4 茶葉樣本顏色區(qū)別
對于彩色圖像的紅色、綠色與藍色顏色分量中,茶葉綠色分量是判斷茶葉優(yōu)劣的一個關(guān)鍵顏色分量.優(yōu)質(zhì)茶葉的綠色分量占比較高,反之,劣質(zhì)茶葉的綠色分量占比較低.通過對優(yōu)劣茶葉樣本進行鑒別實驗,采用茶葉綠色區(qū)域像素數(shù)量比茶葉像素總量方法,得出茶葉綠色區(qū)域像素數(shù)量占比,即:
K=n1/n2
(1)
式中,K為茶葉綠色分量像素數(shù)量占比;n1為茶葉綠色區(qū)域像素數(shù)量;n2為茶葉像素總量.
為了確認K值的選擇,本研究隨機挑選30片包含優(yōu)劣質(zhì)量的茶葉進行實驗,先提取茶葉樣本RGB圖像的綠色分量并統(tǒng)計該分量的像素數(shù)量,再統(tǒng)計每片茶葉樣本圖像綠色像素數(shù)量占比,最后通過最小錯誤率的貝葉斯決策分類法將茶葉分為優(yōu)質(zhì)茶葉與劣質(zhì)茶葉2類.貝葉斯決策理論是統(tǒng)計模式識別中的基本方法.貝葉斯決策判別,既考慮到各類參考總體出現(xiàn)的概率大小,又考慮到因誤判而造成的損失大小,判斷能力強,較適合茶葉顏色的判別分級.
優(yōu)劣茶葉樣本綠色像素數(shù)量占比如圖5所示.優(yōu)質(zhì)茶葉用藍色曲線表示,劣質(zhì)茶葉用紅色曲線表示.橫坐標為樣本數(shù)據(jù),縱坐標為綠色像素占比K.不難發(fā)現(xiàn):當K>0.338,茶葉樣本為優(yōu)質(zhì)茶葉;當K<0.338,茶葉樣本為劣質(zhì)茶葉,因此以0.338為閾值,直接將小于該值的茶葉分為第3等級劣質(zhì)茶葉并先被剔除.
圖5 優(yōu)劣茶葉樣本綠色像素數(shù)量占比
基于上述30片茶葉樣本的分類,本研究用100片某干茶茶葉進行茶葉色澤等級測試驗證.首先,根據(jù)人工分級對已知優(yōu)劣的茶葉樣本進行編號排序,再基于顏色模型提取每幅茶葉樣本圖像中綠色像素參數(shù),按照式(1)統(tǒng)計每片茶葉達標的綠色區(qū)域像素數(shù)量百分比K.100片茶葉樣本的K值統(tǒng)計結(jié)果如圖6所示.
圖6 100片茶葉樣本K值統(tǒng)計圖
本研究用100片茶葉進行茶葉色澤的分級,選取的K閾值為0.338.如表1所示,人工分級判別的劣質(zhì)茶葉數(shù)量為29片,而機器判別的劣質(zhì)茶葉數(shù)量為27片,其主要原因在于:機器判別中極個別樣本由于采集光源等問題受影響,未被判別為劣質(zhì)樣本,但整體上此分級結(jié)果是準確的.所以,當K的閾值取0.338時,可以將第3等級的劣質(zhì)茶葉去除,剩余的茶葉將進入下一級檢測流程并繼續(xù)分級為第1等級與第2等級.
表1 驗證茶葉樣本統(tǒng)計表
在已去除劣質(zhì)茶葉的情況下,再對優(yōu)質(zhì)茶葉進行精分,但僅用綠色分量是不能實現(xiàn)的,因此本研究引入色調(diào)、飽和度及強度的HSI顏色空間.HSI顏色模型與RGB顏色模型不同,色度、飽和度、強度分量更貼合人類視覺模型,其數(shù)學(xué)模型如圖7所示.
圖7 HSI顏色模型
由于普通采集的圖像都是RGB顏色模型,因此先需要轉(zhuǎn)化為HSI顏色模型,然后再進行顏色特征的提取.從 RGB顏色模型到HSI顏色模型的轉(zhuǎn)化式如下:
(2)
(3)
(4)
式中,H是反映色彩本質(zhì)特性的參數(shù),表示顏色的種類;飽和度S主要決定顏色的深淺程度,若顏色的飽和度越高,則表明該顏色純度越高;I分量與圖像彩色信息無關(guān);R、G、B分別為紅色、綠色、藍色分量.
本研究基于HSI顏色模型分別提取單片茶葉樣本的色度和飽和度分量均值作為顏色特征.具體計算式如下:
(5)
(6)
式中,n表示茶葉圖像的像素個數(shù);mH、mS分別表示色度、飽和度分量的均值.
單片茶葉在HSI顏色模型中的顏色特征值如表2所示.
表2 單片茶葉在HSI顏色模型的顏色特征
K均值聚類是一種非監(jiān)督實時聚類算法[14-15],是一種典型的基于距離的聚類算法,使用平方誤差的相似性準則和最小化準則將N個對象劃分為K個類別,從而使聚類域中的所有數(shù)據(jù)點均達到聚類.
以一定數(shù)量的茶葉為樣本數(shù)據(jù),利用K均值聚類法完成茶葉色澤聚類.K均值聚類法的具體過程為:構(gòu)造體現(xiàn)分類特點的關(guān)系數(shù)據(jù)矩陣,再利用該矩陣判斷待測樣本的類別,并根據(jù)待測樣本不同的類別歸屬給出相應(yīng)的色澤等級[16].從茶葉的不同等級中,選取部分數(shù)據(jù)樣本來構(gòu)造代表顏色的特征參數(shù),并計算待測樣本與各個類別的相似度,以此判別其等級.
本研究根據(jù)2.1節(jié)鑒別實驗所剩下的73片茶葉樣本,利用HSI顏色模型提取訓(xùn)練茶葉樣本色度和飽和度的均值特征向量,構(gòu)造體現(xiàn)分類特點的關(guān)系數(shù)據(jù)矩陣,經(jīng)過聚類分析并分級.
表3為K均值聚類結(jié)果分析表,其中,共計73片樣本,分3組進行聚類,分級準確率達到93.4%以上,共耗時5.52 s.
表3 K均值聚類結(jié)果分析表
茶葉分級實驗工作流程如下:1)圖像采集并預(yù)處理;2)基于RGB顏色模型判別茶葉色澤級別:若不符合茶葉本身色澤歸為第3等級,則分級結(jié)束;符合茶葉本身色澤則進入后續(xù)流程;3)基于HSI顏色模型提取單片茶葉色度與飽和度特征參數(shù),求出均值,構(gòu)建特征向量;4)根據(jù)K均值聚類計算待測茶葉色澤特征參數(shù)與特征向量近似匹配值,進行分類并分出茶葉等級.茶葉分級工作實驗平臺如圖8所示.
圖8 茶葉分級工作實驗平臺
茶葉預(yù)處理、檢測和分類過程分別如圖9~圖10所示.本研究選取了200片茶葉樣本圖像進行測試,設(shè)定茶葉等級分為3類,即第1等級、第2等級、第3等級.首先,利用RGB顏色模型綠色參數(shù)對茶葉樣本進行判別,得出80片劣質(zhì)茶葉樣本歸為第3等級,再利用HSI顏色模型構(gòu)建色澤特征向量,最后應(yīng)用K均值聚類算法對剩余120片樣本進行聚類精分.分級測試結(jié)果如表4所示,與人工分級結(jié)果對比,出現(xiàn)23片茶葉與分級結(jié)果不一致,主要是由于圖像采集光源及人工擺放不同位置導(dǎo)致的顏色差異等原因造成了不一致,其中,9片茶葉樣本被認定為第1等級茶葉,8片茶葉樣本被認定為第2等級茶葉,6片茶葉樣本被認定為第3等級茶葉,K均值聚類的平均正確率為85.8%,貝葉斯決策的正確率為92.5%.
圖9 茶葉預(yù)處理
圖10 茶葉檢測和分類
表4 茶葉分級測試結(jié)果
采用計算機視覺技術(shù)對茶葉品質(zhì)進行分級,避免了人工分級的主觀性,同時也是提升茶葉產(chǎn)業(yè)經(jīng)營的重要要求.本研究利用混合顏色模型空間提取顏色特征,采用貝葉斯決策與K均值聚類的方法,直接從茶葉色澤上判別出茶葉的優(yōu)劣等級,解決了流水線中參有黑茶及黃葉等劣質(zhì)茶葉的情形.從鑒別實驗結(jié)果可知,茶葉在線分級準確率最高達到92.5%,避免了人工選擇存在的主觀偶然性.本研究提出的分級方法分級速度快,不需要大量樣本訓(xùn)練,極大提高了工作效率,滿足了茶葉實時分級需求.后期的研究將主要對大量的茶葉樣本做實際測試和算法參數(shù)優(yōu)化,以確保整體視覺系統(tǒng)的穩(wěn)定性和可靠性.