周 兵,譚卓昆,段紅星,劉 亮,張 競,吳文斗
(1.云南農(nóng)業(yè)大學理學院,云南 昆明 650201;2.云南大學 信息學院,云南 昆明 650500;3.云南農(nóng)業(yè)大學茶學院,云南 昆明 650201;4.云南農(nóng)業(yè)大學大數(shù)據(jù)學院,云南 昆明 650201)
中國有源遠流長的茶文化,茶禮茶俗等。隨著中國經(jīng)濟的發(fā)展,茶的需求量逐步增加,各類茶企發(fā)展迅速,茶產(chǎn)品層出不窮,為了有利于品牌的宣傳,對茶葉品質(zhì)進行評價成為必不可少的一環(huán)。傳統(tǒng)評價方式易受評審人員與評審環(huán)境等諸多因素影響,如何使評價過程更為簡便科學,是目前在茶葉評定領(lǐng)域較為迫切的任務之一,而色澤作為茶葉品質(zhì)評審的主要內(nèi)容,對其進行標準且科學的評價便極其重要。
目前對茶葉色澤的評價主要看茶葉外表色澤、茶湯色澤和葉底色澤,以此來了解茶葉品質(zhì)的高低及制作工藝。但在實際評審過程中,往往因為不同人員對色澤的感官強弱不同,使得評價結(jié)果存在一定的主觀誤差。國外對茶葉品質(zhì)因子和茶葉質(zhì)量評定的研究應用越來越多,P Mishra等人在2019年使用近紅外高光譜測量綠茶數(shù)據(jù),構(gòu)建綠茶分類模型,實現(xiàn)了16種綠茶產(chǎn)品的分類。國內(nèi)大部分仍是采用人工感官審評的方法進行,但也不乏創(chuàng)新性的茶葉品質(zhì)評價的研究。2016年,潘玉成等利用人工神經(jīng)網(wǎng)絡對綠茶色澤進行茶葉品質(zhì)的評定,對標準樣和預測樣本獲得了較令人滿意的評判結(jié)果。2019年,帥曉華等人采用計算機視覺技術(shù),對拍攝的茶葉和茶水圖片進行識別分類,識別的準確率總體達到90%。兩者的研究中選取的樣本數(shù)較少,條件控制不足,即便是同一種茶類,由于品控因素,如干茶制作時溫度、干濕度不同,都會對茶類的分級造成極大的影響。
為解決誤差問題,本文設(shè)計的實驗嚴格控制紅茶干茶光照時長,茶湯沖泡的時間、溫度、水質(zhì),以及葉底測量方式,最大限度排除環(huán)境因素帶來的干擾誤差。利用具有精確色彩識別能力的色差儀測定不同色澤類型的 L(亮度值)、a(紅綠色值)、b(黃藍色值)范圍,基于GA-BP算法將測量的數(shù)值與人工感官評價的結(jié)果建立數(shù)學模型,找到紅茶不同類型的干茶、茶湯、葉底色差值與人工感官評價的相關(guān)性,構(gòu)建茶葉色度值參數(shù)與茶葉色澤類型數(shù)據(jù)評審模型,較好的實現(xiàn)了茶葉的分類識別,為茶葉色澤類型的數(shù)字化評定提供了科學依據(jù)。
1.1.1 干茶數(shù)據(jù)。紅茶干茶通過將嫩葉,經(jīng)發(fā)酵等工藝制作而成。本研究選取了市場上常見種類的紅茶,如:古樹紅茶、名優(yōu)紅茶等茶種。為了使數(shù)據(jù)豐富,具備科學性、普適性,又從已選取的紅茶種類中挑選了不同價位、不同品質(zhì)及規(guī)格的紅茶干茶。實驗用的干茶樣本如圖1所示:
圖1 部分干茶樣本及相應色澤人工評審結(jié)論
通過篩選、評估,共選取63份紅茶干茶,用色差儀測得380組數(shù)據(jù),可分為烏黑、烏黑帶毫、烏黑有毫、烏黑多金毫、烏褐顯金毫、金黃共計六個干茶評定色類。
1.1.2 茶湯數(shù)據(jù)。用熱水沖泡前述干茶樣本即得茶湯數(shù)據(jù)。對湯色進行L、a、b值測量時,發(fā)現(xiàn)同一種茶類在不同溫度、不同水質(zhì)下測量的色差值不同;不同的溫度、不同水質(zhì)下的不同茶類測量的數(shù)據(jù)范圍會相互重疊。所以我們選用同一種類的礦泉水,茶葉稱量5克左右,將水加熱至93℃時開始沖泡。用測溫槍檢測茶湯的溫度,當茶湯降溫至30℃左右時,對不同茶類的茶湯,在封閉式的色差儀中進行L、a、b值的測量。研究所用的紅茶茶湯如圖2所示。
圖2 部分茶湯樣本及相應色澤人工評審結(jié)論
本研究選取了60份紅茶干茶進行沖泡,用色差儀測得400組數(shù)據(jù),可分為杏黃、橙黃、橙紅、紅亮、紅濃、紅艷、紅暗共計七種茶湯評定色類。
1.1.3 葉底數(shù)據(jù)。葉底也叫茶渣,即干茶經(jīng)開水沖泡后所展開的葉片。紅茶葉底越有光澤,品質(zhì)越好。判斷方法是首先將泡過的茶葉倒入潔凈的器皿中,再將茶葉拌勻鋪開進行觀察后給出結(jié)論。由于發(fā)酵程度不一致,相同種類紅茶的葉底色澤也是不同的,為了盡量減少這個問題帶來的誤差干擾,評審人員以大面積的茶葉色澤分布作為葉底顏色分類的依據(jù)。
圖3 部分葉底樣本及相應色澤人工評審結(jié)論
在色差儀測量葉底前,首先用機器將葉底打碎,收入相應容器中,再對其進行L、a、b值的測量,使數(shù)據(jù)更加穩(wěn)定、可靠。本研究選取了63份紅茶葉底,用色差儀測得380組數(shù)據(jù),可分為泛青、泛青稍帶紅、棕紅較勻稍青、棕紅、紅共計五大葉底評定色類。
本次研究的測量儀器采用封閉式的色差儀(深圳市三恩時科技有限公司的 YS6060 色差儀),實物圖如圖4所示,該儀器能夠減少在不同環(huán)境條件下,給數(shù)據(jù)測量帶來的誤差干擾,同時本研究的色差值數(shù)據(jù)是由專業(yè)人員進行專業(yè)測量、評估,測量的 L、a、b值更加準確。
圖4 色差儀實物圖
1.3.1 GA-BP網(wǎng)絡搭建。GA-BP算法就是使用遺傳算法(GA)將BP神經(jīng)網(wǎng)絡的權(quán)值和閾值作為初始種群,不斷的迭代進化,尋找出全局最佳的權(quán)值和閾值,實現(xiàn)對BP神經(jīng)網(wǎng)絡的優(yōu)化。GA-BP算法流程如圖5所示:
圖5 GA-BP算法流程圖
1.3.2 網(wǎng)絡參數(shù)設(shè)置及測試。BP神經(jīng)網(wǎng)絡模型隱含層包含的神經(jīng)元節(jié)點個數(shù)能反映出整個網(wǎng)絡的非線性水平,進行參數(shù)設(shè)置時,找到該網(wǎng)絡最佳隱含層節(jié)點數(shù)是十分困難的。若隱含層節(jié)點個數(shù)過多,不僅會增加神經(jīng)網(wǎng)絡的學習時間,而且還會出現(xiàn)“過擬合”現(xiàn)象;若隱含層節(jié)點個數(shù)過少,網(wǎng)絡甚至無法訓練或使用。我們通過對樣本數(shù)據(jù)準確率結(jié)果分析,判斷各節(jié)點數(shù)對網(wǎng)絡模型的影響,確定相關(guān)模型的最優(yōu)隱含層節(jié)點數(shù)。隱含層節(jié)點常用計算公式如下所示:
式中 H——隱含層節(jié)點數(shù);
M——輸入層節(jié)點數(shù);
N——輸出層節(jié)點數(shù);
A——取1到10的整數(shù)。
紅茶干茶、茶湯、葉底網(wǎng)絡模型的隱含層節(jié)點范圍如表1所示。
表1 各樣本種類隱含層范圍的確定
依次選取可能的隱含層節(jié)點數(shù),測試相應數(shù)據(jù)集的準確率,訓練集數(shù)據(jù)的各隱含層節(jié)點數(shù)與各樣本準確率的分布如表2所示。
表2 各樣本訓練集隱含層節(jié)點數(shù)的準確率
通過對比不同隱含層節(jié)點數(shù)對應的訓練集識別的準確率,將均方誤差最小時的隱含層節(jié)點數(shù)目確立為最佳。求得紅茶干茶、茶湯、葉底的最佳隱含層節(jié)點數(shù)目分別為13、10、8。另外,在其它網(wǎng)絡參數(shù)的配置上,本研究設(shè)置網(wǎng)絡的訓練次數(shù)為1000次,顯示頻率為25,即每訓練25次顯示1次,學習速率為0.01,動量因子為0.01,最小性能梯度為10-6,并設(shè)置最高失敗次數(shù)為6次。
1.3.3 學習方式的選擇。為尋找最適合本次研究的學習方式,選擇紅茶干茶色澤數(shù)據(jù)集對增加動量算法、彈性BP算法、自適應學習算法、共軛梯度算法、LM算法分別進行測試。通過網(wǎng)絡訓練,再隨機選取數(shù)據(jù)對模型進行測試,比較不同學習方式對測試數(shù)據(jù)集預測的準確率,結(jié)果如表3所示。
表3 不同學習方式對干茶色澤預測的準確率
測試的結(jié)果顯示LM算法的效果最好,三次平均準確率可達到93.75%,因此后面的研究過程中選擇該算法對網(wǎng)絡進行訓練。
為了檢驗GA-BP算法應用效果,我們選用了100組干茶數(shù)據(jù)對模型進行測試。同時,將標準BP神經(jīng)網(wǎng)絡模型作為對照組,將兩種模型的測試結(jié)果進行分析。根據(jù)測試結(jié)果可知標準BP神經(jīng)網(wǎng)絡對紅茶干茶色澤數(shù)據(jù)識別效果一般,準確率只有85.86%,而且存在少部分識別結(jié)果和正確結(jié)果誤差較大的數(shù)據(jù)。而GA-BP神經(jīng)網(wǎng)絡模型分類識別更為精準,數(shù)據(jù)準確率為94.95%。
在茶湯數(shù)據(jù)的測試中,選用了105組紅茶湯色數(shù)據(jù)對GA-BP模型與標準BP模型進行測試,標準BP神經(jīng)網(wǎng)絡分類識別的準確率為80.95%,使用GA-BP算法的網(wǎng)絡模型的準確率可達到95.23%。
在葉底數(shù)據(jù)的測試中,選用了95組紅茶葉底數(shù)據(jù)對模型進行測試。標準BP神經(jīng)網(wǎng)絡對大部分數(shù)據(jù)識別比較精準,但是也存在少部分識別結(jié)果和正確結(jié)果誤差較大的數(shù)據(jù),其分類識別的準確率為88.54%,而GA-BP網(wǎng)絡模型極大提高測試集數(shù)據(jù)分類識別的準確率,其測試準確率為90.62%。
經(jīng)過紅茶的干茶、湯色、葉底數(shù)據(jù)的測試,使用GA-BP算法對干茶、湯色、葉底數(shù)據(jù)測試的準確率分別為94.95%、95.23%、90.62%,模型的分類識別效果較好,GA-BP算法使得全局尋優(yōu)能力、數(shù)值范圍交叉的數(shù)據(jù)處理能力更佳,分類結(jié)果與專家評估較為一致,通過本次研究獲得的網(wǎng)絡模型,機器視覺識別的結(jié)果可以與人工評審結(jié)果做最好的關(guān)聯(lián)。這不僅大大減少了人工評審帶來的主觀誤差,也能為茶葉色澤類型的量化審評提供科學依據(jù),較好地推動茶產(chǎn)業(yè)的數(shù)字化發(fā)展進程。