王勝鵬,龔自明,鄭鵬程,劉盼盼,滕 靖,高士偉,桂安輝
(湖北省農(nóng)業(yè)科學(xué)院果樹茶葉研究所,湖北 武漢 430064)
青磚茶是湖北省特有的一種黑茶,它是將茶鮮葉殺青、渥堆、蒸制后經(jīng)壓制而成,外形磚面光滑,棱角整齊,緊結(jié)平整[1]。青磚茶加工時,渥堆是非常關(guān)鍵的一道工序,會發(fā)生一系列以多酚類物質(zhì)為主的生化反應(yīng)[2],形成了青磚茶特有的品質(zhì)特點(diǎn)。飲用青磚茶除利于消化外,還具有分解脂肪[3]、舒暢腸胃[4]、抗氧化[5]、降血糖[6]和殺菌止瀉等功效,早已成為我國邊疆少數(shù)民族群眾和外國茶友[7]日常生活中不可或缺的一種必需品。因此,在市場銷售時要嚴(yán)把質(zhì)量關(guān),對青磚茶品質(zhì)開展評價就顯得尤其重要。
通常應(yīng)用GB/T 23776—2018《茶葉感官審評方法》[8]對小麥和大米等樣品[9-12]品質(zhì)進(jìn)行評價,目前已實(shí)現(xiàn)對綠茶[13]、紅茶[14]、烏龍茶[15]和普洱茶[16]等茶類進(jìn)行品質(zhì)感官評價。傳統(tǒng)感官審評法雖然經(jīng)典,但專業(yè)性較強(qiáng),易受審評員嗜好差異、身體狀況和環(huán)境等多種因素影響,結(jié)果主觀性較強(qiáng)。而化學(xué)檢測方法較客觀、公正,通過測定內(nèi)含成分[17-19]含量再評價茶品質(zhì)高低[20]。雖然該方法較為準(zhǔn)確,但測定前需先將樣品粉碎,測定過程中費(fèi)時、費(fèi)力,不利于茶葉品質(zhì)的實(shí)時檢測,因此,非常有必要開發(fā)一種便捷、科學(xué)、客觀有效的青磚茶品質(zhì)評價方法。
近紅外光譜主要反映的樣品中X—H化學(xué)鍵信息,具有快速、無損的分析優(yōu)勢,目前已經(jīng)廣泛應(yīng)用于農(nóng)業(yè)、石油化工、紡織業(yè)和醫(yī)藥等行業(yè)[21-23]。國內(nèi)外很多學(xué)者應(yīng)用近紅外光譜技術(shù)實(shí)現(xiàn)了對茶中茶多酚、抗氧化活性、咖啡堿[24]等成分含量預(yù)測、茶鮮葉質(zhì)量的快速評估[25]和茶葉種類判別[26];此外,應(yīng)用近紅外光譜還對綠茶[27-28]和紅茶[29]品質(zhì)進(jìn)行了評價。
但在青磚茶研究方面,目前主要集中在青磚茶加工技術(shù)[30]、香氣成分分析[31]和菌類鑒別[32]方面,在青磚茶茶湯品質(zhì)評價方面也開展了部分研究工作[20],但目前還較少有應(yīng)用近紅外技術(shù)對青磚茶品質(zhì)開展快速、無損評價研究的報道。因此,本研究借助近紅外光譜技術(shù),分別結(jié)合聯(lián)合區(qū)間偏最小二乘(synergy interval partial least squares,siPLS)法、主成分分析(principal component analysis,PCA)和Jordan-Elman nets人工神經(jīng)網(wǎng)絡(luò)方法建立青磚茶品質(zhì)預(yù)測模型,為青磚茶品質(zhì)快速評價提供一種新方法。
青磚茶樣品共130 個,加工時間:2015年5—10月。樣品分別來自湖北省赤壁市羊樓洞茶業(yè)股份有限公司、趙李橋茶廠有限責(zé)任公司、洞莊茶業(yè)有限公司和思莊茶業(yè)有限公司。120 個樣品用于建立模型,并將樣品按照3∶1比例劃分為校正集(90 個樣品)和驗(yàn)證集(30 個樣品)2 個集合,其中驗(yàn)證集樣品用于檢驗(yàn)校正集模型的穩(wěn)健性。10 個樣品來源未知,用于檢驗(yàn)?zāi)P偷膶?shí)際預(yù)測效果。
Antaris II型傅里葉變換近紅外光譜儀 美國賽默飛世爾公司。
1.2.1 感官審評
根據(jù)GB/T 23776—2018,用四分法取得青磚茶樣品5.0 g,置于250 mL評審杯中,注滿沸水,加蓋浸泡5 min,按照沖泡次序依次等速將茶湯瀝入評茶碗中。3 名感官審評專家對青磚茶品質(zhì)進(jìn)行打分,看外形、審評湯色、嗅香氣、嘗滋味和看葉底,各項(xiàng)分?jǐn)?shù)所占比例分別為20%、15%、25%、30%和10%。滿分為100 分,青磚茶品質(zhì)越好,分?jǐn)?shù)越高。
1.2.2 近紅外光譜采集
采用傅里葉變換近紅外光譜儀測定,光譜掃描范圍4 000~10 000 cm-1,分辨率8 cm-1,檢測器InGaAs。在掃描光譜前,需將儀器開機(jī)預(yù)熱1 h待狀態(tài)穩(wěn)定后再掃描光譜。掃描過程中,將青磚茶樣品裝入與儀器配套的樣品杯中,采用漫反射方式掃描光譜;為確保采集每個樣品的全部近紅外光譜信息,掃描過程中樣品杯會旋轉(zhuǎn)360°,每個樣品掃描3 條光譜,每條光譜掃描64 次,然后進(jìn)行光譜平均,作為該樣品的最終光譜(圖1)。
圖1 青磚茶平均近紅外光譜Fig.1 Average NIR spectra of Qingzhuan tea
1.2.3 光譜數(shù)據(jù)分析
將每條光譜轉(zhuǎn)化為1 557對數(shù)據(jù)點(diǎn)于Excel表中保存,數(shù)據(jù)點(diǎn)間隔為3.86 cm-1,分別應(yīng)用TQ Analyst 9.4.45軟件、OPUS 7.0軟件和Matlab 2012a軟件對數(shù)據(jù)進(jìn)行分析。
從表7中可以看出,西部礦業(yè)股份有限公司在2013~2017年五年間的總資產(chǎn)凈利率分別為0.01、0.01、0.00、0.00、0.01,企業(yè)這五年的總資產(chǎn)凈利率的波動幅度極小,表明在2013~2017年五年間企業(yè)的盈利狀況一直不佳,資產(chǎn)的綜合利用效果不好。可通過合理規(guī)劃運(yùn)用閑置或暫時閑置的資產(chǎn),將暫時閑置的資金、固定資產(chǎn)等投入到生產(chǎn)中,提高企業(yè)的盈利能力。
為有效去除光譜中夾雜的大量噪聲信息,提高光譜的信噪比,分別比較標(biāo)準(zhǔn)變量變換(standard normal variate,SNV)、多元散射校正(multiple scatter correction,MSC)和一階導(dǎo)數(shù)和二階導(dǎo)數(shù)等光譜預(yù)處理方法的效果,篩選出最佳預(yù)處理方法。
應(yīng)用siPLS法[33]將預(yù)處理后的全部光譜數(shù)據(jù)均等劃分為10~24 個光譜子區(qū)間,然后聯(lián)合其中的2~4 個光譜子區(qū)間分別建立偏最小二乘(partial least squares,PLS)法模型,當(dāng)模型的交互驗(yàn)證均方根方差(root mean square error of cross validation,RMSECV)最小時,此時得到的光譜區(qū)間即為篩選的與青磚茶品質(zhì)密切相關(guān)的光譜子區(qū)間。
RMSECV按式(1)計(jì)算:
式中:n為校正集樣品數(shù);為樣品i實(shí)測值;’為校正集樣品i預(yù)測值。
將上述得到的最佳光譜子區(qū)間進(jìn)行PCA,以主成分?jǐn)?shù)為輸入值,以青磚茶品質(zhì)為輸出值,應(yīng)用Jordan-Elman nets人工神經(jīng)網(wǎng)絡(luò)方法建立青磚茶品質(zhì)近紅外光譜預(yù)測模型,所得結(jié)果用校正集決定系數(shù)()、預(yù)測集決定系數(shù)()、RMSECV、預(yù)測均方根均方差(root mean square error of prediction,RMSEP)表示。其中,以R2越大、RMSEP越小時,模型預(yù)測效果越好。
RMSEP按式(2)計(jì)算:
式中:n為驗(yàn)證集樣品數(shù);yi為樣品i實(shí)測值;′為驗(yàn)證集樣品i預(yù)測值。
R2按式(3)計(jì)算:
式中:yi和yi′分別為樣本中第i個樣本實(shí)測值和預(yù)測值;為所有樣本實(shí)測值的平均值。
表1 青磚茶品質(zhì)得分結(jié)果Table 1 Sensory evaluation scores of Qingzhuan tea
從表1可以看出,全部青磚茶樣品感官品質(zhì)得分范圍為75.00~93.00 分,校正集樣品品質(zhì)得分范圍為75.00~93.00 分,驗(yàn)證集樣品品質(zhì)得分范圍為83.00~90.00 分,驗(yàn)證集樣品品質(zhì)得分范圍處于校正集樣品品質(zhì)得分范圍內(nèi),表明建模樣品的劃分是合理的,為建立穩(wěn)健的青磚茶品質(zhì)得分預(yù)測模型提供了前提條件。
應(yīng)用多種光譜預(yù)處理方法對青磚茶樣品的近紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理,并應(yīng)用PLS法分別建立品質(zhì)得分近紅外光譜預(yù)測模型,結(jié)果見圖2。從圖2可以看出,不同光譜預(yù)處理方法對青磚茶原始光譜預(yù)處理后效果不同,建立的青磚茶品質(zhì)分?jǐn)?shù)PLS模型預(yù)測結(jié)果差異較大,當(dāng)無光譜預(yù)處理時,建立的PLS模型預(yù)測結(jié)果最差(=0.597,RMSECV=1.774);隨著不同的光譜預(yù)處理方法對青磚茶原始光譜進(jìn)行去噪處理,PLS模型結(jié)果都有不同程度的提升,其中以MSC+二階導(dǎo)數(shù)的光譜預(yù)處理方法建立的模型預(yù)測結(jié)果最佳(=0.728,RMSECV=1.205),與無光譜預(yù)處理方法模型預(yù)測結(jié)果相比,RMSECV降低了32.1%,可見,對原始光譜進(jìn)行預(yù)處理可以有效提高光譜的信噪比,這與前人的研究結(jié)論一致[34]。但是,圖2中建立的青磚茶品質(zhì)分?jǐn)?shù)近紅外預(yù)測模型結(jié)果還較差,不能較為準(zhǔn)確地預(yù)測未知青磚茶的品質(zhì)分?jǐn)?shù),因此,還需要進(jìn)一步篩選反映青磚茶品質(zhì)的特征光譜區(qū)間,提升模型的預(yù)測效果。
圖2 不同預(yù)處理方法品質(zhì)得分PLS模型結(jié)果比較Fig.2 Comparison of performance of PLS models with different pretreatment methods
2.3.1 siPLS方法篩選特征光譜區(qū)間
表2 青磚茶品質(zhì)分?jǐn)?shù)siPLS模型結(jié)果Table 2 Prediction results obtained from siPLS calibration models for sensory score of Qingzhuan tea
應(yīng)用siPLS[33]方法分別建立每2~4 個光譜子區(qū)間的預(yù)測模型,當(dāng)RMSECV最小時,此時建模光譜區(qū)間即為篩選的反映青磚茶品質(zhì)的特征光譜區(qū)間,所得結(jié)果見表2。從表2可以看出,隨著光譜區(qū)間劃分從10~24 個逐漸增長的過程中,全部應(yīng)用4 個光譜區(qū)間建立PLS模型,表明4 個光譜子區(qū)間含有的建模有用信息比2 個或3 個光譜子區(qū)間波段有效信息多,因此,當(dāng)全光譜劃分為一定的光譜子區(qū)間時,應(yīng)用4 個子區(qū)間建立的siPLS模型預(yù)測效果最佳。隨著光譜劃分子區(qū)間數(shù)逐漸增多,建立的siPLS模型RMSECV呈現(xiàn)逐漸變小再逐漸增大的趨勢,當(dāng)全光譜劃分為16 個子區(qū)間、選用[2 3 7 10]4 個光譜子區(qū)間波段建立模型時,RMSECV最?。?.854),此時建模的[2 3 7 10]4 個光譜子區(qū)間波段即為篩選的反映青磚茶品質(zhì)的最佳光譜區(qū)間波段,對應(yīng)的光譜波數(shù)分別為4 377.6~4 751.7、4 755.6~5 129.7、6 262.7~6 633.9、7 386~7 756.3 cm-1??梢姡瑧?yīng)用siPLS方法篩選的特征光譜區(qū)間只占全部光譜數(shù)據(jù)的25.00%,但模型的預(yù)測效果又得到了進(jìn)一步提升,與2.2節(jié)中模型最佳結(jié)果相比,RMSECV降低了29.1%。在4 377.6~5 129.7 cm-1范圍內(nèi),是C—H鍵一級倍頻吸收區(qū)和C=O二級倍頻吸收區(qū);6 262.7~6 633.9 cm-1范圍內(nèi),是N—H二級倍頻吸收區(qū);7 386~7 756.3 cm-1范圍內(nèi),是C—H鍵二級倍頻吸收區(qū)[35]。青磚茶在渥堆過程中,會發(fā)生一系列以多酚類物質(zhì)為主的生化反應(yīng),產(chǎn)生新的化學(xué)物質(zhì),富含大量的茶多酚、兒茶素、表沒食子兒茶素沒食子酸酯(epigallocatechin gallate,EGCG)、表兒茶素沒食子酸酯(epicatechin gallate,ECG)和表沒食子兒茶素(epigallocatechin,EGC)等物質(zhì),這些物質(zhì)含有大量的C—H和C=O化學(xué)鍵;青磚茶茶湯中還含有大量的游離氨基酸,游離氨基酸對茶湯的鮮爽味具有很大的關(guān)系,與茶湯品質(zhì)呈正相關(guān),含有較多的N—H化學(xué)鍵,這些物質(zhì)含有的化學(xué)鍵信息在近紅外光譜波段范圍內(nèi)被siPLS方法篩選出來,可見,篩選的特征光譜區(qū)間可以有效反映青磚茶的品質(zhì)[20]。因此,應(yīng)用siPLS方法篩選的特征光譜區(qū)間較好反映了青磚茶的品質(zhì),與實(shí)際感官審評結(jié)果相符。
2.3.2 特征光譜區(qū)間PCA
表3 前7 個主成分貢獻(xiàn)率Table 3 Contribution rates of the first seven principal components
從表3可以看出,對特征光譜區(qū)間進(jìn)行PCA后,前7 個主成分的貢獻(xiàn)率迅速降低,其中PC1貢獻(xiàn)率為92.33%,PC2貢獻(xiàn)率為4.87%,PC3貢獻(xiàn)率為1.95%,PC4~PC7的各個主成分貢獻(xiàn)率均低于1.00%;前3 個主成分的累計(jì)貢獻(xiàn)率為99.15%,可見前3 個主成分的信息就可以代表特征光譜區(qū)間的全部信息[36],可用于下一步建立Jordan-Elman nets人工神經(jīng)網(wǎng)絡(luò)預(yù)測模型。
2.3.3 人工神經(jīng)網(wǎng)絡(luò)預(yù)測模型建立
以前3 個主成分為輸入值,以青磚茶品質(zhì)分?jǐn)?shù)為輸出值,應(yīng)用Jordan-Elman nets人工神經(jīng)網(wǎng)絡(luò)方法建立青磚茶品質(zhì)分?jǐn)?shù)近紅外光譜預(yù)測模型。在建立模型過程中,各傳遞層之間應(yīng)用的傳遞函數(shù)不同,模型預(yù)測結(jié)果也不同。本實(shí)驗(yàn)在建立人工神經(jīng)網(wǎng)絡(luò)模型過程中,學(xué)習(xí)速率為0.1,比較3 種信息傳遞函數(shù),分別為linear[-1,1]函數(shù)、logistic函數(shù)和tanh函數(shù)。模型的預(yù)測結(jié)果見表4。
表4 3 種傳遞函數(shù)人工神經(jīng)網(wǎng)絡(luò)模型結(jié)果Table 4 Results obtained from three transfer functions of back propagation-artificial neural network
從表4可以看出,3 種傳遞函數(shù)建立的青磚茶品質(zhì)分?jǐn)?shù)Jordan-Elman nets人工神經(jīng)網(wǎng)絡(luò)模型中,線性的linear函數(shù)模型預(yù)測結(jié)果最差(Rp2=0.908,RMSEP=0.525),雙曲線型tanh函數(shù)模型預(yù)測結(jié)果最佳(Rp2=0.973,RMSEP=0.386),這是由于在建模過程中,青磚茶光譜中含有的信息較為復(fù)雜,而不是單純一種物質(zhì)的光譜信息,因此,線性的傳遞函數(shù)linear預(yù)測效果會相對較差;logistic函數(shù)是S型函數(shù),表明光譜信息存在一定的非線性因素,模型預(yù)測結(jié)果較線性linear函數(shù)稍佳;tanh函數(shù)是雙曲正切函數(shù),模型收斂速度較快,減少迭代次數(shù),模型的預(yù)測結(jié)果在3 種傳遞函數(shù)中最佳[37],預(yù)測模型也最穩(wěn)健。
2.3.4 模型應(yīng)用效果檢驗(yàn)
為檢驗(yàn)建立的Jordan-Elman nets人工神經(jīng)網(wǎng)絡(luò)模型的實(shí)際預(yù)測效果,對10 個未知樣品品質(zhì)分?jǐn)?shù),所得結(jié)果見圖3。
圖3 未知樣品品質(zhì)分?jǐn)?shù)預(yù)測結(jié)果Fig.3 Real versus predicted sensory scores for unknown Qingzhuan tea by the best back propagation-artificial neural network model
從圖3可以看出,應(yīng)用最佳的人工神經(jīng)網(wǎng)絡(luò)模型可以準(zhǔn)確預(yù)測10 個未知樣品的品質(zhì)(=0.971,RMSEP=0.393),預(yù)測結(jié)果與驗(yàn)證集模型較為接近,表明在tanh傳遞函數(shù)下,應(yīng)用Jordan-Elman nets人工神經(jīng)網(wǎng)絡(luò)模型可以準(zhǔn)確的預(yù)測青磚茶的品質(zhì)。
青磚茶品質(zhì)快速、無損檢測是當(dāng)前的發(fā)展趨勢,有利于產(chǎn)品銷售時品質(zhì)的實(shí)時檢測。本實(shí)驗(yàn)將近紅外光譜技術(shù)、siPLS法、PCA和Jordan-Elman nets人工神經(jīng)網(wǎng)絡(luò)相結(jié)合,建立一個穩(wěn)健的青磚茶品質(zhì)預(yù)測模型(=0.973,RMSEP=0.386),在不破壞樣品的前提下,幾秒鐘內(nèi)就可快速、準(zhǔn)確地預(yù)測青磚茶品質(zhì)高低,為降低產(chǎn)品的銷售成本提供了一種新的途徑。同時,在今后應(yīng)用過程中,通過利用已經(jīng)篩選的特征光譜區(qū)間,剔除了大量無關(guān)的光譜信息,還可以有針對性的開發(fā)檢測青磚茶品質(zhì)的近紅外光譜儀器,而不必使用全波長近紅外光譜檢測器,可以降低儀器的研發(fā)成本,有利于開發(fā)的儀器盡早投入使用。此外,為了增強(qiáng)模型的預(yù)測精度,還應(yīng)當(dāng)采集不同年份的青磚茶樣品,對現(xiàn)有模型數(shù)據(jù)庫進(jìn)行適當(dāng)擴(kuò)充,增強(qiáng)模型的適應(yīng)性。