張麗娟, 夏其樂, 陳劍兵, 曹 艷, 關(guān)榮發(fā)*, 黃海智
1. 中國計(jì)量大學(xué)生命科學(xué)學(xué)院, 浙江 杭州 310018 2. 浙江省農(nóng)業(yè)科學(xué)院食品科學(xué)研究所, 農(nóng)業(yè)部果品產(chǎn)后處理重點(diǎn)實(shí)驗(yàn)室, 浙江省果蔬保鮮與加工技術(shù)研究重點(diǎn)實(shí)驗(yàn)室, 浙江 杭州 310021
藍(lán)莓, 一種藍(lán)色小漿果, 富含黃酮醇、 花青素和原花色素, 其花青素含量在水果中是最高的, 被譽(yù)為“漿果之王”[1]。 但藍(lán)莓鮮果保質(zhì)期較短, 常常在采摘和存儲過程中, 因機(jī)械損傷、 微生物腐爛、 水分流失等不可抗因素而變質(zhì)[2]。 2016年, 藍(lán)莓全球年產(chǎn)量高達(dá)655 kt, 其中鮮果產(chǎn)量為425.5 kt, 加工產(chǎn)量為229.5 kt。 在藍(lán)莓的加工生產(chǎn)中, 不可避免地會產(chǎn)生大量藍(lán)莓果渣, 而藍(lán)莓果渣中花色苷含量可達(dá)到6.39 mg·g-1 [1]。 藍(lán)莓果渣用途廣泛, 可用于生產(chǎn)果醬、 含片等, 提高產(chǎn)品的花色苷含量和膳食纖維量, 可滿足大健康背景下, 消費(fèi)者對營養(yǎng)健康產(chǎn)品的需求。 目前測定藍(lán)莓果渣花色苷含量主要有pH示差法[3]、 色譜法。 這兩種方法均無法對藍(lán)莓果渣實(shí)現(xiàn)快速、 大樣本量的測定。
近紅外光譜技術(shù)具備分析速度快、 樣品無需預(yù)處理、 多組分同時測定、 無污染低成本等優(yōu)點(diǎn)。 目前國內(nèi)外已經(jīng)實(shí)現(xiàn)了漿果的硬度[4]、 酸度、 pH值、 可溶性固形物(SSC)[5]、 花青素[4,6]、 花色苷[7]等內(nèi)部指標(biāo)的近紅外光譜無損檢測。 藍(lán)莓的光譜研究, 主要涉及藍(lán)莓內(nèi)部淤傷[8]、 硬度(FI)、 可溶性固形物(SSC)[9]、 總酚、 總黃酮、 花青素[10], 而藍(lán)莓果渣花色苷的近紅外模型建立、 預(yù)處理方法、 波長篩選的研究較少。 利用近紅外光譜實(shí)現(xiàn)對不同品種藍(lán)莓果渣中花色苷的快速測定, 將會為大樣本量藍(lán)莓果渣的分級、 分類以及快速檢測奠定基礎(chǔ)。
選擇了半高叢系列“北陸”、 南高叢系列“藍(lán)美1號”、 兔眼系列“燦爛”三種藍(lán)莓樣品為試驗(yàn)材料, 均于2018年7月購買于浙江藍(lán)美科技股份有限公司。 將每個品種的藍(lán)莓利用SKG A8大口徑原汁機(jī)進(jìn)行榨汁, 獲得藍(lán)莓果渣, 再將每個品種的藍(lán)莓果渣分別隨機(jī)劃分為9組、 10組、 10組, 每組30 g。 將每組藍(lán)莓果渣均勻平鋪至樣品杯中, 使用多功能近紅外分析儀DA7200(瑞典波通公司)采集光譜, 采用近紅外漫反射以樣品杯旋轉(zhuǎn)的方式進(jìn)行光譜采樣。 儀器參數(shù)設(shè)置如下: 波長變量從950 nm分布至1 650 nm, 分辨率為5 nm, 環(huán)境溫度23 ℃, 每個樣品重復(fù)測量3次。 三種藍(lán)莓果渣每組進(jìn)行30次測量, 每次測量取平均值, 北陸、 藍(lán)美1號、 燦爛果渣分別獲得270, 300和300個樣本。
藍(lán)莓果渣花色苷提取方法參考雷良波的方法[3], 并調(diào)整為三次提取, 利用紫外可見分光光度計(jì)UV-1800, 測定藍(lán)莓果渣花色苷含量。 三種藍(lán)莓果渣的花色苷含量分布, 經(jīng)軟件Matlab 2016b檢驗(yàn), 均服從正態(tài)分布, 可為建立藍(lán)莓果渣花色苷的PLS模型提供可靠的數(shù)據(jù)基礎(chǔ)。
應(yīng)用主成分馬氏距離(principal component analysis-Mahalanobis distance, PCA-MD), 來剔除藍(lán)莓果渣近紅外光譜中異常樣本, 可以提高近紅外光譜技術(shù)對藍(lán)莓果渣花色苷定量分析的精確性和可靠性。
運(yùn)用Kennard-Stone(K-S)法, 對剔除異常后的藍(lán)莓果渣光譜數(shù)據(jù)進(jìn)行4∶1的校正集、 驗(yàn)證集的劃分。 該樣本集劃分方法是基于光譜變量的選擇方法, 是目前最常用的方法, 既確保了校正集樣本包括測量樣本的完整背景信息, 同時又能保證驗(yàn)證集的樣本信息包含在校正集的樣本信息中, 利于模型有效性的檢驗(yàn)。
分別對北陸、 藍(lán)美1號、 燦爛果渣的光譜數(shù)據(jù), 進(jìn)行光程校正類預(yù)處理方法歸一化、 變量標(biāo)準(zhǔn)化(standard normal variate, SNV)、 多元散射校正(multiplicative scatter correction, MSC)的比較; 同時對藍(lán)莓果渣進(jìn)行Norris一階導(dǎo)數(shù)(Norris first derivative, NFD)、 Norris二階導(dǎo)數(shù)(Norris second derivative, NSD)、 SG卷積一階導(dǎo)數(shù)(Savitzky-Golay convolution first derivative, SGCFD)、 SG卷積二階導(dǎo)數(shù)(Savitzky-Golay convolution second derivative, SGCSD)導(dǎo)數(shù)類的光譜預(yù)處理方法比較; 再進(jìn)行SG(Savitzky-Golay)卷積平滑、 正交信號校正去噪的預(yù)處理, 比較上述9種預(yù)處理方法, 選擇其中表現(xiàn)更好的預(yù)處理方法, 分析對比其組合順序?qū)λ{(lán)莓果渣花色苷定量分析的影響, 確定其中最優(yōu)的預(yù)處理方法。
連續(xù)投影算法(successive projections algorithm, SPA)利用向量的投影分析, 實(shí)現(xiàn)降低被選波長變量之間的共線性[11]。 競爭適應(yīng)再加權(quán)抽樣(competitive adaptive reweighted sampling, CARS)算法通過高效地競爭方式, 從全譜波長變量中選出具有強(qiáng)競爭力、 與化學(xué)性質(zhì)相關(guān)性強(qiáng)的波長變量。 SPA與CARS算法都是用于光譜分析的典型變量選擇技術(shù), 比較分析兩種波長篩選方法的異同點(diǎn), 得到更適合藍(lán)莓果渣花色苷近紅外光譜PLS模型的波長變量篩選方法。
將已預(yù)處理過的藍(lán)莓果渣光譜數(shù)據(jù)作為樣本集, 應(yīng)用偏最小二乘方法(partial least square, PLS), 建立不同品種藍(lán)莓果渣花色苷的回歸預(yù)測數(shù)學(xué)模型。 藍(lán)莓果渣PLS模型中定量分析花色苷含量的評價(jià)指標(biāo)對應(yīng)的評價(jià)標(biāo)準(zhǔn)如表1所示[12]。
表1 PLS模型的評價(jià)標(biāo)準(zhǔn)
(1)
運(yùn)用K-S法按照4∶1的比例, 對867個已剔除異常的藍(lán)莓果渣樣本分類, 得到分別由三種不同品種中686個、 171個藍(lán)莓果渣花色苷樣本組成的校正集、 驗(yàn)證集。
圖1 三種藍(lán)莓果渣的結(jié)果
對藍(lán)莓果渣光譜數(shù)據(jù)分別進(jìn)行MSC、 SG卷積平滑、 SGCSD、 正交信號校正的雙因素、 三因素、 四因素的組合方式(考慮組合順序)進(jìn)行光譜預(yù)處理, 在此基礎(chǔ)上分別建立其全譜PLS模型, 表3為有效改善藍(lán)莓果渣花色苷回歸模型指標(biāo)的預(yù)處理方法組合。
表2 預(yù)處理方法的單因素比較
由表3結(jié)果分析可知, 正交+SGCSD+SG與正交+SG+SGCSD模型指標(biāo)一樣, 且模型指標(biāo)最優(yōu)。 雖然SG卷積平滑是目前為止近紅外光譜分析最為廣泛的光譜平滑去噪方法, 但在三種不同品種藍(lán)莓果渣花色苷近紅外光譜的研究中, 正交信號校正去除了光譜數(shù)據(jù)中所包含的各種干擾噪聲信號, 去噪效果更為突出全面, 從而導(dǎo)致正交信號處理后, SGCSD和SG卷積平滑的先后順序?qū)δP陀绊戄^小。 SGCSD具有提高光譜分辨率和靈敏度、 分辨重疊峰較好的優(yōu)點(diǎn), 并結(jié)合正交信號校正的強(qiáng)大去噪效果, 就可以避免導(dǎo)數(shù)處理引發(fā)的噪聲放大以及信噪比降低。 在有效提高藍(lán)莓果渣花色苷回歸模型的預(yù)處理組合方法中, MSC占據(jù)75%的比例, 說明MSC可以有效消除三種藍(lán)莓果渣中由于藍(lán)莓籽的存在而導(dǎo)致果渣顆粒大小不一、 分布不均勻而產(chǎn)生的散射影響[11]。
為了建立預(yù)測能力高、 穩(wěn)健性好的藍(lán)莓果渣PLS回歸模型, 與全譜(未篩選波長)PLS模型對比, 比較分析了SPA和CARS算法對三種藍(lán)莓果渣波長變量篩選的簡化模型效果。 分別對北陸、 藍(lán)美1號、 燦爛三種藍(lán)莓果渣經(jīng)SG卷積平滑、 MSC、 SGCSD、 正交信號校正預(yù)處理后的光譜數(shù)據(jù)進(jìn)行SPA和CARS算法波長變量的篩選, 分別建立其PLS回歸模型, 各模型指標(biāo)結(jié)果如表4所示, 表中NW(number of wavelengths)為篩選出的波長變量個數(shù)。
表3 預(yù)處理方法組合的模型指標(biāo)結(jié)果
表4 單因素+SPA/CARS的模型指標(biāo)結(jié)果
分析表4可知, SPA-PLS和CARS-PLS的NW均減小且RPD均大于2.5, 即SPA與CARS算法均可實(shí)現(xiàn)波長篩選簡化模型與實(shí)現(xiàn)模型預(yù)測。 為了比較SPA與CARS算法對藍(lán)莓果渣花色苷近紅外光譜預(yù)處理組合方法的優(yōu)異性, 對雙因素、 三因素、 四因素的組合預(yù)處理后的光譜數(shù)據(jù), 依次進(jìn)行未篩選波長變量、 SPA篩選波長變量、 CARS算法篩選波長變量三種方法的比較。
圖2 預(yù)處理方法+波長篩選的比較
表5為SPA和CARS算法結(jié)合預(yù)處理方法的單因素與多因素組合中, 可以有效提高藍(lán)莓果渣花色苷含量PLS模型指標(biāo)的方法組合, 雖然正交信號校正會導(dǎo)致模型過擬合的趨勢, 但在藍(lán)莓果渣花色苷PLS模型中, 正交信號校正仍然可以有效地改善模型[14]。
表5 預(yù)處理方法+波長篩選算法匯總
通過近紅外光譜漫反射技術(shù), 采集北陸、 藍(lán)美1號、 燦爛三種的藍(lán)莓果渣光譜, 應(yīng)用偏最小二乘法, 建立藍(lán)莓果渣花色苷的回歸模型, 比較9種預(yù)處理方法, 選擇其中4種預(yù)處理方法, 進(jìn)行組合比較, 比較全譜、 SPA、 CARS算法篩選波長變量對PLS回歸模型的影響, 得到以下主要結(jié)論:
(2)SPA與CARS算法均可實(shí)現(xiàn)對三種不同品種的藍(lán)莓果渣花色苷波長變量篩選, 但SPA對所有預(yù)處理方法的波長變量篩選后, 無法全部建立PLS模型, 而CARS算法對全部預(yù)處理方法篩選波長變量后, 均可建立相應(yīng)的PLS模型。
(4)在藍(lán)莓果渣花色苷回歸模型中, 正交信號校正表現(xiàn)出強(qiáng)大的去噪效果, 相比于全光譜以及SPA, CARS算法的適用性更強(qiáng)、 波長變量篩選個數(shù)更少、 模型精度更高。 應(yīng)用近紅外光譜反射可以較好地實(shí)現(xiàn)對北陸、 藍(lán)美1號、 燦爛三種藍(lán)莓果渣花色苷含量的定量分析, 可為藍(lán)莓果渣品質(zhì)分級, 提供一種零污染、 快速、 低成本的檢測方法。