孫瀟鵬 ,劉燦燦 ,陸華忠 ,,徐 賽
(1.華南農(nóng)業(yè)大學 工程學院,廣州 510642;2.廣西大學 輕工與食品工程學院,南寧 530004;3.廣東省農(nóng)業(yè)科學院,廣州 510642)
梅州蜜柚風味極佳,含有有機酸、維生素C和糖等人體不可或缺的營養(yǎng)元素。有止咳清熱、降血壓/血脂等功效[1]??梢?近紅外光譜技術(shù)在蘋果、柑橘、西瓜和櫻桃等內(nèi)部品質(zhì)檢測中被廣泛應用[2-5]。該方法也常因各類影響因素使所建預測模型不夠穩(wěn)健,難以提高其品質(zhì)檢測準確性[6]。如光源衰減和光路偏移等問題對設備檢測的影響;果皮包含大量細胞壁、膜界面及懸浮顆粒等,導致光透過時產(chǎn)生強烈的多維散射,產(chǎn)生不容忽視的影響[7]。
可溶性固形物含量(SSC)也稱為糖度,是水果內(nèi)部品質(zhì)的重要指標之一[8-9]。本文旨在通過可見-近紅外透射光譜檢測蜜柚糖度,探究3種影響因素(光源距離、光照強度和果皮厚度)對檢測精度影響,尋求最優(yōu)的檢測參數(shù)及方法,以期為厚皮水果品質(zhì)檢測提供參考。
1.1.1 材料
在2020年7~10月中旬,15天左右采樣1次,分7批從梅州果園采摘,精選共計600個無損傷的紅肉蜜柚,擦拭晾干后存于室溫(19~21 ℃)靜置24 h,編號后用于試驗。
1.1.2 儀器
PAL-Grape Must型數(shù)顯折射儀(單位為°Brix,ATAGO(愛拓)中國分公司),測量范圍0.0%~53.0%,測試時間為3 s,誤差為±0.2%;HTP312型天平(上?;ǔ彪娖饔邢薰荆?;游標卡尺(精度0.01 mm,上海申韓量具有限公司)。
1.1.3 試驗平臺
搭建可見-近紅外透射光譜試驗平臺,如圖1所示。
圖1 光譜試驗平臺結(jié)構(gòu)示意Fig.1 Structural diagram of the spectral test platform
圖中,QE-Pro型光譜儀(美國海洋光學公司):測量波長400~1 100 nm,光譜分辨率0.14~7.7 nm,信噪比 1 000:1;NIR-QUEST512型光譜儀(美國海洋光學公司):測量波長900~1 700 nm,光譜分辨率為3 nm,信噪比15 000:1。光源系統(tǒng)采用100 W石英鹵素燈,共計12組;柚果托盤:外徑100 mm,內(nèi)徑80 mm,高20 mm,內(nèi)倒角17.01°(實物加工以17°為準),材質(zhì)為聚甲醛樹脂(POM)[10]。
1.2.1 光譜采集與預處理
開機預熱15 min后開始試驗,將托盤置于檢測室內(nèi),使用配套的白板與黑板,分別貼住積分球窗口進行光譜校正。使用廣州某公司開發(fā)的軟件進行光譜采集,軟件進入“組合光譜儀”界面可分別對2臺光譜儀(QE-pro和NIR-QUEST)參數(shù)設定(積分時間分別為200 ms和2 000 ms),獲取并存儲試驗數(shù)據(jù)。樣本每旋轉(zhuǎn)90°采集1次,取4次光譜的均值作為樣本數(shù)據(jù)。選擇光譜的透射率作為光譜信息的研究參數(shù)。光譜數(shù)據(jù)采集透射率如下式所示[11]:
式中T——蜜柚的透射率,%;
Is——蜜柚的光譜透射強度,cd;
Iw——亮背景的光譜透射強度,cd;
Ib——暗背景的光譜透射強度,cd。
使用Unscrambler X 10.4軟件,將原始光譜經(jīng)Savitzky-Golay(SG)多項式平滑法完成預處理。其目的是削弱各種干擾信息,保留有效信息,提高光譜分辨率,降低模型的復雜度[12]。光譜預處理后如圖2所示。
圖2 樣本的可見-近紅外透射光譜Fig.2 Visible and near-infrared transmittance spectra of samples
1.2.2 光譜特征變量選取
主成分貢獻率分布如圖3所示。
圖3 主成分貢獻率分布圖Fig.3 Contribution rate distribution of principal components (PCs)
主成分分析法(principal component analysis,PCA)用于光譜預處理后,將光譜數(shù)據(jù)進行正交變換映射到低維子空間,較低維度的數(shù)據(jù)集不破壞原數(shù)據(jù)信息。其目的是用較少的特征變量去解釋原數(shù)據(jù)中的大部分特征變量,即所謂主成分[13]。根據(jù)Kennard-Stone法按2:1分別建立校正集和驗證集[14],分析可得600個蜜柚光譜數(shù)據(jù)的主成分PC1至PC8的累積貢獻率。結(jié)果表明:前6個主成分的累積貢獻率可100%表征全波段原始光譜。
1.2.3 生長期蜜柚的理化測定
分別測定生長期蜜柚各采摘時間的橫徑(W)、縱徑(H)和質(zhì)量(M)。排水法測定體積(V)。從光譜檢測區(qū)域切取樣本部分果肉,用紗布包裹擠出果汁,將果汁滴于數(shù)顯折射儀讀取并記錄SSC[15]。以上理化指標均測量3次后取平均值,以每個采摘時間的總樣本均值為參考值,對理化指標進行ANOVA分析,結(jié)果如表1所示。質(zhì)量、體積、橫/縱徑和SSC隨蜜柚生長期呈先上升后下降線性規(guī)律性變化。
表1 生長期蜜柚的的理化指標Tab.1 Physical and chemical indicators of honey pomelo in growing period
1.2.4 模型建立與評價指標
偏最小二乘回歸(partial least squares regression,PLSR)是一種多元回歸分析的建模方法,是將樣本采集的數(shù)據(jù)與其理化測定值同時進行分析,最大程度提取兩者之間相關性信息,在對數(shù)據(jù)矩陣進行分解降維的同時進行回歸分析,可用于組分復雜的樣品體系[16]。數(shù)據(jù)矩陣分解和回歸交互運算同時進行,得到的特征值向量直接與被測品質(zhì)參數(shù)或者屬性值進行相關性分析。模型中,品質(zhì)指標(SSC)與光譜數(shù)據(jù)間內(nèi)部關系如下式所示:
式中C(n×s)——n個樣本的被測屬性值或品質(zhì)指標值矩陣;
T(n×m)——n個樣本具有m個數(shù)據(jù)信息矩陣;
E(n×m)——數(shù)據(jù)參數(shù)矩陣的殘差矩陣;
P(h×m)——數(shù)據(jù)參數(shù)載荷陣;
U(n×h)——被測屬性或品質(zhì)指標濃度特征因子陣;
λ(n×h)——數(shù)據(jù)參數(shù)特征因子陣;
Q(h×s)——被測屬性或品質(zhì)指標的濃度載荷陣;
F(n×s)——被測屬性或品質(zhì)指標濃度矩陣殘差矩陣。
定量模型的評價指標有:決定系數(shù)(the coefficient of determination,R2)和均方根誤差(root mean square error,RMSE)等,適用于衡量模型精度,其計算式如下[17]:
模型評價通過內(nèi)部交叉驗證(校驗集)和樣本測試(預測集)進行。其中,校驗集決定系數(shù)(Rcal2)和預測集決定系數(shù)(Rpre2)越高,伴隨校驗均方根誤差(RMSEC)和預測集均方根誤差(RMSEP)值越低,模型精度越好[18-19]。
光源光譜是物質(zhì)在高溫狀態(tài)或因受到帶電粒子的撞擊而直接激發(fā)的光譜。由于受激時物質(zhì)所處的狀態(tài)不同,發(fā)射光譜有不同的特征光譜[20]。自搭建光譜試驗樣機利用光柵光譜儀測量石英鹵素燈的光源光譜—原子態(tài)明線光譜。石英鹵素燈發(fā)光光強與距離之間的關系如下式所示:
式中E——光子總能量,cd;
I——光照強度,cd;
R——光照距離,cm。
光譜試驗平臺的試驗誤差主要源于光源系統(tǒng)至積分球的垂直距離。經(jīng)測量,光譜試驗平臺中光源系統(tǒng)至積分球垂直極限距離為30 cm,將其作為原始距離,設置3 cm為1個試驗梯度,每下降1次進行光譜采集和存儲,直至15 cm為止。每隔45°開啟1組光源,設置共8組100 W石英鹵素燈。H1-H5為光源距離30~18 cm時,樣本的可見-近紅外透射光譜,如圖4所示。
圖4 不同光源距離的可見-近紅外透射光譜Fig.4 Visible and near-infrared transmittance spectra of different light source distances
圖4(a)中,在400~1 100 nm范圍內(nèi)光譜透過率隨H1至H5依次遞增,光譜吸收峰依次遞增。圖4(b)中,在900~1 700 nm范圍內(nèi),光譜透過率隨H1至H5也依次遞增。由于H3至H5光譜透過率增長迅速,發(fā)現(xiàn)距離為24 cm(H3)至18 cm(H5)時,柚果置于托盤上直接放入檢測室內(nèi)較為困難,且樣本出現(xiàn)不同程度灼傷,所以延遲光譜采樣時間。樣本果皮隨光源距離的接近,灼傷程度逐漸加重。
綜上所述,光源距離對樣本的VIS-NIR透射光譜采樣影響較大。H3至H5距離過近,光譜試驗易灼傷柚果果皮,損傷柚果品質(zhì);H1至H2距離適宜,H2的光譜透過率較高于H1,且光譜吸收峰特征明顯。因此,取27 cm(H2)為最佳的光源距離。
人工照明的光源光譜和光照強度會對植物果實生長產(chǎn)生影響[21]。長期強光照的光譜試驗,對柚果品質(zhì)也會產(chǎn)生影響。為保證光照強度的可控性,光源系統(tǒng)設置100 W石英鹵素燈,共計12組,入射角度45°。以最佳光源距離H2開展試驗,4組光源為基數(shù),沿順時針方向,每增加2組光源為1個梯度,共計5個光照強度。如圖5所示,首先開啟序號為1的4組光源,彼此間隔90°均勻分布;其次沿順利針方向依次開啟的光源序號為2,3,4,5;最后完成各梯度透射光譜采集。
圖5 光源系統(tǒng)的開啟順序Fig.5 Turn-on sequence of the light source system
在不同的光照強度下,進行5個光照梯度的數(shù)據(jù)分析。如圖6所示,L4-L12分別代表開啟4~12組光源后采集的VIS-NIR透射光譜均值。光譜透過率隨L4-L12逐漸增加,L10在近紅外波段光譜吸收峰特征明顯。典型的重疊吸收峰對應水果中水分和碳水化合物的C-H、O-H及N-H化學鍵,例如950 nm附近吸收峰為水分的吸收帶;1 400 nm附近吸收峰與木質(zhì)素含量有關[22]。
圖6 不同光照強度的可見-近紅外透射光譜Fig.6 Visible and near-infrared transmittance spectra of different light source intensity
觀察測后樣本品質(zhì):外部無灼傷,果皮無萎蔫,內(nèi)部果實飽滿,果汁充盈。為防止蜜柚灼傷,批量樣本檢測的最大光源強度選擇L10為宜。
蜜柚果皮結(jié)構(gòu)復雜,光透過果皮進入蜜柚內(nèi)部組織才能被官能團吸收,結(jié)合化學計量學方法才能完成樣本的相關內(nèi)部品質(zhì)檢測。光線進入柚果內(nèi)部后經(jīng)過多次反射、折射、衍射及吸收后再經(jīng)過果皮,方可到達積分球和探測器,通過光纖和光譜儀傳輸至電腦完成采集和存儲。因此,果皮對光譜的透過率及光譜變化具有一定影響。
生長期蜜柚隨采摘時間的不同,受“汁胞粒化”生理性病害影響,果皮厚度不同。固采摘不同生長期樣本,并開展光譜采集和數(shù)據(jù)分析。蜜柚的透射光譜隨生長期的變化,如圖7所示。圖7(a)中,自2020年7月12日~8月11日,在400 nm至1 100 nm范圍內(nèi)光譜透過率和吸收峰幅值呈上升趨勢;自此至當年10月10日,光譜透過率和吸收峰幅值呈下降趨勢。圖7(b)中,光譜在900 nm至1 700 nm范圍內(nèi)隨樣本生長期也呈先上升后下降趨勢。
圖7 生長期蜜柚的透射光譜Fig.7 Transmittance spectra of honey pomelo in growing period
原始光譜經(jīng)SG多項式平滑法預處理和PCA特征波長選取,使用MATLAB R2018a軟件建立光譜數(shù)據(jù)與SSC的PLSR模型,剖析不同因素對模型精度的影響,結(jié)果如表2所示。
表2 不同影響因素的偏最小二乘回歸模型Tab.2 Partial least squares regression model of different influencing factors
結(jié)果表明:光源距離和光照強度對模型精度產(chǎn)生一定的影響。當光源距離不變時,以H1為例,隨著光照強度的逐步增加(L4-L10),模型的Rcal2和Rpre2依次遞增,而RMSEC和RMSEP依次減?。划敼庹諒姸炔蛔儠r,以L10為例,隨著光源距離由H1(30 cm)減小至H2(27 cm),模型的Rcal2和Rpre2依次遞增,而RMSEC和RMSEP依次減小。綜上所述,當光源距離為H2、光照強度為L10時,模型的Rcal2和Rpre2分別達到0.893和0.914,與之對應的RMSEC和RMSEP分別為0.254°Brix和0.226°Brix,模型精度最佳。
本文通過自搭建可見-近紅外透射光譜試驗樣機,探究光照強度、光源距離和果皮厚度對生長期蜜柚光譜透射率和吸收峰的影響變化規(guī)律,得到最佳檢測環(huán)境和優(yōu)化參數(shù)。在光源距離27 cm(H2)、光照強度10組100W石英鹵素燈(L10)、入射角度45°,采集原始光譜經(jīng)SG多項式平滑法預處理和PCA特征波長選取,所建立SSC與特征波長的PLSR模型,模型校驗與預測能力最佳。研究結(jié)果能為厚皮水果的品質(zhì)檢測提供數(shù)據(jù)支持。