尚 靜,2,孟慶龍,2,張 艷2,*,穆興燕
(1.貴陽(yáng)學(xué)院食品與制藥工程學(xué)院,貴州貴陽(yáng) 550005; 2.貴陽(yáng)學(xué)院農(nóng)產(chǎn)品無(wú)損檢測(cè)工程研究中心,貴州貴陽(yáng) 550005)
李子酸甜可口,深受廣大消費(fèi)者的青睞。通常果實(shí)可溶性固形物含量是評(píng)價(jià)水果成熟度的主要指標(biāo)之一,檢測(cè)李子的可溶性固形物含量不僅有助于指導(dǎo)消費(fèi),而且對(duì)于指導(dǎo)李子的采收時(shí)間、采后儲(chǔ)藏和加工都具有重要的意義。
水果可溶性固形物含量的傳統(tǒng)檢測(cè)方法是采用折射儀測(cè)量被擠出的果汁的糖度[1],該方法的最大缺點(diǎn)是有損檢測(cè)。因此,開(kāi)發(fā)研制一種快速、無(wú)損的李子可溶性固形物含量檢測(cè)方法在李子品質(zhì)檢測(cè)領(lǐng)域中具有廣泛的應(yīng)用前景。近年來(lái),基于光譜技術(shù)的檢測(cè)以其無(wú)損、快速等諸多優(yōu)點(diǎn)深受廣大科研工作者的青睞,被廣泛應(yīng)用于食品行業(yè)、醫(yī)藥行業(yè)以及化工行業(yè)等各個(gè)領(lǐng)域[2-6]。國(guó)內(nèi)外研究學(xué)者已利用光譜技術(shù)開(kāi)展了關(guān)于獼猴桃[1,7]、蘋(píng)果[8-9]、荔枝[10]、藍(lán)莓[11-12]和梨[13]等水果可溶性固形物含量的無(wú)損檢測(cè)研究,并取得了較好的研究成果。而采用光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)對(duì)李子可溶性固形物含量的無(wú)損檢測(cè)研究相對(duì)較少,而且前期的研究大多采用全光譜數(shù)據(jù)直接建模,檢測(cè)效率較低。
本文采用反射式光譜采集系統(tǒng)獲取采后儲(chǔ)藏期間“紅”李子和“青”李子的平均光譜。然后利用連續(xù)投影算法和競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法對(duì)預(yù)處理后的光譜數(shù)據(jù)進(jìn)行降維,并結(jié)合化學(xué)計(jì)量學(xué)和誤差反向傳播網(wǎng)絡(luò)提出了基于光譜技術(shù)的李子可溶性固形物含量的檢測(cè)方法,以期為李子可溶性固形物含量的檢測(cè)提供一種無(wú)損、快速、高效的方法。
新鮮“紅”李子和“青”李子 共2種,購(gòu)買(mǎi)于當(dāng)?shù)氐奈譅柆敵?。從買(mǎi)回來(lái)的李子中分別挑選大小均勻一致且完好無(wú)損的“紅”李子和“青”李子各60個(gè)。將選好的李子樣本依次編號(hào)后放在室溫(22±2) ℃下儲(chǔ)藏,每隔1 d取樣一次,每次取樣30個(gè),共取樣4次,這樣取樣的目的是使建立的預(yù)測(cè)模型可以預(yù)測(cè)范圍相對(duì)較大的可溶性固形物含量值,增加其適用性。
反射式光譜采集系統(tǒng) 蔚海光學(xué)儀器(上海)有限公司的光纖光譜采集系統(tǒng),該系統(tǒng)包括高性能光譜儀QEPro(檢測(cè)器為CCD,波長(zhǎng)范圍:198.2~1006.4 nm)、光纖R600-7-VIS-125F(直徑為600 μm)、鹵鎢燈光源HL-2000、反射探頭支架RPH-1(用于固定反射探頭的表面鍍鋁的探頭架,反射探頭與表面呈90°)、RPH-ADP適配器(用于使探頭適合于RPH-1型探頭架,使探頭架可以固定直徑為3.17 mm(1/8英寸)的探頭)、標(biāo)準(zhǔn)反射白板WS-1、計(jì)算機(jī)等,系統(tǒng)結(jié)構(gòu)如圖1所示;ATAGO PAL-α數(shù)字手持袖珍折射儀 日本Atago公司,測(cè)量范圍為Brix 0.0%~85%,測(cè)量精度為±0.2%;TD4Z-WS臺(tái)式低速離心機(jī) 湖南湘立科學(xué)儀器有限公司,最高轉(zhuǎn)速為4 000 r/min,轉(zhuǎn)速精度為±30 r/min;JYZ-V911榨汁機(jī) 九陽(yáng)股份有限公司,額定轉(zhuǎn)速為50 r/min。
圖1 反射式光譜采集系統(tǒng)Fig.1 Schematic diagram of spectra acquisition system
1.2.1 李子光譜數(shù)據(jù)采集 將待測(cè)李子樣本緊貼在反射探頭支架RPH-1表面上(反射探頭通過(guò)RPH-ADP適配器固定在反射探頭支架RPH-1上,距離反射探頭支架表面約1 cm),光譜采集部位為李子赤道位置,5次測(cè)量結(jié)果的平均值作為李子樣本的光譜數(shù)據(jù)。反射式光譜采集系統(tǒng)的積分時(shí)間是110 ms,掃描平均次數(shù)為8,滑動(dòng)平均寬度為1,光譜采集范圍為198.2~1006.4 nm,該光譜范圍內(nèi)共1044個(gè)波段。
1.2.2 李子可溶性固形物含量的測(cè)定 在獲取李子光譜數(shù)據(jù)后立即進(jìn)行可溶性固形物含量的測(cè)定。將李子樣本榨汁后再離心(離心機(jī)的轉(zhuǎn)速為3000 r/min,離心時(shí)間為5 min),然后將李子汁涂抹在折光棱鏡的鏡面上,連續(xù)按測(cè)量鍵按鈕多次,當(dāng)最后液晶顯示屏3次顯示值一致時(shí)記錄該值,每個(gè)樣本分別測(cè)量多次求平均值,作為該樣本可溶性固形物含量的真實(shí)測(cè)量值。
1.2.3 樣本集劃分 采用SPXY(sample set partitioning based on joint x-y distances)方法[14-15]按照3∶1的比例將120個(gè)李子樣本劃分為校正集和預(yù)測(cè)集,得到校正集樣本90個(gè)和預(yù)測(cè)集樣本30個(gè)。表1給出了校正集和預(yù)測(cè)集樣本可溶性固形物含量的統(tǒng)計(jì)結(jié)果。從表1可以看出,校正集中李子樣本可溶性固形物含量的最小值小于預(yù)測(cè)集中樣本可溶性固形物含量的最小值,并且校正集中李子樣本可溶性固形物含量的最大值大于預(yù)測(cè)集中的最大值,從而說(shuō)明校正集具有較寬的范圍,樣本劃分合理有助于建立良好的預(yù)測(cè)模型。
表1 李子可溶性固形物含量的統(tǒng)計(jì)結(jié)果Table 1 Statistics results of soluble solids content of plums
采用OceanView(Ocean Optics,copyright 2013)軟件、MATLAB R2016b等軟件對(duì)光譜數(shù)據(jù)進(jìn)行處理。通過(guò)前期比較多種光譜預(yù)處理方法[16](標(biāo)準(zhǔn)正態(tài)變換、二階微分、多元散射校正等)對(duì)李子光譜數(shù)據(jù)預(yù)處理后的數(shù)據(jù)進(jìn)行建模,得出標(biāo)準(zhǔn)正態(tài)變換是對(duì)李子光譜數(shù)據(jù)預(yù)處理的最優(yōu)方法,因此本文采用標(biāo)準(zhǔn)正態(tài)變換對(duì)原始光譜數(shù)據(jù)進(jìn)行預(yù)處理。采用連續(xù)投影算法(successive projection algorithm,SPA)和競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法(competitive adaptive reweighted sampling,CARS)提取特征波長(zhǎng)。采用誤差反向傳播(error back propagation,BP)網(wǎng)絡(luò)建立李子可溶性固形物含量預(yù)測(cè)模型,并以校正集樣本的相關(guān)系數(shù)(rc)和均方根誤差(RMSEC)以及預(yù)測(cè)集樣本的相關(guān)系數(shù)(rp)和均方根誤差(RMSEP)作為評(píng)價(jià)模型性能的指標(biāo)。
由于原始光譜的首末兩端含有較多的噪聲信息,因此剔除前5個(gè)和后15個(gè)波段,選擇中間波段202.25~995.38 nm為有效光譜區(qū)域,該區(qū)域共有1024個(gè)波段。圖2分別給出了60個(gè)“紅”李子的原始平均光譜曲線(xiàn)和60個(gè)“青”李子的原始平均光譜曲線(xiàn)。從圖2可以看出,在202.25~995.38 nm波段內(nèi),“紅”李子和“青”李子的平均光譜曲線(xiàn)的變化趨勢(shì)基本一致。在675 nm處具有明顯的吸收峰,主要由李子表面葉綠素的吸收引起的,反映了李子的表面顏色信息,而980 nm處的吸收峰則主要由李子中的水分吸收所引起的,反映了李子的水分含量信息[17]。
圖2 不同品種的李子平均光譜曲線(xiàn)Fig.2 Average spectral curves of the different varieties of plums
2.2.1 采用SPA選取特征波長(zhǎng) 采用SPA選取特征波長(zhǎng)時(shí),計(jì)算不同有效波長(zhǎng)下的RMSEP,通常根據(jù)最小的RMSEP值確定最佳的特征波長(zhǎng)數(shù)。圖3給出了RMSEP隨SPA中有效波長(zhǎng)數(shù)的變化規(guī)律,由圖3可見(jiàn),RMSEP值隨有效波長(zhǎng)數(shù)的增加而減小,當(dāng)有效波長(zhǎng)數(shù)大于31時(shí),RMSEP變化不明顯,變量過(guò)多會(huì)增加模型的運(yùn)算量和復(fù)雜性,因此選取31個(gè)波長(zhǎng)作為特征波長(zhǎng),這31個(gè)特征波長(zhǎng)按重要性從高到低依次為840.70、369.69、245.49、243.86、377.68、221.86、287.66、507.55、649.82、217.78、230.01、214.51、213.69、225.94、243.04、317.52、255.24、268.23、224.31、234.09、205.52、266.60、323.96、290.90、303.82、208.79、203.06、292.51、221.04、260.92和247.11 nm。
圖3 RMSEP隨SPA中有效波長(zhǎng)數(shù)的變化規(guī)律Fig.3 Variation regulation of RMSEP with the number of effective wavelengths in SPA
2.2.2 采用CARS選取特征波長(zhǎng) 在采用CARS選取特征波長(zhǎng)時(shí),設(shè)定蒙特卡洛采樣次數(shù)為50次,采用5折交叉驗(yàn)證法計(jì)算所建立的PLS模型中的交叉驗(yàn)證均方根誤差RMSECV,結(jié)果如圖4所示。從圖4可以看出開(kāi)始隨著采樣次數(shù)的增加,PLS預(yù)測(cè)模型的RMSECV值逐漸減小,表明在光譜數(shù)據(jù)中大量無(wú)關(guān)或噪聲信息被去除,當(dāng)采樣次數(shù)達(dá)到19時(shí),RMSECV值的增加說(shuō)明在光譜數(shù)據(jù)中一些與李子可溶性固形物含量預(yù)測(cè)相關(guān)的重要變量被剔除。即第19次采樣中獲得的波長(zhǎng)子集建立的PLS模型RMSECV值最小,本文得到的最優(yōu)波長(zhǎng)集包含有104個(gè)特征波長(zhǎng),主要分布在203.06~288.47,340.84~420.70,502.83~538.09和916.19~933.28 nm,說(shuō)明這幾個(gè)區(qū)域是對(duì)李子可溶性固形物含量敏感的波段。
圖4 不同采樣次數(shù)下RMSECV的變化規(guī)律Fig.4 Variation regulation of RMSECV under the different number of sampling times
分別將全光譜(Full Spectra,FS)數(shù)據(jù)以及經(jīng)SPA和CARS選取的特征波長(zhǎng)作為BP網(wǎng)絡(luò)模型的輸入變量,由于BP網(wǎng)絡(luò)模型隨機(jī)選取初始權(quán)值,因此采用50次重復(fù)建模結(jié)果的平均值作為最終結(jié)果,見(jiàn)表2。
表2 基于不同波長(zhǎng)選取方法的BP模型 對(duì)李子可溶性固形物含量的預(yù)測(cè)結(jié)果Table 2 SSC prediction results of plums by BP model based on different variable selection methods
從表2可以看出,CARS-BP模型具有最高的rc(0.998)和rp(0.887),最小的RMSEC(0.026)和RMSEP(1.767),說(shuō)明CARS-BP模型具有最好的校正性能和預(yù)測(cè)性能。FS-BP和SPA-BP模型的校正性能和預(yù)測(cè)性能均劣于CARS-BP模型,另外,采用CARS特征波長(zhǎng)選擇方法從1024個(gè)全光譜波段中選擇了104個(gè)特征變量作為BP網(wǎng)絡(luò)的光譜輸入,明顯提升了BP網(wǎng)絡(luò)模型的運(yùn)行效率。由此表明基于特征光譜建立的BP網(wǎng)絡(luò)對(duì)李子可溶性固形物含量的無(wú)損檢測(cè)具有良好的預(yù)測(cè)能力,可應(yīng)用于李子可溶性固形物含量的無(wú)損檢測(cè)。其中,李子可溶性固形物含量的測(cè)量值和預(yù)測(cè)值如圖5所示。
圖5 李子可溶性固形物含量的預(yù)測(cè)結(jié)果Fig.5 Prediction results of soluble solids content of plums
應(yīng)用紫外/可見(jiàn)光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法構(gòu)建了李子可溶性固形物含量的預(yù)測(cè)模型,采用SNV光譜預(yù)處理方法來(lái)消除噪聲對(duì)光譜信息的影響;對(duì)預(yù)處理后的光譜數(shù)據(jù)應(yīng)用SPA和CARS進(jìn)行降維處理,分別從全光譜的1024個(gè)波長(zhǎng)中提取了31和104個(gè)特征波長(zhǎng);采用BP網(wǎng)絡(luò)模型對(duì)全光譜以及SPA和CARS算法提取的特征波長(zhǎng)分別建模,結(jié)果表明,基于特征波長(zhǎng)建立的CARS-BP網(wǎng)絡(luò)模型為最優(yōu)模型,其rc為0.998,RMSEC為0.026,rp為0.887,RMSEP為1.767。