許文麗,藥林桃,孫 通,胡 田,胡 濤,劉木華,*
(1.江西農(nóng)業(yè)大學(xué)生物光電技術(shù)及應(yīng)用重點(diǎn)實(shí)驗(yàn)室,江西南昌 330045;2.江西省農(nóng)業(yè)科學(xué)院農(nóng)業(yè)工程研究所,江西南昌 330200)
基于CARS-SPA的蘋果可溶性固形物可見(jiàn)/近紅外光譜在線檢測(cè)
許文麗1,藥林桃2,孫 通1,胡 田1,胡 濤1,劉木華1,*
(1.江西農(nóng)業(yè)大學(xué)生物光電技術(shù)及應(yīng)用重點(diǎn)實(shí)驗(yàn)室,江西南昌 330045;2.江西省農(nóng)業(yè)科學(xué)院農(nóng)業(yè)工程研究所,江西南昌 330200)
采用CARS(competitive adaptive reweighted sampling)聯(lián)合連續(xù)投影算法(SPA)方法篩選蘋果可見(jiàn)/近紅外光譜的特征變量,繼而聯(lián)合多種不同建模方法建立蘋果可溶性固形物(SSC)預(yù)測(cè)模型,并對(duì)預(yù)測(cè)模型進(jìn)行對(duì)比研究。研究結(jié)果顯示,采用CARS-SPA聯(lián)合篩選出的31個(gè)變量,通過(guò)采用PLS建立蘋果SSC的可見(jiàn)/近紅外光譜在線檢測(cè)模型性能最穩(wěn)定,其變量數(shù)僅為原始光譜的1.69%,預(yù)測(cè)集的相關(guān)系數(shù)和均方根誤差分別為0.936和0.351%。研究表明采用CARS-SPA能有效提取蘋果SSC的光譜特征變量,能有效簡(jiǎn)化模型并提高模型精度。
可見(jiàn)/近紅外光譜,蘋果,CARS-SPA,PLS,可溶性固形物
蘋果乃世界四大水果之一,我國(guó)目前蘋果總產(chǎn)量位居世界前茅,但出口量很少且國(guó)內(nèi)高端蘋果市場(chǎng)多被國(guó)外進(jìn)口蘋果所占領(lǐng),為改善這一狀況,則需針對(duì)蘋果的內(nèi)在品質(zhì)進(jìn)行檢測(cè),實(shí)行在線分級(jí),以提升我國(guó)蘋果在國(guó)內(nèi)外市場(chǎng)中的競(jìng)爭(zhēng)力。本文選擇對(duì)水果口感的具有極大影響的水果可溶性固形物作為水果內(nèi)部品質(zhì)研究對(duì)象。
近年來(lái),大量研究將可見(jiàn)/近紅外光譜技術(shù)應(yīng)用于水果內(nèi)部品質(zhì)的檢測(cè)[1-8]。目前國(guó)內(nèi)外學(xué)者利用可見(jiàn)/近紅外光譜技術(shù)對(duì)蘋果的內(nèi)部品質(zhì)做了一些研究。歐陽(yáng)愛(ài)國(guó)等[9]對(duì)光譜范圍為482.2~1009.5nm的蘋果可溶性固形物光譜,采用三種方法篩選光譜變量,然后結(jié)合偏最小二乘法建立蘋果SSC的近紅外光譜檢測(cè)模型,結(jié)果顯示GA-PLS方法能夠提高蘋果SSC模 型 精 度 。Jha等[10]采 集900~1700nm范 圍 內(nèi) 的 蘋 果近紅外光譜,對(duì)比不同波段、不同預(yù)處理方法以及不同建模方法所建立的蘋果可溶性固形物、酸度和糖酸比模型結(jié)果可知,多元線性回歸所建立模型效果較好,對(duì)于蘋果可溶性固形物和酸度來(lái)說(shuō)采用多元散射預(yù)處理方法效果最佳,而糖酸比未經(jīng)預(yù)處理效果最優(yōu)。此外其他學(xué)者也對(duì)蘋果的內(nèi)部品質(zhì)進(jìn)行了研究[11-17]。
本研究采用多種預(yù)處理方法對(duì)蘋果SSC的可見(jiàn)/近紅外光譜在線檢測(cè)光譜進(jìn)行處理,繼而聯(lián)合CARS(competitive adaptive reweighted sampling)與 SPA(successive projections algorithm)對(duì)蘋果SSC的可見(jiàn)/近紅外光譜在線檢測(cè)光譜變量進(jìn)行篩選,而后聯(lián)合多種建模方法建立蘋果SSC在線回歸模型,進(jìn)行對(duì)比研究,用以考察CARS-SPA對(duì)蘋果SSC在線回歸模型的影響。
1.1 材料與儀器
蘋果 本實(shí)驗(yàn)所選樣品為購(gòu)自于南昌水果批發(fā)市場(chǎng)的一批蘋果。實(shí)驗(yàn)進(jìn)行前挑選200個(gè)表面沒(méi)有缺陷或碰傷的蘋果,將其表皮擦拭清理干凈,于果柄附近編號(hào),繼而對(duì)樣品進(jìn)行外觀數(shù)據(jù)測(cè)量,將樣品置于室溫下保存12h,使其溫度與室溫基本一致。實(shí)驗(yàn)一共采用200個(gè)蘋果樣品,將實(shí)際測(cè)得的可溶性固形物值中最大值和最小值的樣品直接作為建模集,繼而按3∶1比例隨機(jī)分配建模集和預(yù)測(cè)集,150個(gè)樣品作為建模集用于建立蘋果SSC預(yù)測(cè)模型,50個(gè)樣品作為預(yù)測(cè)集用于評(píng)價(jià)蘋果SSC預(yù)測(cè)模型的性能。
蘋果可見(jiàn)/近紅外光譜在線檢測(cè)系統(tǒng) 見(jiàn)圖1,實(shí)驗(yàn)采用的光譜儀為美國(guó)海洋光學(xué)公司的USB4000微型光纖光譜儀(Ocean Optics,USA),CCD檢測(cè)器,其波長(zhǎng)范圍為465~1150nm;光源為2個(gè)15V/150W的鹵鎢燈,光纖為海洋光學(xué)的Qp600-2-VIS-NIR;折射儀 為 PR101 手 持 式 折 射 儀(Atago Co.,Ltd.,Tokyo,Japan),參比為一個(gè)是直徑為80mm的聚四氟乙烯球;對(duì)射型光電傳感器 滬工牌。
圖1 蘋果近紅外光譜檢測(cè)系統(tǒng)Fig.1 Schematic diagram of the setup for NIR measurement of apple
1.2 光譜采集
光譜數(shù)據(jù)采集前先將該裝置預(yù)熱30min以至系統(tǒng)性能穩(wěn)定,承載水果的機(jī)械傳送系統(tǒng)以0.3m/s的速度運(yùn)行,光譜儀外部觸發(fā)由光電傳感器控制,采用VC6.0編寫的軟件采集和存儲(chǔ)光譜,采集樣品光譜前,先采集參比和暗電流光譜,樣品放置于傳送系統(tǒng)的托盤上,控制每個(gè)樣品于蘋果赤道部位按120°旋轉(zhuǎn)間隔采集3次光譜,光譜由軟件直接換算成吸光度保存,繼而將吸光度光譜用于后續(xù)數(shù)據(jù)處理。
1.3 蘋果SSC的測(cè)定
蘋果可溶性固形物按照國(guó)標(biāo)GB 12295-90的方法測(cè)定,先將蘋果樣品去皮、切片以及剔核,繼而將切片的果肉部分放入壓汁機(jī)進(jìn)行壓榨,將汁液用濾紙過(guò)濾后滴于數(shù)字式折射儀的測(cè)試窗口上測(cè)量其SSC含量,取連續(xù)重復(fù)測(cè)得兩次相同值作為蘋果樣品SSC含量的實(shí)際測(cè)量值。
1.4 數(shù)據(jù)處理分析
1.4.1 數(shù)據(jù)預(yù)處理方法 采用不同預(yù)處理方法結(jié)合PLS建立蘋果SSC的預(yù)測(cè)模型,對(duì)比不同的預(yù)處理方法對(duì)模型性能的影響。本實(shí)驗(yàn)對(duì)蘋果漫透射光譜采用 了 標(biāo) 準(zhǔn) 正 交 變 量 變 換(Standard Normal Variate,SNV)、多 元 散 射 校 正(Multiplicative Scattering Correction,MSC)、基線校正(Baseline)、正交信號(hào)校正法(Orthogonal Signal Correction,OSC)、解趨勢(shì)(Detrending)等預(yù)處理。
1.4.2 CARS-SPA數(shù)據(jù)特征變量?jī)?yōu)選 可見(jiàn)/近紅外本身數(shù)據(jù)量相當(dāng)龐大,為了挑選出有效的光譜數(shù)據(jù)特征變量,簡(jiǎn)化模型,本文采用了CARS聯(lián)合SPA用于挑選出光譜數(shù)據(jù)的特征變量。采用CARS對(duì)蘋果可見(jiàn)/近紅外光譜數(shù)據(jù)進(jìn)行變量?jī)?yōu)選,設(shè)置其蒙特卡羅(MC)采樣次數(shù)為50次,所選擇的波長(zhǎng)變量子集采用10折PLS交叉驗(yàn)證建模,通過(guò)RMSEC值最小確定最優(yōu)的變量子集本研究采用,繼而采用SPA對(duì)經(jīng)CARS挑選出的變量子集進(jìn)行二次挑選,以期獲得更少的特征變量,建立性能更加簡(jiǎn)單、穩(wěn)定的模型。
數(shù) 據(jù) 處 理 分 析 由 化 學(xué) 計(jì) 量 學(xué) 軟 件 The Unscrambler x 10.1 (CAMO AS,Trondheim,Norway)和Matlab 7.11(The Math Works,Inc,USA)實(shí)現(xiàn)。
選擇均方根誤差以及相關(guān)系數(shù)作為本研究評(píng)價(jià)模型性能的標(biāo)準(zhǔn)。模型的相關(guān)系數(shù)值越高,均方根誤差值越小,則模型的預(yù)測(cè)能力則越強(qiáng)。
2.1 蘋果可溶性固形物值統(tǒng)計(jì)結(jié)果
200個(gè)蘋果總樣本集以及經(jīng)隨機(jī)挑選后分集統(tǒng)計(jì)所得出的建模集、預(yù)測(cè)集的樣本數(shù)量、可溶性固形物變化范圍、平均值以及標(biāo)準(zhǔn)差如表1所示,所有樣本、建模集和預(yù)測(cè)集樣本的SSC的平均值、標(biāo)準(zhǔn)偏差及范圍均較為接近,且建模集的SSC范圍略大于預(yù)測(cè)集,由此可知蘋果建模集所建立的模型能很好的適用于預(yù)測(cè)集樣品。
表1 蘋果可溶性固形物的統(tǒng)計(jì)結(jié)果Table 1 The statistical results of soluble solids content of apple
2.2 蘋果可見(jiàn)/近紅外光譜分析
本實(shí)驗(yàn)光譜儀的檢測(cè)范圍為465~1150nm,共計(jì)3648個(gè)樣本變量點(diǎn),采用如此龐大的數(shù)據(jù)進(jìn)行計(jì)算,不僅計(jì)算量大,而且因樣品部分區(qū)域的光譜信息與樣品SSC成分關(guān)聯(lián)性極弱,而光譜數(shù)據(jù)兩端因靠近檢測(cè)器檢測(cè)極限兩端時(shí)會(huì)存在一些噪聲,故此本文剔除兩端光譜信息,選取600~950nm,共計(jì)1832個(gè)變量數(shù)作為后續(xù)處理數(shù)據(jù)。圖2為600~950nm范圍內(nèi)200個(gè)蘋果樣品的可見(jiàn)/近紅外光譜圖,可見(jiàn)該波段范圍內(nèi)存在較多波峰波谷,所含信息量豐富,適合用于建立同蘋果SSC的預(yù)測(cè)模型。
圖2 蘋果樣本的可見(jiàn)/近紅外光譜Fig.2 Vis/NIR spectra of all apple samples
2.3 預(yù)處理方法比較
對(duì)波段范圍為600~950nm樣本的透射光譜采用不同預(yù)處理結(jié)合PLS建模結(jié)果如表2所示,由表2可知,SNV、MSC、Baseline以及De-trending并不適合用于本數(shù)據(jù)預(yù)處理,所建立的模型性能均不如原始光譜所建立的PLS模型,而OSC與原始PLS模型性能相差無(wú)幾,并無(wú)明顯改善,因此對(duì)比多種預(yù)處理方法結(jié)合PLS建模結(jié)果得知,選用原始光譜用作后續(xù)數(shù)據(jù)處理更為合適。
表2 不同預(yù)處理方法的模型結(jié)果Table 2 The model results of different pretreatment methods
2.4 CARS-SPA
采用CARS對(duì)蘋果可見(jiàn)/近紅外光譜數(shù)據(jù)進(jìn)行變量?jī)?yōu)選,經(jīng)CARS挑選出的包含113個(gè)特征變量,將113個(gè)特征變量經(jīng)SPA二次挑選出31個(gè)特征變量,同1832個(gè)原始變量數(shù)相比,僅占1.69%。CARS和CARSSPA聯(lián)合PLS分別建立蘋果可溶性固形物模型,其結(jié)果如表3顯示,CARS-PLS與CARS-SPA-PLS同原始的PLS模型相比,建模性能都略顯不足,但利用預(yù)測(cè)集對(duì)模型進(jìn)行預(yù)測(cè),預(yù)測(cè)效果卻有較大提升。由表3可知,CARS-SPA-PLS比CARS-PLS和原始PLS,不僅變量數(shù)目極大減少了而且模型性能也更加穩(wěn)定,因此本研究確定CARS-SPA為本文的變量?jī)?yōu)選方法。
表3 不同變量?jī)?yōu)選方法的蘋果可溶性固形物結(jié)果Table 3 Results of SSC of apple using different varaibles select methods
2.5 不同建模方法比較
表4為CARS-PCA聯(lián)合不同建模方法所得出的模型性能結(jié)果。本研究對(duì)比了PLS、PCA、MLR、LSSVM四種建模方法用于建立蘋果的可溶性固形物模型,由表4可知,PCA建模效果最差,LS-SVM模型效果略好些,PLS與MLR模型效果較好。判斷模型優(yōu)劣時(shí),不單要求相關(guān)系數(shù)高、均方根誤差小,并且要求建模均方根誤差同預(yù)測(cè)均方根誤差間差值也小,故本研究選擇CARS-SPA-PLS作為最佳模型,采用50個(gè)預(yù)測(cè)集樣本對(duì)該模型進(jìn)行預(yù)測(cè)所得關(guān)系如圖3所示,回歸線表達(dá)式為y=0.8248x+2.1673。
表4 不同建模方法的蘋果可溶性固形物結(jié)果Table 4 Results of SSC of apple using different modeling methods
圖3 蘋果預(yù)測(cè)集樣本的可溶性固形物預(yù)測(cè)結(jié)果Fig.3 Predicted results of SSC of apple in prediction set
本文采用可見(jiàn)/近紅外光譜聯(lián)合CARS-SPA變量?jī)?yōu)選對(duì)蘋果的SSC進(jìn)行快速無(wú)損在線檢測(cè)研究。CARS-SPA聯(lián)合PLS所建立的蘋果SSC預(yù)測(cè)模型性能最優(yōu)。與全光譜PLS預(yù)測(cè)模型相比,建模變量數(shù)從1832個(gè)下降到31個(gè),預(yù)測(cè)集的相關(guān)系數(shù)由0.837上升到0.936,均方根誤差由0.541%下降為0.351%。研究結(jié)果顯示,CARS-SPA方法能有效應(yīng)用于蘋果SSC的在線可見(jiàn)/近紅外光譜變量篩選,能降低建模變量數(shù),簡(jiǎn)化預(yù)測(cè)模型,提高預(yù)測(cè)模型的穩(wěn)定性。
[1]Camps C,Christen D.Non-destructive assessment of apricotfruit quality by portable visible-near infrared spectroscopy[J]. LWT-Food Science and Technology,2009,42(6):1125-1131.
[2]Paz P,Sánchez M T,Pérez-Marín D,et al.Instantaneous quantitative and qualitative assessment of pear quality using near infrared spectroscopy[J].Computers and Electronics in Agriculture,2009,69(1):24-32.
[3]Jha S N ,Jaiswal P ,Narsaiah K ,et al.Non-destructive prediction of sweetness of intact mango using near infrared spectroscopy[J].Scientia Horticulturae,2012,138:171-175.
[4]王加華,戚淑葉,湯智輝,等.便攜式近紅外光譜儀的蘋果糖度模型溫度修正[J]. 光譜學(xué)與光譜分析,2012,32(5):1431-1434.
[5]Moghimi A,Aghkhani M H,Sazgarnia A,et al.Vis/NIR spectroscopy and chemometrics for the prediction of soluble solids content and acidity(pH) of kiwifruit[J].Biosystems Engineering,2010,106(3):295-302.
[6]韓東海,常冬,宋曙輝,等.小型西瓜品質(zhì)近紅外無(wú)損檢測(cè)的光譜信息采集[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2013,44(7):174-178.
[7]代芬,蔡博昆,洪添勝,等.漫透射法無(wú)損檢測(cè)荔枝可溶性固形物[J]. 農(nóng)業(yè)工程學(xué)報(bào),2012,28(15):287-292.
[8]朱偉興,江輝,陳全勝,等.梨可溶性固形物含量NIR與變量篩選無(wú)損檢測(cè)[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2010,41(10):129-133.
[9]歐陽(yáng)愛(ài)國(guó),謝小強(qiáng),周延睿,等.蘋果可溶性固形物近紅外光譜檢測(cè)的偏最小二乘回歸變量篩選研究[J]. 光譜學(xué)與光譜分析,2012,32(10):2680-2684.
[10]Jha S N,Garg R.Non-destructive prediction of quality of intact apple using near infrared spectroscopy[J].Journal of Food Science and Technology,2010,47(2):207-213.
[11]孫炳新,匡立學(xué),徐方旭,等.蘋果有效酸度的近紅外無(wú)損檢測(cè)研究[J]. 食品工業(yè)科技,2013,34(15):298-301.
[12]孫炳新,匡立學(xué),徐方旭,等.蘋果脆度的近紅外無(wú)損檢測(cè)[J]. 食品與發(fā)酵工業(yè),2013,39(5):185-189.
[13]袁雷明,高海寧,呂松,等.可見(jiàn)/近紅外光譜半透射法檢測(cè)蘋果中可溶性固形物含量[J]. 食品安全質(zhì)量檢測(cè)學(xué)報(bào),2012,3(5):448-452.
[14]高玨,王從慶.基于 KPCA蘋果近紅外光譜的特征提取研究[J]. 食品科技,2012(3):275-278.
[15]周林峰,呂進(jìn),劉輝軍,等.溫度對(duì)果糖含量近紅外光譜檢測(cè)模型傳遞的影響[J]. 中國(guó)計(jì)量學(xué)院學(xué)報(bào),2012,23(3):217-221.
[16]孫旭東,郝勇,劉燕德. 蘋果可溶性固形物近紅外光譜在線檢測(cè)影響因素研究[J]. 中國(guó)農(nóng)機(jī)化學(xué)報(bào),2013(1):86-90.
[17]王加華,戚淑葉,湯智輝,等.便攜式近紅外光譜儀的蘋果糖度模型溫度修正[J]. 光譜學(xué)與光譜分析,2012,32(5):1431-1434.
CARS-SPA baesd Visble/near Infraed spectroscopy on-line detection of apple soluble solids content
XU Wen-li1,YAO Lin-tao2,SUN Tong1,HU Tian1,HU Tao1,LIU Mu-hua1,*
(1.Optics-Electronics Application of Biomaterials Lab,Jiangxi Agricultural University,Nanchang 330045,China;2.Institute of Agricultural Engineering,Jiangxi Academy of Agricuhural Sciences,Nanchang 330200,China)
CARS was combined with SPA to select the important variables from the visible/near infrared spectrum of apple , then a variety of different modeling methods was used to develop calibration models for SSC of apple , finally , some comparative studies was done among those models.The analysis results showed that 31 variables which selected by CARS-SPA and PLS could build the most stable on-line detection model of apple soluble solids solids (SSC ) ,in this prediction model,the number of variables was only 1.69 percent of the orginal spectrum , the correlation coefficient of prediction and root mean square error of prediction were 0.936,0.351%repectively.This study showed CARS-SPA could effectively extract important variables from spectrum of apple SSC , also it could simplify and improve the accuracy of prediction model effectively.
visible/near-infrared spectroscopy;apple;CARS-SPA;PLS;SSC
TS255.1
A
1002-0306(2014)22-0061-04
10.13386/j.issn1002-0306.2014.22.004
2014-02-28
許文麗(1990-),女,碩士研究生,研究方向:農(nóng)產(chǎn)品無(wú)損檢測(cè)。
* 通訊作者:劉木華(1969-),男,博士,教授,研究方向:農(nóng)產(chǎn)品光學(xué)檢測(cè)研究。
國(guó)家自然科學(xué)基金項(xiàng)目(31271612);留學(xué)人員科技活動(dòng)項(xiàng)目(2012);江西省教育廳科學(xué)研究基金(GJJ13254)。