王亞紅,周 萍,董大明,鄭文剛,葉 松,王文重
(1.桂林電子科技大學,廣西桂林 541004; 2.北京農(nóng)業(yè)智能裝備技術研究中心,北京市農(nóng)林科學院,北京 100097)
基于PCR和PLS的蔗糖濃度透反射測量方法研究
王亞紅1,2,周 萍1,董大明2,鄭文剛2,葉 松1,2,王文重1,2
(1.桂林電子科技大學,廣西桂林 541004; 2.北京農(nóng)業(yè)智能裝備技術研究中心,北京市農(nóng)林科學院,北京 100097)
利用近紅外透反射光譜技術,研究短波近紅外光譜(780~1100nm)無損檢測蔗糖溶液的可行性,并通過主成分回歸(PCR)和偏最小二乘(PLS)方法建立了蔗糖溶液的近紅外定量分析模型。采用Savitzky-Golay卷積平滑(5點)和多元散射校正(MSC)進行預處理,并且對預處理后的數(shù)據(jù)進行建模分析。PCR定量分析的結果:主成分數(shù)PC=7,交互驗證相關系數(shù)RCV=0.957335,交互驗證的校正標準偏差RMSECV=0.015859;PLS定量分析結果:主成分數(shù)PC=4,交互驗證相關系數(shù)RCV=0.975789,交互驗證的校正標準偏差RMSECV=0.012251。分別用PCR和PLS的校正模型對預測集樣本進行預測,兩種模型的預測標準偏差RMSEP分別為0.0127,0.0118。二者均對高濃度蔗糖溶液的預測結果比較理想,而且在PLS模型下,77%以上的樣本相對誤差在10%以下,較PCR模型的高。綜合結果,PLS所建立的模型簡單,而且精度很高,所以,基于短波近紅外光譜的蔗糖濃度的快速無損檢測是可行的。
近紅外光譜;透反射;蔗糖;偏最小二乘;主成分回歸
近年來,采用近紅外光譜分析技術可對樣品光譜數(shù)據(jù)進行定量或者定性分析,具有快速、無損、無需樣品預處理等特點,已廣泛應用于食品衛(wèi)生安全監(jiān)測方面,例如Ann Peirs、Ann Schenk等利用可見/近紅外光譜檢測7種蘋果在1999—2003年的成熟度,建立了近紅外光譜定量分析蘋果成熟度的模型[1],屠振華、朱大洲應用近紅外光譜結合模式識別方法(LS-SVM)對蜂蜜摻假現(xiàn)象進行了識別分析[2],對摻假蜂蜜的正確判別率能達到100%。江西農(nóng)業(yè)大學的張露采用可見/近紅外光譜技術對含有不同濃度三聚氰胺的165份牛奶樣本進行檢測[3]。Loredana F.Leopol,Nicolae Leopold[4]等人用FTIR光譜儀透射法測量果汁的糖度,校正集模型的相關系數(shù)達到0.936等。相關研究人員分析了近紅外光譜和樣本內部質量指標之間的關系,證實了將近紅外光譜應用于固態(tài)、液態(tài)無損檢測的可行性。
蔗糖是人類基本的食品添加劑,冰糖、白砂糖、綿白糖和赤砂糖都含有不同純度的蔗糖。糖的傳統(tǒng)分析方法有離子高效液相色譜法[5-6]、離子色譜法[7]和比色法[8]等,這些方法操作時間長、費用高,不適宜在線分析。饒震紅、李民贊[9]采用短波近紅外光譜法同時定量分析水溶液中葡萄糖、果糖和蔗糖,校正集以及預測集的相對標準偏差均低于4%。但是定量分析模型比較單一,運用不同的定量分析模型建模并對預測集進行預測的研究相對較少。本文通過近紅外透反射光譜技術檢測溶液中的蔗糖,采用PCR和PLS兩種定量分析方法進行建模,對比分析兩種方法的模型預測精度。
綿白糖400 g,用純凈水配制60個樣本溶液(濃度范圍:0~30%),用500 mL燒杯盛裝,溶液定容至300 mL。實驗樣品分成校正集樣本48個,預測集樣本12個。
實驗采用CCD近紅外光譜儀(AvaSpec-2048,Avantes,The Netherlands)。糖度計為海鷗光學儀器廠的ATC型手持折光儀(0~32%),最小刻度值為0.2%。內部帶有溫度補償裝置,溫度自動補償范圍10~30℃。
取少許配置好的蔗糖溶液,滴在ATC型手持糖度計折光儀棱鏡表面,關上輔助棱鏡,朝向光源處并調節(jié)目鏡視度圈,使視野內出現(xiàn)清晰明暗分界線,分界線相應的讀數(shù)即蔗糖溶液的濃度。每次測量時應保持棱鏡表面的清潔。
采用Avantes近紅外光譜儀的浸入式透反射光纖探頭,如圖1所示,光源為石英鹵素燈12W/12V,檢測器為2048像元線性陣列CCD檢測器,采集的光譜范圍為300~1100 nm,CCD積分時間為45 ms,掃描次數(shù)為25,平均值設為10,光程為10 mm。實驗在自行設計的密閉環(huán)境中進行,對不同濃度蔗糖溶液的吸光度進行測量,以純凈水為背景進行背景光譜的采集。
圖1 實驗原理圖Fig.1 Experimental schematic
因為短波近紅外波段主要是含氫基團C-H,NH,O-H伸縮振動的倍頻與合頻吸收[10-11],所以選取780~1100 nm波段內溶液的吸光度值。
如圖2所示,隨著蔗糖溶液濃度的遞增,蔗糖溶液的吸光度值增大,蔗糖溶液的原始光譜圖存在基線漂移、平移的現(xiàn)象,光譜存在較大噪聲。所以在建模之前,本文采用Camo公司The Unscrambler 9.7軟件對原始光譜數(shù)據(jù)進行預處理,預處理方法采用Savitzky-Golay(S-G)卷積平滑法和MSC(multiplicative scattering correction)多元散射校正法,S-G卷積平滑法是通過多項式對移動窗口內的數(shù)據(jù)進行多項式最小二乘擬合,經(jīng)過大量實驗,移動窗口的寬度為5時模型精度最優(yōu),MSC主要用來消除顆粒分布不均以及顆粒大小產(chǎn)生的散射[12],對原始光譜依次進行(S-G)卷積平滑和MSC預處理后,有效的消除了原始光譜中的漂移,強化了譜帶特征。預處理后的光譜如圖3所示。
圖2 原始光譜Fig.2 Original spectra
圖3 預處理后的光譜Fig.3 Spectra after pretreatment
主成分回歸(PCR)和偏最小二乘(PLS)是兩種不同的建模方法,它們都能夠達到對光譜數(shù)據(jù)降維的目的[12-13],但是,PLS考慮到樣品濃度矩陣的影響,可以對濃度矩陣做同樣的處理,消除其無用的信息[13]。
選用47份校正集樣本,利用軟件 The Unscrambler 9.7對蔗糖濃度的測量值與吸光度數(shù)據(jù)進行相關性分析,采用PCR和PLS建立模型,模型的最佳主成分個數(shù)由交互驗證(cross-validation)法確定[14-15]。兩種建模方式下蔗糖溶液交互驗證的預測值和測量值的對應關系如圖4、圖5所示。
圖4 校正集樣本的PCA回歸模型Fig.4 PCA model regression figure of calibration set
圖5 校正集樣本的PLS回歸模型Fig.5 PLSmodel regression figure of calibration set
如圖4、圖5所示,橫坐標表示蔗糖溶液的真值,縱坐標是蔗糖溶液的預測值,圖中的坐標點都緊緊圍繞在擬合的直線附近,而且直線的斜率分別是0.96114,0.97664,都近似等于1。PCR模型的預測結果為:PC=7,RCV=0.957335,RMSECV= 0.015859。PLS模型的預測結果為:PC=4,RCV= 0.975789,RMSECV=0.012251。綜合比較,兩種方法的預測精度都比較高,但是,PLS模型的交互驗證相關系數(shù)RCV=0.975789,略高于PCR模型,交互驗證標準偏差RMSECV也比PCR模型的小,而且,PLS模型的主成分是4,與PCR模型相比,減少了運算量,模型相對簡單[16-17],所以,PLS模型比 PCR模型的預測精度更高。
用已建立的數(shù)學模型(PCR、PLS)對13個預測集樣品的糖度進行預測,預測樣品的濃度范圍: 6.6%~27.2%,兩種模型下蔗糖溶液的預測值和真實值的對應關系如圖6、圖7所示,12個預測集樣品的真實值、預測值及相對誤差如表1所示。
圖6 預測集樣本PCR回歸的真實值與預測值的相關性Fig.6 The correlation of predicted values and real values by PCR in prediction set
圖7 預測集樣本PLS回歸的真實值與預測值的相關性Fig.7 The correlation of predicted values and real values by PLS in prediction set
表1 預測集樣本的真實值、預測值及相對誤差Tab.1 The predicted results of 13 samples in prediction set %
由圖6、圖7可知,擬合直線的斜率分別是0.9331,0.94134,均大于 0.9,RMSEP分別是0.0127,0.0118,PLS預測結果的 RMSEP略小于PCR模型。
由表1可知,PCR模型的預測結果:樣本號為1,2,3,5,6的蔗糖溶液的預測結果不是很理想,其相對誤差均在10%以上;60%以上的樣本的相對誤差在10%以內。PLS模型的預測結果:1~3號樣本的相對誤差在10%以上,其余樣本的相對誤差均在10%以內。綜合比較,PCR、PLS兩種方法均對高濃度蔗糖溶液的預測結果理想,而且,PLS模型對77%以上的樣本預測精度較高,所以與PCR模型相比,PLS的建模方式最優(yōu)。
采用短波近紅外光譜透反射方式采集蔗糖溶液的光譜,并用兩種定量分析方法PCR、PLS進行建模分析。結果表明:①兩種模型預測結果都比較好,但PLS模型的精度略高于PCR模型,且PLS模型更為簡潔。②兩種模型均對高濃度蔗糖溶液的預測結果比較理想,PLS對77%以上的預測集樣本預測結果比較好,而PCR僅對60%以上的樣本預測結果好。所以,PLS模型性能更優(yōu),運用近紅外光譜透反射技術進行蔗糖溶液濃度的無損檢測是可行的。
[1]Ann Peirs,Ann Schenk.Postharvest effect of natural variability among apples on the accuracy of VIS-NIR calibrationmodels for optimalharvest date predictions[J].Biology and Technology,2005,35:1-13.
[2]TU Zhenhua,ZHU Dazhou,JIBaoping,et al.Adulteration detection of honey based on near-infrared spectroscopy[J].Transactions of the CSAE,2011,27(11):382-387.(in Chinese)
屠振華,朱大洲,籍保平.基于近紅外光譜技術的蜂蜜摻假識別[J].農(nóng)業(yè)工程學報,2011,27(11): 382-386.
[3]ZHANG Lu.Nondestructive detection of melamine and pesticide residue in themilk products based on raman and VIS/NIR spectroscopy technology[D].Nanchang:Jiangxi Agricultural University,2012,5.(in Chinese)
張露.奶產(chǎn)品中三聚氰胺和農(nóng)藥殘留的拉曼及可見/近紅外光譜無損檢測技術研究[D].南昌:江西農(nóng)業(yè)大學,2012,5.
[4]Loredana F.Leopol,Nicolae Leopold,Horst-A.Diehl.Quantification of carbohydrates in fruit juices using FTIR spectroscopy and multivariate analysis[J].Spectroscopy,2011,26:93-104.
[5]JIANG Xiaotong,CHEN Guosong,JIANG Lingling,et al.Simultaneous HPLC determination of 6 sweeteners[J].Food Science,2011,32(6):165-168.(in Chinese)
蔣曉彤,陳國松,姜玲玲,等.高效液相色譜法同時檢測6種甜味劑[J].食品科學,2011,32(6):165-168.
[6]YANG Xiaoqi.Study on determination of sweetener additives and organic acids in food with high performance liquid chromatography and their application[D].Chengdu: Sichuan University,2007,5.(in Chinese)
楊曉琪.食品中甜味劑、有機酸的高效液相色譜分析方法研究及其應用[D].成都:四川大學,2007,5.
[7]XU Li.Application studies to the determination of gallic acid and soluble sugars by Ion chromatography[D].Chongqing:Southwest university,2012,6.(in Chinese)
許麗.離子色譜法在沒食子酸和可溶性糖類分析中的應用研究[D].重慶:西南大學,2012,6.
[8]MO Shuxun,QIAN Chengliang.Colorimetric method to determine content of soluble sugar[J].Journal of Fruit Science,1992,9(1):59-62.(in Chinese)
莫淑勛,錢承梁.果實中可溶性糖的比色法測定[J].果樹科學,1992,9(1):59-62.
[9]RAO Zhenhong,LIMinzan,JI Haiyan.Simultaneous determination ofglucose,fructose and sucrose in aqueous solution by shor-twavelength near infrared[J].Spectroscopy Spectroscopy and Spectral Analysis,2006,26(4): 633-635.(in Chinese)
饒震紅,李民贊,吉海彥.短波近紅外光譜法同時定量分析水溶液中葡萄糖、果糖和蔗糖[J].光譜學與光譜分析,2006,26(4):633-635.
[10]XIE Jun,PAN Tao,CHE Jiemei.Joint optimization of Savitzky-Golay smoothingmodels and partial least squares factors for near-infrared[J].Spectroscopic Analysis of Serum Glucose.Analytical Chemistry,2010,3(8):342-346.(in Chinese)
謝軍,潘濤,陳潔梅.血糖近紅外光譜分析的Savitzky-Golay平滑模式與偏最小二乘法因子數(shù)的聯(lián)合優(yōu)選[J].分析化學,2010,38(3):342-346.
[11]DING Haiquan,LU Qipeng,CHEN Jiemei.Effectof variable optical path length on the accuracy of the model in noninvasive biochemical detection by NIR spectrum[J].Acta Optica Sinica,2012,32(4):1-6.(in Chinese)
丁海泉,盧啟鵬,陳星旦.近紅外光譜無創(chuàng)生化檢測中不定光程對模型精度的影響研究[J].光學學報,2012,32(4):1-6.
[12]ZHU Xiaoli.Molecular spectroscopy analytical technology combined with chemistries and its applications[M].Beijing:Chemical Industry Press.2011.(in Chinese)
褚小麗.化學計量學方法與分子光譜分析技術[M].北京:化學工業(yè)出版社,2011.
[13]LUO Yunhan.Analyses on internal interferer factors in noninvasive measurement of blood glucose concentration with near-infrared spectroscopy[J].Laser& Infrared,2008,38(5):465-471.(in Chinese)
羅云瀚.近紅外光譜無創(chuàng)傷血糖濃度測量的內部干擾因素分析[J].激光與紅外,2008,38(5):465-471.
[14]Natalia Soro,Eleuterio Arancibia,Santiago A.Bortolato.Visible/near infrared-partial least-squares analysis of Brix in sugar cane juice A test field for variable selectionmethods[J].Chemo-metrics and intelligent laboratory systems,2010,102:100-109.
[15]ZHAO Ke,XIONG Yan,ZHAO Min.Rapid non-destructive testing of navel orange based on near infrared spectroscopy[J].Laser&Infrared,2011,41(6):649-652.(in Chinese)
趙珂,熊艷,趙敏.基于近紅外光譜技術的臍橙快速無損檢測[J].激光與紅外,2011,41(6):649-652.
[16]YANG Chunmei,LINing,ZHAO Xuehong,et al.Recent developments of NIRS technique for nondestructivemeasurement of fruitand vegetable interior quality[J].Laser&Infrared,2009,39(11):1137-1141.(in Chinese)
楊春梅,李寧,趙學玒,等.用于果蔬內部品質無損檢測的NIRS技術新進展[J].激光與紅外,2009,39 (11):1137-1141.
[17]ZHAO Jiewen,ZHANG Donghai,LIU Muhua.Non-destructive determination of sugar contents o f apples using near infra red diffuse reflectance[J].Transactions of the CSAE,2005,21(3):162-167.(in Chinese)
趙杰文,張海東,劉木華.利用近紅外漫反射光譜技術進行蘋果糖度無損檢測研究[J].農(nóng)業(yè)工程學,2005,21(3):162-167.
Sucrose concentration measurement by transm ission and reflection spectroscopy based on PCR and PLS
WANG Ya-hong1,2,ZHOU Ping1,DONG Da-ming2,ZHENGWen-gang2,YE Song1,2,WANGWen-zhong1,2
(1.School of Electronic Engineering and Automation,Guilin University of Electronic Technology,Guilin 541004;
2.Beijing Research Center for Intelligent Equipment for Agriculture,Beijing Academy of Agriculture and Forestry Sciences,Beijing 100097,China)
Near-infrared spectra of trans-reflective is applied to determine the feasibility of nondestructive testing of the sucrose solution in the near-infrared wavelength range of 780~1100nm,and principal component regression(PCR) and partial least squares(PLS)are used to establish the near-infrared quantitative analysismodel of sucrose solution.After the pretreatment of(Savitzky-Golay)5 points smoothing and multiplicative scatter correction(MSC),the (PCR and PLS)calibration model ismade.The results of quantitative analysis of PCR are the number of principal component PC=7,the correlation coefficient RCV=0.957335,rootmean square error of cross validation RMSECV= 0.015859;The results of quantitative analysis of PLS are the number of principal component PC=4,the correlation coefficient RCV=0.975789,rootmean square error of cross-validation RMSECV=0.012251.The prediction samples are predicted respectively by the calibration model of PCR and PLS.Root mean square errors of prediction are 0.0127,0.0118 respectively.Both of themethods are satisfactory for the predicted results of high concentration samples.The relative errors ofmore than 77%of validation samples are below 10%using PLS.All of results show that PLSmodel is simpler and its prediction accuracy is higher,and short-wave near-infrared spectrometry is a valuable,rapid and nondestructive tool for the quantitative analysis of sucrose solution.
near infrared spectroscopy;transmission and reflection;sucrose;partial least squares;principal component regression
TN219
A
10.3969/j.issn.1001-5078.2014.05.011
1001-5078(2014)05-0528-05
國家自然科學青年基金(No.31101748);北京市農(nóng)林科學院創(chuàng)新能力建設專項(No.KJCX201102001)資助。
王亞紅(1987-),女,碩士研究生,主要從事近紅外光譜檢測儀器應用研究。E-mail:547573454@qq.com
2013-08-12;
2013-09-09