李天瑞 劉翠玲 位麗娜 吳靜珠 孫曉榮
(北京工商大學(xué)計算機與信息工程學(xué)院;北京市食品安全與大數(shù)據(jù)重點實驗室,北京 100048)
光譜儀器與化學(xué)計量學(xué)理論相結(jié)合形成的近紅外光譜分析技術(shù)具有快速、高效、非破壞、樣品無需預(yù)處理、無污染、無浪費等優(yōu)點。近年來,該技術(shù)在食品領(lǐng)域有著廣泛的應(yīng)用[1-2],國內(nèi)外學(xué)者也在食用油的酸值和過氧化值等指標(biāo)上有著相應(yīng)的研究[3-6]。然而在光譜測量的實際應(yīng)用中,會遇到這種情況,即在一臺儀器(稱為主機)上建立的校正模型,但在另一臺儀器(稱為從機)上的結(jié)果卻偏差較大甚至無法使用。一般將這類問題稱為模型失效問題,解決這類問題一般采用模型轉(zhuǎn)移方法。模型轉(zhuǎn)移可以有效避免重復(fù)建模,實現(xiàn)樣品和數(shù)據(jù)資源的共享,并且模型轉(zhuǎn)移對近紅外光譜技術(shù)應(yīng)用的推廣有著重要意義[7]。
近些年來人們一直在進(jìn)行著模型轉(zhuǎn)移相關(guān)的研究。Galvao R K H等[8]針對小光譜集提出了單變量校正和魯棒性回歸的模型轉(zhuǎn)移方法;Pereira L S A[9]等研究了藥品的粉末狀混合物的模型轉(zhuǎn)移;Ji W等[10]對水稻土中pH值,有機物,總氮含量進(jìn)行了模型轉(zhuǎn)移的研究。其中也不乏一些學(xué)者利用斜率截距校正算法(Slope/Bias Correction,SBC)在不同領(lǐng)域進(jìn)行著模型轉(zhuǎn)移研究。Leion H等[11]的研究顯示,SBC算法可以應(yīng)用到各種儀器上;Qin Y等[12]使用了SBC算法研究了煙草含糖量的模型轉(zhuǎn)移;Li W[13]等利用SBC算法對中藥的重要成分在兩臺儀器間的模型傳遞進(jìn)行了研究并取得了良好的效果;Brito R S等[14]利用SBC算法減小了在線光譜儀之間水質(zhì)檢測的誤差。然而關(guān)于食用油的酸值、過氧化值的近紅外光譜模型在兩臺光譜儀間的轉(zhuǎn)移研究較少,而針對食用油模型轉(zhuǎn)移的研究不僅可以有效的推進(jìn)近紅外光譜在食用油的應(yīng)用,還可以滿足食用油品質(zhì)快速檢測的需要。所以本文利用斜率/截距校正算法(SBC)針對三組實驗儀器的近紅外光譜模型食用油的理化指標(biāo)(酸值、過氧化值)結(jié)合偏最小二乘(Partial Least Squares PLS)建立的矯正模型進(jìn)行了模型轉(zhuǎn)移研究。
斜率/截距校正(Slope/Bias Correction)算法假設(shè)主儀器和從儀器上所測樣本的預(yù)測值之間存在一定的一元線性關(guān)系,通過一元校正算法求得線性關(guān)系的斜率和截距,根據(jù)求得的斜率和截距可實現(xiàn)對待轉(zhuǎn)移樣品預(yù)測結(jié)果的修正,從而實現(xiàn)主、從儀器間的模型轉(zhuǎn)移。
該方法的基本思想為:設(shè)Sm、Ss分別為主、從儀器上采集的樣本光譜矩陣,b為主、從儀器上建立的校正模型的回歸系數(shù)矩陣,則主從儀器上測得樣本的預(yù)測濃度矩陣和光譜矩陣及系數(shù)矩陣存在如式(1)、式(2)所示的關(guān)系。
ym,i=Sm,i×b
(1)
ys,i=Ss,i×b
(2)
式中:ym,i和ys,i分別為主儀器和從儀器所測樣本的預(yù)測濃度值。
假設(shè)ym,i和ys,i存在式(3)關(guān)系:
ym,i=S×ys,i+B
(3)
利用最小二乘法計算斜率(S)和截距(B),則用所建的模型對樣本光譜Xs進(jìn)行預(yù)測后,再利用式(4)對其進(jìn)行校正,即可得到從儀器上所測樣本校正后的預(yù)測濃度。
ys,carr=S×(Xs×b)+B
(4)
式中:Xs為從儀器上所測的待轉(zhuǎn)換的光譜數(shù)據(jù)。
文中設(shè)計的SBC算法的模型轉(zhuǎn)移流程如圖1所示。
圖1 SBC模型轉(zhuǎn)移算法流程圖
2.1 實驗儀器
本次實驗是在北京工商大學(xué)光譜技術(shù)與品質(zhì)檢測研究室和中國農(nóng)業(yè)大學(xué)光譜技術(shù)檢測實驗室完成,用到的光譜檢測儀器為Bruker公司的傅里葉紅外光譜儀VERTEX 70(簡稱V70)和Thermo Scientific公司的傅里葉近紅外光譜儀Antaris Ⅱ(簡稱A Ⅱ)。
表1 光譜儀器及參數(shù)
表1(續(xù))
2.2 實驗樣本光譜采集
本次實驗包括3組實驗,第一組以VERTEX 70紅外光譜儀為主機,Antaris Ⅱ近紅外光譜儀(利用光纖探頭部件)為從機;第二組以VERTEX 70紅外光譜儀為主機,Antaris Ⅱ近紅外光譜儀(利用透射部件)為從機;第三組以Antaris Ⅱ近紅外光譜儀(利用光纖探頭部件)為主機,Antaris Ⅱ近紅外光譜儀(利用光纖探頭部件)為從機。兩臺儀器的具體參數(shù)設(shè)置:分辨率為16 cm-1;樣本掃描次數(shù)為32次;背景掃描次數(shù)為32次;光譜的采集范圍為12 000~4 000 cm-1;光闌設(shè)置:6 mm;掃描速度:10 kHz。
調(diào)查發(fā)現(xiàn)食用油的特征譜區(qū)分布在5 000~5 500波段[15],但為了避免光譜信息的丟失,本次實驗利用的是5 000~9 000 cm-1的光譜數(shù)據(jù),共520個波數(shù)點,兩種儀器采集的4種食用油樣本的近紅外譜圖如圖2所示。
圖2 4種食用油的3種近紅外光譜
2.3 模型傳遞及效果評價
采用校正集樣本在主儀器上建立偏最小二乘模型,利用SBC算法計算標(biāo)準(zhǔn)化樣品分別在主從儀器上的測定光譜的傳遞參數(shù),檢驗集樣本檢驗?zāi)P蛡鬟f效果。利用校正集決定系數(shù)(R2),校正均方根誤差(RMSECV)和預(yù)測均方根誤差(RMSEP)。以及標(biāo)準(zhǔn)偏差S和系統(tǒng)偏差B評價。
(5)
(6)
3.1 食用油酸值模型轉(zhuǎn)移結(jié)果與分析
3.1.1 酸值無模型轉(zhuǎn)移前建模結(jié)果
觀察圖2可以看出,兩臺儀器上采集的相同樣本的3種光譜間存在明顯的差別。利用主儀器采集的40個校正集樣本數(shù)據(jù),結(jié)合PLS算法建立校正模型,利用從儀器采集的無模型轉(zhuǎn)移算法處理的10個驗證集樣本數(shù)據(jù)進(jìn)行預(yù)測,3組實驗結(jié)果分別如圖3~圖5所示,實驗結(jié)果統(tǒng)計如表2所示。
結(jié)果表明,主儀器建立的校正模型較好,而從儀器預(yù)測結(jié)果很差。主儀器上建立的食用油酸值校正模型在從儀器上無法使用,說明了模型轉(zhuǎn)移的必要性。
a 主儀器(V70)建立的酸值校正模型
b 從儀器(A Ⅱ光纖)預(yù)測結(jié)果圖3 第一組實驗主、從儀器酸值建模及預(yù)測結(jié)果
a 主儀器(V70)建立的酸值校正模型
b 從儀器(A Ⅱ透射)預(yù)測結(jié)果圖4 第二組實驗主、從儀器酸值建模及預(yù)測結(jié)果
a 主儀器(A Ⅱ光纖)建立的酸值校正模型
b 從儀器(A Ⅱ透射)預(yù)測結(jié)果圖5 第三組實驗主、從儀器酸值建模及預(yù)測結(jié)果
實驗組R2RMSECVRMSEP主機:VERTEX700.989590.04751654.6756從機:AⅡ(光纖)主機:VERTEX700.949410.092980220.7131從機:AⅡ(透射)主機:AⅡ(光纖)0.977230.070274208.1585從機:AⅡ(透射)
3.1.2 SBC算法模型轉(zhuǎn)移后酸值建模結(jié)果
利用主儀器采集的40個校正集樣本數(shù)據(jù),結(jié)合PLS方法建立的食用油的酸值校正模型,利用從儀器采集的經(jīng)SBC算法處理后的,10個驗證集樣本數(shù)據(jù)進(jìn)行預(yù)測,3組實驗結(jié)果如圖6~圖8所示,實驗結(jié)果統(tǒng)計如表3所示。
a 主儀器(V70)建立的酸值校正模型
b 從儀器(A Ⅱ光纖)預(yù)測結(jié)果
c 模型轉(zhuǎn)移集預(yù)測酸值擬合結(jié)果
a 主儀器(V70)建立的酸值校正模型
b 從儀器(A Ⅱ透射)預(yù)測結(jié)果
c 模型轉(zhuǎn)移集預(yù)測酸值擬合結(jié)果
a 主儀器(A Ⅱ 光纖)建立的酸值校正模型
b 從儀器(A Ⅱ透射)預(yù)測結(jié)果
實驗組SBR2RMSECVRMSEP主機:VERTEX700.7076-2.96170.958610.0947470.44199從機:AⅡ(光纖探頭)主機:VERTEX700.0135-2.80150.949410.0929800.71934從機:AⅡ(透射部件)主機:AⅡ(光纖探頭)0.04039.10050.973460.0673420.95948從機:AⅡ(透射部件)
經(jīng)SBC算法轉(zhuǎn)移后,3組實驗的預(yù)測結(jié)果有了一定的改善,預(yù)測標(biāo)準(zhǔn)偏差RMSEP分別為0.441 9、0.719 3、0.959 5。觀察3組實驗的S(slope)、B(bias)系數(shù)和主、從儀器訓(xùn)練集預(yù)測酸值擬合結(jié)果圖,可以發(fā)現(xiàn)第一組實驗線性相關(guān)性最好,第二組實驗線性相關(guān)性最差,SBC算法對不同儀器間的模型轉(zhuǎn)移效果不同??傮w看來SBC算法對于主機為v70與從機為A Ⅱ(透射部件)效果有限。
3.2 食用油過氧化值模型轉(zhuǎn)移結(jié)果與分析
3.2.1 過氧化值無模型轉(zhuǎn)移前建模結(jié)果
利用主儀器采集的40個校正集樣本數(shù)據(jù),結(jié)合PLS算法建立校正模型,利用從儀器采集的未經(jīng)SBC算法處理的,10個驗證集樣本數(shù)據(jù)進(jìn)行預(yù)測,3組實驗結(jié)果分別如圖9~圖11所示,實驗結(jié)果統(tǒng)計如表4所示。
主儀器上建立的食用油過氧化值定量校正模型,在從儀器上由于預(yù)測標(biāo)準(zhǔn)偏差過大,在從儀器上無法使用。
a 主儀器(V70)建立的過氧化值校正模型
b 從儀器(A Ⅱ光纖)預(yù)測結(jié)果圖9 第一組實驗主、從儀器過氧化值建模及預(yù)測結(jié)果
a 主儀器(V70)建立的過氧化值校正模型
b 從儀器(A Ⅱ透射)預(yù)測結(jié)果圖10 第二組實驗主、從儀器過氧化值建模及預(yù)測結(jié)果
a 主儀器(A Ⅱ光纖)建立的過氧化值校正模型
b 從儀器(A Ⅱ透射)預(yù)測結(jié)果圖11 第三組實驗主、從儀器過氧化值建模及預(yù)測結(jié)果
實驗組R2RMSECVRMSEP主機:VERTEX700.996020.447271912.2194從機:AⅡ(光纖)主機:VERTEX700.942041.716905397.2539從機:AⅡ(透射)主機:AⅡ(光纖)0.969371.241204303.0678從機:AⅡ(透射)
3.2.2 過氧化值模型轉(zhuǎn)移后建模結(jié)果
利用主儀器采集的40個校正集樣本數(shù)據(jù),結(jié)合PLS方法建立的食用油的過氧化值校正模型,利用從儀器采集的經(jīng)SBC算法處理后的,10個驗證集樣本數(shù)據(jù)進(jìn)行預(yù)測,3組實驗結(jié)果如圖12~圖14所示,實驗結(jié)果統(tǒng)計如表5所示。
表5 SBC算法轉(zhuǎn)移后建模結(jié)果
由實驗結(jié)果可以看出,經(jīng)SBC轉(zhuǎn)移后,模型預(yù)測標(biāo)準(zhǔn)偏差RMSEP分別下降了到了6.752、6.205和4.589,實驗證明了該算法在食用油過氧化值定量模型轉(zhuǎn)移中的有效性。觀察三組實驗的S、B系數(shù)和主、從儀器訓(xùn)練集預(yù)測酸值擬合結(jié)果圖,可以發(fā)現(xiàn)仍然是第一組實驗線性相關(guān)性最好,第二組實驗線性相關(guān)性最差。綜合酸值和過氧化值模型轉(zhuǎn)移后的結(jié)果,表明儀器光譜采集原理(同為光纖掃描)越相近,轉(zhuǎn)移效果越好。然而從3組實驗中的從儀器預(yù)測結(jié)果可以看出,預(yù)測結(jié)果與實際結(jié)果仍存在較大的差別,模型需要進(jìn)一步優(yōu)化,轉(zhuǎn)移問題需要更深入的探索研究。
a 主儀器(V70)建立的過氧化值校正模型
b 從儀器(A Ⅱ光纖)預(yù)測結(jié)果
c 模型轉(zhuǎn)移集預(yù)測過氧化值擬合結(jié)果
a 主儀器(V70)建立的過氧化值校正模型
b 從儀器(A Ⅱ透射)預(yù)測結(jié)果
c 模型轉(zhuǎn)移集預(yù)測過氧化值擬合結(jié)果
a 主儀器(A Ⅱ 光纖)建立的過氧化值校正模型
b 從儀器(A Ⅱ透射)預(yù)測結(jié)果
c 模型轉(zhuǎn)移集預(yù)測過氧化值擬合結(jié)果
利用50個實驗樣本,首先將未經(jīng)任何處理的主、從儀器上的食用油近紅外光譜數(shù)據(jù)直接建模預(yù)測,結(jié)果直接說明了模型轉(zhuǎn)移的必要性,然后用SBC算法分別對食用油理化指標(biāo)(酸值、過氧化值)的3組實驗儀器間的近紅外光譜定量模型進(jìn)行了模型轉(zhuǎn)移研究。研究表明,經(jīng)過SBC算法轉(zhuǎn)移后,模型預(yù)測結(jié)果都有了不同程度的改善。并且SBC算法對食用油的酸值的轉(zhuǎn)移效果好于過氧化值,相同原理的儀器有較好的線性度與較好的模型轉(zhuǎn)移效果。但是,經(jīng)SBC算法轉(zhuǎn)移后的模型預(yù)測結(jié)果與理想結(jié)果仍存在很大的差距,食用油酸值和過氧化值的模型轉(zhuǎn)移問題仍需要深入研究。
[1]QU J H,LIU D,CHENG J H,et al. Applications of near-infrared spectroscopy in food safety evaluation and control:a review of recent research advances.Critical Reviews in Food Science and Nutrition,2015,55(13):1939-1954
[2]KUMARAVELU C,GOPAL A Chennai,TAMIL Nadu,India:Institute of Electrical and Electronics Engineers Inc.,2015
[3]MOSSOBA M M,AZIZIAN H,TYBURCZY C,et al.Rapid FT-NIR analysis of edible oils for total SFA,MUFA,PUFA,and trans FA with comparison to GC[J].JAOCS,Journal of the American Oil Chemists’ Society.2013,90(6):757-770
[4]WOJCICKI K,KHMELINSKII I,SIKORSKI M,et al.Near and mid infrared spectroscopy and multivariate data analysis in studies of oxidation of edible oils[J].Food Chemistry.2015,187:416-423
[5]于修燭,張靜亞,李清華,等.基于近紅外光譜的食用油酸價和過氧化值自動化檢測[J].農(nóng)業(yè)機械學(xué)報,2012,09:150-154+159
YU X Z,ZHANG J Y,LI Q H,et al.Automatic Determination of Acid Value and Peroxide Valueof Edible Oils by Near-infrared Spectroscopy[J].Transactions of the Chinese Society for Agricultural Machinery,2012,43(09):150-154+159
[6]CAYUELA SANCHEZ J A,MOREDA W,GARCIA J M.Rapid determination of olive oil oxidative stability and its major quality parameters using vis/NIR transmittance spectroscopy[J].Journal of Agricultural and Food Chemistry.2013,61(34):8056-8062
[7]陸婉珍,褚小立.近五年我國近紅外光譜分析技術(shù)研究與應(yīng)用進(jìn)展[J].光譜學(xué)與光譜分析,2014(10):2595-2605
LU W Z,ZHU X L.Research and application progress of near infrared spectroscopy analytical technology in China in the past five years[J].Spectroscopy and Spectral Analysis,2014(10):2595-2605
[8]GALVAO R K H,SOARES S F C,MARTINS M N,et al.Calibration transfer employing univariate correction and robust regression[J].AnalyticaChimicaActa.2015,864(1):1-8
[9]PEREIRA L S A,CARNEIRO M F,BOTELHO B G,etal.Calibration transfer from powder mixtures to intact tablets:A new use in pharmaceutical analysis for a known tool[J].Talanta.2016,147:351-357
[10]JI W,LI S,CHEN S,et al.Prediction of soil attributes using the Chinese soil spectral library and standardized spectra recorded at field conditions[J].Soil and Tillage Research.2016,155:492-500
[11]LEION H,FOLESTAD S,JOSEFSON M,et al.Evaluation of basic algorithms for transferring quantitative multivariate calibrations between scanning grating and FT NIR spectrometers[J].Journal of Pharmaceutical and Biomedical Analysis.2005,37(1):47-55
[12]QIN Y,GONG H.NIR models for predicting total sugar in tobacco for samples with different physical states[J].Infrared Physics and Technology.2016,77:239-243
[13]LI W,CHENG Z,WANG Y,et al.A study on the use of near-infrared spectroscopy for the rapid quantification of major compounds in Tanreqing injection[J].SpectrochimicaActa-Part A:Molecular and Biomolecular Spectroscopy.2013,101:1-7
[14]BRITO R S,PINHEIRO H M,FERREIRA F,et al.Calibration Transfer between a Bench Scanning and a Submersible Diode Array Spectrophotometer for in Situ Wastewater Quality Monitoring in Sewer Systems[J].Applied Spectroscopy.2016,70(3):443-454
[15]吳靜珠,石瑞杰,陳巖,等.食用油油酸的近紅外特征譜區(qū)優(yōu)選[J].中國糧油學(xué)報,2015,2:118-121
WU J Z,SHI R J,CHEN Y,et al.Research on Selecting Characteristic NIR regions of oleic acid in edible oil[J].Journal of the Chinese Cereals and Oils Association,2015,30(2):118-121.