胡潤文,夏俊芳
(華中農(nóng)業(yè)大學工學院,湖北 武漢 430070)
臍橙總糖近紅外光譜模型傳遞研究
胡潤文,夏俊芳*
(華中農(nóng)業(yè)大學工學院,湖北 武漢 430070)
為實現(xiàn)近紅外光譜模型在同類光譜儀器間的共享,以臍橙總糖為例,在主儀器上建立最優(yōu)的偏最小二乘(PLS)近紅外光譜模型,采用斜率截距(Slope/Bias)校正法和直接校正(DS)算法把主儀器上建立的模型傳遞到從儀器上,并探討標準化樣品個數(shù)對模型傳遞效果的影響。研究表明:在主儀器建立的模型經(jīng)DS算法傳遞后,從儀器預測集的預測標準差(RMSEP)為0.448%,經(jīng)Slope/Bias校正法傳遞后的預測標準差(RMSEP)為0.756%,DS算法更優(yōu)于Slope/Bias校正法,利用直接校正法實現(xiàn)臍橙總糖傅里葉近紅外光譜模型傳遞是可行的。
臍橙;總糖;近紅外;斜率截距法;直接校正法;模型傳遞
臍橙營養(yǎng)豐富,含有人體所必需的各類營養(yǎng)成分,糖度是決定其風味最重要的指標,如何對其進行快速準確的測定具有重要意義。近紅外光譜分析技術(shù)(near infrared reflectance spectroscopy,NIRS)具有處理樣品簡單、分析速度快、無污染、無損等特點,已在果品成分含量的檢測中得到廣泛應用[1-6]。夏俊芳等[7-9]研究了基于近紅外光譜的臍橙內(nèi)部品質(zhì)的無損檢測方法,但是不同的近紅外儀器間由于儀器元器件的選用、裝配誤差和測量環(huán)境的不同,使得相同樣品的光譜數(shù)據(jù)存在一定的差異,導致一臺儀器上建立的模型無法在另一臺儀器上使用[10]。要解決模型在近紅外儀器間的通用,最經(jīng)濟有效的方法是利用化學計量學算法來實現(xiàn)模型傳遞。模型傳遞的本質(zhì)是克服樣品在不同儀器上的測量光譜的不一致性,經(jīng)過傳遞的模型即可用于新的樣品或新的測試環(huán)境[11]。
近年來,國內(nèi)外學者對近紅外光譜儀之間的模型傳遞做了許多相關(guān)研究。Alamar[12]、Greensill[13]、Roggo[14]等分別研究了蘋果和橘子可溶性固形物以及甜菜糖度近紅外光譜模型的傳遞,劉賢[15]等研究了青貯飼料的近紅外光譜模型在不同類型光譜儀之間的傳遞,褚小立等[16]針對國產(chǎn)的CCD近紅外光譜儀,采用普魯克分析法解決了模型傳遞問題,林振興等[17]通過分段直接校正(PDS)算法有效地解決了樣品溫度對近紅外光譜的影響。趙龍蓮[18]、李慶波[19]、陳斌[20]等分別將移動窗口支持向量回歸機(SVR)方法、直接校正(DS)算法、專利算法應用于多元校正中的模型傳遞,均取得了不錯的效果,可見經(jīng)模型傳遞后提高了模型的預測精度。但是關(guān)于臍橙總糖近紅外光譜模型在兩臺傅里葉光譜儀間的傳遞研究較少。本實驗以贛南臍橙為對象,采用Slope/Bias校正法和DS算法兩種方法,研究臍橙總糖含量的近紅外光譜模型在兩臺傅里葉近紅外光譜儀間的共享。
1.1 樣品與光譜的采集
實驗樣品從江西省定南縣果園里隨機采摘得到,共計89個。將采摘到的臍橙樣品擦拭干凈,分別在BRUKER Fr-NIR(VECTOR22N型)傅里葉近紅外光譜儀和BRUKER Fr-NIR(VECTOR33N型)傅里葉近紅外光譜儀上采集光譜(兩臺儀器屬于德國布魯克儀器公司生產(chǎn)同一系列近紅外光譜儀)。設定光譜掃描范圍為10000~4000cm-1,鍍金漫反射體作背景,分辨率為8cm-1,掃描次數(shù)為64。將臍橙整果的橫向最大直徑部位放置于旋轉(zhuǎn)樣品杯上進行掃描,在臍橙圓周上相對90°方向作4次光譜采集,盡量避免樣品表面的斑痕,得到每個樣品的4條普通光譜,利用近紅外分析軟件OPUS5.5將每個樣品的4條普通光譜平均,將每個樣品的平均光譜作為原始光譜數(shù)據(jù)。圖1為臍橙樣品在兩臺儀器上的近紅外光譜圖。
圖1 臍橙樣品近紅外光譜Fig.1 NIR spectra of navel orange samples
1.2 樣品總糖的化學測定
樣品總糖的測定采用硫酸苯酚比色法[21]。稱取每個臍橙樣品的質(zhì)量,用組織搗碎機分別將樣品搗碎,準確稱取10.0g樣品,轉(zhuǎn)移到100mL容量瓶中,加蒸餾水至刻度、搖勻,用濾紙過濾,取濾液1mL,定容到100mL待測,然后取1mL樣液,1mL 6%的苯酚,1mL蒸餾水,5mL濃硫酸,搖勻、冷卻后比色。最后測得的樣品總糖含量的范圍為9.823%~14.7163%。
1.3 樣品集的劃分
Kennard-Stone算法是通過計算樣本之間的歐氏距離(euclidean distance,ED)來選擇樣品的[22],選擇樣本間距離大的樣品,這樣所選的樣品集樣本張成的空間較大,覆蓋范圍也較大,具有代表性。本實驗采用Kennard-Stone算法將89個樣品劃分為校正集和預測集,其中校正集包含70個樣品,用來在主儀器上建立臍橙含糖量的近紅外光譜模型,預測集包含19個樣品,用來檢驗模型的優(yōu)劣。計算模型傳遞參數(shù)的標準化樣品集在校正集中選取。Kennard-Stone算法對樣品的選取過程在Matlab中完成。
1.4 模型傳遞方法原理
1.4.1 Slope/Bias校正法
Slope/Bias校正法通過校正主儀器上的模型來實現(xiàn)模型傳遞的。利用校正集樣品光譜在主儀器上建立校正模型b,用此模型分別預測標準化樣品在兩臺儀器上測得的標準化樣品光譜矩陣Tm、Ts,得到濃度值ym,ys,則:
用一元線性回歸方程來擬合ym和ys,求得此線性方程的普通最小二乘解,即得這一模型的斜率(k)和截距(l):
最后通過主儀器上建立的模型b和Slope/Bias校正項,就可以直接由從儀器上得到的光譜Xs,計算其濃度值:
1.4.2 DS算法
DS算法是一種全光譜校正方法,它利用轉(zhuǎn)換矩陣F將從儀器上測得的未知樣品光譜Xs轉(zhuǎn)換為Xst,Xst與主儀器上測得的光譜在理論上是一致的。
從校正集中選取一定量的樣品作為標準樣品,分別在主儀器上測得光譜矩陣Tm,從儀器上測得光譜矩陣Ts,通過傳遞矩陣F將Ts轉(zhuǎn)換成Tm,使二者相匹配。其中矩陣F描述了主、從兩種測定條件下光譜的差異。
由Tm=Ts×F+E,E為殘差矩陣, 則通過最小二乘法計算可得到轉(zhuǎn)換矩陣F=Ts-1×Tm,其中Ts-1為Ts的廣義逆,F(xiàn)為m×m矩陣(m為波長點數(shù))。對在從儀器上測得的未知樣品光譜矩陣Xsu,利用F將Xsu轉(zhuǎn)化成與主儀器匹配的光譜矩陣Xst。
再由主儀器上建立的校正模型b計算最終結(jié)果。
1.5 模型傳遞的評價
為了找出更優(yōu)的模型傳遞方法,采用主儀器上建立的最優(yōu)PLS模型分別預測傳遞前后從儀器上的預測集光譜,用相關(guān)系數(shù)(R)、內(nèi)部交叉驗證均方差(RMSECV)、預測標準差(RMSEP)來評價模型的效果。
2.1 預測模型的建立
應用OPUS5.5定量分析軟件(德國布魯克儀器公司),將校正集樣品光譜與其化學分析值結(jié)合,建立主儀器上的臍橙糖度偏最小二乘法(PLS)校正模型。為了消除儀器狀態(tài)、樣品狀態(tài)與測量條件對采集到的光譜的影響,采用以下10種不同預處理方法對模型進行優(yōu)化,包括:消除常數(shù)偏移量(COE)、直線差值(SLS)、矢量歸一化(VN)、最小-最大歸一化(MMN)、多元散射校正(MSC)、一階導數(shù)(FD)、二階導數(shù)(SD)、FD+SLS、FD+VN、FD+MSC。
表1 不同預處理方法對模型的影響Table 1 Effects of different data preprocessing methods on the model
由表1可知,不同預處理對模型建立效果有影響,經(jīng)過MSC預處理后的模型比沒有經(jīng)過預處理所建的模型更好,其所選的光譜波段范圍為10001.5~8049.8cm-1和5450.1~4246.7cm-1,相關(guān)系數(shù)R為0.905,內(nèi)部交叉驗證均方差為0.519%,最佳主成分數(shù)為9。校正集的真實值和預測值的關(guān)系如圖2所示。
圖2 校正集中真實值與預測值散點圖Fig.2 Relationship between predicted and chemical values for the calibration set
2.2 模型預測結(jié)果
利用在主儀器上已建好的PLS模型分別預測主從儀器上19個預測集樣品的光譜,結(jié)果見表2,主儀器上建立的模型預測主儀器預測樣品集的光譜,預測值與真實值的相關(guān)系數(shù)R為0.909,預測標準差RMSEP為0.434%,預測效果良好,但用此模型直接預測從儀器上預測集的光譜,R降為0.688,RMSEP則變?yōu)?.675%,預測結(jié)果產(chǎn)生較大差異。這是由于預測集樣品光譜是在不同型號儀器上測得的,儀器對光譜的測量影響造成圖譜之間的差異較大,主儀器上建立的模型已無法滿足預測要求,模型須經(jīng)過維護或修正從儀器上的光譜才能得到滿意的結(jié)果。
表2 主儀器上模型分別預測兩臺儀器預測集的結(jié)果Table 2 Predicted results for the predication sets from the major and minor instruments
2.3 標樣個數(shù)對模型傳遞的影響
為了取得較好的模型傳遞結(jié)果,本實驗采用Kennard-Stone算法[21]依次從校正集樣品中選取10,20,30,……,70個樣品作為標準化樣品集,并同時采用Slope/Bias校正法和DS算法來進行研究。Slope/Bias校正法通過計算Slope和Bias來校正主儀器上模型的,此過程在Excel中進行。DS算法利用標準化樣品求得模型傳遞參數(shù),從儀器上預測集樣品通過此參數(shù)可求得傳遞后的光譜,DS算法是在Matlab中的PLS_toolbox5.8中進行的。圖3是不同標準化樣品數(shù)對兩種算法的影響。標樣數(shù)對Slope/Bias校正法影響較小,隨著樣品數(shù)的增加,RMSEP沒有太大變化,而經(jīng)DS算法傳遞后測定預測集臍橙含糖量的RMSEP隨著標樣數(shù)的增加而減小,直到標樣數(shù)為全部校正集樣品時,標準化樣品集包含的信息足夠充分,RMSEP減小到最小值,模型傳遞效果達到最優(yōu)。
圖3 預測集的RMSEP隨標樣數(shù)的變化Fig.3 Change in RMSEP with the number of standardization samples
2.4 Slope/Bias校正法與DS算法的結(jié)果與比較
兩種方法各自選取最佳標準化樣品個數(shù)進行模型傳遞,利用主儀器上建立的最優(yōu)PLS模型分別預測經(jīng)兩種方法傳遞后的從儀器預測集光譜。預測集的預測值與真實值的散點圖如圖4所示。
圖4 經(jīng)傳遞后真實值與預測值的散點圖Fig.4 Relationship between predicted and chemical values after transfer
由圖4可知,經(jīng)模型傳遞后模型的預測能力均有所改善。Slope/Bias校正法傳遞后,相關(guān)系數(shù)R雖然沒有變化,但RMSEP由原來的3.675%減小到0.756%,經(jīng)DS算法傳遞后的相關(guān)系數(shù)R和RMSEP分別為0.902和0.448%,擬合效果明顯要好于Slope/Bias法,其預測能力比Slope/Bias校正法提高了40.74%。這可能是由于兩臺儀器測量光譜時外界因素對測量結(jié)果的干擾較大,而Slope/Bias校正法只是一元校正法,僅僅對預測結(jié)果進行直線擬合校正,對模型的修正有限,從而沒有取得較好的效果,DS算法由于是全光譜校正法,能消除儀器間包括測量環(huán)境的影響。因此,在儀器結(jié)構(gòu)差異及外部環(huán)境因素影響較大時,DS算法要更好于Slope/Bias校正法。
3.1 建立了臍橙總糖偏最小二乘(PLS)近紅外光譜模型,并比較了不同預處理方法對模型的影響,經(jīng)多元散射校正(MSC)預處理后的模型更優(yōu),具有更高的精度和穩(wěn)定性。
3.2 比較了不同標樣個數(shù)對模型傳遞過程的影響,標樣個數(shù)對Slope/Bias校正法影響較小,但DS算法的效果隨著標樣個數(shù)的增加而變好,當標準化樣品為全部校正集樣品時,模型傳遞效果最優(yōu)。
3.3 研究采用 Slope/Bias校正法和DS算法實現(xiàn)臍橙糖度模型在兩臺傅里葉近紅外光譜儀之間的傳遞。由于兩臺儀器上測得的光譜受儀器條件及環(huán)境變化引起的差異較大,通過Slope/Bias校正法對預測值進行一元校正的能力有限,而DS算法作為多變量標準化方法,對儀器差異、測量環(huán)境的改變等因素引入的光譜差異的校正是可行的。經(jīng)DS算法傳遞后預測值與真實值之間具有較大相關(guān)系數(shù)R(0.902)和較小預測標準差RMSEP(0.448%),可以實現(xiàn)臍橙總糖模型在兩臺傅里葉近紅外光譜儀之間的共享。
[1] 應義斌, 劉燕德, 傅霞萍, 等. 蘋果有效酸度的近紅外漫反射無損檢測[J]. 農(nóng)業(yè)機械學報, 2004, 35(6)∶ 124-126.
[2] XIE Lijuan, HUANG Haibo, YING Yibin, et al. Effect of wavelet denoising techniques on the determination of navel orange sugar content with nearinfrared spectra[C]//Optics for Natural Resources, Agriculture, and Foods.Boston∶ Yud-Ren Chen, 2006.
[3] LIU Yande, SUN Xudong, ZHOU Jianmin, et al. Linear and nonlinear multivariate regressions for determination sugar content of intact Gannan navel orange by Vis-NIR diffuse reflectance spectroscopy[J]. Mathematical and Computer Modelling, 2010, 51(11)∶ 1438-1443.
[4] TEWARI J C, DIXIT V, CHO B K, et al. Determination of origin and sugars of citrus fruits using genetic algorithm, correspondence analysis and partial least square combined with fiber optic NIR spectroscopy[J].Spectrochimica Acta Part A∶ Molecular and Biomolecular Spectroscopy,2008, 71(3)∶ 1119-1127.
[5] 馬蘭, 夏俊芳, 張戰(zhàn)鋒, 等. 基于小波變換的番茄總糖近紅外無損檢測[J]. 農(nóng)業(yè)工程學報, 2009, 25(10)∶ 350-354.
[6] NISHZAWA T, MORI Y, FUKUSHIMA S, et al. Non-destructive analysis of soluble sugar components in strawberry fruits using near-infrared spectroscopy[J]. Japan Nippon Shokuhin Kagaku Kogaku Kaishi, 2009,56(4)∶ 229-235.
[7] 夏俊芳. 基于近紅外光譜的貯藏臍橙品質(zhì)無損檢測方法研究[D]. 武漢∶ 華中農(nóng)業(yè)大學, 2007.
[8] 夏俊芳, 李小昱, 李培武, 等. 基于小波變換的柑橘維生素C含量近紅外光譜無損檢測方法[J]. 農(nóng)業(yè)工程學報, 2007, 23(6)∶ 170-174.
[9] 夏俊芳, 李培武, 李小昱, 等. 不同預處理對近紅外光譜檢測臍橙VC含量的影響[J]. 農(nóng)業(yè)機械學報, 2007, 38(6)∶ 107-111.
[10] 嚴衍祿, 趙龍蓮, 韓東海, 等. 近紅外光譜分析基礎與應用[M]. 北京∶中國輕工業(yè)出版社, 2005∶ 199-200.
[11] 褚小立, 袁洪福, 陸婉珍. 光譜多元校正中的模型傳遞[J]. 光譜學與光譜分析, 2001, 21(6)∶ 881-885.
[12] ALAMAR M C, BOBELYN E, LAMMERTYN J, et al. Calibration transfer between NIR diode array and FT-NIR spectrophotometers for measuring the soluble solids contents of apple[J]. Postharvest Biology and Technology, 2007, 45(1)∶ 38-45.
[13] GREENSILL C V, WALSH K B. Calibration transfer between miniature photodiode array-based spectrometers in the near infrared assessment of mandarin soluble solids content[J]. Journal of Near Infrared Spectroscopy, 2002, 10(1)∶ 27-35.
[14] ROGGO Y, DUPONCHEL L, NOE B, et al. Sucrose content determination of sugar beets by near infrared reflectance spectroscopy. Comparison of calibration methods and calibration transfer[J]. Journal of Near Infrared Spectroscopy, 2002, 10 (2)∶ 137-150.
[15] 劉賢, 董蘇曉, 韓魯佳, 等. 青貯飼料近紅外光譜分析模型轉(zhuǎn)移研究[J]. 農(nóng)業(yè)機械學報, 2009, 40(5)∶ 153-157.
[16] 褚小立, 袁洪福, 陸婉珍, 等. 普魯克分析用于近紅外光譜儀的分析模型傳遞[J]. 分析化學, 2002, 30(1)∶ 114-119.
[17] 林振興, 鄔蓓蕾, 王豪, 等. PDS用于不同溫度下的近紅外光譜模型傳遞研究[J]. 分析測試學報, 2008, 27(12)∶ 1330-1333.
[18] 趙龍蓮, 李軍會, 張文娟, 等. 基于SVR的傅里葉變換型近紅外光譜儀間數(shù)學模型傳遞的研究[J]. 光譜學與光譜分析, 2008, 28(10)∶2299-2303.
[19] 李慶波, 張廣軍, 徐可欣. DS 算法在近紅外光譜多元校正模型傳遞中的應用[J]. 光譜學與光譜分析, 2007, 27(5)∶ 873-876.
[20] 陳斌, 王豪. 專利算法在白酒酒精度近紅外光譜分析模型轉(zhuǎn)移中的應用[J]. 紅外技術(shù), 2006, 28(4)∶ 245-248.
[21] 于瑞濤, 朱鵬程, 陶燕鐸, 等. 苯酚硫酸法測定迷果芹多糖的含量[J].分析試驗室, 2008, 12(27)∶ 222-224.
[22] FILHO H A D, GALVAO R K H, ARAUJO M C U, et al. A strategy for selecting calibration samples for multivariate modelling[J]. Chemometrics and Intelligent Laboratory Systems, 2004, 72∶ 83-91.
Transfer of NIRS Calibration Model for Determining Total Sugar Content in Navel Orange
HU Run-wen,XIA Jun-fang*
(College of Engineering, Huazhong Agricultural University, Wuhan 430070, China)
In order to achieve NIRS (near infrared reflectance spectroscopy) calibration model sharing among similar NIRS instruments, an optimal NIRS partial least square (PLS) regression model was established using the major instrument and transfer to the minor instrument by either slope bias correction (SBC) or direct standardization (DS). In addition, the dependence of calibration transfer on the number of standardization samples was explored. The results showed that the root mean squared errors of prediction (RMSEP) for the calibration model were 0.448% and 0.756% after standardization by DS and SBC,respectively. Thus, the DS method was better than the SBC method and could be used to successfully transfer the calibration model
navel orange;total sugar;near infrared;slope/bias correction;direct standardization;calibration transfer
O657.33
A
1002-6630(2012)03-0028-05
2011-02-24
華中農(nóng)業(yè)大學自主科技創(chuàng)新基金項目(2009SC015)
胡潤文(1985—),男,碩士研究生,研究方向為智能化檢測技術(shù)。E-mail:hurunwen@126.com
*通信作者:夏俊芳(1963—),女,教授,博士,研究方向為智能化檢測技術(shù)、現(xiàn)代農(nóng)業(yè)裝備設計與測控。E-mail:xjf@mail.hzau.edu.cn