蘇 虹 宋 楠 全鶯歌 宮會麗
(1.中國海洋大學(xué)信息科學(xué)與工程學(xué)院,山東 青島 266100;2.山東煙草研究院,山東 濟(jì)南 250000;3.山東中煙工業(yè)有限責(zé)任公司,山東 濟(jì)南 250000)
近年來近紅外光譜分析技術(shù)已成為發(fā)展最為迅速的光譜技術(shù)之一。隨著近紅外光譜分析技術(shù)在各行業(yè)飛速發(fā)展,解決模型傳遞問題成為各行業(yè)的重中之重。模型傳遞也稱為儀器標(biāo)準(zhǔn)化,是指經(jīng)過數(shù)學(xué)處理后,使一臺儀器上的模型能夠用于另一臺儀器,從而減少重新建模所帶來的巨大工作量,實現(xiàn)樣品和數(shù)據(jù)資源的共享。目前,模型傳遞大多使用的是有標(biāo)模型傳遞算法,主要有斜率/截距(B/S)算法 [1]、shenk’s算法 [2]和直接校正(DS)算法[3]等,其中應(yīng)用最為普遍和最為成功的方法是B/S算法和DS算法。DS算法所需標(biāo)樣多,其光譜只是在波長很小的范圍內(nèi)發(fā)生變化,有時會存在“過校正”現(xiàn)象。而shenk’s算法利用某波長點小窗口范圍的光譜數(shù)據(jù)來計算該波長的校正參數(shù),標(biāo)樣少,可以避免過校正現(xiàn)象。所以本文將shenk’s算法和B/S算法應(yīng)用于煙葉在Nicolet AntarisII上模型轉(zhuǎn)移,并比較兩種轉(zhuǎn)移算法優(yōu)劣。
圖1 兩條光譜轉(zhuǎn)換前
圖2 兩條光譜轉(zhuǎn)換后
表1 主機(jī)子機(jī)轉(zhuǎn)換前后評價
表2 t檢驗評價,臨界值t(48,0.05)=2.009
nicolet AntarisII傅立葉變換近紅外光譜儀(美國Thermo Nicolet儀器公司),配有積分球漫反射采樣系統(tǒng)、InGaAs檢測器、Result光譜采集軟件和半徑6cm石英杯等。兩臺儀器分別作為主機(jī)和子機(jī)。儀器的工作參數(shù)為:光譜范圍10000cm-1~3999cm-1, 分 辨 率 8cm-1, 掃描次數(shù)設(shè)為64次,旋轉(zhuǎn)樣品杯且掃描樣品前均掃描背景。
采集山東、云南、四川、廣西四個產(chǎn)區(qū)的395個樣品,將這些樣品在烘箱中60°C烘干,去梗磨碎,過60目篩,稱量50g分別在兩臺相同型號的儀器上掃描近紅外光譜。從中選出206個代表性樣品作為校正集, 48個樣品作為驗證集,選取誤差較小、且重復(fù)性較好的15個樣品作為模型轉(zhuǎn)移樣本。
將測定樣品的總糖、還原糖、總氮、煙堿和cl的值與主機(jī)采集的NIR譜圖按一一對應(yīng)的原則,導(dǎo)入化學(xué)計量學(xué)軟件。通過光譜處理、光譜范圍選擇、SG導(dǎo)數(shù)濾波和偏最小二乘(PLS)回歸建模,建立四個產(chǎn)區(qū)烤煙煙葉的5種主要化學(xué)成分定量預(yù)測模型。
圖3 主機(jī)和子機(jī)轉(zhuǎn)換前預(yù)測值對比
圖4 主機(jī)和子機(jī)B/S轉(zhuǎn)換后預(yù)測值對比
從兩個方面來看模型的轉(zhuǎn)移效果,一是:用shenk’s算法對光譜進(jìn)行轉(zhuǎn)移,將轉(zhuǎn)移后的光譜數(shù)據(jù)用于主機(jī)模型上進(jìn)行預(yù)測烤煙煙葉的5項指標(biāo);二是:用B/S算法對子機(jī)上的預(yù)測值進(jìn)行轉(zhuǎn)移預(yù)測烤煙煙葉的5項指標(biāo)。并通過ICCA國際標(biāo)準(zhǔn)和t檢驗評估模型的轉(zhuǎn)移效果。
由圖1可見,同一個樣品分別在主機(jī)和子機(jī)上采集到的兩條原始光譜的形狀雖然非常相似,但兩臺儀器的吸光度強(qiáng)度明顯看出區(qū)別。從圖2中看到,光譜經(jīng)過shenk’s算法轉(zhuǎn)移之后與主機(jī)光譜幾乎不存在差異。以總糖為例,從圖3和圖4來看經(jīng)B/S算法轉(zhuǎn)換后,主機(jī)和子機(jī)預(yù)測值的差距變大。
(1)按照ICCA國際標(biāo)準(zhǔn)模型轉(zhuǎn)移判斷設(shè)備的傳輸性標(biāo)準(zhǔn)偏差是否小于2/3*SEP。
根據(jù)表1所示:主機(jī)和子機(jī)直接傳遞預(yù)測值的標(biāo)準(zhǔn)偏差均大于2/3*SEP,所以主機(jī)和子機(jī)之間需要轉(zhuǎn)移。分別通過shenk’s算法和斜率/截距進(jìn)行轉(zhuǎn)移,主機(jī)和shenk’s算法轉(zhuǎn)移預(yù)測值偏差的標(biāo)準(zhǔn)偏差均小于2/3*SEP,達(dá)到了模型轉(zhuǎn)移的效果;主機(jī)和B/S算法轉(zhuǎn)移預(yù)測值偏差的標(biāo)準(zhǔn)偏差均大于2/3*SEP,沒有達(dá)到轉(zhuǎn)移的效果。
(2)t檢驗評價分析
根據(jù)表2所示,主機(jī)和子機(jī)直接傳遞的t檢驗值均大于臨界值,所以主機(jī)和子機(jī)存在顯著性差異,故主機(jī)和子機(jī)之間需要轉(zhuǎn)移。主機(jī)和子機(jī)shenk’s算法轉(zhuǎn)移預(yù)測值的t檢驗值均小于臨界值,所以主機(jī)和子機(jī)shenk’s算法轉(zhuǎn)移不存在顯著性差異,達(dá)到轉(zhuǎn)移的效果;主機(jī)和子機(jī)B/S算法轉(zhuǎn)移預(yù)測值的t檢驗值只有總糖達(dá)到了轉(zhuǎn)移效果,不存在顯著性差異。
本文基于Nicolet AntarisII系列近紅外光譜儀實際應(yīng)用中在線檢測煙葉化學(xué)成分分析模型的轉(zhuǎn)移,應(yīng)用shenk’s算法使預(yù)測結(jié)果得到明顯的改善,并且由于shenk’s算法是一元全光譜校正法,其計算過程是利用原光譜進(jìn)行的,基本無信息的丟失。而從分析結(jié)果上來看,斜率截距法也使預(yù)測結(jié)果得到了改善,但沒達(dá)到預(yù)期的結(jié)果,斜率截距轉(zhuǎn)移后還存在顯著性差異,并且斜率截距只是在預(yù)測值上對結(jié)果進(jìn)行了校正,不能從根本上解決問題。綜上所述,shenk’s算法用于煙葉各項指標(biāo)模型傳遞更具優(yōu)勢,能夠較好解決煙草行業(yè)內(nèi)模型無法統(tǒng)一共享等問題。
[1]Bouveresse E,Casolino C,de la Pezuela C.Journal of pharmaceutical and biomedical analysis,1998:18-35.
[2]褚小立.化學(xué)計量學(xué)方法與分子光譜分析技術(shù)[M].北京:化學(xué)工業(yè)出版社,2011:109.