王紅英 常楚晨 金 楠 陳媛媛 雷逸群 譚 宇
(1.中國農(nóng)業(yè)大學(xué)工學(xué)院,北京100083;2.湖南偉業(yè)動物營養(yǎng)集團股份有限公司,湖南長沙410000)
我國作為飼料第一大國,近年來對飼料品質(zhì)的要求逐漸提高,飼料品質(zhì)高低和利用效率直接影響畜禽產(chǎn)品的安全[1-2]。采用近紅外在線分析技術(shù)實時檢測飼料原料成分,可動態(tài)監(jiān)控配制過程,實現(xiàn)精準(zhǔn)營養(yǎng),保證飼料品質(zhì)和利用效率。豆粕是產(chǎn)量最大、使用范圍最廣的植物性蛋白飼料原料[3];玉米粉能量居谷實類飼料之首,在配合飼料中的用量高達(dá)50%~65%。在飼料生產(chǎn)中對作為飼料原料的豆粕和玉米粉進(jìn)行快速檢測,降低生產(chǎn)過程中飼料成分含量的波動引起的配方失真,尤其是水分和粗蛋白的含量,具有重要的現(xiàn)實意義。
目前飼料領(lǐng)域中,關(guān)于采用離線光譜建立近紅外模型的研究已較為廣泛,但生產(chǎn)線檢測環(huán)境惡劣,獲取的在線光譜與離線光譜差異較大,無法在生產(chǎn)線上直接使用離線近紅外模型。而僅用在線光譜建模,模型的穩(wěn)定性不佳,且無法通用于離線近紅外檢測。當(dāng)檢測環(huán)境發(fā)生變化時,模型也要隨之改變,需耗費巨大的人力物力重新建模[4],近紅外模型轉(zhuǎn)移技術(shù)可很好的解決以上問題。目前的近紅外模型轉(zhuǎn)移方法有斜率∕截距校正、樣品擴充[5]、差值轉(zhuǎn)移、直接校正、分段直接校正[6]、Shenk 法[7]、雙競爭自適應(yīng)加權(quán)采樣法[8]等。但針對離線與在線近紅外設(shè)備之間的模型轉(zhuǎn)移研究較少,關(guān)于離線與非接觸式的在線近紅外設(shè)備之間的模型轉(zhuǎn)移研究更少。近紅外建模要求大樣本量且樣本的化學(xué)值分布范圍廣,但飼料企業(yè)受配方和控制的需求限制,原料來源單一,樣品數(shù)量少,營養(yǎng)成分含量分布范圍窄。較大規(guī)模的飼料生產(chǎn)企業(yè),不僅有在線監(jiān)控飼料營養(yǎng)成分的需求,還有在實驗室進(jìn)行飼料營養(yǎng)成分質(zhì)檢的需求,對模型在離線與在線檢測間的通用性要求也很高。
本研究采用基于光譜共享法的近紅外模型轉(zhuǎn)移技術(shù),該方法能用于小樣本量、窄化學(xué)值范圍樣品條件下的近紅外建模,且所建模型能在實驗室與飼料生產(chǎn)線之間通用,成本低、快速便捷。將離線和在線光譜相結(jié)合建立光譜共享模型,對比了僅用離線光譜或在線光譜建模的效果,并評估了光譜共享模型的穩(wěn)定性和通用性。
本研究采用在線非接觸式傅里葉近紅外檢測儀MATRIX-F(Bruker 光譜儀器公司,德國)獲取在線光譜,光譜范圍12 800~4 000 cm-1,波數(shù)準(zhǔn)確度優(yōu)于0.05 cm-1,波數(shù)精度優(yōu)于0.1 cm-1[9]。使用中國農(nóng)業(yè)大學(xué)自主設(shè)計的近紅外在線檢測平臺[10]配合非接觸式在線近紅外探頭采集連續(xù)有效的光譜,該裝置安裝在湖南偉業(yè)公司飼料生產(chǎn)線上粉碎-配料運輸系統(tǒng)的下料溜管處(圖1)。為滿足光譜共享法對獲取在線和離線光譜樣品的一致性需求,用于獲取離線光譜的樣品也在此處取樣。在下料溜管處獲取22個豆粕樣品和26個玉米粉樣品的在線光譜,每20 s采集一次在線光譜,同時進(jìn)行人工取樣,在實驗室采用傅立葉變換近紅外光譜儀MATRIX-I(布魯克光譜儀器公司,德國)獲得22 個豆粕樣品和26 個玉米粉樣品的離線光譜,儀器參數(shù)為:光譜范圍:4 000~12 800 cm-1,分辨率4 cm-1,為降低由于樣品裝杯時不均勻?qū)е碌恼`差,每個樣品掃描兩次[11]。樣本量過小無法成功建模,為滿足建模需求,再額外人工獲取15個豆粕樣品和23 個玉米粉樣品的離線光譜,共取37 個豆粕樣品和49個玉米粉樣品的離線光譜。
以豆粕和玉米粉樣品的濕化學(xué)法檢測結(jié)果為基準(zhǔn)校正近紅外模型,按照GB∕T 6435—2014 和GB∕T 6432—2018測定水分和粗蛋白的化學(xué)值,每個樣品測兩次平行,取平均值作為定量分析模型的參考值。
圖1 飼料生產(chǎn)工藝流程及在線近紅外探頭安裝位置示意圖
按照3∶1 的比例隔三取一地對樣品進(jìn)行分集,且保證校正集和檢驗集的平均值相差不大,檢驗集的數(shù)據(jù)范圍包含在校正集的數(shù)據(jù)范圍內(nèi)。采用馬氏距離法判別異常光譜,采用化學(xué)值絕對誤差的F檢驗法判別化學(xué)值的異常,并將異常樣品剔除。采用平滑校正、導(dǎo)數(shù)校正[12]、多元散射校正[13]、標(biāo)準(zhǔn)正態(tài)變換[14]等光譜預(yù)處理方法降低無關(guān)信息和噪聲信號對建模的干擾[15]。之后使用偏最小二乘(Partial least squares,PLS)法建立近紅外定量分析模型[16-17]。首先使用離線光譜建立離線光譜模型,受樣品數(shù)量少和樣品來源單一的影響,建模效果較差,無法用于在線檢測,故本文不予以討論。之后采用在線光譜和共享后的光譜建立近紅外模型,建模結(jié)果在下文進(jìn)行詳細(xì)分析。采用以下指標(biāo)綜合對模型進(jìn)行評價:模型校正集相關(guān)系數(shù)RC和驗證集相關(guān)系數(shù)RP,校正均方根誤差RMSEC、預(yù)測均方根誤差RMSEP,相對分析誤差RPD[18],模型改善率Ri。
模型轉(zhuǎn)移后模型預(yù)測能力有所提升,本研究定義模型改善率Ri評價模型轉(zhuǎn)移的效果,其含義是與離線光譜模型相比,光譜共享模型的RPD 提高的百分比。Ri的計算公式為:
式中:RPD——相對分析誤差(%);
Ri——模型改善率(%)。
采用所建立的近紅外模型進(jìn)行在線預(yù)測,通過預(yù)測殘差絕對值的方差S2評價預(yù)測的穩(wěn)定性。預(yù)測殘差絕對值的方差越小,說明模型的預(yù)測穩(wěn)定性越好。
式中:Δy——預(yù)測殘差;
n——校正集或驗證集中樣品個數(shù);
yi,a——第i個樣品的實測值;
yi,p——第i個樣品的預(yù)測值;
S2——預(yù)測殘差絕對值的方差。
模型轉(zhuǎn)移是避免模型在不同儀器間預(yù)測失效、實現(xiàn)模型通用的有效手段[19]。實際生產(chǎn)環(huán)境復(fù)雜,采集到的在線光譜與離線光譜偏差很大。圖2 為豆粕和玉米粉的離線和在線光譜曲線,紅色為離線譜線,其余為在線譜線,由于使用了在線近紅外檢測平臺采集在線光譜,光譜質(zhì)量較高,譜線平滑,趨勢合理,在線譜線走向與離線譜線的基本一致,但在線譜線的吸光度明顯高于離線譜線。
根據(jù)比爾定律[20],對于同一樣品來說,吸光度的差異僅由光程不定引起。比爾定律的表達(dá)式為:
A=εbC
式中:A——吸光度[L∕(g·cm)];
ε——待測成分的摩爾吸光系數(shù);
b——光程(cm);
C——待測成分的物質(zhì)的量的濃度(g∕L)。
豆粕和玉米粉由斗式提升機拋出后有較大的初速度,在溜管中主要依靠重力作用運動,其速度高達(dá)2 m∕s 左右,物料間的空隙較大且無法均勻流過近紅外探頭檢測位置,而且物料顆粒大小存在差異,故入射光照投射到樣品后反射到光纖探頭的光程變大,導(dǎo)致樣品的吸光度升高。
圖2 豆粕和玉米粉的離線和在線光譜
本研究采用光譜共享方法進(jìn)行模型轉(zhuǎn)移[21],降低吸光度整體偏移的影響。光譜共享法的具體做法為:首先在現(xiàn)場采集不同生產(chǎn)批次的樣品和光譜,然后在實驗室獲取樣品的離線光譜,并進(jìn)行化學(xué)值的測量,最后使用離線和在線光譜共同進(jìn)行建模,以消除生產(chǎn)線在線檢測條件的不同帶來的誤差,增加定標(biāo)模型的穩(wěn)健性,并且對不同應(yīng)用場合的儀器具有通用性。采用同一樣品的在線和離線光譜共同建模,即采用吸光度不同但其他光譜特征和化學(xué)值相同的光譜共同建模,可使吸光度與光程的偏差對濃度值的影響降低,消除飼料生產(chǎn)線實際條件對在線近紅外檢測效果的影響。該方法操作簡單,無需其他算法或校正方法,適合推廣應(yīng)用于飼料企業(yè)。
采用OPUS7.0(Bruker,德國)軟件進(jìn)行異常值剔除、波段選擇、光譜預(yù)處理和模型構(gòu)建等,采用Excel軟件進(jìn)行數(shù)據(jù)分析和繪圖。
使用離線光譜和在線光譜分別建立豆粕和玉米粉的近紅外模型,光譜預(yù)處理方法及模型結(jié)果如表1和表2 所示。表1 可見,離線光譜模型的相關(guān)系數(shù)過低,玉米粉粗蛋白的離線光譜模型RP僅0.563;RMSEC與RMSEP差值最高達(dá)0.142%,差值越大,模型的預(yù)測誤差波動越大,穩(wěn)定性越差,達(dá)不到建模要求,故采用小樣本量的離線光譜建立近紅外模型不可行。在線光譜模型的RP在0.8以上,均方根誤差RMSEC、RMSEP在0.25%以下,達(dá)到近紅外建模的要求。小樣本量的在線光譜建模效果優(yōu)于離線光譜建模效果,但建模效果仍有優(yōu)化空間。下文采用模型轉(zhuǎn)移技術(shù),以提高近紅外建模的效果并實現(xiàn)離線和在線檢測間的通用。
表1 豆粕和玉米粉離線光譜建模結(jié)果
表2 豆粕和玉米粉在線光譜建模結(jié)果
本研究采用光譜共享方法,利用在實驗室采集的37個豆粕樣品和49個玉米粉樣品的離線光譜與其中22個豆粕樣品和26個玉米粉樣品的在線光譜同時建模,即采用樣品的所有光譜建模,以提高模型預(yù)測效果和穩(wěn)定性。光譜共享后的建模結(jié)果見表3,豆粕和玉米粉樣品水分和粗蛋白模型的各評價指標(biāo)皆較優(yōu)。相關(guān)系數(shù)皆在0.94 以上,均方根誤差RMSEC、RMSEP在0.19%以下,且校正和預(yù)測均方根誤差的差值小,說明模型預(yù)測誤差的波動小,模型穩(wěn)定性較好。根據(jù)評價指標(biāo)綜合衡量,光譜共享模型的建模效果好于離線和在線光譜模型,模型改善率均大于0,其中,粗蛋白指標(biāo)的模型改善率均超過60%,說明光譜共享法對粗蛋白指標(biāo)的優(yōu)化效果更明顯。為直觀地反映建模效果,本研究繪制了散點圖,以1∶1 線為基準(zhǔn),點和擬合線與1∶1 線的重合度越高,模型效果越好。由圖3 可知,點和擬合線與1∶1 線重合度很高,光譜共享對模型有明顯的優(yōu)化功能。
表3 豆粕和玉米粉光譜共享模型建模結(jié)果
圖3 光譜共享近紅外定量分析模型預(yù)測散點圖
近紅外檢測的重現(xiàn)性在實際應(yīng)用中也是至關(guān)重要的[22],這就需要預(yù)測結(jié)果具有良好的穩(wěn)定性,分別使用離線光譜模型、在線光譜模型和光譜共享模型重新預(yù)測豆粕和玉米粉樣品的水分和粗蛋白含量。使用離線模型對獲取的在線譜線進(jìn)行預(yù)測,水分和粗蛋白含量的預(yù)測殘差絕對值皆較大,預(yù)測殘差平均值高達(dá)7.45%,無法實現(xiàn)在線準(zhǔn)確檢測,故此處不對離線模型的預(yù)測殘差予以討論,只比較在線光譜和光譜共享模型對在線譜線的預(yù)測殘差。由圖4 可知,光譜共享模型的預(yù)測殘差絕對值的方差S2均小于在線模型,即光譜共享后模型的預(yù)測性能和穩(wěn)定性均優(yōu)于在線光譜。
圖4 在線光譜預(yù)測殘差圖
除了實時在線監(jiān)控生產(chǎn)線外,飼料企業(yè)對飼料的離線近紅外檢測也有需求,因此近紅外模型的通用性是非常重要的[23]。將光譜共享模型應(yīng)用于離線光譜的預(yù)測,預(yù)測殘差絕對值的平均值為0.3,可用于離線檢測。建立離線近紅外模型通常需要高昂的建模成本,包括化學(xué)試劑的消耗,時間的耗費,技術(shù)人員對化學(xué)成分的測定,大量樣品的采集,光譜共享模型只需采集少量樣品即可同時用于在線檢測和離線檢測,適合在飼料企業(yè)推廣。
①本文獲取37 個豆粕樣品和49 個玉米粉樣品的離線光譜,并獲取其中22 個豆粕樣品和26 個玉米粉樣品的在線光譜,建立了基于光譜共享法的近紅外豆粕、玉米粉在線定量分析模型。
②光譜共享模型的建模效果優(yōu)于離線光譜和在線光譜模型,預(yù)測穩(wěn)定性最佳。既可用于在線檢測也可用于離線檢測,有較好的通用性。豆粕樣品的水分和粗蛋白模型的相關(guān)系數(shù)Rp分別為0.942和0.959,預(yù)測殘差絕對值的方差S2為0.075和0.003;玉米粉樣品的水分和粗蛋白模型相關(guān)系數(shù)Rp分別為0.944 和0.994,預(yù)測殘差絕對值的方差S2為0.042和0.011。
③應(yīng)用基于光譜共享法的模型轉(zhuǎn)移技術(shù),實現(xiàn)對豆粕和玉米粉成分含量的在線實時檢測和離線檢測,且適用于小樣本量和窄化學(xué)值范圍條件,為應(yīng)用在線近紅外檢測技術(shù)在飼料生產(chǎn)線上實現(xiàn)動態(tài)調(diào)整配方、精準(zhǔn)飼料營養(yǎng)提供新方法。