辛世華,韓小珍,王彩霞
(1.寧夏工商職業(yè)技術(shù)學院旅游管理系,寧夏銀川750021;2.寧夏大學學術(shù)期刊中心,寧夏銀川750021;3.寧夏大學農(nóng)學院,寧夏銀川750021)
牛肉肉質(zhì)嫩滑,味道鮮美,是人們?nèi)粘o嬍车闹匾M成部分[1]。不同品種的牛肉在品質(zhì)和口感上存在很大的差異,但肉品性狀和顏色極為相似,肉眼難以區(qū)分。傳統(tǒng)的肉類判別方法有酶聯(lián)免疫吸附[2]、蛋白質(zhì)譜技術(shù)[3-5]、聚合酶鏈式反應(yīng)(polymerase chain reaction,PCR)等[6],操作繁瑣,耗時耗力。因此,需研發(fā)一種快速無損、操作簡單的方法對牛肉的種類進行判別。
高光譜成像技術(shù)作為一種新型無損檢測技術(shù),具有超多波段、高光譜分辨率和譜圖合一等優(yōu)勢[7],在肉品分析領(lǐng)域得到了廣泛的應(yīng)用。Sanz 等[8]利用線性最小均方(linear minimum mean squared,LMS)分類器在380 nm~1 028 nm 波段范圍對羊肉肌肉類型進行識別分類,其準確率達到96.67%;Zhenjie Xiong 等[9]利用可見近紅外高光譜對散養(yǎng)雞和普通飼養(yǎng)方式下的及進行識別分析,并結(jié)合多元散射校正(multiplicative scatter correction,MSC)進行預(yù)處理,建立基于連續(xù)投影算法(successive projections algorithm,SPA)和徑向基函數(shù)-支持向量機(radial basis function-support vector machine,RBF-SVM)的雞肉判別模型,模型準確率高達 93.33%;Pu 等[10]在 400 nm~1 000 nm 光譜范圍內(nèi)對新鮮和凍融豬肉進行分類,校正集與預(yù)測集準確率分別為93.14%與90.91%。識別準確率分別為100%、94.1%、95.5%;王松磊等[11]使用高光譜成像技術(shù)對寧夏地區(qū)灘寒雜交、鹽池灘羊、小尾寒羊3 個品種羊肉進行識別,結(jié)果表明,不同波段高光譜對羊肉品種識別均有較好效果;Kamruzzaman 等[12]對豬肉、牛肉和羊肉3 種不同種類的肉進行鑒別和分類并利用主成分分析(principal component analysis,PCA)和偏最小二乘判別(partial least square-discriminant ,PLS-DA) 等進行建模,結(jié)果表明,驗證集中3 種類型的肉類樣品的總體正確分類率為98.67%。綜上可知,已有學者利用高光譜成像技術(shù)對雞肉、豬肉、羊肉以及摻假肉等進行判別分析,但對不同品種牛肉的判別鮮有報道。
該研究利用可見/近紅外高光譜技術(shù)對5 個不同品種的牛肉進行判別分析。首先利用不同的預(yù)處理對原始光譜進行預(yù)處理并劃分校正集與預(yù)測集,通過所建立的PLS-DA 模型優(yōu)選最佳預(yù)處理方法,建立基于特征波段和全波段的K 最近鄰算法(K-nearest neighbor,KNN)、偏最小二乘判別分析,選出最佳模型,為快速無損判別牛肉品種提供技術(shù)參考[13]。
產(chǎn)奶率低的荷斯坦奶牛,采自寧夏吳忠市澇河橋分割肉加工有限公司;3 歲左右的秦川牛、西門塔爾牛,力木贊牛及安格斯牛,采自寧夏固原市寧夏尚農(nóng)生物科技發(fā)展產(chǎn)業(yè)有限公司。各品種牛經(jīng)屠宰后在0 ℃下冷藏,排酸48 h。取出牛肉樣品進行分割,每個品種的牛分別取4 個部位肉(脖肉、眼肉、瓜條肉、里脊肉),剔除多余的油脂和筋膜后,放入保溫箱運至寧夏大學農(nóng)產(chǎn)品無損檢測實驗室,貯藏在4 ℃冷柜備用。5 個品種的牛肉樣品各60 個,共300 個。光譜掃描前將肉樣整形切塊(大小約為40 mm×30 mm×10 mm),25 ℃下放置2 h,待肉樣中心溫度達到室溫(25 ℃)水平后,用濾紙吸干樣品表面的水分,進行光譜掃描。
Hyper Spec-VNIR 高光譜成像系統(tǒng)、VT-80 自動電控位移平臺:美國Headwall 公司;Imspector N 型成像光譜儀(光譜分辨率2.8 nm,狹縫寬度25 μm)、G4-232 增強型 EMCCD 相機(像素尺寸 8.0 μm)、2 個鹵素燈光源:美國Golden Way Scientific 公司;VT-80 自動電控位移平臺。
1.2.1 高光譜圖像采集
由于肉樣本紋理形狀、色澤等會造成光源漫反射,影響光譜信息采集效果。因此,圖像采集時需設(shè)置合理的曝光時間和位移平臺移動速度。經(jīng)預(yù)試驗確定牛肉樣品的采集參數(shù):相機曝光時間為15 ms,物距為380 mm,電控位移平臺移動速度為15 mm/s[13]。同時,由于光源強度分布不均及相機中暗電流的存在,使采集到的信息中含有大量噪聲。因此在采集高光譜圖像之前需進行黑白校正。具體方法同文獻[13]。
圖像采集前,需打開高光譜儀器預(yù)熱30 min。試驗過程中,每組取5 塊肉樣依次置于電控位移平臺上,進行光譜掃描。圖像數(shù)據(jù)處理之前,利用ENVI 4.8 軟件選取整塊肉表面作為感興趣區(qū)域(range of interest,ROI),計算ROI 內(nèi)的平均反射光譜,作為樣本的反射光譜[13]。
1.2.2 樣本劃分
采用光譜-理化值共生距離法(sample set parti tioning based on joint X-Y distances,SPXY)[14]進行樣本劃分。
1.2.3 光譜數(shù)據(jù)預(yù)處理
在光譜采集過程中,由于試驗樣本、測定環(huán)境及儀器噪音等因素的影響,所采集的光譜數(shù)據(jù)中會夾雜一些無用信息,從而影響建模性能。因此,需要對原始光譜數(shù)據(jù)進行預(yù)處理。該試驗通過卷積平滑(savitzkygolay smoothing,SG)、區(qū)域歸一化、一階導(dǎo)數(shù)(first derivative,F(xiàn)D)、基線校準、標準正態(tài)變量變換(standard normal variate,SNV)、MSC 方法[15]對原始光譜進行預(yù)處理。
1.2.4 模型建立
試驗采用PLS-DA、KNN 法及RBF-SVM 法建立牛肉品種鑒別模型。PLS-DA 算法是在PLS 回歸算法基礎(chǔ)上建立樣本分類變量與光譜特征間的回歸模型的分類方法。KNN 算法是將一個樣本在特征空間中的K 個最相似或者最鄰近的樣本進行比較,樣本中的大多數(shù)屬于某一類則將該樣本歸結(jié)為此類[16]。RBF-SVM法是基于統(tǒng)計學習理論提出的一種機器學習識別方法,對非線性及高維信息識別具有較好的處理能力。該算法的原理將向量映射到高維空間,構(gòu)建一個超平面,進而建立合適的分隔超平面,使兩個與之平行的超平面距離達到最大,從而解決復(fù)雜數(shù)據(jù)的分類及回歸問題。用The Unscrambler X 10.4 對光譜數(shù)據(jù)進行預(yù)處理[13],其余算法在Matlab R2016a 中實現(xiàn)。
對5 種牛肉樣品的光譜數(shù)據(jù)取平均,得到的平均光譜曲線如圖1 所示。
圖1 牛肉樣品平均光譜圖Fig.1 The original average spectra
由圖1 可以看出,不同品種牛肉的光譜曲線走勢相似。其中,奶牛肉的反射率值明顯低于其他牛肉。在400 nm~590 nm 波段范圍內(nèi),反射率較低。而在650 nm~780 nm 波段,光譜反射值較高。
在可見光區(qū)域,牛肉中的肌紅蛋白與血紅蛋白相互作用,使其肉色呈現(xiàn)紅色;在近紅外區(qū)域,光譜吸收取決于物質(zhì)分子基團中光子能量吸收與能級躍遷,不同物質(zhì)具有特定的波長吸收組合,牛肉脂肪、蛋白質(zhì)及水分含量約占牛肉總質(zhì)量的99%,因此光譜吸收主要與其本身所含的-OH,-CH 和-NH2等基團密切相關(guān)。由圖1 可以看出,在部分波段范圍內(nèi)存在光譜交叉及重疊現(xiàn)象,但是在690 nm~930 nm,各波段反射率差異比較明顯,這為牛肉品種的快速判別提供了大量信息。
經(jīng)不同預(yù)處理方法后建立PLS-DA 模型,結(jié)果見表1。
由表1 可知,經(jīng)過FD 法預(yù)處理后所建模型的交互驗證中最小錯誤率最小為0.08,其模型的準確率達到95.33,表明采用一階導(dǎo)數(shù)預(yù)處理所建模型的準確性最好。故選擇FD 方法對原始光譜進行預(yù)處理。
表1 不同預(yù)處理方法后的PLS-DA 模型結(jié)果Table 1 The results of PLS-DA models by different pretreatment methods
樣本集的劃分方法在一定程度上決定了所建模型的優(yōu)略性,該研究利用SPXY 法對樣本劃分進行劃分。對牛肉樣品進行取樣時選擇3/4 樣本作為校正集,剩余1/4 作為預(yù)測集。樣本劃分結(jié)果見表2。
表2 利用SPXY 法劃分樣本結(jié)果Table 2 The results of sample partitioning by SPXY
2.4.1 建模參數(shù)的設(shè)定
KNN 算法中最重要的是K 值的確定。K 值不僅會影響模型的穩(wěn)定性,同時對模型的預(yù)測效果也有很大的干擾[13]。試驗中將最大主成分數(shù)設(shè)定為10,利用馬氏距離算法[17]并進行數(shù)據(jù)歸一化處理,采用百葉窗交互驗證[18],設(shè)置交互驗證組數(shù)為10,尋找交互驗證錯誤率最小處即為最佳K 值,結(jié)果見圖2。
圖2 KNN 算法中K 值選擇Fig.2 K values selection for KNN algorithm
由圖2 可知,當K=6 時,錯誤率達到最低值,所以選擇K=6 時建立KNN 模型。
在建立PLS-DA 模型時,將模型的最大主成分數(shù)設(shè)定為20[13],數(shù)據(jù)歸一化處理后,采用百葉窗交互驗證[19],設(shè)置交互驗證組數(shù)為10,原始光譜的交互驗證錯誤率隨主成分數(shù)的變化見圖3。
圖3 交互驗證中不同主成分下的錯誤率Fig.3 Error rate of different principal components in cross validation
由圖3 可知,在主成分數(shù)為11 時誤判率最低,故將11 確定為最優(yōu)主成分數(shù)。
2.4.2 建模結(jié)果
將經(jīng)FD 法預(yù)處理后的光譜數(shù)據(jù),分別建立基于全部波段的KNN、PLS-DA、RBF-SVM 牛肉品種判別模型,并對模型效果進行比較分析,模型結(jié)果見表4。
綜上可知,RBF-SVM 法所建模型的校正集準確率與預(yù)測集準確率均高于KNN、PLS-DA 算法,RBF-SVM 法所建模型結(jié)果較好,校正集與預(yù)測集準確率分別為100%、99%。
表4 5 個品種牛肉的鑒別準確率Table 4 Identification accuracy of five beef breeds
本文利用近紅外高光譜技術(shù),在400 nm~1 000 nm對5 種不同牛肉品種進行判別,采集其高光譜圖像,提取其光譜信息,對比分析不同的光譜預(yù)處理方法,優(yōu)選出FD 預(yù)處理方法;并采用SPXY 法劃分樣品;然后分別建立基于全波段和特征波長下的PLS-DA,KNN 及RBF-SVM 牛肉判別模型。RBF-SVM 法所建模型的校正集與預(yù)測集準確率分別為100%、99%,具有較好的判別效果,為牛肉品種快速無損判別提供理論依據(jù)。