王梓笛 李雙妹 尹延東
[摘要]本文針對乳制品分類快速識別技術依舊相對匱乏的現(xiàn)狀,獲取了樣品的拉曼光譜,以此作為表征樣品的質量特性數(shù)據(jù),輸入支持向量機判別模型,構建高效識別技術。結果顯示,乳制品拉曼光譜數(shù)據(jù)采集迅速,含水樣品可直接上樣測試,單個樣品的數(shù)據(jù)采集時間僅需2.5min,計算機處理時間在10s以內,參數(shù)優(yōu)化條件分別為小波軟閾值降噪(db1小波基,分解層數(shù)N=3)、歸一化處理([-1,1]區(qū)間),通過主成分分析提取80個主成分(累計貢獻率99%以上),支持向量機算法(徑向基核函數(shù),懲罰系數(shù)c=32,核函數(shù)參數(shù)g=0.022 097),測試集最佳識別率可達到100%。由此可見,本文所建立的高效識別方法,具有分析速度快、流程便捷等多項優(yōu)點,能夠為乳制品質量安全監(jiān)管提供技術參考。
[關鍵詞]支持向量機;拉曼光譜;乳制品;識別;質量管理
中圖分類號:TS252.7文獻標識碼:ADOI:10.16465/j.gste.cn431252ts.202003
乳制品的質量安全問題與每個人息息相關,其質量安全風險主要源于兩個方面:一是有害物質或非法添加物,二是假冒偽劣、以次充好。比較典型的案例有2008年中國奶制品污染事件、2016年的假奶粉事件等[1-2]。為杜絕此類問題,監(jiān)管部門制定并實施了多項產(chǎn)品標準、檢測標準,如《食品安全國家標準 發(fā)酵乳》(GB 19302—2010)、《食品安全國家標準 滅菌乳》(GB 25190—2010)、《食品安全國家標準 巴氏殺菌乳》(GB 19645—2010)等,規(guī)定了合格乳制品的原料要求、感官要求、理化指標、污染物限量、真菌毒素限量、微生物限量和其他要求,以及與各項指標要求對應的常規(guī)檢測方法。不過,現(xiàn)有方法也存在著一定的挑戰(zhàn)性,主要表現(xiàn)在感官檢驗與品評者的身體、技能、經(jīng)驗密切相關,有一定的主觀性;常規(guī)的儀器成分檢測法定性、定量分析準確,但一般需要前處理步驟和專業(yè)技術人員,較為耗時耗力;部分假冒產(chǎn)品實為低端產(chǎn)品冒充質優(yōu)產(chǎn)品,其指標可能符合國家標準的基本要求,造成高效識別困難[3-5]。此外,近年來,乳制品產(chǎn)量、社會需求量均逐年遞增,迫切需要發(fā)展快速、高效的識別方法。
現(xiàn)有的快速檢測方法研究主要集中于比色法、膠體金試紙條法以及計算機輔助識別技術等[6-7]。較前兩種方法,計算機輔助識別技術具備快速準確、客觀、信息利用率高等多種優(yōu)勢,成為快速檢測方法研發(fā)的熱點。因此,本文首先采集了不同品牌的巴氏殺菌熱處理風味發(fā)酵乳的質量特性數(shù)據(jù)拉曼光譜,隨后運用支持向量機模式分類算法并對該方法進行參數(shù)優(yōu)化,實現(xiàn)了乳制品快速分類識別。該方法具有多種優(yōu)勢,如拉曼光譜采集速度快、對操作人員要求低、無需樣品前處理、支持向量機算法運算速度快、數(shù)據(jù)處理在10s內即可完成等,為乳制品質量安全監(jiān)管提供了技術參考,具備一定的潛在應用價值。
1 材料與方法
1.1 材料
實驗用巴氏殺菌熱處理風味發(fā)酵乳購置于當?shù)爻?,均為原味口味,選取3個品牌,分別標記為品牌ee、品牌ff和品牌gg,每種品牌隨機采樣30個樣品,共計90個樣品。
1.2 儀器與設備
便攜式激光拉曼光譜儀(Prott-ezRaman-D3):美國Enwave Optronics公司,激光波長為785nm,激光最大功率約為450MW,CCD檢測器,溫度控制在-85℃左右,積分時間2.5min,掃描次數(shù)為1次,光譜范圍250~2 000cm-1,光譜分辨率1cm-1;96孔板:美國Corning Incorporated公司。
1.3 拉曼光譜圖采集方法
取適量液態(tài)發(fā)酵乳直接上樣,置于96孔板的獨立小孔內,保持小孔恰好處于充滿狀態(tài)。之后,利用激光拉曼光譜儀探頭直接照射樣品,測試獲取信號即為發(fā)酵乳的拉曼光譜數(shù)據(jù)。
1.4 數(shù)據(jù)處理
采集樣品的拉曼光譜數(shù)據(jù)后,使用SLSR Reader V8.3.9軟件進行基線校正,校正后的光譜數(shù)據(jù)采用小波軟閾值降噪法(wden函數(shù))實施噪聲消除處理,然后使用mapminmax函數(shù)對光譜數(shù)據(jù)進行歸一化處理,歸一化至[-1,1]區(qū)間,使用princomp函數(shù)進行主成分分析。本次實驗選取80個主成分,累計貢獻率達到99.2%。支持向量機(Support Vector Machine,SVM)分類識別算法使用Libsvm工具箱實現(xiàn)算法的運算,使用randperm函數(shù)實現(xiàn)發(fā)酵乳樣品隨機抽樣,以總樣品數(shù)的83%(每個品牌樣品25個,共計75個樣品)構建訓練集,以剩下的17%(每個品牌樣品5個,共計15個樣品)樣品數(shù)據(jù)作為測試集。上述函數(shù)的運算、SVM算法及繪圖使用MATLAB軟件實現(xiàn),版本為R2016a。
2 結果與討論
實驗采集了3種不同品牌的巴氏殺菌熱處理風味發(fā)酵乳,均呈液態(tài)黏稠白色試樣,樣品的拉曼光譜如圖1所示,每個品牌隨機選取了10個樣品的拉曼光譜,其相互間保持了較高的一致性。此外,不同品牌拉曼光譜譜圖之間,同樣表現(xiàn)出較高的相似性,僅憑裸眼難以實現(xiàn)有效辨別。拉曼光譜是一種基于樣品分子與輻射光作用的散射光譜,適用于表征分子振動模態(tài),參考已有相關報道[8-10],對圖1中出現(xiàn)的各主要拉曼光譜峰進行了信息歸屬,如表1所示,呈現(xiàn)出樣品中的糖類、脂類、蛋白質等營養(yǎng)成分的拉曼光譜特征,如1 755cm-1主要源自于脂肪分子的C=O伸縮振動。各樣品譜圖間呈現(xiàn)出微小的峰形狀、峰位置、峰高、峰比值差異[11]。據(jù)此可知,實驗獲得了發(fā)酵乳的拉曼光譜這一質量特性數(shù)據(jù),為后續(xù)計算機識別模型的研究提供了必要的數(shù)據(jù)支持。
采集的樣品拉曼光譜數(shù)據(jù)易出現(xiàn)噪聲干擾,結合已有報道,對光譜數(shù)據(jù)進行了小波軟閾值降噪,優(yōu)化選用db1小波基,有效降低了光譜噪聲的影響[12]。為消除光譜數(shù)據(jù)量綱對分類模型的影響,對光譜數(shù)據(jù)進行了歸一化處理,將數(shù)據(jù)強度值校正到[-1,1]區(qū)間。為提高光譜數(shù)據(jù)分類模型運算效率,對數(shù)據(jù)進行了主成分降維,每個樣品原始拉曼光譜數(shù)據(jù)有1 751個數(shù)據(jù)點,經(jīng)主成分降維后,結果顯示第1主成分可以達到原始數(shù)據(jù)的43.4%的解釋程度,第2主成分可以達到原始數(shù)據(jù)的9.9%的解釋程度,第3主成分可以達到原始數(shù)據(jù)的5.0%的解釋程度。實驗選用80個主成分,可代表原有信息的累計貢獻率達到99.2%,既保留了原始光譜數(shù)據(jù)的主要信息又提高了運算效率。主成分分析結果如圖2所示,選取了拉曼光譜原始數(shù)據(jù)提取后的第1和第2主成分??梢钥闯?,同品牌樣品間傾向于聚集,不同品牌樣品間傾向于分離,揭示出盡管發(fā)酵乳制品的拉曼光譜原始數(shù)據(jù)具有較高的相似性,但是同品牌樣品間數(shù)據(jù)統(tǒng)計的相似性要高于不同品牌樣品間的相似性。
支持向量機算法是基于統(tǒng)計學習理論建立起來的一種模式分類識別方法,核心是建立一個分類超平面作為決策曲面,該曲面對待分類的不同種類樣本進行正確分類,并使分類后的樣本點距離該分類超平面最遠,支持向量決定了這一最優(yōu)分類界面[13-15]。本文使用LIBSVM工具箱,通過1對1法來解決多分類問題,基本思路是在任意兩類樣品之間設計一個2分類支持向量機,當對1個未知樣本進行分類時,得票最多的類別即為該未知樣本的類別。如圖3所示,圖中展示了以2個不同品牌的發(fā)酵乳制品光譜數(shù)據(jù)為輸入,運用svmplot函數(shù)繪制出通過計算獲得的樣品間支持向量分布情況,(a)圖顯示了訓練集分類情況,(b)圖顯示了測試集分類情況,由圖顯示出通過訓練集獲得支持向量構建的決策曲面為非線性曲面,能夠實現(xiàn)樣品分類識別。
支持向量機模式分類識別算法的實施步驟如下。將經(jīng)過降噪、歸一化、主成分提取后的訓練集樣品拉曼光譜數(shù)據(jù)導入支持向量機模型,而后選擇一個恰當?shù)暮撕瘮?shù),常用的核函數(shù)有線性核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)等,本文選用應用最為廣泛的徑向基核函數(shù),將樣本特征從較低維輸入空間映射到高維特征空間,最后根據(jù)由優(yōu)化問題求解而來的支持向量得到相應的決策函數(shù),本文使用svmtrain函數(shù)及訓練集進行模型構建。核函數(shù)參數(shù)g及懲罰系數(shù)c是影響模型識別效果的關鍵參數(shù),兩者的選擇決定了分類模型的識別精度,核函數(shù)參數(shù)g決定了輸入空間映射到高維特征空間的方式,懲罰系數(shù)c決定了平衡訓練誤差和模型復雜度[16-17]。本文采用SVMcgForClass函數(shù)進行網(wǎng)格參數(shù)尋優(yōu),設置5折交叉驗證法(K=5),核函數(shù)參數(shù)g和懲罰系數(shù)c的參數(shù)尋優(yōu)條件是cmin=-10、cmax=10、gmin=-10、gmax=10,搜索范圍是[2-10,210],步進值均為0.5,最終獲得了最優(yōu)核函數(shù)參數(shù)g為0.022 097,懲罰系數(shù)c為32,分類模型識別率達到最大。分類識別結果如圖4所示,在優(yōu)化條件下,測試集的分類模型最高識別結果可達到100%的準確率。
3 結 論
實驗以巴氏殺菌熱處理風味發(fā)酵乳的品牌分類識別為例,研究探討了以拉曼光譜數(shù)據(jù)為輸入,以支持向量機算法為判別手段的乳制品計算機識別技術。該技術展現(xiàn)出拉曼光譜快捷方便的采集優(yōu)勢,每個樣品的拉曼光譜數(shù)據(jù)采集僅需2.5min,操作簡單,可直接測樣。針對實驗樣品拉曼光譜圖表現(xiàn)出較高的相似性,裸眼難以判別的情況,發(fā)展了面向對象的支持向量機判別方法,經(jīng)過譜圖預處理和參數(shù)優(yōu)化篩選后,得到適用于分類體系的優(yōu)化條件為小波軟閾值降噪(db1小波基,分解層數(shù)N=3),主成分分析選取前80個主成分(累計貢獻率達99.2%),支持向量機(徑向基核函數(shù),核函數(shù)參數(shù)g為0.022 097,懲罰系數(shù)c為32),據(jù)此,實現(xiàn)了乳制品快速模式分類,識別所需時間不足10s。
參考文獻
[1] 劇檸,胡婕.光譜技術在乳及乳制品研究中的應用進展[J].食品與機械,2019(1):232-236.
[2] 李思維,孫樹壘,張正勇.大學生液態(tài)奶消費行為研究——以南京市仙林大學城為例[J].糧食科技與經(jīng)濟,2019(6):104-108.
[3] 郭文輝,袁彩霞,洪霞,等.乳制品中氰化物的快速檢測[J]. 中國乳品工業(yè),2019(2):61-64.
[4] 張群.乳制品中抗生素的熒光快速檢測技術研究及應用[J].食品與生物技術學報,2018(12):1336.
[5] 張正勇,沙敏,劉軍,等.基于高通量拉曼光譜的奶粉鑒別技術研究[J].中國乳品工業(yè),2017(6):49-51.
[6] 石彬,李詠富,吳遠根.氯化血紅素比色法檢測乳制品中土霉素[J].中國釀造,2018(7):168-172.
[7] 趙小旭,柳家鵬,柴艷兵,等.膠體金免疫層析法快速檢測乳制品中重金屬離子鉛[J].糧食科技與經(jīng)濟,2018(3):51-54.
[8] Almeida M R,Oliveira K D S,Stephani R,et al.Fourier-transform Raman analysis of milk powder:a potential method for rapid quality screening[J].Journal of Raman Spectroscopy,2011,42(7):1548-1552.
[9] 張正勇,岳彤彤,馬杰,等.基于拉曼光譜與k最近鄰算法的酸奶鑒別[J].分析試驗室,2019(5):553-557.
[10]Paulo Henrique Rodrigues Júnior,Kamila De Sá Oliveira,Carlos Eduardo Rocha De Almeida,et al.FT-Raman and chemometric tools for rapid determination of quality parameters in milk powder: Classification of samples for the presence of lactose and fraud detection by addition of maltodextrin[J].Food Chemistry,2016(196): 584-588.
[11] Zheng Yong,Zhang Dong,Dong Gui,et al.Raman chemical feature extraction for quality control of dairy products[J].Journal of Dairy Science,2019(1):68-76.
[12] 張正勇,李麗萍,岳彤彤,等.乳粉拉曼光譜表征數(shù)據(jù)的標準化與降噪處理研究[J].糧食科技與經(jīng)濟,2018(6):57-61.
[13] 李志豪,沈俊,邊瑞華,等.機器學習算法用于公安一線拉曼實際樣本采樣學習及其準確度比較[J].光譜學與光譜分析, 2019(7):2171-2175.
[14] 陳思雨,張舒慧,張紓,等.基于共聚焦拉曼光譜技術的蘋果輕微損傷早期判別分析[J].光譜學與光譜分析,2018 (2):430-435.
[15] Lijuan Du,Weiying Lu,Zhen Zhen,et al.Rapid detection of milk adulteration using intact protein flow injection mass spectrometric fingerprints combined with chemometrics[J].Food Chemistry,2018(240):573-578.
[16] 張文雅,范雨強,韓華,等.基于交叉驗證網(wǎng)格尋優(yōu)支持向量機的產(chǎn)品銷售預測[J].計算機系統(tǒng)應用,2019(5):1-9.
[17] Li Guozhang,Xin Zhang,Li Junni,et al.Rapid identification of adulterated cow milk by non-linear pattern recognition methods based on near infrared spectroscopy[J].Food Chemistry,2014(145):342-348.