李 瑋,楊紅梅,王 浩,賈婧怡,劉 琪
(北京市食品安全監(jiān)控和風險評估中心,北京 100094)
稀奶油 (cream)是以動物乳為原料的乳制品,是制作裱花蛋糕等西式烘焙食品的重要原料[1]。植脂奶油(non-dairy whip topping)是以食用氫化油、甜味劑等為主要原料的人造奶油[2],與稀奶油在外觀、特性與用途上都極為相似,但價格卻遠低于稀奶油。在實際烘焙制品應用中,不良商家常以植脂奶油摻假于稀奶油中來替代純稀奶油。但目前國內(nèi)有關烘焙制品中奶油種類及摻假定量的檢測標準尚未出臺,加之相關國家標準的缺失,給有效監(jiān)管帶來了難度,而且隨著網(wǎng)絡烘焙店的興起和奶油蛋糕等西式烘焙食品消費的逐步增長,這些問題將會越來越突出。
目前,對乳脂摻假檢測的傳統(tǒng)方法有感觀鑒別、氣相色譜等方法,但是這些方法前處理煩瑣、檢測時間長,且測定結(jié)果受人為因素影響大[3-4]。近年來,亦有學者采用紅外、拉曼、熒光等光譜技術結(jié)合化學計量學方法針對油脂含量在80%以上的黃油進行摻假定量鑒別研究[5-7]。但這些光譜技術受其檢測原理所限,其圖譜對乳脂等復雜混合物體系內(nèi)各成分解釋能力有限,難以實現(xiàn)對建模樣本的真實性判斷,具有引入不真實的樣本造成校正模型的真實性降低或(和)將特殊真實樣本排除在建模樣本外造成校正模型的普適性減弱的風險。為有效解決烘焙市場上的問題,應以稀奶油和植脂奶油為基礎,采用接近實際情況的方式配制摻假的混合奶油制品并開發(fā)適于稀奶油檢測的前處理方法。
核磁共振(nuclear magnetic resonance, NMR)是有機物結(jié)構分析的強有力工具,與液相色譜、氣相色譜法等傳統(tǒng)分析方法相比,具有高通量、重現(xiàn)性好、操作簡便、結(jié)構信息豐富等優(yōu)點,對食品等復雜體系的整體分析具有優(yōu)勢[8-9],已被用于多種植物油及其他脂類成分的分析中[10-11]。由于通過NMR所得到的樣品信息具有數(shù)據(jù)信息復雜、多維數(shù)據(jù)矩陣內(nèi)各變量之間具有高度的相關性等特點,需要結(jié)合化學計量學等算法對數(shù)據(jù)進行分析。支持向量機(SVM)[12-13]是近年來機器學習研究的一項重大成果,其主要思想是建立一個分類超平面作為決策曲面,使得正例和反例之間的隔離邊緣被最大化,錯誤概率的上界最小化。與傳統(tǒng)的人工神經(jīng)網(wǎng)絡相比,支持向量機結(jié)構簡單,且泛化能力明顯提高。
本研究采用市售稀奶油、植脂奶油樣本,建立了基于核磁共振氫譜-PCA(主成分分析)-SVM回歸法的稀奶油中植脂奶油摻假含量測定模型,利用該模型可實現(xiàn)裱花奶油產(chǎn)品中稀奶油摻假植脂奶油的含量測定。與傳統(tǒng)的PLS(偏最小二乘法)及單純SVM回歸算法建立的定量模型相比,基于PCA-SVM算法的定量模型的穩(wěn)定性、準確性以及模型的預測能力均優(yōu)于PLS、SVM算法,可為規(guī)范市場上奶油蛋糕等烘焙制品的質(zhì)量監(jiān)管提供技術支持。
1.1.1 原料與試劑
市場上采集了25個不同品牌、產(chǎn)地的奶油樣品(見表1),其中稀奶油(脂肪含量35.0%~38.0%)14個,植脂奶油(脂肪含量16.5%~37.5%)11個。稀奶油4℃存放;植脂奶油-20℃存放,使用前常溫融化,避免反復凍融。所有樣品均在保質(zhì)期前使用。
氘代氯仿 (CDCl3,氘代度99.8%),美國CIL公司。
表1 用于 1H-NMR分析的25個奶油樣品信息
1.1.2 儀器與設備
Bruker AVANCE 600 MHz超導傅里葉變換核磁共振儀(配有BBO探頭和Topspin3.2處理軟件),瑞士Bruker公司;Norell 5 mm核磁管,美國Norell公司;XS204電子天平,瑞士Mettler Toledo公司;Centrifuge 5424R離心機,德國Eppendorf公司;TARGIN多管渦旋振蕩器,北京踏錦科技有限公司;Tissuelyser II均質(zhì)器,德國Qiagen公司。
1.2.1 摻假樣品的制備
按稀奶油中摻假植脂奶油質(zhì)量分數(shù)分別為0%、5%、15%、25%、35%、45%、55%、65%、75%、85%、95%、100%比例稱取2種奶油,將稱好的2種奶油分別置于12個15 mL的塑料瓶中,每個比例點稱取的2種奶油的總質(zhì)量為10 g。放入直徑約為5 mm的不銹鋼研磨珠,用蓋子密封后放入多管渦旋振蕩器中振蕩1 min,使瓶中的兩種奶油充分混合。
1.2.2 樣品溶液的制備
稱取約500 mg 1.2.1中制備的奶油樣品于2 mL EP管中,加入1 mL CDCl3,置于均質(zhì)器中均質(zhì)40 s(30 Hz)后放入離心機中,4℃條件下離心10 min (8 000 r/min)。移取600 μL上清液于5 mm核磁管中,待測。
1.2.3 訓練集與測試集樣本的獲得
在Matlab中用Randperm函數(shù)隨機將14個稀奶油分為2組,每組7個樣品;同樣,將 11個植脂奶油分為2組,一組6個樣品,一組5個樣品。取稀奶油中第1組7個樣品和植脂奶油中第1組6個樣品,按照1.2.1 摻假樣品制備方法制備樣品,共213個樣本作為訓練集(training set)樣本;取稀奶油中第2組7個樣品和植脂奶油中第2組5個樣品,按照1.2.1 摻假樣品制備方法制備樣品,共112個樣本作為測試集(testing set)樣本。
1.2.4 儀器條件
1H NMR測定條件:使用Bruker標準脈沖序列noesyig1d,檢測溫度為297 K,譜寬SWH為6 002.40 Hz,中心頻率O1P為2 400.52 Hz,脈沖延遲時間D1為10 s,混合時間D8為0.01 s,掃描次數(shù)NS為32。
1.2.5 譜圖處理
測得的1H-NMR譜使用Bruker Topspin3.2軟件處理,變換點數(shù)為64 K,LB為1.00 Hz,用指數(shù)窗函數(shù)處理,基線和相位校正均采用手動方式進行,TMS為內(nèi)標信號(δ0.00)。處理后的圖譜以δ0.005積分段對化學位移區(qū)間δ0.40~7.00進行分段積分并進行面積歸一化處理。
1.2.6 模型建立及評價
以圖譜的分段積分值作為輸入自變量,以摻假樣本中所含稀奶油脂肪的相對含量作為擬合輸出因變量,建立模型。按照下式計算因變量。
Y=aK/(aK+bJ)
式中:Y為摻假樣本中所含稀奶油脂肪的相對含量;a為稀奶油樣品商品標簽標識的脂肪含量;b為植脂奶油樣品商品標簽標識的脂肪含量;K為摻假樣本中稀奶油的質(zhì)量分數(shù);J為摻假樣本中植脂奶油的質(zhì)量分數(shù)。
PCA、PLS模型的建立:將上述所得數(shù)據(jù)進行PCA和PLS分析,分別選用中心化法(Ctr)、單位方差法(UV)的數(shù)據(jù)標度換算方式。PLS模型采用交叉驗證(CV)Q2值、排列實驗對所建立的擬合模型進行評判。
PCA-SVM回歸模型的建立:首先用 PCA分析方法將訓練集數(shù)據(jù)自變量降維,得到新的特征變量,交叉驗證優(yōu)化模型的c、g值,然后用最優(yōu)參數(shù)訓練SVM回歸模型,模型類型為epsilon-SVR,核函數(shù)為徑向基(RBF)函數(shù)。用得到的模型預測測試集。模型評價:采用訓練集交互驗證均方根誤差(RMSECV)、測試集的判定系數(shù)(R2)、預測均方根誤差(RMSEP)作為回歸模型的評價指標。RMSECV用于評價建模方法的可行性及所得模型的預測能力,RMSEP用于評價所建模型對外部樣本的預測能力,這兩個值越小,表明模型的準確度越高,預測能力越好;R2越接近于1,說明期望值和預測值之間相關性越好。
圖1為植脂奶油和稀奶油CDCl3提取物的1H-NMR圖譜。根據(jù)文獻[14-15]報道,圖譜中δ0.75~0.99信號為脂肪鏈末端甲基質(zhì)子信號,δ1.11~1.47信號為長鏈脂肪酸一般性亞甲基質(zhì)子信號,δ1.57~1.68信號為脂肪鏈上與羰基相隔一個亞甲基的亞甲基上的質(zhì)子信號,δ1.92~2.14信號為與脂肪鏈上雙鍵相連的亞甲基質(zhì)子信號,δ2.26~2.38信號為脂肪鏈上與羰基直接相連的亞甲基質(zhì)子信號,δ2.75~2.85信號為脂肪鏈上兩個雙鍵之間亞甲基質(zhì)子信號,δ4.10~4.38和δ5.24~5.29信號分別為甘油三酯中丙三醇的亞甲基和次甲基質(zhì)子信號,δ5.30~5.43信號為非共軛脂肪酸不飽和質(zhì)子信號。
圖1 稀奶油和植脂奶油CDCl3提取物的1H-NMR圖譜
從圖1可以看出,與稀奶油相比,植脂奶油的氫譜質(zhì)子信號明顯缺少δ0.99(甘油三酯丁酸脂肪鏈末端甲基質(zhì)子信號)、δ1.92~2.14(與甘油三酯脂肪鏈上雙鍵相連的亞甲基質(zhì)子信號)、δ5.30~5.43(甘油三酯非共軛脂肪酸不飽和質(zhì)子信號)這3組質(zhì)子信號。這是因為,稀奶油來源于天然乳脂,其脂肪酸組成與牛乳類似,含有牛乳中所特有的脂肪酸(丁酸)和較多的飽和脂肪酸;而植脂奶油現(xiàn)多以氫化棕櫚仁油為原料,所以其中的脂肪酸以飽和脂肪酸為主。
為檢查定量摻假實驗所用奶油樣品是否存在異常樣品,對25個奶油樣品CDCl3提取物NMR 譜圖進行PCA分析,結(jié)果見圖2。
圖2 稀奶油、植脂奶油CDCl3提取物1H-NMR圖譜PCA分析PC1/PC2得分圖
由圖2可見,植脂奶油組出現(xiàn)了一個明顯遠離其他樣品的異常樣品,代表該樣品的化學成分與其他植脂奶油樣品具有顯著性差異。通過查閱原始1H-NMR圖譜并結(jié)合多種2D-NMR圖譜發(fā)現(xiàn),與其他植脂奶油樣品相比,此樣品中含有香蘭素,因而在PCA得分圖上會表現(xiàn)出異常偏離的趨勢。香蘭素是一種具有奶香氣息的可食用香料,在奶油、糖果等食品中使用廣泛,因此此樣品雖然在PCA得分圖中遠離其他植脂奶油樣品,但其卻代表了一類含有香蘭素的植脂奶油樣本的特征,因此后續(xù)的定量摻假實驗中應保留此樣品,不應當做異常樣本剔除。
以采用訓練集數(shù)據(jù)建立PLS稀奶油中植脂奶油摻假定量分析模型,并經(jīng)內(nèi)部交叉驗證和排列實驗對所建立的擬合模型進行評判。在潛在變量為4時,交叉驗證Q2為0.977。在此之后,通過排列實驗隨機多次(n=200)改變分類變量(y)的排列順序得到相應不同的隨機Q2和R2值對模型有效性做進一步的檢驗,結(jié)果如圖3所示。
圖3 PLS摻假定量模型排列實驗
由圖3可知,圖中所有的Q2均在R2之下,且Q2的回歸直線與y軸的交點在負半軸,說明該模型未過度擬合。以模型可預測指標Q2并結(jié)合排列實驗驗證結(jié)果說明建立的定量模型成立。
PCA-SVM摻假定量模型:在本研究中,采用了徑向基函數(shù)作為SVM的核函數(shù),以降維得到的新的特征變量作為輸入自變量,以摻假樣本中所含稀奶油脂肪的相對含量作為擬合輸出因變量,通過交叉驗證的方法優(yōu)化c、g值,優(yōu)化后的最佳c值為256,最佳g值為0.062 5,此時的RMSECV為3.69。以優(yōu)化得到的c、g值作為模型參數(shù),采用svmtrain函數(shù)訓練降維后的訓練集數(shù)據(jù),建立PCA-SVM摻假定量模型。
SVM摻假定量模型:SVM摻假定量模型的建立過程與PCA-SVM模型相似,只是不進行自變量數(shù)據(jù)的降維。
分別采用建立的PLS、SVM與PCA-SVM摻假定量模型對112個測試集樣本進行預測,模型預測值和實際值相關性見圖4~圖6。從圖4~圖6可以看出,SVM模型的預測性要優(yōu)于PLS模型。
模型相關參數(shù)結(jié)果見表2。由表2可知:SVM模型的RMSECV小于PLS模型,而訓練集R2大于PLS模型,說明SVM模型的擬合精度優(yōu)于PLS模型;同時,SVM模型的RMSEP小于PLS模型,而測試集R2大于PLS模型,說明SVM模型對外部樣本的預測能力高于PLS模型。同是SVM模型,經(jīng)過PCA降維的SVM模型RMSECV、RMSEP、測試集R2均優(yōu)于沒有降維的SVM模型,說明PCA降維能夠在保證原變量信息不變的前提下,將數(shù)據(jù)降維,使原來的多維問題大大簡化,有效縮短運行時間,提高預測精度。
圖4 PLS摻假定量模型預測值和實際值相關性
表2 PLS、SVM與PCA-SVM模型相關參數(shù)
本研究將PCA-SVM回歸法與核磁共振技術相結(jié)合,利用PCA法對數(shù)據(jù)進行降維處理,建立稀奶油中植脂奶油摻假定量分析模型,并與PLS及SVM建模結(jié)果進行對比。結(jié)果表明,PCA-SVM模型具有穩(wěn)定性好、預測準確度高、外推能力強及不存在過度學習現(xiàn)象等優(yōu)點。