佘之蘊(yùn),黃寶瑩,王文敏,沈宏林,蔣 軒,陳滿英,張 娟
(廣東產(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)研究院,廣東 佛山 528000)
發(fā)酵乳是指以生牛(羊)乳或乳粉為原料,經(jīng)殺菌、發(fā)酵后制成的pH值降低的產(chǎn)品。其具有豐富的營養(yǎng)物質(zhì),包括生物活性蛋白、乳酸菌及其代謝產(chǎn)物[1],是葉酸、核黃素、硫胺素、煙酸、維生素B族及鈣、鎂、鋅、磷等礦物質(zhì)元素傳遞到人體的理想載體[2-3]。發(fā)酵乳的酸性使鈣離子化,能夠促進(jìn)腸道對鈣的吸收[4-5]。發(fā)酵乳具有多種保健作用,如調(diào)節(jié)腸道菌群[6-8],預(yù)防和降低糖尿病[9]、心腦血管疾病等慢性疾病發(fā)生風(fēng)險(xiǎn)等[10-12],已成為最受歡迎的乳制品之一[13-15]。酸度是發(fā)酵乳在生產(chǎn)過程中作為發(fā)酵終點(diǎn)的判定標(biāo)準(zhǔn)之一,適宜的酸度可以賦予發(fā)酵乳良好的凝固狀態(tài)。酸度是影響發(fā)酵乳營養(yǎng)價(jià)值、感官品質(zhì)和風(fēng)味等因素的基礎(chǔ)和原因,酸度過高會(huì)影響風(fēng)味和口感,導(dǎo)致乳清析出,感官質(zhì)量下降[16]。GB 19302—2010《食品安全國家標(biāo)準(zhǔn)發(fā)酵乳》中規(guī)定,酸度應(yīng)≥70.0°T[17]。因此,酸度控制是企業(yè)最為關(guān)注的問題之一。
近紅外光譜(near-infrared spectroscopy,NIRS)是介于可見光和中紅外光之間的電磁波譜,其波長范圍為780~2 526 nm[18]。近紅外光譜技術(shù)是利用化合物中特定官能團(tuán)引起振動(dòng)造成近紅外吸收峰不同,不同化合物呈現(xiàn)不同的峰值[19-20],從而對樣品進(jìn)行分析檢測。由于近紅外光譜與有機(jī)分子中含氫基團(tuán)(-OH,-CH,-SH,-NH)振動(dòng)的組合頻與各級(jí)倍頻的吸收一致,近紅外光對這些化學(xué)鍵的振動(dòng)頻率有特定的吸收峰,如淀粉、蛋白質(zhì)、脂肪酸、糖類和水分等。通過掃描待測樣品的近紅外光譜,樣品中的分子選擇性地吸收不同頻率的近紅外光,透射出來的近紅外光線就攜帶樣品中有機(jī)物結(jié)構(gòu)和組分的信息。通過檢測器分析透射光或反射光的光密度,就可以對組分進(jìn)行定性或定量檢測[21-22]。
本研究利用近紅外光譜儀采集發(fā)酵乳的近紅外光譜,對原始光譜進(jìn)行預(yù)處理,結(jié)合電位滴定法測定的酸度值,建立近紅外快速檢測方法,并比較酸度實(shí)測值與模型預(yù)測值的差異性,從而驗(yàn)證模型的準(zhǔn)確性。以期對發(fā)酵乳酸度的高效、快速檢測提供一定參考。
含活乳酸菌發(fā)酵乳樣品81批次:市售。其中71批次用于發(fā)酵乳中酸度近紅外光譜采集和模型建立,剩余10批次作為外部驗(yàn)證預(yù)測樣品。
采樣袋(聚乙烯密實(shí)袋,規(guī)格7 cm×5 cm):市售。
氫氧化鈉(分析純):天津市致遠(yuǎn)化學(xué)試劑有限公司;酚酞:天津市天新精細(xì)化工開發(fā)中心。
Thermo ANTARIS Ⅱ近紅外光譜儀(InGaAs檢測器,安裝Result 3數(shù)據(jù)采集軟件和TQ Analyst 8數(shù)據(jù)分析軟件):賽默飛世爾科技中國有限公司;785DMP自動(dòng)電位滴定儀:瑞士萬通中國有限公司;ML204/02分析天平:梅特勒托利多中國有限公司。
1.3.1 酸度測定
按照GB 5009.239—2016《食品安全國家標(biāo)準(zhǔn)食品酸度的測定》[23],采用電位滴定儀法測定樣品的酸度。
1.3.2 近紅外光譜采集
ANTARIS Ⅱ儀器采用Result 3操作系統(tǒng)采集光譜,智能透射方式,以積分球漫透射方式和空氣為背景,設(shè)置分辨率8 cm-1,掃描范圍4 000~10 000 cm-1,掃描次數(shù)為32。使用聚乙烯密封袋(7cm×5cm)采樣12~15 g,采樣后密封并應(yīng)在15 min內(nèi)錄制NIR光譜,為防止乳酸菌數(shù)在常溫條件下發(fā)生變化而影響酸度,每個(gè)樣品重復(fù)測定2次,取其平均光譜。測試過程在溫度(23±2)℃、濕度(50±5)%的恒溫恒濕環(huán)境中進(jìn)行。采用自制透漫射采樣模塊:不銹鋼材質(zhì),“[”型,長10 cm×寬3 cm×高3 cm,反射凹面經(jīng)鏡面拋光處理,凹面高度1 mm,光程3 mm。采集的光譜數(shù)據(jù)用TQ Analyst 8數(shù)據(jù)分析軟件進(jìn)行處理和計(jì)算。
1.3.3 模型的評價(jià)指標(biāo)
為保證模型的預(yù)測結(jié)果與使用國標(biāo)法獲得的實(shí)測值具有較好的一致性,本研究在模型建立和驗(yàn)證過程中使用的評價(jià)指標(biāo)如下:
校正集均方根誤差(root mean square error of calibration,RMSEC)和預(yù)測集均方根誤差(root mean square error of prediction,RMSEP):
交互驗(yàn)證均方根誤差(root mean square error of cross validation,RMSECV):
相關(guān)系數(shù)R:
式中:n表示樣品數(shù);yi表示第i個(gè)樣品使用電位滴定法獲得的實(shí)測值;表示第i個(gè)樣品的近紅外預(yù)測值;表示樣品使用電位滴定法獲得的實(shí)測值的平均值。
RMSEC、RMSEP和RMSECV分別表示校正集、預(yù)測集樣品和內(nèi)部交叉驗(yàn)證時(shí)預(yù)測值和實(shí)測值偏離的大小,其值越小,表示所建模型的預(yù)測精度越大,且RMSEC、RMSEP和RMSECV之間的差異越小,模型的預(yù)測效果就越好。RMSEC、RMSEP和RMSECV的相關(guān)系數(shù)Rc、Rp、Rcv表示樣品參數(shù)指標(biāo)的實(shí)測值和近紅外預(yù)測值之間的相關(guān)程度,其值越接近于1,說明實(shí)測值與近紅外預(yù)測值之間的相關(guān)程度越好。理想狀態(tài)條件下,相關(guān)系數(shù)R的值為1,均方根誤差為0。
1.3.4 近紅外模型建立
將1.3.1酸度實(shí)測值數(shù)據(jù)庫與1.3.2近紅外光譜數(shù)據(jù)庫進(jìn)行一一對應(yīng),以RMSEC、RMSEP、RMSECV及其相關(guān)系數(shù)Rc、Rp、Rcv為評價(jià)指標(biāo),通過剔除異常數(shù)據(jù)、選擇建模波段、化學(xué)計(jì)量學(xué)方法、光程類型、數(shù)據(jù)格式、平滑類型等光譜數(shù)據(jù)預(yù)處理等步驟,建立酸度定量模型,并采用交叉驗(yàn)證法對定量模型進(jìn)行內(nèi)部驗(yàn)證。
1.3.5 近紅外模型的外部驗(yàn)證
獲得最佳定量模型后,按照1.3.1測定未參與建模的10批次樣品的酸度,得出樣品的酸度實(shí)測值,并按1.3.2采集其近紅外光譜信息,將光譜信息導(dǎo)入定量模型,得出樣品的酸度預(yù)測值,對比酸度實(shí)測值和預(yù)測值,參照GB 5009.239—2016《食品安全國家標(biāo)準(zhǔn)食品酸度的測定》,要求兩種方法的相對誤差不超過10%。
2.1.1 剔除異常數(shù)據(jù)
采用主成分分析-馬氏距離方法剔去異常樣品,建立發(fā)酵乳酸度的預(yù)測模型,并與未剔除異常樣品建立的預(yù)測模型進(jìn)行比較。
由表1可知,建模時(shí)只采用主成分回歸法(Principal componentregression,PCR),光譜沒有進(jìn)行預(yù)處理,沒有進(jìn)行模型的優(yōu)化,采用主成分分析-馬氏距離法剔去異常樣品所建立的模型相關(guān)系數(shù)和校正集均方差均優(yōu)于未剔除光譜前。
表1 異常數(shù)據(jù)對模型的影響Table 1 Effect of abnormal data on model
采用主成分分析-馬氏距離方法剔除4批次異常數(shù)據(jù),提高近紅外光譜定量分析的可靠性,以剩余的67批次樣品進(jìn)行建模。發(fā)酵乳樣品的近紅外光譜原始數(shù)據(jù)圖見圖1。發(fā)酵乳中的酸度值主要取決于代謝產(chǎn)物有機(jī)酸的含量,有機(jī)酸含有多個(gè)C-H、O-H基團(tuán),基頻振動(dòng)400~4 000 cm-1的合頻和倍頻在近紅外光譜區(qū)4 000~12 800 cm-1有吸收,表明試驗(yàn)中對發(fā)酵乳樣品的近紅外光譜采集方法可行且有效。
圖1 發(fā)酵乳樣品的近紅外光譜原始數(shù)據(jù)圖Fig.1 Near infrared spectroscopy original data diagram of fermented milk samples
2.1.2 建模波段選擇
酸度近紅外吸收波長與模型相關(guān)性關(guān)系圖見圖2。通過觀察發(fā)酵乳近紅外原始光譜曲線,可以發(fā)現(xiàn)相似的規(guī)律:光譜性狀具有相似性,但不同樣品由于組成、性狀存在差異,光譜圖稍有不同,其吸收峰位置的差異性不顯著。在近紅外定量分析中,波長優(yōu)化可以簡化模型,剔除不相關(guān)或者非線性變量,提高模型的預(yù)測能力和穩(wěn)定性。獲得近紅外波段光譜信息中的波段范圍為4 000~10 000 cm-1。根據(jù)相關(guān)光譜的相關(guān)性系數(shù),定量分析波段確定為5 569~5 716 cm-1、5 724~6 403 cm-1、7 197~7 506 cm-1。
圖2 近紅外吸收波長與模型相關(guān)性關(guān)系圖Fig.2 Correlation diagram of near infrared absorption wavelength and model
2.1.3 化學(xué)計(jì)量學(xué)方法選擇
近紅外光譜有其自身的缺點(diǎn),如譜帶較寬,重疊嚴(yán)重,樣品中不同成分的迭加,都會(huì)造成分析過程中的干擾。借助合適的化學(xué)計(jì)量學(xué)方法,可以降低干擾,提高信噪比,有助于提升模型精度和穩(wěn)定性。在近紅外光譜技術(shù)分析中經(jīng)常采用的化學(xué)計(jì)量學(xué)方法有逐步多元線性回歸法(stepwise multiple linear regression,SMLR)、偏最小二乘法(partial least squares,PLS)、主成分回歸法(principal component regression,PCR)等[21,24]。本試驗(yàn)在建模過程中,以RMSEC、RMSEP及其相關(guān)系數(shù)Rc、Rp為評價(jià)指標(biāo),比較SMLR、PLS、PCR三種分析方法,結(jié)果見表2。由表2可知,PLS建模方法的RMSEC、RMSEP最小,Rc、Rp最接近1,故PLS為最佳處理方法。
表2 SMLR、PLS、PCR建模方法的RMSEC、RMSEP和Rc、RpTable 2 RMSEC,RMSEP,Rc and Rp of SMLR,PLS,and PCR modeling methods
2.1.4 光譜數(shù)據(jù)預(yù)處理
近紅外儀器的隨機(jī)噪聲和儀器偏差以及樣品背景、散射光等干擾都會(huì)導(dǎo)致光譜偏移或漂移。如果直接使用原始光譜建立模型,會(huì)影響模型的準(zhǔn)確度和精度。適當(dāng)?shù)墓庾V預(yù)處理能提高模型的預(yù)測性能。建立酸度定量模型時(shí),預(yù)處理方法包括:(1)光程類型(Pathlength Type):恒定光程(Constant)、多元散射校正(multiplicative signal correction,MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate,SNV)等;(2)數(shù)據(jù)格式(Data Format):原始光譜(Spectrum)、一階導(dǎo)數(shù)(first derivative,1stDer)、二階導(dǎo)數(shù)(second derivative,2ndDer);(3)平滑類型(Smoothing):不光滑(no smoothing,NS)、卷積平滑濾波(Savizky-Golay Filter數(shù)據(jù)點(diǎn)為7,3項(xiàng)式平滑濾波,S-G)、Norris導(dǎo)數(shù)平滑濾波(norris derivative filter,ND)等[25-28]。本試驗(yàn)以RMSEC、RMSEP及其相關(guān)系數(shù)Rc、Rp為評價(jià)指標(biāo),對恒定光程、MSC、SNV、1stDer(S-G)、2nd(S-G)、1st+MSC(S-G)、2nd+MSC(S-G)、1st+SNV(S-G)、2nd+SNV(S-G)分析方法比較,結(jié)果如表3所示。由表3可知,2nd+MSC(S-G)、2nd+SNV(S-G)的RMSEC最小,Rc最接近1,但其RMSEP最大,Rp最小、1st+MSC(S-G)、1st+SNV(S-G)的RMSEC、RMSEP較小,同時(shí)其Rc、Rp較接近1,選擇1st+SNV(S-G)為最佳預(yù)處理方法。
表3 近紅外光譜數(shù)據(jù)預(yù)處理方法的RMSEC、RMSEP和Rc、RpTable 3 RMSEC,RMSEP,Rc and Rp of near infrared spectral data preprocessing methods
2.1.5 采用交叉驗(yàn)證法對定量模型進(jìn)行內(nèi)部驗(yàn)證
本試驗(yàn)以樣品的85%作為校正集(calibration)樣品,15%作為驗(yàn)證集(validation)樣品進(jìn)行交叉驗(yàn)證,即以57批次作為校正集樣品,另外的10批次作為驗(yàn)證集樣品,進(jìn)行多變量建立酸度的定量模型,校正集樣品的酸度范圍為55.7~135.0°T,驗(yàn)證集樣品的酸度范圍為58.2~111.3°T。酸度預(yù)測值和實(shí)測值的相關(guān)性關(guān)系見圖3。由圖3可知,Rc和Rp均高于0.9,RMSEC與RMSEP的值很接近,說明模型相關(guān)性好,精確度高。
圖3 發(fā)酵乳中酸度定量模型的預(yù)測值和實(shí)測值的相關(guān)性關(guān)系Fig.3 Correlation between the predicted and measured values of quantitative model of acidity in fermented milk
模型的預(yù)測值和實(shí)測值的相對誤差見圖4。由圖4可知,發(fā)酵乳中酸度定量模型中預(yù)測值和實(shí)測值的相對誤差均<9%,參照GB 5009.239—2016《食品安全國家標(biāo)準(zhǔn)食品酸度的測定》,符合相對誤差不超過10%的要求。
圖4 發(fā)酵乳中酸度定量模型的預(yù)測值和實(shí)測值的相對誤差Fig.4 Relative error of the predicted and measured values of quantitative model of acidity in fermented milk
十字交叉驗(yàn)證圖(Cross validation)見圖5。由圖5可知,RMSEP和RMSECV數(shù)值相近,說明校正集樣品與驗(yàn)證集樣品都具有代表性,樣品信息提取充分,模型信息擬合充分,模型預(yù)測性好。
圖5 發(fā)酵乳中酸度定量模型的十字交叉驗(yàn)證圖Fig.5 Cross validation diagram of quantitative model of acidity in fermented milk
為進(jìn)一步考察定量模型的準(zhǔn)確性,利用外部樣品對已獲得的最佳定量模型進(jìn)行了外部驗(yàn)證。
對未參與建模的10批次含活乳酸菌發(fā)酵乳樣品,按照1.3.2電位滴定法測定樣品中酸度實(shí)測值,按1.3.3采集其近紅外光譜信息,將光譜數(shù)據(jù)導(dǎo)入定量模型,得出樣品的酸度預(yù)測值,同時(shí)將酸度實(shí)測值和預(yù)測值對比,分析其誤差是否在允許范圍內(nèi),要求二者的相對誤差不超過10%,具體結(jié)果見表5。由表5可知,酸度的實(shí)測值和預(yù)測值二者的相對誤差為1.91%~6.76%,10組數(shù)據(jù)的相對誤差都在10%以內(nèi),均在允許范圍內(nèi),說明模型具有良好的預(yù)測性能。
表5 發(fā)酵乳酸度的實(shí)測值和預(yù)測值比較Table 5 Comparison of measured and predicted values of acidity in fermented milk
試驗(yàn)結(jié)果表明,發(fā)酵乳中酸度實(shí)測值和對應(yīng)采集的近紅外光譜數(shù)據(jù)相關(guān)聯(lián)建立快速定量模型后,經(jīng)過剔除異常數(shù)據(jù)、光譜波段優(yōu)化、化學(xué)計(jì)量學(xué)方法優(yōu)選、光譜數(shù)據(jù)預(yù)處理等步驟建立的酸度定量模型。優(yōu)化后模型的定量光譜區(qū)間段為5569~5716cm-1、5724~6403cm-1、7197~7506cm-1,化學(xué)計(jì)量學(xué)方法采用PLS,光譜數(shù)據(jù)預(yù)處理方法為1st+SNV(S-G),其RMSEC、RMSEP、RMSECV分別為3.27、4.39、4.84,相關(guān)系數(shù)Rc、Rp、Rcv分別為0.946 2、0.922 5、0.877 8。經(jīng)外部驗(yàn)證后,該模型酸度預(yù)測值和電位滴定法實(shí)測值的最大相對誤差為6.76%,不超過10%,滿足要求。該定量模型具有快速、高效、準(zhǔn)確、成本低、不污染環(huán)境等優(yōu)點(diǎn),能滿足發(fā)酵乳產(chǎn)品在線質(zhì)量檢驗(yàn)的高效性和及時(shí)性要求。