高 暢,張宇飛,辛 穎,李艷敏,魏金旺,朱婷婷 *,李子文,孫海波
(1.北京順鑫農(nóng)業(yè)股份有限公司牛欄山酒廠,北京 101301;2.中國(guó)食品發(fā)酵工業(yè)研究院有限公司,北京 100015)
白酒是以淀粉質(zhì)原料或糖質(zhì)原料,加入糖化發(fā)酵劑,經(jīng)固態(tài)、半固態(tài)或液態(tài)發(fā)酵、蒸餾、貯存、勾兌而制成的蒸餾酒。發(fā)酵后的酒醅經(jīng)過蒸餾后得到基酒,基酒經(jīng)過存儲(chǔ)陳化處理后進(jìn)行勾兌得到成品酒。不同酒廠成品酒勾兌的方法不同,但基酒組分分析是必不可少的,總酯作為基酒品質(zhì)的關(guān)鍵指標(biāo),用國(guó)家標(biāo)準(zhǔn)所規(guī)定的化學(xué)滴定法,存在操作過程復(fù)雜、工作量大,消耗大量化學(xué)試劑、耗時(shí)長(zhǎng)以及對(duì)環(huán)境產(chǎn)生污染的缺點(diǎn)[1],且對(duì)化驗(yàn)人員的技術(shù)水平有一定要求,無(wú)法滿足基酒快速分析的需求。因此,為了滿足釀酒生產(chǎn)需要、降低實(shí)驗(yàn)成本、保護(hù)環(huán)境,開發(fā)一種快速、精準(zhǔn)、高效的分析技術(shù)來檢測(cè)釀酒生產(chǎn)中的關(guān)鍵性指標(biāo)顯得尤為重要。
近紅外光譜(near-infrared spectroscopy,NIRS)法具有檢測(cè)快速、樣品無(wú)損耗、操作簡(jiǎn)單、分析效率高,無(wú)需前處理且無(wú)污染,可同時(shí)對(duì)樣品的多項(xiàng)指標(biāo)進(jìn)行檢測(cè)等優(yōu)點(diǎn)[2-4],已被廣泛應(yīng)用于酒類行業(yè)中原料、半成品及成品酒質(zhì)量檢測(cè)中[5-7]。薛磊等[8]用近紅外光譜技術(shù)對(duì)黃酒風(fēng)格進(jìn)行判別。謝廣發(fā)等[9]建立了能夠同時(shí)定量分析黃酒中酒精度、總酸以及氨基酸態(tài)氮的校正模型。熊雅婷等[10]利用近紅外光譜技術(shù)對(duì)白酒酒醅主要成分進(jìn)行定量分析,通過偏最小二乘法建立分析模型,實(shí)現(xiàn)對(duì)白酒酒醅主要成分的快速檢測(cè)。盧中明等[11]對(duì)白酒酒醅近紅外模型進(jìn)行分析研究,酒醅中低含量組分測(cè)定時(shí)存在的數(shù)據(jù)差異進(jìn)行了說明,并找到了影響數(shù)據(jù)準(zhǔn)確性的因素。劉建學(xué)等[12-14]將基酒中酸類、醇類、醛類物質(zhì)含量用氣相色譜法與近紅外光譜進(jìn)行關(guān)聯(lián),建立了快速準(zhǔn)確的檢測(cè)方法。買書魁等[15-16]應(yīng)用近紅外光譜技術(shù)對(duì)高粱中直鏈淀粉和支鏈淀粉含量進(jìn)行定量分析,通過建立模型能夠快速、準(zhǔn)確地測(cè)定釀酒原料高粱中直鏈淀粉和支鏈淀粉含量;并且研究了近紅外光譜技術(shù)在白酒原酒中分析與應(yīng)用。何超等[17]針對(duì)等級(jí)酒近紅外模型建立的可靠性上進(jìn)行了初步探索。田育紅等[18]以近紅外光譜分析技術(shù)為基礎(chǔ),采用偏最小二乘法(partial least squares,PLS)分別建立酒精度、總酸、總酯的定量檢測(cè)模型,為快速測(cè)定白酒中重要指標(biāo)提供參考。以上研究均表明近紅外光譜分析技術(shù)可應(yīng)用于白酒釀造生產(chǎn)中,但目前對(duì)于基酒品質(zhì)指標(biāo)的近紅外分析研究仍較少,往往大部分只停留理論研究,未將深入優(yōu)化的模型應(yīng)用于白酒實(shí)際釀造過程的分析檢測(cè)中。
針對(duì)白酒基酒中的重要品質(zhì)指標(biāo)總酯含量進(jìn)行快速分析研究,采用向后間隔偏最小二乘法(backward interval PLS,BiPLS)對(duì)基酒光譜的整個(gè)譜區(qū)進(jìn)行波段篩選,探究光譜波段選擇對(duì)白酒總酯指標(biāo)建模分析的影響,并結(jié)合偏最小二乘法(PLS)[19-20]構(gòu)建快速分析模型,為白酒基酒品質(zhì)的快速分析提供一定參考依據(jù)。
基酒樣品(共743個(gè),涵蓋不同季節(jié)、排次以一年為周期的基酒):牛欄山酒廠釀酒生產(chǎn)車間。
氫氧化鈉(分析純):國(guó)藥集團(tuán)化學(xué)試劑有限公司;硫酸(分析純):天津光復(fù)科技發(fā)展有限公司;酚酞:北京化工廠。
N500傅里葉變換近紅外光譜儀(光源為鹵鎢燈,檢測(cè)器為溫控InGaAs,配有固體測(cè)量池及透反射蓋):瑞士步琦有限公司。
1.3.1 總酯含量測(cè)定方法
基酒總酯含量根據(jù)國(guó)標(biāo)GB/T 10345—2007《白酒分析方法》中的指示劑法測(cè)定。
1.3.2 近紅外光譜采集
將基酒樣品倒入配套的測(cè)量池中,壓上透反射蓋,從測(cè)量池底部檢查無(wú)氣泡。利用配套軟件NIRWare Operator采集白酒基酒樣品的近紅外光譜信息,光譜范圍為10 000~4 000 cm-1,分辨率為8 cm-1,掃描次數(shù)為32次。采用透反射方式掃描采集近紅外光譜,標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate transform,SNV)方法對(duì)光譜進(jìn)行預(yù)處理。
1.3.3 校正集與驗(yàn)證集的劃分
在剔除掉5個(gè)異常點(diǎn)的基礎(chǔ)上,以2∶1的比例對(duì)剩余738個(gè)基酒樣品進(jìn)行校正集和驗(yàn)證集劃分。本實(shí)驗(yàn)采取Kennard-Stone(K-S)法[21]進(jìn)行建模樣品劃分。最終分別選擇了校正集及驗(yàn)證集樣本492個(gè)、246個(gè)。校正集與驗(yàn)證集基酒樣品的總酯含量統(tǒng)計(jì)如表1所示。
表1 校正集與驗(yàn)證集統(tǒng)計(jì)結(jié)果Table 1 Statistical results of calibration set and validation set
1.3.4 光譜變量選擇
本實(shí)驗(yàn)擬采用后向間隔偏最小二乘法(BiPLS)[22]對(duì)全光譜1501個(gè)變量進(jìn)行選擇,該方法的特點(diǎn)是將參與運(yùn)算篩選的譜區(qū)劃分為一定數(shù)量的間隔(子區(qū)間),然后分別計(jì)算各子區(qū)間的交叉驗(yàn)證均方差(root mean square error of cross validation,RMSECV)值,每次剔除最大值所對(duì)應(yīng)的區(qū)間,在剩余區(qū)間上建立PLS模型并給出相應(yīng)的RMSECV值,如此循環(huán),直至剩下單一子區(qū)間建立PLS模型,在此一一排除過程中,各PLS模型RMSECV值最小時(shí)所對(duì)應(yīng)的多個(gè)區(qū)間即為所優(yōu)化出的最佳建模組合區(qū)間。
1.3.5 數(shù)據(jù)處理與分析
BiPLS程序在MATLAB環(huán)境下運(yùn)行,偏最小二乘計(jì)算應(yīng)用UnscramblerX10.3光譜分析軟件(挪威CAMO公司)實(shí)現(xiàn),模型的精確度與穩(wěn)定性通過決定系數(shù)R2、校正均方根誤差(RMSEC)、預(yù)測(cè)均方根誤差(RMSEP)來評(píng)價(jià),R2越接近1,RMSEP越接近0,RMSEC與RMSEP越接近,表明模型效果越好[23-24]。
在運(yùn)用后向間隔偏最小二乘法(BiPLS)優(yōu)選譜曲波段時(shí),如果間隔數(shù)量過少容易遺漏細(xì)節(jié)信息,過多時(shí)則會(huì)導(dǎo)致最后的結(jié)果過于復(fù)雜[25]。因此在考慮到區(qū)間分割數(shù)對(duì)選擇結(jié)果及模型的影響后,本研究將白酒基酒全光譜數(shù)據(jù)共1 501個(gè)波數(shù)點(diǎn)等分為k個(gè)子區(qū)間(k=10~40,間隔5),在每種分割情況下運(yùn)行BiPLS程序,采用留一法來計(jì)算RMSECV值。如表2所示,當(dāng)分割數(shù)為20時(shí),BiPLS所得RMSECV值最小為0.177 1,入選子區(qū)間為[7,2],所對(duì)應(yīng)的信息區(qū)間分別是波數(shù)4 304~4 600 cm-1和5 804~6 100 cm-1,BiPLS共選擇了150個(gè)波長(zhǎng)點(diǎn),占全譜的10.0%。
表2 20個(gè)區(qū)間數(shù)的后向間隔偏最小二乘法優(yōu)化結(jié)果Table 2 BiPLS optimization results of 20 intervals
續(xù)表
在上述波段篩選的基礎(chǔ)上,建立白酒基酒總酯含量指標(biāo)的全光譜-PLS及BiPLS-PLS,定量分析模型,并通過對(duì)決定系數(shù)R2、校正標(biāo)準(zhǔn)偏差RMSEC和預(yù)測(cè)標(biāo)準(zhǔn)偏差RMSEP進(jìn)行分析對(duì)比,從整體上來對(duì)模型效果進(jìn)行評(píng)價(jià),具體模型各指標(biāo)效果見表3。
表3 基酒總酯指標(biāo)的不同偏最小二乘法模型及性能評(píng)價(jià)結(jié)果Table 3 Different PLS models and performance evaluation results of total esters in base liquor
由表3可知,白酒基酒的總酯模型在使用全光譜進(jìn)行建立時(shí),效果并不理想,RMSEC與RMSEP值分別達(dá)到0.490及0.476,而決定系數(shù)(R2)僅有0.484,代表模型整體的相關(guān)線性效果并不理想,預(yù)測(cè)誤差較大,難以滿足基酒實(shí)際生產(chǎn)中的快速分析使用。而在經(jīng)BiPLS的系統(tǒng)篩選波段后,模型效果有了顯著的提升,決定系數(shù)R2提升至0.937,為全光譜建模時(shí)決定系數(shù)(R2)的194.6%,近乎成倍的增長(zhǎng)提升,同時(shí)RMSEC及RMSEP值分別下降至0.172和0.177,分別為原先的35.1%及37.2%,代表模型的預(yù)測(cè)精度有了非常顯著的提升,變量數(shù)也從1 501個(gè)降低至150個(gè),充分說明了波段篩選能夠有效地對(duì)白酒關(guān)鍵指標(biāo)模型進(jìn)行優(yōu)化,在保留關(guān)鍵波長(zhǎng)信息的同時(shí),降低了模型復(fù)雜程度,加快模型計(jì)算速度,顯著提升模型預(yù)測(cè)效果。
BiPLS方法篩選的變量在白酒基酒完整光譜中的分布情況見圖1。由圖1可知,白酒基酒的吸收全譜在波數(shù)為5 164 cm-1及6 884 cm-1處能夠看出明顯的吸收峰,這兩處是吸收峰分別是白酒中水分O-H伸縮和HOH彎曲的組合頻,以及O-H伸縮的一級(jí)倍頻吸收[26],經(jīng)波段篩選后,并未選用以上兩組波數(shù)所在的譜段,有效避免了在使用全譜區(qū)建立模型時(shí)水分的強(qiáng)吸收對(duì)于總酯含量分析的干擾。圖1中紅色譜段為BiPLS方法篩選出的特征譜段,與C-H、C=O等主要官能團(tuán)的基頻與組合頻振動(dòng)吸收峰位置相對(duì)應(yīng),如波數(shù)4 504 cm-1處C-H伸縮振動(dòng)和C=O伸縮振動(dòng)的組合頻吸收,波數(shù)4 514 cm-1處C-H彎曲振動(dòng)和羰基伸縮振動(dòng)的組合頻吸收以及波數(shù)5 960 cm-1處羰基相連甲基的C-H吸收等[27],體現(xiàn)出了白酒基酒樣品中總酯成分的特征吸收。
圖1 后向間隔偏最小二乘法選擇的變量分布情況Fig.1 Distribution diagram of variables selected by BiPLS
將優(yōu)化后的白酒總酯模型導(dǎo)入儀器,獲取實(shí)際生產(chǎn)中50個(gè)基酒樣品的光譜進(jìn)行模型驗(yàn)證并繪制模型對(duì)比圖見圖2。由圖2可知,白酒基酒樣品的總酯實(shí)測(cè)值與模型預(yù)測(cè)值點(diǎn)呈對(duì)角線分布,且經(jīng)成對(duì)t檢驗(yàn),各項(xiàng)指標(biāo)預(yù)測(cè)值與實(shí)測(cè)值無(wú)明顯差異(P>0.05)。經(jīng)驗(yàn)證,驗(yàn)證數(shù)據(jù)R2為0.939,RMSEP為0.176;說明模型預(yù)測(cè)結(jié)果較為準(zhǔn)確。
圖2 基酒總酯后向間隔偏最小二乘法模型理化值與預(yù)測(cè)值分布Fig.2 Distribution idealized value and predicted value of total esters in base liquor by BiPLS model
本研究采用近紅外光譜技術(shù)結(jié)合向后間隔偏最小二乘法(BiPLS)對(duì)白酒基酒的總酯指標(biāo)進(jìn)行了定量分析,分析速度快,無(wú)需樣本預(yù)處理,克服了傳統(tǒng)檢測(cè)方法費(fèi)時(shí)費(fèi)力的缺點(diǎn)。
經(jīng)波段優(yōu)化篩選后,采用特征波段所建模型效果相比全譜區(qū)所建模型獲得了改善,不僅剔除了譜圖中的無(wú)用信息,減輕了模型的復(fù)雜程度,也提升了模型的準(zhǔn)確性與穩(wěn)定性,充分說明了優(yōu)化波段對(duì)建模分析的重要性,表明了BiPLS算法結(jié)合偏最小二乘法建模在白酒品質(zhì)分析應(yīng)用的巨大潛力,BiPLS方法所建立的基酒總酯定量分析模型,經(jīng)實(shí)際生產(chǎn)驗(yàn)證,具有快速、穩(wěn)定、準(zhǔn)確的特點(diǎn),可實(shí)現(xiàn)對(duì)基酒總酯含量的快速無(wú)損檢測(cè),也可以用于生產(chǎn)過程中的實(shí)時(shí)在線監(jiān)測(cè)。