程平言,范文來(lái),徐 巖
(教育部工業(yè)生物技術(shù)重點(diǎn)實(shí)驗(yàn)室,江南大學(xué)生物工程學(xué)院釀酒科學(xué)與酶技術(shù)研究中心,釀造微生物與應(yīng)用酶學(xué)研究室,江蘇無(wú)錫214122)
基于質(zhì)譜與支持向量機(jī)的清香型白酒等級(jí)判別
程平言,范文來(lái)*,徐 巖
(教育部工業(yè)生物技術(shù)重點(diǎn)實(shí)驗(yàn)室,江南大學(xué)生物工程學(xué)院釀酒科學(xué)與酶技術(shù)研究中心,釀造微生物與應(yīng)用酶學(xué)研究室,江蘇無(wú)錫214122)
不同等級(jí)白酒鑒別對(duì)控制白酒質(zhì)量和保護(hù)消費(fèi)者利益有重要意義,文中以牛欄山酒為例,研究清香型白酒質(zhì)量等級(jí)鑒別方法。運(yùn)用頂空固相微萃取質(zhì)譜(HS-SPME-MS)技術(shù)獲取三類不同等級(jí)的57個(gè)牛欄山酒樣質(zhì)荷比m/z 55~191范圍內(nèi)的離子豐度值數(shù)據(jù),分別進(jìn)行偏最小二乘回歸分析(PLS)和主成分回歸分析(PCR),其中PLS模型的預(yù)測(cè)結(jié)果明顯優(yōu)于PCR。同時(shí)PLS與PCR模型的回歸系數(shù)用于選擇重要特征離子,其中PLS與PCR回歸系數(shù)法分別選擇了12和10個(gè)離子,用選擇的離子變量構(gòu)建支持向量機(jī)(SVM)模型,模型對(duì)測(cè)試集的預(yù)測(cè)準(zhǔn)確率分別為80%和86.7%,其中PCR回歸系數(shù)法選擇的特征離子為m/z 71、103、104、106、127、149、161、179、183和184。
等級(jí)鑒別,頂空固相微萃取質(zhì)譜,偏最小二乘回歸分析,主成分回歸分析,支持向量機(jī)
食品安全與質(zhì)量等級(jí)鑒別已日漸引起人們的關(guān)注。目前,白酒研究大多采用色譜技術(shù)[1-3]和光譜技術(shù)[4]。其中范文來(lái)等[2]應(yīng)用毛細(xì)管色譜法結(jié)合聚類分析清晰區(qū)分了四川地區(qū)與江淮流域的濃香型白酒;Yang等[4]應(yīng)用近紅外光譜技術(shù)鑒別了三種不同品牌的白酒。它們大多是關(guān)于白酒不同產(chǎn)地、品牌的鑒定,而很少涉及同種酒不同質(zhì)量等級(jí)的鑒別。近年來(lái),頂空固相微萃取質(zhì)譜技術(shù)[5](HS-SPME-MS)逐漸用于白酒鑒定,這一方法無(wú)需酒樣預(yù)濃縮及化合物解析,能夠快速用于大批量樣品鑒定。近期,Cheng等利用HS-SPME-MS技術(shù)實(shí)現(xiàn)了八種不同白酒的產(chǎn)地鑒別[6]及濃香型白酒的等級(jí)鑒別[7-8],主要采用了逐步線性判別分析[9]、偏最小二乘-判別分析[10]以及神經(jīng)網(wǎng)絡(luò)等[11]化學(xué)計(jì)量學(xué)方法。
本文以清香型牛欄山不同等級(jí)酒為例,研究HS-SPME-MS技術(shù)結(jié)合偏最小二乘回歸分析(PLS)、主成分回歸分析(PCR)和支持向量機(jī)[12-13](SVM)等分析法,建立清香型白酒質(zhì)量等級(jí)鑒別模型。首先,采用HS-SPME-MS技術(shù)分析獲取不同等級(jí)牛欄山原酒的離子豐度值數(shù)據(jù);然后,經(jīng)PLS和PCR分析選取重要特征離子,構(gòu)建SVM模型,并比較模型的預(yù)測(cè)結(jié)果,確定最適等級(jí)鑒別模型及離子變量選擇方法。
1.1 材料與儀器
牛欄山酒樣 實(shí)驗(yàn)選用三個(gè)等級(jí)的牛欄山酒樣,分別為特制大米查酒(DC)、特制二米查酒(EC)和優(yōu)質(zhì)酒(YZ),其中每類等級(jí)各有19個(gè)酒樣,采用分層抽樣法將整個(gè)樣品集分成訓(xùn)練集(42個(gè)酒樣,每類等級(jí)14個(gè))和測(cè)試集(15個(gè)酒樣,每類等級(jí)5個(gè)),其中訓(xùn)練集用于構(gòu)建等級(jí)鑒別模型,而測(cè)試集則用于驗(yàn)證模型的準(zhǔn)確性;氯化鈉 上海國(guó)藥集團(tuán),分析純。
Milli-Q超純水系統(tǒng) Millipore,Bedford,MA,USA;自動(dòng)頂空進(jìn)樣系統(tǒng) 德國(guó)Gerstel公司;GC 6890N-MSD 5975氣相色譜-質(zhì)譜聯(lián)用儀 美國(guó)Agilent公司。
1.2 實(shí)驗(yàn)方法
1.2.1 樣品準(zhǔn)備 將所有不同等級(jí)的牛欄山酒樣,用超純水稀釋到10%vol,取8mL置于20mL自動(dòng)進(jìn)樣頂空瓶中,加入3g氯化鈉,蓋上瓶蓋。
1.2.2 SPME條件 參考文獻(xiàn)[14],對(duì)方法適當(dāng)改進(jìn),采用DVB/CAR/PDMS三相萃取頭于恒溫40℃下預(yù)熱5min,后在同一溫度下萃取吸附15min;萃取完成后,萃取頭插入氣相色譜儀進(jìn)樣口中解吸分析物。由于本方法僅需獲得酒樣的整個(gè)頂空色譜圖而無(wú)需解析化合物,因此,將解吸時(shí)間設(shè)為10min。
1.2.3 質(zhì)譜條件 EI電離源,電子轟擊能量為70eV,離子源溫度為230℃;掃描范圍為35~350amu。
1.2.4 化學(xué)計(jì)量學(xué)分析 文中采用PLS、PCR方法構(gòu)建等級(jí)鑒別模型,并比較兩模型的鑒別結(jié)果。同時(shí),PLS和PCR也用于篩選重要離子,借助PLS和PCR模型回歸系數(shù)值的大小,篩選出重要的特征離子。用篩選得到的離子變量構(gòu)建SVM模型,并比較兩模型的預(yù)測(cè)準(zhǔn)確性。文中所使用的軟件分別為Unscrambler 9.7,Matlab 2012a及Libsvm工具箱。
通過(guò)HS-SPME-MS技術(shù)獲取不同等級(jí)牛欄山酒質(zhì)荷比m/z 55~191范圍內(nèi)的離子豐度值,圖1顯示了牛欄山不同等級(jí)原酒的離子平均豐度質(zhì)譜圖。不同離子的豐度值存在明顯差異,其中m/z 88離子作為基峰,在所有酒樣中它的離子豐度值最高,且它是乙酯類化合物的特征離子[5]。另外,低質(zhì)荷比的離子豐度值明顯高于高質(zhì)荷比離子,甚至某些離子的豐度值在圖中趨于0。圖1中顯示出牛欄山特制大米查酒、特制二米查酒以及優(yōu)質(zhì)酒的離子相對(duì)豐度變化趨勢(shì)基本相同,僅在某些離子處的豐度值存在明顯差異。其中特制大米查酒和特制二米查酒的離子豐度值要低于其優(yōu)質(zhì)酒,特別是在高質(zhì)荷比的離子區(qū)域,它們的豐度值在圖1中趨于0??梢?jiàn),從質(zhì)譜圖中無(wú)法得到能夠區(qū)分三類等級(jí)牛欄山酒的客觀可靠的差異,因此,需借助合適的化學(xué)計(jì)量學(xué)方法來(lái)提取重要的特征離子實(shí)現(xiàn)牛欄山酒等級(jí)的鑒別。
圖1 牛欄山三個(gè)等級(jí)酒質(zhì)荷比m/z 55~191范圍內(nèi)的離子平均強(qiáng)度質(zhì)譜圖Fig.1 The average mass spectrum of Niulanshan liquors with different grades in the range of m/z 55~191
不同酒樣的離子豐度值構(gòu)成數(shù)據(jù)矩陣,但在進(jìn)行化學(xué)計(jì)量學(xué)分析前,需對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。首先,對(duì)觀測(cè)值進(jìn)行標(biāo)準(zhǔn)化,將最高峰m/z 88離子的相對(duì)豐度值設(shè)為100%,其他離子的相對(duì)豐度值根據(jù)比例計(jì)算,這樣可排除因儀器、酒精含量等外在因素造成的離子豐度值差異對(duì)判別結(jié)果的影響;然后,對(duì)離子變量進(jìn)行處理,由于某些離子的豐度值為零,采用四次方根法進(jìn)行數(shù)據(jù)轉(zhuǎn)換[15]。另外,由于m/z 88離子作為基峰,在酒樣中的相對(duì)強(qiáng)度相同,因此將其去除,如此形成了57行(訓(xùn)練集42個(gè),測(cè)試集15個(gè))×135(m/z 188離子豐度值為0)列的數(shù)據(jù)矩陣。
2.1 偏最小二乘回歸分析
PLS分析特別適用于X變量較多的情況,雖然此方法起初并非用于分類判別,但它的應(yīng)用成功實(shí)現(xiàn)了這一目的[16]。首先,將牛欄山酒的不同等級(jí)作Y變量,并對(duì)它的值作如下定義:1=特制大米查酒,2=特制二米查酒,3=優(yōu)質(zhì)酒,若網(wǎng)絡(luò)模型的輸出值在0.7與1.3之間,則酒樣判別為特制大米查酒,若輸出值在1.7與2.3之間,則酒樣判別為特制二米查酒,若輸出值在2.7與3.3之間,則酒樣判別為優(yōu)質(zhì)酒。分界點(diǎn)的選擇標(biāo)準(zhǔn)與其他已報(bào)道的研究相似[17-18]。PLS回歸分析可降低變量維度,本文中篩選出7個(gè)主成分,占整個(gè)變量集方差的96%,此最適主成分?jǐn)?shù)由交叉驗(yàn)證的最低預(yù)測(cè)殘差確定。用訓(xùn)練集酒樣構(gòu)建PLS模型,在此過(guò)程中,采用留一法交叉驗(yàn)證[19]測(cè)試模型的有效性,即每次留一個(gè)酒樣對(duì)由剩余酒樣建立的模型進(jìn)行驗(yàn)證,此過(guò)程重復(fù)n次,其中n為酒樣總數(shù),模型的預(yù)測(cè)能力為n個(gè)模型預(yù)測(cè)準(zhǔn)確率的平均值。選取前兩個(gè)成分來(lái)可視化酒樣的聚類結(jié)果,如圖2,不同等級(jí)的牛欄山酒樣基本能夠分開(kāi),僅少數(shù)酒樣發(fā)生部分重疊,其中特制大米查酒呈散狀分布,主要分布于第三象限中;特制二米查酒與優(yōu)質(zhì)酒分布較集中,呈平行分布??梢?jiàn),PLS分析能夠?qū)崿F(xiàn)不同等級(jí)牛欄山酒的分類聚集。
圖2 不同等級(jí)牛欄山酒的PLS得分圖Fig.2 The PLS two-dimensional diagrams of Niulanshan liquors of different quality grade
PLS模型的預(yù)測(cè)性能由R2、訓(xùn)練集和交叉驗(yàn)證的均方根誤差來(lái)確定。表1中顯示PLS模型對(duì)訓(xùn)練集的R2和均方根誤差值分別為0.969和0.143。當(dāng)R2值越接近1,模型的擬合結(jié)果越好,可見(jiàn),此PLS模型對(duì)酒樣等級(jí)的擬合效果較好,能夠用于牛欄山酒樣等級(jí)的預(yù)測(cè)。從表1中可見(jiàn),PLS模型對(duì)訓(xùn)練集不同等級(jí)牛欄山酒樣的預(yù)測(cè)準(zhǔn)確度都很高,分別為92.9%,100%和92.9%。
為了驗(yàn)證模型對(duì)未知等級(jí)樣品的預(yù)測(cè)能力,本文中引入測(cè)試集,其所含酒樣未用于模型的構(gòu)建。表1中顯示PLS模型對(duì)測(cè)試集中不同等級(jí)牛欄山酒樣的預(yù)測(cè)準(zhǔn)確率分別為60%、100%和60%。另外,模型對(duì)測(cè)試集的R2為0.872,等級(jí)的整體預(yù)測(cè)準(zhǔn)確率為73.3%。
表1 PLS和PCR模型的性能參數(shù)及不同等級(jí)牛欄山酒的預(yù)測(cè)準(zhǔn)確率Table 1 The performance parameter and prediction accuracy of PLS and PCR model for Niulanshan liquors of different quality grade
2.2 主成分回歸分析
應(yīng)用PCR分析時(shí),對(duì)酒樣等級(jí)的預(yù)設(shè)值及分界點(diǎn)選擇標(biāo)準(zhǔn)與PLS模型相同。PCR分析同樣可以降低變量維度,最后以交叉驗(yàn)證的最低預(yù)測(cè)殘差選出7個(gè)最適主成分,占整個(gè)變量集方差的95%。用訓(xùn)練集酒樣構(gòu)建PCR模型,在此過(guò)程中,與PLS模型相同,采用留一法交叉驗(yàn)證測(cè)試模型的有效性。選取前兩個(gè)成分來(lái)可視化酒樣的聚類結(jié)果,如圖3,不同等級(jí)牛欄山酒樣的聚類效果不如PLS分析,不同等級(jí)的酒樣無(wú)法分離,特別是特制二米查酒與優(yōu)質(zhì)酒酒樣發(fā)生明顯重疊。
圖3 不同等級(jí)牛欄山酒的PCR得分圖Fig.3 The PCR two-dimensional diagrams of Niulanshan liquors of different quality grade
從表1中可見(jiàn),PCR模型對(duì)訓(xùn)練集的R2和均方根誤差值分別為0.879、0.284,模型預(yù)測(cè)性能明顯低于PLS模型,且R2值未接近于1,模型的擬合結(jié)果不太好。PCR模型對(duì)不同等級(jí)酒樣準(zhǔn)確率分別為78.6%、85.7%和71.4%,準(zhǔn)確率差異較大,且低于PLS模型,這可能受樣本數(shù)和酒樣代表性的影響。借助測(cè)試集來(lái)驗(yàn)證PCR模型的泛化能力,不同等級(jí)酒樣的整體預(yù)測(cè)準(zhǔn)確率為66.7%。從總體看,PLS模型對(duì)等級(jí)的判別結(jié)果優(yōu)于PCR模型。
2.3 SVM模型比較
本文中PLS和PCR方法也用于變量選擇,提取重要的特征離子。這一選擇方法以回歸系數(shù)為基礎(chǔ),根據(jù)PLS和PCR模型對(duì)各離子的回歸系數(shù)的大小來(lái)選擇重要離子,應(yīng)特別注意回歸系數(shù)絕對(duì)值大的離子變量對(duì)等級(jí)判別越重要。對(duì)PLS和PCR模型,分別選取回歸系數(shù)絕對(duì)值大于1.1和0.7的離子。從圖4可見(jiàn),PLS回歸分析選取了m/z 72、76、106、112、155、157、166、170、177、179、180、183共12個(gè)離子;而PCR分析選取了m/z 71、103、104、106、127、149、161、179、183、184共10個(gè)離子。其中兩種方法均選出了m/z 106、179、183這3個(gè)離子,需特別注意它們對(duì)等級(jí)判別的重要性。
圖4 PLS(a)和PCR(b)模型對(duì)m/z 55~191范圍內(nèi)離子的回歸系數(shù)圖Fig.4 The regression coefficients of PLS(a)and PCR(b)models in the range of m/z 55~191
將兩種方法篩選出的離子,組成新的數(shù)據(jù)矩陣用作SVM模型的輸入集,牛欄山二鍋頭酒樣等級(jí)的預(yù)設(shè)值為輸出層,預(yù)設(shè)值及分界點(diǎn)選擇標(biāo)準(zhǔn)與PLS模型相同,構(gòu)建SVM模型。SVM在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì)[20]。應(yīng)用SVM過(guò)程中,需首先解決三個(gè)重要問(wèn)題,分別是合適的輸入數(shù)據(jù)集、核函數(shù)和最優(yōu)核參數(shù)。常用的核函數(shù)主要有徑向基函數(shù)、多項(xiàng)式和S型函數(shù)。與其他函數(shù)相比,徑向基函數(shù)應(yīng)用更廣泛[21],因此本文中選用徑向基函數(shù)。在確定了核函數(shù)的基礎(chǔ)上,需確定最優(yōu)的核參數(shù)g和懲罰因子c兩個(gè)參變量[22],才能準(zhǔn)確地構(gòu)建等級(jí)判別的SVM模型。SVM采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則來(lái)選擇最優(yōu)參數(shù),明顯優(yōu)于傳統(tǒng)網(wǎng)絡(luò)的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小原則[23]。本文中采取十折交叉驗(yàn)證和網(wǎng)格搜索算法在2-10~210的區(qū)域內(nèi)尋找最優(yōu)c和g值(圖5)。可見(jiàn),根據(jù)PLS回歸系數(shù)法選擇的離子所構(gòu)建的SVM模型的最優(yōu)c和g值分別為45.25和0.707;而根據(jù)PCR回歸系數(shù)法選擇的離子所構(gòu)建的SVM模型的最優(yōu)c,g值分別為2和11.314。圖5中顯示了SVM模型的網(wǎng)格搜索過(guò)程,坐標(biāo)點(diǎn)為最優(yōu)參數(shù)c和g組合。
表2顯示了由所得的兩組最優(yōu)參變量c和g值構(gòu)建的SVM模型的性能參數(shù)和不同等級(jí)白酒的預(yù)測(cè)準(zhǔn)確度??梢?jiàn),由PLS回歸系數(shù)法選擇的變量構(gòu)建的SVM模型對(duì)測(cè)試集酒樣的R2和均方根誤差分別為0.895和0.081,略優(yōu)于PCR回歸系數(shù)法。其中PLS回歸系數(shù)法構(gòu)建的SVM模型對(duì)訓(xùn)練集酒樣的預(yù)測(cè)準(zhǔn)確率分別為85.7%、100%和92.9%,測(cè)試集酒樣的平均預(yù)測(cè)準(zhǔn)確率為80.0%;由PCR回歸系數(shù)法構(gòu)建的SVM模型對(duì)訓(xùn)練集酒樣的預(yù)測(cè)準(zhǔn)確率分別為92.9%、92.9%和100%,測(cè)試集酒樣的平均預(yù)測(cè)準(zhǔn)確率為86.7%,僅2個(gè)特制大米查酒樣預(yù)測(cè)錯(cuò)誤,造成模型預(yù)測(cè)錯(cuò)誤的主要原因是用于構(gòu)建模型的訓(xùn)練集酒樣代表性不明顯。因此,若要提高模型的預(yù)測(cè)準(zhǔn)確性,增加樣本數(shù)是必不可少的過(guò)程。
圖5 SVM模型的最優(yōu)參數(shù)組合c和g的網(wǎng)格搜索圖Fig.5 The grid search process of optimal c and g parameter combination of SVM model
表2 不同離子選擇方法構(gòu)建的SVM模型的性能參數(shù)及不同等級(jí)牛欄山酒的預(yù)測(cè)準(zhǔn)確率Table 2 The performance parameter and prediction accuracy of SVM models built by two ion selection methods for Niulanshan liquors of different quality grade
圖6 PLS、PCR和SVM模型對(duì)測(cè)試集的預(yù)測(cè)誤差圖Fig.6 The prediction error of PLS,PCR and SVM model for the test set
由PCR回歸系數(shù)法選擇的離子構(gòu)建的SVM模型對(duì)牛欄山不同等級(jí)酒樣的預(yù)測(cè)準(zhǔn)確率更高。圖6比較了PLS、PCR和SVM模型對(duì)測(cè)試集的預(yù)測(cè)誤差值,很明顯,PLS和PCR模型的誤差值波動(dòng)較大,而SVM1和SVM2模型的誤差值在第5號(hào)酒樣處出現(xiàn)很大波動(dòng),但對(duì)其他酒樣的預(yù)測(cè)誤差變化很平穩(wěn)。綜合考慮,當(dāng)以±0.3為臨界值時(shí),由PCR回歸系數(shù)法選擇的變量構(gòu)建的SVM模型的預(yù)測(cè)效果要優(yōu)于其他模型,此外也說(shuō)明PCR回歸系數(shù)法能有效用于提取重要的特征離子。另外,可考慮增加酒樣的樣本量,提高酒樣的代表性來(lái)完善模型,提高模型的預(yù)測(cè)準(zhǔn)確度,降低誤差值。
以±0.3為分界點(diǎn)選擇標(biāo)準(zhǔn),PLS模型的等級(jí)預(yù)測(cè)準(zhǔn)確率高于PCR模型,同時(shí)用PLS與PCR的回歸系數(shù)值選擇重要的離子變量,構(gòu)建SVM模型。由PCR回歸系數(shù)法選擇的特征離子所構(gòu)建的SVM模型,對(duì)測(cè)試集的預(yù)測(cè)準(zhǔn)確率達(dá)86.7%,預(yù)測(cè)結(jié)果優(yōu)于其他模型,選出的重要離子為m/z 71、103、104、106、127、149、161、179、183和184。因此,質(zhì)譜技術(shù)與支持向量機(jī)相結(jié)合的方法能夠準(zhǔn)確用于白酒等級(jí)鑒別;且PCR回歸系數(shù)法能有效地選擇重要的離子變量。
[1]祝成,張宿義,趙金松.不同感官等級(jí)白酒基酒的聚類分析[J].釀酒科技,2011(9):47-50.
[2]范文來(lái),徐巖.應(yīng)用GC-FID和聚類分析比較四川地區(qū)白酒原酒與江淮流域白酒原酒[J].釀酒科技,2007(11):75-78.
[3]溫永柱,范文來(lái),徐巖,等.白酒中5種生物胺的HPLC定量分析[J].食品工業(yè)科技,2013,34(7):305-308.
[4]Yang GQ,Zhang SJ,Zhang HH.Study on discrimination of brands of Chinese distilled spirit using near infrared transmission andreflectancespectra[Z].WorldAutomationCongress,Kobe,2010.
[5]Jelen HH,Ziolkowska A,Kaczmarek A.Identification of the botanical origin of raw spirits produced from rye,potato,and corn based on volatile compounds analysis using a SPME-MS method [J].Journal of Agricultural and Food Chemistry,2010,58(24):12585-12591.
[6]Cheng PY,F(xiàn)an W,Xu Y.Determination of Chinese liquors from differentgeographic originsbycombination ofmass spectrometry and chemometric technique[J].Food Control,2014,35(1):153-158.
[7]程平言,范文來(lái),徐巖.基于質(zhì)譜與化學(xué)計(jì)量學(xué)的濃香型白酒等級(jí)鑒別[J].食品與發(fā)酵工業(yè),2013,39(6):94-98.
[8]Cheng PY,F(xiàn)an W,Xu Y.Quality grade discrimination of chinese strong aroma type liquors using mass spectrometry and multivariate analysis[J].Food Research Internationa(lin press).
[9]Liu L,Cozzolino D,Cynkar W,et al.Geographic classification of Spanish and Australian Tempranillo red wines by visible and near-infrared spectroscopy combined with multivariate analysis [J].Journal of Agricultural and Food Chemistry,2006,54(18):6754-6759.
[10]Abdi H.Partial least squares regression and projection on latent structure regression[J].Wiley Interdisciplinary Reviews:Computational Statistics,2010,2(1):97-106.
[11]Marini F.Artificial neural networks in foodstuff analyses:Trends and perspectives A review[J].Analytica Chimica Acta,2009,635(2):121-131.
[12]Xu Y,Zomer S,Brereton RG.Support vector machines:A recent method for classification in chemometrics[J].Critical Reviews in Analytical Chemistry,2006,36(3-4):177-188.
[13]Liu F,He Y,Wang L.Determination of effective wavelengths for discrimination offruit vinegars using near infrared spectroscopy and multivariate analysis[J].Analytica Chimica Acta,2008,615(1):10-17.
[14]Fan W,Qian MC.Headspace solid phase microextraction and gas chromatography-olfactometry dilution analysis of young and aged Chinese“Yanghe Daqu”liquors[J].Journalof Agricultural and Food Chemistry,2005,53(20):7931-7938.
[15]Wold S,Sj?str?m M,Eriksson L.PLS-regression:a basic tool of chemometrics[J].Chemometrics and Intelligent Laboratory Systems,2001,58(2):109-130.
[16]Pereira AC,Reis MS,Saraiva PM,et al.Analysis and assessment of Madeira wine ageing over an extended time period through GC-MS and chemometric analysis[J].Analytica Chimica Acta,2010,660(1-2):8-21.
[17]Yu H,Zhou Y,F(xiàn)u X,et al.Discrimination between Chinese rice wines of different geographical origins by NIRS and AAS[J]. European Food Research and Technology,2006,225(3-4):313-320.
[18]Cozzolino Dl,Smyth HE,Gishen M.Feasibility study on the use of visible and near-infrared spectroscopy together with chemometrics to discriminate between commercial white wines of different varietal origins[J].Journal of Agricultural and Food Chemistry,2003,51(26):7703-7708.
[19]Sampaio OM,Reche RV,F(xiàn)ranco DW.Chemical profile of rums as a function of their origin.The use of chemometric techniques for their identification[J].Journal of Agricultural and Food Chemistry,2008,56(5):1661-1668.
[20]林翠香.基于數(shù)據(jù)挖掘的葡萄酒質(zhì)量識(shí)別[D].長(zhǎng)沙:中南大學(xué),2010:38-39.
[21]Belousov AI,Verzakov SA,Von Frese J.Applicational aspects of support vector machines[J].Journal of Chemometrics,2002,16(8-10):482-489.
[22]CherkasskyV,MaYQ.Practicalselection ofSVM parameters and noise estimation for SVM regression[J].Neural Networks,2004,17(1):113-126.
[23]Gunn SR.Support Vector Machines for Classification and Regression[R].ISIS Technical Report,1998:5.
Quality grade discrimination of light aroma type liquor based on mass spectrometry and support vector machine
CHENG Ping-yan,F(xiàn)AN Wen-lai*,XU Yan
(Key Laboratory of Industrial Biotechnology,Ministry of Education,Laboratory of Brewing Microbiology and Applied Enzymology,School of Biotechnology,Jiangnan University,Wuxi 214122,China)
Quality grade discrimination of Chinese liquor was benefit for controlling liquor quality and safeguarding the interests of consumers.In this paper,taking Niulanshan for instance,we studied quality grade discrimination of Chinese liquor with light aroma type.Mass spectra of 57 samples were obtained by head space-solid phase microextraction-mass spectrometry(HS-SPME-MS)technology in the range of m/z 55~191.And then,the partial least squares regression(PLS)and principal component regression(PCR)models were developed by calibration set and predicted the quality grade of validation set.Obviously PLS model was superior to PCR model.The support vector machine(SVM)models were built by different ion selection methods,PLS regression coefficients and PCR regression coefficients;the prediction accuracy of SVM models for the test set was 80% and 86.7%,respectively.The ions,m/z 71,103,104,106,127,149,161,179,183 and 184 were selected by PCR regression coefficients.
quality grade discrimination;head space-solid phase microextraction-mass spectrometry(HSSPME-MS);partial least squares regression(PLS);principal component regression(PCR);support vector machine(SVM)
TS207.3
A
1002-0306(2014)08-0049-05
10.13386/j.issn1002-0306.2014.08.001
2013-07-05 *通訊聯(lián)系人
程平言(1988-),女,碩士研究生,研究方向:酒類風(fēng)味化學(xué)。
國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)(2013AA102108)。