吳正宗, 王 芳, 徐恩波, 徐學(xué)明, 焦愛權(quán)*
傅立葉紅外光譜技術(shù)快速檢測黃酒中的氨基酸質(zhì)量濃度
吳正宗1,2, 王 芳1,2, 徐恩波1,2, 徐學(xué)明1, 焦愛權(quán)*1,2
(1.江南大學(xué) 食品學(xué)院,江蘇 無錫214122;2.食品科學(xué)與技術(shù)國家重點(diǎn)實(shí)驗(yàn)室,江南大學(xué),江蘇 無錫214122)
氨基酸含量是評價(jià)黃酒質(zhì)量和風(fēng)味的一項(xiàng)重要指標(biāo)。為了實(shí)現(xiàn)對黃酒中氨基酸質(zhì)量濃度的快速檢測,作者探索了將傅立葉紅外光譜技術(shù)(FT-IR)應(yīng)用于黃酒中的17種自由氨基酸質(zhì)量濃度的快速檢測的可行性,同時(shí)采用協(xié)同區(qū)間偏最小二乘算法(SiPLS)和遺傳算法(GA)選出有效波長以期提高模型的預(yù)測精度。實(shí)驗(yàn)結(jié)果顯示與基于全波長光譜建立的經(jīng)典偏最小二乘算法模型相比,基于SiPLS和GA選出來的有效光譜變量而建立的回歸模型的精度有顯著提高,尤其是對半胱氨酸(Cys)、精氨酸(Arg)和脯氨酸(Pro)。此外,對于所有的氨基酸,GA-SiPLS模型效果最好,交互驗(yàn)證相關(guān)系數(shù)均大于0.80,殘余預(yù)測偏差均大于2.00。因此,F(xiàn)T-IR結(jié)合特征譜區(qū)篩選方法可以作為常規(guī)檢測的一種替代手段實(shí)現(xiàn)對黃酒中的自由氨基酸的快速檢測。
波長選擇;傅立葉變換紅外光譜;氨基酸;遺傳算法;協(xié)同區(qū)間偏最小二乘算法
黃酒中的氨基酸也是黃酒的風(fēng)味物質(zhì)的前驅(qū)體。氨基酸以其具有的鮮、甜、苦、澀、酸等諸多味感賦予黃酒豐富的味覺層次,使其具有鮮美、柔和、濃郁、柔潤和協(xié)調(diào)的特征[1-3]。此外,黃酒中的氨基酸質(zhì)量濃度還可被用來實(shí)現(xiàn)產(chǎn)地溯源及真假鑒定[1]。因此,準(zhǔn)確的對黃酒中的氨基酸進(jìn)行定量分析不論對于黃酒的營養(yǎng)價(jià)值和風(fēng)味評估,還是對酒質(zhì)的控制都具有重要的意義。
目前,黃酒中氨基酸的檢測方法主要是高效液相色譜法(HPLC)、毛細(xì)管電泳法和氨基酸自動(dòng)分析儀法。此外,采用氣相色譜法檢測氨基酸成分的方法也已有報(bào)道[4]。盡管這些分析方法通常精確、可靠,但依然有著諸如需要復(fù)雜冗長的樣品預(yù)處理、耗時(shí)等諸多缺點(diǎn),難以適應(yīng)現(xiàn)代化的大工業(yè)生產(chǎn)。因此,急需一種簡便、經(jīng)濟(jì)的分析方法來實(shí)現(xiàn)氨基酸的快速測定,從而降低成本、提高效率。
紅外光譜技術(shù)因其快速、無損、綠色的特點(diǎn)引起人們的關(guān)注和重視,近年來,其已作為常規(guī)化學(xué)檢測的一種替代手段被廣泛應(yīng)用在組分測定、產(chǎn)地溯源和過程控制等諸多領(lǐng)域[5-7]。在氨基酸的檢測方面,已有許多研究者成功的將近紅外光譜技術(shù)(FTNIR)應(yīng)用到大豆、花生等原料中的氨基酸質(zhì)量濃度檢測中[8-9],然而,采用傅立葉紅外光譜技術(shù)對原料中的氨基酸含量進(jìn)行快速檢測的研究則較少。目前,僅Subramanian等[10]采用FT-IR對奶酪成熟過程中的有機(jī)酸和氨基酸含量進(jìn)行快速檢測。已有學(xué)者證明FT-NIR更適用于對表征總量的參數(shù)的測定,而FT-IR則在單個(gè)組分質(zhì)量濃度的預(yù)測方面更有優(yōu)勢。此外,之前的研究建立的模型往往是基于全波長的偏最小二乘模型(PLS)。全光譜中包含很多共線變量和無關(guān)變量。如果這些變量包含在建模變量中,模型精度將不可避免的受影響。
因此,作者采用FT-IR技術(shù)來實(shí)現(xiàn)對黃酒中氨基酸含量的快速檢測,并使用波長選擇算法提高模型預(yù)測精度,以期為黃酒中氨基酸質(zhì)量濃度的快速檢測提供幫助。
1.1 樣品來源
試驗(yàn)共采用109份黃酒樣品。其中23個(gè)樣品來自“古越龍山”,22個(gè)樣品來自“閩族紅”,23個(gè)樣品來自“女兒紅”,20個(gè)樣品來自“塔牌”,21個(gè)樣品來自“西塘”。為增加回歸模型的穩(wěn)健性,同一品牌的黃酒樣品取自不同生產(chǎn)批次(日期)。
1.2 儀器設(shè)備
Nicolet iS10傅立葉紅外光譜儀:美國賽默飛公司產(chǎn)品;Ag1100液相色譜儀:美國安捷倫公司產(chǎn)品。
1.3 實(shí)驗(yàn)方法
1.3.1 氨基酸含量的測定 色譜柱采用ODS HYPERSIL(250 mm×4.6 mm,5 μm),柱溫保持在40℃,采用雙流動(dòng)相梯度洗脫。
1.3.2 紅外光譜掃描 首先光譜儀開機(jī)預(yù)熱半小時(shí),然后用移液槍取100 μL黃酒樣品置于晶片上進(jìn)行紅外光譜掃描。光譜采集條件為:掃描范圍525~4 000 cm-1,分辨率4 cm-1,掃描次數(shù)16,光譜間隔點(diǎn)1.93 cm。使用去離子水按照與樣品相同的條件掃描作為空白對照。每次完成掃描后,使用去離子水清洗晶片,并用紙巾擦拭干凈。每個(gè)樣品采集3次光譜,以克服樣品的不均勻性。數(shù)據(jù)采集使用OMINIC軟件。
1.3.3 多變量回歸模型的建立 使用 MATLAB 2010a軟件(美國MathWorks公司)對紅外光譜數(shù)據(jù)和氨基酸數(shù)據(jù)進(jìn)行定量模型的構(gòu)建。為了消除基線漂移、顆粒散射及高頻隨機(jī)噪音等影響造成的誤差,更有效的提取光譜中的有效信息,建模前,采用平滑(Smooth)、矢量歸一化(SNV)、多元散射校正(MSC)、一階導(dǎo)數(shù)(D1)、二階導(dǎo)數(shù)(D2)及基線校正(BC)6種光譜預(yù)處理方法對紅外光譜進(jìn)行處理。選出交互驗(yàn)證均方根誤差(RMSECV)最小的方法作為各個(gè)氨基酸最佳的預(yù)處理方法。同時(shí),采用了主成分分析(PCA)探索了紅外光譜用于不同品牌黃酒區(qū)分的可能性。作者建立了3種回歸模型。首先建立了基于全波長的經(jīng)典PLS模型,然后用SiPLS選出最佳的子區(qū)間組合,建立SiPLS模型,最后用GA進(jìn)一步提取有效波長變量,減少冗雜變量,基于這些與氨基酸含量高度相關(guān)的幾十個(gè)變量,建立GASiPLS模型。RMSECV、預(yù)測均方根誤差(RMSEP)、交互驗(yàn)證相關(guān)系數(shù) (R2(cal))、預(yù)測相關(guān)系數(shù)(R2(pre))及殘余預(yù)測偏差(RPD)被用來評價(jià)所建立的回歸模型的穩(wěn)健性和預(yù)測性能。一般來說,相關(guān)系數(shù)和殘余預(yù)測偏差取值越大,均方根誤差取值越小,模型的穩(wěn)健性越好。R2和RPD評價(jià)模型的標(biāo)準(zhǔn)如表1所示。各個(gè)氨基酸的最佳波長預(yù)處理方法如表2所示。
表1 回歸模型的評價(jià)標(biāo)準(zhǔn)Table 1 Criteria used for the evaluation of calibration models
表2 各個(gè)氨基酸的最佳光譜預(yù)處理方法Table2 Optimal preprocessing methods for spectra detection of different amino acids
2.1 氨基酸化學(xué)參考值結(jié)果分析
通過分析剔除1個(gè)異常樣本后,剩下的108個(gè)黃酒樣本采用隔三選一法劃分為校正集和預(yù)測集。具體分類方法如下:首先將108個(gè)黃酒樣品的氨基酸含量按照從高到低的順序排列,然后將每4個(gè)樣品作為一個(gè)小集合,其中的任意3個(gè)劃分到校正集中,另一個(gè)劃分到預(yù)測集中,如此循環(huán),最終校正集中含有81個(gè)樣品,預(yù)測集中有27個(gè)樣品。校正集樣本用于黃酒各指標(biāo)近紅外模型的建立,驗(yàn)證集樣本用于驗(yàn)證所建模型的準(zhǔn)確度與可靠性。兩個(gè)子集中樣品的氨基酸含量的最大值、最小值、平均值和標(biāo)準(zhǔn)偏差如表3所示。各種氨基酸的含量之間差異很大。以校正集中數(shù)值為例,甘氨酸(Gly)質(zhì)量濃度最高,其平均值高達(dá)529.00 mg/L,其次是丙氨酸(Ala)和亮氨酸 (Leu),它們的平均值都在300.00 mg/L以上,剩下的14種氨基酸質(zhì)量濃度較少,平均值在16.67~291.75 mg/L之間。除了氨基酸的質(zhì)量濃度高,黃酒中氨基酸的另一個(gè)特點(diǎn)是“質(zhì)量好”,表2可見,黃酒中富含人體必需的8種氨基酸中的7種(賴氨酸(Lys)、苯丙氨酸(Phe)、甲硫氨酸(Met)、蘇氨酸(Thr)、異亮氨酸(Ile)、亮氨酸(Leu)和纈氨酸(Val))。其中賴氨酸尤為重要,因?yàn)樗鼘θ梭w的生長有著重要的作用。黃酒各種氨基酸均展現(xiàn)出了很寬的質(zhì)量濃度范圍,這可能是由于各個(gè)酒廠采用的釀造技術(shù)和生產(chǎn)原料不同。較寬的質(zhì)量濃度范圍十分有利于構(gòu)建穩(wěn)健、可靠的模型。此外,校正集中各個(gè)氨基酸的含量范圍包含了整個(gè)預(yù)測集的范圍,且兩個(gè)子集的標(biāo)準(zhǔn)偏差基本相同,這說明,樣品合理的分配到了兩個(gè)子集中。
為了更好地理解不同氨基酸之間的關(guān)系,作者進(jìn)行了相關(guān)性分析。17種氨基酸之間展現(xiàn)出了很強(qiáng)的相關(guān)性。很多氨基酸之間的Pearson相關(guān)系數(shù)高達(dá)0.90以上。
2.2 黃酒的紅外光譜譜圖解析
由圖1可以看出,黃酒的紅外光譜中有著豐富的吸收峰。其中1 500~1 700 cm-1和3 050~3 650 cm-1區(qū)域處的兩個(gè)負(fù)的特征吸收峰是由水產(chǎn)生的。1 045 cm-1處的強(qiáng)吸收峰則由乙醇產(chǎn)生,2 900 cm-1和2 985 cm-1附近的吸收峰也是由乙醇中的甲基和亞甲基C-H的伸縮振動(dòng)所產(chǎn)生的。900~1 500 cm-1處的眾多復(fù)雜的吸收峰主要來源于糖類、有機(jī)酸和蛋白質(zhì)的中的CH-OH的伸縮振動(dòng)。不同黃酒樣品吸收光譜波形相似,但又不完全重合,既顯示了不同樣品之間的差異,又顯示了大樣本群體的基本一致性。
表3 各個(gè)氨基酸的化學(xué)參考值Table 3 Chemical reference values of different amino acids
圖1 所有黃酒樣品的FT-IR光譜圖Fig.1 Raw FT-IR spectra of all Chinese rice wine samples
2.3 主成分分析
PCA是一種無監(jiān)督的模式識別技術(shù),通常用來作為多變量分析的第一步達(dá)到降維和提取有效信息的目的。這里,作者采用PCA來探索使用FT-IR達(dá)到對不同品牌的黃酒進(jìn)行區(qū)分的可能性。從圖2中可以看出,除了“閩族紅”,其它4個(gè)品牌的樣品相互聚集、覆蓋,沒有明顯的區(qū)分趨勢?!伴}族紅”品牌的黃酒產(chǎn)地是福建省,主要采用紅曲作為糖化劑進(jìn)行發(fā)酵,而“古越龍山”、“女兒紅”、“塔牌”和“西塘”4個(gè)黃酒品牌均來自浙江省,它們主要使用麥曲。兩者工藝有顯著區(qū)別,造成化學(xué)成分含量和種類的明顯不同,因此它們的紅外光譜上也會(huì)有所不同。
圖2 黃酒樣品的前兩個(gè)主成分的得分圖Fig.2 Score plot of the first two principal components(PC1 and PC2)of Chinese rice wine samples
2.4 模型構(gòu)建和評價(jià)
2.4.1 協(xié)同區(qū)間偏最小二乘算法 (SiPLS) SiPLS是由Norgaard等提出的一種特征光譜區(qū)間篩選算法,它是在經(jīng)典偏最小二乘法基礎(chǔ)上的拓展和延伸。其具體步驟如下:(1)將全波長區(qū)域分成一定數(shù)量的等寬子區(qū)間;(2)對組合區(qū)間數(shù)目為2、3、4的所有組合建立PLS模型;(3)計(jì)算出每個(gè)模型的RMSECV,選出最小的RMSECV對應(yīng)的子區(qū)間組合,用來建立SiPLS模型。本實(shí)驗(yàn)中,將整個(gè)光譜區(qū)域分別劃分為11、12、·…,25個(gè)子區(qū)間,以考查不同子區(qū)間劃分?jǐn)?shù)目對回歸模型穩(wěn)健性的影響。各個(gè)氨基酸的最優(yōu)區(qū)間劃分?jǐn)?shù)目、子區(qū)間組合及選出的具體波長區(qū)間如表4所示。圖3是SiPLS為Val選出的最佳光譜組合區(qū)間。
表4 17種氨基酸的最佳SiPLS參數(shù)Table 4 Optimal parameters of SiPLS models for 17 amino acids
圖3 SiPLS為Val選出的最佳子區(qū)間組合Fig.3 Optimal combination of subintervals for Val selected by SiPLS
2.4.2 遺傳算法(GA) 遺傳算法又稱進(jìn)化算法,是一種通過模擬自然進(jìn)化過程搜索最優(yōu)解的方法。該算法能自動(dòng)獲取優(yōu)化空間,自動(dòng)調(diào)整搜索方向,可有效消除無關(guān)變量的干擾。然而單純的采用遺傳算法對光譜變量進(jìn)行處理,往往需要數(shù)小時(shí)的時(shí)間,運(yùn)行時(shí)間過長。用GA對SiPLS選出的波長變量進(jìn)行進(jìn)一步的提取,并在最終選出的變量的基礎(chǔ)上建立GA-SiPLS模型。既節(jié)省了時(shí)間、簡化了模型,還可以有效解決SiPLS存在的共線性問題。本實(shí)驗(yàn)中遺傳算法的具體參數(shù)設(shè)置如下:初始群體大小30,變異概率1%,交叉概率50%,迭代次數(shù)100。由于GA選出的波長變量具有隨機(jī)性的特點(diǎn),本實(shí)驗(yàn)中對于每個(gè)氨基酸,GA均運(yùn)行10次,RMSECV最小的一組選出的變量用來建立回歸模型(GA-SiPLS)。對于GA而言,選擇哪些變量及選擇變量的數(shù)目是兩個(gè)最關(guān)鍵的問題。以Val為例,圖4是基于SiPLS選出來的所有變量在100次運(yùn)行中被選擇的頻率的直方圖。在這張圖中可以很直觀的看出每個(gè)變量被選擇的頻數(shù),直方圖越高,代表被選擇次數(shù)越多,與化學(xué)參數(shù)(氨基酸)的相關(guān)性越大,對模型構(gòu)建的貢獻(xiàn)也就越大。圖5是變異系數(shù)(C.V.)關(guān)于包含在模型中的變量個(gè)數(shù)的函數(shù)關(guān)系圖。隨著包含在模型中的變量數(shù)目增加,C.V.逐漸增大,最終達(dá)到一個(gè)最大值保持穩(wěn)定或略有下降。C.V.達(dá)到最大時(shí)對應(yīng)的變量個(gè)數(shù)即是最佳變量數(shù)目。這時(shí),從圖4中按照各變量的頻數(shù)高低選出相應(yīng)數(shù)目的具體波長變量。
圖4 運(yùn)行100次后所有變量被GA選擇的頻率的直方圖Fig.4 Histogram of frequency of selection of each variable after 100 runs by the GA
圖5 變異系數(shù)(C.V.)關(guān)于包含在模型中變量個(gè)數(shù)的函數(shù)曲線Fig.5 C.V.(%)explained variance as a function of the number of variables included
2.5 模型的建立與評價(jià)
在SiPLS和GA篩選結(jié)果基礎(chǔ)上,分別建立黃酒中各個(gè)自由氨基酸的SiPLS模型和GA-SiPLS模型,并與基于全光譜建立的經(jīng)典PLS模型進(jìn)行比較。3種回歸模型的結(jié)果如表5所示。
2.5.1 偏最小二乘模型(PLS) 其中 Asp,Glu,His,Gly,Thr,Ala,Val,Phe,Leu的PLS模型的R2(pre)均在0.85~0.86之間,RPD則均在2.50~3.00之間,根據(jù)表1中的標(biāo)準(zhǔn),這些氨基酸的PLS模型得到了很好的預(yù)測結(jié)果。Ser,Tyr,Met,Ile,Lys的PLS模型的R2(pre)在0.77~0.84之間,RPD則在2.07~2.50之間,這些氨基酸的PLS模型的預(yù)測精度一般,只能用于掃描黃酒中的氨基酸質(zhì)量濃度的高、中、低值。Arg,Cys和Pro的PLS模型結(jié)果最差,它們的RPD值均小于2,說明PLS模型不能用于預(yù)測這3種氨基酸。Shen等[15]得到了類似的結(jié)果。Pro的結(jié)果較差,可能是因?yàn)镻ro的響應(yīng)較低,造成參考值測定誤差較大。Cys和Arg預(yù)測結(jié)果也不理想則可能是由于黃酒中存在的其它復(fù)雜化合物干擾了兩者的測定。
2.5.2 協(xié)同區(qū)間偏最小二乘模型 (SiPLS) 從表5中可以看出,對于所有的氨基酸,與經(jīng)典PLS模型相比,基于SiPLS進(jìn)行波長優(yōu)化后選出的光譜區(qū)間建立的模型的預(yù)測精度和模型穩(wěn)健性均有顯著提高。除Ser,Arg,Tyr,Cys和Pro外,其余12種氨基酸的SiPLS模型的RPD均大于3.00,這表明,這12種氨基酸得到了極好的回歸模型。由表4可知,對于所有的自由氨基酸,SiPLS選出的波長主要集中在900~1 900 cm-1的區(qū)域里。而這一光譜區(qū)間主要與N=O、C=O的伸縮振動(dòng)及N-H的彎曲振動(dòng)有關(guān)。這些化學(xué)鍵又均與氨基酸密切相關(guān)。因此,SiPLS不僅可以去除大部分全光譜中存在的無信息變量和共線變量,而且最大程度的保留了與氨基酸質(zhì)量濃度相關(guān)的光譜變量。因此,相比于經(jīng)典PLS模型,SiPLS模型的預(yù)測性能有明顯提高。
2.5.3 協(xié)同區(qū)間聯(lián)合遺傳算法偏最小二乘模型(GA-SiPLS) 盡管SiPLS淘汰了大部分冗雜的的光譜變量,但是選擇出的相鄰光譜區(qū)間之間的光譜變量及同一個(gè)光譜區(qū)間內(nèi)的變量之間仍存在共線性,少量冗余光譜信息仍然存在。因此,如表5所示,SiPLS的模型精度略低于GA-SiPLS。
經(jīng)過GA和SiPLS的雙重篩選而建立的GASiPLS模型與PLS模型相比,模型預(yù)測精度有很大提升。對于所有的氨基酸,R2(pre)均大于0.80,RPD則均大于2.00,表明經(jīng)波長篩選后,可所建立的模型可應(yīng)用于對所有氨基酸的預(yù)測。這對于Cys,Pro,和Arg尤其重要,對于Cys,經(jīng)過波長篩選后,RPD由PLS模型的1.92上升到GA-SiPLS模型的2.50,由不能應(yīng)用于預(yù)測到可很好的用于對Cys質(zhì)量濃度的預(yù)測。對Pro和Arg,基于全波長的PLS模型不能用于對兩者質(zhì)量濃度的預(yù)測,而經(jīng)過波長選擇后建立的GA-SiPLS模型則可應(yīng)用于對Pro和Arg的精確掃描。此外,全波長有1 660個(gè)變量,而經(jīng)過GA和SiPLS雙重篩選后,最多含有102個(gè)變量(Pro),波長變量減少了93.86%。既簡化了回歸模型,又節(jié)省了模型運(yùn)行時(shí)間。
以成品黃酒為研究目標(biāo),綜合考慮了多個(gè)黃酒品牌,采用傅立葉紅外光譜技術(shù)對酒中的17種自由氨基酸進(jìn)行了定量檢測,同時(shí)利用SiPLS和GA多波長變量進(jìn)行優(yōu)選,以提高模型的穩(wěn)定性和預(yù)測精度。結(jié)果表明,經(jīng)波長篩選,模型精度得到了極大地提升,同時(shí)建模變量數(shù)目大大降低,此外,優(yōu)選出的波長變量與氨基酸特征官能團(tuán)高度相關(guān),說明波長篩選提高了回歸模型的可解釋性。
表5 17種氨基酸的PLS,SiPLS和GA-SiPLS模型的預(yù)測結(jié)果Table 5 Statistic results of FT-IR equations of 17 amino acid contents based on PLS,SiPLS and GA-SiPLS models
[1]SHEN F,YING Y Y,LI B B,et al.Multivariate classification of rice wines according to ageing time and brand based on amino acid profiles[J].Food Chemistry,2011,129(2):565-569.
[2]ZHANG Ying,WANG Jialin,YU Qinfeng.Meaurment of total nitrogen content and amino acid content in Miaofu rice wine[J]. Liquor-Making Science&Technology,2011,208(10):98-100.(in Chinese)
[3]LI Bobin,ZENG Jinhong,LIU Xingquan,et al.Study on quantitative relationships between amino acids and sensory taste of yellow rice wine[J].Liquor-Making Science&Technology,2011,208(10):98-100.(in Chinese)
[4]HASEGAWA H,SHINOHARA Y,MASUDA N,et al.Simultaneous determination of serine enantiomers in plasma using Mosher's reagent and stable isotope dilution gas chromatography-mass spectrometry[J].Journal of Mass Spectrometry,2011,46(5):502-507.
[5]SHEN F,YING Y Y,LI B B,et al.Prediction of sugars and acids in Chinese rice wine by mid-infrared spectroscopy[J].Food Research International,2011,44(5):1521-1527.
[6]FENG Yu,GU Xiaohong,TANG Jian,et al.Discrimination of tea varieties by mid-infrared spectroscopy combined with pattern recognition[J].Journal of Food Science and Biotechnology,2007,26(2):7-11.(in Chinese)
[7]YANG Lijun,LI Zhaojie,WANG Jing,et al.Rapid differentiation and identification of three species of Listeria by FT-IR spectroscopy[J].Journal of Food Science and Biotechnology,2013,32(2):169-173.(in Chinese)
[8]KOVALENKO I V,RIPPKE G R,HURBURGH C R,et al.Determination of amino acid composition of soybeans(Glycine max)by near-infrared spectroscopy[J].Journal of Agricultural and Food Chemistry,2006,54(10):3485-3491.
[9]WANG L,WANG Q,LIU H Z,et al.Determining the contents of protein and amino acids in peanuts using near-infrared reflectance spectroscopy[J].Journal of the Science of Food and Agriculture,2013,93(1):118-124.
[10]SUBRAMANIAN A,ALVAREZ V B,HARPER W J,et al.Monitoring amino acids,organic acids,and ripening changes in Cheddar cheese using Fourier-transform infrared spectroscopy[J].International Dairy Journal,2011,21(6):434-440.
Rapid Determination of Amino Acids in Chinese Rice Wine by Fourier Transform Infrared Spectroscopy
WU Zhengzong1,2, WANG Fang1,2, XU Enbo1,2, XU Xueming1, JIAO Aiquan*1,2
(1.School of Food Science and Technology,Wuxi 214122,China;2.State Key Laboratory of Food Science and Technology,Wuxi 214122,China)
The content of amino acid in Chinese rice wine(CRW)is one of the most important indexes to evaluate the quality and flavor of Chinese rice wine.In order to rapidly determine the contents of free amino acids in CRW,the possibility of Fourier transform infrared spectroscopy(FT-IR)for the fast detection of 17 different kinds of free amino acids in CRW wasdiscussed. Synergy interval partial least squares(SiPLS)and genetic algorithm (GA)were used to select the most efficient spectral variables to improve the prediction precision of the classical partial least squares(PLS)model based on the full-spectrum.Compared with the PLS model based on the full-spectrum,the prediction accuracy of model based on the spectral variables selected by SiPLS and GA was significantly improved,especially for cysteine,arginine and proline.In addition,GA-SiPLS model showed the most efficient prediction accuracy to all of the free amino acids,with thecorrelation coefficient of cross-validation higher than 0.80 and the residual predictive deviation larger than 2.00.The FT-IR combined with efficient variable selection algorithms is confirmed as a useful method to replace the traditional methods for routine analysis of free amino acids in CRW.
variable selection,fouriertransform infrared spectroscopy,amino acids,genetic algorithm,synergy interval partial least squares
TS 251.5
A
1673—1689(2017)01—0034—07
2015-02-05
國家“十二五”科技支撐計(jì)劃項(xiàng)目(2012BAD37B02;2012BAD37B06)。
*通信作者:焦愛權(quán)(1982—),男,江蘇泰州人,工學(xué)博士,副教授,碩士研究生導(dǎo)師,主要從事食品組分與物性研究。
E-mail:jinlab2008@yahoo.com
吳正宗,王 芳,徐恩波,等.傅立葉紅外光譜技術(shù)快速檢測黃酒中的氨基酸質(zhì)量濃度[J].食品與生物技術(shù)學(xué)報(bào),2017,36(1):34-40.