朱玲,唐杰,許嘉東,胡興鋒,彭忠,譚廣璐,朱立軍
重慶中煙工業(yè)有限責(zé)任公司技術(shù)中心,重慶市南岸區(qū)南坪東路2號 400060
煙用爆珠是一種顆粒狀膠囊,里面包裹了由多種香精香料和適量溶劑調(diào)和制成的特色香味液體[1],埋于成品卷煙濾棒絲束內(nèi),是用于卷煙香氣補(bǔ)償?shù)募夹g(shù)手段之一[2]。近年來,隨著爆珠卷煙在國內(nèi)外市場的快速發(fā)展,各煙草企業(yè)也逐步重視并加大了對爆珠卷煙的研究,同時(shí)爆珠相關(guān)研究也是中國煙草行業(yè)科技規(guī)劃重大專項(xiàng)的分項(xiàng)之一。目前,關(guān)于煙用爆珠的研究報(bào)道多見于爆珠產(chǎn)品的研發(fā)制備和安全性考察[3-6],而對于煙用爆珠質(zhì)量評價(jià)多見于物理指標(biāo)的相關(guān)專利,如粒徑大小、顆粒圓度、有無、位置偏移量、破損情況等的測定[2,7]。對于影響爆珠卷煙整體香味和品質(zhì)的化學(xué)指標(biāo)研究較少,目前僅見于何媛等[1]采用GC/MS法對爆珠內(nèi)含物的測定。雖然物理指標(biāo)能夠體現(xiàn)爆珠的部分外觀性狀,卻無法與內(nèi)液的質(zhì)量產(chǎn)生直接相關(guān)性;而GC/MS能夠較準(zhǔn)確檢測內(nèi)液的成分及含量,但由于成本較高,操作相對復(fù)雜,難以大面積推廣。而煙用爆珠的錯(cuò)、混、濃度改變及質(zhì)量波動(dòng)將極大程度地影響爆珠卷煙質(zhì)量。因此,亟待建立一種快速便捷的煙用爆珠質(zhì)量判別方法。
支持向量機(jī)算法(SVM)是Vapnik等提出的建立在統(tǒng)計(jì)學(xué)理論基礎(chǔ)上的一種機(jī)器學(xué)習(xí)算法[8],基本思想是尋找線性分類器中的最優(yōu)分類面,其在對于小樣本數(shù)、非線性和高維數(shù)據(jù)空間的模式識別問題上有一定的優(yōu)勢[9]。支持向量機(jī)回歸(SVR)是建立在SVM基礎(chǔ)上的回歸算法,是從解決分類問題的SVM分類方法發(fā)展而來的,把變量選擇和建立回歸模型相結(jié)合,以期得到最佳分析效果[10]。紫外光譜技術(shù)因其靈敏可靠、簡便快捷、易于推廣等特點(diǎn)已經(jīng)在煙用香精香料質(zhì)量控制中得以應(yīng)用[11-12],因此,本文以紫外光譜技術(shù)作為分析手段,建立一種基于SVR算法的煙用爆珠質(zhì)量判別方法,旨在為煙用爆珠的質(zhì)量判別提供參考。
Cary60光纖紫外光譜儀(美國Agilent公司);7697-7890B-5977B型頂空氣質(zhì)聯(lián)用儀(美國Agilent公司);XSE204電子天平(感量0.000 1 g,瑞士Mettler Toledo公司)。
無水乙醇(分析純,≥99.7,上海國藥集團(tuán))。
四種(編號A~D)不同牌號煙用爆珠樣品由重慶中煙工業(yè)有限責(zé)任公司技術(shù)中心提供。
1.2.1 煙用爆珠樣品的準(zhǔn)備
A~D四種不同牌號煙用爆珠樣品,每月抽樣,連續(xù)抽樣12個(gè)月。采用電子天平稱量,精確到0.001 g,選擇質(zhì)量和粒徑[2]偏差均不大于±5%的煙用爆珠樣品。
1.2.2 樣品溶液的制備
在10 mL 試管中加入2~3 mL無水乙醇,取煙用爆珠1~3粒加入到試管中,同一牌號煙用爆珠樣品料液比相同。壓破煙用爆珠,使得爆珠內(nèi)液釋放,充分搖勻,靜置,待測。
1.2.3 紫外光譜儀測定
設(shè)定光纖紫外光譜儀測定波長范圍為190~350 nm,吸光度記錄范圍為-0.1~3.5,波長間隔0.5 nm,光程為10 mm,測定時(shí)將光纖探頭完全浸沒在溶液中,無水乙醇作為參比液調(diào)零,以連續(xù)波長掃描3次的光譜數(shù)據(jù)平均值作為樣品最終紫外光譜數(shù)據(jù)。
1.2.4 頂空-GC/MS測定
將定性濾紙?jiān)?0 ℃烘2 h,裁剪成2 cm×1 cm的小塊。對折小塊定性濾紙;選取一種爆珠樣品,取1顆放入小塊定性濾紙中,置于20 mL的頂空瓶中,壓破爆珠,加蓋,平行制作3個(gè)樣品。頂空-GC/MS分析條件:
頂空瓶:20 mL;樣品環(huán):1.0 mL;樣品平衡溫度:70 ℃;樣品環(huán)溫度:160 ℃;傳輸線溫度:180 ℃;樣品平衡時(shí)間:15.0 min;樣品瓶加壓壓力:138 kPa;加壓時(shí)間:0.20 min;充氣時(shí)間:0.20 min;樣品環(huán)平衡時(shí)間:0.05 min;進(jìn)樣時(shí)間:1.0 min;色譜柱:HP-5型毛細(xì)管柱(30 m×0.25 mm×0.25 μm);進(jìn)樣口溫度:180 ℃;升溫程序:。載氣:氦氣,1.0 mL/min;進(jìn)樣模式:分流進(jìn)樣;分流比:20:1;傳輸線溫度:250 ℃;溶劑延遲時(shí)間:6 min;離子源溫度:230 ℃;電離能量:70 eV。
支持向量機(jī)回歸(SVR)是建立在SVM基礎(chǔ)上的回歸算法[8,13],其目標(biāo)是尋求回歸函數(shù):
對于非線性問題,可以通過非線性變換轉(zhuǎn)化為某個(gè)高維特征空間的線性問題,并在高維空間中進(jìn)行線性求解。在高維特征空間中,線性問題中的內(nèi)積運(yùn)算可用核函數(shù)K(xi,xj)來代替,回歸函數(shù)為:
目前,支持向量機(jī)算法的核函數(shù)有十多種,其中最常用的函數(shù)有以下幾種:
徑向基核函數(shù)(Radial basis function,RBF):
線性核函數(shù)(Linear):
多項(xiàng)式核函數(shù)(Polynomial):
Sigmoid核函數(shù):
SVR模型優(yōu)先確定核函數(shù),核函數(shù)選擇得適當(dāng)與否,將直接影響SVR分類效果,另外核函數(shù)的參量對模型也會產(chǎn)生一定影響。
SVR分類算法將光譜數(shù)據(jù)與分類變量進(jìn)行回歸分析,其基本判別過程如下:首先建立校正集樣本的分類變量,將分類變量與光譜數(shù)據(jù)進(jìn)行SVR分析,建立分類變量與光譜數(shù)據(jù)的SVR模型,并計(jì)算預(yù)測集的分類變量值(y)。對于未知樣本類型判別規(guī)則[16]是:①當(dāng)y>0,判定樣本屬于該類;②當(dāng)y ≤0,判定樣本不屬于該類。
根據(jù)正常樣本的分類變量值(y)作質(zhì)量控制圖,中心線為樣本統(tǒng)計(jì)的平均值,控制上限(UCL)為平均值加三倍的標(biāo)準(zhǔn)偏差,控制下限(LCL)為平均值減三倍的標(biāo)準(zhǔn)偏差,對于未知樣本穩(wěn)定性判別規(guī)則是:①當(dāng)LCL≤ y ≤UCL,判定樣本穩(wěn)定性較好;②當(dāng)y>UCL或y<LCL,判定樣本穩(wěn)定性差。
采用Orange軟件(3.16.0版)和R軟件(3.5.1版)進(jìn)行數(shù)據(jù)處理與統(tǒng)計(jì)分析。
2.1.1 變量分類賦值及校正集、驗(yàn)證集樣本的選取
SVR分類是基于SVM方法建立的樣本分類變量與樣品紫外光譜的回歸模型,根據(jù)煙用爆珠樣本不同牌號進(jìn)行分類變量和賦值[15-16]。以A牌號煙用爆珠內(nèi)液SVR模型為例,對于選定的爆珠樣本,隨機(jī)選取100個(gè)樣品,設(shè)定y值為1,再從B、C和D牌號煙用爆珠樣本中各隨機(jī)選取多個(gè)樣品,設(shè)置y值為-1,將上述選取的樣品作為校正集樣本。A、B、C和D牌號煙用爆珠各自剩下的20個(gè)樣品作為驗(yàn)證集。
表1 煙用爆珠樣本分類變量Tab.1 Classification variables of breakable capsules in cigarette
2.1.2 特征波長區(qū)間的選擇
樣品化學(xué)成分和濃度不同時(shí),其在不同波長處的吸光度值也不同,光譜圖隨之出現(xiàn)差異。本研究采用的四種不同牌號煙用爆珠內(nèi)液的紫外光譜圖如圖1所示,各牌號煙用爆珠內(nèi)液的紫外光譜峰型和吸收強(qiáng)度存在明顯區(qū)別。為避免波段過寬造成光譜矩陣含有大量冗余信息和噪音干擾,導(dǎo)致后續(xù)分析的效率和準(zhǔn)確度降低,本研究首先對紫外光譜波段進(jìn)行了優(yōu)化提取。煙用爆珠內(nèi)液在190~230 nm區(qū)域存在較強(qiáng)的末端吸收,噪音較大,不適合模型的建立,而在波長大于330 nm區(qū)域吸光度小,曲線相對平滑,可利用信息少[17],光譜信息最為豐富的區(qū)域在230~330 nm范圍內(nèi),因此選擇波段230~330 nm作為優(yōu)選譜區(qū)。
圖1 不同牌號煙用爆珠內(nèi)液紫外光譜圖Fig.1 UV spectra of different brands of breakable capsules for cigarette
2.1.3 紫外光譜數(shù)據(jù)預(yù)處理方法的比較
紫外光譜數(shù)據(jù)通過預(yù)處理可以減少噪音和干擾,提高信噪比,提取出更多有效光譜信息,從而增強(qiáng)光譜的穩(wěn)定性和分辨率[17]。本研究中首先采用 Gaussian Filter 平滑法對光譜進(jìn)行平滑處理,平滑窗口為5,后對比了平滑后歸一化(Normalize)、多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(SNV)、一階導(dǎo)數(shù)和二階導(dǎo)數(shù)預(yù)處理方法對SVR模型的影響,依據(jù)校正均方根(RMSE)和相關(guān)系數(shù)(R2)值考察數(shù)據(jù)預(yù)處理效果,其中RMSE越小,R2值越大,模型的擬合度越高、穩(wěn)定性越好[9]。不同預(yù)處理方式RMSE和R2值如表2所示。無預(yù)處理時(shí),除C牌號外,其他三個(gè)牌號煙用爆珠內(nèi)液SVR模型R2值均大于0.95。平滑后Normalize、MSC、SNV和一階導(dǎo)數(shù)預(yù)處理均能提高C牌號煙用爆珠內(nèi)液SVR模型R2值,僅二階導(dǎo)數(shù)預(yù)處理顯著降低了C牌號煙用爆珠內(nèi)液SVR模型R2值,可能是因?yàn)楣庾V數(shù)據(jù)中帶有少許隨機(jī)噪聲,采用導(dǎo)數(shù)方法時(shí)放大了這些噪聲信號,從而導(dǎo)致信噪比降低。綜合比較平滑后歸一化、MSC、SNV和一階導(dǎo)數(shù)預(yù)處理方法,其中歸一化法預(yù)處理結(jié)果略優(yōu)于其他預(yù)處理結(jié)果。因此,平滑加歸一化被選為最優(yōu)預(yù)處理方法。
表2 不同預(yù)處理方法不同牌號煙用爆珠內(nèi)液SVR模型RMSE和R2值Tab.2 RMSE and R2 values of the SVR models for different brands of cigarette breakable capsules under different preprocessing methods
2.1.4 SVR類型和參數(shù)的確定
不同核函數(shù)構(gòu)建不同牌號煙用爆珠內(nèi)液ε-SVR模型的RMSE和R2值以及最優(yōu)參數(shù)如表3所示,選用RBF核函數(shù)和Polynomial核函數(shù)時(shí),ε-SVR能得到較好的擬合,選用Linear核函數(shù)時(shí)其次,而選用Sigmoid核函數(shù)時(shí),RMSE值明顯高于其他核函數(shù),而R2明顯低于其他核函數(shù),尤其是C牌號煙用爆珠內(nèi)液ε-SVR模型,R2值僅有0.2540。不同核函數(shù)構(gòu)建不同牌號煙用爆珠ν-SVR模型的RMSE和R2值以及最優(yōu)參數(shù)如表4所示,選用不同核函數(shù)對ν-SVR模型的影響表現(xiàn)出與ν-SVR相似的結(jié)果,SVR模型效果最優(yōu)的是RBF核函數(shù),然后依次是Polynomial核函數(shù)和Linear核函數(shù),最差的是Sigmoid核函數(shù)。對比同種核函數(shù),不同SVR模型時(shí)RMSE和R2值,選用RBF核函數(shù)和Polynomial核函數(shù)時(shí),ν-SVR模型優(yōu)于ε-SVR模型;選用Linear核函數(shù)時(shí),ε-SVR模型優(yōu)于ν-SVR模型;選用Sigmoid核函數(shù),ε-SVR模型和ν-SVR模型擬合效果均不大理想。綜合考慮SVR類型和核函數(shù)類型,RBF核函數(shù)構(gòu)建的ν-SVR模型擬合效果最好,RMSE達(dá)到最小,R2值均≥0.9993。因此,本研究選用ν-SVR模型,并選用RBF作為SVR的核函數(shù)。
表3 不同核函數(shù)構(gòu)建不同牌號煙用爆珠內(nèi)液ε-SVR模型的RMSE和R2值以及最優(yōu)參數(shù)Tab.3 RMSE,R2 values and optimal parameters of the ε-SVR models with different kernel functions for different brands of breakable capsules
表4 不同核函數(shù)構(gòu)建不同牌號煙用爆珠內(nèi)液ν-SVR模型的RMSE和R2值以及最優(yōu)參數(shù)Tab.4 RMSE,R2 values and optimal parameters of the ν-SVR models with different kernel functions for different brands of breakable capsules
2.2.1 對校正集樣本的驗(yàn)證結(jié)果
四種不同牌號煙用爆珠內(nèi)液樣品ν-SVR模型校正集樣本的驗(yàn)證結(jié)果如表5所示。由表5可知,四種牌號煙用爆珠內(nèi)液樣品自身分類變量校正集樣本的預(yù)測值分散在1附近,其他分類變量的預(yù)測值分散在-1附近,相對標(biāo)準(zhǔn)偏差均在5%以內(nèi)。因此,根據(jù)判別規(guī)則該模型對校正集樣本中四種牌號的煙用爆珠內(nèi)液均能準(zhǔn)確判別,正確判別率為100%,說明該模型有較高的判別能力。
表5 不同牌號煙用爆珠內(nèi)液ν-SVR模型校正集預(yù)測結(jié)果Tab.5 The predicted values of the calibration set in ν-SVR models for different brands of cigarette breakable capsules
2.2.2 SVR模型對驗(yàn)證集樣本的預(yù)測效果
利用四種不同牌號煙用爆珠內(nèi)液的ν-SVR模型對未參與建模的驗(yàn)證集樣本進(jìn)行分析預(yù)測,結(jié)果如圖2所示。由圖2(a)可知,A牌號煙用爆珠樣品分類變量驗(yàn)證集樣本的預(yù)測值分散在1附近,其他分類變量的預(yù)測值分散在-1附近。因此,根據(jù)判別規(guī)則該模型對驗(yàn)證集樣本中A牌號的煙用爆珠內(nèi)液均能準(zhǔn)確判別,對A牌號煙用爆珠內(nèi)液樣品的正確判別率為100%。B、C和D牌號煙用爆珠內(nèi)液ν-SVR模型對其樣本同樣具有較好的判別能力,正確判別率均為100%。
圖2 不同牌號煙用爆珠內(nèi)液ν-SVR模型驗(yàn)證集樣品預(yù)測結(jié)果Fig.2 Predicted values of the validation set in ν-SVR models for different brands of cigarette breakable capsules
以A牌號為例,基于紫外光譜圖譜和ν-SVR模型,選取正常6個(gè)批次,每批次16個(gè)樣品,共計(jì)96個(gè)樣品的 值建立A牌號質(zhì)量控制圖,并選取48個(gè)樣品對控制圖進(jìn)行測試,其中正常樣品(W1)、其他牌號樣品(W2)、混有其他牌號的A樣品(W3)、濃度降低的A樣品(W4)以及濃度增加的A樣品(W5)各12個(gè),其中樣品濃度增減通過調(diào)節(jié)無水乙醇的體積實(shí)現(xiàn),增減幅度依次為5%、10%、20%、30%、40%、50%,平行兩次。對96個(gè)正常樣品檢測結(jié)果按照批次順序依次編為1~96號,W1類樣品的檢測結(jié)果編為97~108號,以各樣本編號對應(yīng)的y值作單值控制圖,如圖3(a)所示,中心線為1.0070,控制上限和控制下限分別為1.0293和0.9846。對W2和W3類樣品的檢測結(jié)果進(jìn)行編號,依次編為1~24號,W4和W5類樣品的檢測結(jié)果按照濃度改變幅度由小到大進(jìn)行編號,依次編為25~48號,同樣作圖,如圖3(b)所示,W2和W3類樣品較正常樣品成分發(fā)現(xiàn)改變,檢測結(jié)果均在模型控制限外。隨著濃度變化幅度增大,W4類樣品分類變量值逐漸減小,同樣的濃度變化幅度,W5類分類變量值的變化幅度不明顯;當(dāng)濃度變化幅度在5%時(shí),W4和W5類樣品檢測結(jié)果均在控制限以內(nèi);當(dāng)濃度變化幅度大于10%時(shí),檢測結(jié)果均在控制限外;因此當(dāng)濃度變化幅度超過10%時(shí)即可檢測出樣品濃度的變化。以上結(jié)果表明,基于煙用爆珠內(nèi)液樣品ν-SVR模型的分類變量值建立的質(zhì)量控制圖可以有效地監(jiān)控爆珠內(nèi)液的質(zhì)量變化,提示樣品錯(cuò)、混以及濃度改變等問題,對煙用爆珠產(chǎn)品質(zhì)量進(jìn)行判別。
圖3 A牌號煙用爆珠內(nèi)液質(zhì)量控制圖Fig.3 Quality control chart for liquid in breakable capsules of brand A
對A牌號正常樣品以及W1~W4類樣品分別進(jìn)行頂空-GC/MS分析,結(jié)果圖4所示,其中樣品濃度的增減通過調(diào)節(jié)GC分流比實(shí)現(xiàn)。W1類樣品譜圖(圖4b)與正常樣品譜圖(圖4a)一致,W2~W4類樣品譜圖(圖4c~4e)與正常樣品譜圖不同,出現(xiàn)少峰、多峰、響應(yīng)信號變化等問題,判斷樣品穩(wěn)定性改變,結(jié)果與UV方法一致,支持了UV圖譜結(jié)合SVR算法的準(zhǔn)確性。
GC/MS方法可以對爆珠內(nèi)液成分進(jìn)行分析,得到更多化學(xué)信息,且能分析出現(xiàn)異常樣品質(zhì)量問題的具體原因。而UV方法則相對更為簡便快捷,儀器及操作要求低,易于推廣,適用于大規(guī)模工業(yè)生產(chǎn)中對煙用爆珠內(nèi)液質(zhì)量穩(wěn)定性的日常監(jiān)測。因此可將GC/MS方法和UV法的優(yōu)勢相結(jié)合,為煙用爆珠內(nèi)液質(zhì)量穩(wěn)定性的判別提供一種指導(dǎo)性方法。煙用爆珠內(nèi)液作為多種香精香料調(diào)和制成的混合體系,若其穩(wěn)定性發(fā)生變化,將一定程度影響感官評吸結(jié)果,而煙用爆珠內(nèi)液穩(wěn)定性變化幅度對感官評吸的影響程度還需進(jìn)一步研究與探討。
圖4 A牌號煙用爆珠內(nèi)液的GC/MS圖譜Fig.4 The GC/MS spectra of liquid sample in breakable capsule of brand A
(1)通過無水乙醇稀釋煙用爆珠內(nèi)液,紫外光譜掃描獲得煙用爆珠內(nèi)液紫外光譜數(shù)據(jù),光譜數(shù)據(jù)經(jīng)平滑和歸一化預(yù)處理后,建立四種不同牌號煙用爆珠的SVR模型。
(2)采用徑向基核函數(shù),四個(gè)牌號煙用爆珠內(nèi)液ν-SVR模型的校正集分類變量的預(yù)測值與實(shí)測值的相關(guān)系數(shù)均≥0.9993,ν-SVR模型對于參與建模的400個(gè)煙用爆珠內(nèi)液樣本(校正集)和未參與建模的80個(gè)煙用爆珠內(nèi)液樣本(驗(yàn)證集)的判別準(zhǔn)確度均為100%,模型擬合性好,預(yù)測精度高,判別能力強(qiáng)。以煙用爆珠內(nèi)液樣品ν-SVR模型的分類變量值建立的質(zhì)量控制圖可以有效地判別爆珠內(nèi)液的穩(wěn)定性,且判定結(jié)果與GC/MS檢測結(jié)果一致。
(3)紫外光譜技術(shù)結(jié)合SVR算法可對不同牌號煙用爆珠內(nèi)液質(zhì)量進(jìn)行有效判別,提示樣品錯(cuò)、混以及濃度改變等質(zhì)量問題,且方法快速、準(zhǔn)確、經(jīng)濟(jì)環(huán)保、易于推廣。