国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于GA-SVM算法的烤煙香型自動(dòng)識(shí)別研究

2019-02-23 07:15:48邱昌桂孔蘭芬楊式華楊雙艷張建強(qiáng)袁天軍
煙草科技 2019年2期
關(guān)鍵詞:香型烤煙正確率

邱昌桂,孔蘭芬,楊式華,楊雙艷,劉 靜,張建強(qiáng),袁天軍,劉 澤

1.云南瑞升煙草技術(shù)(集團(tuán))有限公司,昆明市高新區(qū)海源北路1699號(hào) 650106

2.云南同創(chuàng)檢測(cè)技術(shù)股份有限公司,昆明市高新區(qū)海源北路1699號(hào) 650106

3.云南中煙工業(yè)有限責(zé)任公司技術(shù)中心,昆明市五華區(qū)紅錦路181號(hào) 650231

烤煙香型是中式卷煙香氣風(fēng)格的基礎(chǔ),也是煙葉風(fēng)格特色的重要表征以及煙葉品質(zhì)區(qū)域劃分和卷煙配方設(shè)計(jì)與產(chǎn)品維護(hù)的重要依據(jù),對(duì)我國(guó)煙葉原料種植及工業(yè)應(yīng)用產(chǎn)生了深遠(yuǎn)影響[1],因此一直是煙草行業(yè)的研究熱點(diǎn)??緹熛阈屯ǔ7譃榍逑阈汀⒅虚g香型和濃香型3大類,進(jìn)而又細(xì)分為清香型、清偏中型、中偏清型、中間型、濃香型、濃偏中型和中偏濃型7小類[2-3]。目前,關(guān)于不同香型烤煙的差異性和表征研究已有許多報(bào)道,例如不同香型烤煙化學(xué)成分差異性分析[4-11]、煙葉化學(xué)成分與香型風(fēng)格間的關(guān)系[12-13]、采用定量指數(shù)法評(píng)價(jià)烤煙香氣風(fēng)格[3]、利用聚類和線性判別分析方法對(duì)烤煙香型進(jìn)行表征[14-15]以及利用神經(jīng)網(wǎng)絡(luò)[16]和隨機(jī)森林[17]對(duì)烤煙香型進(jìn)行分類等方面。支持向量機(jī)(Support Vector Machine,SVM)是Vapnik[18]在統(tǒng)計(jì)學(xué) VC(Vapnik-Chervonenkis)維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則(Structural Risk Minimization,SRM)基礎(chǔ)上,提出的一種用于解決分類和函數(shù)逼近問(wèn)題的新型機(jī)器學(xué)習(xí)方法。與神經(jīng)網(wǎng)絡(luò)等傳統(tǒng)機(jī)器學(xué)習(xí)方法相比,SVM具有嚴(yán)格的理論和數(shù)學(xué)基礎(chǔ),不存在局部最小問(wèn)題,且泛化能力強(qiáng),適合小樣本學(xué)習(xí),能夠較好地解決局部極小點(diǎn)、非線性、過(guò)學(xué)習(xí)以及“維數(shù)災(zāi)難”等問(wèn)題[19],在復(fù)雜數(shù)據(jù)分類、信號(hào)處理、文本分類及估計(jì)回歸函數(shù)等方面得到廣泛應(yīng)用,在數(shù)據(jù)挖掘和高維模式識(shí)別等領(lǐng)域也表現(xiàn)出應(yīng)用潛力[20-21]。但在實(shí)際應(yīng)用中,對(duì)于SVM最優(yōu)參數(shù)的選擇在理論上尚未得到較好解決。目前常用的SVM參數(shù)選擇一般采取窮舉法,但該方法計(jì)算量大,耗用時(shí)間長(zhǎng),尋優(yōu)精度低,且不易獲得最優(yōu)SVM參數(shù)。近年來(lái)支持向量機(jī)在烤煙模式識(shí)別方面應(yīng)用較多,主要有基于交叉驗(yàn)證優(yōu)化參數(shù)的烤煙煙葉等級(jí)分類[22-25]、選擇不同核函數(shù)判別煙葉的可用性[26]和煙葉配方的替換[27]、卷煙品牌的判別[28]及不同核函數(shù)對(duì)烤煙感官質(zhì)量的評(píng)價(jià)[29]等。但采用遺傳算法(Genetic Algorithm,GA)優(yōu)化支持向量機(jī)參數(shù)在烤煙香型分類的應(yīng)用研究則鮮見報(bào)道。為此,采用遺傳算法優(yōu)化支持向量機(jī)參數(shù)的模式分類方法,對(duì)3類主要香型風(fēng)格烤煙的特征差異性進(jìn)行模式識(shí)別,以期建立一種有效識(shí)別烤煙香型風(fēng)格的方法,為烤煙香型準(zhǔn)確識(shí)別、烤煙產(chǎn)地溯源和煙葉香型風(fēng)格定位提供依據(jù)。

1 材料與方法

1.1 材料

選取2015—2016年濃香型、清香型、中間香型的代表產(chǎn)區(qū)河南、云南和貴州的3個(gè)等級(jí)(B2F、C3F和X2F)煙葉樣品共514個(gè)。其中,濃香型煙葉樣品58個(gè),主要來(lái)自河南省漯河市、平頂山市、商丘市和許昌市下轄的6個(gè)縣;中間香型煙葉樣品110個(gè),主要來(lái)自貴州省安順市、貴陽(yáng)市、銅仁市和遵義市下轄的5個(gè)縣;清香型煙葉樣品346個(gè),主要來(lái)自云南省昆明市、大理市、紅河州、普洱市、臨滄市、曲靖市、文山市、玉溪市和楚雄州下轄的28個(gè)縣。

1.2 儀器

6890N/5975N氣相色譜/質(zhì)譜聯(lián)用儀,配HP-5MS毛細(xì)管色譜柱(美國(guó)Agilent公司);KBF540恒溫恒濕箱(德國(guó)Binder公司);R114旋轉(zhuǎn)蒸發(fā)儀(瑞士Büchi公司);Cyclotec 1093旋風(fēng)式樣品磨[瑞典FOSS(中國(guó))有限公司];ABS204-S電子天平(感量0.000 1 g,瑞士Mettler-Toledo公司);同時(shí)蒸餾萃取裝置(自制)。

1.3 檢測(cè)方法

1.3.1 樣品制備

根據(jù)烤煙香型定點(diǎn)布置采樣點(diǎn)和落實(shí)農(nóng)戶,于煙葉采收期選取3個(gè)等級(jí)(B2F、C3F和X2F)的初烤煙葉樣品2.0 kg進(jìn)行編號(hào)、封裝后備用。

1.3.2 樣品預(yù)處理

每個(gè)樣品將剔除煙梗后的200 g煙葉用粉碎機(jī)粉碎,過(guò)250 μm分樣篩,充分混勻后的煙末置于恒溫恒濕箱(溫度22℃,相對(duì)濕度60%)平衡24 h,準(zhǔn)確稱取25 g平衡后的煙末樣品,采用同時(shí)蒸餾萃取法對(duì)樣品進(jìn)行前處理,用二氯甲烷作溶劑萃取2 h。所得提取物經(jīng)無(wú)水硫酸鈉干燥后,在水浴45℃、體系壓力56 kPa下旋轉(zhuǎn)蒸發(fā)濃縮至1.0 mL,加入50 μL內(nèi)標(biāo)物的無(wú)水乙醇溶液(0.1 mol/L),搖勻,裝入樣品瓶中待測(cè)。

1.3.3 致香成分含量的測(cè)定

致香成分含量的測(cè)定按照文獻(xiàn)[30]的方法,使用氣質(zhì)聯(lián)用分析儀對(duì)萃取濃縮液進(jìn)行分析,所得圖譜采用NIST05和Wiley275譜庫(kù)進(jìn)行檢索定性,并以萘為內(nèi)標(biāo)物,按照內(nèi)標(biāo)校正歸一化法計(jì)算各致香成分的含量。

1.4 模式分類方法

1.4.1 支持向量機(jī)(SVM)算法原理

支持向量機(jī)是基于線性可分情況下的最優(yōu)分類平面而發(fā)展起來(lái)的機(jī)器學(xué)習(xí)方法[31],其核心思想是在進(jìn)行分類時(shí),通過(guò)核函數(shù)將樣本數(shù)據(jù)映射到高維特征空間中,在高維特征空間構(gòu)建一個(gè)分類超平面作為決策面,由此可以將樣本正確分類,且使分類間隔距離最大。其中,構(gòu)建分類超平面就是求函數(shù)的全局最優(yōu)解:

滿足:

式中:m為樣本個(gè)數(shù);xi為訓(xùn)練樣本;yi為樣本類別;ω為分類超平面的法向量;b為常數(shù)。

支持向量機(jī)進(jìn)行多樣本分類時(shí),樣本往往是非線性且不可分的。通過(guò)在約束條件中引入正的松弛因子允許存在錯(cuò)分樣本,在目標(biāo)函數(shù)中加入?yún)?shù)懲罰因子c以及引入核函數(shù)將樣本映射到一個(gè)高維特征空間,使其在高維特征空間中實(shí)現(xiàn)線性可分。其中,懲罰參數(shù)c用于控制分類器泛化能力與分類正確率之間的平衡,對(duì)于支持向量機(jī)分類模型的精度和泛化能力影響顯著。c值越小,訓(xùn)練誤差越大,分類器泛化能力變差;c值越大,會(huì)引起過(guò)學(xué)習(xí),分類器泛化能力下降。

1.4.2 核函數(shù)的選擇

核函數(shù)決定了支持向量機(jī)特征空間的結(jié)構(gòu),對(duì)于支持向量機(jī)的分類性能影響顯著。常用的核函數(shù)有線性核函數(shù)(Linear)、二次核函數(shù)(QKF)、多項(xiàng)式核函數(shù)(Poly)、Gauss徑向基核函數(shù)(RBF)和多層感知器核函數(shù)(Sigmoid)等[32]。本方法中采用了應(yīng)用較廣泛的徑向基核函數(shù),其形式如下:

式中:g為核函數(shù)參數(shù),可以影響SVM算法的復(fù)雜程度。

1.4.3 遺傳算法優(yōu)化參數(shù)

遺傳算法(GA)是一種模仿生物界的進(jìn)化規(guī)律演化而來(lái)的自適應(yīng)全局優(yōu)化搜索方法。與傳統(tǒng)的優(yōu)化算法相比,遺傳算法不依賴于特定的數(shù)學(xué)方程和導(dǎo)數(shù)表達(dá)式,具有全局搜索能力強(qiáng)、不易陷入局部最優(yōu)解、效率高、尋優(yōu)速度快等優(yōu)點(diǎn)[33]。在生產(chǎn)調(diào)度、自適應(yīng)控制、函數(shù)優(yōu)化、機(jī)器學(xué)習(xí)和人工智能等領(lǐng)域得到廣泛應(yīng)用。利用遺傳算法對(duì)支持向量機(jī)參數(shù)進(jìn)行優(yōu)化時(shí),首先對(duì)分類器參數(shù)(懲罰參數(shù)c和核函數(shù)參數(shù)g)進(jìn)行編碼,然后以支持向量機(jī)分類正確率為適應(yīng)度函數(shù),在適應(yīng)度函數(shù)的約束下,通過(guò)隨機(jī)選擇、交叉和變異等步驟尋找最優(yōu)參數(shù)值,從而有效提高支持向量機(jī)分類的精度和效率。

2 結(jié)果與討論

2.1 不同香型烤煙中致香成分含量的差異性分析

采用多重比較方法對(duì)不同香型烤煙中的68種致香成分含量進(jìn)行分析,結(jié)果見表1。

表1 不同香型烤煙中致香成分組間差異性分析結(jié)果①Tab.1 Results of differential analysis of aroma components in flue-cured tobacco samples of different flavor types(μg·g-1)

表1(續(xù))

表1可見,不同香型烤煙中吡啶、2-戊基呋喃、2,4-庚二烯醛A、2,4-庚二烯醛B、氧化異佛爾酮、2,3-二氫苯并呋喃、吲哚、鄰苯二甲酸二丁酯等8種致香成分的含量無(wú)明顯差異,其他60種致香成分的含量均存在顯著差異。在3類香型煙葉樣品中新植二烯含量均最高,1-(2-呋喃基)-乙酮含量均最低;清香型煙葉樣品中3-甲基-1-丁醇、3-甲基-2-丁烯醛、1-(1H-吡咯-2-基)-乙酮、茄酮、β-紫羅蘭酮、蒽、茄那士酮、鄰苯二甲酸二丁酯、棕櫚酸、寸拜醇、植醇和西柏三烯二醇含量均顯著高于其他香型;中間香型煙葉樣品中糠醛、苯甲醇、十四醛、新植二烯、棕櫚酸甲酯和棕櫚酸乙酯含量均顯著高于其他香型;濃香型煙葉樣品中苯乙醇、丁基化羥基甲苯、3-(1-甲基乙基)(1H)吡唑[3,4-b]吡嗪、巨豆三烯酮B、巨豆三烯酮C、巨豆三烯酮D、2,3,6-三甲基-1,4-萘二酮和金合歡基丙酮A含量均顯著高于其他香型。

由表1可知,同類香型中存在致香成分標(biāo)準(zhǔn)偏差較大的現(xiàn)象,說(shuō)明這些致香成分含量在相同香型(清香型、中間香型、濃香型)不同生產(chǎn)點(diǎn)間存在差異。總體上,3類香型煙葉樣品中均為苯甲醇、新植二烯、鄰苯二甲酸二丁酯、西柏三烯二醇含量差異最大,但清香型煙葉樣品中茄酮、寸拜醇含量差異顯著高于其他香型,中間香型煙葉樣品中金合歡基丙酮A、棕櫚酸甲酯、棕櫚酸、亞麻酸甲酯含量差異顯著高于其他香型,濃香型煙葉樣品中巨豆三烯酮B、巨豆三烯酮D含量差異顯著高于其他香型,由此導(dǎo)致不同香型烤煙的香型區(qū)分度更為明顯,也造成同類香型烤煙在香氣質(zhì)、香氣量等方面存在一定差異。

2.2 GA-SVM算法的烤煙香型分類

采用GA-SVM算法對(duì)清香型、中間香型和濃香型3類香型的514個(gè)煙葉樣品進(jìn)行分類,使用5折交叉驗(yàn)證,重復(fù)測(cè)試10次。首先對(duì)GA-SVM算法的各控制參數(shù)進(jìn)行設(shè)置,其中種群最大數(shù)量為20,取值范圍為[20,100];最大進(jìn)化代數(shù)為100,取值范圍為[100,500];支持向量機(jī)懲罰參數(shù)c取值范圍為[0,100],核函數(shù)參數(shù)g取值范圍為[0,100]。以第一次對(duì)514個(gè)煙葉樣品數(shù)據(jù)使用5折交叉驗(yàn)證為例,圖1給出了使用GA-SVM算法優(yōu)化支持向量機(jī)c、g參數(shù)的迭代運(yùn)算曲線。

圖1 GA-SVM算法參數(shù)優(yōu)化過(guò)程曲線Fig.1 Parameter optimization process curves of GA-SVM algorithm

基于最優(yōu)保留策略,種群中的最優(yōu)個(gè)體適應(yīng)度逐漸增加,最后穩(wěn)定在98.54%,表明此時(shí)的懲罰參數(shù)c與核函數(shù)參數(shù)g的組合達(dá)到性能最優(yōu),即最佳懲罰參數(shù)c=72.931,最佳核函數(shù)參數(shù)g=0.011時(shí),訓(xùn)練集的分類正確率為100%,測(cè)試集的分類正確率為94.12%,結(jié)果見表2??梢姡貜?fù)測(cè)試10次,GA-SVM算法的訓(xùn)練集分類正確率為100%;測(cè)試集分類正確率為96.40%,其中清香型煙葉為98.27%,中間香型煙葉為89.55%,濃香型煙葉為98.26%。

表2 GA-SVM算法對(duì)不同香型烤煙的分類結(jié)果Tab.2 Classification results of flue-cured tobacco samples of different flavor types by GA-SVM algorithm

2.3 SVM和樸素貝葉斯分類算法的烤煙香型分類

使用SVM算法和樸素貝葉斯算法分別對(duì)514個(gè)煙葉樣品進(jìn)行分類,使用5折交叉驗(yàn)證,重復(fù)測(cè)試10次,結(jié)果見表3??梢姡?xùn)練集SVM算法的分類正確率為100%,樸素貝葉斯算法的分類正確率為86.46%;測(cè)試集SVM算法的分類正確率為78.58%,樸素貝葉斯算法的分類正確率為84.42%。對(duì)比可見,由于GA-SVM算法使用遺傳算法對(duì)支持向量機(jī)的參數(shù)進(jìn)行優(yōu)化和調(diào)整,獲得最優(yōu)參數(shù),從而使取得的分類正確率優(yōu)于SVM以及樸素貝葉斯等傳統(tǒng)分類算法。

表3 SVM算法和樸素貝葉斯算法對(duì)不同香型烤煙的分類結(jié)果Tab.3 Classification results of flue-cured tobacco samples of different flavor types by SVM and naive Bayesian algorithms

3 結(jié)論

為了尋找一種有效識(shí)別烤煙香型風(fēng)格的方法,以清香型、濃香型和中間香型烤煙為研究對(duì)象,提出了一種基于致香成分結(jié)合GA-SVM算法的烤煙香型自動(dòng)識(shí)別方法。該方法能夠避免支持向量機(jī)算法在分類過(guò)程中主要依靠經(jīng)驗(yàn)值選取參數(shù)的缺陷,通過(guò)使用遺傳算法對(duì)支持向量機(jī)參數(shù)進(jìn)行優(yōu)化和調(diào)整,以獲得最優(yōu)參數(shù)。采用GA-SVM算法、SVM算法和樸素貝葉斯算法分別對(duì)清香型、中間香型和濃香型3類香型的514個(gè)煙葉樣品進(jìn)行分類,結(jié)果表明:3類香型煙葉的分類正確率分別為96.40%、78.58%和84.42%,GA-SVM算法顯著優(yōu)于SVM和樸素貝葉斯等傳統(tǒng)分類算法。因此,GA-SVM算法結(jié)合煙草致香成分能夠用于對(duì)烤煙香型進(jìn)行分類。

猜你喜歡
香型烤煙正確率
本期卷首
中國(guó)白酒香型概念的提出及演化發(fā)展
門診分診服務(wù)態(tài)度與正確率對(duì)護(hù)患關(guān)系的影響
烤煙上炕機(jī)械研制
不同追肥對(duì)烤煙品質(zhì)的影響
活力(2019年19期)2020-01-06 07:36:04
生意
品管圈活動(dòng)在提高介入手術(shù)安全核查正確率中的應(yīng)用
生意
陳香型鐵觀音國(guó)家標(biāo)準(zhǔn)有望2015年發(fā)布
烤煙漂浮育苗和移栽改進(jìn)方法研究進(jìn)展
广河县| 临泉县| 阳泉市| 乡宁县| 杂多县| 大英县| 奉新县| 五台县| 蕉岭县| 莱阳市| 乐东| 万年县| 从江县| 仲巴县| 安宁市| 扎兰屯市| 郑州市| 东平县| 赣州市| 泰安市| 云浮市| 聊城市| 兴和县| 香港| 大荔县| 犍为县| 望江县| 高雄市| 子洲县| 辉县市| 宽城| 遂宁市| 鸡西市| 潜江市| 洛浦县| 南平市| 南宁市| 苍梧县| 黄山市| 石狮市| 淮南市|