吳悅
(淮陰工學(xué)院現(xiàn)代教育技術(shù)中心,江蘇淮安223003)
?
基于搜尋者-支持向量機的葡萄酒品質(zhì)鑒別模型
吳悅
(淮陰工學(xué)院現(xiàn)代教育技術(shù)中心,江蘇淮安223003)
摘要:針對葡萄酒品質(zhì)鑒別問題,提出一種基于搜尋者-支持向量機(SOA-SVM)葡萄酒品質(zhì)鑒別模型。該模型以葡萄酒多維化學(xué)成分作為輸入,以葡萄酒的品質(zhì)類型作為輸出,采用搜尋者優(yōu)化算法對支持向量機模型懲罰因子和核函數(shù)參數(shù)進行優(yōu)選,從而建立最優(yōu)的SOA-SVM葡萄酒品質(zhì)鑒別模型。應(yīng)用該模型對UCI機器學(xué)習(xí)數(shù)據(jù)庫中wine數(shù)據(jù)集進行實例分析,結(jié)果表明SOA算法收斂精度高、收斂速度快,且該模型能夠取得優(yōu)良的分類效果。
關(guān)鍵詞:搜尋者優(yōu)化算法;支持向量機;葡萄酒品質(zhì);分類模型
食品工業(yè)的相關(guān)研究表明,葡萄酒中含有多種維生素、氨基酸和礦物質(zhì),可有效調(diào)節(jié)新陳代謝、促進血液循環(huán)、降低膽固醇[1]。正由于葡萄酒的這種營養(yǎng)價值和醫(yī)療保健作用,葡萄酒的消費量越來越大,其品質(zhì)的鑒別問題也逐漸得到關(guān)注,對促進行業(yè)的健康發(fā)展也具有重要意義。常規(guī)的葡萄酒品質(zhì)鑒別一直靠感官和理化指標(biāo)分析[2]。感官鑒定受主觀因素影響,準(zhǔn)確性低;理化指標(biāo)分析費用貴、時間長,難以得到大規(guī)模推廣。
針對葡萄酒的鑒別問題,相關(guān)研究人員將智能化算法和模型引入到該領(lǐng)域,較為典型的有遺傳神經(jīng)網(wǎng)絡(luò)[3]、模糊神經(jīng)網(wǎng)絡(luò)[4]、數(shù)據(jù)挖掘[5]等,但在實際運用中,不同葡萄酒類別的樣本難以獲得大量樣本,屬于小樣本問題,而支持向量機SVM(supportvectormachine)[6]是一種基于統(tǒng)計學(xué)習(xí)理論的機器學(xué)習(xí)算法,對小樣本學(xué)習(xí)問題具有優(yōu)良的應(yīng)用效果,且能解決神經(jīng)網(wǎng)絡(luò)的“維數(shù)災(zāi)難”問題。SVM在模式識別領(lǐng)域已得到了有效的應(yīng)用。SVM性能主要取決于核函數(shù)參數(shù)和懲罰因子的選取,目前該問題還缺乏理論指導(dǎo)。
搜尋者優(yōu)化算法SOA是一種模擬人類隨機搜索行為的啟發(fā)式隨機搜索算法[7]。該算法模擬人類隨機搜索時采用的交流、寫作、記憶、推理等智能行為,結(jié)合搜索與進化思想,實現(xiàn)搜尋者位置更新,并完成對所求問題解的優(yōu)化。SOA算法具有收斂速度快、精度高的優(yōu)點。
針對支持向量機模型參數(shù)選擇的隨機性和盲目性,本文將SOA算法應(yīng)用于支持向量機模型參數(shù)優(yōu)化中。建立基于SOA-SVM的葡萄酒品質(zhì)鑒別模型,對UCI數(shù)據(jù)庫中的wine數(shù)據(jù)進行實例分析驗證了該方法的有效性。
1搜尋者優(yōu)化算法
SOA算法模擬人的隨機搜索行為,利用模糊邏輯對搜索規(guī)則建模,確定搜索步長和個體搜索方向[7],完成位置的更新。其基本流程如下說明。
①算法參數(shù)設(shè)置。設(shè)置搜尋者的種群規(guī)模s、最大進化次數(shù)m、速度限制上下限參數(shù)Vmax、Vmin;
②t=0;
③人群初始化。在可行解域內(nèi)隨機初始產(chǎn)生s個初始位置:
i=1,2,…,s;t=0
④初始人群評價。根據(jù)實際問題,計算每個初始位置的目標(biāo)函數(shù)值,并取得當(dāng)前最優(yōu)值;
⑤確定搜尋策略。計算每個個體i在每個維度上的搜索方向dij(t)和步長αij(t);
⑥位置更新。在確定搜索方向和搜索步長之后,對每個群體內(nèi)的個體進行位置更新,更新公式如下:
⑦進化1代,t=t+1;
⑧若滿足停止條件,停止搜索,否則,轉(zhuǎn)至步驟④。
可以看出,SOA在尋優(yōu)過程中,搜索步長和搜索方向的確定分開進行,實現(xiàn)位置更新,有利于提高尋優(yōu)能力。
2建模
支持向量機模型在小樣本和高維條件下具有優(yōu)良的應(yīng)用效果,因此本文擬將SVM模型應(yīng)用到葡萄酒品質(zhì)分類中。而在SVM模型建立過程中,懲罰因子和核函數(shù)參數(shù)影響著其應(yīng)用性能,為了建立最優(yōu)的支持向量機模型,結(jié)合前面關(guān)于SOA算法的論述,將SOA算法與該問題相結(jié)合,提出基于搜尋者-支持向量機的葡萄酒品質(zhì)鑒定模型,其核心在于將搜尋者優(yōu)化算法應(yīng)用于支持向量機的模型參數(shù)優(yōu)化中。該方法的建模流程如圖1所示。
圖1 基于搜尋者的支持向量機建模流程
該方法以葡萄酒理化成分-品質(zhì)的數(shù)據(jù)集為數(shù)據(jù)基礎(chǔ),首先將數(shù)據(jù)集劃分為訓(xùn)練樣本集和測試樣本集。對訓(xùn)練樣本進行歸一化后,即可根據(jù)SOA算法的流程,對支持向量機模型的懲罰因子和核函數(shù)參數(shù)進行優(yōu)化選擇。其中,由于需要進行2個參數(shù)的優(yōu)選,所以需要分別建立代表2個參數(shù)的人群,并以訓(xùn)練準(zhǔn)確率為人群的適應(yīng)度。優(yōu)化結(jié)束后,構(gòu)建最優(yōu)的SOA-SVM模式分類模型。將測試樣本進行歸一化操作后代入到該模型,即可對葡萄酒的品質(zhì)進行鑒別,從而提升食品工業(yè)的信息化與智能化水平。
3實例分析
為了驗證本文提出的SOA-SVM模式分類模型的有效性,選取UCI及其學(xué)習(xí)數(shù)據(jù)庫[8]中的wine數(shù)據(jù)集,該數(shù)據(jù)庫記錄了在意大利同一區(qū)域上3種不同品種的葡萄酒的化學(xué)成分分析。
該數(shù)據(jù)集共包括178個樣本,每組樣本包括13個特征分量,分別為Alcohol、Malicacid、Ash、AlKalinityofash、Magnesium、Totalphenols、Fla-
vanoids、Nonflavanoidphenols、Proanthocyanins、Colorintensity、Hue、OD280/OD315ofdilutedwines、Proline,屬于多變量的模式分類問題,3種葡萄酒類別分別為1、2、3。圖2為分類示意圖,圖3描述了葡萄酒的3個屬性的分維可視化圖。
圖2 wine數(shù)據(jù)集分類示意圖
圖3 wine數(shù)據(jù)集分維可視化圖
為了提高分類的準(zhǔn)確率,去除不同屬性因數(shù)據(jù)大小帶來的差異性,對數(shù)據(jù)集進行[0,1]歸一化預(yù)處理操作,采用下式進行歸一化處理。
y=(x-xmin)/(xmax-xmin)
式中,xmin和xmax分別為該屬性的最小值和最大值。歸一化的部分樣本如表1所示。
表1 歸一化的數(shù)據(jù)集
對178個樣本集進行歸一化后,選取其中的89個作為訓(xùn)練樣本,其余89個作為測試樣本。采用SOA優(yōu)化算法對SVM模型的核函數(shù)參數(shù)和泛化參數(shù)進行啟發(fā)式隨機搜索。SOA算法的參數(shù)設(shè)置如下:迭代代數(shù)為100,群體規(guī)模為10;根據(jù)算法原理,選擇最大隸屬度Umax=0.95,最小隸屬度Umin=0.011。SVM的參數(shù)訓(xùn)練采用K-CV方法,本文取K=3。核函數(shù)選用RBF核函數(shù)。SOA優(yōu)化算法以SVM模型對訓(xùn)練樣本的分類準(zhǔn)確率為適應(yīng)度值。實驗的硬件環(huán)境為M450@2.40 GHz,內(nèi)存為2.00 GB,仿真工具為Matlab 2010。
圖4描述了基于SOA算法SVM模型參數(shù)優(yōu)化曲線。從圖中可以看出,當(dāng)?shù)M化到第53代時,適應(yīng)度值可以取得最優(yōu)值98.97%。此時泛化參數(shù)和核函數(shù)參數(shù)分別為0.182 2、102.143 5。
圖4 基于SOA的適應(yīng)度函數(shù)演化曲線
以經(jīng)過SOA優(yōu)化得到的參數(shù)為基礎(chǔ),建立SOA-SVM模型并對89個測試樣本進行模式分類。圖5顯示了其分類效果。
圖5 模式分類結(jié)果
可以看出,在89個測試樣本中,除第2類中有1個樣本被識別為第3類外,其余測試樣本全部得到正確的分類,準(zhǔn)確率達(dá)到98.88%,可以顯示出基于SOA-SVM的葡萄酒品質(zhì)鑒別模型有效性。
4結(jié)語
本文圍繞葡萄酒的品質(zhì)鑒定問題展開研究。針對其實際特點,提出一種基于SOA-SVM的葡萄酒品質(zhì)鑒別模型。
該模型通過SOA算法進行SVM參數(shù)尋優(yōu),模型精度和泛化能力都較好。以wine數(shù)據(jù)集對該模型進行實例分析,結(jié)果表明,SOA算法收斂精度更高,收斂速度更快。在對89組測試樣本的鑒定中,也取得了98.88%的分類準(zhǔn)確率,可以顯示出該模型的有效性。下一步有必要對方法的穩(wěn)定性以及不同訓(xùn)練樣本的模型性能進行分析。
[參考文獻(xiàn)]
[1]陳玉慶.葡萄酒的成分與營養(yǎng)價值[J].釀酒,2004,31(5):112-114.
[2]宋于洋,塔依爾,馮建榮.模糊綜合評判在葡萄酒品嘗中的應(yīng)用[J].中外葡萄與葡萄酒,2002(2):35-36.
[3]殷勇,邱明,劉云宏,等.基于遺傳神經(jīng)網(wǎng)絡(luò)的酒類鑒別技術(shù)[J].農(nóng)業(yè)機械學(xué)報,2003,34(6):104-106.
[4]Raptis C G,Siettos C I,Kiranoudis C T,et al.Classification of aged wine distillates using fuzzy and neural network systems [J].Journal of Food Engineering,2000,46(4):267-275.
[5]Cortez P,Cerdeira A,Almeida F,et al.Modeling wine preferences by data mining from physicochemical properties [J].Decision Support Systems,2009,47(4):547-557.
[6]Vapnik V N.The nature of statistical learning theory [M].New York(USA):Springer-Verlag,1995.
[7]DAI Chaohua,ZHU Yunfang,CHEN Weirong.Seeker optimization algorithm[C]//Proc 2006 Inter Conf Computational Intelligence and Security.Guangzhou:IEEE Press,2006:225-229.
[8]張鑫源,胡曉敏,林盈.遺傳算法和粒子群優(yōu)化算法的性能對比分析[J].計算機科學(xué)與探索,2014,8(1):90-10.
責(zé)任編輯:陳亮
AModelforIdentifyingWineQualityBasedonSOA-SVM
WUYue
(ModernEducationlaTechnologyCenter,HuaiyinInstituteofTechnology,Huaian223003)
Abstract:Aiming at the wine quality identification problems,a model based on SOA-SVM for identifying wine quality was put forward in the paper.The multi-dimensional chemical composition for the wine were taken as model input,the wine type was taken as the output,the SOA algorithm is used in the model for parameter optimization including penalty factor and the kernel function parameter,thereby the optimal SOA-SVM identification model can be established.In the paper,the model is used to analyze the wine set from the UCI machine learning database and the results show that SOA has a high convergence precision and a fast convergence rate.A good classification effect can be achieved through the SOA-SVM quality identification model.
Key words:seeker optimization algorithm;support vector machine;wine quality;classification model
中圖分類號:TP393
文獻(xiàn)標(biāo)志碼:A
文章編號:1671-0436(2015)04-0030-04
作者簡介:吳悅(1976—),女,碩士,工程師。
收稿日期:2015-04-20