国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于單類(lèi)支持向量機(jī)的電子鼻在白酒真假識(shí)別中的應(yīng)用*

2015-08-24 02:53:30孟慶浩亓培鋒井雅琪天津大學(xué)電氣與自動(dòng)化工程學(xué)院天津300072
傳感技術(shù)學(xué)報(bào) 2015年12期
關(guān)鍵詞:真假電子鼻分類(lèi)器

周 宇,孟慶浩,亓培鋒,井雅琪,曾 明(天津大學(xué)電氣與自動(dòng)化工程學(xué)院,天津300072)

基于單類(lèi)支持向量機(jī)的電子鼻在白酒真假識(shí)別中的應(yīng)用*

周宇,孟慶浩*,亓培鋒,井雅琪,曾明
(天津大學(xué)電氣與自動(dòng)化工程學(xué)院,天津300072)

針對(duì)采用多類(lèi)分類(lèi)方法進(jìn)行白酒真假識(shí)別時(shí)存在的真酒樣本和假酒樣本(正類(lèi)樣本和異類(lèi)樣本)數(shù)量無(wú)法均衡以及異類(lèi)樣本無(wú)法全部獲取的問(wèn)題,提出應(yīng)用單類(lèi)支持向量機(jī)分別單獨(dú)對(duì)每一種品牌的白酒訓(xùn)練單類(lèi)分類(lèi)器進(jìn)行真假識(shí)別的方法。首先采用自主設(shè)計(jì)的電子鼻系統(tǒng)對(duì)不同品牌白酒進(jìn)行采樣測(cè)試;采樣后的傳感器陣列數(shù)據(jù)依次經(jīng)過(guò)數(shù)據(jù)預(yù)處理、特征生成、特征選擇降維處理,得到可用于分類(lèi)的白酒樣本;再通過(guò)格點(diǎn)搜索獲取每種白酒單類(lèi)分類(lèi)器的最優(yōu)參數(shù);最后測(cè)試各個(gè)單類(lèi)分類(lèi)器對(duì)相應(yīng)品牌白酒的真假識(shí)別效果。各單類(lèi)分類(lèi)器的真假識(shí)別率分布在93%~98%之間,結(jié)果表明,采用自主設(shè)計(jì)的電子鼻結(jié)合單類(lèi)支持向量機(jī)可以很好地對(duì)白酒真假進(jìn)行識(shí)別。

電子鼻;白酒;真假識(shí)別;單類(lèi)支持向量機(jī)

EEACC:6140;7230Sdoi:10.3969/j.issn.1004-1699.2015.12.001

隨著生活水平的提高,人們對(duì)酒類(lèi)食品越來(lái)越大的需求促進(jìn)了白酒行業(yè)的飛速發(fā)展,與此同時(shí)各種問(wèn)題也不斷出現(xiàn)?!肮磧堕T(mén)”、“酒精門(mén)”、“散酒門(mén)”,年份酒造假以次充好等現(xiàn)象屢見(jiàn)不鮮,并呈現(xiàn)日益嚴(yán)重的趨勢(shì)。而當(dāng)前白酒質(zhì)量檢測(cè)常用的方法主要有感官識(shí)別,色譜儀和質(zhì)譜儀等方法。感官識(shí)別主要依據(jù)色、香、味等進(jìn)行鑒別,但此種方法帶有一定主觀性,且一般僅限于專(zhuān)業(yè)人員。而采用色譜儀和質(zhì)譜儀進(jìn)行檢測(cè),雖然能夠提供精確的定量成分分析,但同時(shí)需要的成本也很高,儀器昂貴且笨重,檢測(cè)周期也較長(zhǎng)。因此白酒的快速檢測(cè)和識(shí)別技術(shù)已成為白酒行業(yè)一個(gè)亟待解決的難題[1-2]。

電子鼻是一種新型的仿生檢測(cè)技術(shù)[3-8],為分析和識(shí)別復(fù)雜揮發(fā)性有機(jī)物而設(shè)計(jì)。電子鼻的主要特點(diǎn)在于它把單一或者復(fù)合氣體當(dāng)作一個(gè)整體,并給出氣體的整體信息,即“氣味指紋”數(shù)據(jù)。不同的氣體對(duì)應(yīng)不同的指紋數(shù)據(jù),將這些數(shù)據(jù)與經(jīng)過(guò)學(xué)習(xí)和訓(xùn)練后所建的數(shù)據(jù)庫(kù)中的信號(hào)進(jìn)行比較,再經(jīng)過(guò)判斷從而實(shí)現(xiàn)識(shí)別功能。同時(shí)電子鼻檢測(cè)也擁有低成本、快速、客觀、不侵入被試等優(yōu)勢(shì)。

目前,用于電子鼻的模式識(shí)別算法主要有統(tǒng)計(jì)模式識(shí)別和人工神經(jīng)網(wǎng)絡(luò)[9]。前者包括主成分分析、線性判別分析[10]、判別因子分析和聚類(lèi)分析等,它們都是線性判別方法;后者包括誤差反向傳播神經(jīng)網(wǎng)絡(luò)、概率神經(jīng)網(wǎng)絡(luò)、學(xué)習(xí)向量化神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等,人工神經(jīng)網(wǎng)絡(luò)雖然具有很強(qiáng)的非線性映射能力,但同時(shí)也存在所需樣本量大、容易陷入局部最優(yōu)、收斂速度慢等缺點(diǎn)[11]。采用VC維(Vapnik-Chervonenkis Dimension)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的支持向量機(jī)[12]則能夠很好地解決小樣本、非線性、高維數(shù)等問(wèn)題,并且單類(lèi)支持向量機(jī)針對(duì)無(wú)法獲取兩類(lèi)樣本、獲取代價(jià)極高或者樣本數(shù)量極度不均衡等問(wèn)題而設(shè)計(jì),非常適合用于解決異類(lèi)檢測(cè)問(wèn)題。

為了檢驗(yàn)單類(lèi)支持向量機(jī)在白酒真假識(shí)別中的實(shí)際效果,本文采用自主設(shè)計(jì)的白酒識(shí)別電子鼻系統(tǒng),對(duì)8種不同品牌的白酒以及作為對(duì)照的酒精溶液共計(jì)9個(gè)類(lèi)別進(jìn)行動(dòng)態(tài)采樣(每個(gè)類(lèi)別測(cè)試20次)。采樣數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)預(yù)處理、特征生成和特征選擇降維處理,得到可用于分類(lèi)測(cè)試的白酒樣本。以瀘州老窖為例,從20個(gè)瀘州老窖的白酒樣本中隨機(jī)選取10個(gè)作為訓(xùn)練樣本,用格點(diǎn)搜索尋找單類(lèi)分類(lèi)器的最優(yōu)參數(shù),再在最優(yōu)參數(shù)下訓(xùn)練后得到用于識(shí)別瀘州老窖白酒真假的單類(lèi)分類(lèi)器。選取20個(gè)瀘州老窖樣本作為正類(lèi)測(cè)試樣本,再?gòu)钠溆?個(gè)類(lèi)別的樣本中分別隨機(jī)選取10個(gè)作為異類(lèi)測(cè)試樣本,測(cè)試該單類(lèi)分類(lèi)器對(duì)瀘州老窖品牌白酒的真假識(shí)別能力。以此類(lèi)推對(duì)其他8個(gè)類(lèi)別訓(xùn)練對(duì)應(yīng)的單類(lèi)分類(lèi)器并進(jìn)行測(cè)試。結(jié)果表明,采用自主設(shè)計(jì)的電子鼻結(jié)合單類(lèi)支持向量機(jī)可以很好地對(duì)白酒真假進(jìn)行識(shí)別。

1 電子鼻系統(tǒng)及實(shí)驗(yàn)方案

1.1實(shí)驗(yàn)材料

實(shí)驗(yàn)選取8種不同品牌的濃香型白酒作為測(cè)試對(duì)象:瀘州老窖(38%,四川瀘州)、百年皖酒(38%,安徽蚌埠)、稻花香(42%,湖北龍泉鎮(zhèn))、青酒(38%,貴州黔東南州)、蘭津酒(48%,天津紅橋)、紅津酒(38%,天津紅橋)、綿竹大曲(38%,四川綿竹)、牛欄山(42%,北京順義),并配置濃度為42%的酒精溶液作為對(duì)照組,共9個(gè)類(lèi)別的實(shí)驗(yàn)樣本。

1.2白酒識(shí)別電子鼻系統(tǒng)結(jié)構(gòu)

圖1為自主設(shè)計(jì)的白酒識(shí)別電子鼻系統(tǒng)結(jié)構(gòu)框圖,其中氣體傳感器陣列由11種對(duì)有機(jī)揮發(fā)物、酒精、甲烷、烴類(lèi)等具有敏感特性的金屬氧化物半導(dǎo)體(MOS)傳感器組成,為增加陣列的廣譜特性,選擇了兩種不同系列的不同型號(hào)的傳感器,分別為:TGS2602、TGS822、TGS880、TGS2610、TGS2620、MICS-5121、MICS-5135、TGS2611、MICS-5521、MICS-5524、MICS-5526,并按照順序編號(hào)為chn0~chn10。11個(gè)傳感器組成的陣列放置于一個(gè)尺寸為108 mm×108 mm×25 mm的不銹鋼方體腔室中,傳感器盡量對(duì)稱(chēng)均布于底部,保證各個(gè)傳感器與氣流的接觸時(shí)間、方向、速度等各個(gè)狀態(tài)盡量一致。

圖1 R白酒識(shí)別電子鼻系統(tǒng)結(jié)構(gòu)框圖

1.3采樣流程與實(shí)驗(yàn)方案

實(shí)驗(yàn)過(guò)程中具體的采樣步驟如下:

①預(yù)熱打開(kāi)清洗泵將氣路系統(tǒng)用潔凈的空氣清洗30 min,同時(shí)氣體質(zhì)量流量控制器上電預(yù)熱15 min后進(jìn)行調(diào)零,恒溫水浴箱上電并設(shè)定恒溫溫度70℃。

②蒸發(fā)用移液槍取2 μL樣本置于樣本瓶中,在70℃的環(huán)境中蒸發(fā)30 min。

③采樣調(diào)節(jié)氣體質(zhì)量流量控制器的流量為200 sccm,打開(kāi)采樣泵以潔凈空氣為載氣將樣本瓶中充分蒸發(fā)的樣本氣體帶入氣室中與傳感器陣列進(jìn)行反應(yīng),持續(xù)通入3 min,同時(shí)電路板開(kāi)始采集陣列響應(yīng)輸出,并將數(shù)據(jù)通過(guò)串口傳送至PC機(jī)進(jìn)行保存。

④清洗關(guān)閉采樣泵,打開(kāi)清洗泵對(duì)氣路系統(tǒng)清洗30 min,清除殘留氣體以準(zhǔn)備下一次采樣。清洗完成后轉(zhuǎn)步驟②重復(fù)下一次采樣。

針對(duì)9個(gè)類(lèi)別的實(shí)驗(yàn)對(duì)象,根據(jù)上述采樣流程進(jìn)行重復(fù)測(cè)試,每個(gè)類(lèi)別重復(fù)20次,一共得到180個(gè)樣本。從20個(gè)瀘州老窖品牌的白酒樣本中隨機(jī)挑選10個(gè)樣本進(jìn)行訓(xùn)練,得到的單類(lèi)分類(lèi)器用于識(shí)別瀘州老窖品牌白酒的真假。選取全部的瀘州老窖白酒樣本作為正類(lèi)測(cè)試樣本,其他8個(gè)類(lèi)別的樣本中分別隨機(jī)挑選10個(gè)充當(dāng)異類(lèi)測(cè)試樣本,測(cè)試該單類(lèi)分類(lèi)器的真假識(shí)別能力。以此類(lèi)推訓(xùn)練其他8個(gè)類(lèi)別的單類(lèi)分類(lèi)器并進(jìn)行真假識(shí)別能力測(cè)試。

2 特征選擇方法

文中采用電導(dǎo)變化率作為傳感器的響應(yīng)信號(hào),可以減少傳感器的基線波動(dòng)對(duì)特征提取帶來(lái)的影響[13],符號(hào)為S。

其中St為t時(shí)刻的相對(duì)電導(dǎo)變化率為t時(shí)刻傳感器電導(dǎo)為基線附近電導(dǎo),為傳感器陣列t時(shí)刻的輸出的電壓信號(hào),為傳感器陣列在潔凈空氣中的輸出電壓值,Vref為模擬信號(hào)采集電路的參考電壓。

為消除樣本濃度帶來(lái)的影響,再對(duì)St進(jìn)行歸一化,歸一化后的相對(duì)電導(dǎo)變化率曲線如圖2。

圖2 R相對(duì)電導(dǎo)變化率曲線

11條相對(duì)電導(dǎo)變化率曲線表達(dá)了電子鼻系統(tǒng)對(duì)一份樣本的整體描述,不同類(lèi)別的樣本的響應(yīng)曲線將會(huì)在動(dòng)態(tài)和靜態(tài)特征[14-17]上產(chǎn)生差異,因此對(duì)每一份樣本的11條電導(dǎo)變化率曲線生成5種特征,分別為:達(dá)到最大相對(duì)電導(dǎo)變化率的時(shí)間t1,t1時(shí)刻相對(duì)電導(dǎo)變化率積分It1,相對(duì)電導(dǎo)變化率一階微分最大值Mder,達(dá)到最大微分的時(shí)間t2,相對(duì)電導(dǎo)變化率曲線的幾何平均曲率GMcure。提取特征的公式如下:

其中,pos1表示響應(yīng)起始點(diǎn),其中pos2表示相對(duì)電導(dǎo)變化率達(dá)到最大時(shí)采樣點(diǎn)位置,pos3表示相對(duì)電導(dǎo)變化率一階微分達(dá)到最大時(shí)的采樣點(diǎn)位置,dt表示采樣周期,a=pos1,b=pos2,ρ表示該點(diǎn)處曲線的曲率半徑。

經(jīng)過(guò)特征生成,每個(gè)樣本可用一個(gè)55維的特征向量表示。顯然,在小數(shù)量樣本的情況下55維的特征數(shù)量過(guò)多,將不利于識(shí)別。并且所選的特征是憑借對(duì)響應(yīng)曲線的直觀估計(jì)而選擇,其對(duì)分類(lèi)識(shí)別的貢獻(xiàn)大小還有待驗(yàn)證。

熵是隨機(jī)變量的不確定性測(cè)度,p(x)是概率密度函數(shù),隨機(jī)變量X的熵為:

H

(X,Y)為聯(lián)合熵,H(X|Y)為條件熵:

X和Y的互信息為:

采用Lewis提出的MIM(Mutual Information Maximization)算法對(duì)初始特征進(jìn)行選擇,該算法按照特征和類(lèi)別標(biāo)簽的互信息大小進(jìn)行排序,排序靠前的初始特征對(duì)分類(lèi)有較大的貢獻(xiàn)。算法對(duì)特征的評(píng)價(jià)準(zhǔn)則為:

其中Xk為特征K的樣本響應(yīng)向量,Y為分類(lèi)標(biāo)簽。鑒于訓(xùn)練樣本數(shù)量為10個(gè),選擇結(jié)果為55維特征排序中的前4個(gè)特征。再加上每次采樣前保持相對(duì)穩(wěn)定的溫度值和濕度值作為2個(gè)特征(用于溫濕度補(bǔ)償),選取這6個(gè)特征作為最后輸入到訓(xùn)練算法的樣本特征。

3 單類(lèi)支持向量機(jī)

3.1單類(lèi)支持向量機(jī)原理

在白酒的真假識(shí)別問(wèn)題中,特定品牌的白酒正類(lèi)樣本易于獲取,而異類(lèi)樣本卻因類(lèi)別太多而無(wú)法全部獲?。?8-20],即使獲取到足夠的異類(lèi)樣本,也會(huì)在多類(lèi)分類(lèi)方法中面對(duì)正類(lèi)樣本和異類(lèi)樣本數(shù)量極度不均衡的問(wèn)題[21-22]。因此真假識(shí)別問(wèn)題是一個(gè)單類(lèi)分類(lèi)問(wèn)題而非多類(lèi)分類(lèi)問(wèn)題。不同于傳統(tǒng)的支持向量機(jī)需要確定類(lèi)別數(shù)以及各類(lèi)別樣本數(shù)量要均衡,單類(lèi)支持向量機(jī)訓(xùn)練時(shí)僅僅需要正類(lèi)樣本,并在判別時(shí)給出“屬于”還是“不屬于”的結(jié)果。

單分類(lèi)支持向量機(jī)(One-Class Support Vector Machine)基于支持向量機(jī)的分離超平面和最大化間隔等思想[23-24],將一個(gè)分類(lèi)問(wèn)題等價(jià)為一個(gè)特殊的二分類(lèi)問(wèn)題,尋找一個(gè)超平面最大化正類(lèi)樣本與原點(diǎn)之間的間隔,原點(diǎn)充當(dāng)異類(lèi)。模型描述如下:給定訓(xùn)練數(shù)據(jù)集,類(lèi)似地,給出從RN到某高維特征空間χ的非線性映射?(核函數(shù))使得?(Xi)∈χ,在高維空間中建立一個(gè)超平面ω??(X)-ρ=0,將映射樣本點(diǎn)以間隔ρ分開(kāi),其中ω為超平面的法向量,ρ為超平面的截距,為了使超平面盡可能遠(yuǎn)離原點(diǎn),最大化原點(diǎn)到目標(biāo)數(shù)據(jù)間的歐氏距離ρ/||ω||來(lái)尋找最優(yōu)超平面。同時(shí)加入松弛變量ξi允許少部分樣本在坐標(biāo)原點(diǎn)與超平面之間,這一類(lèi)樣本點(diǎn)與超平面距離為ξi/||ω||。數(shù)據(jù)模型如圖3。

圖3 R單分類(lèi)支持向量機(jī)數(shù)據(jù)模型

單類(lèi)支持向量機(jī)的權(quán)重ω和閾值ρ,通過(guò)求解以下二次規(guī)劃問(wèn)題獲得:

其中v∈(0,1)表示邊界支持向量在訓(xùn)練樣本總數(shù)中所占比重的下界,同時(shí)表示訓(xùn)練樣本中訓(xùn)練錯(cuò)誤率的上界。n表示訓(xùn)練樣本總數(shù)。其決策函數(shù)與兩類(lèi)支持向量機(jī)類(lèi)似為:

其中sign()為符號(hào)函數(shù),決策函數(shù)輸出1表示x是正類(lèi)樣本;輸出-1表示x是異類(lèi)樣本。

3.2核函數(shù)選擇

當(dāng)線性分類(lèi)器面對(duì)非線性可分的數(shù)據(jù)時(shí),分類(lèi)器的求解程序?qū)?huì)無(wú)限循環(huán),使得問(wèn)題無(wú)解,通過(guò)引入核函數(shù),可以將非線性可分的數(shù)據(jù)映射到高維空間中,使得問(wèn)題變成線性可分問(wèn)題。

徑向基核函數(shù)通常是一個(gè)較好的選擇,首先徑向基核函數(shù)可以將類(lèi)別間有重疊的非線性樣本集通過(guò)非線性映射將樣本集映射到高維空間,使得不同類(lèi)別樣本區(qū)分開(kāi)來(lái);其次該核函數(shù)僅有一個(gè)參數(shù),模型較簡(jiǎn)單;最后其計(jì)算結(jié)果在(0,1)區(qū)間內(nèi),避免出現(xiàn)計(jì)算機(jī)難以保存和計(jì)算的無(wú)窮大值。

xi為樣本空間的樣本,xj為核函數(shù)中心,σ表示核函數(shù)的參數(shù)寬度,控制函數(shù)的徑向作用范圍。為求解3.1節(jié)中的二次規(guī)劃問(wèn)題引入拉格朗日函數(shù),并引入徑向基核函數(shù)將其轉(zhuǎn)化為對(duì)偶問(wèn)題:

其中αi、αj為拉格朗日系數(shù)。在OC-SVM中,ρ=為確定的閾值,與權(quán)重向量ω決定分類(lèi)超平面。

3.3交叉驗(yàn)證與參數(shù)尋優(yōu)

分類(lèi)器參數(shù)v和核參數(shù)g(g=1/2σ2)的選取對(duì)分類(lèi)效果有極大影響,因此采用格點(diǎn)搜索對(duì)參數(shù)進(jìn)行優(yōu)選[25]。

以交叉驗(yàn)證正確率作為對(duì)參數(shù)優(yōu)劣的評(píng)價(jià)標(biāo)準(zhǔn),其思想是:選定一組參數(shù)(g,v),對(duì)于給定的白酒樣本集,將其隨機(jī)均分成n個(gè)樣本子集,其中的n-1個(gè)子集用于在選定的參數(shù)下訓(xùn)練單類(lèi)分類(lèi)器,最后一個(gè)子集用于測(cè)試,依次循環(huán)直到每一個(gè)樣本子集都充當(dāng)過(guò)測(cè)試樣本,最后以測(cè)試正確的樣本數(shù)與樣本總數(shù)的比作為交叉驗(yàn)證正確率。交叉驗(yàn)證正確率是經(jīng)過(guò)對(duì)樣本的多次不同劃分計(jì)算而來(lái),可以很好地避免參數(shù)和樣本之間的過(guò)度擬合,因此理論上交叉驗(yàn)證正確率高的參數(shù)對(duì)任何樣本都會(huì)有較好分類(lèi)效果。

在瀘州老窖白酒樣本中隨機(jī)選取10個(gè)樣本,搜索范圍設(shè)定為v∈[-10,5]和g∈[-10,-5],其步長(zhǎng)分別為0.1和0.01,樣本隨機(jī)均分成3份,循環(huán)計(jì)算所有參數(shù)的交叉驗(yàn)證正確率,最后選取交叉驗(yàn)證正確率較高的參數(shù)。一般在搜索范圍內(nèi)交叉驗(yàn)證正確率最高的參數(shù)會(huì)有多個(gè),此時(shí)從中選取v參數(shù)最小的作為最終的搜索結(jié)果。對(duì)其余8個(gè)類(lèi)別白酒重復(fù)此參數(shù)尋優(yōu)步驟得到各自的最優(yōu)參數(shù),尋優(yōu)結(jié)果按列列于表1。

表1 R各單類(lèi)分類(lèi)器參數(shù)搜索結(jié)果

4 結(jié)果與分析

4.1分類(lèi)結(jié)果

將參數(shù)尋優(yōu)過(guò)程中選取的10個(gè)瀘州老窖白酒樣本作為訓(xùn)練樣本,設(shè)定訓(xùn)練參數(shù)為表1中對(duì)應(yīng)的瀘州老窖最優(yōu)參數(shù)(0.017 337,0.008 609),將訓(xùn)練樣本和最優(yōu)參數(shù)輸入到單類(lèi)支持向量機(jī)算法進(jìn)行訓(xùn)練,得到一個(gè)用于識(shí)別瀘州老窖白酒真假的單類(lèi)分類(lèi)器。

全部的20個(gè)瀘州老窖白酒樣本作為正類(lèi)測(cè)試樣本,其他8個(gè)類(lèi)別中分別隨機(jī)選取10個(gè)樣本充當(dāng)異類(lèi)測(cè)試樣本,測(cè)試該單類(lèi)分類(lèi)器對(duì)瀘州老窖品牌白酒的真假識(shí)別能力。測(cè)試過(guò)程中,該單類(lèi)分類(lèi)器的輸出為1,表示當(dāng)前測(cè)試樣本為正類(lèi)樣本,即當(dāng)前測(cè)試樣本屬于瀘州老窖品牌的白酒樣本;輸出為-1,表示當(dāng)前測(cè)試樣本不屬于瀘州老窖品牌白酒樣本。以此類(lèi)推對(duì)其余8個(gè)類(lèi)別的白酒樣本重復(fù)上述訓(xùn)練和測(cè)試步驟,最后9個(gè)單類(lèi)分類(lèi)器對(duì)各自正類(lèi)和異類(lèi)測(cè)試樣本的測(cè)試情況以及正確率按行列于表2。

表2 R各單類(lèi)分類(lèi)器真假識(shí)別正確率

4.2實(shí)驗(yàn)分析

表2的第一行列出用于識(shí)別瀘州老窖白酒真假的單類(lèi)分類(lèi)器的識(shí)別情況,第一個(gè)數(shù)據(jù)16/4表明該單類(lèi)分類(lèi)器對(duì)20個(gè)正類(lèi)測(cè)試樣本識(shí)別出16個(gè),有4個(gè)被錯(cuò)判為異類(lèi),其后的8個(gè)數(shù)據(jù)表明該分類(lèi)器對(duì)其他8個(gè)類(lèi)別中隨機(jī)選出的10個(gè)異類(lèi)測(cè)試樣本均正確識(shí)別出來(lái),最后該單類(lèi)分類(lèi)器的識(shí)別正確率為96%。表2以下各行數(shù)據(jù)以此類(lèi)推。

實(shí)驗(yàn)中各單類(lèi)分類(lèi)器對(duì)正類(lèi)樣本誤分的原因,一方面在于訓(xùn)練過(guò)程中,為了最大化超平面與原點(diǎn)的距離同時(shí)使得非線性可分問(wèn)題有解,允許一定比例的訓(xùn)練樣本(正類(lèi)樣本)錯(cuò)分,導(dǎo)致一些稍微離群的正類(lèi)樣本被劃分到超平面之外成為異類(lèi)樣本,通俗地說(shuō),為了讓超平面把正類(lèi)樣本包裹的較緊,放棄了最外圍的小部分正類(lèi)樣本,所以對(duì)異類(lèi)樣本識(shí)別率很高,而對(duì)正類(lèi)樣本識(shí)別稍差。另一方面,樣本數(shù)量準(zhǔn)備的還不夠充分,同時(shí)由于訓(xùn)練樣本是隨機(jī)選取的,很難把樣本集最外圍的支持向量全部選取到,因此必然有小部分正類(lèi)樣本處在分類(lèi)超平面之外。

實(shí)驗(yàn)數(shù)據(jù)表明,訓(xùn)練出來(lái)的9個(gè)單類(lèi)分類(lèi)器對(duì)異類(lèi)樣本均有較好的識(shí)別能力,而對(duì)正類(lèi)樣本的識(shí)別稍低,各單類(lèi)分類(lèi)器總體識(shí)別正確率均在93%以上。綜上所述,本文提出的基于單類(lèi)支持向量機(jī)的電子鼻對(duì)白酒真假識(shí)別有較好識(shí)別正確率。

在對(duì)單類(lèi)分類(lèi)器參數(shù)尋優(yōu)過(guò)程中,由于提供的樣本僅僅是正類(lèi)樣本,因此交叉驗(yàn)證正確率僅僅是對(duì)正類(lèi)樣本的測(cè)試結(jié)果,此時(shí)交叉驗(yàn)證正確率最高的參數(shù)可能不是最好的參數(shù),而加入異類(lèi)樣本某些情況下又不允許,因此下一步工作將對(duì)單分類(lèi)支持向量機(jī)的分類(lèi)方法進(jìn)行改進(jìn),以期更高的識(shí)別率。

5 結(jié)語(yǔ)

白酒行業(yè)假酒的泛濫以及傳統(tǒng)假酒檢測(cè)方法的弊端給白酒真假識(shí)別方案的設(shè)計(jì)帶來(lái)了挑戰(zhàn),本文提出的基于單類(lèi)支持向量機(jī)的電子鼻白酒識(shí)別系統(tǒng)為快速性、客觀性、低成本等要求下的白酒真假識(shí)別任務(wù)提供了新的方案。相比于傳統(tǒng)的白酒識(shí)別方法,本文采用自主設(shè)計(jì)的電子鼻系統(tǒng),其檢測(cè)的快速性有較大優(yōu)勢(shì),并且檢測(cè)成本較低、結(jié)果客觀。

實(shí)驗(yàn)中對(duì)每種白酒的真假識(shí)別任務(wù)都訓(xùn)練一個(gè)單類(lèi)分類(lèi)器,訓(xùn)練時(shí)只需提供該品牌的白酒樣本而無(wú)需搜集假酒樣本,既減輕了分類(lèi)器的訓(xùn)練任務(wù),同時(shí)也避免了采用多類(lèi)分類(lèi)方法時(shí)存在的數(shù)據(jù)傾斜嚴(yán)重的問(wèn)題,另外電子鼻系統(tǒng)的識(shí)別范圍也可以靈活擴(kuò)展,添加新的單類(lèi)分類(lèi)器后,系統(tǒng)中識(shí)別其它品牌白酒的單類(lèi)分類(lèi)器不會(huì)受到影響,系統(tǒng)擴(kuò)展性和可維護(hù)性較好。

[1]秦輝.基于可視化仿生嗅覺(jué)系統(tǒng)的白酒檢測(cè)研究[D].重慶:重慶大學(xué),2011.

[2]楊國(guó)強(qiáng),張淑娟.電子鼻技術(shù)在酒類(lèi)識(shí)別應(yīng)用中的研究進(jìn)展[J].山西農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,1:91-96.

[3]惠國(guó)華,陳欲泉.基于電子鼻的低溫貯藏草魚(yú)品質(zhì)預(yù)測(cè)方法研究[J].傳感技術(shù)學(xué)報(bào),2012,25(2):157-161.

[4]Xiao Y S,Liu B,Yu P S,et al.A Robust One-Class Transfer Learning Method with Uncertain Data[J].Knowledge and Information Systems,2015,44(2):407-438.

[5]Pla F,Latorre Carmona P,Sotoca J M.One-Class Classification Techniques in Image Recognition Problems.IEEE Workshop on Information Optics(WIO),2013:1-3.

[6]黃潔,李燕,尹芳緣,等.使用電子鼻預(yù)測(cè)低溫貯藏羅非魚(yú)儲(chǔ)存時(shí)間[J].傳感技術(shù)學(xué)報(bào),2013,26(10):1317-1322.

[7]吳莉莉,鄭丹,鄭寶周.基于電子鼻技術(shù)的花椒品種鑒別方法研究[J].傳感技術(shù)學(xué)報(bào),2013,26(11):1473-1477.

[8]湯旭翔,劉偉,韓圓圓,等.基于電子鼻和非線性數(shù)據(jù)特征分析的雞肉新鮮度檢測(cè)方法[J].傳感技術(shù)學(xué)報(bào),2014,27(10):1443-1446.

[9]亓培鋒,孟慶浩,井雅琪,等.用于白酒識(shí)別的電子鼻數(shù)據(jù)分析與參數(shù)優(yōu)化[J].天津大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,48(7):643-651.

[10]Jing Y Q,Meng Q H,Qi P F,et al.Electronic Nose with A New Feature Reduction Method and A Multi-Linear Classifier for Chinese Liquor Classification.Review of Scientific Instruments,2014,85(5):055004-055004-10.

[11]沈正維,李秋菊.支持向量機(jī)與神經(jīng)網(wǎng)絡(luò)的關(guān)系研究[J].生物數(shù)學(xué)學(xué)報(bào),2006,21(2):204-208.

[12]吳莉莉,鄭丹,鄭寶周,等.基于電子鼻技術(shù)的花椒品種鑒別方法研究[J].傳感技術(shù)學(xué)報(bào),2013,26(11):1473-1477.

[13]鄒小波,趙杰文.電子鼻數(shù)據(jù)的預(yù)處理技術(shù)與應(yīng)用[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2006,37(5):83-86.

[14]Vapnik V N.The Nature of Statistical learning theory[M].NY,USA:Springer Verlag,1995:138-145.

[15]周海濤,殷勇,于慧春.勁酒電子鼻鑒別分析中傳感器陣列優(yōu)化方法研究[J].傳感技術(shù)學(xué)報(bào),2009,22(2):175-178.

[16]占瓊,張順平,范超群,等.特征選擇在電子鼻系統(tǒng)陣列優(yōu)化中的應(yīng)用[J].傳感器與微系統(tǒng),2008,27(2):114-117.

[17]程邵明,王俊,王永維,等.基于電子鼻技術(shù)的不同特征參數(shù)對(duì)番茄苗早疫病病害區(qū)分效果影響的研究[J].傳感器技術(shù)學(xué)報(bào),2014,27(1):1-5.

[18]Utkin L V,Chekh A I.A New Robust Model of One-Class Classification by Interval-Valued Training Data Using the Triangular Kernel[J].Neural Networks.2015,69:99-110.

[19]李琪,盧榮勝,陳成.基于1-分類(lèi)支持向量機(jī)的機(jī)器視覺(jué)缺陷分類(lèi)方法[J].合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,35(10):1311-1315.

[20]劉家辰,苗啟廣,曹瑩,等.基于混合多樣性生成與修剪的集成單類(lèi)分類(lèi)算法[J].電子與信息學(xué)報(bào),2015,37(2):386-393.

[21]陳渝,韓春燕.基于單類(lèi)SVM和甲醛多示例采樣方法的目標(biāo)跟蹤算法[J].西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,39(3):1-8.

[22]Jumutc V,Suykens J A K.Supervised Novelty Detection.2013 IEEE Symposium on Computational Intelligence and Data Mining(CIDM),2013:143-149.

[23]Parhizkar E,Abadi M.BeeOWA:A Novel Approach Based on ABC Algorithm and Induced OWA Operators for Constructing One-Class Classifier Ensembles[J].Neurocomputing,2015,166:367-381.

[24]顏景斌,吳石,伊戈?duì)?,?基于單類(lèi)支持向量機(jī)的音頻分類(lèi)[J].計(jì)算機(jī)應(yīng)用,2009,29(5):1419-1422.

[25]Xiao Y C,Wang H G,Xu W L.Parameter Selection of Gaussian Kernel for One-Class SVM.IEEE Transactions on Cybernetics,2015,45(5):927-939.

Application of Electronic Nose in True-Fake Chinese Liquors Recognition Based on One-Class SVM*

ZHOU Yu,MENG Qinghao*,QI Peifeng,JING Yaqi,ZENG Ming
(School of Electrical Engineering and Automation,Tianjin University,Tianjin 300072,China)

Aimed at the imbalanced number between the true and fake Chinese liquor samples(normal and abnormal samples)and the lack of abnormal sample categories in truecfake Chinese liquor recognition by multi-class classification,a true-fake recognition method using one-class SVM(Support Vector Machine)to train a one-class classifier for each brand of liquor is put forward.Firstly,a self-designed electronic nose system was used to sample different brands of liquor.Secondly,after data pre-processing,feature generation and feature reduction in turn,the data sampled from the sensor array was transformed into test samples of classification.Thirdly,the optimal parameters for each one-class classifier were found by grid-search.Finally,each one-class classifier was tested on the truefake recognition effect by the corresponding samples.The true-fake recognition rate of one-class classifiers ranges from 93%to 98%,which indicates that the self-designed electronic nose system combined with one-class SVM has a good performance of true-fake Chinese liquor recognition.

electronic nose;Chinese liquors;true-fake recognition;one-class SVM

周宇(1990-),男,漢族,天津大學(xué)電氣與自動(dòng)化學(xué)院碩士研究生,研究方向?yàn)闄C(jī)器嗅覺(jué),yu1019594136@tju.edu.cn;

孟慶浩(1968-),男,漢族,博士,天津大學(xué)電氣與自動(dòng)化學(xué)院教授,主要研究方向?yàn)闄C(jī)器人感知、導(dǎo)航與控制、機(jī)器嗅覺(jué)、機(jī)器人意念控制,qh_meng@tju.edu.cn。

TP391.4;TN911.7

A

1004-1699(2015)12-1741-06

項(xiàng)目來(lái)源:國(guó)家自然科學(xué)基金項(xiàng)目(61271321,61473207,61401303);教育部博士點(diǎn)基金項(xiàng)目(20120032110068);天津市科技支撐計(jì)劃項(xiàng)目(14ZCZDS F00025)

2015-06-02修改日期:2015-09-15

猜你喜歡
真假電子鼻分類(lèi)器
真假大作戰(zhàn)
真假大作戰(zhàn)
真假大作戰(zhàn)
電子鼻咽喉鏡在腔鏡甲狀腺手術(shù)前的應(yīng)用
三句話的真假
BP-GA光照分類(lèi)器在車(chē)道線識(shí)別中的應(yīng)用
飛到火星去“聞味兒”——神奇的電子鼻
加權(quán)空-譜與最近鄰分類(lèi)器相結(jié)合的高光譜圖像分類(lèi)
結(jié)合模糊(C+P)均值聚類(lèi)和SP-V-支持向量機(jī)的TSK分類(lèi)器
基于LLE降維和BP_Adaboost分類(lèi)器的GIS局部放電模式識(shí)別
湘西| 龙里县| 塘沽区| 怀柔区| 镇康县| 思茅市| 鹤壁市| 任丘市| 湛江市| 灵武市| 株洲市| 武功县| 石林| 新昌县| 安乡县| 乌鲁木齐县| 洛川县| 泗阳县| 丰县| 永济市| 平和县| 夏邑县| 广水市| 尉氏县| 芜湖县| 晋江市| 济南市| 厦门市| 连南| 阳西县| 苏尼特左旗| 当阳市| 饶河县| 大化| 蓬安县| 寿阳县| 弋阳县| 顺平县| 化德县| 铁岭市| 西乌珠穆沁旗|