張嚴(yán)嚴(yán),郭 敏
陜西師范大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,西安 710062
基于雙譜和支持向量機(jī)的小麥碰撞聲分類(lèi)研究
張嚴(yán)嚴(yán),郭 敏
陜西師范大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,西安 710062
小麥在儲(chǔ)藏期間,易發(fā)生蟲(chóng)害和霉變,導(dǎo)致小麥質(zhì)量下降,有效地檢測(cè)和防治工作顯得尤為重要。常見(jiàn)的儲(chǔ)糧檢測(cè)方法有糧食探管法、機(jī)器視覺(jué)檢測(cè)法、電導(dǎo)率檢測(cè)法、近紅外反射光譜法、軟X線成像法等[1]。但這些方法存在勞動(dòng)強(qiáng)度大、代價(jià)高等缺陷。因此,具有輕便、簡(jiǎn)單、快捷、廉價(jià)等優(yōu)勢(shì)的聲檢測(cè)技術(shù)日益成為該領(lǐng)域的研究熱點(diǎn)[2]。
近年來(lái),在聲檢測(cè)領(lǐng)域,碰撞聲技術(shù)因其方便、快捷得到廣泛應(yīng)用。2001年,Pearson等人首次采用聲碰撞技術(shù)實(shí)時(shí)分析開(kāi)心果碰撞鋼板聲,根據(jù)碰撞聲信號(hào)的不同,分離殼未開(kāi)和已開(kāi)的開(kāi)心果,分類(lèi)正確率約為97%[3-4]。2007年,Pearson等人利用碰撞聲信號(hào)檢測(cè)小麥蟲(chóng)蛀粒(Insect Damaged wheat Kernels,IDK),從時(shí)域信號(hào)建模和短時(shí)窗方法等方面處理信號(hào),用神經(jīng)網(wǎng)絡(luò)進(jìn)行特征分類(lèi),識(shí)別IDK準(zhǔn)確率為87%[5]。2007年,Ince等人利用碰撞聲信號(hào)檢測(cè)裂殼榛子和小麥IDK,根據(jù)Fisher判別準(zhǔn)則對(duì)自適應(yīng)分段聲信號(hào)提取特征,進(jìn)行分類(lèi),對(duì)完好中破損榛子和完好小麥中IDK識(shí)別率均達(dá)90%以上[6]。2008年,Elbatawi等人把碰撞聲分類(lèi)系統(tǒng)用于土豆塊空心病識(shí)別,根據(jù)完好土豆塊碰撞聲幅度大于空心塊莖、峰值頻率高于空心塊莖的特點(diǎn),提取信號(hào)三部分特征進(jìn)行分類(lèi),準(zhǔn)確率約98%[7]。2012年,Khalesi等人采集了兩個(gè)胡桃品種的碰撞聲,采用時(shí)域和基于FFT變換的頻域分析方法提取信號(hào)特征,用多層前饋神經(jīng)網(wǎng)絡(luò)進(jìn)行分類(lèi),識(shí)別率達(dá)90%以上[8]。
本文采用雙譜和支持向量機(jī)(Support Vector Machine,SVM)相結(jié)合的方法,對(duì)小麥完好粒、蟲(chóng)蛀粒和霉變粒碰撞鋼板聲信號(hào)進(jìn)行識(shí)別研究。首先對(duì)信號(hào)進(jìn)行雙譜估計(jì),提取信號(hào)雙譜峰值和對(duì)角切片譜兩部分特征,再用支持向量機(jī)分類(lèi)器進(jìn)行分類(lèi),得到了較高的識(shí)別率,本研究為麥粒分揀提供了一種新途徑。
2.1 雙譜理論
高階統(tǒng)計(jì)分析由于在處理非高斯和非線性信號(hào)方面的特殊性質(zhì),逐漸成為一種信號(hào)分析和特征提取的有效技術(shù)[9]。近年來(lái),高階譜在信號(hào)檢測(cè)、參數(shù)估計(jì)、目標(biāo)分類(lèi)等方面都受到極大關(guān)注,糧食碰撞聲信號(hào)本質(zhì)上是非平穩(wěn)、非高斯信號(hào),因此可利用高階譜進(jìn)行研究分析。高階譜中雙譜的階數(shù)最低,計(jì)算較為簡(jiǎn)單,且包含了高階譜的所有特征,所以本文采用基于雙譜的特征提取方法。
雙譜可以由信號(hào)的離散傅里葉變換表示:
式中,X(ωi)為信號(hào)的離散傅里葉變換;ωi為頻率變量;i= 1,2。并且雙譜具有以下性質(zhì):
本文采用直接法進(jìn)行雙譜估計(jì)。對(duì)于一有限長(zhǎng)度的信號(hào),先估計(jì)其傅里葉值,然后對(duì)該信號(hào)作三重相關(guān)運(yùn)算,即可得到雙譜的估計(jì)。估計(jì)時(shí)采樣頻率設(shè)為 fs,Δ0=fs/L是雙譜區(qū)域內(nèi)沿水平和垂直方向上兩頻率采樣點(diǎn)之間的間隔,采樣點(diǎn)數(shù)為L(zhǎng),步驟如下:
(1)將數(shù)據(jù)L分成N段,每段M個(gè)數(shù)據(jù),即L=NM,每段減去均值(為便于做FFT算法,可在每段補(bǔ)零)。
(2)對(duì)每段數(shù)據(jù)作DFT變換,即
其中,λ=1,2,…,M-1;i=1,2,…,N。
(3)取M=M1L0,M1為正的奇數(shù),即:M1=2S1+1,適當(dāng)選擇L0使得M為偶數(shù),根據(jù)DFT系數(shù),得到每段數(shù)據(jù)的雙譜:
2.2 支持向量機(jī)
支持向量機(jī)是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展起來(lái)的新一代學(xué)習(xí)算法。其基本思想為:先通過(guò)非線性變換將輸入空間變換到一個(gè)高維空間,即將非線性問(wèn)題轉(zhuǎn)換成高維特征空間中的線性問(wèn)題進(jìn)行分類(lèi),然后在這個(gè)新空間中求取最優(yōu)分類(lèi)面,這種變換是通過(guò)定義適當(dāng)?shù)膬?nèi)積函數(shù)來(lái)實(shí)現(xiàn)的。支持向量機(jī)中所求得的分類(lèi)函數(shù)在形式上類(lèi)似于神經(jīng)網(wǎng)絡(luò),輸出是若干中間層節(jié)點(diǎn)的線性組合,每個(gè)中間層節(jié)點(diǎn)對(duì)應(yīng)于輸入樣本與一個(gè)支持向量的內(nèi)積,又被稱(chēng)為支持向量網(wǎng)絡(luò)。
支持向量機(jī)關(guān)鍵在于內(nèi)積函數(shù)(核函數(shù))選擇。低維空間向量集映射到高維空間,增加了計(jì)算復(fù)雜度,而核函數(shù)正好巧妙地解決了這個(gè)問(wèn)題,只要選用適當(dāng)?shù)暮撕瘮?shù),就可以得到高維空間的分類(lèi)函數(shù)。
首先對(duì)信號(hào)進(jìn)行直接雙譜估計(jì),得到雙譜等高線圖,然后從兩方面提取特征:(1)提取雙譜峰值;(2)提取對(duì)角切片譜的譜峰。最后,在支持向量機(jī)分類(lèi)器中對(duì)樣本進(jìn)行分類(lèi),分類(lèi)過(guò)程分為兩步:樣本訓(xùn)練和樣本測(cè)試。樣本訓(xùn)練用核函數(shù)將樣本映射到高維空間,在該空間中計(jì)算支持向量和最優(yōu)分類(lèi)面。測(cè)試時(shí),用訓(xùn)練得到的最優(yōu)分類(lèi)面判別映射到高維空間的測(cè)試樣本,確定測(cè)試樣本分類(lèi)編號(hào),根據(jù)分類(lèi)編號(hào)計(jì)算識(shí)別率。基于雙譜和支持向量機(jī)的分類(lèi)識(shí)別流程如圖1所示。
圖1 實(shí)驗(yàn)流程圖
3.1 雙譜分析
實(shí)驗(yàn)中,取小麥完好粒、蟲(chóng)害粒和霉變粒各300粒,麥粒掉落在24 cm×11 cm×0.06 cm的鋼板上,掉落高度為50 cm,鋼板的水平傾斜角度為30°,用型號(hào)為舒爾BG 4.1的專(zhuān)業(yè)麥克風(fēng)錄制碰撞聲信號(hào),并傳送至裝有MAYA 44聲卡的計(jì)算機(jī)中,采樣頻率為48 000 Hz,完好粒、IDK和霉變粒各采集100個(gè)聲信號(hào)。由于有效碰撞聲只集中在很小一段樣本點(diǎn)內(nèi),為減少計(jì)算量,提高處理速度,對(duì)信號(hào)雙譜估計(jì)前先進(jìn)行預(yù)處理,提取出有效信號(hào)。
3.1.1 雙譜估計(jì)
計(jì)算時(shí),將長(zhǎng)為6 144的樣本點(diǎn)分為128段,經(jīng)估計(jì)得到一個(gè)256×256的雙譜幅度譜Bx( ) ω1,ω2,圖2給出了3類(lèi)小麥碰撞聲的雙譜等高線及三維圖,不同聲信號(hào)差別顯著。
雙譜等高線圖中:
(1)完好粒的幅值分布范圍較廣,幾乎覆蓋低頻及高頻區(qū)域。
(2)蟲(chóng)蛀粒幅值在低頻部分沒(méi)有分布,只在高頻區(qū)域疏散分布。
(3)霉變粒幅值主要集中在低頻部分,圍繞著(0,0)周?chē)植肌?/p>
雙譜三維圖中:
(1)完好粒的峰值比較密集,其峰值大小和蟲(chóng)蛀粒處于一個(gè)數(shù)量級(jí)。
(2)蟲(chóng)蛀粒的峰值密度最少,但其峰值是三者中最大的。
(3)霉變粒的峰值相對(duì)較少,其峰值是三者中最小的。
這種差別的主要原因與3類(lèi)麥粒物理結(jié)構(gòu)不同有關(guān)。蟲(chóng)蛀的麥粒結(jié)構(gòu)會(huì)因?yàn)楹οx(chóng)的洞穴而被改變,其碰撞鋼板時(shí)會(huì)發(fā)生共振,聲音散列。而發(fā)生霉變的麥粒會(huì)使胚乳多空,麥粒收縮,重量減輕,碰撞鋼板的力度較小,聲音偏低。綜上可見(jiàn):麥粒的內(nèi)部構(gòu)造發(fā)生變化時(shí),會(huì)造成它們碰撞鋼板的聲音有差別,這種差別在雙譜中表現(xiàn)顯著。
3.1.2 特征提取
本文從以下兩方面提取特征:
(1)提取雙譜峰值
雙譜的譜峰是反映雙譜結(jié)構(gòu)的一個(gè)重要參數(shù)。在雙譜三維圖中,按1/256的間隔沿Y軸做平行于XZ平面的等間隔截面,可得到雙譜的256個(gè)截面,取各截面最大雙譜值作為特征向量,得到一個(gè)256維的特征向量。圖3為小麥碰撞聲信號(hào)雙譜峰值圖。
(2)提取對(duì)角切片譜
對(duì)角切片是指當(dāng)ω1=ω2時(shí),B(ω1,ω2)中對(duì)應(yīng)的雙譜值。雙譜的對(duì)角切片包含有豐富的特征信息,切片譜的譜峰及形態(tài)決定了雙譜的結(jié)構(gòu),同時(shí)也反應(yīng)了信號(hào)的特征。圖4是3類(lèi)聲信號(hào)的對(duì)角切片圖,差異顯著,因此本文提取了對(duì)角切片譜的256個(gè)譜峰作為特征向量。
3.2 支持向量機(jī)分類(lèi)識(shí)別
3.2.1 最優(yōu)核函數(shù)參數(shù)和懲罰參數(shù)選取
實(shí)際分類(lèi)中,支持向量機(jī)性能的優(yōu)劣依賴(lài)于核函數(shù)和懲罰參數(shù)的選取。不同核函數(shù)對(duì)應(yīng)于不同算法,會(huì)產(chǎn)生不同的支持向量點(diǎn)和分類(lèi)面,最終對(duì)分類(lèi)結(jié)果產(chǎn)生很大影響。
圖2 3類(lèi)小麥碰撞聲雙譜等高線圖
圖3 3類(lèi)小麥碰撞聲的雙譜峰值圖
圖4 3類(lèi)小麥碰撞聲雙譜對(duì)角切片圖
SVM對(duì)核函數(shù)的要求有兩點(diǎn):(l)必須滿足Mercer條件;(2)在高維空間中可以構(gòu)造一個(gè)支持向量數(shù)相對(duì)較少的最優(yōu)分類(lèi)界面。目前,較常用的核函數(shù)有3種:徑向基核函數(shù)、多項(xiàng)式核函數(shù)、Sigmoid核函數(shù)。經(jīng)實(shí)驗(yàn)對(duì)比,本文選擇分類(lèi)正確率較高且計(jì)算量最小的核函數(shù)—重尾徑向基函數(shù)(HTRBF),與普通徑向基函數(shù)相比,它具有指數(shù)級(jí)延遲率,公式為:它包含a、b兩個(gè)參數(shù),默認(rèn) ρ=1,x代表聲音樣本,yi代表第i個(gè)支持向量。對(duì)于HTRBF函數(shù),不同的b值代表不同的分布,但是當(dāng)且僅當(dāng)0≤b≤2的時(shí)候,HTRBF函數(shù)滿足Mercer條件,所以,根據(jù)SVM核函數(shù)的要求,b的取值只可在0到2之間。b的經(jīng)典取值有以下3種:b取0.5時(shí),代表Sublinear分布;b取1.0時(shí),代表Laplacian分布;b取2.0時(shí),代表Gaussian分布。參數(shù)a的選擇不影響Mercer條件,但a取值在0和1之間時(shí),會(huì)決定支持向量數(shù)的衰減速度,從而影響計(jì)算復(fù)雜度。
表1為a、b取不同值時(shí)對(duì)應(yīng)的識(shí)別正確率,其中,b= 2.0,a=0.25時(shí),識(shí)別率最高,但分類(lèi)不均勻,完好粒的識(shí)別率相對(duì)較低,因此這對(duì)參數(shù)不是最佳取值;同理b=1.0,a= 0.5時(shí),分類(lèi)也不均勻;故本文選擇b=2,a=0.125的核函數(shù)作為支持向量的核函數(shù)。
表1 不同核參數(shù)的SVM識(shí)別正確率(%)
懲罰參數(shù)是為了解決樣本在高維空中的不完全線性可分問(wèn)題,而合適的參數(shù)C也可以降低誤分率。核函數(shù)參數(shù)固定后,進(jìn)行懲罰參數(shù)C的選擇,表2為C取不同值時(shí)的識(shí)別正確率。表中,C≥4時(shí),識(shí)別結(jié)果均為88%。由于C值越大,算法的時(shí)間復(fù)雜度就越高,因此本文選擇懲罰參數(shù)值C=22=4。
表2 不同懲罰參數(shù)的SVM識(shí)別正確率(%)
3.2.2 分類(lèi)結(jié)果
選取每類(lèi)碰撞聲樣本100個(gè),其中50個(gè)用于訓(xùn)練,另外50個(gè)進(jìn)行測(cè)試,識(shí)別結(jié)果如表3所示。3類(lèi)聲音信號(hào)的正確識(shí)別率均達(dá)到84%以上,且蟲(chóng)蛀粒的正確率高達(dá)94%。這表明,小麥碰撞聲雙譜特征明顯,支持向量機(jī)分類(lèi)效果良好,尤其對(duì)蟲(chóng)蛀粒識(shí)別效果最好。
表3 3類(lèi)小麥碰撞聲的識(shí)別結(jié)果
不同麥粒碰撞聲所含信息之間存在差異,本文對(duì)3類(lèi)小麥碰撞聲進(jìn)行分析,提取了雙譜峰值和對(duì)角切片譜值作為分類(lèi)依據(jù),用支持向量機(jī)進(jìn)行識(shí)別。得出以下結(jié)論:
(1)麥粒的內(nèi)部構(gòu)造發(fā)生變化時(shí),會(huì)造成它們碰撞鋼板的聲音有差別,這種差別在雙譜中表現(xiàn)顯著。
(2)結(jié)合雙譜和支持向量機(jī)方法能夠有效地提取碰撞聲特征,分類(lèi)效果較好,為小麥粒的識(shí)別研究提供了新方法,同時(shí)也為其他農(nóng)作物的分類(lèi)研究提供了參考。
[1]胡麗華,郭敏,張景虎,等.儲(chǔ)糧害蟲(chóng)檢測(cè)新技術(shù)及應(yīng)用現(xiàn)狀[J].農(nóng)業(yè)工程學(xué)報(bào),2007,23(11):286-290.
[2]耿森林,尚志遠(yuǎn).儲(chǔ)糧害蟲(chóng)聲檢測(cè)技術(shù)研究進(jìn)展與展望[J].農(nóng)業(yè)工程學(xué)報(bào),2006,22(4):204-207.
[3]Pearson T C.Detection of pistachio nuts with closed shells using impactacoustics[J].Applied Engineering in Agriculture,2001,17(2):249-253.
[4]Pearson T C,Cetin A E,Tewfik A H.Detection of insect damaged wheatkernelsby impactacoustics[C]//ICASSP,2005:649-652.
[5]Pearson T C,Cetin A E,Tewfik A H,et al.Feasibility of impact-acoustic emissions for detection of damaged wheat kernels[J].Digital signal processing,2007,17:617-633.
[6]Ince N F,Onaran I,Tewfik A H,et al.Wheat and hazelnut inspection with impact acoustics time-frequency patterns[C]// ASABE Meeting,2007.
[7]Elbatawi I E.An acoustic impact method to detect hollow heart of potato tubers[J].Biosystems Engineering,2008,100:206-213.
[8]Khalesi S,Mahmoudi A,Hosainpour A,et al.Detection of walnut varieties using impact acoustics and Artificial Neural Networks(ANNs)[J].Modern Applied Science,2012,6(1):43-49.
[9]嚴(yán)可國(guó),柳亦兵,徐鴻,等.基于雙譜分析的大型汽輪機(jī)振動(dòng)故障特征提取[J].中國(guó)電機(jī)工程學(xué)報(bào),2007,30(2):98-103.
ZHANG Yanyan,GUO Min
College of Computer Science,Shaanxi Normal University,Xi’an 710062,China
In order to realize the automatic classification of wheat kernels,a new approach that combines the bispectrum and support vector machine is introduced to classify and recognise wheat impact sounds of undamaged kernels,insect damaged kernels and moldy kernels.The impact acoustic signals are processed by bispectrum estimation.Features in bispectrum and diagonal slices spectrum are extracted.Then the features are classified in support vector machine.The recognition accuracy rates in classification of undamaged kernel,insect damaged kernel and moldy kernel are above 84%.The experimental results show that this research has a more comprehensive value in application,and it provides a new method for wheat kernels classification.
wheat impact acoustic signals;bispectrum estimation;support vector machine
為實(shí)現(xiàn)小麥顆粒的自動(dòng)分類(lèi),采用雙譜和支持向量機(jī)相結(jié)合方法對(duì)小麥完好粒、蟲(chóng)蛀粒和霉變粒的碰撞聲進(jìn)行分類(lèi)識(shí)別。對(duì)碰撞聲信號(hào)進(jìn)行雙譜估計(jì),提取信號(hào)雙譜峰值和對(duì)角切片譜兩部分特征,用支持向量機(jī)分類(lèi)器進(jìn)行分類(lèi),對(duì)完好粒、蟲(chóng)蛀粒和霉變粒3種小麥顆粒識(shí)別正確率均達(dá)84%以上。實(shí)驗(yàn)結(jié)果表明,該研究具有較強(qiáng)的實(shí)際應(yīng)用價(jià)值,為小麥顆粒的分類(lèi)提供了新的方法和依據(jù)。
小麥碰撞聲;雙譜估計(jì);支持向量機(jī)
A
TP391.42
10.3778/j.issn.1002-8331.1202-0357
ZHANG Yanyan,GUO Min.Study on classification of wheat impact acoustic signals based on bispectrum and support vector machine.Computer Engineering and Applications,2013,49(23):203-206.
國(guó)家自然科學(xué)基金(No.10974130);陜西省教育廳科研計(jì)劃項(xiàng)目(No.11JK0519)。
張嚴(yán)嚴(yán)(1988—),女,碩士研究生,主要研究方向:信號(hào)處理、模式識(shí)別;郭敏(1964—),通訊作者,女,博士,教授,主要研究領(lǐng)域:數(shù)字信號(hào)處理及模式識(shí)別研究。E-mail:zhangyan-157@163.com
2012-02-20
2012-05-08
1002-8331(2013)23-0203-04