劉 霞,張姍姍,胡銘鑒
(1.東北石油大學(xué)電氣信息工程學(xué)院,黑龍江大慶163318; 2.新疆石油勘探設(shè)計(jì)研究(有限公司)儀信所,新疆克拉瑪依834000)
基于混沌人工蜂群算法優(yōu)化的SVM 齒輪故障診斷
劉 霞1,張姍姍1,胡銘鑒2
(1.東北石油大學(xué)電氣信息工程學(xué)院,黑龍江大慶163318; 2.新疆石油勘探設(shè)計(jì)研究(有限公司)儀信所,新疆克拉瑪依834000)
為克服支持向量機(jī)中模型參數(shù)的隨意選擇對分類性能造成的不利影響,提出了基于混沌人工蜂群算法的支持向量機(jī)(CABC-SVM:Chaotic Artificial Bee Colony algorithm of Support VectorMachine)參數(shù)優(yōu)化方法。該方法采用Logistic混沌映射初始化種群和錦標(biāo)賽選擇策略,對支持向量機(jī)的懲罰因子和核函數(shù)參數(shù)進(jìn)行優(yōu)化時(shí)以分類準(zhǔn)確率作為適應(yīng)度函數(shù)。通過UCI標(biāo)準(zhǔn)數(shù)據(jù)集實(shí)驗(yàn)證明,CABC具有較強(qiáng)的局部和全局搜索能力,其優(yōu)化的支持向量機(jī)可在很大程度上克服局部極值點(diǎn),從而獲取更高的分類準(zhǔn)確率,并有效縮短了搜索時(shí)間。將該方法應(yīng)用于實(shí)際齒輪故障診斷中,采用小波相對能量作為特征輸入支持向量機(jī),分類準(zhǔn)確率達(dá)到99.4%,驗(yàn)證了該方法的可行性和有效性。
支持向量機(jī);混沌人工蜂群算法;參數(shù)優(yōu)化;齒輪故障診斷
齒輪作為一種廣泛應(yīng)用于變速傳動(dòng)系統(tǒng)的機(jī)械部件,其工作環(huán)境具有高速、重負(fù)載和強(qiáng)沖擊的特點(diǎn),再加上自身的復(fù)雜結(jié)構(gòu)使齒輪發(fā)生故障的概率大大增加。因此,以齒輪故障的識(shí)別診斷研究作為國內(nèi)外的研究熱點(diǎn),具有非常重要的現(xiàn)實(shí)意義與價(jià)值。
近年來,在齒輪故障診斷領(lǐng)域應(yīng)用較廣泛的是基于人工神經(jīng)網(wǎng)絡(luò)的模式識(shí)別方法[1],該方法要求具有大量典型的故障樣本數(shù)據(jù)或經(jīng)驗(yàn)數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),而齒輪的故障數(shù)據(jù)不能大量獲?。?],使人工神經(jīng)網(wǎng)絡(luò)的理論優(yōu)勢在實(shí)際應(yīng)用中難以發(fā)揮。針對此問題,Vapnik[3]在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上提出了一種機(jī)器學(xué)習(xí)方法-支持向量機(jī)(SVM:Support Vector Machine),它可以解決小樣本學(xué)習(xí)、高維及非線性問題,同時(shí)可以避免神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)選擇和局部極小點(diǎn)問題。由于模型參數(shù)(包括懲罰因子C、核函數(shù)類型和核函數(shù)參數(shù))的選擇會(huì)嚴(yán)重影響最終的分類結(jié)果[4],因此,在利用SVM進(jìn)行分類時(shí),需要找到一種方法能準(zhǔn)確選擇最佳模型參數(shù)的方法。人工蜂群(ABC:Artificial Bee Colony)算法是Karaboga[5]提出的一種新的群集智能優(yōu)化算法,該算法模擬蜜蜂采蜜的智能行為,不同工種的蜜蜂完成各自的收集或共享任務(wù),通過這種信息的整合與分析最終達(dá)到尋找最優(yōu)食物源即最優(yōu)解的目的。Karaboga等[6,7]通過大量的標(biāo)準(zhǔn)函數(shù)測試證明,ABC算法與傳統(tǒng)方法相比具有更佳的優(yōu)化性能,它通過蜜蜂之間的分工合作很好地兼顧了精密搜索已知解域與擴(kuò)展新解域,從而降低了算法陷入局部最優(yōu)解的概率。
筆者采用支持向量機(jī)作為分類器,利用ABC算法對模型參數(shù)進(jìn)行優(yōu)化,通過對標(biāo)準(zhǔn)數(shù)據(jù)集和實(shí)測齒輪故障數(shù)據(jù)的訓(xùn)練及分類測試實(shí)驗(yàn)證明,ABC算法能克服局部最優(yōu)解,在一定程度上加快搜索速度,優(yōu)化后的SVM具有更高的分類準(zhǔn)確率,從而驗(yàn)證了該方法的可行性和有效性。
1.1 支持向量機(jī)兩類分類器
SVM分類的過程就是在空間找到一個(gè)滿足分類要求的最優(yōu)分類超平面,該超平面在保證分類正確的基礎(chǔ)上,能使兩類數(shù)據(jù)集間的距離最大。將 SVM的學(xué)習(xí)過程轉(zhuǎn)化為優(yōu)化問題,設(shè)有訓(xùn)練樣本集{(xi,yi),i=1,2,…,l},輸入xiRn,期望輸出yi∈{+1,-1},其中+1,-1分別代表兩類的類別標(biāo)識(shí),則該數(shù)據(jù)集的分類超平面可描述為wgx+b=0。尋找最優(yōu)超平面的公式如下
其中w為超平面的法向量;C為錯(cuò)誤懲罰因子,它控制對錯(cuò)分樣本的懲罰程度,C越大對錯(cuò)誤的懲罰越重;ξ為松弛變量,當(dāng)分類面出現(xiàn)錯(cuò)分時(shí)ξi>0;b∈R為閾值。
采用Lagrange乘子法求解式(1),將具有線性約束的二次規(guī)劃問題轉(zhuǎn)化為對應(yīng)的對偶問題
其中K(xi,xj)為核函數(shù)。目前常用的核函數(shù)主要有多項(xiàng)式核函數(shù)、徑向基函數(shù)、多層感知器和動(dòng)態(tài)核函數(shù)等[8,9]。筆者采用徑向基核函數(shù),其值受核函數(shù)參數(shù)σ的影響。
1.2 支持向量機(jī)多分類器
支持向量是針對兩類問題提出的分類方法,但齒輪的故障類型超過兩類,因此,需要研究用支持向量機(jī)解決多類的分類問題。多類分類是以二分類為基礎(chǔ)的,目前采用的多類分類算法[10]主要有一對一(One Against One)、一對多(One Against All)和有向無環(huán)圖分類法(Directed Acyclic Graph)等,筆者采用一對一的分類方法。多類分類問題可表述為:給定屬于k類的m個(gè)訓(xùn)練樣本(x1,y1),…,(xm,ym),其中xi∈Rn,i=1,…,m,且類別標(biāo)簽yi∈{1,…,k}。
一對一的多分類方法是在每兩個(gè)類別之間訓(xùn)練產(chǎn)生一個(gè)分類器,對于一個(gè)k類問題(包含k類訓(xùn)練數(shù)據(jù)),將這k類訓(xùn)練數(shù)據(jù)進(jìn)行兩兩組合,一共可構(gòu)建M=k(k-1)/2個(gè)訓(xùn)練集,利用SVM二分類算法分別對這M個(gè)訓(xùn)練集進(jìn)行學(xué)習(xí),從而產(chǎn)生M個(gè)分類器。測試階段的類別判斷采用投票決策法(Voting Strategy)[11],用所有的分類器對樣本xt進(jìn)行分類,在第i類和第j類之間分類時(shí),若該分類器判斷xt屬于i類,則i類的票數(shù)加1,否則j類的票數(shù)加1。最后將待分類的樣本xt歸為得票數(shù)最多的那類。
綜上可知,無論是兩類分類器還是多類分類器,要使支持向量機(jī)獲得最佳分類性能,必須尋找最優(yōu)的懲罰因子C和核函數(shù)參數(shù)σ。
2.1 ABC算法優(yōu)化原理
ABC算法模擬實(shí)際蜜蜂采蜜機(jī)制處理函數(shù)的優(yōu)化問題,ABC分為3部分:引領(lǐng)蜂、跟隨蜂和偵查蜂。在每次循環(huán)中,首先是引領(lǐng)蜂搜索,從一個(gè)隨機(jī)產(chǎn)生的初始種群開始,在適應(yīng)度值較優(yōu)的一半個(gè)體周圍進(jìn)行搜索,采用一對一優(yōu)勝劣汰的競爭方式選擇并保留較優(yōu)個(gè)體;然后跟隨蜂搜索,利用輪盤賭的選擇策略選擇較優(yōu)個(gè)體,并在其周圍進(jìn)行貪婪搜索產(chǎn)生另一半個(gè)體;最后偵查蜂搜索,如某個(gè)食物源被放棄,則產(chǎn)生偵查蜂,尋找新的食物源。
ABC算法在求解最優(yōu)問題時(shí),食物源的位置代表優(yōu)化問題的可能解,每個(gè)食物源的花蜜量代表每個(gè)解得的適應(yīng)度值。一個(gè)非線性函數(shù)最小值問題可表示為min f(X),XL≤X≤XU,其中XL和XU分別是變量X取值的上界和下界,X=(x1,x2,x3,…,xn),n為變量的維數(shù)。利用ABC求解該最優(yōu)問題的具體過程如下。
2.1.1 種群初始化
在取值范圍內(nèi)按公式隨機(jī)產(chǎn)生一個(gè)包含N個(gè)個(gè)體的初始種群。其中X0i表示初始種群中的第i個(gè)個(gè)體,其維數(shù)n為優(yōu)化參數(shù)的個(gè)數(shù);rand()表示在區(qū)間[0,1]上產(chǎn)生的隨機(jī)數(shù)。
對初始種群的一半計(jì)算適應(yīng)度值及可行解的質(zhì)量,記錄目前質(zhì)量最好的解。
2.1.2 引領(lǐng)蜂階段
引領(lǐng)蜂的數(shù)量等于食物源N的一半,即N/2,表示初始種群中適應(yīng)度值較優(yōu)的一半個(gè)體,與食物源的位置相對應(yīng)。引領(lǐng)蜂隨機(jī)選取食物源進(jìn)行交叉搜索,按公式
對食物源進(jìn)行更新,即產(chǎn)生一個(gè)新解。其中k∈{1,2,…,N/2},j∈{1,2,…,n},且k≠i,φij為[-1,1]之間的隨機(jī)數(shù)。在計(jì)算新解的適應(yīng)度值時(shí),如果新解的適應(yīng)度優(yōu)于舊解,則用新解代替舊解,反之,保留舊解。
2.1.3 跟隨蜂階段
跟隨蜂的數(shù)量跟引領(lǐng)蜂的數(shù)量相等,也是N/2。跟隨蜂根據(jù)引領(lǐng)蜂搜索的信息,按照與適應(yīng)度相關(guān)的概率選擇食物源的位置,即解得位置,并像引領(lǐng)蜂一樣按式(4)對食物源進(jìn)行更新,若新解的適應(yīng)度值優(yōu)于舊解,用新解替代舊解;反之保留舊解。跟隨蜂選擇食物源的概率
其中fi為第i個(gè)解的適應(yīng)度值。
2.1.4 偵查蜂階段
經(jīng)過引領(lǐng)蜂與跟隨蜂的搜索后得到與初始種群相同大小的新種群,為避免隨著種群的進(jìn)化出現(xiàn)種群多樣性喪失過多的問題,人工蜂群算法模擬偵查蜂搜索潛在蜜源的生理行為,提出了一種特有的搜索方式-偵查蜂搜索。如果某個(gè)體(解)連續(xù)很多代沒有變化,與之對應(yīng)的個(gè)體變異成偵查蜂,則按式(3)搜索產(chǎn)生新個(gè)體,計(jì)算新個(gè)體的適應(yīng)度值并與原個(gè)體比較,依然采用優(yōu)勝劣汰的競爭機(jī)制擇優(yōu)并保留個(gè)體。
經(jīng)過引領(lǐng)蜂、跟隨蜂和偵查蜂3個(gè)階段的搜索后,整個(gè)種群進(jìn)化到下一代,這個(gè)過程反復(fù)循環(huán)直至達(dá)到最大迭代次數(shù)或最終誤差達(dá)到預(yù)定的范圍內(nèi),結(jié)束算法。
人工蜂群算法原理簡單、參數(shù)少、容易實(shí)現(xiàn),并且已被證明是一種優(yōu)秀的全局優(yōu)化算法,但仍存在不足,如易早熟收斂,進(jìn)化后期尋優(yōu)速度慢等。為了克服這些不足,筆者對人工蜂群算法做了一些改進(jìn)。
2.2 混沌人工蜂群算法(CABC:Chaotic Artificial Bee Colony)
2.2.1 混沌初始化
混沌看似混亂卻有精致的內(nèi)在結(jié)構(gòu),是非線性系統(tǒng)中特有并普遍存在的一種現(xiàn)象。隨機(jī)性、遍歷性和規(guī)律性是混沌最典型的特點(diǎn),使其能按照自身的某一“規(guī)律”不重復(fù)地遍歷給定范圍內(nèi)的所有狀態(tài)。將混沌思想引入到人工蜂群算法中,可在一定程度上防止算法陷入局部最優(yōu)并加快進(jìn)化速度。筆者采用Logistic混沌映射初始化種群。Logistic混沌映射的方程如下
其中yt∈(0,1);l是混沌序列的迭代次數(shù);μ是混沌序列的控制參數(shù),取值范圍為[3.75,4]。
具體過程如下:
1)設(shè)置混沌序列的迭代次數(shù)l=100,控制參數(shù)μ=4、i=1;
2)隨機(jī)產(chǎn)生混沌序列的初始向量y0=(y01,y02,…,y0D),其中D為優(yōu)化問題的維數(shù),y0中不能包含0.25、0.5和0.75這3個(gè)數(shù)值。
3)根據(jù)混沌方程循環(huán)迭代,產(chǎn)生混沌向量yl=(yl1,yl2,…,ylD);
5)計(jì)算i=i+1,如果i大于種群個(gè)數(shù)N,則結(jié)束,否則返回2)繼續(xù)循環(huán)。
經(jīng)過以上步驟就可產(chǎn)生N個(gè)初始種群。
2.2.2 錦標(biāo)賽選擇策略
傳統(tǒng)的ABC算法中跟隨蜂所采用的選擇策略稱之為按比例的適應(yīng)度選擇策略(Proportional Fitness Selection)。使用該選擇策略,在運(yùn)行早期可以很順利地選擇出具有較優(yōu)適應(yīng)度值的個(gè)體,淘汰適應(yīng)度較差的個(gè)體;但當(dāng)種群進(jìn)化到一定程度后個(gè)體的適應(yīng)度值越來越相近,導(dǎo)致個(gè)體被選擇的概率也越來越相近,從而導(dǎo)致很難選擇出優(yōu)秀個(gè)體,使搜索過程停滯。因此,這種比例選擇策略容易使種群過分喪失多樣性,從而導(dǎo)致算法陷入早熟。為了避免早熟現(xiàn)象,提高ABC算法的全局收斂性和搜索效率,筆者采用了錦標(biāo)賽選擇策略。
錦標(biāo)賽是基于局部競爭機(jī)制的選擇過程,基本思想是在整個(gè)群體中隨機(jī)選擇k個(gè)個(gè)體進(jìn)行比較,選擇適應(yīng)值較優(yōu)的個(gè)體,這里的參數(shù)k稱為競賽規(guī)模,默認(rèn)取2。在ABC算法中,將第t代某個(gè)個(gè)體的適應(yīng)度值與其他所有個(gè)體兩兩進(jìn)行比較,對適應(yīng)度值較優(yōu)的個(gè)體授予1分,對每個(gè)個(gè)體重復(fù)這一過程,個(gè)體得分越高表示個(gè)體越優(yōu)秀,被選擇的概率越大。這種方式根據(jù)種群個(gè)體間適應(yīng)度值的關(guān)系進(jìn)行選擇,與個(gè)體的適應(yīng)度值無關(guān),因此,對適應(yīng)值的正負(fù)沒有要求,從而提高優(yōu)秀個(gè)體被選擇的概率,在一定程度上避免了比例選擇策略可能出現(xiàn)的過早收斂和停滯現(xiàn)象。
2.3 實(shí)驗(yàn)仿真與結(jié)果分析
為驗(yàn)證CABC的有效性,采用函數(shù)優(yōu)化領(lǐng)域常用的4個(gè)標(biāo)準(zhǔn)測試函數(shù)進(jìn)行測試。ABC算法的控制參數(shù)設(shè)置如下:種群個(gè)數(shù)(食物源數(shù)量)N設(shè)為20,最大迭代次數(shù)Imax設(shè)為2 000,個(gè)體最大更新次數(shù)Lmax設(shè)為100,表1描述了測試函數(shù)的函數(shù)形式、定義域以及最優(yōu)值。圖1~圖4分別給出了對4個(gè)函數(shù)的測試結(jié)果。
表1 標(biāo)準(zhǔn)測試函數(shù)描述Tab.1 Description of the standard test functions
圖1 函數(shù)Sphere的測試結(jié)果Fig.1 Test results of Sphere test function
圖2 函數(shù)Rosenbrock的測試結(jié)果Fig.2 Test results of Rosenbrock test function
圖3 函數(shù)Griewank的測試結(jié)果Fig.3 Test results of Griewank test function
圖4 函數(shù)Ackley的測試結(jié)果Fig.4 Test results of Ackley test function
從圖1和圖4可以看出,CABC算法的收斂性優(yōu)于ABC算法,在函數(shù)Sphere的測試中,ABC算法在迭代次數(shù)達(dá)到800時(shí)基本收斂,CABC算法在迭代次數(shù)達(dá)到400時(shí)基本收斂;在函數(shù)Ackley的測試中,ABC算法在迭代次數(shù)達(dá)到1 600時(shí)基本收斂,CABC算法在迭代次數(shù)達(dá)到1 300時(shí)基本收斂,而且從整個(gè)曲線的走勢看,CABC算法的曲線比較光滑,同時(shí)驗(yàn)證了CABC算法能克服局部最優(yōu)解。從圖2和圖3中對函數(shù)Rosenbrock和Griewank的尋優(yōu)結(jié)果可以看出,CABC算法的尋優(yōu)誤差明顯比ABC算法小,驗(yàn)證了CABC算法具有更高的尋優(yōu)精度。
3.1 CABC算法優(yōu)化支持向量機(jī)的算法流程
1)算法初始化。設(shè)定最大迭代次數(shù)Imax、種群個(gè)數(shù)N、維數(shù)D(由于需要優(yōu)化的參數(shù)有兩個(gè),所以D=2)、個(gè)體最大更新次數(shù)Lmax、懲罰因子C和核函數(shù)參數(shù)σ的最大值分別為(Cmax,σmax),其最小值分別為(Cmin,σmin)。
利用式(7)產(chǎn)生混沌初始種群(即懲罰因子C和核函數(shù)參數(shù)σ的初值),將懲罰因子C和核函數(shù)參數(shù)σ的初值寫入SVM模型,并對訓(xùn)練樣本進(jìn)行訓(xùn)練分類,準(zhǔn)確率即為ABC的適應(yīng)度值,記錄最好的適應(yīng)度值和對應(yīng)的參數(shù)值。
2)引領(lǐng)蜂按式(4)搜索更新,計(jì)算適應(yīng)度值,即SVM對訓(xùn)練樣本的分類準(zhǔn)確率,若新食物源的適應(yīng)度值優(yōu)于搜索前,則代替先前的食物源。
3)跟隨蜂根據(jù)錦標(biāo)賽選擇策略選擇食物源,并按式(4)在食物源附近搜索新的食物源。計(jì)算新食物源的適應(yīng)度值,若新食物源的適應(yīng)度值優(yōu)于搜索前,則代替先前的食物源。
4)判斷是否存在需要放棄的食物源。如果某個(gè)食物源經(jīng)Lmax次循環(huán)后沒有改變,則放棄該食物源,同時(shí)對應(yīng)的引領(lǐng)蜂變異為偵查蜂,按式(7)產(chǎn)生新的食物源。
5)迭代次數(shù)I=I+1,若I達(dá)到最大迭代次數(shù)Imax或分類準(zhǔn)確率達(dá)到設(shè)定精度,則結(jié)束算法,輸出最優(yōu)值;否則返回步驟2)。
3.2 仿真實(shí)驗(yàn)
為了驗(yàn)證筆者算法的有效性和優(yōu)越性,采用UCI(University of California,Irvine)數(shù)據(jù)庫(http://archi ve.ics.uci.edu/m l/)中的3個(gè)具有代表性的數(shù)據(jù)集Heart、Iris和Wine進(jìn)行訓(xùn)練和分類實(shí)驗(yàn),數(shù)據(jù)集詳細(xì)信息如表2所示。ABC算法的控制參數(shù)設(shè)置如下:食物源數(shù)量N設(shè)為20,最大迭代次數(shù)Imax設(shè)為1 000,個(gè)體最大更新次數(shù)Lmax設(shè)為50,懲罰因子的搜索范圍設(shè)為[0.1,100],核函數(shù)參數(shù)的搜索范圍設(shè)為[0.01,1 000]。
將傳統(tǒng)SVM、ABC-SVM和CABC-SVM的分類正確率進(jìn)行比較,比較結(jié)果如表3所示。由實(shí)驗(yàn)結(jié)果可以看出,ABC算法能兼顧全局最優(yōu)解和局部最優(yōu)解的搜索,對SVM進(jìn)行參數(shù)優(yōu)化后,可得到更高的分類正確率,而CABC算法能進(jìn)一步提高支持向量機(jī)的分類準(zhǔn)確率。
3種算法進(jìn)行3次試驗(yàn)后得到的平均運(yùn)行時(shí)間如表4所示。從表4中的數(shù)據(jù)可看出,對支持向量機(jī)進(jìn)行參數(shù)優(yōu)化,由于算法的復(fù)雜性增加從而使運(yùn)行時(shí)間增加,但是CABC優(yōu)化的SVM在一定程度上縮短了運(yùn)行時(shí)間,與傳統(tǒng)ABC優(yōu)化的SVM比較表現(xiàn)出更好的收斂性,有效地降低了搜索運(yùn)行時(shí)間。
表2 測試數(shù)據(jù)集信息Tab.2 Instruction of UCIdatasets
表3 3種算法的分類測試結(jié)果Tab.3 The classification test results of three algorithm
表4 3種算法的運(yùn)行時(shí)間對比Tab.4 Running time comparison of three algorithms
4.1 實(shí)驗(yàn)數(shù)據(jù)采集
該課題使用實(shí)驗(yàn)室的旋轉(zhuǎn)機(jī)械振動(dòng)及故障模擬實(shí)驗(yàn)平臺(tái)QPZZ-Ⅱ進(jìn)行齒輪振動(dòng)信號(hào)采集。采用材質(zhì)為S45C的齒輪進(jìn)行實(shí)驗(yàn)測量,其大齒輪模數(shù)為2,齒數(shù)為75;小齒輪模數(shù)為2,齒數(shù)為55。采用加速度傳感器采集正常、斷齒、裂痕、磨損4種狀態(tài)下的齒輪振動(dòng)數(shù)據(jù),采樣率為10 Hz;齒輪轉(zhuǎn)速為1 200 r/min。提取每種狀態(tài)下原始樣本各60組,每組樣本采樣點(diǎn)數(shù)為8 192。
4.2 齒輪振動(dòng)信號(hào)的特征提取
小波變換是20世紀(jì)80年代中期發(fā)展起來的一種多尺度信號(hào)分析方法,它將信號(hào)分解到不同尺度的空間進(jìn)行分析處理,然后再根據(jù)需要進(jìn)行信號(hào)重構(gòu),具有較好的時(shí)頻局部化特性,因此非常適合對齒輪故障信號(hào)非線性、非平穩(wěn)的復(fù)雜信號(hào)進(jìn)行分析與特征提取。
筆者采用信號(hào)各頻段的相對小波能量作為故障信號(hào)的特征進(jìn)行提取,具體過程如下。
將離散時(shí)間信號(hào)f(t)進(jìn)行J層離散小波變換分解,得到低頻近似分量系數(shù)AJ和高頻細(xì)節(jié)系數(shù)Dj,j=1,2,…,J,總的小波能量表達(dá)式為
簡化公式,將AJ表示為DJ+1,則式(8)表示為
相對小波能量表示為
表5中為4種狀態(tài)下齒輪振動(dòng)信號(hào)不同頻段上的相對小波能量。
表5 4種狀態(tài)下齒輪振動(dòng)信號(hào)不同頻段上的相對小波能量Tab.5 The relative wavelet energy on different frequency bands of gear vibration signal in four state
4.3 齒輪故障診斷對比實(shí)驗(yàn)
為驗(yàn)證筆者算法的實(shí)際應(yīng)用價(jià)值,將每種狀態(tài)下的20組原始樣本作為訓(xùn)練樣本,另外的40組作為測試樣本。按照4.2節(jié)的方法對訓(xùn)練樣本進(jìn)行特征提取構(gòu)成特征向量,并將特征向量進(jìn)行歸一化處理輸入支持向量機(jī)進(jìn)行訓(xùn)練。利用CABC算法對支持向量機(jī)的懲罰因子C和核函數(shù)參數(shù)σ進(jìn)行優(yōu)化,用訓(xùn)練好的支持向量機(jī)對測試樣本進(jìn)行分類測試。傳統(tǒng)SVM、ABC-SVM和CABC-SVM3種算法的分類結(jié)果如表6~表8所示。由表6可知,傳統(tǒng)SVM的分類正確率為98.1%,齒輪斷齒狀態(tài)的40個(gè)測試樣本中有1個(gè)樣本分類錯(cuò)誤、齒輪裂痕狀態(tài)的40個(gè)測試樣本中有2個(gè)樣本分類錯(cuò)誤;由表7可知,ABC-SVM的分類正確率為98.8%,齒輪斷齒和裂痕狀態(tài)的40個(gè)測試樣本中各有1個(gè)樣本分類錯(cuò)誤;由表8可知,CABC-SVM的分類正確率為99.4%,只有齒輪裂痕狀態(tài)的40個(gè)測試樣本中有1個(gè)樣本分類錯(cuò)誤。實(shí)驗(yàn)結(jié)果證明,基于CABC算法優(yōu)化的支持向量機(jī)能準(zhǔn)確地診斷旋轉(zhuǎn)機(jī)械的齒輪故障,識(shí)別率更高,可靠性更好。
表6 傳統(tǒng)SVM算法分類測試結(jié)果Tab.6 Classification test results of the traditional SVM algorithm
表7 ABC-SVM算法分類測試結(jié)果Tab.7 Classification test results of ABC-SVM algorithm
表8 CABC-SVM算法分類測試結(jié)果Tab.8 Classification test results of CABC-SVM algorithm
針對齒輪故障數(shù)據(jù)難以大量獲取的實(shí)際問題,筆者采用支持向量機(jī)對齒輪故障進(jìn)行診斷,由于支持向量機(jī)的模型參數(shù)選擇對其分類性能影響巨大,提出了基于混沌人工蜂群算法的支持向量機(jī)參數(shù)優(yōu)化方法。通過對UCI標(biāo)準(zhǔn)數(shù)據(jù)集的分類實(shí)驗(yàn)證明,混沌人工蜂群算法在一定程度上克服早熟收斂和尋優(yōu)速度較慢的問題,其優(yōu)化后的支持向量機(jī)(CABC-SVM)能獲得更高的分類正確率和更快的搜索速度。將該方法應(yīng)用于實(shí)測齒輪數(shù)據(jù),采用小波相對能量作為齒輪信號(hào)特征,與SVM和ABC-SVM的分類結(jié)果相比,CABC-SVM具有更高的分類正確率,證明該方法具有重要的工程應(yīng)用價(jià)值。
[1]李佳,禮賓,王夢卿.基于神經(jīng)網(wǎng)絡(luò)的齒輪故障診斷專家系統(tǒng)[J].機(jī)械傳動(dòng),2007,31(5):81-83. LI Jia,LI Bin,WANG Mengqing.Expert System of Gear's Fault Diagnosis Based on Neural Network[J].Mechanical Transmission,2007,31(5):81-83.
[2]成鈺龍,程剛.基于特征信息融合的離散小波SVM齒輪故障診斷方法研究[J].組合機(jī)床與自動(dòng)化加工技術(shù),2012(8):70-73. CHENG Yulong,CHENG Gang.Based on the Characteristics of the Information Fusion of Discrete Wavelet SVM Gear Fault Diagnosis Method Research[J].Combination Machine Tools and Automatic Processing Technology,2012(8):70-73.
[3]VAPNIK V N.Statistical Learing Theory[M].Berlin:Springer-Verlag,1988:123-167.
[4]SHAO Jun,LIU Junhua,QIAO Xueguang,etal.Temperature Compensation of FBG Sensor Based on Support Vector Machine[J].Journal of Optoelectronics Laser,2010,21(6):803-807.
[5]KARABOGA D.An Idea Based on Honey Bee Swarm for Numerical Optimization[R].Kayseri:Erciyes University,2005.
[6]KARABOGA D,BASTURK B.A Powerful and Efficient Algorithm for Numerical Function Optimization:Artificial Bee Colony (ABC)Algorithm[J].Journal of Global Optimization,2007,39(3):459-471.
[7]KARABOGA D,BASTURK B.A Comparative Study of Artificial Bee Colony Algorithm[J].Applied Mathematics and Computation,2009,214(1):108-132.
[8]王霞,王占岐,金貴,等.基于核函數(shù)支持向量回歸機(jī)的耕地面積預(yù)測[J].農(nóng)業(yè)工程學(xué)報(bào),2014,3(4):204-211. WANG Xia,WANG Zhanqi,JIN Gui,etal.Land Reserve Prediction Using Different Kernel Based Support Vector Regression[J].Transactions of the Chinese Society of Agricultural Engineering,2014,3(4):204-211.
[9]宋暉,薛云,張良均.基于SVM分類問題的核函數(shù)選擇仿真研究[J].計(jì)算機(jī)與現(xiàn)代化,2011(8):133-136. SONG Hui,XUE Yun,ZHANG Liangjun.Research on Kernel Function Selection Simulation Based on SVM Classification[J].Computer and Modernization,2011(8):133-136.
[10]聶盼盼,臧洌,劉雷雷.基于對支持向量機(jī)的多類分類算法在入侵檢測中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2013,33(2): 426-429.NIE Panpan,ZANG Li,LIU Leilei.Application ofMulti-Class Classification Algorithm Based on Twin Support Vector Machine in Intrusion Detection[J].Journal of Computer Applications,2013,33(2):426-429.
[11]段江濤,李凌均,張周鎖,等.基于支持向量機(jī)的機(jī)械系統(tǒng)多故障分類方法 [J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2004,35(4):144-147. DUAN Jiangtao,LI Lingjun,ZHANG Zhousuo,et al.Application of Support Vector Machine in Multi-Fault Classification of Mechanical System[J].Transactions of the Chinese Society for Agricultural Machinery,2004,35(4):144-147.
(責(zé)任編輯:何桂華)
SVM Optimization Based on Chaotic Artificial Colony Algorithm Gear Fault Diagnosis
LIU Xia1,ZHANG Shanshan1,HU Mingjian2
(1.Electrical Information Engineering Institute,Northeast Petroleum University,Daqing 163318,China; 2.Instrument and Signal Institute,Xinjiang Design Institute,China Petroleum Engineering(Company Limited),Karamay 834000,China)
In order to overcome the adverse effects on the performance of classification of SVM(Support Vector Machine)model parameters in the random selection,based on chaotic CABC-SVM(Artificial Bee Colony Algorithm of Support Vector Machine)parameters optimization method is proposed.CABC algorithm uses the Logistic chaoticmapping initialization population and tournament selection strategy,further improves the artificial bee colony algorithm convergence speed and optimization precision,the classification accuracy as the fitness function when using the algorithm of penalty factor and kernel function parameters of SVM was optimized.UCI standard data sets experiments show that CABC algorithm has strong local and global search ability,the optimization of SVM can largely overcome local extremum points to obtain a higher classification accuracy,and can effectively shorten the search time.The method was applied to actual gear fault diagnosis,energy wavelet was used as the feature input SVM,classification accuracy rate reached 99.4%,verified the feasibility and effectiveness of the improved method in this paper.
support vector machine(SVM);chaotic artificial bee colony(CABC)algorithm;parameter optimization;gear fault diagnosis
TP311
A
1671-5896(2015)04-0476-09
2015-01-30
黑龍江省自然科學(xué)基金資助項(xiàng)目(F201404)
劉霞(1970— ),女,黑龍江大慶人,東北石油大學(xué)教授,碩士生導(dǎo)師,主要從事信號(hào)處理研究,(Tel)86-15845989728 (E-mail)liuxia2k@163.com。