高朋飛, 許同樂,侯蒙蒙,郎學(xué)政,李磊
(1.山東理工大學(xué) 機(jī)械工程學(xué)院,山東 淄博 255049;2.山東信遠(yuǎn)集團(tuán)有限公司,山東 萊陽 265200)
故障軸承的振動信號包含了故障特征信息,而且便于采集,因此振動信號分析成為故障診斷的有效手段之一[1-3]。小波分析不僅能對振動信號進(jìn)行降噪處理,還能對信號進(jìn)行進(jìn)一步分解,提取不同頻段的故障特征,在信號處理領(lǐng)域得到了廣泛應(yīng)用。支持向量機(jī)(Support Vector Machine,SVM)是一種基于統(tǒng)計學(xué)理論的模式識別方法,其克服了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)選擇困難、容易陷入局部極小值等問題,并能很好地解決小樣本學(xué)習(xí)問題,已應(yīng)用于許多領(lǐng)域[4-7]。
在此,提出了一種基于小波分析的SVM滾動軸承故障診斷方法,通過小波分析提取軸承的尺度能量譜,建立故障特征向量集,然后將其作為SVM的訓(xùn)練樣本,并用改進(jìn)的SVM核函數(shù)進(jìn)行訓(xùn)練,獲得故障分類模型,最后用該分類模型對未知故障信號進(jìn)行預(yù)測分類。
采用小波閾值方法進(jìn)行降噪,對降噪后的信號進(jìn)行小波變換,可以得到信號的故障特征。設(shè)f(t)為有限能量函數(shù),即f(t)∈L2(R),則該函數(shù)的小波變換定義為
(1)
根據(jù)能量守恒可得
(2)
式中:Cψ為小波的容許條件;ω為頻率。
則f(t)在尺度a上的能量為
(3)
E(a)稱為尺度-小波能量譜,它反映了信號能量隨尺度的變化情況。
為了更好的分析和表征信號的能量特征,采用各個頻段能量在總能量Esum中所占的比例A(i)作為故障特征向量。選取所需要的頻率段信號,提取其尺度-小波能量譜并計算該能量大小,記為Ei,則
(4)
支持向量機(jī)方法建立在統(tǒng)計學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小原理基礎(chǔ)上,它根據(jù)有限的樣本信息在模型的復(fù)雜性與學(xué)習(xí)能力之間尋求最佳折中,使結(jié)構(gòu)風(fēng)險最小,即同時最小化經(jīng)驗(yàn)風(fēng)險和VC維的界,以獲得最好的泛化能力[7-9]。
以二分類為例,給定訓(xùn)練數(shù)據(jù)樣本集:(xi,yi),i=1,2,…,n;x∈Rd,y∈{+1,-1}。其中n為訓(xùn)練樣本數(shù),d為每個訓(xùn)練樣本向量的維數(shù),y為分類標(biāo)號。如果該樣本能被一個超平面線性分開,則該分類超平面的方程為wx+b=0,其中w為權(quán)系數(shù)向量,b為分類閾值。需要找到最優(yōu)超平面,使訓(xùn)練集中的所有樣本均能被該超平面正確分開,而且支持向量與超平面之間的距離最大[9]。
在線性可分的情況下,求最優(yōu)分類面可轉(zhuǎn)化為在滿足yi(wxi+b)≥1的條件下求w2/2的最小值問題。此問題可以通過求解Lagrange函數(shù)得到解決,進(jìn)而得到最優(yōu)分類函數(shù)為
(5)
式中:αi為Lagrange乘子。根據(jù)f(x)的值就可以判斷x所屬的分類。
對于非線性分類,可以使用一個非線性映射Φ把數(shù)據(jù)樣本從原空間Rd映射到一個高維特征空間Ω,再在Ω中求最優(yōu)分類面。根據(jù)泛函有關(guān)理論,只要一種核函數(shù)K(xi,xj)滿足Mercy條件,它就可以對應(yīng)某一變換空間的內(nèi)積,這樣在高維空間實(shí)際上只需進(jìn)行內(nèi)積運(yùn)算,而這種內(nèi)積運(yùn)算是可以用原空間中的函數(shù)實(shí)現(xiàn)的,無需知道變換Φ(x)的具體形式。此時,最優(yōu)分類面的形式為
(6)
在機(jī)械設(shè)備故障診斷中,簡單的二分類顯然不能滿足工程實(shí)際要求,因此需要支持向量機(jī)的多分類模型,可以分別用多個二分類器進(jìn)行訓(xùn)練,得到多分類模型。
一個好的核函數(shù)不僅能夠解決樣本低維線性不可分的問題,還能在一定程度上優(yōu)化SVM訓(xùn)練算法,縮短樣本訓(xùn)練時間。因此,選擇合適的核函數(shù)是建立最優(yōu)SVM模型的關(guān)鍵,直接影響模型的訓(xùn)練精度、訓(xùn)練速率和泛化能力[10]。目前,如何選取核函數(shù)還缺乏統(tǒng)一的理論指導(dǎo),比較常用的核函數(shù)有4種:
(1)線性核函數(shù),K(x,y)=xy,就是線性支持向量機(jī)采用的核函數(shù)。其僅適用于簡單的線性分類問題,無法解決大多數(shù)復(fù)雜的非線性分類問題。
(2)多項(xiàng)式核函數(shù),K(x,y)=(xy+1)d,其中d=1,2,3…,為多項(xiàng)式的階數(shù)。在特征空間維數(shù)很高時,該核函數(shù)的d值很大,將使計算量大大增加。
(3)Sigmoid核函數(shù),K(x,y)=tanh[v(xy)+c],其中v,c分別為比例、偏移參數(shù)。其必須在某些特定條件下才滿足對稱、半正定的核函數(shù)條件,在應(yīng)用上受到一定的限制。
(4)徑向基核函數(shù),K(x,y)=exp{-x-y2/2σ2},其中σ為函數(shù)的寬度參數(shù)。徑向基核函數(shù)最為常用,但σ的不同取值直接影響向量機(jī)的支持向量個數(shù)和訓(xùn)練得到的超球面的形狀,容易產(chǎn)生超球面空間不穩(wěn)定和泛化能力降低等問題,而且對于不同的訓(xùn)練樣本,問題的出現(xiàn)形式也不同,其應(yīng)用也存在一定的局限性。
為此,提出一種新的核函數(shù)
z=max‖x-y‖。
(7)
新核函數(shù)滿足Mercy條件且結(jié)構(gòu)形式簡單,當(dāng)訓(xùn)練樣本維數(shù)較多時,計算量也較小。而且核參數(shù)z不需賦值,而是取決于數(shù)據(jù)樣本,可以根據(jù)樣本輸入自動調(diào)整,實(shí)現(xiàn)自適應(yīng)訓(xùn)練,解決了徑向基核函數(shù)中σ的選擇問題,適用于大部分復(fù)雜非線性分類問題。
為驗(yàn)證新核函數(shù)的優(yōu)越性,對不同核函數(shù)的SVM模型進(jìn)行了仿真分析。由仿真結(jié)果可知,與其他核函數(shù)相比,新核函數(shù)顯著提高了訓(xùn)練精度,預(yù)測分類準(zhǔn)確率也較高,說明該模型有較好的學(xué)習(xí)能力和泛化能力。
小波尺度-能量譜SVM故障診斷的原理圖如圖1所示,首先,對獲得的故障振動信號進(jìn)行預(yù)處理,應(yīng)用小波分析進(jìn)行降噪,對降噪后的信號進(jìn)行小波分解與重構(gòu),提取故障信號的小波-尺度能量譜,并建立故障特征向量集;然后,以此特征向量集作為SVM訓(xùn)練的輸入樣本,應(yīng)用提出的新SVM核函數(shù)對故障特征進(jìn)行訓(xùn)練,通過調(diào)節(jié)參數(shù)使準(zhǔn)確率符合要求,繼而建立SVM故障診斷模型;最后,將未知樣本數(shù)據(jù)輸入診斷模型,再進(jìn)行預(yù)測分類并輸出相應(yīng)的診斷結(jié)果,從而實(shí)現(xiàn)滾動軸承的故障診斷。
圖1 小波尺度能量譜SVM故障診斷原理
試驗(yàn)軸承型號為6004zz,內(nèi)徑為20 mm,外徑為42 mm,寬度為12 mm,鋼球個數(shù)為9,鋼球直徑為6.35 mm。外圈固定,內(nèi)圈旋轉(zhuǎn)。故障模式為單一故障,其中內(nèi)圈與外圈故障為裂紋,分布在溝道處,長約1 mm;鋼球故障是在其表面切掉了一小部分,不影響正常滾動。
在試驗(yàn)臺軸承基座的水平方向和垂直方向上布置2個振動測試點(diǎn),加速度傳感器安裝在電動機(jī)驅(qū)動端,測量軸承振動加速度信號。為獲取軸承故障的相關(guān)數(shù)據(jù),試驗(yàn)臺上分別進(jìn)行了正常及3種典型故障的模擬試驗(yàn)。試驗(yàn)數(shù)據(jù)均進(jìn)行多次采集,試驗(yàn)采樣頻率為12 kHz,軸承轉(zhuǎn)速為1 750 r/min。
軸承振動信號的時域圖如圖2所示,可以看出,故障信息非常不明顯,基本上都被噪聲淹沒,無法識別是否存在故障以及故障類型。如果對其直接進(jìn)行頻譜分析,診斷效果不是很好。
圖2 不同故障類型軸承的振動信號
對振動信號進(jìn)行預(yù)處理,應(yīng)用小波閾值方法對振動信號降噪,去除大部分噪聲;然后采用db4小波基對信號做4層小波包分解,得到表征故障特征的尺度能量譜,也就是信號的能量系數(shù)比,如圖3所示。
圖3 不同故障類型軸承的故障特征對比
由圖3可知,不同故障的能量特征譜有明顯的差別。正常軸承的能量大多分布在低頻段,高頻段能量很??;外圈故障軸承由于受到振動沖擊,在高頻段有很高的能量,低頻段也有小部分能量;內(nèi)圈故障軸承的高、低頻段各有一部分能量,但能量分布比較集中;鋼球故障軸承在高頻段能量分布較集中,低頻段能量分布則趨于分散;因此,提取軸承各個頻段的能量,將其進(jìn)行歸一化等處理后作為故障特征向量集,然后應(yīng)用SVM方法可以對故障特征進(jìn)行預(yù)測和分類。
為避免樣本數(shù)據(jù)差距過大對分類預(yù)測的影響,必須對樣本數(shù)據(jù)進(jìn)行歸一化預(yù)處理,將其線性調(diào)整到[-1,+1]區(qū)間。
隨機(jī)選取參數(shù)是利用程序隨機(jī)選取懲罰參數(shù)和核參數(shù),當(dāng)有多組懲罰參數(shù)對應(yīng)于最高分類準(zhǔn)確率時,選取最小的一組作為最佳懲罰參數(shù),因?yàn)檫^高的懲罰參數(shù)會導(dǎo)致過學(xué)習(xí)狀態(tài)的發(fā)生,即訓(xùn)練集分類準(zhǔn)確率很高而測試集分類準(zhǔn)確率很低,也就是說分類器的泛化能力降低。
為了得到比較理想的分類準(zhǔn)確率,采用交叉驗(yàn)證(Cross Validation,CV)的方法對懲罰參數(shù)和核函數(shù)參數(shù)進(jìn)行尋優(yōu),選取準(zhǔn)確率最高的一組作為模型的參數(shù)。交叉驗(yàn)證即將原始數(shù)據(jù)分為訓(xùn)練集和驗(yàn)證集2組數(shù)據(jù),依次使用訓(xùn)練集和驗(yàn)證集對分類器進(jìn)行訓(xùn)練和驗(yàn)證,以分類準(zhǔn)確率作為分類器的性能指標(biāo)。
從軸承故障信號中選取320組數(shù)據(jù)。其中160組數(shù)據(jù)(每種故障類型選取40組)作為故障的訓(xùn)練樣本,剩余160組數(shù)據(jù)作為測試樣本。為驗(yàn)證新核函數(shù)分類模型的學(xué)習(xí)能力和泛化能力,分別應(yīng)用新核函數(shù)和徑向基核函數(shù)進(jìn)行訓(xùn)練,然后再用測試樣本進(jìn)行檢驗(yàn)。結(jié)果見表1。
表1 不同核函數(shù)SVM診斷模型的分類準(zhǔn)確率
從表1可知,對于徑向基核函數(shù)SVM模型,未經(jīng)優(yōu)化訓(xùn)練的分類模型由于發(fā)生了過學(xué)習(xí)和欠學(xué)習(xí),預(yù)測準(zhǔn)確率不高,為80%左右;而采用CV進(jìn)行參數(shù)優(yōu)化后,準(zhǔn)確率稍有提高,但仍不足以用于模式識別與故障診斷。
而新核函數(shù)在樣本維數(shù)較多時,有很好的空間穩(wěn)定性。表中未優(yōu)化參數(shù)時,準(zhǔn)確率同樣不高;而優(yōu)化后的參數(shù)訓(xùn)練模型的分類準(zhǔn)確率有顯著提高,160個樣本中僅有11個樣本被誤識別。由此可見,新核函數(shù)訓(xùn)練得到的模型不僅有很好的學(xué)習(xí)能力,也具有較好的容錯能力和泛化能力,在故障分類方面比徑向基核函數(shù)更優(yōu)越。
利用提出的新SVM核函數(shù)進(jìn)行訓(xùn)練,并采用交叉驗(yàn)證的方法對訓(xùn)練參數(shù)進(jìn)行尋優(yōu),有效的克服了過學(xué)習(xí)和欠學(xué)習(xí)的發(fā)生,并獲得了更高的準(zhǔn)確率,更好的學(xué)習(xí)能力和泛化能力,能夠有效的對軸承故障進(jìn)行分類。但是對于工業(yè)環(huán)境中的故障軸承而言,故障振動信號本身具有復(fù)雜性,該方法能否準(zhǔn)確診斷還需作進(jìn)一步研究。