鄭近德, 代俊習(xí), 朱小龍, 潘海洋, 潘紫微
(安徽工業(yè)大學(xué)機械工程學(xué)院 馬鞍山,243032)
由于制造誤差和裝配不當(dāng)?shù)仍颍瑵L動軸承在運轉(zhuǎn)過程中必然會產(chǎn)生振動[1]。當(dāng)軸承出現(xiàn)局部故障時,振動信號隨之會表現(xiàn)出非線性、非平穩(wěn)特性。直接從這些信號中提取故障特征將變得尤為困難。隨著非線性科學(xué)理論的發(fā)展,很多非線性理論和方法,如小波分析、分形維數(shù)、近似熵等已被廣泛應(yīng)用于故障診斷領(lǐng)域[2-7],并取得了不錯的效果。如文獻[6]將經(jīng)驗?zāi)B(tài)分解(empincal mode decomposition,簡稱EMD)分解的IMF分量與灰色關(guān)聯(lián)模型結(jié)合建立IMF的能量分布,從而實現(xiàn)故障類型的診斷;文獻[7]將分形維數(shù)與近似熵用于度量信號的復(fù)雜性,結(jié)果表明近似熵具有一定抗噪和抗野點的能力。針對近似熵存在自匹配的缺陷,Richman等[8]提出了樣本熵的概念,樣本熵作為常用的一種特征提取方法,具有抗噪能力強、所需時間序列短等優(yōu)點,但是該方法只能從單一尺度描述故障特征狀態(tài)。Costa等[9-10]在樣本熵的基礎(chǔ)上提出了多尺度熵(multi-scale entropy,MSE),用來衡量時間序列在不同尺度上的復(fù)雜性。針對MSE中樣本熵相似性度量易發(fā)生突變,鄭近德等[11]結(jié)合模糊熵的概念,提出了多尺度模糊熵(multiscale fuzzy entropy,簡稱MFE),并將其應(yīng)用于滾動軸承的故障診斷。
MFE是一種有效的衡量時間序列的復(fù)雜性方法,與單一尺度熵值相比,其既能在整體上反映動力學(xué)特征,又能從細節(jié)上揭示其演化特性,包含了更多的模式信息[12]。然而,研究發(fā)現(xiàn),MFE中的多尺度粗?;^程會導(dǎo)致熵值在較大尺度處的波動,產(chǎn)生端點“飛翼”現(xiàn)象[13]。為此,文中采用滑動均值求數(shù)據(jù)點間均值的方式改進粗?;^程。在此基礎(chǔ)上,提出了改進的多尺度模糊熵(improve multi-scale fuzzy entropy,簡稱IMFE)。改進后的多尺度過程綜合考慮了相鄰數(shù)據(jù)點的信息,不僅克服了時間數(shù)列變短的缺陷,而且能夠提取更多的故障特征信息。
最后,筆者將改進多尺度模糊熵與支持向量機結(jié)合,提出了一種新的滾動軸承故障診斷方法,并將其應(yīng)用于試驗數(shù)據(jù)分析。結(jié)果表明,所提方法能有效地利用少量的訓(xùn)練樣本得到較高的故障識別率,是一種有效的故障診斷方法。
多尺度模糊熵的計算步驟[11]如下
1) 設(shè)原始數(shù)據(jù)為{Xi}={X1,X2,…,XN},建立粗?;^程
(1)
其中:N為數(shù)據(jù)長度,τ=1,2,…,為尺度因子。
τ=1時,yj(1)為原數(shù)據(jù){Xi};τ>1時,原數(shù)據(jù)被分割成τ段長度不超過N/τ的粗粒序列{yj(τ)}。
2) 對得到的τ個粗粒序列分別求其模糊熵,并把熵值畫成尺度因子的函數(shù)。模糊熵的定義參考文獻[14-15]。
由式(1)粗?;^程可以發(fā)現(xiàn),尺度因子越大,粗?;蛄虚L度越短,熵值的偏差會隨著粗?;蛄虚L度減小而逐漸增大。不僅如此,以尺度因子τ等于2為例,粗?;绞饺鐖D1所示。當(dāng)尺度因子等于2時,粗?;紤]了X1和X2,X3和X4等之間的信息,而沒有考慮X2和X3、X4和X5等之間的信息,造成了信息的遺漏。為此,文中借鑒滑動均值的思想,提出了改進多尺度模糊熵算法。
圖1 尺度因子等于2時的多尺度化方法Fig.1 Multiscale methods for scale factor equal to 2
IMFE的計算步驟如下
1) 設(shè)原始數(shù)據(jù)為{Xi},建立改進粗粒化過程:
(2)
當(dāng)τ>1時,原始數(shù)據(jù){Xi}被分割成τ段長度為N-τ+1的序列{yj(τ)}。
2) 對得到的τ個改進粗粒序列分別求其模糊熵,并將其畫成尺度因子的函數(shù)。
為了說明IMFE與MFE的區(qū)別,以尺度因子2為例,改進的多尺度算法如圖2所示。
圖2 尺度因子等于2的改進多尺度方法Fig.2 The improved multi-scale method with scale factor equal to 2
由圖2可知,尺度因子等于2時,改進的多尺度化法綜合考慮了2個相鄰數(shù)據(jù)點特征信息,避免了由于粗粒化不足而導(dǎo)致信息的遺漏。
IMFE的計算與數(shù)據(jù)長度N,嵌入維數(shù)m、相似容限r(nóng)以及指數(shù)函數(shù)梯度參數(shù)n有關(guān)。首先,m取值越大就會有越多的詳細信息,但所需數(shù)據(jù)就更長(N=10m~30m),綜合考慮,m=2。其次,相似容限r(nóng)表示模糊函數(shù)邊界的寬度。r選擇過小會統(tǒng)計過多的信息,導(dǎo)致對噪聲敏感;選擇過大會丟失過多統(tǒng)計信息,一般取0.1~0.25RSD(RSD為原始數(shù)據(jù)的標準差),文中取r=0.15RSD。再次,當(dāng)n趨于無窮大時,指數(shù)函數(shù)即變?yōu)閱挝浑A躍函數(shù)。為了盡可能的捕獲有用的細節(jié)信息,文獻[15]建議計算時取較小的整數(shù)值,文中取n=2。最后,數(shù)據(jù)長度對熵值的影響都比較小,文獻[16]表明模糊熵比樣本熵計算所需的數(shù)據(jù)長度更短,綜上考慮,取N=2 048。
首先,以相同長度的高斯白噪聲和1/f噪聲為研究對象。對不同的r=0.05RSD,0.1RSD,0.15RSD,0.2RSD和0.25RSD分別計算二者的MFE和IMFE,結(jié)果如圖3所示,其中m=2,最大尺度因子取20。由圖3可知,首先,相似容限對MFE和IMFE的計算結(jié)果影響較大,r越大,熵值越小,r越小,熵值越大,選擇過大會丟失掉很多統(tǒng)計信息,過小估計出的統(tǒng)計特性的效果不理想。另外,IMFE比MFE熵值曲線光滑,且不同r的IMFE曲線差異較小,說明IMFE對r的依賴更小。綜合考慮,取r=0.15RSD。
圖3 相似容限對熵值的影響Fig.3 The influence of r on entropy values
圖4 時間序列長度對熵值的影響Fig.4 The influence of data length on entropy values
為了說明時間序列長度對IMFE的影響,分別取數(shù)據(jù)長度為1 500,2 000,2 500,3 000和3 500點的高斯白噪聲和1/f噪聲作為研究對象。分別計算二者的MFE和IMFE,結(jié)果如圖4所示,其中m=2,r=0.15RSD,最大尺度因子取20。從圖4中可知,IMFE的變化趨勢隨尺度因子的增大而逐漸光滑遞減,而MFE曲線隨著尺度因子的增大有波動現(xiàn)象,這說明IMFE穩(wěn)定性更好。另外,由圖4(c~d)可知,1/f噪聲的MFE曲線隨著尺度因子的增大穩(wěn)定在一個恒定值附近,但時間序列的長度對熵值的影響較大,而不同長度1/f噪聲的IMFE曲線幾乎重合,且都是隨著尺度因子的增大而逐漸遞減,曲線比較光滑,說明其對時間序列長度的依賴性更小、更穩(wěn)定。因此,上述分析結(jié)果表明,IMFE和MFE都能夠有效地反映時間序列的復(fù)雜性信息,但與MFE相比,IMFE熵值更穩(wěn)定、曲線更光滑,對時間序列的長度和相似容限的依賴性更小。
為了說明IMFE的有效性,采用美國Case Western Reserve University的試驗采集的滾動軸承數(shù)據(jù)對其進行驗證[17]。測試軸承為6205-2RSJEMSKF深溝球軸承,直徑為0.533 4 mm,故障深度為0.279 4 mm,轉(zhuǎn)速為1 797 r/min,采樣頻率為12 kHz,選用內(nèi)圈(inner race,簡稱IR)、外圈(outer race,簡稱OR)、滾動體故障(ball element,簡稱BE)和正常(norm)四種狀態(tài)的振動信號,振動信號時域波形如圖5所示。
現(xiàn)將提出的方法應(yīng)用于上述試驗數(shù)據(jù),具體步驟如下。
1) 正常、內(nèi)圈故障、外圈故障和滾動體故障試驗數(shù)據(jù),每種狀態(tài)取58個樣本,共得到232個樣本,計算所有樣本的IMFE,得到故障特征集T,尺度因子τmax=20;將每一類的特征集的58個樣本隨機分為5個訓(xùn)練樣本特征集T1和53個測試樣本集T2。
圖5 滾動軸承振動信號的時域波形Fig.5 Time domain waveforms of vibration signal of rolling bearings
2) 將訓(xùn)練樣本特征集,輸入到基于SVM建立的多故障分類器進行訓(xùn)練。其中,基于SVM的多故障分類器采用偏二叉樹思想建立,如圖6所示。SVM1中1表示正常,-1表示外圈故障、內(nèi)圈故障和滾動體故障;SVM2中1表示滾動體故障,-1表示內(nèi)圈故障和外圈故障;SVM3中+1表示內(nèi)圈故障,-1表示外圈故障;SVM4中表示是外圈故障,-1表示其他故障。F表示支持向量機最優(yōu)分類函數(shù)。SVM采用LibSVM程序[18]。SVM的核函數(shù)選取高斯徑向基函數(shù),采用粒子群算法[19]對支持向量機懲罰參數(shù)c和核函數(shù)參數(shù)g進行優(yōu)化。
圖6 多故障支持向量機分類示意圖Fig.6 Sketch of multi-fault support vector machine classification
3) 在分類測試中,將測試樣本集T2依次輸入到已訓(xùn)練的SVM1,若判別式F輸出為+1,則確認為正常,測試結(jié)束;否則自動輸入SVM2,直到SVM4。若輸出為+1,則說明測試樣本屬于滾動體故障。隨機選取每類振動信號的5組數(shù)據(jù)作為訓(xùn)練樣本,將剩下的53組數(shù)據(jù)作為測試樣本,由于測試樣本較多,文中只列出了該方法測試樣本診斷結(jié)果,如表1所示。從表1可以看出,筆者提出的滾動軸承故障診斷方法對試驗數(shù)據(jù)的識別率達到100%。
表1 文中方法測試樣本的診斷結(jié)果
不失一般性,在相同條件下,采用MFE提取上述滾動軸承的振動信號的故障特征,并采用上述故障分類器進行識別。對于相同個數(shù)的訓(xùn)練樣本和測試樣本,輸出結(jié)果中,滾動體故障中的6個測試樣本被錯分到內(nèi)圈故障中,故障識別率為97.17%,低于筆者所提方法。
同時,為了研究訓(xùn)練樣本個數(shù)對故障識別率的影響,分別選用5,10,15,20和25個訓(xùn)練樣本進行訓(xùn)練,MFE與IMFE的故障識別率如表2所示。由表2可以看出,無論是用較少還是較多訓(xùn)練樣本,基于IMFE的故障診斷方法都略高于基于MFE故障診斷方法。這說明:與MFE相比,基于IMFE與SVM相結(jié)合故障診斷方法更適合小樣本的滾動軸承故障診斷。
表2不同數(shù)目訓(xùn)練樣本對識別率的影響
Tab.2Theinfluenceofdifferenttrainingsamplesonrecognitionrate
%
為了驗證所提方法的適用性,再將其應(yīng)用于不同故障程度的滾動軸承試驗數(shù)據(jù)。為方便,“滾動體1”、“內(nèi)圈1”、“外圈1”故障滾動軸承的故障直徑為0.177 8 mm,深度為0.279 4 mm;“滾動體2”、“內(nèi)圈2”、“外圈2”故障滾動軸承的直徑為0.533 4 mm,故障深度為0.279 4 mm。電機轉(zhuǎn)速為1 730 r/min,采樣頻率為12 kHz,數(shù)據(jù)點數(shù)為2 048,共得到406組數(shù)據(jù)。
采用文中方法對上述數(shù)據(jù)進行分析,測試樣本的輸出結(jié)果表3所示。由表可以看出,論文方法將“外圈2”的兩個樣本錯分到“內(nèi)圈1”故障類中,故障識別率為99.06%。而當(dāng)采用MFE進行特征提取時,“外圈2”的4個測試樣本被錯分到“外圈1”中,故障識別率為98.11%,低于文中方法的識別率。
當(dāng)訓(xùn)練樣本個數(shù)分別為5, 10, 15, 20和25時,對于不同故障程度的滾動軸承試驗數(shù)據(jù),基于MFE與IMFE的故障診斷方法的識別率如表4所示。由表4可知,當(dāng)訓(xùn)練樣本選用20或者以上時,兩種方法的故障識別率均為100%。而當(dāng)訓(xùn)練樣本個數(shù)較少時,基于IMFE的故障診斷方法的識別率要高。一般地,對于大型機器來說,故障信號采集比較困難,故障樣本個數(shù)極其稀有,而筆者提出的方法為解決小樣本故障識別問題提供了一種有效的途徑。
表3 測試樣本的輸出結(jié)果
表4 MFE與IMFE識別率
筆者提出了一種衡量時間序列復(fù)雜性的改進多尺度模糊熵算法,將其與多尺度模糊熵進行了對比,結(jié)果表明了所提方法的優(yōu)越性。提出了一種基于改進多尺度模糊熵和支持向量機的滾動軸承故障診斷方法,通過分析具有相同和不同故障程度的滾動軸承的試驗數(shù)據(jù),將其與多尺度模糊熵進行了對比,結(jié)果表明,當(dāng)樣本個數(shù)較少時,論文方法的識別率更高。綜上所述,改進的多尺度模糊熵有效地彌補了多尺度模糊熵中粗?;^程的缺陷,在滾動軸承振動信號的故障特征表征方面具有一定的優(yōu)勢。筆者將進一步對其理論進行研究和完善,以期能推廣到其他故障診斷領(lǐng)域中。