李生鵬,韋朋余,丁 峰,竺一峰,姜朝文,周舒豪
(中國船舶科學(xué)研究中心,江蘇 無錫 214082)
軸承是船用旋轉(zhuǎn)機械系統(tǒng)中的重要組成部分,諸如主機、尾軸、泵系、錨機等眾多設(shè)備中,軸承是
收稿日期:2018-07-30必不可少的機械零件。軸承起著承受載荷和傳遞載荷的作用,其能否正常工作直接影響著整機系統(tǒng)的運行狀態(tài)。軸承在實際運轉(zhuǎn)過程中承受著復(fù)雜交變的外部載荷,致使其成為最容易損壞的零件之一,轉(zhuǎn)動類船舶機械系統(tǒng)發(fā)生的故障大約有30%是由軸承損壞引起的[1],如果能夠有效地識別、處理軸承故障,對整機的維護具有重要意義[2]。現(xiàn)有的振動信號分析方法根據(jù)定量確定故障的類型以及發(fā)展趨勢,可以有效防止“維修不足”和“維修過度”[3]。
定量狀態(tài)下的軸承故障特征與故障類型一般為非線性關(guān)系,而能夠表征該特征的向量具有數(shù)據(jù)量大、變量多等特點,如何有效提取不同故障類型軸承振動信號的特征向量成為目前眾多學(xué)者的研究方向[4]。傳統(tǒng)的頻譜分析方法已不適用于分析非平穩(wěn)、非線性的軸承振動信號,而短時傅里葉變換、小波分析等新方法也沒有擺脫傅里葉變換的局限性[5]。EMD方法根據(jù)自身的時間尺度特征進行分解,具有自適應(yīng)、完備性和正交性等特點,無需設(shè)定基函數(shù),解決了信號在分解過程中瞬時頻率難以確定的問題[6-7]。模糊熵利用指數(shù)函數(shù)的連續(xù)性和非突變性進行時間序列的求解,保證了結(jié)果的平滑性[8]。軸承故障振動特征頻段和復(fù)雜程度在不同尺度下均表現(xiàn)出一定的差異性,在多尺度下提取信號的模糊熵值可以提高特征向量的準確性[9]。PCA是一種多元統(tǒng)計方法,可以有效地消除數(shù)據(jù)之間的相關(guān)性并對其進行壓縮,實現(xiàn)了降低維數(shù)的目的[10-12]。
本文提出了一種多尺度模糊熵和主成分分析相結(jié)合的滾動軸承故障特征提取方法。首先利用EMD將原始振動信號分解成若干個IMF,并根據(jù)相關(guān)系數(shù)和峭度值準則剔除虛假IMF分量;然后在不同尺度下求取真實IMF分量的模糊熵值,利用PCA對其進行降維處理,形成能表征不同軸承故障的特征向量;最后借用支持向量機對軸承故障進行診斷驗證。
EMD方法用于把非線性、非平穩(wěn)的時間序列分解成有限個IMF,并且每個IMF分量中都含有不同時間尺度的振動信息,其分解過程如圖1所示。
EMD分解過程中根據(jù)原始信號的局部最大值和最小值點分別擬合成相對應(yīng)的上下包絡(luò)曲線,但在實際分析時因為誤差、邊界效應(yīng)等原因致使上下包絡(luò)曲線并不會完全對稱。這就會造成實際的EMD運用和理論的EMD分解存在偏差,而這種偏差的存在導(dǎo)致了原始信號中能量的泄露,即得到的IMF存在虛假分量。由EMD分解得到的IMF分量具有正交性,不同分量之間的重合率不超過1%,特殊情況下不超過5%,但由于能量泄露的原因,分解出的虛假分量會與真實分量出現(xiàn)重合,如果不予以剔除則會增加所提取特征向量的維數(shù),帶來很大的計算量。在此結(jié)合先前學(xué)者的研究成果和軸承故障診斷的特點,提出兩條準則以剔除EMD分解過程中出現(xiàn)的虛假分量。
圖1 EMD算法流程圖Fig.1 Algorithm flow chart of EMD
準則1:相關(guān)系數(shù)準則
根據(jù)EMD分解定義可知不同IMF分量都是從原始信號中剝離而來,真實IMF分量與原始信號的關(guān)系最為密切,通過計算各階IMF分量與原始信號的相關(guān)系數(shù)即可判斷真?zhèn)?,其公式為?/p>
式中:RIMFj為各階IMF通過公式(1)計算出的結(jié)果;N為信號的采樣點數(shù);j為IMF分量的階數(shù)。在分析兩個時間序列的相關(guān)程度時,當ρ()j的值大于0.5即可認為兩者之間的相關(guān)程度性較好,即判定為真實分量。
準則2:峭度準則
峭度的定義是描述振動信號波形尖峰度的無量綱參數(shù),其計算公式為:
式中:μ、σ分別表示信號x的均值和標準差。
信號的峭度值和機器的運行狀態(tài)有關(guān),在軸承平穩(wěn)工作時采集的信號屬于正態(tài)分布信號,此時的峭度值約為3。當軸承發(fā)生內(nèi)圈、滾動體和外圈故障時,其波形尖峰會增加,造成信號明顯偏離正態(tài)分布而使峭度值變大。EMD分解得到的IMF分量為不同頻段的信號,每個部分所包含的振動沖擊不一樣,其峭度值越大則表示該IMF分量所攜帶的故障信息越多。因此本文選取峭度值大于3的IMF分量作為真實分量予以保留。
模糊熵用于衡量時間序列在維數(shù)變化時所產(chǎn)生新模式概率的大小,產(chǎn)生概率的值越大則模糊熵值越大。模糊熵通過選擇指數(shù)函數(shù)e-(d/r)n(n,r分別為模糊函數(shù)邊界的梯度和寬度)作為模糊函數(shù)來計算兩個向量的相似性,使其具有連續(xù)和不突變性,且保證了自相似值的最大,其計算過程如下:
(1)對時間序列 {u(i):1≤i≤N}進行處理得到m維向量:
式中:i,j=1,2,…,N-m,i≠j。
(4) 定義函數(shù)
(5)根據(jù)以上步驟構(gòu)造m+1向量:
(6)根據(jù)以上步驟可得模糊熵值為:
當N有限時,上式可變化為
軸承不同故障振動信號特征頻段和復(fù)雜程度在不同尺度下表現(xiàn)出一定的差異性,在不同尺度下提取其振動信號的模糊熵值可以提高結(jié)果的準確性,其定義為對N點時間序列Xi={x1,x2,…,xn}進行粗?;幚?,形成新的時間序列:
式中:τ=1,2,…,n為尺度因子。
多尺度模糊熵表示為在不同時間尺度下求取振動信號的特征模糊熵值,可以有效地克服單一模糊熵值用于衡量時間序列的缺陷。
在上一節(jié)求取了軸承故障的特征模糊熵值,但尺度因子一般要取10以上,對多個IMF進行計算得到的特征向量會更多。但不是每個特征值對識別軸承故障類型的貢獻率都是一致的。如果將所有特征值都用于故障識別,勢必會增加運算的數(shù)量和時間,出現(xiàn)信息冗余和維數(shù)災(zāi)難的問題,在此利用PCA對其進行降維處理。
設(shè)提取的軸承特征信號列向量為Xk=[x1k,x2k,…,xnk],每組特征信號中有n個特征值,則軸承當前的狀態(tài)可以用xk描述,其協(xié)方差矩陣為:
式中:N為樣本的數(shù)量,ˉ為各模式向量的均值。
求取Rx的特征值λi=(i=1,2,…,n)和特征向量vi,通過對λi進行排序形成相對應(yīng)新的特征向量vi(i=1,2,…,n)。 計算樣本xk投影vi即可得到對應(yīng)的主分量:
所有的特征向量形成一個n維正交空間,x通過投影可以得到n維主分量,在投影過程中對應(yīng)的特征值越大則在重構(gòu)時的貢獻率也越大,反之則越小。設(shè)正交空間的前m主分量為y1,y2,…,ym,其累計方差的貢獻率為:
當前m主分量的貢獻率足夠大時就可直接利用該分量進行故障診斷,在保證信息完整性的前提下實現(xiàn)降維的目的,本文取累計貢獻率大于90%的數(shù)個主分量作為故障診斷的特征值。
本文的軸承故障特征提取步驟如圖2所示。
圖2 軸承故障特征向量提取流程示意圖Fig.2 The schematic diagram of extraction procedure for rolling bearing fault feature vector
本次實驗采用的是美國西儲大學(xué)軸承實驗平臺,如圖3所示。實驗平臺的左側(cè)為2馬力的電機,中間部分為轉(zhuǎn)矩傳感器,右側(cè)為功率計。
實驗中電機的轉(zhuǎn)速為17 501 rpm,采樣頻率為12 kHz,分別采集了正常狀態(tài)、內(nèi)圈故障、滾動體故障和外圈故障共4種軸承數(shù)據(jù),其時域波形如圖4所示。
圖3 機械故障模擬實驗臺Fig.3 Simulation test-bed of the mechanical fault
圖4 4種狀態(tài)滾動軸承原始振動信號Fig.4 Original vibration signal of four states for the rolling bearing
圖5 軸承外圈故障EMD分解結(jié)果Fig.5 The EMD decomposition result of bearing outer ring fault
該實驗平臺共有正常、內(nèi)圈故障、滾動體故障和外圈故障4種類型。對每種類型的振動數(shù)據(jù)采集50組,隨機挑選25組用于訓(xùn)練,剩余25組用于測試,每組數(shù)據(jù)包含6 000個采樣點。對采集到的軸承外圈故障進行EMD分解得到8階IMF分量,結(jié)果如圖5所示。
對軸承不同狀態(tài)下振動信號分解出的8階IMF分量進行相關(guān)系數(shù)和峭度值計算,結(jié)果如表1、表2所示。
表1 四種狀態(tài)軸承相關(guān)系數(shù)Tab.1 Four state correlation coefficients of the rolling bearing
表2 四種狀態(tài)軸承峭度值Tab.2 Four states kurtosis value of the rolling bearing
由表中可知IMF分量峭度值和相關(guān)系數(shù)較大的主要集中在IMF1和IMF2分量中,但正常和滾動體故障的峭度值大于3的IMF分量不止2個,為了方便數(shù)據(jù)處理形成統(tǒng)一維數(shù)的輸入向量,在此選取峭度值最大的2個IMF分量予以保留,將其余的分解剔除。在不同尺度下計算軸承不同狀態(tài)IMF1和IMF2分量的模糊熵值,本文選擇尺度因子為20,結(jié)果如圖6、圖7所示。
圖6 IMF1多尺度模糊熵Fig.6 IMF1 multiscale fuzzy entropy
由上圖可以看出,很多尺度因子對應(yīng)的模糊熵值相差很小,而且并不是每個特征值對故障診斷都是有用的,如果不對其進行降維則會增加運算量,出現(xiàn)維數(shù)災(zāi)難等問題。在此基于PCA對其進行處理,由于篇幅有限,本文只給出了外圈故障IMF1降維的結(jié)果,如表3所示。
由表3可知,前3個主分量的累計貢獻率已經(jīng)超過了90%,故可以用這3個主分量作為軸承故障診斷的特征向量。在此借用支持向量機作為分類機器,每種類型的振動數(shù)據(jù)采集50組,隨機挑選25組用于訓(xùn)練,剩余25組用于測試。對所有樣本的IMF1、IMF2分量都進行多尺度模糊熵計算,然后利用PCA進行降維處理,將最終的特征向量輸入支持向量機進行訓(xùn)練、測試,其結(jié)果如圖8所示。
圖8中1、2、3、4分別代表正常、內(nèi)圈故障、滾動體故障和外圈故障4種狀態(tài),其中內(nèi)圈故障有1個樣本被識別為正常狀態(tài),滾動體故障有2個被識別為外圈故障,外圈故障分別有1個被識別為滾動體故障和內(nèi)圈故障。分析原因可能是利用PCA對多尺度模糊熵進行降維時只采用了累計貢獻率達到90%的主分量,在篩選IMF分量時根據(jù)準則值選取了2個,丟失了部分特征信息,不過總體分類精度達到95%(如圖8中所示,錯位點占5%),證明本文的方法是一種有效的軸承故障診斷途徑。
表3 外圈故障IMF1降維的結(jié)果Tab.3 The result of IMF1 reducing dimensions for outer race fault
為了證明虛假分量篩選的有效性,在此求取經(jīng)EMD分解后的前8階IMF分量模糊熵值,結(jié)果如圖9所示。
圖8 支持向量機診斷結(jié)果Fig.8 Diagnosis result using support vector machine
圖9 IMF分量模糊熵Fig.9 The fuzzy entropy of IMF component
計算每種故障類型振動數(shù)據(jù)的特征模糊熵值,在此借用支持向量機作為分類機器,每種類型的振動數(shù)據(jù)采集50組,隨機挑選25組用于訓(xùn)練,剩余25組用于測試,其結(jié)果如圖10所示。
由圖10可知,由8階IMF分量求取模糊熵得到的特征向量識別準確率為88%(如圖10中所示,錯位點占12%)。分析其原因可能是由于虛假分量的存在,從第5階IMF開始得到的模糊熵值非常小且趨近于0,不同故障類型之間的模糊熵值差別不大,從而分類界限不明顯導(dǎo)致了識別正確率較低。
圖10 未篩選IMF支持向量機診斷結(jié)果Fig.10 Diagnosis result using support vector machine for unfiltered IMF
圖11 未經(jīng)PCA降維支持向量機診斷結(jié)果Fig.11 Diagnosis result using support vector machine for non-reducing dimension through PCA
為了證明PCA降維的有效性,在此將求取IMF1、IMF2共40個特征向量輸入支持向量機進行驗算,識別結(jié)果如圖11所示。利用MATLAB的tic、toc組合函數(shù)測試分類所用的時間,仿真電腦參數(shù)如表4所示,其結(jié)果如表5所示。
由表5可知,未經(jīng)PCA降維的支持向量機識別精度為97%,識別時間為17.361 s,而經(jīng)過PCA降維處理后的特征向量識別時間為10.592 s。綜上實驗可以表明在犧牲少量識別精度的前提下可以大幅度減少識別所用的時間,證明了降維的有效性。
表4 仿真電腦參數(shù)Tab.4 The parameters of simulation computer
表5 仿真結(jié)果統(tǒng)計Tab.5 The statistics of simulation result
針對軸承故障特征難以提取的問題,本文提出了基于多尺度模糊熵和主成分分析相結(jié)合的滾動軸承故障特征提取方法。首先利用EMD將原始振動信號分解成若干個IMF,并根據(jù)相關(guān)系數(shù)和峭度值準則剔除虛假IMF分量;然后在不同尺度下求取真實IMF分量的模糊熵值,利用PCA對其進行降維處理,形成能表征不同軸承故障的特征向量,最后借用支持向量機對其進行診斷驗證。主要結(jié)論歸納如下:
(1)EMD基于信號自身局部特征時間尺度分解非線性、非平穩(wěn)軸承故障信號,得到的IMF分量能夠突出原始信號的不同局部信息,有利于特征信息提取。
(2)實驗結(jié)果表明,未經(jīng)篩選的IMF分量識別精度為88%,低于最終識別精度95%。分析原因可能是階數(shù)較大的虛假IMF分量差別較小,導(dǎo)致數(shù)據(jù)的相似度較高、難以區(qū)分,證明了篩選的必要性。
(3)軸承故障振動的信號特征頻段和復(fù)雜程度在不同時間尺度下表現(xiàn)出一定的差異性,提取其振動信號的多尺度模糊熵值提高了識別結(jié)果的準確性。
(4)經(jīng)PCA降維后的特征向量識別精度為95%,低于未經(jīng)PCA降維的97%,但識別時間從17.361 s降低到了10.592 s,即在犧牲少量識別精度的前提下大幅度減少識別所用的時間,說明了降維對識別結(jié)果的有效性。