黃宏臣,張倩倩,韓振南,林曉龍,劉 慶
(太原理工大學機械工程學院,山西 太原 030024)
拉普拉斯特征映射算法在滾動軸承故障識別中的應(yīng)用
黃宏臣,張倩倩,韓振南,林曉龍,劉 慶
(太原理工大學機械工程學院,山西 太原 030024)
由于滾動軸承故障的非線性和非平穩(wěn)性特征,傳統(tǒng)線性方法不能準確發(fā)現(xiàn)和識別出故障類型及其受損情況,該文提出使用流形學習拉普拉斯特征映射(LE)算法對滾動軸承故障進行識別。在由幅值、時域統(tǒng)計指標和由小波包函數(shù)分解得到的能量比作為特征向量構(gòu)建的高維特征空間中,使用LE算法和兩種傳統(tǒng)的降維方法PCA、MDS進行對比,提取出最敏感、最能表征滾動軸承運行狀態(tài)的低維特征量,再使用模式識別進行分類,聚類結(jié)果用三維圖形表示。以樣本識別率和模式識別中的類內(nèi)距和類間距作為評價指標,模擬實驗結(jié)果表明:LE算法不僅能有效地識別出滾動軸承故障類型而且能區(qū)分和識別出軸承外圈在不同受損情況下的運行樣本。
滾動軸承;線性方法;拉普拉斯特征映射;特征空間;模式識別
滾動軸承是各類旋轉(zhuǎn)機械中最常用也最易受損的零件之一。據(jù)統(tǒng)計,旋轉(zhuǎn)機械的故障中有30%是因為軸承故障引起的,軸承的好壞對機器的工作狀況影響極大,對重要用途的軸承進行工況監(jiān)測和故障診斷非常必要[1]。
在滾動軸承早期故障監(jiān)測時,由于故障信號微弱使得所測得的振動信號中包含大量噪聲,常常把故障信號淹沒。通常的方法是采用多個彼此信息高度相關(guān)的傳感器對設(shè)備進行監(jiān)測,更多的信息量可以提高診斷精度,減少系統(tǒng)狀態(tài)的不確定性,但是海量信息也增加了故障分類的難度。因此,如何消除信息冗余,減低維數(shù),從噪聲信號中提取出微弱的故障特征信號,成了目前信號處理和特征提取的關(guān)鍵,也是最大的難點之一。
主元分析法(principal components analysis,PCA)和多維尺度分析(multidimensional scaling,MDS)是對故障的特征量進行有效分類的兩種非常成熟的方法,是基于研究對象相似性或距離,將研究對象在一個低維空間(二維或三維)表示出來,進行聚類或者維度分析的圖示法。由于這兩種方法是線性方法,對于平穩(wěn)和線性問題可以有效進行維數(shù)約簡、特征提取,但對于運行狀態(tài)是典型的非線性和非穩(wěn)態(tài)分布的滾動軸承故障數(shù)據(jù)就顯得效果不佳。而近年來出現(xiàn)的流形學習為非線性的故障診斷提供了一種新的思路。
1.1 流形學習方法
流形學習的本質(zhì)是一個維度約簡的過程,它是從觀測到的事物表象去探索和發(fā)現(xiàn)事物的本質(zhì)特征,找到產(chǎn)生數(shù)據(jù)的內(nèi)在規(guī)律和本征結(jié)構(gòu)[2]。自2000年Science雜志同期發(fā)表了3篇關(guān)于流形學習的論文,該方法逐漸成為當前研究的熱點和難點,已經(jīng)形成一些經(jīng)典的流形學習,如等距映射算法(ISOMAP)、局部線性嵌入(LLE)、拉普拉斯特征映射算法(LE),Hessian特征映射(HE)及局部且空間特征映射(LTSA)等[2]。因為流形學習已經(jīng)成功的應(yīng)用到了圖像處理、數(shù)據(jù)可視化、模式識別以及信息檢索等領(lǐng)域[3],因此,吸引了機械故障領(lǐng)域的研究者相繼投入到流形學習的研究中。
在國內(nèi),已經(jīng)有不少科研工作者進行深入研究并取得了一定的成果。陽建宏等[4]采用重構(gòu)相空間的時域信號,提出一種基于主流形識別非線性降噪方法,并成功地應(yīng)用到了齒輪斷齒的狀態(tài)識別;蔣全勝等[5]直接利用拉普拉斯特征映射LE方法對故障時域信號進行學習,提取出非線性信號中的內(nèi)在本質(zhì),成功識別出滾動軸承的故障類型;栗茂林等[6]利用局部切空間排列LTSA在由時域和頻域等特征量構(gòu)建的特征空間中有效提取出表征滾動軸承狀態(tài)特征;李鋒[7]針對風電齒輪箱故障目前普遍使用的故障識別模式的不足,結(jié)合流行學習方法,有效識別出風電齒輪箱中的故障。本文首次提出使用LE算法在由多特征量構(gòu)建的高維空間進行學習提取出低維特征量,對滾動軸承進行故障狀態(tài)識別。
1.2 拉普拉斯特征映射算法
2003年Belkin[8]提出一種基于圖譜理論的流形學習算法——拉普拉斯特征映射(laplacian eigenmaps,LE)。假設(shè)在高維特征空間中是近鄰點在影射到低維空間中也應(yīng)近鄰,即在保持高維與低維空間中樣本性質(zhì)的連續(xù)性與一致性原則的前提下,求出最優(yōu)低維嵌入。
LE算法可以描述為以下3步:
1)構(gòu)建鄰接圖,查找K近鄰。通過計算每個樣本點與其他點的歐式距離,將每個點與最近的K個近鄰點用邊連接;或者當兩點間的距離小于某個閥值ε時,兩者為近鄰關(guān)系,用一條邊連接。
2)確定近鄰圖上的每一條邊的權(quán)值。確定權(quán)值有兩種方法:①簡單賦值法,即令圖上每條邊權(quán)重為1,無邊則為0;②熱核法,即當Xi與Xj相鄰,令權(quán)重Wij=exp(-‖Xi-Xj‖2/σ2),否則為0。
3)計算數(shù)據(jù)的低維嵌入。計算矩陣I-D-1/2WD-1/2的最小d+1個特征值所對應(yīng)的特征向量,去除特征值為0的項,即為最終得到的低維嵌入坐標。
根據(jù)LE算法的描述可知,局部鄰域的選取對低維流形提取至關(guān)重要。在本文中選用K=8的K近鄰域法構(gòu)建鄰域圖[9],權(quán)值確定的方法將選用熱核法。LE算法過程簡單,不需要進行迭代計算,因此計算量和運算時間大大減少。
由于設(shè)備越來越復(fù)雜,包含的信息量增大,在對設(shè)備進行早期故障診斷時,所測得的振動信號信噪比大,包含大量冗余信息,很難直接利用振動信號數(shù)據(jù)進行識別評估。通過特征提取和轉(zhuǎn)換技術(shù)把原始信號構(gòu)建到高維特征空間,利用特定方法對其中的特征向量進行特征融合,提取出能準確描述設(shè)備運行狀態(tài)的低維特征。
為了提高運行狀態(tài)和故障的識別準確率,本文將從多個角度盡可能的進行全方面分析。根據(jù)滾動軸承在不同故障狀態(tài)下不同特征參數(shù)所表達的信息量及敏感性不同的特點,在時域和頻域特征中選擇特征量。在時域特征中選用最大峰值、峭度等13個特征量作為維度指標。針對時域特征量的局限性,選用平均頻率以及采用db4小波包函數(shù)進行3層正交小波包分解,均勻劃分得8個子頻帶的濾波信號,將得到的8個子頻帶濾波以及對總頻率的相對能量比作為頻域統(tǒng)計特征參數(shù)[3],共計22種特征量參數(shù)如表1所示,詳細的定義和計算公式見文獻[10]。本文將以上述22個特征參數(shù)作為樣本維度,采用LE算法對特征矩陣進行學習,提取出低維特征向量,準確地描述滾動軸承運行狀態(tài)。
表中E3i表示第i+1個頻帶重構(gòu)信號的能量,Ei=E3i/E表示第i個頻帶占總能量比,其中i=0,1,…,7,表示總能量。
表1 特征參數(shù)
基于LE算法的故障診斷思路如圖1所示。先對滾動軸承振動加速度信號進行處理,構(gòu)建高維特征空間,利用LE算法將高維特征向量降維到低維特征空間,通過模式識別對低維空間中的流形結(jié)果進行分類。
圖1 基于LE算法的軸承故障識別模型
故障診斷是典型的模式識別問題,因此,對于滾動軸承的故障識別,本文將采用故障樣本識別準確率以及聚類分析法中的類間距Sb和類內(nèi)距Sw來衡量提取特征的聚類效果[11-13]。類間距Sb用來描述不同類別分開的距離,類內(nèi)距Sw表明每個類樣本分布緊湊性。假定特征向量為{f1,f2,…,fdim},dim是特征向量的目標維數(shù),選取dim=3。Sb和Sw兩個參數(shù)的描述如下:
其中,μpf是每一類中Cp(p=1,2,…,c)樣本特征向量的平均值,是所有類型中特征向量的平均值。類間距Sb是用來描述類與類之間的距離,而類內(nèi)距Sw則是用來描述每一種樣本類型聚集程度的好壞,取值越小越好。通過類內(nèi)距和類間距分類指標的領(lǐng)域選擇策略,保證同類樣本點的關(guān)聯(lián)性,從而獲得較好的聚類質(zhì)量。
機械設(shè)備出現(xiàn)故障時,不僅需要識別出故障的類型,更需要能發(fā)現(xiàn)其受損的程度、位置以及對發(fā)展趨勢進行預(yù)判。因此,為驗證LE算法對于滾動軸承故障識別的有效性,將進行滾動軸承典型故障類型和軸承外圈上不同故障程度判斷兩組實驗,通過與PCA和MDS兩種比較成熟的傳統(tǒng)方法進行比較,證明LE算法比傳統(tǒng)方法更有效,且能高效的識別滾動軸承故障類型及受損程度。本文使用的滾動軸承故障數(shù)據(jù)均來自美國凱斯西儲大學(CWRU)電氣實驗室實驗平臺上所進行的故障模擬實驗。
4.1 滾動軸承故障類型實驗
本實驗選取電機驅(qū)動端軸承座上同一位置傳感器所測得的滾動軸承的內(nèi)圈、外圈和滾動體3種典型故障及無故障狀態(tài)信號進行分析。選擇在下列條件下測得數(shù)據(jù):電機負載為2 hp(1 hp=735.5 W),轉(zhuǎn)速為1750r/min,采樣頻率為48kHz。人為制造的故障尺寸均為直徑0.021in、深度0.011in(1in=2.54cm)。每種故障選50組樣本,構(gòu)建N·m=(50×4)×22的特征矩陣。
圖2為滾動軸承4種振動加速度信號時域圖。從時域圖便能區(qū)分故障信號與無故障信號。
圖2 4種狀態(tài)時域圖
圖3 不同的故障類型分類識別
圖3分別為使用PCA、MDS和LE 3種算法對滾動軸承4種不同故障特征矩陣進行學習,將特征向量進行融合提取出前三維特征量,并將結(jié)果用可視化的三維圖像形式表示。圖3(a)為使用PCA方法得到的結(jié)果用三維圖形表示,可以得出以下結(jié)論:4種狀態(tài)樣本沒能很好的區(qū)分,外圈故障樣本分布比較分散,且大量樣本被錯誤識別;無故障、內(nèi)圈故障和滾動體故障3種樣本每種樣本比較聚集,聚類性比較好,但是3種樣本之間沒有很好的區(qū)分開,類間距太小,出現(xiàn)了樣本的混疊和交叉以及大量錯誤互識。圖3(b)為MDS方法提取得到的結(jié)果圖,可知所有樣本分布分散,聚類性差。無故障樣本比較好聚集在一起并與其他3種狀態(tài)樣本區(qū)分,其他3種樣本中,外圈故障樣本和PCA提取的結(jié)果一樣,分布比較分散且不少樣本被錯誤識別成其他3種狀態(tài),內(nèi)圈和滾動體故障樣本出現(xiàn)了大量的混疊。而使用LE方法就很好的區(qū)分開4種狀態(tài)樣本,4種樣本中的每種樣本很好地聚集在一點,各種樣本間的類間距也很明顯,很好的區(qū)分識別出各種樣本,識別率達到98.5%。
圖4 不同程度故障損傷
3種算法提取的特征參數(shù)值見表2,可知流形學習方法LE與PCA以及MDS相比,識別率大大提高,聚類性的類間距Sb和類內(nèi)距Sw都得到優(yōu)化,在滾動體故障類型識別實驗中很好地體現(xiàn)出了流形學習非線性降維的優(yōu)點。
4.2 滾動軸承外圈不同受損故障實驗
本節(jié)選用模擬實驗中軸承外圈正常狀態(tài)和3種不同故障程度的受損情況進行識別驗證。傳統(tǒng)分析方法結(jié)果見圖4,圖4(a)至上而下分別是無故障、直徑為0.007,0.014,0.021 in故障所對應(yīng)的時域圖,圖4(b)為3種故障經(jīng)FFT變換得到的對應(yīng)的頻域圖,從圖中并不能識別出滾動體故障受損程度。同樣,在本實驗中每種類型選擇50組樣本構(gòu)建N·m=(50×4)×22的特征矩陣,分別使用3種算法對特征矩陣進行特征融合提取出前三維特征量,并將結(jié)果用三維圖像表示,如圖5所示。
表2 特征參數(shù)值
圖5 不同的故障程度分類識別
表3 特征參數(shù)值
圖5(a)是PCA降維得到的三維結(jié)果表示,圖5(b)圖是MDS方法進行特征融合提取,進行降維得到的結(jié)果;可知各種樣本之間出現(xiàn)了大量的交叉混疊和錯誤識別,各種類型間的界限很不明顯。PCA得到的結(jié)果比MDS的聚類性更好,MDS的分布范圍區(qū)間大、比較分散。圖5(c)圖為LE得到的結(jié)果圖,可以明顯得出:識別準確率和聚類性比PCA和MDS兩種方法要好,各種類型間的分界線非常明顯,雖然也出現(xiàn)了一些錯誤識別。3種方法對滾動軸承4種不同受損程度的識別準確率和聚類性見表3。本實驗證明了LE算法對滾動軸承外圈可以識別出不同受損程度,同理也能識別出滾動體和內(nèi)圈故障的不同受損故障,本文將不再詳述。
上述實驗結(jié)果表明:LE算法在滾動軸承故障識別中比線性方法PCA和MDS具有更高的識別準確率且聚類效果好。
本文提出使用LE算法對滾動軸承故障進行識別,進行兩組模擬實驗,實驗結(jié)果表明:LE算法不僅能高效識別滾動軸承故障類型,而且能有效識別出軸承外圈在不同受損情況下的運行狀態(tài)樣本。為LE算法運用到其他機械故障診斷,以及將流形學習中其他方法應(yīng)用到滾動軸承以及其他機械故障診斷中提供借鑒,為將LE算法及流形學習方法中的其他算法應(yīng)用到工程實踐中做準備。
[1]鐘秉林,黃仁.機械故障診斷學[M].北京:機械工業(yè)出版社,2006:298-299.
[2]黃添強.數(shù)據(jù)挖掘-算法與應(yīng)用[M].廈門:廈門大學出版社,2011:113-120.
[3]雷迎科.流形學習算法及其應(yīng)用研究[D].合肥:中國科學技術(shù)大學,2011.
[4]陽建宏,徐金梧,楊德斌,等.基于主流形識別的非線性時間序列降噪方法及其在故障診斷中的應(yīng)用[J].機械工程學報,2006,42(8):154-158.
[5]蔣全勝,李華榮,黃鵬.一種基于非線性流形學習的故障特征提取模型[J].振動與沖擊,2012,31(23):132-136.
[6]栗茂林,王孫安,梁霖.利用非線性流形學習的軸承早期故障特征提取方法[J].西安交通大學學報,2010,44(5):45-49.
[7]李鋒.基于流形學習的風電機組傳動系統(tǒng)故障診斷方法研究[D].重慶:重慶大學,2011.
[8]Belkin M,NiyogiP.Laplacian eigenmaps for dimensio nlity reduction and data representation[J].Neural Comp utation,2003,15(6):1373-1396.
[9]王澤杰,胡浩民.流形學習算法中的參數(shù)選擇問題研究[J].計算機應(yīng)用與軟件,2010,27(6):84-85.
[10]盛兆順,尹琦嶺.設(shè)備狀態(tài)監(jiān)測與故障診斷技術(shù)及應(yīng)用[M].北京:化學工業(yè)出版社,1991:40-41.
[11]張學工.模式識別[M].北京:清華大學出版社,2010:146.
[12]He Q B.Vibration signal classification by wavelet packet energy flow manifold learning[J].Journal of Sound and Vibration,2013(332):1881-1894.
[13]He Q B.Time-frequency manifold for nonlinear feature extraction in machinery fault diagnosis[J].Mechanical Systems and Signal Processing,2013(35):200-218.
Application of laplacian eigenmap in fault diagnosis of rolling bear
HUANG Hongchen,ZHANG Qianqian,HAN Zhennan,LIN Xiaolong,LIU Qing
(College of Mechanical Engineering,Taiyuan University of Technology,Taiyuan 030024,China)
Due to the nonlinearand non-stationarycharacteristicsofrolling bearing fault,traditional linear methods cannot accurately find and identify the fault type and its damage.This paper put forward and used manifold learning laplacian eigenmap(LE)algorithm to identify rolling bearing fault.In the high dimensional feature space constructed by feature vectors from amplitude,time domain statistical indicators and energy ratio decomposed by wavelet packet function,the paper used LE algorithm to compare two traditional dimension reduction methods with PCA and MDS and extracted the low dimensional characteristics that are the most sensitive and can represent the running state of the rolling bearing when using pattern recognition to classify and the three dimensional figure to show clustering results.Taking sample recognition rate and the class cohesion and class spacing of pattern recognition as evaluation index,the results of the two simulation experiment show that:LE algorithm not only can effectively detect rolling bearing fault types,but also can distinguish and identify the running samples in different damage cases of outer ring.
rolling bearing;linearmethod;laplacian eigenmap;characteristicspace;pattern recognition
A
:1674-5124(2015)05-0094-05
10.11857/j.issn.1674-5124.2015.05.024
2014-09-21;
:2014-11-13
國家自然科學基金資助項目(50775157)山西省基礎(chǔ)研究項目(2012011012-1)山西省高等學校留學回國人才科研資助項目(2011-12)
黃宏臣(1986-),男,湖南永州市人,碩士研究生,專業(yè)方向為流形學習算法和機械故障研究。