李月仙,韓振南,黃宏臣,寧少慧
(太原理工大學(xué) 機械工程學(xué)院,太原 030024)
旋轉(zhuǎn)機械是工業(yè)部門中應(yīng)用最廣泛的機械設(shè)備,齒輪-軸承系統(tǒng)作為旋轉(zhuǎn)機械的核心部件在工業(yè)中發(fā)揮著無可替代的作用。目前的機械設(shè)備朝著大型化、復(fù)雜化發(fā)展,旋轉(zhuǎn)部分復(fù)雜的運行工況容易出現(xiàn)各種不同形式的故障而影響正常工作,甚至?xí)l(fā)生毀機事故,造成重大的經(jīng)濟損失。旋轉(zhuǎn)機械常見的故障包括三類:一是滾動軸承故障,包括軸承內(nèi)圈、外圈、滾動體及保持架故障;二是轉(zhuǎn)子本體故障,包括不平衡、不對中、轉(zhuǎn)子裂紋及支承松動等;三是齒輪故障,包括斷齒、齒面磨損和齒根部裂紋等[1]。
對于復(fù)雜結(jié)構(gòu)和系統(tǒng)的旋轉(zhuǎn)機械在出現(xiàn)故障時所監(jiān)測到的振動信號具有明顯的非線性和非平穩(wěn)特性,使用傳統(tǒng)時頻方法難以從復(fù)雜信號中提取出有效特征量。為了及時、準確地識別和診斷出故障狀態(tài),從監(jiān)測信號中提取出有效信息量就尤為重要。常用的方法就是采用多個相關(guān)傳感器和提取多個特征量以提高診斷精度,但是大量的冗余信息給故障分類帶來了更大的復(fù)雜度。因此,消除信息冗余,提取出有效的故障分類特征量是我們一直所追求的目標之一[2]。
核方法是20世紀60年代由Minsky和Papert等人針對線性特征提取方法對于非線性信號進行特征提取時的局限性,無法解決現(xiàn)實世界中很多復(fù)雜的非線性問題而提出的一種非線性學(xué)習(xí)方法。通過引入核函數(shù),將數(shù)據(jù)映射到高維空間中,在特征空間中展開學(xué)習(xí),發(fā)現(xiàn)其存在的線性關(guān)系,實現(xiàn)了非線性問題的高效求解,同時避免了復(fù)雜的非線性映射的求解。
核主元分析法KPCA是最典型的非線性核方法,在高維特征空間中不涉及非線性優(yōu)化,僅僅利用線性代數(shù)求解特征值問題,且由于KPCA使用了核函數(shù),對非線性問題具有了較廣的適用性,在機械過程檢測和故障診斷領(lǐng)域已經(jīng)得到了廣泛應(yīng)用和研究[3-5],但核方法的缺點也是很明顯的,在參數(shù)選取時是不需要預(yù)先給定的,且在使用核函數(shù)時是知道具體的特征空間,使得核方法缺乏物理直觀性。并且核函數(shù)對于故障診斷中的類可分性測度影響很大,選擇不當會導(dǎo)致類可分性測度很小,使得不同類別的樣本點在特征空間中出現(xiàn)相互重疊覆蓋。而近年來流形學(xué)習(xí)方法的發(fā)展給機械故障診斷提供了一種新的思路。
流形學(xué)習(xí)是人們在21世紀信息時代面對海量的高維信息而發(fā)展起來的一種新型的非線性降維及數(shù)據(jù)挖掘的新方法。它能有效地對高維非線性數(shù)據(jù)進行降維,從高維非線性數(shù)據(jù)中找出隱藏在高維觀測空間數(shù)據(jù)中的低維結(jié)構(gòu)表示,揭示其內(nèi)在流形分布。在2000年發(fā)表的三篇論文中開創(chuàng)性地提出局部特征映射LLE和等距映射ISOMAP兩種算法后,迅速在各領(lǐng)域中進行研究,并陸續(xù)出現(xiàn)了多種經(jīng)典方法[6-10],如:拉普拉斯特征映射算法LE和局部切空間排列算法LTSA。因為流形學(xué)習(xí)已經(jīng)在一些領(lǐng)域取得了顯著效果,近幾年被故障診斷領(lǐng)域的研究者引入到設(shè)備工況特征的高維數(shù)據(jù)的非線性特征挖掘和降維中,并顯示了良好的效果和前途[11-13]。
LE算法假設(shè)數(shù)據(jù)點分布在光滑黎曼流形上,其主要思想是通過Laplace-Beltrami算子來構(gòu)造相應(yīng)空間嵌入目標函數(shù),實現(xiàn)高維數(shù)據(jù)在低維空間的嵌入。LE算法降維的實質(zhì)就是尋找到一個平均意義上保持數(shù)據(jù)點局部鄰近信息,即在原來高維特征空間中是近鄰的點在低維表示中也應(yīng)該是近鄰點。因此,LE算法的求解
步驟2:定義鄰接權(quán)矩陣W,可選擇熱核方式或簡單連接方式。熱核法:如果Xi與Xj是鄰接點,則有Wij,否則為 0,其中 t為熱核的寬度,其取值與鄰域K值相適應(yīng);簡單法:可以避免熱核法中參數(shù)t的選擇問題,如果Xi與Xj近鄰,則Wij為1,否則為0,在本文中將采用簡單法確定權(quán)值和權(quán)值矩陣。
步驟3:構(gòu)建拉普拉斯特征矩陣L=D-W,最小化特征映射誤差相當于計算下式中的最小特征向量。
其中D為對角矩陣ij。L的最小d+1個特征值對應(yīng)的特征向量u1,u2…ud就構(gòu)成了低維嵌入結(jié)
由上所述,LE方法將降維和特征提取問題轉(zhuǎn)化成對矩陣特征值和特征向量的求解,過程簡單,不需要進行迭代計算,因此計算量和運算時間大大減少。
根據(jù)LE算法的描述,LE算法是一種重點強調(diào)保持近鄰關(guān)系的流形學(xué)習(xí)算法,可以有效地保持高維樣本空間中具有相同或相近性質(zhì)的近鄰樣本點“物以類聚”的聚類特性,因此,LE算法非常適用于機械故障不同樣本分類識別問題。而對于LE算法,局部鄰域的構(gòu)建對低維流形提取效果至關(guān)重要,根據(jù)參考文獻[14]在本文中將選用K=8的KNN法構(gòu)建鄰域圖。轉(zhuǎn)化為對圖拉普拉斯算子的廣義特征值求解問題[9]。根據(jù)圖譜理論,如果數(shù)據(jù)均勻采樣自高維空間中的低維流形,流形上的拉式算子可以由圖上的Laplacian逼近,而圖上的最前面的幾個特征向量就是流形上L-B算子特征函數(shù)的離散逼近。LE算法可以描述為以下幾步:
步驟1:構(gòu)建鄰接圖G,可采用:近鄰ε法或K近鄰法,在本文中將選用K近鄰域法(KNN);
旋轉(zhuǎn)機械狀態(tài)識別與故障診斷過程是典型的模式識別的過程,特征提取是基礎(chǔ),識別方法是核心[3]。由于對旋轉(zhuǎn)機械所監(jiān)測到的振動信號復(fù)雜,包含著大量的冗余信息量,很難直接利用振動信號數(shù)據(jù)來評估。通過特征提取和轉(zhuǎn)換技術(shù)把原始信號構(gòu)建到特征空間,利用特定方法提取出能準確描述設(shè)備運行狀態(tài)的信息。對振動信號進行時域、頻域以及時頻域特征量分析已被廣泛使用,但是由于提取的不同特征參數(shù)對設(shè)備健康狀態(tài)的規(guī)律性、敏感性和聚類性各不相同且表征規(guī)律不一,很難用某一個或幾個特征參數(shù)來準確表征滾動軸承的運行狀態(tài)。如何提取出規(guī)律性強、敏感性好的狀態(tài)特征參數(shù)一直是故障診斷領(lǐng)域所追求的,也是研究的熱點和難點之一。
為了提高運行狀態(tài)和故障的識別準確率,本文將從多個角度盡可能地進行全方面分析。根據(jù)旋轉(zhuǎn)機械在不同故障狀態(tài)下不同特征參數(shù)的敏感性不同,構(gòu)建如表1所示的26個特征量,其中Ei為采用db4小波包函數(shù)進行3層正交小波包分解得到均勻劃分的8個子頻帶的濾波信號,將得到的8個子頻帶信號能量與總頻率的相對能量比作為頻域統(tǒng)計特征參數(shù)[11]。本文以上述26個特征參數(shù)作為訓(xùn)練樣本,采用降維方法對高維特征數(shù)據(jù)進行學(xué)習(xí),提取特征量。
E3i表示第 i+1個頻帶重構(gòu)信號的能量,Ei=E3i/E表示第i個頻帶占總能量比,其中 i=0,1,…,7,E=表示總能量。
表1 特征參數(shù)表Tab.1 Characteristic param eter
滾動軸承實驗中所采用的數(shù)據(jù)均來自美國凱斯西儲大學(xué)電氣實驗室使用SKF6205-2RS滾動軸承所進行的實驗[15]。所有實驗數(shù)據(jù)是在選擇下列實驗條件下所測得的數(shù)據(jù):電機負載為2 hp,轉(zhuǎn)速為1 750 r/min,采樣頻率為48 kHz,其傳感器位置為驅(qū)動端的軸承座上垂直位置。在本實驗中,軸承內(nèi)圈、外圈和滾動體上人為制造出滾動軸承三類典型故障類型,選用其故障尺寸為直徑0.53 mm、深度0.28 mm所測數(shù)據(jù)作為實驗依據(jù)。四種故障樣本類型,每種故障選50組樣本,每組樣本26個維度,構(gòu)建出N×m=(4×50)×26的特征矩陣。根據(jù)參考文獻[16-17]所述,確定目標維數(shù)dim為選取的故障樣本類型數(shù)減一,即dim=3。
從圖1和表2中可知,圖1(a)為PCA方法所得到的結(jié)果。從圖中可以看出只有無故障樣本可以準確識別,并且具有很好的聚類性,其他三種故障類型樣本之間出現(xiàn)了相互交叉混疊,尤其是外圈故障樣本分布散亂且識別率最低??梢奝CA對滾動軸承故障樣本的識別率和聚類效果不太理想。
圖1(b)為KPCA提取的前三個主元K1K3的三維圖。因為KPCA采用了參數(shù)σ=0.5的高斯核函數(shù),所以從圖中可以看出四種故障樣本基本區(qū)分開來,各類故障樣本實現(xiàn)了很好的識別和聚集,較PCA在樣本的平均識別率和聚類性均有了較大的提高。但是,仍出現(xiàn)了不少的樣本處于偏離位置,聚集性仍有待提高。
圖1(c)為采用流形學(xué)習(xí)中的LE算法對高維特征空間進行特征融合提取的結(jié)果。滾動軸承的四種樣本在三維空間中都呈現(xiàn)出很好的聚類性,且類與類之間明顯地分離。與PCA和KPCA兩種方法相比,LE方法能對高維樣本空間提取出不同故障狀態(tài)下的有效信息,從而實現(xiàn)了對滾動軸承故障狀態(tài)的有效識別。
圖1 滾動軸承故障分類識別Fig.1 Different fault classification of Rolling Bearing
轉(zhuǎn)子故障是旋轉(zhuǎn)機械中常見的一類故障,在本節(jié)中,通過典型故障的分析找出故障的振動特征是進行模式識別的必要條件,是進行精密診斷的基礎(chǔ)。
第一種,轉(zhuǎn)子不平衡,是一種常見的故障類型,旋轉(zhuǎn)機械中由于不平衡而失效約占30%;第二種,各轉(zhuǎn)子軸線之間產(chǎn)生平行、軸線角度或綜合位移等對中變化誤差,即轉(zhuǎn)子不對中。轉(zhuǎn)子系統(tǒng)中約60%故障是由不對中引起的,是旋轉(zhuǎn)機械轉(zhuǎn)子系統(tǒng)中最常見的故障;第三種是轉(zhuǎn)子彎曲,轉(zhuǎn)子彎曲又分為中間彎曲和端部彎曲兩種,在運行時會產(chǎn)生與質(zhì)量偏心類似的旋轉(zhuǎn)矢量激振力,同時在軸向發(fā)生與角頻率相等的振動。第四種是基座或裝配松動,基座和裝配松動常和轉(zhuǎn)子不平衡相伴生,表現(xiàn)出強烈的垂直方向振動[1]。
本節(jié)中四種典型轉(zhuǎn)子故障均為某公司實驗平臺上所進行的模擬實驗,選用電機轉(zhuǎn)速均為2 976 r/min(fr=49.6 Hz)。同理,構(gòu)建出如滾動軸承故障實驗類似的N×m=(4×50)×26高維特征矩陣。分別采用PCA、KPCA和LE方法進行特征提取,降維結(jié)果如圖2所示。
由于四種故障在時域和頻域特征量中差別比較明顯,故PCA方法對于四種故障也能基本識別,但每種故障的聚類性很差,且各種故障相互間的間隔不明顯;KPCA比PCA在類內(nèi)距有所提高外,樣本識別率并沒有明顯提高,出現(xiàn)一定量的交叉混疊;而LE方法很明顯地把類與類分離,雖然也存在錯誤識別,但相較PCA和KPCA,在高維空間中對狀態(tài)樣本的低維嵌入聚類提取敏感特征效果明顯提高。
本文齒輪故障識別實驗數(shù)據(jù),是在太原理工大學(xué)齒輪研究所振動及故障模擬實驗平臺上所測得,并選用軸承座垂直方向振動加速度信號作為診斷依據(jù)。實驗采用的是材料為45#鋼的單級漸開線直齒圓柱齒輪,大齒輪齒數(shù)為45,小齒輪齒數(shù)為30,壓力角α0=20°,模數(shù)m=4,轉(zhuǎn)速均為N=800 r/min,負載為400 N·m,采樣頻率為10 kHz。實驗選用三個相同的小齒輪,一個為無故障齒輪,一個制造成齒面剝落,而另一個在某個齒根處切割長為5 mm的裂紋,作為齒輪的三種典型狀態(tài)。同理,分別采集三種狀態(tài)的振動信號,提取特征量構(gòu)建N×m=(3×50)×26的高維矩陣進行降維和特征提取。由于在本齒輪實驗中只選擇三種類型,所以,目標維數(shù)dim=2的二維圖像表示分類結(jié)果如圖3所示。
圖2 轉(zhuǎn)子故障分類識別Fig.2 Different fault classification of Rotors
圖3 齒輪故障類型識別Fig.3 Different fault classification of Gear1
從圖3可以得出以下結(jié)論:圖3(a)PCA對于識別分類效果不理想,出現(xiàn)了一些故障信號被識別成無故障類別,無故障信號被識別成故障類別,但基本能區(qū)分出故障和無故障,而對于齒面剝落和齒根裂紋兩種故障不能很明顯區(qū)分開,混在一起,且無故障的分布非常散亂;KPCA對于三種狀態(tài)的識別比PCA在識別率和類內(nèi)距都有了較好的提高,但是仍出現(xiàn)了一些錯誤識別現(xiàn)象,各種類別聚集性有了明顯提高,但仍有待提高;而LE算法對于三種類別基本實現(xiàn)了較好的識別和區(qū)分,無故障類別的50組信號全部識別出來,幾乎聚集在了一個點,對于齒面剝落和齒根裂紋故障信號也基本實現(xiàn)了識別,聚集在一起,但也出現(xiàn)了不少識別錯誤,一部分齒面剝落被識別出成無故障,一部分齒根裂紋被錯誤識別為齒面剝落??傮w來說對于齒輪故障分類識別LE算法比PCA和KPCA在識別率、類內(nèi)距Sb和類間距Sw都更具有優(yōu)越性,詳細數(shù)據(jù)見圖4和表2。
在模式識別中所選取的特征評價準則直接或間接反映出樣本的分類效果,本文采用故障樣本平均識別準確率、聚類分析法中的類間距Sb和類內(nèi)距Sw來衡量提取特征的聚類效果[16-18]。類間距Sb用來描述不同類別分開的距離,類內(nèi)距Sw表明每個類樣本分布緊湊性。假定特征向量為{f1、f2、…、fdim},特征向量的目標維數(shù)dim。Sb和Sw兩個參數(shù)的描述如下:
其中是每一類中 Cp(p=1,2,…c)樣本特征向量的平均值是所有類型中特征向量的平均值。類間距Sb是用來描述類與類之間的距離,而類內(nèi)距Sw則是用來描述每一類樣本聚集程度的好壞,取值越小越好,而Sb/Sw可作為分類能力的主要指標。本文通過類內(nèi)距和類間距分類指標的鄰域選擇策略,保證同類樣本點的關(guān)聯(lián)性,從而獲得較好的聚類質(zhì)量。通過三種方法,計算兩組實驗的Sb和Sw,結(jié)果見表2。
表2 特征參數(shù)值Tab.2 Characteristic parameters value
由表2和圖4可知:LE方法的識別效果明顯好于PCA和KPCA方法。PCA的效果最差,KPCA由于采用了高斯核函數(shù),所以比PCA有了很大提高;在聚類性方面,尤其是類內(nèi)距Sw,LE的效果最好,較前兩種都有明顯提高,在滾動軸承故障識別中,類內(nèi)距Sw幾乎為零,遠遠小于其他兩種方法的結(jié)果,而Sb/Sw的比值,LE的比值也是最大,說明LE方法對特征提取降維效果最好。綜上所述:LE方法相對PCA和KPCA在故障樣本分類和識別中具有優(yōu)越性。
圖4 三種提取方法的識別率Fig.4 The recognition rate of threemethods
本文在拉普拉斯特征映射算法基礎(chǔ)上,首次提出一種基于LE算法的旋轉(zhuǎn)機械故障識別新模式。通過對旋轉(zhuǎn)機械三類典型故障:滾動軸承故障、轉(zhuǎn)子故障以及齒輪故障進行模擬實驗驗證。從模式聚類識別的角度進行分析,使用樣本平均識別率、樣本聚類性的類內(nèi)距和類間距三個參數(shù)作為評價指標,三組模擬實驗結(jié)果表明:LE算法相較于傳統(tǒng)的PCA和非線性核方法KPCA,在由多特征量構(gòu)建的高維特征空間中能夠提取出更敏感、更準確地表征設(shè)備運行狀態(tài)的特征量,提高了不同故障樣本的分類識別性能,從而實現(xiàn)了旋轉(zhuǎn)機械的故障診斷。
[1]廖伯瑜.機械故障診斷基礎(chǔ)[M].北京:冶金工業(yè)出版社,2003.
[2]鐘秉林,黃仁.機械故障診斷學(xué)(第三版)[M].北京:機械工業(yè)出版社,2007.
[3]蔣玲莉.基于核方法的旋轉(zhuǎn)機械故障診斷技術(shù)與模式分析方法研究[D].長沙:中南大學(xué),2010.
[4]李巍華,廖廣蘭,史鐵林.核函數(shù)主元分析及其在齒輪故障診斷中的應(yīng)用[J].機械工程學(xué)報,2003,39(8):65-70.LIWei-hua,LIAO Guang-lan,SHI Tie-lin.Kernel principal component analysis and its applcation in gear fault diagnosis[J].Chinese Journal of Mechanical Engineering.2003,39(8):65-70.
[5]鄧曉剛,田學(xué)民.一種基于KPCA的非線性故障診斷方法[J].山東大學(xué)學(xué)報(工學(xué)版),2005,35(3):103-106.DENG Xiao-gang,TIAN Xue-min.Nonlinear process fault diagnosismethod using kernel principal component analysis[J].Journal of Shandong University(Engineering Science),2005,35(3):103-106.
[6]Seung H S,Lee D D.Themanifold ways of perception[J].Science,2000,290(5500):2268-2269.
[7]Roweis ST,Saul L K.Nonlinear dimensionality reduction by locally linear embedding[J].Science,2000,290(5500):2323-2326.
[8]Tenenbaum J,Silva D,Langford J.A global geometric framework for nonlinear dimensionality reduction[J].Science,2000,290(5500):2319-2323.
[9]Belkin M,Niyogi P.Laplacian Eigenmaps for dimensionality reduction and data representation[J].Neural Computation,2003,15(6):1373-1396.
[10]ZHANG Zhen-yue,ZHA Hong-yuan.Principalmanifolds and nonlinear dimensionality reduction via tangent space alignment[J].Journal of Shanghai University(English Edition),2004,8(4):406-424.
[11]栗茂林,王孫安,梁霖.利用非線性流形學(xué)習(xí)的軸承早期故障特征提取方法[J].西安交通大學(xué)學(xué)報,2010,44(5):45-49.LIMao-lin,WANG Sun-an,LIANG Lin.Feature extraction for incipient fault diagnosis of rolling bearings based on nonlinearmanifold learning[J].Journal of Xi’an Jiaotong University,2010,44(5):45-49.
[12]蔣全勝,李華榮,黃鵬.一種基于非線性流形學(xué)習(xí)的故障特征提取模型[J].振動與沖擊,2012,31(23):132-136.JIANG Quan-sheng,LI Hua-rong,HUANG Peng.A fault feature extractionmodel based on nonlinearmanifold learning[J].Journal of Vibration and Shock,2012,31(23):132-136.
[13]黎敏,徐金梧,陽建宏,等.一種基于流形拓撲結(jié)構(gòu)的軸承故障分類方法[J].控制工程,2009,16(3):358-362.LIMin,XU Jin-wu,YANG Jian-hong.et al.Classification method of bearing faults based on topological structure of manifold[J].Control Engineering of China,2009,16(3):358-362.
[14]王澤杰,胡浩民.流形學(xué)習(xí)算法中的參數(shù)選擇問題研究[J].計算機應(yīng)用與軟件,2010,27(6):84-85.WANG Ze-jie,HU Hao-min.On parameter selection in manifold learning algorithm[J].Computer Applications and Software,2010,27(6):84-85.
[15] The Case Western Reserve University Bearing Data Center.http://csegroups.case.edu/bearingdatacenter/home.
[16]He Qing-bo.Vibration signal classification by wavelet packet energy flow manifold learning[J].Journal of Sound and Vibration,2013,332(7):1881-1894.
[17] He Qing-bo.Time-frequency manifold for nonlinear feature extraction in machinery fault diagnosis[J].Mechanical Systems and Signal Processing,2013,35(1-2):200-218.
[18]張學(xué)工.模式識別[M].北京:清華大學(xué)出版社,2010.146.