梁禮明,吳武林,吳健
(江西理工大學(xué) 電氣工程與自動化學(xué)院,江西 贛州 341000)
滾動軸承的峰值因子、峭度、脈沖因子等時域參數(shù),頻域頻譜特征和能量等包含了豐富的軸承運(yùn)行狀態(tài)信息,因此可以提取這些參數(shù)作為故障診斷的高維特征[1],但得到的高維特征空間中不可避免地存在一些與故障診斷不相關(guān)的特征和冗余特征,不利于故障診斷,因此需要提取高維特征空間中的低維特征。主成分分析(Principal Component Analysis,PCA)僅能有效地發(fā)現(xiàn)全局歐式結(jié)構(gòu),因而無法發(fā)現(xiàn)隱藏在數(shù)據(jù)中內(nèi)在的非線性流形結(jié)構(gòu)。為了發(fā)現(xiàn)位于軸承數(shù)據(jù)空間中的內(nèi)在流形結(jié)構(gòu),文獻(xiàn)[2]等利用流形學(xué)習(xí)的方法提取故障信息,取得了不錯的效果。流形學(xué)習(xí)方法是以數(shù)據(jù)最近鄰域的個數(shù)和本質(zhì)維數(shù)或降維維數(shù)已知為前提,降維效果嚴(yán)重依賴于對這些參數(shù)的選擇,但目前流形學(xué)習(xí)中最近鄰域的個數(shù)和本質(zhì)維數(shù)如何確定是一個有待研究的問題,而且它們是定義在訓(xùn)練樣本上的,還不能有效處理新測試樣本。
針對流形學(xué)習(xí)面臨的上述問題,提出了基于低秩鑒別投影的軸承故障特征提取方法。低秩表示同時考慮到類間的差異性和類內(nèi)的同一性,因而能準(zhǔn)確描述數(shù)據(jù)的全局結(jié)構(gòu),低秩鑒別投影算法擁有低秩表示的良好數(shù)據(jù)全局結(jié)構(gòu)表達(dá)能力和一定的判別結(jié)構(gòu)表達(dá)能力[3],并且能夠得到顯示的投影矩陣,泛化能力強(qiáng)。
假設(shè)訓(xùn)練數(shù)據(jù)樣本由X=[x1,x2,…,xn]構(gòu)成,低秩表示[3-5]的目的是尋求訓(xùn)練集中每一個獨(dú)立的數(shù)據(jù)向量作為所有數(shù)據(jù)向量的線性組合表示,考慮到實(shí)際數(shù)據(jù)采集過程中的噪聲干擾,低秩表示模型可以表示為
(1)
式中:W為系數(shù)矩陣;‖W‖*為矩陣W的核范數(shù),即該矩陣奇異值之和;參數(shù)a>0;E2,1為噪聲矩陣的l2,1范數(shù),用來描述噪聲的類型,在此用來模型化受大噪聲干擾的樣本。(1)式的最優(yōu)解可利用非精確增廣拉格朗日乘子法求解[6]。
低秩鑒別投影算法[7-8]的思想是:首先求出(1)式的最優(yōu)解W并將其分解為類內(nèi)表示、類間表示和噪聲3個部分;然后盡量使類間散度足夠大,類內(nèi)散度和噪聲散度足夠?。蛔詈髮ふ乙粋€投影矩陣,使數(shù)據(jù)經(jīng)過線性投影后的低秩結(jié)構(gòu)保持不變,且低維空間聚類效果更好。
(2)
假設(shè)經(jīng)過線性轉(zhuǎn)換后低秩結(jié)構(gòu)保持不變,則
y=PTx,
(3)
(4)
式中:P為投影矩陣。
在變換空間中,類內(nèi)散度可描述為
(5)
其中類內(nèi)散度矩陣為
(6)
類間散度可以描述為
(7)
其中類間散度矩陣為
同時,為了使數(shù)據(jù)更好的分布,希望投影后的噪聲越小越好,因此要使(4)式中PTei,j的范數(shù)最小化,即
(9)
X(I-W)(I-W)TXT。
(10)
則最優(yōu)投影的判別準(zhǔn)則為
(11)
式中:I為單位矩陣;r為組合參數(shù),用于平衡類內(nèi)散度與噪聲散度。為了更容易地估計參數(shù),簡便計算,定義一個聯(lián)合矩陣,令
(12)
判別準(zhǔn)則轉(zhuǎn)化為
(13)
低秩鑒別投影算法步驟為:
1)給定c類數(shù)據(jù)集X,用非精確增廣拉格朗日乘子法計算最優(yōu)相似矩陣W。
將上述時域特征和頻域特征組成N×D的故障診斷高維特征空間。每種軸承狀態(tài)數(shù)據(jù)抽取50 組樣本,則全體狀態(tài)樣本數(shù)N=200;高維特征數(shù)D=16。每種狀態(tài)下抽取25組樣本作為訓(xùn)練樣本D1,其余的作為測試樣本D2。
信號的稀疏表示[9-10](Sparse Representation)是指將信號在特定的原子庫中進(jìn)行分解,如果原子庫中的原子與信號的主要成分相似,則僅需要少數(shù)原子的線性組合就能很好地逼近原始信號。
選取y中第i類別的訓(xùn)練樣本為Ai=[ai1,ai2,…,ain]∈Rm×n,則具有共同類別屬性的測試樣本βi∈Rm就可以近似表示為第i類訓(xùn)練樣本的線性組合,即
βi=xi1ai1+xi2ai2+…+xinain,
(14)
xi,j∈R;ai,j∈Rm;xi=[xi1,xi2,…,xin]。
式中:xi為樣本βi在訓(xùn)練樣本Ai下的稀疏表示系數(shù);aij為第i類別下的第j個樣本。
定義一個由y中4類訓(xùn)練樣本集構(gòu)成的完整樣本字典A=[A1,A2,A3,A4],則測試樣本β在字典A下可表示為
β=Ax。
(15)
考慮數(shù)據(jù)噪聲的情況下,稀疏表示問題可以表述為
(16)
對于測試樣本β,可以通過優(yōu)化目標(biāo)(16)式求出其稀疏表示系數(shù)x,即得到測試樣本在全局表示下的稀疏表示。實(shí)際應(yīng)用中,由于噪聲與模型錯誤,其非零元素通常會散布于較多類別間。為通過x完成分類工作,可采用分類函數(shù)
minri(y)=β-Aδi(x)2;i=1,2,3,4,
(17)
式中:函數(shù)δi表示保留第i類元素,其余元素置0。
選擇美國凱斯西儲大學(xué)電氣工程實(shí)驗(yàn)室的軸承試驗(yàn)數(shù)據(jù)進(jìn)行分析驗(yàn)證。軸承型號SKF6205,通過電火花加工單點(diǎn)損傷,損傷部位直徑為0.036 mm,采樣頻率為48 kHz。試驗(yàn)?zāi)M軸承在1 797 r/min時,鋼球故障、內(nèi)圈故障、外圈故障、正常工作共4種工作狀態(tài)。
為了驗(yàn)證提出方法的提取效果,選擇PCA、等距映射(ISOMAP)流形學(xué)習(xí)方法進(jìn)行對比分析。均提取前3個主分量,使提取效果可視化。
3.2.1 PCA的特征提取
經(jīng)PCA提取的前3個主分量為P1~P3,軸承的4種狀態(tài)樣本在三維子空間的分布如圖1所示。
圖1 PCA特征提取效果
由圖可知,內(nèi)圈故障樣本與鋼球故障樣本重疊比較嚴(yán)重,并且分布較分散。有1個鋼球故障樣本與正常故障樣本重疊,相對來說,正常樣本與外圈故障樣本聚類質(zhì)量更良好。這是由于鋼球故障表現(xiàn)為隨機(jī)的沖擊分量,包含沖擊分量的樣本與內(nèi)圈故障樣本接近。由此可見,PCA方法對軸承故障樣本的聚類效果不太理想。
3.2.2 等距映射流形學(xué)習(xí)算法特征提取
等距映射流形學(xué)習(xí)算法的主要思想是利用局部鄰域距離近似地計算數(shù)據(jù)點(diǎn)間的流形測地距離,并將高維數(shù)據(jù)間測地距離作為其本質(zhì)低維表示間歐氏距離的不變特征量,進(jìn)而完成數(shù)據(jù)降維。仿真試驗(yàn)中,通過ISOMAP提取的3個主分量為L1~L3,軸承的4種故障狀態(tài)樣本在三維子空間上的分布如圖2所示,其中鄰域K=5。
圖2 ISOMAP特征提取效果
由圖可知,正常狀態(tài)樣本和外圈故障狀態(tài)樣本有較好的聚類效果,而內(nèi)圈故障狀態(tài)樣本分布較遠(yuǎn)、個別樣本與滾動體故障狀態(tài)樣本發(fā)生重疊。由于ISOMAP屬于非線性的流形學(xué)習(xí)算法,很好地揭示了高維數(shù)據(jù)的非線性結(jié)構(gòu),聚類性能相對于PCA得到了一定的提高,但I(xiàn)SOMAP的基本假設(shè)是全局等距映射和凸的數(shù)據(jù)空間,實(shí)際應(yīng)用中難以滿足。
3.2.3 低秩鑒別投影的特征提取
設(shè)置參數(shù)尋優(yōu)范圍:a為2~8,r為2-4~2-1,搜索步長為0.5。參數(shù)尋優(yōu)結(jié)果如圖3所示,圖中水平面坐標(biāo)分別取參數(shù)a,r的以2為底的對數(shù),圖中顯示了低秩鑒別投影算法利用不同的參數(shù)對(a,r)所對應(yīng)的軸承工作狀態(tài)識別正確率。由圖可知,當(dāng)a=5.656 9,r=0.062 5時,狀態(tài)識別率最高,因此,可以選擇上述最優(yōu)參數(shù)值作為LRDP的參數(shù)值提取軸承故障信息。
圖3 參數(shù)尋優(yōu)3D圖
選擇參數(shù)a=5.656 9,r=0.062 5,通過LRDP提取的3個主分量為K1~K3,軸承4種狀態(tài)樣本在三維子空間中的分布如圖4所示,由圖可知,LRDP完全準(zhǔn)確地識別了軸承的不同故障狀態(tài),可以用于軸承故障診斷。
圖4 LRDP特征提取效果
提出了一種基于低秩鑒別投影的故障特征提取方法,并與網(wǎng)格搜索法、稀疏表示分類器組合起來對算法中參數(shù)進(jìn)行尋優(yōu)。經(jīng)仿真表明,低秩鑒別投影算法能夠準(zhǔn)確地描述數(shù)據(jù)的全局結(jié)構(gòu)和判別結(jié)構(gòu),對于軸承故障特征提取是一種有效的特征提取算法。