古瑩奎 承姿辛 朱繁瀧
江西理工大學,贛州,341000
基于主成分分析和支持向量機的滾動軸承故障特征融合分析
古瑩奎承姿辛朱繁瀧
江西理工大學,贛州,341000
為有效降低滾動軸承故障特征的維數并提高診斷準確率,將主成分分析(PCA)和支持向量機(SVM)方法應用到軸承故障特征的融合分析中,給出了相應的決策流程。應用基于小波包分解的特征提取算法及特征向量的構造方法對不同狀態(tài)下的振動信號進行分解,得到用于表征軸承運行狀態(tài)的8維特征集合;應用PCA提取累積貢獻率達到95%的特征主成分并輸入SVM分類器中進行識別。結果表明,將滾動軸承故障特征從8維降低到5維,仍可有效表征軸承的狀態(tài),但大大降低了計算的復雜性;故障診斷的準確率達到97%以上,診斷時間也相對較短;4種軸承狀態(tài)識別的準確率從高到低依次為正常、外圈剝落、滾動體剝落和內圈剝落,可為確保設備安全運行和快速故障診斷提供理論依據。
主成分分析;支持向量機;特征融合;故障診斷;滾動軸承
在故障診斷中,如何盡可能多且準確地從信號中獲取與設備狀況相關的信息是基于振動信號進行故障診斷的關鍵[1]。任何一類診斷對象,單用一方面信息來反映其狀態(tài)行為都是不完整的,僅依靠單一的理論方法和單一的故障信息也難以對故障作出精確的診斷。為對設備作出更準確、更全面的狀態(tài)評估,需要從不同角度獲取更多表征其運行狀態(tài)的信息,但隨著信息量的增大,急需解決的問題是如何充分地融合篩選信息并加以高效利用。
當前,神經網絡、證據理論、互信息、支持向量機(support vector machine,SVM)等方法已被引入故障信息的融合中并得到有效應用。王赟松等[2]在發(fā)動機的故障診斷中用基于神經網絡的特征層信息融合診斷取代單一傳感器,有效地壓縮了信息并實現了實時處理與診斷,取得了良好效果。Otman等[3]用基于信息融合的D-S證據理論對發(fā)動機進行了故障診斷。而針對傳統(tǒng)D-S證據理論中存在的證據沖突等問題,Niu等[4]通過神經網絡將多傳感器收集信號進行特征級融合后,應用D-S回歸和最小二乘SVM進行決策級融合,實現對壓縮機的狀態(tài)監(jiān)測。Peng等[5]在將互信息理論用于特征選擇方面做了大量的工作,使用互信息最大最小相關性的方法評價特征,通過互信息的大小判斷特征之間的相似程度,認為相似程度高的特征攜帶的故障信號具有冗余性而予以剔除。李冰等[6]將互信息用于軸承振動信號特征參數集的優(yōu)化選擇。Zhao[7]運用基于粗糙集的特征選擇方法和基于SVM的特征選擇方法進行行星齒輪箱的故障診斷,在252種反映設備運行狀態(tài)的特征中選擇了10余種關鍵特征,從而避免了由于故障特征多而產生的分類器模型復雜和效率低等問題。蔣玲莉等[8]將SVM應用于多振動信息融合的齒輪故障診斷中。
以上方法盡管在故障特征的融合中得到應用,但隨著信息量的增大,單一的方法仍然難以對信息進行有效的處理,尤其是當冗余信息較大時。本文以滾動軸承為研究對象,將基于主成分分析(principal component analysis,PCA)的特征級融合引入旋轉機械的故障診斷,對軸承試驗中由小波包分解所得特征進行融合,實現故障特征的降維,并結合SVM分類器良好的分類性能,使得輸入到故障分類器的特征集更加簡練高效,以降低分類器運行時間,減小計算量,通過對冗余信息的刪除提高故障診斷的準確率。
PCA是一種分析、簡化數據的技術,通過線性變換將問題從高維轉化到低維,保留低階主成分,刪除高階成分,達到降低數據集維數的目的。通過降維將原本復雜的多維數據轉換成簡單、直觀且不相關的低維數據,有效降低數據分析的難度和復雜程度[9]。
將機械振動信號用模式向量矩陣表示為X=[x1x2…xn],其中第l列為Xl=[x1lx2l…xnl]T,xl表示設備的某一狀態(tài),其協方差矩陣為[10]
(1)
求矩陣Rx的特征值以及特征向量。將特征值λi(i=1,2,…,n)進行排序:λ1>λ2>…>λn,各特征值對應的特征向量為vi。樣本xj投影到特征向量vi,得到該方法對應的主成分量為
(2)
所求特征向量構成n維正交空間,將樣本投影到該空間即可得到對應的n維主成分量。重構時特征向量的貢獻率與其所對應的特征值大小成正比。設正交空間中前l(fā)個主成分量為y1,y2,…,yl,其累積貢獻率為
(3)
θ的取值通常在95%以上,即l(l SVM是建立在統(tǒng)計學習理論基礎上的一種數據挖掘方法,能非常成功地處理回歸問題和模式識別等問題,可推廣應用于預測和綜合評價等領域。SVM的機理是尋找一個滿足分類要求的最優(yōu)分類超平面,使得該超平面在保證分類精度的同時,超平面兩側的空白區(qū)域最大化[11-12]。實質上,機械設備故障診斷是多類別模式識別和多值分類問題,設備故障類型和失效形式多種多樣,其損壞的嚴重程度也有大小之分,因而,如何實現SVM分類器在多值分類中的應用是實現準確的故障特征分類與診斷至關重要的環(huán)節(jié)之一。目前,SVM處理多值分類問題使用最為廣泛的算法有一對一算法和一對多算法[11]。 原始信號經小波包分解后得到具有一定能量的分解頻帶信號,可將各分解頻帶信號所攜能量與信號總能量之比作為特征向量以表征設備的運行狀態(tài)。 信號經小波包分解后所得分解頻帶相互獨立且無冗余,由能量守恒定理可得[13] (4) 設原始信號x(t)長度為N,分解頻帶離散信號xk,m(i)長度縮減為2-kN,其能量可表示為 (5) 歸一化處理后,第m頻帶分解信號的相對能量可表示為 En(m)=En(xk,m(i))/En(x(t)) (6) 根據能量守恒原理,顯然有 (7) 設備運行狀態(tài)的改變使其振動信號各頻帶內信號能量隨之發(fā)生變化,因此分解頻帶信號能量占總能量之比組成的特征向量e可很好地表征設備的運行狀態(tài),其表達式為 e=(En(xk,1(i)),En(xk,2(i)),…, En(xk,m(i)))/En(x(t)) (8) 根據PCA、SVM和小波包分解理論,結合機械故障診斷的特點,基于PCA與SVM的故障特征分類與診斷流程如圖1所示。 圖1 基于PCA和SVM的故障特征分類與診斷流程 在訓練階段,采集設備已知狀態(tài)的振動信號,將振動信號進行小波包分解,求得用于表征已知狀態(tài)的特征向量。利用PCA進行特征的融合降維,將融合后的特征向量作為SVM分類器的輸入,進行模型訓練并找出已知狀態(tài)訓練樣本中的支持向量,據此確定最優(yōu)分類超平面;在測試階段,測取未知狀態(tài)設備振動信號,將振動信號進行小波包分解,利用PCA進行特征的融合降維,求得用于表征未知狀態(tài)的特征向量。在訓練模型已完成的情況下將用于表征未知狀態(tài)的特征向量作為SVM分類器的輸入,SVM分類器將根據最優(yōu)分類超平面對用于表征未知狀態(tài)的特征向量作出分類決策。 4.1試驗數據描述 對308軸承分別在外圈滾道剝落、內圈滾道剝落、滾動體剝落和正常4種不同狀態(tài)下的信號進行分析。測取其振動信號,采樣頻率為25 kHz,軸承工作轉速為1600 r/min,樣本長度為8192。構造基于小波包分解的故障特征向量。由于樣本數目較多,僅列出外圈滾道剝落故障狀態(tài)下8個經小波包分解后的結果,見表1,各頻帶寬為1562.5 Hz,由低到高分布,如頻帶1的范圍為0~1562.5 Hz,頻帶2的范圍為1562.5~3125 Hz,依此類推。經分解可以得到故障的8維特征向量,如外圈剝落故障樣本1,e1=(0.086 9240.039 2820.287 580.271 6280.026 9880.035 6710.158 9410.092 986)。 表1 外圈滾道剝落故障信號小波包分解各頻帶的相對能量比 在試驗中共測得試驗數據128組,其中滾動體剝落、內圈剝落、外圈剝落以及正常狀態(tài)各32組。為了方便比較和更好地表現SVM分類器的性能,將原始數據分成訓練樣本較多和訓練樣本較少的兩組數據集,見表2。 表2 試驗樣本 4.2基于PCA的軸承故障特征融合分析 將試驗數據進一步處理,通過小波包分解提取的8維特征盒圖如圖2所示。從中可以大致了解8種特征的一些基本情況,如特征5、6比其他特征具有更多的異常點,但其分布的整體變化幅度比其他特征小,變化幅度最大的特征是特征1,特征3、4、7、8整體分布比較均勻。 圖2 軸承試驗中8種特征數據的描述(已歸一化) 將得到的8維特征向量進行基于PCA的融合,提取累積貢獻率達到95%的主成分。經過PCA融合后,軸承試驗所提取的5個主成分貢獻率值見表3,前5個主成分累積貢獻率達到95%以上??梢钥闯鲋鞒煞?的貢獻率最大,達57.8622%,從理論上說主成分1集合了原8維特征57%左右的信息,是所有主成分中最具故障判斷價值的成分。 表3 軸承試驗所提取的5個主成分貢獻率 % 圖3為利用PCA方法融合后的前5個主成分特征波形圖??梢钥闯?第1個特征參數主成分1保留了原信號大部分信息,變化趨勢較為明顯地表征了不同狀態(tài)下的軸承,與樣本狀態(tài)變化趨勢基本保持一致,其他參數的變化整體較為混亂,無規(guī)律性可言,對不同狀態(tài)軸承的表征能力較弱。 圖3a為PCA融合后軸承主成分1的特征波形圖,4個圓圈分別對應軸承試驗中的4種不同狀態(tài)的軸承,除外圈剝落(樣本1~32)與內圈剝落(樣本33~64)分辨率較低外,滾動體剝落(樣本65~96)與正常狀態(tài)軸承(樣本97~128)間區(qū)分度較高。 4.3基于SVM的軸承故障特征分類 4.3.1SVM核函數的選擇 (a)主成分1 (b)主成分2 (c)主成分3 (d)主成分4 (e)主成分5圖3 軸承試驗前5個主成分隨樣本變化趨勢圖 為選擇合適的核函數以獲得SVM最佳的分類性能,分別選擇線性核函數、多項式核函數、徑向基核函數、雙曲正切核函數對樣本進行SVM訓練。同時為了比較不同SVM分類算法對試驗結果的影響,分別選用一對多、一對一算法進行計算。對準確率結果采用5折交叉驗證方法進行驗證,不同故障類別軸承的分類準確率結果見表4和表5。 表4 不同故障狀態(tài)的測試分類結果(數據集1) % 表5 不同故障狀態(tài)的測試分類結果(數據集2) % 由表4和表5可知,SVM分類器并沒有因為訓練樣本數據的減少而導致準確率出現大的波動,依然表現出較高的準確率。采用了一對一和一對多兩種算法,SVM分類器在準確率方面并沒有顯著的差距。核函數確定了從樣本空間到高維特征空間的非線性映射,不同的核函數及其參數對應著樣本數據在高維特征空間分布不同的復雜程度,從而影響最終的分類準確率。因而,選擇不同的核函數對分類結果有一定的影響,如雙曲正切核函數在本次試驗中的分類準確率明顯低于其他3種核函數。試驗結果顯示,徑向基核函數的準確率最高,雙曲正切核函數最低,線性核函數和多項式核函數的準確率略低于徑向基核函數,但明顯高于雙曲正切核函數,說明在分類準確率上雙曲正切核函數綜合性能最差,因而選擇徑向基核函數。 4.3.2基于SVM的軸承故障特征融合 將前文試驗中的8維特征向量進行基于PCA的融合,提取累積貢獻率達到95%的主成分。將融合后的5個主成分輸入SVM分類器進行識別,為避免偶然性,同時用BP神經網絡分類器進行結果比較。分類結果見表6。 表6 軸承8維特征PCA融合前后的故障診斷準確率 由表6的結果分析可知,基于PCA和VSM的特征融合無論在診斷的準確率和時間方面都具有優(yōu)勢,準確率可以達到97%以上。因而,將兩者相結合能充分利用各特征間的互補性,將特征信息中的冗余信息剔除,最大化壓縮信息量,提高特征表征運行狀態(tài)的能力,從而提高故障診斷率。同時,基于PCA的特征融合方法還能有效降低特征維數,減少分類器的訓練時間,這一性能在處理海量數據時具有一定價值。 在軸承試驗中,作為SVM分類器輸入的5個主成分累積貢獻率為97.2840%,這5個主成分幾乎包含原有8維特征的全部信息。但在實際運用中,融合前的特征往往較多,為盡可能達到降低維數的要求,應用PCA融合的方法保留主成分貢獻率很難達到95%以上,對于故障狀態(tài)相對不是很復雜的情況,可適當降低主成分貢獻率的設定值,如取值在85%左右。在本文中前3個主成分的貢獻率為83.5083%,將前3個主成分作為SVM輸入進行故障診斷,準確率為82.5641%。相對于取5個主成分,其診斷準確率有較大的下降。 圖4為基于PCA的前3個主成分特征繪制的樣本空間三維圖,可以通過前3個主成分特征表征4種不同狀態(tài)的軸承。從圖4中可以看出,正常狀態(tài)的軸承最易識別,其分布圖也最為集中,其次為外圈剝落,該狀態(tài)下的分布圖也較為緊密,以上兩種狀態(tài)的軸承通過3個主成分特征均能達到很高的識別率。內圈剝落和滾動體剝落這兩種狀態(tài)的軸承較難識別,部分特征間出現了相互干涉的現象,但考慮到這3個主成分累積貢獻率僅為83.5083%,且從原8維特征降到3維,特征維數幅度壓縮量大使得信息量損失較大,所以出現了部分樣本難以區(qū)分的情況。因而,為提高診斷的準確率,不應過度對信息進行壓縮。 圖4 基于PCA融合后前3個主成分的樣本分布圖 (1)采用PCA和SVM相結合的方法,通過刪除冗余特征進行融合的方法可以極大地壓縮信息量,既能降低特征維數,降低計算的復雜性,又能有效表征軸承的故障狀態(tài),診斷精度也較其他方法高。 (2)對滾動軸承來說,正常狀態(tài)的軸承較其他狀態(tài)易識別,外圈剝落次之,內圈剝落和滾動體剝落這兩種狀態(tài)的軸承較接近,相對而言較難識別。因而,為保證故障診斷的有效性,在信息融合過程中不宜過度進行信息的壓縮而使信息量損失較大。 致謝感謝加拿大阿爾伯特大學可靠性實驗室提供的技術和條件支持。 [1]徐曉濱,王玉成,文成林.評估診斷證據可靠性的信息融合故障診斷方法[J].控制理論與應用,2011,28(4):504-510. Xu Xiaobin,Wang Yucheng,Wen Chenglin.Information-fusion Method for Fault Diagnosis Based on Reliability Evaluation of Evidence[J].Control Theory & Applications,2011,28(4):504-510. [2]王赟松,褚福磊, 何永勇, 等. 基于信息融合技術的發(fā)動機故障診斷的研究[J].內燃機學報,2003,21(5):374-378. Wang Yunsong,Chu Fulei,He Yongyong,et al.Study on Fault Diagnosis for Automobile Electronically Controlled Engine Based on Data Fusion Technique[J].Transactions of CSICE,2003,21(5):374-378. [3]Otman B,Yuan X H.Engine Fault Diagnosis Based on Multi-sensor Information Fusion Using Dempster-Shafer Evidence Theory[J].Information Fusion,2007,8(4):379-386. [4]Niu G,Yang B S.Intelligent Condition Monitoring and Prognostics System Based on Data-fusion Strategy[J].Expert Systems with Applications,2010,37(12):8831-8840. [5]Peng H,Long F,Ding C.Feature Selection Based on Mutual Information:Criteria of Max-dependency,Max-relevance,and Min-redundancy[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(8):1226-1238. [6]李冰,張培林,任國全,等.基于互信息的滾動軸承故障特征選擇方法[J].測試技術學報,2009,23(2):183-188. Li Bing,Zhang Peilin,Ren Guoquan,et al.Features Selection for Rolling Bearing Fault Diagnosis Based on Mutual Information[J].Journal of Test and Measurement Technology,2009,23(2):183-188. [7]Zhao Xiaomin.Data-driven Fault Detection,Isolation and Identification of Rotating Machinery:with Applications to Pumps and Gearboxes[D].Edmonton:University of Alberta,2012. [8]蔣玲莉,劉義倫,李學軍,等.基于SVM與多振動信息融合的齒輪故障診斷[J].中南大學學報(自然科學版),2010,41(6):2184-2188. Jiang Lingli,Liu Yilun,Li Xuejun,et al.Gear Fault Diagnosis Based on SVM and Multi-sensor Information Fusion[J].Journal of Central South University(Science and Technology),2010,41(6):2184-2188. [9]周榮義,鐘岸,任競舟,等.基于主成分分析和神經網絡的事故預測方法及應用[J].中國安全科學學報,2013,23(7):55-60. Zhou Rongyi,Zhong An,Ren Jingzhou,et al.An Accident Forecasting Method of ANN Based on PCA and Its Application[J].China Safety Science Journal,2013,23(7):55-60. [10]Jolliffe I T.Principal Component Analysis[M].New York:Springer-Verlag,2002. [11]丁世飛,齊丙娟,譚紅艷.支持向量機理論與算法研究綜述[J].電子科技大學學報,2011,40(1):2-10. Ding Shifei,Qi Bingjuan,Tan Hongyan.An Overview on Theory and Algorithm of Support Vector Machines[J].Journal of University of Electronic Science and Technology of China,2011,40(1):2-10. [12]聶磊,黃圣國,舒平,等.基于支持向量機(SVM)的民用飛機重著陸智能診斷研究[J].中國安全科學學報,2009,19(7):149-154. Nie Lei,Huang Shengguo,Shu Ping,et al.Intelligent Diagnosis for Hard Landing of Aircraft Based on SVM[J].China Safety Science Journal,2009,19(7):149-154. [13]程軍圣,于德介,鄧乾旺,等.連續(xù)小波變換在滾動軸承故障診斷中的應用[J].中國機械工程,2003,14(23):2037-3040. Cheng Junsheng,Yu Dejie,Deng Qianwang,et al.An Application of Continuous Wavelet Transform to Fault Diagnosis of Rolling Element Bearings[J].China Mechanical Engineering,2003,14(23):2037-3040. (編輯陳勇) Rolling Bearing Fault Feature Fusion Based on PCA and SVM Gu YingkuiCheng ZixinZhu Fanlong Jiangxi University of Science and Technology,Ganzhou,Jiangxi,341000 To effectively reduce the dimension of rolling bearing fault features and improve the accuracy of diagnosis,the PCA and SVM were applied in the fusion of bearing fault features,and the corresponding decision-making process was presented.By using the fault feature extraction algorithm and eigenvector constructing methods which were proposed based on wavelet packet decomposition,the bearing vibration signals in different states were decomposed to get the 8-dimensional feature sets which could be used to characterize the running conditions of the bearing.The cumulative contribution rate of 95% principal components were extracted by using PCA method and were input into SVM classifier for identification.Results show that the fault feature dimensions of rolling bearing can be reduced from 8-dimensions to 5-dimensions,which can still characterize the bearing status effectively,and the computational complexity can be reduced.The fault diagnosis accuracy is higher than 97%,and the diagnosis time is short relatively.The identification accuracy of four bearing status from high to low in turn is normal, outer ring peel, roller peel and inner ring peel.It can ensure the safe operation of the equipment and provide theoretical basis for fast fault diagnosis. principal component analysis(PCA);support vector machine(SVM);feature fusion;fault diagnosis;rolling bearing 2015-01-14 國家自然科學基金資助項目(61164009, 61463021); 江西省自然科學基金資助項目(20132BAB206026);江西省教育廳科學技術研究項目 (GJJ14420); 江西省青年科學家培養(yǎng)對象計劃資助項目(20144BCB23037) X928.03; TH165.3DOI:10.3969/j.issn.1004-132X.2015.20.014 古瑩奎,男,1976年生。江西理工大學機電工程學院教授、博士。主要研究方向為機械裝備可靠性與健康管理。發(fā)表論文40余篇。承姿辛,女,1991年生。江西理工大學機電工程學院碩士研究生。朱繁瀧,男,1989年生。江西理工大學機電工程學院碩士研究生。2 小波包故障特征提取算法及特征向量的構造
3 基于PCA與SVM的故障特征分類與診斷流程
4 基于PCA與SVM的滾動軸承故障特征融合分析
5 結束語