古瑩奎 楊子茜 朱繁瀧
江西理工大學(xué),贛州,341000
基于主成分分析的齒輪箱故障特征融合分析
古瑩奎楊子茜朱繁瀧
江西理工大學(xué),贛州,341000
為有效降低齒輪箱故障特征的維數(shù)并提高診斷準確率,提出了基于主成分分析法的齒輪箱故障特征融合方法,并結(jié)合支持向量機和BP神經(jīng)網(wǎng)絡(luò)對診斷的準確率進行了分析。以齒輪箱中不同裂紋齒輪為對象,選取能夠表征齒輪箱故障狀態(tài)的時域、頻域和基于希爾伯特變換的36個特征,提取累積貢獻率達到95%以上的主成分并輸入支持向量機分類器中進行分類識別,用BP神經(jīng)網(wǎng)絡(luò)分類器進行結(jié)果的比較分析。結(jié)果表明,采用主成分分析法與支持向量機相結(jié)合的方法,既能降低特征維數(shù),降低計算的復(fù)雜性,又能有效地表征齒輪箱的運行狀態(tài),識別不同裂紋水平的齒輪,比單獨使用支持向量機分類器的方法診斷準確率更高,訓(xùn)練時間更短。
齒輪箱;主成分分析;支持向量機;BP神經(jīng)網(wǎng)絡(luò);特征融合
實現(xiàn)設(shè)備運行狀態(tài)分析與故障診斷的必要前提是從振動信號中提取能夠有效表征設(shè)備運行狀態(tài)的特征,并在一定框架下對其進行選擇,刪除冗余,對所選特征進行深入分析,從而提高狀態(tài)識別與故障診斷的準確率[1]。因而,如何盡可能多且準確地從信號中獲取與設(shè)備狀況相關(guān)的信息是基于振動信號進行故障診斷的關(guān)鍵。在故障診斷中,對任何一類診斷對象,單用一方面的信息來反映其狀態(tài)行為都是不完整的。為對設(shè)備做出更準確、更全面的狀態(tài)評估,需要從不同角度獲取更多能夠表征其運行狀態(tài)的信息。但是,隨著信息量的增加,如何充分地融合篩選信息并加以高效利用也成為急需解決的問題之一。當前,神經(jīng)網(wǎng)絡(luò)[2]、證據(jù)理論[3-4]、互信息[5-6]、支持向量機[7-8]、遺傳算法[9]和粗糙集[10]等已被應(yīng)用到故障診斷中。本文以齒輪箱為研究對象,將基于主成分分析(principal component analysis,PCA)的特征級融合引入旋轉(zhuǎn)機械的故障診斷。利用主成分分析法可以有效融合去除冗余信息的優(yōu)點,實現(xiàn)故障特征的降維,并結(jié)合支持向量機(support vector machine,SVM)分類器良好的分類性能,準確地識別不同裂紋齒輪,有效地克服由于復(fù)雜工況對故障診斷工作帶來的干擾。
主成分分析法是一種分析、簡化數(shù)據(jù)的方法,該方法通過線性變換將問題從高維轉(zhuǎn)化到低維,保留低階主成分,刪除高階成分達到降低數(shù)據(jù)集維數(shù)的目的;通過降維將原本復(fù)雜的多維數(shù)據(jù)轉(zhuǎn)換成簡單、直觀且不相關(guān)的低維數(shù)據(jù),有效降低數(shù)據(jù)分析的難度和復(fù)雜程度[11]。
將機械振動信號用模式向量矩陣表示為X=[x1x2…xn],其中第k列為xk=[x1kx2k…xnk]T,xk表示設(shè)備的某一狀態(tài),其協(xié)方差矩陣為
求矩陣Rx的特征值以及特征向量,將特征值λi(i=1,2,…,n)進行排序:λ1>λ2>…>λn。各特征值對應(yīng)的特征向量為vi(i=1,2,…,n)。將樣本xj投影到特征向量vi,得到該方法所對應(yīng)的主成分量:
所求特征向量構(gòu)成n維正交空間,將X投影到該空間即可得到對應(yīng)的n維主成分量。重構(gòu)時特征向量的貢獻率與其所對應(yīng)的特征值大小成正比。設(shè)正交空間中前k個主成分量為y1,y2,…,yk,其累計貢獻率為
θ的取值通常在95%以上,即k(k 選取以下齒輪箱的36種特征參數(shù)進行分析。 (1)時域特征參數(shù)。共有16個,即平均值、均方根標準差、方根幅值、絕對平均值、偏斜度、峭度、方差、最大值、最小值、峰峰值、波形指標、峰值指標、脈沖指標、裕度指標、偏斜度指標、峭度指標,依次編為1~16。 (2)頻域特征參數(shù)。共有13個,見表1,依次編為17~29。表1中,X(n)為離散信號序列,數(shù)據(jù)長度為N,f(n)為n時刻功率頻對應(yīng)的頻率值[12-13]。 表1 齒輪箱頻域故障特征名稱及定義 (3)基于希爾伯特變換的特殊特征參數(shù)。將齒輪箱振動信號通過希爾伯特變換和傅里葉變換并進行預(yù)處理,得到殘余和差異信號以及頻譜,按表2中公式求得30~36號特征。表2中,d(k)為樣本離散信號序列,數(shù)據(jù)長度為N,r(k)為殘差信號,e(k)=|b(t)+iH(b(t))|,b(t)為齒輪嚙合頻率的帶通濾波,H[b(t)]表示對b(t)進行希爾伯特變換[14],其他參數(shù)符號意義見文獻[14]。 表2 齒輪箱特殊故障特征名稱及定義 如圖1所示,實驗設(shè)備包括一臺2.2 kW的驅(qū)動電機,與之連接的速度調(diào)節(jié)器控制其轉(zhuǎn)速。電磁制動器與齒輪箱輸出端相連,通過制動調(diào)節(jié)器模擬不同的負載。齒輪箱內(nèi)部結(jié)構(gòu)如圖2所示,齒輪3為測試齒輪,通過更換齒輪3可以測得不同裂紋的齒輪箱振動信號。 圖1 實驗設(shè)備結(jié)構(gòu)圖 圖2 齒輪箱內(nèi)部結(jié)構(gòu)圖 實驗參數(shù)見表3,f1為軸1和齒輪1的旋轉(zhuǎn)頻率,f2為軸2和齒輪2及齒輪3的旋轉(zhuǎn)頻率,f3為軸3和齒輪4的旋轉(zhuǎn)頻率,f12為齒輪1和齒輪2的嚙合頻率,f34為齒輪3和齒輪4的嚙合頻率。齒輪箱中各個齒輪的齒數(shù)、數(shù)量和故障齒輪狀態(tài)見表4。 表3 齒輪箱旋轉(zhuǎn)頻率和齒輪嚙合頻率 Hz 表4 實驗齒輪箱中齒輪描述 通過改變驅(qū)動電機轉(zhuǎn)速和齒輪箱負載來模擬齒輪箱運行的不同工況,記錄各工況下的振動信號。本次實驗包括以下12種實驗條件:①兩種不同轉(zhuǎn)速,即驅(qū)動電機旋轉(zhuǎn)頻率為30Hz和40Hz;②兩種不同程度負載,0表示無負載,h表示50%滿負載;③三種齒輪裂痕故障,分別為正常、25%裂紋、50%裂紋,分別用0Q、1Q、2Q表示。 由于垂直方向上的振動信號對齒輪裂紋較為敏感,故只對垂直方向的信號進行研究。采樣頻率為2560Hz,數(shù)據(jù)長度N=8192,每種實驗工況條件下取10組數(shù)據(jù),共120組數(shù)據(jù)。對每組信號分別提取以上36種特征,求得120×36的特征全集矩陣。將120組樣本進行整理編號,見表5。 表5 120個樣本的故障類型及工況描述 由于每個特征參數(shù)表征的物理意義各不相同,參數(shù)間尺度大小不一,不同參數(shù)對不同齒輪裂痕狀態(tài)的表征各不相同、規(guī)律不一,為了使參數(shù)在評價時更具參考意義,對每個參數(shù)進行歸一化處理,如圖3所示。 圖3 齒輪箱實驗提取的36種特征數(shù)據(jù)描述(已歸一化) 將齒輪箱36種特征直接進行PCA融合,提取累積貢獻率在95%以上的7個主成分,如圖4所示。將融合結(jié)果輸入到支持向量機中進行分類,為避免結(jié)果的偶然性,同時用BP神經(jīng)網(wǎng)絡(luò)分類器進行結(jié)果比較。 圖4 累積貢獻率達95%的7個主成分 從圖4中可以看出,前7個主成分累積貢獻率為95.3148%,其中主成分1在貢獻率中所占比列明顯高于其他主成分,其值為52.3229%。經(jīng)過PCA的特征融合,原36維特征降至7維,特征維數(shù)降低80%,在壓縮信息量和降低特征維數(shù)上取得的效果非常顯著。 圖5為利用PCA方法融合后的前7個主成分特征波形圖。每40個樣本為一種裂紋狀態(tài)下的齒輪,不同程度的裂紋齒輪有4種不同的工況,每種工況有10個樣本。 圖6為PCA融合后齒輪箱主成分1的特征波形圖,圖中樣本數(shù)量從80到120區(qū)間為50%裂紋的齒輪箱振動信號樣本,該區(qū)間內(nèi)主成分的變化趨勢呈明顯的階梯形,且沒有明顯的波峰波谷,這與50%裂紋齒輪箱的4種工況完全吻合。 圖6 齒輪箱主成分1特征波形圖 基于融合后前3個主成分繪制的樣本分布三維圖見圖7。通過這前3個主成分特征表征3種不同狀態(tài)的齒輪,每種狀態(tài)對應(yīng)4種不同的工況。 圖7 齒輪箱PCA+SVM方案前3個主成分的樣本分布圖 主成分1在其他程度裂紋樣本中(樣本1到80)變化也基本與工況的變化相吻合,但有幾處較為明顯的波峰波谷,如圖6中圓圈所示。圓圈1所示為正常狀態(tài)齒輪在旋轉(zhuǎn)頻率30Hz、負載為0的樣本,開始出現(xiàn)了一個明顯的波峰,但馬上回落并保持穩(wěn)定,初步認為出現(xiàn)這一現(xiàn)象的原因是實驗設(shè)備在開始收集信號時,設(shè)備運行初期沒有進入正常的工作狀態(tài),導(dǎo)致振動信號出現(xiàn)異常,該異常對最終故障分類工作的影響較小。圓圈2在樣本10到20區(qū)間內(nèi),波谷持續(xù)時間較長,該狀況在圖7中表現(xiàn)為:正常狀態(tài)下部分樣本分布較為凌亂,與其他裂紋樣本出現(xiàn)了重疊的情況,這對故障識別的準確率存在一定的影響。圓圈3處出現(xiàn)了一個異常波峰,這一現(xiàn)象對故障識別的準確率的影響較小,此處波峰在圖7中表現(xiàn)為:極少數(shù)25%裂紋的樣本脫離了密集集中區(qū)域。 從圖7中可以看出: (1)通過前3個主成分特征基本可以表征3種不同狀態(tài)的齒輪。不同狀態(tài)的齒輪樣本區(qū)分度較為明顯且集中度高,只有正常齒輪在負載為0、旋轉(zhuǎn)頻率為40Hz工況下樣本和25%裂紋齒輪在負載為0、旋轉(zhuǎn)頻率為40Hz工況下的樣本較難區(qū)分,如圖7圓圈所示。 (2)每種狀態(tài)下的齒輪箱有4種不同的工況,分別對應(yīng)兩種不同的負載和兩種不同的轉(zhuǎn)速。25%和50%裂痕的樣本在4種不同工況下的樣本分布不但區(qū)分度高而且非常集中。圖7中的問題在于正常齒輪在不同工況下的樣本分布較為零散。 針對以上問題,經(jīng)分析,原因有以下幾點: (1)正常狀態(tài)下振動信號隨工況的變化而變化的程度不明顯,且對轉(zhuǎn)速30Hz變化到40Hz時不敏感,導(dǎo)致旋轉(zhuǎn)頻率為30Hz和40Hz樣本在三維圖中的分布較為模糊,如圖7圓圈所示。同時也看到,齒輪箱在不同負載下的正常樣本還是能保持較高的區(qū)分度。 (2)正常狀態(tài)下工況1(負載0、旋轉(zhuǎn)頻率30Hz)與工況4(負載h、旋轉(zhuǎn)頻率40Hz)區(qū)分度很高且分布密集,但是工況2(負載0、旋轉(zhuǎn)頻率40Hz)與工況3(負載h、旋轉(zhuǎn)頻率30Hz)的樣本區(qū)分度不高。可能原因是同一狀態(tài)下且工況變化幅度不大的情況下,提取的部分特征變化趨勢有一定的相似性,導(dǎo)致高速低載和低速高載兩種工況下齒輪箱振動信號表征出現(xiàn)了一定的相似性。 (3)正常狀態(tài)與25%狀態(tài)的振動信號相似度較高,這也是早期故障檢測的難點,且圖7的繪制僅參考貢獻率前3的主成分,其累計貢獻率為81.1271%,含有原特征集合的故障信息量不高,也是導(dǎo)致上圖中出現(xiàn)部分樣本難以區(qū)分的原因。 PCA融合前后的故障診斷準確率見表6。 表6 PCA融合前后的故障診斷準確率 由表6可知,特征全集經(jīng)過PCA融合后特征維數(shù)大幅降低,但并沒有影響分類器的準確率,相反地,融合之后冗余特征減少使得準確率有小幅的增長。在分類器運行時間上,融合后的運行時間縮短幅度非常大,這說明簡單有效的特征集顯著減小了分類器的計算量。 針對機械振動信號的復(fù)雜性,采用主成分分析實現(xiàn)旋轉(zhuǎn)機械振動信號的特征降維,提取旋轉(zhuǎn)機械運行狀態(tài)特征參數(shù)的主成分,通過SVM和BP神經(jīng)網(wǎng)絡(luò)兩種分類器實現(xiàn)故障診斷。齒輪箱實驗的結(jié)果顯示,采用PCA+SVM的方法,既能降低特征維數(shù)減少計算的復(fù)雜性,又能有效地表征旋轉(zhuǎn)機械的運行狀態(tài),比單獨使用SVM分類器的方法診斷準確率更高,訓(xùn)練時間更短。通過刪除冗余特征和融合的方法極大地壓縮了信息量,提高了故障診斷準確率。 [1]徐曉濱, 王玉成, 文成林. 評估診斷證據(jù)可靠性的信息融合故障診斷方法[J]. 控制理論與應(yīng)用, 2011, 28(4): 504-510. Xu Xiaobin, Wang Yucheng, Wen Chenglin. Information-fusion Method for Fault Diagnosis Based on Reliability Evaluation of Evidence[J]. Control Theory & Applications, 2011, 28(4): 504-510. [2]周洪煜, 張振華, 陳曉鋒. 中速直吹磨組徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)信息融合-模糊啟動控制[J]. 中國電機工程學(xué)報, 2011, 31(11): 119-127. Zhou Hongyu,Zhang Zhenhua, Chen Xiaofeng. Radial Basis Function Neural Network-data Fusion and Fuzzy Control during Direct-firing Medium-speed Mill’s Start-up[J]. Proceedings of the CSEE, 2011, 31(11): 119-127. [3]Otman B, Yuan X H. Engine Fault Diagnosis Based on Multi-sensor Information Fusion Using Dempster-shafer Evidence Theory[J]. Information Fusion, 2007, 8(4): 379-386. [4]王奉濤, 馬孝江, 朱泓,等 . 基于Dempster-Shafer證據(jù)理論的信息融合在設(shè)備故障診斷中應(yīng)用[J]. 大連理工大學(xué)學(xué)報, 2003, 43(4): 470-474. Wang Fengtao, Ma Xiaojiang, Zhu Hong, et al. Research on Fault Diagnosis Method Based on Dempster-Shafer Evidential Theory[J]. Journal of Dalian University of Technology, 2003, 43(4): 470-474. [5]李冰, 張培林, 任國全,等. 基于互信息的滾動軸承故障特征選擇方法[J]. 測試技術(shù)學(xué)報, 2009, 23(2): 183-188. Li Bing, Zhang Peilin, Ren Guoquan, et al. Features Selection for Rolling Bearing Fault Diagnosis Based on Mutual Information[J]. Journal of Test and Measurement Technology, 2009, 23(2): 183-188. [6]Peng H, Long F, Ding C. Feature Selection Based on Mutual Information: Criteria of Max-dependency, Max-relevance and Min-redundancy[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2005, 27(8):1226-1238. [7]Niu G, Yang B S. Intelligent Condition Monitoring and Prognostics System Based on Data-fusion Strategy[J]. Expert Systems with Applications, 2010, 37(12): 8831-8840. [8]蔣玲莉, 劉義倫, 李學(xué)軍,等. 基于SVM與多振動信息融合的齒輪故障診斷[J]. 中南大學(xué)學(xué)報(自然科學(xué)版), 2010, 41(6): 2184-2188. Jiang Lingli, Liu Yilun, Li Xuejun, et al. Gear Fault Diagnosis Based on SVM and Multi-sensor Information Fusion[J]. Journal of Central South University(Science and Technology), 2010, 41(6): 2184-2188. [9]劉曉平, 鄭海起, 祝天宇. 基于進化蒙特卡洛方法的特征選擇在機械故障診斷中的應(yīng)用[J]. 振動與沖擊, 2011, 30(10): 98-101. Liu Xiaoping, Zheng Haiqi, Zhu Tianyu. Feature Selection in Machine Fault Diagnosis Based on Evolutionary Monte Carlo Method[J]. Journal of Vibration and Shock, 2011, 30(10): 98-101. [10]ZhaoXiaomin. Data-driven Fault Detection, Isolation and Identification of Rotating Machinery: with Applications to Pumps and Gearboxes[D]. Edmonton: University of Alberta, 2012. [11]Jolliffe I T. Principal Component Analysis[M]. New York: Springer-Verlag, 2002. [12]Abu-Mahfouz I A. A Comparative Study of Three Artificial Neural Networks for the Detection and Classification of Gear Faults[J]. International Journal of General Systems, 2005, 34(3): 261-277. [13]Lei Y G, He Z J, Zi Y Y. Fault Diagnosis of Rotating Machinery Based on Multiple ANFIS Combination with GAs[J]. Mechanical Systems and Signal Processing, 2007, 21(5): 2280-2294. [14]Lei Y G, Zuo M J. Gear Crack Level Identification Based on Weighted K Nearest Neighbor Classification Algorithm[J]. Mechanical Systems and Signal Processing, 2009, 23(5): 1535-1547. (編輯袁興玲) Gearbox Fault Feature Fusion Based on Principal Component Analysis Gu YingkuiYang ZixiZhu Fanlong Jiangxi University of Science and Technology,Ganzhou,Jiangxi,341000 To effectively reduce the dimension of gearbox fault feature and improve the accuracy of diagnosis, a fault signal feature fusion method of gearbox was proposed based on principal component analysis, and the support vector machine and BP neural network were used to analyze the diagnosis accuracy. The 36 features with different crack gears in gearbox were selected based on time-domain, frequency-domain and Hilbert transform, which could be used to characterize the fault states of gearbox. The principal components which had more than 95% cumulative contribution rate were extracted and input into support vector machine classifier for identification. BP neural network classifier was used for comparative analysis of the results. Results show that a combination of principal component analysis and support vector machine method can reduce the feature dimension and computational complexity, characterize the gearbox running status effectively, and identify the different levels of gear crack. The diagnosis accuracy is higher and the training time is shorter than that of individual support vector machine classifiers. gearbox; principal component analysis; support vector machine; BP neural network; feature fusion 2014-07-11 國家自然科學(xué)基金資助項目(61164009, 61463021);江西省教育廳科學(xué)技術(shù)研究資助項目 (GJJ14420);江西省自然科學(xué)基金資助項目(20132BAB206026) TH132.41; TH165.3DOI:10.3969/j.issn.1004-132X.2015.11.018 古瑩奎,男,1976年生。江西理工大學(xué)機電工程學(xué)院教授、博士。主要研究方向為機械裝備可靠性與健康管理。發(fā)表論文40余篇。楊子茜,女,1991年生。江西理工大學(xué)機電工程學(xué)院碩士研究生。朱繁瀧,男,1989年生。江西理工大學(xué)機電工程學(xué)院碩士研究生。2 齒輪箱特征定義及其分類
3 齒輪箱振動試驗分析
4 基于PCA的齒輪箱故障特征融合分析
5 結(jié)束語