夏 田,詹 瑤,郭建斌
(陜西科技大學 機電工程學院,陜西 西安 710021)
軸承是旋轉機械的核心零件之一,它的運行狀態(tài)直接關系到機器能否穩(wěn)定地運轉[1].準確地對軸承的狀態(tài)進行診斷和分析對保證機器正常運轉具有重要意義[2].軸承的運行環(huán)境復雜,軸承振動信號表現出非平穩(wěn),非線性,噪聲大等特征[3,4].小波包變換具有大小不變形狀可調的時間窗,以及對高低頻信號均能有效分解的性能[5,6],相比于傳統(tǒng)的時域、頻域分析方法更能表現出軸承信號的時變性[7].文獻[8]設計了基于小波包分析的變壓器區(qū)內外故障特征量提取方法,結合神經網絡進行變壓器故障診斷;文獻[9]利用小波包分解將齒輪箱故障信號分解到各個頻段,提取各頻段能量特征,結合神經網絡進行齒輪箱故障診斷.文獻[10]采用小波包分解和經驗模態(tài)分解結合的方法提取內圈故障軸承的特征,進行軸承故障診斷.證明了小波包分解方法在提取信號特征時的有效性.
考慮到軸承信號非線性、非平穩(wěn)、帶噪聲,差異小等特性,本文采用小波包分解與梯度提升決策樹結合的方法進行軸承故障診斷,達到提升故障診斷準確率的目的.
小波包分解可以同時分解信號的高頻分量和低頻分量,提高了信號時域和頻域的分析能力[15].使用小波包分解軸承信號,能夠準確描述軸承信號在各個頻帶的詳細信息.梯度提升決策樹通過將多個弱分類器的結果累加達到損失函數極小化,相比于單個分類模型具有更強的軸承故障診斷能力.
小波包分解與梯度提升決策樹結合的軸承故障診斷方法包括軸承故障特征提取和軸承故障診斷建模兩部分.先使用小波包分解原始軸承信號,求得不同頻帶的小波包分量,并提取各頻帶的小波包能量作為軸承故障特征,再將提取的故障特征輸入梯度提升決策樹模型進行訓練及分類,達到軸承故障診斷的目的.小波包分解和梯度提升決策樹結合的軸承故障診斷流程如圖1所示.
圖1 軸承故障診斷流程圖
特征向量提取包括獲取各頻帶小波包分量,計算各頻帶小波包能量兩部分.原始軸承信號經過以分析頻率fs的n層小波包分解后,頻域將被分成2n段,各小波包分量對應的頻段分別為:
(1)
各個頻帶信號的小波包能量Ei,j是此頻帶小波包分量di,j(k)的平方和[16],i層各頻帶信號的能量為:
(2)
i層所有Ei,j組成的能量譜為[17]:
E=[Ei,0,Ei,1,…,Ei,j,…,Ei,2i-1]
第二,3月份是獼猴桃潰瘍病爆發(fā)高峰期。嫁接操作不可避免地會在樹體上造成傷口,為潰瘍病侵染提供了有利條件,此時嫁接不但不利于嫁接樹的健康生長,也為其他未嫁接樹帶來了潰瘍病感染隱患。
(3)
第n層的能量譜構成了原始軸承信號的特征向量.
軸承發(fā)生故障時,表現為某頻帶的能量值與其他頻帶的能量值相差很大,并且不同類型的故障發(fā)生時,頻帶能量值的分布也不同.因此,不同類型軸承故障的小波包能量對于不同故障具有較好的區(qū)分性.
梯度提升決策樹算法核心在于每次計算由1個弱分類器完成,下次計算的目的為減小上次模型的殘差,并在殘差減小的梯度方向新建立一個弱分類器[18],通過不斷調整和優(yōu)化弱分類器的權重,使之成為強學習器.基于梯度提升決策樹的軸承故障診斷建模包括兩部分:梯度提升決策樹訓練及參數調節(jié),梯度提升決策樹軸承故障分類.
利用梯度提升決策樹實現軸承故障診斷的步驟如下:
(1)提取軸承故障特征.利用小波包分解將軸承信號分解至各頻帶,將各頻帶小波包能量作為軸承故障特征,形成軸承故障數據集.
(2)隨機抽取軸承故障數據集中的70%作為訓練集,訓練梯度提升決策樹模型,計算出最佳模型參數,訓練后的模型即為軸承故障診斷模型.
(3)將軸承故障數據集中剩下的30%作為測試集,檢測軸承故障診斷模型的分類效果,若分類效果不好,則重復步驟(2),直到達到較好的分類效果.
使用凱斯西儲大學軸承數據中心的軸承測試數據[19]驗證上述小波包分解與梯度提升決策樹結合的軸承故障診斷方法.采用Windows10系統(tǒng),編程語言為Python,小波包能量提取使用python第三方庫pywt,梯度提升決策樹算法使用Scikit-Learn機器學習工具包.
軸承型號為SKF6205,使用電火花加工在軸承內圈、滾動體和軸承外圈分別引入直徑為0.177 8 mm、0.533 4 mm的單點故障.一共六種故障類型,如表1所示.
表1 軸承故障類型及尺寸
引入單點故障的軸承被重新安裝到測試電機中,并記錄電機轉速為1 797 r/min時的振動數據.振動數據使用加速度計收集,加速度計分別放置在支撐基座、電機殼體驅動端、電機殼體風扇端,采樣頻率為12 kHz.
圖2為正常軸承振動時序圖,正常軸承振動較平緩,加速度信號沒有突變.圖3(a)、(b)、(c)為故障尺寸0.177 8 mm的不同故障類型的振動時序圖.故障軸承振動較劇烈,加速度信號有明顯突變.不同的故障類型信號幅值隨時間變化曲線具有顯著差異.
圖2 正常軸承振動時序圖
(a)內圈故障軸承
將振動信號的每400個采樣點作為1個周期,1個周期為1組數據,共抽取9467組數據.分別對每組數據進行小波包分解,小波基函數為db1小波,分解級數分別為3級,4級,5級.通過小波包分解得到每一頻帶的小波包分解系數并計算小波包能量.小波包5級分解的小波包能量如圖4所示.
由圖4的各頻帶能量分布圖對比可知,不同故障類型、不同故障尺寸對應的能量大小及分布不同.
小波包3級分解頻帶數為8;小波包4級分解頻帶數為16;小波包5級分解頻帶數為32.將每一頻帶的能量以及加速度計位置的0-1編碼作為軸承故障特征.表2、表3、表4分別為3級、4級、5級小波包分解的數據樣本集.各軸承故障類型的數據樣本數量如表5所示.
表2 小波包3級分解數據樣本集
表3 小波包4級分解數據樣本集
表4 小波包5級分解數據樣本集
表5 不同故障類別數據樣本量
將軸承故障特征數據樣本集劃分為訓練集(6 626個樣本)、測試集(2 841個樣本).圖5為軸承故障類型的數據樣本數量學習曲線.樣本量小于3 600時,預測準確率快速提升;樣本量為3 600至5 600時,預測準確率增速減緩;樣本量為5 600以上,預測準確率不再上升.因此,6 626個樣本的訓練集足夠達到訓練要求.
圖5 樣本量學習曲線
將6 626組訓練數據輸入梯度提升決策樹模型進行訓練,采用網格搜索法調整超參數,超參數包括弱評估器數量、學習速率、損失函數、剪枝參數、不純度衡量指標等,調整各參數至最佳超參數組合,得到最優(yōu)梯度提升決策樹軸承故障診斷模型.圖6為訓練后的梯度提升決策樹模型參數截圖.
圖6 梯度提升決策樹模型參數截圖
將2 841組測試數據輸入梯度提升決策樹軸承故障診斷模型,圖7是模型運行的結果截圖,描述了樣本數據的真實類別和診斷結果的關系[20].precision為精確率,表示預測結果為故障軸承中真正為故障軸承的比例,用來衡量預測結果是否準確;recall為召回率,表示真正的故障軸承中預測結果為故障軸承的比例,用來衡量預測結果是否全面;f1-score為衡量精準率和召回率的綜合指標;support為每一類別的樣本量.
由圖7可知,模型在正常軸承,0.177 8 mm的內圈故障,0.533 4 mm的外圈故障,0.533 4 mm的滾動體故障的診斷精準率,召回率均高于99.2%;模型在0.177 8 mm的外圈故障,0.533 4 mm的內圈故障精準率和召回率均高于97.3%,模型在0.177 8 mm的滾動體故障的診斷精準率,召回率高于96.5%.模型對不同類型故障的診斷精確率和召回率均保持在較高水平,具有較高查準率與查全率.
圖7 模型分類準確率截圖
為保證故障診斷結果的穩(wěn)定性,進行5次交叉驗證,求取模型的平均診斷結果.圖8為測試模型的5次分類準確率.采用時域分析、3級小波包分解結合梯度提升決策樹的軸承故障診斷準確率較低且不穩(wěn)定;4級和5級小波包分解結合梯度提升決策樹的軸承故障診斷模型準確率高且較穩(wěn)定.
圖8 五次交叉驗證故障診斷準確率
不同小波包分解級數的訓練準確率及測試準確率如表6所示.
表6 故障診斷準確率
采用3級、4級、5級小波包分解提取小波包能量作為軸承故障特征訓練梯度提升決策樹軸承故障診斷模型,軸承故障診斷準確率分別為98.28%,99.01%,99.26%;不采用小波包分解,直接以振動信號的時序特征訓練梯度提升決策樹軸承故障診斷模型,測試準確率為87%.
本文采用一種基于小波包分解與梯度提升決策樹結合的軸承故障診斷方法.首先對原始振動信號進行小波包分解,提取各頻帶小波包能量作為故障特征,構成軸承特征數據集;再將數據集的70%輸入到梯度提升決策樹模型中進行訓練,得到最優(yōu)模型參數;用剩下的30%特征數據對軸承故障診斷模型進行測試.
驗證結果表明,采用小波包能量作為軸承振動特征比直接采用時序特征,故障診斷準確率提升了11%;采用小波包分解結合梯度提升決策樹進行軸承故障診斷時,5級小波包分解的軸承故障診斷準確率最高,達99.26%.小波包分解和梯度提升決策樹結合的方法能夠準確的將軸承故障進行分類,滿足實際故障診斷需求.