趙小強, 羅維蘭, 梁浩鵬
(1. 蘭州理工大學 電氣工程與信息工程學院, 甘肅 蘭州 730050; 2. 蘭州理工大學 甘肅省工業(yè)過程先進控制重點實驗室, 甘肅 蘭州 730050; 3. 蘭州理工大學 國家級電氣與控制工程實驗室教學中心, 甘肅 蘭州 730050)
現(xiàn)代機械設備朝著高速化、精密化和自動化的方向發(fā)展,設備的穩(wěn)定運行狀態(tài)直接影響使用壽命和機械性能.其中,滾動軸承是旋轉設備中的關鍵零部件,當旋轉機械發(fā)生故障時,約30%的故障發(fā)生在軸承[1].因此,能夠準確地識別滾動軸承的健康狀況具有重要意義.
對于滾動軸承的故障診斷,通常分故障特征提取和故障分類兩步.由于傳感器是在強噪聲、非平穩(wěn)、變工況環(huán)境下采集信號,所以采集的信號具有時變性強和噪聲背景強的特點,難以提取有效的特征信息,導致最終的故障分類準確率不高.因此,故障信號特征提取是軸承故障診斷的關鍵.特征提取的方法主要有時域分析法、頻域分析法和聯(lián)合時頻分析法.時域分析方法通常有統(tǒng)計分析法[2]和均方根分析法[3],頻域分析方法一般有高階譜估計法[4]和譜峭度法(spectral kurtosis,SK)[5],聯(lián)合時頻分析法有維格納分布(wigner-ville distribution,WVD)[6]、小波變換(wavelet transform, WT)[7]、短時傅立葉變換(short time fourier transform,STFT)[8]和經(jīng)驗模態(tài)分解(empirical mode decomposition,EMD)[9].故障分類的方法主要有BP神經(jīng)網(wǎng)絡[10]、支持向量機[11]和貝葉斯分類[12]等.傳統(tǒng)的故障診斷方法簡單并應用范圍廣泛,通過設置合適的參數(shù),可以部分滿足故障診斷識別準確率的要求.然而,傳統(tǒng)的軸承故障診斷方法依賴于對該領域豐富的經(jīng)驗、專業(yè)知識以及扎實的數(shù)學基礎,并且特征的提取是在提前設定好的模型上進行,所提取的特征幾乎是淺層特征,適應性很差.
因此,實現(xiàn)特征的自適應提取與分類,擺脫對專業(yè)知識的依賴,已成為故障診斷領域的研究熱點.部分學者利用深度學習具有自動學習數(shù)據(jù)內部特征的優(yōu)勢,提出了基于深度學習的故障診斷方法.深度學習是機器學習的重要分支,通過貪婪逐層預訓練和反向微調以及各種非線性激活函數(shù)的組合實現(xiàn)復雜特征提取.
深度學習的方法主要有棧式自編碼器網(wǎng)絡(stacked autoencoder,SAE)[13]、深度置信網(wǎng)絡(deep belief network,DBN)[14]、循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN)[15]和卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)[16].溫江濤等[17]將壓縮感知與深度神經(jīng)網(wǎng)絡結合,直接從原始信號中充分地提取特征,實現(xiàn)了故障診斷;陶潔等[18]提出了基于Teager能量算子(teager energy operator,TEO)和深度置信網(wǎng)絡的故障診斷方法,先用TEO提取滾動軸承振動信號的特征信息,然后通過層次優(yōu)化算法生成合適的DBN分類器,可以準確、穩(wěn)定地識別軸承故障;周奇才等[15]將網(wǎng)絡中神經(jīng)元用門控循環(huán)單元代替,并將循環(huán)神經(jīng)網(wǎng)絡進行堆疊,提高滾動軸承故障診斷精度;張弘斌等[19]提出新的多通道樣本構造方法,與深度學習結合可提高故障診斷的效果.
雖然上述方法能取得不錯的診斷效果,但都只能適應于恒定工況條件.而在實際的工業(yè)生產(chǎn)中,機械設備的運轉通常處于變工況狀態(tài).近幾年不少學者對軸承在變工況下做了研究,張西寧等[20]采用改進深度卷積神經(jīng)網(wǎng)絡實現(xiàn)軸承的變工況故障診斷,陳保家等[21]結合卷積神經(jīng)網(wǎng)絡和長短時記憶網(wǎng)絡并應用于變工況故障診斷.然而,上述方法都未考慮采用多尺度融合的方法提取軸承變工況特征信息.因此,本文先采用SIR(SE-Inception-Resnet)模塊多尺度提取更加充分有效的特征信息,再使用快捷連接線提高收斂速度,最后利用殘差密集網(wǎng)絡對特征信息重新標定,提取有效特征信息,通過不斷訓練和優(yōu)化網(wǎng)絡達到故障分類.通過實驗對比發(fā)現(xiàn),本文所提方法在復雜工況下具有更好的故障診斷效果.
SENet(squeeze-and-excitation net works)是由Hu等[22]提出的CNN結構,該結構由Squeeze、Excitation和Reweight組成,如圖1所示.當給定特征通道數(shù)為C_1的輸入X,經(jīng)過一系列的卷積、2個全連接變換后得到特征通道數(shù)為C_2的X′.轉化的過程如下:首先,將Ftr進行式(1)轉化(卷積)操作,其中,vc表示第c個卷積核,xs表示第s個輸入;其次,Squeeze操作是將空間維度H×W對特征uc進行式(2)特征壓縮(全局平均池化)變成實數(shù)zc∈RC(c×1×1),這個實數(shù)某種程度上具有全局的感受野;然后,Excitation操作是由式(3)經(jīng)過2個全連接層和激活函數(shù)變換每個特征通道生成權重,輸出的s通過式(4)最終輸出X′;Reweight的操作是將通道權重與輸入特征相乘,實現(xiàn)對原始特征的重新標定.
圖1 SENet模型結構圖Fig.1 Structure diagram of SENet model
(1)
(2)
s=Fex(z,W)=σ[W2δ(W1z)]
(3)
x′={x′1,x′2,…,x′c}
(4)
在機器學習神經(jīng)網(wǎng)絡中,通過增加網(wǎng)絡的深度或寬度可提取充分有效的特征信息,以提高網(wǎng)絡的性能.但是隨著網(wǎng)絡深度的增加,會出現(xiàn)梯度消失或梯度爆炸問題.針對此問題,可采用的解決方式包括:一種是帶快捷連接線的殘差學習[23],使網(wǎng)絡輸入與輸出的誤差重構,避免梯度消失;另一種是密集連接網(wǎng)絡[24],采用跨層并聯(lián)的連接方式增加網(wǎng)絡的寬度,即每層的輸入都與之前的卷積層相互連接,但當網(wǎng)絡很深或者很寬時,隨著網(wǎng)絡不斷訓練的過程,對一些損失的細節(jié)難以恢復.
殘差密集塊[25]不僅增加了網(wǎng)絡的深度,同時提高了網(wǎng)絡訓練速度,融合了殘差網(wǎng)絡和密集網(wǎng)絡的優(yōu)點,使提取的特征更加充分.殘差密集塊的結構如圖2所示.
圖2 殘差密集塊結構圖Fig.2 Structure diagram of residual-dense block
殘差密集塊每層的輸出與前面層通過快捷連接線融合局部特征,隨著網(wǎng)絡加深且連接線的增多,網(wǎng)絡難以訓練起來.采用殘差學習在網(wǎng)絡后端融合全局特征,融合后的特征更能充分表達原數(shù)據(jù)的特征信息,并加快網(wǎng)絡整體的訓練速度.為了減少整個網(wǎng)絡的計算量,在每個卷積操作后都使用批量規(guī)范化(batch normalization,BN)和激活函數(shù)(ReLU).
由于所診斷的軸承信號是在強噪聲、變負荷的復雜工況下采集的,所以難以從微弱的信號中提取有效的特征,從而導致故障診斷的準確率不高.因此,本文設計SIR模塊來提高對軸承信號特征的提取能力,結構圖如圖3所示.
圖3中Inception采用多尺度卷積核(1×1、3×3、5×5)代替7×7大卷積核,提取更加豐富的特征,并采用concat連接多尺度的特征信息.同時,為了提高訓練速度和減少訓練參數(shù),在每個卷積后面都使用批量標準化和激活函數(shù).雖然Inception提取的特征相對充分,但難以確定其有效性.因此,采用SENet網(wǎng)絡對原輸出通道進行加權(通道的每個元素與對應權重相乘),提升有用的特征并抑制對當前任務貢獻不大的特征,達到對原始特征的重新標定,再利用快捷連接線提高信息流通速率,同時避免了由網(wǎng)絡過深所引起的梯度消失問題.
圖3 SIR模塊結構圖Fig.3 SIR module structure
殘差密集塊連接是通過連用多個卷積提取特征信息.如果每進行1次卷積操作,步長stride≥2,那么持續(xù)卷積必定會存在信息的缺失.因此,采用可獲得更大感受野的空洞卷積[26].空洞卷積與普通卷積具有相同的卷積操作,但與普通卷積不同的是沒有步長參數(shù),而是在卷積核之間加入空洞,產(chǎn)生相關的參數(shù)空洞率r.通過設置不同空洞率,得到不同的感受野,空洞卷積的感受野為
R=[(k-1)(r-1)+k]2
(5)
式中:k為卷積核大小.
在感受野相同的情況下,空洞卷積比普通卷積的參數(shù)少.但空洞卷積計算方式類似于棋盤格式,某一層得到的卷積結果來自上一層獨立的集合,彼此沒有相互依賴.如果多個卷積持續(xù)連用,會造成局部信息丟失.因此,本文在殘差密集連接中交叉使用普通卷積和空洞卷積,以避免特征信息的缺失.
由于殘差密集網(wǎng)絡訓練的參數(shù)少,所以需要足夠多的殘差密集塊提高網(wǎng)絡的性能.但過多的殘差密集塊連接必會使整個網(wǎng)絡訓練時間很長,不能及時診斷出故障,會對設備造成很大的損傷,并減少設備的使用壽命.因此,本文設計多級殘差連接密集網(wǎng)絡的軸承故障診斷方法,網(wǎng)絡結構如圖4所示,采用殘差連接可以在減少網(wǎng)絡訓練時間的同時提高了網(wǎng)絡的性能.
從圖4可以看出,為了使整個網(wǎng)絡結構提取更充分、更有效的信息,采用不同方式的卷積和不同大小的卷積核進行卷積操作,將提取的不同特征進行相互融合.殘差密集模塊第1個卷積層使用空洞卷積,其卷積核大小為3×3,空洞率r=4,使得網(wǎng)絡具有更強的特征學習能力;第2個卷積層使用3×3的卷積核進行卷積,輸出的結果與第1層的輸出進行殘差融合得到更多的特征信息;第3個卷積層和第4個卷積層的卷積操作與前面兩層的卷積操作一樣,但空洞卷積的空洞率有所變化,因第2層卷積操作后,輸出的尺寸縮小了一半,為了能提取到更多的信息,這層的空洞率采用r=2;第5個卷積層采用3×3的卷積核進行卷積.
本文提出的基于SIR多級殘差連接密集網(wǎng)絡的軸承故障診斷方法如圖5所示.該方法主要由SIR模塊、多級殘差連接的密集模塊和softmax分類器相結合,實現(xiàn)滾動軸承原始振動信號的自適應特征學習,將學習到的特征進行故障分類.
圖5 SIR多級殘差連接密集網(wǎng)絡結構圖Fig.5 SIR multilevel residual connection dense network structure diagram
首先,將輸入的數(shù)據(jù)矩陣轉化處理成二維28×28灰度圖,經(jīng)過SIR模塊對原始特征重新標定,充分地提取有效特征信息,將SIR模塊融合的特征利用最大池化降維,減少網(wǎng)絡參數(shù),防止過度擬合.然后,將降維后的特征14×14依次經(jīng)過5個卷積層的多級殘差連接密集網(wǎng)絡進行訓練,各卷積后的特征信息通過殘差快捷連接線連接實現(xiàn)更全面的特征融合,但為防止多個同樣的卷積操作使信息丟失,采用空洞卷積和普通卷積相互交叉的方式.最后,將融合的特征信息經(jīng)過池化層,為全連接層降低參數(shù)的同時增加感受野,從而實現(xiàn)故障診斷.
整個網(wǎng)絡的具體參數(shù)如表1所列.降低率a為SIR模塊中影響SENet容量和計算復雜度的超參數(shù),本文通過二分法,經(jīng)過多次實驗反復驗證,選取最佳降低率a=5.
表1 網(wǎng)絡模型整體結構參數(shù)設置Tab.1 Parameters of the overall structure of the network model
在整個網(wǎng)絡訓練的過程中,參數(shù)比較多.如果對參數(shù)訓練不佳,就會影響故障分類的準確率.因此,采用學習率自適應的優(yōu)化算法Adam來更新權值,尋找最優(yōu)的權值,使損失函數(shù)值θ*最小.其中,Adam算法最初參數(shù)的配置包括:學習率為0.001,指數(shù)衰減速率為0.9.優(yōu)化表達式為
θ*=argminθL[f(xi,θ)]
(6)
式中:L(·)為目標函數(shù)值,即參數(shù)更新的權重大??;f(·)為輸出值;θ為卷積神經(jīng)網(wǎng)絡的所有參數(shù);θ*為卷積神經(jīng)網(wǎng)絡的最優(yōu)參數(shù);xi為卷積神經(jīng)網(wǎng)絡的輸入.
本文的實驗數(shù)據(jù)來自美國Case Western University[27]的CWRU實驗臺.CWRU實驗臺包括電機、扭矩傳感器、測力器(負載)及編碼器,如圖6所示.電機驅動端的軸承型號為深溝球軸承SKF-6205,振動的信號通過加速度計進行采集,加速度計通常安裝在電機殼的驅動端或者扇端的12點鐘位置,有些也和電機底座連接.用16通道的DAT記錄儀收集振動信號,在MATLAB環(huán)境中進行后處理,數(shù)據(jù)按12 kHz進行采集.電機轉速不同對應的不同負荷分別為0、1、2、3 hp.利用電火花在滾動軸承上人為制造損傷,損傷位置分別在軸承的內圈、滾動體和軸承外圈3點鐘、6點鐘、12點鐘方向,且損傷直徑分別為0.36、0.18、0.53、0.71 mm.將故障軸承安裝到測試電機中,記錄不同負載下的振動信號,包含軸承不同的損傷位置和不同的損傷程度以及正常狀態(tài)共計16種狀態(tài).
圖6 實驗裝置臺Fig.6 Experimental equipment table
轉速n=1 730 r/min、寬度為0.36 mm時,軸承正常狀況、滾動體故障、內圈故障、外圈故障(6點鐘方向)的時域信號如圖7所示.可以看出,軸承在故障狀態(tài)下振動加速度的沖擊均比正常狀態(tài)下的明顯,而且內圈和外圈的故障信號每間隔一定時間就有沖擊成分出現(xiàn),但4種類型的振動加速度信號均包含較多噪聲,部分沖擊淹沒在噪聲中.
圖7 原始軸承振動信號Fig.7 Original bearing vibration signal
實驗的每段采樣數(shù)據(jù)點數(shù)為784,訓練過程中,從每類樣本集中隨機選擇樣本數(shù)的75%作為訓練集,其余作為測試集,保證數(shù)據(jù)在均衡的條件下驗證故障診斷的準確率.實驗樣本詳細信息如表2所列.
表2 實驗數(shù)據(jù)集Tab.2 Experimental data set
在實際工業(yè)中,旋轉機械設備的滾動軸承是在強噪聲、變負荷的復雜環(huán)境下運行.本文采用不同的方法對3種情況進行對比分析,驗證本文所提方法可以在復雜的環(huán)境下及時、有效地診斷出故障.
3.2.1變噪聲情況分析
為了驗證噪聲對故障診斷的影響,本文在不同的噪聲環(huán)境下采用不同的方法進行比較.在2 hp負荷下的測試集中加入不同信噪比(6、8、10、12、14 dB)的高斯白噪聲,采用基于深度學習lenet-5方法、Dense方法和改進Resnet[28]方法與本文方法進行比較,結果如圖8所示.其中,lenet-5方法采用三層卷積網(wǎng)絡提取特征信息,每層卷積核的大小為5×5,通道數(shù)分別為32、64、128,經(jīng)過池化、全連接層達到故障分類;殘差密集方法是將輸入的數(shù)據(jù)轉化成二維后,經(jīng)過四層殘差密集連接,每層卷積核的大小為3×3,通道數(shù)分別為8、32、64、128,同樣經(jīng)過池化、全連接達到故障分類.
從圖8可以看出,隨著信噪比的增加,所有方法的故障診斷準確率均增高,這是因為信噪比越大表示在信號中加的噪聲比例越小.當信噪比高于10 dB時,本文方法的故障診斷準確率達到了99%以上,幾乎可以精確地分類出故障類型.當信噪比為6 dB時,采用不同的方法對故障診斷的結果差別比較大.lenet-5方法網(wǎng)絡結構簡單,對輸入信號特征提取得不夠充分,導致加入噪聲后對故障的分類不夠準確.而改進Resnet方法采用空洞卷積,擴大感受野,提取到了充分的信息,相對lenet-5方法提高了故障診斷準確率;但改進Resnet方法特征提取未標定關鍵因子,使得提取的特征有效性比本文方法差.本文方法采用了SIR模塊對權重重新標定,并對殘差密集的卷積層進行改進,更加有效地提取特征,從而提高故障診斷準確率.
圖8 各方法在不同信噪比下故障診斷準確率Fig.8 Fault diagnosis accuracy of each method in different SNR
在實際工程應用中,不僅要求故障診斷準確率高,還要求診斷的及時性好.因此,訓練時間也是評估算法優(yōu)劣的關鍵指標.在整個訓練的過程中,由于權值和閾值的初始化是隨機的,導致每次訓練的時間有所不同.但為了研究整個算法訓練時間,選10次相對較好的結果,取平均值代表該算法的訓練時間.表3列出了不同方法在不同信噪比下的訓練時間.可以看出:lenet-5方法訓練時間很長,因為三層網(wǎng)絡結構訓練過程中,輸出值與預測值的誤差很大,所以正反向更新參數(shù)的速度慢;而其它方法比lenet-5方法訓練時間短,這是因為引入快捷連接線使得輸出值很快達到預測值,其中,Dense方法采用了更多的快捷連接線,每層的輸出與前面的都相關,訓練過程參數(shù)的更新速度更快.由此可見,網(wǎng)絡經(jīng)過充分訓練后,基于SIR多級殘差連接密集網(wǎng)絡具有較好的實用性.
表3 各方法在不同信噪比下診斷訓練時間Tab.3 Diagnosis training time under different SNR for each method
3.2.2變負荷情況分析
在實際工況下,旋轉機械的滾動軸承不僅在強背景噪聲中工作,而且工作負荷是變化的.為了研究本文方法在變負荷下的適用性,選擇4種不同的負荷分別為0、1、2、3 hp,并選擇其中1種負荷為訓練集,剩余負荷為測試集.變負荷故障診斷結果如圖9所示,圖中橫軸0-1、0-2、0-3分別表示網(wǎng)絡訓練以0 hp為訓練集,以1、2、3 hp為測試集.
圖9 變負荷故障診斷結果Fig.9 Fault diagnosis results of variable load
可以看出:本文方法的故障診斷準確率均高于其他3種方法,不同負荷情況下準確率都在90%以上,并且柱高波動較小,方差為0.053;其他方法故障診斷準確率的方差分別為0.256、0.053、0.064,雖然殘差密集方法也具有較好的穩(wěn)定性,但本文方法的故障診斷準確率更高.因此,本文方法對變負荷具有較好的泛化能力.
3.2.3變工況情況分析
滾動軸承在實際運行中,變噪聲和變負荷往往同時影響著整個過程.為了研究變負荷和變噪聲同時對軸承故障分類結果的影響,在輸入信號中加入不同的信噪比,并在不同的負荷下進行訓練.以1-2的3組實驗數(shù)據(jù)為例進行說明,1-2表示1 hp負荷為訓練集,2 hp為測試集.在測試集中加入6、9、12 dB不同的信噪比,并且將本文方法與lenet-5方法、Dense方法和改進Resnet方法進行對比,結果如圖10所示.
從圖10a和圖10b可以看出,lenet-5方法和Dense方法在變工況下故障診斷準確率基本都在90%以下,當加入6 dB的強噪聲時,柱高的波動很大,準確率很低,抗噪性能很差.從圖10c可以看出:基于改進Resnet方法的診斷準確率為85.49%,最高為94.68%,高于90%很少;并且在同一負荷下求取不同信噪比的準確率平均值曲線中,基于改進Resnet方法在變工況下故障診斷準確率波動很大.從圖10d可以看出:本文方法的診斷準確率最低在89%以上,最高達到96%以上;并從平均值曲線可以發(fā)現(xiàn),在變工況下故障診斷準確率穩(wěn)定而且很高.由上述分析可知,本文方法在變負荷和高強度的噪聲干擾下仍具有很高的識別率,相比其他方法優(yōu)勢明顯.實驗結果驗證了SIR多級殘差密集網(wǎng)絡的軸承故障診斷方法具有很好的魯棒性和泛化能力.
為了進一步驗證本文所提方法在變負荷、變噪聲等復雜工況環(huán)境下故障診斷的效果,采用流行學習算法中的t-SNE(t-distributed stochastic neighbor embedding)進行特征可視化,實驗結果如圖11所示.其中,圖11a沒有包含SIR模塊,網(wǎng)絡中只有殘差密集連接網(wǎng)絡;而圖11b包含SIR模塊,對輸入的振動信號進行多尺度提取,并將提取的信息進行特征融合,采用SE模塊進行特征標定,從而所提取的特征更加充分有效,使得最終分類結果中同類故障更加聚攏,診斷準確率高達97%.
圖11 T-sne可視化圖Fig.11 T-sne visualization
本文提出了基于SIR多級殘差連接密集網(wǎng)絡的軸承故障診斷方法.首先,設計SIR模塊完成多尺度特征提取,并在通道維度上對原始特征重新標定,有效地分離出關鍵特征因子;然后,設計了多級殘差連接的密集塊,對故障診斷的輸入數(shù)據(jù)進行更深入、更有效地特征提取,提高了故障診斷準確率;最后,通過實驗將本文方法應用于變負荷、強噪聲干擾環(huán)境下的滾動軸承故障診斷中.根據(jù)對滾動軸承故障實時信號檢測和分析,驗證了本文方法的有效性,以及對復雜工況更具較強的魯棒性和泛化性.