孟德乾,徐軍楊,袁建平,吳月超
(華東勘測設(shè)計研究院有限公司,浙江 杭州 310000)
滾動軸承作為機械設(shè)備的重要部件,在長期運行中極易疲勞,一旦發(fā)生故障,將影響整個機械設(shè)備的穩(wěn)定運行[1]。因此,對滾動軸承開展故障診斷研究,具有重要的理論意義與工程實際價值[2]。
為解決滾動軸承的故障診斷問題,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)憑借其優(yōu)異的特征提取能力,被廣泛應(yīng)用于故障診斷領(lǐng)域。如趙小強等人[3]提出一種基于二維CNN 的滾動軸承故障診斷方法,將構(gòu)建好的二維特征圖輸入到CNN 中,以識別滾動軸承的故障狀態(tài)。Huang 等人[4]針對故障特征的多尺度特性,提出多尺度CNN 結(jié)構(gòu),較好地實現(xiàn)了軸承狀態(tài)分類。然而,CNN 雖具備較強的特征提取能力,卻難以充分獲取故障信號在時間方面的內(nèi)在表達(dá)。
與CNN 相比,循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)則在獲取時間關(guān)聯(lián)性方面有較強的優(yōu)勢。在后續(xù)出現(xiàn)的基于RNN 的不同網(wǎng)絡(luò)中,長短時記憶網(wǎng)絡(luò)(long short term memory network,LSTM)應(yīng)用最為廣泛。如鄭直等[5]針對凱斯西楚大學(xué)滾動軸承數(shù)據(jù)集,提出基于改進(jìn)鯨魚算法優(yōu)化LSTM 網(wǎng)絡(luò)的故障診斷模型,取得了97%的識別準(zhǔn)確率。樊家偉等[6]在增強故障特征的基礎(chǔ)上,采用LSTM 網(wǎng)絡(luò)對行星齒輪箱不同局部故障進(jìn)行診斷。雖取得一定的應(yīng)用效果,但LSTM 結(jié)構(gòu)復(fù)雜,導(dǎo)致網(wǎng)絡(luò)訓(xùn)練難度加大,而基于LSTM 的門控循環(huán)單元(gated recurrent unit,GRU)則有效解決了模型的訓(xùn)練難問題。
考慮CNN 和GRU 的各自優(yōu)勢,為提升強噪聲下網(wǎng)絡(luò)的診斷性能,研究提出了一種基于深度特征提取與遷移學(xué)習(xí)的滾動軸承故障診斷模型。首先,構(gòu)建MSCNN-BiGRU 深度特征提取網(wǎng)絡(luò),提取強噪聲下的多尺度特征和時序特征,并通過注意力機制模塊進(jìn)行重要特征選擇。其次,引入遷移學(xué)習(xí),通過多級距離公式度量源域與目標(biāo)域特征分布差異,并將度量結(jié)果添加到損失函數(shù)中,利用損失的反向傳播,實現(xiàn)源域與目標(biāo)域特征分布對齊,以解決變工況下源域與目標(biāo)域特征分布不同的問題。最后通過softmax 層進(jìn)行故障模式識別。
卷積神經(jīng)網(wǎng)絡(luò)主要由卷積層、池化層和全連接層組成[7]。卷積層使用卷積核對輸入數(shù)據(jù)的局部區(qū)域進(jìn)行卷積運算,并使用激活函數(shù)進(jìn)一步生成輸出特征。計算過程如下:
池化層可以進(jìn)一步降低網(wǎng)絡(luò)參數(shù)。選用最大值池化方式,其計算式為:
式中:ul(i,t)為第l層中第i個特征張量的第t神經(jīng)元;w為卷積核寬度。
對于多分類任務(wù),全連接層常采用softmax 函數(shù)進(jìn)行分類,其表達(dá)式如下:
式中:C為類別個數(shù);φi為第i類的輸出值;αi為第i類的概率。
滾動軸承常運行在變工況環(huán)境下,為實現(xiàn)有效診斷,需綜合考慮來自不同工況下的域數(shù)據(jù)進(jìn)行分析。假設(shè)在A 工況和B 工況下采集到的滾動軸承數(shù)據(jù)集分別為:源域和目標(biāo)域。其中xi為源域樣本特征,yi為源域樣本標(biāo)簽,xj為目標(biāo)域樣本特征。源域和目標(biāo)域有相同的特征空間和類別空間,但兩者的邊緣分布和條件分均不同[8]。
為衡量兩個域之間的分布差異,引入MMD 進(jìn)行量化分析,其將源域與目標(biāo)域中的特征同步映射到再生核希爾伯特空間中,通過計算兩域均值的距離以表征域間數(shù)據(jù)分布差異。其計算公式為:
式中:ns和nt分別是源、目標(biāo)域樣本個數(shù)。
滾動軸承工作環(huán)境復(fù)雜,采集信號中有效成分常被噪聲而淹沒[9]??紤]MSCNN 網(wǎng)絡(luò)能自適應(yīng)提取信號中的多尺度特征,進(jìn)而獲取更豐富的故障特征信息,以及BiGRU 網(wǎng)絡(luò)可以從前后兩個方向?qū)W習(xí)振動信號的時間關(guān)聯(lián)性,本研究有機融合兩種網(wǎng)絡(luò)的優(yōu)勢并引入注意力機制,構(gòu)建基于MSCNN-BiGRU-Attention 的深度特征提取網(wǎng)絡(luò),其結(jié)構(gòu)如圖1 所示。
圖1 深度特征提取網(wǎng)絡(luò)結(jié)構(gòu)
在損失函數(shù)中分別嵌入MK-MMD 和JMMD,度量源域與目標(biāo)域的特征分布差異,并將度量結(jié)果添加在損失函數(shù)中,構(gòu)建具有一定域適應(yīng)能力的深度遷移網(wǎng)絡(luò)。其結(jié)構(gòu)如圖2 所示,由狀態(tài)識別和域適應(yīng)2 個模塊組成。狀態(tài)識別模塊包括MSCNN-BiGRUAttention 特征提取網(wǎng)絡(luò)、瓶頸層和標(biāo)簽分類器,其中瓶頸層和標(biāo)簽分類器均采用單層全連接網(wǎng)絡(luò),神經(jīng)元個數(shù)分別為256 和5。域適應(yīng)模塊由MK-MMD 度量和JMMD 度量組成。
圖2 深度遷移網(wǎng)絡(luò)結(jié)構(gòu)
基于所提深度遷移網(wǎng)絡(luò)的診斷模型主要實現(xiàn)步驟如下:
Step 1:數(shù)據(jù)預(yù)處理。采用滑動窗口對原始振動信號進(jìn)行不重疊切割;同時為將每個樣本的輸入值保持在一定范圍內(nèi),采用歸一化方法。
Step 2:網(wǎng)絡(luò)預(yù)訓(xùn)練。在前30 次訓(xùn)練中,只利用帶標(biāo)簽源域樣本對狀態(tài)識別模塊進(jìn)行預(yù)訓(xùn)練,以使特征提取網(wǎng)絡(luò)、瓶頸層和標(biāo)簽分類器獲得較好的模型參數(shù)。
Step 3:域遷移訓(xùn)練。在帶標(biāo)簽源域樣本訓(xùn)練模型的基礎(chǔ)上,增加無標(biāo)簽的目標(biāo)域樣本進(jìn)行同時訓(xùn)練。其中,MK-MMD 產(chǎn)生LM損失,JMMD 產(chǎn)生LJ損失,兩者與標(biāo)簽分類損失一起構(gòu)成總損失,再通過反向傳播以減小源域和目標(biāo)域特征分布差異。
Step 4:故障診斷。利用訓(xùn)練完備的模型對測試集的無標(biāo)簽?zāi)繕?biāo)域樣本進(jìn)行狀態(tài)識別,完成診斷。
如圖3 所示,所提模型的損失函數(shù)L包含三部分,即標(biāo)簽分類損失LP、MK-MMD 度量損失LM與JMMD 度量分布損失LJ。損失函數(shù)L公式描述如下:
圖3 機械故障實驗臺
式中:θG表示特征提取網(wǎng)絡(luò)參數(shù),θB為瓶頸層參數(shù),θP為標(biāo)簽分類器參數(shù)。
2.3.1 標(biāo)簽分類損失
通過帶標(biāo)簽的源域樣本對特征提取網(wǎng)絡(luò)、瓶頸層和標(biāo)簽分類器進(jìn)行有監(jiān)督訓(xùn)練,標(biāo)簽分類損失采用交叉熵?fù)p失函數(shù)衡量,其公式如下:
式中:GG代表特征提取網(wǎng)絡(luò),GB為瓶頸層,GP代表標(biāo)簽分類器。
2.3.2 多核最大均值度量損失
MMD 雖具有一定的差異度量能力,但其基于單一核變換,難以多空間衡量分布差異,為此引入多核模式,即由多個核進(jìn)行線性組合,具體如下:
式中:βu是不同內(nèi)核的加權(quán)參數(shù)。
基于上式得到表征能力更強的多核MMD 度量(MK-MMD),進(jìn)而得到MK-MMD 度量損失LM,其表達(dá)式如下:
2.3.3 聯(lián)合最大均值度量損失
借鑒文獻(xiàn)[10],引入JMMD,同時度量源域與目標(biāo)域之間的邊緣分布和條件分布差異。JMMD 的公式如下:
本研究基于Spectra Quest 公司設(shè)計的機械故障綜合模擬實驗臺進(jìn)行故障數(shù)據(jù)采集,如圖3 所示,其主要由轉(zhuǎn)速控制器、旋轉(zhuǎn)軸和加速度傳感器等部件組成。加速度傳感器型號為PCB352C33,實驗軸承的型號為ER12KCL,實驗滾動軸承的直徑為19.05 mm。
分別在1400 r/min、1800 r/min 和2200 r/min 轉(zhuǎn)速下收集實驗數(shù)據(jù)。采樣頻率為12.8 kHz,采集時間10 s。滾動軸承有內(nèi)圈(IF)、外圈(OF)、滾動體(BF)和綜合(CF)四種故障狀態(tài)及正常狀態(tài)(N),如圖4 所示。
圖4 不同狀態(tài)下的滾動軸承
對原始數(shù)據(jù)進(jìn)行不重疊切割。基于采樣頻率,選擇三個采樣周期,即樣本長度設(shè)為1024,最終每類故障獲得125 個樣本,見表1。為消除樣本奇異數(shù)據(jù)導(dǎo)致的不良影響,進(jìn)行歸一化處理。
表1 故障數(shù)據(jù)集說明
選擇2 dB 強噪聲背景,用A、B、C 分別代表1400 r/min、1800 r/min 和2200 r/min 三種轉(zhuǎn)速數(shù)據(jù)集,六組遷移任務(wù)分別用A to B、A to C、B to A、B to C、C to A、C to B 表示,如A to B 表示:源域為1400 r/min數(shù)據(jù)集及目標(biāo)域為1800 r/min 數(shù)據(jù)集。分別從帶標(biāo)簽源域樣本集和無標(biāo)簽?zāi)繕?biāo)域樣本集選取80%作為訓(xùn)練集,目標(biāo)域樣本集的剩余20%作為測試集。
為驗證所提模型的遷移性能,將其與DCORAL、DAN、JAN、DANN、CDAN 等五種域適應(yīng)模型進(jìn)行比較。其中,DAN、JAN 和DCORAL 是基于顯式距離度量的深度域適應(yīng)模型,DANN 和CDAN 是基于對抗學(xué)習(xí)的深度域適應(yīng)模型。實驗使用Pytorch 深度學(xué)習(xí)框架,batch 為64,學(xué)習(xí)率為0.001,epoch 為100。對六組遷移任務(wù)分別同時進(jìn)行5 次實驗,并取實驗結(jié)果的平均值進(jìn)行模型性能評估。不同任務(wù)的遷移診斷結(jié)果如圖5 所示,每個模型在所有任務(wù)的平均準(zhǔn)確率及標(biāo)準(zhǔn)差見表2。
表2 不同模型的故障診斷結(jié)果
圖5 不同任務(wù)的遷移診斷結(jié)果
由遷移結(jié)果對比可知,DCORAL 模型的診斷性能最差,識別準(zhǔn)確率僅為75.07%。其中DAN 和DANN兩種模型都只關(guān)注邊緣分布適配,識別準(zhǔn)確率分別為88.75%和90.60%,但兩者的準(zhǔn)確率明顯高于DCORAL。JAN 模型將邊緣分布與條件分布同時適配,準(zhǔn)確率為90.15%,略高于DAN 模型。CDAN 模型是在DAN 模型基礎(chǔ)上改進(jìn)的,識別準(zhǔn)確率為90.85%。對比而言,所提遷移方法的識別準(zhǔn)確率96.56%最高,且標(biāo)準(zhǔn)差最小,明顯優(yōu)于5 種對比模型。
強噪聲下基于深度特征提取與遷移學(xué)習(xí)的滾動軸承故障診斷模型,其深度特征提取網(wǎng)絡(luò)通過融合MSCNN 與BiGRU 并引入注意力機制模塊,對帶噪聲的振動信號進(jìn)行深度故障特征挖掘。針對變工況導(dǎo)致源域與目標(biāo)域數(shù)據(jù)分布不同的問題,在模型中引入遷移學(xué)習(xí),通過多級距離度量以減小源域與目標(biāo)域特征分布差異,進(jìn)而實現(xiàn)對無標(biāo)簽?zāi)繕?biāo)域樣本的故障診斷。