王 磊,孫志成,王 磊,陳端兵,3*,蔣家瑋
(1. 中國(guó)人民解放軍63861 部隊(duì) 吉林 137001;2. 成都數(shù)之聯(lián)科技股份有限公司 成都 610041;3. 電子科技大學(xué)大數(shù)據(jù)研究中心 成都 611731)
滾動(dòng)軸承是現(xiàn)代機(jī)械設(shè)備中廣泛應(yīng)用的零部件之一,它依靠主要元件間的滾動(dòng)接觸來支撐機(jī)械設(shè)備的運(yùn)行,在飛機(jī)、風(fēng)力渦輪機(jī)、鐵路軸和發(fā)電機(jī)等多個(gè)行業(yè)中應(yīng)用廣泛。這些機(jī)器系統(tǒng)在某些不利條件下運(yùn)行時(shí),一個(gè)微小的故障就可能導(dǎo)致一連串的電機(jī)損壞,具有維護(hù)成本高、經(jīng)濟(jì)損失嚴(yán)重和安全隱患重大等問題[1-4]。特別地,在高速、重載、極端工作溫度和污染等嚴(yán)酷環(huán)境下,機(jī)械系統(tǒng)中的軸承很容易發(fā)生故障。因此,軸承的故障診斷在系統(tǒng)運(yùn)行過程中至關(guān)重要。
軸承故障診斷的一個(gè)重要手段是利用軸承的振動(dòng)信號(hào)進(jìn)行檢測(cè)?;谳S承振動(dòng)信號(hào)的故障診斷一般分為兩個(gè)階段:特征提取和分類[5]。傳統(tǒng)機(jī)器學(xué)習(xí)的特征大致可分為3 種不同類型:時(shí)域(timedomain)[6]、 頻 域(frequency-domain)[7]和 時(shí) 頻 域(time-frequency-domain)[8]。由于信號(hào)的時(shí)域特征較為簡(jiǎn)單,不能準(zhǔn)確表示軸承所有的故障信息。因此,需要將時(shí)域信息轉(zhuǎn)化為表達(dá)更豐富的頻域或時(shí)頻域信息,如振幅譜[9]、功率譜[10]、傅里葉變換[11]和經(jīng)驗(yàn)?zāi)J椒纸鈁12]等。然而,并非所有的特征都對(duì)診斷有用,許多特征不僅會(huì)增加計(jì)算復(fù)雜度,而且會(huì)降低故障分類的準(zhǔn)確性。因此,需要利用特征降維技術(shù),從高維特征中選擇合適的特征,只將這些相關(guān)的特征輸入分類器對(duì)信號(hào)進(jìn)行分類。
在傳統(tǒng)的軸承故障診斷過程中,信號(hào)特征的提取相當(dāng)耗時(shí),并且強(qiáng)依賴于專業(yè)的信號(hào)處理知識(shí)。隨著深度學(xué)習(xí)的發(fā)展,相繼提出了基于深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的軸承故障診斷方法。文獻(xiàn)[13]在對(duì)原始數(shù)據(jù)進(jìn)行離散傅里葉變換后,利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)自動(dòng)提取用于軸承故障診斷的特征。文獻(xiàn)[5,14-17]針對(duì)CNN進(jìn)行改進(jìn),嘗試在世界公認(rèn)的軸承故障診斷標(biāo)準(zhǔn)數(shù)據(jù)[18]-凱斯西儲(chǔ)大學(xué)(Case Western Reserve University,CWRU)數(shù)據(jù)集[19]上提升故障診斷效果。為了考慮信號(hào)的時(shí)序信息,文獻(xiàn)[20]結(jié)合長(zhǎng)短期記憶(long short-term memory, LSTM)模型,提出了一種含有3 個(gè)LSTM 模塊的分層深度學(xué)習(xí)軸承故障診斷算法。之后,文獻(xiàn)[21]利用CNN 分別提取信號(hào)的高頻信息和低頻信息,提出了MCNN-LSTM 模型。特別地,由于ResNet-50[22]在圖像領(lǐng)域能提取高質(zhì)量的圖像特征,文獻(xiàn)[23]將時(shí)域故障信號(hào)轉(zhuǎn)換為RGB 圖像格式作為輸入,提出了TCNN(ResNet-50)模型。
然而,軸承振動(dòng)信號(hào)是由放置在設(shè)備上的傳感器所收集,收集到的信號(hào)中往往包含大量噪音。在噪聲的干擾下,卷積核學(xué)習(xí)到的深層特征往往判別性不足,不能準(zhǔn)確地進(jìn)行故障分類。因此,在上述端到端的深度學(xué)習(xí)故障診斷算法中,診斷前需要進(jìn)行信號(hào)去噪。在傳統(tǒng)的信號(hào)去噪算法中通常采用軟閾值法處理,如小波閾值法,它由3 個(gè)步驟組成:小波分解、軟閾值和小波重構(gòu)。為了保證信號(hào)去噪的性能,小波閾值法的一個(gè)關(guān)鍵任務(wù)是設(shè)計(jì)一個(gè)濾波器,將噪聲信息轉(zhuǎn)換為接近零的特征。然而,設(shè)計(jì)這樣一個(gè)濾波器通常很難設(shè)置合適的閾值。將軟閾值和深度學(xué)習(xí)相結(jié)合是消除噪聲、構(gòu)造高分辨特征的新途徑。針對(duì)這一問題,文獻(xiàn)[24]設(shè)計(jì)了兩種深度殘差收縮網(wǎng)絡(luò)(deep residual shrinkage networks,DRSN):通道共享閾值殘差收縮模塊(residual shrinkage building unit with channel-shared thresholds,RSBU-CS) 與逐通道不同閾值的殘差收縮模塊(deep residual shrinkage networks with channel-wise thresholds, DRSN-CW),通過機(jī)器學(xué)習(xí)的方法自適應(yīng)確定軟閾值以消除噪聲的影響,軟閾值的加入使得兩種DRSNs 能有效減少數(shù)據(jù)中噪聲的影響,從而提高特征的有效性。RSBU-CS 與DRSN-CW 的區(qū)別在于,特征圖的每個(gè)通道是否有獨(dú)立的閾值。RSBU-CS 的所有特征通道使用相同的閾值,在特征映射過程中,不同通道通常包含不同數(shù)量的噪聲。相比于RSBU-CS,DRSN-CW 允許特征映射過程中每個(gè)信道具有自己的閾值。因此,DRSNCW 比RSBU-CS 具有更高的特征提取能力。
基于DRSNs 中的DRSN-CW 模塊,本文設(shè)計(jì)了一個(gè)無需對(duì)信號(hào)進(jìn)行前期處理的端到端軸承故障診斷模型DRSN-LSTM,模型分為特征提取和故障分類兩個(gè)階段。在特征提取階段,DRSN-CW 模塊能有效提取頻域中的有用信息,并自動(dòng)去掉噪聲信息,使提取到的特征更有鑒別性。在故障分類階段,首先利用LSTM 提取時(shí)域信息,接著引入self-attention 機(jī)制,在分類任務(wù)前自動(dòng)關(guān)注時(shí)域信息中的有用信息,最后將時(shí)域信息與頻域信息融合,再次采用LSTM 進(jìn)行分類。
將原始信號(hào)數(shù)據(jù)直接輸入神經(jīng)網(wǎng)絡(luò),而無需前期的信號(hào)預(yù)處理等操作。利用深度學(xué)習(xí),自動(dòng)從原始的含噪聲的振動(dòng)信號(hào)數(shù)據(jù)中提取特征,以用于軸承的故障診斷。
基于本文采取DRSN-CW 模型對(duì)帶噪聲的信號(hào)進(jìn)行特征提取和降噪,以獲得更具辨識(shí)度的信號(hào)特征。在特征提取階段,本文首先利用一個(gè)卷積核為20×20,步長(zhǎng)為2 的一維卷積(Conv1D)對(duì)輸入信號(hào)(或特征)的局部區(qū)域進(jìn)行卷積運(yùn)算,產(chǎn)生相應(yīng)的特征。然后利用DRSN-CW 對(duì)信號(hào)噪聲的學(xué)習(xí)能力,在消除原始信號(hào)中噪聲的同時(shí),提取出更為高級(jí)的信號(hào)特征。DRSN-CW 中同樣采用大感受野(2 0×20和 1 0×10)的卷積進(jìn)行特征提取。最終,將提取的特征輸入分類器(堆疊LSTM 網(wǎng)絡(luò)),用于軸承故障的診斷。
在軸承信號(hào)分類與故障診斷階段,首先利用LSTM 模型抽取振動(dòng)信號(hào)特征之間的時(shí)序信息。LSTM 是一種時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò),解決了常規(guī)循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)存在的長(zhǎng)期依賴問題,即當(dāng)相關(guān)信息和當(dāng)前預(yù)測(cè)位置之間的間隔變得非常大時(shí),RNN 會(huì)喪失學(xué)習(xí)遠(yuǎn)距離信息的能力。造成長(zhǎng)期依賴問題的主要原因在于,RNN 在反向傳播中很容易出現(xiàn)梯度消失或梯度爆炸的問題,導(dǎo)致長(zhǎng)距離的信息丟失。而LSTM 通過增加輸入門(input gate)、輸出門(output gate)和遺忘門(forget gate)解決了這些問題。圖1 顯示了LSTM 神經(jīng)元的內(nèi)部結(jié)構(gòu)。
圖1 LSTM 神經(jīng)元內(nèi)部結(jié)構(gòu)
沿時(shí)間軸,LSTM 利用上述3 個(gè)門控制信息在“細(xì)胞”內(nèi)的傳遞,更新當(dāng)前“細(xì)胞”狀態(tài)。輸入門決定了輸入xt和 前一層的隱藏狀態(tài)ht-1是否應(yīng)該被添加到當(dāng)前單元狀態(tài)。遺忘門與前一個(gè)隱藏狀態(tài)ht-1和 當(dāng)前輸入xt有關(guān),它決定當(dāng)前單元值是否保留。最后,輸出門利用一個(gè)tanh 層判斷輸出哪些狀態(tài)特征,作為下一個(gè)“細(xì)胞”的輸入。LSTM 神經(jīng)元在每一步都會(huì)輸出一個(gè)狀態(tài)響應(yīng)列表,其中包含之前的輸出信息和當(dāng)前的輸入信息。記憶單元確保梯度可以傳遞到許多時(shí)間步,而不會(huì)出現(xiàn)梯度消失或爆炸的情況。因此,LSTM 克服了訓(xùn)練過程中由梯度消失效應(yīng)造成的困難。3 個(gè)門的具體計(jì)算方法如下:
在抽取出振動(dòng)信號(hào)特征之間的時(shí)序信息后,再利用Self-attention 機(jī)制,挖掘時(shí)序信號(hào)特征的相對(duì)重要性,使得模型更關(guān)注重要的時(shí)序信息,忽略其他不重要的時(shí)序信息。H1∈Rd×N表示第一層LSTM模型各個(gè)時(shí)刻的輸出向量 [h1,h2,···,hN]所組成的矩陣,N表示第一層LSTM 的時(shí)間步長(zhǎng)。注意力權(quán)重為α=softmax(WhH1), 其中Wh∈Rd×d為模型參數(shù),注意力權(quán)重α ∈RN。
結(jié)合注意力權(quán)重,將新的特征向量H2=H1αT輸入到下一層LSTM 中。最后,將尾端輸出向量x作為特征進(jìn)行分類。為避免故障分類造成過擬合,在最后一層LSTM 后加入Dropout 層,以一定概率將神經(jīng)單元暫時(shí)屏蔽。
完整模型網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。經(jīng)過softmax分類函數(shù)后,模型可以預(yù)測(cè)該信號(hào)s為類別yi的概率p(yi),具體計(jì)算公式為:
式中,Strain為 訓(xùn)練樣本;Ntrain為訓(xùn)練樣本的數(shù)目。為了學(xué)習(xí)到網(wǎng)絡(luò)最佳超參數(shù),本文采用能自動(dòng)調(diào)整學(xué)習(xí)率的Adam(adaptive moments)[25]算法優(yōu)化目標(biāo)函數(shù),設(shè)定初始化學(xué)習(xí)率為0.006。
圖2 基于DRSN-CW 和LSTM 的軸承故障診斷框架
本文的原始實(shí)驗(yàn)數(shù)據(jù)是從CWRU 軸承數(shù)據(jù)中心[19]以12 kHz 的采樣頻率從電機(jī)驅(qū)動(dòng)機(jī)械系統(tǒng)的加速計(jì)中獲得。被診斷的軸承一共有3 種缺陷類型,分別是滾動(dòng)體損傷、外圈損傷與內(nèi)圈損傷,損傷直徑的大小分別為0.007 、 0.014 和 0.021 inch,共有10 種故障類別(包括正常軸承)。針對(duì)不同馬力(horsepower, HP)負(fù)載情況,收集了0、1、2 和3 HP 負(fù)載下10 種不同類型的故障。
為了評(píng)估模型對(duì)軸承故障的診斷能力,本文采用準(zhǔn)確度(Accuracy)、精確度(Precision)、召回率(Recall)和F1 分?jǐn)?shù)來驗(yàn)證模型的有效性,其計(jì)算公式為:
式中,TP、FP、FN 和TN 分別代表真陽性、假陽性、假陰性和真陰性結(jié)果的數(shù)量。針對(duì)CWRU 中的10 個(gè)故障類型,分別將每種類型都看做正樣本,剩下的類型看做負(fù)樣本。真陽性就代表被模型預(yù)測(cè)為正的正樣本,假陽性代表被模型預(yù)測(cè)為正的負(fù)樣本,假陰性代表被模型預(yù)測(cè)為負(fù)的正樣本,真陰性代表被模型預(yù)測(cè)為負(fù)的負(fù)樣本。
MCNN-LSTM[21]方法已遠(yuǎn)超于其他傳統(tǒng)方法,平均故障檢測(cè)準(zhǔn)確率超過90%,因此本文只選擇MCNN-LSTM 模型作為對(duì)比算法。除此以外,在模型訓(xùn)練之前,MCNN-LSTM 采用下采樣以達(dá)到降噪的目的,而本文模型不進(jìn)行任何信號(hào)預(yù)處理。
在CWRU 數(shù)據(jù)集中的0、1、2 和3 HP 這4 類負(fù)載數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),設(shè)定 δ=0.05和0.10 進(jìn)行訓(xùn)練集信號(hào)采樣,最終實(shí)驗(yàn)結(jié)果見表1。表1 中的Precision、Recall 和F1 為10 類故障的均值。實(shí)驗(yàn)表明,在訓(xùn)練集相對(duì)充足的情況下(δ =0.10),本文方法在4 項(xiàng)指標(biāo)上都略優(yōu)于MCNN-LSTM。而當(dāng)訓(xùn)練數(shù)據(jù)進(jìn)一步減少, δ=0.05時(shí),本文方法明顯優(yōu)于MCNN-LSTM。主要原因在于訓(xùn)練數(shù)據(jù)量較低的情況下,利用DRSN-CW 能提取更有鑒別性的特征。同時(shí),DRSN-CW 為每個(gè)特征通道學(xué)習(xí)到了獨(dú)立的降噪閾值,有偏向性的降噪相比于MCNNLSTM 采用的簡(jiǎn)單下采樣降噪方法,能保留更多的信號(hào)特征。特別是在訓(xùn)練數(shù)據(jù)量不足的情況下,DRSN-CW 保留的信號(hào)特征越多,所得到的特征也就更豐富。另外,引入注意力機(jī)制使得時(shí)序信息能更好地融入信號(hào)特征中,從而得到準(zhǔn)確性更高的特征。
表1 軸承故障診斷實(shí)驗(yàn)結(jié)果
為了進(jìn)一步驗(yàn)證訓(xùn)練集對(duì)模型分類的影響,取δ ∈[0.05,0.50]進(jìn)行軸承故障診斷實(shí)驗(yàn),如圖4 所示。從圖3 看出,在4 類負(fù)載的數(shù)據(jù)集中,提出的DRSNCW-LSTM 在 δ <0.15時(shí),軸承故障診斷準(zhǔn)確率明顯高于MCNN-LSTM。隨著 δ的增大,訓(xùn)練集越來越豐富,兩者均能很好地診斷出軸承的故障,診斷準(zhǔn)確率也都達(dá)到了99%以上。而在0 HP 與1 HP數(shù)據(jù)集中,本文方法能更快地達(dá)到99%的準(zhǔn)確率。
圖3 不同訓(xùn)練集比例下的軸承故障診斷對(duì)比實(shí)驗(yàn)
為了驗(yàn)證分類模塊中加入的Attention 機(jī)制是否有效,在移除注意力機(jī)制后進(jìn)行了消融實(shí)驗(yàn),結(jié)果如圖4 所示。在訓(xùn)練集有限的情況下δ ∈[0.05,0.20],引入Attention 后的模型明顯優(yōu)于無Attention 的模型。隨著訓(xùn)練數(shù)據(jù)量的增加,兩個(gè)模型都能很好地提取出信號(hào)的有效特征,軸承故障診斷準(zhǔn)確率均能達(dá)到99%以上。注意力機(jī)制的引入是為了融合信號(hào)的時(shí)域與頻域信息。在訓(xùn)練樣本缺失,特征提取不足的情況下,注意力機(jī)制能極大地補(bǔ)充軸承振動(dòng)信號(hào)的特征信息,為后續(xù)的故障診斷帶來明顯增益。
圖4 Self-Attention 消融實(shí)驗(yàn)
本文提出了一種新的端到端的滾動(dòng)軸承故障智能診斷模型,該模型包括特征提取模塊和分類器模塊。特征提取模塊在對(duì)原始數(shù)據(jù)進(jìn)行降噪處理的同時(shí),學(xué)習(xí)到更有鑒別性的頻域特征。在分類模塊中,由于輸入的特征為序列化的頻域特征,而LSTM 可以很好地利用信號(hào)的時(shí)序特點(diǎn),提取頻域特征之間的時(shí)域特征,同時(shí),注意力機(jī)制的引入使得模型能自動(dòng)提取出重要的時(shí)域特征。將時(shí)域信息與頻域信息融合后,使用softmax 函數(shù)將神經(jīng)元輸出轉(zhuǎn)換為滾動(dòng)軸承故障(包括正常)的概率分布。本文在CWRU 軸承數(shù)據(jù)集下驗(yàn)證了所提出的故障診斷模型的可行性,在訓(xùn)練集充足的情況下,本文提出的DRSNCW-LSTM 模型略優(yōu)于當(dāng)前最新的MCNN-LSTM 模型。而當(dāng)訓(xùn)練集缺乏時(shí),本文模型在4 個(gè)數(shù)據(jù)集上平均準(zhǔn)確率達(dá)到了98.16%,對(duì)比MCNN-LSTM 模型,準(zhǔn)確率平均提升了2.6%。在沒有任何信號(hào)預(yù)處理的專業(yè)知識(shí)背景下,本文方法能準(zhǔn)確地診斷出軸承的故障,提高機(jī)械系統(tǒng)的可靠性,可以有效避免大型事故的發(fā)生。