陳國(guó)俊, 蘇燕辰, 寇皓為, 鄧 越, 李恒奎
(1. 西南交通大學(xué)機(jī)械工程學(xué)院,四川 成都 610031; 2. 軌道交通運(yùn)維技術(shù)與裝備四川省重點(diǎn)實(shí)驗(yàn)室,四川 成都 610031;3. 青島四方機(jī)車(chē)車(chē)輛股份有限公司,山東 青島 266031)
軸承在機(jī)械行業(yè)快速發(fā)展的時(shí)代一直扮演著十分重要的角色,一旦發(fā)生故障,便會(huì)對(duì)機(jī)械結(jié)構(gòu)的健康狀態(tài)帶來(lái)巨大破壞并造成經(jīng)濟(jì)損失。因此,對(duì)軸承的狀態(tài)進(jìn)行實(shí)時(shí)檢測(cè)非常有必要。
隨著時(shí)間的推移,軸承故障診斷的方法也在不斷的改進(jìn)。傳統(tǒng)方法通過(guò)人工提取信號(hào)特征判斷故障是否發(fā)生,其中較經(jīng)典的有經(jīng)驗(yàn)?zāi)B(tài)分解、快速傅里葉變換和經(jīng)驗(yàn)小波變換等信號(hào)處理技術(shù)[1-4]。傳統(tǒng)診斷方法依賴(lài)專(zhuān)家經(jīng)驗(yàn),在大數(shù)據(jù)時(shí)代不能滿(mǎn)足自動(dòng)化的需求。之后,針對(duì)滾動(dòng)軸承國(guó)內(nèi)外一些學(xué)者提出了隨機(jī)森林、支持向量機(jī)、Xgboost 等機(jī)器學(xué)習(xí)方法[5-7],使模型準(zhǔn)確率得到較大提升,但是其方法具備一定的局限性,且準(zhǔn)確率達(dá)不到較高要求。深度學(xué)習(xí)以其強(qiáng)大的建模與數(shù)據(jù)處理能力,在數(shù)據(jù)處理方面具有獨(dú)特的優(yōu)勢(shì),越來(lái)越多的深度學(xué)習(xí)算法被應(yīng)用在滾動(dòng)軸承故障診斷上[8-9]。Hoang 等[10]將滾動(dòng)軸承一維振動(dòng)信號(hào)轉(zhuǎn)換成二維灰度圖,作為振動(dòng)圖像CNN(VI-CNN)模型的輸入應(yīng)用于滾動(dòng)軸承故障模式的自動(dòng)識(shí)別,避免了手工提取信號(hào)特征,但未考慮時(shí)序信息的丟失,準(zhǔn)確率不是特別理想。陳保家等[11]提出了CNN-LSTM 診斷模型,其先利用CNN 進(jìn)行自適應(yīng)故障特征提取,然后利用長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)(LSTM)學(xué)習(xí)故障特征,診斷的全過(guò)程沒(méi)有人工參與且故障診斷效果較好,但是其模型不夠便捷快速。
GRU 是LSTM 的改進(jìn)版[12],它相比LSTM 更加容易收斂和訓(xùn)練。本文在CNN-LSTM 診斷模型的基礎(chǔ)上,提出使用GRU 替換LSTM,從而使網(wǎng)絡(luò)收斂更快,且加入殘差網(wǎng)絡(luò)解決神經(jīng)網(wǎng)絡(luò)深度較深的問(wèn)題,并通過(guò)實(shí)驗(yàn)與CNN 網(wǎng)絡(luò)、CNN-LSTMResnet 網(wǎng)絡(luò)、CNN-GRU 網(wǎng)絡(luò)對(duì)比,進(jìn)一步驗(yàn)證了本文方法比其他方法更加快速,準(zhǔn)確率更高。
門(mén)控循環(huán)單元(gated recurrent unit)相比LSTM(long short-term memory)網(wǎng)絡(luò)結(jié)構(gòu)更簡(jiǎn)單,它也可以解決RNN 網(wǎng)絡(luò)中長(zhǎng)輸入序列帶來(lái)的梯度消失問(wèn)題[13]。圖1為GRU 的結(jié)構(gòu)圖。
圖1 門(mén)控循環(huán)單元
GRU 使用更新門(mén)、重置門(mén)等提取時(shí)序數(shù)據(jù)中的長(zhǎng)期依賴(lài)關(guān)系,減少梯度消失問(wèn)題。運(yùn)算過(guò)程分為4 個(gè)部分:重置門(mén)、更新門(mén)、候選隱含狀態(tài)運(yùn)算以及隱含狀態(tài)運(yùn)算,公式如下:
式中:Rt——重置門(mén)的輸出結(jié)果;
Zt——更新門(mén)的輸出結(jié)果;
——候選隱含狀態(tài)的輸出;
ht——t時(shí)刻的隱藏狀態(tài)量;
Wr、Wz和——對(duì)應(yīng)量權(quán)重。
理論上深神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的效果并不比淺神經(jīng)網(wǎng)絡(luò)差,但在實(shí)踐中卻發(fā)現(xiàn)深度越深時(shí),梯度消失或爆炸的可能性越大。He 等[14]提出了殘差神經(jīng)網(wǎng)絡(luò)(residual neural network,Resnet),它可以有效解決實(shí)際中神經(jīng)網(wǎng)絡(luò)深度增加時(shí)出現(xiàn)的性能下降問(wèn)題。圖2 為殘差塊的結(jié)構(gòu)圖。
圖2 殘差網(wǎng)絡(luò)的結(jié)構(gòu)圖
前向傳播時(shí),因包含一個(gè)恒等映射,所以在一定程度上可以解決網(wǎng)絡(luò)退化問(wèn)題。反向傳播時(shí),信號(hào)可以不經(jīng)過(guò)權(quán)重網(wǎng)絡(luò)而直接傳遞到底層,在一定程度上可以解決梯度彌散問(wèn)題。
為了增強(qiáng)神經(jīng)網(wǎng)絡(luò)的故障檢測(cè)能力,本文提出在CNN 特征提取下GRU 與殘差神經(jīng)網(wǎng)絡(luò)有機(jī)結(jié)合的故障診斷網(wǎng)絡(luò),并簡(jiǎn)稱(chēng)為GBRN(gated recurrent unit based on residual network),其網(wǎng)絡(luò)模型結(jié)構(gòu)如圖3 所示。
GBRN 模型主要由2 層卷積神經(jīng)網(wǎng)絡(luò)、2 個(gè)GRU層以及1 個(gè)殘差塊組成。在GBRN 中,前兩層傳統(tǒng)的卷積和池化運(yùn)算對(duì)原始的一維振動(dòng)信號(hào)進(jìn)行充分的特征提取以及降低數(shù)據(jù)維度,GRU 可保證時(shí)序信息不丟失,殘差結(jié)構(gòu)可防止神經(jīng)網(wǎng)絡(luò)深度較深時(shí)出現(xiàn)梯度消失。模型最后通過(guò)一個(gè)輸出層將結(jié)果輸出。
為了提高整個(gè)網(wǎng)絡(luò)模型的訓(xùn)練效率,選用最常見(jiàn)的relu作為卷積和全連接層的激活函數(shù)。鑒于軸承的振動(dòng)信號(hào)是一維時(shí)間序列數(shù)據(jù),所以本文利用一維卷積網(wǎng)絡(luò)進(jìn)行信號(hào)特征的提取。
為了驗(yàn)證本文所提算法的可行性,選用公開(kāi)且公認(rèn)標(biāo)準(zhǔn)的美國(guó)凱斯西儲(chǔ)大學(xué)的滾動(dòng)軸承故障數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)分析。凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)是10 分類(lèi)問(wèn)題,所以最后輸入到分類(lèi)器中用于10 分類(lèi)的數(shù)據(jù)識(shí)別。模型的具體參數(shù)如表1 所示。
表1 GBRN 結(jié)構(gòu)參數(shù)
采用美國(guó)凱斯西儲(chǔ)大學(xué)(CWRU)的滾動(dòng)軸承故障數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),圖4 為數(shù)據(jù)采集現(xiàn)場(chǎng)。
圖4 CWRU 軸承數(shù)據(jù)采集系統(tǒng)
實(shí)驗(yàn)有外圈、滾子、內(nèi)圈3 種故障位置,每種故障位置有3 種不同尺寸的缺陷。本文還使用了1 組正常軸承進(jìn)行了實(shí)驗(yàn)。因此,實(shí)驗(yàn)共有9 種故障的信號(hào)和1 種正常的信號(hào),共計(jì)10 種信號(hào)。實(shí)驗(yàn)分別在電機(jī)轉(zhuǎn)速為1 730、1 750、1 772、1 797 r/min 條件下得到了4 組不同的數(shù)據(jù)。
輸出的數(shù)據(jù)標(biāo)簽使用One-Hot 編碼的形式,每一個(gè)樣本對(duì)應(yīng)一個(gè)類(lèi)別,即一個(gè)類(lèi)別只有在對(duì)應(yīng)的特征值才為1,其他的值均為0。
本文分別利用4 種電機(jī)轉(zhuǎn)速下的數(shù)據(jù)進(jìn)行實(shí)驗(yàn),選取的樣本長(zhǎng)度均為1 024,因?yàn)榫W(wǎng)絡(luò)參數(shù)較多,為了使網(wǎng)絡(luò)訓(xùn)練的更好,將訓(xùn)練樣本劃分較大的比例,每次實(shí)驗(yàn)共4 000 條訓(xùn)練樣本,800 條測(cè)試樣本,具體情況如表2 所示(1 inch=25.4 mm)。
表2 實(shí)驗(yàn)數(shù)據(jù)
實(shí)驗(yàn)使用TensorFlow 框架進(jìn)行網(wǎng)絡(luò)模型的訓(xùn)練與測(cè)試。實(shí)驗(yàn)中,將Mini-batch 設(shè)置為1 00,初始學(xué)習(xí)率設(shè)置為0.001,使用Adam 優(yōu)化器,epoch 設(shè)置為1 00。GBRN 模型在訓(xùn)練集和測(cè)試集上的損失值和準(zhǔn)確率結(jié)果分別如圖5 和圖6 所示。
圖5 模型訓(xùn)練和測(cè)試時(shí)的損失值曲線(xiàn)
圖6 模型訓(xùn)練和測(cè)試時(shí)的準(zhǔn)確率曲線(xiàn)
由圖可知,GBRN 算法的故障識(shí)別準(zhǔn)確率可以達(dá)到較好的效果,模型的診斷能力良好。
為了進(jìn)一步說(shuō)明GBRN 算法的故障診斷能力,在相同的數(shù)據(jù)集下將GBRN 模型與其他深度學(xué)習(xí)算法進(jìn)行對(duì)比,對(duì)比實(shí)驗(yàn)與GBRN 的環(huán)境相同。對(duì)比實(shí)驗(yàn)一:全CNN 網(wǎng)絡(luò);對(duì)比實(shí)驗(yàn)二:CNN-LSTMResnet,用于比較GRU 與LSTM 的效果;對(duì)比實(shí)驗(yàn)三:CNN-GRU,用于顯示Resnet 的作用。對(duì)比實(shí)驗(yàn)的結(jié)果如圖7~圖9 所示。
圖7 全CNN 的效果
圖8 CNN-LSTM-Resnet 的效果
圖9 CNN-GRU 的效果
由圖可知,基于深度學(xué)習(xí)的診斷方法都可取得較好的故障診斷效果,10 分類(lèi)的準(zhǔn)確率都在97%以上,分別為97.69%、98.91%、98.90%以及99.42%,其中GBRN 算法的準(zhǔn)確率最高。實(shí)驗(yàn)在不同電機(jī)轉(zhuǎn)速對(duì)應(yīng)的數(shù)據(jù)集下得到的平均故障診斷準(zhǔn)確率以及訓(xùn)練時(shí)長(zhǎng)如圖10 所示。
圖10 不同算法結(jié)果圖
對(duì)比實(shí)驗(yàn)一中全CNN 網(wǎng)絡(luò)即使參數(shù)較多,但是存在權(quán)值共享,最終訓(xùn)練總時(shí)間小于其他網(wǎng)絡(luò),所以本文先利用CNN 提取信號(hào)特征,再將信息輸入至GRU 網(wǎng)絡(luò)以提高網(wǎng)絡(luò)實(shí)用性。對(duì)比實(shí)驗(yàn)二顯示使用GRU 網(wǎng)絡(luò)較LSTM 網(wǎng)絡(luò)減少大約4.0%的訓(xùn)練時(shí)間,增加0.51% 的準(zhǔn)確率。對(duì)比實(shí)驗(yàn)三說(shuō)明使用殘差網(wǎng)絡(luò)可使損失值的變化穩(wěn)定,穩(wěn)定性增加,進(jìn)而使模型準(zhǔn)確率增加。從整體角度分析GBRN模型在準(zhǔn)確率和穩(wěn)定性方面都比其他模型好。
為了進(jìn)一步驗(yàn)證GBRN 模型的有效性和適應(yīng)性,利用齒輪箱圓錐滾子軸承臺(tái)架試驗(yàn)數(shù)據(jù)對(duì)其進(jìn)行驗(yàn)證。數(shù)據(jù)采集現(xiàn)場(chǎng)如圖11 所示,轉(zhuǎn)軸的速度為54 r/s,轉(zhuǎn)軸的外部放置了4個(gè)傳感器,它們的采集頻率都為10 Hz。本文選取最上方振動(dòng)傳感器測(cè)得的垂向振動(dòng)數(shù)據(jù)進(jìn)行驗(yàn)證實(shí)驗(yàn)。
圖11 數(shù)據(jù)采集現(xiàn)場(chǎng)圖
因?qū)嶒?yàn)的故障類(lèi)型只有4 種,故將GBRN 的最后一個(gè)全連接層改為4。樣本長(zhǎng)度為1 024,560 個(gè)訓(xùn)練樣本,180 個(gè)測(cè)試樣本。具體詳情如表3所示。
表3 齒輪箱軸承的故障類(lèi)型
實(shí)驗(yàn)結(jié)果如圖12 所示,在訓(xùn)練樣本僅有560條的情況下,本文的GBRN 模型的故障診斷準(zhǔn)確率依然可以達(dá)到98.99 %。雖然整體診斷結(jié)果略低于使用CWRU 軸承數(shù)據(jù)進(jìn)行實(shí)驗(yàn)的結(jié)果,但依舊比其他模型效果好,保持了良好的診斷效果,所以該模型具有一定的通用性。
圖12 不同模型在齒輪箱圓錐滾子軸承數(shù)據(jù)中的診斷結(jié)果
本文提出的GBRN 模型是“端到端”的滾動(dòng)軸承故障診斷算法。該算法通過(guò)卷積神經(jīng)網(wǎng)絡(luò)提取軸承振動(dòng)信號(hào)中的信息,再將提取到的信息輸入GRU 網(wǎng)絡(luò)中以保證時(shí)序信息不丟失,最后通過(guò)殘差模塊解決神經(jīng)網(wǎng)絡(luò)深度較深問(wèn)題。通過(guò)美國(guó)凱斯西儲(chǔ)大學(xué)數(shù)據(jù)集和臺(tái)架試驗(yàn)數(shù)據(jù)集證明該算法具有更高的分類(lèi)準(zhǔn)確率和穩(wěn)定性。此模型具有一定的工程意義。