張曉鋒, 郝如江, 段澤森, 夏晗鐸, 程 旺
(石家莊鐵道大學(xué)機(jī)械工程學(xué)院,河北 石家莊 050043)
齒輪箱是旋轉(zhuǎn)機(jī)械的關(guān)鍵部件,而旋轉(zhuǎn)機(jī)械的機(jī)械故障約30%是由齒輪箱發(fā)生故障引起的[1]。而對(duì)機(jī)械設(shè)備進(jìn)行定期的故障診斷之后,可以將事故的發(fā)生率減少75%,維修的費(fèi)用也可以降低25%~50%[2]。伴隨著深度學(xué)習(xí)的快速發(fā)展,科研人員逐漸將淺層的機(jī)器學(xué)習(xí)方法應(yīng)用到旋轉(zhuǎn)機(jī)械的故障診斷之中,常見(jiàn)的有支持向量機(jī)、深度置信網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)等故障分類(lèi)方法或模型。殘差網(wǎng)絡(luò)(Residual Neural Network,ResNet)作為卷積神經(jīng)網(wǎng)絡(luò)的一種優(yōu)異模型,在圖像識(shí)別領(lǐng)域等二維信息之間應(yīng)用廣泛,本文對(duì)其進(jìn)行改進(jìn)使其具有良好的抗噪能力,以剔除具體工業(yè)環(huán)境下噪聲的干擾,以利于機(jī)械故障診斷。
當(dāng)傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)較深時(shí),模型難以直接擬合實(shí)際映射H(x),于是殘差網(wǎng)絡(luò)引入了x這一恒等映射,將問(wèn)題轉(zhuǎn)換為擬合殘差映射F(x),只需最小化殘差函數(shù)F(x)=H(x)-x來(lái)逼近實(shí)際映射,以此來(lái)解決網(wǎng)絡(luò)在加深時(shí)特征丟失這一問(wèn)題。在殘差網(wǎng)絡(luò)中,假設(shè)有L個(gè)殘差塊在進(jìn)行堆疊連接,其中xl表示為第l個(gè)殘差塊的輸入,那么x(l+1)就表示第l個(gè)殘差塊的輸出,同時(shí)也是第(l+1)個(gè)殘差塊的數(shù)據(jù)輸入。由此可推導(dǎo)第L個(gè)殘差塊的輸出為:
(1)
可以發(fā)現(xiàn),在殘差網(wǎng)絡(luò)中第L層的特征是各個(gè)殘差塊特征的累和,殘差網(wǎng)絡(luò)不斷地學(xué)習(xí)每個(gè)殘差塊的特征,又因?yàn)橛?xùn)練人工神經(jīng)網(wǎng)絡(luò)常用的算法是反向傳播算法,假設(shè)該神經(jīng)網(wǎng)絡(luò)的損失函數(shù)為ε,那么網(wǎng)絡(luò)的第l個(gè)殘差塊梯度計(jì)算公式如式(2)所示:
(2)
通常是設(shè)置數(shù)值確定的閾值以去除冗余噪聲,閾值在很多降噪中都有應(yīng)用,其公式如式(3)所示,x代表輸入數(shù)據(jù),τ為閾值,即將閾值[-τ,τ]區(qū)間內(nèi)的特征置為0,讓距0較遠(yuǎn)的特征趨向0收縮。
(3)
本文基于深度殘差網(wǎng)絡(luò),利用注意力機(jī)制對(duì)閾值進(jìn)行改進(jìn),使網(wǎng)絡(luò)根據(jù)數(shù)據(jù)本身自動(dòng)生成相對(duì)應(yīng)的閾值來(lái)消除噪聲,每組數(shù)據(jù)都可以根據(jù)樣本自身的重要程度不同,進(jìn)行獨(dú)特的特征通道加權(quán)調(diào)整[3]。該自適應(yīng)閾值的生成過(guò)程如圖1虛線框內(nèi)所示,數(shù)據(jù)先經(jīng)過(guò)權(quán)值均值池化處理,而后經(jīng)過(guò)批量歸一化與激活層,用sigmoid函數(shù)使輸出映射到[0,1]之內(nèi),該映射縮放系數(shù)記為α,最終的閾值可以表示為α×A,則不同的樣本對(duì)應(yīng)不同的閾值。將自適應(yīng)閾值塊加入到殘差網(wǎng)絡(luò)中改進(jìn)為殘差收縮模塊(Residual Shrinkage Network Block),稱其為RSNB模塊,從而達(dá)到剔除或減弱噪聲的目的。
圖1 RSNB模型
由于全連接層是將卷積層展開(kāi),然后對(duì)每個(gè)feature map分類(lèi),這樣的參數(shù)計(jì)算量巨大,往往全連接層的參數(shù)計(jì)算量占據(jù)了網(wǎng)絡(luò)總參數(shù)計(jì)算量的大部分,使神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度非常慢。為解決訓(xùn)練速度慢的問(wèn)題將全局均值池化引入到網(wǎng)絡(luò)中,全局平均池化是直接將每個(gè)通道的feature map做平均值處理,即一個(gè)feature map輸出一個(gè)值,然后將結(jié)果輸入到softmax來(lái)進(jìn)行分類(lèi)。在識(shí)別任務(wù)中,全局平均池化能夠?yàn)樽詈蟮木矸e層中的每一個(gè)特定的類(lèi)別生成一個(gè)feature map(有多少個(gè)類(lèi)就產(chǎn)生多少個(gè)feature map)。
如圖2所示,GAP加入到原來(lái)的FC層,其所需要計(jì)算的參數(shù)大大減少,這很大程度的提升了網(wǎng)絡(luò)的計(jì)算速度; GAP不需要像FC層那樣大量的訓(xùn)練調(diào)優(yōu)參數(shù),如此避免了過(guò)擬合問(wèn)題。GAP匯總了空間信息,因此對(duì)輸入的空間轉(zhuǎn)換更為魯棒。為驗(yàn)證GAP層對(duì)網(wǎng)絡(luò)訓(xùn)練時(shí)間的影響,本文在CPU版本為intel 5十代、運(yùn)行環(huán)境為T(mén)ensorFlow1.19 下進(jìn)行實(shí)驗(yàn),得到實(shí)驗(yàn)結(jié)果如表1所示。
圖2 GAP結(jié)構(gòu)
表1 訓(xùn)練時(shí)間對(duì)比s
通過(guò)對(duì)比,GAP層確實(shí)可以很大程度上提高模型訓(xùn)練的速度,因此決定在改進(jìn)的殘差收縮網(wǎng)絡(luò)中加入該層來(lái)加快網(wǎng)絡(luò)模型的訓(xùn)練。
RSNB模塊改進(jìn)后的網(wǎng)絡(luò)模型結(jié)構(gòu)如圖3所示,故障數(shù)據(jù)輸入后先經(jīng)過(guò)兩個(gè)卷積層,而后輸入到第一個(gè)殘差收縮模塊(RSNB1)中,殘差收縮模塊引入了批量歸一化層(BN層)與ReLU激活函數(shù)。BN層可以減小訓(xùn)練數(shù)據(jù)的梯度差異,從而提升網(wǎng)絡(luò)的泛化能力;ReLU激活函數(shù)增加了神經(jīng)網(wǎng)絡(luò)各層之間的非線性關(guān)系,節(jié)約大量計(jì)算,緩解過(guò)擬合現(xiàn)象,進(jìn)而提高故障診斷效果;再將之前的Identity與之相加,再進(jìn)入后續(xù)的池化層來(lái)減少網(wǎng)絡(luò)參數(shù),而后通過(guò)第二個(gè)殘差收縮模塊(RSNB2),最后通過(guò)Dense層來(lái)進(jìn)行分類(lèi)。
圖3 改進(jìn)后的殘差網(wǎng)絡(luò)結(jié)構(gòu)
本文的實(shí)驗(yàn)數(shù)據(jù)來(lái)自于動(dòng)力傳動(dòng)故障診斷綜合實(shí)驗(yàn)臺(tái)(DDS實(shí)驗(yàn)臺(tái))。DDS實(shí)驗(yàn)臺(tái)主要由電機(jī)、兩級(jí)傳動(dòng)變速箱、扭矩控制器和磁粉制動(dòng)器組成。
本實(shí)驗(yàn)主要針對(duì)平行軸齒輪箱進(jìn)行故障研究,信號(hào)采集實(shí)驗(yàn)將驅(qū)動(dòng)電機(jī)轉(zhuǎn)頻設(shè)為35 Hz,信號(hào)采集頻率設(shè)為12.8 kHz。本文設(shè)置了8種齒輪箱狀態(tài),包括7種故障類(lèi)型與1種正常類(lèi)型,具體齒輪箱零件狀態(tài)如圖4所示。
圖4 齒輪箱零件狀態(tài)
為驗(yàn)證改進(jìn)后網(wǎng)絡(luò)模型的抗噪效果,分別使用目前比較先進(jìn)的幾種網(wǎng)絡(luò)模型在有隨機(jī)噪聲和無(wú)隨機(jī)噪聲兩種數(shù)據(jù)下進(jìn)行實(shí)驗(yàn),分別為CNN、ResNet和本文提出的RSNB三種網(wǎng)絡(luò)模型。8種狀態(tài)類(lèi)型,每種類(lèi)型選取1 536×250個(gè)樣本點(diǎn),共選取了1 536×2 000個(gè)點(diǎn)作為樣本數(shù)據(jù),其中1 536×1 600個(gè)點(diǎn)為訓(xùn)練集,1 536×400個(gè)點(diǎn)為測(cè)試集。將強(qiáng)度為-2 dB的隨機(jī)噪聲加入與無(wú)隨機(jī)噪聲狀態(tài)測(cè)試相同的數(shù)據(jù)分別輸入到CNN、ResNet、RSNB三個(gè)網(wǎng)絡(luò)中,迭代次數(shù)與無(wú)噪聲狀態(tài)下相同。兩種條件下的故障診斷準(zhǔn)確率對(duì)比結(jié)果如表2所示。
表2 三種網(wǎng)絡(luò)故障診斷正確率對(duì)比 %
在無(wú)噪聲情況下CNN、ResNet和本文提出的RSNB表現(xiàn)相差不大,而在數(shù)據(jù)中加入噪聲后CNN、ResNet網(wǎng)絡(luò)的性能急劇下降,而RSNB網(wǎng)絡(luò)可以很好的剔除噪聲對(duì)網(wǎng)絡(luò)模型的干擾。RSNB網(wǎng)絡(luò)訓(xùn)練期間正確率與損失的變化如圖5所示,在迭代次數(shù)達(dá)到105次左右時(shí),分類(lèi)準(zhǔn)確率與損失值能夠收斂并且保持穩(wěn)定,沒(méi)有發(fā)生過(guò)擬合現(xiàn)象,網(wǎng)絡(luò)的分類(lèi)準(zhǔn)確率能夠達(dá)到99.7%,表明所構(gòu)建的網(wǎng)絡(luò)模型在有噪聲的情況下也可以保持良好的學(xué)習(xí)能力。
圖5 RSNB訓(xùn)練正確率與訓(xùn)練損失變化
為驗(yàn)證RSNB的抗噪性能,測(cè)試三種網(wǎng)絡(luò)在不同信噪比下的故障診斷準(zhǔn)確率結(jié)果(如圖6所示),發(fā)現(xiàn)總體而言隨著數(shù)據(jù)信噪比的降低,故障診斷的效果出現(xiàn)下降,在信噪比為-6 dB的時(shí)候,RSNB模型的診斷精度為84%,而ResNet網(wǎng)絡(luò)、CNN網(wǎng)絡(luò)的故障診斷精度分別為61.1%、33.2%,低于RSNB網(wǎng)絡(luò)的診斷精度。而當(dāng)信噪比較大時(shí),說(shuō)明數(shù)據(jù)中的噪聲強(qiáng)度對(duì)網(wǎng)絡(luò)性能的影響變小,RSNB網(wǎng)絡(luò)與ResNet網(wǎng)絡(luò)都有不錯(cuò)的診斷效果。
圖6 不同信噪比準(zhǔn)確率
(1)將殘差模塊加入到傳統(tǒng)CNN中進(jìn)行訓(xùn)練,降低了在層數(shù)加深時(shí)特征丟失嚴(yán)重的問(wèn)題,使網(wǎng)絡(luò)可以學(xué)習(xí)到更多的數(shù)據(jù)特征,從而可以達(dá)到加深網(wǎng)絡(luò)進(jìn)而提升網(wǎng)絡(luò)性能的目的。
(2)將注意力機(jī)制與軟閾值化應(yīng)用到到網(wǎng)絡(luò)中,針對(duì)在復(fù)雜工況下的噪聲問(wèn)題設(shè)計(jì)自適應(yīng)閾值塊(RSNB)來(lái)進(jìn)行處理,使神經(jīng)網(wǎng)絡(luò)根據(jù)不同的噪聲特征來(lái)學(xué)習(xí)生成相應(yīng)的閾值,實(shí)驗(yàn)結(jié)果表明自適應(yīng)閾值塊具有良好的降噪效果。
(3)在高強(qiáng)度噪聲情況下,RSNB故障診斷性能明顯優(yōu)于其他網(wǎng)絡(luò)模型,在中低等噪聲強(qiáng)度下具有很高的故障診斷精度。
為了提高RSNB網(wǎng)絡(luò)的魯棒性,還需要采集不同實(shí)驗(yàn)臺(tái)上的數(shù)據(jù)來(lái)進(jìn)行模型的訓(xùn)練,并且根據(jù)不同的數(shù)據(jù)選取合適的激活函數(shù)以及網(wǎng)絡(luò)參數(shù),探究網(wǎng)絡(luò)在其他類(lèi)型故障診斷的應(yīng)用及改進(jìn)。