張曉鋒, 郝如江, 程旺, 夏晗鐸, 段澤森
(石家莊鐵道大學(xué) 機(jī)械工程學(xué)院,石家莊 050043)
齒輪箱是旋轉(zhuǎn)機(jī)械的關(guān)鍵部件,其內(nèi)的機(jī)械故障約30%是由軸承發(fā)生故障引起的[1]。而對機(jī)械設(shè)備進(jìn)行定期的故障診斷之后,可以將事故的發(fā)生率減少75%,維修的費(fèi)用也可以降低25%~50%[2]。因此,對機(jī)械進(jìn)行故障診斷不僅能有效提高生產(chǎn)效率,而且能產(chǎn)生巨大的經(jīng)濟(jì)效益??蒲腥藛T逐漸將淺層的機(jī)器學(xué)習(xí)方法應(yīng)用到旋轉(zhuǎn)機(jī)械的故障診斷之中,常見的有深度置信網(wǎng)絡(luò)[3]、循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)[4]等故障分類方法或模型。ResNet[5]作為卷積神經(jīng)網(wǎng)絡(luò)的一種優(yōu)秀模型,在圖像識別領(lǐng)域[6]應(yīng)用廣泛且表現(xiàn)優(yōu)異,所以本文將其應(yīng)用到故障診斷方面。但是一方面考慮到故障信號的具體工業(yè)環(huán)境含有噪聲等冗余信息,ResNet網(wǎng)絡(luò)并不能解決噪聲等冗余信息對故障診斷性能的影響,如何剔除噪聲等冗余信息的影響是當(dāng)前故障診斷的一個關(guān)鍵問題。另一方面由于故障信號時(shí)變性較強(qiáng),如何保證數(shù)據(jù)的特征不被丟失也是目前較為受關(guān)注的一個方向。
本文對ResNet進(jìn)行改進(jìn)使其具備降噪效果,而且增加了多尺度特征融合[6],對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行預(yù)處理,得到不同尺度的特征信息,從而避免丟失敏感特征。經(jīng)過在DDS實(shí)驗(yàn)臺上的數(shù)據(jù)測試,取得了良好的故障分類效果。
殘差網(wǎng)絡(luò)(Residual neural network,ResNet)由He等[7]在2015年提出,在當(dāng)年的ILSVRC競賽中,取得了ImageNet比賽分類任務(wù)冠軍。該網(wǎng)絡(luò)為網(wǎng)絡(luò)增加了一條恒等映射,其映射函數(shù)為
H(x)=x+F(x)
(1)
式中x為輸入,也就是identity,在另一條路徑中經(jīng)過卷積變換得到F(x),二者對應(yīng)元素相加最終輸出H(x)。而神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中是利用反向傳播來進(jìn)行特征的學(xué)習(xí),其公式為
(2)
由式(2)可以發(fā)現(xiàn):
在實(shí)際工況中,采集到的數(shù)據(jù)一般都包含噪聲信號,本文用神經(jīng)網(wǎng)絡(luò)利用注意力機(jī)制[8]自動生成閾值[9]來將噪聲等冗余信息消除,從而提高故障診斷的正確率。設(shè)置閾值在很多降噪[10、11]中都用應(yīng)用,將[-τ,τ]區(qū)間內(nèi)的特征置為0,讓距0較遠(yuǎn)的特征朝著0進(jìn)行收縮。其公式為:
(3)
考慮到每組數(shù)據(jù)特征不一致,利用注意力機(jī)制根據(jù)數(shù)據(jù)自身的特征來設(shè)置自己獨(dú)特的一組閾值,這樣每組數(shù)據(jù)都可以有可以根據(jù)樣本自身的重要程度不同,進(jìn)行獨(dú)特的特征通道加權(quán)調(diào)整。從而保留重要信息,削弱冗余信息對診斷結(jié)果的影響。將自適應(yīng)閾值塊加入到殘差網(wǎng)絡(luò)中改進(jìn)為殘差收縮塊(Residual shrinkage network block)[12],本文稱其為RSNB塊,可以很好的對信號中的冗余信息進(jìn)行剔除,該模塊的模型如圖1所示。
圖1 RSNB模型圖Fig.1 RSNB model
由于故障信息的頻率各不相同,所以在采集數(shù)據(jù)時(shí)就會采集到不同尺度的信號。而經(jīng)典的CNN卷積核大小一般是固定的,所以使用不同尺度的卷積核來處理特征就顯得十分重要。將多尺度特征融合[13](Multi-scale feature fusion)添加到經(jīng)過改進(jìn)的殘差收縮網(wǎng)絡(luò)中,本文將此卷積塊稱為MFF塊,對數(shù)據(jù)進(jìn)行多尺度預(yù)處理從而獲得更多有用特征[14]。為此選用了1×4、1×32、1×64、1×128等不同尺度的卷積核,組成2個MFF層來充分挖掘信號中的特征信息如圖2所示,重復(fù)兩次最后進(jìn)行匯總傳入后續(xù)的殘差收縮網(wǎng)絡(luò)之中。
圖2 MCK卷積塊結(jié)構(gòu)Fig.2 MCK convolution block structure
多尺度特征融合模型有兩個特征融合模塊(Fusion block),兩個融合模塊的結(jié)構(gòu)是相同的,都是采用跳躍連接。因?yàn)樵诤罄m(xù)的殘差收縮模塊中,特征信息經(jīng)過其中的最大池化層之后尺度信息發(fā)生了變化,而特征融合需要特征層的尺度必須大小一致,所以需要對淺層卷積層進(jìn)行卷積變化,使得變化后輸出的尺度與后面需要相加的特征層尺度一致;然后對其進(jìn)行ReLU[15]激活處理,接著輸出到BN層對數(shù)據(jù)進(jìn)行批量歸一化;而低層卷積層進(jìn)行簡單的卷積、激活與批量歸一化處理后通過Add函數(shù)與經(jīng)過反卷積的高層卷積層進(jìn)行添加操作,具體計(jì)算流程如圖3所示。
圖3 MFF特征融合模塊Fig.3 MFF feature fusion module
針對故障信號中的不同尺度信號,采用1×4、1×32、1×64、1×128等不同尺度的卷積核層聯(lián),構(gòu)建了1個多尺度卷積核模塊來提學(xué)習(xí)網(wǎng)絡(luò)深層的不同特征;而后為了融合高層網(wǎng)絡(luò)與低層網(wǎng)絡(luò)各自的優(yōu)點(diǎn),將經(jīng)過兩次RSNB模塊的高層卷積層經(jīng)過反卷積操作與低層的卷積層進(jìn)行特征融合處理。將高層的兩個卷積層1×510×64經(jīng)過卷積操作,使其尺度與經(jīng)過殘差收縮模塊后的卷積層尺度相同,通過Add函數(shù)使其對應(yīng)相加,如此特征融合操作完成,然后將兩個特征融合后的卷積層通過網(wǎng)絡(luò)的后面層相連接后輸入到后續(xù)的故障分類層。該改進(jìn)使模型實(shí)現(xiàn)了高層卷積層與低層卷積層的特征融合,使網(wǎng)絡(luò)能夠同時(shí)學(xué)習(xí)到低層網(wǎng)絡(luò)特征的細(xì)節(jié)信息,又擁有高層網(wǎng)絡(luò)所具備的的敏感度,使網(wǎng)絡(luò)在進(jìn)行故障診斷時(shí)學(xué)習(xí)能力得到明顯提升,網(wǎng)絡(luò)診斷效果更加精。改進(jìn)后的具體網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。
圖4 MFF+RSNB網(wǎng)絡(luò)模型結(jié)構(gòu)Fig.4 MFF+RSNB network model structure
本實(shí)驗(yàn)考慮了試驗(yàn)臺的8種工況,包括一種健康狀態(tài)、3種軸承故障類型、4種齒輪故障類型。8種健康類型的具體形態(tài)如圖5所示。
圖6為DDS試驗(yàn)臺,主要由電機(jī)、扭矩控制器和磁粉制動器組成。齒輪箱可以模擬旋轉(zhuǎn)機(jī)械健康狀態(tài)和各種故障狀態(tài)。
圖6 DDS試驗(yàn)臺Fig.6 DDS test bench
DDS試驗(yàn)臺在進(jìn)行實(shí)驗(yàn)時(shí)的工況參數(shù)設(shè)置如表1所示。
對采集到的8種類型的故障信號進(jìn)行打標(biāo)簽操作,其標(biāo)簽編號如表2所示,其中的訓(xùn)練集規(guī)模為訓(xùn)練集規(guī)模為1 536×1 600,每種故障類型都選取1 536×200測試集規(guī)模為1 536×400。
表2 故障類型Tab.2 Fault types
為模擬在噪聲條件下的信號特征,所以在DDS試驗(yàn)臺采集到的信號中加入隨機(jī)噪聲,以此來模擬具體環(huán)境下的噪聲;將信噪比為2dB的數(shù)據(jù)輸入到改進(jìn)后的RSNB與MCK+MFF+RSNB網(wǎng)絡(luò)中,每次迭代都打印1次訓(xùn)練精度和訓(xùn)練損失值。得到網(wǎng)絡(luò)訓(xùn)練的準(zhǔn)確率變化分別如圖7與圖8所示。
圖7 RSNB模型正確率Fig.7 RSNB model accuracy rate
圖8 MCK+MFF+RSNB模型正確率Fig.8 Accuracy rate of MCK+MFF+RSNB model
為驗(yàn)證改進(jìn)后網(wǎng)絡(luò)模型的抗噪效果,分別加入信噪比為-4dB、-2dB、0、2dB、4dB的噪聲來測試5種網(wǎng)絡(luò)在不同噪聲強(qiáng)度下的故障診斷準(zhǔn)確率,
網(wǎng)絡(luò)模型分別為CNN、AlexNet、ResNet和本文提出的RSNB、MCK+MFF+RSNB這4種網(wǎng)絡(luò)模型。在迭代150次之后將實(shí)驗(yàn)故障診斷準(zhǔn)確率結(jié)果記錄下來進(jìn)行對比,5種網(wǎng)絡(luò)訓(xùn)練與測試的故障診斷的準(zhǔn)確率隨噪聲強(qiáng)度的變化對比如圖9與圖10所示。
圖9 4種模型正確率對比(訓(xùn)練)Fig.9 Comparison of accuracy rates of four models(training)
圖10 4種模型正確率對比(測試)Fig.10 Comparison of accuracy rates of four models (test)
發(fā)現(xiàn)總體而言隨著數(shù)據(jù)信噪比的降低,故障診斷的效果出現(xiàn)下降,在信噪比為-4dB的時(shí)候,MCK+MFF+RSNB網(wǎng)絡(luò)的故障診斷精確度為88.0%,RSNB模型的診斷精度為80.1%,而AlexNet、ResNet網(wǎng)絡(luò)、CNN網(wǎng)絡(luò)的故障診斷精度分別為71%、68.7%、57.5%。而當(dāng)信噪比增大到2dB時(shí),噪聲對原始數(shù)據(jù)的影響變小,MCK+MFF+RSNB網(wǎng)絡(luò)的故障診斷精確度為99.8%,RSNB網(wǎng)絡(luò)模型的診斷精度為99.7%,而AlexNet、ResNet網(wǎng)絡(luò)、CNN網(wǎng)絡(luò)的故障診斷準(zhǔn)確率分別為92.3%、92.5%、91.4%,當(dāng)信噪比繼續(xù)增大時(shí),說明數(shù)據(jù)中的噪聲強(qiáng)度小對網(wǎng)絡(luò)性能的影響進(jìn)一步變小,這5種網(wǎng)絡(luò)模型都有不錯的診斷效果。
而后統(tǒng)計(jì)網(wǎng)絡(luò)的學(xué)習(xí)效率與特征提取能力,將5種網(wǎng)絡(luò)在訓(xùn)練的準(zhǔn)確率不再變化時(shí)所需要的迭代次數(shù)統(tǒng)計(jì)下來重復(fù)3次取平均值,其結(jié)果如圖11所示。
可以發(fā)現(xiàn)改進(jìn)網(wǎng)絡(luò)達(dá)到穩(wěn)定的訓(xùn)練狀態(tài)所需要的迭代次數(shù)是最小的,相同的條件下只需要網(wǎng)絡(luò)迭代28次,而殘差收縮網(wǎng)絡(luò)也需要42次迭代才能達(dá)到穩(wěn)定的識別精度;其他3種網(wǎng)絡(luò)模型都需要迭代更多次數(shù)才能達(dá)到穩(wěn)定的。可以得出在經(jīng)過多尺度卷積核(MCK)與特征融合處理(MFF)之后,改進(jìn)網(wǎng)絡(luò)的特征提取能力得到很大程度的提高,而且網(wǎng)絡(luò)訓(xùn)練的穩(wěn)定性得到提升。
1) 將特征映射加入到傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)中形成的殘差網(wǎng)絡(luò),能夠在層數(shù)加深時(shí)使特征丟失嚴(yán)重的問題得到改進(jìn),解決網(wǎng)絡(luò)梯度消失的現(xiàn)象,使網(wǎng)絡(luò)的深度能夠加深,為構(gòu)建深層卷積神經(jīng)網(wǎng)絡(luò)打下基礎(chǔ),進(jìn)而提升網(wǎng)絡(luò)性能的目的。
2) 將注意力機(jī)制與軟閾值化加入到網(wǎng)絡(luò)中構(gòu)建殘差收縮模塊(RSNB),針對在工業(yè)環(huán)境下會產(chǎn)生噪聲等干擾因素這一問題,在網(wǎng)絡(luò)中設(shè)置自適應(yīng)閾值塊,根據(jù)噪聲的不同強(qiáng)度自適應(yīng)生成閾值,該模塊使網(wǎng)絡(luò)獲得良好的降噪效果。
3) 將多尺度特征融合運(yùn)用到神經(jīng)網(wǎng)絡(luò)中,在網(wǎng)絡(luò)的前端使用這一處理,可以使后續(xù)進(jìn)入到神經(jīng)網(wǎng)絡(luò)的信號獲得不同尺度的特征,而且使得網(wǎng)絡(luò)能夠獲取深層與淺層的信息,既能夠提取到細(xì)節(jié)信息,又能夠保證足夠的敏感度。最大限度的獲取故障信號中的故障特征,降低特征丟失,而且降低了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間,提高網(wǎng)絡(luò)模型的訓(xùn)練效率。
為了提高網(wǎng)絡(luò)的魯棒性,還需要采集不同試驗(yàn)臺上的數(shù)據(jù)來進(jìn)行模型的訓(xùn)練,探究網(wǎng)絡(luò)在其他類型故障診斷的應(yīng)用及改進(jìn)。