湯 亮, 凡焱峰, 徐適斐, 蔡凱翼
(1.湖北工業(yè)大學(xué) 機械工程學(xué)院,湖北 武漢 430068; 2.湖北省制造業(yè)創(chuàng)新方法與應(yīng)用工程技術(shù)研究中心,湖北 武漢 430068)
滾動軸承是機械傳動裝置的重要零件,其故障診斷是機械傳動裝置能穩(wěn)定運行的重要保證,因此準確判斷軸承故障對機械傳動裝置的正常工作意義重大。但機械傳動裝置結(jié)構(gòu)復(fù)雜,滾動軸承的振動信號具有非線性、非平穩(wěn)性的特點,所以傳統(tǒng)的故障診斷方法難以精確判斷滾動軸承的故障類型[1]。
采用機器學(xué)習(xí)如人工神經(jīng)網(wǎng)絡(luò)、支持向量機和隨機森林等實現(xiàn)滾動軸承故障識別,這些故障診斷運用小波變換、傅里葉變換等時頻變換提取滾動軸承的原始振動信號的故障特征,通過分類器中實現(xiàn)滾動軸承的故障診斷。鄭新等使用經(jīng)驗?zāi)B(tài)分解和主成分分析實現(xiàn)了軸承故障診斷模型的構(gòu)建[2];通過對變分模態(tài)分解改進,孟宗設(shè)計了高精度的故障診斷模型[3];利用局部均值分解與隨機森林,周海軍設(shè)計了樣本熵與隨機森林分類的滾動軸承故障診斷[4]。但這些方法存在操作過程復(fù)雜、忽略特征提取和分類聯(lián)系的問題,這導(dǎo)致傳統(tǒng)故障診斷無法保持較高的精度。
深度學(xué)習(xí)可以提取原始樣本中的特征信息,具有良好的非線性擬合能力,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)的權(quán)值共享結(jié)構(gòu)降低數(shù)據(jù)重建的復(fù)雜性,在處理原始樣本具有先天性的優(yōu)勢,在語音識別[5]、圖片分類[6]等領(lǐng)域具有廣泛應(yīng)用。
CNN在滾動軸承故障診斷中應(yīng)用廣泛。對滾動軸承振動信號完成傅里葉變換,熊劍等把頻譜樣本劃分后,構(gòu)建高精度滾動軸承故障診斷模型[7];Lu等將一維信號轉(zhuǎn)換成二維數(shù)據(jù)作為CNN的原始輸入構(gòu)建故障診斷模型[8];將滾動軸承振動信號轉(zhuǎn)換成二維信號后,Wen等提出具有高魯棒性的LeNet-5的軸承故障診斷模型[9];劉星辰等以滾動軸承振動信號作為輸入,提出高精度的一維CNN故障診斷模型[10];Zhang等考慮了滾動軸承的實際工作環(huán)境中存在大量噪音后,設(shè)計高魯棒性的故障診斷模型[11],該模型在多工況下保持較高精度;利用隨機對角線優(yōu)化CNN的結(jié)構(gòu),Viet提出多工況下高精度的滾動故障診斷模型[12]。然而,上述CNN對軸承故障診斷的研究,都采用人為提取的特征作為CNN的輸入,導(dǎo)致故障識別率無法提升,且特征提取的過程依賴人工經(jīng)驗。
本文設(shè)計了采用貝葉斯優(yōu)化的改進LeNet-5網(wǎng)絡(luò)算法以及基于該算法構(gòu)建的軸承故障診斷模型,利用該軸承故障診斷模型實現(xiàn)軸承故障識別。使用該網(wǎng)絡(luò)模型對滾動軸承實現(xiàn)故障診斷中,旨在為軸承故障診斷提供理論和技術(shù)支持。
LeNet-5作為典型的CNN,利用局域感受野,權(quán)值共享和池化特性實現(xiàn)輸入的特征提取。LeNet-5網(wǎng)絡(luò)實現(xiàn)分類的過程分為特征提取和分類2部分:通過卷積和池化操作實現(xiàn)振動信號的特征提?。煌ㄟ^全連接層和徑向基(radial basis function, RBF)實現(xiàn)分類。LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 LeNet-5卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
卷積層利用卷積運算實現(xiàn)原始輸入的特征提取[13]。卷積運算過程如式(1)所示:
(1)
池化層采用降采樣技術(shù)實現(xiàn)輸入信號特征的降低,避免過擬合現(xiàn)象[14],提高容錯性。池化層的計算過程可由式(2)表示:
(2)
全連接層與最后的池化層采用全連接的方式[15],全連接層計算工程由式(3)表示:
(3)
LeNet-5網(wǎng)絡(luò)有7個網(wǎng)絡(luò)層:原始輸入為32×32;C1層,6個大小為5×5的卷積核,卷積結(jié)果由6個28×28的二維信號組成;S2層,以2×2的鄰域作為池化區(qū)生成6個14×14的二維信號,激活函數(shù)為Sigmoid函數(shù);C3層,具有16個5×5的卷積核,其輸出由16個為10×10的二維信號組成;S4層,以 2×2的鄰域為池化區(qū)生成16個5×5的二維信號,激活函數(shù)為Sigmoid函數(shù);C5層,輸入與其卷積核相等,卷積后輸出為1×1;全連接層F6,包含84個神經(jīng)元,激活函數(shù)為Tanh函數(shù);RBF組成LeNet-5網(wǎng)絡(luò)的輸出層。
貝葉斯優(yōu)化是利用貝葉斯搜尋目標函數(shù)最優(yōu)值的算法[16]。概率代理模型和采集函數(shù)是貝葉斯優(yōu)化算法的核心部分,常見的概率代理模型有高斯過程;采集函數(shù)由目標函數(shù)的后驗概率組成,為了使總損失r為最小,貝葉斯優(yōu)化算法利用采集函數(shù)選擇評估點xt,該過程由式(4)和式(5)表示。
(4)
ri=|y*-yi|
(5)
式中:X為決策空間;λ(x,D1:i)為采集函數(shù);y*為最優(yōu)解。
貝葉斯優(yōu)化算法由以下步驟實現(xiàn):
(1) 確定最大迭代次數(shù)N;
(2) 利用采集函數(shù)獲得評估點xi;
(3) 利用評估點xi評估目標函數(shù)值yi;
(4) 整合數(shù)據(jù)Dt后更新概率代理模型;
(5) 若當(dāng)前迭代次數(shù)n最大迭代次數(shù)N,則返回步驟(2)繼續(xù)迭代,否則輸出xi。
與經(jīng)典LeNet-5網(wǎng)絡(luò)對比,本文的LeNet-5網(wǎng)絡(luò)主要有以下改進:
(1) 批歸一化可以避免網(wǎng)絡(luò)的梯度彌散,同時增加神經(jīng)網(wǎng)絡(luò)的泛化能力[17],采用批歸一化操作對S1,S2池化層輸出特征進行歸一化處理,降低輸出特征的差異性;
(2) Relu激活函數(shù)避免了Sigmoid函數(shù)的梯度消失現(xiàn)象[18],有易優(yōu)化、增加網(wǎng)絡(luò)稀疏性的優(yōu)點,將LeNet-5網(wǎng)絡(luò)中池化層S2和S4的激活函數(shù)由Sigmoid函數(shù)改為Relu函數(shù);
(3) 全局平均池化與全連接層相比,降低了LeNet-5網(wǎng)絡(luò)的參數(shù)量,整合了全局空間信息,使網(wǎng)絡(luò)魯棒性更高[19],將LeNet-5網(wǎng)絡(luò)全連接層F1替換成為全局平均池化層;
(4) Softmax函數(shù)分類效果更好,Softmax函數(shù)代替LeNet-5網(wǎng)絡(luò)中的RBF實現(xiàn)特征。
隨機選擇的學(xué)習(xí)率,訓(xùn)練批次和優(yōu)化器可能導(dǎo)致改進LeNet-5網(wǎng)絡(luò)在滾動軸承故障診斷能力不足,因此以訓(xùn)練一定次數(shù)后準確率為目標函數(shù),以一定范圍內(nèi)的學(xué)習(xí)率,訓(xùn)練批次和不同優(yōu)化器為決策空間,利用貝葉斯優(yōu)化算法對這些超參數(shù)進行優(yōu)化。
本文用美國凱斯西儲大學(xué)滾動軸承數(shù)據(jù)集[20]對貝葉斯優(yōu)化后的改進LeNet-5網(wǎng)絡(luò)開展實驗驗證,試驗臺裝置包括電動機、扭矩傳感器、功率測試計。SKF6205滾動軸承安裝在電動機驅(qū)動端,加速度計傳感器的采樣頻率設(shè)為12 kHz,在多種轉(zhuǎn)速下(1 797,1 772,1 491,1 750 r/min)采集滾動軸承原始振動信號,滾動軸承故障類別共3種:外圈故障,內(nèi)圈故障和滾動體故障,每種類型的損傷尺寸都有3種:0.07,0.14,0.21 inch(1 inch=2.54 cm)。0.21 inch又分為中心方向、正交方向、相對方向3種故障損傷類型,本文同時考慮中心方向、正交方向和相對方向的外圈故障損傷類型。
LeNet-5網(wǎng)絡(luò)輸入為32×32的二維數(shù)據(jù),同時也為了提高卷積層的計算速度,將1 024個采樣點作為一個采樣周期,采用形變操作將1 024×1的一維數(shù)據(jù)轉(zhuǎn)化為32×32的二維數(shù)據(jù)。在內(nèi)圈故障,外圈故障和滾動體故障約有487 093/1 024≈480個樣本;1 797 r/min轉(zhuǎn)速下,正常(作為一種特殊的故障)狀態(tài)約243 938/1 024≈238個樣本,而其余轉(zhuǎn)速下正常狀態(tài)約485 643/1 024≈475個樣本。為了保證各類故障樣本數(shù)相同,在這些正常樣本中隨機選擇480個樣本作為訓(xùn)練時的數(shù)據(jù)集。本文共考慮12種故障類別,滾動軸承故障,故障類別,損傷直徑以及樣本數(shù)如表1所示。
表1 驅(qū)動端軸承故障數(shù)據(jù)
為了保持原始振動信號相對不變,提高故障分類的準確性,運用Z-score標準化對樣本中原始振動信號進行處理,如式(6)所示:
(6)
為了確保網(wǎng)絡(luò)模型具有較強的泛化能力,將歸一化處理后的數(shù)據(jù)集D依照7:2:1的比例,被分為訓(xùn)練集S,驗證集V和測試集T。
本文所有實驗都基于深度學(xué)習(xí)框架Tensor Flow2.0實現(xiàn),計算機配置為i5-7500CPU,主頻為3.4 GHz。實驗中,訓(xùn)練過程中導(dǎo)入時間監(jiān)控機制來記錄3種網(wǎng)絡(luò)訓(xùn)練的時長。
5.3.1 一維CNN(1D-CNN)
1D-CNN采用的是曲建山等提出的基于一維卷積神經(jīng)網(wǎng)絡(luò)的滾動軸承故障診斷模型[21],該網(wǎng)絡(luò)模型輸入為1 024×1的一維數(shù)據(jù),其部分網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如表2所示。
表2 1D-CNN網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)
1D-CNN的準確率隨迭代次數(shù)變化曲線如圖2所示。
圖2 1D-CNN準確率變化曲線
5.3.2 二維CNN(2D-CNN)
2D-CNN利用李益兵等提出的混合蛙跳算法優(yōu)化的CNN的滾動軸承故障診斷模型[22]。該模型僅采用了1 797 r/min轉(zhuǎn)速下的軸承10種不同故障的數(shù)據(jù)。其部分網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如表3所示。
表3 2D-CNN網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)
2D-CNN的準確率隨迭代次數(shù)變化曲線如圖3所示。
圖3 2D-CNN準確率變化曲線
5.3.3 改進LeNet-5網(wǎng)絡(luò)
利用貝葉斯優(yōu)化對學(xué)習(xí)率等超參數(shù)進行優(yōu)化,最大迭代次數(shù)設(shè)為40,采集函數(shù)為期望提升,決策空間如表4所示。
表4 改進LeNet-5網(wǎng)絡(luò)的超參數(shù)及其范圍
經(jīng)過貝葉斯對超參數(shù)優(yōu)化后可得:訓(xùn)練批次為32,優(yōu)化器采用RMSprop,學(xué)習(xí)率為1.724×10-3。優(yōu)化后的改進LeNet-5網(wǎng)絡(luò)(BO-ILeNet-5)部分結(jié)構(gòu)參數(shù)如表5所示。
表5 改進LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)
利用BO-ILeNet-5網(wǎng)絡(luò)開展實驗驗證,準確率變化曲線如圖4所示。
圖4 BO-ILeNet-5準確率變化曲線
經(jīng)實驗分析,BO-ILeNet-5網(wǎng)絡(luò)模型與1D-CNN 和2D-CNN對比結(jié)果如表6所示。
表6 故障識別模型對比
BO-ILeNet-5網(wǎng)絡(luò)具有較高的精度,無論在訓(xùn)練集還是在驗證集上,BO-ILeNet-5網(wǎng)絡(luò)對滾動軸承的故障診斷比1D-CNN 和2D-CNN更好,且訓(xùn)練效率更高。
為了驗證BO-ILeNet-5網(wǎng)絡(luò)的泛化能力,利用測試集T進行驗證,測試集中每類故障均有48個樣本,并繪制故障分類混淆矩陣如圖5所示?;煜仃嚨臋M軸表示故障診斷模型對樣本進行預(yù)測的故障類別,縱軸表示樣本真實的故障類別,對角線表示正確識別的原始樣本數(shù),非對角線表示識別錯誤的樣本數(shù),由圖可知:僅在0.21 inch的滾動體故障和外圈故障中心方向各存在1個樣本在預(yù)測中出現(xiàn)錯誤。結(jié)果表明,BO-ILeNet-5網(wǎng)絡(luò)對滾動軸承故障有較好的分類效果。
圖5 BO-ILeNet-5故障混淆矩陣
為驗證BO-ILeNet-5網(wǎng)絡(luò)的魯棒性,在測試樣本中加入不同程度的高斯白噪聲,測試不同信噪比(signal noise ratio,SNR)下的識別準確率,結(jié)果如表7所示。
由表7可知,BO-ILeNet-5網(wǎng)絡(luò)在低噪聲下故障識別準確率更高。
表7 BO-ILeNet-5不同噪聲環(huán)境下準確率
傳統(tǒng)的CNN應(yīng)用在軸承故障診斷上存在效率低、精度差的問題。本文首先改進LeNet-5網(wǎng)絡(luò)中網(wǎng)絡(luò)層的激活函數(shù),引入批歸一化操作,全局平均池化避免網(wǎng)絡(luò)模型出現(xiàn)過擬合,并用貝葉斯優(yōu)化改進LeNet-5網(wǎng)絡(luò)的超參數(shù),最后采用該算法構(gòu)建的軸承故障診斷模型,經(jīng)過對比實驗分析,獲得以下結(jié)論:
(1) 基于貝葉斯優(yōu)化超參數(shù)后的改進LeNet-5網(wǎng)絡(luò)的滾動軸承故障診斷模型不需要手動提取軸承原始振動信號的特征,降低了對人工經(jīng)驗和專家知識的依賴。
(2) 基于貝葉斯優(yōu)化超參數(shù)后的改進LeNet-5網(wǎng)絡(luò)滾動軸承故障診斷模型具有較好泛化性能和較高的故障識別率,且網(wǎng)絡(luò)模型訓(xùn)練時間較短。
在進一步的研究中,應(yīng)該采用自測的滾動軸承的多種故障信號來對該軸承故障診斷模型進行工程實踐研究,以提高網(wǎng)絡(luò)模型的實際應(yīng)用價值。