康 濤,王 書,陳志剛,劉 菲,景騰飛
(1.北京航天萬源科技有限公司,北京 100176;2.北京航天拓撲高科技有限責(zé)任公司,北京 100176)
旋轉(zhuǎn)機械設(shè)備廣泛應(yīng)用在航天、交通、工業(yè)制造和風(fēng)力發(fā)電等重要工程領(lǐng)域[1],其在重大工程中扮演著不可或缺的角色,設(shè)備發(fā)生故障或者停機可能造成嚴重后果。旋轉(zhuǎn)機械設(shè)備中滾動軸承是其非常重要的零部件[2],同時滾動軸承在惡劣工況下容易出現(xiàn)磨損、裂紋、斷裂等故障[3]。因此,采用故障診斷技術(shù)對滾動軸承狀態(tài)的準確識別,可以有效防止軸承故障引起的意外事故。傳統(tǒng)的故障診斷技術(shù)有:自回歸滑動平均模型(Autoregressive moving average model,ARMA)[4]、變分模態(tài)分解(Variational Mode Decomposition,VMD)[5]、小波分析[6]、概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network,PNN)[7]等得到了廣泛的應(yīng)用。隨著大數(shù)據(jù)時代的到來,利用海量數(shù)據(jù)驅(qū)動軸承故障診斷算法成為近些年的研究熱點。其中基于深度學(xué)習(xí)算法的軸承故障診斷成為現(xiàn)階段的主流。主要手段如下:首先人為處理原始信號,然后將信號輸入到深度學(xué)習(xí)算法中,再通過分類器對故障識別。
然而上述介紹的故障診斷方法將故障診斷分割為信號預(yù)處理、特征提取、故障分類三個孤立的部分,無法將各個部分形成有效的耦合關(guān)系,可能導(dǎo)致在數(shù)據(jù)傳遞的過程中出現(xiàn)故障特征損失的情況發(fā)生。針對此問題,提出一種端到端的滾動軸承故障診斷模型,將三個步驟直接整合到一個模型中,直接將原始振動信號輸入模型中,經(jīng)過模型計算、算法處理后得到軸承故障類型。提出了一種基于一維卷積神經(jīng)網(wǎng)絡(luò)的滾動軸承故障診斷模型。利用一維卷積神經(jīng)網(wǎng)絡(luò)強大的特征提取能力,對原始信號提取特征。然后將提取的特征輸入到全連接,通過全連接層對特征分類得到故障識別。同時考慮到一維信號的特點,設(shè)計了大卷積核的診斷模型。減少了數(shù)據(jù)傳遞過程中故障特征損失。
卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Networks,CNN)是共享權(quán)重、局部特征提取、特征池化的多層神經(jīng)網(wǎng)絡(luò)[8]。其中共享權(quán)重可以使其泛化能力增強,局部特征提取使卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度得到了很大提高,特征池化降低特征維度放大特征明顯區(qū)域。卷積神經(jīng)網(wǎng)絡(luò)主要由前向傳播算法和反向傳播算法相結(jié)合,前向傳播算法用于接收輸入數(shù)據(jù)直至輸出產(chǎn)生誤差,反向傳播算法是將減少輸出層的誤差并同時更新權(quán)重。
卷積神經(jīng)網(wǎng)絡(luò)根據(jù)輸入類型不同,可以將其分為一維(1D)和二維(2D)卷積神經(jīng)網(wǎng)絡(luò)。本文采用一維卷積神經(jīng)網(wǎng)絡(luò)對原始一維振動信號處理,其中1D-CNN 包括隱含層、輸出層及輸入層,而隱含層包含一維卷積層(Convolutional Layers)、激活函數(shù)層(Activation Layers)以及池化層(Pooling Layers)等,隱含層主要用于接收輸入層的輸出并完成對數(shù)據(jù)特征的提取。
為驗證本文提出方法的有效性,試驗選用來自美國凱斯西儲大學(xué)的軸承數(shù)據(jù)集[9]。滾動軸承運行狀態(tài)可以分成四種分別為:健康、內(nèi)圈故障、外圈故障和滾珠故障,正常狀態(tài)時域如圖1 所示,內(nèi)圈故障時域如圖2 所示,外圈故障如圖3 所示,滾珠故障如圖4 所示,根據(jù)圖片很難分辨出故障類型。每種故障狀態(tài)包含三種故障尺寸:?。?.18 mm)、中(0.36 mm)和大(0.54 mm)。根據(jù)上述介紹軸承狀態(tài)共有10 種情況。
圖1 正常狀態(tài)
圖2 內(nèi)圈故障
圖3 外圈故障
圖4 滾珠故障
提升模型對樣本的泛化效果,試驗采取重疊采樣的操作對數(shù)據(jù)集進行增強,實現(xiàn)模型魯棒性的提升。重疊采樣如圖5 所示。數(shù)據(jù)集具體信息見表1。
表1 數(shù)據(jù)集信息
圖5 重疊采樣
為了使1D-CNN 診斷模型具有效果更佳的診斷效果,需對其模型結(jié)構(gòu)進行設(shè)計。常見的二維卷積神經(jīng)網(wǎng)絡(luò),比如ResNet[10]和VGGnet[11]采用堆疊式的3×3的卷積核,可以實現(xiàn)少參數(shù)大感受野的效果,從而防止過擬合現(xiàn)象。但是對于一維振動信號采用堆疊式3×1的卷積結(jié)構(gòu),以6 個權(quán)值為代價,只得到5×1的感受野,反而將上述優(yōu)勢變成了劣勢。因此根據(jù)一維振動信號的特點,將1D-CNN 診斷模型的第一層設(shè)計為大卷積核,其作用提取短時特征。其余的卷積層為3×1的小卷積核,減少模型參數(shù)防止過擬合現(xiàn)象。
為了選擇合適的第一層卷積核的參數(shù),通過對比實驗進行比較分析,設(shè)計三種1D-CNN 診斷模型。這三種模型的第一層卷積核分別為32×1、64×1、128×1,每個模型共有4 層卷積核池化層,除了第一層外,剩下的卷積核均為3×1,全連接層為10 個輸出對應(yīng)著軸承的10 種狀態(tài)。模型對比實驗結(jié)果見表2。
表2 模型對比實驗
由表2 可以看出,隨著卷積核尺寸的增加,模型在測試集中的準確率隨之提高,當(dāng)卷積核尺寸由32 增加到64 時,準確率由96.01%提升到99.33%,提高了3.46%,計算時間變化不大,當(dāng)卷積核尺寸由64 增加到128 時,準確率提升不多,僅提升0.44%,但由于計算參數(shù)的增加,計算所消耗的時間增加了0.02 s,對網(wǎng)絡(luò)準確率提升不高,卻造成了比較多的資源消耗,因此選擇64×1 作為第一層卷積核的尺寸。具體診斷網(wǎng)絡(luò)模型參數(shù)見表3。
表3 故障診斷網(wǎng)絡(luò)參數(shù)
使用上述數(shù)據(jù)集,對比所確立的模型進行訓(xùn)練。訓(xùn)練過程中,全連接層使用Dropout 防止過擬合問題,Dropout 比率設(shè)置為0.2,Adam 算法的學(xué)習(xí)率為0.001。為了保證模型的可靠性,在訓(xùn)練工程中,每個數(shù)據(jù)集迭代60 次。為了直觀地觀察模型對每種故障的識別情況,采用混淆矩陣表示實驗結(jié)果如圖6 所示,圖中行表示實際分類,列表示預(yù)測分類。其中在混淆矩陣中,0~9 分別代表不同的類別,具體混淆矩陣標識說明見表4。
表4 混淆矩陣標識說明
圖6 故障診斷混淆矩陣
根據(jù)混淆矩陣圖可以看出,所提出的基于1D-CNN的故障診斷網(wǎng)絡(luò),在美國凱斯西儲大學(xué)數(shù)據(jù)集中所進行的實驗,在同故障尺寸之間容易發(fā)生混淆,例如對于故障尺寸為0.36 mm 中內(nèi)圈故障(標識4)和外圈故障(標識6)發(fā)生混淆。雖然發(fā)生了混淆,但是每種故障識別準確率都高于97%。并且模型的類間平均準確率為99.33%,可以滿足對軸承故障的準確識別。
提出了一種基于一維卷積神經(jīng)網(wǎng)絡(luò)的端到端軸承故障診斷模型,直接將原始信號輸入,減少了數(shù)據(jù)傳遞中特征損失。針對一維原始振動信號特點,在CNN 設(shè)計方法的基礎(chǔ)上,設(shè)計了三種第一層大卷積核模型,通過實驗數(shù)據(jù)集測試,確定了一種最優(yōu)的CNN 網(wǎng)絡(luò)模型。通過實驗美國凱斯西儲大學(xué)數(shù)據(jù)集驗證,所提模型的類間平均準確率為99.33%,測試時間為0.03 s。實現(xiàn)了快速識別高準確率的診斷性能,證明了所提出方法的可行性,具有較好的技術(shù)應(yīng)用前景。