謝遠東,雷文平,韓 捷,陳 磊
(鄭州大學振動工程研究所,河南 鄭州450001)
滾動軸承作為旋轉(zhuǎn)機械以至于機械系統(tǒng)領(lǐng)域中關(guān)鍵性的部位,以支持旋轉(zhuǎn)軸正常穩(wěn)定的工作狀態(tài)。任何軸承的意外故障可能導致一些負面影響,例如停機時間增加,生產(chǎn)力降低,甚至造成人員安全等重大問題。隨著大數(shù)據(jù)以及深度學習的發(fā)展,依靠算力的智能型診斷方法將會逐漸在智能診斷領(lǐng)域中占主導地位。對于模式識別問題[1],目前可以分為兩種應(yīng)用場景:(1)用于對軸承剩余壽命進行評估預(yù)測;(2)對于軸承的故障類型進行分類。對于RUL(可用剩余壽命)預(yù)測,可以分為數(shù)據(jù)采集、指標系統(tǒng)建立、剩余壽命預(yù)測。對于軸承故障分類,即原始信號采集以及數(shù)據(jù)集預(yù)處理、信號特征的提取和選取故障類型。
對于軸承壽命預(yù)測來說,近幾年,合成的健康指標通常是通過一些數(shù)據(jù)融合技術(shù)構(gòu)建的,其中多維統(tǒng)計特性均方根(RMS)、方差、峰值被轉(zhuǎn)化成一維特征[2],取得不錯的效果。但是還存在以下缺點:(1)不同的傳統(tǒng)的靜態(tài)特征是從時域和頻域中獲得,其度量和范圍是不一致的;(2)很難確定一個故障閾值(FT)不同機器的故障時間(HI)值有一個很大的變化范圍。
對于軸承故障分類來說,傳統(tǒng)的方法如文獻[3]中對信號降噪,使用EMD和LSTA以及SVM進行分類;文獻[4]使用小波進行特征的提取進行了對比以驗證傳統(tǒng)特征提取方法只適用于一些特定的信號,故方法的通用性不強。設(shè)計專用網(wǎng)絡(luò)[5]成為了傳統(tǒng)手工提取故障特征不可忽視的缺點,從而影響進一步發(fā)展。
深度學習由科研人員提出,通過大量的數(shù)據(jù)進行非線性擬合的方式,得到數(shù)據(jù)不同維度的特征??蒲腥藛T使用卷積神經(jīng)網(wǎng)絡(luò)針對旋轉(zhuǎn)機械中的軸承故障特征進行提?。?];科研人員利用相空間重構(gòu)與SVD結(jié)合深度置信網(wǎng)絡(luò)對滾動軸承的故障診斷[7];科研人員使用深度神經(jīng)網(wǎng)絡(luò)結(jié)合全矢譜理論對軸承故障中的特征進行提?。?]。
以上均采集的是單通道信號,故提取的故障特征是不完善的,無法準確的表征信號的原始信息,而全矢譜[9]技術(shù)結(jié)合雙通道信息,使數(shù)據(jù)更加的完備。本文將全矢譜與循環(huán)神經(jīng)網(wǎng)絡(luò)算法結(jié)合并提出基于全矢RNN模型,通過試驗對比CEEMD算法以及單通道LSTM算法從而驗證了該方法的有效性和優(yōu)越性。
RNN結(jié)構(gòu)類似于鏈條,這樣的鏈條結(jié)構(gòu)對于處理序列和列表數(shù)據(jù)十分有效。例如對于語句進行識別,Xi就是相對應(yīng)的詞語的one-hot向量,A為網(wǎng)絡(luò)記憶單元,一般有非線性激活函數(shù)如tanh或Relu,同時將處理結(jié)果作為輸入到下一個記憶單元,?i為相對應(yīng)的輸出,一般有激活函數(shù)softmax處理。
LSTM(長短時記憶)是相對于循環(huán)神經(jīng)網(wǎng)絡(luò)的改良版本,由Hochreiter和Schmidhuber(1997)提出以克服RNN難以訓練和梯度消失問題[10],能夠?qū)W習長期依賴關(guān)系。對于每一個單元結(jié)點相對于簡單RNN,添加了遺忘門、更新門和輸出門對于元數(shù)據(jù)的連接進行更多的非線性的控制。LSTM網(wǎng)絡(luò)的基礎(chǔ)向前傳遞結(jié)構(gòu),如圖1所示。
圖1 LSTM(長短時記憶)網(wǎng)絡(luò)向前傳播結(jié)構(gòu)圖Fig.1 Structure of Long and Short Time Memory Forward
一旦我們遺忘了了所討論的主題是單一的,我們需要找到一種方法來更新它以反映新主題是復數(shù)。以下是更新門的公式:
要確定我們將使用哪些輸出,我們需要輸出門:
式中:Wf、Wu、Wo和bf、bu、bo—控制遺忘門、更新門、輸出門輸出的參數(shù)矩陣和偏置向量,σ—激活函數(shù),這里通過Logistic Sigmoid激活函數(shù)來控制門的開關(guān)程度以控制信息的流動,a<t-1>—上一個節(jié)點的輸出。這里的[a<t-1>,x<t>]是將上一節(jié)點的輸出和該節(jié)點的輸入進行合并矩陣操作,式中a<t-1>和x<t>做如下操作:
要更新新狀態(tài),我們需要創(chuàng)建一個新的數(shù)字向量,我們可以將其添加到之前的單元格狀態(tài)。我們使用的等式是:
最終新節(jié)點狀態(tài)為:
節(jié)點進行向前傳遞后,需要向后傳遞獲取梯度從而進行優(yōu)化,基礎(chǔ)RNN網(wǎng)絡(luò)的基礎(chǔ)向后傳遞結(jié)構(gòu),如圖2所示。
圖2 基礎(chǔ)RNN網(wǎng)絡(luò)向后內(nèi)傳播結(jié)構(gòu)圖Fig.2 Structure of Base RNN Backpropagation
我們對于基礎(chǔ)RNNa<t>進行求導,如下:
在Base RNN的基礎(chǔ)上,使用通過時間的反向傳播(Back Propagation Through Time,BPTT)算 法[11],求 得
最后將計算相對于之前隱藏狀態(tài),之前的記憶狀態(tài)以及輸入:
這里使用Adam[12]作為優(yōu)化算法進行參數(shù)優(yōu)化,它計算過去梯度的指數(shù)加權(quán)平均值v以及指數(shù)加權(quán)平方值s,并將其存儲在變量(偏差校正前)和(偏差校正)中。t代表adam的步數(shù),L是層數(shù),β1和β2是控制指數(shù)加權(quán)平均值的超參數(shù),α是學習率,是一個很小的數(shù)保證分母不為0。
全矢譜簡單理解就是轉(zhuǎn)子的渦流現(xiàn)象是諧波頻率的組合,其渦旋軌跡是一系列橢圓。定義橢圓的長半軸是振動強度評估的主要振動矢量,短半軸是振動強度的子振動矢量。而轉(zhuǎn)子在不同諧波頻率下的強度是對故障判別的基本依據(jù)[13]。
雙通道數(shù)據(jù){xn}和{yn}(n=0,1,2,…,N-1),傅里葉變換{Xk}和{Yk}(k=0,1,2,…,N-1),令復序列{zk}={xk}+i{yk},式中i=,通過傅里葉變換得到{Zk},并結(jié)合正反進動得到以下公式:
式中:Rai主振矢,Rbi—副振矢,αi—主振矢和x軸的夾角,φi—初相位角。
使用全矢譜對同源信號進行融合得到主振矢,使用得到主振矢訓練集對LSTM模型進行訓練,經(jīng)過驗證集驗證并進行參數(shù)微調(diào),通過Layer Normalization在通道方向做CHW歸一化避免數(shù)據(jù)分布不一致帶來長尾特征提取不到問題,使用Adam作為優(yōu)化器進行優(yōu)化,最后在測試集上驗證LSTM模型的有效性。如圖3所示。
圖3 全矢LSTM方法故障診斷流程圖Fig.3 Flow Chart of Full-vector LSTM Fault Diagnosis
具體步驟如下:
(1)確定LSTM模型結(jié)構(gòu),我們選擇雙向LSTM,相對于LSTM更關(guān)注上下文信息的傳遞性;對樣本采樣信息中的雙通道數(shù)據(jù)進行全矢融合并得到主振矢譜,作為訓練的訓練集;
(2)確定訓練的超參數(shù)訓練學習率、確定目標函數(shù)θ,確定epoch、batch-size、學習率、節(jié)點數(shù)、輸出節(jié)點數(shù)、激活函數(shù)類型等;
(3)計算全矢LSTM模型每一層的節(jié)點狀態(tài)a<t>,通過增加BatchNormalization在通道方向上做歸一化,解決輸入分布不一致問題,解決梯度消失問題,提高收斂速度即訓練時間。
(4)使用Adam算法計算輸出結(jié)果與標簽的損失函數(shù)φFV-LSTM,根據(jù)BPTT算法fine-tune模型,更新W和b。
(5)將全矢LSTM輸出層與使用測試集標簽數(shù)據(jù)做對比,統(tǒng)計正確率,召回率等評價指標。
使用Center for Intelligent Maintenance at Sinatra University的滾動軸承全生命周期故障數(shù)據(jù)[14]進行實驗。四個Rexnord ZA-2115滾動軸承在的位置,如圖4所示。每列包含16個滾動體,節(jié)圓直徑為71.5mm,滾子直徑為8.4mm,接觸角為15.17°。通過摩擦帶將轉(zhuǎn)速連接到軸上的轉(zhuǎn)速保持恒定在約2000r/min。通過彈簧機構(gòu),軸和軸承承受6000磅的徑向載荷。所有軸承都是強制潤滑的。對于數(shù)據(jù)集每個軸承上安裝了兩個PCB 353B33高靈敏度石英ICP加速度傳感器(分別裝在X軸和與之垂直的Y軸)。所有故障均發(fā)生在軸承超過設(shè)計壽命1億轉(zhuǎn)以上的情況下。ICP傳感器的采樣頻率為20 kHz,每次采集了20480個點。信號樣本采集間隔為10 min,于2003年10月22號至2003年12月25號持續(xù)采集信號保存在2156個文件中,其中前43個文件中的數(shù)據(jù)的采集間隔是5 min,軸承3、4分別為內(nèi)圈和滾動體故障。
圖4 軸承及傳感器布置圖Fig.4 Bearing and Sensor Placement Illustration
選擇test1中的雙通道數(shù)據(jù)進行處理,因為對于三種軸承來說并不是在一開始的情況下就處于故障的階段,所以在對于三種軸承的數(shù)據(jù)進行標定標簽的時候不能簡單的全部標定。我們選擇軸承2的全部2156組數(shù)據(jù)為正常數(shù)據(jù)。軸承3最終出現(xiàn)了內(nèi)圈故障,我們對于軸承3的前1800組數(shù)據(jù)標定為正常數(shù)據(jù),在1800到2156組數(shù)據(jù)標定為內(nèi)圈故障。軸承4最終出現(xiàn)了滾動體故障,我們對于軸承4的前1600組數(shù)據(jù)標定為正常的軸承數(shù)據(jù),在1600到2156組數(shù)據(jù)中標定為滾動體故障。由于每一組數(shù)據(jù)的維度都是20480,在經(jīng)過全矢譜融合后得到的主振矢的維度為10240,考慮到LSTM節(jié)點數(shù)太多會導致計算量急劇增加,并且可能會導致梯度在傳遞過程中出現(xiàn)消失的現(xiàn)象,確定輸入節(jié)點數(shù)為1024,得到試驗樣本集。最終數(shù)據(jù)集的長度為64680x1024,雖然其中的每個故障類型的數(shù)量不一致,但是是符合現(xiàn)實情況的。訓練集和測試集按照8:2的比例分配,試驗數(shù)據(jù)集,如表1所示。
表1 滾動軸承故障類型數(shù)據(jù)集Tab.1 Rolling Bearing Fault Type Data Sets
由經(jīng)驗[15]設(shè)置全矢LSTM網(wǎng)絡(luò),設(shè)定激活函數(shù)為tanh函數(shù),lr為0.05,epoch為400,batchsize為64。考慮到一般的軸承信號中噪聲,為了使提取的特征更加的泛化,特征的方差更小,我們采用去噪技術(shù)[16]重構(gòu)輸入,其中噪聲比率為12%。根據(jù)故障結(jié)果為正常、內(nèi)圈故障、滾動體故障確定輸出層為3,分別對于全矢LSTM、X通道LSTM、Y通道LSTM的模型的識別效果進行比較。
為了使實驗結(jié)果更加嚴謹,我們每次從64680組樣本中隨機抽取劃分訓練集和測試集,一共完成了20次重復試驗,這里取的是在400epoch中各模型的最高的測試集上的準確率,消除偶然性的影響,全矢LSTM和X通道LSTM測試集以及Y通道LSTM準確率對比,如圖5所示。
圖5 全矢LSTM和單通道LSTM測試集準確率對比Fig.5 Accuracy Comparison between Full-vector LSTM and Single-channel LSTM on Test Set
Epoch=400,驗證集上驗證的結(jié)果,如表2所示。
表2 試驗結(jié)果比較(平均準確率±標準差)Tab.2 Results Trials(Average Accuracy±Standard Deviation)
從圖7和表2可以看出,Y通道LSTM的軸承識別故障準確率要高于X通道LSTM,而全矢LSTM方法在模型的準確率和模型的泛化性上都優(yōu)于單通道LSTM,證明了全矢LSTM方法是有效的。
圖7 三種方法準確率對比Fig.7 Comparison of Accuracy of the Three Methods
我們分別采集全矢LSTM,X通道LSTM和Y通道LSTM提取的特征向量,用T-SNE非線性降維算法對提取到的特征向量進行降維,得到T-SNE的特征維度圖。如圖6所示,三種顏色藍色、綠色、橙黃色分別代表正常狀態(tài)、內(nèi)圈故障和滾動體故障的特征分量。從圖中可見全矢LSTM方法提取的特征對于故障分類能力特別強,幾乎沒有誤判,而單通道LSTM提取的特征都誤判現(xiàn)象,并且對于特征的擬合并不完善,故全信息融合技術(shù)是有效以及必要的。
圖6 測試集分類結(jié)果PCA特征對比Fig.6 Test Set Classification Results
為了驗證LSTM相對于手工提取有效特征的優(yōu)越性,我們選擇CEEMD能量熵作為手工特征提取方法的典型代表與Y通道LSTM以及全矢LSTM的特征向量作比較,最后都使用softmax多分類器中,結(jié)果,如表3所示。
表3 特征提取方法與softmax結(jié)合測試集診斷準確率對比Tab.3 Comparison of Diagnostic Accuracy Between Different FeatureExtraction Methods Combined with Softmax in Test Dataset
由于softmax對于多分類的優(yōu)化,Y通道DNN和Y通道LSTM都取得比較好的分類效果。由表3和圖7所示,CEEMD作為手工特征提取準確率較低,并且出現(xiàn)的波動比較大;而單通道LSTM的準確率有所提升達到83.67%,并且波動變小,表示其泛化性較強;而全矢LSTM的準確率達到99.34%,并且在準確率提升的同時不存在波動,可以進一步驗證了全矢LSTM相對于手工提取軸承故障特征,判斷軸承故障類型具有很大的優(yōu)勢。
經(jīng)過IMS數(shù)據(jù)集的驗證,全矢譜融合雙通道信息,對于數(shù)據(jù)增強以及模型對于數(shù)據(jù)的擬合都有明顯的作用。通過全矢譜和循環(huán)神經(jīng)網(wǎng)絡(luò)中的LSTM模型結(jié)合得到全矢LSTM模型提高了對于軸承故障診斷分類的準確率以及模型泛化性的全面提升。