唐貴基,周 威,王曉龍,徐振麗,丁 傲
(1.華北電力大學機械工程系,河北 保定 071003;2.華北電力大學河北省電力機械裝備健康維護與失效預防重點實驗室,河北 保定 071003)
由于數(shù)據(jù)驅(qū)動下的健康評估框架逐步搭建形成以及信息管理系統(tǒng)的不斷開發(fā),滾動軸承故障維修由傳統(tǒng)的事后維修、定期維修等被動的維修階段過渡到自動的預測維修階段。對于滾動軸承來說,預測維修的核心在于軸承的剩余壽命(remaining useful life,RUL)預測[1]。
深度學習在時序數(shù)據(jù)預測上的發(fā)展為軸承壽命預測提供了新思路。其中循環(huán)神經(jīng)網(wǎng)絡(luò)在時間序列數(shù)據(jù)預測上有著一定的優(yōu)勢,但同時存在著對于長期特征無法保存,在反向傳播中存在梯度爆炸和梯度離散等問題,為減少這些問題的影響,Hochreater等[2]提出了一種基于3種門結(jié)構(gòu)的循環(huán)神經(jīng)網(wǎng)絡(luò),即長短時記憶網(wǎng)絡(luò)(long short-term memory model,LSTM)結(jié)構(gòu)。申彥斌[3]將雙向長短時記憶網(wǎng)絡(luò)(bidirectional long short-term memory model,BiLSTM)應用到軸承壽命預測中,將提出的特征輸入到網(wǎng)絡(luò)里面,利用網(wǎng)絡(luò)對RUL 進行預測,證明了BiLSTM 在壽命預測上的可行性。王文慶等[4]提出了基于卷積神經(jīng)網(wǎng)絡(luò)復合門控循環(huán)單元(gated recurrent unit,GRU)的壽命預測方法,以及王彪等[5]提出的多尺度卷積注意力網(wǎng)絡(luò),都將特征交于網(wǎng)絡(luò)進行自行提取,增強了網(wǎng)絡(luò)可信度。
因此,為避免人工提取特征帶來的數(shù)據(jù)誤差,本文提出了一種變維GRU-BiLSTM 模型進行軸承壽命預測。本模型可以直接將原始信號作為模型輸入,通過將信號按其周期變維,再依托信號自身周期特征進行壽命預測的方法,有望為解決具有周期性特征的時序信號預測問題提供新思路。
LSTM 是循環(huán)神經(jīng)網(wǎng)絡(luò)中的一種,其主要由3個門控單元組成,即遺忘門、輸入門和輸出門。遺忘門主要作用在LSTM 狀態(tài)向量c上面,用于控制上一個時間戳的記憶ct-1對于當前時間戳的影響。輸入門用來控制LSTM對于輸入的接受程度,
式中:Wc、bc為輸入門的參數(shù)矩陣和殘差向量;xt為當前時間戳的輸入;tanh 為激活函數(shù);ht-1為上一個時間戳的輸出。
在LSTM 內(nèi)部,狀態(tài)向量并不會全部輸出,而是在輸出門的作用下有選擇地輸出。輸出門的門控變量go為
式中:Wo、bo為輸入門的參數(shù)矩陣和殘差向量;σ為激活函數(shù),一般為Sigmod函數(shù)。
故LSTM輸出的計算公式為
即內(nèi)存向量ct經(jīng)過tanh激活函數(shù)后與輸入門作用。
BiLSTM 在原前向LSTM 的基礎(chǔ)上加入了一個后向LSTM,對于前向LSTM,學習順序輸入的序列數(shù)據(jù);而后向LSTM,則用來學習倒序輸入的序列數(shù)據(jù)。待前向LSTM 和后向LSTM 都完成數(shù)據(jù)學習,在對兩段LSTM 學習結(jié)果進行疊加,得到最后輸出,其計算公式如下:
式中:σ為激活函數(shù),一般為Sigmod 函數(shù);hLt為正向LSTM 最后一個細胞結(jié)構(gòu)的輸出;hRt為反向LSTM最后一個細胞結(jié)構(gòu)的輸出。
其基本結(jié)構(gòu)如圖1所示。
圖1 BiLSTM 基本結(jié)構(gòu)Fig.1 Basic structure diagram of BiLSTM
GRU 將LSTM 的3個門控單元減少為2個門控單元:重置門和更新門[6]。GRU 的基本結(jié)構(gòu)如圖2所示。圖中,rt為重置門,zt為更新門。
圖2 GRU基本結(jié)構(gòu)Fig.2 Basic structure diagram of GRU
圖中:重置門用來控制上一個時間戳的狀態(tài)ht-1進入GRU 的量,門控向量gr由當前時間戳輸入xt和上個時間戳狀態(tài)ht-1變換得到,其計算公式如下:
式中:Wr、br為重置門的參數(shù)矩陣和殘差向量,可以由反向傳播自動優(yōu)化;σ為激活函數(shù),一般為Sigmod 函數(shù)。更新門用于控制上一個時間戳狀態(tài)ht-1和新輸入ht對新狀態(tài)向量ht的影響程度。
更新門門控向量為
式中:Wz、bz為更新門的參數(shù)矩陣和殘差向量,可以由反向傳播自動優(yōu)化;σ為激活函數(shù),一般為Sigmod函數(shù)。
gz用來控制信號,1-gz用于控制ht-1信號。
針對具有周期性特征的時序信號,設(shè)計了一種變維GRU-BiLSTM 神經(jīng)網(wǎng)絡(luò)模型,本模型主要分為3 個模塊,分別為變維模塊、特征提取模塊、數(shù)據(jù)預測模塊,其基本結(jié)構(gòu)如圖3所示。
對時序信號而言,由于其受到各種自身物理特性的影響,具有一定的周期性特征。如果將一維狀態(tài)的時序信號直接輸入到神經(jīng)網(wǎng)絡(luò)中,其自身可用于預測的周期性特征就存在未被神經(jīng)網(wǎng)絡(luò)充分學習和運用到的可能性。為了使神經(jīng)網(wǎng)絡(luò)充分學習到信號周期內(nèi)和周期間的相互作用關(guān)系,本文設(shè)計了一種基于信號周期的變維模塊。圖3中,T為信號周期,T/2為信號的半周期,在本文中用來表示周期長度數(shù)據(jù)點的個數(shù)。
當時序信號輸入到模型中時,先將一維的時序信號按照信號周期長度進行切分,形成一個長度為T的一個二維數(shù)組,二維數(shù)組的寬度nT由原數(shù)據(jù)的長度控制,舍去不足周期長度的數(shù)據(jù)點。其計算公式為
式中:l為原信號的長度;nT為多維數(shù)組的寬度,即長度為T數(shù)據(jù)組的組數(shù);a為原數(shù)據(jù)組經(jīng)過變維后長度達不到T而舍棄的數(shù)據(jù)。
為加強對于半周期內(nèi)特征的學習,同時為了學習長度不足T模塊的數(shù)據(jù),增加了一個按半周期變維的模塊。對數(shù)據(jù)進行半周期T/2的變維與上述同理,但是當處理長度不足T/2的點時,依然將其單列為一組,不再將其省略。
特征學習模塊采用的是GRU 網(wǎng)絡(luò)單元。如圖3所示,先將變維后的二維數(shù)組每組依序輸入到GRU 網(wǎng)絡(luò)單元中,利用GRU 網(wǎng)絡(luò)單元對于時序信號的長短時記憶特征,讀取信號每個周期內(nèi)的特征,并依次輸出。將輸出按序拼接后,得到一個新的一維數(shù)組,再將這個一維數(shù)組輸入到GRU 網(wǎng)絡(luò)單元中。該數(shù)組包含了每個周期提取出的相關(guān)特征信息,GRU 網(wǎng)絡(luò)單元通過學習,可以建立包含信號周期之間聯(lián)系的數(shù)組。
數(shù)據(jù)預測模塊采用的BiLSTM 網(wǎng)絡(luò)單元。將按T變維后經(jīng)過特征提取后的信號與按T/2變維后經(jīng)過特征提取后的數(shù)組相拼接,此時數(shù)組包含了周期、半周期內(nèi)及其相互間的特征信息。利用BiLSTM 雙向?qū)W習的特征,對于數(shù)據(jù)前后的聯(lián)系進行學習,從而進行壽命狀態(tài)分析及剩余壽命預測。
據(jù)統(tǒng)計,在使用滾動軸承的旋轉(zhuǎn)設(shè)備中,大約有45%~55%的機械故障都是由滾動軸承引起的[7],所以滾動軸承的壽命預測分析已經(jīng)成為滾動軸承故障診斷的一個重要研究方向。本文針對滾動軸承進行壽命預測的流程主要分為以下3 個部分,其流程如圖4所示。
圖4 軸承壽命預測流程Fig.4 Flow chart of bearing life prediction
當滾動軸承振動信號輸入到模型中,先將原先的滾動軸承信號數(shù)據(jù)分別按照其周期和半周期展開成寬度為T和T/2 的多維數(shù)據(jù),然后將這個多維數(shù)據(jù)輸入到GRU 中,通過GRU 對其周期、半周期內(nèi)和周期間特征進行學習。將GRU 部分學習后的數(shù)據(jù)輸送到BiLSTM 中,通過BiLSTM 對數(shù)據(jù)從2個方向進行學習,增強了對數(shù)據(jù)的學習能力[8],從而提高預測的精度,然后將預測結(jié)果輸出。最后對RUL 采用三點平均法進行降噪處理,得到軸承的RUL預測結(jié)果。
當神經(jīng)網(wǎng)絡(luò)模型通過學習數(shù)據(jù)中的特征并進行輸出后,為對神經(jīng)網(wǎng)絡(luò)模型預測結(jié)果進行定量評估以展示其預測效果,本文以平均絕對值誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)和Score 函數(shù)作為評價指標,并記錄了不同模型的訓練時長。
MAE計算公式為
RMSE計算公式為
Score函數(shù)來自2012年的PHM 數(shù)據(jù)挑戰(zhàn)賽[9],計算公式如下:
式中:h(xi)為軸承的預測值;yi為軸承的實際壽命值;m為數(shù)據(jù)集中數(shù)據(jù)點的個數(shù);Ai為軸承的實際RUL 值;Ri為軸承的預測RUL 值;Ei為第i個樣本的百分比誤差;S為Score函數(shù)值。
RMSE 和MAE 數(shù)值越小,越能說明預測效果越好,越能體現(xiàn)軸承壽命的變化趨勢。而Score 函數(shù)越高,則表明網(wǎng)絡(luò)預測效果越好。
為驗證本文所提出的變維GRU-BiLSTM 壽命預測模型的有效性,采用XJTU-SY 滾動軸承加速壽命試驗數(shù)據(jù)集進行驗證[12]。
此數(shù)據(jù)集下包括3 個工況下的15 個軸承完整運行到故障的數(shù)據(jù),測試軸承型號為LDK UER204,采樣頻率為25.6 kHz,每次采樣1.28 s,每兩次采樣之間間隔1 min,滾動軸承試驗平臺的結(jié)構(gòu)如圖5所示。
圖5 滾動軸測試驗平臺結(jié)構(gòu)Fig.5 Structure diagram of rolling axonometric test platform
本次試驗模型是基于pytorch 架構(gòu)設(shè)計,運行平臺為Intel(R)Core(TM)i5-9300H CPU(主頻2.4 GHz),Win10 64位操作系統(tǒng),NVIDIA GTX1650顯卡,并安裝了CUDA10.0,Cudnn7.3 對顯卡運算進行加速。
本次試驗是基于端對端神經(jīng)網(wǎng)絡(luò)進行的壽命預測,無需對振動信號特征進行提取,可以直接用全壽命的振動信號作為網(wǎng)絡(luò)的輸入。為了合理使用軸承全周期的壽命數(shù)據(jù),故采用以下方法劃分數(shù)據(jù)。已知每個樣本中包含軸向和徑向兩個方向上的振動數(shù)據(jù),共計32 768×2個點。本試驗將這32 768×2個點分成32組,故每組為1 024×2個點,每個點由原振動信號隔32個點抓取產(chǎn)生按照每組起始點的位置給予編號,分為第1~32組。本文試驗先隨機抽取其中5組進行數(shù)據(jù)集劃分,其中4組作為訓練集,最后1組作為測試集。
文獻[11]對剩余壽命標簽進行劃分,標簽劃分采用的是歸一化處理,假定1 表示軸承完好的時刻,0 表示軸承失效的時刻,故編號為1 的樣本,其剩余壽命標簽為1,其余編號樣本的剩余壽命計算公式為
式中:x為其樣本編號;A為該樣本的剩余壽命編號。
本次試驗的數(shù)據(jù)集其全壽命為339 min,比如編號為100 的樣本,其真實剩余壽命為239 min,將其編號代入式(15)得到剩余壽命標簽為0.707,以此類推構(gòu)建滾動軸承壽命的數(shù)據(jù)集標簽集。
本次試驗選擇XJTU-SY 軸承數(shù)據(jù)集中轉(zhuǎn)速為2 250 r/min(轉(zhuǎn)頻37.5 Hz)和負載為12 kN 的工況下的第5 個軸承,失效標志為水平或垂直振動信號的最大幅值超過了10 倍的正常運行階段水平或垂直振動信號的最大幅值。該數(shù)據(jù)集共有339 個樣本,該軸承實際壽命為339 min,其失效時出現(xiàn)的故障類型為外圈故障。
此時可以計算變維模塊中的T值,計算公式為
式中:a為按照本文描述方式劃分數(shù)據(jù)集后的組數(shù);ts為每次采樣時間;fz為軸承的轉(zhuǎn)頻。
將相關(guān)數(shù)據(jù)代入到式(16)中,得到本次試驗變維模塊中的T值為22,T/2值為11。
本試驗采用的是學習率自適應優(yōu)化算法中的Adam 優(yōu)化算法,其具有著收斂速度快,對內(nèi)存需求小,能較好處理噪聲樣本等優(yōu)點[10]。
本次試驗主要是為了驗證變維GRU-BiLSTM模型在預測滾動軸承剩余壽命這類時間序列問題上的可靠性,故選擇常見的GRU、BiLSTM 以及去除變維模塊后各超參不變的GRU-BiLSTM 模型作為對比試驗,并在最后對模型預測結(jié)果使用了三點平均法,降低局部預測誤差過大對全局預測帶來的影響。
4種模型的預測效果如圖6所示,4種模型的評估指標見表1,4 種模型在迭代學習過程中MAE 的變化曲線如圖7所示。
圖6 不同模型在試驗臺數(shù)據(jù)集上的預測結(jié)果Fig.6 Prediction results of different models on XJTU-SY dataset
由圖7和表1可知:相較于其他3 種算法,本文提出的變維GRU-BiLSTM 在運行相同的迭代次數(shù)時具有更高的擬合度,且MSE、RMSE 的誤差也比其他3種模型更低,同時在Score函數(shù)中,具有更高的得分。通過該試驗能證明本文提出的變維GRUBiLSTM模型在軸承壽命預測上具有可靠性。
表1 不同模型在XJTU-SY上的評估結(jié)果Tab.1 Evaluation results of different models on XJTU-SY
圖7 3種模型迭代過程中的MAE變化曲線Fig.7 MAE change curves of the three models during iteration
本文針對旋轉(zhuǎn)機械的重要部件——滾動軸承的壽命預測,提出了一種可以提取周期性特征的變維GRU-BiLSTM模型。通過試驗分析,得到以下結(jié)論:變維GRU-BiLSTM比GRU、BiLSTM具有更快的回歸速度、更高的精度和平滑度,在預測結(jié)果上更貼合于實際壽命曲線。變換軸承數(shù)據(jù)后,本文提出的變維GRU-BiLSTM依然可以很好地對軸承壽命進行預測,證明了該模型的普適性。通過試驗證明了本文所提模型的可靠性和魯棒性,能夠為深度學習處理具有周期性特征的時序信號問題提供新思路。