葉子健,張 強(qiáng),邵思羽,楊新宇,牛天林,趙玉偉,焦曉璇
(1.空軍工程大學(xué) 防空反導(dǎo)學(xué)院,西安 710051;2.空軍工程大學(xué) 航空工程學(xué)院, 西安 710051)
滾動軸承被譽(yù)為旋轉(zhuǎn)機(jī)械設(shè)備的關(guān)節(jié),在工業(yè)生產(chǎn)、智能制造和交通運(yùn)輸?shù)阮I(lǐng)域起著重要作用。滾動軸承一旦發(fā)生故障,輕則引起機(jī)械設(shè)備的停止工作,重則造成巨大的經(jīng)濟(jì)損失。因此,及時(shí)對滾動軸承的健康狀態(tài)進(jìn)行分析,并對其剩余使用壽命(remaining useful life,RUL)進(jìn)行預(yù)測具有重要的研究意義。RUL預(yù)測是預(yù)測與健康管理(prognostics and health management,PHM)中一項(xiàng)關(guān)鍵技術(shù),其概念是設(shè)備當(dāng)前工作時(shí)間到出現(xiàn)故障時(shí)刻之間的時(shí)間間隔。對設(shè)備的RUL進(jìn)行準(zhǔn)確預(yù)測,可以輔助維護(hù)人員及時(shí)修正維修策略,合理的對設(shè)備零部件進(jìn)行更換或者維修,提升設(shè)備視情維護(hù)能力,減少無效維護(hù)次數(shù),能夠起到提升維護(hù)效率,減少維護(hù)成本的作用。
當(dāng)前,剩余使用壽命預(yù)測方法主要分為基于模型的方法和基于數(shù)據(jù)驅(qū)動的方法?;谀P偷姆椒ú捎脭?shù)學(xué)方法構(gòu)建機(jī)械部件退化趨勢的物理模型。然而,現(xiàn)代機(jī)械系統(tǒng)的復(fù)雜程度急劇增加,內(nèi)部組件高度耦合,并且通常在高負(fù)載、變工況和多噪聲等嚴(yán)峻環(huán)境下工作。因此,建立精確的退化模型是一件較為困難的事情,限制了基于模型方法的發(fā)展。基于數(shù)據(jù)驅(qū)動的方法是利用機(jī)器學(xué)習(xí)算法,來構(gòu)建傳感器的監(jiān)測數(shù)據(jù)和剩余使用壽命之間的映射關(guān)系。
深度學(xué)習(xí)是目前機(jī)器學(xué)習(xí)領(lǐng)域最熱門的研究方向之一,憑借其強(qiáng)大的數(shù)據(jù)處理和特征提取能力,深度學(xué)習(xí)廣泛的應(yīng)用于計(jì)算機(jī)視覺、自然語言處理和故障診斷等領(lǐng)域。鑒于深度學(xué)習(xí)的優(yōu)點(diǎn),越來越多的研究人員將其應(yīng)用在剩余使用壽命預(yù)測領(lǐng)域。Wang等提出了一個(gè)多尺度卷積注意力網(wǎng)絡(luò)。首先將多傳感器數(shù)據(jù)進(jìn)行融合,然后使用帶自注意力機(jī)制的多尺度卷積模塊進(jìn)行特征提取,最后使用動態(tài)密集層對高層表示進(jìn)行回歸分析,使用銑刀壽命數(shù)據(jù)驗(yàn)證了模型的有效性。張等]通過建立全卷積層神經(jīng)網(wǎng)絡(luò)對軸承進(jìn)行剩余使用壽命預(yù)測,能夠?qū)崿F(xiàn)特征自學(xué)習(xí),并且減少了神經(jīng)網(wǎng)絡(luò)所需的訓(xùn)練參數(shù)量。周哲韜等將Transformer模型應(yīng)用在滾動軸承的剩余使用壽命預(yù)測領(lǐng)域。孫鑫等提出了一種新型的改進(jìn)均方誤差損失函數(shù),并結(jié)合多尺度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行軸承的RUL預(yù)測。
健康指標(biāo)(Health Index,HI)的提取是剩余使用壽命預(yù)測流程中的關(guān)鍵步驟。健康指標(biāo)主要反映了機(jī)械設(shè)備的退化情況,因此,健康指標(biāo)質(zhì)量的優(yōu)劣將直接影響剩余使用壽命預(yù)測的精度。Qiu等使用自組織映射(SOM)將提取的特征進(jìn)行融合,以此構(gòu)建滾動軸承的健康指標(biāo)。Chen等提出了一個(gè)簡單的健康指標(biāo)構(gòu)建方案,將當(dāng)前時(shí)刻的剩余使用壽命值與初始剩余使用壽命的比值作為健康指標(biāo),減少了昂貴先驗(yàn)知識的需求。使用頻譜的5個(gè)帶通能量值作為特征,利用基于注意力機(jī)制的循環(huán)自編碼器構(gòu)建特征和健康指標(biāo)直接的映射關(guān)系,最后利用線性回歸計(jì)算得到剩余使用壽命的值。
上述方法主要存在兩點(diǎn)問題:① 沒有充分利用振動信號的數(shù)據(jù)信息,通常只使用單一大小的時(shí)間窗對振動信號進(jìn)行特征提取,沒有綜合考慮局部信息與全局信息。軸承的振動信號是一個(gè)包含時(shí)間信息的向量,如果缺乏對時(shí)間尺度的充分考慮,則會影響健康指標(biāo)的有效性。② 通常在使用健康指標(biāo)對RUL進(jìn)行預(yù)測時(shí),需要對健康指標(biāo)的失效閾值進(jìn)行確定。如在文獻(xiàn)[22]中,選擇軸承失效時(shí)的RMS最大值1.903作為失效閾值。這些方法往往需要一定的先驗(yàn)知識或經(jīng)驗(yàn)積累,否則會導(dǎo)致實(shí)際RUL預(yù)測的較大誤差。
為了解決上述問題,本文中提出一種新的深度學(xué)習(xí)框架,稱為多尺度卷積自編碼網(wǎng)絡(luò),用于滾動軸承健康指標(biāo)的自動提取。多尺度卷積自編碼器由多個(gè)卷積核大小不同的卷積自編碼器融合得到。具有小卷積核的卷積自編碼器能夠針對局部的退化特征進(jìn)行特征提取。與此相反,具有大卷積核的卷積自編碼器能夠考慮整個(gè)序列的退化趨勢進(jìn)行特征提取。兩者相互結(jié)合,能夠解決振動信號時(shí)間信息利用不充分的問題。使用復(fù)合損失函數(shù)對多尺度卷積自編碼器進(jìn)行訓(xùn)練,實(shí)現(xiàn)健康指標(biāo)的自動提取。在得到多尺度卷積自編碼器提取的健康指標(biāo)后,使用門控循環(huán)單元(gate recurrent unit,GRU)神經(jīng)網(wǎng)絡(luò)用于軸承的剩余使用壽命預(yù)測,與其他方法不同,本文中提出方法得到的健康指標(biāo)不需要增加失效閾值確定的步驟,直接將失效閾值定為1。
自編碼器(Autoencoder,AE)是一種無監(jiān)督學(xué)習(xí)方法,通常用于特征降維。AE由編碼器和解碼器構(gòu)成,前者對輸入數(shù)據(jù)進(jìn)行降維,提取其高層表示,后者對提取的高層表示進(jìn)行升維,對輸入數(shù)據(jù)進(jìn)行重構(gòu)。利用反向傳播算法來更新自編碼器的內(nèi)部參數(shù),使得重構(gòu)誤差達(dá)到最小。AE的結(jié)構(gòu)如圖1所示。
圖1 自編碼器結(jié)構(gòu)示意圖Fig.1 The structure of autoencoder
假設(shè)AE的輸入為= [,,…,],為輸入數(shù)據(jù)的長度。則編碼器的輸出可以表示為:
=(+)
(1)
′=(+)
(2)
其中:和分別表示權(quán)重和偏差;表示解碼器的激活函數(shù)。AE通過誤差反向傳播來對內(nèi)部的權(quán)重和偏差進(jìn)行更新,使得重構(gòu)誤差達(dá)到最小,AE的重構(gòu)誤差可以表示為:
(3)
圖2 多尺度卷積自編碼器結(jié)構(gòu)示意圖Fig.2 The structure of multi-scale convolutional autoencoder
(4)
其中:為MSCAE中的可訓(xùn)練參數(shù);v是比例系數(shù)。由式(4)可以看出,本文中構(gòu)建的復(fù)合損失函數(shù)即包括數(shù)據(jù)重構(gòu)誤差,也包含HI和真實(shí)的退化標(biāo)簽之間的誤差,在充分利用軸承振動數(shù)據(jù)的同時(shí),有效的提取具有反應(yīng)軸承真實(shí)退化特性的HI。使用反向傳播算法優(yōu)化可訓(xùn)練參數(shù),使復(fù)合損失函數(shù)達(dá)到最小,使構(gòu)建的MSCAE具備提取測試軸承的HI能力。
基于MSCAE的滾動軸承HI提取及RUL預(yù)測流程如圖3所示。具體步驟為:
圖3 滾動軸承的HI提取及RUL預(yù)測流程框圖Fig.3 HI extraction and RUL prediction process of rolling bearings
1) 訓(xùn)練軸承的標(biāo)簽構(gòu)建:由于軸承的振動信號沒有對應(yīng)的標(biāo)簽,無法對有監(jiān)督學(xué)習(xí)的深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,故需要人為的構(gòu)建振動信號的對應(yīng)標(biāo)簽。假設(shè)軸承已經(jīng)運(yùn)行的時(shí)間為t,軸承的運(yùn)行總時(shí)間為,則對應(yīng)的標(biāo)簽為。例如,軸承已經(jīng)運(yùn)行14 000 s,而軸承的運(yùn)行總時(shí)長為28 000 s,則當(dāng)前的標(biāo)簽值為0.5。值得注意的是,訓(xùn)練軸承的標(biāo)簽大小處于0~1。
2) 訓(xùn)練MSCAE:將訓(xùn)練軸承的振動信號輸入MSCAE,得到編碼器提取的HI值和解碼器對振動數(shù)據(jù)的重構(gòu)值,計(jì)算復(fù)合損失函數(shù)的損失值,使用誤差反向傳播算法對內(nèi)部的參數(shù)進(jìn)行更新。在反復(fù)的參數(shù)優(yōu)化過程中,使得MSCAE能夠有效的提取軸承的HI。
3) 測試軸承的HI提取:將測試軸承的振動數(shù)據(jù)輸入已經(jīng)訓(xùn)練好的MSCAE,得到編碼器的結(jié)果,即為測試軸承的HI值。
4) RUL預(yù)測:在進(jìn)行測試軸承的HI提取后,假設(shè)提取的HI序列為= [,,…,],假設(shè)的最后個(gè)點(diǎn)為未知量,則已知HI序列為′ = [,,…,-]。構(gòu)建訓(xùn)練矩陣,可以表示為:
(5)
(6)
(7)
本文中的實(shí)驗(yàn)數(shù)據(jù)來源于IEEE協(xié)會在2012年舉辦的PHM挑戰(zhàn)賽,數(shù)據(jù)由PRONOSTIA實(shí)驗(yàn)臺獲得,如圖4所示。實(shí)驗(yàn)臺主要由3部分組成:旋轉(zhuǎn)部分、退化產(chǎn)生部分和測量部分。其中,旋轉(zhuǎn)部分由帶變速箱的異步電機(jī)及其旋轉(zhuǎn)軸組成,目的支撐軸承的工作。退化產(chǎn)生部分可以模擬實(shí)際工作中的帶負(fù)載情況,給軸承施加徑向載荷。測量部分主要由水平、垂直和溫度3個(gè)傳感器組成,前2個(gè)傳感器測量軸承在工作中的振動量,溫度傳感器測量軸承工作中的溫度。
圖4 PRONOSTIA實(shí)驗(yàn)臺實(shí)物圖Fig.4 PRONOSTIA test bench
PHM2012數(shù)據(jù)集給出了3種操作條件下的軸承運(yùn)行到失效的全周期壽命數(shù)據(jù),每種操作條件下分別有7,7,3個(gè)測試軸承。實(shí)驗(yàn)臺的采樣頻率為25.6 kHz,采樣持續(xù)時(shí)間為0.1 s,采樣間隔為10 s。這表明每10 s能夠得到2 560個(gè)采樣點(diǎn)。為了驗(yàn)證本文所提出的MSCAE的有效性,需要將數(shù)據(jù)集劃分為測試集和訓(xùn)練集,劃分方法如表1所示。由表1可知,本文中只使用操作條件1下的7個(gè)軸承,操作條件1為轉(zhuǎn)速1 800 r/min和負(fù)載4 000 N,將Bearing1_1和Bearing1_3作為測試集,其余5個(gè)軸承作為訓(xùn)練集。
表1 訓(xùn)練集和測試集劃分Table 1 Training set and testing set division
為了驗(yàn)證本文所提出MSCAE模型提取HI的有效性,使用單調(diào)性和相關(guān)性來量化HI的性能。單調(diào)性和相關(guān)性的公式如下:
(8)
(9)
式(8)表示單調(diào)性的評價(jià)指標(biāo),式中:為HI的一階導(dǎo)數(shù);為HI的個(gè)數(shù),同時(shí)也是傳感器的采樣次數(shù)。本文中為了簡化運(yùn)算,采用間隔三個(gè)點(diǎn)之間的差值表示。例如,=-。單調(diào)性衡量HI單調(diào)增加和單調(diào)減少的趨勢,若HI的單調(diào)性越強(qiáng),其值越接近1,反之,單調(diào)性越弱,其值越接近0。式(9)表示相關(guān)性的評價(jià)指標(biāo),其中和分別表示指標(biāo)和運(yùn)行時(shí)間的值,()和()表示和的平均值。相關(guān)性衡量HI和運(yùn)行時(shí)間之間的相關(guān)性。兩者越相關(guān),其值越接近1,反之,其值越接近0。
本文中所提出的MSCAE三條通路中的卷積核大小分別為3×1,7×1和11×1,編碼塊和解碼塊的個(gè)數(shù)都為3,詳細(xì)的模型超參數(shù)配置由表2所示。
表2 多尺度卷積自編碼器的超參數(shù)Table 2 Hyperparameter setting of multi-scale convolutional autoencoder
根據(jù)表2的模型配置構(gòu)建MSCAE,使用訓(xùn)練集的軸承數(shù)據(jù)對模型進(jìn)行訓(xùn)練。在訓(xùn)練完畢后,輸入測試軸承的原始振動數(shù)據(jù),得到編碼器的輸出,即HI,Bearing1_1和Bearing1_3的HI提取結(jié)果如圖5所示。由圖5可以發(fā)現(xiàn),軸承1和軸承3所提取的HI具有明顯的退化趨勢,并且在軸承的退化后期,即軸承即將損壞的時(shí)刻,HI的值接近于1。
圖5 Bearing1_1和Bearing1_3的HI提取結(jié)果圖Fig.5 HI extraction results of Bearing1_1 and Bearing1_3
為了驗(yàn)證本文所提出的MSCAE的有效性,設(shè)置了一組對比實(shí)驗(yàn),將所提出的MSCAE和3個(gè)單尺度的卷積自編碼器進(jìn)行對比。3個(gè)單尺度卷積自編碼器的卷積核大小分別為3×1,7×1和11×1,為了保證對比實(shí)驗(yàn)的合理性,除了卷積核的大小不同之外,其余的模型超參數(shù)設(shè)置均和MSCAE模型相同。4種模型的結(jié)果如圖6和圖7所示,并且4種模型的單調(diào)性和相關(guān)性指標(biāo)見表3。由圖6(c)和圖7(c)可以發(fā)現(xiàn),卷積核大小為7×1的卷積自編碼器提取的HI在退化后期,有很多點(diǎn)都接近于1,這會導(dǎo)致軸承RUL的提前預(yù)測,使預(yù)測的RUL值總是小于真實(shí)的RUL值,并且會帶來很大的預(yù)測誤差。由圖6(b)和圖7(b),卷積核大小為3×1的卷積自編碼器提取的HI也有類似的情況出現(xiàn),但是比卷積核大小7×1的現(xiàn)象要輕微。由圖6(d)和圖7(d),卷積核大小為11×1的模型提取的HI在退化后期波動情況比較明顯。同時(shí),表3中使用MSCAE提取的HI在2個(gè)測試軸承上的單調(diào)性和相關(guān)性均高于其他3種模型。綜合上述分析,證明本文所提出的MSCAE模型能夠充分的利用振動信號的全局和局部信息,提取的HI相比于單尺度的卷積自編碼器更為有效。
表3 4種模型的單調(diào)性和相關(guān)性指標(biāo)Table 3 Monotonicity and correlation indicators of the four models
圖6 4種模型在Bearing1_1上的HI提取結(jié)果圖Fig.6 HI extraction results of four models on Bearing1_1
圖7 4種模型在Bearing1_3上的HI提取結(jié)果圖Fig.7 HI extraction results of four models on Bearing1_3
為了進(jìn)一步驗(yàn)證本文提出的MSCAE的優(yōu)越性,將所提出的模型與AE和文獻(xiàn)[26]中提出的基于卷積神經(jīng)網(wǎng)絡(luò)的HI提取模型進(jìn)行對比。AE內(nèi)部由6層隱藏層構(gòu)成,隱藏神經(jīng)元的個(gè)數(shù)分別為[320,40,1,40,320,2 560],其余的超參數(shù)設(shè)置和表2一致?;诰矸e神經(jīng)網(wǎng)絡(luò)的HI提取模型的詳細(xì)結(jié)構(gòu)見文獻(xiàn)[25]。最終,實(shí)驗(yàn)結(jié)果如圖8和表4所示。圖8中,圖8 (a)和圖8 (b)表示MSCAE在Bearing1_1和Bearing1_3上的HI提取結(jié)果,圖8 (c)和圖8 (d)表示使用卷積神經(jīng)網(wǎng)絡(luò)的方法在Bearing1_1和Bearing1_3上的HI提取結(jié)果,圖8 (e)和圖8(f)表示AE在Bearing1_1和Bearing1_3上的HI提取結(jié)果。由圖9(c) 和圖9 (d)可以發(fā)現(xiàn),基于卷積神經(jīng)網(wǎng)絡(luò)的方法提取的HI波動比較明顯,并且在退化后期十分容易出現(xiàn)HI值接近1的情況,會對RUL的預(yù)測造成影響。由圖8(e)和圖8 (f)可以發(fā)現(xiàn)AE不具備有效的HI提取能力,提取結(jié)果波動非常明顯,并且不能反映真實(shí)的退化趨勢。表4可以進(jìn)一步說明本文提出的MSCAE提取的HI具有最好的性能。
圖8 多尺度卷積自編碼器與其他2種方法的HI提取結(jié)果圖Fig.8 Comparison of HI extraction results between the multi-scale convolutional autoencoder and the other two methods
表4 卷積神經(jīng)網(wǎng)絡(luò)和AE的單調(diào)性和相關(guān)性指標(biāo)Table 4 Monotonicity and correlation indicators of convolutional neural networks and AE
本文中使用GRU模型對提取的HI進(jìn)行RUL預(yù)測,設(shè)置=100,即假設(shè)最后100個(gè)HI點(diǎn)為未知量,使用GRU對未知點(diǎn)進(jìn)行預(yù)測,當(dāng)預(yù)測值超過閾值1時(shí),認(rèn)定軸承失效,該時(shí)刻即為軸承的RUL。GRU模型的超參數(shù)設(shè)置見表5所示。為了描述RUL的預(yù)測準(zhǔn)確率,使用平均絕對誤差(mean absolute error,MAE)來進(jìn)行評價(jià),MAE的具體表達(dá)式為
表5 GRU神經(jīng)網(wǎng)絡(luò)的超參數(shù)Table 5 Hyperparameter settings of GRU neural network
Bearing1_1和Bearing1_3的預(yù)測結(jié)果如圖9所示。由圖9可以看出,GRU模型能夠很好地預(yù)測軸承的未來趨勢,藍(lán)色的預(yù)測值與黑色的HI真實(shí)值具有很強(qiáng)的擬合程度,說明本文提出的MSCAE模型所提取的HI能夠很好的解決軸承的RUL預(yù)測問題。為了進(jìn)一步驗(yàn)證的大小對于RUL預(yù)測精度的影響,設(shè)置了=50、100、200三個(gè)不同的值進(jìn)行對比實(shí)驗(yàn),Bearing1_1和Bearing1_3的MAE結(jié)果如圖10所示。由圖10可以發(fā)現(xiàn),隨著未知點(diǎn)個(gè)數(shù)的增加,GRU預(yù)測的MAE逐漸增大,這是因?yàn)槲粗c(diǎn)的個(gè)數(shù)越多,退化信息越少,GRU模型需要預(yù)測軸承的長期退化趨勢,必然會導(dǎo)致誤差增加。并且由圖10可以看出,隨著未知點(diǎn)個(gè)數(shù)的減少,GRU預(yù)測的MAE減少幅度也在減少,這是因?yàn)樵谖粗c(diǎn)個(gè)數(shù)很少時(shí),GRU模型的預(yù)測RUL已經(jīng)接近真實(shí)的RUL,未知點(diǎn)個(gè)數(shù)的減少對于RUL預(yù)測精度提升的影響變低。綜合分析為200和50的預(yù)測情況,Bearing1_1和Bearing1_3的RUL預(yù)測結(jié)果都能保持很高的預(yù)測精度,這對于實(shí)際的軸承RUL預(yù)測提供了很好的借鑒。
圖9 Bearing1_1和Bearing1_3的RUL預(yù)測結(jié)果圖Fig.9 RUL prediction results of Bearing1_1 and Bearing1_3
圖10 未知點(diǎn)個(gè)數(shù)不同的MAE結(jié)果Fig.10 MAE results with different unknown points
提出了一種基于MSCAE的HI提取方法,并基于提取的HI,使用GRU神經(jīng)網(wǎng)絡(luò)進(jìn)行RUL預(yù)測。MSCAE能夠有效的利用振動數(shù)據(jù)的全局和局部信息,進(jìn)行更為有效的健康指標(biāo)提取。并且提取的HI在進(jìn)行RUL預(yù)測時(shí),不需要憑借專家的先驗(yàn)知識設(shè)置特定的閾值,直接將閾值設(shè)定為1。通過PHM2012挑戰(zhàn)賽數(shù)據(jù)對提出的模型有效性進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果說明,使用MSCAE提取的HI相比于單尺度卷積自編碼器,具有更好的單調(diào)性和相關(guān)性,并且HI的波動較小,不會出現(xiàn)提前接近閾值的現(xiàn)象。與AE和卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行比較,進(jìn)一步突顯MSCAE的優(yōu)越性。GRU神經(jīng)網(wǎng)絡(luò)的RUL預(yù)測實(shí)驗(yàn)證明,使用本文提取的HI進(jìn)行RUL預(yù)測具有很高預(yù)測精度。