談為智,馮 驍,邱 祺,丁婷婷
(1.合肥工業(yè)大學(xué) 管理學(xué)院,合肥 230009;2.江蘇省儀征中學(xué),江蘇 揚(yáng)州 211400)
高端裝備的意外故障往往會(huì)造成嚴(yán)重的經(jīng)濟(jì)損失,甚至危害人員的生命安全[1]。軸承作為機(jī)械裝備的關(guān)鍵部件之一,其能否正常運(yùn)轉(zhuǎn)對(duì)于高端裝備能否健康工作起到了至關(guān)重要的作用[2]。因此,預(yù)測(cè)軸承剩余使用壽命,并依據(jù)預(yù)測(cè)結(jié)果確定最佳維修時(shí)間,優(yōu)化維護(hù)計(jì)劃受到了工業(yè)界與學(xué)術(shù)界的廣泛關(guān)注。如何提高軸承剩余使用壽命的準(zhǔn)確性和魯棒性是一個(gè)值得思考的問(wèn)題。
目前應(yīng)用于剩余使用壽命預(yù)測(cè)的方法主要有以下2類:基于模型的方法和數(shù)據(jù)驅(qū)動(dòng)的方法[3]。基于模型的方法主要通過(guò)構(gòu)建一個(gè)數(shù)學(xué)模型來(lái)描述機(jī)械設(shè)備的退化過(guò)程,該方法能在一定程度上反映外部可測(cè)變量與內(nèi)部物理性質(zhì)之間的關(guān)系[4]。如謝宏遠(yuǎn)等[5]采用了基于粒子濾波和遺傳算法的氫燃料電池剩余使用壽命預(yù)測(cè)方法,能夠在實(shí)現(xiàn)長(zhǎng)期預(yù)測(cè)精確度的基礎(chǔ)上提高計(jì)算效率,并且得到了較為精確的預(yù)測(cè)結(jié)果。焦自權(quán)等[6]提出一種改進(jìn)粒子濾波算法的狀態(tài)跟蹤與剩余使用壽命預(yù)測(cè)估計(jì)方法。實(shí)驗(yàn)結(jié)果表明,該文提出的改進(jìn)算法具有計(jì)算效率性能優(yōu)良、狀態(tài)跟蹤擬合度好及預(yù)測(cè)精度高等特點(diǎn)。但是,在建立數(shù)學(xué)模型時(shí)需要大量關(guān)于特定物理系統(tǒng)的專家知識(shí),并且所建立的模型僅適用于特定工況條件下的工業(yè)部件[7]。實(shí)際工作過(guò)程中的工業(yè)部件工作環(huán)境往往十分復(fù)雜,不能采用簡(jiǎn)單的數(shù)學(xué)模型來(lái)預(yù)測(cè)剩余使用壽命。
伴隨著傳感器技術(shù)和物聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,豐富的歷史運(yùn)行數(shù)據(jù)可以被收集到。數(shù)據(jù)驅(qū)動(dòng)的方法得到了廣泛的應(yīng)用,并展示出很好的前景。數(shù)據(jù)驅(qū)動(dòng)方法通常分為統(tǒng)計(jì)學(xué)方法和機(jī)器學(xué)習(xí)方法。傳統(tǒng)的數(shù)據(jù)驅(qū)動(dòng)方法通常包括以下2步:特征提取和模型構(gòu)建[8]。在特征提取階段,目前提取的特征通常分為以下3類,包括時(shí)域特征、頻域特征和時(shí)頻域特征。例如Behzad等[9]選擇了一個(gè)新的頻域特征:高頻帶寬均方根,用于滾珠軸承剩余使用壽命估計(jì)。與應(yīng)用其他常用特征的結(jié)果相比,應(yīng)用新特征可以更準(zhǔn)確地估計(jì)軸承的剩余使用壽命。在模型構(gòu)建階段,人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、灰色預(yù)測(cè)方法和馬爾科夫模型等都是常用的剩余壽命預(yù)測(cè)模型。例如Elasha等[10]將回歸模型和多層人工神經(jīng)網(wǎng)絡(luò)模型相結(jié)合,以預(yù)測(cè)運(yùn)行中的風(fēng)力渦輪機(jī)齒輪箱的剩余使用壽命。所提出的方法通過(guò)案例研究得到了較好的評(píng)估結(jié)果。然而,相關(guān)特征的提取和選擇通常需要相關(guān)領(lǐng)域的專家知識(shí),因此模型的泛化能力存在一定的局限性。此外,傳統(tǒng)的機(jī)器學(xué)習(xí)模型不能自動(dòng)提取非線性特征,且維度詛咒也是一個(gè)值得注意的問(wèn)題。
深度學(xué)習(xí)方法能夠?qū)W習(xí)原始數(shù)據(jù)中的非線性深度特征,從而吸引了各行各業(yè)的廣泛關(guān)注,并在自然語(yǔ)言處理、圖像識(shí)別等領(lǐng)域取得了巨大成功。本文將主要介紹與研究相關(guān)的堆疊降噪自編碼器及卷積神經(jīng)網(wǎng)絡(luò)。堆疊自編碼器旨在通過(guò)恢復(fù)輸入過(guò)程變量數(shù)據(jù)來(lái)學(xué)習(xí)分層隱藏特征表示。此外,為了從損壞的數(shù)據(jù)中恢復(fù)原始輸入數(shù)據(jù),以增強(qiáng)模型魯棒性,Vincent等[11]已將降噪自編碼器(Denoising Autoencoder,DAE)用于特征提取。本文將多個(gè)降噪自編碼器的隱藏層堆疊到SDAE中,以便從軸承振動(dòng)數(shù)據(jù)中獲取深層特征表示。卷積神經(jīng)網(wǎng)絡(luò)中的卷積核能夠?qū)崿F(xiàn)局部權(quán)值共享,并逐層挖掘相鄰數(shù)據(jù)間的共性規(guī)律。例如,張繼冬等[12]將全卷積層神經(jīng)網(wǎng)絡(luò)用于軸承剩余壽命預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的先人工構(gòu)建性能退化指標(biāo)、再預(yù)測(cè)的方法相比,所提方法大幅提高了剩余壽命的預(yù)測(cè)精度。一維卷積神經(jīng)網(wǎng)絡(luò)(One-Dimensional Convolutional Neural Network,1DCNN)是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural Network,CNN)的一種變體,不同于接收矩陣輸入的標(biāo)準(zhǔn)CNN,1DCNN的輸入是一個(gè)向量。目前,1DCNN被廣泛應(yīng)用于處理變化的一維信號(hào)以獲得短期動(dòng)態(tài)特征,其還可以平滑輸入向量的波動(dòng)。但是,由于溫度、負(fù)載等外部環(huán)境的變換,軸承轉(zhuǎn)子等系統(tǒng)的退化模式往往不是單一的,采用單一大小的卷積核容易遺漏局部重要特征。因此,通過(guò)利用大小不同的卷積核,可以使提取的特征更加全面有效。例如孫鑫等[13]提出了一種基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的軸承剩余壽命預(yù)測(cè)方法。實(shí)驗(yàn)結(jié)果顯示,該方法具有更高的魯棒性與穩(wěn)定性。為此,本文提出了一種基于SDAE和MS1DCNN的剩余使用壽命預(yù)測(cè)模型。首先,SDAE用于從添加了一些噪聲的過(guò)程數(shù)據(jù)中分層學(xué)習(xí)深度的降噪特征。之后,MS1DCNN用于捕獲不同退化模式對(duì)于軸承剩余使用壽命的影響。為了驗(yàn)證提出模型的優(yōu)越性,本文將提出的方法應(yīng)用于PHM2012挑戰(zhàn)賽的軸承剩余使用壽命預(yù)測(cè)任務(wù)中,并取得了良好的預(yù)測(cè)效果。
在實(shí)際工業(yè)系統(tǒng)的數(shù)據(jù)采集和傳輸過(guò)程中,由于工業(yè)設(shè)備內(nèi)部老化、外部環(huán)境干擾等各種原因,導(dǎo)致收集到的軸承振動(dòng)數(shù)據(jù)中往往存在大量噪聲。為了增強(qiáng)自編碼器模型的魯棒性,在輸入模型訓(xùn)練前需要先向原始輸入數(shù)據(jù)中加入噪聲。其結(jié)構(gòu)圖如圖1所示。
圖1 降噪自編碼器結(jié)構(gòu)圖
式中:ht為學(xué)習(xí)到的隱藏層特征;sigmoid為激活函數(shù);We,be分別為權(quán)值矩陣和偏置向量。解碼階段用于產(chǎn)生和原始輸入維度相同的原始數(shù)據(jù)表示,其計(jì)算過(guò)程如下
堆疊自編碼網(wǎng)絡(luò)的核心思想是通過(guò)訓(xùn)練每一層編碼器抽象出更為穩(wěn)定的特征表達(dá)。在結(jié)構(gòu)上,典型的堆疊自編碼器(Stacked Denoising Autoencoder,SAE)由多個(gè)無(wú)監(jiān)督自編碼器和反向傳播神經(jīng)網(wǎng)絡(luò)監(jiān)督層組成。其結(jié)構(gòu)圖如圖2所示。
由圖2可知,第1個(gè)自編碼器的隱藏層特征,將作為第2個(gè)自編碼器的輸入特征,并借此獲得更深層次的特征表示以提升模型的穩(wěn)定性。當(dāng)然,第2個(gè)自編碼器的隱藏層特征或許還是不能夠很好地反映原始數(shù)據(jù)的特性,可以將其作為第3個(gè)自編碼器的輸入去獲得更高層次的隱層特征。
圖2 堆疊自編碼器結(jié)構(gòu)圖
1.3.1 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)是利用卷積運(yùn)算來(lái)捕獲動(dòng)態(tài)特征的前饋神經(jīng)網(wǎng)絡(luò)。如圖3所示,傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)通常由卷積層、池化層和全連接層3部分組成。
圖3 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
在卷積層中,卷積核與輸入矩陣進(jìn)行卷積操作,然后利用激活函數(shù)得到卷積層的輸出矩陣,其計(jì)算公式如下
式中:?代表卷積運(yùn)算,能夠從振動(dòng)數(shù)據(jù)中提取有用的信息;Ws和bs分別為卷積核和偏置;fc為非線性激活函數(shù)。
池化層的主要操作是對(duì)卷積層的輸出矩陣進(jìn)行降維處理,以去除冗余特征的同時(shí)增加網(wǎng)絡(luò)的收斂速度。常用的池化操作有最大池化及平均池化等。
1.3.2 一維卷積神經(jīng)網(wǎng)絡(luò)
不同于接受矩陣形式信號(hào)輸入的傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò),一維卷積神經(jīng)網(wǎng)絡(luò)接受的輸入為一個(gè)向量,輸出也為一個(gè)向量,其結(jié)構(gòu)圖如圖4所示。因而,在處理振動(dòng)信號(hào)這一類一維時(shí)序數(shù)據(jù)時(shí),一維卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用更為廣泛。
圖4 一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
1.3.3 多尺度卷積神經(jīng)網(wǎng)絡(luò)
傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)往往采用單一大小的卷積核來(lái)提取隱藏在原始信號(hào)中的特征。然而,由于原始信號(hào)的數(shù)據(jù)量較大,使用單一大小的卷積核會(huì)導(dǎo)致網(wǎng)絡(luò)在自適應(yīng)的提取特征時(shí)遺漏局部重要特征,難以表征不同振動(dòng)模式對(duì)于軸承剩余使用壽命的影響。
考慮到實(shí)際工況環(huán)境中常常會(huì)有噪聲干擾,并且軸承工作的外部環(huán)境常常處于變化之中,本文提出了一種結(jié)合堆疊降噪自編碼器(SDAE)和多尺度一維卷積神經(jīng)網(wǎng)絡(luò)(MS1DCNN)的剩余壽命預(yù)測(cè)模型,結(jié)構(gòu)圖如圖5所示。首先進(jìn)行軸承振動(dòng)數(shù)據(jù)收集與預(yù)處理,之后將處理后歸一化的數(shù)據(jù)輸入到SDAE網(wǎng)絡(luò)中進(jìn)行數(shù)據(jù)去噪,接著通過(guò)MS1DCNN來(lái)獲取不同退化模式對(duì)于軸承剩余使用壽命的影響,以提高模型在不同工況環(huán)境下的泛化能力。最后將MS1DCNN輸出的特征使用全連接神經(jīng)網(wǎng)絡(luò)進(jìn)行回歸預(yù)測(cè)。
圖5 SDAE-MS1DCNN結(jié)構(gòu)圖
由于SDAE能從損壞的數(shù)據(jù)中學(xué)習(xí)隱藏的特征表示,所以可以在一定程度上消除數(shù)據(jù)噪聲的干擾。如圖5所示,經(jīng)過(guò)預(yù)處理的軸承振動(dòng)數(shù)據(jù)在輸入SDAE網(wǎng)絡(luò)之前需要向其中加入噪聲,加入噪聲后的振動(dòng)數(shù)據(jù)便可以輸入到網(wǎng)絡(luò)之中進(jìn)行編碼操作,以獲得第一層隱藏層的特征表示。隱藏層的特征在進(jìn)行解碼的操作還原出原始信號(hào)。這樣第一個(gè)DAE便構(gòu)造完成了。然而,由于第一層隱藏層提取到的特征往往抽象程度不高,不能夠很好地提取出原始信號(hào)具有代表性的特征。因此,需要將第一層隱藏層的信號(hào)輸入到下一個(gè)自編碼器的網(wǎng)絡(luò)中。值得注意的是,在第一層隱藏特征輸入到下一層的自編碼器網(wǎng)絡(luò)前,仍需對(duì)該特征加入噪聲,以增加網(wǎng)絡(luò)的魯棒性。
由于軸承快速退化與緩慢退化時(shí)所收集到的信號(hào)振幅與頻率往往是存在差異的,使用相同大小的卷積核就有可能會(huì)遺漏局部重要特征,導(dǎo)致模型準(zhǔn)確度低,泛化性能差。因此,本文基于CNN的基本原理,提出了MS1DCNN模型。如圖5所示,在經(jīng)過(guò)SDAE處理之后的最后一層隱藏層特征信號(hào)將利用m種不同尺寸的卷積核進(jìn)行卷積操作,由于不同大小的卷積核具備不同的感受野,不同特征感受野層能夠充分提取不同頻段的振動(dòng)特征,實(shí)現(xiàn)提高模型預(yù)測(cè)精度。進(jìn)行了多次卷積池化操作后,將輸出特征輸入全連接層進(jìn)行最終的回歸預(yù)測(cè)。
本文中所使用的滾動(dòng)軸承全生命周期數(shù)據(jù)來(lái)自電氣和電子工程師協(xié)會(huì)(IEEE)2012年舉辦的PHM數(shù)據(jù)挑戰(zhàn)賽。其數(shù)據(jù)在試驗(yàn)平臺(tái)PRONOSTIA進(jìn)行收集。該平臺(tái)可用于評(píng)估軸承的故障診斷和預(yù)后方法,其可以在幾個(gè)小時(shí)內(nèi)加速軸承的退化過(guò)程。其實(shí)驗(yàn)裝置包括3個(gè)主要的子系統(tǒng)即旋轉(zhuǎn)子系統(tǒng)、退化生成子系統(tǒng)和數(shù)據(jù)采集子系統(tǒng)。
在實(shí)驗(yàn)中,獲得了軸承的溫度和振動(dòng)數(shù)據(jù),共進(jìn)行了在不同電機(jī)轉(zhuǎn)速和徑向力的3種工況下的實(shí)驗(yàn),工況1和工況2各進(jìn)行了7個(gè)軸承實(shí)驗(yàn),分別命名為Bearing1_1~Bearing1_7和Bearing2_1~Bearing2_7,工況3進(jìn)行了3個(gè)軸承的實(shí)驗(yàn),命名為Bearing3_1~Bearing3_3。每種工況選取1和2號(hào)軸承作為訓(xùn)練集,其他的作為測(cè)試集。表1列出了不同工作條件下的具體電機(jī)速度和徑向力。
表1 數(shù)據(jù)集工況信息
為了驗(yàn)證預(yù)測(cè)精度,采用均方根誤差(RMSE)直接替換為RMSE和平均絕對(duì)誤差(MAE)直接替換為MAE這兩個(gè)典型指標(biāo)來(lái)分析不同方法的建模性能。RMSE和MAE定義如下
式中:Ttesting為測(cè)試集樣本數(shù);代表剩余使用壽命真值的均值;yi和y^i為i時(shí)刻剩余使用壽命的真實(shí)值和預(yù)測(cè)值。
3.3.1 參數(shù)設(shè)置
在樣本數(shù)據(jù)的劃分上,本實(shí)驗(yàn)遵從PHM2012挑戰(zhàn)賽的樣本劃分規(guī)制,將軸承2-2作為訓(xùn)練集,軸承3-3作為測(cè)試集。劃分完訓(xùn)練樣本后,本小組將對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行設(shè)置,本小組采用的堆疊降噪自編碼器共有3層,其隱藏層的維度分別為:2 000、1 800、800。另外,實(shí)驗(yàn)中的多尺度卷積神經(jīng)網(wǎng)絡(luò)分別采用3×1,5×1和7×1的卷積核。在卷積神經(jīng)網(wǎng)絡(luò)后接一個(gè)全連接層輸出預(yù)測(cè)值。經(jīng)過(guò)多次實(shí)驗(yàn)和比較,最終確定的模型的2個(gè)卷積層的通道數(shù)分別為3和6,訓(xùn)練學(xué)習(xí)率為0.005,批量大小為30。
3.3.2 實(shí)驗(yàn)結(jié)果
為了驗(yàn)證SDAE-MS1DCNN的剩余使用壽命預(yù)測(cè)性能,不同的回歸預(yù)測(cè)方法在本數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)驗(yàn)證。具體來(lái)說(shuō),有支持向量回歸(Support Vector Regression,SVR)等傳統(tǒng)的機(jī)器學(xué)習(xí)方法,也有SAE、DAE、SDAE、1DCNN、MS1DCNN、SDAE-1DCNN等深度學(xué)習(xí)方法,具體的實(shí)驗(yàn)結(jié)果見(jiàn)表2。
表2 各模型預(yù)測(cè)效果表
由表2中數(shù)據(jù)可知,傳統(tǒng)機(jī)器學(xué)習(xí)方法SVR的預(yù)測(cè)結(jié)果表現(xiàn)最差,主要是由于SVR的淺層結(jié)構(gòu)難以提取數(shù)據(jù)中的動(dòng)態(tài)時(shí)間特征。SDAE的預(yù)測(cè)效果好于SAE與DAE,因?yàn)橐环矫鍿DAE能夠?qū)W習(xí)深層次的特征表示,另一方面SDAE能夠抵御噪聲對(duì)于預(yù)測(cè)結(jié)果的干擾。1DCNN及其變體的預(yù)測(cè)性能好于SVR和SAE,因?yàn)槠潢P(guān)注到了特征間動(dòng)態(tài)信息。SDAEMS1DCNN結(jié)合了SDAE和MS1DCNN的優(yōu)勢(shì),能夠在抵御噪聲干擾的同時(shí)捕獲全面的動(dòng)態(tài)特征。
為了進(jìn)一步探究模型抵抗噪聲的能力,本文向SDAE網(wǎng)絡(luò)中分別加入了0.1、0.2、0.3、0.4的噪聲系數(shù),其預(yù)測(cè)效果如圖6所示。
由圖6可知,隨著噪聲的增多,模型的誤差也在逐步增大,但是模型仍然具有較高的準(zhǔn)確度與魯棒性,因此可見(jiàn)所提網(wǎng)絡(luò)在處理實(shí)際工業(yè)環(huán)境中產(chǎn)生的噪聲數(shù)據(jù)時(shí),能夠保持較高的預(yù)測(cè)精度。
圖6 不同噪聲系數(shù)下模型預(yù)測(cè)效果
在SDAE-MS1DCNN模型中,尺度數(shù)是一個(gè)關(guān)鍵的超參數(shù),直接決定了多尺度學(xué)習(xí)的效果。單尺度學(xué)習(xí)模型不能適應(yīng)非平穩(wěn)的工況環(huán)境,但是當(dāng)尺度個(gè)數(shù)增加過(guò)多時(shí)可能導(dǎo)致過(guò)度擬合問(wèn)題,降低模型的泛化能力。為此,本文探究了尺度個(gè)數(shù)對(duì)于學(xué)習(xí)效果的影響。
如圖7所示,在最開(kāi)始時(shí),隨著尺度的增加,模型的預(yù)測(cè)效果不斷提升,由此可見(jiàn)MS1DCNN能夠?qū)W習(xí)到更加全面的軸承退化特征。但是當(dāng)尺度數(shù)增加到4時(shí)模型預(yù)測(cè)效果開(kāi)始下降,這可能是由于尺度數(shù)過(guò)多時(shí)模型學(xué)習(xí)了訓(xùn)練樣本所獨(dú)有的特征,從而導(dǎo)致過(guò)擬合。
圖7 不同尺度下模型預(yù)測(cè)效果
本文提出了一種新的剩余使用壽命預(yù)測(cè)方法,不同于以往的剩余壽命預(yù)測(cè)方法,該方法的優(yōu)點(diǎn)主要如下:首先,通過(guò)引入堆疊降噪自編碼器,充分考慮實(shí)際工業(yè)過(guò)程中的數(shù)據(jù)噪聲對(duì)于剩余使用壽命預(yù)測(cè)結(jié)果的影響,增強(qiáng)模型的穩(wěn)定性與可泛化能力。其次,通過(guò)利用多尺度一維卷積神經(jīng)網(wǎng)絡(luò),使模型能夠在面對(duì)變化的工況環(huán)境下,仍然擁有較高的預(yù)測(cè)精度。此外,所提模型在PHM2012挑戰(zhàn)賽的數(shù)據(jù)集上得到了實(shí)驗(yàn)驗(yàn)證,實(shí)驗(yàn)結(jié)果表明,該方法可以有效地抑制噪聲,并且實(shí)驗(yàn)結(jié)果的準(zhǔn)確性也明顯優(yōu)于其他對(duì)照模型。在未來(lái),研究者將進(jìn)一步探索如何以更優(yōu)的方式融合從不同尺度得到的深度特征,以進(jìn)一步提高預(yù)測(cè)精度。