周明珠,張藝寶,吳 雙,孔麗軍,王梓齊
(1.內(nèi)蒙古霍煤鴻駿鋁電有限責(zé)任公司,內(nèi)蒙古 通遼 029200;2.湖南中融匯智信息科技股份有限公司,湖南 長沙 410221;3.浙江大學(xué) 控制科學(xué)與工程學(xué)院,浙江 杭州 310027;4.浙江大學(xué) 湖州研究院,浙江 湖州 313002)
隨著煤化工產(chǎn)業(yè)的大規(guī)模發(fā)展,在環(huán)保技術(shù)方面的升級改造迫在眉睫。凈化分廠的持續(xù)高效運行取決于設(shè)備的可靠性和智能化程度。針對設(shè)備的各類隱性及顯性故障,需要開發(fā)智能監(jiān)測預(yù)警及運維系統(tǒng)以指引設(shè)備的預(yù)防性維修。
滾動軸承作為旋轉(zhuǎn)機械中的關(guān)鍵基礎(chǔ)零件,其在凈化分廠中得到了廣泛的應(yīng)用。滾動軸承將運轉(zhuǎn)的軸與軸座之間的滑動摩擦轉(zhuǎn)變成滾動摩擦以減小摩擦損失,軸承的健康狀況將直接影響旋轉(zhuǎn)機械的安全運行。為了提高設(shè)備的可靠性,對導(dǎo)致設(shè)備失效的故障隱患進行預(yù)測是至關(guān)重要的。故障預(yù)測與健康管理(prognostics and health management,PHM)是實現(xiàn)這一目標(biāo)的有效技術(shù),而RUL預(yù)測作為PHM的核心技術(shù),是后續(xù)進行健康管理決策的基礎(chǔ)。
RUL預(yù)測方法主要分為兩類,即基于模型的方法和基于數(shù)據(jù)驅(qū)動的方法[1,2]。1)基于模型的方法是通過分析物理失效機制,建立描述機器退化過程的數(shù)學(xué)模型。但實際案例中,通常難以將其用于準(zhǔn)確描述設(shè)備的物理失效機制,從而影響了退化模型RUL預(yù)測的準(zhǔn)確性。2)數(shù)據(jù)驅(qū)動方法的預(yù)測準(zhǔn)確性依賴于訓(xùn)練數(shù)據(jù)的數(shù)量和質(zhì)量,受模型結(jié)構(gòu)的限制較少。其中,深度學(xué)習(xí)方法由于具備處理復(fù)雜非線性數(shù)據(jù)的能力,得到了越來越廣泛的應(yīng)用[3]。
盡管基于深度學(xué)習(xí)的RUL預(yù)測研究取得了很大進展,但現(xiàn)有的大部分方法僅關(guān)注了RUL的點估計問題。在復(fù)雜的運行工況下,RUL預(yù)測可能會受到傳感器噪聲、建模不確定性及未來環(huán)境和工況的隨機變化等因素的影響[4],這些因素帶來的不確定性將大幅度降低點預(yù)測的可信度。因此,有必要對RUL預(yù)測中的不確定性量化問題展開深入研究[5]。
解決不確定性量化問題的傳統(tǒng)方法是采用貝葉斯方法,即結(jié)合先驗信息和新的觀測內(nèi)容進行后驗推理。例如,將卡爾曼濾波器、粒子濾波器應(yīng)用于RUL預(yù)測[6]。于震梁等人[7]采用支持向量機和非線性卡爾曼濾波相結(jié)合的方法預(yù)測了機械零件的RUL,得到了一定置信度的置信區(qū)間;但是狀態(tài)更新方程的建立需要假設(shè)狀態(tài)量與噪聲項相互獨立,在實際情況中往往難以滿足該條件。焦自權(quán)等人[8]采用改進的粒子濾波方法,預(yù)測了鋰離子電池的RUL,通過在狀態(tài)方程中引入噪聲項,進而考慮不確定性;但是由于方程中噪聲項跟隨狀態(tài)量,無法直接考慮最終預(yù)測值中的不確定性。
傳統(tǒng)的貝葉斯方法適用于較簡單的系統(tǒng),隨著工業(yè)系統(tǒng)的結(jié)構(gòu)日漸復(fù)雜,多工況、故障耦合等情況在實際運行過程中頻繁發(fā)生,傳統(tǒng)方法中構(gòu)造的健康指標(biāo)無法充分描述系統(tǒng)的特征信息。
近年來,由于深度學(xué)習(xí)方法具有強大的非線性擬合能力,將傳統(tǒng)貝葉斯方法融入深度學(xué)習(xí)的BNN[9]這一研究方向受到了廣泛關(guān)注。PENG Wei-wen等人[10]提出了BNN模型,在設(shè)計模型時將網(wǎng)絡(luò)中的參數(shù)從數(shù)值轉(zhuǎn)變?yōu)閰?shù)分布,從而進行了不確定性量化;但是計算過程中其采用變分推斷進行簡化,導(dǎo)致模型的準(zhǔn)確度較低。胡城豪等人[11]通過引入高斯分布作為先驗信息,使模型的準(zhǔn)確性得以提升;但是其仍未解決計算量大的問題。較高的計算成本是限制BNN實際應(yīng)用的主要因素。
另一類常用的不確定性量化方法是Bootstrap集成方法[12]。HUANG Cheng-geng等人[13]采用Bootstrap與深度卷積網(wǎng)絡(luò)相結(jié)合的方法,對RUL預(yù)測中的不確定性進行了捕捉;但是該方法只考慮了數(shù)據(jù)不確定性,未對RUL預(yù)測過程中的模型不確定性進行分析。
筆者提出一種考慮不確定性量化的RUL區(qū)間預(yù)測方法,采用CNN構(gòu)造預(yù)測模型,在模型中同時考慮數(shù)據(jù)不確定性與模型不確定性的量化;最后,采用軸承退化公開數(shù)據(jù)集進行實驗,以證明該方法的有效性及優(yōu)越性。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)最早應(yīng)用于圖像處理領(lǐng)域,具有局部感知、權(quán)重共享和池化3個特征。CNN在許多領(lǐng)域得到了應(yīng)用,并獲得了優(yōu)越的性能,包括計算機視覺、自然語言處理、語音識別等。CNN是將卷積核與原始輸入數(shù)據(jù)運算后提取特征,經(jīng)過池化操作壓縮數(shù)據(jù)和參數(shù)量、減小過擬合,從而通過交替堆疊來學(xué)習(xí)抽象的特征表示。
模型的輸入為二維數(shù)據(jù),其中,一維是特征參數(shù),另一維是每個特征的時間序列。預(yù)測問題中的特征維信息來自軸承振動信號的時域特征,由于數(shù)據(jù)樣本中空間相鄰特征的關(guān)系不緊密,因此,筆者采用一維卷積操作[14]。
一維卷積操作的計算公式如下:
ci=f(ω·xi:i+FL-1+b)
(1)
式中:f為非線性激活函數(shù);b為偏置項;ω為卷積核權(quán)重矩陣;xi:i+FL-1為經(jīng)過長度為FL的滑窗得到的數(shù)據(jù);ci為卷積核與某個滑窗內(nèi)的序列數(shù)據(jù)計算后得到的特征。
筆者將卷積核應(yīng)用于全數(shù)據(jù)序列的各個滑窗數(shù)據(jù)后,計算得到整體特征圖c。具體計算公式如下:
c=[c1,c2,…,cn-Fc+1]
(2)
式中:Fc為卷積核大小;n為全數(shù)據(jù)序列經(jīng)滑窗后的總數(shù)。
通常情況下,Fc越大,獲得的結(jié)果越好,但是計算負擔(dān)也更大。實驗中,筆者折中選取Fc=10。
在CNN中,池化層通常緊隨卷積操作之后,被用于提取每個特征圖中重要的局部信息,并可顯著降低特征維數(shù),減少模型參數(shù)的數(shù)量。池化非常適合應(yīng)用于高維問題,例如圖像處理,但是這種操作在提高計算效率的同時過濾了部分有用信息。
實驗中,由于RUL預(yù)測問題中原始特征的維度相對較低,CNN中將不采用池化層[15]。
實際應(yīng)用中,由于數(shù)據(jù)質(zhì)量參差、模型存在預(yù)測誤差等原因,RUL預(yù)測問題往往存在一些不確定性,可將其劃分為兩類,即數(shù)據(jù)不確定性與模型不確定性。
數(shù)據(jù)不確定性又叫任意不確定性[16],它產(chǎn)生于觀測中固有的噪聲。數(shù)據(jù)不確定性來源于噪聲污染、測量誤差和傳感器技術(shù)限制等因素。這些因素一般是不可控的,所以數(shù)據(jù)不確定性無法隨著數(shù)據(jù)量的增加、訓(xùn)練次數(shù)的提高而減小或消除[17]。
模型不確定性又叫認(rèn)知不確定性,主要來源于模型結(jié)構(gòu)和模型參數(shù)的不確定,本質(zhì)是缺乏對模型的認(rèn)識。不同于數(shù)據(jù)不確定性,其可以通過增加數(shù)據(jù)量和訓(xùn)練次數(shù)而使模型不確定性減小。
在確保達到一定RUL預(yù)測準(zhǔn)確率的同時,為了對預(yù)測過程中捕獲的數(shù)據(jù)不確定性與模型不確定性進行量化,實驗中采用區(qū)間形式輸出預(yù)測結(jié)果。筆者選取以下3個指標(biāo)對預(yù)測結(jié)果進行性能評估:
1)采用RMSE評價點預(yù)測的準(zhǔn)確率。RMSE的計算公式如下:
(3)
式中:RULpred為RUL預(yù)測值;RULtrue為RUL真實值;i為預(yù)測點;N為預(yù)測點總數(shù)。
2)采用PICP評價區(qū)間預(yù)測的結(jié)果。PICP表示真實值落在預(yù)測區(qū)間上下界內(nèi)的比率,計算公式如下:
(4)
式中:Ui為區(qū)間上界;Li為區(qū)間下界;當(dāng)yi∈[Li,Ui]時Ci=1,否則Ci=0。
3)采用平均預(yù)測區(qū)間寬度(mean prediction interval width,MPIW)評價區(qū)間預(yù)測的結(jié)果。MPIW用于衡量預(yù)測區(qū)間的狹窄程度,較窄的區(qū)間相對較寬的區(qū)間具有更高的價值,計算公式如下:
(5)
深度神經(jīng)網(wǎng)絡(luò)方法的特點是:根據(jù)網(wǎng)絡(luò)結(jié)構(gòu),通過參數(shù)的學(xué)習(xí)與優(yōu)化,逼近復(fù)雜的非線性函數(shù),可以自適應(yīng)地從原始輸入信號中捕獲信息。
模型的輸入為包含時間維度和特征維度的二維數(shù)據(jù),其中,特征是從軸承原始振動信號中提取的趨勢性時域特征。筆者提出的RUL預(yù)測基礎(chǔ)模型是一個5層的一維卷積網(wǎng)絡(luò)。
模型的具體結(jié)構(gòu)如表1所示。
表1 卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
CNN預(yù)測模型通過堆疊4個相同的卷積層進行特征提取,其采用全零填充方法保持特征維度不變,可得到多個與輸入相同維度的特征圖。該模型采用一個卷積核為3×1的網(wǎng)絡(luò)層組合多個特征圖,可獲得原始特征的高級表示;之后,二維特征圖被展平,并與全連接層連接,展平過程采用dropout方法以緩解過擬合;最后,在網(wǎng)絡(luò)末端放置高斯層,并采用2個輸出神經(jīng)元,分別用于輸出預(yù)測值及相應(yīng)的不確定性。
數(shù)據(jù)不確定性的量化是通過在網(wǎng)絡(luò)輸出層放置RUL的概率分布來實現(xiàn)的。筆者設(shè)RUL服從正態(tài)分布,設(shè)置網(wǎng)絡(luò)的輸出參數(shù)為(μ,σ),分別表示RUL的點預(yù)測值與不確定性大小。不同于點預(yù)測中僅輸出最佳的預(yù)測值y*,基于CNN的區(qū)間預(yù)測方法的輸出參數(shù)(μ,σ)是當(dāng)RUL=y*時概率密度的最大值。
模型的訓(xùn)練過程是通過最大化似然函數(shù)調(diào)整網(wǎng)絡(luò)權(quán)重和偏置項,從而獲得最優(yōu)輸出。模型中RUL的概率分布表示如下:
(6)
訓(xùn)練目標(biāo)是最大化上述概率分布函數(shù)。
在模型訓(xùn)練的初始階段,由于參數(shù)離最優(yōu)值較遠,似然函數(shù)的變化相對較小,導(dǎo)致整體訓(xùn)練速度較慢。因此,筆者在實驗中采用對數(shù)似然函數(shù)進行訓(xùn)練,使參數(shù)的變化率在最優(yōu)值附近較小,遠離最優(yōu)值時較大,從而加快模型的收斂速度;同時,對數(shù)運算能夠?qū)⒎植贾械某朔ㄟ\算轉(zhuǎn)換為加法運算,有利于反向傳播過程的求導(dǎo)操作。
在執(zhí)行上述優(yōu)化操作后,模型的損失函數(shù)如下:
(7)
LI Gao-yang等人[4]發(fā)現(xiàn),模型不確定性可以采用模型方差表示;HU Chao等人[18]發(fā)現(xiàn),采用更多數(shù)據(jù)訓(xùn)練基礎(chǔ)學(xué)習(xí)器有助于減少預(yù)測偏差,而采用集成方法則有助于減少模型方差,即減小模型不確定性。
根據(jù)以上結(jié)論,基于CNN的區(qū)間預(yù)測方法,在整個數(shù)據(jù)集上采用均勻加權(quán)混合對模型進行集成,預(yù)測值和方差分別如下:
(8)
(9)
式中:M為集成模型的個數(shù),實驗中取M=10。
為了驗證基于CNN的區(qū)間預(yù)測方法的一般性與有效性,筆者采用IEEE PHM 2012挑戰(zhàn)賽提供的軸承加速壽命實驗數(shù)據(jù)進行驗證分析。
實驗數(shù)據(jù)來自PRONOSTIA實驗臺,該試驗臺如圖1所示。
圖1 軸承加速退化PRONOSTIA實驗臺
軸承箱上裝有2個加速度計,分別測量垂直和水平方向的振動。數(shù)據(jù)采樣間隔為10 s,采樣率為25.6 kHz,采樣持續(xù)時間為0.1 s,即每次采樣2 560個數(shù)據(jù)。
實驗數(shù)據(jù)涉及3種不同的工況,且已完成訓(xùn)練集與測試集的劃分。
PHM 2012軸承退化數(shù)據(jù)集如表2所示。
表2 PHM 2012軸承退化數(shù)據(jù)集
在數(shù)據(jù)集中,傳感器采集到的原始振動信號趨勢性不強、特征不明顯,且含有大量噪聲,直接采用原始數(shù)據(jù)進行RUL預(yù)測的難度較大。因此,筆者對單個采樣周期內(nèi)的數(shù)據(jù)點進行時域計算,提取原始振動信號的7個時域特征作為RUL預(yù)測模型的輸入。
筆者采用的時域特征分別為:裕度指標(biāo)、峰峰值、均方根值、偏度、峰值因子、峭度指標(biāo)和波形因子。相比于原始振動信號,提取后的時域特征呈現(xiàn)出更明顯的變化趨勢。
首先,筆者對原始振動數(shù)據(jù)進行了預(yù)處理,提取相應(yīng)的時域特征,然后將其輸入CNN模型;其次,CNN模型的高斯輸出層將輸出RUL的點預(yù)測值μ和表示不確定性的參數(shù)σ2,實現(xiàn)RUL的點預(yù)測和數(shù)據(jù)不確定性的量化目的;最后,筆者采用集成方法進行了M次訓(xùn)練,得到M個CNN預(yù)測模型,均勻加權(quán)后得到了最終的預(yù)測結(jié)果,實現(xiàn)了模型不確定性的量化目的。
算法的整體流程如圖2所示。
圖2 算法流程框架圖
數(shù)據(jù)預(yù)處理過程中,筆者對振動信號的時域指標(biāo)進行最大最小歸一化操作,計算公式如下:
(8)
式中:xmin為特征的最小值;xmax為特征的最大值。
在PHM2012數(shù)據(jù)集上,筆者對基于CNN的區(qū)間預(yù)測方法進行實驗。采用表2中工況1的訓(xùn)練集和測試集進行實驗,選擇x軸振動數(shù)據(jù),并對其進行研究。
工況1中,軸承的轉(zhuǎn)速恒定為1 800 r/min,通過徑向施加4 000 N的載荷加速軸承損壞;當(dāng)加速度計幅值超過20 g時認(rèn)為軸承失效,停止采集數(shù)據(jù)。
在測試集上,僅考慮數(shù)據(jù)不確定性量化的預(yù)測結(jié)果如圖3所示。
圖3 僅考慮數(shù)據(jù)不確定性量化的預(yù)測結(jié)果
圖3中:實線為RUL的點預(yù)測結(jié)果,虛線為真實RUL值,陰影區(qū)域描述了僅考慮數(shù)據(jù)不確定性量化的區(qū)間預(yù)測結(jié)果。
圖3所示實驗中,RUL點預(yù)測的RMSE值為0.209 6,區(qū)間預(yù)測的PICP值與MPIW值分別為0.533 2和0.213 4。
從圖3中可以觀察到:隨著軸承退化接近末期,數(shù)據(jù)不確定性呈現(xiàn)減小的趨勢。
在數(shù)據(jù)不確定性量化的基礎(chǔ)上,預(yù)測模型增加了對模型不確定性的量化??紤]兩種不確定性量化的預(yù)測結(jié)果如圖4所示。
圖4 考慮兩種不確定性量化的預(yù)測結(jié)果
如圖4所示:由于考慮了兩種不確定性的共同作用,RUL的預(yù)測區(qū)間相較于圖3寬度小幅增加,MPIW值為0.237 2。
圖4中區(qū)間預(yù)測的PICP值為0.620 2、相較于圖3有大幅提升,說明RUL的真實值落在預(yù)測區(qū)間內(nèi)的百分比更大,對不確定性的描述更為準(zhǔn)確,對實際的維護策略更有指導(dǎo)意義。同時,圖4中的點預(yù)測結(jié)果也更為精確,RMSE值為0.199 7。
為進一步證明基于CNN的區(qū)間預(yù)測方法的優(yōu)越性,在模型結(jié)構(gòu)和參數(shù)相同的條件下,筆者將基于CNN的區(qū)間預(yù)測方法與貝葉斯不確定性量化方法得到的結(jié)論進行對比。
貝葉斯神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果如圖5所示。
圖5 貝葉斯神經(jīng)網(wǎng)絡(luò)結(jié)果
圖5中:模型的RMSE、PICP、MPIW值分別為0.206 7,0.378 5,0.225 0。由于貝葉斯方法在不確定性量化過程中僅考慮了模型不確定性因素,盡管MPIW值小幅降低,但是其PICP值遠小于基于CNN的區(qū)間預(yù)測方法的值。
上述結(jié)果說明:貝葉斯方法得到的預(yù)測區(qū)間范圍對實際維護策略的指導(dǎo)意義相對較弱,點預(yù)測的準(zhǔn)確率也相對較低。
不同區(qū)間預(yù)測方法結(jié)果匯總?cè)绫?所示。
表3 不同方法結(jié)果匯總
如表3所示:基于CNN的區(qū)間預(yù)測方法在保證點預(yù)測效果的同時,能夠準(zhǔn)確描述軸承退化過程中的不確定性,相比常規(guī)的不確定性量化方法有著更優(yōu)越的性能。
筆者基于CNN模型,提出了一種量化RUL預(yù)測不確定性的區(qū)間預(yù)測方法,并采用PHM2012軸承退化公開數(shù)據(jù)集證明了該方法的有效性。
研究結(jié)果如下:
1)CNN可以充分提取軸承振動數(shù)據(jù)中的退化信息,為RUL預(yù)測提供了良好的基礎(chǔ),在輸出層放置正態(tài)分布,可以在實現(xiàn)不確定性描述的同時,保證點預(yù)測的精度;
2)通過構(gòu)建新型的損失函數(shù),并采用集成方法,能夠有效融合RUL預(yù)測過程中的數(shù)據(jù)不確定性和模型不確定性,可以得到良好的區(qū)間預(yù)測結(jié)果,更符合實際物理含義;
3)與現(xiàn)有的不確定性量化方法相比,基于CNN的區(qū)間預(yù)測方法的區(qū)間預(yù)測和點預(yù)測能力均更強,對于實際工程應(yīng)用的指導(dǎo)意義更顯著。
在下一階段的工作中,筆者將進一步提升不確定性量化的準(zhǔn)確程度,深入優(yōu)化算法的結(jié)構(gòu)和訓(xùn)練過程,以節(jié)約計算資源。