李子涵,張營(yíng),,左洪福
(1.南京林業(yè)大學(xué)汽車與交通工程學(xué)院,江蘇南京 210037;2.南京航空航天大學(xué)民航學(xué)院,江蘇南京 211106)
軸承在伺服電機(jī)中起到了至關(guān)重要的作用,軸承故障是伺服電機(jī)故障的主要原因之一。軸承本身就是易損部件,尤其在經(jīng)過長(zhǎng)期高強(qiáng)度的運(yùn)行之后很容易發(fā)生故障,進(jìn)而影響伺服電機(jī)的性能[1]。因此,滾動(dòng)軸承的早期故障診斷和壽命預(yù)測(cè)對(duì)伺服電機(jī)的預(yù)測(cè)維護(hù)和工業(yè)安全運(yùn)行具有重要意義[2-5]。
現(xiàn)有的故障預(yù)測(cè)方法可分為三大類:物理模型預(yù)測(cè)法、數(shù)據(jù)驅(qū)動(dòng)模型預(yù)測(cè)法以及物理模型數(shù)據(jù)驅(qū)動(dòng)模型混合預(yù)測(cè)法[6]。其中數(shù)據(jù)驅(qū)動(dòng)方法在機(jī)械設(shè)備的壽命預(yù)測(cè)中應(yīng)用較為廣泛;WANG等[7]提出了基于PCA和多傳感器物聯(lián)網(wǎng)的滾動(dòng)軸承狀態(tài)健康監(jiān)測(cè)與壽命預(yù)測(cè)研究,并利用IMS滾動(dòng)軸承試驗(yàn)數(shù)據(jù)驗(yàn)證其有效性。馬云飛等[8]通過改進(jìn)小波包頻帶稀疏編碼對(duì)滾動(dòng)軸承進(jìn)行壽命預(yù)測(cè)。王奉濤等[9]基于LSTM網(wǎng)絡(luò)對(duì)滾動(dòng)軸承進(jìn)行了壽命預(yù)測(cè)分析,長(zhǎng)短期記憶網(wǎng)絡(luò)通過改變隱藏層結(jié)構(gòu)可有效解決RNN中的梯度消失與梯度爆炸問題[10]。張成龍等[11]基于改進(jìn)后的PSO-SVR算法對(duì)滾動(dòng)軸承RUL(Remaining Useful Life)進(jìn)行預(yù)測(cè)。 ZHU等[12]利用隱馬爾可夫模型有效驗(yàn)證了轉(zhuǎn)移剩余使用壽命(RUL )預(yù)測(cè)的有效性。由于軸承的退化過程易受到外界因素干擾,因此,同一軸承模型的不同部件,即使在相同工況下,其退化過程也有可能具有不同的數(shù)據(jù)分布特征[13]。此外大部分特征指標(biāo)并不能清晰地表征軸承的運(yùn)行狀態(tài)且容易忽略原始特征之間的聯(lián)系,容易導(dǎo)致預(yù)測(cè)精度較差等問題[14]。
針對(duì)上述問題,本文作者提出一種基于皮爾遜相關(guān)系數(shù)(Pearson)和核主成分分析(KPCA)的LSTM滾動(dòng)軸承RUL預(yù)測(cè)方法,首先提取了軸承原始全壽命周期的時(shí)、頻域特征,在融合之前對(duì)所提取的時(shí)、頻域信息進(jìn)行皮爾遜相關(guān)性分析,在此基礎(chǔ)上采用KPCA 進(jìn)行特征融合、凝練特征,獲得信息互補(bǔ)精簡(jiǎn)的特征[15]。將KPCA提取的若干主成分及對(duì)應(yīng)的剩余壽命序列輸入到LSTM中對(duì)滾動(dòng)軸承進(jìn)行壽命預(yù)測(cè)。最后,通過IMS軸承數(shù)據(jù)集驗(yàn)證了該方法的有效性和準(zhǔn)確性。
時(shí)域信號(hào)具有直觀、易于理解的特點(diǎn),是機(jī)械故障診斷與預(yù)測(cè)的原始依據(jù)[15]。因此本文作者獲取了12個(gè)時(shí)域特征:方差、均方值、均方根值、偏度、峭度、峰峰值、波形指標(biāo)、裕度指標(biāo)、峰值指標(biāo)、脈沖指數(shù)、最大值、最小值。
頻域分析常被應(yīng)用于軸承振動(dòng)信號(hào)處理,軸承健康狀態(tài)的變化會(huì)在頻率上表現(xiàn)出來[15]。不同的頻域分析指標(biāo)反映軸承運(yùn)轉(zhuǎn)狀態(tài)的不同方面,因此,本文作者提取了4個(gè)頻域特征:頻率方差、頻率均方根、平均頻率、中心頻率。時(shí)、頻域信號(hào)提取如圖1所示。
圖1 時(shí)、頻域信號(hào)提取
皮爾遜相關(guān)系數(shù)最初是在統(tǒng)計(jì)學(xué)領(lǐng)域用來解讀兩個(gè)變量之間的相關(guān)性,被廣泛用于衡量?jī)蓚€(gè)變量之間的相關(guān)性[15]。皮爾遜相關(guān)系數(shù)計(jì)算公式如(1)所示:
(1)
其中:Corr(X,T)表特征X與特征T之間的相關(guān)性。因?yàn)樘崛×?6個(gè)不同類型軸承振動(dòng)信號(hào)特征,所以每個(gè)特征需要與其他15個(gè)特征計(jì)算一次相關(guān)性,記第一個(gè)特征與第二個(gè)特征相關(guān)性為r1.2,最終將會(huì)得到一個(gè) 16×16 的特征評(píng)價(jià)矩陣,如公式(2)所示:
(2)
主成分分析是一種從高維數(shù)據(jù)集中提取內(nèi)在結(jié)構(gòu)的強(qiáng)大技術(shù)(Bishop,1995)。然而,主成分分析是一種線性技術(shù),無法捕捉數(shù)據(jù)集中的非線性結(jié)構(gòu)。因此,人們提出了非線性泛化,特別是基于核理論的KPCA,用于計(jì)算非線性映射到高維特征空間的數(shù)據(jù)集的主成分。KPCA是一種非線性PCA方法。KPCA的實(shí)現(xiàn)過程為:首先使用非線性映射將所有樣本轉(zhuǎn)換到新空間;然后在新空間中進(jìn)行主成分分析,并在新空間中提取樣本的低維特征。
假設(shè)向量x1,x2,…,xN,訓(xùn)練樣本已通過非線性函數(shù)φ。因此,可以使用φ(x1),…,φ(xN)表示特征空間中的訓(xùn)練樣本。如果特征空間中的樣本具有零均值,則協(xié)方差矩陣為
(3)
引用Γ(φ)作為特征空間的生成矩陣。根據(jù)PCA方法,特征空間中最有用的特征向量應(yīng)該是Γ(φ)的大特征值對(duì)應(yīng)的特征向量。最有用的特征向量應(yīng)該是Γ(φ)的大λi對(duì)應(yīng)的解μi,ui=λiμi。利用核函數(shù)k(xi,xj)表示點(diǎn)積,即k(xi,xj)=φ(xi)Tφ(xj),可以得到如下特征值方程:
Kα=λα
(4)
K是所謂的克矩陣,它有一個(gè)元素Kij=k(xi,xj),α是特征向量?;谔卣髦凳?4)的主成分分析方法稱為KPCA。
針對(duì)梯度消失和RNN不能解決長(zhǎng)期依賴問題,選擇長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)。LSTM的特點(diǎn)是用內(nèi)存模塊替換普通的隱藏節(jié)點(diǎn),保證梯度在大量時(shí)間步長(zhǎng)后不會(huì)消失或爆炸,并能保持長(zhǎng)期信息。LSTM網(wǎng)絡(luò)由多個(gè)LSTM單元鏈接組成,典型的LSTM單元包括寫入記憶、從記憶中讀取、重置記憶三大主要功能。LSTM作為一種非線性模型,也可以作為網(wǎng)絡(luò)中的復(fù)雜非線性元素來構(gòu)建更大的深度神經(jīng)網(wǎng)絡(luò)。此外,在訓(xùn)練階段加入dropout以避免過擬合,提高計(jì)算效率。LSTM網(wǎng)絡(luò)的核心思想為門控邏輯,公式(5)—(9)表示了LSTM單元中3個(gè)控制門(遺忘門、記憶門、輸出門)的操作:
ft=σ(wf×[ht-1,xt]+bf)
(5)
it=σ(wi×[ht-1,xt]+bi)
(6)
(7)
Ot=σ(Wo×[ht-1,xt]+bO)
(8)
ht=Ot×tanh(Ct)
(9)
式(5)中:ft是遺忘門;wf是遺忘的權(quán)重項(xiàng);bf是偏差項(xiàng)。公式(6)—(7)為輸入門;公式(8)—(9)為輸出門。Ot由輸出門獲得,ht為隱藏層的輸出,在LSTM中采用sigmoid函數(shù)作為激勵(lì)函數(shù),具體函數(shù)公式如(10)所示:
(10)
LSTM的基本結(jié)構(gòu)單元如圖2所示。
圖2 LSTM基本結(jié)構(gòu)單元
為了基于實(shí)際信號(hào)預(yù)測(cè)伺服電機(jī)滾動(dòng)軸承的剩余壽命,提出一種基于皮爾遜相關(guān)系數(shù)(Pearson)和核主成分分析(KPCA)的LSTM伺服電機(jī)滾動(dòng)軸承壽命預(yù)測(cè)。圖3為Pearson-KPCA-LSTM預(yù)測(cè)模型流程。
圖3 Pearson-KPCA-LSTM預(yù)測(cè)模型流程
(1)提取原始軸承全壽命周期的時(shí)、頻域信號(hào)。
(2)利用移動(dòng)平均法(MA)對(duì)時(shí)、頻域信號(hào)進(jìn)行平滑處理并進(jìn)一步提取特征信息。
(3)將平滑后的特征信號(hào)利用皮爾遜相關(guān)系數(shù)遍歷選取高度相關(guān)的特征值。
(4)將高度相關(guān)的特征值利用核主成分分析(KPCA)降維并選取若干主成分,通過第一主成分選取對(duì)應(yīng)的剩余壽命序列作為測(cè)試集對(duì)滾動(dòng)軸承進(jìn)行RUL預(yù)測(cè),利用第一主成分作為L(zhǎng)STM模型的輸入并在LSTM中加入Dropout防止過擬合。
(5)二階多項(xiàng)式擬合。
此次實(shí)驗(yàn)數(shù)據(jù)來自美國(guó)國(guó)家科學(xué)基金會(huì)NSF I/UCR智能維修系統(tǒng)中心(IMS)進(jìn)行的軸承失效測(cè)試。實(shí)驗(yàn)間隔20 min采集一次數(shù)據(jù),采樣頻率為20 kHz,驅(qū)動(dòng)電機(jī)轉(zhuǎn)速為2 000 r/min,采樣點(diǎn)為4 096,一共984組數(shù)據(jù),共獲得3組單獨(dú)的軸承壽命實(shí)驗(yàn)數(shù)據(jù)[16],每組數(shù)據(jù)都表示一個(gè)軸承從完好到失效的狀態(tài)。其中數(shù)據(jù)集2中的軸承1出現(xiàn)外圈故障。實(shí)驗(yàn)設(shè)備如圖4所示。
圖4 實(shí)驗(yàn)裝置
首先提取了軸承原始全壽命周期的時(shí)、頻域共計(jì)16個(gè)信號(hào),通過移動(dòng)平均法(MA)對(duì)所提取的時(shí)、頻域信號(hào)進(jìn)行平滑處理,可以看出平滑后的特征信號(hào)特征趨勢(shì)更為明顯。圖5為部分用移動(dòng)平均法(MA)平滑過后的特征信號(hào)。
圖5 MA平滑后的時(shí)、頻域信號(hào)
由于時(shí)域中的無量綱指標(biāo)過于嘈雜,部分特征值對(duì)早期故障不敏感以及無性能退化趨勢(shì)體現(xiàn)[17],且原始特征集中存在一些單調(diào)性不好和反映性能退化過程相對(duì)效果差的特征,因此需要對(duì)原始特征集進(jìn)行特征篩選[18]。利用皮爾遜相關(guān)系數(shù)對(duì)平滑后的16個(gè)特征信號(hào)進(jìn)行相關(guān)性分析,通過皮爾遜相關(guān)系數(shù)分析得出相關(guān)系數(shù)矩陣并得出高度相關(guān)特征圖(見圖6)。一般情況下,相關(guān)性r的取值在(-1,1)之間,其中當(dāng)相關(guān)性|r|≥0.8時(shí),視為高度相關(guān)[15]。通過設(shè)定閾值為0.8選取了方差、均方值、最大值、最小值、均方根值、峰峰值、頻率方差7個(gè)高度相關(guān)特征指標(biāo)。表1為高度相關(guān)系數(shù)矩陣。
表1 相關(guān)系數(shù)矩陣
圖6 高度相關(guān)特征圖
利用核主成分分析(KPCA)對(duì)所選取的9個(gè)高維特征進(jìn)行加權(quán)融合和降維處理,并選取若干主成分,其各主成分的貢獻(xiàn)率如表2所示。根據(jù)各主成分的貢獻(xiàn)率可得出第一主成分包含了軸承全面的退化信息,因此選取第一主成分作為L(zhǎng)STM模型的輸入。第一主成分如圖7所示。
表2 各主成分貢獻(xiàn)率
圖7 第一主成分
根據(jù)第一主成分分析,其后500個(gè)點(diǎn)上升趨勢(shì)較為明顯,因此選取第一主成分后500個(gè)點(diǎn)及其對(duì)應(yīng)的剩余壽命序列作為測(cè)試集輸入到LSTM中并預(yù)測(cè)滾動(dòng)軸承的RUL。
在LSTM中加入 dropout防止過擬合,文中的dropout比率設(shè)置為0.2。為更好地反映滾動(dòng)軸承RUL,設(shè)定0-1直線為軸承的理想退化趨勢(shì),其中0表示軸承處于健康狀態(tài),1代表軸承發(fā)生故障。圖8為軸承的RUL預(yù)測(cè)曲線,可看出:預(yù)測(cè)值圍繞著理想退化趨勢(shì)上下波動(dòng)。
圖8 滾動(dòng)軸承RUL曲線
為了直觀反映被測(cè)軸承的剩余使用壽命,通過二階多項(xiàng)式擬合對(duì)所得預(yù)測(cè)曲線進(jìn)行擬合。從圖9可以看出:擬合曲線與理想退化趨勢(shì)相比十分逼近,表明了該模型對(duì)伺服電機(jī)滾動(dòng)軸承剩余使用壽命預(yù)測(cè)的有效性。
圖9 RUL二次擬合曲線
為驗(yàn)證文中提出的模型的準(zhǔn)確性,采用RMSE和R2作為評(píng)估指標(biāo)對(duì)滾動(dòng)軸承RUL預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià)。將最終得到的實(shí)驗(yàn)結(jié)果與LSTM和BP神經(jīng)網(wǎng)絡(luò)對(duì)比,如表3所示。評(píng)估公式如下:
表3 實(shí)驗(yàn)結(jié)果對(duì)比
(11)
(12)
通過對(duì)比可以看出:所提出的預(yù)測(cè)方法較LSTM和BP神經(jīng)網(wǎng)絡(luò)相比有更高的精度,為伺服電機(jī)滾動(dòng)軸承零件剩余壽命預(yù)測(cè)提供一種新思路[19]。
(1)由于單一的特征難以真實(shí)反映軸承的性能退化狀態(tài)且為避免忽略原始特征之間的聯(lián)系,本文作者提取了滾動(dòng)軸承的16個(gè)時(shí)、頻域特征指標(biāo),通過皮爾遜相關(guān)系數(shù)遍歷選取了9個(gè)高度相關(guān)的特征指標(biāo),利用核主成分分析對(duì)所提取的9個(gè)高度相關(guān)特征指標(biāo)進(jìn)行降維,降維后的主成分能充分表征軸承性能退化過程。
(2)在LSTM中加入dropout可有效防止過擬合,通過IMS數(shù)據(jù)集驗(yàn)證了該方法的可行性。與LSTM及BP神經(jīng)網(wǎng)絡(luò)的對(duì)比結(jié)果表明,該方法的預(yù)測(cè)精度更高且具有更小的預(yù)測(cè)誤差。