呂明珠
(1.遼寧裝備制造職業(yè)技術(shù)學(xué)院 自動控制學(xué)院,沈陽 110161; 2.遼寧開放大學(xué),沈陽 110034)
預(yù)測和健康管理(Prognostics and Health Management,PHM)是實現(xiàn)機(jī)械設(shè)備智能運(yùn)維的重要環(huán)節(jié),剩余使用壽命(Remaining Useful Life, RUL)定義為相關(guān)設(shè)備在出現(xiàn)故障之前剩余的壽命長度[1]。滾動軸承作為各種旋轉(zhuǎn)機(jī)械的關(guān)鍵部件和易損件,若能準(zhǔn)確估計其剩余使用壽命,不僅能保證設(shè)備安全可靠的運(yùn)行,還能大大降低維護(hù)成本。
現(xiàn)有的剩余使用壽命預(yù)測方法主要包括基于模型和數(shù)據(jù)驅(qū)動2種類型[2]:基于模型的方法主要借助退化的物理機(jī)制預(yù)測關(guān)鍵部件的剩余使用壽命,需要一定的先驗知識,很難準(zhǔn)確地建立復(fù)雜工況下的退化模型[3];數(shù)據(jù)驅(qū)動方法將傳感器提供的數(shù)據(jù)轉(zhuǎn)換為參數(shù)或非參數(shù)相關(guān)模型,無需了解退化機(jī)理,但需獲得足夠的歷史數(shù)據(jù)[4],深度學(xué)習(xí)的發(fā)展使從大量數(shù)據(jù)中獲得退化特征成為可能,從而避免人工構(gòu)造特征的繁瑣。
實際應(yīng)用中,軸承往往在變工況下工作,工況條件一旦變化就需要重新訓(xùn)練模型,更新模型參數(shù)。為提高故障診斷模型的泛化能力,遷移學(xué)習(xí)算法近年來得到了越來越廣泛的關(guān)注[5]。由于變工況會導(dǎo)致特征分布發(fā)生變化,領(lǐng)域自適應(yīng)(Domain Adaptation,DA)成為影響遷移效果的關(guān)鍵因素。DA只需要利用新工況中少量的未標(biāo)記樣本即可提取域不變特征,同時在原工況中對標(biāo)記數(shù)據(jù)進(jìn)行有效的監(jiān)督,從而避免了在新工況下對標(biāo)記數(shù)據(jù)的需要[6]。
然而,目前的DA研究方法存在如下問題:1)幾乎所有的遷移回歸模型都采用了一個無監(jiān)督的全局DA解決方案,只是全局對齊域而忽略了數(shù)據(jù)中的細(xì)粒度信息,容易出現(xiàn)遷移結(jié)果變差的問題;2)大多數(shù)最初被提出的DA模型只用于故障分類,可能并不適用于剩余使用壽命預(yù)測;3)已有的DA解決方案常使用對抗性模型,存在結(jié)構(gòu)復(fù)雜和收斂困難的問題。
針對上述問題,本文提出一種深度子域自適應(yīng)回歸網(wǎng)絡(luò)的變工況軸承剩余使用壽命預(yù)測,基本思想是利用傳統(tǒng)的深度學(xué)習(xí)網(wǎng)絡(luò)建立一個特征提取器,加入輔助類別標(biāo)簽和子域分類器捕捉子域類別信息,通過局部最大均值偏差估計不同工況之間的特征分布差異,最后建立一個域不變回歸,完成剩余使用壽命預(yù)測。
令Ds和Dt分別代表源域和目標(biāo)域,定義樣本空間Xs∈Ds,Xt∈Dt,則從源域和目標(biāo)域中提取的數(shù)據(jù)樣本分別為xs∈Xs,xt∈Xt。在實際應(yīng)用中,源域和目標(biāo)域的振動數(shù)據(jù)通常來自于不同工況的軸承,存在嚴(yán)重的分布差異。假設(shè)來自源域和目標(biāo)域的數(shù)據(jù)樣本服從各自的邊緣概率分布P(Xs),P(Xt)以及條件概率分布Q(Ys|Xs),Q(Yt|Xt),且P(Xs)≠P(Xt),Q(Ys|Xs)≠Q(mào)(Yt|Xt)。
所謂領(lǐng)域自適應(yīng),就是解決源域與目標(biāo)域之間的特征空間和學(xué)習(xí)任務(wù)相同,但邊緣概率分布和條件概率分布不同的問題[7]。領(lǐng)域自適應(yīng)遷移學(xué)習(xí)的目標(biāo)是學(xué)習(xí)一個特征變換,同時最小化邊緣分布和條件分布差異,即
minD(Ps(φ(Xs)),Pt(φ(Xt)),
(1)
minD(Qs(Ys|φ(Xs)),Qt(Yt|φ(Xt))),
(2)
式中:D為評估領(lǐng)域差異的函數(shù);φ為映射函數(shù)。
EXt~q[φ(Xt)]},
(3)
式中:D為用于評估領(lǐng)域偏差的距離;H為再生核希爾伯特空間;sup為輸入聚合的上確界;φ為X→H的非線性映射函數(shù);E為嵌入樣本的平均值。
在統(tǒng)計學(xué)中,這種表示被稱為整體概率度量。為計算這個差異,可以用最大均值差異的有偏估計替代,可表示為
(4)
2個分布差異的經(jīng)驗估計可認(rèn)為是在再生核希爾伯特空間中的2個數(shù)據(jù)平均值的距離。當(dāng)最大均值差異接近于0時,表示2個分布是對齊的。
大量的深度自適應(yīng)方法試圖通過學(xué)習(xí)全局域移位來提取域不變表示。這只是對齊源域和目標(biāo)域的全局分布,而沒有考慮子域之間的關(guān)系(在分類任務(wù)中,相同的樣本通常被歸類為子域)。這種全局對齊會破壞域內(nèi)的分布結(jié)構(gòu),導(dǎo)致結(jié)果較差,如圖1所示。
圖1 全局與子域領(lǐng)域自適應(yīng)遷移學(xué)習(xí)結(jié)果對比
子域自適應(yīng)側(cè)重于將源域和目標(biāo)域中相同類型的子域?qū)R[9],但大多是基于對抗性的方法,意味著復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),包含多個損失項的目標(biāo)函數(shù),困難的超參數(shù)選擇和收斂過程等, 而且將子域自適應(yīng)理論應(yīng)用于剩余使用壽命預(yù)測的相關(guān)文獻(xiàn)也很少。
為對齊相關(guān)的子域,本文引入局部最大均值偏差(Local MMD,LMMD),其在考慮不同樣本權(quán)重的情況下,測量源域和目標(biāo)域中相關(guān)子域經(jīng)驗分布的核平均嵌入之間的Hilbert-Schmidt范數(shù)[10],其定義為
DH(xs,xt)?
(5)
LMMD可以測量局部分布差異的期望。假設(shè)每個樣本以權(quán)重ωc屬于每個類別,則存在的無偏估計為
(6)
對于任意一個樣本,其權(quán)重計算公式為
(7)
式中:zic為zi的第c個元素。
為適應(yīng)滾動軸承剩余使用壽命預(yù)測的需要,本文利用子域間的細(xì)粒度監(jiān)督信息設(shè)計了一種新型遷移學(xué)習(xí)框架,稱為深度子域自適應(yīng)回歸網(wǎng)絡(luò)(Deep Subdomain Adaptive Regression Network, DSARN),其結(jié)構(gòu)如圖2所示。
圖2 深度子域自適應(yīng)回歸網(wǎng)絡(luò)結(jié)構(gòu)圖
與大多數(shù)端到端的剩余使用壽命預(yù)測結(jié)構(gòu)類似,DSARN中嵌入了一個特征提取器和一個回歸器。特征提取器將原始輸入信號xi通過隱藏層獲得高維特征hi,再通過回歸器得到高維特征hi與回歸預(yù)測yi之間的映射,這個映射的學(xué)習(xí)過程需要不斷最小化回歸誤差,并在網(wǎng)絡(luò)中嵌入子域自適應(yīng)解決最小化問題,即
(8)
λ=2μ/(1+e-10τ/τm)-1,
式中:J為目標(biāo)輸出與預(yù)測輸出的損失函數(shù);dc為用來度量源域和目標(biāo)域之間所有對應(yīng)的子域差異;λ為時變權(quán)衡系數(shù);τ為當(dāng)前迭代次數(shù);τm為最大迭代次數(shù);μ為預(yù)先設(shè)定的遷移系數(shù)。
為在回歸模型中進(jìn)行子域劃分和子域自適應(yīng),本文在網(wǎng)絡(luò)結(jié)構(gòu)中加入輔助類別標(biāo)簽和子域分類器捕捉子域類別信息,再通過LMMD估計源域與目標(biāo)域之間的加權(quán)分布差,最后建立一個域不變回歸,形成DSARN學(xué)習(xí)算法。
為提高剩余使用壽命預(yù)測的跨域泛化性能,全面利用細(xì)粒度的子域信息,本文在DSARN算法基礎(chǔ)上提出了一種基于DSARN的多工況軸承剩余使用壽命預(yù)測方法,其框架如圖3所示,具體步驟為:
圖3 基于DSARN的剩余使用壽命預(yù)測方法流程圖
1)收集多種工況下滾動軸承的故障振動信號。
2)利用二階同步壓縮變換將源域已標(biāo)記的樣本和目標(biāo)域原始振動信號轉(zhuǎn)換為時頻表示。
3)建立并初始化DSARN模型。
4)將來自源域的標(biāo)記樣本和來自目標(biāo)域的未標(biāo)記樣本用于DSARN訓(xùn)練,通過最小化相對子域之間的差異減小每個退化階段中源域與目標(biāo)域樣本之間的差異。
5)使用訓(xùn)練后的DSARN進(jìn)行測試樣本的預(yù)測。
6)輸出剩余使用壽命預(yù)測結(jié)果并評價該方法的性能。
為驗證DSARN在剩余使用壽命預(yù)測上的實用性,采用在多種工況下采樣軸承振動信號的IEEE2012PHM軸承數(shù)據(jù)集[11]進(jìn)行分析,使用評分函數(shù)、均方根誤差(Root Mean Squared Error, RMSE)和平均絕對誤差(Mean Absolute Error, MAE)進(jìn)行性能評價。
評分函數(shù)的定義為
(9)
IEEE2012PHM軸承數(shù)據(jù)集來自PRONOSTIA試驗臺,其通過加速退化試驗收集滾動軸承的全周期退化振動數(shù)據(jù)。試驗軸承為6804型深溝球軸承(內(nèi)徑20 mm,外徑32 mm,寬度7 mm),軸承外圈上安裝了2個加速度傳感器,采樣頻率為25.6 kHz。每次采樣持續(xù)0.1 s,每10 s采樣一次,當(dāng)軸承振動幅值超過20g時試驗終止[12]。該數(shù)據(jù)集在3種不同工況下測試了17套軸承(表1),本節(jié)的案例研究包含了6個遷移場景,具體的訓(xùn)練和測試數(shù)據(jù)見表2。
表1 IEEE2012PHM軸承數(shù)據(jù)集描述
表2 遷移預(yù)測的6種情況
深度網(wǎng)絡(luò)具有較強(qiáng)的特征提取能力,甚至可以直接從軸承振動信號中提取特征;然而,考慮到振動信號的非平穩(wěn)性,通過頻譜分析預(yù)處理的數(shù)據(jù)更有利于特征提取,使網(wǎng)絡(luò)獲得更快的收斂。因此,本文選用比傳統(tǒng)的傅里葉方法更利于處理波動頻繁的軸承振動數(shù)據(jù)的二階同步壓縮變換方法進(jìn)行時頻處理,以軸承1_1某一樣本為例,其預(yù)處理結(jié)果如圖4所示。
(a) 原始振動信號
由于軸承在不同工況下的全壽命周期差異很大,使用絕對剩余使用壽命值難以獲得良好的跨域預(yù)測。為便于對比分析,本文對預(yù)測結(jié)果進(jìn)行規(guī)范化處理,即
(10)
式中:LRUL為軸承剩余使用壽命預(yù)測值;Ltotal為軸承全周期壽命。L越接近1表明軸承越健康,越接近0則表明軸承退化越嚴(yán)重。
ResNet是卷積神經(jīng)網(wǎng)絡(luò)的一種變體[12],通過在網(wǎng)絡(luò)中添加殘余模塊解決梯度消失的問題,比傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)具有更好的學(xué)習(xí)能力和泛化性能。本文使用沒有頂層分類器和預(yù)訓(xùn)練參數(shù)的ResNet50作為軸承信號的特征提取器。DSARN的網(wǎng)絡(luò)結(jié)構(gòu)見表3。通過網(wǎng)格搜索確定的DSARN超參數(shù)設(shè)置為:最大迭代次數(shù)200,批處理大小16,學(xué)習(xí)率0.000 05,遷移系數(shù)0.005,子域類別10。
表3 DSARN的網(wǎng)絡(luò)結(jié)構(gòu)
DSARN模型在訓(xùn)練過程中的誤差減少情況如圖5所示:回歸誤差(目標(biāo)輸出與預(yù)測輸出之間的均方根誤差)在早期對目標(biāo)函數(shù)的貢獻(xiàn)較大,因此,在早期訓(xùn)練過程應(yīng)注重提高回歸精度;經(jīng)過迭代后,回歸誤差的下降明顯減慢,LMMD的貢獻(xiàn)增加,此時應(yīng)注重提取域不變特征以減小子域差異;再經(jīng)過一段時間迭代后,總誤差趨于穩(wěn)定,表明網(wǎng)絡(luò)變得收斂。LMMD明顯下降,說明子域差異在不斷減小。
圖5 DSARN的訓(xùn)練損失
除DSARN外,本文引入了2個對比模型:模型1是沒有進(jìn)行領(lǐng)域自適應(yīng)的ResNet,從DSARN中刪除輔助類別標(biāo)簽和子域自適應(yīng),只使用源域訓(xùn)練;模型2是使用傳統(tǒng)全局領(lǐng)域自適應(yīng)的ResNet(簡稱DAN),源域和目標(biāo)域在全域?qū)R而不考慮子域劃分,并使用MMD作為距離度量。利用上述方法對表2中的6種遷移場景進(jìn)行訓(xùn)練和測試,剩余使用壽命預(yù)測結(jié)果如圖6所示:非領(lǐng)域自適應(yīng)ResNet的預(yù)測在大部分時間下表現(xiàn)不佳,幾乎沒有單調(diào)的趨勢,使用較少的源域樣本預(yù)測較大樣本量目標(biāo)域時的性能特別糟糕(圖6f);DAN的性能往往不如DSARN好,有時甚至比ResNet更差(圖6d,圖6e),這是由于DAN只會全局縮小源域和目標(biāo)域,導(dǎo)致內(nèi)部細(xì)粒度結(jié)構(gòu)信息被破壞,可能導(dǎo)致負(fù)遷移[15];除了圖6e的結(jié)果外,使用DSARN得到的結(jié)果有明顯的單調(diào)趨勢,DSARN將相應(yīng)的子域?qū)R,可以得到每個退化階段更好的子域不變特征,DSARN在6種遷移場景中均取得了比DAN和ResNet更好的剩余使用壽命預(yù)測結(jié)果。
圖6 不同模型在6種遷移場景下的預(yù)測結(jié)果
3種性能指標(biāo)的計算結(jié)果見表4:與非領(lǐng)域自適應(yīng)ResNet相比,DAN提高了預(yù)測效果但有時會發(fā)生負(fù)遷移,DSARN方法則取得了最高的平均分?jǐn)?shù)以及最小的平均RMSE和MAE。結(jié)果表明子域自適應(yīng)能夠使網(wǎng)絡(luò)進(jìn)行跨條件的剩余使用壽命預(yù)測且不容易發(fā)生負(fù)遷移,DSARN通過子域自適應(yīng)保留和使用數(shù)據(jù)中的細(xì)粒度結(jié)構(gòu)信息,顯著提高了跨域泛化性能。
表4 遷移結(jié)果的性能指標(biāo)
為探究LMMD對隱藏特征提取的影響,進(jìn)行了源域樣本和目標(biāo)域樣本中提取特征的對比分析。以工況1→2為例,使用t-分布的隨機(jī)鄰域嵌入可視化隱藏表示的分布,結(jié)果如圖7所示:ResNet提取的隱藏特征顯示出較大的特征分布上的差異,準(zhǔn)確度也較差;DAN提取的特征服從MMD項的分布相對相似,但仍存在明顯的差異,而且樣本集太多時將難以區(qū)分特征;DSARN利用LMMD的子域自適應(yīng)函數(shù)很好地對齊源域和目標(biāo)域的特征,得到了最小的子域差異,從而更好地提取域不變特征并建立從特征到標(biāo)簽的有效映射。
圖7 不同模型從源域到目標(biāo)域的特征分布
本文提出了一種基于子域自適應(yīng)的DSARN模型,用于多工況下滾動軸承的剩余使用壽命預(yù)測。利用二階同步壓縮變換對軸承振動信號進(jìn)行預(yù)處理,將非平穩(wěn)的原始振動信號轉(zhuǎn)換為更容易捕捉特征的頻譜信號并得到多通道信號作為輸入,與基于人工設(shè)計特征或統(tǒng)計特征的方法相比,可以保留更多的特征信息。使用ResNet50作為基礎(chǔ)網(wǎng)絡(luò)框架進(jìn)行特征提取并加入回歸器和子域分類器實現(xiàn)回歸模型上的子域自適應(yīng),采用一個新的包含LMMD項和時變權(quán)衡項的目標(biāo)函數(shù)來訓(xùn)練網(wǎng)絡(luò)并提取子域不變特征。在IEEE 2012 PHM軸承數(shù)據(jù)集上進(jìn)行6種場景的遷移預(yù)測,DSARN模型在變工況軸承剩余使用壽命預(yù)測中可獲得更高的準(zhǔn)確性和更好的遷移性能,在工程實踐中有一定的推廣價值。
DSARN模型的局限性在于參數(shù)較多,收斂時間及復(fù)雜度較高,而且未從多維度綜合考慮時間退化信息,在今后的研究工作中將進(jìn)一步改進(jìn)模型參數(shù),提高收斂性能,加快收斂速度,合理利用時間相關(guān)信息,以期提供更穩(wěn)定的預(yù)測效果。