石懷濤,尚亞俊,白曉天,郭 磊,馬 輝
(1.沈陽建筑大學(xué) 機械工程學(xué)院,沈陽 110168;2.東北大學(xué) 機械工程與自動化學(xué)院,沈陽 110819)
旋轉(zhuǎn)機械是現(xiàn)代工業(yè)、民用和軍事應(yīng)用中最常見的機械類型[1-2],而滾動軸承是其核心部件之一,極易在長期運行中由于安裝、溫度、潤滑等因素受到損傷[3]。若早期故障未得到有效識別與及時解除,旋轉(zhuǎn)機械的精度將不斷降低,直至系統(tǒng)完全損壞,甚至引起不可挽回的后果。
很多有效的傳統(tǒng)滾動軸承故障診斷方法依靠旋轉(zhuǎn)機械的運行振動信號對其進行故障診斷[4-6],對其時域、頻域及時頻域進行分析,如振動分析、溫度分析以及油液分析等。其中振動分析是最具說服力的方法,從振動信號中提取大量的特征參數(shù)作為傳統(tǒng)故障診斷的標(biāo)準(zhǔn)。時域特征(均方差根、峭度)被廣泛應(yīng)用于軸承性能評估[7-9]。Chen等[10]提出基于均方差根值(root mean square,RMS)的時域統(tǒng)計指標(biāo)用在滾動軸承狀態(tài)識別中,RMS反映的是信號能量,振幅值隨時間變化的越緩慢,其效果越明顯,很明顯對早期故障不敏感。袁云龍等[11]基于峭度(Kurtosis)的時域統(tǒng)計指標(biāo)來進行滾動軸承狀態(tài)識別,峭度對沖擊信號的有較大的反應(yīng),所以對早期異常故障信號有較高的敏感性,但對于微小波動的情況,可能出現(xiàn)敏感度過高造成評估滾動軸承故障的可靠性產(chǎn)生影響。而滾動軸承振動信號隱含的特征信息非常多,特征信息的提取是滾動軸承的關(guān)鍵。采用多種時域特征,研究滾動軸承運行狀態(tài)與振動信號之間的關(guān)系。其中,RMS和Kurtosis是最常見的時域特征方法,因為它們能有效地反映滾動軸承運行振動的實時變化。但是,滾動軸承運行過程中振動的不確定性引起的波動對軸承運行狀態(tài)的預(yù)測有很大的影響。時域特征分析不再利于滾動軸承的早期故障預(yù)測。
深度學(xué)習(xí)能自動學(xué)習(xí)豐富而有區(qū)別的特征,具有強大的特征提取能力,使其在故障診斷領(lǐng)域的應(yīng)用成為了可能。李恒等[12]提出將滾動軸承振動信號進行短時傅里葉變換,使用得到的時頻譜樣本訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN),對不同類型的故障有較高的識別精度。Zhang等[13]提出的單類支持向量機(support vector machine,SVM)方法雖然能夠向高維空間中進行映射,對于大規(guī)模的訓(xùn)練數(shù)據(jù)比較困難,尤其是進行超參數(shù)的智能調(diào)優(yōu)的過程時,會投入大量的時間和精力。以上神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練的樣本之間是相互獨立的,數(shù)據(jù)之間具有的時序相關(guān)性被忽略。長短時記憶[14](long short-term memory network,LSTM)網(wǎng)絡(luò)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN),在涉及序列數(shù)據(jù)廣泛的機器學(xué)習(xí)問題中是有效的[15]。杜小磊等[16]提出了一種基于深層小波卷積自編碼器和LSTM的軸承故障診斷模型,利用小波自編碼提取故障特征進行LSTM網(wǎng)絡(luò)訓(xùn)練,進行故障診斷。趙建鵬等[17]使用經(jīng)驗?zāi)B(tài)分解數(shù)據(jù)進行特征參量的提取,并輸入到LSTM網(wǎng)絡(luò)中預(yù)測下一刻旋轉(zhuǎn)機械的工作狀態(tài)。但這些方法都存在網(wǎng)絡(luò)模型使用簡單,提取數(shù)據(jù)的時序關(guān)聯(lián)特性機理不確切等問題。
越深的網(wǎng)絡(luò)和越多的節(jié)點個數(shù)往往會使學(xué)習(xí)效果和擬合效果越好,但也會增加超參數(shù)的個數(shù)。超參數(shù)是模型訓(xùn)練開始前設(shè)置的一系列參數(shù),例如隱藏層的數(shù)量、每層的節(jié)點個數(shù)、迭代次數(shù)和學(xué)習(xí)率等,模型的超參數(shù)具有選取困難、沒有規(guī)律性的特點,而且不同超參數(shù)之間存在無法預(yù)知的影響,每個超參組合的評估需要進行大量的迭代計算。不同的超參數(shù)組合會影響模型的最終準(zhǔn)確率和平穩(wěn)性,通常需要大量的超參數(shù)試驗來確定模型最終的超參數(shù)組合,耗費大量的時間和精力。
網(wǎng)絡(luò)模型的超參數(shù)優(yōu)化策略[18-19]對模型的精度影響很大,網(wǎng)格搜索方法[20-21]是最早的自動搜索超參數(shù)的方法,網(wǎng)格搜索是一種帶有步長的窮舉方法,通過不斷縮小網(wǎng)格的步長增大搜索空間最大程度上找到模型的最優(yōu)解,但是網(wǎng)格搜索只適合數(shù)據(jù)集較小的模型,一旦數(shù)據(jù)規(guī)模增大,就會很難得到最優(yōu)解,甚至?xí)霈F(xiàn)“指數(shù)爆炸”的問題。Bergstra等[22]提出隨機搜索方法,將超參數(shù)選擇問題轉(zhuǎn)變成函數(shù)優(yōu)化問題,按照概率分布抽取初始值,進行計算得到最優(yōu)解或者近似最優(yōu)解,適用于數(shù)據(jù)集較大的情況,但隨即搜索得到的結(jié)果之間差異較大。網(wǎng)格搜索和隨機搜索均為目標(biāo)函數(shù)可導(dǎo)的優(yōu)化方法,對于目標(biāo)函數(shù)表達式未知等復(fù)雜的優(yōu)化問題,提出了智能優(yōu)化方法與深度學(xué)習(xí)模型相結(jié)合的方式,如Yan等[23]用遺傳算法來優(yōu)化人工神經(jīng)網(wǎng)絡(luò)模型的超參數(shù),Li等[24]用量子遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò),李甜甜[25]用粒子群算法和模擬退火算法來優(yōu)化SVM中超參數(shù)等。但遺傳算法和粒子群算法均屬于群體優(yōu)化算法,需要足夠多的初始點來進行訓(xùn)練才能有效地搜索到最優(yōu)解,訓(xùn)練效率不高。本文使用貝葉斯優(yōu)化(Bayesian optimization,BO)[26]方法,因BO網(wǎng)絡(luò)只需對目標(biāo)函數(shù)進行次數(shù)很少的評估就能獲得最優(yōu)解,非常適用于求解目標(biāo)函數(shù)表達式未知以及評估代價高昂的復(fù)雜優(yōu)化問題,且不需要大量的采樣點便可以得到最優(yōu)解,適合深度學(xué)習(xí)模型的超參數(shù)調(diào)優(yōu)問題[27]。
基于以上分析,本文提出了一種基于貝葉斯優(yōu)化的滑動窗堆疊去噪自編碼器(sliding window stacked denoising auto encoder,SWDAE)和LSTM網(wǎng)絡(luò)的早期故障預(yù)測模型(SWDAE-LSTM)的研究方法。在離線建模階段,為了保證堆疊去噪自編碼(stacked denoising auto encoder,SDAE)提取特征的精確性,使用滑動窗算法對數(shù)據(jù)進行預(yù)處理,之后將數(shù)據(jù)輸入到SDAE網(wǎng)絡(luò)進行滾動軸承故障特征的提取,并固定訓(xùn)練好的SDAE,將經(jīng)過SDAE重構(gòu)的數(shù)據(jù)集作為LSTM的輸入,進行LSTM網(wǎng)絡(luò)的訓(xùn)練,進一步學(xué)習(xí)數(shù)據(jù)之間的時序特征。之后將訓(xùn)練好的SDAE-LSTM模型用于在線監(jiān)測,去掉LSTM最后一層分類層,實時在線數(shù)據(jù)輸入到SDAE-LSTM網(wǎng)絡(luò),訓(xùn)練得到下一時刻的預(yù)測值,而這一時刻的真實值來源于實際的運行數(shù)據(jù),數(shù)據(jù)實時輸入到模型中,與訓(xùn)練得到的預(yù)測值進行殘差計算來重構(gòu)誤差,來判斷滾動軸承的運行狀態(tài)。對于SDAE和LSTM的精度與其超參數(shù)組合的關(guān)系,我們在貝葉斯優(yōu)化階段使用貝葉斯優(yōu)化算法對模型的超參數(shù)進行智能調(diào)參,BO可以在迭代中尋求最優(yōu)解,在節(jié)省了大量的時間和精力的同時,使模型的精確度和平穩(wěn)性達到最優(yōu),從而使模型能夠更全面地學(xué)習(xí)滾動軸承數(shù)據(jù)的特征。利用辛辛那提大學(xué)智能維護中心提供的數(shù)據(jù)進行了實驗仿真,仿真結(jié)果表明,基于貝葉斯優(yōu)化的SWDAE-LSTM模型可以很好地描述滾動軸承的運行狀態(tài),更早更穩(wěn)定的預(yù)測出滾動軸承的早期故障,這對于滾動軸承運行狀態(tài)的退化監(jiān)測非常重要。同時,利用旋轉(zhuǎn)機械綜合模擬實驗臺證明了本文提出方法的有效性和可靠性。
得益于SDAE模型的特征提取能力與LSTM模型的數(shù)據(jù)特征提取能力,本文對滾動軸承早期故障預(yù)測的主要貢獻如下:
(1)利用貝葉斯優(yōu)化算法對模型的超參數(shù)進行智能調(diào)參,使模型的超參數(shù)得出最優(yōu)解,在節(jié)省了大量時間和精力的同時,使模型的精確度和平穩(wěn)性達到最優(yōu)。
(2)利用滑動窗算法對滾動軸承的數(shù)據(jù)進行預(yù)處理,使輸入到網(wǎng)絡(luò)模型中的數(shù)據(jù)長度保持一致,使SDAE能更好的提取滾動軸承的數(shù)據(jù)特征,同時保證了數(shù)據(jù)之間的時序相關(guān)性,使模型能更好的對滾動軸承早期故障的出現(xiàn)進行預(yù)測。
(3)將無監(jiān)督的SDAE網(wǎng)絡(luò)對滾動軸承振動信號的特征進行提取,去掉LSTM網(wǎng)絡(luò)最后一層分類層,提取數(shù)據(jù)之間的時序關(guān)聯(lián)特性,并利用滾動軸承序列數(shù)據(jù)的完整歷史軌跡對滾動軸承的運行狀態(tài)進行監(jiān)測,進一步預(yù)測滾動軸承早期故障的出現(xiàn)。
自動編碼器(auto encoder,AE)是一個無監(jiān)督的特征表達網(wǎng)絡(luò),由輸入層(x)、隱藏層(h)和輸出層(r)組成。AE的目的是通過編碼和解碼的過程重構(gòu)數(shù)據(jù),使輸出數(shù)據(jù)與輸入數(shù)據(jù)之間的誤差最小。去噪自編碼器(denoising auto encoder,DAE)是AE的一種改進方法,DAE從被損壞或加入噪聲的數(shù)據(jù)樣本中重建數(shù)據(jù)。AE從輸入層到隱藏層的編碼公式為
式中:fe()為輸入層到輸出層的編碼函數(shù);σ()為Sigmoid激活函數(shù);Wxh為其權(quán)重值;bxh為其偏移值。
AE從隱藏層到輸出層的解碼公式為
式中:fd()為隱藏層到輸出層的解碼函數(shù);Whr為其的權(quán)重值;bhr為其偏移值。
AE的中心思想是通過編碼和解碼,使輸入數(shù)據(jù)和輸出數(shù)據(jù)保持一致,因此AE的損失函數(shù)為
未處理的振動信號含有大量的噪聲,初始故障的信號特征較弱,需要通過DAE處理去除了信號中的大部分噪聲,以及隱藏層從信號中提取魯棒特征。
將多個DAE堆疊便得到SDAE,在訓(xùn)練模型時,上一個DAE的輸出作為下一個DAE的輸入,以此類推,直到所有的DAE訓(xùn)練結(jié)束,得到一個堆疊而成的深層網(wǎng)絡(luò)。經(jīng)堆疊而成的SDAE網(wǎng)絡(luò)在高維度、非線性輸入數(shù)據(jù)特征的提取上具有很強的魯棒性。
長短時記憶網(wǎng)絡(luò)是一種特殊的RNN網(wǎng)絡(luò),既有RNN網(wǎng)絡(luò)所具備的時序關(guān)聯(lián)特性,并且通過門控循環(huán)單元 來控制網(wǎng)絡(luò)中神經(jīng)元間的歷史信息傳輸,解決了傳統(tǒng)RNN網(wǎng)絡(luò)梯度消失和梯度爆炸的問題。
圖1為LSTM網(wǎng)絡(luò)的基本結(jié)構(gòu),由輸入門、遺忘門和輸出門來完成LSTM每個神經(jīng)單元工作狀態(tài)的修改和輸出,并由GRU在內(nèi)部控制有效信息的記憶和傳遞。其中,遺忘門決定(t-1)時刻的單元狀態(tài)有多少被保留到t時刻。輸入門決定單元狀態(tài)的更新。在遺忘門和輸入門更新了單元狀態(tài)之后,由σ()非線性激活函數(shù)和輸出門來決定LSTM神經(jīng)單元狀態(tài)的輸出。一個LSTM細(xì)胞的計算過程如下:
圖1 LSTM細(xì)胞圖Fig.1 LSTM structure
遺忘門
式中:ft為遺忘門;Wf為遺忘門的權(quán)重矩陣;bf為遺忘門偏置項。
輸入門
式中:it為輸入門;c′t為當(dāng)前輸入的單元狀態(tài),最后計算出當(dāng)前時刻的單元狀態(tài)ct。
輸出門
輸出門和單元狀態(tài)共同決定了LSTM的最終輸出。
綜上所述,我們將SDAE網(wǎng)絡(luò)和LSTM網(wǎng)絡(luò)組合來構(gòu)建神經(jīng)網(wǎng)絡(luò)模型。如圖2所示,為SWDAE-LSTM網(wǎng)絡(luò)框架。
圖2 SWDAE-LSTM網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 SWDAE-LSTM network structure
該模型主要由輸入層、特征提取層和預(yù)測層組成?;瑒哟鞍凑找欢ǖ牟介L和移動速度將數(shù)據(jù)進行堆疊劃分,產(chǎn)生X={X1,X2,…,Xt-1,Xt,…,XN}輸入數(shù)據(jù)集,將處理好的數(shù)據(jù)集輸入到SDAE網(wǎng)絡(luò)當(dāng)中,按照式(1)~式(3)訓(xùn)練SDAE網(wǎng)絡(luò),利用SDAE網(wǎng)絡(luò)捕獲數(shù)據(jù)更多有用的隱藏模式,并從原始數(shù)據(jù)中獲得更強的魯棒性以及數(shù)據(jù)之間的時序依賴特性。將訓(xùn)練好的數(shù)據(jù)作為LSTM網(wǎng)絡(luò)的輸入,按照式(4)~式(6)進行LSTM網(wǎng)絡(luò)訓(xùn)練,生成序列數(shù)據(jù),對數(shù)據(jù)進行預(yù)測。
貝葉斯優(yōu)化針對深度學(xué)習(xí)模型超參數(shù)目標(biāo)函數(shù)表達式未知、搜索代價高昂的復(fù)雜優(yōu)化問題,使用一個不斷更新的概率模型,通過少數(shù)次的目標(biāo)函數(shù)評估來更新優(yōu)化函數(shù)的后驗概率,得到最優(yōu)的模型超參數(shù)組合。模型的超參數(shù)組合選擇可表示為
式中:f(x)為最小化的目標(biāo)函數(shù),用于評估目標(biāo)函數(shù)的最優(yōu)性能;x*為最后獲得的最優(yōu)超參數(shù)組合。
貝葉斯優(yōu)化源于貝葉斯定理,利用BO公式建立優(yōu)化過程的概率分布
式中:P(E)為高斯分布;P(D|E)為一個高斯回歸過程??捎珊司仃嚒苼泶_定,∑由核函數(shù)定義,其表達式為
BO超參數(shù)的目的就是通過不斷地迭代得到一個最優(yōu)的超參數(shù)組合,即x*=xn+1使模型的精度達到最優(yōu)。
基于以上研究,SDAE網(wǎng)絡(luò)在故障特征提取方面具有很強的魯棒性,LSTM網(wǎng)絡(luò)能夠?qū)W習(xí)數(shù)據(jù)之間的時序關(guān)聯(lián)特性,將SDAE與LSTM網(wǎng)絡(luò)組合為一個網(wǎng)絡(luò)模型,來描述滾動軸的運行狀態(tài),正確的狀態(tài)描述是解決滾動軸承早期故障預(yù)測的最優(yōu)方式。為了保證SDAE網(wǎng)絡(luò)特征提取的有效性,本文引入了滑動窗算法對數(shù)據(jù)進行預(yù)處理,保證了SDAE網(wǎng)絡(luò)對提取特征的魯棒性。貝葉斯優(yōu)化可以不斷更新超參數(shù),只需經(jīng)過少次目標(biāo)函數(shù)評估即可獲得理想解,適合深度學(xué)習(xí)模型的超參數(shù)調(diào)優(yōu)問題。因此本文選用BO算法優(yōu)化模型的超參數(shù),滑動窗算法進行數(shù)據(jù)預(yù)處理,LSTM與SDAE組合來構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型。
基于BO的SWDAE-LSTM模型的構(gòu)建包括貝葉斯優(yōu)化階段、離線建模階段和在線監(jiān)測階段,貝葉斯優(yōu)化階段由超參數(shù)初始點開始進行模型訓(xùn)練,并不斷更新超參數(shù)組合,直到模型的精度滿足要求。離線建模階段利用經(jīng)滑動窗預(yù)處理的歷史正常數(shù)據(jù)進行SDAE迭代訓(xùn)練,保存訓(xùn)練好的SDAE之后訓(xùn)練LSTM,去除LSTM的分類層將LSTM網(wǎng)絡(luò)作為序列生成器,可以輸出數(shù)據(jù)變成與輸入數(shù)據(jù)維度相同的序列數(shù)據(jù)。在線監(jiān)測階段,將實時在線數(shù)據(jù)輸入到訓(xùn)練好的SWDAE-LSTM模型中,進行滾動軸承下一時刻運行狀態(tài)的預(yù)測并輸出其預(yù)測值,將其預(yù)測值和在線數(shù)據(jù)進行殘差計算使誤差重構(gòu),當(dāng)前的運行狀態(tài)是否在正常范圍之內(nèi)通過支持向量數(shù)據(jù)描述(support vector data description,SVDD)來判斷,若正常則繼續(xù)監(jiān)測,否則報警。如圖3所示,為滾動軸承早期故障預(yù)測流程圖(3個階段:貝葉斯優(yōu)化調(diào)參、離線建模和在線監(jiān)測)。
圖3 滾動軸承早期故障預(yù)測流程圖Fig.3 Rolling bearing early fault prediction flow chart
(1)貝葉斯優(yōu)化階段:
步驟1根據(jù)要優(yōu)化的超參數(shù),設(shè)置n個初始點Xn=[X1,X2,…,Xn],作為模型的初始化超參數(shù),并代入SWDAE-LSTM模型中進行訓(xùn)練。并計算Xn在目標(biāo)函數(shù)上的響應(yīng)值Yn=[Y1,Y2,…,Yn],構(gòu)建數(shù)據(jù)集D={(X1,Y1)…(Xn,Yn)}。
步驟2在模型的驗證集上判斷模型是否滿足精度要求,若滿足則模型超參數(shù)為Xn,否則判斷模型是否達到最大迭代次數(shù),若滿足則該模型超參數(shù)為Xn,否則循環(huán)執(zhí)行貝葉斯優(yōu)化迭代。
步驟3利用D數(shù)據(jù)集,建立高斯回歸模型GP。
步驟4基于GP,通過采集函數(shù)u(X),進行采樣點Xn+1的計算。
步驟5使用新得到的采樣點Xn+1作為模型超參數(shù),進行模型訓(xùn)練,并得到模型的響應(yīng)值Yn+1。
步驟6判斷是否滿足精度要求。若不滿足循環(huán)執(zhí)行步驟2~步驟6;滿足則確定超參數(shù)為Xn+1,停止迭代。
(2)離線建模階段:
步驟1采集滾動軸承正常狀態(tài)下的振動信號,作為歷史正常數(shù)據(jù)x。
步驟2在歷史正常數(shù)據(jù)上運行長度為ω的重疊滑動窗口,得到一個新的擴展時間序列數(shù)據(jù)Y。
步驟3將新的數(shù)據(jù)集Y作為SDAE輸入數(shù)據(jù),將初始化參數(shù)作為模型的超參數(shù)。根據(jù)第2章式(1)~式(5)對SDAE進行訓(xùn)練。
步驟4固定訓(xùn)練好的SDAE,并將重構(gòu)的數(shù)據(jù)作為LSTM的輸入數(shù)據(jù)ej,進行LSTM訓(xùn)練。
步驟5訓(xùn)練LSTM時,輸出與輸入數(shù)據(jù)維度相同的預(yù)測序列,并不斷更新SWDAE-LSTM模型的超參數(shù)以及參數(shù)。
步驟6判斷模型的精度是否滿足要求。若不滿足,循環(huán)執(zhí)行步驟1~步驟5;滿足則停止訓(xùn)練。
(3)在線監(jiān)測階段:
步驟1將實時數(shù)據(jù)輸入到訓(xùn)練好的SWDAE-LSTM模型中,輸出下一時刻的預(yù)測數(shù)據(jù)nt。
步驟2將輸出的預(yù)測值nt與實時數(shù)據(jù)的真實值進行殘差計算,產(chǎn)生重構(gòu)誤差J(θ)。
步驟3將重構(gòu)誤差經(jīng)過SVDD,判斷重構(gòu)誤差是否超過SVDD設(shè)置的閾值,若超過,則滾動軸承出現(xiàn)早期故障,進行報警,否則繼續(xù)循環(huán)步驟1~步驟5。
為驗證基于貝葉斯優(yōu)化的SWDAE-LSTM模型對滾動軸承早期故障預(yù)測的診斷效果,分別利用來自美國辛辛那提大學(xué)智能維護中心(IMSCenter)的軸承全生命周期數(shù)據(jù)以及機械故障綜合模擬實驗裝置獲取的數(shù)據(jù)進行仿真實驗及分析。如圖4所示,為滾動軸承全壽命試驗臺,軸承測試臺在一個由交流電動機驅(qū)動的軸上承載4個軸承(1#、2#、3#、4#),軸的轉(zhuǎn)速保持為2 000 r/min。為加速軸承老化,在徑向方向上,彈簧機構(gòu)向軸和軸承施加了2 721.6 kg的載荷,油液循環(huán)系統(tǒng)可測量潤滑油的流量和溫度。此每個軸承箱上均安裝了振動加速度傳感器,數(shù)據(jù)采樣率為20 kHz,每隔10 min采樣一次并記錄。本文使用1#軸承的數(shù)據(jù)進行仿真試驗。
圖4 滾動軸承全壽命試驗臺Fig.4 Rolling bearing full life test stand
如圖5所示,為機械故障綜合模擬試驗臺,實驗臺主要由調(diào)速電機,加速度傳感器等構(gòu)成。實驗中設(shè)置不同轉(zhuǎn)速下不同故障尺寸的滾動軸承實驗,分別在轉(zhuǎn)速為1 200 r/min,2 400 r/min,3 600 r/min,選取故障直徑為0.2 mm,0.3 mm,0.5 mm的滾動軸承,故障的位置包括滾動軸承的外圈、內(nèi)圈和滾動體,在信號采樣頻率為12 kHz下采集振動信號。
圖5 旋轉(zhuǎn)機械故障綜合模擬實驗臺Fig.5 Rotating machinery fault comprehensive simulation test bench
由美國辛辛那提大學(xué)智能維護中心提供的軸承全生命周期數(shù)據(jù)可知,共包含3個試驗,在轉(zhuǎn)速相同的條件下每個實驗出現(xiàn)明顯故障時停止實驗,最后整理試驗數(shù)據(jù)集如表1所示。
表1 滾動軸承全生命周期數(shù)據(jù)集Tab.1 Rolling bearing full life cycle data set
其中,每個樣本中有20 480點,通過表1可以看出,在相同的實驗設(shè)備、實驗環(huán)境以及滾動軸承等條件下,實驗中的每組滾動軸承發(fā)生故障的位置是不同的,并且故障出現(xiàn)的時間也是不一樣的。因此說明滾動軸承的故障具有不確定性,人為的歷史經(jīng)驗很難做出準(zhǔn)確的判斷。
以實驗B(1#滾動軸承)的數(shù)據(jù)作為本文實驗仿真使用的數(shù)據(jù),共包含984個樣本,其中每個樣本中包含20 480點。選擇樣本文件的前400個1#滾動軸承的正常運行數(shù)據(jù)作為模型的訓(xùn)練數(shù)據(jù),后584個1#滾動軸承的退化過程數(shù)據(jù)用于測試模型的性能。為了保證實驗結(jié)果的有效性和準(zhǔn)確性,通過計算采樣頻率和電機轉(zhuǎn)速可以得出,滾動軸承在實驗中旋轉(zhuǎn)一周可以采集600個采樣點,將數(shù)據(jù)按照其周期性將數(shù)據(jù)輸入到模型進行訓(xùn)練和測試。
由機械故障綜合模擬實驗臺可得數(shù)據(jù)集,為了進一步驗證SWDAE-LSTM方法的有效性和可靠性,我們使用采樣頻率為12 kHz,故障直徑為0.2 mm的條件下,3種不同的轉(zhuǎn)速的滾動軸承故障數(shù)據(jù),數(shù)據(jù)類型共10組,最后整理實驗數(shù)據(jù)如表2所示。
表2 滾動軸承故障數(shù)據(jù)Tab.2 Rolling bearing fault data
數(shù)據(jù)集中共有80 000個采樣點,將每200個采樣點劃分為一個樣本,每個故障包含400個樣本,使用前300個樣本作為訓(xùn)練集,后100個樣本作為測試集。
3.2.1 貝葉斯優(yōu)化模型驗證
為了保證模型能更準(zhǔn)確識別出滾動軸承早期故障,本文使用了貝葉斯優(yōu)化算法進行智能調(diào)參。
根據(jù)訓(xùn)練集的大小將隱藏層的個數(shù)設(shè)置為整數(shù)范圍3~5個,隱藏層神經(jīng)元個數(shù)設(shè)置為300~600,并且每次按整百來調(diào)整搜索空間。LSTM的收斂速度和訓(xùn)練精度對批量大?。˙atchsize)的設(shè)置大小十分敏感,所以在待優(yōu)化超參數(shù)選擇中,同樣需要對Batchsize進行優(yōu)化,Batchsize的搜索范圍設(shè)置為90~200,并且每次按整百來調(diào)整搜索空間。目前神經(jīng)網(wǎng)絡(luò)的主要優(yōu)化函數(shù)有Adam、RMSProp、Nadam,經(jīng)BO算法優(yōu)化出最適合模型的優(yōu)化函數(shù)。在激活函數(shù)sigmoid、tanh、relu中經(jīng)迭代搜索出適合模型的激活函數(shù)。訓(xùn)練一個大型的神經(jīng)網(wǎng)絡(luò)時,為防止過擬合的發(fā)生,需引入Dropout歸一化。Dropout的大小決定了在訓(xùn)練過程中神經(jīng)元暫時被丟棄的概率,因此設(shè)置其搜索區(qū)間為0~0.9。由于本文提出的模型使用貝葉斯優(yōu)化方法確定模型超參數(shù),圖6顯示了貝葉斯優(yōu)化算法優(yōu)化模型中超參數(shù)的過程。
圖6 貝葉斯優(yōu)化超參數(shù)過程可視化Fig.6 Visualization of Bayesian optimization hyperparameter process
圖6的橫坐標(biāo)表示的是各待優(yōu)化參數(shù)的選擇區(qū)間,分別為LSTM隱藏層神經(jīng)元個數(shù)、SDAE第一層隱藏層神經(jīng)元個數(shù)、SDAE第二層隱藏層個數(shù)、LSTM的Dropout歸一化大小、SDAE第一層隱藏層Dropout歸一化大小、SDAE第二層隱藏層Dropout歸一化大小、優(yōu)化函數(shù)、激活函數(shù)、Batchsize的大小,縱坐標(biāo)表示模型在驗證集上的均方誤差(mean-square error,MSE),通過參數(shù)估計值與參數(shù)真值之差平方的期望值的公式MSE=,來評價數(shù)據(jù)的變化程度,當(dāng)MSE的值越小時,超參數(shù)預(yù)測值具有更高的精度。貝葉斯在優(yōu)化參數(shù)的過程中使用高斯函數(shù)代替黑箱函數(shù),并通過一致連續(xù)的局部平滑性弱假設(shè),來得到最優(yōu)解。平滑性弱假設(shè)使BO算法有效的利用區(qū)間鄰近信息進行更準(zhǔn)確的推斷,從而選擇更具有“潛力”的點。圖6中的每個小框圖為每個超參數(shù)由BO算法在區(qū)間的搜索過程,即通過主動選擇策略來確定搜索區(qū)間當(dāng)中最具“潛力”的點,圖6中的選中的點表示在設(shè)定好的區(qū)間內(nèi)最具“潛力”的點,即超參數(shù)組合的最優(yōu)解,可見,每個待優(yōu)化超參數(shù)都會影響模型的最后精度。
在貝葉斯智能調(diào)參的過程中,為了顯示任意一組超參數(shù)對模型的影響及其調(diào)參過程的平穩(wěn)性,添加可視化程序,圖中的曲線代表了在BO的過程中,經(jīng)過多次迭代(如20次迭代)之后更新學(xué)習(xí)的超參數(shù)組合對SWDAE-LSTM模型的訓(xùn)練損失率即平均損失誤差,如圖7所示,為模型的訓(xùn)練損失和在驗證集的平均損失誤差。
圖7 貝葉斯優(yōu)化超參數(shù)訓(xùn)練過程Fig.7 BO of the hyperparameter training process
圖7中的曲線代表了網(wǎng)絡(luò)模型使用貝葉斯算法在超參數(shù)空間選擇的一組超參數(shù)進行訓(xùn)練的過程。在訓(xùn)練損失圖中,圖中的任意一條曲線都代表了當(dāng)前超參數(shù)組合進行迭代時的模型訓(xùn)練損失,隨著貝葉斯的優(yōu)化搜索,模型的訓(xùn)練過程逐漸穩(wěn)定其損失也降到最低。BO算法從過去的結(jié)果中進行推理來更新優(yōu)化函數(shù)的后驗概率(參考式(7)~式(9)),不斷搜索到最優(yōu)的超參數(shù)組合。從平均絕對誤差圖中可以看出,模型在驗證集的平均絕對誤差從0.017左右下降到0.002左右,迭代訓(xùn)練過程也趨于平穩(wěn),可以證明BO算法選擇出了可以使模型精度顯著提高和泛化能力顯著增強的一組最優(yōu)超參數(shù),避免了手動調(diào)節(jié)超參數(shù)造成的大量時間損耗以及超參數(shù)組合的不平穩(wěn)性。
為了驗證BO算法選擇出來的最優(yōu)超參數(shù)組合的精度是否滿足要求,將優(yōu)化出的超參數(shù)組合代入本文提出的模型中,得到振動信號訓(xùn)練模型的損失下降圖,如圖8所示。
圖8 最優(yōu)超參數(shù)模型訓(xùn)練過程Fig.8 The training process of the optimal hyperparameter model
從圖8中可以看出,經(jīng)過貝葉斯優(yōu)化選擇出的超參數(shù)組合,在模型訓(xùn)練過程中,模型的收斂速度更快且在收斂過程中波動較小。隨著迭代的完成,模型的訓(xùn)練損失降到0.000 751,損失率為0.075 1%,準(zhǔn)確率達到了99.91%,模型的平均絕對誤差降到0.016 59,此時模型提取數(shù)據(jù)的特征較為充分,精度高并且穩(wěn)定。
驗證模型滿足精度要求后,在模型訓(xùn)練超參數(shù)過程中添加顯示程序,訓(xùn)練結(jié)束時顯示優(yōu)化好的超參數(shù)組合,得到本文模型超參數(shù)組合如表3所示。
表3 經(jīng)過優(yōu)化的模型超參數(shù)Tab.3 Optimized model hyperparameters
3.2.2 滾動軸承早期故障預(yù)測
選擇實驗B的1#滾動軸承的運行數(shù)據(jù)進行仿真,如圖9為實驗B中1#滾動軸承全生命周期的原始時域振動信號圖。由圖中可以看出,滾動軸承在大約750個樣本(約125 h)前的時域信號是比較平穩(wěn)的,在大約750個數(shù)據(jù)樣本之后時域信號出現(xiàn)了非常明顯的異常,即滾動軸承發(fā)生了較為明顯的損傷,并且之后時域信號出現(xiàn)了波谷現(xiàn)象,即滾動軸承外圈故障中典型的“治愈現(xiàn)象”,由于損傷出現(xiàn)后在循環(huán)力的作用下,損傷位置被短暫的磨合至光滑,之后出現(xiàn)重度損傷之后,滾動軸承不再被“治愈”直至失效。
圖9 1#滾動軸承全生命周期振動信號Fig.9 1#rolling bearing full life cycle vibration signal
基于時域統(tǒng)計指標(biāo)經(jīng)常被用在滾動軸承狀態(tài)識別中,常用的時域統(tǒng)計指標(biāo)有平均值,均方差根值和峭度。圖10分別為1#滾動軸承的這幾種時域統(tǒng)計指標(biāo)值。
從圖10可以看出,圖10(a)平均值基本上不能有效反映滾動軸承的退化趨勢和故障狀態(tài)。從圖10(b)RMS值可以看出,大約從500個樣本(約83 h)左右開始有上升趨勢,反映了軸承退化的早期,信號幅值較正常狀態(tài)有了相對明顯的增加,但是加速度相對平穩(wěn)增加,隨著損傷的加深,RMS值出現(xiàn)波動并逐漸增大。但是RMS沒有較大的變化峰值,曲線變化相對緩慢。圖10(c)Kurtosis值對沖擊信號較為敏感,在故障樣本出現(xiàn)時其信號幅值也產(chǎn)生了相對的突變,但不同于RMS,隨著故障的加深,其信號幅值波動較大,在退化末期更為敏感,軸承接近失效,而在退化早期沖擊信號并不明顯,所以相比較于RMS值,從Kurtosis值圖中沒有有效反映出滾動軸承的退化早期,并且在退化末期出現(xiàn)了下降的趨勢。
圖10 時域統(tǒng)計指標(biāo)識別滾動軸承狀態(tài)Fig.10 1#rolling bearing full life cycle vibration signal
基于時域的統(tǒng)計指標(biāo)雖然可以在一定程度下反映滾動軸承的退化趨勢,但是不能很好的反映滾動軸承早期故障的變化和退化后期的各個階段。將BO算法選擇出的最優(yōu)超參數(shù)組合代入模型中進行訓(xùn)練,如圖11所示,為本文提出的基于貝葉斯優(yōu)化的SWDAELSTM模型對滾動軸承運行狀態(tài)的描述。
圖11 1#滾動軸承全生命周期描述曲線Fig.11 Full life cycle description curve of 1#rolling bearing
從圖11可以看出,經(jīng)過BO算法優(yōu)化的模型可以檢測到在第10 070個周期左右首先出現(xiàn)異常的測試數(shù)據(jù)較正常狀態(tài)信號幅值明顯增加(軸承運行90 h左右)。與圖8相比,提前了將近30 h發(fā)現(xiàn)軸承故障。然后數(shù)據(jù)趨于正常,直到第14 500周期左右異常信號出現(xiàn)之后異常的測試數(shù)據(jù)出現(xiàn)的時間間隔逐漸變短,且每次異常信號的幅值也逐漸增大,直至滾動軸承完全失效。這符合滾動軸承的生命周期(從正常到完全失效的過程)。與均方差根值和峭度統(tǒng)計指標(biāo)的方法相比,經(jīng)過BO算法優(yōu)化的SWDAE-LSTM的模型可以很好的反映滾動軸承的早期故障的變化和退化的各個階段。即當(dāng)滾動軸承的外圈出現(xiàn)初始異常時,隨著滾動軸承的繼續(xù)運行,外圈損傷將被滾動體不斷磨合,滾動軸承的異常信號會出現(xiàn)短期的相對正常的數(shù)據(jù)。隨著滾動軸承的繼續(xù)運行,并且重復(fù)損傷與磨合的過程,但是相對正常數(shù)據(jù)產(chǎn)生的時間間隔被縮短,直至不會再出現(xiàn)類似正常數(shù)據(jù)。
殘差是基于實時在線運行數(shù)據(jù)對滾動軸承的運行狀態(tài)進行監(jiān)測的方法之一,訓(xùn)練之后的SWDAE-LSTM網(wǎng)絡(luò)能夠預(yù)測下一時刻的振動數(shù)據(jù),預(yù)測的振動數(shù)據(jù)與實時在線的輸入數(shù)據(jù)進行殘差計算,之后利用重構(gòu)誤差來識別滾動軸承運行過程中的異常振動情況,如圖11可知,能夠提前30 h時監(jiān)測出滾動軸承的異常振動信號。因此有理由相信殘差能夠為滾動軸承早期故障預(yù)測提供健康監(jiān)測指標(biāo)。
3.2.3 滾動軸承故障試驗
為了驗證SWDAE-LSTM網(wǎng)絡(luò)的有效性,我們使用故障程度最小的故障軸承數(shù)據(jù)集,數(shù)據(jù)集共包含了10組實驗數(shù)據(jù),共4種滾動軸承的運行狀態(tài):正常狀態(tài)、內(nèi)圈故障、外圈故障、滾動體故障。為了保證模型的魯棒新和準(zhǔn)確性,我們使用歷史正常數(shù)據(jù)對網(wǎng)絡(luò)進行訓(xùn)練,之后將4種故障數(shù)據(jù)輸入到訓(xùn)練好的模型中,使用重構(gòu)誤差來判斷滾動軸承的運行狀態(tài)。
圖12中可以看出,4種故障中,外圈故障最為明顯,而其余兩種故障與滾動軸承正常狀態(tài)相差較小,較難區(qū)分。
圖12 4種故障數(shù)據(jù)時域圖Fig.12 Four fault data time domain diagrams
圖13顯示了滾動軸承震動數(shù)據(jù),經(jīng)SWDAELSTM網(wǎng)絡(luò)重構(gòu)誤差之后的結(jié)果圖。
圖13 4種故障診斷的重構(gòu)誤差Fig.13 Reconstruction errors of four fault diagnoses
如圖13所示,顯示了經(jīng)過BO算法優(yōu)化的SWDAE-LSTM網(wǎng)絡(luò)對滾動軸承進行故障診斷的結(jié)果,可以看出,正常狀態(tài)的重構(gòu)誤差在2.5左右波動,而故障狀態(tài)的重構(gòu)誤差大于正常狀態(tài),在3.7~17.5波動,正常狀態(tài)的重構(gòu)誤差與故障狀態(tài)的重構(gòu)誤差具有明顯的差異,說明經(jīng)過BO算法優(yōu)化的SWDAE-LSTM網(wǎng)絡(luò)能夠?qū)L動軸承的正常狀態(tài)和故障狀態(tài)很好的分隔開來,同時,內(nèi)圈故障的重構(gòu)誤差在7.5左右波動,滾動體故障的重構(gòu)誤差在3.5左右波動,外圈故障的重構(gòu)誤差在12.5~17.5波動,每個故障的重構(gòu)誤差都不存在重疊部分,可以證明本文提出的方法能夠有效的對滾動軸承的故障進行診斷。
為了驗證本文提出的基于貝葉斯優(yōu)化的SWDAELSTM(以下簡稱SDLSTM)方法的穩(wěn)定性和先進性,將BO之后的SWDAE-LSTM算法與Kurtosis、RMS、SDAE+RMS、SDAE+Kurtosis進行了比較。
3.3.1 全生命周期數(shù)據(jù)仿真實驗分析
為了驗證本文提出的基于BO的SWDAE-LSTM模型的有效性,使用IMS數(shù)據(jù)集,將本文提出的模型與常用的是與特征提取的方法進行了比較。圖14中,①號線代表本文提出的經(jīng)BO的SWDAE-LSTM算法,②號線代表Kurtosis統(tǒng)計指標(biāo),③號線代表RMS統(tǒng)計指標(biāo),④號線代表SDAE和RMS提取的特征,⑤號線代表特征由SDAE和Kurtosis提取。
圖14 故障預(yù)測算法提取特征結(jié)果比較Fig.14 Fault prediction algorithm to extract feature results comparison
圖14描述了故障的發(fā)展,圖中Ⅰ、Ⅱ分別是早期故障階段和重度故障階段。從Ⅰ中可以看出,Kurtosis和本文提出的方法對初始異常的診斷有相似的效果,對于Kurtosis來說,它對信號的異常變化非常敏感,當(dāng)滾動軸承運行異常時,振動信號會有一個瞬態(tài)尖峰,因此Kurtosis會有明顯的變化,但是會造成診斷結(jié)果不穩(wěn)定,造成誤判的機率會增大。且從Ⅱ中可以看出,Kurtosis并不能很好地反映滾動軸承從早期故障到退化末期的逐步失效趨勢,對維修指導(dǎo)意義不大。所以不能為評估滾動軸承的狀況提供非常有價值的診斷特征。而對于RMS,在滾動軸承早期故障產(chǎn)生時其振動信號并沒有產(chǎn)生異常,在Ⅱ中看出,RMS只在故障產(chǎn)生的后期出現(xiàn)了波動,且波動幅度很小,所以不能作為評估指標(biāo)來很好的反映滾動軸承的運行狀態(tài)。另外兩種方法(SDAE+RMS、SDAE+Kurtosis),由Ⅰ可以看出,雖然通過SDAE訓(xùn)練,學(xué)習(xí)到了穩(wěn)定的特性,但是對狀態(tài)變化并不敏感。而經(jīng)過BO的SWDAE-LSTM算法不僅可以對滾動軸承早期異常非常敏感,并且可以反映滾動軸承后期的退化趨勢,在診斷過程中滾動軸承的信號穩(wěn)定,因此能夠?qū)L動軸承早期故障進行預(yù)測。
3.3.2 定量對比分析
為了進一步定量驗證本文提出的基于貝葉斯優(yōu)化的SWDAE-LSTM方法的有效性,利用SVDD來表示故障發(fā)生時的信號位置。同樣的,我們將SVDD與表4中的其他幾種方法結(jié)合起來,顯示每種方法的預(yù)測周期通過比較故障報警發(fā)生時的運行時間來評估不同方法的有效性。對實驗B中1#滾動軸承進行早期異常的預(yù)測,為了說明使用深度學(xué)習(xí)方法的先進性和有效性,使用單類的SVM方法和本文方法進行對比。預(yù)測的結(jié)果如圖15所示。
圖15 1#滾動軸承故障預(yù)測結(jié)果定量比較Fig.15 Quantitative comparison of failure prediction results of 1#rolling bearing
由圖15可以看出,經(jīng)BO的SWDAE-LSTM模型可以在10 070個周期內(nèi)進行故障報警。相比其他方法,BO算法優(yōu)化的網(wǎng)絡(luò)的精度更高,能夠更早的發(fā)現(xiàn)滾動軸承的早期故障,效果優(yōu)于其他方法。在RMS、Kurtosis這兩種方法結(jié)合了SDAE后,相對于直接使用統(tǒng)計指標(biāo)RMS、Kurtosis的早期故障預(yù)測時間,雖然提前了約600個周期,提高了滾動軸承早期故障預(yù)測的效果,但仍滯后于本文所提方法。因此,經(jīng)BO的SWDAE-LSTM模型可以更早的預(yù)測到滾動軸承早期故障的出現(xiàn),能夠?qū)L動軸承早期故障進行預(yù)測,末期退化過程也得到良好反映,同時也表明SDAE提取的數(shù)據(jù)特征更加穩(wěn)定。
3.3.3 滾動軸承故障診斷實驗分析
為了驗證經(jīng)過BO算法優(yōu)化的SWDAE-LSTM網(wǎng)絡(luò)的有效性和可靠性,將本文提出的方法與支持向量機自編碼、堆棧降噪自編碼、循環(huán)神經(jīng)網(wǎng)絡(luò)、SDAE-RNN這幾種常見的故障診斷方法的結(jié)果分別進行對比。其中SVM的輸入維滾動軸承振動信號的16個時域統(tǒng)計特征和13個頻域特征,并且選擇SVM常用的損失函數(shù)L2,對于RNN、AE、SDAE、SDAE-RNN的輸入與本文提出的方法使用同一個輸入數(shù)據(jù)。同理,為了保證實驗的可比較性,我們將要對比的網(wǎng)絡(luò)的超參數(shù)有BO算法驚醒優(yōu)化得出,如表4所示,為模型的部分超參數(shù)。
表4 不同方法超參數(shù)設(shè)置Tab.4 Different methods for hyperparameter setting
上述方法均使用Adam自適應(yīng)學(xué)習(xí)率的方法對模型進行訓(xùn)練,經(jīng)過迭代訓(xùn)練之后,得出每個方法所對應(yīng)的準(zhǔn)確率,如表5及圖16所示。
表5 不同方法診斷精度Tab.5 Different diagnostic accuracy methods %
圖16 模型診斷結(jié)果Fig.16 Model diagnosis results
如圖16所示,為每種方法的故障診斷精度,SVM相比于其他深度學(xué)習(xí)其準(zhǔn)確率較低,說明人工擬合特征結(jié)合模式識別并不能對故障進行準(zhǔn)確識別,具有一定的局限性。AE與SDAE在特征提取方面其準(zhǔn)確率由于RNN,SDAE經(jīng)過多層非線性映射,相比于AE來說,其非線性特征提取能力較強。由于采用的輸入數(shù)據(jù)一致,但SDAE-RNN網(wǎng)絡(luò)的故障診斷準(zhǔn)確率相比于SDAE-LSTM較低,在經(jīng)過滑動窗之算法預(yù)處理的數(shù)據(jù),保留了數(shù)據(jù)之間的時序關(guān)聯(lián)特性,LSTM能夠提取數(shù)據(jù)之間的時序關(guān)聯(lián)特性。綜上,SWDAE-LSTM網(wǎng)絡(luò)在故障診斷方面也具有很高的精度,證明經(jīng)過BO算法優(yōu)化的SWDAE-LSTM網(wǎng)絡(luò)的有效性和可靠性。
(1)簡述了滾動軸承早期故障診斷的重要性,指出傳統(tǒng)時域特征提取方法的不足,以及超參數(shù)組合對模型精度的影響,提出一種基于貝葉斯優(yōu)化的SWDAELSTM網(wǎng)絡(luò)模型。
(2)提出的模型不僅可以學(xué)習(xí)數(shù)據(jù)的分布,保留數(shù)據(jù)之間的時序相關(guān)性,而且在超參數(shù)選擇方面,避免了手動調(diào)參費時和參數(shù)不確定性的問題,保證了模型的精度和準(zhǔn)確率,能更好的監(jiān)測滾動軸承運行狀態(tài)。
(3)經(jīng)貝葉斯優(yōu)化的模型與其他特征提取模型結(jié)合SVDD和單類別SVM方法相比,可以更早有效的預(yù)測出滾動軸承的早期故障,且具有很強的魯棒性,對于預(yù)測滾動軸承的早期故障和生命周期計算具有重要意義。