□ 郭雙全
上海電氣集團(tuán)股份有限公司 中央研究院 上海 200070
滾動(dòng)軸承是風(fēng)電機(jī)組、汽輪機(jī)、電動(dòng)機(jī)、機(jī)床等工業(yè)旋轉(zhuǎn)類設(shè)備的重要零部件。滾動(dòng)軸承故障,易造成較大的停機(jī)損失和影響。因此,及時(shí)識(shí)別或預(yù)警滾動(dòng)軸承的故障狀態(tài),對(duì)于保障設(shè)備安全運(yùn)行和高效運(yùn)維有重要意義。
在工程實(shí)踐中,為保障大型設(shè)備可靠運(yùn)行,往往配備在線監(jiān)測系統(tǒng),對(duì)振動(dòng)、電氣、壓力等關(guān)鍵參數(shù)進(jìn)行動(dòng)態(tài)高頻采樣監(jiān)測。采用傳統(tǒng)故障狀態(tài)診斷方法時(shí),通過時(shí)域分析、頻域分析、時(shí)頻分析等進(jìn)行特征提取[1-3],通過支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林等方法進(jìn)行故障狀態(tài)識(shí)別[4]。隨著深度學(xué)習(xí)技術(shù)在視覺和語音識(shí)別方面的快速發(fā)展,部分學(xué)者開始研究卷積神經(jīng)網(wǎng)絡(luò)在軸承故障診斷方面的應(yīng)用[5]。李恒等[6]提出短時(shí)傅里葉變換和卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的軸承故障診斷方法。韓樹發(fā)等[7]提出一種改進(jìn)的深度遷移學(xué)習(xí)算法——聯(lián)合領(lǐng)域自適應(yīng)算法,與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合,進(jìn)行多工況故障診斷,效果優(yōu)于單一卷積神經(jīng)網(wǎng)絡(luò)。
雖然采用卷積神經(jīng)網(wǎng)絡(luò)可以在一定程度上實(shí)現(xiàn)對(duì)軸承故障狀態(tài)下復(fù)雜時(shí)頻特征的提取,但是模型層數(shù)和模型參數(shù)的確定需要多次嘗試和較多的經(jīng)驗(yàn),還未形成可靠的方法,往往訓(xùn)練的模型泛化性能不足。集成學(xué)習(xí)算法可以通過對(duì)多個(gè)弱學(xué)習(xí)器的融合,顯著提高模型的泛化性能[8]。由此,筆者針對(duì)振動(dòng)信號(hào)時(shí)頻譜圖,即短時(shí)傅里葉變換譜的數(shù)據(jù)結(jié)構(gòu)特點(diǎn),設(shè)計(jì)三個(gè)不同的卷積神經(jīng)網(wǎng)絡(luò)模型,通過全連接神經(jīng)網(wǎng)絡(luò)對(duì)這三個(gè)不同的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行融合,采用常用的引導(dǎo)聚集集成學(xué)習(xí)方法訓(xùn)練融合模型,實(shí)現(xiàn)對(duì)滾動(dòng)軸承故障狀態(tài)的智能識(shí)別。通過試驗(yàn)將融合模型與單一卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)比,從模型測試結(jié)果準(zhǔn)確性、訓(xùn)練過程穩(wěn)定性及效率等方面進(jìn)行對(duì)比分析。
滾動(dòng)軸承的振動(dòng)信號(hào)是典型的非平穩(wěn)信號(hào),一般采用時(shí)頻分析作為振動(dòng)信號(hào)處理的基本方法。常見的時(shí)頻分析方法包括短時(shí)傅里葉變換、小波變換、S變換、希爾伯特-黃變換等。時(shí)頻分析得到的時(shí)頻譜圖反映出滾動(dòng)軸承振動(dòng)信號(hào)在不同時(shí)間與頻率維度下的能量強(qiáng)度,可以多角度展現(xiàn)振動(dòng)信號(hào)的細(xì)節(jié)變化,有效描述振動(dòng)信號(hào)細(xì)微變化的滾動(dòng)軸承故障特征。
筆者采用短時(shí)傅里葉變換方法對(duì)滾動(dòng)軸承振動(dòng)信號(hào)進(jìn)行預(yù)處理,得到時(shí)頻譜圖。短時(shí)傅里葉變換方法采用固定長度的窗函數(shù)對(duì)振動(dòng)信號(hào)進(jìn)行截取,對(duì)截取的振動(dòng)信號(hào)進(jìn)行傅里葉變換計(jì)算,得到某時(shí)刻的局部頻譜。連續(xù)在時(shí)間軸上移動(dòng)窗函數(shù),截取振動(dòng)信號(hào)進(jìn)行傅里葉變換,最終得到不同時(shí)刻的局部頻譜的集合,結(jié)果為關(guān)于時(shí)刻t與頻率f的二維函數(shù)。短時(shí)傅里葉變換方法理論公式為:
(1)
式中:τ為時(shí)刻;x(τ)為時(shí)刻τ的振動(dòng)信號(hào);ω(τ-t)為時(shí)刻τ與時(shí)刻t時(shí)間差對(duì)應(yīng)的窗函數(shù)。
在實(shí)際信號(hào)處理中,振動(dòng)信號(hào)一般為離散的高頻采樣序列,需要采用短時(shí)傅里葉變換離散計(jì)算公式:
(2)
式中:m為離散采樣時(shí)刻順序;n為離散頻率點(diǎn)順序;s[k]為第k個(gè)離散采樣時(shí)刻信號(hào);γ(k-m)為離散采樣時(shí)刻順序k與m差值對(duì)應(yīng)的離散窗函數(shù);L為離散窗函數(shù)長度。
輸出的離散結(jié)果S[m,n]為二維時(shí)頻譜圖,如圖1所示。假設(shè)短時(shí)傅里葉變換輸出矩陣大小為Ms×Ns,時(shí)間維度Ms為56,頻率維度Ns為501。時(shí)頻譜圖反映了信號(hào)在不同時(shí)刻和頻率的幅值大小,既是時(shí)域和頻域特性的綜合體現(xiàn),也可以看作是信號(hào)在Ms個(gè)不同時(shí)刻對(duì)應(yīng)的頻率分布情況或信號(hào)在Ns個(gè)不同頻率對(duì)應(yīng)的時(shí)間變化趨勢。
圖1 二維時(shí)頻譜圖
卷積神經(jīng)網(wǎng)絡(luò)一般由輸入層、卷積層、池化層、過渡層、全連接層、輸出層組成,通過多層特征提取層能自適應(yīng)從輸入信息中充分挖掘抽象特征,具有較強(qiáng)的泛化能力和判別能力,同時(shí)具有對(duì)移動(dòng)、縮放、扭曲不變性的特點(diǎn)。卷積神經(jīng)網(wǎng)絡(luò)可以將振動(dòng)信號(hào)預(yù)處理得到的時(shí)頻譜圖作為輸入層,進(jìn)行自動(dòng)特征提取識(shí)別時(shí)頻特性,實(shí)現(xiàn)狀態(tài)識(shí)別。
卷積層主要通過將輸入特征圖與多個(gè)卷積核進(jìn)行卷積計(jì)算,加上偏置項(xiàng),經(jīng)過激活函數(shù),輸出新的特征圖。假設(shè)卷積層的輸入特征圖包含N個(gè)通道,輸出特征圖包含M個(gè)通道,則有[9]:
(3)
式中:Cq為卷積層輸出特征圖第q個(gè)通道矩陣;Xp為輸入特征圖第p個(gè)通道矩陣;Wpq為輸入特征圖第p個(gè)通道矩陣在進(jìn)行卷積計(jì)算得到輸出特征圖第q個(gè)通道矩陣時(shí)采用的卷積核權(quán)重矩陣;bq為偏置項(xiàng);F為激活函數(shù)。
池化層主要對(duì)輸入特征圖進(jìn)行計(jì)算變換,包括最大值池化、平均值池化、隨機(jī)值池化等,輸出尺寸較小的特征圖,同時(shí)保持特征基本尺度不變。池化層一般只改變特征圖的尺寸大小,不做權(quán)值更新。
過渡層一般作為卷積層或池化層與全連接層連接的過渡層,將輸入特征圖展開為一維特征向量,不做實(shí)際計(jì)算。
全連接層對(duì)輸入的一維特征向量進(jìn)行加權(quán)求和偏置,通過激活函數(shù),輸出新的一維特征向量,計(jì)算式為:
(4)
式中:yv為全連接層輸出特征向量對(duì)應(yīng)值;xu為全連接層輸入特征向量對(duì)應(yīng)值;U為全連接層輸入特征向量總數(shù);J為全連接層輸出特征向量總數(shù);wuv為對(duì)應(yīng)權(quán)重因數(shù);bv為偏置項(xiàng);θ為激活函數(shù)。
為設(shè)計(jì)出合適的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),需綜合考慮輸入圖像大小、各層類型、卷積核大小與數(shù)量等多種因素。一般采用常用的深度學(xué)習(xí)網(wǎng)絡(luò),結(jié)合數(shù)據(jù)特點(diǎn)和專業(yè)經(jīng)驗(yàn)進(jìn)行修改,通過改變各層網(wǎng)絡(luò)參數(shù)或適當(dāng)增加網(wǎng)絡(luò)層數(shù),建立適合根據(jù)滾動(dòng)軸承短時(shí)傅里葉變換時(shí)頻譜圖進(jìn)行故障診斷的網(wǎng)絡(luò)模型。
LeNet-5是一種用于手寫體字符識(shí)別的非常高效的卷積神經(jīng)網(wǎng)絡(luò)[10]。這一卷積神經(jīng)網(wǎng)絡(luò)總共包括七層:三層卷積層、兩層池化層、兩層全連接層,網(wǎng)絡(luò)將3像素×32像素×32像素手寫體圖片輸入數(shù)據(jù)轉(zhuǎn)換為10節(jié)點(diǎn)輸出向量,0~9代表模型識(shí)別的數(shù)字。筆者在LeNet-5網(wǎng)絡(luò)的基礎(chǔ)上,將短時(shí)傅里葉變換輸出矩陣呈現(xiàn)的時(shí)頻譜圖作為輸入,根據(jù)時(shí)頻譜圖在時(shí)域和頻域不同的尺度大小,以及不同的卷積操作形式,改變網(wǎng)絡(luò)參數(shù),設(shè)計(jì)典型的卷積神經(jīng)網(wǎng)絡(luò)模型,將時(shí)頻譜圖輸入數(shù)據(jù)轉(zhuǎn)換為對(duì)應(yīng)的滾動(dòng)軸承故障狀態(tài)的節(jié)點(diǎn)輸出。
為了充分應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)綜合提取滾動(dòng)軸承振動(dòng)信號(hào)預(yù)處理得到的時(shí)頻譜圖特征,筆者考慮設(shè)計(jì)三個(gè)不同的卷積神經(jīng)網(wǎng)絡(luò):二維卷積神經(jīng)網(wǎng)絡(luò)、一維時(shí)域卷積神經(jīng)網(wǎng)絡(luò)、一維頻域卷積神經(jīng)網(wǎng)絡(luò)。
將短時(shí)傅里葉變換Ms×Ns輸出矩陣呈現(xiàn)的時(shí)頻譜圖作為單通道二維圖像,構(gòu)建二維卷積神經(jīng)網(wǎng)絡(luò),對(duì)應(yīng)二維的卷積核和池化核。二維卷積神經(jīng)網(wǎng)絡(luò)能夠利用卷積特性在頻域和時(shí)域上同時(shí)提取特征。二維卷積神經(jīng)網(wǎng)絡(luò)如圖2所示,包括輸入層、三個(gè)卷積層、三個(gè)池化層、過渡層、三個(gè)全連接層、輸出層。其中,輸入層為時(shí)頻譜圖的簡化表示,各個(gè)卷積層和池化層的輸出為對(duì)應(yīng)的特征圖,過渡層用于將池化層的輸出特征圖平鋪展開為一維特征向量,與全連接層的神經(jīng)元一一映射。圖2中各標(biāo)識(shí)數(shù)字為網(wǎng)絡(luò)設(shè)計(jì)參數(shù),如“輸入層1通道501×56”表示輸入層為單通道,Ns為501,Ms為56;“卷積層15×3核”表示卷積層采用對(duì)應(yīng)大小的二維卷積核;“特征圖3通道164×54”表示經(jīng)過卷積層計(jì)算后輸出的特征圖包括三個(gè)通道,每個(gè)通道的大小為164×54;“隱含神經(jīng)元400個(gè)”表示與全連接層相連的隱含神經(jīng)元的數(shù)量。輸出層的節(jié)點(diǎn)數(shù)對(duì)應(yīng)軸承故障的狀態(tài)數(shù)。
圖2 二維卷積神經(jīng)網(wǎng)絡(luò)
可以將短時(shí)傅里葉變換輸出矩陣呈現(xiàn)的時(shí)頻譜圖看作按頻率維度劃分的對(duì)應(yīng)Ns個(gè)頻率通道的時(shí)間變化子圖的集合,從而構(gòu)建一維時(shí)域卷積神經(jīng)網(wǎng)絡(luò),對(duì)應(yīng)一維的卷積核和池化核。一維時(shí)域卷積神經(jīng)網(wǎng)絡(luò)側(cè)重利用卷積特性在時(shí)域上提取特征。一維時(shí)域卷積神經(jīng)網(wǎng)絡(luò)如圖3所示,包括輸入層、三個(gè)卷積層、兩個(gè)池化層、過渡層、三個(gè)全連接層、輸出層。其中,輸入層是時(shí)頻譜圖按頻率維度進(jìn)行通道劃分后的簡化表示,各個(gè)卷積層和池化層的輸出為對(duì)應(yīng)的特征圖。
圖3 一維時(shí)域卷積神經(jīng)網(wǎng)絡(luò)
可以將短時(shí)傅里葉變換輸出矩陣呈現(xiàn)的時(shí)頻譜圖看作按時(shí)間維度劃分的對(duì)應(yīng)Ms個(gè)時(shí)間通道的一維頻率分布子圖的集合,從而構(gòu)建一維頻域卷積神經(jīng)網(wǎng)絡(luò),對(duì)應(yīng)一維的卷積核和池化核。一維頻域卷積神經(jīng)網(wǎng)絡(luò)側(cè)重利用卷積特性在頻域上提取特征。一維頻域卷積神經(jīng)網(wǎng)絡(luò)如圖4所示,包括輸入層、三個(gè)卷積層、兩個(gè)池化層、過渡層、三個(gè)全連接層、輸出層。其中,輸入層是時(shí)頻譜圖按時(shí)間維度進(jìn)行通道劃分后的簡化表示,各個(gè)卷積層和池化層的輸出為對(duì)應(yīng)的特征圖。
圖4 一維頻域卷積神經(jīng)網(wǎng)絡(luò)
集成學(xué)習(xí)時(shí),訓(xùn)練若干個(gè)個(gè)體學(xué)習(xí)器,通過一定的結(jié)合策略,形成一個(gè)強(qiáng)學(xué)習(xí)器。根據(jù)個(gè)體學(xué)習(xí)器之間依賴關(guān)系的不同,集成方法一般分為引導(dǎo)聚集算法和提升算法兩種。筆者采用引導(dǎo)聚集算法對(duì)設(shè)計(jì)的三個(gè)不同卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行集成,形成融合模型。集成學(xué)習(xí)如圖5所示。
圖5 集成學(xué)習(xí)
引導(dǎo)聚集算法首先通過對(duì)樣本數(shù)為N的訓(xùn)練集T進(jìn)行有放回的隨機(jī)采樣,構(gòu)建出與訓(xùn)練集大小相同的采樣集T1、T2、T3,然后利用采樣集分別訓(xùn)練二維卷積神經(jīng)網(wǎng)絡(luò)模型、一維時(shí)域卷積神經(jīng)網(wǎng)絡(luò)模型、一維頻域卷積神經(jīng)網(wǎng)絡(luò)模型,最后對(duì)這三個(gè)卷積網(wǎng)絡(luò)模型的輸出采用結(jié)合策略集成,一般結(jié)合策略包括平均法、投票法、學(xué)習(xí)法。筆者采用學(xué)習(xí)法設(shè)計(jì)一種常規(guī)全連接神經(jīng)網(wǎng)絡(luò)進(jìn)行集成,最終得到融合模型。全連接神經(jīng)網(wǎng)絡(luò)的輸出即為融合模型的最終輸出結(jié)果。全連接神經(jīng)網(wǎng)絡(luò)如圖6所示,包括輸入層、隱含層、輸出層。將前述三個(gè)不同卷積神經(jīng)網(wǎng)絡(luò)模型的輸出結(jié)果作為輸入層,經(jīng)過隱含層計(jì)算后輸出最終結(jié)果,即為軸承的故障狀態(tài)。
圖6 全連接神經(jīng)網(wǎng)絡(luò)
為驗(yàn)證模型訓(xùn)練效果,采用滾動(dòng)軸承振動(dòng)數(shù)據(jù)集,經(jīng)過處理得到某滾動(dòng)軸承在正常、外圈故障、內(nèi)圈故障、滾動(dòng)體故障時(shí),受到不同轉(zhuǎn)速和負(fù)載情況的振動(dòng)信號(hào)樣本472條,每條樣本信號(hào)的采樣頻率為12 000 Hz,采樣時(shí)長為1 s。滾動(dòng)軸承正常、外圈故障、內(nèi)圈故障、滾動(dòng)體故障四種狀態(tài)的樣本數(shù)依次為a、b、c、d。
采用前述步驟,將樣本劃分為訓(xùn)練集和測試集,進(jìn)行對(duì)比訓(xùn)練,比較融合模型和單一卷積神經(jīng)網(wǎng)絡(luò)模型在訓(xùn)練精度和效率上的差異。訓(xùn)練策略為通過集成學(xué)習(xí)對(duì)融合模型進(jìn)行訓(xùn)練,包括對(duì)二維卷積神經(jīng)網(wǎng)絡(luò)模型、一維時(shí)域卷積神經(jīng)網(wǎng)絡(luò)模型、一維頻域卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,以及對(duì)全連接神經(jīng)網(wǎng)絡(luò)訓(xùn)練K次。將K設(shè)為10、30、50,逐漸增加集成學(xué)習(xí)的訓(xùn)練次數(shù),并在每次集成學(xué)習(xí)訓(xùn)練后利用測試集對(duì)融合模型和單一卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行驗(yàn)證。驗(yàn)證準(zhǔn)確率隨集成學(xué)習(xí)訓(xùn)練次數(shù)的變化曲線如圖7所示。
以驗(yàn)證準(zhǔn)確率99%為基準(zhǔn),由圖7可以看出,融合模型比三個(gè)單一卷積神經(jīng)網(wǎng)絡(luò)模型更快收斂達(dá)到基準(zhǔn),并且訓(xùn)練過程更為穩(wěn)定,而單一卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中存在一定的震蕩。另一方面,不同K值對(duì)應(yīng)的融合模型收斂次數(shù)并無明顯變化,表明采用全連接神經(jīng)網(wǎng)絡(luò)進(jìn)行融合具有較好的泛化能力,在實(shí)際應(yīng)用中選取較小的K即可達(dá)到提高準(zhǔn)確率的效果。
圖7 驗(yàn)證準(zhǔn)確率隨集成學(xué)習(xí)訓(xùn)練次數(shù)變化曲線
為進(jìn)一步驗(yàn)證融合模型對(duì)驗(yàn)證準(zhǔn)確率的改善效果,對(duì)固定K值的三種情況分別進(jìn)行三次重復(fù)試驗(yàn),共計(jì)九次,統(tǒng)計(jì)各次試驗(yàn)中融合模型和各單一卷積神經(jīng)網(wǎng)絡(luò)模型分別達(dá)到驗(yàn)證準(zhǔn)確率99%所需的訓(xùn)練次數(shù),具體見表1。由表1數(shù)據(jù)可以看出,融合模型所需訓(xùn)練次數(shù)相比單一卷積神經(jīng)網(wǎng)絡(luò)模型所需訓(xùn)練次數(shù)明顯減少,具有較好的穩(wěn)定性。
表1 驗(yàn)證準(zhǔn)確率達(dá)到99%試驗(yàn)結(jié)果
筆者提出的多卷積神經(jīng)網(wǎng)絡(luò)融合的滾動(dòng)軸承故障識(shí)別方法,集成了多種不同結(jié)構(gòu)類型的卷積神經(jīng)網(wǎng)絡(luò),提高了對(duì)滾動(dòng)軸承振動(dòng)信號(hào)時(shí)頻特征的提取能力。試驗(yàn)結(jié)果表明,與單一卷積神經(jīng)網(wǎng)絡(luò)模型相比,通過集成學(xué)習(xí)得到的多卷積神經(jīng)網(wǎng)絡(luò)融合模型能夠通過較少的訓(xùn)練次數(shù)達(dá)到相同的驗(yàn)證準(zhǔn)確率,有效識(shí)別滾動(dòng)軸承故障狀態(tài),并且訓(xùn)練過程穩(wěn)定性和泛化性較好。后續(xù)可以通過優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)和改進(jìn)集成學(xué)習(xí)策略,不斷提高模型對(duì)滾動(dòng)軸承故障的識(shí)別精度。