王 鑫, 胡天亮, 習(xí) 爽*
(1.南京林業(yè)大學(xué)機(jī)械電子工程學(xué)院,江蘇 南京 210000;2.山東大學(xué)機(jī)電工程學(xué)院,山東 濟(jì)南 250000)
軸承廣泛地應(yīng)用于各種機(jī)電裝備產(chǎn)品中,如機(jī)床、礦山機(jī)械,航天航空設(shè)備、汽車(chē)等,一旦其出現(xiàn)故障,將導(dǎo)致整個(gè)設(shè)備不能正常運(yùn)轉(zhuǎn),嚴(yán)重時(shí)甚至導(dǎo)致設(shè)備崩潰。據(jù)統(tǒng)計(jì),由于軸承失效而導(dǎo)致機(jī)械設(shè)備發(fā)生故障的情況約占30%~40%[1],因此必須采取一定的措施對(duì)軸承進(jìn)行實(shí)時(shí)監(jiān)測(cè)和故障診斷,在其發(fā)生故障前便進(jìn)行維修,減少不必要的損失。
傳統(tǒng)方法[2]是利用人工提取軸承振動(dòng)信號(hào)特征并進(jìn)行軸承故障診斷,對(duì)工人的經(jīng)驗(yàn)要求高、成本高、耗時(shí)長(zhǎng)且結(jié)果具有很大的隨機(jī)性。近年來(lái),工業(yè)領(lǐng)域中的機(jī)電裝備逐漸大型化、智能化、復(fù)雜化,故障因素和種類(lèi)也大大增加,依靠人工對(duì)軸承故障進(jìn)行診斷和預(yù)防的難度越來(lái)越大,已不能適應(yīng)社會(huì)發(fā)展的要求[3],因此迫切需要一種新型的診斷方法。近年來(lái),深度學(xué)習(xí)已廣泛應(yīng)用于各個(gè)領(lǐng)域[4-5]。機(jī)器通過(guò)深度學(xué)習(xí)后,再次遇到類(lèi)似情況時(shí),便可以自動(dòng)提取有價(jià)值的特征并進(jìn)行分類(lèi),得出有用結(jié)論。目前在故障診斷領(lǐng)域,很多優(yōu)秀的深度學(xué)習(xí)方法[6]不斷問(wèn)世,這也意味著軸承的故障診斷有希望進(jìn)入自我診斷的智能階段,這既具有理論意義,更具有實(shí)踐意義。
深度學(xué)習(xí)的部分算法在軸承故障診斷領(lǐng)域展現(xiàn)了獨(dú)到優(yōu)勢(shì),這一階段涌現(xiàn)的算法大多都是針對(duì)CNN進(jìn)行改進(jìn),如Chen等將振動(dòng)信號(hào)的一系列特征作為CNN的輸入,用帶標(biāo)簽的齒輪箱數(shù)據(jù)訓(xùn)練時(shí),取得了前所未有的高準(zhǔn)確率,但診斷用時(shí)過(guò)長(zhǎng),難以應(yīng)用于實(shí)際生產(chǎn)領(lǐng)域;Janssens 等先對(duì)振動(dòng)信號(hào)加窗,取沒(méi)有重疊部分的頻譜作為CNN的輸入,準(zhǔn)確率進(jìn)一步得到提升,但與此同時(shí)診斷用時(shí)也進(jìn)一步加長(zhǎng);Zhang等將時(shí)頻分析和CNN相結(jié)合,激活函數(shù)選擇縮放指數(shù)線性單位(SELU),有效地減少了訓(xùn)練過(guò)程中出現(xiàn)死點(diǎn)的概率,但對(duì)硬件的計(jì)算能力要求較高,診斷成本較高。與之前的軸承故障診斷相比,基于深度學(xué)習(xí)的故障診斷無(wú)需提取振動(dòng)信號(hào)的特征,避開(kāi)了人工提取特征的繁瑣,降低了對(duì)技術(shù)人員的要求[7];同時(shí)具有很高的可移植性,易于推廣。但該方法在具有上述優(yōu)點(diǎn)的同時(shí)仍存在一些不足,如:診斷時(shí)需要大量帶標(biāo)簽的樣本;硬件計(jì)算能力有限;診斷用時(shí)過(guò)長(zhǎng);診斷準(zhǔn)確率有待提高等[8]。因此,如何在利用CNN自動(dòng)提取特征的優(yōu)勢(shì)上,設(shè)計(jì)出準(zhǔn)確且高效的軸承故障診斷模型,仍是國(guó)內(nèi)外學(xué)者研究的熱點(diǎn),未來(lái)還有一段路要走。
為了搭建出一個(gè)更優(yōu)的模型,本文在神經(jīng)網(wǎng)絡(luò)中引入Dropout丟棄層來(lái)抑制過(guò)擬合,縮短診斷用時(shí),并適當(dāng)加深網(wǎng)絡(luò)層數(shù),提高診斷正確率。神經(jīng)網(wǎng)絡(luò)的基本架構(gòu)選取在軸承故障診斷領(lǐng)域有一定優(yōu)勢(shì)的第一層寬卷積核深度卷積神經(jīng)網(wǎng)絡(luò)(WDCNN)算法[9],在該算法基礎(chǔ)上進(jìn)行改進(jìn),并通過(guò)相關(guān)實(shí)驗(yàn)探究了改進(jìn)后模型的性能。
對(duì)工作中的軸承而言,其振動(dòng)信號(hào)易于采集且能很好地反應(yīng)軸承的狀態(tài),振動(dòng)信號(hào)的頻率與故障類(lèi)型有著特定的對(duì)應(yīng)關(guān)系。因此,本文所設(shè)計(jì)診斷模型的輸入是在不同工作環(huán)境下軸承的振動(dòng)信號(hào),并對(duì)不同的故障類(lèi)型貼上標(biāo)簽,輸出結(jié)果即為判斷的標(biāo)簽值。為了保證結(jié)果的準(zhǔn)確率和實(shí)驗(yàn)的效率,診斷算法要能夠?qū)φ駝?dòng)信號(hào)的特征進(jìn)行全面、快速地提取,因此用卷積神經(jīng)網(wǎng)絡(luò)搭建的軸承故障診斷模型,應(yīng)遵循以下法則[10]:將軸承的振動(dòng)信號(hào)作為輸入,輸出為軸承故障類(lèi)型,并與振動(dòng)信號(hào)對(duì)應(yīng)的標(biāo)簽進(jìn)行對(duì)比;大小卷積核卷積使用。短時(shí)、全局特征由大卷積核捕捉,局部信息交給小的卷積核;迭代次數(shù)和網(wǎng)絡(luò)深度應(yīng)適中,既要考慮學(xué)習(xí)的準(zhǔn)確率,又要考慮訓(xùn)練時(shí)間以及訓(xùn)練過(guò)程對(duì)硬件資源的要求;應(yīng)充分考慮過(guò)擬合和梯度爆炸問(wèn)題。
本文選取在軸承故障診斷領(lǐng)域中與上述設(shè)計(jì)法則最為接近的第一層寬卷積核深度卷積神經(jīng)網(wǎng)絡(luò)(WDCNN)算法[11]作為基礎(chǔ)模型。在WDCNN算法[12]中,第一層神經(jīng)網(wǎng)絡(luò)采用一個(gè)64*1的大卷積核,用于獲取整體的周期特征;其后的神經(jīng)網(wǎng)絡(luò)中均采用3*1的小卷積核,用于獲得各個(gè)邊緣的特征,且由于卷積核較小,計(jì)算速度很快。但該算法沒(méi)有充分考慮過(guò)擬合問(wèn)題,準(zhǔn)確率較低,現(xiàn)有資料表明在特定條件下進(jìn)行訓(xùn)練時(shí),其準(zhǔn)確率只有83.6%。
本文在此算法的基礎(chǔ)上進(jìn)行了以下改進(jìn):加深神經(jīng)網(wǎng)絡(luò)的層數(shù),由原來(lái)的5層變?yōu)?層,加深模型對(duì)帶標(biāo)簽數(shù)據(jù)的學(xué)習(xí)程度;在合適的位置引入Dropout丟棄層來(lái)抑制過(guò)擬合[13]現(xiàn)象,從而在減少診斷用時(shí)的基礎(chǔ)上提高診斷正確率。
改進(jìn)后的診斷算法基本流程[14-15]如圖1所示。
圖1 軸承故障診斷流程圖
由于疫情原因,無(wú)法去實(shí)驗(yàn)室利用實(shí)驗(yàn)平臺(tái)獲取實(shí)驗(yàn)數(shù)據(jù),因此本次實(shí)驗(yàn)用到的軸承振動(dòng)數(shù)據(jù)及其對(duì)應(yīng)標(biāo)簽全部來(lái)自于美國(guó)凱斯西儲(chǔ)大學(xué)(CWRU)提供的軸承公開(kāi)數(shù)據(jù)集[16]。凱斯西儲(chǔ)大學(xué)收集軸承數(shù)據(jù)的試驗(yàn)臺(tái)如圖2所示。其主要工作內(nèi)容是在不同工況下進(jìn)行一系列對(duì)比實(shí)驗(yàn),獲取不同故障的軸承振動(dòng)信號(hào),得到故障類(lèi)型與振動(dòng)信號(hào)的一一對(duì)應(yīng)關(guān)系。
圖2 西儲(chǔ)大學(xué)收集軸承振動(dòng)數(shù)據(jù)診斷臺(tái)
本文選取的是采樣頻率為12 kHz時(shí),健康軸承數(shù)據(jù)以及驅(qū)動(dòng)端和風(fēng)扇端在不同載荷、不同損傷位置(內(nèi)圈、外圈、滾動(dòng)體)、不同損傷直徑(0.177 8 mm、0.355 6 mm、0.533 4 mm)的故障軸承數(shù)據(jù)[17],共計(jì)101種軸承樣本,分別對(duì)應(yīng)標(biāo)號(hào)0~100。經(jīng)過(guò)預(yù)處理貼上標(biāo)簽后,最大樣本總數(shù)可達(dá)6 783個(gè)。
通過(guò)一系列對(duì)比實(shí)驗(yàn),一方面與WDCNN進(jìn)行對(duì)比,來(lái)判斷改進(jìn)效果是否明顯;另一方面為模型確定了最佳參數(shù)。
首先用上述數(shù)據(jù)集分別對(duì)原始的WDCNN模型及改進(jìn)后的WDCNN模型進(jìn)行訓(xùn)練,每次實(shí)驗(yàn)訓(xùn)練100次,重復(fù)10次實(shí)驗(yàn),最終結(jié)果取平均值后繪制如圖3所示的圖像。
圖3 原始WDCNN模型與改進(jìn)WDCNN模型準(zhǔn)確率對(duì)比圖
由圖3可以看出,原始WDCNN模型經(jīng)過(guò)100次訓(xùn)練,準(zhǔn)確率大概穩(wěn)定在87%左右,而改進(jìn)以后的模型準(zhǔn)確率明顯提升,準(zhǔn)確率大概穩(wěn)定在94%左右。因此表明增加網(wǎng)絡(luò)深度,引入丟棄層可以有效地抑制過(guò)擬合問(wèn)題,顯著提高診斷準(zhǔn)確率[18]。
在實(shí)際訓(xùn)練過(guò)程中可以發(fā)現(xiàn),網(wǎng)絡(luò)層數(shù)由5層增加到6層時(shí),訓(xùn)練100次用時(shí)會(huì)增加8~10 s;而從5層增加到7層,訓(xùn)練100次用時(shí)則會(huì)增加18~22 s。綜合考慮增加網(wǎng)絡(luò)深度會(huì)導(dǎo)致診斷用時(shí)增加、對(duì)硬件的計(jì)算能力要求增加等問(wèn)題,在對(duì)WDCNN模型進(jìn)行改進(jìn)過(guò)程中,只加深一層神經(jīng)網(wǎng)絡(luò),以便在合理的時(shí)間內(nèi)獲得最高的準(zhǔn)確率。
2.2.1 丟棄率
與WDCNN相比,本模型最大的特點(diǎn)之一便是引入Dropout丟棄層[19],即在訓(xùn)練過(guò)程中隨機(jī)關(guān)閉部分節(jié)點(diǎn)的激活功能。這樣一方面可以減輕過(guò)擬合現(xiàn)象,另一方面可以有效減少計(jì)算量,加快診斷速度[20]?,F(xiàn)有實(shí)驗(yàn)?zāi)P痛蠖嗖捎?.2、0.3和0.5的比例丟棄參數(shù),為了尋找最適合本設(shè)計(jì)模型的丟棄率,做了以下四組實(shí)驗(yàn):不添加丟棄層、丟棄率為0.2、丟棄率為0.3、丟棄率為0.5。四組實(shí)驗(yàn)數(shù)據(jù)互相對(duì)比,最終得出結(jié)論,將實(shí)驗(yàn)數(shù)據(jù)進(jìn)行整合,得到圖4所示的折線圖。
由圖4可以看出,加入丟棄層抑制過(guò)擬合現(xiàn)象之后,準(zhǔn)確率和訓(xùn)練速度均明顯提升。且在訓(xùn)練初期,由于數(shù)據(jù)量較小,硬件設(shè)備的計(jì)算能力可以輕松處理數(shù)據(jù),此時(shí)并沒(méi)有產(chǎn)生過(guò)擬合現(xiàn)象,不需要丟棄太多數(shù)據(jù),否則學(xué)習(xí)程度不夠,丟棄率為0.2和0.3時(shí)的效果相當(dāng)且較高,學(xué)習(xí)效果較好;而到后期,大量數(shù)據(jù)的輸入已經(jīng)超出了硬件的計(jì)算能力范圍,產(chǎn)生了一定程度的過(guò)擬合現(xiàn)象,因此必須丟棄部分?jǐn)?shù)據(jù),減輕計(jì)算壓力,從而提高正確率,由圖4可以看出丟棄率為0.3和0.5時(shí)的準(zhǔn)確率明顯高于0.2。充分考慮整個(gè)訓(xùn)練過(guò)程的準(zhǔn)確率以及訓(xùn)練用時(shí),本文認(rèn)為丟棄率為0.3時(shí)診斷效果最好。
圖4 丟棄率與準(zhǔn)確率關(guān)系曲線
由圖4可以看到一個(gè)異常的數(shù)據(jù)點(diǎn):不添加丟棄層訓(xùn)練60次時(shí),準(zhǔn)確率出現(xiàn)低峰。初步認(rèn)為這個(gè)實(shí)驗(yàn)結(jié)果是由于摻雜的軸承故障數(shù)據(jù)太多嚴(yán)重過(guò)擬合,甚至可能出現(xiàn)梯度消失或者梯度爆炸等問(wèn)題,導(dǎo)致模型的工作效果不好。而在添加丟棄層的實(shí)驗(yàn)組中均沒(méi)有產(chǎn)生模型突然失效現(xiàn)象,這也進(jìn)一步說(shuō)明了添加丟棄層的重要性。
2.2.2 丟棄層位置
找到最合適的丟棄率以后,需要找到合適的位置來(lái)放置丟棄層,從而達(dá)到最高的準(zhǔn)確率。為了尋找放置丟棄層最合適的位置進(jìn)行了以下探究,分別將丟棄層放置在第一層卷積之前、第一層卷積層內(nèi)、最后一層卷積層內(nèi),得到了如圖5所示的實(shí)驗(yàn)結(jié)果。
圖5 丟棄層位置與準(zhǔn)確率關(guān)系曲線
從圖中可以看出丟棄層放置在第一個(gè)卷積層之前效果最差,放置最后一個(gè)卷積層內(nèi)效果最好。這個(gè)結(jié)果與CNN模型的工作方式基本相符:當(dāng)數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)以后,若在卷積提取特征之前就關(guān)閉神經(jīng)元的激活功能,就相當(dāng)于剔除了許多數(shù)據(jù),則很多特征將不會(huì)在后續(xù)被提取出來(lái),很多特征都會(huì)丟失,導(dǎo)致準(zhǔn)確率很低;但由于全連接層的神經(jīng)元數(shù)目最多,最容易超出硬件的計(jì)算能力,產(chǎn)生過(guò)擬合現(xiàn)象,若在全連接層之前添加丟棄函數(shù),會(huì)直接、有效抑制數(shù)據(jù)之間的過(guò)擬合現(xiàn)象,提高準(zhǔn)確率;若將丟棄層放置在神經(jīng)網(wǎng)絡(luò)之間的某一層,將會(huì)有很大的隨機(jī)性,若隨機(jī)關(guān)閉的節(jié)點(diǎn)并沒(méi)有剔除關(guān)鍵數(shù)據(jù),則關(guān)鍵特征將會(huì)被提取并傳遞,相反若關(guān)鍵特征所在的神經(jīng)元功能被關(guān)閉,該特征將從這一層神經(jīng)網(wǎng)絡(luò)開(kāi)始被去除,導(dǎo)致準(zhǔn)確率忽高忽低。因此,本模型將丟棄層放置在最后一層卷積內(nèi),即全連接層之前,這樣模型的準(zhǔn)確率一直穩(wěn)定在較高水平。
模型參數(shù)確定好以后,接下來(lái)要探究迭代次數(shù)對(duì)診斷準(zhǔn)確率的影響。迭代次數(shù)與準(zhǔn)確率有著很大的關(guān)系:迭代次數(shù)太少,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)程度不夠,難以進(jìn)行正確的診斷;迭代次數(shù)過(guò)多,會(huì)占用較大的計(jì)算資源,診斷時(shí)間變長(zhǎng),且容易出現(xiàn)梯度消失和爆炸,導(dǎo)致準(zhǔn)確率下降。為了在硬件設(shè)備一定的條件下盡量提高準(zhǔn)確率,需要找到一個(gè)合適的迭代次數(shù)。在其他參數(shù)相同的條件下,探究迭代次數(shù)與故障診斷模型準(zhǔn)確率的關(guān)系。分別迭代10次、20次、30次……100次,將pycharm中顯示的運(yùn)行結(jié)果進(jìn)行整理,得到如圖6所示的迭代次數(shù)與準(zhǔn)確率關(guān)系近似圖。
從圖6可以看出,從第1次迭代到第5次迭代準(zhǔn)確率直線上升,這說(shuō)明在這一階段,隨著“學(xué)習(xí)次數(shù)”的不斷增多,模型學(xué)到的東西越來(lái)越多,已經(jīng)可以用于診斷;從第50次開(kāi)始逐漸收斂[21-23],分類(lèi)準(zhǔn)確率最高可達(dá)93.86%,這個(gè)結(jié)果與目前已有的參考文獻(xiàn)相符合,證明本設(shè)計(jì)訓(xùn)練的診斷模型具有一定的現(xiàn)實(shí)意義。
圖6 迭代次數(shù)與軸承故障診斷模型準(zhǔn)確率關(guān)系曲線
為了探究輸入數(shù)據(jù)量與模型準(zhǔn)確率的關(guān)系,做了以下5組實(shí)驗(yàn),并將多次實(shí)驗(yàn)的結(jié)果取平均值后記錄于圖7。
圖7 輸入數(shù)據(jù)量與準(zhǔn)確率關(guān)系曲線
由圖7可以看出:為模型提供的可以學(xué)習(xí)的標(biāo)簽樣本越多,模型的準(zhǔn)確率越高,且在其他條件相同時(shí),剛開(kāi)始隨著樣本數(shù)目增多,準(zhǔn)確率明顯提高;但對(duì)比5 061組與6 783組可知,當(dāng)數(shù)據(jù)量達(dá)到一定程度時(shí),準(zhǔn)確率提升程度很小,但用時(shí)卻大幅度增加,經(jīng)濟(jì)效益差。
出現(xiàn)上述實(shí)驗(yàn)結(jié)果的原因是:當(dāng)數(shù)據(jù)量較少時(shí),給模型提供的軸承振動(dòng)信號(hào)特征不足,學(xué)習(xí)程度不夠,導(dǎo)致模型學(xué)到的東西不多,下次遇到類(lèi)似問(wèn)題時(shí)無(wú)法給出準(zhǔn)確結(jié)果;隨著輸入數(shù)據(jù)量的增多,振動(dòng)信號(hào)的特征被不斷挖掘出來(lái),模型學(xué)到的東西越來(lái)越多,下次遇到同樣問(wèn)題時(shí)可以作出正確判斷;但當(dāng)數(shù)據(jù)量達(dá)到一定量,振動(dòng)信號(hào)的特征相當(dāng)于被多次輸入,對(duì)硬件計(jì)算能力的要求大幅度提升,甚至可能出現(xiàn)過(guò)擬合問(wèn)題,導(dǎo)致準(zhǔn)確率提升程度不高。因此,在充分權(quán)衡訓(xùn)練用時(shí)與準(zhǔn)確率后,確定本實(shí)驗(yàn)的最佳輸入樣本數(shù)目為5 601。
在現(xiàn)有軸承故障診斷模型WDCNN的基礎(chǔ)上進(jìn)行改進(jìn),一方面加深神經(jīng)網(wǎng)絡(luò)層數(shù),另一方面在合適位置引入Dropout丟棄層來(lái)抑制過(guò)擬合現(xiàn)象。通過(guò)相關(guān)的對(duì)比實(shí)驗(yàn)可以看出,改進(jìn)后的神經(jīng)網(wǎng)絡(luò)模型較以前在診斷準(zhǔn)確率、診斷用時(shí)方面有了較大的提升。用美國(guó)凱斯西儲(chǔ)大學(xué)提供的軸承公開(kāi)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)時(shí),準(zhǔn)確率可以達(dá)到94.6%,說(shuō)明該模型在軸承診斷領(lǐng)域有著很大的優(yōu)勢(shì)。獲取數(shù)據(jù)集以外的軸承振動(dòng)數(shù)據(jù)將成為筆者進(jìn)行下一步實(shí)驗(yàn)研究的重點(diǎn)。