陳功勝,唐向紅,1b,2,陸見(jiàn)光,1b,2,楊瑞恒
(1.貴州大學(xué) a.現(xiàn)代制造技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室; b.機(jī)械工程學(xué)院, 貴陽(yáng) 550025; 2.貴州省公共大數(shù)據(jù)重點(diǎn)實(shí)驗(yàn)室, 貴陽(yáng) 550025)
滾動(dòng)軸承在機(jī)械設(shè)備中占據(jù)著舉足輕重的地位,通常也是機(jī)械設(shè)備中最容易出現(xiàn)故障的部分[1],據(jù)機(jī)械故障統(tǒng)計(jì),旋轉(zhuǎn)機(jī)械中的滾動(dòng)軸承故障比例占據(jù)了機(jī)械故障的40%[2-3]。因此,開(kāi)展軸承故障診斷研究具有重要意義。
傳統(tǒng)故障診斷方法是提取傳感器采集原始振動(dòng)信號(hào)中的有用特征,常用的方法有:短時(shí)傅里葉變換(STFT)[4],包絡(luò)分析(EA)[5],小波變換(WT)[6]等。傳統(tǒng)的方法是基于理論出發(fā)對(duì)問(wèn)題進(jìn)行分析,雖然在原理上具備可解釋性,但診斷精度低。隨著“互聯(lián)網(wǎng)+智能制造”的快速發(fā)展,以數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法逐漸應(yīng)用到故障診斷中。如SVM[7],樸素貝葉斯[8],K最近鄰[9]等,與傳統(tǒng)信號(hào)處理方法不同,這些算法在診斷精度及直觀性方面都有較大的提升,但也需要更高的計(jì)算能力。這類方法在很大程度上取決于人工特征提取的質(zhì)量,這就依賴于專家經(jīng)驗(yàn)和先驗(yàn)知識(shí)[10]。
因此,為了克服這一問(wèn)題,實(shí)現(xiàn)特征自提取。近些年,一些學(xué)者將深度學(xué)習(xí)技術(shù)應(yīng)用到故障診斷領(lǐng)域的研究,如深度置信網(wǎng)絡(luò)(DBN)、深度自動(dòng)編碼器(DAE)[16]、卷積神經(jīng)網(wǎng)絡(luò)(CNN)等。其中CNN在軸承故障診斷中的應(yīng)用最為廣泛。文獻(xiàn)[11-13]中提出將一維卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于滾動(dòng)軸承自適應(yīng)故障診斷方法。這些研究雖然省去人工提取特征的工作,但基于一維時(shí)序信號(hào)的處理方法仍存在著丟失特征的缺陷,而將原始時(shí)序信號(hào)轉(zhuǎn)變?yōu)榛叶葓D像信號(hào)后進(jìn)行特征提取會(huì)很大程度上改進(jìn)這個(gè)問(wèn)題[14]。文獻(xiàn)[15]中以滾動(dòng)軸承時(shí)頻圖像作為研究對(duì)象輸送至ResNet進(jìn)行分類,實(shí)驗(yàn)證明了該方法的有效性。文獻(xiàn)[16]中提出一種將振動(dòng)信號(hào)進(jìn)行灰度轉(zhuǎn)換,然后輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分類,從而實(shí)現(xiàn)了對(duì)航空故障中介軸承的快速分類的方法。WAN等[17]提出了將深度自動(dòng)編碼器與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,先利用小波變換構(gòu)造不同狀態(tài)下的時(shí)頻圖,再采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)DCAE降噪后的時(shí)頻圖進(jìn)行故障分類,實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法可在高噪聲情況下具備更高的識(shí)別率。上述研究表明,首先將時(shí)域信號(hào)轉(zhuǎn)為圖像形式,然后輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取與分類,同樣能取得出色的分類效果。結(jié)合CNN的結(jié)構(gòu)特點(diǎn),其自帶的softmax分類器存在著易陷入局部最優(yōu)的缺陷[18]。由于極限樹(shù)回歸計(jì)算分裂的方式具有隨機(jī)性,選取完全隨機(jī)所得到最優(yōu)分叉值,這就有效避免了softmax分類的不足。針對(duì)該問(wèn)題,本文提出一種二維卷積神經(jīng)網(wǎng)絡(luò)與極限樹(shù)回歸相結(jié)合的自適應(yīng)軸承故障診斷方法。在此基礎(chǔ)上增加隨機(jī)搜索算法,相較于網(wǎng)格搜索,可快速地檢索到該模型較優(yōu)參數(shù)組合。最后將CNN-ETR算法與傳統(tǒng)的DT、CNN、CNN-DT算法進(jìn)行比較,驗(yàn)證了CNN-ETR模型對(duì)軸承故障具有很好的分類能力。
CNN具有自動(dòng)提取復(fù)雜的非平穩(wěn)振動(dòng)信號(hào)特征的強(qiáng)大能力。通常CNN包括若干卷積層、池化層、一個(gè)全連接層和一個(gè)輸出分類器。圖1為卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)架構(gòu)。
圖1 卷積神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)示意圖
根據(jù)上述結(jié)構(gòu),CNN的處理流程如下,無(wú)論輸入是圖像還是數(shù)據(jù)集都將轉(zhuǎn)換為數(shù)組,并將其傳遞到輸入層。然后由卷積層創(chuàng)建的卷積核在前一層的矩陣上進(jìn)行卷積操作,獲得低級(jí)特征子圖。為了增強(qiáng)神經(jīng)網(wǎng)絡(luò)模型的表達(dá)能力,引入ReLU讓卷積神經(jīng)網(wǎng)絡(luò)具有非線性輸出的能力。
(1)
(2)
在經(jīng)過(guò)重復(fù)的卷積和池化操作后,高級(jí)特征矩陣會(huì)進(jìn)一步映射為一維向量。最后,通過(guò)softmax分類器對(duì)運(yùn)行狀態(tài)進(jìn)行分類。若為N種輸入信號(hào),類別標(biāo)簽設(shè)為i所對(duì)應(yīng)輸出yi概率為:
(3)
其中:wi表示由第i個(gè)輸出神經(jīng)元連接的權(quán)重矩陣;bi是偏置;而x表示softmax層的輸入。
極限樹(shù)回歸作為集成分類模型的一種,當(dāng)特征屬性以類別為標(biāo)準(zhǔn)時(shí),隨機(jī)選擇具有類別的樣本作為左分支,其他類別樣本作為右分支,可以應(yīng)用基尼系數(shù)進(jìn)行分類
(4)
其中:m為數(shù)據(jù)集中樣本類型的數(shù)量;Pi是第i類樣本的占比。當(dāng)特征屬性以特征值為標(biāo)準(zhǔn)時(shí),利用與特征值比較大小將樣本分類,可以應(yīng)用均方誤差進(jìn)行分類
(5)
為了提高該算法的準(zhǔn)確性,除了將本文模型設(shè)計(jì)不要過(guò)于復(fù)雜的同時(shí),仍需對(duì)極限樹(shù)回歸中的超參數(shù)(評(píng)估器、最大深度及學(xué)習(xí)率等值)的選優(yōu)。由于集成模型的超參數(shù)個(gè)數(shù)較多,如果使用網(wǎng)格搜索,那么搜索所需時(shí)間會(huì)將呈指數(shù)級(jí)增長(zhǎng),而隨機(jī)搜索會(huì)在超參數(shù)空間內(nèi)隨機(jī)搜尋數(shù)十或上百個(gè)點(diǎn),可快速的檢索到較優(yōu)的參數(shù)組合,這種做法比網(wǎng)格搜索要快很多,因此本文選用隨機(jī)搜索算法。
CNN-ETR模型主要包括兩部分:訓(xùn)練CNN模型用來(lái)提取故障軸承特征;然后將CNN全連接層的128維特征向量輸入極限樹(shù)回歸中進(jìn)行訓(xùn)練及測(cè)試,從而診斷出軸承故障。此外,為了進(jìn)一步提高該模型的診斷精度,采用隨機(jī)搜索匹配適用模型的較優(yōu)參數(shù)組合。CNN-ERT診斷流程如圖2所示。
圖2 CNN-ETR診斷流程框圖
本研究采用了CUT-2實(shí)驗(yàn)平臺(tái)(見(jiàn)圖3)進(jìn)行數(shù)據(jù)采集,測(cè)試軸承放置在試驗(yàn)臺(tái)的右端。實(shí)驗(yàn)軸承型號(hào)為6900ZZ,使用電火花加工技術(shù)在軸承內(nèi)圈、外圈及滾動(dòng)體上分別布置直徑為0.2 mm與0.3 mm的故障(見(jiàn)圖4)。軸承故障如圖所示,在電機(jī)轉(zhuǎn)速為1 500 r/min,采樣頻率為2K時(shí),選取10種故障類型,每類故障類型包含330個(gè)樣本,每個(gè)樣本包含512個(gè)數(shù)據(jù)點(diǎn)(見(jiàn)表1)。樣本按照隨機(jī)75%的訓(xùn)練集和25%的測(cè)試集進(jìn)行劃分并用于訓(xùn)練及測(cè)試。本次實(shí)驗(yàn)在電腦Win10×64位操作系統(tǒng),處理器為:Inter(R)Core(TM):i5-6500CPU@3.20GHz,RAM:8GB的配置環(huán)境下進(jìn)行的。
圖3 CUT-2軸承實(shí)驗(yàn)平臺(tái)
表1 CUT-2實(shí)驗(yàn)數(shù)據(jù)
3.2.1激活函數(shù)的選擇
本次實(shí)驗(yàn)選擇最常用的Sigmoid、Tanh、ReLU及PReLU四類激活函數(shù)進(jìn)行了比較,為了避免實(shí)驗(yàn)結(jié)果出現(xiàn)偶然性,采用了10次交叉驗(yàn)證方法,從表2中可以看出,在同等條件下,選用ReLU激活函數(shù)能達(dá)到最佳實(shí)驗(yàn)精度。
表2 不同激活函數(shù)性能表
3.2.2優(yōu)化器的選擇
本次實(shí)驗(yàn)選用較為常用的Adam、SGD、RMSprop三類優(yōu)化器,且分別在學(xué)習(xí)率為0.000 1、0.001、0.005、0.01、0.05五種情況下測(cè)試出每種分類器的性能。
如圖5所示,Adam優(yōu)化器在學(xué)習(xí)率為0.005時(shí)取得了最佳分類效果,此外,該優(yōu)化器在設(shè)定區(qū)間內(nèi)(0.000 1~0.05)穩(wěn)定性最好,因此本次實(shí)驗(yàn)選取學(xué)習(xí)率為0.005的 Adam 優(yōu)化器。
圖5 不同優(yōu)化器及學(xué)習(xí)率直方圖
3.2.3批處理樣本數(shù)目
批處理樣本數(shù)目指模型每輪更新參數(shù)所需訓(xùn)練的樣本數(shù)量。若批樣本處理數(shù)目選擇較少,即會(huì)增加模型陷入局部最優(yōu)的風(fēng)險(xiǎn)和模型訓(xùn)練時(shí)間;若批樣本處理數(shù)目選擇較少,則無(wú)法保證模型參數(shù)的最佳優(yōu)化方向[11]。本研究在選取ReLU激活函數(shù),選取Adam優(yōu)化器及學(xué)習(xí)率為0.005的條件下測(cè)試不同大小的批量訓(xùn)練數(shù)據(jù)對(duì)模型的性能影響。數(shù)據(jù)大小分別取8、16、32、64、128,實(shí)驗(yàn)結(jié)果如表3所示,當(dāng)批量訓(xùn)練數(shù)據(jù)大小為64時(shí),該模型在測(cè)試集上取得最佳的分類表現(xiàn)。因此選取批量訓(xùn)練數(shù)據(jù)大小為64。
表3 塊大小取得的準(zhǔn)確率
根據(jù)上述的參數(shù)選擇,CNN-ETR模型最終確定的模型參數(shù)如表4所示。
表4 CNN-ETR模型參數(shù)
為了展示該模型對(duì)不同類型故障的提取能力,使用t_SNE技術(shù)分別提取不同層的特征映射成二維并進(jìn)行可視化。具體效果如圖6所示。圖6(a)為輸入原始信號(hào)樣本的分類結(jié)果,可以看出信號(hào)之間具有亢余性,導(dǎo)致各類別難以區(qū)分。在經(jīng)過(guò)多次的卷積池化操作后,圖6(b)展示全連接層的特征提取結(jié)果,除第六類樣本中少量樣本被誤分在第五類,及第一類樣本中少量樣本被誤分入第四類中,其余類別的樣本均能很好的聚攏在相應(yīng)區(qū)域內(nèi)。
圖6 不同層級(jí)的特征可視化效果圖
在上述的基礎(chǔ)上,更為直觀地考察CNN-ETR模型在識(shí)別故障軸承的能力及具體細(xì)節(jié),本文引入混淆矩陣對(duì)診斷結(jié)果進(jìn)行量化分析,在圖7中,可以清楚的觀察到該模型對(duì)每類軸承診斷情況。從總體上來(lái)看,該模型準(zhǔn)確率平均維持在99%以上,近一半類別故障軸承診斷精度甚至達(dá)到了100%,證明了該模型在故障軸承的類別診斷方面具有出色的表現(xiàn)。
圖7 多分類混淆矩陣元素圖
考慮到在實(shí)際工程應(yīng)用中,滾動(dòng)軸承發(fā)生故障的方式多樣化,因此本文對(duì)CNN-ETR模型的泛化能力進(jìn)行了實(shí)驗(yàn),以驗(yàn)證不同故障占比率對(duì)該模型精度的影響。在總樣本容量保持不變的基礎(chǔ)上,分別對(duì)故障占比率處于70%~94%的數(shù)據(jù)進(jìn)行測(cè)試。實(shí)驗(yàn)結(jié)果如圖8所示,可以看出僅故障占比率在76%及82%時(shí),對(duì)應(yīng)的故障識(shí)別率略低于99%,分別為98.94%、98.95%,其余測(cè)試結(jié)果均穩(wěn)定在99%及以上。證明了該模型具有較好的魯棒性,對(duì)軸承運(yùn)轉(zhuǎn)狀態(tài)監(jiān)測(cè)有著重要意義。
圖8 故障占比率對(duì)算法精度的影響曲線
由于極限樹(shù)回歸由多個(gè)決策樹(shù)組成,為了驗(yàn)證CNN-ETR算法的有效性,本文選取DT、CNN、CNN-DT算法分別進(jìn)行了對(duì)比實(shí)驗(yàn)。并將所有實(shí)驗(yàn)的準(zhǔn)確率、精確率、召回率及F1指標(biāo)進(jìn)行了繪制。在決策樹(shù)模型中,在對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化后,選取C4.5生成樹(shù)算法使用熵,其他參數(shù)默認(rèn)初始化配置。為了增加實(shí)驗(yàn)可信度,每種模型取20次重復(fù)性試驗(yàn)的平均值。所得結(jié)果如圖9所示。
圖9 對(duì)比算法有效性的直方圖
從上述可以看出,使用DT模型分類時(shí),準(zhǔn)確率、精確率、召回率及F1指標(biāo)均為最低,這是因?yàn)镈T模型對(duì)有時(shí)間序列的數(shù)據(jù)并不敏感,此外當(dāng)其在某一節(jié)點(diǎn)發(fā)生分類錯(cuò)誤時(shí),那錯(cuò)誤會(huì)沿著該節(jié)點(diǎn)一直延伸下去。在使用ETR進(jìn)行分類時(shí),可以看出該模型在組合了大量決策樹(shù)的基礎(chǔ)上,其分類能力有了明顯的提升,但依舊在很大程度上取決于人工提取特征的質(zhì)量。值得關(guān)注的是,借助卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的特征自提取能力,CNN的故障診斷準(zhǔn)確率為90.2%,而CNN-DT的故障診斷準(zhǔn)確率達(dá)到了95.7%,相比于卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練結(jié)果有了較大的改進(jìn)。CNN-ETR采用了隨機(jī)搜索算法,可快速搜索極限樹(shù)回歸模型中較優(yōu)的參數(shù)組合,并利用該模型實(shí)現(xiàn)快速分類,該算法的故障軸承診斷準(zhǔn)確率達(dá)到了99.6%,比CNN-DT算法還要高出3.9%,由此從四項(xiàng)分類指標(biāo)中驗(yàn)證了CNN-ETR模型的有效性。
CNN-ETR是一種結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)與極限回歸樹(shù)的自適應(yīng)診斷算法,相較于傳統(tǒng)算法具有更高的精確度,并具備以下特點(diǎn):
1) 在數(shù)據(jù)預(yù)處理階段,將時(shí)域信號(hào)轉(zhuǎn)為灰度圖像后輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取,可有效地保留信號(hào)特征。
2) 利用極限樹(shù)回歸對(duì)卷積神經(jīng)網(wǎng)絡(luò)提取的特征進(jìn)行快速分類,可提高故障分類的精度,增加模型的泛化能力。
3) 采用隨機(jī)搜索算法可快速搜索極限樹(shù)回歸模型中較優(yōu)的參數(shù)組合。分類準(zhǔn)確率都能穩(wěn)定在99%以上,該模型在故障診斷領(lǐng)域中有著良好的識(shí)別能力。