唐貴基, 田寅初, 田 甜
(華北電力大學(xué)(保定) 機(jī)械工程系,河北 保定 071003)
近年來(lái),隨著深度學(xué)習(xí)在圖像和語(yǔ)音識(shí)別等領(lǐng)域的成功應(yīng)用[1],相較于傳統(tǒng)診斷方法,在提取特征、識(shí)別準(zhǔn)確率等方面具有明顯優(yōu)勢(shì)。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)目前在醫(yī)學(xué)、認(rèn)知科學(xué)和人工智能領(lǐng)域得到了廣泛應(yīng)用:文獻(xiàn)[2]使用一維CNN自適應(yīng)提取滾動(dòng)軸承故障信號(hào)的故障特征;文獻(xiàn)[3]直接將滾動(dòng)軸承故障信號(hào)作為輸入,使用CNN進(jìn)行軸承多故障診斷;文獻(xiàn)[4]通過(guò)CNN和振動(dòng)數(shù)據(jù)的頻域特征對(duì)齒輪箱進(jìn)行故障診斷;文獻(xiàn)[5]提出了權(quán)值求和和最大尺度最大池化策略,對(duì)故障軸承進(jìn)行診斷,驗(yàn)證了平移不變CNN的有效性;文獻(xiàn)[6]將滾動(dòng)軸承振動(dòng)信號(hào)的頻譜圖作為輸入通過(guò)CNN自適應(yīng)提取故障特征;文獻(xiàn)[7]通過(guò)短時(shí)傅里葉變換得到振動(dòng)信號(hào)的時(shí)頻圖并將其作為CNN的輸入,一定程度上實(shí)現(xiàn)了端到端的軸承故障診斷;文獻(xiàn)[8]使用深度卷積自編碼器對(duì)振動(dòng)信號(hào)時(shí)頻圖進(jìn)行去噪,然后利用CNN對(duì)去噪后的圖像進(jìn)行故障分類;文獻(xiàn)[9]對(duì)CNN全連接層進(jìn)行改進(jìn),使用改進(jìn)CNN算法進(jìn)行滾動(dòng)軸承故障識(shí)別;文獻(xiàn)[10]通過(guò)基于粒子群優(yōu)化的細(xì)菌覓食方法改進(jìn)AlexNet,實(shí)現(xiàn)了滾動(dòng)軸承16種故障狀態(tài)的診斷。以上方法為滾動(dòng)軸承故障診斷提供了良好借鑒。
但在實(shí)際工程應(yīng)用中,用于訓(xùn)練的樣本數(shù)據(jù)往往受其樣本大小、維度和總體表示形式的影響。因此,神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練效果經(jīng)常被有限的數(shù)據(jù)集和預(yù)測(cè)問(wèn)題所限制。而故障狀態(tài)種類越多,所需要的訓(xùn)練樣本數(shù)量相應(yīng)就需要增加。Adaboost(自適應(yīng)提升)算法可以更加充分地利用數(shù)據(jù)集,通過(guò)提高被上一個(gè)基分類器錯(cuò)分樣本的權(quán)重來(lái)提高下一個(gè)基分類器對(duì)于錯(cuò)分樣本的準(zhǔn)確率,并且最終將所有的基分類器按不同的權(quán)重組合為強(qiáng)分類器。為了使用有限的數(shù)據(jù)集得到更好的分類效果,進(jìn)一步實(shí)現(xiàn)多工況狀態(tài)下更多故障的分類,本文綜合Adaboost算法在集成學(xué)習(xí)領(lǐng)域和AlexNet在圖像分類領(lǐng)域各自的優(yōu)勢(shì),以軸承故障信號(hào)時(shí)頻圖為對(duì)象,提出了一種基于AlexNet-Adaboost的多工況滾動(dòng)軸承故障識(shí)別方法。
傳統(tǒng)的傅里葉變換是一種全局變換,無(wú)法將信號(hào)的時(shí)域特征和頻域特征聯(lián)系起來(lái)。小波變換具有良好的時(shí)頻局部化特性,可以表現(xiàn)出振動(dòng)信號(hào)的頻域特征而不丟失其時(shí)域特征[11]。小波變換通過(guò)小波母函數(shù)的平移和伸縮得到一系列小波序列,以此將信號(hào)分解為不同的頻率分量,具體過(guò)程可表示為
(1)
式中:ψ(t)為小波母函數(shù);a為尺度因子并假定a>0;b為平移因子。
對(duì)于任意二次方可積函數(shù)f(t)∈L2(R),其連續(xù)小波變換定義為
(2)
AlexNet由2012年ImageNet競(jìng)賽冠軍獲得者Hinton和他的學(xué)生Krizhevsky等[12]設(shè)計(jì)。AlexNet是第二代CNN,在第一代CNN的基礎(chǔ)上加深了網(wǎng)絡(luò)架構(gòu),能夠提取更豐富更高維的圖片特征。AlexNet主要包含8層:前5層是卷積層;后3層是全連接層,最后1層的輸出經(jīng)過(guò)Softmax函數(shù),產(chǎn)生1 000類標(biāo)簽的概率分布。詳細(xì)結(jié)構(gòu)如圖1所示,不同于第一代CNN,AlexNet使用兩個(gè)GPU進(jìn)行訓(xùn)練,其網(wǎng)絡(luò)結(jié)構(gòu)的上下部分完全相同,只在特定層進(jìn)行信息交互以完成對(duì)圖片的并行處理。AlexNet已廣泛應(yīng)用于圖像識(shí)別、圖像檢索、語(yǔ)音識(shí)別等領(lǐng)域。
圖1 AlexNet結(jié)構(gòu)圖Fig.1 AlexNet structure diagram
Adaboost算法由Freund等[13]開(kāi)發(fā),Adaboost會(huì)在訓(xùn)練數(shù)據(jù)集中產(chǎn)生一系列權(quán)重,從而對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行調(diào)整以生成多個(gè)假設(shè)。在每次迭代中,調(diào)用學(xué)習(xí)算法以最小化訓(xùn)練數(shù)據(jù)集上的加權(quán)誤差,并將其應(yīng)用于更新訓(xùn)練數(shù)據(jù)集的權(quán)重。權(quán)重變化的影響是將更多的權(quán)重放在被誤分類的訓(xùn)練數(shù)據(jù)上,將更少的權(quán)重放在正確分類的訓(xùn)練數(shù)據(jù)上。因此,隨著迭代的進(jìn)行,Adaboost會(huì)逐步構(gòu)造更難的學(xué)習(xí)問(wèn)題。Adaboost算法的過(guò)程如下:
步驟2迭代過(guò)程m=1~M
(a) 使用帶權(quán)重wi的訓(xùn)練數(shù)據(jù)來(lái)訓(xùn)練分類器Tm(x)
(b) 計(jì)算分類結(jié)果誤差
(3)
(c) 計(jì)算權(quán)重系數(shù)
(4)
(d) 更新權(quán)重
wi+1=wi·exp{αm·Ⅱ[ci≠Tm(x)]},i=1,2,…,m
(5)
(e) 歸一化wi;
步驟3輸出預(yù)測(cè)值
(6)
原始的Adaboost算法僅限于二分類問(wèn)題,Zhu等[14]對(duì)Adaboost算法進(jìn)行了改進(jìn),使用多分類指數(shù)損失函數(shù)的階段性加法建模,改進(jìn)后的Adaboost算法與原算法非常相似,主要區(qū)別為權(quán)重系數(shù)計(jì)算公式
(7)
式中,K為總分類數(shù)。
本文取1 024個(gè)采樣點(diǎn)為一個(gè)樣本,通過(guò)重疊采樣來(lái)增加樣本數(shù)量[15]。假設(shè)原數(shù)據(jù)數(shù)列數(shù)據(jù)點(diǎn)個(gè)數(shù)為M,樣本長(zhǎng)度為N,采樣偏移量為ΔX,則該數(shù)列可以產(chǎn)生樣本個(gè)數(shù)為Y,其公式為
(8)
使用‘cmor3-3’小波,尺寸序列長(zhǎng)度為256,采樣頻率為12 kHz,分別對(duì)正常軸承、內(nèi)圈故障軸承、外圈故障軸承和滾動(dòng)體故障軸承的振動(dòng)信號(hào)做小波變換繪制時(shí)頻圖,去除時(shí)頻圖周邊的坐標(biāo)、文字、能量條部分,將所得到的時(shí)頻圖尺寸調(diào)整為227×227。
AlexNet雖然擁有更強(qiáng)的學(xué)習(xí)能力,但是它的網(wǎng)絡(luò)結(jié)構(gòu)也更為復(fù)雜,且需要兩個(gè)GPU并行運(yùn)算以及上百萬(wàn)個(gè)訓(xùn)練樣本,相應(yīng)的時(shí)間成本和經(jīng)濟(jì)成本會(huì)大大增加。相對(duì)于上千種類的圖片分類問(wèn)題,數(shù)十種類的滾動(dòng)軸承故障識(shí)別屬于少類別的任務(wù),因此可以在避開(kāi)百萬(wàn)級(jí)數(shù)據(jù)樣本和多個(gè)GPU并行運(yùn)算的要求下,通過(guò)精簡(jiǎn)AlexNet的結(jié)構(gòu)的同時(shí)運(yùn)用它包含的部分新技術(shù)來(lái)解決滾動(dòng)軸承故障識(shí)別問(wèn)題[16]。本文使用的AlexNet結(jié)構(gòu)如圖2所示。
隨機(jī)梯度下降(stochastic gradient descent,SGD)算法是目前使用最多的梯度下降優(yōu)化算法之一,SGD算法通??梢哉业阶顑?yōu)解,但是會(huì)花費(fèi)遠(yuǎn)多于自適應(yīng)優(yōu)化算法的時(shí)間,且SGD算法非常依賴于魯棒的初始化值以及退火策略。而自適應(yīng)優(yōu)化算法可以在不調(diào)參的情況下使用更短的時(shí)間得到較好的效果,常用的自適應(yīng)優(yōu)化算法有Adadelta、RMSprop和Adam等,上述3種算法非常相似,在相同的情況下都能得到較好的結(jié)果[17]。本文使用收斂速度最快的RMSprop算法來(lái)訓(xùn)練模型。
vi=β·vi+(1-β)(?wi)2
(9)
(10)
式中:i為迭代次數(shù);α為全局學(xué)習(xí)率;vi為累計(jì)平方梯度;β為衰減率; ?wi為梯度累計(jì)量;wi為被更新的權(quán)值。
本研究方法的流程圖如圖3所示。
圖3 AlexNet-Adaboost算法流程圖Fig.3 AlexNet-Adaboost algorithm flow chart
本研究方法的具體步驟如下:
步驟1采集滾動(dòng)軸承在不同工況、不同狀態(tài)下的振動(dòng)信號(hào);
步驟2通過(guò)小波變換將一維的振動(dòng)信號(hào)轉(zhuǎn)化為227×227尺寸的二維時(shí)頻圖;
步驟4使用帶權(quán)重的訓(xùn)練數(shù)據(jù)來(lái)訓(xùn)練第一個(gè)基分類器;
步驟5使用測(cè)試數(shù)據(jù)集計(jì)算基分類器的分類結(jié)果誤差,并計(jì)算權(quán)重系數(shù);
步驟6根據(jù)權(quán)重系數(shù)更新訓(xùn)練數(shù)據(jù)集的權(quán)重,提高誤分類樣本的權(quán)重,并將權(quán)重歸一化;
步驟7使用更新權(quán)重后的訓(xùn)練數(shù)據(jù)集訓(xùn)練下一個(gè)基分類器;
步驟8重復(fù)步驟5~步驟7直到所需基分類器全部訓(xùn)練完成;
步驟9將所有的基分類器按權(quán)重系數(shù)組合成最終的強(qiáng)分類器;
步驟10使用最終的強(qiáng)分類器進(jìn)行多工況下的滾動(dòng)軸承故障識(shí)別。
分析過(guò)程的具體流程如圖4所示。
圖4 分析過(guò)程流程圖Fig.4 Analysis process flow chart
本文所用振動(dòng)數(shù)據(jù)為美國(guó)凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)庫(kù)的滾動(dòng)軸承振動(dòng)加速度數(shù)據(jù)[18]。試驗(yàn)數(shù)據(jù)包括正常、內(nèi)圈故障、外圈故障和滾動(dòng)體故障信號(hào),在4種工況(電動(dòng)機(jī)負(fù)載分別為735.498 75 W,1 470.997 50 W,2 206.496 25 W)下各收集3種損傷直徑(0.177 8 mm,0.355 6 mm,0.533 4 mm)數(shù)據(jù),總共為40種狀態(tài)如表1和表2所示。每種狀態(tài)收集450個(gè)樣本,共收集18 000個(gè)訓(xùn)練樣本,分為15 000個(gè)訓(xùn)練樣本和3 000個(gè)測(cè)試樣本。
表1 軸承故障狀態(tài)標(biāo)簽Tab.1 Bearing fault status label
表2 軸承正常狀態(tài)標(biāo)簽Tab.2 Bearing normal status label
由于每種狀態(tài)樣本數(shù)量較少,為了增加模型的泛化能力,防止過(guò)擬合,在訓(xùn)練前進(jìn)行數(shù)據(jù)增強(qiáng),每張圖片的高度和寬度按10%比例隨機(jī)豎直水平偏移,并隨機(jī)對(duì)整張圖片進(jìn)行水平翻轉(zhuǎn)。除數(shù)據(jù)增強(qiáng)外,訓(xùn)練時(shí)會(huì)進(jìn)行樣本重采樣處理,每個(gè)訓(xùn)練階段實(shí)際使用的樣本數(shù)量為真實(shí)樣本的三倍。
滾動(dòng)軸承的主要作用之一是承載負(fù)荷,因此當(dāng)電動(dòng)機(jī)負(fù)載發(fā)生變化時(shí),不得不考慮滾動(dòng)軸承故障識(shí)別方法是否仍然具有較高的識(shí)別準(zhǔn)確率,所以要求識(shí)別方法有較好的泛化能力。對(duì)此,本文使用AlexNet-Adaboost、CNN-Adaboost、AlexNet、CNN和傳統(tǒng)機(jī)器學(xué)習(xí)方法SVM(support vector machine)分別在單工況和多工況下進(jìn)行故障識(shí)別進(jìn)行對(duì)比試驗(yàn)。對(duì)比試驗(yàn)使用同樣的數(shù)據(jù)集分別測(cè)試使用不同方法的識(shí)別準(zhǔn)確率。同時(shí),為排除試驗(yàn)的偶然性,對(duì)每種方法分別運(yùn)行5次的準(zhǔn)確率取平均值得到最終結(jié)果。
SVM的最優(yōu)參數(shù)通過(guò)在單獨(dú)劃分出的驗(yàn)證數(shù)據(jù)集上進(jìn)行網(wǎng)格搜索得到。本文方法使用的基分類器與AlexNet方法相同,結(jié)構(gòu)見(jiàn)圖2;CNN-Adaboost方法使用的基分類器和CNN方法相同,結(jié)構(gòu)如圖5所示。AlexNet模型和CNN模型都通過(guò)RMSprop算法來(lái)訓(xùn)練,全局學(xué)習(xí)率設(shè)置為0.000 1,衰減率設(shè)置為0.000 001,批量尺寸設(shè)置為32,迭代次數(shù)設(shè)置為15。
圖5 CNN結(jié)構(gòu)圖Fig.5 CNN structure diagram
首先,分析單工況下的滾動(dòng)軸承故障識(shí)別,單工況數(shù)據(jù)集包括在電動(dòng)機(jī)負(fù)載為0的情況下滾動(dòng)軸承不同故障部位不同損傷直徑共10種狀態(tài)。故障識(shí)別結(jié)果如圖6所示,使用AlexNet或者CNN作為基分類器通過(guò)Adaboost集成得到的強(qiáng)分類器準(zhǔn)確率都為100%;AlexNet方法和CNN方法準(zhǔn)確率分別為99.73%和98.13%;SVM準(zhǔn)確率為99.33%。可以看出,在單工況下進(jìn)行故障識(shí)別較為簡(jiǎn)單,幾種方法都可以得到較好的識(shí)別效果。
圖6 單工況下不同方法的故障識(shí)別準(zhǔn)確率Fig.6 Fault recognition accuracy of different methods under single working condition
其次,分析多工況下的滾動(dòng)軸承故障識(shí)別,多工況數(shù)據(jù)集包括滾動(dòng)軸承在4種工況下滾動(dòng)軸承不同故障部位不同損傷直徑共40種狀態(tài)。結(jié)果如圖7所示,使用AlexNet作為基分類器時(shí),5個(gè)基分類器集成得到的強(qiáng)分類器準(zhǔn)確率為98.43%,3個(gè)基分類器進(jìn)行集成得到的準(zhǔn)確率為98.2%;使用CNN作為基分類器時(shí),5個(gè)基分類器集成得到的強(qiáng)分類器準(zhǔn)確率為95.1%,3個(gè)基分類器進(jìn)行集成得到的準(zhǔn)確率為93.87%;AlexNet和CNN準(zhǔn)確率分別為90.87%和81.33%;SVM方法準(zhǔn)確率為93.57%??梢钥闯?,在多工況下進(jìn)行故障識(shí)別,本文方法仍有高的準(zhǔn)確率,而其他幾種方法的準(zhǔn)確率都顯著降低。綜述,本文方法準(zhǔn)確率最高,且具有較好的泛化性能。
圖7 多工況下不同方法的故障識(shí)別準(zhǔn)確率Fig.7 Fault recognition accuracy of different methods under multiple working conditions
本文提出了一種基于AlexNet-Adaboost相結(jié)合的滾動(dòng)軸承故障識(shí)別方法。構(gòu)造不同數(shù)量的AlexNet模型作為基分類器,形成最終的AlexNet-Adaboost強(qiáng)分類器,實(shí)現(xiàn)了多工況條件下滾動(dòng)軸承的40種類別的狀態(tài)識(shí)別。該方法可以通過(guò)提高被前一個(gè)基分類器錯(cuò)誤分類樣本的權(quán)重并用來(lái)訓(xùn)練下一個(gè)基分類器,最終提高整體樣本的識(shí)別準(zhǔn)確率,充分利用有限的數(shù)據(jù)集得到更高的準(zhǔn)確率。與CNN-Adaboost、AlexNet、CNN和SVM方法相比,所提方法應(yīng)用于凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)集進(jìn)行滾動(dòng)軸承故障識(shí)別,在多工況條件下對(duì)滾動(dòng)軸承不同位置、不同損傷程度的40種類故障識(shí)別準(zhǔn)確率最高,且相對(duì)于其他方法有更好的泛化能力,證明了該方法的有效性。