吳定海,曹進(jìn)華,張?jiān)茝?qiáng),唐香珺
(1. 陸軍工程大學(xué) 石家莊校區(qū),石家莊 050003; 2. 廈門(mén)大學(xué)嘉庚學(xué)院 機(jī)電工程學(xué)院,福建漳州 363105)
機(jī)械故障診斷是監(jiān)測(cè)、診斷和預(yù)示機(jī)械設(shè)備的狀態(tài)和故障,對(duì)保障裝備安全運(yùn)行具有重大意義[1]。狀態(tài)監(jiān)測(cè)已經(jīng)能夠?qū)崿F(xiàn)對(duì)多測(cè)點(diǎn)、全壽命的數(shù)據(jù)采集,進(jìn)而獲得大量的數(shù)據(jù),而研究和利用先進(jìn)的理論與方法,從機(jī)械裝備大數(shù)據(jù)中挖掘信息,高效、準(zhǔn)確地識(shí)別裝備健康狀態(tài),成為裝備大數(shù)據(jù)健康監(jiān)測(cè)面臨的新問(wèn)題[2]。
卷積神經(jīng)網(wǎng)絡(luò)作為經(jīng)典的深度學(xué)習(xí)模型并被不斷發(fā)展,出現(xiàn)了如LeNet-5、 AlexNet、 VGG、ResNet、 GoogleNet等網(wǎng)絡(luò)[3-4],在圖像識(shí)別領(lǐng)域取得了巨大成功。CNN主要源于其模型結(jié)構(gòu)和訓(xùn)練方式上的優(yōu)勢(shì)[5-6]:1) 以多層卷積變換為核心,具有更強(qiáng)的非線性深層次特征提取能力;2) 直接面向模式識(shí)別,實(shí)現(xiàn)了特征提取、選擇和分類(lèi)的聯(lián)合優(yōu)化;3) 訓(xùn)練時(shí),首先以大樣本進(jìn)行“逐層無(wú)監(jiān)督貪婪學(xué)習(xí)”對(duì)參數(shù)進(jìn)行自適應(yīng)調(diào)節(jié),然后以小樣本 “有監(jiān)督整體微調(diào)”,實(shí)現(xiàn)網(wǎng)絡(luò)學(xué)習(xí)的整體修正。
近年來(lái),許多學(xué)者嘗試將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于機(jī)械故障診斷[7],主要可以分為兩大類(lèi):1) 將一維振動(dòng)信號(hào)轉(zhuǎn)化圖像,進(jìn)而使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)圖像進(jìn)行分析。轉(zhuǎn)換方法最為簡(jiǎn)單的是將一維信號(hào)排列成二維矩陣即灰度圖像[8],其次是利用信號(hào)變換的方法形成圖像矩陣,如時(shí)頻分布[9]?;叶葓D像轉(zhuǎn)換方法簡(jiǎn)單、計(jì)算量小,但是轉(zhuǎn)換后的圖像較為接近,而時(shí)頻分布信息豐富但是計(jì)算量巨大。2) 直接采用一維機(jī)械信號(hào)作為輸入,利用卷積神經(jīng)網(wǎng)絡(luò)深層次特征提取和分析,實(shí)現(xiàn)“端到端”的故障診斷,這種方法無(wú)需額外的處理和人工干預(yù),避免了信息的丟失,簡(jiǎn)化了故障診斷信息處理流程,正在成為故障診斷領(lǐng)域的研究熱點(diǎn)。
基于一維信號(hào)的卷積神經(jīng)網(wǎng)絡(luò)故障診斷,是利用數(shù)據(jù)驅(qū)動(dòng)方式直接從大量機(jī)械故障數(shù)據(jù)中分析規(guī)律。部分學(xué)者進(jìn)行了有益的嘗試:Zhang等[10]構(gòu)建了包含6個(gè)卷積模塊的卷積神經(jīng)網(wǎng)絡(luò),運(yùn)用大尺寸卷積核和Dropout機(jī)制,對(duì)噪聲干擾仍具有較好的診斷效果。Wan等[11]研究了利用改進(jìn)的2D和1D LeNet-5網(wǎng)絡(luò)對(duì)軸承進(jìn)行故障診斷,改進(jìn)的1D LeNet-5包含5個(gè)卷積模塊網(wǎng)絡(luò)結(jié)構(gòu),取得了不錯(cuò)的效果。針對(duì)深度卷積網(wǎng)絡(luò)訓(xùn)練和診斷計(jì)算量大,劉星辰等[12]在采用全局平均池化層代替LeNet-5的全連接層,降低計(jì)算量,在軸承和齒輪數(shù)據(jù)診斷方面具有較高的精度,但是需要大量的訓(xùn)練樣本。Janssens等[13]更是嘗試單卷積層加全連接層的簡(jiǎn)單網(wǎng)絡(luò)對(duì)軸承振動(dòng)信號(hào)的故障診斷,計(jì)算量小但是模型的診斷精度較低,魯棒性差。
針對(duì)一維復(fù)雜機(jī)械振動(dòng)信號(hào)的分析特點(diǎn),在經(jīng)典LeNet-5網(wǎng)絡(luò)基礎(chǔ)上,合理整合了批量規(guī)范化、ReLu激活、重疊最大池化和Dropout機(jī)制,兼顧故障診斷網(wǎng)絡(luò)的實(shí)時(shí)性和魯棒性,對(duì)于往復(fù)機(jī)械的數(shù)據(jù)輸入方面,嘗試采用階次采樣提高訓(xùn)練樣本數(shù)據(jù)質(zhì)量,在較小訓(xùn)練樣本條件下也能優(yōu)良的訓(xùn)練效果。
LeNet-5是LeCun在1998年提出的經(jīng)典卷積神經(jīng)網(wǎng)絡(luò),對(duì)手寫(xiě)字符識(shí)別具有非常高的精度,該模型包括2個(gè)卷積層、2個(gè)池化層和3個(gè)全連接層,網(wǎng)絡(luò)的具體細(xì)節(jié)如圖1所示[14]。
圖1 CNN的基本網(wǎng)絡(luò)結(jié)構(gòu)
表1列出了LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù),2個(gè)卷積模塊由卷積層和最大池化層組成。卷積層固定采用5×5的卷積核,步長(zhǎng)均設(shè)置為1,卷積核個(gè)數(shù)由6個(gè)增加到16個(gè),池化層采用大小為2×2、步長(zhǎng)為2的窗口進(jìn)行最大池化。第1個(gè)全連接層神經(jīng)元個(gè)數(shù)為120,第2層為84,最后一層為輸出層,神經(jīng)元個(gè)數(shù)由分類(lèi)類(lèi)別數(shù)量決定,手寫(xiě)字體0~9共10個(gè)類(lèi)別,故設(shè)置為10個(gè)。
表1 LeNet-5經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)
LeNet-5作為一種經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò),其網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)也為后續(xù)卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展奠定了基礎(chǔ)。針對(duì)一維機(jī)械故障信號(hào)的特點(diǎn)對(duì)LeNet-5經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行如下分析和改進(jìn):
1) LeNet-5針對(duì)圖像分析采用固定5×5的卷積核,不能適應(yīng)一維信號(hào)分析需求,故對(duì)卷積核結(jié)構(gòu)進(jìn)行改進(jìn),采用一維長(zhǎng)卷積核和較大的池化步長(zhǎng);
2) 為提高模型的魯棒性,采用重疊最大池化層以突出信號(hào)的鄰域關(guān)聯(lián)性,卷積層后增加了批量規(guī)范化和ReLu激活層,構(gòu)建了兩個(gè)卷積模塊,避免梯度飽和并提高網(wǎng)絡(luò)訓(xùn)練速度;
3) LeNet-5采用3個(gè)卷積層,耗費(fèi)計(jì)算量大,故刪減全連接層的數(shù)量,在卷積模塊后只采用一個(gè)全連接層配合Softmax及輸出層;
4) 在全連接層之前增加一個(gè)Dropout層,降低神經(jīng)元之間的依賴(lài)程度,避免網(wǎng)絡(luò)過(guò)擬合的發(fā)生,提高模型的泛化性能。
一維LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)如圖2所示,包含輸入層,兩個(gè)包含卷積層、批量規(guī)范化層、ReLu激活層和重疊池化層的卷積模塊,以及隨機(jī)失活Dropout層,全連接層、Softmax層和分類(lèi)輸出層。
圖2 改進(jìn)的一維LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)
1) 卷積層
卷積層是CNN的核心組成部分,一個(gè)深度卷積神經(jīng)網(wǎng)絡(luò)通過(guò)多個(gè)卷積模塊來(lái)增強(qiáng)對(duì)信號(hào)的特征提取和表示能力。一維卷積操作表達(dá)式為
(1)
2) 批量規(guī)范化層
在模型中引入了批量規(guī)范化層(Batch normalization, BN),用于將各層的輸入重新歸一化,以減小內(nèi)部數(shù)據(jù)分布偏移的影響,不僅可以提高網(wǎng)絡(luò)的訓(xùn)練速度,還可以提高網(wǎng)絡(luò)的泛化性能。
(2)
3) Relu激活層
為了避免梯度飽和現(xiàn)象的發(fā)生,卷積模塊中加入了Relu激活層,用于把卷積層輸出結(jié)果做非線性映射,增強(qiáng)信息整合能力,使得其訓(xùn)練簡(jiǎn)單、快速。
(3)
4) 池化層
池化層一般位于連續(xù)的卷積層中間,包括平均池化和最大池化。池化層能夠逐漸減小表達(dá)空間的尺寸,降低網(wǎng)絡(luò)參數(shù)和計(jì)算量,也能起到控制過(guò)擬合的作用。最大池化被普遍證明有更好的效果而被廣泛采用,其運(yùn)算公式為
(4)
式中:xl(i,t)為第l層中第i個(gè)特征圖的第t個(gè)神經(jīng)元;w為卷積核的寬度;j為第j個(gè)池化核。池化層實(shí)現(xiàn)數(shù)據(jù)降維的同時(shí)進(jìn)一步突出提取特征。
5) 全連接層及輸出層
模型在兩個(gè)卷積模塊后連接一個(gè)全連接層,而后設(shè)置有Softmax層,以交叉熵?fù)p失函數(shù)作為多類(lèi)分類(lèi)目標(biāo)函數(shù)。全連接層權(quán)重ω和偏差b,f為非線性激活函數(shù),對(duì)輸入X∈Rm全連接層輸出為
δ=f(ωX+b)
(5)
Softmax層得到輸入數(shù)據(jù)的標(biāo)簽分布為
其中,?rb(m)=?b(m)+?NCO(m)+?PLL(m)-?ori(m),載波恢復(fù)后的基帶信號(hào)只包含多普勒信息,由相位?rb(m)可直接得到多普勒跟蹤結(jié)果fd(m)=Δ?(m)/ΔT。
(6)
設(shè)計(jì)的一維LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如表2所示,以12類(lèi)輸出為例,輸入層參數(shù)由輸入一維信號(hào)的長(zhǎng)度而定,一般采用2 048點(diǎn),針對(duì)一維信號(hào)的特點(diǎn),第一個(gè)卷積模塊采用64×1的長(zhǎng)卷積核,數(shù)量為16,步長(zhǎng)為8,重疊池化層窗口7×1,步長(zhǎng)5,第二個(gè)卷積模塊采用32×1的卷積核,數(shù)量為32,步長(zhǎng)為4,池化層窗口7×1,步長(zhǎng)5,全連接層神經(jīng)元個(gè)數(shù)等同于識(shí)別信號(hào)類(lèi)別數(shù)。
表2 改進(jìn)一維LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)
為驗(yàn)證本文建立模型的有效性,以美國(guó)Case Western Reserve University (CWRU)的軸承數(shù)據(jù)集[15]進(jìn)行驗(yàn)證。選取正常工況和不同程度故障的驅(qū)動(dòng)端軸承數(shù)據(jù)作為訓(xùn)練和測(cè)試樣本,數(shù)據(jù)集和標(biāo)簽設(shè)置如表3所示,對(duì)負(fù)載為0~3 HP的振動(dòng)信號(hào)進(jìn)行滑動(dòng)窗采樣,數(shù)據(jù)長(zhǎng)度為2 048點(diǎn),滑動(dòng)窗口為1 024(正常工況2 048),共獲得不同負(fù)載、不同轉(zhuǎn)速工況下的數(shù)據(jù)樣本5 645個(gè)。對(duì)所獲得的數(shù)據(jù)集打亂次序,選取70%作為訓(xùn)練集,10%作為驗(yàn)證集,20%作為測(cè)試集。
表3 數(shù)據(jù)集與標(biāo)簽
構(gòu)建網(wǎng)絡(luò)后,訓(xùn)練參數(shù)設(shè)置如下:訓(xùn)練樣本數(shù)量為3 376個(gè),驗(yàn)證樣本數(shù)量為573個(gè),初始學(xué)習(xí)率設(shè)置為0.001,衰減率為0.9,批量規(guī)范化設(shè)置為80,Dropout設(shè)為0.5,驗(yàn)證頻率為30,模型共進(jìn)行30輪訓(xùn)練,1 260次迭代。訓(xùn)練過(guò)程如圖3所示,訓(xùn)練時(shí)模型只要迭代幾步,分類(lèi)準(zhǔn)確率迅速上升,模型損失迅速下降,很快就超過(guò)90%以上,200步以后分類(lèi)準(zhǔn)確率和損失函數(shù)基本上就達(dá)能夠到收斂,整個(gè)過(guò)程訓(xùn)練速度快,效率高。
圖3 訓(xùn)練過(guò)程的識(shí)別率和交叉熵
模型訓(xùn)練完畢后,采用測(cè)試樣本集進(jìn)行性能測(cè)試,測(cè)試樣本數(shù)量為1 696個(gè),最終驗(yàn)證集的分類(lèi)正確率能達(dá)到99.82%。模型的識(shí)別率混淆矩陣如圖4所示。對(duì)于所有12類(lèi)數(shù)據(jù),模型均能夠獲得非常好的識(shí)別結(jié)果。
圖4 識(shí)別率混淆矩陣
表4是模型識(shí)別精度比較。從表4可見(jiàn),本文方法能夠和文獻(xiàn)[10-12]的診斷精度相媲美:從模型上看,文獻(xiàn)[10-11]明顯網(wǎng)絡(luò)層數(shù)要多,結(jié)構(gòu)較為復(fù)雜;從訓(xùn)練與測(cè)試樣本數(shù)量來(lái)看,文獻(xiàn)[12]所采用的模型同樣較為簡(jiǎn)單,但是為達(dá)到較高的精度文獻(xiàn)所采用的訓(xùn)練樣本量較大,訓(xùn)練測(cè)試樣本比為9∶1。綜上所述,本文所構(gòu)建的模型結(jié)構(gòu)簡(jiǎn)單,計(jì)算效率高,訓(xùn)練樣本較少時(shí)也具有非常高的識(shí)別準(zhǔn)確率。
表4 模型識(shí)別精度比較
利用階次采樣方法構(gòu)建高質(zhì)量訓(xùn)練樣本集,在訓(xùn)練樣本集較小的條件下獲得較好的訓(xùn)練效果。某8缸柴油機(jī)缸蓋振動(dòng)信號(hào)測(cè)試系統(tǒng)如圖5所示,ADXL001型振動(dòng)加速度傳感器安裝于左4缸缸蓋和氣缸體結(jié)合處。上止點(diǎn)和瞬時(shí)轉(zhuǎn)速信號(hào)測(cè)試選用霍爾傳感器,輸出軸上粘貼有磁鋼片,初始位置對(duì)應(yīng)左4缸上止點(diǎn),瞬時(shí)轉(zhuǎn)速測(cè)量選用M16-85型磁電式轉(zhuǎn)速傳感器,正對(duì)輸出端飛輪。多通道數(shù)據(jù)采集系統(tǒng)與計(jì)算機(jī)用于同步采集4缸缸蓋振動(dòng)、曲軸上止點(diǎn)和飛輪瞬時(shí)轉(zhuǎn)速信號(hào)。
圖5 發(fā)動(dòng)機(jī)缸蓋振動(dòng)信號(hào)測(cè)試系統(tǒng)示意圖
實(shí)驗(yàn)設(shè)置了正常、單缸失火、進(jìn)氣不足和復(fù)合故障(單缸失火+進(jìn)氣不足)這4種典型的工況,所有故障均設(shè)置于左4缸。采樣頻率為51.2 kHz,采集800 r/min時(shí)的上止點(diǎn)信號(hào)、瞬時(shí)轉(zhuǎn)速信號(hào)、缸蓋振動(dòng)信號(hào),如圖6所示。
圖6 柴油機(jī)同步采集信號(hào)
柴油機(jī)輸出端飛輪轉(zhuǎn)動(dòng)一圈,產(chǎn)生一個(gè)上止點(diǎn)信號(hào),轉(zhuǎn)動(dòng)兩圈則為柴油機(jī)一個(gè)完整周期。磁電式轉(zhuǎn)速傳感器獲得的轉(zhuǎn)速信號(hào)為正弦波信號(hào),每個(gè)波峰對(duì)應(yīng)于飛輪轉(zhuǎn)過(guò)的一個(gè)輪齒,經(jīng)轉(zhuǎn)換可得瞬時(shí)轉(zhuǎn)速信號(hào),由一個(gè)工作循環(huán)的轉(zhuǎn)速信號(hào)可見(jiàn)柴油機(jī)工作過(guò)程中具有較大的轉(zhuǎn)速波動(dòng)性。柴油機(jī)缸蓋振動(dòng)信號(hào)是在氣缸工作過(guò)程中由多種不同激振力共同作用產(chǎn)生的,包括氣體燃爆沖擊壓力、進(jìn)排氣門(mén)關(guān)閉時(shí)的氣閥落座沖擊力、進(jìn)排氣門(mén)開(kāi)啟時(shí)的氣流沖擊力、噴油器針閥落座沖擊力、機(jī)體振動(dòng)沖擊力以及各種隨機(jī)激振力,柴油機(jī)發(fā)生故障時(shí),這些激振力的激振時(shí)刻和激振幅值大小將發(fā)生微弱改變。
卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練與所輸入的訓(xùn)練數(shù)據(jù)樣本的質(zhì)量緊密相關(guān)。卷積神經(jīng)網(wǎng)絡(luò)具有良好的大數(shù)據(jù)學(xué)習(xí)能力,但是如果所輸入的數(shù)據(jù)樣本質(zhì)量較差,則網(wǎng)絡(luò)的學(xué)習(xí)效果也不好。對(duì)上述信號(hào)進(jìn)行不重疊階次域滑動(dòng)窗重采樣,獲得樣本數(shù)量分別為164、164、163、161個(gè),對(duì)所獲得的數(shù)據(jù)集打亂次序,選取70%為訓(xùn)練集,10%為驗(yàn)證集,20%為測(cè)試集。訓(xùn)練時(shí)初始學(xué)習(xí)率設(shè)置為0.001,衰減率為0.9,批量規(guī)范化設(shè)置為20,驗(yàn)證頻率為30,模型共進(jìn)行30輪訓(xùn)練。
為了對(duì)比,采樣滑動(dòng)窗采樣的方法對(duì)柴油機(jī)800 r/min勻速工況的振動(dòng)信號(hào)進(jìn)行采樣,分別取1 024、2 048、4 096和5 120的數(shù)據(jù)點(diǎn)數(shù),滑動(dòng)間隔500點(diǎn),分別獲得樣本數(shù)量分別為10 200、10 160、10 080、10 040,仍選取70%作為訓(xùn)練集,10%作為驗(yàn)證集,20%作為測(cè)試集,最大迭代步數(shù)設(shè)置為10 000步。訓(xùn)練過(guò)程的識(shí)別率曲線經(jīng)平滑處理后如圖7所示,階次采樣的數(shù)據(jù)樣本輸入,網(wǎng)絡(luò)模型的學(xué)習(xí)訓(xùn)練具有最大效率,只要迭代幾步識(shí)別率就迅速躍升,階次采樣訓(xùn)練樣本識(shí)別率最終達(dá)到100%。采用滑動(dòng)窗采樣的訓(xùn)練樣本,樣本質(zhì)量較差,學(xué)習(xí)訓(xùn)練效率低,模型的識(shí)別率上升緩慢。隨著滑動(dòng)采樣點(diǎn)數(shù)的增加,每個(gè)數(shù)據(jù)樣本包含的信息量增大,能夠較好地反應(yīng)柴油機(jī)的工況,訓(xùn)練效果有所改善,但是滑動(dòng)采樣的樣本信息量難免受原始信號(hào)采樣率和柴油機(jī)旋轉(zhuǎn)波動(dòng)性等因素的影響,對(duì)模型的訓(xùn)練效果影響較大。
圖7 階次采樣與滑動(dòng)采樣輸入的網(wǎng)絡(luò)訓(xùn)練過(guò)程
模型訓(xùn)練完畢后,采用測(cè)試樣本對(duì)模型的泛化能力進(jìn)行測(cè)試,識(shí)別精度如圖8所示。隨著數(shù)據(jù)點(diǎn)數(shù)的增加,輸入樣本所包含的信息量增大,模型的診斷精度不斷提高,當(dāng)輸入信號(hào)為4 096點(diǎn)時(shí)達(dá)到最佳,之后輸入數(shù)據(jù)長(zhǎng)度再增加,識(shí)別能力反而降低。這說(shuō)明數(shù)據(jù)長(zhǎng)度也不是越長(zhǎng)越好,一方面所建網(wǎng)絡(luò)模型的結(jié)構(gòu)已不適合此類(lèi)型數(shù)據(jù),喪失最佳的分析能力,且計(jì)算量巨大;另一方面受采樣率、柴油機(jī)轉(zhuǎn)速變化等眾多因素的影響,滑動(dòng)窗數(shù)據(jù)采樣長(zhǎng)度不容易確定最佳值。而本文提出基于階次采樣能夠很好地包含了柴油機(jī)一個(gè)周期的信息,具有較高的訓(xùn)練樣本數(shù)據(jù)質(zhì)量,大大提高網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)的效果,識(shí)別精度遠(yuǎn)高于滑動(dòng)窗采樣方式,達(dá)到了98.48%。
圖8 階次采樣與滑動(dòng)采樣對(duì)診斷結(jié)果的影響
構(gòu)建了基于一維振動(dòng)信號(hào)輸入的改進(jìn)LeNet-5網(wǎng)絡(luò)模型,融合了階次采樣的樣本數(shù)據(jù)集構(gòu)建方法,從樣本數(shù)據(jù)質(zhì)量和模型學(xué)習(xí)能力著手,實(shí)現(xiàn)小樣本下的高效訓(xùn)練學(xué)習(xí),并利用柴油機(jī)和軸承數(shù)據(jù)集進(jìn)行驗(yàn)證,主要結(jié)論如下:
1) 借鑒經(jīng)典的LeNet-5網(wǎng)絡(luò)模型,構(gòu)建了包含兩個(gè)卷積模塊、單一全連接層和輸出層的一維LeNet網(wǎng)絡(luò),模型結(jié)構(gòu)簡(jiǎn)單緊湊,訓(xùn)練參數(shù)較少。模型的卷積模塊結(jié)合批規(guī)范化層和Relu層,提高訓(xùn)練速度和網(wǎng)絡(luò)泛化能力,利用重疊極大池化和隨機(jī)失活來(lái)緩解網(wǎng)絡(luò)出現(xiàn)過(guò)擬合現(xiàn)象。
2) 實(shí)驗(yàn)對(duì)比分析了滑動(dòng)窗采樣和階次采樣的樣本集構(gòu)建方式,階次采樣有助于提高旋轉(zhuǎn)或往復(fù)機(jī)械數(shù)據(jù)樣本的構(gòu)建質(zhì)量,減小轉(zhuǎn)速波動(dòng)的影響,能夠使網(wǎng)絡(luò)模型在小樣本條件下仍具有非常高的訓(xùn)練精度和泛化能力。