趙 靖 楊紹普 李 強(qiáng) 劉永強(qiáng),3
1.北京交通大學(xué)機(jī)械與電子控制工程學(xué)院,北京,100044 2.石家莊鐵道大學(xué)省部共建交通工程結(jié)構(gòu)力學(xué)行為與系統(tǒng)安全國(guó)家重點(diǎn)實(shí)驗(yàn)室,石家莊,050043 3.石家莊鐵道大學(xué)機(jī)械工程學(xué)院,石家莊,050043
隨著互聯(lián)網(wǎng)的發(fā)展,機(jī)械故障診斷領(lǐng)域進(jìn)入了“大數(shù)據(jù)”時(shí)代[1]。近年來,數(shù)據(jù)驅(qū)動(dòng)算法得到了快速發(fā)展,智能故障診斷方法吸引了越來越多學(xué)者的關(guān)注[2]。智能故障診斷算法通過分析被測(cè)信號(hào),自動(dòng)學(xué)習(xí)故障特征,進(jìn)而對(duì)機(jī)器的運(yùn)行狀態(tài)進(jìn)行判別,旨在建立端到端的診斷模型。智能故障診斷算法的發(fā)展大致分為以下3個(gè)階段:傳統(tǒng)的機(jī)器學(xué)習(xí)方法、深度學(xué)習(xí)方法和遷移學(xué)習(xí)方法[3]。傳統(tǒng)的機(jī)器學(xué)習(xí)方法主要有人工神經(jīng)網(wǎng)絡(luò) (artificial neural network, ANN)、支持向量機(jī)[4](support vector machine, SVM)以及k最近鄰分類算法[5](k nearest neighbor, kNN)。傳統(tǒng)的機(jī)器學(xué)習(xí)方法雖然可以對(duì)機(jī)械系統(tǒng)的狀態(tài)進(jìn)行識(shí)別,但是其網(wǎng)絡(luò)結(jié)構(gòu)往往比較淺,泛化性能比較差,不適用于處理大批量的數(shù)據(jù)。深度學(xué)習(xí)算法的發(fā)展彌補(bǔ)了傳統(tǒng)機(jī)器學(xué)習(xí)算法的不足。CHEN等[6]利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)和極限學(xué)習(xí)機(jī)解決了齒輪和軸承的故障分類問題。ZHAO等[7]建立了卷積神經(jīng)網(wǎng)絡(luò)模型,將不同的二維灰度圖作為模型的輸入完成了不同工況下軸承的故障分類,并對(duì)模型的訓(xùn)練過程與結(jié)果進(jìn)行了可視化分析。XIE等[8]利用自適應(yīng)深度置信網(wǎng)絡(luò)(deep belief networks, DBN)診斷模型完成軸承故障分類任務(wù)。趙志宏等[9]提出一種非對(duì)稱自編碼器方法,完成了旋轉(zhuǎn)機(jī)械關(guān)鍵部件的頻域特征提取與智能診斷。深度學(xué)習(xí)方法在提取特征方面展示了獨(dú)特的優(yōu)勢(shì),尤其是卷積神經(jīng)網(wǎng)絡(luò),因其可以從復(fù)雜的二維圖中提取特征而受到眾多學(xué)者的關(guān)注。由于機(jī)械設(shè)備大多在正常狀態(tài)下工作,故采集到的信號(hào)往往都是正常的,并且獲得機(jī)器不同運(yùn)行狀態(tài)的振動(dòng)數(shù)據(jù)往往需要耗費(fèi)大量人力物力[3]。深度學(xué)習(xí)方法雖然能從信號(hào)中提取特征,但是訓(xùn)練好模型往往需要大量不同健康狀態(tài)的帶標(biāo)簽數(shù)據(jù),這在工程實(shí)際中不太現(xiàn)實(shí)。
隨著智能診斷算法的發(fā)展,為了滿足工程實(shí)際的需求,遷移學(xué)習(xí)方法吸引了一些學(xué)者的研究。遷移學(xué)習(xí)方法是將一個(gè)或多個(gè)任務(wù)中學(xué)習(xí)到的知識(shí)應(yīng)用到與之相關(guān)但不同的新任務(wù)中[10]的方法。LONG等[11]提出了一種深度域適應(yīng)網(wǎng)絡(luò)架構(gòu),采用最優(yōu)多核選擇方法進(jìn)行均值嵌入匹配,進(jìn)一步減小了域差異。SUN等[12]提出一種無監(jiān)督域自適應(yīng)方法,采用非線性變換將源域與目標(biāo)域分布的二階統(tǒng)計(jì)量對(duì)齊。LONG等[13]提出聯(lián)合自適應(yīng)網(wǎng)絡(luò),通過減小激活層輸入特征和輸出標(biāo)簽聯(lián)合分布的差異來縮小源域與目標(biāo)域的差異。GANIN等[14]將域?qū)挂脒w移學(xué)習(xí)中,完成了源域向目標(biāo)域的遷移學(xué)習(xí)。除此之外,CHEN等[15]采取一種微調(diào)的遷移學(xué)習(xí)策略完成了不同試驗(yàn)臺(tái)的遷移任務(wù)。LI等[16]提出一種最優(yōu)集成深度遷移網(wǎng)絡(luò)并應(yīng)用于軸承的故障診斷。揭震國(guó)等[17]提出一種子域適配的深度遷移方法,通過自適應(yīng)匹配不同域之間的特征解決了機(jī)械設(shè)備在變工況故障診斷時(shí)的域偏移問題。HAN等[18]將對(duì)抗學(xué)習(xí)作為一種正則化方法引入卷積神經(jīng)網(wǎng)絡(luò)中,提出了一種新的深度對(duì)抗卷積神經(jīng)網(wǎng)絡(luò)。上面介紹的遷移學(xué)習(xí)方法可以分為以下三類:①基于域自適應(yīng)的遷移學(xué)習(xí)方法。通過減小源域與目標(biāo)域的差異完成不同工況的遷移,這類方法統(tǒng)稱為域自適應(yīng)方法,文獻(xiàn)[11-13,17]可歸為此類。②基于對(duì)抗的遷移學(xué)習(xí)方法。部分學(xué)者致力于研究對(duì)抗學(xué)習(xí)的遷移策略,文獻(xiàn)[14,18]屬于這一類。③基于預(yù)訓(xùn)練的遷移學(xué)習(xí)方法。即從源域與目標(biāo)域中找到共享的參數(shù)信息來完成遷移學(xué)習(xí),文獻(xiàn)[15-16]屬于預(yù)訓(xùn)練遷移學(xué)習(xí)[19]。
隨著遷移學(xué)習(xí)診斷精度的提高,模型的結(jié)構(gòu)變得越來越復(fù)雜,模型的訓(xùn)練時(shí)間變得也越來越長(zhǎng)。但是,工程中往往更需要高精度高效率的模型,為了滿足工程應(yīng)用,亟需一種準(zhǔn)確率高且計(jì)算時(shí)間短的遷移學(xué)習(xí)模型。特征提取在模型學(xué)習(xí)過程中發(fā)揮著不可或缺的作用,有效的特征提取能達(dá)到事半功倍的效果。本文提出一種基于殘差注意力卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)故障診斷算法。為了捕捉不同健康狀態(tài)的特征,在卷積神經(jīng)網(wǎng)絡(luò)模型的最后加入殘差注意力。為了測(cè)評(píng)本文方法的性能,將基于殘差注意力卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)的在不同遷移學(xué)習(xí)策略下的結(jié)果進(jìn)行對(duì)比。為了進(jìn)一步探究不同故障特征在模型訓(xùn)練過程中的變化情況,在對(duì)不同域的分類結(jié)果做了進(jìn)一步的可視化分析的同時(shí),進(jìn)一步分析了某一具體樣本在模型訓(xùn)練過程中的特征分布情況。
遷移學(xué)習(xí)中,被遷移的領(lǐng)域稱為源域(source domain),待學(xué)習(xí)的領(lǐng)域稱為目標(biāo)域(target domain)。源域Ds和目標(biāo)域Dt組成了遷移學(xué)習(xí)中兩個(gè)重要的域。
遷移學(xué)習(xí)的工作過程描述如下:利用實(shí)驗(yàn)室中機(jī)械設(shè)備故障模擬實(shí)驗(yàn)獲得的數(shù)據(jù)訓(xùn)練一個(gè)可靠的遷移學(xué)習(xí)模型,再用訓(xùn)練好的模型去判斷工程實(shí)際中機(jī)械設(shè)備的工作狀態(tài)。遷移學(xué)習(xí)在具體的應(yīng)用中,源域的數(shù)據(jù)通常都是在實(shí)驗(yàn)室獲得的帶標(biāo)簽的機(jī)械設(shè)備故障數(shù)據(jù),而目標(biāo)域通常都是不帶標(biāo)簽的數(shù)據(jù),因?yàn)楣こ虒?shí)際中機(jī)械設(shè)備的工作狀態(tài)具有很大的不確定性,所以目前遷移學(xué)習(xí)研究主要針對(duì)不同實(shí)驗(yàn)臺(tái)或同一實(shí)驗(yàn)臺(tái)不同工況之間的遷移。
結(jié)合遷移學(xué)習(xí)相關(guān)概念及相關(guān)術(shù)語,遷移學(xué)習(xí)的目標(biāo)有以下3種情景[19]:①特征空間不同,即Xs≠Xt;②類別空間不同,即ys≠yt;③特征空間和類別空間均相同、概率分布不同,即Ps(x,y)≠Pt(x,y),本文研究?jī)?nèi)容主要針對(duì)情景③。源域與目標(biāo)域的特征空間相同,類別空間相同,概率分布不同,源域中是帶標(biāo)簽的樣本,目標(biāo)域中是不帶標(biāo)簽的樣本。
卷積神經(jīng)網(wǎng)絡(luò)一般由卷積層、池化層及全連接層組成[20]。卷積神經(jīng)網(wǎng)絡(luò)具有局部連接和權(quán)重共享特性,是一種深層前饋神經(jīng)網(wǎng)絡(luò)[21]。卷積層是卷積神經(jīng)網(wǎng)絡(luò)的重要組成部分,由一系列卷積核組成,卷積運(yùn)算是在輸入信號(hào)與卷積核之間進(jìn)行的。對(duì)于每一個(gè)輸入xi和卷積核wj,卷積運(yùn)算之后輸出特征如下:
(1)
其中,yi,j是卷積之后輸出的特征;bj是偏置;wj是卷積核;*表示卷積操作;σ(·)是激活函數(shù),常用的激活函數(shù)有Sigmoid( )函數(shù)、Softmax( )函數(shù)、Tanh( )函數(shù)和ReLu( )(rectified linear unit)函數(shù)等。ReLu( )函數(shù)具有以下優(yōu)點(diǎn):①采用ReLu的神經(jīng)元只需要進(jìn)行加、乘和比較操作,計(jì)算上更加高效。②在優(yōu)化方面,在一定程度上緩解了神經(jīng)網(wǎng)絡(luò)的梯度消失問題,加速梯度下降的收斂速度,且ReLu( )函數(shù)具有很好的稀疏性。Softmax( )函數(shù)常用于分類問題的輸出層。因此,本文選取ReLu( )函數(shù)作為隱藏層激活函數(shù),Softmax( )函數(shù)作為輸出層的激活函數(shù)。
卷積運(yùn)算之后是池化運(yùn)算,池化運(yùn)算降低了特征維數(shù),減少了計(jì)算時(shí)間。常用的池化運(yùn)算有最大池化和平均池化運(yùn)算。
最大池化運(yùn)算,選取特征區(qū)域的最大值:
(2)
式中,R為池化區(qū)域;yij為卷積層輸出的激活值;Y為最大池化結(jié)果。
平均池化運(yùn)算,計(jì)算特征區(qū)域所有值的平均值:
(3)
卷積神經(jīng)網(wǎng)絡(luò)最后是全連接層,在全連接層中,需要將經(jīng)過卷積層運(yùn)算與池化運(yùn)算之后的特征進(jìn)行展平。模型在經(jīng)全連接層之后,經(jīng)過Softmax( )激活函數(shù)之后即可得到模型學(xué)習(xí)結(jié)果。模型在訓(xùn)練過程中會(huì)產(chǎn)生較多的參數(shù),為了防止過擬合,在搭建卷積神經(jīng)網(wǎng)絡(luò)的過程中,常常還會(huì)加入Dropout(·)運(yùn)算和批量歸一化(batch normalization, BN)。
ZHU等[22]提出了殘差注意力(class-specific residual attention,CSRA)并將其應(yīng)用于多標(biāo)簽識(shí)別中。受其啟發(fā),本文將CSRA應(yīng)用于軸承的故障特征識(shí)別中,輸入特征xi的注意力分?jǐn)?shù)為
(4)
注意力分?jǐn)?shù)確定之后,xi的特征為
(5)
輸出特征為
f(i)=g+λa(i)
(6)
式中,g為輸入特征的均值;F(i)為殘差注意力網(wǎng)絡(luò)的輸出結(jié)果。
特征殘差注意力既考慮了整體,又考慮了局部,可以充分利用模型訓(xùn)練過程中不同特征的分布。
為了提取故障特征,本文將殘差注意力網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)結(jié)合起來,將殘差注意力網(wǎng)絡(luò)應(yīng)用于卷積神經(jīng)網(wǎng)絡(luò)最后,基于殘差注意力的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)見表1。
表1 基于殘差注意力的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
為了測(cè)評(píng)所建模型的特征提取能力,本文將其與傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對(duì)比,進(jìn)一步測(cè)評(píng)本文模型在故障特征提取方面的優(yōu)越性。需要說明的是,為了公平起見,本文所用的傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)模型與本文方法的part Ⅰ~part Ⅳ相同,最后一層是全連接層,而本文方法的最后一層是殘差注意力網(wǎng)絡(luò)。
本文采用4種常用的遷移學(xué)習(xí)方法測(cè)評(píng)不同模型的遷移策略:DAN (deep adaptation networks)[11]、CORAL(correlation alignment)[12]、JAN (joint adaptation networks)[13]和DA (domain-adversarial)[14]。將本文方法與傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)分別在這4種不同的遷移模型上進(jìn)行測(cè)試,對(duì)比不同模型診斷結(jié)果。本文方法主要由3部分組成:數(shù)據(jù)處理、特征提取與遷移結(jié)果可視化,具體內(nèi)容如圖1所示。
圖1 基于CSRA-CNN的故障診斷方法示意圖
本文方法的流程圖見圖2,具體步驟如下:
圖2 本文方法流程圖
(1)獲取機(jī)械設(shè)備不同工況下的監(jiān)測(cè)數(shù)據(jù),構(gòu)建源域與目標(biāo)域,其中源域數(shù)據(jù)是帶標(biāo)簽的,目標(biāo)域數(shù)據(jù)是不帶標(biāo)簽的。
(2)劃分訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),構(gòu)建以殘差注意力卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的遷移學(xué)習(xí)模型。
(3)用訓(xùn)練集數(shù)據(jù)訓(xùn)練所建模型,通過文獻(xiàn)[11-14]方法對(duì)模型參數(shù)及特征進(jìn)行訓(xùn)練與提取,優(yōu)化特征以達(dá)到較好的遷移效果。將本文方法與傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)分別在這四種不同的遷移模型上進(jìn)行測(cè)試,對(duì)比不同模型診斷結(jié)果。
(4)重復(fù)步驟(3),直到給定的迭代次數(shù),得到訓(xùn)練好的模型。
(5)用目標(biāo)域數(shù)據(jù)測(cè)試訓(xùn)練好的模型,得到診斷結(jié)果,并對(duì)模型的訓(xùn)練過程及結(jié)果進(jìn)行可視化分析。
3.1.1數(shù)據(jù)介紹
為評(píng)估本文方法的性能,采用動(dòng)力傳動(dòng)故障診斷綜合實(shí)驗(yàn)臺(tái)對(duì)本文方法進(jìn)行驗(yàn)證。實(shí)驗(yàn)臺(tái)的結(jié)構(gòu)如圖3所示,主要由電機(jī)、齒輪箱、測(cè)試軸承以及電磁制動(dòng)器等組成。本實(shí)驗(yàn)測(cè)試軸承共設(shè)置四種不同狀態(tài):正常軸承、外圈故障軸承、內(nèi)圈故障軸承與滾子故障軸承。采樣頻率為51.2 kHz,采樣時(shí)長(zhǎng)為60 s。為了更貼近工程實(shí)際,本實(shí)驗(yàn)轉(zhuǎn)速設(shè)置為變轉(zhuǎn)速,共設(shè)置三種不同的轉(zhuǎn)速:0-1200-0 r/min、0-2400-0 r/min和0-3600-0 r/min,將這三種不同轉(zhuǎn)速下測(cè)得的振動(dòng)數(shù)據(jù)分別記為數(shù)據(jù)集A、B和C。以轉(zhuǎn)速0-1200-0 r/min為例,它表示轉(zhuǎn)速由0升到1200 r/min,再由1200 r/min降到0,該工況下的轉(zhuǎn)速是先升再降的一個(gè)過程,轉(zhuǎn)速0-2400-0 r/min和0-3600-0 r/min同理。每種健康狀態(tài)隨機(jī)采用400個(gè)樣本,所以每種工況有1600個(gè)樣本。在這些樣本中,80%的樣本用于訓(xùn)練所建模型,剩下的樣本用于測(cè)試模型,具體細(xì)節(jié)見表2。
圖3 動(dòng)力傳動(dòng)故障診斷綜合實(shí)驗(yàn)臺(tái)
表2 測(cè)試軸承工況
3.1.2遷移任務(wù)設(shè)置
本實(shí)驗(yàn)所用數(shù)據(jù)通過下式進(jìn)行標(biāo)準(zhǔn)化預(yù)處理:
(7)
因卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別、語音識(shí)別、目標(biāo)跟蹤等方面得到了廣泛的應(yīng)用[21],受文獻(xiàn)[7]啟發(fā),本文將一維振動(dòng)轉(zhuǎn)化成二維灰度圖作為模型的輸入。將每個(gè)樣本的一維長(zhǎng)度選為1024,轉(zhuǎn)化為32×32的二維灰度圖。本實(shí)驗(yàn)共有3種數(shù)據(jù)集A、B和C,以此為基礎(chǔ),設(shè)置以下6種遷移任務(wù):A-B、A-C、B-A、B-C、C-A和C-B,遷移任務(wù)設(shè)置見表3。以A-B為例,A表示源域數(shù)據(jù)集,B表示目標(biāo)域數(shù)據(jù)集。隨機(jī)選取80%的數(shù)據(jù)用于模型訓(xùn)練,剩下的數(shù)據(jù)用于測(cè)試模型。將本文方法與傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)分別在這4種不同的遷移模型上進(jìn)行測(cè)試,對(duì)比不同模型診斷結(jié)果。
表3 遷移任務(wù)
3.1.3遷移診斷結(jié)果分析
以遷移任務(wù)A-C為例,源域A和目標(biāo)域C中不同健康狀態(tài)的時(shí)域圖和灰度圖見圖4。可以看出,源域A中不同健康狀態(tài)時(shí)域圖的波形不一樣,這種不同的波形在灰度圖中也展現(xiàn)出了不同的特征,二維灰度圖可用于描述軸承的不同健康狀態(tài),目標(biāo)域C中存在相同的現(xiàn)象。然后,將源域與目標(biāo)域的二維灰度圖輸入本文模型與對(duì)比模型中,不同方法下的遷移結(jié)果見表4。其中,CSRA-CNN表示本文模型,CNN表示傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型??梢钥闯?,本文方法的遷移結(jié)果均優(yōu)于傳統(tǒng)CNN,為了更加清楚地展現(xiàn)表4的遷移結(jié)果,圖5給出了表4的柱狀圖。可以看出,相比傳統(tǒng)的CNN模型,本文模型在不同方法與不同遷移任務(wù)上均能達(dá)到較高的遷移準(zhǔn)確率,進(jìn)一步說明本文模型在特征提取階段捕捉到了更有用的特征。
(a)源域 (b)目標(biāo)域
表4 遷移結(jié)果
圖5 遷移結(jié)果柱狀圖
為了進(jìn)一步論證本文所建模型的特征提取能力,同樣以遷移任務(wù)A-B為例,給出了本文模型與傳統(tǒng)CNN模型在訓(xùn)練過程中源域與目標(biāo)域的特征分布圖(圖6)。
圖6a~圖6d為本文模型中Part Ⅰ-Part Ⅳ激活層中源域與目標(biāo)域的特征分布圖,圖6e~圖6h為傳統(tǒng)CNN模型中Part Ⅰ-Part Ⅳ激活層中源域與目標(biāo)域的特征分布圖。由圖6可得到以下結(jié)論:
(1)在模型訓(xùn)練初期,源域與目標(biāo)域的故障特征混淆在一起,沒有進(jìn)行有效分離,這種現(xiàn)象在本文模型與傳統(tǒng)CNN模型中表現(xiàn)一致,可以由圖6a 、圖6b與圖6e、圖6f看出。隨著模型結(jié)構(gòu)的加深,本文模型特征聚類效果明顯。同一域下不同故障類型的特征聚集在一起的同時(shí),不同域中同一故障類型的特征也聚集在一起,這可以由圖6c、圖6d看出。但是,傳統(tǒng)CNN模型特征未能有效聚類。圖6g、圖6h中不同故障類型的特征雖然相比圖6e、圖6f有所聚集,但是所有特征聚集在一起,難以區(qū)分。
(2)除此之外,本文模型中,在Part Ⅰ、Part Ⅱ和Part Ⅲ中始終存在一簇離群樣本,這從圖6a~圖6c中可以看出,在Part Ⅳ中沒有再出現(xiàn)該簇離群樣本。但是在傳統(tǒng)CNN模型的Part Ⅰ、Part Ⅱ和Part Ⅲ中同樣存在一簇離群樣本,在Part Ⅳ中該簇離群樣本不但沒有消失,反而又多了一簇,這從圖6e、圖6h中可以看出。
(a)Part Ⅰ-CSRA (b)Part Ⅱ-CSRA
(3)綜上,本文模型在故障特征提取方面優(yōu)于傳統(tǒng)CNN模型,能較出色地完成軸承在不同變轉(zhuǎn)速工況下的遷移學(xué)習(xí)任務(wù)。
選取目標(biāo)域B中某一正常健康狀態(tài)樣本,分析該樣本在模型訓(xùn)練過程中的特征分布情況,其原始信號(hào)的一維時(shí)域圖與二維灰度圖及該樣本在模型訓(xùn)練過程中的特征分布grad-cam圖[23]見圖7。
由圖7a、圖7b可以看出,一維時(shí)域圖中有一部分幅值相對(duì)較高,這種特征在二維灰度圖中也可看出。其中,圖7c、圖7f是本文方法Part Ⅰ-Part Ⅳ中激活層的特征圖,圖7g、圖7j是傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)Part Ⅰ-Part Ⅳ中激活層的特征圖。對(duì)比圖7c~圖7f與圖7g~圖7j可以發(fā)現(xiàn):與傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)相比,基于殘差注意力的卷積神經(jīng)網(wǎng)絡(luò)可以捕捉到有效的特征并將灰度圖中幅值相對(duì)較高的特征提取出來,而傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)在特征提取方面效果不佳,由此可知,本文模型可以更好地提取故障特征。
(a)一維振動(dòng)信號(hào) (b) 二維灰度圖
3.2.1數(shù)據(jù)介紹
為評(píng)估本文模型的性能,除了采用動(dòng)力傳動(dòng)故障診斷綜合實(shí)驗(yàn)臺(tái)對(duì)其驗(yàn)證之外,本文還采用高速列車綜合實(shí)驗(yàn)臺(tái)對(duì)本文方法進(jìn)行驗(yàn)證。實(shí)驗(yàn)臺(tái)結(jié)構(gòu)如圖8所示,該實(shí)驗(yàn)臺(tái)主要由測(cè)試軸承、支撐軸承和驅(qū)動(dòng)電機(jī)等構(gòu)成。該實(shí)驗(yàn)臺(tái)可以通過施加徑向和軸向的靜載荷或動(dòng)載荷,模擬軸承的運(yùn)行工況,完成不同速度等級(jí)和負(fù)載工況下的實(shí)驗(yàn)。
圖8 高速列車綜合實(shí)驗(yàn)臺(tái)
本實(shí)驗(yàn)測(cè)試軸承共設(shè)置3種健康狀態(tài):外圈故障軸承、內(nèi)圈故障軸承和正常狀態(tài)軸承。實(shí)驗(yàn)的采樣頻率為51.2 kHz,采樣時(shí)長(zhǎng)為60 s。該實(shí)驗(yàn)在變轉(zhuǎn)速下設(shè)置了三種不同的載荷,速度設(shè)置為0-2100-0 r/min,載荷分別設(shè)置如下:不加載、靜載 (徑向8.5 t,軸向5 t)和動(dòng)載 (徑向8 t,軸向4 t,0.2-20 Hz),0.2-20 Hz是指載荷的變化方式。與實(shí)驗(yàn)一相同,0-2100-0 r/min表示轉(zhuǎn)速由0升到2100 r/min,再由2100 r/min降到0,該工況下的轉(zhuǎn)速同樣是先升再降的一個(gè)過程。將這3種不同載荷下測(cè)得的振動(dòng)數(shù)據(jù)分別記為數(shù)據(jù)集D、E和F。與實(shí)驗(yàn)一相同,從每種健康狀態(tài)下隨機(jī)選取400個(gè)樣本,每種工況有1200個(gè)樣本。在這些樣本中,80%的樣本用于訓(xùn)練所建模型,剩下的樣本用于測(cè)試模型,具體細(xì)節(jié)見表5。
表5 測(cè)試軸承工況
3.2.2遷移任務(wù)設(shè)置
該實(shí)驗(yàn)所用數(shù)據(jù)同樣通過式(7)進(jìn)行標(biāo)準(zhǔn)化預(yù)處理。與實(shí)驗(yàn)一相同,每個(gè)樣本的一維長(zhǎng)度選為1024,轉(zhuǎn)化為32×32的二維灰度圖。本實(shí)驗(yàn)同樣有三種不同的數(shù)據(jù)集D、E和F,以這3種不同的數(shù)據(jù)集為基礎(chǔ),設(shè)置以下6種遷移任務(wù):D-E、D-F、E-D、E-F、F-D和F-E,遷移任務(wù)設(shè)置見表6。以D-E為例,隨機(jī)選取80%的數(shù)據(jù)用于模型訓(xùn)練,剩下的數(shù)據(jù)用于模型測(cè)試。將本文方法與傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)分別在這4種不同的遷移模型上進(jìn)行測(cè)試,對(duì)比不同模型診斷結(jié)果。
表6 遷移任務(wù)
3.2.3遷移診斷結(jié)果分析
同樣以遷移任務(wù)D-E為例,源域D和目標(biāo)域E中不同健康狀態(tài)的時(shí)域圖和灰度圖見圖9??梢钥闯?,源域D中不同健康狀態(tài)時(shí)域圖的波形不同,這種不同的波形在灰度圖中也展現(xiàn)出了不同的特征,二維灰度圖可以用于描述不同健康狀態(tài)的軸承,目標(biāo)域E中存在相同的現(xiàn)象。同理,再將源域與目標(biāo)域的二維灰度圖輸入本文模型與對(duì)比模型中,不同方法下的遷移結(jié)果見表7。其中,CSRA-CNN表示本文所提的基于殘差注意力的卷積神經(jīng)網(wǎng)絡(luò)模型,CNN表示傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型。由表7可以得出如下結(jié)論:
表7 遷移結(jié)果
(1)與實(shí)驗(yàn)一中表4的遷移結(jié)果相比,實(shí)驗(yàn)二中的遷移結(jié)果效果略差,出現(xiàn)這種現(xiàn)象的原因是實(shí)驗(yàn)二中的實(shí)驗(yàn)工況更加復(fù)雜。實(shí)驗(yàn)一中考慮的是變轉(zhuǎn)速工況之間的遷移,只有轉(zhuǎn)速在變。而在實(shí)驗(yàn)二中,轉(zhuǎn)速在變化的同時(shí),載荷也在變,工況更加復(fù)雜,因此遷移效果略差,這與實(shí)際情況也是相符的。
(2)與實(shí)驗(yàn)一相同,本文方法的遷移結(jié)果均優(yōu)于傳統(tǒng)的CNN。同樣,為了更加清楚地展現(xiàn)表7的遷移結(jié)果,圖10給出了表7的柱狀圖。
圖10 遷移結(jié)果柱狀圖
由圖10可以看出,相比傳統(tǒng)的CNN模型,本文模型的遷移準(zhǔn)確率在變轉(zhuǎn)速變載荷的工況下均占優(yōu)勢(shì),進(jìn)一步證明本文模型在特征提取階段捕捉到了更有用的特征。同理,為了進(jìn)一步論證本文模型的特征提取能力,同樣以遷移任務(wù)D-E為例,給出了本文模型與傳統(tǒng)CNN模型在訓(xùn)練過程中源域與目標(biāo)域的特征分布圖(圖11)。
與實(shí)驗(yàn)一相同,圖11a~圖11d分別為本文模型中Part Ⅰ-Part Ⅳ激活層中源域與目標(biāo)域的特征分布圖,圖11e~圖11h分別為傳統(tǒng)CNN模型中PartⅠ-Part Ⅳ激活層中源域與目標(biāo)域的特征分布圖。由圖11可以得到以下結(jié)論:
(1)從圖11a~圖11d中可以看出,在PartⅠ、PartⅡ和PartⅢ中,源域和目標(biāo)域的故障特征混淆在一起,沒有進(jìn)行有效分離;在Part Ⅳ中,同一域下不同故障類型的特征聚集在一起的同時(shí),不同域中同一故障類型的特征也聚集在一起,這與實(shí)驗(yàn)二表7中遷移結(jié)果分析相吻合。傳統(tǒng)CNN模型更沒有達(dá)到特征有效聚類的效果,這可以由圖11e~圖11h看出,在圖11h的Part Ⅳ中,不同故障類型的特征雖然相比前三部分有所聚集,但是效果并不好。
(a)Part Ⅰ-CSRA (b)Part Ⅱ-CSRA
(2)實(shí)驗(yàn)二分析結(jié)果證明本文模型在故障特征提取方面優(yōu)于傳統(tǒng)CNN模型,能較出色地完成軸承在變轉(zhuǎn)速變載荷工況下的遷移學(xué)習(xí)任務(wù)。
(3)實(shí)驗(yàn)二中的特征聚類比實(shí)驗(yàn)一結(jié)果略差,出現(xiàn)這種現(xiàn)象的原因是實(shí)驗(yàn)二中遷移任務(wù)的工況更加復(fù)雜,轉(zhuǎn)速在變化的同時(shí)載荷也在變化,這可以說明遷移結(jié)果因更加復(fù)雜的工況而變差。
選取目標(biāo)域E中某一內(nèi)圈故障樣本,分析該樣本在模型訓(xùn)練過程中的特征分布情況,其原始信號(hào)的一維時(shí)域圖與二維灰度圖與該樣本在模型訓(xùn)練過程中的特征分布grad-cam圖見圖12。由圖12a、圖12b可以看出,一維時(shí)域圖中有一簇幅值相對(duì)較高,這種特征在二維灰度圖中也可看出。與圖7相同,圖12c~圖12f是本文方法Part Ⅰ-Part Ⅳ中激活層的特征圖,圖12g~圖12j是傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)PartⅠ-Part Ⅳ中激活層的特征圖。對(duì)比圖12c~圖12與圖12g~圖12j可以發(fā)現(xiàn):基于殘差注意力的卷積神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)均可捕捉到這一簇幅值相對(duì)較高的信號(hào),但是與圖12b中的二維灰度圖相比,本文方法可以提取到信號(hào)中更為細(xì)致的信息,這一點(diǎn)從圖12c~圖12f可以看出。
(a)一維振動(dòng)信號(hào) (b) 二維灰度圖
(1)將本文方法與傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)分別在四種不同的遷移模型上對(duì)兩個(gè)不同實(shí)驗(yàn)臺(tái)上的數(shù)據(jù)進(jìn)行測(cè)試,在實(shí)驗(yàn)一中完成了變轉(zhuǎn)速下軸承不同健康狀態(tài)的遷移學(xué)習(xí),在實(shí)驗(yàn)二中完成了變轉(zhuǎn)速變載荷下軸承不同健康狀態(tài)的遷移學(xué)習(xí)。結(jié)果顯示本文所提的CSRA-CNN遷移效果優(yōu)于傳統(tǒng)的CNN,進(jìn)一步證明本文方法可以提取到更多有效特征。
(2)對(duì)目標(biāo)域的分類結(jié)果做了可視化分析的同時(shí),分析了樣本在模型訓(xùn)練過程中的特征學(xué)習(xí),并進(jìn)一步分析了有無殘差注意力時(shí)模型的遷移學(xué)習(xí)能力。結(jié)果表明,殘差注意力在遷移學(xué)習(xí)過程的特征提取中發(fā)揮著重要的作用。
(3)實(shí)驗(yàn)二中的特征聚類比實(shí)驗(yàn)一結(jié)果略差,出現(xiàn)這種現(xiàn)象的原因是實(shí)驗(yàn)二中遷移任務(wù)的工況更加復(fù)雜,轉(zhuǎn)速在變化的同時(shí)載荷也在變化,可以說明遷移結(jié)果因更加復(fù)雜的工況而變差,這對(duì)遷移學(xué)習(xí)的工程應(yīng)用具有一定的參考價(jià)值。