趙曉平, 呂凱揚(yáng), 邵 凡, 張中洋
(1.南京信息工程大學(xué) 計算機(jī)與軟件學(xué)院,南京 210044;2.南京信息工程大學(xué) 江蘇省網(wǎng)絡(luò)監(jiān)控中心,南京 210044;3.南京信息工程大學(xué) 自動化學(xué)院,南京 210044)
機(jī)械故障診斷是對工業(yè)生產(chǎn)設(shè)備進(jìn)行維護(hù)的最佳途徑,故滾動軸承故障診斷[1]是現(xiàn)今工業(yè)生產(chǎn)過程不可或缺的任務(wù)。因滾動軸承長期處于連續(xù)工作狀態(tài)且工作環(huán)境極其惡劣,故很容易發(fā)生故障[2]。一旦滾動軸承損壞,輕則導(dǎo)致機(jī)器故障延誤生產(chǎn),重則造成重大事故甚至出現(xiàn)傷亡。因此,對滾動軸承的工作狀況進(jìn)行監(jiān)測,確認(rèn)已發(fā)生的故障類型并及時做出相應(yīng)的零件更換具有重要意義[3]。
隨著科技的不斷創(chuàng)新以及大數(shù)據(jù)技術(shù)的不斷發(fā)展,大量軸承運(yùn)轉(zhuǎn)狀態(tài)的監(jiān)測信息被記錄下來。因此,以數(shù)據(jù)驅(qū)動方式為根本的故障診斷方法被學(xué)術(shù)以及工業(yè)領(lǐng)域廣泛運(yùn)用。而在實際數(shù)據(jù)采集環(huán)境中,通過頻繁停機(jī)檢查確定故障類型費(fèi)時費(fèi)力,故需通過試驗臺采集已知故障信號從而對實際工作環(huán)境中的未知故障進(jìn)行診斷。傳統(tǒng)的滾動軸承故障診斷方法主要采用時頻分析方法,通過對振動信號的故障特征進(jìn)行降維和提取,進(jìn)而獲取故障診斷結(jié)果。蔡艷平等[4]結(jié)合經(jīng)驗小波變換與同步壓縮小波變換進(jìn)行圖像的紋理特征提取,有效地降低了振動信號間的交叉干擾,提高了故障診斷的準(zhǔn)確率。李勇發(fā)等[5]考慮到故障檢測方法泛化能力較弱的問題,提出了融合支持向量數(shù)據(jù)描述與小波奇異譜的滾動軸承故障檢測方法,通過db5小波對信號分解后進(jìn)行篩選,最后通過支持向量數(shù)據(jù)描述訓(xùn)練,有效地實現(xiàn)了滾動軸承故障診斷。但是,傳統(tǒng)的故障診斷方法過分依賴于專家知識,容易造成誤判,且面對數(shù)據(jù)量日益增大的機(jī)械診斷任務(wù),很難高效地完成診斷工作。
近年來,深度學(xué)習(xí)技術(shù)迅猛發(fā)展,在圖像識別與分割、自動駕駛、目標(biāo)風(fēng)格變換等方向都得到了廣泛運(yùn)用。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)作為深度學(xué)習(xí)中的一類模式分析方法,因其強(qiáng)大的自適應(yīng)特征提取能力以及學(xué)習(xí)能力,越來越多的學(xué)者和專家將其運(yùn)用到故障診斷領(lǐng)域。趙曉平等[6]提出了一種基于多任務(wù)深度學(xué)習(xí)模型的診斷方法,針對單標(biāo)簽系統(tǒng)會忽視復(fù)合故障之間關(guān)系的情況,引入了多標(biāo)簽系統(tǒng),從而實現(xiàn)了對多故障情況的準(zhǔn)確分類。湯保平等[7]考慮到齒輪箱內(nèi)部各個零部件的振動信號重疊嚴(yán)重的問題,提出了一種多共振分量融合CNN,得到了不錯的分類效果。針對傳統(tǒng)的旋轉(zhuǎn)機(jī)械故障算法抗干擾性差,無法準(zhǔn)確提取故障特征的問題,Shao等[8]提出了一種基于遷移學(xué)習(xí)的對抗域自適應(yīng)方法,對故障特征利用最大均方差和域混淆函數(shù)進(jìn)行域間自適應(yīng),實現(xiàn)了跨域故障診斷。但是,深度學(xué)習(xí)故障診斷模型大多是以數(shù)據(jù)驅(qū)動的方式來對模型進(jìn)行訓(xùn)練,通過試驗臺采集的數(shù)據(jù)進(jìn)行模型訓(xùn)練,往往導(dǎo)致訓(xùn)練出來的故障診斷模型可遷移性較差。在實際生產(chǎn)過程中,因為工況不同、生產(chǎn)環(huán)境復(fù)雜等原因,出現(xiàn)的故障種類不可預(yù)測,這可能會導(dǎo)致無可用的測試類樣本進(jìn)行故障診斷模型的訓(xùn)練。因此,為了解決上述問題,筆者結(jié)合零樣本學(xué)習(xí)(zero-shot learning, ZSL)的思想,在無測試類樣本可供訓(xùn)練的情況下完成對未知類故障的診斷工作。
ZSL[9]由Palatucci和Hinton等于2009年提出,該方法在模型的學(xué)習(xí)過程中,訓(xùn)練集和測試集沒有交集。ZSL模型在使用非測試類的樣本進(jìn)行訓(xùn)練后,通過屬性遷移、語義輸出編碼、跨模態(tài)遷移[10]等方法,仍能對測試類進(jìn)行準(zhǔn)確的分類。Norouzi等[11]構(gòu)造了一個圖像分類模型,通過類標(biāo)簽將圖像映射到語義空間中,從而在不需要對測試類進(jìn)行額外訓(xùn)練的情況下,完成圖片分類任務(wù)。Verma等[12]建立了一個基于概率編碼器的ZSL框架,減小了預(yù)測的偏差,在ZSL常用的公開數(shù)據(jù)集上都得到了不錯的結(jié)果。然而上述幾個ZSL的試驗中,試驗對象往往是物品或者動物等,而將零樣本圖像識別的方法遷移到故障診斷方向時,這些物品的屬性并不適用于工業(yè)傳感器信號,因此在進(jìn)行零樣本滾動軸承故障診斷任務(wù)時,需要更加有代表性的故障屬性信息來輔助識別工作。
針對零樣本故障診斷問題,F(xiàn)eng等[13]采用了一種基于故障描述的屬性遷移方法,從而實現(xiàn)了對TEP數(shù)據(jù)集故障的準(zhǔn)確診斷,該方法使用良好的語言描述代替樣本來進(jìn)行診斷和識別各種故障,然而該模型完成特征提取任務(wù)的主成分分析方法(principal component analysis,PCA),需要大量的先驗知識才可以最優(yōu)化保留特征維數(shù),故提取的特征往往不能很好地代表訓(xùn)練和測試樣本。針對上述問題,筆者從屬性描述的角度出發(fā),提出了一種結(jié)合Xception網(wǎng)絡(luò)[14]與CNN的零樣本滾動軸承故障診斷方法,即X-CNN故障診斷模型。本方法憑借對現(xiàn)有固定故障類型的屬性學(xué)習(xí),完成在工業(yè)場景下對未見類故障的識別工作,以此擺脫對共享故障類型的依賴,從而令使用范圍更加廣泛。該方法采用Xception網(wǎng)絡(luò)對故障信號時頻圖進(jìn)行特征提取;根據(jù)故障類別的屬性描述構(gòu)建屬性矩陣,使用CNN對提取的特征進(jìn)行屬性學(xué)習(xí);最后通過屬性矩陣的相似度比較完成故障診斷工作。
傳統(tǒng)的機(jī)器學(xué)習(xí)采用大量具有標(biāo)簽的數(shù)據(jù)進(jìn)行有監(jiān)督學(xué)習(xí),現(xiàn)如今人們已經(jīng)不滿足這種繁瑣的學(xué)習(xí)方式,于是針對一些尚未獲得大量訓(xùn)練數(shù)據(jù)的新類型,或者需要消耗繁雜、巨大的人力物力才能獲得足夠訓(xùn)練數(shù)據(jù)的對象,提出了一種零樣本學(xué)習(xí)方法[15]。
ZSL衍生于遷移學(xué)習(xí)[16],但是卻與普通的遷移學(xué)習(xí)方法有著很大的區(qū)別:在ZSL的訓(xùn)練過程中,訓(xùn)練集樣本類型和測試集是沒有交集的[17]。ZSL模型通過對其他已知類別的學(xué)習(xí),完成對未知類的識別。這一過程常常搭建直接屬性預(yù)測(direct attribute prediction,DAP)模型來進(jìn)行分類工作。DAP的結(jié)構(gòu)圖如圖1所示。
圖1中:D1,D2,…,DK為訓(xùn)練類數(shù)據(jù);DK+1,DK+2,…,DK+M為測試類數(shù)據(jù);y={ε1,ε2,…,εN}為不同類型訓(xùn)練數(shù)據(jù)的屬性向量。通過對屬性學(xué)習(xí)器α1,α2,…,αz的訓(xùn)練,完成對數(shù)據(jù)屬性的預(yù)測,從而得到輸入數(shù)據(jù)的特征估計,最終進(jìn)行分類判斷,其分類過程如式(1)
圖1 直接屬性預(yù)測模型
(1)
式中:M為數(shù)據(jù)包含的屬性數(shù)目;εn,l為l類屬性的第n個分量;p(εn,lx)為輸入數(shù)據(jù)x的特定屬性包含的概率;P(εn,l)則為對該類特定屬性的先驗估計。
Xception網(wǎng)絡(luò)是一種將有殘差連接的深度可分離卷積層進(jìn)行線性堆疊的深度學(xué)習(xí)模型,Xception網(wǎng)絡(luò)將Resnet中的卷積層模塊替換為極致的Inception模塊[18],極致的Inception模塊對輸入先進(jìn)行了普通的卷積操作,然后對1*1卷積后的每一個通道分別進(jìn)行3*3的卷積操作,并在最后將結(jié)果concat,該過程如圖2所示。Xception網(wǎng)絡(luò)在原網(wǎng)絡(luò)的基礎(chǔ)上提高了網(wǎng)絡(luò)的運(yùn)行效率,在不增加網(wǎng)絡(luò)復(fù)雜度的情況下改善了模型的效果。
X-CNN模型通過對已知類故障樣本的學(xué)習(xí),完成對未知類故障樣本的診斷。這一過程分為兩個階段:第一階段采用Xception特征提取網(wǎng)絡(luò)對樣本進(jìn)行特征提取;第二階段使用基于CNN的屬性學(xué)習(xí)器完成對特征的屬性學(xué)習(xí)以及預(yù)測,并最終通過相似度度量獲得具體的故障診斷結(jié)果。
圖2 Inception模塊
X-CNN模型選用Xception網(wǎng)絡(luò)進(jìn)行時頻圖特征提取。Xception網(wǎng)絡(luò)通過36個卷積層來進(jìn)行基礎(chǔ)的特征提取,其引入了Entry flow,Middle flow和Exit flow 3層,每個flow都有若干個conv_bn模塊或者sep_bn模塊。本模型刪除用于輸出的Exit flow,Xception特征提取網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
(1) Entry flow
Entry flow共進(jìn)行了8次卷積,其作用是對輸入振動信號時頻圖進(jìn)行下采樣,減小空間維度。其中的con_bn層將卷積層與批歸一化層(batch normalization,BN)結(jié)合,sep_bn層將可分離卷積層與BN層結(jié)合。這一改進(jìn)省去了整個BN層的計算量。BN層計算過程如式(2)。
(2)
圖3 Xception特征提取網(wǎng)絡(luò)結(jié)構(gòu)圖
(2) Middle flow
Middle flow將3個可分離卷積層重復(fù)運(yùn)算8次以不斷學(xué)習(xí)通道間的關(guān)系,實現(xiàn)特征的優(yōu)化,即圖3中Middle flow模塊內(nèi)部的虛線連接處。再將原網(wǎng)絡(luò)中的Exit flow中的部分模塊添加至Middle flow,在完成特征優(yōu)化后流向sep_bn層和conv_bn層,進(jìn)行特征的匯總和整理后,將多維特征輸出。
基于屬性描述的零樣本滾動軸承故障診斷方法需要對提取的特征進(jìn)行屬性預(yù)測,因CNN采用局部連接和權(quán)值共享的方式,可以有效地降低權(quán)值的數(shù)量,使得網(wǎng)絡(luò)易于優(yōu)化,從而很好得完成特征提取與多分類任務(wù)[19],故選用CNN作為特征圖的屬性學(xué)習(xí)器。
基于CNN的屬性學(xué)習(xí)器由特征提取層和預(yù)測分類層組成,其網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。
(1) 特征提取層
特征提取層由卷積層、池化層組成[20]。卷積層和池化層對輸入數(shù)據(jù)的特征進(jìn)行提取。卷積的過程中,使用矩形的卷積核對輸入對象的每一個像素點進(jìn)行卷積計算,同一輸入對象共享權(quán)重。卷積計算過程如式(3)
fi+1=Wi?fi+bi
(3)
式中:fi為卷積運(yùn)算的輸入;fi+1為卷積過后產(chǎn)生的特征圖;Wi為權(quán)重;bi為偏置值;?為卷積運(yùn)算符。通過卷積操作,會增加輸出的特征圖個數(shù),這將導(dǎo)致輸出維度不斷增大,造成維度災(zāi)難,故通過添加最大池化層的方式降低輸出維度并保留主要特征,最大池化的過程對輸入特征的紋理較為敏感,其過程見式(4)。
Max-pooling(f[i-1],f[i],f[i+1])=
max(f[i-1],f[i],f[i+1])
(4)
通過將卷積層和池化層進(jìn)行堆疊,不斷降低參數(shù)量,與此同時獲得感受野的提升,該過程見圖4特征提取層結(jié)構(gòu)。卷積池化層后使用ReLU激活函數(shù),使得原先的單一線性變化多樣化,從而增強(qiáng)學(xué)習(xí)能力。
(2) 預(yù)測分類層
預(yù)測分類層中用全連接層將提取的所有主要特征合并,并將其輸送至SoftMax分類器,經(jīng)過全連接層或者池化層輸出可得一個k行j列的矩陣Yk*j,其中:k為樣本數(shù)量;j為j個類別對應(yīng)的量化值。對于輸入樣本x以及其對應(yīng)的標(biāo)簽y,可以用q(y=jx)表示y屬于j類別的概率,Softmax函數(shù)的公式為
(5)
圖4 基于CNN的屬性學(xué)習(xí)器網(wǎng)絡(luò)結(jié)構(gòu)
圖5為X-CNN故障診斷流程圖,由圖5可以看出X-CNN故障診斷模型由數(shù)據(jù)預(yù)處理階段、特征提取階段、屬性學(xué)習(xí)及分類階段組成。
(1) 數(shù)據(jù)預(yù)處理階段
隨機(jī)選擇凱斯西儲大學(xué)原始振動信號,按照ZSL的思想(訓(xùn)練類樣本在測試類樣本中均不出現(xiàn)),對數(shù)據(jù)集進(jìn)行訓(xùn)練集和測試集的劃分,劃分比例為22∶5。對所選取的訓(xùn)練集和測試集,分別進(jìn)行短時傅里葉變換(short-time Fourier transform, STFT)得到振動信號時頻圖。
(2) 特征提取階段
對模型進(jìn)行訓(xùn)練時,將訓(xùn)練集時頻圖作為樣本輸入到Xception網(wǎng)絡(luò)訓(xùn)練,對其進(jìn)行特征提取,訓(xùn)練直至網(wǎng)絡(luò)收斂,從而獲得時頻圖的特征并將訓(xùn)練完畢的Xception網(wǎng)絡(luò)保存。將測試集信號時頻圖輸入到訓(xùn)練完畢的Xception特征提取網(wǎng)絡(luò),通過Entry flow完成對時頻圖的下采樣以及降低維度后,經(jīng)Middle flow完成對特征的不斷優(yōu)化,得到訓(xùn)練集和測試集的特征圖并輸出供屬性學(xué)習(xí)器使用。
(3) 屬性學(xué)習(xí)及分類階段
將訓(xùn)練階段中由訓(xùn)練集得到的特征圖傳入到屬性學(xué)習(xí)器{α1,α2,…,αM}中,對其M個屬性分別訓(xùn)練對應(yīng)的屬性學(xué)習(xí)器。測試階段,將測試集特征輸入屬性學(xué)習(xí)器中,獲得測試樣本的屬性預(yù)測矩陣,并將測試集樣本的屬性預(yù)測矩陣與數(shù)據(jù)集屬性表進(jìn)行相似度度量,從而診斷最終的故障類別。
圖5 X-CNN故障診斷流程圖
為驗證所提方法對未知類故障的診斷能力,試驗中選用真實的滾動軸承數(shù)據(jù),數(shù)據(jù)選自凱斯西儲大學(xué)(Case Western Reserve University, CWRU)的滾動軸承數(shù)據(jù)集。
CWRU數(shù)據(jù)集的采集試驗臺如圖6所示。裝置主要由3個部分組成:位于最左側(cè)的1.5 kW的驅(qū)動電機(jī)、位于中間的扭矩傳動裝置、位于最右側(cè)的功率測試機(jī)。加速度傳感器分別安裝在試驗電機(jī)的基座處、風(fēng)扇端、驅(qū)動端的電機(jī)外殼處,從而獲得基座加速度數(shù)據(jù)(base accelerometer data, BA)、風(fēng)扇端加速度數(shù)據(jù)(fan end accelerometer, FE)、驅(qū)動端加速度數(shù)據(jù)(drive end accelerometer data, DE)。同時,CWRU通過電火花加工技術(shù)在滾動軸承三處布置單點故障,分別是內(nèi)圈故障(InnerRace)、外圈故障(OuterRace)和滾動體故障(Ball),并且選用0.17 mm,0.35 mm,0.52 mm,0.7 mm的不同故障體量級別。除此之外,外圈故障還區(qū)分為外圈3點鐘,外圈6點鐘和外圈12點鐘三處損傷點。
圖6 CWRU試驗臺
在試驗中屬性描述為判斷某種故障屬性是否出現(xiàn),按照不同故障類型的故障位置(內(nèi)圈故障、外圈3點鐘方向故障、外圈6點鐘方向故障、外圈12點鐘方向故障、滾動體故障)、電機(jī)負(fù)載0,0.75 kW,1.5 kW,2.25 kW、故障大小0.17 mm,0.35 mm,0.52 mm,0.7 mm等信息定義其屬性。
根據(jù)選用的數(shù)據(jù)集,定義了13種不同的屬性(如表1所示),其中包括4種故障尺寸屬性、4種運(yùn)行負(fù)載屬性、5種不同故障位置屬性。試驗從驅(qū)動端數(shù)據(jù)中根據(jù)5種不同的故障位置、4種不同的工作負(fù)載和4種故障的損傷尺寸選取了共計27類故障數(shù)據(jù)進(jìn)行試驗,按照不同滾動軸承狀態(tài)選取的不同故障類別數(shù)及其樣本數(shù)如表2所示。
表1 屬性描述對應(yīng)表
表2 故障類別數(shù)及樣本數(shù)
其中無故障狀態(tài)因本試驗存在3種負(fù)載故選擇3類,外圈故障因其包含更多類故障位置故選擇10類,滾動體和內(nèi)圈故障選擇7類,共計27類故障。
對選取的故障類型定義數(shù)據(jù)編碼,數(shù)據(jù)編碼代表故障的發(fā)生位置、尺寸以及機(jī)器的運(yùn)行負(fù)載:對于故障位置,正常類型為N,滾動體故障為B,內(nèi)圈故障為IR,外圈故障為OR;故障類型后的兩位數(shù)字代表故障尺寸。如“OR07@3_0”代表外圈故障,故障尺寸0.17 mm,且負(fù)載為0,故障位置為外圈3點鐘方向。表3展示了從CWRU數(shù)據(jù)集中,選取用作試驗部分的屬性描述在向量空間中的配置,共計27種故障。表3中:“1”表示該故障具備該屬性;“0”表示該故障不具備該屬性。通過對3種不同的屬性類型,共計13種屬性的學(xué)習(xí),可以實現(xiàn)在不使用測試類故障樣本進(jìn)行訓(xùn)練的情況下,完成對測試類故障的診斷分類工作。
將選取的振動信號數(shù)據(jù)隨機(jī)劃分為訓(xùn)練集、測試集,其序號如表4所示。
在對CWRU所提供的振動信號進(jìn)行預(yù)處理時,考慮到選取的特征提取網(wǎng)絡(luò)在對圖像處理方面有著優(yōu)異的表現(xiàn),故先采用STFT將故障信號數(shù)據(jù)轉(zhuǎn)變?yōu)闀r頻圖,從而獲得其隨時間變化的頻譜信息。在STFT中使用Hanmming窗作為窗函數(shù)并且預(yù)設(shè)窗函數(shù)長度為256,窗重疊度為50%,采樣頻率設(shè)為120 kHz。
3.2.1 特征提取網(wǎng)絡(luò)效果分析
對時頻圖進(jìn)行特征提取是基于屬性描述的零樣本滾動軸承故障診斷方法的第二步,本試驗中分別使用有監(jiān)督的機(jī)器學(xué)習(xí)方法PCA、改進(jìn)后的Xception特征提取網(wǎng)絡(luò)來提取時頻圖的相關(guān)特征,特征提取網(wǎng)絡(luò)的主要參數(shù)見表5。表5中Entry flow和Middle flow中的殘差連接conv_bn步長相同,卷積核大小分別為1×1和3×3,池化過程都選擇最大池化,padding方式為“same”,大小為3×3,步長為2。其余sep_bn和conv_bn的卷積核大小皆為3×3,各自的步長如表5所示。
設(shè)置對比試驗時,需對選定機(jī)器學(xué)習(xí)方法參數(shù)進(jìn)行設(shè)置。在進(jìn)行特征提取時,選用的PCA方法,保留前20個主要特征。屬性學(xué)習(xí)階段選用經(jīng)典機(jī)器學(xué)習(xí)分類方法,即支持向量機(jī)(support vector machine, SVM)、概率樸素貝葉斯(naive Bayesian, NB)和隨機(jī)森林(random forest, RF)進(jìn)行屬性學(xué)習(xí)。對PCA提取的20個主要特征,使用SVM,NB和RF進(jìn)行屬性學(xué)習(xí)器的訓(xùn)練。其中SVM的懲罰系數(shù)C設(shè)為1,NB中不設(shè)先驗概率大小,利用極大似然法進(jìn)行計算,RF的決策樹數(shù)設(shè)為50。
X-CNN故障診斷網(wǎng)絡(luò)通過Entry flow和Middle flow完成對時頻圖的特征的逐步提取,特征提取網(wǎng)絡(luò)的末端添加一個Softmax層,并設(shè)置網(wǎng)絡(luò)的損失函數(shù)如下
(6)
訓(xùn)練集和測試集的分類準(zhǔn)確率和Loss值見圖7和圖8,試驗結(jié)果表明,Xception網(wǎng)絡(luò)可以很好的提取時頻圖特征并進(jìn)行分類工作。如圖7所示,在訓(xùn)練階段,當(dāng)iteration達(dá)到1 000次時,在訓(xùn)練集上模型的分類準(zhǔn)確率已經(jīng)達(dá)到99.5%,Loss值已經(jīng)降到了0.348,在這之后模型訓(xùn)練的分類準(zhǔn)確率和Loss值的變化趨勢逐漸平緩。如圖8所示,在測試階段,當(dāng)進(jìn)行到第1 000個iteration時,模型的分類準(zhǔn)確率已經(jīng)達(dá)到99.6%,Loss值降到了0.298,在這之后準(zhǔn)確率和Loss值保持穩(wěn)定。由此可見若是只對可見類進(jìn)行分類,Xception網(wǎng)絡(luò)可以很好地完成任務(wù),從而說明了Xception網(wǎng)絡(luò)具有極強(qiáng)的分類能力。
表3 CWRU數(shù)據(jù)集屬性表
表4 訓(xùn)練集、測試集劃分
圖7 訓(xùn)練集準(zhǔn)確率與Loss值
圖8 測試集準(zhǔn)確率與Loss值
為了驗證Xception網(wǎng)絡(luò)是否具備優(yōu)異的特征提取能力,本試驗使用t-SNE方法將提取的多維特征降維后投影到二維空間中進(jìn)行可視化分析,若投射結(jié)果可分性好,則可以說明該方法的特征提取能力強(qiáng)。本試驗隨機(jī)選取了7種故障對其進(jìn)行特征提取并且降維可視化,使用PCA方法以及Xception特征提取網(wǎng)絡(luò)進(jìn)行特征提取后,特征降維可視化的結(jié)果如圖9和圖10所示。通過觀察圖9可以發(fā)現(xiàn)使用PCA方法進(jìn)行特征提取后,負(fù)載為2.25 kW、損傷尺寸0.17 mm和負(fù)載為1.5 kW、損傷尺寸0.52 mm的滾動體故障發(fā)生了混淆,即圖9中圓圈劃出部分,故PCA特征提取方法對不同故障尺寸與負(fù)載的滾動體故障區(qū)分能力較弱。而觀察圖10可以發(fā)現(xiàn)使用Xception網(wǎng)絡(luò)提取的特征可分性極好,各種不同位置、尺寸、負(fù)載的故障類型特征可分性極強(qiáng),特征分類無混淆。故相較于使用PCA進(jìn)行特征提取的方法,Xception網(wǎng)絡(luò)可以更好得進(jìn)行特征提取。
表5 特征提取網(wǎng)絡(luò)主要參數(shù)
圖9 PCA特征提取降維可視化
圖10 Xception網(wǎng)絡(luò)特征提取降維可視化
3.2.2 屬性學(xué)習(xí)器效果對比
使用CNN作為屬性學(xué)習(xí)器對提取的特征圖進(jìn)行屬性預(yù)測,所搭建的CNN網(wǎng)絡(luò)參數(shù)如表6所示??紤]到Softmax通過自然底數(shù)e使得輸入差異擴(kuò)大,然后使用配分方式將結(jié)果歸一化為概率分布,具有優(yōu)異的分類效果,故選用Softmax作為最終全連接層輸出的分類函數(shù)。此外,屬性學(xué)習(xí)器選用Adam作為優(yōu)化器,選用categorial crossentropy損失函數(shù)。使用訓(xùn)練完畢的屬性學(xué)習(xí)器對其進(jìn)行屬性預(yù)測,從而評估其屬性學(xué)習(xí)的準(zhǔn)確率。將屬性矩陣傳入學(xué)習(xí)器,分別預(yù)測13種屬性在多種不同故障類型種是否存在。使用PCA方法與Xception網(wǎng)絡(luò)提取特征后使用不同屬性學(xué)習(xí)器進(jìn)行屬性學(xué)習(xí),其準(zhǔn)確率如圖11所示。
表6 CNN參數(shù)
由圖11可知,X-CNN模型對故障尺寸(屬性1~4)、故障位置(屬性9~13)的屬性學(xué)習(xí)準(zhǔn)確率高,最低的屬性預(yù)測準(zhǔn)確率可達(dá)75.4%。在對屬性1~4與屬性9~13進(jìn)行分析時,觀察圖11(a)可知,使用X-CNN進(jìn)行屬性學(xué)習(xí)的準(zhǔn)確率優(yōu)于PCA+RF或者X-RF,最高預(yù)測準(zhǔn)測率可達(dá)100%,最低預(yù)測準(zhǔn)確率可達(dá)85.2%。X-CNN對屬性的預(yù)測準(zhǔn)確率明顯優(yōu)于使用傳統(tǒng)方法;由圖11(b)可知,使用X-NB對多數(shù)屬性的預(yù)測準(zhǔn)確率都高于PCA+NB,而X-CNN對所有屬性的預(yù)測準(zhǔn)確率都高于X-NB;觀察圖11(c)可知,使用X-SVM進(jìn)行屬性預(yù)測的準(zhǔn)確率優(yōu)于使用PCA+SVM進(jìn)行屬性預(yù)測,而使用X-CNN對所有屬性的預(yù)測準(zhǔn)確率皆優(yōu)于X-SVM。相對于內(nèi)圈故障和滾動體故障,X-CNN模型對外圈故障的屬性識別率尤其優(yōu)秀,針對3點鐘方向和12點鐘方向的外圈故障屬性學(xué)習(xí)的準(zhǔn)確率都達(dá)到了100%,對0.7 mm的故障屬性識別準(zhǔn)確率也達(dá)到100%。觀察圖11可以發(fā)現(xiàn),本方法對振動信號的負(fù)載屬性(即圖中的屬性5,6,7,8)的識別能力均較弱,準(zhǔn)確率均在50%左右??梢姳痉椒▽τ谪?fù)載的識別能力較弱,分析原因是相同故障狀態(tài)的滾動軸承在變負(fù)載條件下,數(shù)據(jù)特征分布差異較小,這一情況增加了區(qū)分難度。為減小這類特征分布差異所帶來的問題,可以使用度量學(xué)習(xí)方法,或者使用triplet loss損失函數(shù),加大相似特征之間的分布差異,從而提高區(qū)分度。這一情況為接下來的研究學(xué)習(xí)提供了方向。
(a) X-CNN與RF方法下屬性學(xué)習(xí)準(zhǔn)確率比較
(b) X-CNN與NB方法下屬性學(xué)習(xí)準(zhǔn)確率比較
(c) X-CNN與SVM方法下屬性學(xué)習(xí)準(zhǔn)確率比較
3.2.3 零樣本分類結(jié)果分析
為保證試驗過程的合理性和真實性,對所選擇的數(shù)據(jù)集進(jìn)行測試集和訓(xùn)練集的隨機(jī)劃分,其中訓(xùn)練類故障樣本與測試類故障樣本無交集,樣本序號和故障類型的對應(yīng)情況可見表3。對測試集進(jìn)行故障類別診斷過程中,考慮到過小的K值會造成過擬合,而過大的K值會增大學(xué)習(xí)的近似誤差,故通過交叉驗證法確定最優(yōu)K值為K=7,并且選用歐氏距離作為度量標(biāo)準(zhǔn)。
表7展示了使用Xception網(wǎng)絡(luò)和PCA方法進(jìn)行特征提取后,配合不同屬性學(xué)習(xí)器,在不同數(shù)據(jù)集上的分類準(zhǔn)確率。由表7可知,使用Xception提取特征后進(jìn)行屬性學(xué)習(xí)并進(jìn)行故障診斷,相較于使用PCA方法,無論是使用SVM,RF還是NB作為屬性學(xué)習(xí)器,都可以獲得更高的分類準(zhǔn)確率,最高達(dá)到了82.6%,而使用PCA作為特征提取器時,在5組試驗中準(zhǔn)確率最高的PCA+RF也只有59%,平均準(zhǔn)確率最高僅僅55.92%。此外,相對于使用機(jī)器學(xué)習(xí)方法作為屬性學(xué)習(xí)器,使用CNN作為屬性學(xué)習(xí)器時可以獲得更高的分類準(zhǔn)確率,單次分類的準(zhǔn)確率最高達(dá)到了88.5%,平均準(zhǔn)確率達(dá)到了86.5%,可見X-CNN模型對于各種故障屬性、故障位置、故障大小的滾動軸承故障進(jìn)行診斷時魯棒性較強(qiáng)。
表7 分類準(zhǔn)確率
圖12展示了對數(shù)據(jù)集A使用Xception進(jìn)行特征提取后,運(yùn)用不同屬性學(xué)習(xí)器進(jìn)行故障診斷的混淆矩陣。圖12中,縱坐標(biāo)代表了測試樣本的真實類別,橫坐標(biāo)表示模型預(yù)測的類別,橫縱坐標(biāo)交點代表預(yù)測的準(zhǔn)確率。圖12(a)中X-CNN模型的平均準(zhǔn)確率達(dá)到了88.2%,診斷準(zhǔn)確率最低的故障類型也可達(dá)到83%,遠(yuǎn)高于其他使用PCA作為特征提取方法后得到的結(jié)果,相比于圖12(b)~圖12(d)中其他使用Xception網(wǎng)絡(luò)作為特征提取網(wǎng)絡(luò)的方法,CNN對屬性學(xué)習(xí)的準(zhǔn)確率比SVM(82.6%)、RF(73.4%)、NB(76.2%)等機(jī)器學(xué)習(xí)方法更高,圖12(c)與圖12(d)方法對于測試集中的各種不同種類的故障,均存在較高的識別錯誤率,平均準(zhǔn)確率僅76.6%與74.2%。比較圖12(a)與圖12(b),可以發(fā)現(xiàn),X-SVM模型的識別精度相當(dāng)高,但是對于某種特定的故障類型識別效果一般,最優(yōu)診斷結(jié)果與最差診斷結(jié)果誤差可達(dá)36%,而X-CNN方法最優(yōu)準(zhǔn)確率可達(dá)100%,最低可達(dá)83%,結(jié)果誤差僅17%。可見X-CNN模型對各種不同的故障種類在零樣本情況下分類的魯棒性更高。
(c) X-RF診斷結(jié)果混淆矩陣
本文提出的X-CNN方法由Xception特征提取網(wǎng)絡(luò)和基于CNN的屬性學(xué)習(xí)網(wǎng)絡(luò)組成。通過對特征的提取以及屬性的學(xué)習(xí),實現(xiàn)了由故障特征空間到故障屬性空間的映射,進(jìn)而在無測試類樣本可供訓(xùn)練的情況下完成故障診斷工作,試驗結(jié)果表明:
(1) 經(jīng)過Xception網(wǎng)絡(luò)提取的故障特征,相較于PCA等傳統(tǒng)機(jī)器學(xué)習(xí)方法,可以更好得代表故障信號,且通過該方法提取的故障特征可以為屬性學(xué)習(xí)過程提供優(yōu)質(zhì)的輸入。
(2) 通過將CNN和其他3種傳統(tǒng)機(jī)器學(xué)習(xí)方法(SVM,RF,NB)構(gòu)成的屬性學(xué)習(xí)器比較可知,基于CNN的屬性學(xué)習(xí)器可以更加準(zhǔn)確得進(jìn)行屬性學(xué)習(xí)工作且具備更強(qiáng)的魯棒性。
(3) 所構(gòu)建的X-CNN故障診斷模型以多種屬性作為輔助信息,將特征的分類轉(zhuǎn)化為對不同屬性的識別,屬性共享于不同的故障種類之間,從而進(jìn)行由故障特征空間到故障屬性空間的映射,通過對屬性的學(xué)習(xí)可以高效且準(zhǔn)確地完成故障診斷任務(wù)。
綜上,X-CNN故障診斷模型能夠完成在零樣本條件下的故障診斷工作,適用范圍更廣且魯棒性強(qiáng),為解決可供訓(xùn)練數(shù)據(jù)類別不足而導(dǎo)致的特征學(xué)習(xí)不充分的模型訓(xùn)練問題提供了新的思路。