吳靜然,劉建華,崔 冉
(1.中國礦業(yè)大學(xué) 信息與控制工程學(xué)院,江蘇 徐州 221008;2.中國礦業(yè)大學(xué) 徐海學(xué)院,江蘇 徐州 221008)
滾動軸承作為旋轉(zhuǎn)機(jī)械設(shè)備減少各部件間摩擦的重要組成部分,廣泛應(yīng)用于現(xiàn)代機(jī)械設(shè)備中。然而在惡劣環(huán)境下工作,滾動軸承易遭受磨損,故障率較高。準(zhǔn)確識別軸承的故障,判斷故障類型,可以有效指導(dǎo)維修工作,提高維修效率,提高機(jī)械設(shè)備的可靠性和安全性,減少經(jīng)濟(jì)損失,保護(hù)工作人員的人身安全[1-2]。
隨著智能制造技術(shù)的快速發(fā)展,基于滾動軸承振動信號分析的方法成為研究熱門。傳統(tǒng)的方法主要通過頻譜分析、時頻域變換分析進(jìn)行特征提取,利用K近鄰、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林構(gòu)建分類器進(jìn)行故障診斷識別[3-5]。特征提取過程依賴于專家知識和人工經(jīng)驗(yàn),通過頻譜分析或從振動信號中提取統(tǒng)計(jì)特征,無法從原始的振動信號中挖掘出有效的故障特征,獲得的診斷模型結(jié)構(gòu)簡單,無法應(yīng)用于大容量高維數(shù)據(jù)。當(dāng)工況發(fā)生變化后,診斷準(zhǔn)確率降低。
鑒于深度學(xué)習(xí)能夠從輸入的數(shù)據(jù)中自動學(xué)習(xí)特征,基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)的端到端故障軸承診斷方法[6-7]被廣泛應(yīng)用。然而大多數(shù)研究要求訓(xùn)練樣本和測試樣本具有相同特征空間、概率分布和大量的可用標(biāo)簽。考慮到實(shí)際工況改變時,收集的故障數(shù)據(jù)分布會隨之改變,大部分?jǐn)?shù)據(jù)沒有標(biāo)簽;同時由于設(shè)備故障很難發(fā)生,很難收集足夠的信息來反映完整的健康狀態(tài)。利用現(xiàn)有大量標(biāo)記數(shù)據(jù)進(jìn)行無標(biāo)簽變工況下的軸承故障診斷變得非常重要。
無監(jiān)督領(lǐng)域適應(yīng)(unsupervised domain adaptation, UDA)作為遷移學(xué)習(xí)的分支,能夠探索領(lǐng)域不變特征,彌合領(lǐng)域間分布差異。鑒于UDA在圖像處理領(lǐng)域的廣泛應(yīng)用,UDA也被廣泛應(yīng)用于跨領(lǐng)域故障診斷。文獻(xiàn)[8]以深度學(xué)習(xí)為主要結(jié)構(gòu),通過最小化多核最大均值差異,減少卷積網(wǎng)絡(luò)的多層特征分布差異,提取域不變特征,實(shí)現(xiàn)滾動軸承故障診斷。文獻(xiàn)[9]采用對抗域自適應(yīng)學(xué)習(xí)策略,提出了一種機(jī)器故障診斷網(wǎng)絡(luò),該網(wǎng)絡(luò)學(xué)習(xí)通用的域不變特征,有助于增強(qiáng)特征表示的魯棒性,提高訓(xùn)練模型的泛化能力。文獻(xiàn)[10]提出一種跨設(shè)備故障診斷模型,采用卷積神經(jīng)網(wǎng)絡(luò)提取數(shù)據(jù)特征,使用最大均值差異和域?qū)箿p少源域和目標(biāo)域全局分布。雖然上述方法取得了較好的效果,但是僅僅試圖進(jìn)行全局對齊,未考慮源域和目標(biāo)域間的關(guān)系,可能會丟失每個類別的細(xì)粒度信息。如圖1(a)所示,全局域適應(yīng)后,生成的源域和目標(biāo)域空間的特征基本一致,但是子域間數(shù)據(jù)過分接近,分類正確率低[11]。
(a)全局域適應(yīng)
為了解決上述問題,本文提出了一維卷積子域適應(yīng)網(wǎng)絡(luò)(subdomain adaptation networks,SDAN)進(jìn)行準(zhǔn)確的無監(jiān)督故障診斷。該網(wǎng)絡(luò)包括特征提取器和健康狀態(tài)分類器,特征提取器用于處理原始故障數(shù)據(jù),進(jìn)而獲得故障診斷分類特征。引入局部最大平均偏差(local maximum mean discrepancy, LMMD)[11]來度量源域和目標(biāo)域數(shù)據(jù)嵌入相關(guān)子域的差異,調(diào)整相關(guān)子域同一類別下的分布,捕獲每個類別的細(xì)粒度信息,實(shí)現(xiàn)子域?qū)R。經(jīng)過子域適應(yīng)后,局部分布近似相同,全局分布也近似相同,如圖1(b)所示。使用江南大學(xué)JNU軸承故障數(shù)據(jù)集進(jìn)行該方法的有效性驗(yàn)證,與現(xiàn)有5種領(lǐng)域自適應(yīng)算法進(jìn)行對比,SDAN網(wǎng)絡(luò)具有更好的診斷性能,結(jié)果表明該方法在滾動軸承故障診斷上的可行性和有效性。
鑒于CNN在圖像處理、計(jì)算機(jī)視覺等領(lǐng)域的成功應(yīng)用,CNN也被廣泛應(yīng)用于振動信號分析的故障診斷領(lǐng)域。典型的CNN包含有卷積層、池化層和全連接層[12]。
卷積層(Conv):用于提取復(fù)雜的高維輸入特征,由多個卷積內(nèi)核(過濾器)組成, 當(dāng)每個核在輸入映射上滑動時,權(quán)值保持不變,通過將輸入信號與卷積核進(jìn)行卷積運(yùn)算獲得特征圖。卷積操作完成后,使用激活函數(shù)實(shí)現(xiàn)非線性映射,在本研究中,采用了直線單元(ReLU)函數(shù)[13]。卷積層數(shù)學(xué)模型可表示為:
δ(x)=max(0,x)
(1)
池化層(Pool):每個卷積層后面會連接一個池化層,通過池化內(nèi)核對得到的特征圖進(jìn)行下采樣,實(shí)現(xiàn)數(shù)據(jù)降維和進(jìn)一步特征提取。本文采用最大池化函數(shù),返回池化核區(qū)域最大值。
全連接層(FC):用于分類和識別故障類別。本文采用softmax函數(shù)將全連接層輸出映射到(0,1)區(qū)間,實(shí)現(xiàn)故障識別分類[14]。softmax公式可表示為:
(2)
式中:C為數(shù)據(jù)集類別個數(shù);φi為全連接層的第i類的輸出值;αi為φi經(jīng)過softmax運(yùn)算后第i類的概率。
最大均值差異(maximum mean discrepancy, MMD)是用來衡量兩個分布差異的指標(biāo)[15]。給定兩個數(shù)據(jù)集Xs、Xt,利用核函數(shù)進(jìn)行內(nèi)積形式的希爾伯特空間的非線性映射,MMD表示式如式(3)所示。
(3)
本節(jié)介紹網(wǎng)絡(luò)結(jié)構(gòu)和損失函數(shù),用于實(shí)現(xiàn)無監(jiān)督軸承故障類別診斷。
SDAN網(wǎng)絡(luò)主要包含有特征提取器、健康狀況分類器2部分。為了簡化復(fù)雜的網(wǎng)絡(luò)調(diào)參過程,本文特征提取器的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)與文獻(xiàn)[16]基本網(wǎng)絡(luò)結(jié)構(gòu)保持一致。后續(xù)可結(jié)合實(shí)際應(yīng)用,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù),更好地提取軸承故障數(shù)據(jù)的特征,提高分類正確率。本文SDAN網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)如表2所示。Conv(x,y)為一維卷積運(yùn)算,表示x個卷積核,卷積核的大小為y。網(wǎng)絡(luò)均采用最大池化操作,窗口大小為2,步長為2。FC(n)表示全連接層,包含有n個神經(jīng)元輸出。隨機(jī)丟棄(Dropout)[17]為0.5,用于提高網(wǎng)絡(luò)的泛化能力。分類器只包含一個全連接層,其神經(jīng)元的數(shù)目與數(shù)據(jù)集類別的個數(shù)相同。
圖2 SDAN網(wǎng)絡(luò)結(jié)構(gòu)
表1 SDAN網(wǎng)絡(luò)結(jié)構(gòu)
MMD被廣泛應(yīng)用于測量源域和目標(biāo)域分布差異,但是主要關(guān)注全局分布對齊,卻忽略源域和目標(biāo)域同一類別子域間關(guān)系。由于同一類別有更強(qiáng)的相關(guān)性,通過對齊具有相同標(biāo)簽的樣本的相關(guān)子域可以匹配全局分布和類別局部分布。借鑒文獻(xiàn)[11],本文引入LMMD用于對齊同一類別相關(guān)子域的分布,公式可表示為:
(4)
(5)
該網(wǎng)絡(luò)通過深度特征表示學(xué)習(xí)和局部最大平均誤差學(xué)習(xí)來提取域可轉(zhuǎn)移的特征表示。訓(xùn)練過程中有2個優(yōu)化目標(biāo)。
(1)最小化源域數(shù)據(jù)集上軸承故障類別分類器的損失函數(shù)Jc,引導(dǎo)分類器輸出正確預(yù)測標(biāo)簽。
(2)最小化源和目標(biāo)域數(shù)據(jù)集間的LMMD距離Jd。
其中Jc的表達(dá)式可表示為:
(6)
式中:Ga為特征提取器輸出;Gc為源域分類器預(yù)測輸出;Jy為交叉熵?fù)p失函數(shù)。
則總的損失函數(shù)J如下所示,其中α為平衡超參數(shù)。
J=Jc+αJd
(7)
對江南大學(xué)(Jiang Nan University, JNU)軸承故障數(shù)據(jù)集[18]進(jìn)行了對比實(shí)驗(yàn),用以驗(yàn)證所提出模型的有效性。
該數(shù)據(jù)集為江南大學(xué)采集的軸承故障數(shù)據(jù)集,采樣頻率為50 kHz,包含有正常狀態(tài)、內(nèi)圈故障、外圈故障和滾動體故障四種健康狀況。根據(jù)軸承故障位置不同,將故障數(shù)據(jù)分為4類,如表2所示。
表2 JNU軸承故障數(shù)據(jù)集說明
實(shí)驗(yàn)過程中使用加速度計(jì)在600、800和1 000 r/min三種不同轉(zhuǎn)速下采集振動信號。不同轉(zhuǎn)速被認(rèn)為為不同任務(wù),分別將轉(zhuǎn)速為600、800和1 000 r/min的數(shù)據(jù)定義為任務(wù)A、B、C。例如A->B表示源域?yàn)檗D(zhuǎn)速為600 r/min的振動數(shù)據(jù),目標(biāo)域?yàn)檗D(zhuǎn)速為800 r/min的振動數(shù)據(jù)。
實(shí)驗(yàn)采用重疊采樣的方式,每間隔200個點(diǎn)采樣1 024個點(diǎn),即每個樣本有1 024個數(shù)據(jù)點(diǎn)。每個故障類別500個樣本。其中100%的源域樣本和50%的目標(biāo)域樣本作為訓(xùn)練集,目標(biāo)域剩余的50%的樣本作為測試集。
為了驗(yàn)證本文方法的有效性,本文選擇5個受歡迎的領(lǐng)域自適應(yīng)學(xué)習(xí)方法,DCORAL[19]、JAN[20]、DDC[15]、DANN[21]、CDAN[22]進(jìn)行對比實(shí)驗(yàn)。JAN、DDC等方法均采用高斯核函數(shù)進(jìn)行損失函數(shù)計(jì)算。以上所有的方法均采用與本文相同的CNN基本網(wǎng)絡(luò)框架進(jìn)行數(shù)據(jù)特征提取,便于更合理的測試模型性能。
為了評估模型的性能,將本方法與其他5種常用算法進(jìn)行比較,診斷的平均結(jié)果及對比如表3、圖3所示。其中DCORAL自適應(yīng)方法效果最差,識別正確率平均值為72.61%,準(zhǔn)確率波動較大,標(biāo)準(zhǔn)差更大。其中DDC、DANN兩種方法考慮對齊全局分布,方法識別正確率平均值分別為94.24%和93.64%,正確率明顯高于DCORAL。而JAN和CDAN方法考慮特征表示和標(biāo)簽分類輸出特征進(jìn)行特征對齊,識別正確率分別為94.26%和92.88%。本文提出的方法平均準(zhǔn)確率為95.86%,都具有相對較小的標(biāo)準(zhǔn)差和較好的魯棒性,明顯優(yōu)于其他5種方法,表明本文方法可以通過對齊子域分布,捕獲各類別細(xì)粒度信息,學(xué)習(xí)更多可轉(zhuǎn)移的表示,驗(yàn)證了模型的有效性。
表3 實(shí)驗(yàn)平均診斷結(jié)果
圖3 JNU軸承故障數(shù)據(jù)集不同方法故障識別正確率對比
為了更直觀地分析本文方法的優(yōu)點(diǎn),隨機(jī)選擇遷移任務(wù)B->A,采用t分布隨機(jī)鄰居嵌入(t-distributed stochastic neighbor embedding,t-SNE)算法[23]對目標(biāo)域數(shù)據(jù)特征表示進(jìn)行可視化,不同方法的特征表示如圖4所示。圖例中包含源域和目標(biāo)域的4類故障類型,s代表源域,t代表目標(biāo)域,如s-NA指的是源域的正常數(shù)據(jù)。由圖可知,通過深度遷移學(xué)習(xí),各網(wǎng)絡(luò)學(xué)習(xí)到源域和目標(biāo)域特征全局對齊較好。但是由4(a)可知DCORAL網(wǎng)絡(luò)學(xué)習(xí)存在嚴(yán)重的類別間的重疊問題,部分點(diǎn)很難分類,正確率偏低。由4(b)可知,DDC網(wǎng)絡(luò)重疊問題相較DCORAL改善明顯,但是各類別特征對齊較差。由4(d)可知,DANN雖然全局分布對齊效果良好,但是外圈故障類別特征相對分散,子域?qū)R效果一般。由4(c)、4(e)可知,雖兩種方法考慮不同域之間特征和輸出標(biāo)簽的聯(lián)合分布差異進(jìn)行軸承故障診斷,子域?qū)R效果卻差強(qiáng)人意。由4(f)可知,本文SDAN不僅可以很好的對齊全局分布,同時可以有效的對齊同類別子域的分布,各類別間具有明確的邊界,便于更好地識別目標(biāo)域的故障類。
(a)DCORAL
本文同時計(jì)算了6種方法在遷移任務(wù)B->A的混淆矩陣,詳細(xì)地分析每個類別的分類精度,分類結(jié)果如圖5所示。由圖可知,本文方法僅有35個錯誤樣本,識別正確率為96.5%,明顯高于其他5種方法,說明了該方法的優(yōu)越性。
(a)DCORAL
為了提高軸承故障診斷在變工況情況下的分類精度,提出了一種子域適應(yīng)無監(jiān)督軸承故障診斷網(wǎng)絡(luò)SDAN。該網(wǎng)絡(luò)引入局部最大平均誤差LMMD,彌補(bǔ)了現(xiàn)有方法僅僅試圖進(jìn)行全局對齊,未考慮源域和目標(biāo)域間的關(guān)系,可能會丟失每個類別的細(xì)粒度信息的缺陷。在江南大學(xué)JNU軸承故障數(shù)據(jù)集,選取5種目前流行的領(lǐng)域自適應(yīng)故障診斷方法進(jìn)行對比實(shí)驗(yàn),驗(yàn)證了該方法的有效性。
結(jié)果表明:本文提出的端到端無監(jiān)督軸承故障診斷SDAN網(wǎng)絡(luò),僅需在損失函數(shù)中引入局部最大平均偏差LMMD,不僅可以很好的對齊全局分布,同時可以有效的對齊同類別子域的分布。本文方法在變工況且數(shù)據(jù)無標(biāo)簽的情況下,診斷正確率優(yōu)于現(xiàn)有5種流行的領(lǐng)域自適應(yīng)故障診斷方法,t分布隨機(jī)鄰居嵌入算法顯示該方法可以有效的對齊源域和目標(biāo)域,驗(yàn)證了該方法良好的可行性和有效性。