蘇浩 楊鑫 向玲 胡愛軍 李顯澤
摘要: 機械設(shè)備實際運行中的工況具有時變性,這加劇了源域(訓(xùn)練集)和目標(biāo)域(測試集)數(shù)據(jù)之間的分布差異,因而導(dǎo)致智能故障診斷模型的性能下降。提出了一種基于深度對比遷移學(xué)習(xí)的方法,可用于機械設(shè)備變工況下的故障智能診斷。利用多層卷積塊作為模型前置特征提取器,能夠有效提取原始振動數(shù)據(jù)的代表性特征,提升故障分類器和域判別器的診斷性能。將前置特征提取器提取的特征傳遞給特征融合器,特征融合器提煉并聯(lián)接局部感受野和全局感受野卷積特征,增強模型特征表達(dá)能力。將特征融合器提煉的特征用于故障分類器和域判別器診斷不同工況下的機械故障,并在故障分類器中使用 Wasserstein 距離度量源域和目標(biāo)域數(shù)據(jù)的差異,基于互信息噪聲對比估計提出用于工況區(qū)分的互信息對比域判別器,提高模型的遷移診斷性能。將所提方法用于診斷變工況下不同類別的軸承、齒輪故障。結(jié)果表明,所提方法能夠有效實現(xiàn)變工況下軸承、齒輪故障的遷移診斷。
關(guān)鍵詞: 故障診斷;變工況; Wasserstein 距離;遷移學(xué)習(xí);對比學(xué)習(xí)
中圖分類號: TH165+.3;TP206+.3 文獻(xiàn)標(biāo)志碼: A 文章編號: 1004-4523(2023)03-0845-09
DOI:10.16385/j.cnki.issn.1004-4523.2023.03.027
引 言
隨著現(xiàn)代社會的不斷發(fā)展,機械設(shè)備廣泛應(yīng)用于各行各業(yè),軸承、齒輪是機械設(shè)備中不可或缺的組件。由于機械設(shè)備多運行在復(fù)雜惡劣的環(huán)境中,軸承、齒輪極易受損,導(dǎo)致機械設(shè)備發(fā)生故障,甚至造成重大安全事故[1‐2]。如何有效地監(jiān)測軸承、齒輪的健康狀況成為了當(dāng)下機械設(shè)備健康監(jiān)測領(lǐng)域的研究熱點。
智能故障診斷技術(shù)推動了機械設(shè)備健康監(jiān)測領(lǐng)域的發(fā)展,尤其是深度學(xué)習(xí)和大數(shù)據(jù)時代的到來,將智能故障診斷推向了更加快速的發(fā)展軌道[3]。近年來,應(yīng)用在智能故障診斷方面的深度學(xué)習(xí)方法層出不窮,有卷積神經(jīng)網(wǎng)絡(luò)[4]、深度置信神經(jīng)網(wǎng)絡(luò)、深度自編碼器等。YAN 等[5]利用深度置信網(wǎng)絡(luò)提取振動原始數(shù)據(jù)的多尺度信息,能夠?qū)S承和齒輪故障進(jìn)行有效的診斷。Cheng 等[6]建立了基于持續(xù)小波變換的局部二值卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),利用局部二值卷積層替換了傳統(tǒng)卷積層,軸承和齒輪故障實驗結(jié)果驗證了所提方法的有效性。
盡管深度學(xué)習(xí)在機械故障診斷領(lǐng)域已經(jīng)取得了顯著的成就,但是其應(yīng)用需要滿足一個假設(shè):源域和目標(biāo)域的數(shù)據(jù)符合近似的分布關(guān)系。然而,在實際工程中,機械設(shè)備的工作狀況是實時變化的,導(dǎo)致采集到的振動數(shù)據(jù)隨時間而變化,而復(fù)雜惡劣的工作環(huán)境使測得的振動數(shù)據(jù)更加具有隨機性,致使源域和目標(biāo)域的數(shù)據(jù)存在著嚴(yán)重的數(shù)據(jù)分布差異,深度學(xué)習(xí)模型無法發(fā)揮性能[7]。遷移學(xué)習(xí)為解決這一問題提供了有力的工具,近年來,遷移學(xué)習(xí)以其強大的域適應(yīng)能力被引入智能故障診斷領(lǐng)域[8]。王肖雨等[9]利用自適應(yīng)噪聲完整經(jīng)驗?zāi)B(tài)分解對不同工況下的軸承信號進(jìn)行分解,將提取特征嵌入流形空間完成特征變換,再對特征動態(tài)分布對齊,有效提高識別準(zhǔn)確率。陳仁祥等[10]提出子空間嵌入特征分布對齊的機械故障診斷方法,利用相關(guān)對齊方法對齊源域和目標(biāo)域特征,采用動態(tài)分布自適應(yīng)因子定量估計邊緣分布和條件分布,并對模型進(jìn)行適配調(diào)整,通過軸承實驗數(shù)據(jù)驗證了所提遷移方法的有效性。ZOU 等[11]利用方差約束提高深度卷積 Wasserstein對抗網(wǎng)絡(luò)的特征聚合能力,自適應(yīng)地根據(jù)類別對齊特征,提高了模型的遷移診斷性能,并使用軸承實驗數(shù)據(jù)進(jìn)行了驗證。上述方法有效解決了深度模型處理變工況下軸承、齒輪故障診斷問題時精度不高的缺點,但是針對的是源域和目標(biāo)域均是單一工況時的遷移問題,而實際工程應(yīng)用中,數(shù)據(jù)的工況是實時變化的,經(jīng)常面臨單工況源域遷移到多工況目標(biāo)域的情況。
LI 等[12]利用域增強方法擴充可獲得的數(shù)據(jù)集,使用域?qū)箤W(xué)習(xí)和度量學(xué)習(xí)提高模型的魯棒性,有效地提取不同工況的泛化特征,使用旋轉(zhuǎn)機械實驗數(shù)據(jù),驗證了單一工況源域遷移到多工況目標(biāo)域情況下模型遷移診斷的高效性。但是多工況的數(shù)據(jù)中所有工況下的所有類別故障是并行輸入模型測試的,沒有揭示實際過程中振動信號隨工況時變的現(xiàn)象。而且,以往的智能故障診斷方法多采用特征提取層直接連接故障分類器的方式完成任務(wù),模型特征提取層提取的特征的局部信息和全局信息并沒有得到充分利用。對比學(xué)習(xí)采用互信息噪聲對比估計作為損失函數(shù),能夠充分利用特征層的全局信息和局部信息表征不同工況樣本之間的差異。對比學(xué)習(xí)由于能夠?qū)W習(xí)數(shù)據(jù)中的可分辨特征而被應(yīng)用在機械故障診斷領(lǐng)域[13],但并沒有得到廣泛應(yīng)用,結(jié)合對比學(xué)習(xí)的故障診斷研究有待進(jìn)一步推廣。
綜上所述,針對軸承、齒輪振動信號多工況時變的遷移診斷任務(wù),提出了一種基于深度對比遷移學(xué)習(xí)的智能機械故障診斷模型,充分利用此模型提取的特征信息,用于變工況下不同類型故障的識別。使用多層卷積塊提取原始振動信號特征并構(gòu)建局部感受野和全局感受野特征集,增強模型的特征表達(dá)能力,采用 Wasserstein 距離度量源域和目標(biāo)域數(shù)據(jù)的分布差異用于提高模型的遷移能力,利用互信息噪聲對比估計區(qū)分源域和目標(biāo)域工況。所提方法的有效性在變工況的軸承、齒輪實驗數(shù)據(jù)中得到驗證。
1 遷移學(xué)習(xí)理論
遷移學(xué)習(xí)問題有兩個基本概念:領(lǐng)域和任務(wù)[14]。遷移任務(wù)是學(xué)習(xí)的目標(biāo),主要包括標(biāo)簽空間 Y 及對應(yīng)的學(xué)習(xí)函數(shù) f ( ? )。領(lǐng)域是學(xué)習(xí)的主體,由數(shù)據(jù)域D 和其對應(yīng)的概率分布 P組成。數(shù)據(jù)域包括源域和目標(biāo)域,遷移任務(wù)需要將在源域?qū)W習(xí)到的知識遷移到目標(biāo)域。對遷移學(xué)習(xí)形式化,給定帶標(biāo)簽的源域 Ds ={ xi,yi }ni = 1 及其分布 P ( Xs) ( X ={ x1,x2,…,xn }) 和不帶標(biāo)簽的目標(biāo)域 Dt ={ xj }mj = 1 及其分布 P ( Xt),且Xs,Xt∈ X,X 為特征空間。如果 P ( Xs) ≠ P ( Xt),則表明源域和目標(biāo)域存在分布偏差。那么,根據(jù)上述相關(guān)描述,遷移學(xué)習(xí)任務(wù)定義為 T ={ Y,f ( X ) },目標(biāo)是利用源域數(shù)據(jù)學(xué)習(xí)一個分類器f ( Xt):Xt→ Y t,遷移到目標(biāo)域并完成對目標(biāo)域數(shù)據(jù)標(biāo)簽 Y t的預(yù)測[15]。
機械故障遷移學(xué)習(xí)任務(wù):所提方法針對軸承、齒輪運行工況變化的問題,以一種工況下采集的數(shù)據(jù)為源域,其他工況下采集的數(shù)據(jù)為目標(biāo)域。利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)源域數(shù)據(jù)和標(biāo)簽之間的函數(shù)映射關(guān)系,并將這一關(guān)系遷移到目標(biāo)域數(shù)據(jù),完成目標(biāo)域數(shù)據(jù)的識別。
2 相關(guān)工作
2. 1 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)在機械故障診斷領(lǐng)域應(yīng)用廣泛,通常由卷積層、池化層、全連接層組成,能夠完成分類、預(yù)測等任務(wù)[16]。其具有局部感知野和參數(shù)共享的特點,提取的特征具有時移不變性,使用反向傳播方式更新梯度訓(xùn)練模型。卷積神經(jīng)網(wǎng)絡(luò)通常使用多層卷積層和池化層依次穿插連接的方式提取輸入樣本數(shù)據(jù)的隱含特征,并將提取特征輸入全連接層完成分類或預(yù)測[4]。其中,卷積層的功能是提取原始振動信號的特征,其包含多個卷積核,能夠保留數(shù)據(jù)間的空間關(guān)系。給定卷積核的形狀為 k × k,輸入特征形狀為 h × w,步長為 s,填充為 p,那么經(jīng)過第一
池化層的作用是對卷積層提取出來的特征進(jìn)行信息過濾和縮放,能夠減少模型的參數(shù)數(shù)量,保留有效特征,加速模型收斂速度并防止過擬合現(xiàn)象的發(fā)生。池化運算將特征映射到互不相干的區(qū)域,由此保留輸入樣本有用的信息。最大池化被采用,得到池化特征圖:
2. 2 Wasserstein 距離
最大均值差異(Maximum Mean Discrepancy,MMD)是遷移學(xué)習(xí)中最常使用的度量方式,用于衡量源域和目標(biāo)域數(shù)據(jù)的距離,構(gòu)建約束使得不同領(lǐng)域數(shù)據(jù)分布更加近似。但是由于其利用核函數(shù)的方法進(jìn)行計算,在網(wǎng)絡(luò)更新參數(shù)過程中梯度計算復(fù)雜[17]。而 Wasserstein 距離不存在 MMD 的缺點,所以,Wasserstein 距離,也稱為陸地移動距離,被選作度量不同數(shù)據(jù)之間概率分布差異的方式。該距離通常用于尋找最優(yōu)傳遞路徑的問題,即最短的傳遞距離。由此其能夠衡量兩個隨機變量之間的距離和分布差異,實現(xiàn)源域和目標(biāo)域特征的適配與對齊 。Wasserstein 距離的定義為:
2. 3 互信息噪聲對比估計遷移學(xué)習(xí)網(wǎng)絡(luò)需要同時完成故障種類的識別和不同工況的辨別,因此,通常會設(shè)計兩個分類器完成分類任務(wù)。經(jīng)典的分類器經(jīng)常使用交叉熵作為損失函數(shù),其雖然能夠達(dá)到良好的效果但需要精心設(shè)計神經(jīng)網(wǎng)絡(luò),并不能直接利用數(shù)據(jù)的信息。而互信息噪聲對比估計[18]能夠充分反映兩類不同樣本之間的信息相關(guān)性,直接利用數(shù)據(jù)之間的信息差異就能夠完成對兩類不同數(shù)據(jù)的區(qū)分,不需要設(shè)計性能良好的分類器,對于解決工況識別任務(wù)比較友好。給定樣本集合{xk}Kk=1,選取兩個樣本xi和xj,xi,xj∈{xk}Kk=1,則兩個樣本之間互信息噪聲對比估計定義為:
3 所提方法
3. 1 模型結(jié)構(gòu)
模型由特征提取器、特征融合器、域判別器和故障分類器組成,為了更加直觀地展現(xiàn)模型結(jié)構(gòu)以及內(nèi)部信息的傳輸方式,設(shè)計的智能故障診斷模型如圖 1 所示。模型利用卷積神經(jīng)網(wǎng)絡(luò)作為基礎(chǔ),為了實現(xiàn)局部信息和全局信息的提取,設(shè)計了特征融合器。其中特征提取器由兩層卷積層、兩層池化層構(gòu)成,每層卷積層使用 ReLU 作為激活函數(shù),用以提取通用淺層的特征。特征融合器使用 1 × 1 的局部卷積核(用以逐點提取特征提取器輸出的特征)和 8 ×8 的全局卷積核分別計算并獲得特征提取器提取特征圖的局部和全局信息,然后將信息在二維形狀上進(jìn)行擴展,再在通道維度上直接拼接融合。域判別器利用特征融合器獲得的全局信息和局部信息,通過互信息噪聲對比估計方法對不同工況樣本進(jìn)行對比分析。原始的互信息噪聲對比估計需要選定一個樣本相似性估計函數(shù),為了避免選擇函數(shù)的隨機性導(dǎo)致的結(jié)果不確定性,所提方法利用神經(jīng)網(wǎng)絡(luò)自身的學(xué)習(xí)能力,直接對兩種不同工況的軸承或齒輪數(shù)據(jù)樣本進(jìn)行特征提取,以源域數(shù)據(jù)集的全局特征g ( Xs)代替公式(4)中的 xi,源域數(shù)據(jù)集的局部特征l ( Xs)代替公式(4)中的 xj,目標(biāo)域數(shù)據(jù)集的局部特征 l ( Xt)代替公式(4)中的 xk,則得到互信息對比域判別器的損失函數(shù)為:式中 g ( ? )表示由特征融合層得到的全局特征的表征函數(shù);l ( ? ) 表示由特征融合層得到的局部特征表征函數(shù);兩者求點積是對公式(4)中 f (?) 的表示即 f (?) = g (?) ? l (?);batch 表示批量處理樣本數(shù)量。
故障分類器由兩層卷積層、兩層池化層和三層全連接層組成,每層卷積層和全連接層使用 ReLU作為激活函數(shù),卷積層用以充分提取可分辨的不同類健康狀況信息。故障分類器使用 Softmax 函數(shù)對最后一層網(wǎng)絡(luò)的輸出做處理,完成故障分類,因此使用交叉熵作為分類損失函數(shù)。交叉熵?fù)p失定義為:式中 yic 表示符號函數(shù),如果樣本 i 的真實標(biāo)簽等于 c,則 yic = 1,否則 yic = 0;pic 表示樣本 i 經(jīng)由 Soft‐max 后輸出的概率值;N 表示樣本數(shù)量;M 表示類別的數(shù)量。
故障分類器利用 Wasserstein 距離度量源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的距離,約束數(shù)據(jù)分布,實現(xiàn)知識遷移。因此,模型的損失函數(shù)共由三部分組成:互信息噪聲對比估計、交叉熵?fù)p失和 Wasserstein 距離。模型整體損失定義為:
模型各個單元的參數(shù)如表 1 所示。
將融合特征輸入到全連接網(wǎng)絡(luò)的參數(shù)數(shù)量(數(shù)值為 262144)與表 1 中的參數(shù)數(shù)量相加,模型共計參數(shù)為359280,而經(jīng)典的改進(jìn)深度卷積神經(jīng)網(wǎng)絡(luò)AlexNet 的參數(shù)量高達(dá) 6000 萬,所設(shè)計模型的參數(shù)數(shù)量不及其 0.6%。
3. 2 故障識別流程
深度對比遷移學(xué)習(xí)方法充分利用有標(biāo)簽的訓(xùn)練集和無標(biāo)簽的測試集數(shù)據(jù)完成故障診斷任務(wù),具體故障診斷流程如圖 2 所示。
表述如下:
1)采集軸承、齒輪的振動數(shù)據(jù),將原始振動數(shù)據(jù)劃分為訓(xùn)練集和測試集。
2)構(gòu)建模型結(jié)構(gòu),將有標(biāo)簽的訓(xùn)練集和無標(biāo)簽的測試集同時輸入網(wǎng)絡(luò),由特征提取器提取特征,使用特征融合層將局部全局特征進(jìn)行融合。
3)融合后的特征輸入域判別器和故障分類器,分別進(jìn)行工況區(qū)分和故障識別,利用模型輸出計算損失,并反向傳播更新模型參數(shù)。
4)模型訓(xùn)練完畢后,將無標(biāo)簽測試集輸入訓(xùn)練好的模型進(jìn)行故障分類,獲得最終的診斷結(jié)果。
4 實驗案例驗證
4. 1 軸承實驗案例
4. 1. 1 源域和目標(biāo)域數(shù)據(jù)描述
建立了如圖 3 所示滾動軸承實驗裝置。實驗裝置包括減速電機、行星齒輪箱、聯(lián)軸器、軸承測點和二級平行軸齒輪箱等。使用加速度計采集振動信號,采樣頻率為 12.8 kHz,為了滿足工況遷移任務(wù)的需要,軸承分別運行在 1800 r/min(記作 A 工況),600 r/min(記作 B 工況),100 r/min(記作 C 工況)的轉(zhuǎn)速下。數(shù)據(jù)集分為源域和目標(biāo)域,各包括正常(N)、內(nèi)圈故障(IF)、外圈故障(OF)、滾動體故障(BF)四種健康狀況,每種狀況劃分 100 個樣本,每個樣本包含 1024 個數(shù)據(jù)點,這樣源域和目標(biāo)域各包含 4×100×1024=409600 個數(shù)據(jù)點。最后,將源域和目標(biāo)域數(shù)據(jù)集劃分為兩個遷移任務(wù)(T0 和 T1),具體描述如表 2 所示。
圖 4 展示了軸承在 A 和 B 兩種工況下四種健康狀況的時域波形圖,每種狀況展示 3 個樣本,可以看出僅僅根據(jù)時域數(shù)據(jù)無法人為地進(jìn)行故障診斷。
4. 1. 2 遷移診斷結(jié)果分析
為了對比互信息噪聲對比和 Wasserstein 距離對深度對比遷移學(xué)習(xí)模型性能的影響,使用無互信息噪聲對比估計方法(記作方法 1,去除互信息噪聲對比估計)、MMD 方法(記作方法 2,使用 MMD 代替 Wasserstein 距離)和所提方法(記作方法 3)設(shè)計了消融實驗。其中,兩種方法均使用與所提方法相同的模型結(jié)構(gòu)和訓(xùn)練流程,不同的是:無互信息噪聲(特征融合器僅用作互信息噪聲對比估計的使用)直接將特征提取器提取的特征用于域判別器和故障分類器,且域判別器使用交叉熵?fù)p失。
目前,在機器學(xué)習(xí)領(lǐng)域,超參數(shù)的確定沒有一個系統(tǒng)的參照方法,且其并不是重點討論對象。因此針對三種方法比較重要的超參數(shù)、學(xué)習(xí)率和批量處理大小,使用網(wǎng)格搜索和以往設(shè)計經(jīng)驗進(jìn)行確定,即學(xué)習(xí)率的搜索范圍為[1.0,0.1,0.01,0.001,0.0001],批量處理大小的搜索范圍為[5,10,20]。最終確定的模型參數(shù)如表 3 所示。為了保障實驗的一致性,迭代次數(shù)均設(shè)置為 2000,均使用 Adam 優(yōu)化器,利用反向傳播的方式進(jìn)行模型參數(shù)的更新。
三種方法的遷移診斷結(jié)果如表 4 所示,使用遷移準(zhǔn)確率作為判斷指標(biāo)。從表 4 和圖 5 可以看出,所提方法的遷移診斷準(zhǔn)確率均達(dá)到了 100%,對軸承的四種健康狀況都實現(xiàn)了精準(zhǔn)分類,效果好于無互信息噪聲對比估計的方法和 MMD 方法。
由遷移診斷結(jié)果分析,Wasserstein 距離和互信息噪聲對比估計的使用均提高了模型的遷移故障診斷能力。其中所提方法與無互信息噪聲對比估計的方法對比,表明互信息噪聲對比估計能夠充分反映數(shù)據(jù)之間的信息交互情況,將源域和目標(biāo)域樣本信息區(qū)分開來,提高了模型的遷移故障診斷能力;所提方法與 MMD 方法對比結(jié)果表明 Wasserstein 距離的表現(xiàn)優(yōu)于 MMD 距離,證明了其在遷移學(xué)習(xí)方面的有效性;而方法 2 的準(zhǔn)確率在兩個遷移任務(wù)中的表現(xiàn)均優(yōu)于方法 1,證明了互信息噪聲對比估計對模型性能的影響大于 Wasserstein 距離。
為了能夠直觀地觀察深度對比遷移學(xué)習(xí)模型的遷移效果,將模型輸出層的特征使用等距特征映射(Isometric Feature Mapping,Isomap)方法進(jìn)行可視化。三種方法的可視化效果對比如圖 6 所示。從圖 6 中可以看出,所提方法表現(xiàn)出極佳的故障遷移和故障分類效果,目標(biāo)域和源域特征重疊在一起,四種健康狀況下的特征具有較大的類間距和較小的類內(nèi)距的特點,這體現(xiàn)了模型強大的遷移故障診斷能力,能夠?qū)崿F(xiàn)單工況源域機械故障到多變工況目標(biāo)域機械故障的遷移診斷。而其他兩種方法,盡管源域數(shù)據(jù)的各種故障能夠較為明顯的區(qū)分開(少量重疊),但是目標(biāo)域各種故障重疊嚴(yán)重,而且源域與目標(biāo)域的空間分布差異巨大,導(dǎo)致其遷移診斷結(jié)果不佳。
4. 2 齒輪實驗案例
4. 2. 1 源域和目標(biāo)域數(shù)據(jù)描述
為了進(jìn)一步驗證所提方法的有效性,使用行星傳動系統(tǒng)故障模擬實驗臺獲取行星輪故障數(shù)據(jù)集,實驗臺如圖 7 所示。行星輪故障信號使用加速度計采集,采樣頻率 16 kHz。行星輪的健康狀況包括正常、剝落、裂紋和磨損,每種健康狀況均采集三種不同轉(zhuǎn)速下的數(shù)據(jù),分別是600r/min(記作D工況)、1200r/min(記作E工況)和2400r/min(記作F工況)。每種狀況取100個樣本,每個樣本包含1024個數(shù)據(jù)點,這樣源域和目標(biāo)域數(shù)據(jù)集分別包含4×100×1024=409600個數(shù)據(jù)點。最后,將源域和目標(biāo)域數(shù)據(jù)集劃分為兩個遷移任務(wù)(T2和T3),具體描述如表5所示。
4. 2. 2 遷移診斷結(jié)果分析
為了驗證深度對比遷移學(xué)習(xí)模型的有效性,使用流行的遷移成分分析[15](TransferComponentAnalysis,TCA)方法和深度適應(yīng)網(wǎng)絡(luò)[7](DeepAdap‐tationNetworks,DANs)方法與所提方法進(jìn)行對比實驗。其中,遷移成分分析方法的正則項從{0.1,1,10,100}中選擇,子空間維度從{2,4,8,16,32,64,128}中選擇。深度領(lǐng)域適應(yīng)網(wǎng)絡(luò)的結(jié)構(gòu)與所提方法保持一致,其使用多層MMD作為度量距離,也就是在所有的全連接層均使用MMD。值得注意的是,所提方法只在模型的最后一個全連接層使用Was‐serstein距離,以上三種方法均取10次實驗結(jié)果的平均值作為評判標(biāo)準(zhǔn)。
三種方法的遷移診斷平均準(zhǔn)確率如表 6 所示??梢钥闯?,所提方法的遷移診斷準(zhǔn)確率在任務(wù) T2 和T3中分別達(dá)到了99.95%和100%,效果遠(yuǎn)好于TCA和DANs。其中,DANs的準(zhǔn)確率在任務(wù)T2 和T3 中均高于 TCA,表明針對未經(jīng)處理的原始振動信號,相比于傳統(tǒng)遷移學(xué)習(xí)模型,結(jié)合深度學(xué)習(xí)的遷移模型具有更強有力的可遷移特征學(xué)習(xí)能力。
從圖 8 中可以看出,經(jīng)過大約 800 次迭代后,深度對比遷移學(xué)習(xí)模型的訓(xùn)練準(zhǔn)確率才達(dá)到 100%,而DANs 的訓(xùn)練準(zhǔn)確率過早地達(dá)到了 100%,出現(xiàn)了較為嚴(yán)重的過擬合現(xiàn)象。從訓(xùn)練損失上看,深度對比遷移學(xué)習(xí)模型的損失下降的幅度更大,且迭代過程曲折,而 DANs 的迭代過程更加平滑,這表明深度對比遷移學(xué)習(xí)模型的訓(xùn)練過程更加穩(wěn)健,也證明了Wasserstein 距離作為遷移學(xué)習(xí)模型的損失更能發(fā)揮模型的性能,因此該模型的測試準(zhǔn)確率高于 DANs。
為了證明所提方法的穩(wěn)定性,分別計算了三種方法測試結(jié)果的標(biāo)準(zhǔn)差,如表 7 所示。從表 7 可以看出,所提方法的標(biāo)準(zhǔn)差在兩個遷移任務(wù)上均小于DANs,說明深度對比遷移學(xué)習(xí)模型的測試結(jié)果更加可靠,證明所提方法具有較強的穩(wěn)健性。盡管 TCA的標(biāo)準(zhǔn)差在兩個遷移任務(wù)上面均為 0,但是其測試平均準(zhǔn)確率遠(yuǎn)遠(yuǎn)低于其他兩種方法,因此綜合考慮平均準(zhǔn)確率和標(biāo)準(zhǔn)差兩個指標(biāo),所提方法的效果最佳。
5 結(jié) 論
提出一種基于深度對比遷移學(xué)習(xí)的機械設(shè)備故障診斷方法,旨在完成機械設(shè)備在變工況下的遷移診斷任務(wù),主要得到以下結(jié)論:
(1)模型使用特征融合器,充分利用了特征提取器提取特征的局部信息和全局信息,增強了模型的特征表達(dá)能力,提高了模型故障診斷的準(zhǔn)確度。
(2) Wasserstein 距離的采用提高了模型的遷移能力,使得模型將在源域?qū)W習(xí)到的知識遷移到目標(biāo)域,有效完成了目標(biāo)域無標(biāo)簽樣本的故障診斷。
(3)互信息噪聲對比估計能夠?qū)⒃从蚝湍繕?biāo)域樣本之間信息的差異準(zhǔn)確地區(qū)分,從而將源域和目標(biāo)域數(shù)據(jù)集對應(yīng)的不同工況分離開,提高了模型的遷移診斷能力。
(4)模型在軸承和齒輪實驗案例上均表現(xiàn)出了良好的遷移診斷性能,具備較好的泛化能力。
參考文獻(xiàn):
[1] 李巍華,單外平,曾雪瓊 . 基于深度信念網(wǎng)絡(luò)的軸承故障分類識別[J]. 振動工程學(xué)報,2016,29(2):340-347.Li W H, Shan W P, Zeng X Q. Bearing fault identifica‐tion based on deep belief network[J]. Journal of Vibra‐tion Engineering,2016,29(2):340-347.
[2] 張坤,胥永剛,馬朝永,等 . 經(jīng)驗快速譜峭度及其在滾動軸承故障診斷中的應(yīng)用[J]. 振動工程學(xué)報,2020,33(3):636-642.
Zhang Kun, Xu Yonggang, Ma Chaoyong, et al. Em‐pirical fast kurtogram and its application in rolling bear‐ing fault diagnosis[J]. Journal of Vibration Engineer‐ing,2020,33(3):636-642.
[3] 雷亞國,賈峰,周昕,等. 基于深度學(xué)習(xí)理論的機械裝備大數(shù)據(jù)健康監(jiān)測方法[J]. 機械工程學(xué)報,2015,51(21):49-56.
LEI Yaguo, JIA Feng, ZHOU Xin, et al. A deep learn‐ing-based method for machinery health monitoring withbig data[J]. Journal of Mechanical Engineering,2015,51(21):49-56.
[4] DIBAJ A, ETTEFAGH M M, HASSANNEJAD R,et al. A hybrid fine-tuned VMD and CNN scheme foruntrained compound fault diagnosis of rotating machin‐ery with unequal-severity faults[J]. Expert Systemswith Applications,2021,167:114094.
[5] YAN X A, LIU Y, JIA M P. Multiscale cascadingdeep belief network for fault identification of rotatingmachinery under various working conditions[J]. Knowl‐edge-Based Systems,2020,193:105484.
[6] CHENG Y W, LIN M X, WU J, et al. Intelligent fault di‐agnosis of rotating machinery based on continuous wavelettransform-local binary convolutional neural network[J].Knowledge-Based Systems,2021,216:106796.
[7] LI C, ZHANG S, QIN Y, et al. A systematic reviewof deep transfer learning for machinery fault diagnosis[J]. Neurocomputing,2020,407:121-135.
[8] ZHAO K, JIANG H K, WANG K, et al. Joint distri‐bution adaption network with adversarial learning forrolling bearing fault diagnosis[J]. Knowledge-BasedSystems,2021,222:106974.
[9] 王肖雨,童靳于,鄭近德,等 . 基于流形嵌入分布對齊的 滾 動 軸 承 遷 移 故 障 診 斷 方 法[J]. 振 動 與 沖 擊 ,2021,40(8):110-116.
WANG Xiaoyu, TONG Jinyu, ZHENG Jinde, et al.Transfer fault diagnosis for rolling bearings based onmanifold embedded distribution alignmen[t J]. Journalof Vibration and Shock,2021,40(8):110-116.
[10] 陳仁祥,吳昊年,張霞,等 . 子空間嵌入特征分布對齊的不同工況下旋轉(zhuǎn)機械復(fù)合故障診斷[J]. 機械工程學(xué)報,2021,57(2):21-29.
CHEN Renxiang, WU Haonian, ZHANG Xia, et al.Compound fault diagnosis of rotating machinery underdifferent conditions based on subspace embedded featuredistribution alignment[J]. Journal of Mechanical Engi‐neering,2021,57(2):21-29.
[11] ZOU Y S, LIU Y Z, DENG J L, et al. A novel trans‐fer learning method for bearing fault diagnosis under dif‐ferent working conditions[J]. Measurement, 2021,171:108767.
[12] LI X, ZHANG W, MA H, et al. Domain generalizationin rotating machinery fault diagnostics using deep neuralnetworks[J]. Neurocomputing,2020,403:409-420.
[13] DING Y F, ZHUANG J C, DING P, et al. Self-super‐vised pretraining via contrast learning for intelligent in‐cipient fault detection of bearings[J]. Reliability Engi‐neering and System Safety,2022,218:108126.
[14] LI X D, HU Y, LI M T, et al. Fault diagnostics be‐tween different type of components: a transfer learningapproach[J]. Applied Soft Computing,2019,86:105950.
[15] YANG B, LEI Y G, JIA F, et al. An intelligent faultdiagnosis approach based on transfer learning from labo‐ratory bearings to locomotive bearings[J]. MechanicalSystems and Signal Processing,2019,122:692-706.
[16] LONG Y Y, ZHOU W N, LUO Y. A fault diagnosismethod based on one-dimensional data enhancementand convolutional neural network[J]. Measurement,2021,180:109532.
[17] CHENG C, ZHOU B T, MA G J, et al. Wassersteindistance based deep adversarial transfer learning for in‐telligent fault diagnosis with unlabeled or insufficient la‐beled data[J]. Neurocomputing,2020,409:35-45.
[18] CHEN X C, YAO L N, ZHOU T, et al. Momentumcontrastive learning for few-shot COVID-19 diagnosisfrom chest CT images[J]. Pattern Recognition,2021,113:107826.