ResNet-LSTM并行網(wǎng)絡(luò)轉(zhuǎn)子故障遷移診斷方法

2023-02-03 12:57張興宇胡愛軍邴漢昆

動力工程學(xué)報 2023年1期

向玲，張興宇，胡愛軍，邴漢昆，楊鑫

(1.華北電力大學(xué) 機械工程系，河北保定 071003； 2.華電電力科學(xué)研究院有限公司，杭州 310030)

轉(zhuǎn)子是旋轉(zhuǎn)機械的核心組成部分，在旋轉(zhuǎn)機械中起著重要作用。在實際運行中，轉(zhuǎn)子常因設(shè)計、制造、安裝和運行條件等因素，會產(chǎn)生各種故障，影響機械設(shè)備正常工作[1]。隨著科學(xué)技術(shù)的發(fā)展，對機械設(shè)備故障診斷的方法越來越先進[2]。充分挖掘轉(zhuǎn)子設(shè)備中的有效信息，實現(xiàn)機械設(shè)備故障的智能診斷已成為研究熱點。

近年來，借鑒深度學(xué)習(xí)在多個領(lǐng)域成功應(yīng)用的經(jīng)驗，將深度學(xué)習(xí)應(yīng)用到故障診斷領(lǐng)域，取得了不錯的效果。Janssens等[3]使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)對齒輪箱中的軸承和齒輪故障進行分類，準(zhǔn)確率提高了約6%。Lu等[4]使用堆疊降噪自編碼(SDA)在噪聲環(huán)境下準(zhǔn)確地區(qū)分出旋轉(zhuǎn)機械部件的狀態(tài)。Yuan等[5]使用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)預(yù)測航空發(fā)電機的壽命。Zhu等[6]結(jié)合對稱點模式(SDP)圖像和CNN診斷轉(zhuǎn)子故障，準(zhǔn)確率可達96.5%。王新偉等[7]提出了基于XGBoost算法的汽輪機轉(zhuǎn)子故障診斷模型，能夠識別汽輪機的9種故障。為提高齒輪箱狀態(tài)監(jiān)測效率和準(zhǔn)確性，劉旭斌等[8]提出了基于堆疊去噪自編碼-長短期記憶網(wǎng)絡(luò)(SDAE-LSTM)的故障監(jiān)測模型，該模型能夠及時發(fā)現(xiàn)齒輪箱異常。以上方法將深度學(xué)習(xí)算法引入故障診斷領(lǐng)域，提高了旋轉(zhuǎn)機械故障診斷的準(zhǔn)確率，但在實際運行中，很難收集到足夠的數(shù)據(jù)，且將模型應(yīng)用于新的診斷任務(wù)時，需要對整個模型進行再訓(xùn)練。

遷移學(xué)習(xí)是一種跨領(lǐng)域、跨任務(wù)的學(xué)習(xí)方法，能夠利用已有知識解決不同問題[9]，已被引入智能故障診斷領(lǐng)域。Shao等[10]基于遷移學(xué)習(xí)，利用預(yù)訓(xùn)練好的模型提取低層次特征，再使用時頻圖微調(diào)高層次網(wǎng)絡(luò)，在小樣本數(shù)據(jù)集上提升了齒輪和軸承的故障診斷準(zhǔn)確率。Chen等[11]提出暫態(tài)混沌神經(jīng)網(wǎng)絡(luò)(TCNN)遷移學(xué)習(xí)框架，在不同工況數(shù)據(jù)集下，使目標(biāo)域上分類的平均準(zhǔn)確率達到99.03%。He等[12]提出一種經(jīng)過優(yōu)化的深度傳遞自編碼方法，利用源域足夠的輔助數(shù)據(jù)對優(yōu)化的深度自編碼器進行預(yù)訓(xùn)練，并將參數(shù)傳遞至目標(biāo)模型，在不同工況間的遷移準(zhǔn)確率達到93%。

針對轉(zhuǎn)子系統(tǒng)實際故障樣本少的情況，筆者提出了基于殘差網(wǎng)絡(luò)(ResNet)和長短期記憶網(wǎng)絡(luò)(LSTM)的并行網(wǎng)絡(luò)(RLPN)的轉(zhuǎn)子故障遷移診斷方法，利用ResNet-LSTM并行網(wǎng)絡(luò)能夠同時提取時間和空間特征的優(yōu)勢，以及遷移學(xué)習(xí)對樣本需求量較少的優(yōu)勢，解決了小樣本下轉(zhuǎn)子故障診斷問題。使用ResNet模塊提取信號的空間特征，采用LSTM模塊提取信號的時間特征，再將時間和空間特征進行特征融合，增強模型特征的表達能力。然后在源域中訓(xùn)練模型，再采用參數(shù)遷移的方法，在目標(biāo)域中完成轉(zhuǎn)子故障的分類，實現(xiàn)小樣本下的轉(zhuǎn)子多故障識別。

1 理論基礎(chǔ)

1.1 遷移學(xué)習(xí)

遷移學(xué)習(xí)是從源域中學(xué)習(xí)知識并應(yīng)用到目標(biāo)域中，使目標(biāo)域能夠更好地完成故障診斷任務(wù)[13]。領(lǐng)域和任務(wù)是遷移學(xué)習(xí)的2個基本概念。領(lǐng)域D={χ,P(X)}，其中X={x1,…,xn}?χ，xi表示源域的第i個樣本，χ代表源域的樣本空間，P(X)表示χ的邊緣概率分布；任務(wù)T={γ,f(·)}，定義Y={y1,…,y2}?γ，yi表示目標(biāo)域的第i個樣本，γ代表目標(biāo)域的樣本空間，目標(biāo)是學(xué)習(xí)預(yù)測函數(shù)f(·)：X→Y。

給定源域DS和源任務(wù)TS、目標(biāo)域DT和任務(wù)TT，遷移學(xué)習(xí)是學(xué)習(xí)DS和TS的知識，在目標(biāo)域DT中提高任務(wù)TT中的預(yù)測函數(shù)f(·)。

針對轉(zhuǎn)子故障遷移診斷問題，將在2種不同工況下采集的數(shù)據(jù)設(shè)為源域和目標(biāo)域，將源域中訓(xùn)練的模型參數(shù)向目標(biāo)域遷移，借助源域和源任務(wù)知識，學(xué)習(xí)源域和標(biāo)簽之間的函數(shù)映射關(guān)系，再利用目標(biāo)域中的少量有標(biāo)簽的樣本微調(diào)優(yōu)化模型，實現(xiàn)對目標(biāo)域的故障識別。

1.2 殘差網(wǎng)絡(luò)

當(dāng)采用深度學(xué)習(xí)進行網(wǎng)絡(luò)訓(xùn)練時，隨著網(wǎng)絡(luò)層數(shù)的增加，網(wǎng)絡(luò)在訓(xùn)練過程中會出現(xiàn)梯度消失和退化問題。He等[14]在2016年提出了ResNet，該網(wǎng)絡(luò)具有極強的特征提取能力，解決了網(wǎng)絡(luò)準(zhǔn)確率隨著網(wǎng)絡(luò)層數(shù)增加而產(chǎn)生飽和甚至下降的問題，ResNet模型結(jié)構(gòu)如圖1所示。

圖1 ResNet模型結(jié)構(gòu)

殘差單元的表達式為：

yl=f(xl,Wl)+h(xl)

(1)

xl+1=g(yl)

(2)

式中：xl為上一個模塊的輸入；Wl為卷積層的權(quán)重矩陣；f(xl,Wl)為xl經(jīng)過2次卷積操作后的輸出；h(xl)為恒等映射函數(shù)，目的是保證輸入xl與f(xl,Wl)尺寸相同；yl為未經(jīng)過ReLU激活函數(shù)前的殘差輸出；g(yl)為ReLU激活函數(shù)；xl+1為yl經(jīng)過ReLU激活函數(shù)后的輸出。

基于上式，在h(xl)=xl時，由淺層l到深層L的學(xué)習(xí)特征表達式為：

(3)

利用鏈?zhǔn)角髮?dǎo)法則可求得反向傳播過程的梯度：

(4)

式中:Lloss為交叉熵損失函數(shù)。

由式(4)可知，ResNet在誤差反向傳播中，可使得梯度大于0，避免梯度消失。ResNet模塊的主要思路是引入跳躍連接，在反向傳播過程中，可以通過跳躍連接將誤差有效地傳遞給上一層，避免普通卷積網(wǎng)絡(luò)隨著網(wǎng)絡(luò)層數(shù)的增加而產(chǎn)生梯度消失的現(xiàn)象。

1.3 長短期記憶網(wǎng)絡(luò)

在解決序列數(shù)據(jù)的依賴問題時采用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)模型，該模型具有保持短期記憶的能力。神經(jīng)元不僅可以接受自身的信息，還可以接受其他神經(jīng)元的信息，在故障診斷領(lǐng)域表現(xiàn)出極強的生命力。但對于傳統(tǒng)的RNN，由于其內(nèi)部tanh層的特點，當(dāng)序列數(shù)據(jù)較長時，初始的記憶信息會消失，存在梯度爆炸和消失問題，很難保持長時間的記憶。

LSTM模型是RNN模型的變體，其引入了門控制機制，以控制信息的累積速度，可有效解決長期記憶的問題[15]。LSTM模型結(jié)構(gòu)如圖2所示。

圖2 LSTM模型結(jié)構(gòu)

LSTM模型前向傳播過程為：

ft=σ(Wf·xt+Rf·ht-1+bf)

(5)

it=σ(Wi·xt+Ri·ht-1+bi)

(6)

(7)

(8)

ot=σ(Wo·xt+Ro·ht-1+bo)

(9)

ht=ot⊙tanh(Ct)

(10)

LSTM用3個門動態(tài)控制內(nèi)部狀態(tài)，以決定應(yīng)該遺忘多少歷史信息，以便更好地提取序列信號中的時間特征。

2 RLPN轉(zhuǎn)子故障遷移診斷

2.1 模型結(jié)構(gòu)

所提RLPN模型能夠?qū)σ痪S時序信號數(shù)據(jù)進行時間特征和空間特征的提取，更深層次地挖掘數(shù)據(jù)中的有效信息。模型由輸入層、卷積層、池化層、LSTM模塊、ResNet模塊、全局池化層、特征融合層及分類輸出層組成。模型結(jié)構(gòu)及其內(nèi)部傳輸方式如圖3所示，模型各個單元的參數(shù)見表1。

圖3 RLPN結(jié)構(gòu)圖

表1 模型參數(shù)表

2.2 預(yù)故障識別流程

RLPN故障遷移診斷模型的整體流程圖如圖4所示，通過遷移學(xué)習(xí)方法對故障數(shù)據(jù)分類，得到最終的識別結(jié)果。

由圖4可知，RLPN遷移診斷的具體流程如下：

(1) 獲取不同工況下的轉(zhuǎn)子振動數(shù)據(jù)，將其劃分為有標(biāo)簽的源域和帶有少量標(biāo)簽的目標(biāo)域，并將數(shù)據(jù)標(biāo)準(zhǔn)化，每1 024個點劃分為1個小樣本。

(2) 構(gòu)建RLPN網(wǎng)絡(luò)模型，將源域數(shù)據(jù)輸入網(wǎng)絡(luò)模型，采用交叉熵損失函數(shù)和反向傳播算法對網(wǎng)絡(luò)參數(shù)進行更新訓(xùn)練。

圖4 RLPN遷移診斷的流程

(3) 訓(xùn)練完畢后，將網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)參數(shù)遷移到目標(biāo)域，將目標(biāo)域帶有少量標(biāo)簽的數(shù)據(jù)作為目標(biāo)域訓(xùn)練集輸入網(wǎng)絡(luò)模型，固定除分類層外的所有層，對分類層參數(shù)進行參數(shù)的重新訓(xùn)練與微調(diào)。

(4) 模型重新訓(xùn)練完畢后，將無標(biāo)簽的源域數(shù)據(jù)作為目標(biāo)域的測試集輸入模型完成故障分類，得到最終的識別結(jié)果。

3 實驗分析

3.1 實驗數(shù)據(jù)集

選用圖5所示的Bently轉(zhuǎn)子實驗臺開展轉(zhuǎn)子故障實驗，分析RLPN轉(zhuǎn)子故障遷移診斷方法。該裝置由電機、轉(zhuǎn)軸、傳感器、滑動軸承、預(yù)加載架和轉(zhuǎn)速調(diào)節(jié)器組成，使用傳感器采集振動幅值數(shù)據(jù)。

分別采集1 500 r/min(工況A)、1 600 r/min(工況B)、1 700 r/min (工況C)和2 000 r/min (工況D)這4個工況下的正常、輕度碰摩故障、重度碰摩故障、1 mm裂紋故障和3 mm裂紋故障共20類狀態(tài)數(shù)據(jù)。深度學(xué)習(xí)模型擁有強大的學(xué)習(xí)能力，能夠自適應(yīng)提取信號特征，采樣頻率只需滿足采樣定理即可，因此統(tǒng)一取采樣頻率為5.12 kHz。每類數(shù)據(jù)包含72個樣本，其中訓(xùn)練集和測試集按照2∶8的比例劃分，分別是14個樣本和58個樣本，每個樣本包含1 024個數(shù)據(jù)點，可得源域和目標(biāo)域各包含5×72×1 024=368 640個數(shù)據(jù)點。最后，將4個工況劃分為4個遷移任務(wù)，即T1、T2、T3和T4，見表2。

表2 轉(zhuǎn)子故障診斷任務(wù)描述表

轉(zhuǎn)子在B工況下的原始信號波形如圖6所示，由圖6可知，僅依據(jù)時域數(shù)據(jù)很難通過人工完成故障診斷。

(a) 正常

3.2 實驗流程與結(jié)果分析

為了驗證RLPN轉(zhuǎn)子故障遷移診斷方法的創(chuàng)新性和有效性，在相同的數(shù)據(jù)集上使用ResNet-LSTM串行網(wǎng)絡(luò)模型(模型1)、LSTM模型(模型2)、CNN模型(模型3)、CNN-LSTM并行網(wǎng)絡(luò)模型(模型4)、本文所提模型(模型5)，開展轉(zhuǎn)子故障遷移診斷對比實驗。

根據(jù)以往設(shè)計經(jīng)驗確定模型的超參數(shù)，為保證對比實驗的一致性，訓(xùn)練均采用Adam優(yōu)化器，迭代次數(shù)為1 500。針對較重要的超參數(shù)，使用網(wǎng)格搜索法確定，學(xué)習(xí)率的搜索范圍為[0.1，0.01，0.001，0.000 1，0.000 01]，批處理大小的搜索范圍為[16，32]。最終確定模型超參數(shù)見表3。

表3 轉(zhuǎn)子故障診斷超參數(shù)

采用遷移準(zhǔn)確率作為上述5種模型的遷移診斷結(jié)果判斷指標(biāo)，如表4和圖7所示。由表4和圖7可知，平均準(zhǔn)確率最低的是LSTM模型，為87.41%，且在T3任務(wù)上的準(zhǔn)確率僅為70.69%，說明LSTM在遷移診斷中的穩(wěn)定性較差，診斷效果一般。CNN-LSTM并行網(wǎng)絡(luò)模型的平均準(zhǔn)確率達到96.98%，高于LSTM模型和CNN模型，論證了采用并行網(wǎng)絡(luò)擁有更好的特征提取能力。本文的RLPN模型是CNN-LSTM并行網(wǎng)絡(luò)模型，其中的CNN模塊被ResNet模塊替換，其平均準(zhǔn)確率可達99.83%，高于其他4種模型，實現(xiàn)了對轉(zhuǎn)子5種不同狀態(tài)的精準(zhǔn)分類。

表4 轉(zhuǎn)子實驗遷移診斷結(jié)果

圖7 轉(zhuǎn)子實驗遷移診斷結(jié)果

以T1任務(wù)為例，5種模型的準(zhǔn)確率曲線如圖8所示。由圖8可知，經(jīng)過約600次迭代后，RLPN模型的準(zhǔn)確率達到100%，且趨于穩(wěn)定，高于其他4個模型，表明該模型訓(xùn)練效果良好。

為了更清晰地說明模型對測試集的識別效果，采用混淆矩陣展示模型在T1任務(wù)上的診斷結(jié)果，如圖9所示。由圖9可知，5種模型遷移診斷均能準(zhǔn)確識別轉(zhuǎn)子1 mm的裂紋。其中，ResNet-LSTM串行網(wǎng)絡(luò)模型對正常和輕度碰摩2種健康狀況的識別無效；LSTM模型能夠有效識別2種裂紋狀態(tài)，對正常、輕度碰摩和重度碰摩3種狀態(tài)的識別準(zhǔn)確

(a) ResNet-LSTM串行網(wǎng)絡(luò)模型

率可達88%及以上；CNN模型能夠有效識別重度碰摩和1 mm的裂紋，而對正常狀態(tài)的識別準(zhǔn)確率僅為79%；CNN-LSTM并行網(wǎng)絡(luò)模型難以識別3 mm的裂紋，其準(zhǔn)確率僅為64%，對其他4種狀態(tài)的識別準(zhǔn)確率可達93%以上；只有RLPN模型能精準(zhǔn)識別5種狀態(tài)，識別準(zhǔn)確率高達100%。綜上所述，RLPN模型可以從原始振動信號中提取出充足的特征，從而實現(xiàn)精確的故障識別任務(wù)。

為直觀分析RLPN模型在轉(zhuǎn)子故障遷移診斷中的有效性，采用t分布隨機鄰域嵌入(t-SNE)算法對T1任務(wù)原始數(shù)據(jù)和模型提取的特征(分類層的輸出)降維至二維平面，并以散點圖進行可視化處理，如圖10所示。

由圖10(a)可知，原始數(shù)據(jù)類間距小，所有類型混雜在一起，無法準(zhǔn)確分類。圖10(b)中正常和輕度碰摩2種健康狀況基本重合，同樣無法準(zhǔn)確識別。圖10(c)、圖10(d)和圖10(e)中，有少量類別重合在一起，只能識別部分故障。圖10(f)中5種類別類間距大，所提方法能夠有效提取信號中的顯性可分辨特征，準(zhǔn)確地識別故障，充分驗證了RLPN模型在遷移學(xué)習(xí)轉(zhuǎn)子故障診斷中的優(yōu)越性。

4 結(jié) 論

(1) 基于RLPN模型的遷移診斷方法能夠深入挖掘轉(zhuǎn)子數(shù)據(jù)樣本中的時空特征，獲取更充分的特征參數(shù)，實現(xiàn)小樣本下的轉(zhuǎn)子故障遷移診斷，為轉(zhuǎn)子智能故障診斷提供了新的方法。

(2) 基于RLPN模型的遷移診斷方法平均準(zhǔn)確率達到99.83%，優(yōu)于CNN-LSTM并行網(wǎng)絡(luò)模型，更高于只提取信號空間特征的CNN模型、只提取信號時間特征的LSTM模型，以及ResNet模塊與LSTM模塊級聯(lián)的ResNet-LSTM模型。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡