李曼,潘楠楠,段雍,曹現(xiàn)剛
(1. 西安科技大學 機械工程學院,陜西 西安 710054;2. 陜西省礦山機電裝備智能監(jiān)測重點實驗室,陜西 西安 710054)
隨著煤礦開采深度和難度不斷加大,煤礦設(shè)備正逐漸趨于大型化、復雜化和智能化[1-2]。礦用旋轉(zhuǎn)機械所處環(huán)境惡劣,工作載荷大且多變,易出現(xiàn)故障,且其振動信號具有非平穩(wěn)、非線性的特點,使得設(shè)備狀態(tài)監(jiān)測和準確評估困難。因此,對煤礦旋轉(zhuǎn)機械健康狀態(tài)進行準確評估,對于保障煤礦機械設(shè)備安全高效運行具有重要意義。
設(shè)備健康評估方法主要有基于物理模型驅(qū)動、基于知識驅(qū)動和基于數(shù)據(jù)驅(qū)動的方法[3]。煤礦旋轉(zhuǎn)機械結(jié)構(gòu)復雜,且關(guān)鍵部件的健康狀態(tài)呈現(xiàn)復雜的退化規(guī)律,基于物理模型和知識驅(qū)動的方法難以準確建立評估模型。隨著信息與傳感技術(shù)的飛速發(fā)展,基于數(shù)據(jù)驅(qū)動的方法已被廣泛應用于煤礦設(shè)備故障診斷、異物檢測和煤矸檢測等方面[4]。在設(shè)備健康評估方面,基于數(shù)據(jù)驅(qū)動的方法主要包括有監(jiān)督學習和無監(jiān)督學習2種方法[5]。有監(jiān)督學習方法能夠建立樣本與標簽之間的聯(lián)系,有效地進行分類與回歸,但煤礦旋轉(zhuǎn)機械結(jié)構(gòu)復雜、工況多變,難以建立樣本與健康狀態(tài)之間的對應關(guān)系,且往往需要大量專家知識與人為經(jīng)驗。無監(jiān)督學習方法無需費時費力的數(shù)據(jù)標記過程,能夠自適應地進行特征提取與降維,實現(xiàn)設(shè)備健康狀態(tài)評估。在眾多無監(jiān)督學習算法中,卷積自編碼器(Convolutional Autoencoder,CAE)模型集成了自編碼器(Autoencoder,AE)與卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的優(yōu)勢,能夠?qū)崿F(xiàn)任意維度的特征空間映射[6],在避免專家經(jīng)驗的同時增強模型性能。CAE雖然有出色的特征提取與降噪能力,但卷積單元僅能提取數(shù)據(jù)樣本的局部空間相關(guān)特征,未同時考慮樣本的空間與時間特性,存在特征學習不完備的問題,影響識別準確性。
煤礦設(shè)備監(jiān)測參數(shù)為時間序列數(shù)據(jù),其時序特征對健康評估的影響較大。循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)能夠?qū)W習數(shù)據(jù)中的序列特征,在健康評估與壽命預測中得到了應用。長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)是一種改進RNN,通過引入門控結(jié)構(gòu)控制信息的傳遞,從而有效記憶時序數(shù)據(jù)特征,解決RNN因時間間隔過大出現(xiàn)的梯度消失和梯度爆炸等問題[7]。為充分挖掘煤礦設(shè)備振動數(shù)據(jù)的時間與空間特征信息,本文采用LSTM網(wǎng)絡(luò)提取振動數(shù)據(jù)的時間序列特征,建立了基于二維數(shù)組的長短期記憶降噪卷積自編碼器(Twodimensional array Long Short-Term Memory Denoising Convolutional Autoencoder,2D-LSTMDCAE)模型,并提出了基于2D-LSTMDCAE的煤礦旋轉(zhuǎn)機械健康指標(Health Indicator,HI)構(gòu)建及狀態(tài)評估方法。評估模型采用卷積和LSTM并行的網(wǎng)絡(luò)結(jié)構(gòu),以二維樣本輸入,可充分提取振動信號的時空特性。
1.1.1 LSTM網(wǎng)絡(luò)
LSTM網(wǎng)絡(luò)的循環(huán)單元結(jié)構(gòu)如圖1所示。
圖1 LSTM循環(huán)單元結(jié)構(gòu)Fig. 1 Structure of LSTM cyclic unit
LSTM引入輸入門it控制當前時刻的候選狀態(tài)有 多少信息需要保存,引入遺忘門ft控制上一時刻的內(nèi)部狀態(tài)ct-1需 要遺忘多少信息,引入輸出門ot控制當前時刻的內(nèi)部狀態(tài)ct有多少信息需要輸出給外部狀態(tài)ht。 在每個時間步t,隱藏層的狀態(tài)更新公式為
式中:⊙為向量元素相乘符號;tanh為雙曲正切激活函數(shù);Wc為候選狀態(tài)的權(quán)重矩陣;xt為當前時刻的輸入;bc為候選狀態(tài)的偏置向量。
3個門的計算公式分別為
式中:s為Sigmoid激活函數(shù);Wi,Wf,W0分別為3個門中xt的權(quán)重矩陣;Vi,Vf,V0分別為3個門中ht-1的權(quán)重矩陣;bi,bf,b0分別為3個門的偏置向量。
1.1.2 CAE
CAE由編碼和解碼2個部分組成,如圖2所示。編碼部分實現(xiàn)特征提取與降維,解碼部分還原特征,并利用卷積、池化、反卷積和上采樣代替AE中的全連接層,以增強算法對數(shù)據(jù)特征的學習能力[8]。
圖2 CAE模型Fig. 2 CAE model
1.1.3 LSTMDCAE模型
考慮到實際煤礦生產(chǎn)條件下存在強電磁干擾、載荷多變等因素,使得所測振動信號中包含較強的背景噪聲和設(shè)備運行引起的機械沖擊,所以采用降噪CAE(DCAE)提升模型的降噪能力。LSTMDCAE模型如圖3所示。
圖3 LSTMDCAE模型Fig. 3 LSTMDCAE model
LSTMDCAE模型采用并行多層CAE結(jié)構(gòu)。在編碼階段,分別采用卷積與長短時單元對原始數(shù)據(jù)集進行特征提取,對提取到的特征進行拼接,再由卷積單元進行特征融合。在解碼階段,采用反卷積和上采樣單元將特征恢復為原始數(shù)據(jù)格式,在輸出層之后添加Sigmoid激活函數(shù),將輸出特征映射到[0,1]區(qū)間,以便于模型訓練。
在輸入層之后,通過高斯層對輸入信號添加噪聲,后續(xù)通過網(wǎng)絡(luò)重構(gòu)無噪聲數(shù)據(jù),以提高模型的抗干擾能力。在每次卷積后加入標準化層,使每層神經(jīng)元的輸入保持標準正態(tài)分布,以避免梯度消失問題,加快模型的訓練速度,提高模型的泛化能力[9]。在標準化層后添加ReLU激活函數(shù),使負值置零,以增強模型的非線性能力,加快收斂速度。該模型以無監(jiān)督的方式從原始數(shù)據(jù)中捕獲時空信息并降低噪聲干擾。
2D-LSTMDCAE模型輸入樣本及HI構(gòu)建過程如圖4所示。將一維振動數(shù)據(jù)重構(gòu)為二維樣本,輸入由卷積和LSTM組成的并行網(wǎng)絡(luò)進行樣本重構(gòu),通過Bray-Curtis距離度量原始樣本與重構(gòu)樣本間的相似程度,構(gòu)建HI,最后通過Savitzky-Golay濾波器對HI曲線進行平滑處理。
圖4 輸入樣本及HI構(gòu)建Fig. 4 Construction of input sample and HI
1.2.1 輸入樣本構(gòu)建
原始振動信號是一維時間序列信號,通過一維卷積進行特征學習時存在學習能力不足、訓練參數(shù)較大等問題。將原始數(shù)據(jù)轉(zhuǎn)換為二維數(shù)組,可通過二維卷積網(wǎng)絡(luò)模型充分學習原始數(shù)據(jù)中所包含的信息,增強模型對數(shù)據(jù)特征的學習能力。
首先,分別將垂直和水平2路原始振動數(shù)據(jù)歸一化到[0,1]區(qū)間,并切分為等時間長度的N個時刻。其次,按照等間距采樣的方式,分別在垂直和水平方向每一時刻的振動數(shù)據(jù)中取X個數(shù)據(jù)點,構(gòu)成2個一維數(shù)組,用K1[X],H1[X]表示。然后,分別將K1[X],H1[X]重 新排列,重構(gòu)為長為E、寬為D的2個二維數(shù)組,用K2[E×D],H2[E×D]表示。最后,將任意時刻的2路振動信號二維數(shù)組結(jié)合為1個二通道輸入樣本St[E×D×2],構(gòu)建N個時刻的總輸入樣本S[N×E×D×2],作為卷積單元的輸入。
對于輸入樣本S,以T為窗口長度、m為步長進行滑動,構(gòu)建輸入樣本S′[n×T×E×D×2](n為樣本數(shù)),作為LSTM網(wǎng)絡(luò)的輸入。
1.2.2 HI構(gòu)建
基于AE能夠重構(gòu)輸入樣本的特性,模型在訓練時通過最小化重構(gòu)誤差來學習樣本數(shù)據(jù)的分布情況。將設(shè)備健康狀態(tài)下的數(shù)據(jù)構(gòu)建為訓練樣本,輸入2D-LSTMDCAE模型中進行訓練。隨著訓練損失的減小,模型能夠掌握健康數(shù)據(jù)的序列特征并學習到數(shù)據(jù)的深層特征表達。對于健康狀態(tài)下的監(jiān)測數(shù)據(jù),模型能夠很好地對其進行重構(gòu),重構(gòu)樣本與原始樣本之間的相似度接近于1。當設(shè)備開始退化時,振動監(jiān)測數(shù)據(jù)中所蘊含的特征信息逐漸偏離健康狀態(tài)下的特征信息,模型對數(shù)據(jù)的重構(gòu)能力逐漸減弱,重構(gòu)樣本與原始樣本之間的相似度逐漸減小,當設(shè)備失效時,二者之間的相似度為0。重構(gòu)樣本與原始樣本之間的相似度差異可以作為健康評估的標準。Bray-Curtis距離是衡量2個物種相似度的指標。向量A=[a1,a2,···,aQ] 與R=[r1,r2,···,rQ] 間的Bray-Curtis距離為
式中:aj,rj為 向量A,R中 的元素;Q為 向量A,R中元素的個數(shù)。
相比于歐氏距離,Bray-Curtis距離能夠克服因物種豐度引起的誤差[10],衡量特征之間是否存在差異及差異大小[11]。Bray-Curtis距離具有將差異程度歸一化的特點,能夠消除量綱對度量的影響。采用Bray-Curtis距離衡量重構(gòu)向量與原始向量之間的相似性,構(gòu)建反映設(shè)備退化情況的HI,可實現(xiàn)旋轉(zhuǎn)機械健康評估。
使用Savitzky-Golay濾波器對得到的Bray-Curtis距離曲線進行平滑,以減小毛刺引起的誤報。將平滑后的曲線歸一化到[0,1]區(qū)間,并將歸一化后的值作為HI。HI越趨近于0,表示重構(gòu)數(shù)據(jù)與原始數(shù)據(jù)的偏差越小,設(shè)備越健康;HI越趨近于1,表示偏差越大,設(shè)備越趨近于失效。
使用XJTU-SY軸承數(shù)據(jù)集[12]來驗證2DLSTMDCAE模型的特征學習能力。該數(shù)據(jù)集記錄了軸承在3種工況下的全壽命周期數(shù)據(jù)。實驗分別在軸承的水平和垂直2個方向安裝加速度傳感器,用來采集其振動數(shù)據(jù),采樣頻率為25.6 kHz,每次采樣32 768個數(shù)據(jù)點,采樣周期為1 min。各工況下軸承參數(shù)見表1。
表1 各工況下軸承參數(shù)Table 1 Bearing parameters under various working conditions
對XJTU-SY軸承數(shù)據(jù)集進行處理,對每個時刻下的數(shù)據(jù)按照等間距采樣的方式取16 384個點,構(gòu)建為1 28×128×2的二通道二維數(shù)組格式。采用窗口長度T=10 、 步長m=1 的滑動窗口構(gòu)建LSTM單元的輸入樣本。
為測試2D-LSTMDCAE模型的泛化能力,采用同一工況數(shù)據(jù)訓練的模型對不同工況下的軸承進行測試。XJTU-SY軸承數(shù)據(jù)集中工況3下軸承的退化時間較長,前4個軸承的故障類型包括軸承所有的故障類型,易于找出軸承健康狀態(tài)下的數(shù)據(jù)。根據(jù)數(shù)據(jù)集描述可知[13],實驗軸承由開始的健康狀態(tài)經(jīng)加速退化實驗發(fā)展到嚴重故障狀態(tài),工況3下前4個軸承的特征曲線在開始時比較平緩,表明系統(tǒng)運行初期軸承的健康狀態(tài)良好,可選用工況3下前4個軸承前10%的數(shù)據(jù)作為訓練集[14-15]。使用工況1和工況2下前3個軸承、工況3下第5個軸承(共7個軸承)的全壽命周期數(shù)據(jù)作為測試集。
采用Adma作為優(yōu)化器優(yōu)化網(wǎng)絡(luò)模型,學習率和batchsize分別設(shè)置為0.01和16,訓練輪次設(shè)置為500。選用Huber損失函數(shù)。
式中:L為損失值;v為 模型輸入;u為模型輸出;d為常量,d=0.5。
Huber損失函數(shù)集成了均方誤差和平均絕對誤差損失函數(shù)的優(yōu)點,當誤差小于0.5時采用平方誤差,當誤差大于0.5時采用線性誤差,能夠減小模型對離群點的敏感程度。采用訓練集對2D-LSTMDCAE模型進行離線訓練,損失曲線如圖5所示??煽闯鰮p失曲線收斂速度較快,在500次迭代后的損失為4.992 2×10-5,表明模型能夠很好地還原健康狀態(tài)下的樣本。
圖5 損失曲線Fig. 5 Loss curve
7個測試軸承的Bray-Curtis距離曲線和濾波后得到的HI曲線如圖6所示??煽闯鯤I在初始階段均接近于0,表明各軸承運行狀況良好,然后開始緩慢上升,最后均逐漸趨近于1,表明軸承都出現(xiàn)嚴重故障,與軸承加速壽命試驗結(jié)果一致。
圖6 測試軸承Bray-Curtis距離與HI曲線Fig. 6 Bray-Curtis distance and HI curves of test bearing
為了評估模型能否更早地發(fā)現(xiàn)早期故障,采用3σ準則獨立計算每個軸承的退化起始閾值,并采用相關(guān)性和單調(diào)性2個指標評價HI。相關(guān)性量化了HI與時間的相關(guān)關(guān)系,單調(diào)性反映了HI的趨勢,2個指標的值越大,表明基于HI的狀態(tài)評估方法性能越好。相關(guān)性C和單調(diào)性M計算公式分別為
式中:F(Y,I)為Y和I之間的協(xié)方差,Y為HI的值,I為構(gòu)建HI時所對應的時間點;σHI和σl分 別為Y和I的標準差;Nd1,Nd2分 別為Y的微分大于0和小于0的個數(shù);T′為 軸承全壽命周期中HI的長度。
為驗證2D-LSTMDCAE模型的有效性和基于HI的狀態(tài)評估方法的性能,選擇經(jīng)典評價指標均方根與所提HI進行對比實驗。為了降低噪聲及采用單路數(shù)據(jù)進行評估對驗證結(jié)果的影響,計算均方根前對原始數(shù)據(jù)進行小波降噪(小波函數(shù)為sym8,分解層數(shù)為5),并對2路信號的均方根取平均值。為評估本文所提樣本構(gòu)建方法的有效性,與無樣本重構(gòu)的LSTMDCAE模型進行比較。為驗證LSTM模塊的有效性,與DCAE進行比較。構(gòu)建2D-LSTMDCAE,LSTMDCAE和DCAE共3種AE模型。各模型結(jié)構(gòu)相同,使用相同的訓練集和測試集進行驗證,且都能夠從原始數(shù)據(jù)中學習特征并重構(gòu)數(shù)據(jù),從而構(gòu)建HI。3種AE模型構(gòu)建的HI、均方根指標及通過3σ準則求出的異常狀態(tài)閾值如圖7所示。可看出在軸承1_1上,2D-LSTMDCAE模型所構(gòu)建的HI在第72 min時超過閾值,LSTMDCAE模型構(gòu)建的HI、DCAE模型構(gòu)建的HI和均方根分別在第76,77,78 min時超出閾值,平均比本文所提方法晚5 min。2D-LSTMDCAE在其他6個測試軸承上的表現(xiàn)類似,較其他3種模型指標都能更早找出軸承初始劣化點,在各軸承上分別平均提前了8,11,2,6,14,2 min,平均提前了約7 min。測試結(jié)果表明本文所提出的樣本構(gòu)建方法及學習數(shù)據(jù)時序特征的HI構(gòu)建方法對軸承的性能退化更敏感,能夠更好地描述設(shè)備的退化過程。
圖7 各模型構(gòu)建的HI對比Fig. 7 Comparison of HI constructed by each model
HI的評價指標見表2??梢?,本文構(gòu)建的HI的相關(guān)性比LSTMDCAE,DCAE模型構(gòu)建的HI和均方根分別高出了0.015,0.031和0.047,單調(diào)性分別高出了0.072,0.084和0.272。
表2 HI的評價指標Table 2 The evaluation index of HI
4種HI的評價指標分析如圖8所示。可看出2D-LSTMDCAE模型構(gòu)建的HI僅在軸承2_1上的單調(diào)性比均方根略低一些,在其他軸承上的2種評價指標均高于均方根。與LSTMDCAE相比,2D-LSTMDCAE模型構(gòu)建的HI在軸承1_3上的2種評價指標、在軸承2_1上的相關(guān)性和在軸承2_3上的單調(diào)性較低。與DCAE相比,2D-LSTMDCAE模型構(gòu)建的HI在各軸承上的評價指標均較高。分析結(jié)果表明,2D-LSTMDCAE模型構(gòu)建的HI能更好地反映軸承的退化情況。
圖8 HI的評價指標分析Fig. 8 Analysis of HI evaluation index
為評估模型性能,分別與基于注意力機制的一維深度可分離卷積模型[16]和深度殘差模型[17]進行對比實驗。考慮到數(shù)據(jù)樣本的無標簽特性,對2種模型結(jié)構(gòu)進行適當調(diào)整,分別構(gòu)建基于注意力機制的一維深度可分離卷積自編碼器(1D-Attention Depthwise Separable Convolution Autoencoder,1D-ADSCAE)模型和深度殘差自編碼器(Deep Residual Autoencoder,DRAE)模型。各模型采用相同的數(shù)據(jù)集進行驗證,都能在一定程度上對輸入樣本進行還原,能夠基于AE的重構(gòu)誤差原理構(gòu)建HI。3種模型構(gòu)建的HI的評價指標見表3。
表3 3種深度學習模型構(gòu)建的HI的評價指標Table 3 Evaluation index of HI constructed by three deep learning models
由表3可看出,2D-LSTMDCAE模型構(gòu)建的HI具有更好的相關(guān)性和單調(diào)性,驗證了采用卷積與長短期單元并行提取特征并采用卷積進行深層特征學習的2D-LSTMDCAE模型性能更優(yōu)。
在實驗室搭建減速器平臺,并以煤礦實際工況運行數(shù)據(jù)為依據(jù)模擬采煤機截割傳動系統(tǒng)運行狀況。實驗平臺包括齒輪減速器、驅(qū)動電動機、磁粉制動器等,如圖9所示。在減速器垂直和水平方向分別布置加速度傳感器,采集運行過程中的振動信號。
圖9 模擬采煤機截割傳動系統(tǒng)的減速器平臺Fig. 9 Reducer platform simulating shearer cutting transmission system
選取實際工況下采煤機運行1個工作周期的負載變化數(shù)據(jù)作為激勵信號,等比輸入磁粉制動器,模擬采煤機截割變負載工況,對減速器進行加速退化實驗。實驗中振動信號采樣頻率為5 kHz,監(jiān)測并記錄減速器垂直和水平方向的振動數(shù)據(jù)。實驗結(jié)束時,振動信號具有明顯幅值波動,波動范圍為正常運行時的3~6倍,并且現(xiàn)場出現(xiàn)明顯噪聲,因此判定減速器完全故障。減速器振動原始信號如圖10所示,實驗中每分鐘采集1組狀態(tài)值,濾除現(xiàn)場干擾,共采集1 430組退化實驗數(shù)據(jù)。
圖10 減速器垂直和水平方向原始振動信號Fig. 10 Vertical and horizontal original vibration signals of the reducer
采用減速器加速退化實驗數(shù)據(jù)進行健康評估實驗,通過本文所提出的樣本構(gòu)建方法構(gòu)建訓練和測試樣本,采用訓練樣本訓練2D-LSTMDCAE模型,將測試樣本輸入模型中進行評估實驗。計算減速器退化數(shù)據(jù)的均方根指標,與2D-LSTMDCAE模型構(gòu)建的HI進行對比,實驗結(jié)果如圖11所示。2種HI的評價指標見表4。
圖11 減速器HI對比Fig. 11 HI Comparison of the reducer
表4 減速器HI的評價指標Table 4 HI evaluation index of the reducer
從圖11可看出,均方根指標在減速器的健康階段波動較大,容易造成誤報,且在第938 min開始出現(xiàn)上升趨勢。2D-LSTMDCAE模型構(gòu)建的HI在減速器的健康階段比較平穩(wěn),在第930 min開始出現(xiàn)逐漸上升趨勢,相比于均方根指標提前了8 min。從表4可看出,2D-LSTMDCAE模型構(gòu)建的HI更優(yōu),表明本文所提方法能夠更好地反映減速器的退化情況。
(1) 2D-LSTMDCAE模型能夠更早地檢測到設(shè)備的早期故障,在測試軸承上相比于LSTMDCAE和DCAE模型構(gòu)建的HI及均方根平均提前了約7 min。
(2) 2D-LSTMDCAE模型構(gòu)建的HI相關(guān)性較均方根提升了0.047,單調(diào)性提高了0.272,與LSTMDCAE和DCAE構(gòu)建的HI相比,相關(guān)性分別提升了0.015和0.031,單調(diào)性分別提升了0.072和0.084。與其他深度學習網(wǎng)絡(luò)模型構(gòu)建的HI對比,2D-LSTMDCAE模型仍具有較大的性能優(yōu)勢。
(3) 在測試減速器上,相比于均方根指標,通過2D-LSTMDCAE模型構(gòu)建的HI能夠提前8 min發(fā)現(xiàn)早期故障,且HI相關(guān)性提高了0.007,單調(diào)性提高了0.211。2組實驗表明2D-LSTMDCAE模型具有良好的泛化性,是一種良好的HI構(gòu)建模型。