王 冰, 胡 雄, 李洪儒, 孫德建
(1.上海海事大學 物流工程學院,上海 201306;2.陸軍工程大學石家莊校區(qū) 導彈工程系,石家莊 050003)
在機械設備維修理論中,基于狀態(tài)的維修(CBM)能夠以設備實時監(jiān)測信息為基礎,結合設備的結構與動力學特性,識別其運行狀態(tài),并對設備故障的演化趨勢進行預測。從而彌補傳統(tǒng)的事后維修與計劃維修在維修效率上的不足[1]。CBM主要包括退化特征提取、退化狀態(tài)識別、剩余壽命預測等關鍵技術[2-3]。
滾動軸承是機械設備中的重要的旋轉支撐部件,旋轉機械中約有30%的故障由滾動軸承引起。當前很多研究工作集中在軸承不同故障類型的特征提取和模式分類中[4-6],而從CBM理論出發(fā),分析滾動軸承性能退化規(guī)律,圍繞退化特征提取和剩余壽命預測所開展的研究則相對較少。滾動軸承在性能退化過程中通常存在一個由正常到失效的發(fā)展過程,及時準確地識別其退化狀態(tài),能夠合理地指導設備的檢查和替換,從而提升整個機械設備的運行可靠性。對滾動軸承進行退化狀態(tài)識別需要解決兩個關鍵問題:①提取有效的退化特征;②建立科學的退化狀態(tài)識別模型。
退化特征提取是實現(xiàn)退化狀態(tài)評估的基礎,主要目的是提取能夠有效表征性能退化規(guī)律的特征參數(shù)。傳統(tǒng)的退化特征主要基于時域、頻域以及時頻域分析方法提出。近年來,熵、分形等理論被逐漸應用在機械設備的退化特征提取中,為非線性信號演化規(guī)律的刻畫提供了一條有效的途徑。典型的退化特征指標包括提升小波樣本熵[7]、層次熵[8]、LCD譜熵[9]、多尺度熵[10]、排列熵[11]等。在該類研究中,基本尺度熵[12]的提出為非線性信號的分析提供了一種全新的思路?;境叨褥匾苑杽恿W理論為基礎,對心跳間隔序列進行幅值上的符號化,并計算熵測度。具有簡單、快速和較強的抗干擾能力,可以有效地分析短時、非平穩(wěn)、有噪聲干擾的數(shù)據(jù),該算法起源并有效地應用在心臟電信號分析中[13-15],在機械設備故障診斷領域也有一些成功應用。例如鐘先友等[16]提出一種改進的本征時間尺度分解方法(IITD)和基本尺度熵的齒輪故障診斷方法。首先采用IITD方法分解齒輪振動信號,計算前四個分量的基本尺度熵參數(shù),以此作為故障特征向量;許凡等[17]提出了一種基于局部均值分解(LMD)與基本尺度熵的相鄰傳播(AP)聚類診斷方法,提取基于LMD與基本尺度熵的故障特征向量,并采用AP聚類算法實現(xiàn)滾動軸承的故障類型聚類。與此思路不同,本文將基本尺度熵理論應用在性能退化特征提取中,分析軸承性能退化過程中的基本尺度熵演化規(guī)律,從而為不同性能退化階段的識別奠定基礎。
性能退化狀態(tài)的識別本質上是模式識別問題。機械設別的性能退化過程具有隨機性、模糊性的特點,表現(xiàn)為退化過程不可預知,且退化階段的數(shù)目與邊界難以確定。聚類分析方法能夠從退化特征數(shù)據(jù)的特點出發(fā),挖掘數(shù)據(jù)之間的相似性關系,從而無監(jiān)督地將數(shù)據(jù)劃分到不同的類別中,是解決退化狀態(tài)識別問題的有效途徑。典型的聚類方法包括K均值聚類(K-means)、模糊c-均值聚類(FCM,fuzzy center means)、GK(Gustafaon-Kessel)聚類方法等。Wang等[18]采用數(shù)學形態(tài)分形維數(shù)作為軸承的性能退化特征,采用FCM算法實現(xiàn)了退化特征的自動聚類;Rai等[19]提出了基于EMD分解和K-means的退化狀態(tài)聚類方法;黃友朋等[20]采用EEMD排列熵作為軸承的故障特征,并應用主成分分析和GK聚類方法實現(xiàn)了滾動軸承不同故障的自動聚類。
在無監(jiān)督聚類算法中,GG聚類算法(Gath-Geva)對FCM和GK聚類算法進行了改進,引入了基于模糊最大似然估計的距離范數(shù),從而能夠反映不同形狀和方向的數(shù)據(jù)類別,聚類的精度和準確性更高。張立國等[21]應用本征時間尺度分解模糊熵和GG模糊聚類方法對滾動軸承進行故障診斷,取得了較FCM、GK算法更優(yōu)的聚類效果。Li等[22]提出了基于VMD分解和GG聚類的退化狀態(tài)評估方法,采用GG聚類算法對時間序列進行分割。Yu等[23]首先采用EEMD和SVD方法提取滾動軸承的故障特征,并結合GG聚類方法,對不同的故障狀態(tài)進行聚類。在關于GG聚類算法的研究中,研究熱點主要集中在故障模式的診斷中,對性能退化狀態(tài)的聚類則相對較少,并且并未考慮性能退化狀態(tài)中的時間連續(xù)性約束,算法的針對性還需要進一步研究。
綜上,本文對分別采用基本尺度熵和GG聚類算法解決滾動軸承退化狀態(tài)識別中的兩個關鍵問題。分析軸承性能退化過程中的基本尺度熵演化規(guī)律,并建立融入時間約束的退化特征向量,并采用GG聚類算法實現(xiàn)不同退化狀態(tài)的識別。采用IEEE PHM 2012的軸承全壽命數(shù)據(jù)集進行實例分析,對比驗證本方法的有效性和優(yōu)越性。
一維信號的基本尺度熵計算思路如下:首先對數(shù)據(jù)進行從1維到m維的矢量轉換,然后根據(jù)基本尺度參數(shù)a將m維矢量轉換為相應的符號序列,最后由符號序列統(tǒng)計出相關概率并計算基本尺度熵值。具體計算過程如下。
假設u為長度N的一維時間序列,首先將其u轉換成為m維矢量X,轉換方式如下
X(i)=[u(i),u(i+L),…,u(i+(m-1)L)]
(1)
式中:m為矢量維數(shù),L為延遲因子,i+(m-1)L≤N。當L=1時,u可以轉化為N-m+1個m維矢量。之后,對每個m維矢量進行符號化,將其轉換為m為矢量符號序列S
Si(Xi)={s(i),s(i+L),…,s(i+(m-1)L)}
(2)
式中:s∈A:A=0,1,2,3,轉換過程如下[24]
(3)
(4)
式中:a為基本尺度參數(shù),在實際應用中需要合適地選擇。取值過大會丟失信號中的細節(jié)信息,無法反映信號的動態(tài)變化信息,取值過小則會受噪聲影響。
最后,統(tǒng)計m維矢量符號序列S的分布概率P(Si)。由于包括四種符號,所以m維矢量符號序列共有4m種不同組合狀態(tài)π,因此,整個N-m+1個m維矢量中所占的概率為
(5)
式中,1≤t≤N-m+1,#表示個數(shù)。
計算序列u的歸一化的基本尺度熵如下
(6)
基本尺度熵描述了時間序列中m個取值所包含的波動信息,即信息的復雜度?;境叨褥刂翟酱?,則表明序列維矢量的波動模式越復雜,序列的復雜性越高;反之,熵值越小,序列的復雜性越低[25]。
一般情況下,延遲因子默認為L=1;矢量維數(shù)m可以取3~7之間的任意整數(shù),序列長度N應該大于4m。
1.2.1 GG模糊聚類
GG模糊聚類對FCM和GK聚類算法進行了改進,引入了基于模糊最大似然估計的距離測度,算法過程如下。
假設聚類樣本集合為X={x1,x2,…,xN},集合內的元素xk(k=1,2,…N)具有d個特征指標,即xk{xk1,xk2,…,xkd},對X聚類的目標是將其劃分為c類。假設每個分類的聚類中心向量為V={v1,v2,…,vc},假設隸屬度矩陣為U=[μik]c×N,其中元素μik∈[0,1]表示第k個樣本對第i類的隸屬度(i=1,2,…,c)。GG模糊聚類通過迭代(U,V),使目標函數(shù)Jm取得最小值。
(7)
式中:M為加權指數(shù),M>1,M越大,各個類別之間的重疊越多,一般取2。迭代調整的步驟如下[26]
(1) 計算聚類中心
(8)
(9)
其中Ai代表第i個聚類的協(xié)方差矩陣。
(2) 更新分類矩陣
(10)
其中,i=1,2,…c;k=1,2,…N.
1.2.2 聚類效果評價
為了對聚類算法的效果進行評價,一般采用分類系數(shù)和平均模糊熵兩個指標。此外,為了評價性能退化狀態(tài)識別中分類樣本在時間特征上的連續(xù)性,本文提出時間一致度指標。三種指標的定義如下。
(1) 分類系數(shù)CC(Classification Coefficient)。該指標定義為隸屬度的方均值,計算方法如下。其中uik代表隸屬度數(shù)值,分類系數(shù)越接近1,聚類效果越好。
(11)
(2) 平均模糊熵AFE(Average Fuzzy Entropy)。該指標定義為隸屬度分布所蘊含的信息熵大小,計算方法如下。其中uik代表隸屬度數(shù)值,平均模糊熵越接近0,聚類效果越好。
(12)
(3) 時間一致度TC(Time Consistency)。該指標定義為樣本在時間特征上的序列偏離度。計算方法如下:
首先定義序列偏離度,該參數(shù)定義為序列當前排列與順序排列之差的和,用于表征序列的亂序程度。例如序列[1,2,3,5]的序列偏離度為1,序列[6,7,8,9]的序列偏離度為0。
假設目標樣本集合X={x1,x2,…,xN}被劃分為c類。隸屬于每個類的樣本集合為S={s1,s2,…,sc}, 其中bi(i=1,2,…,c)代表所有隸屬于si(i=1,2,…,c)的樣本在時間特征維度的序列偏離度。時間一致度指標定義為所有類別序列偏離度的算數(shù)平均值,計算如下。該指標越接近0,代表序列的時間聚集度越高,聚類效果越好。
(13)
研究表明,滾動軸承在性能退化過程中一般會經(jīng)歷從正常到失效等多個退化狀態(tài)[27]。為了分析軸承在全壽命實驗中的性能退化規(guī)律,識別不同階段的軸承性能退化狀態(tài),本文將基本尺度熵與GG聚類方法相結合,提出一種基于BSE-GG聚類的退化狀態(tài)識別方法。該方法的基本流程,如圖1所示。
(1) 軸承全壽命數(shù)據(jù)集獲取與劃分。
采用在線監(jiān)測的方式獲取滾動軸承從良好到失效的全壽命振動信號??紤]到全壽命實驗時間長且數(shù)據(jù)量大,一般采用間隔采樣的方式,將每組采樣所獲取的振動數(shù)據(jù)依次記作Group1、Group2,直到GroupN軸承失效。
(2) 退化特征提取
以組別為單位對振動信號進行退化特征提取,計算每組數(shù)據(jù)的基本尺度熵和有效值RMS,以此作為描述軸承性能退化規(guī)律的特征指標。與此同時,考慮到同一性能退化狀態(tài)在時間上的連續(xù)性,將時間t作為退化特征指標描述該過程的時間規(guī)律。進而構建三維特征指標[BSE; RMS;t]。
圖1 基于BSE-GG聚類的退化狀態(tài)識別流程
(3) 退化狀態(tài)識別
采用GG聚類算法對退化特征向量進行聚類。從而識別軸承性能退化的不同狀態(tài)。
(4) 識別效果評價
分別采用分類系數(shù)、平均模糊熵、時間一致度對GG聚類算法的聚類效果進行評價,并對比其他同類算法的效果。
本文選用的軸承全壽命數(shù)據(jù)集來自IEEE PHM2012所提供的數(shù)據(jù)集[28]。試驗在FEMTO-ST研究中心的PRONOSTIA試驗臺進行。通過運行在不同負載條件下的加速退化試驗,獲取多組從良好到失效的軸承全壽命振動信號。試驗臺的實景圖,如圖2所示。
在加速退化試驗中,分別采集轉子輸出軸垂直方向(vertical axis)與軸向(horizontal axis)的振動信號,振動傳感器選用DYTRAN超小型加速度傳感器3035B,振動傳感器布置和選型,如圖3所示。
本文選取三組全壽命試驗數(shù)據(jù)集的V向振動數(shù)據(jù)進行分析,系統(tǒng)采樣頻率為25.6 kHz,每組的采樣時間為0.1 s,組間采樣間隔為10 s。數(shù)據(jù)集基本描述見表1。
圖2 加速試驗臺實景圖
圖3 振動傳感器布置與選型
忽略三組數(shù)據(jù)集的采樣間隔,從信號的時域波形分析性能退化過程。如圖4所示。可以看出,三個數(shù)據(jù)集在壽命的前期和中期均保持相對穩(wěn)定的狀態(tài),后期振幅逐漸增大,直至軸承失效。相對而言,數(shù)據(jù)集Dataset 3在壽命中期存在明顯的沖擊成分。
提取三個數(shù)據(jù)集中每組振動信號的退化特征。依次計算其基本尺度熵和有效值。在基本尺度熵的計算過程中,通過多次對比發(fā)現(xiàn),改變m值從3到7,ɑ值從0.1到0.6,結果沒有明顯區(qū)別,因此取m=4,ɑ=0.2。三個數(shù)據(jù)集的基本尺度熵和有效值計算結果分別如圖5~圖7所示。
以圖5為例進行分析。在軸承的性能退化過程中,基本尺度熵在整體上呈現(xiàn)單調上升的趨勢,并表現(xiàn)出一定的階段性特點,反映出軸承性能退化的不同階段。在第55組采樣點之前,BSE保持相對穩(wěn)定的狀態(tài),取值保持在0.55左右。從第55到第490組采樣點之間,BSE呈現(xiàn)出一個緩慢的上升過程,BSE取值從0.6緩慢上升至0.72左右。在第490組采樣點之后,BSE出現(xiàn)一次明顯的階躍上升過程,取值保持在0.75左右,此時認定軸承已失效。與之相對應,有效值在整體上上升且階段性特點明顯,但在第55組采樣點左右存在一個明顯的下降趨勢,分析認為該階段可能處于軸承的磨合期,導致BSE和有效值表現(xiàn)出不同的規(guī)律性。對比圖6和圖7中其他兩個數(shù)據(jù)集的分析結果,可以得到同樣的結論。綜上,基本尺度熵在軸承性能退化過程中體現(xiàn)出整體單調性的特性,并且對軸承退化狀態(tài)的變化十分敏感,能夠較好地反映軸承性能退化的規(guī)律性。因此,選擇基本尺度熵作為性能退化特征指標是有效的。
(a) Dataset1
(b) Dataset2
(c) Dataset3
以數(shù)據(jù)集Dataset1為例進行退化狀態(tài)識別分析。經(jīng)過退化特征提取,構建該數(shù)據(jù)集515×3的退化特征向量集,歸一化之后,采用GG聚類方法對性能退化狀態(tài)進行聚類。根據(jù)上節(jié)的初步分析,設置聚類組數(shù)c=3,加權指數(shù)M=2。根據(jù)算法迭代效果,經(jīng)過多次試驗對比,取容差參數(shù)為ε=0.000 1。迭代更新退化狀態(tài)的聚類中心,直至算法收斂。選用FCM和GK聚類算法進行對比分析,三種算法在BSE和RMS二維坐標上的等高線聚類效果如圖8所示,其中“O”為聚類中心??梢钥闯?,GG聚類的樣本重疊程度最低,等高線為任意形狀,而FCM聚類和GK聚類的等高線分別接近于圓形和橢圓形。這說明GG聚類算法中基于模糊最大似然估計的距離測度能夠更靈活地劃分聚類結構,對數(shù)據(jù)源的分布要求最低。而FCM聚類和GK聚類算法均以歐式距離為基礎建立距離測度,能夠更好的適應近似圓形分布的聚類結構,對數(shù)據(jù)源的分布要求較高。
(a) 基本尺度熵
(b) 有效值
(a) 基本尺度熵
(b) 有效值
(a) 基本尺度熵
(b) 有效值
(a) GG聚類算法等高線
(b) FCM聚類算法等高線
(c) GK聚類算法等高線
圖9~圖11描述了三種算法對Dataset1的三維和二維聚類效果??梢钥闯?,三種聚類算法均將數(shù)據(jù)集識別為三類,根據(jù)前文的分析,將其分別定義為Condition1(磨合期)、Condition2(穩(wěn)定期)、Condition3(失效期)。定性對比分析,GG聚類算法能夠較好地識別特征曲線的主趨勢和突變點,符合對退化狀態(tài)的直觀分析。而FCM算法則將大部分穩(wěn)定期的數(shù)據(jù)識別為失效期,GK算法則將磨合期的時間估計的更長。
(a) 三維聚類效果
(b) 二維聚類效果
(a) 三維聚類效果
(b) 二維聚類效果
(a) 三維聚類效果
(b) 二維聚類效果
表2定量分析了三種算法對Dataset1的聚類效果。GG聚類算法的分類系數(shù)取值最高,平均模糊熵和時間一致度最低,聚類效果最優(yōu)。相比而言,F(xiàn)CM聚類算法的聚類效果最差,但GK聚類結果的時間一致度最差。
采用GG聚類算法對數(shù)據(jù)集Dataset2和Dataset3進行分析,為了分析時間特征向量對于聚類效果的影響,分別采用三維特征向量[BSE;RMS;t]和二維特征向量[BSE;RMS]進行聚類分析,三種算法的定量聚類結果如表3所示。由于聚類結果相近,為了清晰地分析其細節(jié),均以基本尺度熵特征上的聚類效果為例進行對比分析,如圖12和圖13所示??梢钥闯?,兩種方法的分類系數(shù)和平均模糊熵指標相近,但三維特征向量的選取能夠明顯的提高聚類結果的時間一致度。對于Dataset3的識別效果對比更為明顯,如圖13(a)所示,Condition3的幾個數(shù)據(jù)點零星地分布在Condition2的連續(xù)時間尺度內,使得時間一致度達到204,使得序列的一致性最差。這說明,時間特征參數(shù)的約束能夠
(a) 二維特征[RMS;BSE]
(b) 三維特征[RMS;BSE;t]
(a) 二維特征[RMS;BSE]
(b) 三維特征[RMS;BSE;t]
在GG聚類過程中考慮數(shù)據(jù)點之間的時間維度距離,從而提高類別內部的時間聚集度,聚類效果更優(yōu),滿足對性能退化狀態(tài)識別的要求,從而驗證了該方法的有效性和優(yōu)越性。
本文提出一種基于基本尺度熵與GG聚類的退化狀態(tài)識別方法,通過對實例數(shù)據(jù)的分析驗證,得到以下結論:
(1) 基本尺度熵能夠反映信號在基本尺度內波動模式的復雜程度,從而刻畫軸承在性能退化過程中的復雜性演化規(guī)律。并且呈現(xiàn)出主趨勢單調性、變化敏感性的特點,是一種有效的性能退化特征提取方法。
(2) GG聚類方法能夠對任意形狀的數(shù)據(jù)進行聚類,將時間約束加入到特征向量中,能夠在保持聚類精度的同時,提高類別內部的時間聚集度。所提出的時間一致度參數(shù)較好地反映出了聚類的時間聚集效果。
(3) 退化狀態(tài)數(shù)目的不確定性一直是該領域的研究難點。文中通過先驗知識對GG聚類算法的參數(shù)c進行設置,取得了與直觀分析相一致的結果。下一步有必要深入退化狀態(tài)數(shù)目的智能選取方法。