第一作者張淑清女,博士,1966年生
郵箱:zhshq-yd@163.com
多重分形近似熵與減法FCM聚類的研究及應(yīng)用
張淑清,李盼,胡永濤,王佳森,姜萬錄
(燕山大學(xué)電氣工程學(xué)院河北省測試計量技術(shù)及儀器重點實驗室, 秦皇島066004)
摘要:提出了一種基于多重分形與近似熵相結(jié)合的信號特征量提取方法,應(yīng)用于齒輪箱的故障信號診斷中。針對齒輪箱的故障信號的復(fù)雜性,先用減法聚類對提取到的信號特征量進(jìn)行處理,得到初始聚類中心,然后再用模糊C 均值聚類(FCM)作進(jìn)一步處理,實現(xiàn)齒輪箱故障的自動診斷和識別。多重分形譜提取的特征量如譜寬,可以表示信號的波動程度,而近似熵可以表示信號的復(fù)雜程度。兩者結(jié)合可以得到更加準(zhǔn)確的齒輪箱故障信號模式。減法聚類可以有效解決FCM容易陷入局部最優(yōu)的問題,還可以提高收斂速度。提取的特征參數(shù)作為聚類分析的數(shù)據(jù),通過計算數(shù)據(jù)點與聚類中心的隸屬度判定所屬類型,實現(xiàn)齒輪箱故障類型聚類以及模式識別。通過風(fēng)力發(fā)電機(jī)齒輪箱故障診斷實驗,證明該方法的可行性和有效性。為齒輪箱故障診斷提供了一種新的有效途徑。
關(guān)鍵詞:多重分形; 近似熵; 減法模糊聚類; 故障診斷
基金項目:國家自然科學(xué)基金(51475405,61077071);河北省自然科學(xué)基金(F2015203413)
收稿日期:2014-01-22修改稿收到日期:2014-09-10
中圖分類號:TS04文獻(xiàn)標(biāo)志碼:A
基金項目:中央高校基本科研業(yè)務(wù)費專項資金資助項目(QN2011141);高等學(xué)校博士學(xué)科點專項科研基金資助項目(20120204120017)
Application of multifractal approximate entropy and subtractive FCM clustering in gearbox fault diagnosis
ZHANGShu-qing,LIPan,HUYong-tao,WANGJia-sen,JIANGWan-lu(Institute of Electrical Engineering, the Key Lab of Measurement Technology and Instrumentation of Hebei Province, Yanshan University, Qinhuangdao 066004, China)
Abstract:A feature extraction method based on multifractal approximate entropy was presented and used in gearbox fault diagnosis. Considering the complexity of gearbox fault data, the subtractive clustering was used to obtain an initial cluster center of characteristics. Then the fuzzy C-means clustering(FCM) was used for further processing to achieve automatic gearbox fault diagnosis and identification. The volatility of a signal was expressed by feature values extracted by multifractal spectrum, such as spectral width, and the complexity of the signal was represented by approximate entropy(ApEn). The combination of the two representations can make the patterns of gearbox faults more accurate. The problem of easily falling into local optimum during the FCM clustering process was effectively solved by applying subtractive fuzzy clustering, which also improves the convergence rate. The characteristic parameters extracted were taken as the data used in clustering analysis. In order to achieve gearbox fault clustering and recognition, the membership grades of data points and cluster center were calculated. To prove the feasibility and effectiveness of the method proposed, fault diagnosis experiments on a wind turbine gearbox were implemented. The study provides a new effective way for gearbox fault diagnosis.
Key words:mutifractal; approximate entropy; subtractive fuzzy clustering; fault diagnosis
齒輪箱作為重要的機(jī)械部件,承載著加減速、 改變傳動方向、分配動力等功能,一旦出現(xiàn)故障,將對整個機(jī)器運行造成嚴(yán)重后果,為保證機(jī)械設(shè)備安全高效運行,齒輪箱故障的診斷與識別是極為重要的[1-2]。齒輪箱故障信號往往呈現(xiàn)出非線性和非平穩(wěn)特性,傳統(tǒng)的振動時域特征值法和頻譜分析法等均未考慮振動信號的非線性因素[3];經(jīng)驗?zāi)B(tài)分解雖能夠自適應(yīng)的處理非平穩(wěn)非線性信號,但是該方法存在諸如過包絡(luò)、欠包絡(luò)、端點效應(yīng)和缺乏統(tǒng)一的篩分停止準(zhǔn)則等問題[4]。這些方法的不足嚴(yán)重影響了齒輪箱故障特征向量提取的效果。
多重分形奇異譜提取間接反映振動信號波動程度的譜寬Δα和能反應(yīng)振動幅值之比的最大最小概率差Δf,齒輪箱故障信號的多標(biāo)度、非平穩(wěn)信號的特點決定了多重分形的故障特征提取方法能夠表征齒輪箱故障信號的內(nèi)在動力學(xué)機(jī)制[5];近似熵(ApEn)作為信號復(fù)雜程度的度量工具可以直接表征振動信號的特征[6]。因此,多重分形譜參數(shù)結(jié)合近似熵,可以有效揭示隱藏在齒輪箱振動信號內(nèi)部的動力學(xué)行為,準(zhǔn)確全面地表達(dá)齒輪箱故障信號復(fù)雜的故障模式。
模糊C均值(FCM)聚類是用隸屬度確定每個數(shù)據(jù)點屬于某個聚類程度的一種聚類算法[7]。該聚類算法以其高效性在工程實際中得到了廣泛應(yīng)用,但該算法對初始聚類中心極其敏感,極易陷入局部最優(yōu)。引入減法聚類能夠有效避免陷入局部最優(yōu),并且提高收斂速度。本文將所提取的三個故障向量作為減法模糊聚類的特征參數(shù),可準(zhǔn)確達(dá)到齒輪箱復(fù)雜故障信號診斷和識別的目的。
1多重分形與ApEn的特征提取法
1.1多重分形特征參數(shù)提取
多重分形適用于非平穩(wěn)信號的內(nèi)在特征信息的精細(xì)刻畫與準(zhǔn)確提取[8]。
將時間序列x(i),i=1,2,…,n,分解為若干個尺寸為ε的小方塊,Si(ε)是第i個小方塊內(nèi)所有信號的幅值之和,那么概率測度可以表示為:
(1)
由概率密度Pi(ε)組成的一系列子集,按Pi(ε)的大小劃分可以滿足如下條件的冪函數(shù)子集:
Pi(ε)∝εα
(2)
式中:α為奇異強度。
若具有相同奇異強度的小方塊的個數(shù)為N(ε),該數(shù)與ε在無標(biāo)度區(qū)域內(nèi)有如下關(guān)系:
N(ε)∝ε-f(α)(ε→0)
(3)
式中:f(α)為α的分布密度函數(shù),即多重分形譜函數(shù),通常為光滑的凸函數(shù)。
不同的權(quán)重因子q表示不同的概率測度Pi在分配函數(shù)χq(ε)中的比例為:
χq(ε)≡∑Pi(ε)q
(4)
在無標(biāo)度區(qū)域內(nèi)存在與χq(ε)的標(biāo)度關(guān)系為:
χq(ε)∝ετ(q)
(5)
(6)
式中:τ(q)為質(zhì)量指數(shù),-∞0時χq(ε)主要反映時序中的大波動狀況;而q<0時χq(ε)主要反映時間序列中的小波動狀況。從τ(q)與q之間的關(guān)系可以確定所給時間序列的多重分形性;若兩者存在非線性關(guān)系,則說明時序具有多重分形性,否則,說明時序具有單一分形特性。
由Legendre變換可以確定多重分形譜如下:
(7)
最后,由多形分形譜提取多重分形參數(shù):
Δα=αmax-αmin
(8)
Δf=f(amin)-f(amax)
(9)
式中:Δα為提取多重分形譜的譜寬。其大小可以反映整個分型結(jié)構(gòu)上概率測度分布的情況,通過該數(shù)據(jù)的大小可以表示分布的不均勻性,也就是可以間接的表示信號的波動程度。Δf為最大最小概率子集分形維數(shù)差,可以反應(yīng)振動信號振動幅值之比。
1.2近似熵算法提取特征參數(shù)
近似熵算法的具體步驟如下[9]:
設(shè)采集到的原始數(shù)據(jù){x(i),i=1,…,n};
(1)將序列{x(i)}按順序組成一組m維矢量X(i):
X(i)=[x(i),…,x(i+m-1)]
(10)
式中:i=1~n-m+1,每一個X(i)是由m個數(shù)據(jù)點構(gòu)成。
(2)定義Nm(i),i=1~n-m+1。其中Nm(i)為d[X(i)X(j)]小于r的數(shù)量,d[X(i)X(j)]表示X(i)和其余X(j)間的距離,r為相似容限,是需要預(yù)先給定的值。
(3)定義φm(r)用來描繪序列中的所有m維矢量彼此接近的平均頻率,
(11)
(4)將維數(shù)m增加1,重復(fù)上面的(1)至(3)步驟可以得到φm+1(r)。
(5)按照理論,此序列的近似熵:
ApEn(m,r,n)=φm(r)-φm+1(r)
(12)
從以上過程可知,近似熵的大小與m,r的大小有關(guān),Pincus指出,通常m=2,r=0.1~0.25SD,SD為原始數(shù)據(jù)x(i)的標(biāo)準(zhǔn)差。
2減法模糊聚類法與模式識別法
模糊C均值聚類算法(FCM),是模糊聚類中比較常用的算法[10]。但該算法對初始聚類中心十分敏感,極易陷入局部最優(yōu)。為了解決這個問題,在使用FCM前先采用減法聚類得到初始聚類中心,不但可以獲得全局最優(yōu)解,還能夠加快聚類速度。
2.1減法聚類算法
減法聚類從全局出發(fā)把全部樣本點列為聚類中心的候選點,是一種快速且獨立的近似聚類算法[11]。
考慮樣本集{xi},i=1,2,…,n;n為樣本個數(shù),具體的算法步驟如下:
首先計算樣本集中每個點xi的密度指標(biāo):
(13)
式中:ra是一個正數(shù),定義了該點的鄰域半徑,一般取ra=0.5。把密度指標(biāo)最大的數(shù)據(jù)點xc1選為第一個聚類中心,對應(yīng)的密度指標(biāo)為Dc1。
然后假定xci為第i次選出的聚類中心,對應(yīng)的密度指標(biāo)為Dci,其余每個點xi的密度指標(biāo)為:
(14)
式中:rb也為一個正數(shù),定義了一個密度指標(biāo)顯著減小的鄰域,一般rb=(1.2~1.5)ra。
重復(fù)以上過程,直至:
(15)
式中:0<δ<1,決定最終產(chǎn)生的初始化聚類中心數(shù)目,一般δ=0.5時可獲得最多的聚類數(shù)目Cmax。
從上述步驟可以看出,減法聚類中心出現(xiàn)的順序是由密度指標(biāo)決定的,密度指標(biāo)越大則出現(xiàn)的越早,也越有可能是合理的初始聚類中心。因此在以聚類數(shù)為c的檢測中,只需以減法聚類產(chǎn)生的前c個聚類中心作為新的初始中心就可以了,而不需要再重新進(jìn)行初始化,從而提高聚類的效率[12]。
2.2模糊C均值聚類算法
給定一個樣本集{xi},i=1,2…,n,n為樣本個數(shù),F(xiàn)CM將該樣本分為c個模糊組,并且計算出每個族的聚類中心,使非相似性指標(biāo)函數(shù)達(dá)到最小值。每個點是通過隸屬度來確定與各組之間的關(guān)系,每個隸屬度的大小在[0,1]的范圍之內(nèi),再經(jīng)過歸一化規(guī)定,一個數(shù)據(jù)屬于各組的隸屬度之和為1[13]。
(16)
式中:?i=1,2,…,n。
FCM的價值函數(shù)可以表示為:
(17)
式中:U為模糊隸屬矩陣;uij為標(biāo)準(zhǔn)化后數(shù)據(jù)集的隸屬度,總和為1,且uij∈(0,1);cj是某一類的聚類中心,dij表示的是第i個數(shù)據(jù)點與第j類聚類中心的歐氏距離,m是一個不小于1的加權(quán)指數(shù)。
為了使J(U,c1,c2,…,cn)函數(shù)達(dá)到最小值,必須滿足如下的條件:
(18)
(19)
由以上兩個必要條件可知,模糊C聚類是一個簡單的運算過程。依據(jù)式(17)計算目標(biāo)函數(shù),如果它相對于上次目標(biāo)函數(shù)值的該變量小于某個確定的閾值ε,則算法停止。
2.3減法模糊聚類算法
(1)初始化聚類參數(shù):鄰域半徑ra、rb,比例參數(shù)δ,F(xiàn)CM聚類數(shù)c,加權(quán)指數(shù)m和閾值ε等。
(2)利用減法聚類得到Cmax(Cmax>c)個聚類中心,從中選前c個作為FCM的初始聚類中心。
(3)再進(jìn)行FCM聚類,得到聚類結(jié)果。
2.4貼近度擇近原則
模糊模式識別大致有兩種方法:最大隸屬度法和貼近度擇近法。前者適用于個體樣本的模式識別,后者適用于群體樣本的模式識別。本文選擇貼近度擇近原則進(jìn)行故障模式識別[14]。
設(shè)A和B是論域W上的兩個模糊子集,定義A和B之間的貼近度為N(A,B)。常用的計算公式有歐式貼近度、海明貼近度和最大最小貼近度,這里采用最為常用的最大最小貼近度法。
設(shè)論域W={w1,w2,…,wn},則最大最小貼近度為:
(20)
式中:∨和∧分別為取最大值和最小值,uA(w)和uB(w)分別為論域W中元素A、B的隸屬度。
給定論域W上的模糊子集A1,A2,…,An及另一模糊子集B,若:
N(A,B)=maxN(A1,B),…,N(An,B)
(21)
則認(rèn)為B與Ai最貼近,B應(yīng)歸為模式Ai,這就是貼近度擇近原則。
本文模糊聚類識別算法就是通過計算數(shù)據(jù)點與聚類中心的隸屬貼近度判定所屬類型,以實現(xiàn)聚類和模式識別,從而達(dá)到對不同故障信號的特征參數(shù)的類別的區(qū)分。
3故障診斷實驗
圖1 齒輪箱3種信號局部圖 Fig.1 Three local signal of gear box
采用多重分形譜對三種狀態(tài)進(jìn)行分析,取q為[-50,50]中所有整數(shù)。圖2為質(zhì)量指數(shù)τ(q)與q的關(guān)系圖。從圖2可知,約在橫坐標(biāo)為0的處有一個明顯的拐點,體現(xiàn)出明顯的非線性,可以說明這三種信號具有多重分形性。
圖3為三種信號的多重分形譜,根據(jù)對多重分形譜的分析可以求得在多重分形分析中的兩個常見的參數(shù),譜寬Δα和最大最小概率差Δf。
根據(jù)上文中所介紹的近似熵算法的具體步驟對三種狀態(tài)信號進(jìn)行近似熵計算,并將其與譜寬Δα和最大最小概率差Δf構(gòu)成聚類分析的特征向量。
圖2 三種信號的τ(q)-q圖Fig.2Relationbetweenτ(q)andqofthethreekindsofsignal圖3 三種狀態(tài)信號的多重分形奇異譜Fig.3Themulti-fractalsingularityspectrumofthethreekindsofsignal
由于本文所提取的是三個特征參數(shù),所以需構(gòu)造一個三維的故障特征向量A:
A=[ai1,aj1,af1]
(22)
式中:ai,aj,af分別表示的是同一個信號的譜寬,最大最小差值,以及近似熵的值。由于不同類別之間的差別不是特別的突出,因此將該矩陣進(jìn)行標(biāo)準(zhǔn)化處理:
(23)
式中:分母表示的是各列相同類型特征量中的最大與最小的差值,分母就是某個特征值相對于最小值的大小。通過標(biāo)準(zhǔn)化計算,可以把特征值的范圍限制在[0,1]區(qū)間之內(nèi)。通過之前對實驗平臺的介紹可以知道故障類型是3類,所以在模糊聚類數(shù)c=3,鄰域半徑ra=0.5,rb=0.6,比例參數(shù)δ=0.5,加權(quán)指數(shù)m=2和閾值ε=0.000 1。按照減法模糊聚類的運算不斷迭代計算,直到滿足收斂條件為止,聚類的結(jié)果見圖4。從圖4可知,聚類曲線呈現(xiàn)出不規(guī)則性,因而能夠完成對不同狀態(tài)、大小和密度的數(shù)據(jù)進(jìn)行聚類。說明了對于由多重分形與近似熵相結(jié)合提取的特征量,用減法模糊聚類可以達(dá)到明顯的聚類效果,可以作為故障模式識別的有效途徑。
圖4 三種狀態(tài)信號的模糊C聚類圖 Fig.4 FCM clustering of the three kinds of signal
在以上聚類分析基礎(chǔ)上,我們對各類故障進(jìn)一步識別,通過計算待測樣本標(biāo)準(zhǔn)化特征向量與故障聚類中心的最大最小貼近度,同時根據(jù)“貼近度擇近原則”達(dá)到識別故障類型的目的。各種故障的聚類中心見表1。
表1 各種故障的聚類中心
已知三種狀態(tài)的聚類中心,現(xiàn)對一種故障類型進(jìn)行識別,待測樣本X=[0.657 8,1.530 7,1.544 7],計算待測樣本特征向量與正常、磨損、斷齒故障三種狀態(tài)聚類中心的最大最小貼近度,結(jié)果如下:
Nc1=0.572 0,Nc2=0.552 4,Nc3=0.963 3
Nc1,Nc2,Nc3分別為待測樣本標(biāo)準(zhǔn)化特征向量與故障聚類中心c1,c2,c3的最大最小貼近度。通過以上的數(shù)據(jù)可以看出,待測數(shù)據(jù)與斷齒聚類中心的貼近度最大,根據(jù)貼近度擇近原則可以判斷該故障信號是一個斷齒信號,理論的判斷結(jié)果與實際相符合。
為了進(jìn)一步驗證該故障診斷方法的有效性,隨即采集正常、磨損、斷齒故障三種狀態(tài)特征向量各2組,計算各組聚類中心的貼近度,理論的結(jié)果應(yīng)該為:1~2組中Nc1大于Nc2和Nc3,3~4組中Nc2大于Nc1和Nc3,5~6組中Nc3大于Nc1和Nc2。依據(jù)貼近度的大小給待測樣本做出判定,實際計算值和診斷結(jié)果見表2。
表2 故障診斷結(jié)果
表2中6組待測數(shù)據(jù)的測試結(jié)果與實際情況相符合,驗證了該方法對齒輪箱故障的有效性。
4結(jié)論
提出多重分形近似熵與減法模糊聚類的齒輪箱故障診斷方法。用多重分形提取到能夠間接表示振動信號特征量的參數(shù):譜寬Δα和最大最小概率差Δf。然后提取該振動信號的近似熵。將這三個參數(shù)作為減法模糊聚類的特征向量,通過計算數(shù)據(jù)點與聚類中心的隸屬度判定故障所屬類型,從而達(dá)到齒輪箱故障類型聚類以及模式識別的目的。對某風(fēng)力發(fā)電實驗平臺的齒輪箱實測信號進(jìn)行了診斷和識別,表明該方法能夠解決故障模式相近的復(fù)雜齒輪箱振動信號的分類問題,為齒輪箱故障診斷提供了一種新的有效途徑。
參考文獻(xiàn)
[1]林近山, 陳前.基于非平穩(wěn)時間序列雙標(biāo)度指數(shù)特征的齒輪箱故障診斷[J].機(jī)械工程學(xué)報, 2012, 48(13): 108-114.
LIN Jin-shan, CHEN Qian. Fault diagnosis of gearboxes based on the double-scaling-exponent characteristic of non-stationary time series [J]. Journal of Mechanical Engineering, 2012, 48(13): 108-114.
[2]唐新安, 謝志明, 王哲,等. 風(fēng)力機(jī)齒輪箱故障診斷[J].噪聲與振動控制, 2007(1): 120-124.
TANG Xin-an, XIE Zhi-ming, WANG Zhe, et al.Fault diagnosis of gearbox for wind turbine [J]. Noise and Vibration Control, 2007(1): 120-124.
[3]祝志慧, 孫云蓮, 李洪. 基于EMD的時頻分析方法的電力故障信號檢測[J].武漢大學(xué)學(xué)報:工學(xué)版, 2007, 40(05): 112-119.
ZHU Zhi-hui, SUN Yun-lian, LI Hong. Power fault detection using empirical mode decomposition [J].Engineering Journal of Wuhan University, 2007, 40(05): 112-119.
[4]Frei M G,Osorio I.Intrinsic time-scale decomposition: time-frequency-energy analysis and real-time filtering of non-stationary signals [J].Proceedings of the Royal Society A, 2007, 463(2078): 321-342.
[5]林近山,陳前.基于多重分形去趨勢波動分析的齒輪箱故障特征提取方法[J].振動與沖擊, 2013, 32(2): 97-101.
LIN Jin-shan, CHEN Qian. Fault feature extraction of gearboxes based on multi-fractal detrended fluctuation analysis[J]. Journal of Vibration and Shock, 2013, 32(2): 97-101.
[6]胥永剛, 李凌均, 何正嘉. 近似熵及其在機(jī)械設(shè)備故障診斷中的應(yīng)用[J].信息與控制, 2002, 31(06): 543-551.
XU Yong-gang,LI Ling-jun, HE Zheng-jia. Approximate entropy and its applications in mechanical fault diagnosis[J]. Information and Control, 2002, 31(06): 543-551.
[7]Bezdek J C.Pattern recognition with fuzzy objective function slgorithms[M].New York:Plenum Press,1981.
[8]王祖林,周蔭清. 多重分形譜及其計算[J]. 北京航空航天大學(xué)學(xué)報, 2000,26(3): 256-258.
Wan Zu-lin, Zhou Yin-qing. Multifractal spectrum and calculation[J]. Journal of Beijing University of Aeronautics and Astronautics, 2000, 26(3): 256-258.
[9]戴桂平.基于EMD近似熵和DAGSVM的機(jī)械故障診斷[J].計量學(xué)報, 2010, 31(5): 467-471.
DAI Gui-ping. Mechanical fault intelligent diagnosis based on EMD-Approximate entropy and DAGSVM[J]. Acta Metrologica Sinica, 2010, 31(5): 467-471.
[10]Abásolo D, Hornero R, Espino P, et al.Analysis of regularity in the EEG background activity of Alzheimer’s disease patients with Approximate Entropy[J].Clinical Neurophysiology, 2005, (116): 1826-1834.
[11]肖春景, 張敏. 基于減法聚類與模糊c-均值的模糊聚類的研究[J]. 計算機(jī)工程, 2005,31(7): 135-137.
XIAO Chun-jing, ZHANG Min. Research on fuzzy clustering based on subtractive clustering and fuzzy c-means[J]. Computer Engineering, 2005, 31(7): 135-137.
[12]蔡威, 程俊杰. 基于減法聚類的GK模糊聚類研究[J]. 蘭州交通大學(xué)學(xué)報, 2011, 30(6): 50-54.
CAI Wei, CHENG Jun-jie. Research on GK fuzzy clustering algorithm based on subtractive clustering[J]. Journal of Lanzhou Jiaotong University, 2011, 30(6): 50-54.
[13]徐超, 張培林, 任國全,等. 基于改進(jìn)半監(jiān)督模糊C均值聚類的發(fā)動機(jī)磨損故障診斷[J].機(jī)械工程學(xué)報, 2011, 47(17):55-60.
XU Chao, ZHANG Pei-lin, REN Guo-quan, et al. Engine wear fault diagnosis based on improved semi-supervised fuzzy c-means clustering[J]. Journal of Mechanical Engineering, 2011, 47(17): 55-60.
[14]張淑清, 張金敏, 趙玉春. 基于混沌和模糊聚類的機(jī)械故障自動識別[J].機(jī)械工程學(xué)報, 2011, 47(19):81-85.
ZHANG Shu-qing, ZHANG Jin-min, ZHAO Yu-chun. Automatic diagnosis techniques of machinery fault based on chaos and fuzzy clustering analysis[J]. Journal of Mechanical Engineering, 2011, 47(19): 81-85.