蔣玲莉 莫志軍 陳安華 李學(xué)軍
1.湖南科技大學(xué)機(jī)械設(shè)備健康維護(hù)湖南省重點(diǎn)實(shí)驗(yàn)室,湘潭,4112012.蘇州東陵振動(dòng)試驗(yàn)儀器有限公司,蘇州,215163
?
一種聚類優(yōu)化融合故障診斷方法及其應(yīng)用
蔣玲莉1,2莫志軍1陳安華1李學(xué)軍1
1.湖南科技大學(xué)機(jī)械設(shè)備健康維護(hù)湖南省重點(diǎn)實(shí)驗(yàn)室,湘潭,4112012.蘇州東陵振動(dòng)試驗(yàn)儀器有限公司,蘇州,215163
針對(duì)單一聚類診斷方法難以準(zhǔn)確、全面識(shí)別不同故障狀態(tài)的問(wèn)題,提出了一種聚類優(yōu)化融合故障診斷方法。分別利用社團(tuán)聚類、K-均值聚類及粒子群聚類三種方法對(duì)故障進(jìn)行識(shí)別,得出三種聚類方法對(duì)應(yīng)的故障識(shí)別準(zhǔn)確率,在此基礎(chǔ)上構(gòu)建初始權(quán)值矩陣,并通過(guò)遺傳算法對(duì)初始判斷矩陣與三種聚類方法進(jìn)行優(yōu)化,得到最優(yōu)權(quán)值矩陣與優(yōu)化的聚類模型,用于融合診斷。軸承故障診斷實(shí)例結(jié)果表明,該聚類融合診斷方法能夠有效提高故障識(shí)別準(zhǔn)確率。
聚類分析;權(quán)值矩陣;融合診斷;遺傳算法
聚類分析方法被用作描述數(shù)據(jù)、衡量不同數(shù)據(jù)源間的相似性、將數(shù)據(jù)源劃分為各類集合[1-2],被廣泛應(yīng)用于故障模式識(shí)別[3-4]。大部分故障聚類診斷方法通過(guò)描述故障特征間聯(lián)系緊密程度的聚類變量來(lái)實(shí)現(xiàn)故障模式識(shí)別,聚類變量主要存在兩種方式:一是采用描述故障特征之間的接近程度的指標(biāo),例如“距離”,“距離”越小的變量越具有相似性,傳統(tǒng)的故障診斷聚類方法如K-均值聚類[6]、粒子群聚類[7]、灰色聚類[8]等的測(cè)量方式就歸于此類;二是采用表示故障特征之間相似程度的指標(biāo),例如“相關(guān)系數(shù)”,“相關(guān)系數(shù)”越大的故障特征越具有相似性,社團(tuán)聚類中的模塊度就是典型的“相關(guān)系數(shù)”[5],不僅可以表示單個(gè)樣本特征模塊之間的相似性,而且能夠描繪出大規(guī)模模塊之間的相似程度。各種聚類診斷方法各有優(yōu)劣,實(shí)際應(yīng)用中各有適用性,如K-均值聚類需知故障類別等先驗(yàn)知識(shí),粒子群聚類容易陷入局部最優(yōu),社團(tuán)聚類雖無(wú)需故障類別數(shù)等先驗(yàn)知識(shí),卻容易多分類或少分類而導(dǎo)致誤判??偠灾瑔我痪垲愒\斷方法通用性差,不具備全面的、良好的識(shí)別所有故障狀態(tài)的能力。對(duì)聚類方法進(jìn)行融合可提高故障診斷適用性,保證診斷精度?;诖?,本文提出了一種聚類優(yōu)化融合故障診斷方法,分別利用社團(tuán)聚類、K-均值聚類及粒子群聚類三種方法進(jìn)行故障識(shí)別,在此基礎(chǔ)上構(gòu)建初始權(quán)值矩陣,并通過(guò)遺傳算法對(duì)初始判斷矩陣及三種聚類方法進(jìn)行優(yōu)化,得到最優(yōu)權(quán)值矩陣與優(yōu)化的聚類模型,進(jìn)行融合診斷。最后以軸承故障診斷實(shí)例驗(yàn)證了融合診斷的優(yōu)越性。
1.1聚類優(yōu)化融合診斷模型
融合診斷方法主要分為串行診斷融合與并行診斷融合,由于單一診斷方法的排列順序?qū)Υ腥诤显\斷的診斷結(jié)果影響過(guò)大,因而在本文中選取并行診斷融合。聚類優(yōu)化融合的流程框圖見(jiàn)圖1。
圖1 融合聚類診斷流程圖
聚類優(yōu)化融合的步驟如下:
(1)故障信號(hào)集包含m類故障,共計(jì)b個(gè)故障樣本,m類故障分別用G=(G1,G2,…,Gm)來(lái)表示,提取故障信號(hào)的N維特征向量,構(gòu)成b×N特征樣本矩陣Q,矩陣Q的每一行是一個(gè)故障樣本特征向量。本文以經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)所得各階能量值為特征向量[9]。
(2)采用選定的K種方法分別對(duì)矩陣Q進(jìn)行聚類診斷,得到K種方法的診斷結(jié)果,矢量Pk=(P1k,P2k, …,Pmk)T表示第k(k=1,2,…,K)類方法對(duì)第m類故障的識(shí)別正確率,矢量R=(Rk1,Rk2,…,Rkm)表示第k類方法對(duì)樣本Q(j)的判定結(jié)果(j=1,2,…,b),Rki為第k種診斷方法對(duì)應(yīng)Gi類故障的診斷結(jié)果(i=1,2, …,m),且有
本文分別用社團(tuán)聚類、K-均值聚類及粒子群聚類三種方法進(jìn)行聚類診斷。
(3)對(duì)矢量P進(jìn)行預(yù)加權(quán)調(diào)整,得到初始權(quán)值矩陣W:
(1)
(2)
其中,Wik表示第k種方法對(duì)Gi類故障判定時(shí)所占權(quán)值。
(4)由矢量R得到K種聚類診斷方法對(duì)所有單個(gè)故障樣本Q(j)的初始判定矩陣R(j):
(3)
(5)用遺傳算法優(yōu)化融合權(quán)值矩陣,迭代結(jié)束后根據(jù)適應(yīng)度函數(shù)得到優(yōu)化后的權(quán)值矩陣W1;遺傳算法在優(yōu)化權(quán)值矩陣的同時(shí),對(duì)三種聚類方法的錯(cuò)誤診斷予以修正,優(yōu)化聚類模型。
(6)故障樣本Q(j)的最終診斷結(jié)果為Val(j),則有
Vj=(V1,V2,…,Vm)=diag(W1R(j))
(4)
Vjmax=max(V1,V2,…,Vm)
(5)
當(dāng)Vi=Vjmax時(shí),取Val(j)=i,即判定故障樣本Q(j)屬于Gi類故障。
1.2基于遺傳算法的融合權(quán)值矩陣優(yōu)化
從融合診斷模型中可以看出,權(quán)值矩陣W在很大程度上決定了最終診斷正確率,在本文中,采用遺傳算法[10]對(duì)權(quán)值矩陣W進(jìn)行優(yōu)化。
本文中遺傳算法的應(yīng)用步驟如下:
(1)將初始權(quán)值矩陣W的權(quán)值因子作為初始種群個(gè)體進(jìn)行編碼。隨機(jī)產(chǎn)生初始種群,個(gè)體數(shù)目一定,每個(gè)個(gè)體表示染色體的基因編碼,由于二進(jìn)制編碼方法的編碼、解碼操作簡(jiǎn)單易行,且便于實(shí)現(xiàn)交叉、變異等遺傳操作,因而在本文中選用二進(jìn)制編碼方法對(duì)融合權(quán)值矩陣進(jìn)行編碼,并設(shè)定好求解精度。圖2所示為本文中權(quán)值矩陣串聯(lián)編碼組合而成的染色體。
圖2 融合權(quán)值矩陣串聯(lián)編碼組合后的染色體
(2)對(duì)個(gè)體適應(yīng)度函數(shù)值進(jìn)行計(jì)算。適應(yīng)度函數(shù)在遺傳算法中不僅表明了函數(shù)解的優(yōu)劣,而且決定了個(gè)體的進(jìn)化方向,當(dāng)適應(yīng)度函數(shù)增大到收斂時(shí),訓(xùn)練樣本的診斷正確率相應(yīng)收斂到最大值。本文定義適應(yīng)度函數(shù)Fit(Wc)[11]如下:
(6)
(7)
(8)
其中,Wc為每一次迭代過(guò)程中的權(quán)值矩陣輸入值,當(dāng)訓(xùn)練樣本故障聚類診斷正確時(shí),函數(shù)G(Wc)取值為1;反之,函數(shù)G(Wc)在0~1范圍內(nèi)取值,b1為訓(xùn)練樣本總數(shù)。
每一次迭代過(guò)程中,首先計(jì)算出所有個(gè)體的適應(yīng)度函數(shù)值,具體計(jì)算過(guò)程是以個(gè)體染色體解碼后得到的權(quán)值矩陣Wc作為輸入,按照式(4)、式(5)對(duì)所有訓(xùn)練樣本依次進(jìn)行診斷判定,再代入式(6)、式(7)求得個(gè)體的適應(yīng)度函數(shù)值,其值越大,復(fù)制到下一代的概率越高,根據(jù)遺傳算法的輪盤(pán)選擇機(jī)制獲取最優(yōu)遺傳個(gè)體,并判斷最優(yōu)個(gè)體是否符合優(yōu)化準(zhǔn)則,若符合,輸出自家個(gè)體代表的最優(yōu)解,并結(jié)束計(jì)算,否則繼續(xù)進(jìn)行步驟(3)。
(3)對(duì)權(quán)值矩陣進(jìn)行優(yōu)化。權(quán)值矩陣的優(yōu)化具體體現(xiàn)為種群個(gè)體適應(yīng)度函數(shù)值的提高,依據(jù)種群中個(gè)體適應(yīng)度函數(shù)選擇復(fù)制個(gè)體,適應(yīng)度高的個(gè)體選擇復(fù)制的概率高,適應(yīng)度低的個(gè)體則可能被淘汰;對(duì)當(dāng)次循環(huán)中最優(yōu)個(gè)體返回的染色體進(jìn)行解碼,即可得到當(dāng)次循環(huán)優(yōu)化后的權(quán)值矩陣。
(4)交叉生成新個(gè)體。對(duì)于步驟(3)中適應(yīng)度值低的個(gè)體,按照一定的交叉概率與交叉方法生成新的個(gè)體并添加到種群中,進(jìn)行下一輪迭代;其中交叉方法選定為單點(diǎn)交叉,如圖3所示。
圖3單點(diǎn)交叉
圖3單點(diǎn)交叉(5)變異生成新個(gè)體。對(duì)于步驟(3)中適應(yīng)度值低的個(gè)體,按照一定的變異概率與變異方法,生成新的個(gè)體添加到種群中,在種群個(gè)體數(shù)保持不變的情況下進(jìn)行下一輪迭代,變異方法如圖4所示。
圖4 變異
(6)迭代求取最優(yōu)權(quán)值矩陣。由交叉和變異產(chǎn)生新一代的種群,返回步驟(2),進(jìn)行下一輪迭代;通過(guò)交叉操作和變異操作,調(diào)整適應(yīng)度值低的個(gè)體權(quán)值矩陣編碼,當(dāng)訓(xùn)練樣本故障分類判定錯(cuò)誤時(shí),在下一輪迭代中,正確判定故障分類的方法權(quán)值得到提高,并相應(yīng)調(diào)低錯(cuò)誤判定故障分類的方法權(quán)值,實(shí)現(xiàn)新生個(gè)體適應(yīng)度函數(shù)值的增加;當(dāng)達(dá)到設(shè)定的迭代最大次數(shù)時(shí),迭代完成,此時(shí)若適應(yīng)度函數(shù)并未收斂,則需增大迭代次數(shù),直到滿足優(yōu)化準(zhǔn)則中的一條,結(jié)束計(jì)算,并返回最優(yōu)權(quán)值矩陣。
其中步驟(2)與步驟(6)的優(yōu)化準(zhǔn)則如下(設(shè)定滿足其中一條即可):①種群中個(gè)體的平均適應(yīng)度超過(guò)預(yù)先設(shè)定值,預(yù)先設(shè)定值由適應(yīng)度值可能達(dá)到的最大值與求解精度決定;②適應(yīng)度函數(shù)在達(dá)到種群世代數(shù)前收斂(運(yùn)行到超過(guò)預(yù)先設(shè)定值,即迭代次數(shù)達(dá)到/超過(guò)最大值)。
權(quán)值矩陣優(yōu)化流程圖如圖5所示。
圖5 權(quán)值矩陣優(yōu)化流程圖
通過(guò)機(jī)械故障綜合模擬實(shí)驗(yàn)臺(tái)分別采集內(nèi)圈故障、滾珠故障、正常狀態(tài)和外圈故障4種單一模式下的軸承振動(dòng)信號(hào),每種故障狀態(tài)分別對(duì)應(yīng)一個(gè)模擬故障軸承,各軸承結(jié)構(gòu)尺寸一致,分別進(jìn)行振動(dòng)測(cè)試,實(shí)驗(yàn)臺(tái)工作轉(zhuǎn)頻為1797 r/min,采樣頻率為12 kHz。
隨機(jī)選取軸承內(nèi)圈故障、滾珠故障、正常狀態(tài)和外圈故障樣本各100個(gè),共400個(gè)訓(xùn)練樣本,用EMD方法提取每類狀態(tài)的樣本特征,取每組特征向量的前7維構(gòu)成訓(xùn)練樣本矩陣Q。分別采用社團(tuán)聚類算法、K-均值聚類算法與粒子群聚類算法對(duì)軸承故障訓(xùn)練樣本進(jìn)行聚類診斷,每類算法取10次聚類診斷的平均結(jié)果作為最終診斷輸出,結(jié)果見(jiàn)表1。則有
表1三種聚類方法對(duì)訓(xùn)練樣本單一診斷正確率 %
內(nèi)圈故障滾珠故障正常外圈故障樣本整體社團(tuán)聚類9072968084.5K-均值聚類6660807269.5粒子群聚類9084906682.5
對(duì)P進(jìn)行預(yù)加權(quán)調(diào)整,根據(jù)式(2)有
同理,可計(jì)算得到初始權(quán)值矩陣W:
采用遺傳算法優(yōu)化初始權(quán)值矩陣,過(guò)程原理如下。
假設(shè)某一訓(xùn)練樣本j為軸承滾珠故障樣本,用社團(tuán)聚類、K-均值聚類和粒子群聚類3種診斷方法分別判定其為軸承內(nèi)圈故障、軸承滾珠故障和正常狀態(tài),由式(3)得該訓(xùn)練樣本的初始判斷矩陣R(j):
其中,初始判斷矩陣R(j)的4列分別對(duì)應(yīng)4種軸承狀態(tài):內(nèi)圈故障、滾珠故障、正常狀態(tài)和外圈故障,3行分別對(duì)應(yīng)3種診斷方法:社團(tuán)聚類、K-均值聚類和粒子群聚類。
由式(8)可得
Vjmax=0.3659,最大值處于第1列,即融合診斷后判定訓(xùn)練樣本j為內(nèi)圈故障,判定錯(cuò)誤,通過(guò)交叉操作和變異操作對(duì)初始權(quán)值矩陣W進(jìn)行調(diào)整,使W11變小,W22變大,同時(shí)修正聚類模型。再對(duì)訓(xùn)練樣本j進(jìn)行判定,得
本文將初始權(quán)值矩陣W按照?qǐng)D3的順序編碼成二進(jìn)制數(shù)值串,遺傳算法具體參數(shù)參照文獻(xiàn)[11]設(shè)定,見(jiàn)表2。
表2 遺傳算法參數(shù)設(shè)置
圖6所示為適應(yīng)度函數(shù)值隨著遺傳代數(shù)的變化曲線,設(shè)定個(gè)體平均適應(yīng)度閾值為1×10-6,可以發(fā)現(xiàn)在進(jìn)行第11次迭代時(shí)適應(yīng)度函數(shù)已經(jīng)收斂,滿足優(yōu)化準(zhǔn)則2,結(jié)束運(yùn)算,得到優(yōu)化后的權(quán)值矩陣W1:
圖6 遺傳算法適應(yīng)度函數(shù)值隨迭代次數(shù)變化
得到最優(yōu)權(quán)值矩陣W1并對(duì)聚類模型進(jìn)行優(yōu)化后,便可對(duì)樣本進(jìn)行聚類融合診斷。
隨機(jī)選取軸承內(nèi)圈故障、滾珠故障、正常狀態(tài)和外圈故障樣本各100個(gè),對(duì)400個(gè)測(cè)試樣本進(jìn)行聚類融合診斷,診斷結(jié)果見(jiàn)表3。
表3 聚類優(yōu)化融合對(duì)測(cè)試樣本診斷正確率 %
對(duì)比表3與表1可知,聚類優(yōu)化融合診斷整體識(shí)別率明顯提高,滾動(dòng)體故障與正常狀態(tài)能夠完全識(shí)別,內(nèi)圈故障識(shí)別率提高到96%,外圈故障識(shí)別率提高到88%。這說(shuō)明聚類優(yōu)化融合診斷方法明顯優(yōu)于單一聚類診斷方法。
本文提出了一種聚類優(yōu)化融合故障診斷方法,通過(guò)單一聚類診斷獲得初始權(quán)值矩陣,利用遺傳算法優(yōu)化判定權(quán)值與聚類模型,聚類融合診斷取長(zhǎng)補(bǔ)短,消除了單一融合診斷方法的不確定性與片面性,以軸承故障診斷實(shí)例驗(yàn)證了該方法的優(yōu)越性,本文研究結(jié)果有重要的應(yīng)用參考價(jià)值。
[1]Deng Zhaohong,Choi K S,Chung Fulai,et al.Enhanced Soft Subspace Clustering Integrating within Cluster and Between-cluster Information[J].Pattern Recognition, 2010,43(3):767-781.
[2]Everitt B S,Landau S,Leese M,et al.Cluster Ana-lysis [M]. London: Wiley,2011.
[3]Park H S,Jun C H.A Simple and Fast Algorithm for K-medoids Clustering[J].Expert Systems with Applications,2009,36(2):3336-3341.
[4]陳安華,周博,張會(huì)福,等.基于改進(jìn)人工魚(yú)群算法的機(jī)械故障聚類診斷方法[J].振動(dòng)與沖擊,2012,31(17):145-148.
Chen Anhua,Zhou Bo,Zhang Huifu,et al.A Clustering Method for Mechanical Fault Diagnosis Based on Improved Fish-swarm Algorithm[J].Journal of Vibration and Shock,2012,31(17):145-148.
[5]陳安華,潘陽(yáng),蔣玲莉.基于復(fù)雜網(wǎng)絡(luò)社團(tuán)聚類的故障模式識(shí)別方法研究[J].振動(dòng)與沖擊,2013,32(20):129-133.
Chen Anhua,Pan Yang,Jiang Lingli.Fault Pattern Recognition Method Based on Complex Community Clustering[J].Journal of Vibration and Shock,2013,32(20):129-133.
[6]Richhariya V,Sharma N.Optimized Intrusion Detection by CACC Discretization via Naive Bayes and K-Means Clustering[J].International Journal of Computer Science & Network Security,2014,14(1):54-58.
[7]Runkler T A, Katz C.Fuzzy Clustering by Particle Swarm Optimization[C]//IEEE International Conference on Fuzzy Systems.Vancouver,2006: 601-608.
[8]Liu Y C,Xu J X.Risk Evaluation of CCIT Model in Ant Colony Housing Supply Based on AHP-grey Clustering Method[J].Applied Mechanics and Materials,2013, 380/384: 2520-2523.
[9]蔡艷平,李艾華,石林鎖,等.基于EMD與譜帩度的滾動(dòng)軸承故障檢測(cè)改進(jìn)包絡(luò)譜分析[J].振動(dòng)與沖擊,2011,30(2):167-172.
Cai Yanping,Li Aihua,Shi Linsuo,et al.Roller Bearing Fault Detection Using Improved Envelope Spectrum Analysis Based on EMD and Spectrum Kurtosis[J]. Journal of Vibration and Shock,2011,30(2):167-172.
[10]Holland J H.Adaptation in Natural and Artificial Systems:an Introductory Analysis with Applica-tions to Biology,Control,and Artificial Intelligence[M].2nd ed.Cambridge:MIT Press,1992.
[11]何大闊,王福利,張春梅.基于均勻設(shè)計(jì)的遺傳算法參數(shù)設(shè)定[J].東北大學(xué)學(xué)報(bào)(自然科學(xué)版),2003,24(5):409-411.
He Dakuo,Wang Fuli, Zhang Chunmei.Establishment of Parameters of Genetic Algorithm Based on Uniform Design[J].Journal of Northeastern University(Natural Science),2003,24(5):409-411.
(編輯陳勇)
Clustering Optimization Fusion Method for Fault Diagnosis and Its Applications
Jiang Lingli1,2Mo Zhijun1Chen Anhua1Li Xuejun1
1.Hunan Provincial Key Laboratory of Health Maintenance for Mechanical Equipment,Hunan University of Science and Technology, Xiangtan, Hunan, 411201 2. Suzhou Dongling Vibration Test Instrument Limited Company, Suzhou, Jiangsu, 215163
Single community diagnosis clustering methods were difficult to identify different fault states, in order to improve diagnostic accuracy, a fusion clustering method was proposed herein based on genetic optimization algorithm. Three clustering methods, the community clustering, the K-means clustering and the particle swarm clustering, were used to identify the fault states respectively. The diagnostic accuracies were used to construct an initial weight matrix. The genetic optimization algorithm was used to optimize the weight matrix. The examples of bearing fault diagnosis show that the clustering optimization fusion method may improve diagnostic accuracy.
clustering analysis;weight matrix;fusion diagnosis;genetic algorithm
2015-10-09
國(guó)家自然科學(xué)基金資助項(xiàng)目(51575177);湖南省教育廳優(yōu)秀青年項(xiàng)目(14B057) ;湖南省教育廳資助重點(diǎn)項(xiàng)目(13A023)
TP206.3 ;TH17DOI:10.3969/j.issn.1004-132X.2016.15.012
蔣玲莉,女,1981年生。湖南科技大學(xué)機(jī)械設(shè)備健康維護(hù)省重點(diǎn)實(shí)驗(yàn)室副教授,蘇州東陵振動(dòng)試驗(yàn)儀器有限公司博士后研究人員。主要研究方向?yàn)閯?dòng)力學(xué)與故障診斷。莫志軍,男,1992年生。湖南科技大學(xué)機(jī)電工程學(xué)院碩士研究生。陳安華,男,1963年生。湖南科技大學(xué)機(jī)械設(shè)備健康維護(hù)省重點(diǎn)實(shí)驗(yàn)室教授。李學(xué)軍,男,1969年生。湖南科技大學(xué)機(jī)械設(shè)備健康維護(hù)省重點(diǎn)實(shí)驗(yàn)室教授。