王海瑞+張楠
摘要:針對轉(zhuǎn)子故障振動信號特點(diǎn),提出了一種基于核主成分分析及相關(guān)向量機(jī)(KPCA-RVM)的故障診斷方法。首先對故障信號用核主成分分析的方法進(jìn)行降維處理以去除冗余信息以提高對數(shù)據(jù)進(jìn)行計(jì)算處理的速度及正確率。之后使用相關(guān)向量機(jī)的方法對特征信息進(jìn)行分類識別,以識別轉(zhuǎn)子的正常、不對中、不平衡、碰磨以及松動五種不同運(yùn)行狀態(tài)。最后將本文所使用的方法與3種其他常見模型方法進(jìn)行對比,結(jié)果表明本方法在轉(zhuǎn)子故障識別上具有良好的可行性以及更好的實(shí)用性。
Abstract: Base on the characteristics of the rotor fault, a method based on Kernel Principal Component Analysis and Relevant Vector Machine to diagnose rotor fault has been proposed. In this essay, firstly KPCA has been used to reduce the dimension of fault signals to remove redundancy information and improve the accuracy and computation speed, then RVM has been used to diagnose fault state which including normal condition, misalignment, unbalance, friction and looseness, finally, three other methods have been used to comprise with the method which is provided, and indicate the feasibility and practicability of the provided method in rotor fault diagnosis.
關(guān)鍵詞:故障診斷;轉(zhuǎn)子;核主成分分析;相關(guān)向量機(jī)
Key words: fault diagnosis;rotor;KPCA;RVM
中圖分類號:U226.8+1 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-4311(2017)15-0154-03
0 引言
轉(zhuǎn)子是旋轉(zhuǎn)機(jī)械中的核心部件之一,典型的常見轉(zhuǎn)子故障包括松動、碰磨、不對中以及不平衡等,當(dāng)這些故障出現(xiàn)時(shí),將對機(jī)械設(shè)備的正常運(yùn)行造成很大負(fù)面影響甚至可能造成運(yùn)行事故,因此當(dāng)故障正在或者即將發(fā)生時(shí),及時(shí)準(zhǔn)確的故障診斷具有十分重要的意義。
通常情況下,轉(zhuǎn)子故障診斷依靠分析轉(zhuǎn)子振動信號,這一信號常包含其他信號干擾,并且在故障的發(fā)生后可能會對整體機(jī)械誘發(fā)出新的振動[1]。因此使用主成分分析(Principal Component Analysis)方法對獲取到的信號進(jìn)行降維運(yùn)算以獲取更準(zhǔn)確數(shù)據(jù)。但傳統(tǒng)PCA方法很難實(shí)現(xiàn)在不同尺度下的非線性特征提取,這對降維結(jié)果的精確性造成不少影響,因此本文使用基于核的主成分分析(Kernel Principal Component Analysis)方法對數(shù)據(jù)特征進(jìn)行處理。
常見的模式識別分類方法包括人工神經(jīng)網(wǎng)絡(luò)(Artificial Neuro Network,ANN),支持向量機(jī)(Support Vector Machine,SVM)等,這些方法在故障診斷中都有大量應(yīng)用,但同時(shí)這些方法也有各自的局限性使其在一定程度上對其在工程上的實(shí)際應(yīng)用帶來不穩(wěn)定影響。相關(guān)向量機(jī)(Relevance Vector Machine, RVM)方法與前者相比具有參數(shù)易設(shè)置、模型結(jié)構(gòu)易于確定等優(yōu)點(diǎn),故而本文使用這一方法進(jìn)行故障分類。
1 特征提取
1.1 PCA方法基本原理
主成分分析(Principal Component analysis,PCA)又名主元分析,被廣泛應(yīng)用于特征提取、有損數(shù)據(jù)壓縮、降維及數(shù)據(jù)可視化中[2]。PCA屬于一種線性的數(shù)據(jù)降維方法,它可以實(shí)現(xiàn)在對一個(gè)含有大量相關(guān)數(shù)據(jù)的數(shù)據(jù)集進(jìn)行降維處理的同時(shí)盡可能多的保持?jǐn)?shù)據(jù)內(nèi)部的差異性,這為后續(xù)的分類過程中能得到更準(zhǔn)確的分類結(jié)果是十分有益的。
在對數(shù)據(jù)進(jìn)行處理時(shí),首先需要得到采樣數(shù)據(jù)組成的矩陣,其中包括個(gè)采樣點(diǎn),如下所示:
2.3 RVM的“二叉樹”分類
由于相關(guān)向量機(jī)是一種二元分類方法,因而在故障診斷中需要使用多模式分類的方法以實(shí)現(xiàn)多分類問題的解決。常見的組合分類方法包括“一對余”(One Against Rest, OAR),“一對一”(One Against One,OAO),“二叉樹”(Binary Tree,BT)法和“有向無環(huán)圖”(Direct Acyclic Graph, DAG)法[7]。二叉樹方法是很常用的一種決策樹方法,相比于其他類型的分類器,“二叉樹”分類方法具有構(gòu)造的RVM二分類器數(shù)量少,訓(xùn)練所需要的樣本數(shù)量相對較少,測試時(shí)間相對較短的優(yōu)點(diǎn)[10]。在本文中使用了如圖1所示的多分類器組合結(jié)構(gòu)。
2.4 故障診斷模型
結(jié)合轉(zhuǎn)子故障診斷的實(shí)際需求及以上理論基礎(chǔ),提出了如圖2所示的故障診斷模型。
首先,獲取轉(zhuǎn)子的振動信號,之后將振動信號中有意義部分的特征進(jìn)行提取,然后將獲取到的不同運(yùn)行狀態(tài)(正常或故障)的故障信息進(jìn)行KPCA降維。
在故障類型識別中,首先將經(jīng)過處理的特征選取適當(dāng)數(shù)量樣本作為訓(xùn)練樣本,然后使用這些樣本對相關(guān)向量機(jī)進(jìn)行訓(xùn)練,訓(xùn)練結(jié)束后該已被訓(xùn)練好的相關(guān)向量機(jī)即可對新得到的數(shù)據(jù)進(jìn)行故障辨識,最終得到診斷結(jié)果。
3 轉(zhuǎn)子故障診斷實(shí)例
實(shí)驗(yàn)數(shù)據(jù)來源一小型轉(zhuǎn)子試驗(yàn)臺的實(shí)驗(yàn)數(shù)據(jù),轉(zhuǎn)速為3200轉(zhuǎn),共包括五種不同的轉(zhuǎn)子運(yùn)行狀態(tài),分別為正常、不對中、不平衡、松動以及碰磨。數(shù)據(jù)為12通道的轉(zhuǎn)子振動數(shù)據(jù),5種運(yùn)行狀態(tài)每種狀態(tài)選取了40組樣本,共計(jì)200組樣本組成故障樣本集。以K-fold交叉驗(yàn)證方法為基礎(chǔ)將樣本集二分成訓(xùn)練集和測試集,如表1所示。
由于樣本數(shù)據(jù)維度較大,包含一定量的冗余信息,在對這樣的數(shù)據(jù)樣本進(jìn)行處理時(shí)會耗費(fèi)大量計(jì)算時(shí)間,并且實(shí)際上冗余信息并不是十分重要,可以經(jīng)過降維處理去掉這些信息并對后續(xù)識別處理幾乎不造成影響,故而使用降維的方法提取主要特征信息。在研究中通過計(jì)算,將主元方差累積貢獻(xiàn)率的最小值設(shè)為95%,將樣本用KPCA的方法進(jìn)行降維處理,采用RBF徑向基函數(shù)作為核函數(shù),參數(shù)降維后的故障數(shù)據(jù)樣本如表2所示。
使用上面所得到的特征數(shù)據(jù)對RVM進(jìn)行訓(xùn)練,在相關(guān)向量機(jī)分類器的訓(xùn)練中同樣適用RBF徑向基函數(shù)作為核函數(shù),其中核函數(shù)的參數(shù)。訓(xùn)練結(jié)束后使用測試樣本進(jìn)行測試,通過將測試樣本進(jìn)行測試后的狀態(tài)識別率為94%,具體每一類測試結(jié)果如表3所示。
總體來看識別的準(zhǔn)確率較高,其中錯(cuò)誤識別可能是由于特征量較為相似而訓(xùn)練樣本不足所導(dǎo)致。為進(jìn)一步的驗(yàn)證本文所使用的故障診斷模型的優(yōu)越性,將實(shí)驗(yàn)數(shù)據(jù)和幾種現(xiàn)有常用方法進(jìn)行了對比測試,測試結(jié)果如表4所示。
通過對比可以看出相較于其他方法,本文所提出的KPCA-RVM模型識別正確率最高。在特征提取方面,KPCA的耗時(shí)比PCA要長,但通過核主成分分析降維后的數(shù)據(jù)識別正確率會稍高于使用普通主成分分析方法得到的數(shù)據(jù)的分類結(jié)果,說明使用核函數(shù)對非線性情況進(jìn)行處理會提高降維準(zhǔn)確度,更有利于對特征量的識別分類。SVM方法與RVM方法相比,RVM的訓(xùn)練需要消耗更多時(shí)間,但在分類時(shí)速度較快??傮w來說,仍以KPCA-RVM模型為最佳。
4 結(jié)論
本文通過將核主成分分析與相關(guān)向量機(jī)優(yōu)點(diǎn)進(jìn)行結(jié)合,提出了一種以核主成分分析方法進(jìn)行特征提取,后以相關(guān)向量機(jī)以“二叉樹”法進(jìn)行多故障分類的轉(zhuǎn)子故障診斷模型。通過實(shí)驗(yàn)結(jié)果可以看出這一方法在轉(zhuǎn)子故障診斷問題上切實(shí)可行并具有較高的識別正確率,通過與PCA方法和SVM方法的對比得出本文所提出模型較之常見方法的優(yōu)異性所在。實(shí)驗(yàn)結(jié)果表明本文所涉及模型具有識別率高,分類時(shí)間較短的優(yōu)點(diǎn)。
參考文獻(xiàn):
[1]李舜酩.轉(zhuǎn)子振動故障信號的盲分離[J].航空動力學(xué)報(bào),2005,20(5):751-756.
[2]Bishop. C. M (2006). Pattern Recognition and Machine learning.577.
[3]Vapnik. V. N (2000). 統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)[M].清華大學(xué)出版社,2000:1-5.
[4]陽同光,桂衛(wèi)華.基于KPCA與RVM感應(yīng)電機(jī)故障研究[J].電機(jī)與控制學(xué)報(bào),2016,20(9):89-95.
[5]李偉紅,龔衛(wèi)國,陳偉民,梁毅雄,尹克重.基于小波分析與KPCA的人臉識別方法[J].計(jì)算機(jī)應(yīng)用,2005,25(10):2339-2341.
[6]Tipping. M. E (2001), Sparse Bayesian Learning and the Relevance Vector Machine[J]. Journal of Machine Learning Research, 2001(1):211-244.
[7]柳長源.相關(guān)向量機(jī)多分類算法的研究與應(yīng)用[D].哈爾濱工程大學(xué),2013.
[8]張維強(qiáng),趙榮珍,李坤杰.基于MSKPCA和SVM的轉(zhuǎn)子故障診斷模型及應(yīng)用[J].機(jī)械設(shè)計(jì)與制造,2015,10(10):4-8.
[9]馬登武,范庚,張繼軍.相關(guān)向量機(jī)及其在故障診斷與預(yù)測中的作用[J].海軍航空工程學(xué)院學(xué)報(bào),2013,28(2):154-160.
[10]王冉,陳進(jìn).支持向量機(jī)決策樹分類器在轉(zhuǎn)子故障診斷中的應(yīng)用[J].振動與沖擊,2010,29:258-260.