姜景升, 王華慶, 柯燕亮, 向 偉
(北京化工大學(xué) 機電工程學(xué)院, 北京 100029)
基于LTSA與K-最近鄰分類器的故障診斷
姜景升, 王華慶, 柯燕亮, 向 偉
(北京化工大學(xué) 機電工程學(xué)院, 北京 100029)
針對局部切空間排列算法(LTSA)的效果受近鄰數(shù)k值影響較大的缺點,提出基于聚類準(zhǔn)則的LTSA與K-最近鄰分類器的故障診斷模型?;谡駝有盘柕臅r域特征構(gòu)建高維特征矩陣;對高維矩陣進行標(biāo)準(zhǔn)化預(yù)處理,依據(jù)聚類準(zhǔn)則確定局部切空間排列中的最佳近鄰數(shù)k,運用LTSA提取高維矩陣的低維特征向量;將提取的低維特征向量利用K-最近鄰分類器進行故障模式識別。采用軸承診斷實驗系統(tǒng)進行驗證,結(jié)果表明,基于聚類準(zhǔn)則的優(yōu)化方法可有效地克服近鄰數(shù)k選擇的盲目性,提高了局部切空間的降維精度和故障模式識別正確率,其在軸承時域特征維數(shù)約簡方面,效果優(yōu)于主成分分析(PCA)與拉普拉斯特征映射(LE),適用于軸承故障診斷。
局部切空間排列; K-最近鄰分類器; 聚類準(zhǔn)則; 故障診斷
早期人們通常利用時域特征參數(shù)分析來進行故障特征提取,然后利用神經(jīng)網(wǎng)絡(luò)進行故障模式識別[1-2]。然而對于復(fù)雜工況下的軸承故障,單一的時域特征無法準(zhǔn)確全面地描述故障特征,而高維特征矩陣的非線性信息中又存在冗余信息,直接對高維數(shù)據(jù)進行處理會碰到很多問題,除計算量和存儲量大、數(shù)據(jù)可視性差、包含多種噪聲外,其中最突出的問題就是容易造成維數(shù)災(zāi)難(Curse of Dimensionality)[3-5]。必須人工去除冗余信息,提取主要特征。流形學(xué)習(xí)方法(Manifold Learning),作為將高維空間的流形映射至低維空間的降維方法。自2000年在著名的科學(xué)雜志《Science》被首次提出以來,已成為信息科學(xué)領(lǐng)域的研究熱點。在理論和應(yīng)用上,流形學(xué)習(xí)方法都具有重要的研究意義[6-8]。局部切空間排列算法是張振躍等人在2004年提出的,LTSA算法利用局部切空間可以很好地反映出流形的局部幾何特性,即較好地恢復(fù)出流形等距的低維空間子集,而且不要求它是凸的。相比拉普拉斯特征映射(LE)、局部線性嵌入(LLE)等流行學(xué)習(xí)算法具有更強的特征提取能力,分類效率得到大大提高[9-10]。主成分分析(Principal Component Analysis,PCA)作為另外一種降維方法,主要通過線性變換從多個變量中選出較少個數(shù)重要變量的一種多元統(tǒng)計分析方法,它在人臉圖像識別、設(shè)備故障診斷方面具有廣泛的應(yīng)用[11-12]。
本文引入聚類準(zhǔn)則為局部切空間中近鄰數(shù)k選擇提供理論依據(jù),有效地克服近鄰數(shù)k選擇的盲目性,大大地提高局部切空間的降維精度??紤]到K-最近鄰分類器可以直接用訓(xùn)練樣本的局部信息對測試樣本進行分類決策,在參數(shù)選取方面具有一定優(yōu)勢[13-15]。最后利用K-最近鄰分類器進行模式識別來進一步驗證基于聚類準(zhǔn)則的LTSA故障診斷方法的準(zhǔn)確性。因此,本文提出基于聚類準(zhǔn)則的LTSA與K-最近鄰分類器的故障診斷模型,該模型實現(xiàn)了故障診斷的精確化。
1.1 局部切空間排列算法
1.2 K-最近鄰分類器
最近鄰分類器的具體內(nèi)容:先計算測試樣本與各訓(xùn)練樣本的余弦距離,找出距離最近的k個近鄰,然后求出測試樣本對訓(xùn)練樣本各狀態(tài)的隸屬度,隸屬度最大的為測試樣本的狀態(tài)[18-19]。K-最近鄰分類器具體計算步驟如下:
設(shè)測試樣本經(jīng)LTSA提取的特征向量為y0,y0和訓(xùn)練樣本yi之間的余弦距離為
(1)
定義測試樣本y0和Ei類樣本的隸屬度為
(2)
(3)
(4)
利用原始振動信號的時域特征參數(shù)構(gòu)建高維特征矩陣,在對原始高維矩陣進行特征選擇與提取時,需要對原始數(shù)據(jù)進行標(biāo)準(zhǔn)化預(yù)處理。預(yù)處理之后,依據(jù)聚類準(zhǔn)則利用LTSA進行降維,降至三維觀察聚類情況。最終,利用K-最近鄰分類器進行故障模式識別,提高診斷精度。本文提出“基于聚類準(zhǔn)則的LTSA-K-最近鄰分類器”故障診斷模型,診斷流程如圖1所示。
圖1 故障診斷模型流程圖
整個計算流程主要包含以下幾個步驟:
(1) 利用軸承診斷模擬實驗臺采集故障振動信號,計算時域特征參數(shù),構(gòu)建高維時域特征矩陣;
(2) 對高維矩陣運用標(biāo)準(zhǔn)化預(yù)處理方法,去除由單位量綱不同所引起的權(quán)重[20]。它是將原數(shù)據(jù)集各元素減去該元素所在列的元素的均值再除以該列元素的標(biāo)準(zhǔn)差,經(jīng)標(biāo)準(zhǔn)化處理后的數(shù)據(jù)集,變量的權(quán)重相同,均值為0,標(biāo)準(zhǔn)差為1。
(5)
(3) 利用LTSA流行學(xué)習(xí)提取高維矩陣中的三維矩陣特征參數(shù),依據(jù)聚類準(zhǔn)則,確定最佳聚類情況下的近鄰數(shù)k=k0,將LTSA中近鄰數(shù)設(shè)為k0,然后再次利用
LTSA提取高維矩陣中三維特征向量。其中,聚類準(zhǔn)則含義,類內(nèi)離散度和類間距離常被用來判斷聚類結(jié)果的有效性,其基本內(nèi)容如下[21]:
1) 類內(nèi)平均離散度
(6)
2) 類間距離
(7)
即用兩個類中心的距離表示類間距離。
3) DB Index
(8)
(4) 將提取的低維特征向量利用K-最近鄰分類器進行故障模式識別,并與PCA及LE-K-最近鄰分類器結(jié)果進行比較,驗證本文所提出的故障診斷模型可靠性。
3.1 信號采集
滾動軸承診斷實驗臺,如圖2所示。電機通過皮帶帶動主軸轉(zhuǎn)動,在滾動軸承水平(x)、垂直(y)兩個方向上的2個測點位置安裝壓電式加速度傳感器,通過NF EZ7501數(shù)采設(shè)備進行振動信號的拾取,分別測取正常、外圈故障、內(nèi)圈故障和滾動體故障四種狀態(tài)下振動信號,其中四種軸承故障采用線切割技術(shù)制作而成,如圖3所示。主軸轉(zhuǎn)速設(shè)為900 r/min,采樣頻率為10 kHz,采樣時間為50 s。
采集的信號時域波形見圖4,對信號使用sym8小波進行5層分解,使用SURE閾值降噪并重構(gòu),最后利用Hilbert變換和FFT求取振動信號包絡(luò)頻譜,如圖5所示,外圈與內(nèi)圈故障特征明顯,滾動體故障特征微弱。
圖2 軸承診斷模擬實驗臺
3.2 結(jié)果分析
(a)正常狀態(tài)(b)外圈故障
(c)內(nèi)圈故障(d)滾動體故障
圖3 正常軸承與故障軸承實物
(c)內(nèi)圈故障(d)滾動體故障
圖4 四種狀態(tài)信號時域波形圖
(c)內(nèi)圈故障(d)滾動體故障
圖5 四種狀態(tài)信號小波包絡(luò)頻譜
Fig.5 The wavelet envelope spectrum of signal measured
利用軸承診斷實驗臺完成信號采集,分別獲取每種狀態(tài)下的振動數(shù)據(jù)。將采集到的每種信號截成100段,分別每一段計算時域特征參數(shù),時域特征參數(shù)包括均值、峰值、均方值、方差、方根幅值、平均幅值、均方幅值、偏斜度、峭度、波形指標(biāo)、峰值指標(biāo)、脈沖指標(biāo)、裕度指標(biāo)[22]。構(gòu)建高維時域特征矩陣(400×13),然后對高維矩陣運用標(biāo)準(zhǔn)化預(yù)處理方法。利用LTSA流行學(xué)習(xí)提取高維矩陣中的三維矩陣特征參數(shù),依據(jù)聚類準(zhǔn)則,確定最佳聚類情況下的近鄰數(shù)k。圖6所為近鄰數(shù)k取6~200時對應(yīng)DBk值的散點圖。其中,在k=7~15區(qū)域DBk取值較小,趨于零值。為了得到最佳近鄰數(shù)k,圖6(b)給出該區(qū)域局部放大視圖,從圖中可以看出,當(dāng)近鄰數(shù)k=13時,DBk值最小,聚類效果最好。此時運用LTSA進行低維特征提取,降至三維觀察聚類情況,見圖7。為了驗證所提方法的有效性,將本文方法同主成分分析(PCA)和拉普拉斯特征映射(LE)維數(shù)約簡方法進行對比,圖8和圖9分別對應(yīng)兩種方法降維后的聚類結(jié)果。
(a) 整體圖
(b) 局部放大圖
如圖7所示,軸承四種狀態(tài)實現(xiàn)了有效分離。而圖8中軸承四種狀態(tài)混雜在一起,難以區(qū)分,這與主成分分析在處理非線性信號時具有一定局限性有著密不可分的聯(lián)系[23]。與PCA聚類結(jié)果相比,圖9聚類效果雖較好,但LE降維受近鄰數(shù)k和賦權(quán)值時的參數(shù)σ的影響[24-25],內(nèi)圈與滾動體故障部分樣本混在一起,沒有完全分離??梢?,經(jīng)LTSA降維之后的聚類效果優(yōu)于PCA和LE聚類效果。
為了進一步驗證降維效果,將三種方法所提取的低維特征向量利用K-最近鄰分類器進行故障模式識別,并得出三種方法的識別正確率,其中訓(xùn)練樣本數(shù)為240,測試樣本數(shù)為160,得到三種方法下K-最近鄰分類器分類結(jié)果,如圖10、圖11和圖12所示。
如圖11所示,經(jīng)PCA降維運用K-最近鄰分類器分類效果不夠明顯,存在故障誤判的現(xiàn)象,識別率較低。如圖12所示,經(jīng)LE降維之后運用K-最近鄰分類器分類效果受參數(shù)k與σ的影響,存在故障誤判的現(xiàn)象。
圖7 LTSA降維聚類結(jié)果
圖8 PCA降維聚類結(jié)果
圖9 LE降維聚類結(jié)果
圖10 基于LTSA-K-最近鄰分類器故障診斷模型的分類結(jié)果
圖11 基于PCA-K-最近鄰分類器故障診斷模型的分類結(jié)果
圖12 基于LE-K-最近鄰分類器故障診斷模型的分類結(jié)果
從圖10中可以看出,經(jīng)LTSA 降維之后運用K-最近鄰分類器分類,分類結(jié)果呈階梯狀。即四種狀態(tài)完全區(qū)分開來,分類正確率高。由于聚類準(zhǔn)則優(yōu)化的局部切空間排列算法避免人為選取與調(diào)整參數(shù),實現(xiàn)方法的自適應(yīng)化。
將聚類準(zhǔn)則引入LTSA 降維,可有效地克服近鄰數(shù)k選擇的盲目性,提高了局部切空間的降維精度。提出LTSA-K-最近鄰分類器故障診斷模型,該方法建模方法簡單,人為確定參數(shù)少。通過軸承故障診斷實驗驗證并與PCA及LE-K-最近鄰分類器結(jié)果對比分析,運用LTSA-K-最近鄰分類器得到較好的識別效果,驗證了該方法在故障模式識別領(lǐng)域的可應(yīng)用性。
[1] 劉麗娟, 陳果, 郝騰飛. 基于流行學(xué)習(xí)與一類支持向量機的滾動軸承早期故障識別方法[J]. 中國機械工程, 2013, 24(5): 629-633.
LIU Lijuan, CHEN Guo, HAO Tengfei. Incipient fault recognition of rolling bearings based on manifold learning and one-class SVM[J]. China Mechanical Engineering, 2013, 24(5): 629-633.
[2] 李金榮, 王國英, 莫路鋒. 基于感知數(shù)據(jù)時域特征的WSNs故障被動診斷方法[J]. 傳感技術(shù)學(xué)報, 2015, 28(7): 1078-1085.
LI Jinrong, WANG Guoying, MO Lufeng. Passive diagnosis for WSNs using time domain features of sensing data[J]. Journal of Transduction Technology, 2015, 28(7): 1078-1085.
[3] 陳珍, 夏靖波, 柏駿. 基于進化深度學(xué)習(xí)的特征提取算法[J]. 計算機科學(xué), 2015, 42(11): 288-292.
CHEN Zhen, XIA Jingbo, BO jun. Feature extraction algorithm based on evolutionary deep learning[J]. Computer Science, 2015, 42(11): 288-292.
[4] RABL T, SADOGHI M, JACOBSEN H A. Solving big data challenges for enterprise application performance management[J]. Proceedings of the VLDB Endowment, 2012, 5(12): 1724-1735.
[5] LASALLE D, KARYPIS G. Mpi for big data: New tricks for an old dog[J]. Parallel Computing, 2014, 40(10): 754-767.
[6] SEUNG H S, DANIEL D L. The manifold ways of perception[J]. Science, 2000, 290(5500): 2268-2269.
[7] ROWEIS S, SAUL L. Nonlinear dimensionality reduction by locally linear embedding[J]. Science, 2000, 290(5500): 2323-2326.
[8] TENENBAUM J, SILVA D D, LANGFORD J. A global geometric framework for nonlinear dimensionality reduction[J]. Science, 2000, 290(5500): 2319-2323.
[9] 萬鵬, 王紅軍, 徐小力. 局部切空間排列和支持向量機的故障診斷模型[J]. 儀器儀表學(xué)報, 2012, 33(12): 2790-2795.
WAN Peng, WANG Hongjun, XU Xiaoli. Fault diagnosis model based on local tangent space alignment and support vector machine[J]. Chinese Journal of Scientific Instrument, 2012, 33(12): 2790-2795.
[10] 李鋒, 湯寶平, 董紹江. 基于正交鄰域保持嵌入特征約簡的故障診斷模型[J]. 儀器儀表學(xué)報, 2011, 32(3): 622-627.
LI Feng, TANG Baoping, DONG Shaojiang. Fault diagnosis model based on feature compression with orthogonal neighborhood preserving embedding[J]. Chinese Journal of Scientific Instrument, 2011, 32(3): 622-627.
[11] 鄭偉勇, 李艷瑋. 降維方法在人臉圖像識別中的分析與評估[J]. 工業(yè)控制計算機, 2015, 28(7): 110-112.
ZHENG Weiyong, LI Yanwei. Dimension reduction method in face image recognition system[J]. Industrial Control Computer, 2015, 28(7): 110-112.
[12] 王潔, 楊平, 郁嵩. 主成分分析和小波神經(jīng)網(wǎng)絡(luò)在氣缸疲勞失效預(yù)測中的應(yīng)用[J]. 機床與液壓, 2015, 43(13): 167-171.
WANG Jie, YANG Ping, YU Song. Application of principal component analysis and wavelet neural network for prediction of cylinder fatigue failure[J]. Machine Tool & Hydraulics, 2015, 43(13): 167-171.
[13] 陳法法, 湯寶平, 蘇祖強. 基于等距映射與加權(quán)KNN的旋轉(zhuǎn)機械故障診斷[J]. 儀器儀表學(xué)報, 2013, 34(1): 216-220.
CHEN Fafa, TANG Baoping, SU Zuqiang. Rotating machinery fault diagnosis based on isometric mapping and weighted KNN[J]. Chinese Journal of Scientific Instrument, 2013, 34(1): 216-220.
[14] 李勝, 張培林,吳定海. 基于漸近權(quán)值小波降噪和算法的液壓泵Adaboost故障診斷[J]. 中國機械工程, 2011, 22(9): 1067-1071.
LI Sheng, ZHANG Peilin, WU Dinghai. Fault diagnosis for hydraulic pump based on gradual asymptotic weight selection of wavelet and adaboost[J]. China Mechanical Engineering, 2011, 22(9): 1067-1071.
[15] 于德介, 陳淼峰, 程軍圣. 一種基于支持向量機預(yù)測器模型的轉(zhuǎn)子系統(tǒng)故障診斷方法[J]. 中國機械工程, 2006, 17(7): 696-699.
YU Dejie, CHEN Miaofeng, CHENG Junsheng. Fault diagnosis approach for rotor systems based on support vector machine predictive model[J]. China Mechanical Engineering, 2006, 17(7): 696-699.
[16] 楊慶, 陳桂明, 何慶飛. 局部切空間排列算法用于軸承早期故障診斷[J]. 振動、測試與診斷, 2012, 32(5): 831-835.
YANG Qing, CHEN Guiming, HE Qingfei. Incipient fault diagnosis of rolling bearings based on local tangent space alignment[J]. Journal of Vibration, Measurement & Diagnosis, 2012, 32(5): 831-835.
[17] 楊正永, 王昕, 王振雷. 基于 LTSA 和聯(lián)合指標(biāo)的非高斯過程監(jiān)控方法及應(yīng)用[J]. 化工學(xué)報, 2015, 66(4): 1370-1379.
YANG Zhengyong, WANG Xin, WANG Zhenlei. LTSA and combined index based non-Gaussian process monitoring and application[J]. CIESC Journal, 2015, 66(4): 1370-1379.
[18] 宋濤, 湯寶平, 李鋒. 基于流行學(xué)習(xí)和K-最近鄰分類器的旋轉(zhuǎn)機械故障診斷方法[J]. 振動與沖擊, 2013, 32(5): 149-153.
SONG Tao, TANG Baoping, LI Feng. Fault diagnosis method for rotating machinery based on manifold learning and K-nearest neighbor classifier[J]. Journal of Vibration and Shock, 2013, 32(5): 149-153.
[19] 孫斌, 劉立遠, 牛翀. 基于局部切空間排列和 K-最近鄰分類器的轉(zhuǎn)子故障診斷方法[J]. 中國機械工程, 2015, 26(1): 74-78.
SUN Bin, LIU Liyuan, NIU Chong. Rotor fault diagnosis methods based on local tangent space alignment and K-nearest Neighbor[J]. China Machanical Engineering, 2015, 26(1): 74-78.
[20] 許國根, 賈瑛. 模式識別與智能計算的MATLAB實現(xiàn)[M]. 北京: 北京航空航天大學(xué)出版社, 2012.
[21] 張莉, 孫鋼, 郭軍. 基于K-均值聚類的無監(jiān)督的特征選擇方法[J]. 計算機應(yīng)用研究, 2005, 22(3): 23-25.
ZHANG Li, SUN Gang, GUO Jun. Unsupervised feature selection method based on K-means clustering[J]. Computer and Modernization, 2005, 22 (3): 23-25.
[22] 楊國安. 信號處理基礎(chǔ)[M]. 北京: 中國石化出版社, 2012.
[23] 范雪莉, 馮海泓, 原猛. 基于互信息的主成分分析特征選擇算法[J]. 控制與決策, 2013, 28(6): 915-919.
FAN Xueli, FENG Haihong, YUAN Meng. PCA based on mutual information for feature selection[J]. Control and Decision, 2013, 28(6): 915-919.
[24] 李月嬌, 劉秉瀚. 基于自適應(yīng)鄰域參數(shù)的拉普拉斯特征映射[J]. 福州大學(xué)學(xué)報(自然科學(xué)版), 2013 (2): 153-157.
LI Yuejiao, LIU Binghan. Self-regulation of neighborhood parameter for Laplacian eigenmaps[J]. Journal of Fuzhou University(Natural Science Edition), 2013 (2): 153-157.
[25] 侯臣平, 吳翊, 易東云. 新的流形學(xué)習(xí)方法統(tǒng)一框架及改進的拉普拉斯特征映射方法[J]. 計算機研究與發(fā)展, 2009, 46(4): 676-682.
HOU Chenping, WU Yi, YI Dongyun. A novel unified manifold learning framework and an improved Laplacian eigenmaps[J]. Journal of Computer Research and Development, 2009, 46(4): 676-682.
Fault Diagnosis Based on LTSA and K-Nearest Neighbor Classifier
JIANG Jingsheng, WANG Huaqing, KE Yanliang, XIANG Wei
(School of Mechanical and Electrical Engineering, Beijing University of Chemical Technology, Beijing 100029, China)
Aiming at the problem that performances of the local tangent space alignment(LTSA) are greatly influenced by the nearest neighbor numberk, the fault diagnosis model of LTSA and K-nearest neighbor (KNN) classifier based on the clustering criterion was proposed. Firstly, a vibration signal collected was used to construct a high dimensional feature matrix. Then, the matrix was standardized before dimension reduction. According to the clustering criterion, the nearest neighbor numberkof LTSA was determined and lower dimensional feature vectors of the high dimensional feature matrix of LTSA were extracted. Finally, the extracted lower dimensional feature vectors were used to do fault pattern recognition with the KNN classifier. The tests for fault diagnosis of bearings were conducted to verify the proposed model. The results showed that this method based on the clustering criterion can effectively overcome the choice blindness of the KNN numberk, and improve the accuracy of dimension reduction and the recognition correct rate of fault patterns; compared with the principal component analysis (PCA) method and Laplace eigen-maps(LE)method, the proposed method is more suitable for bearing fault pattern recognition.
local tangent space alignment (LTSA); K-nearest neighbor (KNN) classifier; clustering criterion; fault diagnosis
國家自然科學(xué)基金(51675035; 51375037)
2015-12-31 修改稿收到日期:2016-03-28
姜景升 男,碩士生,1992年4月生
王華慶 男,博士,教授,博士生導(dǎo)師,1973年3月生
TH165+.3; TH133.33
A
10.13465/j.cnki.jvs.2017.11.021