胡 峰,王傳桐,吳雨川,范良志,余聯(lián)慶
(武漢紡織大學(xué)機械工程與自動化學(xué)院,武漢 430074)
基于改進(jìn)監(jiān)督LLE算法的故障特征提取方法
胡 峰,王傳桐,吳雨川,范良志,余聯(lián)慶
(武漢紡織大學(xué)機械工程與自動化學(xué)院,武漢 430074)
針對現(xiàn)有監(jiān)督局部線性嵌入算法在低維輸出向量重構(gòu)過程中監(jiān)督學(xué)習(xí)能力弱,不利于故障特征提取的問題,通過利用訓(xùn)練樣本類標(biāo)簽信息擴大不同類樣本間平均距離的方式,增加低維輸出向量重構(gòu)模型的監(jiān)督學(xué)習(xí)能力,強化同類樣本的聚集性和異類樣本的互斥性?;谝?guī)范切割準(zhǔn)則和低維輸出向量重構(gòu)誤差,應(yīng)用離散粒子群優(yōu)化算法優(yōu)化折中系數(shù)α和β、以及嵌入維數(shù)和鄰域等參數(shù),提高故障特征提取精度。將改進(jìn)的監(jiān)督局部線性嵌入方法應(yīng)用于軸承故障特征提取,結(jié)果表明推薦方法的特征提取精度較高。
故障;特征提?。槐O(jiān)督局部線形嵌入;局部幾何結(jié)構(gòu);規(guī)范切割
高維度、非線性和強耦合的機械故障信號會嚴(yán)重影響機械故障的診斷正確率[1-2]。監(jiān)督局部線性嵌入算法(Supervised Locally Linear Embedding,SLLE)通過調(diào)節(jié)樣本間的局部鄰域結(jié)構(gòu)實現(xiàn)監(jiān)督學(xué)習(xí),能強化同類樣本的聚集性和異類樣本的互斥性,實現(xiàn)故障特征流形的解耦與分類及新增樣本的增量處理,提高故障辨識精度和計算效率[3-6]。但是,現(xiàn)有SLLE方法存在:①低維輸出向量在重構(gòu)過程中監(jiān)督學(xué)習(xí)能力弱;②參數(shù)優(yōu)化能力不足等問題。導(dǎo)致SLLE對故障特征提取精度差。針對上述問題,需要對SLLE進(jìn)行改進(jìn)。
SLLE根據(jù)類標(biāo)簽尋找每個訓(xùn)練樣本xi∈X的k個同類鄰近點,采用放大異類樣本間歐式距離,保持同類樣本間距離不變的方法來拉大異類樣本之間的距離,用公式[3-7]
將不同類樣本分別映射到低維空間,保證鄰域中同類點占多數(shù)的狀態(tài)。其中S=‖xi-xj‖為未考慮類標(biāo)簽信息時的歐式距離,max(S)=maxi,j‖xi-xj‖為樣本間的最大距離,S′為融入類標(biāo)簽信息的距離。若xi和xj屬于異類,則δ(xi,xj)=0;否則,δ(xi,xj)=1。α∈[0,1]為折中系數(shù),用于控制類信息的融入程度。
采用式(1)構(gòu)造訓(xùn)練樣本集中每個樣本點xi的k個最近鄰點集合,運用
為使輸出向量yi在低維空間盡量保持高維空間的拓?fù)浣Y(jié)構(gòu),代價函數(shù)[8]
必須最小。yi是矩陣Y的列向量;式中yij(j=1,2,…,k)是yi在嵌入空間的k鄰近點。且必須滿足
式中I是單位矩陣。在計算式(3)的最優(yōu)解時,ε(Y)可寫成[8]
式中M是一個n×n的對稱矩陣,其表達(dá)式[8]為
式(3)最小解為矩陣M的d個最小特征值所對應(yīng)的特征向量構(gòu)成的矩陣Y,則Y的列向量維數(shù)為d。
針對現(xiàn)有SLLE方法在低維輸出向量重構(gòu)過程中監(jiān)督學(xué)習(xí)能力不足的問題,利用訓(xùn)練樣本類標(biāo)簽信息擴大不同類樣本之間平均距離的方式構(gòu)造監(jiān)督學(xué)習(xí)機制,增強SLLE的特征提取精度。
圖1 改進(jìn)SLLE監(jiān)督學(xué)習(xí)原理示意圖Fig.1 Learningmechanism of improved supervised locally linear embedding algorithm
式(3)與式(10)具有相同表達(dá)形式。通過最小化兩式的和,求取低維輸出向量。但是,兩式目標(biāo)值大小和數(shù)量級存在差異,故設(shè)立折中系數(shù)β進(jìn)行協(xié)調(diào)。
式中φ(y,β)最小時,即式(3)與式(10)兩式分別最小時,獲得的低維輸出向量y即為所求。式(12)進(jìn)一步改寫為
設(shè)新樣本為xnew,它在訓(xùn)練樣本集中的k個最近鄰點為xj,j=1,2,…,k。yj為xj的低維輸出向量。令X=[xi,x2,…,xk],Y=[y1,y2,…,yk]?,F(xiàn)有SLLE方法利用公式[3-4,9]:
計算映射矩陣A。然后通過矩陣A計算新樣本的低維輸出向量。但是,當(dāng)XT為不滿秩矩陣時,如:鄰近點數(shù)目k小于高維空間維數(shù)D時,矩陣A計算困難。
LLE方法必須滿足兩個前提假設(shè):在高維空間滿足[8]
本文推薦的方法是先找出新樣本在訓(xùn)練樣本集中的k個鄰近點xj,j=1,…,k,計算xnew和xj間的權(quán)值wij。由于yj已經(jīng)利用改進(jìn)SLLE計算得到,使用式(16)可計算出ynew,注意使用式(16)時,要求重構(gòu)誤差較小。
式(1)和式(13)中的折中系數(shù)α和β,以及嵌入維數(shù)d和鄰域大小k都會影響故障特征的提取精度[10],需要進(jìn)行優(yōu)化。
4.1 改進(jìn)SLLE參數(shù)的優(yōu)化準(zhǔn)則
本文推薦采用規(guī)范切割(簡稱Ncut)準(zhǔn)則和重構(gòu)誤差作為參數(shù)優(yōu)化準(zhǔn)則。Ncut準(zhǔn)則能用于衡量類可分性的優(yōu)劣。設(shè)樣本點能劃分為K類,Ci是屬于類i的樣本點集合,則Ncut準(zhǔn)則[11-13]為
式中d(xi,xj)是頂點xi和xj間的歐式距離,σi(σj)是頂點xi(xj)與鄰域點的平均距離。如果邊(xi,xj)?E,則S=0。由式(18)可知S∈[0,1],使不同維度空間計算得到的邊權(quán)值具有可比性,進(jìn)一步使衡量類可分性的Ncut值在不同子空間具有可比性。
新樣本通過式(16)提取故障特征,為了使新樣本具有較高的故障特征提取精度,式(3)中重構(gòu)誤差ε越小越好。
4.2 基于離散粒子群的參數(shù)優(yōu)化算法
式中:i=1,2,…,L,j=1,2,…,N;r1j,r2j和ρ是[0,1]上均勻分布的隨機數(shù);ω,c1和c2是權(quán)重及加速度系數(shù)。
基于離散粒子群的參數(shù)優(yōu)化算法如下:
步驟1 初始化粒子群參數(shù)。設(shè)置種群大小、粒子維數(shù);
步驟2 計算每個粒子適應(yīng)度值。將二值粒子轉(zhuǎn)化為十進(jìn)制參數(shù)值,利用改進(jìn)SLLE算法計算訓(xùn)練樣本的低維輸出向量。將式(3)和式(17)同時作為適應(yīng)度函數(shù),分別計算兩式的值。步驟3 計算個體適應(yīng)度最好位置第t+1次迭代后,粒子xi(t+1)的適應(yīng)度值比它歷史最好位置的適應(yīng)度值小時,即:目前計算得到的重構(gòu)誤差和Ncut值同時小于或等于歷史最好位置的重構(gòu)誤差和Ncut值的情況下,更新粒子xi的歷史最好位置xpi。
步驟4 計算全局最好位置。利用全局最好位置計算得到的重構(gòu)誤差和Ncut值要同時小于或等于個體最好位置的重構(gòu)誤差和Ncut值。
步驟5 利用式(18)~式(20)更新粒子速度和位置。
步驟6 檢測是否達(dá)到終止條件。如果達(dá)到則停止,否則返回步驟2。
5.1 實驗?zāi)康暮头椒?/p>
在相同條件下,與現(xiàn)有方法進(jìn)行對比實驗研究,證明改進(jìn)SLLE方法提取的故障特征向量靈敏度更高;特征向量維數(shù)更小。
對比實驗中涉及的方法有:①改進(jìn)SLLE方法。該方法在軸承故障特征提取中同時應(yīng)用重構(gòu)誤差和Ncut準(zhǔn)則作為適應(yīng)度函數(shù),應(yīng)用離散粒子群算法優(yōu)化折中系數(shù)α和β、以及嵌入維數(shù)和鄰域大小,應(yīng)用式(16)提取新樣本故障特征。②SLLE方法[3-4]。該方法在軸承特征提取過程中應(yīng)用局部協(xié)方差矩陣的特征值來確定嵌入維數(shù),用十折交叉驗證法確定鄰域大小和折中系數(shù)α,應(yīng)用式(14)提取新樣本的故障特征。③LLE方法和基于相關(guān)熵的局部線形嵌入算法(CCLLE)[13]。兩種方法在軸承故障特征提取中應(yīng)用Ncut準(zhǔn)則優(yōu)化嵌入維數(shù)和鄰域大小,應(yīng)用式(16)提取新樣本故障特征。
5.2 實驗數(shù)據(jù)來源
實驗數(shù)據(jù)來源和原始特征集的構(gòu)造方法與文獻(xiàn)[13]相同。選擇美國Case Western Reserve University電氣工程實驗室提供的SKF6205型深溝球軸承在正常和不同故障狀態(tài)下的振動信號數(shù)據(jù)進(jìn)行分析研究。從軸承振動信號中提取波峰指標(biāo)、峭度指標(biāo)、偏度指標(biāo)、裕度指標(biāo)、標(biāo)準(zhǔn)差、均方根和峰值等7個時域特征。采用小波包函數(shù)將不同狀態(tài)下的滾動軸承振動信號進(jìn)行p層正交小波包分解,得到由全頻帶均勻劃分的2p個子頻帶的濾波信號,將各頻帶信號的能量作為原始特征集[13]。原始特征集由時域特征和頻域特征共同構(gòu)成,共計7+2p個特征。
5.3 實驗過程
在不同轉(zhuǎn)數(shù)、采樣頻率和故障尺寸情況下,選取正常狀態(tài)、滾珠故障、內(nèi)圈故障和外圈故障等4種狀態(tài)下的軸承振動信號。
(1)實驗一
信號采樣頻率為48 kHz,轉(zhuǎn)速1 750 r/min,故障尺寸0.036 cm,進(jìn)行p=7層正交小波包分解,得到135個特征。每種狀態(tài)樣本數(shù)為29,樣本長度為16 384,計算原始特征集。首先,在每種狀態(tài)中隨機選取15個樣本組成訓(xùn)練樣本集,其余作測試樣本。需要特別指出:應(yīng)用SLLE方法時,如果按十折交叉驗證法要求,將訓(xùn)練樣本分成10個測試子集,每個測試子集中每類樣本平均只有1.5個,數(shù)量太少。為提高每個測試子集不同類樣本的數(shù)量,實驗中將訓(xùn)練樣本分成5折。鄰域和折中系數(shù)α的步長與文獻(xiàn)[3-4]一致。改進(jìn)SLLE算法中離散粒子群的迭代次數(shù)為400。然后,計算訓(xùn)練樣本的低維輸出向量,并將結(jié)果用于訓(xùn)練概率神經(jīng)網(wǎng)絡(luò)分類器;接下來,提取新樣本的低維輸出向量;最后,將新樣本低維輸出向量輸入概率神經(jīng)網(wǎng)絡(luò)分類器分類。所有實驗中,分類器參數(shù)不變。識別正確率和優(yōu)化參數(shù)見表1。
表2 實驗二結(jié)果Tab.2 Classification result of Experiment 2
(2)實驗二
信號采樣頻率為12 kHz,轉(zhuǎn)速1 730 r/min,故障尺寸0.018 cm,每種狀態(tài)樣本數(shù)為58,樣本長度為2 048。計算原始特征集時,進(jìn)行p=5層正交小波包分解,小波特征和時域特征共計39個。首先,在每種狀態(tài)中隨機選取40個樣本組成訓(xùn)練樣本集,其余作為驗證樣本。應(yīng)用SLLE方法時,將訓(xùn)練樣本分成10個測試子集。其它實驗步驟和實驗一相同,識別結(jié)果見表2。
5.4 實驗結(jié)果分析
通過改進(jìn)SLLE方法的低維輸出向量重構(gòu)模型、新樣本的特征提取方法和參數(shù)優(yōu)化方法,能提高軸承故障特征的特征提取精度,同時獲得較小的維數(shù)。通過實驗證明相對于局部協(xié)方差特征法和十折交叉法,Ncut準(zhǔn)則更適合用于對嵌入維數(shù)和鄰域進(jìn)行優(yōu)化,即使沒有引入監(jiān)督學(xué)習(xí)機制,Ncut準(zhǔn)則通過有效測量低維輸出向量的類可分離性,也能提高新樣本的特征提取精度。同時將重構(gòu)誤差和Ncut值作為參數(shù)優(yōu)化準(zhǔn)則,有利于新樣本特征的提取精度。
[1]栗茂林,王孫安,梁霖.利用非線性流形學(xué)習(xí)的軸承早期故障特征提取方法[J].西安交通大學(xué)學(xué)報,2010,44(5):45-49.
LIMao-lin,WANG Sun-an,LIANG Lin.Feature extraction for incipient fault diagnosis of rolling bearings based on nonlinearmanifold learnging[J].Journal of Xian Jiao Tong University,2010,44(5):45-49.
[2]張紹輝,李巍華.可變近鄰參數(shù)的局部線性嵌入算法及其在軸承狀態(tài)識別中的應(yīng)用[J].機械工程學(xué)報,2013,49 (1):81-87.
ZHANG Shao-hui,LIWei-hua.Variable nearest neighbor locally linear embedding and applications in bearing condition recognition[J].Journal of Mechanical Engineering,2013,49 (1):81-87.
[3]李鋒,田大慶,王家序,等.基于有監(jiān)督增量式局部線形嵌入的故障辨識[J].振動與沖擊,2013,32(23):82-88.
LI Feng,TIANG Da-qing,WANG Jia-xu,et al.Fault identification method based on supervised incremental locally linear embedding[J].Journal of Vibration and Shock,2013,32(23):82-88.
[4]Li Ben-wei,Zhang Yun.Supervised locally linear embedding projection(SLLEP)for machinery fault diagnosis[J].Mechanical systems and Signal Processing,2011,25:3125-3134.
[5]閻慶,梁棟,張晶晶.基于Fisher變換的植物葉片圖像識別監(jiān)督LLE算法[J].農(nóng)業(yè)機械學(xué)報,2012,43(9):179-183.
YAN Qing,LIANG Dong,ZHANG Jing-jing.Recognition method of plant leaves based on fisher projection-supervised LLE algorithm[J].Transactions of the Chinese Society for Agricultural Machinery,2012,43(9):179-183.
[6]Zhao Ling-xiao,Zhang Zhen-yue.Supervised locally linear embedding with probability-based distance for classification [J].Computers and Mathematics with Applications,2009,57:919-926.
[7]Ridder D D,Kouropteva O,Okun O.Supervised locally linear embedding[C]//Proceedings of the Joint International Conference,ICANN/ICONIP.Lecture Notes in Computer Science,Springer,Heidelberg,2003:333-341.
[8]Roweis ST,Saul L K.Nonlinear dimensionality reduction by locally linear embedding[J].Science,2000,290(5500):2323-2326.
[9]Nichols J M,Bucholtz F,Nousain B.Automated,rapid classification of signals using locally linear embedding[J].Expert Systemswith Applications,2011,38:13472-13474.
[10]Kouropteva O,Okun O,Pietikainen M.Selection of the optimal parameter value for the locally linear embedding algorithm[C]//In:Fisrt Internat.Conf.on Fuzzy Systems and Knowledge Discovery,2002.
[11]Shi Jian-bo,Malik J.Normalized cuts and image segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(8):888-905.
[12]Tabatabaei S S,Coates M,Rabbat M.GANC:Greedy agglomerative normalized cut for graph clustering[J].Pattern Recognition,2012,45:831-843.
[13]胡峰,蘇訊,劉偉,等.基于改進(jìn)局部線性嵌入算法的故障特征提取方法[J].振動與沖擊,2015,34(15):211-215.HU Feng,SU Xun,LIUWei,et al.Fault feature extraction based on improved locally linear embedding[J].Journal of Vibration and Shock,2015,34(15):211-215.
[14]Liu Yan,Gu Xue-ping.Skeleton-network reconfiguration based on topological characteristics of scale-free networks and discrete particle swarm optimization[J].IEEE Transactions on Power Systems,2007,22(3):1267-1274.
[15]Alberto G V,Rafael P.Introducing dynamic diversity into a discrete particle swarm optimization[J].Computer and Operation Research,2009,36(3):951-966.
Fault features extraction based on im proved supervised locally linear embedding
HU Feng,WANG Chuan-tong,WU Yu-chuan,F(xiàn)AN Liang-zhi,YU Lian-qin
(School of Mechanical Science and Automation,Wuhan Textile University,Wuhan 430074,China)
Aiming at the shortage of weak learning ability of the supervised locally linear embedding(SLLE)algorithm being unfavorable to fault feature extraction in reconstructing lower-dimensional output vectors,the learning ability of reconstructedmodel of output vectorswas improved via utilizing the information of class labels of training samples to increase the average distance between sampleswith different class labels.The aggregation of the same class samples and themutual exclusion of sampleswith different class labelswere enhanced.In order to enhance extraction precision of fault features,the binary particle swarm optimal(PSO)algorithm,the normalized cut or Ncut criterion and the reconstruction error were employed to optimize compromise coefficients,embedding dimension and neighborhood size.The improved SLLE was employed in the fault feature extraction of rolling bearings.The test results for fault diagnosis of rolling ball bearings showed that compared with other approaches,ISLLE ismore effective to extract the fault features form vibration signals,and enhance the classification ability of failure pattern.
fault;features extraction;SLLE;normalized cut criterion;PSO
TH17
A
10.13465/j.cnki.jvs.2015.21.021
國家自然科學(xué)基金資助項目(51205294,61271008,51275363)
2014-09-16 修改稿收到日期:2014-11-19
胡峰男,博士,副教授,碩士生導(dǎo)師,1979年生