郭佳靖,姜 宏,章翔峰,冉祥鋒
(新疆大學(xué) 機(jī)械工程學(xué)院,烏魯木齊 830047)
滾動(dòng)軸承作為機(jī)械設(shè)備中易受損的部件之一,其工作條件相對(duì)惡劣。一旦發(fā)生故障將導(dǎo)致機(jī)械設(shè)備的嚴(yán)重?fù)p壞以及災(zāi)難性事故的發(fā)生。若能夠及時(shí)針對(duì)滾動(dòng)軸承損傷程度進(jìn)行準(zhǔn)確評(píng)估,更加主動(dòng)地啟動(dòng)維護(hù)模式,對(duì)于減少事故發(fā)生率,提高設(shè)備使用效率都擁有重要的意義及應(yīng)用價(jià)值。
對(duì)滾動(dòng)軸承損傷程度進(jìn)行準(zhǔn)確識(shí)別,首先要提取能夠表征損傷程度加深的特征量。歐璐等[1]通過(guò)提取信號(hào)Hilbert包絡(luò)譜的頻率特征和能量熵特征實(shí)現(xiàn)軸承故障診斷。程小涵、劉蘊(yùn)哲等[2-3]結(jié)合時(shí)頻域統(tǒng)計(jì)特征和能量譜指標(biāo),利用投影尋蹤和距離評(píng)估判別方法研究特征指標(biāo)的聚類性和敏感性,篩選出關(guān)鍵特征完成軸承故障識(shí)別。本文決定結(jié)合時(shí)、頻域特征指標(biāo)建立特征集。為降低計(jì)算的復(fù)雜性及提高分類精度,需將表征軸承損傷狀態(tài)變化的敏感特征篩選出來(lái)。郭宏偉等[4]利用皮爾遜相關(guān)系數(shù)對(duì)選出的特征進(jìn)行冗余分析,再利用SVMRFE算法篩選出關(guān)鍵特征。肖艷與王欣杰等[5-6]利用ReliefF和F-score特征選擇方法剔除冗余特征,實(shí)現(xiàn)關(guān)鍵特征的選擇。各個(gè)特征選擇方法的選擇標(biāo)準(zhǔn)并不相同,利用單一方法容易造成特征的錯(cuò)選和漏選[7]。因此本文提出一種基于最大相關(guān)最大距離的特征選擇方法,利用皮爾遜相關(guān)系數(shù)度量類別與特征間的相關(guān)性,利用ReliefF和F-score方法評(píng)判特征的類別可分性,以完成關(guān)鍵特征的選擇。將篩選的敏感特征子集對(duì)應(yīng)的數(shù)據(jù)樣本輸入到概率神經(jīng)網(wǎng)絡(luò)[8]分類器中進(jìn)行訓(xùn)練和識(shí)別,完成軸承損傷程度的評(píng)估。
實(shí)現(xiàn)對(duì)軸承的損傷程度的準(zhǔn)確識(shí)別,關(guān)鍵是要找到對(duì)損傷狀態(tài)變化較為敏感和聚類能力強(qiáng)的特征指標(biāo)。由于軸承故障機(jī)理的復(fù)雜性,單一特征或單域特征難以全面、準(zhǔn)確刻畫(huà)軸承運(yùn)行狀態(tài)的復(fù)雜性[9]。針對(duì)軸承不同故障對(duì)應(yīng)的振動(dòng)信號(hào)與特征指標(biāo)的關(guān)系已有諸多研究,但是對(duì)軸承某一故障損傷程度加深情況下信號(hào)與特征指標(biāo)的關(guān)系研究較少。針對(duì)軸承損傷狀態(tài)的變化,特征的敏感性和聚類性也不一樣,為選取關(guān)鍵特征以全面描述軸承損傷程度變化,同時(shí)能夠兼顧所選特征的敏感性和穩(wěn)定性,決定選取時(shí)域特征和頻域特征構(gòu)建多域特征集。時(shí)域特征指標(biāo)共18個(gè),包括12個(gè)有量綱指標(biāo)和6個(gè)無(wú)量綱指標(biāo)。頻率特征指標(biāo)共12個(gè)。30個(gè)特征指標(biāo)的表達(dá)式如表1所示。
表1 時(shí)頻域特征指標(biāo)
多數(shù)特征選擇方法利用特征間的相關(guān)性來(lái)排除冗余特征,或通過(guò)評(píng)估特征的類別可分能力篩選出聚類能力強(qiáng)的敏感特征。然而,在實(shí)際計(jì)算時(shí)只能兩兩比較特征間的相關(guān)性,當(dāng)特征數(shù)目較大時(shí),運(yùn)算量巨大且效率低下。針對(duì)特征冗余性的判斷若沒(méi)有統(tǒng)一標(biāo)準(zhǔn)易造成錯(cuò)誤決策,從而影響后續(xù)軸承損傷程度識(shí)別的準(zhǔn)確率[10]。評(píng)判特征間的類別可分能力其實(shí)就是要找到使不同類別樣本的類間距離最大,類內(nèi)距離最小的特征量。不同距離評(píng)判方法擁有不同篩選特性和適用范圍,利用單一距離評(píng)判方法易造成關(guān)鍵特征的漏選和錯(cuò)選。遂提出一種將相關(guān)性評(píng)價(jià)函數(shù)和距離評(píng)價(jià)函數(shù)相結(jié)合的特征選擇方法。
最大相關(guān)最大距離(MRMD)方法的重點(diǎn)是找到一種特征排序度量標(biāo)準(zhǔn),其中包括:分析目標(biāo)類別和特征子集間的相關(guān)性以及不同特征的類別可分性。本文利用皮爾遜相關(guān)系數(shù)度量類別與特征間的關(guān)聯(lián)度,利用兩種距離評(píng)價(jià)函數(shù)評(píng)判特征的類別可分能力。在特征集中選出相關(guān)性和距離綜合最大的特征,得到低冗余度和目標(biāo)類關(guān)聯(lián)性強(qiáng)的特征子集。
為便于理解該方法,針對(duì)算法中需要用到的概念和已知量進(jìn)行符號(hào)定義。將輸入數(shù)據(jù)D分為N個(gè)標(biāo)簽,特征集中共有M個(gè)特征F={fi,i=1,…,M},目標(biāo)類別為C。目標(biāo)是找到包含m個(gè)關(guān)鍵特征的特征子集Rm,達(dá)到對(duì)不同樣本類別的進(jìn)行分類達(dá)到最大貢獻(xiàn)。
目標(biāo)類別C和特征子集Rm具有最大的相關(guān)性,此時(shí)可以得到最小的分類誤差。皮爾森相關(guān)系數(shù)適用于連續(xù)變量的計(jì)算并且易于實(shí)現(xiàn),選擇該測(cè)度計(jì)算相關(guān)性。
兩個(gè)向量X和Y的皮爾遜相關(guān)系數(shù)可以定義為:
(1)
(2)
(3)
(4)
xK和yK是向量X和Y中的第K個(gè)元素,結(jié)合兩個(gè)特征向量可以組合為多維向量。特征i的最大相關(guān)性可以定義為:
maxMRi=|PCC(Fi,Ci)|(1≤i≤M)
(5)
為進(jìn)一步排除冗余特征,在最大距離特征評(píng)價(jià)準(zhǔn)則下綜合ReliefF和F-score兩種特征選擇方法完成關(guān)鍵特征的篩選工作。
Relief算法的核心思想是對(duì)每個(gè)待識(shí)別的特征分配一個(gè)相關(guān)性加權(quán)值,使用加權(quán)值的大小衡量特征的類別可分能力。本文用其改進(jìn)算法ReliefF對(duì)多類軸承損傷程度樣本進(jìn)行區(qū)分。
在該算法中,對(duì)每一個(gè)不同類都找出所選樣本的k個(gè)近鄰,使用每類的先驗(yàn)概率進(jìn)行加權(quán),將k個(gè)近鄰對(duì)權(quán)值的貢獻(xiàn)進(jìn)行平均實(shí)現(xiàn)權(quán)值的更新,該方法提高了特征有效性估計(jì)的可靠性。其算法的實(shí)現(xiàn)過(guò)程如下所示:
輸入?yún)?shù):特征權(quán)值初始化為零:Wj=0
(1)forj=1:T
從訓(xùn)練樣本中選擇一個(gè)樣本x
(2)fori=1:M
找出x的k個(gè)同類近鄰;
(3)for 從每一個(gè)類別C≠class(x)
找出樣本x的k個(gè)不同類近鄰;
(4)計(jì)算每個(gè)特征的權(quán)值
(6)
將計(jì)算所得的Wi根據(jù)其值大小進(jìn)行排序,取Wi較大的前k個(gè)特征作為所篩選的關(guān)鍵特征。
F-score是一種基于類內(nèi)類間距離的特征評(píng)價(jià)算法。實(shí)際碰到的問(wèn)題多是多分類問(wèn)題,需將原始公式進(jìn)行改良。文獻(xiàn)[11]對(duì)原公式進(jìn)行了具體改進(jìn)從而適合多分類樣本的特征評(píng)價(jià)問(wèn)題。
給定樣本集xk∈Dm,k=1,2,3,…,n;N為樣本類別數(shù),nj為第j類樣本的個(gè)數(shù),其中j=1,2,…,N。第i個(gè)特征的F-score值如下定義:
(7)
通過(guò)式(6)和式(7)可以定義最大距離的表達(dá)式,如下所示:
maxMDi=max(Wi+Fi)
(8)
在對(duì)計(jì)算所得評(píng)分進(jìn)行歸一化后,可以線性相加綜合反應(yīng)該特征的類別可分性和類別相關(guān)性,結(jié)合上述兩個(gè)約束標(biāo)準(zhǔn)可以定義最大相關(guān)最大距離的表達(dá)式如下所示:
max(MDi+MRi)
(9)
在式(9)中目標(biāo)類別與特征子集間的相關(guān)性以及不同特征的類別可分性占有相同的權(quán)重,利用此公式不一定能得到最優(yōu)特征子集。因此對(duì)最大相關(guān)與最大距離賦予不同的權(quán)重因子以獲得最好的特征選擇結(jié)果,對(duì)式(9)進(jìn)行改進(jìn)如下所示:
max(μMDi+(1-μ)MRi)
(10)
式中,μ的取值范圍為0≤μ≤1,遞增步長(zhǎng)為0.1。
利用MRMD特征選擇方法進(jìn)行軸承損傷程度的識(shí)別步驟如下:
(1)研究對(duì)象為軸承內(nèi)圈裂紋故障,包括4種不同損傷程度的數(shù)據(jù)樣本,分為訓(xùn)練樣本集和待測(cè)樣本集。對(duì)原始數(shù)據(jù)樣本提取時(shí)域、頻域特征統(tǒng)計(jì)量共計(jì)30個(gè),組成原始特征集。
(2)將權(quán)重因子以0.1為步長(zhǎng)進(jìn)行賦值,即μ=0,0.1,…,1。利用MRMD分別得到不同權(quán)重因子對(duì)應(yīng)的特征子集。利用ELM[12]以每次遞增一個(gè)特征的方式計(jì)算分類正確率,以分類正確率為評(píng)判標(biāo)準(zhǔn)確定最佳權(quán)重因子μ以及應(yīng)選取關(guān)鍵特征的個(gè)數(shù)m。
(3)分別采用皮爾遜相關(guān)系數(shù)、ReliefF、F-score、MRMD特征選擇方法,對(duì)建立的多域特征集的各個(gè)特征進(jìn)行評(píng)分并排序。比較4種特征選擇方法的排序結(jié)果。將得分高的前m個(gè)特征作為敏感特征子集。
(4)同樣以分類器正確率為標(biāo)準(zhǔn),驗(yàn)證4種特征評(píng)價(jià)方法所篩選的特征子集是否具有較好的類別可分性和類別相關(guān)性。將特征子集對(duì)應(yīng)的訓(xùn)練樣本輸入到PNN分類器中進(jìn)行訓(xùn)練和測(cè)試,根據(jù)分類正確率對(duì)不同的特征選擇方法的性能進(jìn)行評(píng)判,完成軸承損傷程度的識(shí)別。
為了驗(yàn)證本文所提出方法的有效性,軸承試驗(yàn)數(shù)據(jù)來(lái)源美國(guó)Case Western Reserve University 滾動(dòng)軸承驗(yàn)測(cè)試數(shù)據(jù)[13]。對(duì)象選擇電動(dòng)機(jī)驅(qū)動(dòng)端支撐軸承,型號(hào)為SKF6205。使用電火花加工在軸承上布置單點(diǎn)故障。故障類型選擇內(nèi)圈裂紋故障,裂紋寬度分別為0.18mm、0.35mm、0.53mm、0.71mm。采樣頻率為12 kHz,轉(zhuǎn)速為1797r/min,采集4種不同損傷程度的數(shù)據(jù)樣本。
每種狀態(tài)數(shù)據(jù)樣本取28組數(shù)據(jù)共計(jì)112組,每組數(shù)據(jù)包括4096個(gè)點(diǎn),組成112×4096原始特征矩陣,計(jì)算特征值組成112×30特征矩陣作為特征選擇算法初始輸入信息。類別標(biāo)簽N=4,待選特征子集F中共30個(gè)特征,依照前節(jié)給出所定義計(jì)算公式帶入具體參數(shù)計(jì)算特征評(píng)分。利用分類器進(jìn)行識(shí)別時(shí),每種狀態(tài)數(shù)據(jù)取16組作為訓(xùn)練樣本,12組為測(cè)試樣本用于軸承損傷程度的識(shí)別。
根據(jù)已知參數(shù)利用MRMD方法按照步驟(2)求取不同權(quán)重因子對(duì)應(yīng)的特征子集并進(jìn)行降序排列。采用ELM分類器測(cè)試特征子集,按照排序結(jié)果逐一添加特征。ELM激活函數(shù)選擇Sigmoid函數(shù),隱含層節(jié)點(diǎn)數(shù)為4。不同權(quán)重對(duì)應(yīng)分類正確率的變化如圖1所示。
(a) μ=0.1~0.4對(duì)應(yīng)分類正確率曲線
(b) μ=0.5~0.7對(duì)應(yīng)分類正確率曲線
(c) μ=0.8~1對(duì)應(yīng)分類正確率曲線 圖1 不同權(quán)重對(duì)應(yīng)分類正確率曲線
由圖1可知,隨著特征數(shù)目的增加分類正確率先逐漸增大到達(dá)峰值后呈緩慢下降趨勢(shì)。不同權(quán)重對(duì)應(yīng)的最高分類正確率也不同,當(dāng)μ=0.4時(shí)達(dá)到最高分類正確率為97.1%,所需特征數(shù)目為6個(gè)。所以本文選擇權(quán)重因子μ=0.4,選取前m個(gè)關(guān)鍵特征的個(gè)數(shù)m=6。
接下來(lái)采用皮爾遜相關(guān)系數(shù)、ReliefF、F-score以及本文所提出的MRMD特征選擇方法,對(duì)建立的多域特征集的各個(gè)特征進(jìn)行評(píng)分并排序。依照前節(jié)給出的計(jì)算公式帶入具體參數(shù)計(jì)算評(píng)分,結(jié)果如圖2所示。
(a) 皮爾遜相關(guān)系數(shù)評(píng)分
(b) F-score評(píng)分
(c) ReliefF評(píng)分
(d) MRMD評(píng)分 圖2 特征評(píng)分結(jié)果
由圖2中的評(píng)分結(jié)果可以看出4種特征選擇方法得到的評(píng)價(jià)結(jié)果有較大差別。為更直觀的了解所篩選特征的重要性,將所有特征值按評(píng)分從高到低排序。依照之前計(jì)算所得m=6,4種特征選擇算法統(tǒng)一選取評(píng)分最高的前6個(gè)特征,排序結(jié)果如表2所示。4種特征選擇方法所選取的6個(gè)特征存在著較大的差別。為驗(yàn)證MRMD較其他方法擁有較好的特征篩選能力,將4種方法所篩選特征對(duì)應(yīng)的數(shù)據(jù)分布樣本輸入到PNN中進(jìn)行訓(xùn)練和識(shí)別,驗(yàn)證MRMD方法所篩特征的類別可分能力。
表2 特征排序結(jié)果
PNN的學(xué)習(xí)與訓(xùn)練過(guò)程較為簡(jiǎn)單,能夠較快的完成樣本的訓(xùn)練和預(yù)測(cè)工作且噪聲對(duì)其影響較低,能夠用線性方法計(jì)算非線性數(shù)據(jù)。輸入層神經(jīng)元個(gè)數(shù)特征矩陣的維數(shù)30;模式層神經(jīng)元個(gè)數(shù)等于總樣本數(shù)112,激活函數(shù)為高斯函數(shù);求和層神經(jīng)元個(gè)數(shù)為樣本類別數(shù)4。
每種損傷狀態(tài)共計(jì)28組數(shù)據(jù),其中16組作為訓(xùn)練樣本,12組作為測(cè)試樣本。由于樣本均為隨機(jī)選取,對(duì)測(cè)試樣本重復(fù)10次識(shí)別過(guò)程,得到共計(jì)120組樣本的損傷程度識(shí)別結(jié)果,并以平均準(zhǔn)確率近似代表實(shí)際準(zhǔn)確率,分類準(zhǔn)確率如表3所示,括號(hào)內(nèi)為識(shí)別樣本總數(shù)。
表3 分類準(zhǔn)確率
由表3可以看出,由MRMD所選特征樣本輸入到PNN分類器中得到的測(cè)試集準(zhǔn)確率高達(dá)97.92%,只有極少部分?jǐn)?shù)據(jù)樣本出現(xiàn)錯(cuò)誤識(shí)別。以分類正確率為依據(jù)可知MRMD特征選擇方法具有較好的特征評(píng)價(jià)和篩選能力。表中前3種方法特征樣本的測(cè)試集準(zhǔn)確率較低,不能單獨(dú)使用某一方法進(jìn)行特征篩選。
針對(duì)軸承損傷程度難以識(shí)別的問(wèn)題,以軸承內(nèi)圈裂紋故障為研究對(duì)象,提出一種基于MRMD特征評(píng)價(jià)準(zhǔn)則的特征選擇方法,研究30種常用時(shí)頻域特征指標(biāo)對(duì)不同損傷程度軸承數(shù)據(jù)的敏感性和類別可分性。利用MRMD方法對(duì)所有特征進(jìn)行評(píng)價(jià),將得到的評(píng)分來(lái)衡量各特征指標(biāo)的類別可分能力。MRMD方法集成皮爾遜相關(guān)系數(shù)、F-score、ReliefF特征選擇算法,綜合考慮不同類別數(shù)據(jù)樣本間的距離以及不同類數(shù)據(jù)樣本和類別標(biāo)簽間的相關(guān)性。最后結(jié)合西儲(chǔ)大學(xué)的軸承實(shí)驗(yàn)數(shù)據(jù),依據(jù)評(píng)分排序得到6個(gè)關(guān)鍵特征。利用PNN分類器進(jìn)行驗(yàn)證,MRMD方法得到較高的正確率,證明該方法在軸承損傷程度識(shí)別方面的可行性和使用價(jià)值,其較單一特征選擇方法能夠篩選出類別可分能力強(qiáng)的關(guān)鍵特征。該方法的提出能為軸承狀態(tài)的檢測(cè)和安全運(yùn)行篩選出可靠特征,提高了軸承故障診斷的準(zhǔn)確性和可靠性。