董 飛 ,俞 嘯 ,3,丁恩杰 ,吳守鵬
(1.中國(guó)礦業(yè)大學(xué)信息與控制工程學(xué)院,江蘇 徐州 221008;2.中國(guó)礦業(yè)大學(xué)物聯(lián)網(wǎng)(感知礦山)研究中心,江蘇 徐州 221008;3.徐州醫(yī)科大學(xué)醫(yī)學(xué)信息學(xué)院,江蘇 徐州 221009)
滾動(dòng)軸承作為旋轉(zhuǎn)機(jī)械設(shè)備的關(guān)鍵部件之一,其發(fā)生故障會(huì)嚴(yán)重影響到旋轉(zhuǎn)機(jī)械的安全穩(wěn)定運(yùn)行[1]。因此,進(jìn)行滾動(dòng)軸承的狀態(tài)監(jiān)測(cè)與故障診斷對(duì)保障安全生產(chǎn)和降低維護(hù)成本具有重要意義。近年來(lái),隨著信號(hào)處理、數(shù)據(jù)挖掘以及人工智能的快速發(fā)展,基于數(shù)據(jù)驅(qū)動(dòng)的方法在滾動(dòng)軸承故障診斷中變得越來(lái)越重要,其主要可分為四個(gè)步驟:信號(hào)處理,特征提取,特征降維和故障模式識(shí)別[2-3]。
滾動(dòng)軸承在運(yùn)行過程中的振動(dòng)信號(hào)蘊(yùn)含著豐富的狀態(tài)信息,是軸承故障狀態(tài)分析與診斷的有效手段[2]。小波變換是分析非線性、非平穩(wěn)振動(dòng)信號(hào)的有效方法,但是由于小波變換沒有對(duì)信號(hào)的高頻部分做進(jìn)一步的分解,容易導(dǎo)致高頻部分故障特征信息的丟失。針對(duì)此問題,在小波變換的基礎(chǔ)上,小波包變換被提出,它能進(jìn)一步分解信號(hào)在高頻區(qū)的細(xì)節(jié)系數(shù),提供更詳細(xì)、更全面的時(shí)頻面。文獻(xiàn)[4]將小波包分解及其能量譜用于發(fā)動(dòng)機(jī)連桿軸承故障診斷;文獻(xiàn)[5]將小波包能量特征與徑向基函數(shù)網(wǎng)絡(luò)相結(jié)合,建立了滾動(dòng)軸承故障監(jiān)測(cè)模型;文獻(xiàn)[6]通過計(jì)算小波包提取的信號(hào)包絡(luò)譜的峰值,增強(qiáng)信號(hào)峭度特征,用于微弱瞬時(shí)信號(hào)的監(jiān)測(cè)。
結(jié)合小波包變換與統(tǒng)計(jì)參數(shù)可得到高維原始特征集。然而,由于故障類型與統(tǒng)計(jì)特征之間存在復(fù)雜的映射關(guān)系,原始特征集中存在干擾和冗余特征,可能會(huì)影響故障診斷的準(zhǔn)確度。因此,提出一種基于樸素貝葉斯的故障敏感特征選擇方法(Features Selection Based on Naive Bayes,F(xiàn)SNB),實(shí)現(xiàn)對(duì)原始特征集中單個(gè)統(tǒng)計(jì)特征的故障敏感度的量化分析,篩選出故障敏感度較高的統(tǒng)計(jì)特征進(jìn)行故障診斷。
在特征降維方面,領(lǐng)域保持嵌入(Neighborhood Preserving Embedding,NPE),是一種非監(jiān)督的線性降維方法,其主要目標(biāo)是保持?jǐn)?shù)據(jù)流行中的局部結(jié)構(gòu)。LDA作為一種經(jīng)典的線性降維方法,其可以將故障的類別信息考慮到特征降維過程中。因此可以結(jié)合NPE與LDA各自的優(yōu)點(diǎn),提出一種改進(jìn)的特征降維方法,基于類別標(biāo)簽的監(jiān)督鄰域保持嵌入方法(Supervised Neighborhood Preserving Embedding with Label Information,SNPEL),以此來(lái)提高故障診斷的精度與適應(yīng)性。
在故障模式識(shí)別方面,采用KNN方法。KNN是一種經(jīng)典的非參數(shù)分類方法,在模式識(shí)別領(lǐng)域得到了廣泛的應(yīng)用。文獻(xiàn)[7]利用局部均值分解和KNN實(shí)現(xiàn)滾動(dòng)軸承故障診斷。文獻(xiàn)[8]利用模糊K近鄰支持向量進(jìn)行數(shù)據(jù)描述,從而實(shí)現(xiàn)水電機(jī)組振動(dòng)故障診斷。
首先利用WPT分解振動(dòng)信號(hào),得到終端節(jié)點(diǎn)的單支重構(gòu)信號(hào)并計(jì)算其包絡(luò)譜(Hilbert Envelope Spectrum,HES),隨后結(jié)合統(tǒng)計(jì)參數(shù),可得到原始統(tǒng)計(jì)特征集。然后利用樸素貝葉斯方法進(jìn)行敏感特征的篩選,再利用提出的基于類別標(biāo)簽的監(jiān)督NPE方法進(jìn)行特征降維,得到新的特征集并用于訓(xùn)練KNN分類器。最后,已訓(xùn)練的分類器用于對(duì)測(cè)試數(shù)據(jù)進(jìn)行故障診斷。實(shí)驗(yàn)分析結(jié)果表明,該模型可以達(dá)到比較理想的滾動(dòng)軸承故障識(shí)別效果。
樸素貝葉斯算法是基于貝葉斯定理的分類方法。根據(jù)已有的樣本數(shù)據(jù)實(shí)例,運(yùn)用貝葉斯公式來(lái)判定待測(cè)數(shù)據(jù)的歸類問題。貝葉斯算法的主要思想是將事件的先驗(yàn)概率和后驗(yàn)概率相聯(lián)系,并利用先驗(yàn)信息預(yù)測(cè)事件的后驗(yàn)概率。樸素貝葉斯算法還具有自學(xué)習(xí)能力,可以將新數(shù)據(jù)記錄加入到已知的先驗(yàn)信息中,從而進(jìn)一步影響事件的后驗(yàn)概率,提高事件預(yù)測(cè)的準(zhǔn)確性。
貝葉斯公式如下:
式中:P(A|B)—條件B下A的后驗(yàn)概率;P(A)—A的先驗(yàn)概率;P(B|A)—條件A下B的后驗(yàn)概率;P(B)—B的先驗(yàn)概率。
令訓(xùn)練樣本為 X={x1,x2,…,xn},每個(gè)樣本對(duì)應(yīng)的類別為label(xi)∈C,其中C={c1,c2,…,cm}表示類別集合,T={t1,t2,…,tn}為測(cè)試樣本。
樣本T歸屬于類cj的后驗(yàn)概率為:
式中:P(cj|t1,t2,…,tn)—測(cè)試樣本歸入故障類型 cj的后驗(yàn)概率;P(t1,t2,…,tn|cj)—故障類型 cj的條件概率;式中 P(cj)為故障類型 cj的先驗(yàn)概率;α=1/P(t1,t2,…,tn),α 為常量。樸素貝葉斯算法根據(jù)式(2)計(jì)算出全部類 cj,j=1,2,…,m 的后驗(yàn)概率,然后將測(cè)試樣本中數(shù)據(jù)歸入后驗(yàn)概率最大的類中。樸素貝葉斯是以各屬性變量間相互獨(dú)立的條件為基礎(chǔ),因此,式(1)中的后驗(yàn)概率的計(jì)算可以變換為:
在訓(xùn)練樣本中,共有M種故障類型,每種故障類型有N個(gè)樣本,每個(gè)樣本有K種統(tǒng)計(jì)特征。故障敏感特征選擇的目標(biāo)是從K種統(tǒng)計(jì)特征中選擇出對(duì)故障類型較為敏感的特征,然后組成新的特征集。對(duì)于每種統(tǒng)計(jì)特征,利用樸素貝葉斯算法對(duì)其樣本進(jìn)行分類,分類的精度作為衡量其故障敏感程度的指標(biāo)。
經(jīng)信號(hào)處理和統(tǒng)計(jì)參數(shù)計(jì)算,可以得到原始特征集[FS1,F(xiàn)S2,…,F(xiàn)SK],其中 FSk如下所示:
圖1 訓(xùn)練集樣本Saccuracy序列值分布Fig.1 Saccuracy Sequence Distribution of Training Samples
然后,利用樸素貝葉斯算法對(duì)每種故障狀態(tài)樣本分別進(jìn)行分類,得到分類精度Accurac,將 Saccuracy(k)=Accurac作為第k種統(tǒng)計(jì)特征對(duì)故障敏感程度的衡量指標(biāo)。可以得到一個(gè)分類精度和的序列Saccuracy={Saccuracy(1),Saccuracy(2),…,Saccuracy(K)}。最后,對(duì)分類精度和的序列進(jìn)行降序排列。我們認(rèn)為Saccuracy(k)值越大,說(shuō)明該統(tǒng)計(jì)特征對(duì)故障敏感程度越高,更適合用于故障診斷與分類。訓(xùn)練集樣本Saccuracy序列值分布,如圖1所示。
提出了一種基于類別標(biāo)簽的監(jiān)督NPE方法,該方法的目標(biāo)是可以在保持高維數(shù)據(jù)局部幾何結(jié)構(gòu)不變的同時(shí),通過融合LDA的優(yōu)化目標(biāo),構(gòu)建出一個(gè)新的優(yōu)化目標(biāo)函數(shù)。使得在降維過程中考慮了類別標(biāo)簽信息,獲得判別性較強(qiáng)的低維表示,從而更有利于故障診斷與分類。
令訓(xùn)練樣本為 X={x1,x2,…,xn},其中 xi∈Rm,n 訓(xùn)練樣本的個(gè)數(shù),m為訓(xùn)練樣本的維數(shù)。每個(gè)樣本對(duì)應(yīng)的類別為label(xi)∈C,其中 C={c1,c2,…,cm}表示類別集合。尋找一個(gè)映射矩陣 A={a1,a2,…,ad},其中 ai∈Rm,d 為將訓(xùn)練樣本進(jìn)行映射之后的維度,將Rm空間的數(shù)據(jù)映射到一個(gè)相對(duì)維度較低的特征空間Rd(d≤m)中。數(shù)據(jù)點(diǎn)xi在Rd中的表示為yi,且yi=ATxi。
SNPEL的第一個(gè)優(yōu)化目標(biāo)是保持?jǐn)?shù)據(jù)集的局部鄰域流行結(jié)構(gòu)不變,構(gòu)造訓(xùn)練樣本上的近鄰圖時(shí)采用的方法和LLE相同。令xi的近鄰集合為knn(xi),其近鄰圖重構(gòu)權(quán)重系數(shù)矩陣W滿足下面要求[9-10]:
對(duì)于非0的權(quán)重系數(shù),需要通過最小化重構(gòu)損失函數(shù)求得:
當(dāng)W可以在Rm空間中重構(gòu)出數(shù)據(jù)點(diǎn)xi,那么在Rd空間中也可以重構(gòu)對(duì)應(yīng)的點(diǎn)yi。所以映射矩陣的求解可以轉(zhuǎn)換為求解下述最小化問題得到:
SNPEL的第二個(gè)優(yōu)化目標(biāo)是最大化類間散度和最小化類內(nèi)散度,來(lái)獲得判別性較強(qiáng)的低維表示。其中,類間散度矩陣Sb和類內(nèi)散度矩SW陣定義如下:
式中:cl—第 l類樣本集合;μl—第 l類樣本均值;μ—所有樣本均值。類間散度矩陣Sb和類內(nèi)散度矩陣SW的等價(jià)形式如下:
式中:Pb=、PW=—權(quán)值矩陣;Db、DW—n×n 的對(duì)角矩陣,從上式中可以看出和中體現(xiàn)類別的判別信息。于是,SNPEL的第二個(gè)優(yōu)化目標(biāo)可歸結(jié)為下面的優(yōu)化問題:
利用式(7)來(lái)保持樣本原有的局部幾何結(jié)構(gòu),利用式(14)和式(15)實(shí)現(xiàn)最大化類間散度和最小化類內(nèi)散度,結(jié)合式(7),式(14)和式(15),可得SNPEL的優(yōu)化目標(biāo)函數(shù)如下:
結(jié)合式(10)和式(11),可改寫成跡比優(yōu)化形式:
式中:Z=(I-W)T(I-W),I=diag(1,…,1),對(duì)于上式,還需要對(duì)分母
進(jìn)行歸一化,因此優(yōu)化目標(biāo)函數(shù)最終為:
式中:(DW-PW)nor、Znor—經(jīng)過歸一化后的矩陣。最終,SNPEL 的目標(biāo)函數(shù)優(yōu)化問題轉(zhuǎn)化為下面的廣義特征值求解問題:
其中,L=(DW-PW)nor,S=(DW-PW)nor+Znor。假設(shè)是式(19)特征值λ0≥λ1≥…≥λM所對(duì)應(yīng)的特征向量,則用于降維的映射矩陣由前 d 個(gè)特征向量組成,即 A={a1,a2,…,ad}。因此,給定 xi∈Rm,可以得到其相應(yīng)的映射變換 yi∈Rd:xi→yi=ATxi。
圖2 故障診斷方法系統(tǒng)結(jié)構(gòu)示意圖Fig.2 System Structure of the Fault Diagnosis Method
所提出的故障診斷方法系統(tǒng)結(jié)構(gòu),如圖2所示。整個(gè)故障診斷過程分為四個(gè)步驟:信號(hào)處理,特征提取,特征降維和故障模式識(shí)別。在第一步中,原始振動(dòng)信號(hào)經(jīng)WPT處理,得到終端節(jié)點(diǎn)的單支重構(gòu)信號(hào)并計(jì)算包絡(luò)譜,結(jié)合統(tǒng)計(jì)參數(shù),得到原始特征集;第二步中,將原始特征集經(jīng)過基于樸素貝葉斯的故障敏感特征選取方法處理,得到故障敏感特征。第三步中,對(duì)于訓(xùn)練樣本的高維特征集,利用SNPEL方法,得到低維特征集,并作為分類器的輸入,同時(shí)還得到降維映射矩陣,直接用于測(cè)試樣本的高維特征集降維。第四步中,將從訓(xùn)練樣本中得到的低維特征集用于訓(xùn)練分類器,訓(xùn)練好的分類器直接運(yùn)用于測(cè)試樣本的故障診斷。
使用美國(guó)凱斯西儲(chǔ)大學(xué)滾動(dòng)軸承數(shù)據(jù)中心的軸承振動(dòng)數(shù)據(jù),驅(qū)動(dòng)端采用型號(hào)為6205-2RS JEM SKF的深溝球軸承,故障類型有滾珠故障、內(nèi)圈故障和外圈故障,故障尺寸有0.007英寸,0.014英寸,0.021英寸和0.028英寸。電機(jī)的工作負(fù)載范圍是(0~3)hp,對(duì)應(yīng)轉(zhuǎn)速為1730到1797r/min。正常情況在內(nèi)的12種故障模式,如表1所示。從每種故障模式中提取60個(gè)振動(dòng)信號(hào)樣本,每個(gè)樣本包含2000個(gè)連續(xù)的數(shù)據(jù)點(diǎn)。由于滾動(dòng)軸承在實(shí)際工作環(huán)境中,其負(fù)載是變化的,處于變工況狀態(tài)。因此為了驗(yàn)證提出故障診斷算法在變工況狀態(tài)下的有效性和適應(yīng)性,設(shè)計(jì)了四個(gè)驗(yàn)證案例。有兩組對(duì)比實(shí)驗(yàn),每組中均是采用一種電機(jī)負(fù)載的樣本做訓(xùn)練集,不同電機(jī)負(fù)載的樣本做測(cè)試集。其中,案例1和案例2均采用2hp樣本作為訓(xùn)練集,案例1使用2hp的樣本為測(cè)試集,案例2使用3hp的樣本為測(cè)試集。案例3和案例4也是類似的對(duì)比實(shí)驗(yàn),其不同在于采用3hp的樣本作為訓(xùn)練集。
表2 統(tǒng)計(jì)參數(shù)Tab.2 Statistical Parameters
利用WPT處理原始振動(dòng)信號(hào),在實(shí)驗(yàn)中,選用“db5”小波,經(jīng)四層小波包分解得到的16個(gè)終端節(jié)點(diǎn)信號(hào)的單支重構(gòu)信號(hào),再分別計(jì)算出其希爾伯特包絡(luò)譜,結(jié)合表2所示的6個(gè)統(tǒng)計(jì)參數(shù),可以得到96個(gè)時(shí)域統(tǒng)計(jì)特征和96個(gè)包絡(luò)譜統(tǒng)計(jì)特征,共192個(gè)統(tǒng)計(jì)特征,構(gòu)成原始特征集(OriginalFeatures Set,OFS)。利用FSNB方法計(jì)算得到的訓(xùn)練集樣本Saccuracy序列值分布,如圖1所示。說(shuō)明不同的統(tǒng)計(jì)特征對(duì)于故障敏感程度不同,我們可以基于此選擇出故障敏感度高的特征子集用于故障診斷,如表1、表2所示。
表1 實(shí)驗(yàn)中使用的振動(dòng)數(shù)據(jù)集Tab.1 The Used Vibration Dataset in Experiments
分別對(duì) OFS-KNN、OFS-FSNB-PCA-KNN、OFS-FSNBLDA-KNN和OFS-FSNB-SNPEL-KNN故障模型開展實(shí)驗(yàn)分析。這五個(gè)模型均是基于KNN的故障診斷模型,OFS-KNN是原始特征集(OFS)直接用于訓(xùn)練KNN。其余模型是首先將原始特征集進(jìn)過FSNB敏感特征選擇之后,將敏感特征分別使用PCA、LDA和SNPEL降維處理,結(jié)果用于訓(xùn)練KNN,最后將訓(xùn)練好的模型用于對(duì)測(cè)試樣本進(jìn)行故障診斷。四個(gè)案例所對(duì)應(yīng)實(shí)驗(yàn)結(jié)果,每一個(gè)子圖中是四種故障分析模型的精度曲線,橫軸表示所選取的敏感特征數(shù),縱軸是故障診斷的精度,如圖3所示。
圖3 四個(gè)故障診斷模型的實(shí)驗(yàn)結(jié)果Fig.3 Experimental Results of Four Fault Diagnosis Models
實(shí)驗(yàn)中PCA的降維大小為15,LDA的降維大小為11,SNPEL的降維大小為20。從圖中可以看出,對(duì)于案例1和案例3,sfn在一定的范圍內(nèi),四種故障分析模型均表現(xiàn)出較好的性能。對(duì)于案例2和案例4,sfn在一個(gè)較寬的范圍內(nèi),OFS-FSNBSNPEL-KNN 表現(xiàn)出更好的性能,例如,sfn在(60~110)時(shí),故障診斷的精度均可達(dá)到95%以上。因此,實(shí)驗(yàn)結(jié)果表明所提出的故障敏感特征選擇方法FSNB與改進(jìn)的降維方法SNPEL對(duì)于變工況下的滾動(dòng)軸承故障診斷具有良好的效果與適應(yīng)性,可應(yīng)用于智能故障診斷系統(tǒng)。
在對(duì)WPT、樸素貝葉斯以及NPE的研究基礎(chǔ)上,提出一種基于樸素貝葉斯的故障敏感特征選擇方法和監(jiān)督NPE的特征降維方法,建立OFS-FSNB-SNPEL-KNN故障診斷模型,同時(shí)還設(shè)置了其他三種故障診斷模型(OFS-KNN,OFS-FSNB-PCA-KNN,和OFS-FSNB-LDA-KNN),實(shí)驗(yàn)分析結(jié)果表明:
(1)提出的FSNB方法,可以從時(shí)頻分析得到的原始統(tǒng)計(jì)特征集中提取出故障狀態(tài)敏感的特征分量,可以有效提高后續(xù)故障識(shí)別準(zhǔn)確率;
(2)提出的SNPEL方法,可以實(shí)現(xiàn)降維過程中,既保持?jǐn)?shù)據(jù)間集合結(jié)構(gòu)不變,也最大化類間散度和最小化類內(nèi)散度,從而得到更有利于故障診斷與分類的特征空間;
(3)對(duì)于OFS-FSNB-SNPEL-KNN故障診斷模型,選擇合適故障敏感特征數(shù)量,可以獲取較高的滾動(dòng)軸承故障診斷識(shí)別率。