陳 英,陳木榮
(1.長(zhǎng)沙民政職業(yè)技術(shù)學(xué)院 電子信息工程學(xué)院,湖南 長(zhǎng)沙 410004;2.華南理工大學(xué) 機(jī)械與汽車工程學(xué)院,廣東 廣州 510640;3.廣東理工學(xué)院 機(jī)電工程系,廣東 肇慶 526100)
滾動(dòng)軸承是旋轉(zhuǎn)機(jī)械設(shè)備中必不可少的重要零件,其狀態(tài)的好壞直接影響整個(gè)機(jī)械設(shè)備的安全運(yùn)行。因此,對(duì)滾動(dòng)軸承工作狀態(tài)的監(jiān)測(cè)及其故障識(shí)別一直是學(xué)者們的研究熱點(diǎn)。
隨著對(duì)滾動(dòng)軸承狀態(tài)判別算法研究的不斷深入,各種故障識(shí)別器被應(yīng)用于滾動(dòng)軸承故障識(shí)別領(lǐng)域,并取得了一定的效果[1,2]。
隨著模式識(shí)別算法的快速發(fā)展,各種分類器(算法)被廣泛應(yīng)用于滾動(dòng)軸承狀態(tài)識(shí)別中,如支持向量機(jī)(support vector machine,SVM)、線性判別分析、k近鄰、貝葉斯分類器、極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)等[3-8]。
上述經(jīng)典分類器是在輸入特征為向量形式的基礎(chǔ)上構(gòu)造的。而在實(shí)際應(yīng)用中,拾取的滾動(dòng)軸承振動(dòng)信號(hào)記錄了一段時(shí)間內(nèi)的波動(dòng)信息,使其以二維矩陣的形式得以表現(xiàn)出來。為適應(yīng)傳統(tǒng)分類器對(duì)輸入數(shù)據(jù)的形式要求,通常需要將拾取的特征矩陣重塑為向量,或以向量形式提取特征。然而,由于二維振動(dòng)信號(hào)行和列之間的高度相關(guān)性,矢量化會(huì)破壞特征矩陣的列或行之間的結(jié)構(gòu)信息[9]。
為了解決上述問題,LUO Luo等人[10]提出了一種新的支持矩陣機(jī)(support matrix machine,SMM),它可以充分利用特征矩陣的結(jié)構(gòu)信息,采用交替方向乘子法,來優(yōu)化SMM的目標(biāo)函數(shù),獲得良好的分類效果。
此外,在SMM的基礎(chǔ)上,相關(guān)學(xué)者又陸續(xù)提出了一系列的改進(jìn)算法。ZHENG Qing-qing等人[11,12]提出了多分類支持矩陣機(jī)(multiclass support matrix machine,MSMM)和稀疏支持矩陣機(jī)(sparse support matrix machine,SSMM);PAN Hai-yang等人[13]提出了辛增量矩陣機(jī)(symplectic incremental matrix machine,SIMM);YE Yun-fei等人[14]提出了多距離支持矩陣機(jī)(multi-distance support matrix machines,MDSMM);LI Xin等人[15]提出了辛加權(quán)稀疏支持矩陣機(jī)(symplectic weighted sparse support matrix machine,SWSSMM)。
SMM及其改進(jìn)算法都是以矩陣形式對(duì)滾動(dòng)軸承的含噪信號(hào)、冗余特征等進(jìn)行分類,可以完成不同工況下的分類問題。
隨著SMM算法的理論和應(yīng)用研究的不斷增加,該方法的一些不足之處也逐漸顯現(xiàn)出來,如結(jié)果缺乏必要的概率信息,預(yù)測(cè)的結(jié)果不具有統(tǒng)計(jì)意義,預(yù)測(cè)結(jié)果的不確定性無法估算,等。同時(shí),隨訓(xùn)練樣本集的規(guī)模增大,采用該方法所獲得的支持向量的個(gè)數(shù)也呈線性增長(zhǎng),這使得模型的稀疏性有限[16]。
鑒于SMM的不足,筆者結(jié)合再生核希爾伯特空間(reproducing kernel Hilbert space,RHKS)[17],并利用貝葉斯統(tǒng)計(jì)方法進(jìn)行推理,提出了一種相關(guān)支持矩陣機(jī)(relevance support matrix machine,RSMM)。
與SMM方法相比,RSMM是一種基于貝葉斯框架的統(tǒng)計(jì)學(xué)習(xí)方法,該方法利用貝葉斯學(xué)習(xí)框架,為模型參數(shù)施加一個(gè)條件概率分布的約束,可以得到稀疏的解空間。同時(shí),在SMM方法中,只有滿足Mercer條件限制的核函數(shù),才可以用來構(gòu)造非線性的SMM。由于RSMM是以貝葉斯統(tǒng)計(jì)框架構(gòu)造的模型,其核函數(shù)不受Mercer條件限制,可以獲得各類別之間的概率統(tǒng)計(jì)信息,從而可以對(duì)不確定樣本進(jìn)行分類。
此外,多核函數(shù)的引入可以解決由多個(gè)不同數(shù)據(jù)源帶來的復(fù)雜問題;將先驗(yàn)概率引入到模型權(quán)重設(shè)置中,利用超參數(shù)對(duì)權(quán)重進(jìn)行一對(duì)一分配,可使多數(shù)權(quán)值的后驗(yàn)分布近似于零。由此可以說明,RSMM模型是稀疏的,且在復(fù)雜數(shù)據(jù)模式識(shí)別中,在特征提取的多元化和異常數(shù)據(jù)的多樣性方面,該方法具有較好的適用性。
綜上所述,筆者在矩陣多元化和貝葉斯框架的基礎(chǔ)上,提出一種RSMM算法,來獲得各類別之間的概率統(tǒng)計(jì)信息,進(jìn)而對(duì)不確定樣本進(jìn)行分類;最后,進(jìn)行滾動(dòng)軸承故障分類實(shí)驗(yàn),采用滾動(dòng)軸承數(shù)據(jù)集對(duì)該方法的性能進(jìn)行檢驗(yàn)。
樣本數(shù)據(jù)集為:
ZC={Zi,yj|Zi∈RS×N}
(1)
式中:C—類別數(shù);S—樣本數(shù);N—每個(gè)樣本的長(zhǎng)度。
其中:i=1,2,…,N;j=1,2,…,C。
針對(duì)式(1),引入初始輔助變量Y∈RS×C和權(quán)矩陣W∈RS×C,筆者構(gòu)造標(biāo)準(zhǔn)噪音回歸模型如下:
ysc|wc,ks~Nysc(kswc,1)
(2)
式中:ysc—Y的第s行c列的元素;wc—W的第c列;Nysc(kswc,1)—ysc服從均值為kswc,方差為1的正態(tài)分布;ks—特征集數(shù)。
ZC核函數(shù)K的行也代表訓(xùn)練集中第s個(gè)樣本數(shù)據(jù)與其他樣本數(shù)據(jù)的相似度。引入多項(xiàng)概率鏈接函數(shù),可以將回歸目標(biāo)轉(zhuǎn)化為類別標(biāo)簽,即:
ts=i,ysi>ysj(i≠j)
(3)
因此,根據(jù)多項(xiàng)概率似然函數(shù)原理,其分類表達(dá)式可以表示為:
(4)
式中:u—服從N(0,1)分布;Φ—高斯累積分布函數(shù)。
(5)
式中:Ac—由A的c列對(duì)應(yīng)的對(duì)角矩陣。
由log邊緣似然函數(shù)可以推導(dǎo)出:
(6)
式中:C=I+QA-1QT。
C可以分解為:
(7)
式中:C-i—?jiǎng)h除第i個(gè)樣本后的C值。由此可以得出:
(8)
Log邊緣似然函數(shù)可被分解為:
L(α)=L(α-i)+l(αi)
(9)
式中:ei—稀疏因子;gci—量化因子。
通過求解?L(A)/?αi=0,可得駐點(diǎn)αi。
在模型訓(xùn)練過程中,由最大后驗(yàn)概率估計(jì)的方法可得:
(10)
因此,給定類別時(shí),基于最大后驗(yàn)概率的權(quán)重更新方法為:
(11)
根據(jù)上式,對(duì)于第i類,其輔助變量表達(dá)式為:
(12)
先驗(yàn)參數(shù)的后驗(yàn)概率分布的表達(dá)式為:
(13)
通過更新和訓(xùn)練,模型參數(shù)W的大部分值為0,因此,模型在樣本空間和特征空間上均是稀疏的。對(duì)于新的樣本Znew,利用后驗(yàn)概率式(4)可得:
(14)
式(14)即為新樣本屬于類別c的概率。而最大概率對(duì)應(yīng)的類別即為新樣本所屬的類別,即:
(15)
為了驗(yàn)證RSMM方法在滾動(dòng)軸承故障診斷上的有效性,筆者將利用美國(guó)凱斯西儲(chǔ)大學(xué)的滾動(dòng)軸承數(shù)據(jù)和湖南大學(xué)的滾動(dòng)軸承試驗(yàn)數(shù)據(jù)來進(jìn)行分析與驗(yàn)證。
首先,將利用美國(guó)凱斯西儲(chǔ)大學(xué)數(shù)據(jù)(故障分類常用數(shù)據(jù)集)的7種狀態(tài),來證明RSMM在識(shí)別率、分類效率和小樣本等方面與其他方法相比有更好的分類性能;
其次,將利用湖南大學(xué)的試驗(yàn)數(shù)據(jù)(實(shí)驗(yàn)數(shù)據(jù)具有6種狀態(tài)類型),來進(jìn)一步驗(yàn)證RSMM的普適性;
最后,為了驗(yàn)證RSMM方法的優(yōu)越性,選擇MSMM、SSMM和SIMM進(jìn)行對(duì)比分析。
由于RSMM、MSMM、SSMM和SIMM等方法的輸入元素為矩陣,需要構(gòu)造輸入矩陣來完成分類和建模。多重同步壓縮變換(multi-synchro squeezing transform,MSST)作為一種新的信號(hào)分析方法,已被證明具有良好的特征提取能力。因此,在此處筆者采用MSST來分析原始信號(hào),以獲得可以保存完整結(jié)構(gòu)信息的特征矩陣。
實(shí)驗(yàn)的具體步驟如下:
(1)將不同狀態(tài)(一維時(shí)間序列)的樣本進(jìn)行MSST分析,對(duì)得到的時(shí)頻譜進(jìn)行灰度化和下采樣,獲得輸入特征矩陣;
(2)將訓(xùn)練樣本特征矩陣輸入到主程序(MATLAB)中,得到?jīng)Q策函數(shù)式(15);
(3)將測(cè)試樣本輸入決策函數(shù),得到預(yù)測(cè)結(jié)果;
(4)對(duì)各模型的預(yù)測(cè)結(jié)果進(jìn)行分析,得到各模型的輸出識(shí)別狀態(tài)。
為了驗(yàn)證所提方法的有效性,筆者首先利用美國(guó)凱斯西儲(chǔ)大學(xué)滾動(dòng)軸承數(shù)據(jù)進(jìn)行測(cè)試。實(shí)驗(yàn)選擇的滾動(dòng)軸承型號(hào)為SKF6205。
軸承故障模擬試驗(yàn)臺(tái)如圖1所示[18]。
圖1 滾動(dòng)軸承故障模擬試驗(yàn)臺(tái)
為了模擬滾動(dòng)軸承的各種故障狀態(tài),筆者采用電火花加工技術(shù),分別在滾動(dòng)軸承的內(nèi)圈、外圈和滾動(dòng)體上加工出裂紋。
實(shí)驗(yàn)中,采樣頻率設(shè)置為48 000 Hz,電機(jī)轉(zhuǎn)速設(shè)置為1 730 r/min,負(fù)載為2.24 kW。筆者在每種狀態(tài)下(正常、內(nèi)圈故障、外圈故障、滾動(dòng)體故障,故障寬度0.457 2 mm)各采集200個(gè)樣本(每個(gè)樣本2 048點(diǎn))。
實(shí)驗(yàn)環(huán)境詳細(xì)設(shè)置如表1所示。
表1 實(shí)驗(yàn)環(huán)境設(shè)置
筆者隨機(jī)抽取100個(gè)樣本進(jìn)行訓(xùn)練,100組作為測(cè)試樣本。
筆者采用MSMM、SSMM、SIMM和RSMM方法分別對(duì)滾動(dòng)軸承實(shí)驗(yàn)數(shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試。4種方法識(shí)別結(jié)果的混淆矩陣如圖2所示。
圖2 4種方法識(shí)別結(jié)果的混淆矩陣1,…,7—滾動(dòng)軸承狀態(tài)類別標(biāo)簽;橫坐標(biāo)—訓(xùn)練樣本的預(yù)測(cè)標(biāo)簽;縱坐標(biāo)—訓(xùn)練樣本的真實(shí)標(biāo)簽
從圖2可以看出:(1)在所有方法中,采用MSMM的故障診斷效果最差,這是由于MSMM對(duì)數(shù)據(jù)的要求較高,數(shù)據(jù)復(fù)雜度和數(shù)據(jù)長(zhǎng)度會(huì)導(dǎo)致MSMM難以收斂;(2)與MSMM相比,SSMM和SIMM在魯棒性和冗余性方面具有一定的優(yōu)勢(shì),可以得到更好的分類結(jié)果。
但是上述方法的結(jié)果缺乏必要的概率信息,預(yù)測(cè)的結(jié)果不具有統(tǒng)計(jì)意義,預(yù)測(cè)結(jié)果的不確定性無法估算;同時(shí),該方法獲得支持向量的個(gè)數(shù)基本上隨訓(xùn)練樣本集的規(guī)模呈線性增長(zhǎng),模型的稀疏性有限。
與MSMM、SSMM和SIMM相比,RSMM方法采用核函數(shù)獲得信號(hào)的傳輸特性,并利用概率框架和先驗(yàn)概率來確定最可能的狀態(tài)類別。因此,RSMM方法具有更優(yōu)越的性能。
為了進(jìn)一步驗(yàn)證RSMM方法分類的客觀性,筆者進(jìn)行5次隨機(jī)分類實(shí)驗(yàn),即在每個(gè)實(shí)驗(yàn)中,隨機(jī)抽取100組樣本進(jìn)行訓(xùn)練,100組作為測(cè)試樣本。
4種方法的識(shí)別結(jié)果如圖3所示。
圖3 4種分類方法的分類結(jié)果1—5—第1—5次隨機(jī)分類實(shí)驗(yàn)
從圖3可以看出:在5次隨機(jī)分類實(shí)驗(yàn)中,RSMM的分類效果最好,RSMM方法具有優(yōu)越的分類性能。
全面評(píng)價(jià)一種分類方法的分類性能,需要從多個(gè)角度進(jìn)行驗(yàn)證。因此,筆者選取查準(zhǔn)率、召回率、F-score、kappa、準(zhǔn)確率等指標(biāo)進(jìn)行再次驗(yàn)證。在一定范圍內(nèi),以上5種指標(biāo)值越大,說明模型的分類性能越好。
各項(xiàng)指標(biāo)說明如下:
(1)Accuracy為正確率,作為最常用的分類指標(biāo),表示分類正確樣本在總體樣本中所占比例;(2)Recall表示召回率,表示在所有正確分類樣本中,正類樣本所占比例;(3)Precision表示精確率,表示真正能被模型識(shí)別出來的屬于正類的樣本占比;(4)F1-score為精確率和召回率的調(diào)和值;(5)kappa系數(shù)常用于一致性檢驗(yàn)。
同樣,筆者為了克服偶然因素,進(jìn)行了5次隨機(jī)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表2所示。
表2 4種方法分類性能比較(平均值±標(biāo)準(zhǔn))
從表2可以看出:在各個(gè)指標(biāo)上,RSMM方法都優(yōu)于其他分類方法,表現(xiàn)出了優(yōu)越的分類性能。這是因?yàn)镽SMM方法在貝葉斯框架下進(jìn)行學(xué)習(xí),其核函數(shù)不受Mercer條件限制,能夠直接完成多分類問題,且不同核函數(shù)的引入有效地解決了不同數(shù)據(jù)源的數(shù)據(jù)復(fù)雜性問題,提高了算法的分類精度;而SSMM、SIMM、MSMM方法在分類較多、數(shù)據(jù)較復(fù)雜的情況下,分類能力不足。
除了識(shí)別率外,分類效率也是評(píng)價(jià)機(jī)器學(xué)習(xí)方法的一個(gè)重要指標(biāo)。
筆者隨機(jī)抽取100個(gè)樣本作為訓(xùn)練樣本,其余100個(gè)樣本作為測(cè)試樣本。從原始信號(hào)的輸入到分類結(jié)果的輸出,記錄整個(gè)分類過程所消耗的時(shí)間。
4種分類方法的分類效率如表3所示。
表3 4種分類方法的分類效率對(duì)比
由表4可知,利用美國(guó)凱斯西儲(chǔ)大學(xué)滾動(dòng)軸承數(shù)據(jù)集,驗(yàn)證了RSMM方法的優(yōu)越性。
為了進(jìn)一步說明RSMM方法的普適性,筆者再次選擇湖南大學(xué)滾動(dòng)軸承數(shù)據(jù)集進(jìn)行驗(yàn)證[19]。
該滾動(dòng)軸承故障模擬試驗(yàn)臺(tái)如圖4所示。
圖4 滾動(dòng)軸承故障模擬試驗(yàn)臺(tái)
實(shí)驗(yàn)環(huán)境設(shè)置如表4所示。
表4 實(shí)驗(yàn)環(huán)境設(shè)置
在實(shí)驗(yàn)過程中,筆者隨機(jī)抽取100組樣本(每個(gè)樣本1 024個(gè)點(diǎn))進(jìn)行訓(xùn)練,100組作為測(cè)試樣本。
4種方法的分類識(shí)別結(jié)果如圖5所示。
圖5 4種分類方法的分類結(jié)果
從圖5可以看出:在5次隨機(jī)實(shí)驗(yàn)中,RSMM的分類效果仍然最好。該結(jié)果進(jìn)一步證明了筆者所提出的方法的優(yōu)越性。
為了全面評(píng)價(jià)該方法的分類性能,筆者仍然選取查準(zhǔn)率、召回率、F-score、Kappa、準(zhǔn)確率等指標(biāo),同時(shí)選擇SSMM、SIMM、MSMM 3種分類方法進(jìn)行對(duì)比分析,以驗(yàn)證RSMM方法在5種指標(biāo)下的優(yōu)越性能。
為了克服偶然因素,筆者獨(dú)立進(jìn)行5次隨機(jī)實(shí)驗(yàn)。
4種方法分類性能比較的實(shí)驗(yàn)結(jié)果如表5所示。
表5 4種方法分類性能比較(平均值±標(biāo)準(zhǔn))
綜上所述,根據(jù)Accuracy、Recall、Precision、F-score和Kappa等衡量指標(biāo)下的對(duì)比結(jié)果可知,在以上4種方法中,RSMM方法的識(shí)別結(jié)果明顯要優(yōu)于SSMM、SIMM和MSMM方法。
分析原因可知:
(1)RSMM是一種基于貝葉斯框架的統(tǒng)計(jì)學(xué)習(xí)方法,該方法在貝葉斯框架下進(jìn)行模型訓(xùn)練,其核函數(shù)不受Mercer條件限制,可以獲得各類別之間的概率統(tǒng)計(jì)信息,進(jìn)而可以對(duì)不確定樣本進(jìn)行分類;
(2)MSMM是一種平行超平面分類器,當(dāng)輸入數(shù)據(jù)包含多種復(fù)雜特征信息時(shí),數(shù)據(jù)的復(fù)雜性和數(shù)據(jù)的長(zhǎng)度會(huì)導(dǎo)致MSMM難以收斂;
(3)采用SSMM和SIMM構(gòu)建模型的前提是回歸矩陣具有低秩特性,在面對(duì)大多數(shù)矩陣是多秩的情況下,SSMM和SIMM方法很難發(fā)揮其模型本身的優(yōu)勢(shì)。
相比SSMM、SIMM和MSMM方法,RSMM方法是借助于貝葉斯框架思想構(gòu)造出來的概率統(tǒng)計(jì)模型,因此,在采用該方法對(duì)不確定樣本(尤其是復(fù)雜數(shù)據(jù)問題)進(jìn)行分類時(shí),RSMM具有明顯的優(yōu)勢(shì)。
為了解決采用支持矩陣機(jī)(SMM)進(jìn)行分類建模時(shí),缺乏必要的概率信息,而導(dǎo)致其產(chǎn)生的稀疏性和魯棒性不明確的問題,筆者以貝葉斯理論框架為基礎(chǔ),提出了一種相關(guān)支持矩陣機(jī)(RSMM),來獲得各類別之間的概率統(tǒng)計(jì)信息,進(jìn)而對(duì)不確定樣本進(jìn)行了分類;最后,進(jìn)行了滾動(dòng)軸承故障分類實(shí)驗(yàn),采用滾動(dòng)軸承數(shù)據(jù)集對(duì)該方法的性能進(jìn)行了檢驗(yàn)。
研究結(jié)論如下:
(1)RSMM以樣本信號(hào)矩陣作為分類器的輸入,在建模中引入概率框架和先驗(yàn)概率,使預(yù)測(cè)結(jié)果具有必要的概率信息,并且使預(yù)測(cè)結(jié)果具有統(tǒng)計(jì)意義;
(2)在貝葉斯框架下,采用RSMM方法進(jìn)行模型訓(xùn)練,其核函數(shù)不受Mercer條件的限制,可以獲得各類別之間的概率統(tǒng)計(jì)信息,進(jìn)而可以對(duì)不確定樣本進(jìn)行分類;
(3)滾動(dòng)軸承故障分類實(shí)驗(yàn)證明,在在Accuracy、Recall、Precision、F-score和Kappa等各項(xiàng)衡量指標(biāo)方面,RSMM方法均表現(xiàn)出其良好的性能。
由于RSMM方法在滾動(dòng)軸承故障診斷方面具有良好的表現(xiàn),可以將其推廣到其他旋轉(zhuǎn)機(jī)械的故障診斷中。然而,RSMM方法仍然存在一些需要改進(jìn)的地方,如特征冗余性等。
因此,在今后的工作中,筆者所在課題組將對(duì)建模過程中的特征冗余性問題進(jìn)行研究,以進(jìn)一步提高該算法的識(shí)別精度。