張西寧,張雯雯,周融通,余迪
(西安交通大學(xué)機(jī)械制造系統(tǒng)工程國家重點(diǎn)實(shí)驗(yàn)室,710049,西安)
滾動(dòng)軸承是極為重要的機(jī)械基礎(chǔ)件,因其高效率、便于裝配以及易潤滑等優(yōu)勢,廣泛應(yīng)用于國民經(jīng)濟(jì)和國防事業(yè)各個(gè)領(lǐng)域[1]。作為旋轉(zhuǎn)機(jī)械中的關(guān)鍵零部件之一,滾動(dòng)軸承運(yùn)行狀態(tài)直接關(guān)系到機(jī)械設(shè)備的性能和使用壽命。然而,滾動(dòng)軸承是機(jī)器中最易損壞的元件之一[2],據(jù)不完全統(tǒng)計(jì),旋轉(zhuǎn)機(jī)械的故障約有30%是由滾動(dòng)軸承引起的。因此,滾動(dòng)軸承的故障監(jiān)測診斷技術(shù)成為國內(nèi)外的研究重點(diǎn)。
目前,對于滾動(dòng)軸承的智能診斷大多數(shù)針對其振動(dòng)信號,提取時(shí)域、頻域、時(shí)頻域中的幅值譜、幅頻圖、功率譜、小波能譜、希爾伯特邊際譜等譜圖參數(shù)組成特征向量[3-6],或者利用樣本熵、模糊熵、幅值譜熵等信號處理方法構(gòu)造特征集[7-8],然后通過模式識別的方法進(jìn)行故障診斷。大量不同的機(jī)器學(xué)習(xí)算法,如支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、決策樹、邏輯回歸等,被廣泛應(yīng)用于構(gòu)建分類器。單一特征向量在不同數(shù)據(jù)集中的表現(xiàn)差異造成了提取多種特征的必要性。然而,特征向量維數(shù)的增加不一定能提高診斷準(zhǔn)確率,這就對有效信息的綜合提取和無用信息的摒棄提出了要求。
在高維情形下,所有機(jī)器學(xué)習(xí)方法均會(huì)面臨樣本稀疏、計(jì)算困難等形式的“維數(shù)災(zāi)難”[9],此時(shí)往往通過特征融合或特征選擇對高維特征集進(jìn)行降維。多維縮放是一種經(jīng)典的降維方法,它維持了降維前后樣本之間的距離不變,將原始數(shù)據(jù)“擬合”到一個(gè)低維坐標(biāo)系中,使得由降維所引起的任何變形最小。
本文提出基于多維縮放和隨機(jī)森林的軸承故障診斷方法,采用函數(shù)型數(shù)據(jù)分析中的基函數(shù)展開法,提取的滾動(dòng)軸承振動(dòng)信號自相關(guān)函數(shù)的函數(shù)擬合系數(shù)作為狀態(tài)特征,對比了特征選擇對特征提取的影響,并使用多維縮放對特征集進(jìn)行了降維,結(jié)合隨機(jī)森林模型,實(shí)現(xiàn)了對滾動(dòng)軸承的故障診斷。
對于隨時(shí)間變化表現(xiàn)出函數(shù)特征的數(shù)據(jù),函數(shù)型數(shù)據(jù)分析(FDA)回歸到數(shù)據(jù)產(chǎn)生的本質(zhì),將其轉(zhuǎn)化回函數(shù),并進(jìn)行進(jìn)一步分析[10]。它以“化數(shù)為形”為基礎(chǔ)思想,將收集到的樣本數(shù)據(jù)當(dāng)作整體而非單個(gè)數(shù)值組成的集合。工程實(shí)際中,采集到的樣本數(shù)據(jù)通常是離散的、有限的,因此在FDA中用基函數(shù)展開法將原始離散振動(dòng)數(shù)據(jù)轉(zhuǎn)換為一個(gè)光滑的函數(shù)。
滾動(dòng)軸承不同元件缺陷產(chǎn)生的振動(dòng)信號,表現(xiàn)為滾動(dòng)體在滾道上的通過頻率或者滾動(dòng)體自轉(zhuǎn)頻率對外環(huán)固有頻率的調(diào)制現(xiàn)象[11]。旋轉(zhuǎn)機(jī)械正常運(yùn)轉(zhuǎn)時(shí),振動(dòng)數(shù)據(jù)曲線一般為三角函數(shù)形式,傅里葉基函數(shù)就可以滿足其函數(shù)型轉(zhuǎn)換需求。假設(shè)內(nèi)圈存在一個(gè)缺陷,當(dāng)軸轉(zhuǎn)動(dòng)時(shí),這個(gè)缺陷與滾子產(chǎn)生的振動(dòng)會(huì)不斷改變,采集到的數(shù)據(jù)會(huì)有內(nèi)圈轉(zhuǎn)動(dòng)產(chǎn)生的調(diào)幅影響。假設(shè)滾動(dòng)體存在一個(gè)缺陷,當(dāng)軸轉(zhuǎn)動(dòng)時(shí),這個(gè)缺陷與滾道產(chǎn)生的振動(dòng)會(huì)不斷改變,采集到的數(shù)據(jù)會(huì)有滾子轉(zhuǎn)動(dòng)產(chǎn)生的調(diào)幅影響。假設(shè)外圈存在一個(gè)缺陷,由于外圈通常保持不動(dòng),且加速度計(jì)安裝在外圈正上方,這個(gè)缺陷與滾子產(chǎn)生的振動(dòng)位置不會(huì)改變,滾子的振動(dòng)不會(huì)對其產(chǎn)生調(diào)幅影響。
不同狀態(tài)下的振動(dòng)信號由于包含了不同成分會(huì)表現(xiàn)出不同的函數(shù)特征,振動(dòng)信號與目標(biāo)基函數(shù)的擬合系數(shù)在數(shù)值和相關(guān)性上不同。將函數(shù)型數(shù)據(jù)分析應(yīng)用在故障診斷中的流程如圖1所示。將清洗后的數(shù)據(jù)與設(shè)定的目標(biāo)基函數(shù)進(jìn)行擬合,擬合系數(shù)或誤差參數(shù)可以作為樣本特征用于訓(xùn)練分類模型。
圖1 采用函數(shù)型數(shù)據(jù)分析的故障診斷流程
通過降維方法緩解維數(shù)災(zāi)難是指通過某種數(shù)學(xué)變換將原始高維屬性空間轉(zhuǎn)變?yōu)橐粋€(gè)低維子空間,以提高樣本密度并簡化計(jì)算。目前常用的線性降維方法如主成分分析、線性判別分析;非線性降維方法如局部線性嵌入、拉普拉斯映射等流形學(xué)習(xí)方法。主成分分析[4](PCA)通過正交變換將原始特征轉(zhuǎn)換為線性獨(dú)立的特征,使投影后樣本點(diǎn)的方差最大化,但是貢獻(xiàn)率小的主成分也可能包含對樣本差異的重要信息。t分布隨機(jī)鄰域嵌入(TSNE)[12]基于樣本點(diǎn)之間的分布概率不變,將距離大的簇之間的距離拉大,解決了隨機(jī)鄰域嵌入(SNE)的擁擠問題,但是TSNE在樣本較多時(shí)構(gòu)建困難、梯度下降慢。
多維縮放(MDS)要求原始空間中樣本之間的距離在低維空間中得以保持[13]。假定m個(gè)樣本在原始空間的距離矩陣為D,D的元素dij表示第i個(gè)樣本和第j個(gè)樣本之間的距離。MDS的目標(biāo)是獲得樣本在d′維空間的表示Z,且任意兩個(gè)樣本在d′維空間中的歐氏距離等于原始空間中的距離。令內(nèi)積矩陣B=ZTZ,作如下定義
(1)
(2)
(3)
MDS的算法流程見圖2。該算法通過原始空間中的距離平方矩陣推導(dǎo)出降維后的內(nèi)積矩陣,從而獲得低維空間中的樣本表示。
圖2 多維縮放算法流程
圖3 隨機(jī)森林診斷流程圖
隨機(jī)森林(RF)是以決策樹為基學(xué)習(xí)器的裝袋集成,在決策樹的訓(xùn)練過程中引入了隨機(jī)屬性選擇,每棵樹生成時(shí),訓(xùn)練集的抽取過程與節(jié)點(diǎn)分裂時(shí)特征屬性的選擇過程中的隨機(jī)性,導(dǎo)致了采樣的差異性和特征選取的差異性,從而大大提升了決策準(zhǔn)確率[14-16]。分類模型輸出結(jié)果由多棵決策樹投票表決,少數(shù)服從多數(shù)。利用隨機(jī)森林模型進(jìn)行故障診斷的流程見圖3。隨機(jī)森林克服了決策樹容易過擬合的問題,對噪聲和異常值有較好的容忍性,對高維數(shù)據(jù)分類問題具有良好的可擴(kuò)展性和并行性,給出的特征重要性排序是驗(yàn)證初始假設(shè)和評價(jià)模型學(xué)習(xí)效果的好方法[17-18]。
根據(jù)上述分析,本文提出了基于MDS和RF的滾動(dòng)軸承故障診斷方法。該方法流程如圖4所示,具體步驟如下:
(1)對軸承振動(dòng)信號的自相關(guān)函數(shù)做函數(shù)型數(shù)據(jù)分析,取其擬合系數(shù)作為樣本特征構(gòu)造特征集;
(2)訓(xùn)練隨機(jī)森林模型用于故障狀態(tài)的分類,若訓(xùn)練誤差與驗(yàn)證誤差均在允許范圍內(nèi),則進(jìn)行測試,運(yùn)行第(6)步,否則對模型進(jìn)行優(yōu)化;
(3)使用網(wǎng)格搜索法確定合適的基分類器數(shù)量與特征數(shù)量,并依據(jù)特征重要性排序做特征選擇;
(4)使用MDS對特征集進(jìn)行維數(shù)約簡;
(5)訓(xùn)練得到最佳的隨機(jī)森林故障診斷模型;
(6)對待診斷信號進(jìn)行相同的取自相關(guān)、FDA擬合操作后,將得到的特征輸入到訓(xùn)練好的隨機(jī)森林診斷模型中,模型輸出類別即為軸承狀態(tài)類型。
圖4 基于MDS和RF的軸承診斷方法流程圖
本文構(gòu)建了如圖5所示的實(shí)驗(yàn)平臺(tái),包括直流驅(qū)動(dòng)電機(jī)、支架、安裝座、預(yù)緊裝置、滾動(dòng)軸承、傳感器、電荷放大器、數(shù)據(jù)采集卡UA300等部分。軸承安裝座的振動(dòng)由壓電型加速度傳感器測量,靈敏度為8.8 pC/(m·s-2),頻率測量范圍為0.27~10 kHz。主軸鍵相信號由靈敏度為8×10-3V/μm的電渦流傳感器測量。
圖5 滾動(dòng)軸承實(shí)驗(yàn)臺(tái)
實(shí)驗(yàn)所用軸承均為6308深溝球軸承,有正常、內(nèi)圈故障、外圈故障、滾子故障共4種狀態(tài)。實(shí)驗(yàn)轉(zhuǎn)速為1 200 r/min,徑向加載7.7 kg的重物,采樣頻率為10 240 Hz,采樣時(shí)間為20 s。采集到的信號如圖6所示。
實(shí)驗(yàn)采集到的軸承振動(dòng)信號包含了轉(zhuǎn)頻、倍頻、故障特征頻率、固有頻率、噪聲頻率等非常復(fù)雜的成分。在對比了移動(dòng)平均濾波、中值濾波、小波濾波3種常用方法的濾波效果之后,選擇“db3”小波濾波作為預(yù)處理方法。
(a)正常信號
(b)內(nèi)圈故障信號
(c)外圈故障信號
(d)滾子故障信號圖6 軸承振動(dòng)信號的FDA特征提取
振動(dòng)模型的精確度和運(yùn)算量使得即使對濾波之后的信號進(jìn)行準(zhǔn)確地函數(shù)擬合也是極其困難的,因此對振動(dòng)信號的自相關(guān)函數(shù)進(jìn)行了擬合。自相關(guān)函數(shù)含有與原振動(dòng)信號同周期的成分,是從干擾噪聲中找出周期信號或瞬時(shí)信號的重要手段。從圖6中可以看出,對應(yīng)4種狀態(tài)的原始信號呈現(xiàn)出不同的特征,自相關(guān)信號也各不相同。
對各自相關(guān)函數(shù)用下式擬合
y(x)=a1sin(b1x+c1)+…+a5sin(b5x+c5)
(4)
得到的擬合系數(shù)ai、bi、ci(i=1,…,5)即為樣本特征。從每種狀態(tài)的20 s信號中截取了100段0.1 s的信號提取特征,每個(gè)樣本特征有15維。4種狀態(tài)的樣本構(gòu)成了大小為400×15的特征集,其中20%的樣本用作測試集。
隨機(jī)森林往往使用默認(rèn)參數(shù)可以得到不錯(cuò)的結(jié)果,其調(diào)參過程通常是對決策樹個(gè)數(shù)ntrees和每棵樹分裂時(shí)選用的最大特征數(shù)nfea進(jìn)行的[15]。網(wǎng)格搜索法通過遍歷已定義參數(shù)的列表來評估算法的參數(shù),從而找到最優(yōu)值,該方法適用于3個(gè)以及更少的超參數(shù)。
圖7 隨機(jī)森林參數(shù)優(yōu)化結(jié)果
隨機(jī)森林可以對變量進(jìn)行特征重要性排序,其原理是逐次對每個(gè)特征加噪,觀察對結(jié)果正確率或基尼指數(shù)的影響[16]。特征加噪后平均準(zhǔn)確率減少得越多(影響越大),說明該特征重要;減少得越少(影響越小),說明該特征不重要。
對提取出的15個(gè)特征進(jìn)行重要性排序后得到圖8所示結(jié)果。由圖8可見,c1、c5、c4、c2、c3對模型結(jié)果影響最小且與其他特征差距明顯,因此除去這5維特征在一定程度上可以提高準(zhǔn)確率。
圖8 特征重要性排序
本文將TSNE和PCA兩種降維方法與MDS的降維效果進(jìn)行對比,降維前的特征被分為特征選擇前后兩種類型。為便于可視化,原始特征均降至二維,4種軸承狀態(tài)的數(shù)據(jù)對應(yīng)4種不同點(diǎn)的類型。降維后特征集由400×15減小為400×2。
降維后的數(shù)據(jù)首先進(jìn)行歸一化,然后用類內(nèi)散布矩陣的跡表示類內(nèi)距,用類間散布矩陣的跡表示類間距。我們希望降維后數(shù)據(jù)分布類間距大而類內(nèi)距小,因此類間距與類內(nèi)距的比值越大越好。3種方法的降維效果衡量見表1。
表1 3種方法降維效果衡量
圖9顯示對原始15維特征的降維效果,類間距TSNE最大、MDS次之、PCA最小;類內(nèi)距MDS最小、PCA次之、TSNE最大。因此,類間距與類內(nèi)距之比MDS最大、TSNE次之、PCA最小。圖10顯示了特征選擇后10維特征的降維效果,其中距離大小分布排序與圖9相同,但是特征選擇后,MDS和TSNE的類間距增大,MDS的類內(nèi)距略增大,TSNE的類內(nèi)距增大較多,PCA的類內(nèi)距與類間距均未變化。綜合來看,特征選擇使MDS的降維效果明顯提升,使TSNE的降維效果輕微提升,對PCA的降維效果幾乎沒影響。
(a)MDS
(b)TSNE
(c)PCA圖9 不同方法原始特征降維效果的比較
從表1可以看出,MDS降維提供了最佳的類間距與類內(nèi)距的比,并且與另外兩種方法存在較大差距,優(yōu)勢明顯。與直接對原始特征做MDS相比,特征選擇后再做MDS降維效果更佳。
(a)MDS
(b)TSNE
(c)PCA圖10 不同方法特征選擇后降維效果的比較
從表2的模型輸出結(jié)果中可以看出,依據(jù)特征重要性排序的特征選擇和多維縮放的降維方式對提高分類準(zhǔn)確率均有貢獻(xiàn)。特征選擇后測試集中的分類準(zhǔn)確率由95%提高至97.5%,再經(jīng)過MDS降維準(zhǔn)確率上升至100%。表1中3種方法下測試集的分類混淆矩陣如圖11所示。0、1、2、3分別代表正常、內(nèi)圈故障、外圈故障、滾子故障,對滾子故障的正確分類有助于提升分類準(zhǔn)確率。
表2 不同特征處理方式下模型準(zhǔn)確率對比
(a)原始特征 (b)特征選擇 (c)特征選擇+MDS
圖11 不同特征處理方式下測試集分類混淆矩陣
本文提出了使用MDS和隨機(jī)森林的滾動(dòng)軸承故障診斷方法。首先提取滾動(dòng)軸承振動(dòng)信號自相關(guān)函數(shù)的FDA擬合系數(shù),構(gòu)造故障特征集;然后使用MDS對依據(jù)重要性排序選擇過的特征進(jìn)行壓縮,減小模型時(shí)間復(fù)雜度與運(yùn)算復(fù)雜度,并避免可能存在的干擾;最后將處理后的特征送入隨機(jī)森林分類模型,對滾動(dòng)軸承的故障狀態(tài)進(jìn)行診斷。為驗(yàn)證所提方法的有效性,與TSNE-RF和PCA-RF作對比,得到如下結(jié)論。
(1)將軸承振動(dòng)信號自相關(guān)函數(shù)的FDA擬合系數(shù)作為樣本特征時(shí),在RF分類器中準(zhǔn)確率達(dá)到了95%,驗(yàn)證了本文所用特征提取方法的可行性。
(2)在與TSNE-RF和PCA-RF的對比實(shí)驗(yàn)中,MDS降維后的類間距與類內(nèi)距的比值明顯高于其余兩種方法,并在特征提取后有所提升,驗(yàn)證了本文所用特征選擇和MDS降維方法的有效性。
(3)使用特征選擇和MDS、RF對正常狀態(tài)及3種故障下的滾動(dòng)軸承進(jìn)行故障診斷,測試準(zhǔn)確率均達(dá)到100%,較未使用MDS的RF分類器提升了5%,驗(yàn)證了本文所提MDS與RF結(jié)合方法的有效性。