張龍,彭小明,熊國良,王良,黃婧,胡俊鋒
(1. 華東交通大學(xué) 機(jī)電與車輛工程學(xué)院,江西 南昌 330013;2. 中國鐵路南昌局集團(tuán)有限公司 科學(xué)技術(shù)研究所,江西 南昌 330002)
機(jī)車輪對軸承的工作環(huán)境復(fù)雜,非平穩(wěn)載荷和系統(tǒng)內(nèi)部非線性因素會導(dǎo)致軸承振動信號表現(xiàn)出非平穩(wěn)性和非線性。振動信號的特征可以在時域、頻域以及時頻域進(jìn)行提取,然而傳統(tǒng)的信號處理方法難以有效地處理這種隨時間變化的非平穩(wěn)信號[1]。經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decom‐position, EMD)和小波變換等時頻分析雖然可以處理振動信號中的非平穩(wěn)性,但并不能提取信號的非線性特征信息。許多非線性參數(shù)如近似熵、分形維數(shù)等被廣泛應(yīng)用于機(jī)械設(shè)備的故障診斷,然而,近似熵的一致性較差[2];分形維數(shù)的計(jì)算依賴數(shù)據(jù)的長度,且比較耗時,不適合在線監(jiān)測[3]。RICHMAN 等[4]提出了另一種表征時間序列復(fù)雜性的測度方法—樣本熵(Sample Entropy),樣本熵是一種通過非負(fù)數(shù)來度量時間系列的非線性和復(fù)雜度,其對于自身數(shù)據(jù)的匹配程度要優(yōu)于近似熵,且度量準(zhǔn)確度遠(yuǎn)高于近似熵。然而樣本熵只能反映時間序列在單一尺度上的復(fù)雜度,對振動信號特征提取的效果不理想。在樣本熵的基礎(chǔ)上,COSTA 等[5?6]提 出 了 多 尺 度 熵(Multiscale Entropy,MSE)的概念,用來反映時間序列在不同尺度下的自相似性和復(fù)雜程度。機(jī)車輪對軸承不同故障類型會導(dǎo)致振動信號的復(fù)雜度不同,而信號的復(fù)雜度體現(xiàn)在不同尺度上。因此,多尺度熵可作為特征參數(shù)表征信號在不同尺度上的復(fù)雜性,能有效解決單一尺度下振動信號特征提取的局限性問題。利用人工智能技術(shù)實(shí)現(xiàn)滾動軸承的智能診斷成為近年來的研究熱點(diǎn)。張龍等[7]利用時序模型和自聯(lián)想神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對齒輪故障程度的評估。李笑梅等[8]提出一種基于集合經(jīng)驗(yàn)?zāi)J椒纸?EEMD)和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBFNN)相結(jié)合的滾動軸承故障診斷方法,實(shí)現(xiàn)對列車滾動軸承的故障識別。趙春華等[9]通過鯨魚優(yōu)化算法(WOA)的支持向量機(jī)(SVM)對滾動軸承故障類型進(jìn)行識別。SVM 是一種以統(tǒng)計(jì)學(xué)理論為基礎(chǔ)的機(jī)器學(xué)習(xí)方法,其克服了神經(jīng)網(wǎng)絡(luò)過擬合和過度依靠經(jīng)驗(yàn)基礎(chǔ)來確定結(jié)構(gòu)類型的缺點(diǎn),在分析處理局部極小、非平穩(wěn)性和非線性等問題時表現(xiàn)出強(qiáng)大的優(yōu)越性[10],在解決小樣本問題時表現(xiàn)出獨(dú)特的優(yōu)勢和良好的應(yīng)用前景[11?13]。基于以上分析,針對DF4 型內(nèi)燃機(jī)車輪對軸承單一和復(fù)合故障在內(nèi)的7種不同健康狀態(tài)的識別問題,本文用MSE 提取軸承原始信號的多尺度非線性特征信息,然后使用PSO 優(yōu)化后的SVM 對軸承不同故障進(jìn)行類型識別。該方法結(jié)合了MSE的信號非線性特征提取和SVM 在小樣本復(fù)雜非線性分類方面的優(yōu)勢。為驗(yàn)證所提方法在機(jī)務(wù)段軸承檢測中的應(yīng)用效果,將DF4 型內(nèi)燃機(jī)車輪對軸承實(shí)際故障數(shù)據(jù)用于本次實(shí)驗(yàn)研究。
時間序列{x(i)|1 ≤i≤N}由N個數(shù)據(jù)組成,樣本熵的求解過程如下:
1) 選定一組維數(shù)為m的矢量序列Xm(1),Xm(2),…,Xm(N-m+ 1)
其 中:Xm(i) ={x(i),x(i+ 1),…,x(i+m+ 1)}1 ≤i≤N-m+ 1。
2) 定義向量Xm(i) 與Xm(j) 之間的距離d[Xm(i),Xm(j)]為兩者對應(yīng)元素中最大差值的絕對值,即:
3)設(shè)定相似容限r(nóng),統(tǒng)計(jì)Xm(i)與Xm(j)元素之間距離不大于r的j(1 ≤j≤N-m,j≠i)的數(shù)目,記為Bi。對于1 ≤i≤N-m,定義:
MSE 能夠反映不同尺度下時間序列的自相似性和復(fù)雜程度,其實(shí)質(zhì)就是計(jì)算多尺度下的樣本熵值[3]。多尺度熵的計(jì)算過程如下。
1)對于時間序列{x(i)}=x(1),x(2),…x(N),利用下式定義粗粒化序列P(τ):
MSE與4個參數(shù)的取值密切相關(guān),即嵌入維數(shù)m,尺度因子τ,樣本點(diǎn)數(shù)N和相似容限r(nóng),正確選取各參數(shù)是獲得理想的特征提取效果的前提[14]。嵌入維數(shù)m一般取值為1 或2[4];另外,文獻(xiàn)[16]研究表明,在MSE 應(yīng)用中,需要保證每個時間尺度下有足夠的數(shù)據(jù)量,嵌入維數(shù)m通常取為2,設(shè)置m=2。在實(shí)際應(yīng)用中尺度因子取值過大會丟失信號中的重要信息,計(jì)算效率低下;取值較小則不能完全提取振動信號的信息,無法完整反映時間序列的復(fù)雜度[3],設(shè)置最大尺度因子τmax=20。為研究數(shù)據(jù)長度N和相似容限r(nóng)對MSE算法的影響,特進(jìn)行以下仿真實(shí)驗(yàn)。
將不同點(diǎn)數(shù)(設(shè)N分別為3 000,4 000和5 000)下的白噪聲和1/f噪聲分別用于數(shù)據(jù)長度N對MSE算法影響的分析。設(shè)置MSE 算法的嵌入維數(shù)m=2,相似容限r(nóng)=0.15×SD(SD 為原始序列的標(biāo)準(zhǔn)差),最大尺度因子τmax=20。由圖1 可知:不同點(diǎn)數(shù)N下的白噪聲和1/f噪聲,其熵值曲線較為接近,表明樣本點(diǎn)數(shù)N對MSE算法影響較小。另外,從文獻(xiàn)[15]可知,樣本熵的計(jì)算過程中含有循環(huán)嵌套,隨著樣本點(diǎn)數(shù)的增加,計(jì)算量呈指數(shù)增加;樣本點(diǎn)數(shù)過小則不能完全提取信號的全部信息,因此本文取N=4 000。
圖1 不同長度N下MSE算法對2種噪聲分析結(jié)果Fig.1 Analysis results of two kinds of noise by MSE with different N
將不同相似容限(設(shè)r分別為0.1×SD,0.15×SD,0.2×SD)下的白噪聲和1/f噪聲分別用于相似容限r(nóng)對MSE 算法影響的分析。結(jié)果如圖2 所示,其中,設(shè)置MSE 算法的嵌入維數(shù)m=2,樣本點(diǎn)數(shù)N=4 000,最大尺度因子τmax=20。由圖2可知:r對MSE算法結(jié)果影響較大,當(dāng)r較小時,匹配的模式特征較多,因此熵值較大;當(dāng)r較大時,匹配的模式特征較少,故熵值較小。通常為使樣本熵與其反映的時間序列關(guān)聯(lián)性更大,r一般取值為(0.1~0.25)×SD[5]。r過大會使大量模式特征滿足相似條件,有效信息中混雜著大量冗余信息,難以獲得理想結(jié)果;r過小則符合相似條件的模式少,難以正確反映信息時間序列的本質(zhì)。故本文選擇r=0.15×SD。
圖2 不同r條件下MSE對2種噪聲分析結(jié)果Fig.2 Analysis results of two kinds of noise by MSE with different r
以RBF 為核函數(shù)的SVM 需要確定2 個參數(shù),分別為懲罰因子c和參數(shù)g(RBF 核函數(shù)中的方差),其中懲罰因子c用于控制樣本超出誤差的懲罰程度。參數(shù)c和g對SVM 分類準(zhǔn)確率起著主要影響,利用PSO 對上述2 個參數(shù)尋優(yōu),從而可以提高SVM分類的準(zhǔn)確率。PSO尋優(yōu)公式如下所示:
式中:ω為慣性因子,通過調(diào)整ω的大小,可以對全局尋優(yōu)性能和局部尋優(yōu)性能進(jìn)行調(diào)整;d=1,2,3,…,D;i=1,2,3,…,n;t為當(dāng)前迭代次數(shù);vid為粒子的速度;c1和c2為非負(fù)常數(shù),稱為加速常數(shù),用于調(diào)節(jié)學(xué)習(xí)的最大步長;r1和r2為分布于[0,1]之間的隨機(jī)數(shù),用于增加搜索的隨機(jī)性。
PSO-SVM 算法的主要步驟如圖3 所示。首先確定適應(yīng)度函數(shù),然后初始化種群和速度,計(jì)算適應(yīng)度函數(shù)值,若滿足終止條件,則輸出最優(yōu)解;否則繼續(xù)更新個體和速度,直至找到全局最優(yōu)解,算法終止。
圖3 PSO-SVM算法流程圖Fig.3 Procedure of PSO-SVM
基于多尺度熵的機(jī)車輪對軸承PSO-SVM 故障診斷方法流程如圖4所示,主要步驟如下:
圖4 所提故障診斷方法的流程圖Fig.4 Flow chart of the proposed fault diagnosis method
1) 分別采集DF4 型內(nèi)燃機(jī)車包含單一和復(fù)合故障在內(nèi)的7種不同健康狀態(tài)的輪對軸承試件的振動信號數(shù)據(jù)。
2) 對輸入的特征向量進(jìn)行歸一化處理,除去樣本集中的奇異樣本,從而減少誤差。
3) 將MSE 特征提取后的特征樣本作為PSOSVM模型的訓(xùn)練和測試樣本。
4) 利用PSO 對SVM 的徑向基核函數(shù)(RBF)參數(shù)g及懲罰因子c尋優(yōu)。
5) 利用PSO 優(yōu)化后的SVM 對測試集進(jìn)行分類,確定機(jī)車輪對軸承的故障類型。
實(shí)驗(yàn)在南昌鐵路局機(jī)務(wù)段完成,實(shí)驗(yàn)軸承為NJ2232WB系列圓柱滾子軸承,軸承內(nèi)外徑分別為160 mm 和290 mm。圖5 為本次實(shí)驗(yàn)所用的包含單一和復(fù)合故障在內(nèi)的軸承試件,均是從DF4 型內(nèi)燃機(jī)車上拆卸下來的實(shí)際故障輪對軸承。在進(jìn)行實(shí)驗(yàn)前,所有的機(jī)車輪對軸承均進(jìn)行了清洗,以免影響實(shí)驗(yàn)效果。實(shí)驗(yàn)過程中,軸承由圖6所示的JL-501 型機(jī)車軸承檢測臺驅(qū)動。檢測臺主要由主軸箱、電氣系統(tǒng)、液壓系統(tǒng)和臺身組成。主軸箱是試驗(yàn)臺的關(guān)鍵部分,待測機(jī)車輪對軸承的檢測安裝和旋轉(zhuǎn)等過程都需要通過主軸箱來實(shí)現(xiàn),主軸轉(zhuǎn)速范圍為120~1 200 r/min;液壓系統(tǒng)主要是對待測機(jī)車軸承進(jìn)行徑向加載和卸載。
圖5 機(jī)車輪對軸承6種故障類型實(shí)物圖Fig.5 Six wheelset bearings with various faults
圖6 JL-501機(jī)車軸承檢測臺Fig.6 JL-501 test bench for locomotive bearings
本文借助該檢測臺實(shí)現(xiàn)輪對軸承的驅(qū)動和加載,設(shè)置轉(zhuǎn)速500 r/min,徑向載荷當(dāng)量1.4 MPa。通過由磁座安裝在軸承外圈的3 個CA-YD-187T 型加速度傳感器和NI USB-4431型采集卡完成振動信號采集,采樣頻率設(shè)置為20 kHz,本文分析數(shù)據(jù)來自垂直方向傳感器B。
表1 為正常(無故障)及圖5 所示包含單一和復(fù)合故障在內(nèi)的6 種故障狀態(tài)共7 種不同健康狀態(tài)機(jī)車輪對軸承的故障信息和樣本數(shù)量,并依次編號為1~7。實(shí)驗(yàn)過程中分別采集7種不同健康狀態(tài)機(jī)車輪對軸承試件的振動信號,每個樣本包含4 000個數(shù)據(jù)點(diǎn),每種軸承健康狀態(tài)各有樣本數(shù)為100。圖7 為7 種軸承狀態(tài)的信號時域、頻域波形圖,從圖7可以明顯看出,正常軸承的振動較故障軸承更平穩(wěn),外圈故障和內(nèi)圈故障都能較明顯地看到周期性故障沖擊,但僅從時域波形中無法判別具體的故障類型。在頻域波形圖中,故障軸承信號和正常軸承信號的能量都主要集中于2 000~4 000 Hz,仍然無法從頻域中區(qū)分故障類別。因此,需要進(jìn)一步對機(jī)車輪對軸承振動信號進(jìn)行分析處理,提取出能表征信號類型的特征向量。
尺度因子τ=20,得到20 個粗粒向量序列,計(jì)算每個序列的樣本熵,可以得到一個20 維的特征向量作為PSO-SVM 的輸入。圖8給出了圖7中7種狀態(tài)信號對應(yīng)的MSE 計(jì)算結(jié)果,從圖中可以看出隨著尺度的增加樣本熵呈現(xiàn)逐漸下降的趨勢,不同機(jī)車輪對軸承振動信號的MSE 值在第20 個尺度時基本沒有交叉重疊,區(qū)分較為明顯。若選擇超過20 個尺度的MSE 作為振動信號的特征向量,會造成特征信息冗余,影響故障特征的分類識別精度;而若只選擇較小的尺度因子上的MSE 值構(gòu)建故障特征向量,則無法完全反映輪對軸承振動信號中蘊(yùn)含的故障信息,最終故障識別準(zhǔn)確率會較低。同時,可以看出單個尺度上的熵值曲線存在交叉重疊,無法有效區(qū)分故障類型,需要在多個尺度上進(jìn)行分析。由此說明,多尺度熵能夠綜合多個尺度上的熵值信息,從而能更好地區(qū)分機(jī)車輪對軸承的運(yùn)行狀態(tài)。
圖7 機(jī)車輪對軸承7種健康狀態(tài)的時域和頻域信號Fig.7 Time and frequency signals of 7 health conditions
圖8 圖7中7種機(jī)車輪對健康軸承信號的多尺度熵Fig.8 Multiscale entropy of the 7 signals in Fig.7
PSO-SVM 的建立首先要求設(shè)定相關(guān)初始網(wǎng)絡(luò)參數(shù)。將20 個尺度的樣本熵作為輸入特征向量,由表1 可知每種軸承狀態(tài)有100 個樣本,將100 個樣本分為訓(xùn)練集和測試集,隨機(jī)選取60 個樣本作為訓(xùn)練集,剩余40 個樣本測試集。PSO 算法參數(shù)中設(shè)定ωmax=0.9,ωmin=0.4,最大迭代次數(shù)設(shè)為200,并作為終止的條件。由于需要優(yōu)化的參數(shù)個數(shù)較少,將粒子群的規(guī)模設(shè)為20,加速常數(shù)c1=1.5,c2=1.6,最大速度vmax設(shè)為3。采用交叉驗(yàn)證(Cross Validation, CV)的方法在一定程度上可以找到SVM 的最優(yōu)參數(shù),能有效地避免訓(xùn)練過程出現(xiàn)過學(xué)習(xí)和欠學(xué)習(xí)。因此,本文以CV 意義下的準(zhǔn)確率作為PSO 的適應(yīng)度函數(shù)值,CV 的參數(shù)設(shè)為3,即測試集分為3部分進(jìn)行交叉驗(yàn)證。某次PSO算法經(jīng)過200 次迭代,所得懲罰因子c,徑向基核函數(shù)(RBF))參數(shù)g的最佳參數(shù)為:c=3.022,g=2.432。以此參數(shù)訓(xùn)練SVM 模型,并將訓(xùn)練后的PSO-SVM模型用于測試樣本的判別,某一次的分類結(jié)果如圖9 所示。模型對280 個測試樣本的識別準(zhǔn)確率達(dá)到99.29%,僅有2 個樣本被誤判,分別是狀態(tài)1 和狀態(tài)4的各一個樣本被誤判為狀態(tài)3和狀態(tài)1。
圖9 PSO-SVM分類結(jié)果Fig.9 PSO-SVM classification results
表1 機(jī)車輪對軸承故障類型及樣本數(shù)量Table 1 Fault types and sample size of wheelset bearings
為使實(shí)驗(yàn)結(jié)果更具嚴(yán)謹(jǐn)性和一般性,重復(fù)上述訓(xùn)練和測試過程100次,每次訓(xùn)練和測試樣本在樣本空間中隨機(jī)劃分,最后PSO-SVM 模型的100次試驗(yàn)的平均準(zhǔn)確率為99.15%。實(shí)驗(yàn)結(jié)果表明,尺度因子τ=20 時,MSE 能夠有效地提取機(jī)車輪對軸承的故障特征,PSO-SVM 模型對不同故障及不同故障程度能很好區(qū)分。表2 給出了100 次測試準(zhǔn)確率的平均混淆矩陣,沿矩陣對角線的單元格顯示正確分類樣本的百分比,而非對角線的其他單元格表示錯誤分類。以第2行為例,它們顯示屬于故障類型2 的樣本錯誤地分類為3 類型、6 類型的比例分別為0.45% 和0.02%。另一方面,數(shù)值99.53%顯示了正確分類樣本的比例。因此,對角線處單元格的值越接近100,則意味著分類識別效果越好。
表2 100次測試的平均混淆矩陣Table 2 Averaged confusion matrix of 100 tests %
值得注意的是,不同的錯誤分類會導(dǎo)致不同的風(fēng)險,可通過敏感性和特異性等統(tǒng)計(jì)指標(biāo)進(jìn)行評估。
1)敏感性=正確分類的正樣本數(shù)/實(shí)際正樣本數(shù)
2)特異性=正確分類的負(fù)樣本數(shù)/實(shí)際負(fù)樣本數(shù)
分類性能的統(tǒng)計(jì)指標(biāo)值見表3,表3 中最重要的項(xiàng)目是軸承狀態(tài)類型1的敏感性和特異性,因?yàn)樵撁舾行栽叫?,表明故障漏診的風(fēng)險更高。另一方面,類型1的特異性越小,表明健康狀況被誤診為故障的可能性越高,這將導(dǎo)致不必要的停車檢查。表2中的其他單元格主要表示各種軸承狀態(tài)之間錯誤分類的可能性,由于與故障和健康狀態(tài)之間的錯誤分類相比,各種故障狀態(tài)之間的錯誤分類風(fēng)險相對較小,因此它們的重要性不大。由表3可知,該模型對類型1 具有較高的敏感性和特異性,健康狀況被誤診為故障的實(shí)際風(fēng)險相對較低。
表3 混淆矩陣中各類別的統(tǒng)計(jì)指標(biāo)值Table 3 Statistics of confusion matrix %
將MSE 特征輸入到參數(shù)不經(jīng)優(yōu)化的SVM 模型中進(jìn)行故障分類識別,懲罰因子c,徑向基核函數(shù)(RBF)參數(shù)g按人為經(jīng)驗(yàn)一般設(shè)為:c=2,g=1[11]。同樣取SVM 模型運(yùn)行100 次后的平均準(zhǔn)確率為實(shí)驗(yàn)的最終識別準(zhǔn)確率,得到平均準(zhǔn)確率為98.86%。再將MSE特征輸入到參數(shù)網(wǎng)格尋優(yōu)法Grid-SVM模型中進(jìn)行故障分類識別,c和g的取值范圍設(shè)置為2?10:0.2:10(指數(shù)步長均為0.2),分類準(zhǔn)確率采用3 折交叉驗(yàn)證,最優(yōu)參數(shù)得到100 次平均準(zhǔn)確率為98.92%。不同SVM 模型的分類結(jié)果如表4 所示,顯然經(jīng)過粒子群優(yōu)化的SVM 優(yōu)于參數(shù)未經(jīng)優(yōu)化的SVM 和參數(shù)網(wǎng)格尋優(yōu)法的Grid-SVM,PSO 的參數(shù)尋優(yōu)能力更佳。由此表明,PSO-SVM 的模式識別能力強(qiáng),分類準(zhǔn)確率更高,尤其在樣本基數(shù)大的時候,其漏診和誤診的風(fēng)險更低。
另外,采用多尺度近似熵(Multiscale Approxi‐mate Entropy,MAE)和小波包分解提取機(jī)車輪對軸承的振動信號的特征向量,再分別輸入到PSOSVM,SVM 和Grid-SVM 模型中,與本文基于MSE 與PSO-SVM 的故障識別方法作對比。MAE的嵌入維數(shù)m=2,最大尺度因子τmax=20,樣本點(diǎn)數(shù)N=4 000,相似容限r(nóng)=0.15×SD。從每組故障類型中隨機(jī)選取60 個樣本作為訓(xùn)練數(shù)據(jù),剩余40 個樣本測試集,進(jìn)行100次的訓(xùn)練測試,識別結(jié)果如表4所示;小波包分解中采用Db10小波對100個樣本信號均進(jìn)行3 層小波分解,選取低頻到高頻8 個自帶信號的能量作為特征向量。同樣從每組故障類型中隨機(jī)選取60 個樣本作為訓(xùn)練數(shù)據(jù),剩余40 個樣本測試集,進(jìn)行100次的訓(xùn)練測試,識別結(jié)果如表4 所示。由表4 可知,MSE 的特征提取效果優(yōu)于MAE 和小波包分解,與本文方法識別準(zhǔn)確率99.15%相比,本文基于MSE 與PSO-SVM 的故障識別方法具有一定的優(yōu)勢。
表4 不同方法的分類結(jié)果Table 4 Classification results using different methods
1) MSE 能有效表征機(jī)車輪對軸承振動信號在不同尺度下的復(fù)雜性和非線性;采用粒子群算法對SVM 中的參數(shù)g和懲罰因子c進(jìn)行優(yōu)化處理,避免人為經(jīng)驗(yàn)選取參數(shù)產(chǎn)生的誤差,增加了參數(shù)選取的準(zhǔn)確性和自適應(yīng)性。
2) 提出一種基于MSE 和PSO-SVM 的機(jī)車輪對軸承故障識別模型,經(jīng)過實(shí)驗(yàn)驗(yàn)證,故障識別模型對機(jī)車輪對軸承實(shí)際故障識別準(zhǔn)確率高,并且模型運(yùn)行穩(wěn)定、自適應(yīng)性強(qiáng),為提高機(jī)務(wù)段檢測機(jī)車輪對軸承故障的精度提供了一種有效的方法。