郝勇,劉尚宗,吳文輝
(1.華東交通大學機電與車輛工程學院,南昌330013;2.青島四方龐巴迪鐵路運輸設備有限公司,山東青島266111)
振動信號分析廣泛應用于機械設備的故障診斷和健康狀態(tài)測試與維護。軸承是機械設備中一種重要零部件,它的主要功用是支撐機械旋轉體,降低其運動過程中的摩擦因數(shù),并保證其回轉精度,其質量優(yōu)劣直接影響機械系統(tǒng)的壽命、安全性和穩(wěn)定性[1],在旋轉機械中有70%的故障是由滾動軸承引起的。軸承振動信號具有非線性、非平穩(wěn)和缺陷特征微弱的特點[2-3],因此,從振動信號中直接提取軸承的故障特征較困難且不準確,需要探索一種適用于強背景干擾下的信號特征提取和分析方法實現(xiàn)軸承品質的評估。
振動信號結合機器學習方法常用于軸承的故障診斷和質量品質評估模型的建立[4]。然而,傳統(tǒng)的機器學習算法如支持向量機(Support vector machine,SVM)對于大數(shù)據(jù)訓練樣本會耗費大量機器內存與運算時間,對于非線性問題還需要選擇最優(yōu)核函數(shù)[5];決策樹(Decision tree)不支持在線學習,且會忽略數(shù)據(jù)集屬性間的相關性,模型容易過擬合;邏輯回歸(Logistic regression)只能處理兩分類問題,對多類特征不能很好處理,容易欠擬合。因此,傳統(tǒng)的機器學習算法雖然結構簡單,但是在復雜非線性關系的分類問題中其分析能力受到極大限制。
近年來,深度學習作為自動提取特征的典型方法應用于智能故障診斷。Kong 等[6]提出一種新穎的正則化策略,在堆棧自編碼模型訓練中引入內積,,構造出基于內部產(chǎn)品的堆棧式自編碼模型,用以改善工業(yè)過程的深層特征。葉狀等[7]利用經(jīng)驗模態(tài)分解方法得到多通道一維信號,構建多通道一維卷積神經(jīng)網(wǎng)絡(Multi-channel one-dimensional convolutional neural network,MC-1DCNN)模型進行特征提取。在MC-1DCNN的全連接層后接堆疊降噪自編碼器層,進一步進行維度縮減和特征提取并實現(xiàn)特征分類。李益兵等[8]利用粒子群優(yōu)化(Particle swarm optimization,PSO)算法優(yōu)選深度置信網(wǎng)絡(Deep belief nets,DBN)網(wǎng)絡結構,隨后運用具有最優(yōu)結構的DBN 模型直接提取低維故障特征,并將故障特征輸入軸承故障識別模型進行故障判斷。Wang 等[9]提出了一種基于強化學習的神經(jīng)網(wǎng)絡體系結構自動搜索方法,用于滾動軸承的故障診斷,該方法以遞歸神經(jīng)網(wǎng)絡(Recursive neural network,RNN)為控制器生成一系列動作,每個動作指定一種設計選擇,以構造用于故障診斷的子模型。CNN 是一種有監(jiān)督深度學習模型,具有局部區(qū)域感知、權重共享和空間采樣3個關鍵的架構思想,適用于處理高維數(shù)據(jù)[10-11],并且是含有多層處理單元的特征學習方法,可以將輸入層的數(shù)據(jù)逐層轉換成更易于識別的特征[12]。
論文針對強背景干擾下振動信號的特征提取和建模分析問題,以滾動軸承的故障診斷和質量品質評估振動信號作為實驗數(shù)據(jù)集,提出了一種基于振動圖像(Vibration image,VI)結合CNN的軸承故障診斷與質量評估方法:將振動信號轉為二維振動圖像,結合CNN方法提取圖像多維特征信息并進行建模分析,以期實現(xiàn)噪聲影響下振動信號的有效特征提取和精確穩(wěn)定的模型構建。
在軸承故障診斷和質量品質評估過程中,采集的振動信號包含了豐富的質量品質信息和設備運行產(chǎn)生的沖擊等干擾響應信息,由于時域信號不相鄰樣本點間關系獲取比較困難,若將其轉換為振動圖像,獲取給定圖像元素與其相鄰圖像元素間的關系相對容易。因此,為了有效提取振動信號樣本點間關系信息,將振動信號轉換為振動圖像,樣本幅值歸一化到[-1,1],然后將歸一化的樣本幅值轉換為圖像像素值[13-14]。圖1所示為振動信號轉換為振動圖像的構建過程示意圖。
圖1 振動圖像構建過程示意圖
樣本幅值與對應圖像像素值的表達式為
式中:M 為圖像尺寸長度;N 為圖像尺寸寬度;j=1∶M;k =1∶N; P[ j,k]為M × N 大小振動圖像對應像素的強度;B[·]是振動信號中樣本點轉化的幅值。振動圖像中像素的個數(shù)等于振動信號中樣本點的個數(shù)。
1.2.1 振動信號時域特征分析
在振動信號分析過程中,實驗采集的滾動軸承振動信號包含了軸承工作的全部信息,具有較強的時域信息,因此對信號進行時域特征提取是一種最直接、最有效的特征提取方法。振動信號時域特征(Vibration signal time domain feature,VSTF)提取獲取信號時域特征參數(shù)。
時域特征參數(shù)可分為有量綱和無量綱。本文有量綱特征統(tǒng)計參數(shù)為均值、均方根值、方根幅值、絕對平均值、偏斜度、峭度、方差、最大值、最小值、峰峰值;波形指標、峰值指標、脈沖指標、裕度指標、偏斜度指標、峭度指標等特征為無量綱統(tǒng)計參數(shù)。
1.2.2 梯度方向直方圖算子
梯度方向直方圖(Histogram of oriented gridients,HOG)源于SIFT算法,是一種圖像局部特征描述符,通過對圖像中某一矩形區(qū)域中像素點梯度幅值和方向綜合信息的統(tǒng)計來獲取圖像特征。
1)每個像素點梯度以及估算梯度的幅值G(x, y)和方向α(x, y)的計算式分別為:
2)圖像分割成大小相似的單元模式(Cell),以單元模式為主要統(tǒng)計單位來估計其梯度方向的質量分布圖(Cell-HOG)。對于每個Cell計算梯度方向的質量分布圖向量其中
3)相鄰Cell 組成一個塊。該塊在圖像中向右或向下方移動一個Cell 以獲得下一個塊。
4)所有的塊的梯度直方圖融合起來,獲得其最終輸入圖像的HOG 特征。
1.2.3 支持向量機(SVM)
SVM是由Vapnik 基于統(tǒng)計學習理論提出的一種機器學習算法,算法獨特優(yōu)勢在于解決小樣本、非線性問題。懲罰因子c 和核函數(shù)參數(shù)g 的選擇會對SVM 模型最終結果起關鍵作用,參數(shù)尋優(yōu)將關系到SVM 模型的優(yōu)劣。網(wǎng)格搜索算法(Grid search,GS)是將c、g 在一定范圍內劃分網(wǎng)格,通過遍歷網(wǎng)格內所有點來找到最優(yōu)參數(shù)組合。
CNN 網(wǎng)絡具有前饋結構,在圖像分析中具有3個重要的特點:局部感知、權重共享和空間采樣。CNN 典型結構由卷積層、池化層以及全連接層[15]構成。圖2所示為典型的卷積神經(jīng)網(wǎng)絡結構圖。
圖2 典型的卷積神經(jīng)網(wǎng)絡
卷積層將輸入圖像與內核進行卷積。卷積層內核大小相同,提取圖像局部特征。一般情況下,卷積過程中的數(shù)學模型表示為
式中: xlj為l 卷積層j 通道的值;(*)為卷積操作;Mj為 計算 xlj的特征圖集;k 為S ×S 的核矩陣;f 為非線性激活函數(shù); blj為偏置項。
池化層對于上一層輸入的振動圖像進行降采樣處理,同時減少網(wǎng)絡參數(shù)[16]。此外,池化層通過對輸入進行小的變換保持了局部不變性,其數(shù)學模型為
式中:down(·)為子采樣函數(shù);β 為乘法偏置。
全連接層是一種傳統(tǒng)的前饋神經(jīng)網(wǎng)絡,其目的是上層的特征圖中收集所有的特征進行分類[17],Softmax函數(shù)作為輸出層激活函數(shù)。Softmax 函數(shù)定義如下
為了實現(xiàn)軸承振動信號多維信息特征的提取和分析,擬采用振動圖像結合CNN的信息提取和建模方法對滾動軸承故障和質量等級評估等反映軸承質量品質的振動信號進行分析,軸承質量品質評估分析流程圖如圖3所示。
圖3 軸承質量品質評估分析流程
該方法主要分為2個核心步驟:振動信號轉換為振動圖像和振動圖像特征提取建模與分類識別。該方法的一般步驟如下:
1)采用振動信號采集系統(tǒng)依據(jù)國標[18]或行業(yè)推薦標準[19]采集軸承故障振動信號或不同品質軸承工作的振動信號;
2)利用1.1 節(jié)所述方法將振動信號轉換為振動圖像;
3)數(shù)據(jù)樣本隨機劃分為訓練集與測試集,訓練集訓練CNN模型,測試集評估模型精度,實現(xiàn)軸承故障診斷和質量品質評估。正確識別率CRR為
式中:RCR為正確識別率,RCR越高,表明模型越好;p為正確識別樣本數(shù);t 為總樣本數(shù)。
2.1.1 數(shù)據(jù)來源
為有效驗證本文所提軸承振動信號分析方法,采用美國凱斯西儲大學電氣工程實驗室提供的故障數(shù)據(jù)集[20]。以型號為6205-2RSSKF的軸承為研究對象,電火花加工單點損傷,電機負載為0HP、軸承轉速為1797 r/min、采樣頻率為48 kHz 下進行試驗。選取傳感器在驅動端采集得到的4種狀態(tài)(正常狀態(tài)、內圈故障、外圈故障(6點鐘方向)及滾動體故障)振動信號,總體樣本數(shù)為200,樣本信號包含2304個樣本點。數(shù)據(jù)樣本說明如表1所示。
2.1.2 基于振動信號的軸承故障診斷判別模型研究
1)VS-SVM 模型
直接采用SVM方法用于軸承故障診斷識別模型的構建,原始信號作為模型特征輸入,SVM采用的核函數(shù)為徑向核函數(shù),通過GS尋優(yōu)方法獲取最優(yōu)值,參數(shù)c、g 尋優(yōu)范圍[2-20,220]。將滾動軸承4種狀態(tài)的振動信號直接建模,隨機選取120樣本作為訓練集用于故障診斷模型的建立,其余樣本用于驗證模型,隨機10次樣本劃分并建立SVM 模型,優(yōu)化得懲罰因子c為0.41,核函數(shù)參數(shù)g 為0.04,訓練集平均識別率為100%,測試集平均識別率為95.62%。
2)VSTF-SVM 模型
振動信號包含豐富的相關軸承故障信息,通過提取振動信號的時域特征,采用優(yōu)化參數(shù)的SVM進行軸承故障診斷識別模型構建。利用統(tǒng)計方法提取16個時域特征,200個樣本按3∶2比例劃分訓練集與測試集進行模型訓練與驗證。模型優(yōu)化后c =8,g =0.25,隨機10次樣本劃分后獲得訓練集平均識別率98.82%,測試集平均識別率97.25%。
2.1.3 基于振動圖像和卷積神經(jīng)網(wǎng)絡的軸承故障診斷判別模型研究
依據(jù)1.1節(jié)方法將樣本振動信號轉化為48×48的振動圖像,圖像樣本如圖4 所示。由圖看出正常狀態(tài)的振動圖像與其他3種狀態(tài)振動圖像差別明顯。
圖4 4種狀態(tài)軸承振動圖像
1)VI-HOG-SVM 模型
為克服在振動信號中提取特征時不能很好挖掘軸承工作特征信息,將振動信號轉換為振動圖像,利用HOG 算法獲取振動圖像的圖像特征,使用SVM分類器對軸承故障進行診斷識別。樣本訓練集與測試集按3∶2劃分并進行特征提取并建模分析,隨機10次樣本劃分建模分析獲得訓練集平均識別率為100%,測試集平均識別率為99.62%。最優(yōu)模型參數(shù)c =5.66,g =0.004。
2)VI-CNN 模型
按上述比例隨機劃分樣本數(shù)據(jù),設置2層卷積與2層池化。卷積層參數(shù)分別設置[21-22]為:50@3×3,100@2×2,步長均設為1,使用ReLU 激活函數(shù)。池化層均采用2×2,步長設置為2的最大池化。隨機10次樣本劃分后訓練集與測試集平均識別率均為100%。
2.1.4 最優(yōu)故障診斷模型分析
圖5和表2所示為采用隨機分組方式進行樣本劃分后,對每種振動信號分析方法建立10個模型的計算結果。
表2 軸承故障識別結果統(tǒng)計
圖5 軸承故障識別結果比較
由圖5 可知,VI-CNN 方法得到了最高的CRR 值,且10個模型的CRR值均為100%;VI-HOG-SVM模型的CRR 次之,為99.62%;VSTF-SVM 模型的CRR 為97.25%;VS-SVM方法的分析結果最低,且10個模型的測試結果差異較大,表明該方法具有較低的穩(wěn)健性。直接采用振動信號結合SVM 方法較難提取分析信號的深度特征信息;VI-CNN 模型相比于其它方法具有更好的細節(jié)信息分辨力和信噪分離能力,模型具有較好的分析精度和穩(wěn)健性。
VI-CNN 模型最佳結果混淆矩陣如圖6所示,由圖可知該模型平均測試精度為100%,每一類分類識別率均為100%,表明VI-CNN 模型可以實現(xiàn)振動信號信息特征的有效且多維度提取,可以實現(xiàn)更好的識別結果。
圖6 VI-CNN 模型最佳結果混淆矩陣
2.2.1 數(shù)據(jù)來源為進一步驗證所提方法的優(yōu)勢,依據(jù)《JB/T 7047-2006中深溝球軸承振動水平標準》,采用S0910裝置依據(jù)機械行業(yè)推薦標準-深溝球軸承振動水平采集得優(yōu)等品、一等品及合格品軸承振動信號。振動信號檢測裝置如圖7所示。主軸轉速為1800 r/min,軸向載荷70 N,采樣頻率為8 kHz。每一等級樣本各50個,樣本信號包含2304個樣本點。圖8所示為3種品質軸承振動信號。
圖7 軸承檢測裝置簡圖
圖8 3種品質軸承振動信號圖
2.2.2 基于振動信號的軸承質量等級評估模型研究
隨機選取90個振動信號樣本作為訓練集,60個作為測試集。
1)VS-SVM 模型
直接采用優(yōu)化參數(shù)的SVM進行建模與軸承質量等級評估,隨機10次樣本劃分后訓練集平均識別率為100%,測試集平均識別率為84.83%。優(yōu)化后模型參數(shù)c=1,g =0.71。
2)VSTF-SVM 模型
使用振動信號16個時域特征并結合SVM進行建模與軸承質量評估,隨機10 次樣本劃分后訓練集平均識別率為97.77%,測試集平均識別率為86.66%。模型參數(shù)c=22.63,g =0.18。
2.2.3 基于振動圖像和卷積神經(jīng)網(wǎng)絡的軸承質量等級評估模型研究
依據(jù)1.1節(jié)所提方法,樣本信號轉化為48×48的振動圖像,振動圖像如圖9所示。由圖9可知優(yōu)等品與一等品、合格品振動圖像有明顯差別將振動圖像樣本隨機分為90個訓練集樣本和60個測試集樣本。
圖9 3種軸承品質的振動圖像
1)VI-HOG-SVM 模型
軸承質量等級樣本訓練集與測試集進行特征提取并建模與預測識別,隨機10次樣本劃分建模分析獲得訓練集平均識別率為100%,測試集平均識別率為95.83%。最優(yōu)模型參數(shù)c = 4,g = 0.0055。
2)VI-CNN 模型
振動圖像根據(jù)節(jié)1.1方法由振動信號轉換,分別設置2層卷積與2層池化,卷積層參數(shù)分別設置為:50@3×3,150@2×2,步長均設為1,使用ReLU 激活函數(shù)。池化層均采用2×2,步長設置為2的最大池化。隨機10次樣本劃分后訓練集平均識別率為100%,測試集平均識別率均為98.16%。
2.2.4 最優(yōu)判別模型分析
對軸承質量等級評估實驗數(shù)據(jù)樣本隨機劃分后,每種振動分析方法分別建立10個模型評估識別結果,如圖10所示。由圖可以看出,VI-CNN 模型平穩(wěn)性最好,其他3個模型軸承質量評估識別結果波動比較大。表3中計算得到10次VI-CNN 模型的CRR 平均值為98.16%,標準差為0.49;VI-HOGSVM 模型CRR平均值為95.83%,但CRR值標準差為2.49,標準差值過高,其余2個模型CRR值均低于90%,且由標準差值可以看出模型穩(wěn)定性較差。VI-CNN 模型在軸承質量等級評估過程中,表現(xiàn)出更好的樣本特征信息提取能力,模型精度更高。
圖10 軸承質量等級評估結果比較
表3 軸承質量等級評估結果統(tǒng)計
對于軸承質量等級數(shù)據(jù)集,VI-CNN 模型識別結果混淆矩陣如圖11所示。標簽1、2、3分別代表優(yōu)等品、一等品、合格品,行代表測試值標簽,列代表真實值標簽,在進行軸承等級識別分類時錯將某一優(yōu)等品樣本識別成一等品樣本,導致平均測試識別精度為98.33%。對于不同質量等級的軸承振動信號樣本數(shù)據(jù),該模型仍能高效穩(wěn)定識別。
圖11 VI-CNN 模型識別結果混淆矩陣
1)振動圖像對比于振動信號包含更為豐富的軸承樣本信息,在進行特征提取有效減少信息缺失。
2)對比振動信號傳統(tǒng)特征提取方法,CNN自適應特征提取不依賴先驗知識,模型能更好學習特征且提高識別準確率。
3)通過振動圖像結合CNN 對滾動軸承4類故障和滾動軸承3類質量等級實現(xiàn)了準確診斷。實驗得出CNN 模型對于不同數(shù)據(jù)集仍具有很好的適應性,測試集識別率均到達了100%。
鑒于本研究中故障診斷和軸承質量等級樣本數(shù)據(jù)有限,CNN 方法中采用4個卷積層已使樣本數(shù)據(jù)達到很好分類效果。故障樣本數(shù)據(jù)和質量等級數(shù)據(jù)需進一步擴大,以構建深層卷積網(wǎng)絡,并優(yōu)化模型內部參數(shù),利用大數(shù)據(jù)樣本建模與內部參數(shù)優(yōu)化是以后進行研究的方向。