鄧飛躍, 強亞文
(1. 石家莊鐵道大學 河北省工程機械動力與傳動控制重點實驗室,河北 石家莊 050043;2. 石家莊鐵道大學 河北省大型工程機械裝備制造協(xié)同創(chuàng)新中心,河北 石家莊 050043)
滾動軸承作為旋轉(zhuǎn)機械中的核心組件,其狀況直接影響了機械整體的正常運行。在旋轉(zhuǎn)機械的各類故障中,滾動軸承故障約占30%,對滾動軸承的運行狀態(tài)進行準確識別,能夠及時發(fā)現(xiàn)軸承故障以制定維修計劃,保證機器的正常運行。同時由于旋轉(zhuǎn)機械運轉(zhuǎn)過程中時刻產(chǎn)生著海量監(jiān)測數(shù)據(jù),給故障診斷帶來了諸多挑戰(zhàn),傳統(tǒng)的支持向量機(SVM)、BP神經(jīng)網(wǎng)絡等方法由于或多或少存在一些缺陷[1-2],限制了其實際應用。
極限學習機(Extreme Learning Machine,ELM)作為一種新型神經(jīng)網(wǎng)絡學習方法,相比其他神經(jīng)網(wǎng)絡方法擁有更快的學習速度和泛化性能,已成功應用于多個研究領域[3-9]:Cao et al[3]基于ELM和稀疏表示分類算法提出了一種用于圖像分類的混合分類器;Zhang et al[4]提出了一種基于極限學習機的去噪自動編碼器,并將流形正則化框架引入其中,提高了圖像的識別性能;林怡等[5]利用魚群尋優(yōu)算法優(yōu)化極限學習機的正則化參數(shù)和核參數(shù),增強了遙感影像分類的準確度。上述研究均取得了較好的結(jié)果,證實了ELM方法具有良好的工程應用前景。與此同時,ELM方法在機械設備故障研究中也得到了較好的應用:Li et al[6]提出一種稀疏與鄰域保持深層極限學習機算法,成功用于旋轉(zhuǎn)機械的故障診斷;皮駿等[7]基于改進遺傳算法優(yōu)化極限學習機網(wǎng)絡,將其應用于滾動軸承故障診斷;鄭近德等[8]提出了一種基于極限學習機的變量預測模型用于滾動軸承的劣化狀態(tài)識別;裘日輝等[9]基于PCA和極限學習機提出了單分類算法,獲得了較高的分類準確率。這些方法雖然具有積極的借鑒意義,但由于ELM模型中輸入權(quán)值和閾值是隨機生成的,有可能導致病態(tài)問題的出現(xiàn)[10],因此在ELM特征向量輸入方面仍需要進行進一步的研究。
基于上述分析,以極限學習機的模型輸入為出發(fā)點,討論了一種新型模型輸入的極限學習機并應用于故障模式識別。該方法首先通過K-Singular Value Decomposition(K-SVD)方法提取樣本數(shù)據(jù)的自適應字典,基于該字典使用正交匹配追蹤(OMP)對樣本數(shù)據(jù)進行稀疏編碼,將稀疏編碼作為模型輸入。通過美國西儲大學發(fā)布的10類滾動軸承故障數(shù)據(jù)測試,該方法在多種不同故障類型以及不同故障程度識別中具有較好的診斷正確率和可靠性。
圖1 極限學習機結(jié)構(gòu)圖
極限學習機具有和傳統(tǒng)單隱層神經(jīng)網(wǎng)絡相同的網(wǎng)絡結(jié)構(gòu)[11],但其輸出權(quán)值矩陣根據(jù)最小范數(shù)最小二乘解理論一部求解得出,所以具有更快的訓練速度。
極限學習機的結(jié)構(gòu)見圖1,設有N個訓練樣本(X,T),X=[x1,x2,…,xN],T=[t1,t2,…,tN],則模型的輸出可表示為
(1)
式中,M為隱藏節(jié)點個數(shù);wm、bm分別為隨機給定的隱藏節(jié)點的輸入權(quán)重和偏置;βm為輸出權(quán)重;G為隱含層的激活函數(shù),文獻[4]給出了幾種常用的激活函數(shù)。式(1)還可以改寫成如下矩陣形式
O=Hβ
(2)
式中,H=G(wx+b)為隱含層輸出矩陣,ELM的訓練目標為
‖T-Hβ‖=0
(3)
隱含層的輸出權(quán)值
β=H+T=(HTH)-1HTT
(4)
式中,H+表示H的Moore-Penrose廣義逆。
由此可見,ELM模型免去了傳統(tǒng)算法中的參數(shù)設置以及迭代計算過程,計算更加簡便,極大地提高了網(wǎng)絡構(gòu)建的速度。本文使用ELM分類模型[12]用于故障模式識別。
實際工程振動信號數(shù)量巨大,并且包含大量背景噪聲,若直接作為模型輸入進行診斷,不僅診斷準確率得不到保障,而且嚴重降低診斷效率,所以有必要對數(shù)據(jù)進行消噪與降維處理。
K-SVD字典學習算法以稀疏編碼-字典更新的循環(huán)迭代方式來對樣本信號進行學習,相比傳統(tǒng)字典擁有更好的自適應能力,對信號的表示也更稀疏。同時為提高學習速度,采用改進型K-SVD算法[13],其具體過程如下:
(1)給定學習樣本Ym×n,設定K-SVD算法參數(shù):迭代次數(shù)J,迭代過程中OMP算法的稀疏度為L并初始化字典Dm×K,字典原子數(shù)目為K。
(2)利用OMP算法求解系數(shù)矩陣WK×n。
(3)隨機排列字典原子序號,記為rperm,初始化計數(shù)器j=1。
(4)令h=rperm(j),找出系數(shù)矩陣W第h行中不為零的元素,記錄其位置Ih={
α|W(h,α)≠0|}。
(5)若集合I為空,則計算誤差矩陣E=Y-DW,并記錄其最大誤差所在列i,將數(shù)據(jù)集的第i列歸一化作為字典的第h個原子,D(h)=Y(i)/‖Y(i)‖2;若集合I不為空,則根據(jù)集合中元素得到新系數(shù)矩陣WT=(k,α),(k=1,2,…,K;α∈Ih),并找到對應的數(shù)據(jù)列計算誤差E=Y(α)-DWT,(α∈Ih),對誤差奇異值分解得到左特征向量p、特征值s、右特征向量d,更新D(h)=d,W(h,α)=spT,(α∈Ih) 。
(6)更新計數(shù)器j=j+1,返回步驟(4),當j=K時停止。
(7)更新迭代次數(shù)返回步驟(3)直至算法結(jié)束。
改進后的算法只根據(jù)系數(shù)矩陣中不為零元素的位置對其部分字典基進行奇異值分解,加快了計算效率[14]。
利用K-SVD學習算法學習得到的字典較其他字典稀疏性更好,能夠以較少的系數(shù)準確表示數(shù)據(jù)的稀疏特征,可以對海量運行監(jiān)測數(shù)據(jù)進行有效地壓縮。相比時域樣本信號,頻域信號可以有效消除相同類型樣本之間故障沖擊時移的影響,故障模式識別的魯棒性更好。因此,采用其頻域數(shù)據(jù)進行處理。
利用K-SVD算法求取ELM模型輸入的過程如下:①將數(shù)據(jù)庫中所有數(shù)據(jù)進行頻域轉(zhuǎn)換,得到其頻域數(shù)據(jù);②將頻域數(shù)據(jù)庫分為數(shù)據(jù)集1與數(shù)據(jù)集2,使其2個數(shù)據(jù)集都均勻包含每種故障類型;③將數(shù)據(jù)集1作為K-SVD算法的樣本數(shù)據(jù)學習得到字典D;④基于該字典使用OMP算法[15]分別求取數(shù)據(jù)集1和數(shù)據(jù)集2的稀疏系數(shù)矩陣作為訓練集和測試集,根據(jù)故障類型賦予其標簽,得到ELM的模型輸入。
為了說明此種模型輸入的有效性與優(yōu)越性,將此模型應用于實例分析。采用西儲大學發(fā)布的軸承振動數(shù)據(jù)進行分析[16-17],選取其中10種故障類型的數(shù)據(jù)用于故障模式識別,并與其他模型輸入方式結(jié)果進行對比。另外2種模型輸入方式為:多種時、頻域指標和PCA融合的特征指標,在同樣的訓練樣本和測試樣本基礎上,從網(wǎng)絡的診斷正確率、隱含層激活函數(shù)和神經(jīng)元個數(shù)多個方面進行綜合分析。同時為說明ELM模型的優(yōu)越性,對比分析了以稀疏編碼為輸入的BP神經(jīng)網(wǎng)絡、SVM模型。
原始數(shù)據(jù)的具體信息見表1,該數(shù)據(jù)由軸承支座上放置的加速度傳感器采集得到,采樣頻率為12 kHz。將單點損傷直徑為0.177 8 mm的損傷定為一級損傷,單點損傷直徑為0.355 6 mm的損傷定為二級損傷,單點損傷直徑為0.533 4 mm的損傷定為三級損傷,并將其采集得到的數(shù)據(jù)不重疊地劃分為118個,每個樣本包含1 024個數(shù)據(jù)點,隨機劃分每種故障類型的樣本組成訓練樣本和測試樣本,樣本間互不重復,訓練樣本包含每種故障類型70個,測試樣本包含每種故障類型48個。
表1 數(shù)據(jù)信息
采用稀疏編碼的方式對數(shù)據(jù)進行處理,首先對全部數(shù)據(jù)進行頻域轉(zhuǎn)換,使用訓練樣本作為K-SVD算法的學習樣本,過程中,字典原子個數(shù)K設置為10,算法過程中OMP稀疏度L為5,迭代次數(shù)J為5。使用學習到的字典對全部頻域數(shù)據(jù)進行稀疏編碼,將每個樣本數(shù)據(jù)的稀疏系數(shù)向量代替其樣本作為ELM模型的輸入。同時計算每個樣本的時域、頻域指標以及將時、頻域指標進行PCA融合后的特征構(gòu)建了其他2種模型輸入。其中,時域指標選取為:最大值、均值、均方根值、方差、偏度、峭度、波形指標、脈沖指標;頻域指標選取為:頻率均值、頻率標準差、頻率均方根以及頻譜峭度共12個指標;PCA融合后選擇其前6個主元作為模型輸入。
3種模型輸入的測試集診斷結(jié)果如表2所示,其中固定神經(jīng)元數(shù)量為40,為消除隨機因素影響,每種模型輸入計算30次。
表2 測試集診斷結(jié)果
從表2可以看出,稀疏編碼為輸入的診斷模型在3種激活函數(shù)下都取得了最高的平均正確率,以Sigmoid函數(shù)為激活函數(shù)時,其正確率最高,為98.57%,標準差也較小,僅為0.29%,診斷結(jié)果最為穩(wěn)定。此外,以Sigmoid函數(shù)為激活函數(shù)時,3種模型輸入均取得了最高的平均正確率和最低的正確率標準差,相比于其他激活函數(shù),此函數(shù)具有更強的魯棒性。因此,基于Sigmoid函數(shù)分析隱含層神經(jīng)元數(shù)量對測試集診斷結(jié)果的影響。
極限學習機的隱含神經(jīng)元數(shù)量不僅影響模型的診斷正確率,還關系到模型的計算時間。較少的神經(jīng)元不能有效提取數(shù)據(jù)特征,過多的神經(jīng)元則會造成數(shù)據(jù)冗余,同時增加計算負擔?;赟igmoid函數(shù)分析神經(jīng)元數(shù)量對測試集診斷結(jié)果的影響,在1~400每種神經(jīng)元個數(shù)下計算3種模型輸入診斷結(jié)果30次,其平均正確率結(jié)果如圖2所示,正確率標準差如圖3所示。由圖2、圖3可知,3種模型輸入的診斷正確率隨神經(jīng)元個數(shù)的增加都呈先增加后下降的趨勢,PCA主元作為模型輸入的平均正確率較時、頻域指標略高,但這2種模型輸入的診斷平均正確率在其穩(wěn)定區(qū)域(即隨神經(jīng)元個數(shù)增加、平均正確率未出現(xiàn)明顯下降的區(qū)域)均低于以稀疏編碼為輸入的模型。并且在較寬的神經(jīng)元個數(shù)范圍內(nèi)(20~200),以稀疏編碼為輸入的模型診斷平均正確率均穩(wěn)定在98%以上,標準差穩(wěn)定在1%以下,可見該診斷模型不僅具有較高的正確率,穩(wěn)定性也較好。
圖2 平均正確率分析
圖3 標準差分析
以Sigmoid函數(shù)為激活函數(shù)、隱含層神經(jīng)元數(shù)量為100時,3種模型輸入的診斷結(jié)果分別見圖4~圖6。稀疏編碼為輸入時,僅有1個樣本診斷錯誤,明顯低于其他2種輸入的模型,診斷效果非常明顯。
圖4 稀疏編碼為輸入的診斷結(jié)果
圖5 PCA主元為輸入的診斷結(jié)果
圖6 時、頻域指標為輸入的診斷結(jié)果
將稀疏編碼作為輸入,采用BP神經(jīng)網(wǎng)絡、SVM模型進行故障模式識別。不斷調(diào)整2種方法參數(shù),確定其最優(yōu)參數(shù)如下:BP神經(jīng)網(wǎng)絡隱含層神經(jīng)元數(shù)量為10,學習率為0.1,最高迭代次數(shù)為10 000,隱含層激勵函數(shù)為“Sigmoid”;SVM核函數(shù)類型為“l(fā)inear”。ELM模型的隱含層神經(jīng)元數(shù)量為100,激活函數(shù)為“Sigmoid”。3種模型每種模型計算30次,測試集診斷結(jié)果見表3。測試平臺計算機的配置為:CPU是酷睿i5-4210(2.4 GHz),8 G內(nèi)存,Matlab軟件版本為R2016a。
表3 測試集診斷結(jié)果
從表3的診斷結(jié)果可以看出,以稀疏編碼為輸入的ELM模型不僅具有極高的正確率,同時計算時間相對最短,滿足實際工程應用需要。相比傳統(tǒng)的BP神經(jīng)網(wǎng)絡、SVM等方法,ELM建立能反映特征值之間復雜關系的非線性高斯函數(shù)模型,進而準確反映不同特征值之間復雜關系,可以對待測樣本進行更加準確的樣本識別。
(1)提出了以稀疏編碼為輸入的ELM診斷模型,將其應用于10種不同類型、不同程度滾動軸承故障進行模式識別,并與其他2種輸入的ELM模型、BP神經(jīng)網(wǎng)絡、SVM模型對比。結(jié)果表明,以稀疏編碼為輸入的ELM模型診斷正確率更高,穩(wěn)定性也較好,并且模型保持了ELM計算速度快的優(yōu)點。
(2)隱含層激活函數(shù)為Sigmoid、神經(jīng)元數(shù)量為20~200時,以稀疏編碼為輸入的ELM診斷模型平均正確率穩(wěn)定在98%以上,標準差穩(wěn)定在1%以下,較強的診斷性能使其更適用于設備故障診斷。