路小娟,石成基
(蘭州交通大學 自動化與電氣工程學院,蘭州 730070)
滾動軸承作為旋轉機械設備的重要組成部分,在長期大負荷、高強度的復雜工況下,極易產(chǎn)生各種故障,導致機械設備工作性能惡化,直接影響了生產(chǎn)系統(tǒng)的安全穩(wěn)定運行。采用單一的智能檢測方法已經(jīng)很難得到準確的診斷結果。如何融合多種數(shù)據(jù)源,實施對目標軸承進行快速、可靠的檢測,使其診斷結果具有準確性和穩(wěn)定性成為研究的熱點和難點,具有一定的研究價值和實際的應用需求。
故障診斷問題的多維化和復雜化致使基于信號處理的診斷技術愈加繁瑣。近年來,隨著機器學習技術的快速發(fā)展,使得數(shù)據(jù)驅動的智能化故障檢測和診斷技術受到廣大學者的廣泛關注。文獻[1]利用深度神經(jīng)網(wǎng)絡與淺層學習機相結合的方法構建混合智能故障診斷模型,達到了軸承故障診斷的目的。文獻[2]中,金棋等人提出一種基于深度學習特征提取的行星齒輪箱故障的方法,利用多個堆棧降噪自編碼器提取故障特征來實現(xiàn)對齒輪箱的故障診斷。文獻[3]利用基于多小波系數(shù)的故障特征提取的方法,提取機械振動信號多小波系數(shù)的最大值、最小值以及均值等統(tǒng)計特征用于故障診斷。文獻[4]利用深度置信網(wǎng)絡對齒輪系統(tǒng)的振動信號進行特征提取,然后利用DBNS強大的映射表征能力進行故障辨識。文獻[5]是通過局部均值分解算法對故障信號進行自適應分解,然后利用峭度準則及切片雙譜分析來提取故障特征的頻率信息。文獻[6]提出在不同噪聲強度背景下的振動信號進行故障特征提取,采用優(yōu)化廣義S變換的滾動軸承故障特征提取方法并取得了一定的效果。
滾動軸承的振動信號是一種非平穩(wěn)、非線性的信號,如何進行信號處理是特征提取的關鍵,特征提取的優(yōu)劣直接影響到智能故障診斷系統(tǒng)對故障診斷結果的準確性。現(xiàn)有做法通常是從振動信號等檢測數(shù)據(jù)中提取包絡譜特征[7]、時頻特征[8]和小波特征[9]等故障特征,進而用于樸素Bayes[10]分類器等智能檢測模型進行故障診斷。但多數(shù)研究在信息融合時都要對原始信號進行特征提取,導致了原始信號大量信息的丟失,致使信息融合不完善。概率盒(probability-box,p-box)理論是用來表征不確定數(shù)組成的偶然不確定性和認知不確定性,在定量不確定性建模方面有著天然的優(yōu)勢。本文利用p-box建模將諸多不確定性問題考慮在內進行信息融合,可以有效防止傳統(tǒng)特征提取所造成的大量有用概率信息丟失的問題。支持向量機(support vector machine,SVM)是一種建立在統(tǒng)計學習理論上和VC維結構理論的模式識別方法,在其核函數(shù)σ和懲罰因子C選擇的過程中利用混合改進的灰狼算法(hybrid improved grey wolf optimization,HGWO)進行優(yōu)化,以提高在處理小樣本、非線性問題上的泛化能力,增強其模式識別的能力。
本文提出基于p-box和HGWO-SVM的滾動軸承診斷方法。首先利用概率盒進行多源信息融合,然后提取故障特征,以解決信息不確定的問題,提高診斷精度。最后利用HGWO-SVM診斷模型進行故障診斷,得出診斷結果。經(jīng)試驗驗證,該方法具有較高的故障辨識能力和診斷效率。
概率盒是將指標數(shù)據(jù)放在一個界限范圍內,對其概率界限進行分析,并根據(jù)界限提取數(shù)據(jù)的特征向量用于故障診斷,能更好的解決在機械故障診斷過程中各數(shù)據(jù)特征的不確定性、信息源的未知性和測量不確定性等問題。
概率盒的下邊界
(1)
概率盒的上邊界
(2)
概率盒的示意圖如圖1所示。
圖1 p-box示意圖
p-box的核心是D-S結構體(dempster-shafer structures,DSS)。DSS是基于D-S證據(jù)理論[11]提出來的,是多個焦元構成的集合,而每個焦元包含一個區(qū)間和一個信度。DSS的基本結構形式可表示為
{([x1,y1],m1),([x2,y2],m2),…,([xn,yn],mn)}
(3)
其中,m稱為概率片,應滿足∑mi=1,xi≤yi,且當xi=yi時,yi≠yj,i=1,2,3,…,n。
p-box與DSS之間可以理解為整體與部分的關系,p-box的左邊界可由DSS的每個小區(qū)間左界累積得到,即
(4)
同理,p-box的右邊界可由DSS的每個小區(qū)間右界累積得到,即
(5)
兩條折線所包含的就是概率盒,兩虛線圍成的矩形區(qū)域是DSS焦元,橫坐標表示區(qū)間,矩形的高表示焦元的mass值,如圖2所示。
圖2 DSS轉換為p-box示意圖
同樣,p-box間的卷積運算需要將其離散化,這里將p-box分解為等信度的DSS,如圖3所示,每兩條虛線間為DSS焦元,每個焦元對應的mass值相等。
圖3 p-box等信度離散化
概率盒的來源有很多種,包括卷積建模方法、魯棒貝葉斯方法、專家估計方法和試驗測量方法等。為了保留原始數(shù)據(jù)豐富的概率統(tǒng)計信息,本文在概率盒試驗測量建模的基礎上,采用根據(jù)原始數(shù)據(jù)直接建立概率盒的方法[12],稱為概率盒直接建模方法(the p-box modeling method based on raw data,RDPMM)。RDPMM的優(yōu)勢在于其不用驗證數(shù)據(jù)的概率分布類型,可直接根據(jù)原始數(shù)據(jù)進行建模,因此應用范圍較廣。p-box直接建模得到的p-box的邊界是最窄的,即緊致性最高。
RDPMM建模方法的算法是將原始數(shù)據(jù)按采樣頻率轉換成m行n列的數(shù)組,m為采樣次數(shù),n為采樣頻率;將每次采樣的數(shù)據(jù)按遞增順序排序,得到新的數(shù)組,然后計算各自排列熵值,找到每組的最小值和最大值的行向量;最后累加最小值行向量和最大值行向量得到概率盒的下邊界和上邊界。故障信號p-box的建模流程如圖4所示。
圖4 p-box建模流程圖
在不同的條件下,或者采用不同的方法可以得到多個不同概率盒,為了能夠進一步得到信息相對一致、完整的概率盒,就需要將不同的概率盒進行融合。概率盒融合的常用方法包括:貝葉斯融合、交集融合、包絡、DS證據(jù)體融合以及均值融合等。本文采用包絡的方法對不同的概率盒進行數(shù)據(jù)的融合,其融合的基本原理如下:
定義有n個概率盒
它們的包絡定義為
則有如下表示
將含有不同信息的概率盒進行融合之后再提取其特征量可以有效的增加故障診斷的準確度。本文采用累積不確定測量方法實現(xiàn)p-box的特征提取,用于后期SVM的故障識別。結合相關文獻對融合后的概率盒進行其6個特征向量的提取,所提取特征向量為:①累積寬度;②對數(shù)累積寬度;③累積區(qū)間邊界值;④邊界值;⑤矛盾區(qū)間統(tǒng)計;⑥置信區(qū)間。
2014年澳大利亞學者Mirjalili等[13]根據(jù)大自然中灰狼種群的等級制度和狼群種族集體圍攻、狩獵的過程提出了一種群智能優(yōu)化算法——灰狼算法(grey wolf optimization,GWO)?;依欠N群的的等級結構如圖5所示。
圖5 灰狼種群等級結構圖
GWO在每一次的優(yōu)化過程中,取得最優(yōu)解的三只狼的位置以此標記為α,β,δ,其余狼的位置標記為ω。由每一代種群的最優(yōu)解的三只狼的位置α,β,δ指導ω完成[14],其算法模型如圖6所示[15]。
圖6 灰狼種群算法模型
在GWO算法尋求獵物(最優(yōu)解)的過程中,全局最優(yōu)灰狼的位置即為獵物的位置,位置標記為ω的狼跟隨著位置前三優(yōu)α,β,δ狼的位置進行更新,其位置更新過程表示為
D=|CXP(t)-X(t)|
(6)
X(t+1)=XP(t)-AD
(7)
式中,t為迭代次數(shù);D為狼群中個體狼與獵物之間的近距離;XP為獵物位置;X為灰狼位置;A和C為隨機向量且計算公式為
A=2ar1-a
(8)
C=2r2
(9)
|a|=2(1-t/T)
(10)
式中:a為收斂因子,其值從2~0線性遞減;t為當前迭代次數(shù);T為最大迭代次數(shù);r1,r2∈[0,1]為隨機值。當|A|>1時,狼群擴大圍捕獵物的范圍,實現(xiàn)全局尋優(yōu);當|A|<1時,狼群將圍捕獵物的范圍縮小,實現(xiàn)局部尋優(yōu)。
A,C值的變化可反映灰狼群從各個方向向獵物靠近,通過式(6)可計算出α,β,δ狼與獵物之間的距離Dα,Dβ,Dδ,以引導ω狼共同捕食獵物,從而達到更新灰狼位置的目的,其數(shù)學表達為
(11)
X(t+1)=(X1+X2+X3)/3
(12)
式中,X1,X2,X3為狼群ω被α,β,δ三只狼指導過后更新的位置。
2.2.1 優(yōu)化收斂因子a
由于參數(shù)A直接影響了算法的全局搜索能力和局部的探索能力,而收斂因子a決定了A的取值。原灰狼算法中收斂因子a的值從2~0線性遞減,容易使算法收斂過早,陷入局部最優(yōu)[16]。為避免算法早熟,引入非線性余弦收斂因子,表達式為
(13)
式(13)定義的余弦因子與原線性收斂因子的收斂趨勢,如圖7所示。由圖7可知,余弦收斂因子在迭代前期有著收斂速度緩慢,有利于增加灰狼種群的多樣性,便于尋求全局最優(yōu)解,而在迭代后期,余弦收斂因子的下降速度加快,更有利于提升算法的收斂速度。
圖7 收斂因子收斂趨勢
2.2.2 引入萊維飛行策略
為進一步彌補GWO過早收斂以及收斂精度低的不足,在優(yōu)化收斂因子a的基礎上引入萊維(Levy)飛行策略[17]。Levy飛行策略具有隨機游走的特性,可以增加算法中種群的多樣性,有效的跳出局部最優(yōu),更好的平衡全局和局部的搜索能力?;贚evy飛行策略改進灰狼位置更新公式為
X(t+1)=X(t)+κ⊕Levy(γ)
(14)
式中:X(t)為當代灰狼在t迭代的位置;κ為步長控制量,一般取0.01;⊕為點對點乘法;Levy(γ)為隨機搜索路徑,計算為
Levy(γ)=Sstep·(X(t)-Xm(t))·Rrandn
(15)
(16)
式中:γ為[0,2]之間的常數(shù),文中取γ=1.5;Sstep為隨機步長;X(t)為灰狼種群更新后的位置;Xm(t)為t次迭代時α,β,δ三只灰狼的位置;Rrandn為服從正態(tài)分布的隨機數(shù);μ和ν服從的正態(tài)分布如下所示
(17)
(18)
式中,Γ為伽馬函數(shù)。
在灰狼種群位置更新公式的基礎上引入Levy飛行策略擴大其搜索范圍,對其位置進行進一步更新,再代入式(6)~式(9)分析灰狼個體與獵物間的位置關系?;依撬惴ㄎ恢酶鹿揭隠evy飛行策略后,可以有效地提升整體搜索的性能,加強算法的靈活性。
2.2.3 算法測試
為驗證采用非線性余弦收斂因子和Levy飛行策略的混合方法對傳統(tǒng)灰狼算法改進后的優(yōu)越性,利用多峰函數(shù)Rastrigin[18]對HGWO、GWO、PSO和GA 4種算法進行測試。其中Rastrigin函數(shù)為
(19)
式中:定義維度為30;范圍為[-5.12,5.12];最優(yōu)最小值為0。
參數(shù)設置:種群維度30,最大迭代次數(shù)為500,學習因子均為2,定義慣性權重由0.9~0.3線性遞減。Rastrigin函數(shù)圖像及其測試算法收斂結果,如圖8所示。
圖8 測試結果
由圖8可知,在求解有局部最優(yōu)的多峰函數(shù)Rastrigin時,相較于GWO算法,HGWO算法在尋求理論最優(yōu)0值,且在收斂速度和收斂精度上都具有更加明顯的優(yōu)勢。這充分說明了采用非線性余弦收斂因子和Levy飛行策略更有利于算法權衡全局搜索和局部開發(fā)的能力。
SVM模型對故障分類的能力主要取決于其懲罰因子C與核函數(shù)參數(shù)σ。以訓練集的平均故障準確識別率為優(yōu)化目標,在數(shù)次迭代過程中保留最優(yōu)解。本文將全局搜索性能較好的HGWO算法應用于SVM的參數(shù)尋優(yōu)中,其具體步驟如下:
步驟1初始化SVM的參數(shù)C,σ以及HGWO中狼群的規(guī)模和最大迭代次數(shù);
步驟2對灰狼種群進行初始化,確認其個體的位置向量,即C,σ的初始值;
步驟3以SVM當前的識別準確率作為適應度函數(shù),學習和訓練初始的訓練樣本,再計算得出灰狼個體的適應度值;
步驟4根據(jù)適應度值對灰狼種群進行登記劃分,然后根據(jù)位置公式對灰狼個體的位置信息進行更新;
步驟5根據(jù)α,β,δ的位置信息更新其他搜索個體的位置;
步驟6更新a,A,C,確定新的Xα,Xβ和Xδ。
步驟7若迭代超過最大迭代次數(shù),則訓練結束,輸出全局最優(yōu)位置,即SVM中的C,σ。否則跳至步驟5;
步驟8用HGWO算法輸出的最佳參數(shù)構建SVM模型,實現(xiàn)對滾動軸承的故障診斷。
本文所提智能故障診斷模型的核心在于利用概率盒理論對滾動軸承的原始振動信號進行直接建模,避免了原數(shù)據(jù)中有效概率信息的丟失。將原始信號先轉換為p-box,再實現(xiàn)其融合,使得信息融合時的時空配準問題得到有效解決,最后利用p-box特征提取的方法對融合后的p-box進行特征提取,獲得其有效特征向量。而其關鍵在于利用非線性余弦收斂因子和Levy飛行策略的混合方法改進過后的灰狼算法對SVM的參數(shù)進行優(yōu)化訓練,使其減小分類誤差,實現(xiàn)對滾動軸承故障類型的準確識別。故障診斷方法整體設計示意圖,如圖9所示。
圖9 故障診斷方法整體設計流程
為驗證本文所提智能故障診斷模型的有效性,將滾動軸承故障振動信號作為具體的研究對象,采用目前基于振動信號軸承故障診斷研究常用的公開數(shù)據(jù)集——美國凱斯西儲大學提供的數(shù)據(jù)作為試驗數(shù)據(jù)。滾動軸承試驗狀態(tài)有正常、內圈故障、外圈故障和滾動體故障4種。轉速為1 750 r/min,采樣頻率為12 kHz,故障損傷直徑為0.1 778 mm,軸承在4種狀態(tài)下振動信號的時域波形圖,如圖10所示。1組正常數(shù)據(jù)和3組故障數(shù)據(jù)共計1 200組樣本,每組包含2 048個采樣點。滾動軸承每種運行狀態(tài)有300組數(shù)據(jù),隨機將數(shù)據(jù)按2∶1劃分為訓練集和測試集,這樣保證了數(shù)據(jù)的均衡性,有助于提高模型的診斷精度。軸承數(shù)據(jù)樣本組合如表1所示。
圖10 滾動軸承振動信號時域波形圖
表1 滾動軸承試驗數(shù)據(jù)表
通過概率盒直接建模的方法得到4個概率盒,分別對應著滾動軸承的4種狀態(tài):正常狀態(tài)、內圈故障、外圈故障和滾動體故障。在獲取滾動軸承振動信號的過程中,由于傳感器分布的位置不同,會導致在軸承相同的運行狀態(tài)下的數(shù)據(jù)存在信息的冗余和互補。因此需要將得到的概率盒進行融合來實現(xiàn)進一步優(yōu)化,以便后續(xù)的模式識別。采用包絡的方法對不同的概率盒進行數(shù)據(jù)的融合,融合結果如圖11所示。
圖11 p-box融合結果
采用累積不確定測量方法對圖11中4個p-box進行特征提取,提取結果如表2所示。
表2 p-box特征向量數(shù)據(jù)表示
根據(jù)試驗數(shù)據(jù),分別獲得每種軸承狀態(tài)下300組概率盒特征向量,200組用于訓練SVM模型,100組用于模型性能測試。
SVM的分類性能受其參數(shù)影響較大,這里采用HGWO算法對SVM進行參數(shù)尋優(yōu),HGWO算法以及SVM參數(shù)尋優(yōu)范圍,如表3所示。
表3 HGWO-SVM參數(shù)設置
SVM參數(shù)優(yōu)化適應度曲線,如圖12所示。在經(jīng)歷約3次迭代后適應度達到最佳,而在約22次迭代后,平均適應度曲線趨向穩(wěn)定。對于人工隨機選取參數(shù)而言,利用HGWO進行參數(shù)尋優(yōu)有助于節(jié)約時間,更能提高準確率。
圖12 HGWO-SVM參數(shù)優(yōu)化適應度曲線
利用滾動軸承4種狀態(tài)的概率盒特征向量測試集對HGWO-SVM模型進行測試,得到模型測試集分類結果如圖13所示。圖中:“○”表示實際類別;“*”表示預測類別;縱坐標“1”、“2”、“3”和“4”編號分別表示表1中軸承的4種狀態(tài)。從分類結果可以直觀的看出基于p-box和HGWO-SVM的診斷模型僅出現(xiàn)個別分類錯誤,其他測試數(shù)據(jù)均取得正確的分類結果。由圖13可知,故障分類診斷率約為98.8%??梢?,本文所提出的診斷方法具有較高的預測精度,對滾動軸承故障類別能作出準確分類。
圖13 HGWO-SVM分類結果
為進一步驗證本文所提方法在滾動軸承故障診斷方面的優(yōu)越性,下面給出兩種常用的故障診斷方法與之對比:
①基于小波包特征提取和粒子群優(yōu)化算法(partucle swarm optimization,PSO)的支持向量機的故障診斷模型(PSO-SVM);
②基于卷積神經(jīng)網(wǎng)絡(convolutional neural networks,CNN)特征提取和遺傳優(yōu)化算法(genetic algorithm,GA)和支持向量機的故障診斷模型(GA-SVM)。
在融合后p-box特征提取的基礎上,分別使用HGWO、PSO和GA算法對SVM的參數(shù)進行優(yōu)化,迭代次數(shù)均設置為100,得到其適應度曲線如圖14所示。有圖14可知3種算法在SVM參數(shù)尋優(yōu)的過程中均有良好的收斂性,最終都可以得到最優(yōu)參數(shù)。但相比較而言,HGWO在尋優(yōu)過程中所用的時間更少,對SVM的優(yōu)化效果更佳。
圖14 3種算法的適應度曲線對比圖
由于群智優(yōu)化算法在每次試驗中的收斂結果都會存在一些偏差,所以用多次試驗所得的平均識別率進行對比。在不改變試驗條件的情況下,利用同一數(shù)據(jù)集在本文所用模型與兩個對比模型中分別獨立重復進行10次試驗。模型①通過對原始信號進行小波包變換,得到不同頻段的特征分量,進而計算得到4種狀態(tài)下的小波能量分布,最后將其作為特征向量輸入PSO-SVM來實現(xiàn)故障分類。模型②是用經(jīng)過預處理后的原始信號數(shù)據(jù)訓練CNN,然后把數(shù)據(jù)代入訓練好的模型來獲得特征向量,最后將其輸入GA-SVM進行故障分類。
各重復10次試驗后,得到診斷次數(shù)與識別準確率的關系,如圖15所示。受特征提取方法和故障分類模型性能的綜合影響,由圖15可知,基于p-box-HGWO-SVM的診斷方法的故障識別率普遍較高,明顯優(yōu)于其他兩種方法。
圖15 不同模型識別率對比圖
SVM參數(shù)尋優(yōu)時間和故障診斷識別率是衡量診斷模型優(yōu)劣的關鍵指標,通過以上對比試驗表明,本文所用p-box-HGWO-SVM模型在故障的分類速度和分類準確度上都明顯優(yōu)于小波包-PSO-SVM模型和CNN-GA-SVM。因此,p-box-HGWO-SVM模型在滾動軸承的故障診斷中具有較強的實用性。
(1)充分利用了概率盒直接建模的方法獲得緊致性最高的概率盒,發(fā)揮其在處理不確定問題和信息融合上的優(yōu)勢,有效地防止了大量概率信息的丟失。利用累計不確定性測量方法對概率盒進行特征提取,獲得具有較強穩(wěn)定性的特征向量用于故障診斷。
(2)采用非線性余弦收斂因子和Levy飛行策略對灰狼算法進行改進,使其具有良好全局搜索能力和局部探索能力,且全局收斂能力良好,結構簡單,可以較大概率快速找到最優(yōu)解。
(3)引入HGWO算法對SVM的參數(shù)進行優(yōu)化,加強了SVM參數(shù)的優(yōu)化效率。HGWO-SVM診斷模型具有較強的故障診斷準確率,可有效實現(xiàn)滾動軸承的故障辨識。