付文龍, 譚佳文, 王 凱
(1.三峽大學(xué) 電氣與新能源學(xué)院,湖北 宜昌 443002;2.三峽大學(xué) 梯級水電站運行與控制湖北省重點實驗室,湖北 宜昌 443002)
軸承作為各種旋轉(zhuǎn)機械運行時的重要部件,其健康狀況將直接影響設(shè)備的正常運行。但由于運行工況的復(fù)雜性和其本身的結(jié)構(gòu)特點,軸承也是故障易發(fā)部位。因此,對軸承開展故障診斷研究具有重要的理論意義與實際價值,也受到相關(guān)研究人員的廣泛關(guān)注[1-2]。軸承故障診斷的本質(zhì)為一模式識別問題,即通過故障特征樣本實現(xiàn)故障模式的判別。然而,實際運行時的振動信號常具有較強的非線性與非平穩(wěn)性,制約了故障特征的有效提取。為此,學(xué)者們先后將小波變換(Wavelet Transform, WT)[3]、經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition, EMD)[4]、變分模態(tài)分解 (Variational Mode Decomposition,VMD)等時頻分析方法用于處理此類時變非平穩(wěn)信號,并取得了較好的應(yīng)用效果。其中,VMD[5]作為一種新的自適應(yīng)準正交信號處理方法,通過遞歸地求解變分問題將時變非平穩(wěn)信號分解為一系列有限帶寬的模態(tài)分量,實現(xiàn)了各信號分量頻率的分離,避免了WT的泛化性不足和EMD的模態(tài)混疊等問題[6]。散布熵是Rostaghi等[7]2016年提出的一種衡量時間序列不規(guī)則性的新指標,具備較好的非線性故障特征表征能力,且具有計算速度快和兼顧幅值間關(guān)系等優(yōu)點[8]。基于上述分析,本文融合兩者的優(yōu)勢,在VMD信號分解的基礎(chǔ)上,引入散布熵指標以表征故障特征。此外,設(shè)備實際運行中,往往存在大量故障類型未知的未標記樣本,如能有效應(yīng)用,其中蘊含的有效信息將有助于診斷決策。為此,本文采用半監(jiān)督模糊C均值(Fuzzy C Means,F(xiàn)CM)聚類[9]實現(xiàn)對部分標記的故障樣本的知識挖掘。
支持向量數(shù)據(jù)描述(Support Vector Data Description,SVDD)是Tax等[10]基于支持向量機理論,提出的一種單分類模式識別方法。其通過在樣本特征空間構(gòu)建超球數(shù)學(xué)模型,實現(xiàn)對測試樣本的分類,具有較強的泛化能力。Zhu等[11]將SVDD推廣到多分類分析,并以待識別樣本到各超球的絕對距離作為決策依據(jù)。袁勝發(fā)等[12]提出基于相對距離決策的SVDD并用于轉(zhuǎn)軸碰摩位置的識別,取得了一定的效果。為提升SVDD模型識別精度,研究引入k近鄰準則[13],提出一種改進決策的SVDD模型,并將其用于半監(jiān)督FCM所得聚類簇進行建模。進一步,采用灰狼算法優(yōu)化SVDD模型參數(shù),提出基于自適應(yīng)變異的參數(shù)尋優(yōu)策略。最后將基于最優(yōu)參數(shù)訓(xùn)練的改進決策SVDD模型用于測試樣本的故障模式識別。通過試驗分析和對比結(jié)果表明所提方法具有較好的診斷性能。
對于給定振動信號φ,VMD通過求解約束變分問題將給定信號分解為一組模態(tài)分量,每個分量具有一定的中心頻率和有限帶寬。
(1)
式中:K為分量個數(shù);mk為所得第k個分量;wk為對應(yīng)的中心頻率。
通過引入Lagrange乘子和懲罰項,進行交替方向乘子分析,可實現(xiàn)對mk,wk與β的交替迭代尋優(yōu)(詳細參見Dragomiretskiy等的研究),迭代公式為
(2)
(3)
(4)
對于給定求解精度ε,滿足式(5)時停止迭代。
(5)
對于一個長度為N的時間序列x=[x1,x2, …,xN],散布熵首先將x歸一化,這里使用標準正態(tài)累積分布函數(shù)
(6)
式中:i=1, 2, …,N;σ與μ分別為正態(tài)分布的方差和期望。于是時間序列x被歸一化為y=[y1,y2, …,yN],yi∈(0, 1)。進一步將y映射到c個類別(1~c)
(7)
對zc進行相空間重構(gòu),嵌入向量可表示為
(8)
計算πv0v1…vm-1的相對頻數(shù)p(πv0v1…vm-1)
(9)
根據(jù)信息熵理論定義散布熵為
(10)
DE值越大,時間序列的不規(guī)則性越高;相反,DE值越小,不規(guī)則性越低。
聚類分析時,通常有部分數(shù)據(jù)的標簽是已知的,可為聚類過程以及后續(xù)相關(guān)分析提供較好的指導(dǎo)。其中,Pedrycz提出的半監(jiān)督模糊C均值聚類是基于模糊C均值的一種半監(jiān)督聚類方法。假定待聚類的樣本為S=[s1,s2,…,sn],聚類數(shù)為c(2≤c≤n),則半監(jiān)督FCM聚類(Semi-Supervised Fuzzy C Means,SSFCM)的目標函數(shù)為
(11)
式中:Uc×n=[uij],uij為第j個樣本屬于第i個聚類的模糊隸屬度;V=[v1,v2,…,vn]T為聚類中心矩陣;Fc×n=[fij],fij為標簽已知樣本的隸屬度;bj為區(qū)別標簽已知樣本和標簽未知樣本的二值標志;dij=‖sj-vi‖為第j個樣本與第i個聚類中心的歐幾里得距離;w(w≥1)為權(quán)重參數(shù);γ(γ≥0)為平衡因子,起到平衡公式中監(jiān)督與非監(jiān)督機制的作用。
通過引入Lagrange乘子,半監(jiān)督FCM聚類對應(yīng)的優(yōu)化問題可轉(zhuǎn)化為如下的約束最小問題
(12)
式中:λj為Lagrange乘子,i=1, 2, …,c,j=1, 2, …,n。模糊隸屬度uij和聚類中心vi可通過下式迭代得到
(13)
(14)
SVDD是Tax等提出的單分類模式識別方法,其通過推求包含給定數(shù)據(jù)集的超球,并使其具有最小半徑,實現(xiàn)數(shù)據(jù)集的最優(yōu)描述,對應(yīng)優(yōu)化問題為
s.t.‖xi-a‖2≤R2+ξi,ξi≥0,i=1,2,…,n
(15)
式中:{xi,i=1,2,…,n}為給定數(shù)據(jù)集;a為超球的球心;R為半徑;ξi為松弛變量;C為懲罰因子。
引入Lagrange函數(shù),可得其對偶問題為
(16)
式中:αi為Lagrange乘子。
對于非線性問題,采用核變換,式(16)可轉(zhuǎn)化為
(17)
(18)
式中:xp為支持向量。任意樣本g距超球球心的計算公式為
(19)
在模式識別中,SVDD通常與相對距離方法結(jié)合,用以判斷待識別樣本的類型,在進行單類別的模式識別時,該決策方式具有一定的精度。然而,在處理多分類問題時,待識別樣本可能位于多個超球的重疊區(qū)域或所有超球之外,如圖1所示,此時基于相對距離的決策方式將難以準確識別樣本類型。為此本文提出基于支持向量數(shù)據(jù)描述與k近鄰(k-Nearest Neighbor,KNN)方法的改進決策規(guī)則(ISVDD)。
KNN方法由于其易于理解與使用的特點,現(xiàn)已被廣泛應(yīng)用于模式識別領(lǐng)域。KNN的基本思想是度量樣本與其相鄰樣本的差異,通常使用歐幾里得或曼哈頓距離進行計算。若p,q均為h維樣本,KNN可以表示為
歐幾里得距離
(20)
曼哈頓距離
(21)
式中:pi,pi分別為p與q的第i維。
利用半監(jiān)督聚類標記的訓(xùn)練樣本可以建立不同故障類型的SVDD模型,并得到超球面半徑Rs與支持向量SVs,進而判斷待識別樣本的類型。ISVDD的具體步驟如下:
步驟1根據(jù)式(17)、式(18)對不同類型的故障建立SVDD模型;
步驟2根據(jù)式(19)計算待識別樣本與超球球心的距離D;
步驟3比較D與各超球半徑R的大小,若待識別樣本僅在一個超球內(nèi),轉(zhuǎn)步驟6,否則進行下一步;
步驟4設(shè)置KNN參數(shù)k,在SVs中找出待識別樣本的k個近鄰樣本;
步驟5根據(jù)大多數(shù)近鄰樣本的類型判定待識別樣本的故障類型;
步驟6識別結(jié)束。
ISVDD具體步驟的流程圖如圖2。
圖1 樣本與超球位置關(guān)系示意圖Fig.1 Schematic diagram of positional relationship between samples and hyperspheres
圖2 ISVDD流程圖Fig.2 The flowchart of ISVDD
為提升SVDD故障識別精度,研究采用自適應(yīng)變異灰狼算法進行參數(shù)優(yōu)化。在原始灰狼算法(Grey Wolf Optimizer,GWO)中(詳細參見文獻[14]),由于其本身的參數(shù)控制及更新規(guī)則均為線性變化,所以在迭代后期易陷入局部最優(yōu),進而影響優(yōu)化效果。本文針對上述問題提出一種自適應(yīng)變異策略,通過引入自適應(yīng)規(guī)則和變異算子提高灰狼算法的收斂精度。
分析原始灰狼算法可知,隨著迭代次數(shù)變化,其收斂因子a由2線性遞減至0,這種等步長的參數(shù)變化將會限制收斂效果。本文引入如下非線性二次凸函數(shù)來指導(dǎo)a的遞減過程[15]
(22)
式中:l與lmax分別為當前迭代次數(shù)和最大迭代次數(shù)。
將99.8%的冰醋酸與80%~85%的回收醋酸充分混合成95%左右的原料酸;原料酸經(jīng)預(yù)熱進入管式反應(yīng)器,在磷酸氫二銨的催化作用下,在700~750℃條件下進行裂解脫水,醋酸裂解生成一分子的水和一分子的乙烯酮,高溫的裂解氣經(jīng)換熱器迅速降溫后分離掉反應(yīng)生成的水和未裂解的乙酸,整個裂解脫水反應(yīng)均在真空條件下完成;被分離后的氣體經(jīng)真空泵送入吸收塔,吸收塔采用雙乙烯酮作為循環(huán)液來吸收氣體,吸收飽和的液體進入聚合槽聚合生成雙乙烯酮;雙乙烯酮采出后經(jīng)薄膜蒸發(fā)提純得到雙乙烯酮成品。其生產(chǎn)過程中涉及的主要化學(xué)反應(yīng)有:
由式(22)可知,收斂因子a能夠隨著迭代次數(shù)進行自適應(yīng)的非線性變化,有效調(diào)節(jié)灰狼算法的全局和局部搜索能力。此外,在灰狼算法的更新策略中,下一代種群的位置由α,β和δ狼位置的平均值決定,但簡單的平均并不能反映三匹狼重要性的差異,為此,本文提出如下自適應(yīng)權(quán)重更新策略
(23)
式中:w與fitness分別為α,β和δ狼的權(quán)重和適應(yīng)度值;X為三匹狼當前的位置。下一代種群的位置由三匹狼的適應(yīng)度值加權(quán)決定。
此外,在灰狼算法迭代后期,種群的多樣性逐漸匱乏。為此,研究引入變異算子來豐富種群多樣性[16],使算法不易陷入局部最優(yōu)。含有變異算子的α狼更新公式為
(24)
式中:n=1, 2, …,G與T(T 本文提出的基于AMGWO與改進決策SVDD的軸承半監(jiān)督故障診斷方法主要步驟如下: 步驟1采用中心頻率觀察法確定VMD分解模態(tài)參數(shù)K; 步驟2利用VMD將原始樣本分解為一系列本征模態(tài)函數(shù)IMFs; 步驟4對訓(xùn)練樣本進行半監(jiān)督FCM聚類,得到一系列聚類簇; 步驟5對各聚類簇進行改進決策SVDD建模,并基于所提AMGWO方法對參數(shù)C,σ進行尋優(yōu); 步驟6利用最優(yōu)參數(shù)訓(xùn)練得到最優(yōu)ISVDD模型; 步驟7將訓(xùn)練好的最優(yōu)ISVDD模型用于測試樣本的故障模式識別。 本文提出的故障診斷方法流程如圖3所示。 圖3 SSFCM-AMGWO-ISVDD故障診斷流程圖Fig.3 The flowchart of SSFCM-AMGWO-ISVDD fault diagnosis method 本文使用凱斯西儲大學(xué)軸承數(shù)據(jù)中心的振動信號作為試驗數(shù)據(jù)[17],以驅(qū)動端收集的振動信號作為研究對象,采樣頻率為12 000 Hz,在2 hp的額定負載下轉(zhuǎn)速為1 750 r/min。為充分驗證所提方法的有效性,本文選用9種類型的故障樣本,包含故障尺寸分別為0.017 78 cm,0.035 56 cm,0.053 34 cm的內(nèi)圈故障、滾動體故障和外圈故障,即每種故障有3種故障尺寸。每種故障類型的振動信號包含59個樣本,每個樣本含有2 048個采樣點。試驗數(shù)據(jù)相關(guān)描述如表1所示。 表1 試驗數(shù)據(jù)描述Tab.1 Description of the experimental data 為驗證所提SSFCM-AMGWO-ISVDD方法的優(yōu)越性,試驗在各階段采用對比的方式進行,具體如下:在聚類階段采用非監(jiān)督的FCM聚類進行對比,在參數(shù)優(yōu)化階段采用粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)、GWO進行對比,而在決策階段采用基于相對距離決策方式的SVDD進行比較。對比試驗的參數(shù)均以與本文所提方法相同的方式進行設(shè)置。 試驗首先將每種故障類型的樣本分解為一系列IMFs,VMD分解的模態(tài)數(shù)K需要預(yù)先使用中心頻率觀察方法確定。如果K值過大,則相鄰IMF的中心頻率過近,會出現(xiàn)模態(tài)混疊;相反,當K過小,難以實現(xiàn)信號的有效分解。選取不同K時的各IMF中心頻率見表2和圖4。其中,當K為5時前兩個中心頻率已相對接近,即可認為發(fā)生了過分解[18-19],因此模態(tài)數(shù)最終設(shè)定為4。 得到所有樣本的IMFs后,計算其DE值以提取故障特征并構(gòu)造故障特征向量。試驗中嵌入維數(shù)m、時延τ與映射類別數(shù)c分別取3、1和6。表3列出了不同故障樣本(L1~L9)的前兩個DE向量。 表2 不同K值下的歸一化中心頻率Tab.2 Center frequencies with different K value 圖4 不同K值下中心頻率在迭代過程中的變化Fig.4 The variation of central frequency with iteration on different K values 從不同故障類型的特征向量中隨機選取30個組成訓(xùn)練集,其余29個組成測試集。在訓(xùn)練集中,再次隨機選取50%的樣本作為已標記樣本指導(dǎo)SSFCM的聚類過程。SSFCM的加權(quán)參數(shù)w設(shè)定為2,而平衡系數(shù)α根據(jù)已標記樣本的比率設(shè)定為1/0.5。圖5為聚類后訓(xùn)練樣本的二維投影,投影數(shù)據(jù)由樣本經(jīng)過主元分析得到。如圖5所示,訓(xùn)練樣本在已標記樣本的監(jiān)督下聚集為9個簇,并分布在每個簇的中心附近。等高線表示具有相同的聚類值。 表3 不同故障樣本的散布熵值Tab.3 Dispersion entropy values of different fault samples 圖5 訓(xùn)練樣本聚類后的二維投影圖Fig.5 2D projection of the training samples 在AMGWO優(yōu)化SVDD的懲罰因子C和核參數(shù)σ階段,個體數(shù)與迭代次數(shù)分別取30和100??紤]到SVDD理論中優(yōu)化問題的約束條件,C與σ的搜索范圍分別取[1/n, 1]和[2-10, 210],其中n為目標對象的數(shù)量。KNN系數(shù)k取3。試驗根據(jù)5折交叉驗證的平均準確率確定最優(yōu)C,σ組合。AMGWO優(yōu)化算法的收斂過程如圖6所示,隨著迭代次數(shù)的增加,個體平均適應(yīng)度值趨于穩(wěn)定并繼續(xù)增加,即個體已接近全局最優(yōu)解,陰影部分顯示了10次獨立試驗中收斂曲線的分布情況。不同優(yōu)化算法的對比如圖7所示,圖中收斂曲線由10次試驗的平均值得到,由圖可知,PSO的收斂曲線波動幅度較大,平均適應(yīng)度值在迭代50次后便難以繼續(xù)提高;GWO的收斂效果較好并明顯優(yōu)于PSO;AMGWO在起始階段便最先收斂到了較高的水平,在迭代后期則體現(xiàn)出了更好的增長趨勢。 圖6 AMGWO優(yōu)化算法的收斂過程曲線Fig.6 Convergence procedure of AMGWO optimization algorithm 圖7 不同優(yōu)化算法的收斂曲線對比Fig.7 Comparison of convergence procedure for different methods 試驗最后利用最佳C,σ組合和已標記的訓(xùn)練集訓(xùn)練ISVDD模型,隨后應(yīng)用于測試樣本的識別。診斷結(jié)果取10次試驗的平均值,并列出了每個結(jié)果的偏差范圍作為結(jié)果評估的參考。本文采用4種指標來評估診斷結(jié)果,即調(diào)整蘭德指數(shù)(ARI)、歸一化互信息(NMI)、F值(F)與準確率(ACC),ARI評價范圍為[-1, 1],其余均為[0, 1],指標越接近1表示分類性能越優(yōu)異。表4和圖8顯示了不同方法的故障診斷結(jié)果。從表4可知,本文所提SSFCM-AMGWO-ISVDD方法在所有指標中均達到了最高值,即ARI-0.895 0,NMI-0.910 4,F(xiàn)-0.950 5和ACC-0.950 2。具體而言:與FCM-AMGWO-ISVDD的比較表明半監(jiān)督的SSFCM比非監(jiān)督的FCM具有更好的聚類效果,達到了充分挖掘未標記樣本所蘊含信息的目的;與SSFCM-PSO-ISVDD,SSFCM-GWO-ISVDD的比較表明所提改進灰狼優(yōu)化算法的有效提升了模式識別算法的性能;而與SSFCM-AMGWO-SVDD的比較驗證了改進決策SVDD的優(yōu)越性。診斷結(jié)果的盒圖如圖9所示,由圖可知,與其他診斷方法相比,所提SSFCM-AMGWO-ISVDD方法的評估值更高并具有更好的穩(wěn)定性。 表4 不同方法的故障診斷結(jié)果Tab.4 Fault diagnosis results with different methods 圖8 不同方法評價指標值的對比Fig.8 Comparison of evaluation values for different methods 注:x軸刻度分別為1-FCM-AMGWO-ISVDD;2-SSFCM-PSO-ISVDD;3-SSFCM-GWO-ISVDD;4-SSFCM-AMGWO-SVDD;5-SSFCM-AMGWO-ISVDD圖9 不同方法評價指標值的盒圖Fig.9 Boxplots of evaluation values for different methods 為實現(xiàn)滾動軸承各類故障的準確診斷,提升其運行穩(wěn)定性,本文提出一種基于VMD散布熵與改進灰狼優(yōu)化SVDD的軸承半監(jiān)督故障診斷方法,并以試驗驗證了所提方法的有效性和優(yōu)越性,得到的結(jié)論如下: (1)通過中心頻率觀察法確定VMD模態(tài)參數(shù)K能夠?qū)崿F(xiàn)原始信號的最優(yōu)分解,減弱信號的非平穩(wěn)性帶來的干擾。 (2)散布熵能夠從分解得到的各模態(tài)中有效提取故障特征,從而構(gòu)造不同故障類型的特征向量。 (3)半監(jiān)督FCM利用部分標記的樣本作為監(jiān)督,指導(dǎo)樣本的聚類過程,充分挖掘了樣本蘊含的信息。 (4)提出的自適應(yīng)變異灰狼優(yōu)化算法促進了最優(yōu)參數(shù)的選擇,并具有一定的收斂性;而改進決策SVDD則對不確定區(qū)域樣本達到了較好的識別效果。 (5)對比試驗表明,所提方法具有更優(yōu)異的診斷性能,可為滾動軸承的故障診斷提供一定依據(jù)。5 基于AMGWO與改進決策SVDD的半監(jiān)督故障診斷方法
6 試驗分析
7 結(jié) 論