李天昊,李志星,王衍學(xué)
(北京建筑大學(xué)a.機(jī)電與車輛工程學(xué)院;b.城市軌道交通車輛服役性能保障重點(diǎn)實(shí)驗(yàn)室,北京 100044)
隨著現(xiàn)代工業(yè)生產(chǎn)加工設(shè)備日趨復(fù)雜化、精細(xì)化,自動(dòng)化水平顯著提高,人們對(duì)生產(chǎn)系統(tǒng)持續(xù)性、穩(wěn)定性和安全性需求日益強(qiáng)烈。然而,滾動(dòng)軸承作為機(jī)床設(shè)備加工過程中的重要精密部件,持續(xù)發(fā)生因設(shè)計(jì)缺陷和惡劣工況導(dǎo)致設(shè)備故障或停機(jī)。在機(jī)床軸承失效期前及早進(jìn)行故障排查和處理,能夠避免故障惡化導(dǎo)致的安全事故和財(cái)產(chǎn)損失,具有重大社會(huì)經(jīng)濟(jì)價(jià)值。因此,對(duì)軸承故障智能診斷方法的研究至關(guān)重要。
得益于機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí)在故障診斷領(lǐng)域的發(fā)展,基于智能優(yōu)化算法和深度學(xué)習(xí)的智能故障診斷方法不斷取得突破。何強(qiáng)等[1]使用兩重訓(xùn)練方式,在小規(guī)模訓(xùn)練樣本條件下能夠準(zhǔn)確進(jìn)行故障分類。SHIFAT等[2]提出了一種基于每個(gè)IMF最大峰度值模態(tài)分量選擇方法。SHAHRAKI等[3]將AdaBoost算法與決策樹分類器結(jié)合使用,獲得了更好的性能。神經(jīng)混沌學(xué)習(xí)[4]受到生物神經(jīng)網(wǎng)絡(luò)的啟發(fā),是一種設(shè)計(jì)新穎的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。提取的4個(gè)神經(jīng)混沌特征:放電時(shí)間、放電速率、能量和熵用于訓(xùn)練支持向量機(jī)分類器(support vector machine,SVM)。然而由于SVM對(duì)數(shù)據(jù)集部分缺失的敏感度較高且對(duì)于大規(guī)模數(shù)據(jù)集需要較長的訓(xùn)練時(shí)間,因此該模型對(duì)小樣本、不平衡數(shù)據(jù)集診斷效果較差。
基于上述問題,本文將NL與AdaBoost結(jié)合,用于軸承故障特征的提取和分類。首先使用時(shí)頻域信號(hào)拼接合成樣本的方法,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;隨后,使用廣義Luroth級(jí)數(shù)(GLS神經(jīng)元)從樣本中提取非線性特征以解決分類任務(wù);最后,使用線性核函數(shù)訓(xùn)練的集成學(xué)習(xí)分類器(AdaBoost)增強(qiáng)從單層GLS神經(jīng)元提取的非線性特征,上述診斷方法的有效性在低訓(xùn)練樣本條件下在實(shí)驗(yàn)中得到驗(yàn)證。
混沌行為是非線性系統(tǒng)中常見的非周期性運(yùn)動(dòng)形式。神經(jīng)混沌學(xué)習(xí)(NL)架構(gòu)由生物神經(jīng)元放電過程獲得啟發(fā),將神經(jīng)混沌理論和經(jīng)典機(jī)器學(xué)習(xí)算法相結(jié)合,ChaosNet(ChaosFEX+SVM)[5]是這一理論用于分類任務(wù)的理想實(shí)例。ChaosNet利用個(gè)體神經(jīng)元的混沌行為產(chǎn)生的生物神經(jīng)特性,可以在較少訓(xùn)練樣本的情況下,表現(xiàn)出比傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)更好的分類性能。該結(jié)構(gòu)如圖1所示,是一個(gè)由混沌神經(jīng)元為基本單位組成的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。每個(gè)GLS神經(jīng)元具有2個(gè)主要參數(shù)-神經(jīng)活動(dòng)初始狀態(tài)x0和用于特征提取時(shí)的判別閾值a。神經(jīng)元在接受刺激(輸入數(shù)據(jù))時(shí)被激活,根據(jù)神經(jīng)活動(dòng)初始狀態(tài)x0以周期性或者混沌的方式輸出放電軌跡。
圖1 混沌神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
廣義Luroth[6]級(jí)數(shù)(generalized luroth series,GLS)是一個(gè)分段線性的一維混沌映射,其常用的映射方式為帳篷映射(Tent Map)[7],圖2為斜帳篷函數(shù)映射圖,本文使用Tent Map作為混沌神經(jīng)元,數(shù)學(xué)表達(dá)式為:
(1)
圖2 斜帳篷映射圖
式中:x∈[0,1),a∈(0,1)。
結(jié)合圖2可以得出:Tent Map作為一個(gè)基于其自身的不可逆變換,鑒別閾值a決定了GLS圖的偏斜度。變換之后的函數(shù)自變量范圍分為線性區(qū)間[0,a]和[a,1],左分支斜率為1/a∈(1,+∞),右分支斜率為1/(1-a)∈(1,+∞)。
Lyaponuv(李雅普諾夫)指數(shù)[8]常被用來判定一個(gè)系統(tǒng)的混沌性,通過圖像可以直觀地看出某個(gè)系統(tǒng)或者映射是否是混沌系統(tǒng)或映射,計(jì)算公式為:
(2)
式中:f′(x)表示x點(diǎn)的導(dǎo)數(shù),即λ量化了兩條軌跡在[0,k]時(shí)間間隔內(nèi)彼此發(fā)散λ>0或收斂λ<0時(shí)的平均速率。本文基于此證明Tent Map的混沌特性。
假定Lyaponuv指數(shù)用λ來表示,判別依據(jù)如下:
當(dāng)λ>0時(shí),系統(tǒng)運(yùn)動(dòng)進(jìn)入混沌狀態(tài),且對(duì)初始條件敏感,對(duì)應(yīng)映射稱為混沌映射;當(dāng)λ<0時(shí),系統(tǒng)運(yùn)動(dòng)狀態(tài)趨于穩(wěn)定且此時(shí)對(duì)系統(tǒng)的初始狀態(tài)不敏感,即此時(shí)的映射對(duì)初始值不敏感;當(dāng)λ=0時(shí),系統(tǒng)處于穩(wěn)定狀態(tài)。
設(shè)a=0.32,計(jì)算Tent Map的李雅普諾夫指數(shù)。對(duì)于式(1),于函數(shù)圖像左半支,|f′[x(j)]|為1/a,λ>0;于函數(shù)圖像右半支,|f′[x(j)]|為1/(1-a),λ>0。由此證明Tent Map具有混沌狀態(tài)。
在NL架構(gòu)中,使用混沌神經(jīng)元的特征提取步驟稱為ChaosFEX[9],NL從混沌神經(jīng)網(wǎng)絡(luò)中提取ChaosFEX特征,該網(wǎng)絡(luò)在不同層上具有同質(zhì)和異質(zhì)的混沌神經(jīng)元。輸入層中的所有GLS神經(jīng)元具有q個(gè)單位的初始神經(jīng)活動(dòng),GLS圖的偏斜度由鑒別閾值(a)控制。
通過改變a,混沌神經(jīng)元可以根據(jù)李雅普諾夫指數(shù)分別表現(xiàn)出弱混沌和強(qiáng)混沌。
在單個(gè)混沌神經(jīng)元的放電軌跡中,提取構(gòu)成ChaosFEX特征的放電時(shí)間、放電速率、能量和熵,然后將這些特征饋送到AdaBoost進(jìn)行分類。特征具體含義如下:
(1)放電時(shí)間:混沌軌跡識(shí)別刺激所需的時(shí)間。
(2)放電速率:混沌軌跡高于區(qū)分閾值以便識(shí)別刺激的時(shí)間段。
(3)能量:混沌軌跡x(t)的能量,計(jì)算方法為:
(3)
(4)熵:首先對(duì)混沌軌跡x(t)定義如下的符號(hào)序列:
(4)
式中:i表示放電時(shí)間序列號(hào),計(jì)算以上符號(hào)序列的香農(nóng)熵:
H(St)=-(1-Pt)log2(1-Pt)-Ptlog(Pt)
基于GLS的拓?fù)鋫鬟f性-符號(hào)序列算法和AdaBoost實(shí)現(xiàn)故障特征提取、訓(xùn)練、分類和測試的完整流程。
ChaosNet的單層混沌神經(jīng)元結(jié)構(gòu)由一個(gè)輸入層和一個(gè)輸出層組成。輸入層由n個(gè)GLS神經(jīng)元(C1,C2,…,Cn)組成,用于從輸入樣本中提取特征模型。整個(gè)輸入數(shù)據(jù)樣本表示為m×n維矩陣X,ChaosNet輸入層神經(jīng)元個(gè)數(shù)等于輸入數(shù)據(jù)樣本數(shù),其中m表示樣本數(shù)量,n表示每個(gè)樣本中的采樣點(diǎn)數(shù)。輸出層節(jié)點(diǎn)O1,O2,…,OS存儲(chǔ)對(duì)應(yīng)于s個(gè)故障類別中的表示向量。
(5)
圖3 拓?fù)鋫鬟f性-符號(hào)序列特征提取
(2)特征向量處理。假設(shè)一個(gè)s類故障分類問題,故障類由L1,L2,…,Ls表示,對(duì)應(yīng)的標(biāo)簽分別為1,2,…,s。定義m×n的歸一化矩陣U1,U2,…,US,分別代表L1,L2,…,Ls的數(shù)據(jù)。使用TT-SS算法訓(xùn)練從第一步提取來的特征,從而產(chǎn)生特征向量V1,V2,…,VS。接下來計(jì)算跨行的平均值,計(jì)算公式為:
(6)
式中:M1,M2,…,Ms是對(duì)應(yīng)于s個(gè)類的平均表示向量,隨著越來越多的樣本輸入,均值表示向量將持續(xù)更新,將更新后的均值表示向量分別存儲(chǔ)在輸出層節(jié)點(diǎn)O1,O2,…Os中。
對(duì)于每個(gè)基分類器:
①分別劃分樣本空間為Z1,Z2,…,Zr;
②計(jì)算權(quán)重Gv;
③計(jì)算誤分類率如式(7)所示。
(7)
最終,獲得增強(qiáng)分類器,表達(dá)式如下:
ψ(z)=argmaxf(zi,yi)
(8)
針對(duì)小樣本條件下的軸承故障診斷問題,本文提出了基于NL-AdaBoost的診斷方法。診斷流程共分為3個(gè)主要環(huán)節(jié),如圖4所示。
圖4 ChaosNet-AdaBoost軸承故障診斷流程
本文基于以下2個(gè)實(shí)驗(yàn)驗(yàn)證NL-AdaBoost在2種軸承故障數(shù)據(jù)集和小樣本條件下的分類性能。在實(shí)驗(yàn)1中,首先通過充足數(shù)量的訓(xùn)練樣本進(jìn)行k折交叉驗(yàn)證,確定模型最優(yōu)超參數(shù);進(jìn)而使用訓(xùn)練后的模型對(duì)測試集數(shù)據(jù)驗(yàn)證故障診斷能力,使用宏觀F1分?jǐn)?shù)(Macro F1 Score)[10]評(píng)價(jià)分類模型綜合性能。實(shí)驗(yàn)2在實(shí)驗(yàn)室自采軸承數(shù)據(jù)上進(jìn)行,ChaosNet三個(gè)超參數(shù)與實(shí)驗(yàn)1一致,每類故障的訓(xùn)練樣本數(shù)量由1~64漸進(jìn),在每種情況下執(zhí)行100次隨機(jī)訓(xùn)練實(shí)驗(yàn);測試集數(shù)量與實(shí)驗(yàn)一保持一致。最后分別使用原生ChaosNet(ChaosFEX+SVM)、K最近鄰分類算法(KNN)[11]、SVM、樸素貝葉斯分類器(Naive Bayes)[12]共4種深度學(xué)習(xí)算法在此數(shù)據(jù)集上進(jìn)行分類測試,比較幾種模型的分類性能。
實(shí)驗(yàn)1的數(shù)據(jù)來自機(jī)械故障預(yù)防技術(shù)學(xué)會(huì)(MFPT),軸承型號(hào)NICE,滾珠直徑0.235 cm,滾珠數(shù)量8個(gè),故障類型如圖5所示,數(shù)據(jù)集包括內(nèi)圈故障和外圈故障。此數(shù)據(jù)集包含實(shí)際故障數(shù)據(jù)和來自實(shí)驗(yàn)室軸承實(shí)驗(yàn)臺(tái)故障數(shù)據(jù),每類故障具體描述如表1所示。分別在不同負(fù)載的內(nèi)、外圈故障中各選取3個(gè)故障和正常工況組成實(shí)驗(yàn)數(shù)據(jù)集,如表2所示,共10類故障類型。從每類故障樣本中選取80組實(shí)驗(yàn)樣本,共800組,每組樣本采樣點(diǎn)2048個(gè),訓(xùn)練集占比80%,測試集占比20%。
表1 MFPT故障描述
表2 測試集診斷結(jié)果
圖5 軸承內(nèi)、外圈故障實(shí)物圖
實(shí)驗(yàn)2使用實(shí)驗(yàn)室自采軸承數(shù)據(jù),試驗(yàn)臺(tái)如圖6所示。軸承型號(hào)為FLURO ER12K寬內(nèi)圈球軸承。使用3個(gè)通道(正上方、左側(cè)、右側(cè))加速度傳感器,以5000 Hz的采樣頻率采集軸承振動(dòng)信號(hào),持續(xù)時(shí)間10 s,轉(zhuǎn)速500 r/min,振動(dòng)信號(hào)樣本包括正常工況、內(nèi)圈故障、外圈故障、保持架故障、滾動(dòng)體故障5種狀態(tài)。從每類故障樣本中選取80組實(shí)驗(yàn)樣本,共800組,在訓(xùn)練集中,每類故障的訓(xùn)練樣本由1,2,…,16組遞增,測試集數(shù)量與實(shí)驗(yàn)一保持一致。
本文通過FFT將長度為2048的時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào),拼接時(shí)頻域信號(hào)得到單個(gè)樣本,處理過程如圖7所示。這一處理方法不僅保留信號(hào)的原始特征信息,而且保留了信號(hào)的一維特性。
圖7 實(shí)驗(yàn)樣本預(yù)處理
神經(jīng)網(wǎng)絡(luò)的模型參數(shù)和超參數(shù)對(duì)于最終的回歸和分類結(jié)果準(zhǔn)確度具有至關(guān)重要的作用。NL-AdaBoost的特征表示向量M1,M2,…,MS是模型訓(xùn)練時(shí)需要學(xué)習(xí)的參數(shù),共有3個(gè)超參數(shù):初始神經(jīng)活動(dòng)(q)、辨別閾值(a)和神經(jīng)刺激的epsilon鄰域(ε)。本文采用k折交叉驗(yàn)證法確定模型最優(yōu)參數(shù)。固定一組超參數(shù)(初始神經(jīng)活動(dòng)q=0.31,辨別閾值a=0.92),ε以0.000 1為一個(gè)單位由0.15遞增至0.16,即以不同ε參數(shù)在訓(xùn)練集做共100次模型訓(xùn)練。最后計(jì)算每個(gè)樣本集的宏觀F1分?jǐn)?shù)。這一方法的優(yōu)勢在于可以全面評(píng)定模型和超參數(shù)的整體表現(xiàn),相比固定單一訓(xùn)練集,這一方法在交叉驗(yàn)證中每個(gè)樣本都將作為訓(xùn)練集和驗(yàn)證集,最終所得結(jié)果可靠性更高。
選用兼顧分類模型精確率和召回率的macro F1-score(宏觀F1分?jǐn)?shù))作為分類指標(biāo)。macro F1-score可以看作是模型精確率和召回率的加權(quán)平均,適用于衡量不平衡數(shù)據(jù)的精度,其計(jì)算方法如下,取值范圍[0,1]。
①根據(jù)式(9)計(jì)算每個(gè)類的F1-scorei。
(9)
②計(jì)算每個(gè)類的macro F1-scorei。
(10)
經(jīng)過100次訓(xùn)練之后,超參數(shù)調(diào)整對(duì)應(yīng)的宏觀F1評(píng)分變化如圖8所示。F1分?jǐn)?shù)在0.153~0.157的范圍內(nèi)達(dá)到1.00,因此本文得到最終的最優(yōu)超參數(shù)為q=0.31,a=0.92,ε=0.155。
圖8 超參數(shù)調(diào)整中的宏觀F1分?jǐn)?shù)變化
本文選用的深度學(xué)習(xí)框架為基于Python語言的Sklearn(Scikit-Learn)[13],封裝了包括回歸、降維、分類、聚類4種主要算法。為驗(yàn)證故障診斷模型有效性,在測試集驗(yàn)證NL-AdaBoost基于第3.3節(jié)所述最優(yōu)超參數(shù)的分類能力,進(jìn)行10次重復(fù)實(shí)驗(yàn)取每個(gè)故障類型的精準(zhǔn)度、召回率和F1評(píng)價(jià)分?jǐn)?shù)的平均值。測試集包括10種故障類型,每類16組,共160組數(shù)據(jù)。訓(xùn)練集上macro F1-score的變化曲線如圖9所示。
圖9 訓(xùn)練集macro F1-score變化曲線
在測試集上根據(jù)公式計(jì)算每個(gè)故障類型的平均精準(zhǔn)度、召回率和F1評(píng)價(jià)指標(biāo)如表2所示,整個(gè)測試集的F1評(píng)價(jià)指標(biāo)為0.975,證明本文所述模型對(duì)于軸承故障數(shù)據(jù)具有較好的分類效果。為了直觀展示故障分類情況,挑選一次試驗(yàn)結(jié)果,繪制測試集上的故障診斷結(jié)果混淆矩陣如圖10所示,可以看出除類型4、類型7和類型9分別有1個(gè)和2個(gè)判斷錯(cuò)誤以外,其余都準(zhǔn)確識(shí)別出故障類型。
為進(jìn)一步驗(yàn)證本文所述模型在小樣本訓(xùn)練集情況下的分類性能和泛化能力,基于上述實(shí)驗(yàn)方案在實(shí)驗(yàn)室自采軸承故障數(shù)據(jù)集上,將4種深度學(xué)習(xí)算法包括原生ChaosNet(ChaosFEX+SVM)、K最近鄰分類算法(KNN)、SVM、樸素貝葉斯分類器(Naive Bayes)與之做對(duì)比試驗(yàn)。在訓(xùn)練過程中,為了分析訓(xùn)練集樣本數(shù)量與模型診斷準(zhǔn)確率之間的關(guān)系,使每類故障的訓(xùn)練樣本數(shù)量分別為1,2,…,16,然后在測試集驗(yàn)證模型泛化能力,分別計(jì)算每種情況的平均宏觀F1分?jǐn)?shù),圖11為16種情況下每類深度學(xué)習(xí)算法的平均宏觀F1分?jǐn)?shù)變化曲線。
圖11 5種診斷模型的平均宏觀F1分?jǐn)?shù)
由圖11可知,隨著訓(xùn)練樣本數(shù)量的增加,5種算法的故障診斷準(zhǔn)確率均呈逐漸升高的趨勢。其中,樸素貝葉斯分類器故障診斷準(zhǔn)確率最低,在訓(xùn)練樣本達(dá)到9組的情況下,宏觀F1評(píng)分僅為0.39;當(dāng)模型診斷準(zhǔn)確率趨于穩(wěn)定時(shí),其余4種算法的宏觀F1評(píng)分均大于0.8。當(dāng)訓(xùn)練樣本不足時(shí),原生ChaosNet(ChaosFEX+SVM)和NL-AdaBoost(ChaosFEX+Adaboost)表現(xiàn)出了良好的分類性能,宏觀F1評(píng)分均大于0.9。即本文提出的基于改進(jìn)神經(jīng)混沌學(xué)習(xí)的軸承故障診斷模型具有較好的穩(wěn)定性、準(zhǔn)確率和泛化能力。
(1)提出的基于改進(jìn)神經(jīng)混沌學(xué)習(xí)的軸承故障診斷新方法,具有創(chuàng)新性的輸入特征提取方式,在不同工況下可以準(zhǔn)確識(shí)別出軸承的多種故障類型。
(2)AdaBoost分類器在多次迭代訓(xùn)練任務(wù)中逐漸提升前一輪預(yù)測錯(cuò)誤樣本的權(quán)重,最終實(shí)現(xiàn)通過加權(quán)所有基分類器的訓(xùn)練結(jié)果得到分類標(biāo)簽。
(3)通過與常見分類模型的實(shí)驗(yàn)對(duì)比,證明了本文提出的NL-AdaBoost模型能夠有效提升故障診斷結(jié)果。