張書鋒,陳雪勤
(1.蘇州工業(yè)園區(qū)服務(wù)外包職業(yè)學(xué)院 信息工程學(xué)院,江蘇 蘇州 215123;2.蘇州大學(xué) 電子信息學(xué)院,江蘇 蘇州 215006)
目前,旋轉(zhuǎn)設(shè)備在軍工、能源、航空航天等領(lǐng)域已經(jīng)得到了廣泛應(yīng)用。由于滾動(dòng)軸承是旋轉(zhuǎn)設(shè)備的關(guān)鍵部件,其健康狀況對(duì)設(shè)備平穩(wěn)運(yùn)行、生產(chǎn)安全具有重要影響。然而由于自身結(jié)構(gòu)的復(fù)雜性和運(yùn)行環(huán)境的惡劣性,滾動(dòng)軸承容易發(fā)生腐蝕、磨損等損壞,從而影響生產(chǎn)安全[1]。因此,研究軸承故障診斷方法具有重要的意義。
當(dāng)滾動(dòng)軸承發(fā)生故障時(shí),常會(huì)伴隨振動(dòng)、溫度、聲音等物理量的變化,因此,滾動(dòng)軸承故障診斷手段也包括聲學(xué)檢驗(yàn)、油膜檢驗(yàn)、電流分析與振動(dòng)分析等[2]。由于傳感器具有便宜、安裝簡單、可在線高效診斷等優(yōu)勢,基于振動(dòng)分析的故障診斷方法得到了廣泛關(guān)注和應(yīng)用[3,4]。
就方法而言,故障診斷主要包括故障提取和模式識(shí)別兩個(gè)方面,有些學(xué)者使用深度神經(jīng)網(wǎng)絡(luò)將特征提取和模式識(shí)別一體化實(shí)現(xiàn),這種方法提取的特征參數(shù)一般不具有實(shí)際物理意義[5]。多數(shù)研究中將故障提取與模式識(shí)別分開實(shí)現(xiàn),提取的故障參數(shù)包括時(shí)域、頻域和時(shí)頻域參數(shù)等,模式識(shí)別方法包括支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林等。
文獻(xiàn)[6]針對(duì)特征提取和降維過程復(fù)雜的問題,提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的故障智能診斷方法,有效地提高了軸承故障診斷的準(zhǔn)確率。文獻(xiàn)[7]以原始信號(hào)的時(shí)域指標(biāo)和小波包能量作為特征參數(shù),并使用最小二乘支持向量機(jī)實(shí)現(xiàn)了故障模式識(shí)別,實(shí)現(xiàn)了軸承故障的較高精度診斷。文獻(xiàn)[8]提出了一種云特征與時(shí)域特征融合的故障特征提取方法,并使用改進(jìn)人工魚群算法優(yōu)化了支持向量機(jī)參數(shù),經(jīng)驗(yàn)證,通過該方法可以獲得更高的識(shí)別準(zhǔn)確率。以上研究成果在各自軸承故障診斷上取得了較好成果,但是不同使用環(huán)境下不同類型軸承的敏感特征差別較大、故障診斷準(zhǔn)確率差別也很大,因此不同使用背景下軸承的故障特征提取和診斷方法仍是當(dāng)前研究熱點(diǎn)。
筆者對(duì)滾動(dòng)軸承故障特征提取與診斷技術(shù)進(jìn)行研究,對(duì)極差熵進(jìn)行改進(jìn),提取軸承振動(dòng)信號(hào)的多尺度極差熵特征;筆者以隨機(jī)森林算法思想為基礎(chǔ),給出基于專家森林算法的故障診斷方法,以達(dá)到提高軸承故障診斷精度的目的。
滾動(dòng)軸承主要由內(nèi)圈、外圈、滾動(dòng)體和保持架等結(jié)構(gòu)部件構(gòu)成,其結(jié)構(gòu)和主要參數(shù)如圖1所示。
圖1 滾動(dòng)軸承結(jié)構(gòu)及主要參數(shù)α—接觸角;d—滾動(dòng)體直徑;D—軸承節(jié)徑,即滾動(dòng)體中心間距離
當(dāng)軸承發(fā)生內(nèi)圈故障、外圈故障或滾動(dòng)體故障時(shí),軸承故障的特征頻率[9]如表1所示。
表1 軸承故障特征頻率
fIR—內(nèi)圈故障特征頻率;Z—滾動(dòng)體數(shù)量;fr—旋轉(zhuǎn)頻率;fB—滾動(dòng)體故障特征頻率;fOR—外圈故障特征頻率
由表1中數(shù)據(jù)可知:當(dāng)軸承內(nèi)圈、外圈和滾動(dòng)體等不同位置發(fā)生故障時(shí),其特征頻率不同,也即故障信號(hào)的規(guī)律性不同。
軸承的特征頻率越大,則信號(hào)規(guī)律性越強(qiáng),信號(hào)的熵值就越小;特征頻率越小,則信號(hào)規(guī)律性越弱,信號(hào)的熵值也就越大,因此,可以通過提取其信號(hào)的熵值特征,以此作為軸承的故障特征。
極差熵對(duì)信號(hào)長度和信號(hào)幅值不敏感,具有較強(qiáng)的穩(wěn)定性,因此,可以使用極差熵來度量信號(hào)的復(fù)雜度。
對(duì)于長度為N的時(shí)間序列x={x1,x2,…xN},極差熵的計(jì)算步驟如下[10]:
(1)
式中:m—數(shù)據(jù)長度,個(gè);t—延遲時(shí)間,s。
(2)在重構(gòu)相空間中搜索匹配樣本數(shù)量。根據(jù)熵與信號(hào)自相似的關(guān)系,借鑒重標(biāo)極差分析思想,可以定義樣本距離為:
(2)
(3)
式中:r—相似容限;Ψ()—Heaviside函數(shù)。
(4)
(5)
由于極差熵只是在一個(gè)維度上對(duì)信號(hào)復(fù)雜度進(jìn)行度量,并提取出該信號(hào)的特征,其無法全面提取數(shù)據(jù)序列中的有用信息。
為了解決這一問題,筆者提出了能夠全面反映信號(hào)特征的多尺度極差熵的概念,即借助粗?;枷?在不同尺度上將給定信號(hào)進(jìn)行分解,而后計(jì)算信號(hào)在各尺度的極差熵。
粗?;椒?
(6)
以τ=3為例,序列的粗粒化過程如圖2所示。
圖2 信號(hào)粗粒化方法
原始數(shù)據(jù)序列按照式(6)進(jìn)行粗?;?按照極差熵的計(jì)算步驟得到信號(hào)在各尺度下的極差熵,從而得到多尺度極差熵。
從原始信號(hào)中提取的多尺度極差熵對(duì)軸承故障的敏感程度不同,不敏感參數(shù)的存在不僅會(huì)增加特征向量維度,而且會(huì)降低故障識(shí)別準(zhǔn)確率,因此,筆者使用主成分分析法[11,12]提取其高敏感特征。
筆者將提取的多尺度極差熵記為Y={yq1,yq2,…yqd}。其中:d為特征參數(shù)維度;q為特征參數(shù)數(shù)量,q=1,2,…,n。
首先,計(jì)算特征向量組成矩陣的協(xié)方差矩陣:
(7)
式中:Ry—協(xié)方差矩陣;
求協(xié)方差矩陣的特征值βq和特征向量vq,按照特征值降序?qū)⑻卣飨蛄窟M(jìn)行重新排序,得到新特征向量矩陣記為vq(new),將多尺度極差熵yq在新特征矩陣vq(new)中進(jìn)行投影:
(8)
特征值βq越大代表相應(yīng)的特征向量的貢獻(xiàn)率越大,則對(duì)軸承故障也就越敏感。因此,筆者選擇前若干個(gè)累積貢獻(xiàn)率足夠大的特征向量用于故障診斷,這樣就實(shí)現(xiàn)了特征向量降維。
隨機(jī)森林算法原理如圖3所示[13,14]。
圖3 隨機(jī)森林算法
筆者使用Bagging隨機(jī)抽樣法從訓(xùn)練集中隨機(jī)、有放回地選擇訓(xùn)練樣本,從所選訓(xùn)練樣本中隨機(jī)挑選特征屬性對(duì)決策樹進(jìn)行訓(xùn)練,得到訓(xùn)練完畢的隨機(jī)森林決策樹[15];將測試集導(dǎo)入到?jīng)Q策樹中,得到各個(gè)決策樹的分類結(jié)果(即投票結(jié)果),得票數(shù)量最多的類別為隨機(jī)森林辨識(shí)的類別。
分析隨機(jī)森林算法原理可知,森林中決策樹的投票權(quán)是無差別的,但是決策權(quán)重卻是一致的。為了解決這一問題,筆者提出了專家樹和專家森林的概念,即根據(jù)決策樹的決策能力為不同決策樹賦予專家屬性,依據(jù)決策樹的專家屬性為其賦予不同的決策權(quán)重。筆者將這種具有專家屬性的決策樹命名為專家樹,由專家樹組成的森林命名為專家樹森林。
筆者將訓(xùn)練樣本分為訓(xùn)練組和預(yù)測試組兩類,其中,訓(xùn)練組用于決策樹的訓(xùn)練,預(yù)測試組用于對(duì)決策樹的決策精度進(jìn)行測試,從而為其賦予不同的專家屬性。
將預(yù)測試組的樣本數(shù)量記為C,則專家樹k在預(yù)測試中的決策準(zhǔn)確率Rk為:
(9)
式中:Ck—專家樹k在預(yù)測試中決策正確的次數(shù)。
根據(jù)預(yù)測試的決策準(zhǔn)確率,為專家樹k賦予的專家權(quán)值wk為:
(10)
式中:wk—專家樹k的專家屬性,即決策權(quán)值;K—專家樹數(shù)量。
則專家森林的決策結(jié)果為加權(quán)和取最大值的類別,即:
(11)
式中:fEF(x)—專家森林算法決策結(jié)果;Bk(i)—標(biāo)識(shí)函數(shù),當(dāng)決策樹k識(shí)別結(jié)果為i時(shí)Bk(i)=1,當(dāng)決策樹k識(shí)別結(jié)果不為i時(shí)Bk(i)=0。
根據(jù)專家樹森林算法的構(gòu)造方法,筆者設(shè)計(jì)的專家樹森林算法流程如下:
(1)初始化算法參數(shù),包括決策樹數(shù)量、訓(xùn)練組樣本數(shù)量、測試組樣本數(shù)量;
(2)將測試樣本隨機(jī)分為訓(xùn)練組和預(yù)測試組;
(3)使用訓(xùn)練組樣本對(duì)專家森林的決策樹進(jìn)行訓(xùn)練,并使用預(yù)測試組對(duì)決策樹的決策準(zhǔn)確率進(jìn)行評(píng)價(jià),為決策樹賦予專家屬性得到專家樹;
(4)將測試樣本輸入到專家森林中,得到專家投票的加權(quán)和,加權(quán)和最大的類別為決策類別。
筆者使用美國凱斯西儲(chǔ)大學(xué)的滾動(dòng)軸承故障數(shù)據(jù)進(jìn)行實(shí)驗(yàn)[16]。其中的測試軸承型號(hào)為6205—2RS深溝球軸承,轉(zhuǎn)速為1 797 r/min,數(shù)據(jù)采樣頻率為12 kHz。
軸承分為正常狀態(tài)、內(nèi)圈故障、外圈故障和滾動(dòng)體故障4種狀態(tài),每種故障狀態(tài)下根據(jù)故障深度分為0.007 inch、0.014 inch、0.021 inch 3類,因此共有10類故障狀態(tài),如表2所示。
表2 軸承10種狀態(tài)
在每一種軸承故障狀態(tài)下,筆者截取2 048個(gè)數(shù)據(jù)點(diǎn),原始振動(dòng)數(shù)據(jù)如圖4所示。
圖4 原始振動(dòng)數(shù)據(jù)x—振幅;t—時(shí)間
取數(shù)據(jù)長度m=2,相似容限r(nóng)=0.2SD,通過計(jì)算可得到不同尺度下軸承各狀態(tài)的極差熵值,如圖5所示。
圖5 不同尺度極差熵
由圖5可以看出:在軸承信號(hào)不同尺度的極差熵特征值中,一些極差熵(如1尺度、2尺度)對(duì)軸承故障敏感性好,狀態(tài)之間區(qū)分明顯;也有一些極差熵(如3尺度、4尺度)對(duì)軸承故障敏感性較差,故障狀態(tài)之間區(qū)分不明顯。因此,還要從特征參數(shù)中提取出對(duì)軸承故障狀態(tài)敏感的特征參數(shù)。
筆者使用主成分分析法計(jì)算上述多尺度極差熵的貢獻(xiàn)率,其結(jié)果如表3所示(按貢獻(xiàn)率降序排列)。
表3 主成分分析結(jié)果
由表3可以看出:上述25個(gè)多尺度極差熵的貢獻(xiàn)率相差較大,也即對(duì)軸承故障狀態(tài)的敏感度相差較大;選取貢獻(xiàn)率大于1%的前7個(gè)特征值組成特征向量,前7個(gè)特征值的累積貢獻(xiàn)率為96.24%,能夠較好地表征軸承的故障特征。
為了對(duì)基于降維方法和專家樹森林算法的軸承故障診斷效果進(jìn)行驗(yàn)證,筆者設(shè)置了3組對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)一使用降維前的25個(gè)特征參數(shù)組成特征向量,依據(jù)隨機(jī)森林算法進(jìn)行故障診斷;實(shí)驗(yàn)二使用降維后的7個(gè)特征參數(shù)組成特征向量,依據(jù)隨機(jī)森林算法進(jìn)行故障診斷;實(shí)驗(yàn)三使用降維后的7個(gè)特征參數(shù)組成特征向量,依據(jù)專家樹森林算法進(jìn)行故障診斷。
筆者從軸承每種狀態(tài)的振動(dòng)信號(hào)中隨機(jī)截取102 400個(gè)點(diǎn),并平均、非重疊地分為50個(gè)樣本,10種狀態(tài)下共得到500組樣本。每種狀態(tài)下隨機(jī)選擇10個(gè)樣本作為訓(xùn)練組樣本,共100個(gè)訓(xùn)練組樣本;再隨機(jī)選取10組樣本作為預(yù)測試組樣本,共100個(gè)預(yù)測試組樣本;每個(gè)狀態(tài)剩余30組樣本為測試樣本,共300組測試樣本。
3組實(shí)驗(yàn)中針對(duì)300組樣本的診斷結(jié)果如圖6所示。
圖6 3組實(shí)驗(yàn)診斷結(jié)果n—樣本編號(hào)
實(shí)驗(yàn)一、實(shí)驗(yàn)二和實(shí)驗(yàn)三的故障診斷準(zhǔn)確率如表4所示。
表4 故障診斷準(zhǔn)確率
對(duì)比實(shí)驗(yàn)一和實(shí)驗(yàn)二可知:實(shí)驗(yàn)二的故障診斷準(zhǔn)確率比實(shí)驗(yàn)一高17.07%,這是因?yàn)閷?shí)驗(yàn)二以降維后的高敏感特征參數(shù)作為特征向量,這也證明了基于主成分分析法的降維方法是有效的;
對(duì)比實(shí)驗(yàn)二和實(shí)驗(yàn)三可知:實(shí)驗(yàn)三的故障診斷準(zhǔn)確率比實(shí)驗(yàn)二高3.47%,兩組實(shí)驗(yàn)均以降維后的7個(gè)特征參數(shù)作為特征向量,實(shí)驗(yàn)二使用隨機(jī)森林算法進(jìn)行故障識(shí)別,實(shí)驗(yàn)三使用專家森林算法進(jìn)行故障識(shí)別,兩組實(shí)驗(yàn)結(jié)果說明專家森林算法的識(shí)別準(zhǔn)確率高于隨機(jī)森林算法。這是因?yàn)閷<疑炙惴ㄖ幸罁?jù)決策樹的決策能力,為決策樹賦予了不同的專家屬性,使專家樹具有不同的決策權(quán)。
由此可見,基于專家森林算法方法的識(shí)別準(zhǔn)確率高于基于隨機(jī)森林算法方法。
針對(duì)軸承故障特征提取與診斷方面的問題,筆者提出了一種基于多尺度極差熵的故障特征提取方法和基于專家森林的軸承故障診斷方法,并通過實(shí)驗(yàn)的方式對(duì)以上方法進(jìn)行了驗(yàn)證。
研究結(jié)論如下:
(1)與極差熵特征比,多尺度極差熵提取了振動(dòng)參數(shù)的多維度故障特征,能夠較好地代表軸承故障特征;
(2)經(jīng)過主成分分析法降維,降維后的特征組合對(duì)故障模式敏感度高于降維前,降維后故障診斷準(zhǔn)確率也高于降維前;
(3)在同等故障特征向量條件下,由于對(duì)隨機(jī)樹賦予了專家屬性,專家森林算法故障診斷準(zhǔn)確率高于隨機(jī)森林算法。
后續(xù)研究中,筆者將針對(duì)軸承故障特征提取與模式診斷的一體化開展研究,并使用深度學(xué)習(xí)等方法提取振動(dòng)數(shù)據(jù)的潛在故障特征,判斷出故障模式。