趙小強(qiáng) 柴靖軒
摘要: 目前許多基于卷積網(wǎng)絡(luò)的滾動軸承故障診斷方法受噪聲信號以及負(fù)荷變化的影響,存在診斷效果不佳、泛化能力差的問題。針對此問題提出一種改進(jìn)卷積膠囊網(wǎng)絡(luò)的滾動軸承變工況故障診斷方法。該方法設(shè)計了多尺度非對稱卷積模塊,其中采用不同尺度的非對稱卷積層對輸入數(shù)據(jù)進(jìn)行特征提取,在實現(xiàn)最大化提取數(shù)據(jù)中的特征信息的同時,還能夠有效減少參數(shù)量;在該模塊中引入通道注意力機(jī)制,能更好地提取有用的通道特征,提高該方法特征提取的能力;通過將網(wǎng)絡(luò)中的全連接層改進(jìn)為膠囊全連接層,使得膠囊在輸出向量特征信息時,避免了特征信息在空間中的丟失。使用凱斯西儲大學(xué)軸承數(shù)據(jù)集和東南大學(xué)變速箱數(shù)據(jù)集來驗證所提方法的診斷性能,并與其他深度學(xué)習(xí)方法進(jìn)行了比較。實驗結(jié)果表明,與其他深度學(xué)習(xí)方法相比,具有較好的泛化性,效果更佳。
關(guān)鍵詞: 故障診斷; 滾動軸承; 膠囊網(wǎng)絡(luò); 非對稱卷積; 特征提取
中圖分類號: TH165+.3; TH133.33+1??? 文獻(xiàn)標(biāo)志碼: A??? 文章編號: 1004-4523(2024)05-0885-11
DOI:10.16385/j.cnki.issn.1004-4523.2024.05.017
引 言
旋轉(zhuǎn)機(jī)械中的滾動軸承是關(guān)鍵部件,其運(yùn)行狀態(tài)直接影響到整個旋轉(zhuǎn)機(jī)械的工作過程[1],發(fā)生故障可能會損壞整個設(shè)備,造成重大損失。因此,對滾動軸承進(jìn)行更準(zhǔn)確、更智能的故障診斷是減少經(jīng)濟(jì)損失的重要保障[2]。
故障診斷技術(shù)向智能化階段發(fā)展,其中人工智能的算法對各種故障類型的識別和分類尤為重要[3?4]。作為人工智能的主要方法,機(jī)器學(xué)習(xí)可以有效地學(xué)習(xí)數(shù)據(jù)信息,模擬并實現(xiàn)人類學(xué)習(xí)行為,不斷改進(jìn)和提高自身的性能,取得更好的學(xué)習(xí)效果。貝葉斯分類器[5]、支持向量機(jī)[6]和神經(jīng)網(wǎng)絡(luò)[7]等機(jī)器學(xué)習(xí)方法雖然能夠提取、識別與分類所需的故障特征,但是在提取軸承的故障信號特征時,往往使用復(fù)雜的數(shù)學(xué)工具,針對不同類型的故障所采用的特征提取方法也不同。傳統(tǒng)的故障特征提取方法過于依賴信號處理的相關(guān)知識以及故障診斷專家的經(jīng)驗[8?9],這對故障檢測的效率和成本都是很大的考驗。
與傳統(tǒng)的人工智能故障診斷方法相比,深度學(xué)習(xí)技術(shù)不僅直接處理工業(yè)生產(chǎn)系統(tǒng)的檢測信號,而且不過多依賴信號處理和專家經(jīng)驗。近年來,深度學(xué)習(xí)技術(shù)在軸承故障診斷領(lǐng)域取得了快速發(fā)展[10?11],例如卷積神經(jīng)網(wǎng)絡(luò)[12]、深度置信網(wǎng)絡(luò)[13]、稀疏自編碼器[14]和卷積自編碼網(wǎng)絡(luò)[15]等方法通過多層非線性特征提取結(jié)構(gòu),將振動信號進(jìn)行多層非線性變換,可以比較充分地提取故障特征,診斷生產(chǎn)過程中的設(shè)備故障類別。然而在實際的工業(yè)應(yīng)用中,傳感器采集到的振動信號會無法避免地被現(xiàn)場各種噪聲所污染[16?17]。此外,軸承的轉(zhuǎn)速會因負(fù)荷的變化而變化。鑒于各種復(fù)雜的系統(tǒng)組件及其內(nèi)部工作原理,通常存在錯綜復(fù)雜且強(qiáng)相關(guān)的耦合關(guān)系。因此,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在診斷受噪聲干擾和負(fù)荷變化影響的軸承故障時,會存在診斷準(zhǔn)確率低、泛化能力差的問題。
膠囊網(wǎng)絡(luò)由Sabour等[18]提出。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同,膠囊網(wǎng)絡(luò)中的每個神經(jīng)元都不是由傳統(tǒng)的標(biāo)量組成,而是由向量組成。因此,膠囊網(wǎng)絡(luò)可以從輸入數(shù)據(jù)中提取并存儲更詳細(xì)的特征,同時有效地減少特征信息的損失。初始膠囊網(wǎng)絡(luò)提取特征時僅使用了單卷積;楊平等[19]提出雙卷積層膠囊網(wǎng)絡(luò)的診斷方法,但雙卷積層膠囊網(wǎng)絡(luò)只增加了一個卷積層和池化層[18],使得原始圖像數(shù)據(jù)特征未被進(jìn)一步提取,導(dǎo)致細(xì)節(jié)特征提取不夠完整,其特征提取能力還有待改善。
針對上述膠囊網(wǎng)絡(luò)存在的問題,本文提出一種基于卷積膠囊網(wǎng)絡(luò)的故障診斷方法。首先使用不同尺度非對稱卷積層和注意力機(jī)制構(gòu)建多尺度非對稱卷積結(jié)構(gòu),然后使用膠囊全連接層改進(jìn)了膠囊網(wǎng)絡(luò),最后結(jié)合多尺度非對稱卷積和改進(jìn)的膠囊網(wǎng)絡(luò)進(jìn)行特征分類,可以在強(qiáng)噪聲影響或變負(fù)荷的情況下診斷軸承的故障,提高故障診斷的準(zhǔn)確率。
1 基礎(chǔ)理論
1.1 Inception卷積結(jié)構(gòu)
在深度學(xué)習(xí)中,卷積神經(jīng)網(wǎng)絡(luò)(CNN)[20]是一種前饋神經(jīng)網(wǎng)絡(luò),具有自動提取特征的能力,它通過多個卷積核逐層提取輸入數(shù)據(jù)中的深層特征,卷積核的每個元素都包含一個權(quán)重系數(shù)和偏差,并對輸入圖像或數(shù)據(jù)執(zhí)行局部卷積運(yùn)算。
Inception結(jié)構(gòu)使用不同大小的卷積核,通過堆疊來增加網(wǎng)絡(luò)寬度,從而可以提取豐富的特征信息,同時利用1×1尺度的卷積核對輸入的特征圖進(jìn)行降維,減少參數(shù),加快網(wǎng)絡(luò)計算及訓(xùn)練速度。由于激活函數(shù)的增加,多層卷積核的非線性表達(dá)能力得到提升;卷積層的深度增加,避免了一定的梯度彌散。目前,Inception模塊已經(jīng)更新到Inception v4和Inception?ResNet模塊[21]。
1.2 通道注意力機(jī)制
注意力機(jī)制模仿人觀察事物、關(guān)注重點部位的特點,在自然語言處理、統(tǒng)計學(xué)習(xí)及語音識別等領(lǐng)域中[22]被廣泛應(yīng)用。通道注意力機(jī)制能更好地提取有用的通道特征,增強(qiáng)模型特征提取的能力。通道注意力模塊由三部分組成:壓縮模塊、激勵模塊和注意力模塊[23]。壓縮模塊由池化層將各通道內(nèi)的全局空間特征信息進(jìn)行求和壓縮,形成各自的通道特征,該特征能反映全局的通道特征信息,等同擴(kuò)大了網(wǎng)絡(luò)的感受野;激勵模塊在增強(qiáng)模塊遷移能力的同時降低模塊的參數(shù)數(shù)量;注意力模塊在每個通道域上將原卷積相應(yīng)的通道特征值與得到的特征權(quán)重進(jìn)行加權(quán)相加,使卷積通道特征表現(xiàn)不同的權(quán)重,提取出表征目標(biāo)中的關(guān)鍵信息。
1.3 膠囊網(wǎng)絡(luò)
膠囊網(wǎng)絡(luò)使用卷積層來對二維輸入信息的各個區(qū)域進(jìn)行卷積計算,并將計算結(jié)果堆疊,形成卷積層的輸出。傳統(tǒng)深度學(xué)習(xí)方法通常使用最大池化層來實現(xiàn)靜態(tài)不變性,由于最大池化層持續(xù)搜尋二維矩陣的區(qū)域并選取區(qū)域內(nèi)最大的計算結(jié)果,因此有價值的信息容易損失,并且對編碼特征間的相對空間關(guān)系缺乏考慮,本文方法使用動態(tài)路由算法替代最大池化層,膠囊層提取的重要特征信息以向量形式被膠囊封裝,普通標(biāo)量神經(jīng)元與膠囊向量神經(jīng)元如圖1所示。
在圖2膠囊網(wǎng)絡(luò)結(jié)構(gòu)中,設(shè)定上層膠囊為父膠囊,下層膠囊為子膠囊。除第一層膠囊外,其余下層膠囊的總輸入是來自子膠囊的所有“預(yù)測向量”的加權(quán)和,記父膠囊層第個神經(jīng)元為,為與神經(jīng)元相乘的權(quán)重矩陣。用非線性Squash函數(shù)替代傳統(tǒng)激活函數(shù),將總輸入傳遞到膠囊網(wǎng)絡(luò)中,得到最終的輸出向量,其表達(dá)式為:
式中是由迭代動態(tài)路由過程確定的耦合系數(shù),其目的是使輸入的神經(jīng)元能夠自主選擇最好的路徑傳輸?shù)较乱粚由窠?jīng)元。膠囊與上一層,膠囊i-1層中所有膠囊之間的耦合系數(shù)之和為1,由“路由Softmax”確定,其初始Logits函數(shù)為膠囊連接到膠囊的對數(shù)先驗概率,其表達(dá)式為:
在每一次動態(tài)路由的前向傳播中,都先將初始化為0,使用式(5)來更新的值,從而更新的值,通過前向傳播進(jìn)一步修正的值,改變輸出向量的值,通過動態(tài)路由迭代循環(huán),最終得到一組最佳的耦合系數(shù)。
2 改進(jìn)卷積膠囊網(wǎng)絡(luò)的滾動軸承故障診斷方法
滾動軸承的工作環(huán)境通常伴隨強(qiáng)噪聲、變負(fù)荷等情況,導(dǎo)致實際軸承檢測的振動信號容易受到外界因素干擾。為了充分利用膠囊網(wǎng)絡(luò)的特征提取能力,同時改進(jìn)神經(jīng)網(wǎng)絡(luò)需要處理大量的數(shù)據(jù)和時間來提高學(xué)習(xí)能力的缺點,并預(yù)防梯度損失的問題,本文提出了改進(jìn)卷積膠囊的滾動軸承變工況故障診斷方法,設(shè)計了改進(jìn)的多尺度非對稱卷積模塊和改進(jìn)全連接膠囊層并引入通道注意力機(jī)制,實現(xiàn)對強(qiáng)噪聲和變工況下故障的診斷。
2.1 多尺度非對稱卷積結(jié)構(gòu)
為使膠囊網(wǎng)絡(luò)從原始振動信號中獲取更多的有用信息,并提升膠囊網(wǎng)絡(luò)提取特征的速度,本文提出了一種改進(jìn)的多尺度非對稱卷積模塊。該模塊基于Inception結(jié)構(gòu),相比于普通的對稱k×k卷積核的卷積,非對稱卷積是將一個k×k的卷積拆解成一個k×1的卷積再串聯(lián)一個1×k的卷積,兩者的感受野是相同的,但非對稱卷積能有效地減少參數(shù)量和運(yùn)算量[24],因為多個大小兼容的二維核使用相同的步長對同一輸入進(jìn)行操作,這些卷積核會產(chǎn)生具有相同分辨率的輸出。在求和非對稱卷積的輸出后,相應(yīng)位置的卷積核會相互疊加,從而形成一個等效的卷積核,其輸出與原始輸出相同[25?26],其結(jié)構(gòu)如圖3所示:在第一層中,使用1×1結(jié)構(gòu),3×1與1×3的串聯(lián),以及5×1與1×5的串聯(lián)結(jié)構(gòu)。且并行的卷積層對輸入故障數(shù)據(jù)進(jìn)行不同尺度的特征提取,通道數(shù)設(shè)置為16,8,8;第二層將5×5,3×3的卷積分別等效拆解成5×1與1×5,3×1與1×3的非對稱卷積,并與第一層串聯(lián),通道數(shù)都為16;第三層使用兩個1×1且通道數(shù)都為32的卷積層。為了增加模型的非線性表達(dá)能力,在每個卷積層之后使用批量標(biāo)準(zhǔn)化和ReLU激活函數(shù),然后通過Concat層對不同分支的特征維度進(jìn)行堆疊拼接,并使用通道注意力機(jī)制獲得不同特征信息的重要程度,依據(jù)重要程度增強(qiáng)有用特征,抑制干擾。
2.2 膠囊全連接層
全連接層(Fully Connected Layers)在整個神經(jīng)網(wǎng)絡(luò)中起到將學(xué)習(xí)到的“分布式特征表示”映射到樣本標(biāo)記空間的作用[27]。因為全連接層的特性參數(shù)在網(wǎng)絡(luò)中也是最多的,所以全連接層在綜合前邊提取的特征時,參數(shù)相對冗余,在模型進(jìn)行最后故障分類時,存在特征信息丟失的問題。為使模型達(dá)到更好的故障診斷效果,本文改進(jìn)了一種膠囊全連接層[28]來替代傳統(tǒng)全連接層。膠囊全連接層是由子膠囊構(gòu)成,子膠囊保留上層父膠囊提取的特征信息,如圖4所示。當(dāng)模型在最后壓縮輸出時,下層的膠囊被展平成膠囊列表,送入膠囊全連接層,膠囊層中每個子膠囊乘以轉(zhuǎn)換矩陣,通過協(xié)議路由,以產(chǎn)生適用于每個類別的最終膠囊及其概率。因為協(xié)議路由內(nèi)部會使用Softmax函數(shù)產(chǎn)生膠囊間的對數(shù)先驗概率,所以本文使用ReLU激活函數(shù)在全連接層內(nèi)部進(jìn)行一次再壓縮,針對每個最終膠囊進(jìn)行解碼。改進(jìn)因膠囊全連接層內(nèi)部的Softmax函數(shù)被過多使用,導(dǎo)致數(shù)值溢出的問題;所以在其內(nèi)部使用ReLU函數(shù)進(jìn)行單側(cè)抑制,增強(qiáng)運(yùn)算效率的同時,并沒有像傳統(tǒng)前連接層一樣丟失過多的特征信息。因為各個膠囊盡可能地保留了特征向量,所以在將各個數(shù)字膠囊層提取的特征信息相連時,依舊保持較高的信息量,在最后使用ReLU函數(shù)來抑制過擬合,可以提高模型的分類準(zhǔn)確度。
2.3 網(wǎng)絡(luò)結(jié)構(gòu)
為提高卷積膠囊網(wǎng)絡(luò)的特征提取效率,利用改進(jìn)的多尺度特征提取模塊進(jìn)行前端特征提取,該模塊采用多通道不同尺度的非對稱卷積核,有效地減少特征提取時的參數(shù)量。采用通道注意力機(jī)制獲得更多更有效的故障數(shù)據(jù)信息,并減少特征提取時的模型計算量,與主膠囊層相結(jié)合,將前端提取的標(biāo)量特征信息轉(zhuǎn)換為向量特征信息,在空間上存儲了更多的有效特征信息。以動態(tài)路由算法替代了傳統(tǒng)最大池化實現(xiàn)特征傳遞,并在后端數(shù)字膠囊層與輸出層之間使用全連接膠囊層進(jìn)行下一步的特征信息全連接和特征分類的輸出傳遞,保證特征信息盡可能地存儲在膠囊中,經(jīng)過交叉熵?fù)p失函數(shù)輸出故障診斷結(jié)果,其結(jié)構(gòu)如圖5所示。
3 實驗驗證及結(jié)果分析
為了評估本文提出方法對故障診斷的有效性和準(zhǔn)確性,實驗在Windows 10系統(tǒng)下進(jìn)行,處理器為i9?9900K,GPU為RTX 2070 SUPER,利用Pycharm平臺,編程語言為Python,深度學(xué)習(xí)框架為Tensorflow[29]。本文實驗以滾動軸承為對象,采用來自美國凱斯西儲大學(xué)(CWRU)的軸承數(shù)據(jù)[30]和東南大學(xué)變速箱數(shù)據(jù)集中的軸承數(shù)據(jù)[31]進(jìn)行實驗驗證與分析。
3.1 CWRU軸承故障數(shù)據(jù)集
3.1.1 數(shù)據(jù)集介紹
本文選取了凱斯西儲大學(xué)(CWRU)滾動軸承數(shù)據(jù)中心的公開數(shù)據(jù)集驗證本文方法的可行性,CWRU實驗臺由電機(jī)、扭矩傳感器和測功器組成。測試的故障軸承是型號為SKF 6205的電機(jī)驅(qū)動端軸承,采用電火花方法在內(nèi)圈、滾動體和外圈的表面上加工出損傷直徑為0.1778,0.3556,0.5334和0.7112 mm的單點凹槽,以模擬滾動軸承在實際運(yùn)行中的磨損情況。本實驗采樣頻率為12 kHz,分別采集轉(zhuǎn)速為1797,1772,1750和1730 r/min時,對應(yīng)負(fù)載為0,1,2和3 hp(約為0,0.75,1.49和2.24 kW)狀態(tài)下的加速度數(shù)據(jù)集,并將其標(biāo)記為數(shù)據(jù)集A、數(shù)據(jù)集B、數(shù)據(jù)集C和數(shù)據(jù)集D。將采集到的數(shù)據(jù)按照不同位置和不同損傷度劃分為16種狀態(tài)標(biāo)簽,且每種狀態(tài)標(biāo)簽中的樣本數(shù)量大致相同。在每個數(shù)據(jù)集中單次選取8000個樣本,按照3∶1的比例劃分訓(xùn)練樣本和測試樣本,每段的采樣點數(shù)設(shè)置為784個,每一訓(xùn)練批次大小為100。訓(xùn)練集和測試集如表1所示。
3.1.2 數(shù)據(jù)集處理
實驗臺采集的軸承數(shù)據(jù)為一維時間序列,為了適應(yīng)改進(jìn)卷積膠囊網(wǎng)絡(luò)模型輸入數(shù)據(jù)格式,有效地進(jìn)行卷積和下采樣操作,根據(jù)如圖6所示的重構(gòu)方式,本文對長度為784的一維數(shù)據(jù)進(jìn)行提取。首先,將時間序列樣本等分為28段,每段包含28個數(shù)據(jù)點;然后,將這28段數(shù)據(jù)堆疊在一起,獲得一個(28,28)的二維特征灰度圖。
為了加快網(wǎng)絡(luò)模型訓(xùn)練速度,讓數(shù)據(jù)便于計算、獲得更加泛化的結(jié)果,對輸入數(shù)據(jù)做標(biāo)準(zhǔn)化處理,有效消除變量量綱和變異范圍的影響,其表達(dá)式為:
式中為輸入數(shù)據(jù),為數(shù)據(jù)中的最小值,為數(shù)據(jù)中的最大值。
3.2 網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)
網(wǎng)絡(luò)結(jié)構(gòu)越深,特征提取能力就越強(qiáng),但是網(wǎng)絡(luò)層數(shù)越多,越容易產(chǎn)生梯度爆炸等問題。滾動軸承的故障數(shù)據(jù)為一維時間序列,在轉(zhuǎn)化成二維特征圖像輸入時,有效特征不是足夠多,所以提出方法時要考慮提升網(wǎng)絡(luò)的計算效率。在使用多尺度特征提取時,用非對稱卷積核替代傳統(tǒng)對稱卷積核,這樣可以在同樣的感受野下,減少模型計算的參數(shù)量,加快模型的計算效率。在通道注意力機(jī)制后,需要構(gòu)建膠囊單元,表2中膠囊單元的輸出尺寸表示為6×(8),即特征層的寬度為6且每一個向量的維度為8。在膠囊層中通過動態(tài)路由將之前卷積輸出的特征標(biāo)量變?yōu)樘卣魇噶浚谀z囊層之間進(jìn)行運(yùn)算。同理,16×(10)表示16個維度為10的向量,10×(8)表示10個維度為8的向量。
因為膠囊網(wǎng)絡(luò)的擬合能力較強(qiáng),所以訓(xùn)練時在膠囊層使用Dropout操作,即對神經(jīng)元在每次迭代時隨機(jī)失活,并且失活神經(jīng)元的權(quán)值不再更新,從而降低網(wǎng)絡(luò)復(fù)雜度,防止網(wǎng)絡(luò)過擬合。本文方法參數(shù)設(shè)計如表2所示。
3.3 對比方法
為了驗證本文方法在變噪聲、變負(fù)荷和變工況實驗中,是否能夠獲得較高的故障診斷準(zhǔn)確率和較好的泛化能力,將本文方法和常見的深度學(xué)習(xí)方法(CNN,IRB,CapsNet和FD?CCN)進(jìn)行對比。對比模型的網(wǎng)絡(luò)參數(shù)如表3所示,表3中的參數(shù)盡量使用與原文獻(xiàn)中相同的網(wǎng)絡(luò)參數(shù)。
CNN(Convolutional Neural Network)使用傳統(tǒng)的全連接層,為適應(yīng)時頻變換后的數(shù)據(jù)結(jié)構(gòu),通過卷積和池化的方式,逐層提取和壓縮特征。卷積層的參數(shù)構(gòu)建是為了更好地對比IRB[30]網(wǎng)絡(luò),因為IRB網(wǎng)絡(luò)同樣使用卷積層,有著不錯的診斷效果。
IRB(Inception+Residual Block)全局殘差網(wǎng)絡(luò)[32]在殘差網(wǎng)絡(luò)中添加了注意力機(jī)制,并使用了五個殘差塊來提取特征信息,兩個全連接層來逐層進(jìn)行特征壓縮。網(wǎng)絡(luò)內(nèi)部參數(shù)參照原文獻(xiàn)來復(fù)現(xiàn)網(wǎng)絡(luò),同時使用Inception模塊。
FD?CCN(Fault Diagnosis?Convolution Capsule Network)卷積膠囊網(wǎng)絡(luò)[19]用傳統(tǒng)卷積層和池化層組合先進(jìn)行特征提取,并二次使用卷積與池化,再與膠囊層相組合,結(jié)合了卷積網(wǎng)絡(luò)和膠囊網(wǎng)絡(luò)的各自特點,采用ReLU激活函數(shù),以傳統(tǒng)的全連接層來進(jìn)行特征壓縮,也采用原文獻(xiàn)中的網(wǎng)絡(luò)參數(shù),驗證本文方法對改進(jìn)膠囊網(wǎng)絡(luò)具有明顯的提升和優(yōu)勢。
CapsNet(Capsules Network)膠囊網(wǎng)絡(luò)[18]先通過一個二維卷積層進(jìn)行特征提取并作為膠囊層的輸入,在初級膠囊層與數(shù)字膠囊層之間通過動態(tài)路由算法進(jìn)行特征向量的矢量轉(zhuǎn)化。膠囊網(wǎng)絡(luò)使用文獻(xiàn)[18]中的網(wǎng)絡(luò)參數(shù),驗證了本文方法對原有膠囊網(wǎng)絡(luò)的改進(jìn)具有顯著效果。
分別使用構(gòu)建好的數(shù)據(jù)集B進(jìn)行實驗,樣本按3∶1的比例隨機(jī)劃分訓(xùn)練集和測試集。4種方法均采用Adam優(yōu)化方法,學(xué)習(xí)率為0.001,衰減率為0.9,訓(xùn)練時單次讀入數(shù)據(jù)量批次大小為100,全部樣本迭代批次數(shù)設(shè)置為50,運(yùn)行3次取平均結(jié)果。表4為在數(shù)據(jù)集B上的不同方法診斷結(jié)果對比。
由表4可以看到,改進(jìn)卷積膠囊網(wǎng)絡(luò)對訓(xùn)練集的診斷精度有一定提升。這說明改進(jìn)的卷積膠囊網(wǎng)絡(luò)相比于其他深度學(xué)習(xí)方法在數(shù)據(jù)量更大時,不僅診斷精度優(yōu)于其他方法,而且在減少特征損失方面也有著不錯的表現(xiàn)。
3.4 變工況條件下的故障診斷結(jié)果與分析
3.4.1 變負(fù)荷故障診斷
由于在實際中,滾動軸承經(jīng)常工作在變負(fù)荷狀態(tài)下,所以要求故障診斷方法具有良好的泛化能力。為了驗證本文方法在變負(fù)荷情況下的診斷性能,網(wǎng)絡(luò)訓(xùn)練與測試用的數(shù)據(jù)均為不同負(fù)荷下的數(shù)據(jù)集。以數(shù)據(jù)集A、數(shù)據(jù)集B、數(shù)據(jù)集C和數(shù)據(jù)集D中的一種依次作為訓(xùn)練樣本,另外三種負(fù)荷數(shù)據(jù)集作為測試樣本,實驗結(jié)果如圖7所示。
由圖7可以看到,本文提出的方法在變負(fù)荷實驗中的診斷準(zhǔn)確率均高于其他三種方法,其中以數(shù)據(jù)集C作為訓(xùn)練樣本,數(shù)據(jù)集A、數(shù)據(jù)集B和數(shù)據(jù)集D作為測試樣本時,IRB雖然改進(jìn)了數(shù)據(jù)池化層、增強(qiáng)了網(wǎng)絡(luò)特征學(xué)習(xí)能力,但是診斷準(zhǔn)確率不如FD?CCN和本文方法,這是由于膠囊網(wǎng)絡(luò)能保留卷積丟失的特征信息;CapsNet相較于卷積方法的性能有提升,但是因為其單一的卷積層,沒有充分提取故障特征信息,提升優(yōu)勢并不是很明顯;FD?CCN雖然已經(jīng)有了較明顯的提取特征能力的提升,但是在前端卷積層輸出特征信息到膠囊層的過程中過度使用池化層,在特征提取過程中過濾了不活躍的特征信息,影響了故障診斷準(zhǔn)確率提升。以數(shù)據(jù)集C為訓(xùn)練集,本文方法對測試集為數(shù)據(jù)集A、數(shù)據(jù)集B、數(shù)據(jù)集D時的故障診斷準(zhǔn)確率分別為97.52%,96.41%和98.56%,平均診斷準(zhǔn)確率達(dá)到97.49%,而FD?CCN方法的診斷準(zhǔn)確率平均值為92.38%,本文方法相比于FD?CCN準(zhǔn)確率提升5%左右。
3.4.2 變噪聲故障診斷
在實際應(yīng)用中,檢測的信號受到強(qiáng)噪聲的干擾,為了驗證本文方法在故障診斷時的抗強(qiáng)噪聲性能,將不同信噪比(SNR)的高斯白噪聲添加在測試數(shù)據(jù)集中。信噪比是評價信號中所含噪聲的重要指標(biāo),其表達(dá)式為:
式中為信號有效功率;為噪聲功率。
本文方法以滾動軸承數(shù)據(jù)集C作為訓(xùn)練樣本,并且在數(shù)據(jù)集C的測試樣本中加入信噪比分別為 -3,3,6和9 dB的高斯白噪聲。給原始信號加入噪聲以后,原始信號的特征就被強(qiáng)噪聲所淹沒,如圖8所示。人眼已無法清晰地區(qū)分強(qiáng)噪聲信號故障是否與原始信號故障屬于相同故障。將最終得到的實驗結(jié)果與CNN,IRB,CapsNet和FD?CCN方法的診斷結(jié)果進(jìn)行對比分析,實驗結(jié)果如表5所示。
由表5的數(shù)據(jù)對比可知,在不同信噪比的實驗結(jié)果中,F(xiàn)D?CCN和CapsNet相比CNN和IRB有著明顯的診斷優(yōu)勢,在信噪比為-3 dB的噪聲下達(dá)到95%左右的診斷準(zhǔn)確率,相比于IRB和CNN提升了5%以上;在信噪比為-3 dB時,本文方法比CapsNet的故障診斷準(zhǔn)確率提升了2.98%,相比FD?CCN的診斷準(zhǔn)確率提升了1.27%。本文方法在數(shù)據(jù)池化層采用多尺度非對稱卷積,最大限度地提取了故障數(shù)據(jù)中的信息,在6 dB以上的噪聲下故障診斷準(zhǔn)確率達(dá)99%以上,相比于其他4種方法其抗噪性能更好。
圖9是本文方法在不同信噪比下的故障診斷結(jié)果,可以直觀得到,在-3 dB的強(qiáng)噪聲環(huán)境下,測試集的診斷準(zhǔn)確率達(dá)到95%以上。
3.4.3 變工況故障診斷
在實際工程應(yīng)用中,由于軸承的工作環(huán)境復(fù)雜,振動信號可能同時受到強(qiáng)噪聲和負(fù)荷變化的影響。在變噪聲和變負(fù)荷的單工況故障診斷實驗中,本文提出的方法均取得了良好的診斷效果,為了驗證本文方法在噪聲環(huán)境下,且負(fù)荷在變化時的診斷性能,以數(shù)據(jù)集A作為訓(xùn)練樣本,數(shù)據(jù)集B、數(shù)據(jù)集C和數(shù)據(jù)集D作為測試樣本并且向測試樣本中分別添加-3,3,6和9 dB的高斯白噪聲,與CNN,IRB,CapsNet和FD?CCN模型的診斷結(jié)果進(jìn)行對比分析,結(jié)果如表6所示。
從表6可知,本文方法在不同信噪比和變負(fù)荷的環(huán)境下,其故障識別準(zhǔn)確率都優(yōu)于IRB,CapsNet和FD?CCN。以數(shù)據(jù)集B為測試樣本時,隨著信噪比的減小,F(xiàn)D?CCN的診斷準(zhǔn)確率從97.41%降到了85.96%,而本文方法從99.11%降到了90.37%,診斷準(zhǔn)確率仍在90%以上,說明本文方法擁有更好的泛化能力。
3.5 變速箱的滾動軸承實驗分析
3.5.1 變速箱數(shù)據(jù)集介紹與處理
為了驗證本文所提方法在其他類型軸承應(yīng)用的可行性,采用來自東南大學(xué)變速箱數(shù)據(jù)集中的軸承數(shù)據(jù)進(jìn)行實驗驗證[31],該數(shù)據(jù)從傳動系統(tǒng)動力學(xué)模擬器(DDS)上獲取,DDS由電機(jī)、行星齒輪箱、并聯(lián)齒輪箱和制動器構(gòu)成。在實驗中,分別在兩種運(yùn)行條件下(20 Hz,0 V和30 Hz,2 V)對齒輪和軸承的故障進(jìn)行診斷實驗,其中軸承狀態(tài)包括正常、外圈裂縫故障、內(nèi)圈裂縫故障、滾動體裂縫故障和內(nèi)外圈裂縫聯(lián)合故障。DDS實驗臺表面采用7個608A11振動傳感器,其頻率范圍為0.5~10 Hz,測量范圍為±50g,測量精度為100 mV/g。測量了齒輪箱x,y,z三個方向的振動信號,并采用緊湊型光譜板數(shù)據(jù)采集儀(最多20個通道)進(jìn)行數(shù)據(jù)采集,采樣頻率為1024 Hz,采樣窗口為512 s[33]。本文在每種故障中隨機(jī)選取800個樣本,按照3∶1的比例劃分訓(xùn)練集和測試集,如表7所示。
3.5.2 故障診斷結(jié)果與分析
(1) 變負(fù)荷故障診斷
該實驗轉(zhuǎn)速?負(fù)載分別設(shè)置為20 Hz?0 V和30 Hz?2 V,以軸承5種故障類型為基礎(chǔ),構(gòu)建10個實驗數(shù)據(jù)集。讀入數(shù)據(jù)共計批次大小為100,設(shè)置迭代批次為50,將全部樣本運(yùn)行3次并取平均結(jié)果。將實驗結(jié)果與CNN,IRB,CapsNet和FD?CCN方法作比較,結(jié)果如表8所示。
由表8可知,在變負(fù)荷環(huán)境下,本文所提方法的故障診斷準(zhǔn)確率相比其他4種方法有顯著提升。這是由于本文方法設(shè)計了改進(jìn)后的多尺度非對稱卷積模塊進(jìn)行特征提取,能夠充分提取故障數(shù)據(jù)中的信息,提取的特征進(jìn)入膠囊網(wǎng)絡(luò),膠囊網(wǎng)絡(luò)可以更充分地提取并保存數(shù)據(jù)中的特征信息,從而使故障診斷準(zhǔn)確率得到顯著的提升。
為進(jìn)一步觀察本文所提方法對故障誤判的情況,對測試結(jié)果做了混淆矩陣實驗,結(jié)果如圖10所示,圖中橫坐標(biāo)為預(yù)測標(biāo)簽的診斷狀態(tài),縱坐標(biāo)為真實標(biāo)簽的實際狀態(tài)。
從圖10(a)可看出,F(xiàn)D?CCN方法對于軸承滾動體故障的診斷準(zhǔn)確率僅為98.29%,因為FD?CCN使用了兩次池化操作,在特征提取過程中損失了一些細(xì)節(jié)特征。這導(dǎo)致兩種故障的診斷準(zhǔn)確率分別為0.96與0.97,對整個故障診斷造成了影響。而從圖10(b)可看出,本文方法對各個故障狀態(tài)均有較高的診斷準(zhǔn)確率,其整體診斷準(zhǔn)確率達(dá)99.81%,這說明本文方法相比于FD?CCN擁有更佳的診斷性能,能夠更充分地提取故障特征信息。也驗證了本文所提出的故障診斷方法應(yīng)用在其他種類軸承數(shù)據(jù)集的可行性和泛化能力。
(2) 變噪聲故障診斷
在變速箱數(shù)據(jù)集上依舊采用和CWRU軸承數(shù)據(jù)集一樣的處理方式,分別加入信噪比為-3,3,6和9 dB的高斯白噪聲,具體結(jié)果如表9所示。
由表9可知,在-3 dB的強(qiáng)噪聲環(huán)境下,本文方法相比傳統(tǒng)的CapsNet故障診斷準(zhǔn)確率提升了2.42%,相比FD?CCN提升了0.65%。這說明本文方法依舊保持著良好的特征提取性能,且本文方法在軸承故障診斷的抗噪方面有著不錯的表現(xiàn)。
3.6 模型參數(shù)量
計算成本是評價深度學(xué)習(xí)方法性能的重要指標(biāo)。本文方法和各對比方法的參數(shù)量如表10所示。傳統(tǒng)CNN和IRB方法的參數(shù)量雖然明顯小于膠囊相關(guān)方法,但是它們的故障診斷準(zhǔn)確率也是最低的。本文方法相比傳統(tǒng)CapsNet的參數(shù)量顯著減少,盡管比FD?CCN的參數(shù)量要多,但是本文方法在變速箱數(shù)據(jù)集變負(fù)荷實驗中每批次平均耗時最短,診斷結(jié)果更優(yōu)。這是因為參數(shù)量相同時,非對稱卷積比對稱卷積計算效率更高。同時由于本文方法在膠囊網(wǎng)絡(luò)前未使用池化操作過濾部分特征信息,能夠充分提取故障特征信息,所以具有良好的魯棒性。
4 結(jié) 論
本文提出了一種改進(jìn)卷積膠囊網(wǎng)絡(luò)的滾動軸承變工況故障診斷方法。該方法將一維時域信號轉(zhuǎn)為二維圖像數(shù)據(jù)作為網(wǎng)絡(luò)輸入,通過大量的數(shù)據(jù)學(xué)習(xí),能夠自適應(yīng)地提取軸承故障特征,而無需對原始數(shù)據(jù)進(jìn)行過多的人工預(yù)處理,通過將多尺度非對稱卷積與通道注意力模塊結(jié)合,并且改進(jìn)膠囊網(wǎng)絡(luò)中的膠囊全連接層,起到抗噪和改善特征提取能力的作用,使得本文方法的穩(wěn)定性和泛化能力更好。實驗結(jié)果表明,相比于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)、全局殘差網(wǎng)絡(luò)和雙卷積膠囊神經(jīng)網(wǎng)絡(luò),本文方法可以實現(xiàn)更高的診斷準(zhǔn)確率和更好的泛化能力。未來在強(qiáng)噪聲環(huán)境影響下,需要對本文方法進(jìn)一步優(yōu)化,改善網(wǎng)絡(luò)參數(shù)選擇的穩(wěn)定性和通用性。
參考文獻(xiàn):
[1]張妮, 車立志, 吳小進(jìn). 基于數(shù)據(jù)驅(qū)動的故障診斷技術(shù)研究現(xiàn)狀及展望[J]. 計算機(jī)科學(xué), 2017, 44(6A): 47-52.
Zhang N, Che L Z, Wu X J. Present situation and prospects of data-driven based fault diagnosis technique[J]. Computer Science, 2017, 44(6A): 47-52.
[2]Lu C, Wang Z Y, Qin W L, et al. Fault diagnosis of rotary machinery components using a stacked denoising autoencoder-based health state identification[J]. Signal Processing, 2017, 130: 377-388.
[3]劉強(qiáng), 柴天佑, 趙立杰. 基于數(shù)據(jù)和知識的工業(yè)過程監(jiān)視及故障診斷綜述[J]. 控制與決策, 2010, 25(6): 801-807.
Liu Q, Chai T Y, Zhao L J. Progress of data-driven and knowledge-driven process monitoring and fault diagnosis for industry process[J]. Control and Decision, 2010, 25(6): 801-807.
[4]盧文濤. 基于膠囊網(wǎng)絡(luò)模型過程故障識別的應(yīng)用與研究[D]. 南昌: 華東交通大學(xué), 2020.
Lu Wentao. Application and research of process fault identification based on CapsNet Model[D]. Nanchang: East China Jiaotong University, 2020.
[5]Muralidharan V, Sugumaran V. A comparative study of Na?ve Bayes classifier and Bayes net classifier for fault diagnosis of monoblock centrifugal pump using wavelet analysis[J]. Applied Soft Computing, 2012, 12(8): 2023-2029.
[6]Yang Y, Yu D, Cheng J. A fault diagnosis approach for roller bearing based on IMF envelope spectrum and SVM[J]. Measurement, 2007, 40(9-10): 943-950.
[7]賀巖松, 黃毅, 徐中明, 等. 基于小波奇異熵與SOFM神經(jīng)網(wǎng)絡(luò)的電機(jī)軸承故障識別[J]. 振動與沖擊, 2017, 36(10): 217-223.
He Y S, Huang Y, Xu Z M, et al. Motor bearing fault identification based on wavelet singular entropy and SOFM neural network[J]. Journal of Vibration and Shock, 2017, 36(10): 217-223.
[8]Verstraete D, Ferrada A, Drognett E L, et al. Deep learning enabled fault diagnosis using time-frequency image analysis of rolling element bearings[J]. Shock & Vibration, 2017, 2017: 1-17.
[9]He Z, Shao H, Ding Z, et al. Modified deep autoencoder driven by multisource parameters for fault transfer prognosis of aeroengine[J]. IEEE Transactions on Industrial Electronics, 2021, 69(1): 845-855.
[10]胡越, 羅東陽, 花奎, 等. 關(guān)于深度學(xué)習(xí)的綜述與討論[J]. 智能系統(tǒng)學(xué)報, 2019, 14(1): 1-19.
Hu Y, Luo D Y, Hua K, et al. Overview on deep learning[J]. Journal of Intelligent Systems, 2019, 14(1): 1-19.
[11]邵海東, 張笑陽, 程軍圣, 等. 基于提升深度遷移自動編碼器的軸承智能故障診斷[J]. 機(jī)械工程學(xué)報, 2020, 56(9): 84-90.
Shao H D, Zhang X Y, Cheng J S, et al. Intelligent fault diagnosis of bearings using enhanced deep transfer auto-encoder[J]. Journal of Mechanical Engineering, 2020, 56(9): 84-90.
[12]曲建嶺, 余路, 袁濤, 等. 基于一維卷積神經(jīng)網(wǎng)絡(luò)的滾動軸承自適應(yīng)故障診斷算法[J]. 儀器儀表學(xué)報, 2018, 39(7): 134-143.
Qu J L, Yu L, Yuan T, et al. Adaptive fault diagnosis algorithm for rolling bearings based on one-dimensional convolutional neural network[J]. Chinese Journal of Scientific Instrument, 2018, 39(7): 134-143.
[13]Gan M, Wang C, Zhu C. Construction of hierarchical diagnosis network based on deep learning and its application in the fault pattern recognition of rolling element bearings[J]. Mechanical Systems & Signal Processing, 2016, 72-73: 92-104.
[14]Sun W, Shao S, Zhao R, et al. A sparse auto-encoder-based deep neural network approach for induction motor faults classification[J]. Measurement, 2016, 89: 171-178.
[15]張西寧, 向宙, 唐春華. 一種深度卷積自編碼網(wǎng)絡(luò)及其在滾動軸承故障診斷中的應(yīng)用[J]. 西安交通大學(xué)學(xué)報, 2018, 52(7): 1-8.
Zhang X N, Xiang Z, Tang C H. A deep convolutional auto-encoding neural network and its application in bearing fault diagnosis[J]. Journal of Xi'an Jiaotong University, 2018, 52(7): 1-8.
[16]Laha S K. Enhancement of fault diagnosis of rolling element bearing using maximum kurtosis fast nonlocal means denoising[J]. Measurement, 2017, 100: 157-163.
[17]Shao H, Li W, Xia M, et al. Fault diagnosis of a rotor-bearing system under variable rotating speeds using two-stage parameter transfer and infrared thermal images[J]. IEEE Transactions on Instrumentation and Measurement, 2021, 70: 3524711.
[18]Sabour S, Frosst N, Hinton G E. Dynamic routing between capsules[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach, CA, USA, 2017: 3859-3869.
[19]楊平, 蘇燕辰, 張振. 基于卷積膠囊網(wǎng)絡(luò)的滾動軸承故障診斷研究[J]. 振動與沖擊, 2020, 39(4): 55-62.
Yang P, Su Y C, Zhang Z. A study on rolling bearing fault diagnosis based on convolutional capsule network[J]. Journal of Vibration and Shock, 2020, 39(4): 55-62.
[20]Chen Y. Convolutional neural network for sentence classification[D]. Waterloo: University of Waterloo, 2015.
[21]Szegedy C, Ioffe S, Vanhoucke V, et al. Inception-v4, inception-ResNet and the impact of residual connections on learning[C]//Proceedings of the 31st AAAI Conference on Artificial Intelligence. Palo Alto, CA, USA, 2017: 4278-4284.
[22]Bahdanau D, Cho K H, Bengio Y. Neural machine translation by jointly learning to align and translate[C]//3rd International Conference on Learning Representations. San Diego, United States , 2015: 1-15.
[23]Hu J, Shen L, Sun G, et al. Squeeze-and-excitation networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, 42(8): 2011-2023.
[24]Szegedy C, Vanhoucke V, Ioffe S, et al. Rethinking the Inception architecture for computer vision[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, NV, USA, 2016: 2818-2826.
[25]王賀兵, 張春梅. 基于非對稱卷積-壓縮激發(fā)-次代殘差網(wǎng)絡(luò)的人臉關(guān)鍵點檢測[J]. 計算機(jī)應(yīng)用, 2021, 41(9): 2741-2747.
Wang H B, Zhang C M. Facial detection based on ResNet with asymmetric convolution and squeeze excitation[J]. Journal of Computer Applications, 2021, 41(9): 2741-2747.
[26]楊宏業(yè). 卷積神經(jīng)網(wǎng)絡(luò)的多光譜遙感圖像超分辨率重建[D]. 徐州: 中國礦業(yè)大學(xué), 2020.
Yang Hongye. Multispectral remote sensing images super-resolution based on convolutional neural network[D]. Xuzhou: China University of Mining and Technology, 2020.
[27]王婷.基于LSTM深度網(wǎng)絡(luò)的電力負(fù)荷預(yù)測[D]. 太原: 山西大學(xué), 2020.
Wang Ting. Power load forecasting based on LSTM deep network[D]. Taiyuan: Shanxi University, 2020.
[28]Zhao W, Ye J, Yang M, et al. Investigating capsule networks with dynamic routing for text classification[C]//2018 Conference on Empirical Methods in Natural Language Processing. Brussels, Belgium, 2018: 3110-3119.
[29]Abadi M, Agarwal A, Barham P,et al. Tensorflow: large-scale machine learning on heterogeneous distributed systems[J]. arXiv:1603.04467, 2016.
[30]袁壯, 董瑞, 張來斌, 等. 深度領(lǐng)域自適應(yīng)及其在跨工況故障診斷中的應(yīng)用[J]. 振動與沖擊, 2020, 39(12): 281-288.
Yuan Z, Dong R, Zhang L B, et al. Deep domain adaptation and its application in fault diagnosis across working conditions[J]. Journal of Vibration and Shock, 2020, 39(12): 281-288.
[31]Shao S, McAleer S, Yan R, et al. Highly accurate machine fault diagnosis using deep transfer learning[J]. IEEE Transactions on Industrial Informatics, 2019, 15(4): 2446-2455.
[32]趙小強(qiáng), 梁浩鵬. 使用改進(jìn)殘差神經(jīng)網(wǎng)絡(luò)的滾動軸承變工況故障診斷方法[J]. 西安交通大學(xué)學(xué)報, 2020, 54(9): 23-31.
Zhao X Q, Liang H P. Fault diagnosis method of rolling bearing under variable condition using improved residual neural network[J]. Journal of Xi'an Jiaotong University, 2020, 54(9): 23-31.
[33]Zhao R, Wang D, Yan R, et al. Machine health monitoring using local feature-based gated recurrent unit networks[J]. IEEE Transactions on Industrial Electronics, 2018, 65(2): 1539-1548.
Improved convolutional capsule network method for rolling bearing fault diagnosis
Abstract: At present, many rolling bearing fault diagnosis methods based on convolutional networks have the disadvantages of poor diagnosis effect and poor generalization ability under the influence of noise signals and load variations. Aiming at these problems, an improved convolutional capsule network fault diagnosis method of rolling bearing under variable operating conditions is proposed. This method designs a multi-scale asymmetric convolution module, in which asymmetric convolution layers of different scales to extract features from the input data to maximize the extraction of feature information in the data and reduce the number of parameters effectively. In this module, the channel attention mechanism is introduced to better extract useful channel features and improve the feature extraction ability of the method in this paper. By improving the fully connected layer in the network to the fully connected layer of the capsule, the capsule can avoid the loss of characteristic information in the space in the process of outputting vector feature information. Case Western Reserve University bearing dataset and Southeast University gearbox dataset are used to verify the diagnostic performance of the proposed method and compare with other deep learning methods. The experimental results show that the proposed method has a better generalization and performance.
Key words: fault diagnosis;rolling bearing;capsule network;asymmetric convolution;feature extraction