彭雪瑩,江永全,楊 燕
(西南交通大學計算機與人工智能學院,成都 611756)
(?通信作者yqjiang@swjtu.edu.cn)
為了保證列車服役的安全,預防故障的發(fā)生,減少安全隱患,符合發(fā)展需求的故障診斷新技術(shù)的研究刻不容緩,使用深度學習方法進行軸承故障診斷已經(jīng)有了很多的成果。Luo等[1]提出了一種基于Fisher 的自適應深度卷積神經(jīng)網(wǎng)絡(Adaptive Fisher-based Deep Convolutional Neural Network,AFDCNN)方法用于小樣本的故障診斷,可以自適應地優(yōu)化模型參數(shù),解決樣本數(shù)量少時深度卷積神經(jīng)網(wǎng)絡診斷精度下降的問題。Zhang 等[2]開發(fā)了一種具有全局屬性的并行長短時記憶(Long Short-Term Memory,LSTM)網(wǎng)絡,以解決長序列中LSTM 可能導致不正確的特征提取的問題。Wang 等[3]提出了一種將加速度計和傳聲器采集到的多模態(tài)傳感器信號進行融合的方法,從原始振動信號和聲學信號中提取特征,并利用1D 卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)進行融合。李益兵等[4]研究了基于粒子群優(yōu)化(Particle Swarm Optimization,PSO)的深度置信網(wǎng)絡(Deep Belief Network,DBN),通過PSO 優(yōu)選DBN 結(jié)構(gòu),用最優(yōu)的DBN 模型提取故障特征來進行診斷。
然而在實際應用中,工作負荷的變化以及工作環(huán)境噪聲等因素十分容易對結(jié)果產(chǎn)生干擾,而且由于故障會引起機器故障甚至是難以挽回的事故,因此故障是不被允許的,軸承服役期間的真實服役故障數(shù)據(jù)難以獲取,導致真實的服役故障數(shù)據(jù)較為缺乏。由于深度學習模型往往需要大量的數(shù)據(jù)進行充分訓練,服役故障數(shù)據(jù)稀缺成了深度學習方法在軸承服役故障診斷上應用的瓶頸。但由于不同設備對故障的容忍度不同,雖然無法獲得高鐵軸承服役故障數(shù)據(jù),但是電動機的軸承故障數(shù)據(jù)獲取相對容易。然而,不同數(shù)據(jù)的分布是不同的,很難保證在一個數(shù)據(jù)集上訓練的模型能很好地在另一個數(shù)據(jù)集上工作。同時,不同類型的組件之間、不同工作條件下收集的故障數(shù)據(jù)都存在較大差異,這些原因都阻礙了軸承服役故障診斷研究的快速發(fā)展。
遷移學習為上述問題提供了解決方案,它能把源域的知識遷移到目標域,使其在目標領域能發(fā)揮出更好的學習效果。通常情況下,軸承服役故障數(shù)據(jù)比較稀少,收集真實的故障數(shù)據(jù)也缺乏標簽,想要直接學習服役故障的知識比較困難。遷移學習能利用其他容易獲取的數(shù)據(jù)在數(shù)據(jù)充足情況下將學習到的知識遷移到數(shù)據(jù)量少但與其相似的任務中。同時從零開始建立模型是復雜耗時的,遷移學習可以提高學習效率。針對不同工作條件下工作的軸承,Wang 等[5]通過整合可變形的CNN、深度長短時記憶(Deep Long Short-Term Memory,DLSTM)網(wǎng)絡和稠密層來構(gòu)建模型,并實施遷移學習策略,從而能夠識別新工況下的軸承故障類型。Wu 等[6]提出了一種基于元學習的遷移學習方法在不同工作條件之間遷移。Chen等[7]提出了一種新的帶有約束和輔助分類器的Atrous 卷積深度Inception 網(wǎng)絡(Deep Inception Net with Atrous Convolution,ACDIN)故障診斷模型,以解決人為模擬損壞的軸承數(shù)據(jù)和自然損壞軸承數(shù)據(jù)之間特征不同的問題,取得了較高的準確度。陳仁祥等[8]設計的改進TrAdaBoost 多分類算法從樣本中只選取對任務最有用的知識,使用不同的調(diào)整權(quán)重的方式,重用有用的數(shù)據(jù)樣本,實現(xiàn)知識遷移。Li 等[9]設計了兩種微調(diào)參數(shù)的方式,即微調(diào)最后一層和微調(diào)所有層來驗證遷移學習在不同的軸承工作條件下的性能。Kang 等[10]設計了深度特征遷移方法去診斷不同工作條件下的故障,減小了源域和目標域之間樣本特征的分布差異,減少了子空間變換操作。
針對軸承服役故障診斷困難的問題,本文設計了基于圖卷積網(wǎng)絡的遷移學習(Transfer Learning with Graph Convolutional Network,GCNTL)軸承服役故障診斷模型,從數(shù)據(jù)充足的人工模擬損傷故障數(shù)據(jù)中學習故障知識,并遷移到真實的服役故障上,提高服役故障的診斷準確率。本文的主要工作如下:
1)設計了一種GCNTL 軸承服役故障診斷模型,通過學習數(shù)據(jù)充足的人工模擬損傷故障知識,診斷真實的服役故障;
2)利用小波變換對原始振動信號提取時頻特征,通過圖卷積層提取數(shù)據(jù)特征,并使用Wasserstein 距離度量不同數(shù)據(jù)分布之間的差異;
3)應用不同數(shù)據(jù)集的實驗結(jié)果驗證本文提出的GCNTL軸承服役故障診斷模型可以有效地從人工模擬故障遷移到服役故障,同時能在軸承不同工作條件之間遷移。
小波變換作為一種時頻分析方式,滿足時頻信號分析的需求,能夠?qū)r間和頻率執(zhí)行局部化精細剖析,通過定位時間和頻率,在不同的條件下分別放大時間和頻率的相關(guān)細節(jié),提取信號的時頻特征,可以減小甚至消除所提取的不同特征之間的相關(guān)性。小波變換克服了窗口尺寸不能隨著頻率變化而變換、且不具備自適應能力的缺點,能夠提供一個隨頻率變化的時頻窗口,特別適用于不穩(wěn)定信號的分析。
假設Z(t)是輸入信號,連續(xù)小波變換可以表示為:
其中:a為伸縮因子,表示依賴頻率的伸縮;τ為時間平移因子;ψ(?)為小波母函數(shù),是滿足一定條件的基本小波函數(shù)。小波函數(shù)具有多樣性,可以根據(jù)信號點的特征推導或構(gòu)建,小波函數(shù)對相同問題的解析會產(chǎn)生截然不同的效果,具有很強的靈活性。
GCN 將CNN 從低維的規(guī)則網(wǎng)格推廣到了高維不規(guī)則圖數(shù)據(jù)上,GCN從卷積方式上可以分為兩種:空間域卷積和譜域卷積。譜域卷積主要借助圖譜理論來實現(xiàn)非規(guī)則圖上的卷積操作[11],主要通過計算圖的拉普拉斯矩陣的特征值和特征向量來探索圖的性質(zhì)。具體來說,圖上的卷積定義為:
其中:輸入信號x∈RN;U是歸一化圖拉普拉斯矩陣L的特征向量組成的矩陣;Θ表示被傅里葉域的θ∈RN參數(shù)化的濾波器,Θ=Θ(Λ)∈RN×N,是一組可以學習的參數(shù);Λ是L的特征值組成的對角矩陣。
然而在大圖中計算L的特征值分解的復雜度很高,導致很難大規(guī)模擴展圖,且無法在不同的圖之間共享參數(shù)[12]。為了解決這個問題,Hammond 等[13]設計了用切比雪夫多項式Tk(x)的第k階的截斷展開來近似Θ(Λ)的ChebNet:
為了在減少計算量的同時不影響卷積效果,采用局部一階近似的方法[14]來限制卷積操作,即令K=1,并進一步近似λmax≈2,網(wǎng)絡在訓練過程中能適應這種處理方式,則式(4)能表示為更為簡潔的式子:
進一步限制參數(shù)數(shù)量有利于解決過度擬合并能夠最大限度地減少每層的運算次數(shù),用單一的參數(shù)θ=θ0=-θ1來簡化式(5):
GCN中的卷積層的傳播規(guī)則表示為:
其中:σ(?)是激活函數(shù);代表第l層的輸出;W為權(quán)值矩陣。
Wasserstein 距離(WD)是衡量兩個概率分布之間距離的方法[15],該距離在度量空間(M,ρ)上定義,ρ(z,y)表示集合M中兩個樣本z和y的距離函數(shù)。兩個概率分布P1(z)和P2(y)之間的Wasserstein距離定義為:
其中:Γ(P1,P2) 在集合M×M內(nèi),所有以P1(z)和P2(y)為邊緣分布的聯(lián)合分布的集合;inf表示對表達式取最大下界。
Wasserstein 距離最大的優(yōu)勢在于,在兩個分布完全沒有任何交集時或交集非常小時,Wasserstein 距離仍然能夠反映兩個分布的遠近,提供更為平滑的結(jié)果用于訓練過程中梯度下降法的參數(shù)更新。
GCNTL 軸承服役故障診斷模型主要分為三個部分:特征提取器、分類器和判別器,如圖1 所示。數(shù)據(jù)的輸入分為充足的源域數(shù)據(jù)和較少的目標域數(shù)據(jù):源域數(shù)據(jù)的數(shù)據(jù)量大,有標簽;目標域數(shù)據(jù)的數(shù)據(jù)量少,沒有標簽。數(shù)據(jù)輸入網(wǎng)絡前都經(jīng)過小波變換生成時頻圖。
圖1 GCNTL軸承服役故障診斷模型Fig.1 GCNTL bearing service fault diagnosis model
特征提取器主要作用是從源域和目標域數(shù)據(jù)中提取可傳遞的特征。特征提取器對特征的提取能力直接影響分類器和判別器的工作,因此特征提取器的特征提取能力是決定模型效果的重要因素之一。
模型的特征提取器由三層GCN 層和一層全連接層構(gòu)成,每層GCN 后由ReLU 作為激活函數(shù),映射神經(jīng)元的輸出,GCN層的傳播規(guī)則見式(7)。特征提取器中的全連接層用于整合學習到的特征信息并對特征進行降維。
模型在特征提取器上的目的是尋找一個特征空間,學習源域數(shù)據(jù)和目標域數(shù)據(jù)在特征空間的特征映射,減小源域數(shù)據(jù)與目標域數(shù)據(jù)之間的數(shù)據(jù)分布差異,因此,模型在特征提取器上的目標是學習域的不變特征。
分類器的主要作用是在模型訓練和預測過程中對特征提取器提取的特征進行分類,分類器的性能不僅取決于自身的特征提取能力,也與特征提取器提取的特征準確與否息息相關(guān)。
GCNTL 軸承服役故障診斷模型中的分類器由兩層全連接層組成,將特征提取器學習到的特征進行降維并映射到樣本空間,其中應用Dropout隨機丟棄部分神經(jīng)元。分類器最后一層的神經(jīng)元個數(shù)為故障的類別數(shù),其結(jié)果表示故障的標簽。
模型要根據(jù)特征提取器學習到的特征,識別軸承的健康狀況,因此,模型在分類器上的目標是減少源域數(shù)據(jù)上的故障分類錯誤,表現(xiàn)為最小化源域數(shù)據(jù)集上的交叉熵損失函數(shù)來最小化分類損失。
判別器的作用主要是通過度量源域和目標域經(jīng)過特征提取器提取的特征之間的分布差異,使得分布之間的差異最小化,從而使獲得的源域和目標域之間的特征具有較小的跨域差異。
判別器由三層全連接層組成,每一層全連接層后使用ReLU作為激活函數(shù)。模型中,源域和目標域之間的數(shù)據(jù)分布差異由Wasserstein 距離來衡量,而最大化判別器的損失可以近似Wasserstein距離[15],判別器的損失表示為式(9)。
其中:ns、nt分別是源域和目標域的樣本數(shù);Fg(?)、Fd(?)分別是特征提取器和判別器計算的特征表示。為了防止梯度消失或梯度爆炸,需要給優(yōu)化目標添加梯度懲罰Lgrad=,h是在源域和目標域上定義的梯度。因此Wasserstein距離可以表示為:
其中:λ作為平衡系數(shù)控制梯度懲罰的影響;θw為判別器權(quán)重參數(shù)。模型在判別器上的優(yōu)化目標是減小源域和目標域之間的數(shù)據(jù)分布差異,即最小化Wasserstein距離。
結(jié)合模型在分類器和判別器上的優(yōu)化目標,模型的最終優(yōu)化目標可以寫成:
其中:超參數(shù)γ控制域適應的強度;Lc表示分類器的損失函數(shù);θg、θc分別為特征提取器和分類器的權(quán)重參數(shù)。模型的詳細步驟在算法1中給出。
算法1 GCNTL軸承服役故障診斷算法。
輸入 源域小波變換時頻圖Xs,目標域小波變換時頻圖Xt,鄰接矩陣A;
輸出 軸承服役故障診斷的準確率。
①初始化超參數(shù),如平衡系數(shù)λ、學習率lr,隨機初始化網(wǎng)絡參數(shù),如權(quán)重矩陣W、偏差b;
②計算源域數(shù)據(jù)和目標域數(shù)據(jù)經(jīng)過特征提取器后的特征表示Fg(xs)和Fg(xt);
③根據(jù)式(10)計算Wasserstein 距離,并通過模型反向傳播更新判別器參數(shù);
④計算分類的交叉熵損失Lc,并通過模型反向傳播更新分類器參數(shù);
⑤根據(jù)式(11)計算模型損失,其中λ=0,梯度懲罰不應指導特征表示過程,并通過模型反向傳播更新特征提取器參數(shù);
⑥轉(zhuǎn)到步驟②繼續(xù)執(zhí)行,直至網(wǎng)絡收斂或達到預先設定的迭代次數(shù)。
為了驗證GCNTL 軸承服役故障診斷模型的有效性,在4種不同的軸承故障數(shù)據(jù)集上進行測試。
凱斯西儲大學(Case Western Reserve University,CWRU)軸承數(shù)據(jù)集是從CWRU 軸承數(shù)據(jù)中心的實驗平臺[16]中收集的,該實驗平臺使用電動機進行實驗,從電動機軸承測量振動數(shù)據(jù)。CWRU 軸承數(shù)據(jù)集實驗中使用的軸承是深溝球軸承,所有故障都是人為放電加工的模擬損傷,損傷位置分別在內(nèi)圈、外圈和滾動體滾道上。軸承故障數(shù)據(jù)有兩種采樣頻率,即12 kHz 和48 kHz,在驅(qū)動端軸承或風扇端軸承上采樣獲得。每種條件下電動機都有4 種負載條件,分別為1 hp、2 hp、3 hp和無負載。該數(shù)據(jù)集的軸承有4 種狀態(tài),分別為正常狀態(tài)(Normal Condition,NC)、滾動體故障(Ball Fault,BF)、內(nèi)圈故障(Inner-Race Fault,IF)和外圈故障(Outer-Race Fault,OF),并且每種故障都有至少3 種不同的故障直徑,分別為0.007 in(1 in=2.54 cm)、0.014 in和0.021 in。
智能維護系統(tǒng)(Intelligent Maintenance System,IMS)軸承數(shù)據(jù)集是從智能維護中心的實驗平臺[17]上收集的,該實驗平臺在軸上安裝了4 個雙列軸承,軸由電動機驅(qū)動,旋轉(zhuǎn)速度為2 000 r/min,通過彈簧設備提供6 000 磅(1 磅=0.453 592 4 kg)的徑向負載。數(shù)據(jù)以20 kHz 的采樣頻率采樣,每個軸承有X向和Y向兩個采樣通道,共8 個采樣通道,包含滾動軸承全生命周期的健康狀態(tài),軸承3 生命周期結(jié)束后的故障形式表現(xiàn)為IF,軸承4 生命周期結(jié)束后的故障形式表現(xiàn)為外圈滾動體復合故障(Outer-race and Ball Compound Fault,OBCF)。
2009 故障預測與健康管理(Prognostics Health Management,PHM)軸承數(shù)據(jù)集是PHM 數(shù)據(jù)挑戰(zhàn)賽[18]提供的工業(yè)齒輪箱數(shù)據(jù),包含3 個軸、6 個軸承、2 個正齒輪和2 個斜齒輪。軸的速度有5 種,分別是30 Hz、35 Hz、40 Hz、45 Hz 和50 Hz,分別在高負載和低負載兩種負載方式下工作。數(shù)據(jù)是在66.7 kHz 的采樣頻率下收集的,由2 個加速度計通道和1個轉(zhuǎn)速傳感器通道組成。故障部位有軸、齒輪和軸承,實驗只選取故障部位在軸承的故障的第一通道數(shù)據(jù)。軸承的狀態(tài)為NC、BF、IF、OBCF 和外圈滾動體內(nèi)圈復合故障(Outer-race and Ball and Inner-Race Compound Fault,OBICF)。
帕德博恩大學(Paderborn University,PU)軸承數(shù)據(jù)集[19]包含了人為損傷和實際損傷兩種軸承故障數(shù)據(jù),人為損壞通過放電加工、鉆孔、手動電雕刻三種方式模擬損壞,實際損壞由加速壽命測試設備產(chǎn)生,表現(xiàn)為點蝕或塑性變形。軸承以64 kHz 的采樣頻率采樣,一共設置了4 種不同的工作條件。根據(jù)設備的損壞深度分為三級:損壞深度大于4.5 mm 為3級,大于2 mm、小于等于4.5 mm 為2 級,小于等于2 mm 為1級。該數(shù)據(jù)集的軸承有五種狀態(tài),分別為NC、BF、IF、OF 和外圈內(nèi)圈復合故障(Outer-race and Inner-race Compound Fault,OICF),除NC外,每種故障有不同的損傷級別。
數(shù)據(jù)輸入模型前通過小波變換將原始振動信號以256 個采樣點為單位生成同時具有時域和頻域的特征的時頻圖,利用滑動窗口依次采樣數(shù)據(jù),滑動窗口的步長為128。
為了驗證GCNTL 軸承服役故障診斷模型的能力,設計了人工模擬損傷的軸承故障到軸承服役故障的遷移實驗,實驗任務設計如表1所示。任務1、2、3的源域數(shù)據(jù)來自PU軸承故障數(shù)據(jù)集中的人為損傷故障數(shù)據(jù),在旋轉(zhuǎn)速度1 500 r/min,負載扭矩0.7 N·m,徑向力1 000 N 的條件下,故障類型有NC、IF和OF。任務1、4 的目標域數(shù)據(jù)來自PU 軸承數(shù)據(jù)集的實際損傷故障數(shù)據(jù),在相同工作條件下,故障類型有IF、OF 和OICF;任務4、5、6的源域數(shù)據(jù)CWRU 軸承數(shù)據(jù)集選用以12 kHz的采樣頻率在驅(qū)動端軸承上獲得的數(shù)據(jù),故障類型有NC、BF、IF和OF。
表1 模擬故障到服役故障的遷移任務Tab.1 Transfer task from simulated faults to service faults
在人工模擬損傷的軸承故障到軸承服役故障的遷移實驗中,GCNTL 軸承服役故障診斷模型在表1 中的6 個遷移任務中進行了測試,結(jié)果如表2 所示。表2 中,將模型結(jié)構(gòu)不變的情況下,不使用遷移學習,直接用源域的知識去診斷目標域的結(jié)果作為模型的基準。同時,將MMD和Wasserstein距離作為該模型的不同度量來衡量數(shù)據(jù)分布之間的差異。從表2 中可以看出,不使用遷移學習的結(jié)果較差,從源域?qū)W習的知識不能直接作為目標域的知識,且數(shù)據(jù)之間差異越大,模型越難遷移到目標域上。實驗驗證了該模型能夠從人工模擬損傷的軸承故障遷移到軸承服役故障,并且在大多數(shù)情況下,以Wasserstein 距離作為衡量數(shù)據(jù)之間的分布差異的模型診斷結(jié)果略好于MMD作為度量準則的模型。
表2 模型在軸承服役故障上的診斷準確率 單位:%Tab.2 Diagnosis accuracy of model on bearing service faultunit:%
為驗證GCNTL 軸承服役故障診斷模型能在不同條件之間進行遷移,在兩個數(shù)據(jù)集上設置了6 個不同的工作條件。在PU 軸承數(shù)據(jù)集上設計的不同條件之間的遷移實驗任務如表3所示。在CWRU 軸承數(shù)據(jù)集上設計的不同條件之間的遷移實驗任務如表4所示。
在不同工作條件之間的遷移實驗中,GCNTL 軸承服役故障診斷模型在表3和表4的6個遷移任務中的診斷結(jié)果如表5所示。從表5 實驗結(jié)果可知,該模型在PU 軸承數(shù)據(jù)集不同條件的3 個遷移任務和CWRU 軸承數(shù)據(jù)集不同條件的3 個遷移任務中都能在不同的工作條件之間進行遷移,驗證了該模型也能從一個工作條件遷移到另一工作條件中,可以用于診斷不同類型的組件和不同工作條件下的軸承故障。
表3 PU軸承數(shù)據(jù)集上的遷移任務Tab.3 Transfer task on PU bearing dataset
表4 CWRU軸承數(shù)據(jù)集上的遷移任務Tab.4 Transfer task on CWRU bearing dataset
表5 模型在不同工作條件之間遷移的診斷準確率單位:%Tab.5 Diagnosis accuracy of model transfer between different working conditions unit:%
為進一步驗證GCNTL 軸承服役故障診斷模型的有效性,在完全相同的任務和數(shù)據(jù)集上,將該模型與其他6 種故障診斷模型進行了比較,這6 種模型分別是:遷移成分分析(Transfer Component Analysis,TCA)[20],基于CNN 的域自適應故障診斷(Domain Adaptation in Fault Diagnosis,DAFD)[21],基于參數(shù)的遷移學習(CNN-fine-tune)[9],域?qū)股窠?jīng)網(wǎng)絡(Domain-Adversarial Neural Network,DANN)[22],深度卷積遷移學習網(wǎng)絡(Deep Convolutional Transfer Learning Network,DCTLN)[23],以及基于特征的遷移神經(jīng)網(wǎng)絡(Feature-based Transfer Neural Network,F(xiàn)TNN)[24],每個模型分別對表1 的6個任務進行了10次測試并取平均值,結(jié)果如表6所示。
表6 不同模型在6個任務上的診斷準確率 單位:%Tab.6 Diagnosis accuracies of different models on 6 tasks unit:%
根據(jù)表6 的結(jié)果可知,由于源域和目標域數(shù)據(jù)分布差異較大,TCA 和DAFD 依賴于某些手工提取的特征,從模擬損傷的故障遷移到服役故障的效果較差;CNN-fine-tune 模型通過調(diào)整模型參數(shù)實現(xiàn)遷移,數(shù)據(jù)分布之間的差異越大,效果越差;DANN 引入了對抗訓練使得源特征分布和目標特征分布趨于一致;DCTLN 使用了較多的CNN 層,參數(shù)量較大;FTNN采用了偽標簽學習將預測的標簽分布到目標域中的未標記樣本上,用來輔助分類器訓練。DANN、DCTLN、FTNN 和本文提出的GCNTL軸承服役故障診斷模型在6個任務上的診斷效果相當,在任務5 上DCTLN 取得了最好的遷移效果,而在其余5個任務上GCNTL模型略好于其他遷移學習模型,GCNTL模型在6 個任務上的平均診斷準確率也略高于其他遷移學習模型。
綜上所述,GCNTL 軸承服役故障診斷模型具有診斷軸承服役故障的能力,能夠從人工模擬損傷的故障上學習特征表示并遷移到服役故障上,同時能在不同工作條件的軸承故障之間遷移。
針對軸承服役故障診斷難的問題,本文提出了GCNTL 軸承服役故障診斷模型,從數(shù)據(jù)充足的人工模擬損傷故障數(shù)據(jù)中學習故障知識,并遷移到真實的服役故障上,提高服役故障的診斷準確率。首先通過將源域和目標域的原始振動信號由小波變換轉(zhuǎn)換為同時具有時間和頻率信息的時頻圖,輸入到GCN 中進行學習;然后計算源域數(shù)據(jù)和目標域數(shù)據(jù)分布之間的Wasserstein距離,通過最小化數(shù)據(jù)分布差異,構(gòu)建了一個能診斷軸承服役故障的故障診斷模型。實驗結(jié)果表明,本文的GCNTL 軸承服役故障診斷模型具有診斷軸承服役故障的能力,同時,該模型也能從一個工作條件遷移到另一工作條件。