佟 博,劉 韜,劉 暢
(昆明理工大學 機電工程學院,云南 昆明 659500)
在故障診斷領域中,對機械系統(tǒng)運行狀況的監(jiān)控具有合理安排生產計劃、提升生產效率等很多重要意義。據統(tǒng)計,軸承故障在旋轉機械故障的故障類別中超過了30%。因此,對軸承進行故障診斷的相關算法研究以提高機械系統(tǒng)故障診斷準確率和診斷效率非常重要[1-4]。但是在實際應用的過程中,因為不同工作環(huán)境之間的差異等原因,一臺設備上的數據無法簡單遷移到另一臺上使用。因此,在實際生產中,往往會面臨只有正常工作的數據,而缺乏失效階段數據的情況[5]。針對這種情況,國內外學者做了大量研究,例如假設符合軸承壽命符合威布爾分布[6-7],劉海濤等[8]得到了可靠性參數的 Bayes 估計等等。但是上述方法都是基于統(tǒng)計模型,不得不面對小樣本、準確的是小分部難以估計等問題。
考慮到以上因素,本文將生成對抗網絡(Generative Adversarial Networks,GAN)模型引入故障診斷領域。Goodfellow等[9-10]最早提出生成對抗網絡框架,該模型有著強大的建模能力,可以捕捉到高維、難以追蹤的數據分布并進一步運用到圖像分割[11]、視頻預測[12]、風格遷移等領域[13]。Martin A等[14-15]在原始框架上通過改進損失函數、優(yōu)化算法等,解決了GAN訓練不穩(wěn)定、梯度消失等問題。綜上所述,本文結合傳統(tǒng)的振動分析技術,為故障診斷領域一直存在的數據缺失問題提供了一種新的解決思路。
生成對抗網絡由一個生成器網絡G與一個判別器網絡D構成。生成器與判別器的網絡結構皆為多層感知器。生成對抗網絡的目的是學習到真實數據的分布Pdata,為了學習該分布,給定真實數據樣本集Xs{x1,…,xn}。設生成器的輸入數據為基底信號,從其已知分布Pz(例如高斯分布)中進行隨機采樣得到數據集Z{z1,…,zm},接下來將其映射到數據空間G(z,θg),這里的G是一個以θg作為參數的多層感知網絡構成的生成模型。此外,定義一個判別模型D(x,θd)用來判斷輸入的數據是來自生成模型還是真實數據,D的輸出為x是訓練數據的概率。網絡優(yōu)化過程可以簡單描述為一個“二元極大極小”問題。根據原始論文,生成模型G與判別模型之間的對抗關系可以如下表達
Ez~Pz (z){log[1-D(G(Z))]}
(1)
其中,Pdata表示目標數據的數據分布;PZ是基底信號的數據分布;G(Z)表示生成模型生成數據。即表示判別器的訓練集取自真實數據的分布和生成數據的分布。其判別器的損失函數表示為[16]
JD=-Ex~Pdata (x)[logD(x) ]-Ez~Pz(z){log[1-D(G(Z))]}
(2)
理想情況下,判別器可以完全分辨出訓練樣本數據與生成數據,即判別器D的輸出為0或1,真實數據為1,生成數據為0。
生成器的損失函數即為判別器的相反
JG=-JD
(3)
實際應用時,生成器的損失函數經常采用為
JG=-Ez~pz(z){logD[G(Z)]}
(4)
值得說明的是,D和G的需要交替優(yōu)化,在訓練數據有限時,先進性判別器D的優(yōu)化會導致過擬合的現象產生,從而使模型無法收斂。
在實際工程應用中進行軸承時,會面臨以下問題:
(1)當采用實驗室人造故障并模擬真實工況采集數據時,真實故障與實驗室人造故障存在客觀差異。同時,某些故障也無法通過實驗室制造;
(2)當采用機理分析的方法使用相關函數人為生成軸承振動的仿真信號時,仿真信號也與真實故障信號存在差異。在進行故障診斷或性能評估時,仿真信號與真實信號相比往往缺少最關鍵軸承失效階段的樣本數據。這是由多種原因引起的,包括信噪比的選擇、部分參數的調校等。目前對于最接近真實信號的噪音信噪比問題無明確的理論基礎,在實際生產中通常依靠人為經驗。以此為基礎的數據,無論是用以訓練診斷的判別模型還是性能評估模型,都不能提供有力的數據支撐。
本文引入生成對抗網絡后,生成器產生的生成信號結合仿真信號和基底信號的特性,即同時具有故障信號的特征頻率、沖擊和輸入的正常信號等特征,在對比兩種方式產生的人造信號時會更像真實信號。
為解決上文提到的問題,在基于軸承振動信號的故障診斷領域引入GANs,為故障診斷模型提供所需的數據支撐。
以辛辛那提大學的軸承全壽命振動數據為例,將軸承全壽命數據的早期正常工況下的數據作為生成器G的輸入數據,訓練樣本數據則采用人造仿真信號。其目的在于,以早期的正常工況信號為基底,向軸承仿真故障信號進行映射,在訓練生成器G的過程中,一方面將原始工況下的機械特性保留在生成信號中,另一方面則在映射過程中加入該軸承故障時的故障特性,從而將仿真信號與真實的機械特性相結合,最終得到比仿真信號更加真實的故障信號。
為避免名詞混亂及結合故障診斷領域的稱呼習慣,在接下來的相關工作闡述中,將輸入生成器的數據Z稱為基底信號;生成器生成的數據稱為生成信號;作為“真”信號與生成信號一起作為判別器訓練集的是使用函數生成的人造仿真信號,稱為仿真信號;真實信號表示辛辛那提大學的軸承全壽命實驗信號。
2.3.1 網絡結構
整體生成對抗網絡,由兩部分組成,一部分是生成器模型,一部分是判別器模型。生成器模型包括一個輸入層、一個隱層和一個輸出層。生成器模型同樣包括一個輸入層、一個隱層和一個輸出層,二者通過生成器的最后一層和分類器的第一層連接在一起,共同組成生成對抗網絡,如圖1所示。
生成模型的輸入層輸入基底信號,在早期的GANs模型中,輸入信號取白噪聲,同隱層及輸出層全連接。
2.3.2 模型輸入輸出
結合實驗要求,本文的實驗數據有辛辛那提全壽命實驗數據及以仿真信號。其中,基底信號為軸承全壽命數據正常階段的數據,即數據集Z;仿真信號作為分類器的判定對比信號,即Xs,二者均是單個樣本為1×870的向量。而Xfake作為生成器的輸出結果也是一個1×870的向量。
本文研究所需得到的是訓練完畢的生成器生成的數據Xfake。考慮到模型訓練時間成本和最終結果等因素,通過實驗選取輸入生成器的Z和輸入分類器的Xs的數據點長度截取為870個數據點的時域振動數據。
2.3.3 模型超參數確定
GANs模型中的超參數主要包括模型結構參數迭代次數等,這些參數的取值會直接影響最終的信號生成結果。
(1)結構參數:生成器和分類器均采用3層結構。在原始的GANs中,是從噪聲中映射出圖像信號;但是在故障診斷中,則是從一段真實的正常工況中映射出在該相同工況下的故障狀態(tài)信號。因此,從直觀機理和實驗結果兩方面來考慮,生成器采用3層網絡的結果。同時,3層神經元數不采用逐層增加的方式,即每層神經元數目相同,每層神經元數目均為870個。分類器同樣采用3層結構,第一層和分類器的最后一層重合;第二、三層等差降低神經元數目,也就是第二層采用第一層的半數,即435個神經元,最后一層為1個神經元;
(2)傳遞函數均采用Sigmoid函數,同時為匹配該傳遞函數,學習率采用較小的0.01;
(3)訓練過程中,每次導入訓練樣本個數為5,同時由于本文中生成數據的針對性,其樣本不會太多,因此不采用梯度共享,即每個樣本獨立使用梯度;
(4)訓練過程中,每回合隨機采樣樣本迭代步數設為30步。由于訓練回合數會直接會影響最終的生成效果。因此,經過實驗后發(fā)現在上述參數及實驗數據下,回合數在約3 500次能取得較好生成結果。
在設定訓練終止條件時,從小到大逐步擴大訓練回合數,直到概率分布和真實數據相接近為止。訓練過程如圖2所示,圖2(a)~圖2(e)分別為節(jié)選100、1 000、2 000、3 500、5 000回合時的概率分布對比結果。
式(2)和式(4)定義的損失函數為GANs的目標函數,但是它引起了GANs在訓練時不穩(wěn)定及訓練不收斂的問題,比較顯著的缺陷為以下兩點:(1)誤差函數本質上是對比JS散度,當對比的兩個分布存在不可忽略的重疊時,會最終導致梯度消失等問題出現;(2)訓練的周期越長,生成的結果越逼真,但是無法從計算式中得出訓練應該什么時候停止。
在故障診斷領域中,對于缺陷(1),振動信號的概率分布同為高斯分布,在歸一化后,重疊度很高。對于缺陷(2),在實際應用當中,并不需要將輸入生成器的基底數據通過生成器完全映射成訓練樣本數據,僅需要保留一部分原始的機械系統(tǒng)的特性,所以在此并不能通過誤差等條件判定終止訓練。
本文的實驗數據來源包含辛辛那提大學的全壽命實驗信號和人造仿真信號。
如圖3所示,辛辛那提大學的軸承全壽命實驗工作臺是將4個軸承安裝在軸上。通過皮帶的傳動,帶動連接到軸的AC電動機上的主軸轉動,并將軸的轉速保持恒定在2 000 rpm。通過彈簧機制在軸和軸承上施加6 000 lb的徑向載荷。同時,所有軸承都經過強制潤滑。
本文的實驗軸承型號為Rexnord ZA-2115雙列軸承,該種軸承安裝在軸上。如圖3所示,PCB 353B33高靈敏度石英ICP加速度計安裝在軸承箱上。每個軸承配備兩個加速度傳感器,分別安裝于水平方向(x方向)與豎直方向(y方向)。通過傳感器采集到的信號組成數據集1、數據集2和數據集3。值得說明的是,所有故障都發(fā)生在超過軸承1億轉的設計使用壽命之后,即所有故障都是在超過設計壽命后發(fā)生的。所采集數據的運行時間是從2004年3月4日9點27分46秒運行至2004年4月4日19點01分57秒,最終因為3號軸承外圈故障而終止實驗。軸承全壽命實驗臺架如圖所示。
根據下式生成所需故障及正常工況下軸承振動信號[17]
(5)
其中
Ai=A0cos(2πQt+φA)+CA
(6)
s(t)=e-Btsin(2πfnt+φW)
(7)
合成信號相關參數如表1所示。
表1合成信號參數Table 1.Parameters of simulated signal
其中,上述合成信號的相關參數參照真實信號失效階段仿真而成,一個周期產生的數據點長度為87個數據點。
本文從概率分布、包絡譜、峭度及裕度做全壽命曲線擬合,通過評估上述4個方面指標來比較仿真信號與生成信號與真實信號的接近程度。
需要指出的是,因為在沒有真正得到失效信號時無法預知信號的幅值,因此后續(xù)的包絡譜、概率分布及特征的對比都是在歸一化的條件下進行。
在進行歸一化后,圖4(a)表示真實故障信號和仿真信號的概率分布對比,圖4(b)表示真實故障信號和生成器G生成信號的概率分布對比。
需要指出的是,在采集真實的故障信號時,由于受到車間環(huán)境、機械系統(tǒng)干擾等因素干擾,故存在一定的信噪比。而在仿真信號時,如果直接為其添加噪聲,一方面缺少提示信噪比增加量的參考依據;另一方面,增加的噪聲會使包括峭度在內的很多特征發(fā)生改變,在后續(xù)的性能評估或模式識別模型中都會有不容忽視的消極影響。因此,通過降低信噪比的方式來使仿真信號的概率分布更接近真實信號的做法并不可取。
上述對比說明了生成信號的概率分布與真實信號從概率分布的角度來看很“像”,需再結合包絡譜進一步分析3種信號包絡譜如圖5所示。其中,圖5(a)所示為仿真信號的包絡譜,在圖中可以清晰的發(fā)現設定的外圈故障理論特征頻率為229.9 Hz。同時,由于是仿真信號,整體包絡譜頻率清晰,無可見噪聲和頻率模糊的情況出現。圖5(b)所示為真實軸承全壽命故障信號的包絡譜,其外圈故障時的故障頻率在230 Hz左右。由于是真實工況下采集的軸承振動數據,因此除了噪聲外,還在3 918 Hz、8 957 Hz處存在幅值。進一步結合圖5(c)所示的生成信號的包絡譜,對比可知,除了在包絡譜中可以清晰地看到外圈故障的特征頻率229.9 Hz外,還可以看到生成信號在4 138 Hz也類似于真實信號在3 918 Hz處出現了一個異常幅值,整體形狀相較之仿真信號與真實信號更加相似,其信噪比也更接近真實信號。
為進一步對比生成信號與真實信號的相似程度,本研究對3種信號進行特征提取。同時,為了更好對比擬合效果,數據前部分的正常及早期故障均采用相同數據,即軸承真實實驗數據。將生成的失效信號、仿真的失效信號和真實的失效信號在最后位置重復放置,進而擬合曲線來對比三者差異。
圖6、圖7截取部分正常工況的數據、早期故障及失效階段的數據,并在此基礎上提取了數據的峭度和裕度特征進行全壽命的曲線擬合。由圖6可以看出,利用峭度擬合時,在最后的失效階段,真實數據的峭度達到22.03左右,仿真信號為11.37,誤差為48.39%,生成信號為12.08,誤差為45.17%,即生成的失效信號較之仿真信號對于真實信號來說,相似程度提升了3%。由圖7可以看出,利用裕度擬合時,在最后的失效階段,真實數據的裕度達到約18.49,仿真信號為16.43,誤差為11.14%,生成信號為7.197,誤差為61.08%,即生成的失效信號較之仿真信號對于真實信號來說相似程度提升了接近50%。
同時,結合上述兩圖中擬合曲線可以發(fā)現,生成信號比仿真信號明顯更接近真實信號。由圖4~圖7綜合對比可以看出,利用生成對抗網絡生成的信號對比仿真信號時,在譜分析、概率分布、特征提取及擬合曲線方面都與真實信號更加相似,尤其是采用裕度特征時,數值及擬合曲線效果更加顯著。
深度學習模型在故障診斷領域中具有非常大的發(fā)展?jié)摿?。但是基于模型的故障診斷系統(tǒng)所面臨的一大重要障礙就是,在實際生產中缺少真實且可用于訓練或調整模型的失效信號。本文利用GAN生成故障信號并證明其較之仿真信號更接近真實信號,可在一定程度上為解決故障診斷領域數據缺失的問題提供新的啟示。本文的研究仍存在進一步研究空間,例如將時域信號換成振動的頻譜信號;當訓練好模型時,改變基底信號以進行全壽命曲線的預測等。