劉恒 馮濤 王晶 楊偉成
1. 北京工商大學 北京 100048;
2. 中國家用電器研究院 北京 100037
異音檢測是壓縮機產(chǎn)線質(zhì)量檢測的重要工序環(huán)節(jié),許多專家學者在壓縮機檢測方向進行了深入研究并取得了優(yōu)質(zhì)的成果[1-4]。近年來,隨著機器學習的快速發(fā)展,深度學習被引入到機械故障檢測中,并取得了成果。通常,故障檢測包括特征提取和分類兩個步驟。從原始信號中提取故障特征,然后通過人工經(jīng)驗判斷或模態(tài)識別技術(shù)進行分類[5-7]。盡管這些方法取得了一定成果,但其良好的性能需要大量標記數(shù)據(jù)。對于實際使用的壓縮機,很難收集到足夠的標記數(shù)據(jù)。楊斌等人[8]提出了一種基于特征的遷移神經(jīng)網(wǎng)絡(FTNN),利用實驗室機器的診斷知識來識別實際機器的健康狀態(tài)以解決樣本數(shù)據(jù)少的問題。李春陽等[9]利用數(shù)據(jù)增強的方式開發(fā)出一種基于卷積生成對抗網(wǎng)絡模型用以解決訓練樣本稀少的問題。在實際中,壓縮機大多在正常狀態(tài)下運行,呈現(xiàn)正常信號樣本豐富,故障信號樣本稀少的特點。為解決冰箱壓縮機故障信號樣本稀少的難題,本文應用自編碼器模型,以大量正常信號樣本為基礎,研究冰箱壓縮機正常信號樣本共性特征的提取方法,進而實現(xiàn)壓縮機的異音檢測。
自編碼器由編碼器和解碼器兩部分構(gòu)成,編碼環(huán)節(jié)通過輸入原始數(shù)據(jù)對數(shù)據(jù)進行壓縮,得到低維數(shù)據(jù)空間中的特征向量,該特征包括原始特征的本質(zhì)信息。而解碼環(huán)節(jié)通過前向傳播對自編碼器的參數(shù)進行優(yōu)化調(diào)整,最終學習到原始數(shù)據(jù)的特征。如圖1所示。
圖1 自編碼器結(jié)構(gòu)
自編碼器編碼、解碼過程可表示為[10]:
其中,σα為激活函數(shù),在編碼階段采用的為Relu激活函數(shù),W為輸入數(shù)據(jù)的權(quán)重,b為偏置。
其中,σβ為激活函數(shù),在編碼階段采用的為Relu和Sigmoid激活函數(shù)相結(jié)合的方式,W'為輸出數(shù)據(jù)的權(quán)重,取W'=WT,b'為偏置。通過不斷更新各層的調(diào)節(jié)權(quán)重和偏置參數(shù),使重構(gòu)誤差達到最小,達到最優(yōu)網(wǎng)絡。
Adam算法(Adaptive Moment Estimation Algorithm, Adam)廣泛用于深度學習優(yōu)化的學習,不僅可以采用動量法作為參數(shù)的更新方向,還可以通過矩估計法調(diào)節(jié)每個參數(shù)的學習率。由于Adam算法對超參數(shù)具有很強的魯棒性,因而在深度學習領(lǐng)域被廣泛應用。Adam算法參數(shù)的更新差值為[11]:
其中,Δθt為需要更新的參數(shù); 為對一階梯度的校正,可以提供增大學習率的參數(shù),加速訓練能力;為對二階梯度的校正,提供減少學習率的能力;為常數(shù);α為學習率。
自編碼器聲信號共性特征提取流程如圖2所示,步驟如下:
圖2 自編碼器異常振動檢測流程
(1)采集原始振動信號。
(2)對采集的信號進行預處理,圖3 a)、圖4 a)分別為采集到的正常樣本信號通過不同預處理后的頻譜圖。
圖3 經(jīng)過頻域FFT變換后的頻譜圖及提取到的自編碼器共性特征
圖4 經(jīng)過頻域FFT對數(shù)譜變換后的頻譜圖及提取到的自編碼器共性特征
(3)劃分為訓練集和測試集。
(4)把訓練集的樣本作為自編碼器的輸入、將解碼后的輸出當作重構(gòu)目標,損失函數(shù)為:
(5)將正常樣本輸入到編碼器中得到的輸出即為正常信號的共性特征信息,提取到的隱藏層共性特征如圖3 b)、圖4 b)所示。
(6)將測試集中的振動信號輸入網(wǎng)絡通過重構(gòu)誤差對比進行故障檢測分類。
由于故障樣本較難收集,考慮到測試集數(shù)據(jù)正負樣本差距較大,需對故障樣本進行重疊采樣以建立一個平衡的數(shù)據(jù)集,本文對原始樣本進行一定重疊比例分割的方法。采用重疊分割的方法對數(shù)據(jù)進行擴充,樣本擴充示意圖如圖5所示,這樣做既可以保證數(shù)據(jù)信息不會損失,同時還能提高樣本數(shù)量。在選擇樣本長度的問題上,過短的信號樣本會導致信息量不足,過長的樣本又會使整體模型學習時間過長,所以選擇一個適合的樣本長度也是至關(guān)重要的。
圖5 樣本擴充示意圖
樣本擴充公式如下:
其中,N為以重疊率η分割后的樣本數(shù)量,L為一段聲信號樣本的長度,len為預先設置分割后的樣本長度。
以某型冰箱壓縮機為研究對象,在生產(chǎn)線上采集其殼體振動信號,振動信號采集過程中所使用的設備主要包括帶有Pulse系統(tǒng)的計算機、采集卡及加速度傳感器。采集過程如圖6所示,將加速度傳感器貼在處于工作狀態(tài)中的壓縮機外表面,并用Pulse系統(tǒng)將壓縮機的振動信號錄制下來。采集到的振動信號由專業(yè)人員進行分類,包括正常和異常兩種壓縮機振動信號。涉及的故障類型主要包括無油、內(nèi)排氣管焊堵、閥減震彈簧與內(nèi)排氣管間隙大、吸油管脫落、內(nèi)排氣管碰殼。采集到正常數(shù)據(jù)893個,故障數(shù)據(jù)52個,采用預處理后得到正常信號樣本4937個,故障信號樣本為532個。其中訓練集只包括正常樣本,數(shù)量為2000個;測試集包括正常和故障樣本兩類,分別取500個,訓練集與測試集的樣本并不重疊。
圖6 采集裝置連接示意圖
自編碼器模型使用正常數(shù)據(jù)訓練得到,正常數(shù)據(jù)的重構(gòu)結(jié)果與正常原始數(shù)據(jù)相差較??;但是將故障數(shù)據(jù)代入該自編碼器模型中,所得到的重構(gòu)結(jié)果就會與故障原始數(shù)據(jù)有較大的誤差,可以對重構(gòu)誤差設置相應的閾值以實現(xiàn)故障機的識別,通過均方差計算可確定最優(yōu)閾值作為故障分類標準。圖7為采用頻域FFT對數(shù)譜的數(shù)據(jù)處理方式得到的正常、故障樣本均方差圖,從圖中可以看出正常樣本與故障樣本的均方差分布以6100左右為界限,最后可進行細化測試,找到最佳閾值的位置。
圖7 正常、故障樣本均方差圖
選擇合適的數(shù)據(jù)處理方式在學習模型中起到了一個關(guān)鍵的作用,考慮樣本為一維時域信號,通常信號數(shù)據(jù)處理方式有時域處理、FFT頻域處理等處理方式,這里選用FFT頻域處理和FFT頻域?qū)?shù)處理兩種方式進行不同學習率對學習模型的影響,為了消除隨機誤差的影響對每組分別進行5次測試,并以測試集最終的平均準確率為結(jié)果。表1為不同數(shù)據(jù)處理方式和學習率實驗結(jié)果。
表1 不同數(shù)據(jù)處理方式和學習率實驗結(jié)果
使用頻域FFT及頻域FFT對數(shù)譜的數(shù)據(jù)處理分別在不同學習率下的故障分類準確率如表1所示。由表1的結(jié)果可以看出,利用頻域FFT及頻域FFT對數(shù)譜進行數(shù)據(jù)處理時,最優(yōu)的準確率出現(xiàn)在學習率為1e-4和頻域?qū)?shù)譜的數(shù)據(jù)處理方式上。隨著學習率的增加,識別準確率出現(xiàn)了不同程度的下降。從圖8的PR曲線來看,頻域FFT對數(shù)譜和頻域FFT均具有較好的學習性能,但使用頻域FFT對數(shù)譜要更勝一籌。分析其原因,使用頻域FFT數(shù)據(jù)處理時,不僅可以避免信號的多樣性及不確定性,還可以提高頻率的分辨率。而使用頻率FFT對數(shù)譜的數(shù)據(jù)處理方式,對數(shù)譜數(shù)值小的部分差異的敏感程度要比數(shù)值大的部分的差異敏感程度更高,且信號更接近于人耳實際聽取的聲音,所以更有利于增加其分辨能力。
圖8 不同數(shù)據(jù)處理下的PR曲線
為了在少量故障壓縮機樣本的條件下進行故障檢測,本文提出了一種共性特征提取及檢測的自編碼器系統(tǒng)。學習模型由全連接層的自編碼器網(wǎng)絡堆疊而成,并用兩種數(shù)據(jù)處理方式進行對比分析,利用非標記數(shù)據(jù)樣本來發(fā)掘數(shù)據(jù)中的內(nèi)部結(jié)構(gòu),根據(jù)測試結(jié)果可以得出:使用頻域FFT對數(shù)譜的數(shù)據(jù)處理方式且在學習率為1e-4的條件下,具有較好的分類結(jié)果,準確率達到97.4%。
綜上所述,在選定合適的自編碼器參數(shù)和頻域FFT對數(shù)譜的條件下,自編碼器可以用于壓縮機的異常振動監(jiān)測。本文所有的樣本數(shù)據(jù)雖然采集于往復式冰箱壓縮機,但是本文所用到的自編碼器模型并不限于適用往復式冰箱壓縮機,也適用于其他類型壓縮機。