張子賢,李 敏,苗紅霞,孫 寧
(1.河海大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,江蘇 常州 213022;2.國家電網(wǎng)江蘇省電力公司檢修分公司,江蘇 常州 211100)
如今,為了滿足設(shè)備運(yùn)行的高效性與可靠性,針對設(shè)備定期維護(hù)和故障發(fā)生后才維修等傳統(tǒng)方法的不足,故障預(yù)測在工程設(shè)備的維修與監(jiān)測中的重要性逐漸增加。故障預(yù)測可以將各傳感器測得的信息,通過一定的理論、算法處理后,推測出故障發(fā)展的趨勢,它是比故障診斷更高級的維修手段,如果能在故障發(fā)生之前識別到故障發(fā)生的可能,從而對設(shè)備進(jìn)行排查,對零件進(jìn)行更換,可以大大減少故障風(fēng)險,減少因故障造成的損失,節(jié)約資源,降低經(jīng)濟(jì)成本。
由于故障預(yù)測是在故障發(fā)生之前進(jìn)行的,所以往往具有故障幅值微小、故障特性不明顯、容易被噪聲掩蓋等特點(diǎn),相對而言難以被檢測出,因此,對于故障發(fā)生前的信號處理與分析是故障預(yù)測技術(shù)研究的重點(diǎn)。近年來,在該方面的研究很是火熱,王姝等提出了一種結(jié)合多元統(tǒng)計技術(shù)(MPCA)與AR序列分析的緩變故障預(yù)測方法[1],該方法通過建立T2及Q 統(tǒng)計量的自回歸模型,預(yù)測下一批次統(tǒng)計量值,將所求值與控制限對比,進(jìn)而實現(xiàn)漸變故障的預(yù)測,但是該方法假設(shè)故障的趨勢為線性的,并且每個統(tǒng)計量的預(yù)測過程、預(yù)測結(jié)果是獨(dú)立的,對于非線性、多耦合的數(shù)據(jù)較難預(yù)測;東南大學(xué)陸寧云等提出一種多層預(yù)測型貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),根據(jù)工程系統(tǒng)自身固有的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),構(gòu)建了多層貝葉斯網(wǎng)絡(luò)模型,利用定性趨勢分析法將時間信息融入網(wǎng)絡(luò)節(jié)點(diǎn)中,使得網(wǎng)絡(luò)具有處理時序信息的能力,便于進(jìn)行故障傳播機(jī)理分析和故障預(yù)測[2],在該算法中需要構(gòu)建隸屬度函數(shù),通過一定的先驗知識去構(gòu)造隸屬度函數(shù),這些先驗知識的精確與否會直接影響該方法的準(zhǔn)確性;文獻(xiàn)[3]利用深層神經(jīng)網(wǎng)絡(luò)(DNN)與PCA相結(jié)合的方法實現(xiàn)了微小緩變故障早期診斷及壽命預(yù)測;文獻(xiàn)[4]則提出了一種使用深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)預(yù)測方法,然而,上述兩種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)由于沒有對應(yīng)狀態(tài)變量的神經(jīng)元,因此難以存儲之前時間的信息。
近年來,隨著計算機(jī)計算能力的提高,人工神經(jīng)網(wǎng)絡(luò)的層數(shù)越來越多,深度學(xué)習(xí)的研究與應(yīng)用也日益增加。深度學(xué)習(xí)的本質(zhì)是特征提取,即通過組合低層次的特征形成更加抽象的高層表示,以達(dá)到獲得最佳特征的目的。具體應(yīng)用可以抽象為將原始數(shù)據(jù)、信號作為低層次的特征送入神經(jīng)網(wǎng)絡(luò),把人們想要得到的信息作為高層表示的過程。在深度學(xué)習(xí)的應(yīng)用上,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)主要用于與時間序列相關(guān)的數(shù)據(jù),比如自然語言的處理、疾病預(yù)測等等,并體現(xiàn)出了良好的擬合能力[5-8]。故障預(yù)測與語言處理和疾病預(yù)測相似,各種設(shè)備的傳感器信號大多為時間序列,當(dāng)前時刻的信號值與之前的信號值有不可分割的聯(lián)系,因此,在判斷設(shè)備狀態(tài)時僅僅關(guān)注當(dāng)前信號是不夠的,還要考慮傳感器之前信號的狀態(tài),這樣才能最大程度的挖掘出時間序列數(shù)據(jù)所蘊(yùn)含的信息。
另一方面,對于大多數(shù)工程系統(tǒng)而言,從系統(tǒng)安裝運(yùn)行到出現(xiàn)異常的正常工作階段,監(jiān)測得到的數(shù)據(jù)一般比較平穩(wěn),沒有明顯的趨勢出現(xiàn),而一旦發(fā)生故障,所監(jiān)測的數(shù)據(jù)則會發(fā)生劇烈變化,如發(fā)動機(jī)、氣輪機(jī)、旋轉(zhuǎn)機(jī)械等的振動幅值信號,都具有這樣的特點(diǎn),其故障劇烈程度近似于指數(shù)函數(shù)。出現(xiàn)異常的時間點(diǎn)一般被稱為異常點(diǎn),對于異常點(diǎn)的確定是故障預(yù)測中較為關(guān)鍵的一環(huán),異常點(diǎn)確定過早,會導(dǎo)致誤判發(fā)生,而過晚則失去了故障預(yù)測的意義。關(guān)于異常點(diǎn)的檢測,文獻(xiàn)[9]介紹了貝葉斯、廣義貝葉斯、極大極小值等方法,然而這些方法沒有自學(xué)習(xí)能力,并且假定數(shù)據(jù)的分布符合某種規(guī)律,比如高斯分布,而現(xiàn)實情況下的數(shù)據(jù)往往并不符合這些特殊的分布,因此這些方法在實際工程中難以應(yīng)用,為了解決該問題,在此,應(yīng)用了一種逐步逼近的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法。
基于RNN的故障預(yù)測算法整體流程如圖1所示,該算法主要由數(shù)據(jù)處理模塊與RNN網(wǎng)絡(luò)識別模塊構(gòu)成。數(shù)據(jù)處理模塊用于對傳感器輸出信號進(jìn)行處理,而RNN網(wǎng)絡(luò)識別模塊用于對經(jīng)過處理的輸入信號進(jìn)行故障預(yù)測的操作。
圖1 整體算法流程圖
在數(shù)據(jù)處理模塊中,先對所采集的歷史數(shù)據(jù)進(jìn)行處理;再使用數(shù)學(xué)函數(shù)賦值的方法來構(gòu)造待訓(xùn)練RNN模型的訓(xùn)練與測試樣本。
在RNN網(wǎng)絡(luò)識別模塊中,首先確定RNN模型結(jié)構(gòu);然后使用RNN模型進(jìn)行異常點(diǎn)檢測,為訓(xùn)練樣本數(shù)據(jù)貼上標(biāo)簽;再使用數(shù)據(jù)處理模塊構(gòu)建的訓(xùn)練樣本對RNN模型進(jìn)行訓(xùn)練,調(diào)整模型參數(shù),確定故障預(yù)測模型;最后將數(shù)據(jù)輸入RNN模型對設(shè)備進(jìn)行故障預(yù)測。
通常,使用循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測前,對于傳感器采集的數(shù)據(jù)都需要先進(jìn)行特征提取。若構(gòu)建特征提取模型進(jìn)行特征提取,不僅費(fèi)時費(fèi)力,而且會延緩識別速度,給識別帶來困難,因此,這里采用數(shù)學(xué)函數(shù)賦值的方法來構(gòu)建輸入矩陣,對輸入數(shù)據(jù)進(jìn)行處理。
首先采集設(shè)備多種傳感器上較長時間內(nèi)的各種信號數(shù)據(jù),作為歷史數(shù)據(jù),并對這些歷史數(shù)據(jù)進(jìn)行采樣。接著通過數(shù)學(xué)函數(shù)賦值的方法構(gòu)造待訓(xùn)練RNN模型的訓(xùn)練樣本數(shù)據(jù),并使用相同的方法構(gòu)造測試數(shù)據(jù)。
數(shù)學(xué)函數(shù)賦值的方法為:
對于裝置中的信號,設(shè)置k個傳感器采集不同的信號,并將采集到的k個信號波形函數(shù)a(1,t)到a(k,t)中的若干采樣點(diǎn)提取到一個多維矩陣b中,該矩陣的每一列代表一個樣本,假設(shè)總共有n個樣本。矩陣為:
其中:b是輸入矩陣。函數(shù)a(1,t)到a(k,t)分別是k個傳感器波形函數(shù),t是歷史數(shù)據(jù)的時間。X是歷史數(shù)據(jù)的起點(diǎn)。該方法可以根據(jù)設(shè)備的故障特征確定輸入矩陣形式。
1.3.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
由于各種原因,傳感器采集到的數(shù)據(jù)會夾雜噪聲信號,而數(shù)學(xué)方法如貝葉斯和極大極小原理等需要精確的數(shù)據(jù)才能得出較為可靠的預(yù)測結(jié)果,因此需要一種不易被噪聲信號影響的算法。循環(huán)神經(jīng)網(wǎng)絡(luò)能夠通過學(xué)習(xí)歷史數(shù)據(jù)來區(qū)分噪聲信號與故障信號,RNN可以在迭代的訓(xùn)練過程中,不斷調(diào)整參數(shù),直到滿足精度要求。因此它在解決時間序列問題的實際使用過程中有更高的預(yù)測精度。
在傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)(FNN)中,神經(jīng)元的信息傳遞是通過網(wǎng)絡(luò)層與網(wǎng)絡(luò)層之間的單向傳遞完成的,此模式使得FNN變得更容易學(xué)習(xí),但在一定程度上也削弱了FNN模型的能力。在實際情況中,輸出不僅和當(dāng)前輸入相關(guān),也有可能和上一個時刻的輸出相關(guān)。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是FNN的一種改進(jìn)體,是一類具有短期記憶能力的神經(jīng)網(wǎng)絡(luò)。RNN形成的環(huán)路的網(wǎng)絡(luò)結(jié)構(gòu),使得神經(jīng)元既可以接收到其他神經(jīng)元的信息,也能接收到本身的信息。所以,相比之下,RNN在處理與時序數(shù)據(jù)相關(guān)的預(yù)測問題時有著比FNN更明顯的優(yōu)勢。在實際應(yīng)用中,需要根據(jù)故障模型構(gòu)建合適的RNN網(wǎng)絡(luò)結(jié)構(gòu),并需要兼顧快速性、魯棒性與準(zhǔn)確性。
FNN的訓(xùn)練過程通過后向傳播算法(BP)來實現(xiàn),而RNN可以被看作是一個展開的多層FNN,這樣就需要依次在時間維上疊加對后向傳遞的結(jié)果。
假設(shè)輸入RNN的是長度為T的序列X,并且RNN的輸入層、隱含層與輸出層的神經(jīng)元個數(shù)分別是為I、H與K。
那么RNN前向傳播算法公式如(1)~(3)所示:
(1)
(2)
(3)
對于RNN的時間后向傳播算法,首先要定義損失函數(shù)對神經(jīng)元j在時刻t輸入值的偏導(dǎo)數(shù),如式(4)~(6)所示:
(4)
(5)
(6)
從RNN的訓(xùn)練過程可以看出,RNN能夠?qū)斎霐?shù)據(jù)的序列特性進(jìn)行“記憶”,因此更適合于解決時間序列問題[10]。
1.3.2 異常點(diǎn)檢測
通常,神經(jīng)網(wǎng)絡(luò)訓(xùn)練時需要使用大量的帶標(biāo)簽樣本,而獲取大量有標(biāo)簽樣本不僅耗費(fèi)人力物力,難度也較大。因此,這里使用一種逐步逼近的神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法——異常點(diǎn)檢測算法來對故障數(shù)據(jù)樣本給定標(biāo)簽。使用該算法能夠在短時間內(nèi)獲得樣本的標(biāo)簽,能夠提高效率。
圖2 故障信號變化過程
大部分故障信號變化通常不是突然的,而是漸進(jìn)的、緩慢的過程,如圖2所示,A點(diǎn)稱為故障趨勢起始點(diǎn),在此之前,設(shè)備狀態(tài)是健康的,A點(diǎn)表示故障趨勢開始的時間,此時故障信號會有微小的變化,但設(shè)備仍能正常運(yùn)行。到B點(diǎn)時,故障信號已經(jīng)達(dá)到故障閾值,并且故障信號的變化開始由平緩趨于劇烈,設(shè)備將受到損壞。因此在建立故障模型時,可以使用指數(shù)函數(shù)來近似表達(dá)故障嚴(yán)重程度?;赗NN的故障預(yù)測算法針對這一故障變化趨勢建立了指數(shù)型故障預(yù)測模型,并利用異常點(diǎn)檢測算法對樣本數(shù)據(jù)進(jìn)行反復(fù)迭代,從而逐次逼近得出故障發(fā)生前信號微小變化的時間,進(jìn)而達(dá)到對設(shè)備故障進(jìn)行預(yù)測的目的。
實際應(yīng)用中,在故障信號有微小的變化的時候檢測出故障趨勢起始點(diǎn)A,接著檢測故障真正發(fā)生的點(diǎn)B,在T=B-A時間段對應(yīng)的樣本貼上[0.1-1]的標(biāo)簽。異常點(diǎn)檢測流程如圖3所示,具體做法為:
1)確定輸入輸出向量,建立RNN,確定神經(jīng)元數(shù)目和隱藏層層數(shù)。
2)確定第一次訓(xùn)練的假想異常點(diǎn)v1。
首先根據(jù)經(jīng)驗選取異常點(diǎn)時刻v,且v點(diǎn)在時間上要偏晚,以確保有故障趨勢發(fā)生,v點(diǎn)與故障趨勢起始點(diǎn)A之間的一段時間稱為時間裕量M,將數(shù)據(jù)輸入RNN模型進(jìn)行訓(xùn)練。第一次訓(xùn)練時,時間裕量M內(nèi)的數(shù)據(jù)不放入RNN模型進(jìn)行訓(xùn)練。
圖3 異常點(diǎn)檢測流程圖
3)用函數(shù)P(t)對數(shù)據(jù)進(jìn)行賦值。
從異常點(diǎn)v1到故障發(fā)生時刻B,按照式(7)利用函數(shù)P(t)對其進(jìn)行賦值,故障模型時域為T=B-v1。
(7)
假定選定從v1時刻開始,將異常時刻v1的輸出值用P賦值,并令P值的變化與實際故障的變化趨勢相同,都是由平緩趨于劇烈的指數(shù)函數(shù)形式。留出時間裕量M的原因是真實的異常點(diǎn)A處于該時間段M內(nèi),此時并不能給出該段時間內(nèi)的恰當(dāng)?shù)腜值,因為不管P值超前或者滯后,都意味著在v-A這段時間中的數(shù)據(jù)會得到錯誤的P值。
由于猜想的異常點(diǎn)v是偏晚的,所以實際的P值要比公式(7)中的結(jié)果大一些。按式(8)對式(7)進(jìn)行修正:
(8)
其中:自變量t表示從出現(xiàn)故障趨勢開始后的時間,B表示故障發(fā)生的時刻,v表示最終更新的異常點(diǎn)時刻。
5)將訓(xùn)練數(shù)據(jù)放入網(wǎng)絡(luò)進(jìn)行訓(xùn)練,測試并觀察輸出值,調(diào)整網(wǎng)絡(luò)權(quán)值。
第一次訓(xùn)練完成后,RNN網(wǎng)絡(luò)已經(jīng)具有初步的故障預(yù)測能力,再放入數(shù)據(jù),測試并觀察輸出值。
8)停止更新v值,此時的v值已經(jīng)無限接近于故障趨勢起始點(diǎn)A的時刻,再根據(jù)最終的v值訓(xùn)練神經(jīng)網(wǎng)絡(luò)。可見,此過程是一個逐次逼近的過程。
檢驗是否為故障趨勢起始點(diǎn)可依據(jù)式(9)進(jìn)行,待定時間點(diǎn)的輸出值Pd若大于設(shè)備健康狀態(tài)時的輸出平均值相,則為故障趨勢起始點(diǎn)。
(9)
其中:Pd為待定點(diǎn)輸出值,Pk為k時刻健康狀態(tài)輸出值,s為比例系數(shù)。為防止將健康狀態(tài)誤判為具有故障趨勢的點(diǎn),通常將s設(shè)定為略大于1,n為數(shù)據(jù)數(shù)目。
1.3.3 故障預(yù)測輸出
對于不同的設(shè)備,故障類型的數(shù)目不同,因此預(yù)測輸出的矩陣維數(shù)也不同。假設(shè)用于故障預(yù)測的設(shè)備有k種不同的故障類型,即a,b,c,,k,那么最終的預(yù)測輸出為:
其中:矩陣a,b,c到k的行表示預(yù)測的當(dāng)前設(shè)備故障類型的概率。a,b,c,,k的值越接近1,故障發(fā)生的可能性就越大,i代表在不同時刻的狀態(tài)及當(dāng)時故障預(yù)測的結(jié)果。
本次氣體絕緣開關(guān)(GIS)信號取自某電廠,取其在190天內(nèi)傳感器采集的振動信號與局部放電信號作為歷史數(shù)據(jù)。在數(shù)據(jù)處理模塊中,使用數(shù)學(xué)函數(shù)賦值方法建立的樣本矩陣為:
將振動信號與局部放電信號數(shù)據(jù)錄入Matlab,并繪制波形,如圖4和圖5所示。當(dāng)t=120天時,故障未發(fā)生,但開始有微小的信號變化;當(dāng)t=140天時,故障發(fā)生??梢钥闯?,故障發(fā)生后,t>140天時,信號變化較為明顯;當(dāng)120天 圖4 振動傳感器信號 圖5 電流傳感器信號 在RNN識別模塊中,首先要建立故障預(yù)測模型。在最終確定RNN網(wǎng)絡(luò)結(jié)構(gòu)之前,分別嘗試過使用不同層數(shù)的RNN網(wǎng)絡(luò)、改變每層的神經(jīng)元數(shù)量等來進(jìn)行訓(xùn)練。訓(xùn)練結(jié)果顯示,網(wǎng)絡(luò)最終輸出的準(zhǔn)確性以及響應(yīng)速度與RNN網(wǎng)絡(luò)的結(jié)構(gòu)關(guān)系很大。當(dāng)每層神經(jīng)元數(shù)量增加到20個時,訓(xùn)練耗時會增加,然而精度的提高卻不甚明顯。而當(dāng)把RNN網(wǎng)絡(luò)層數(shù)增加到8層時,網(wǎng)絡(luò)訓(xùn)練時間上升到13 s,訓(xùn)練進(jìn)行了27次重復(fù)訓(xùn)練,訓(xùn)練精度雖有所提高,但耗時大大增加。因此,確定RNN網(wǎng)絡(luò)結(jié)構(gòu)時需要綜合考慮快速性與準(zhǔn)確性。 因為振動與電流信號并不非常復(fù)雜,信號類型不多,因此選用的RNN結(jié)構(gòu)相對簡單。選用的RNN由一個輸入層、四個隱含層和一個輸出層構(gòu)成。 將時間在40~135天內(nèi)的數(shù)據(jù)作為異常點(diǎn)可能存在的區(qū)間,此區(qū)間的數(shù)據(jù)不放入網(wǎng)絡(luò)訓(xùn)練。對故障發(fā)生前5個天的數(shù)據(jù)進(jìn)行賦值,將賦值后的數(shù)據(jù)放入網(wǎng)絡(luò)訓(xùn)練后,重新將所有數(shù)據(jù)放入網(wǎng)絡(luò)測試,訓(xùn)練效果如圖6所示。 圖6 數(shù)據(jù)重新標(biāo)簽前訓(xùn)練效果 由圖6可見,整個RNN網(wǎng)絡(luò)的訓(xùn)練過程一共耗時1 s,訓(xùn)練期間重復(fù)了29次。在第23次訓(xùn)練時,得到了最好的訓(xùn)練效果。訓(xùn)練后得到的結(jié)果如表1所示。 表1 時間裕度 M1=5時的輸出 由表1可知,健康狀態(tài)的輸出均值為0.029 4,取比例系數(shù)s=1.3,可以看出時間在131~135的5個數(shù)據(jù)中,有3個滿足式(9),于是將時間在131~140的數(shù)據(jù)重新標(biāo)簽,并用于網(wǎng)絡(luò)訓(xùn)練。重新將所有數(shù)據(jù)進(jìn)行測試,訓(xùn)練結(jié)果如圖7所示。 圖7 數(shù)據(jù)重新標(biāo)簽后訓(xùn)練效果 由圖7可見,此次訓(xùn)練的最小均方誤差比第一次小,并且在訓(xùn)練過程中不斷收斂,取得了較好的效果。訓(xùn)練結(jié)果如表2所示。 表2 時間裕度M2=10時的輸出 圖8 最終預(yù)測結(jié)果 此時126~130天的輸出均滿足式(9)。將數(shù)據(jù)重新標(biāo)簽后,再次訓(xùn)練并測試網(wǎng)絡(luò),直到找出真正的異常點(diǎn)時刻T=120。最終的預(yù)測結(jié)果見圖8,橫坐標(biāo)是時間,縱坐標(biāo)是P值??梢钥闯?,在t<120時,可以認(rèn)為P為0;當(dāng)t>120時(故障趨勢開始),P值開始變大,直到t=140(故障發(fā)生時),P值到達(dá)1,網(wǎng)絡(luò)能很好地分辨出t=120前后的健康狀態(tài)和之后的異常狀態(tài)。 針對設(shè)備極其微小的故障趨勢,設(shè)計了基于RNN的故障預(yù)測算法。通過在GIS上應(yīng)用,驗證了該算法對時間序列數(shù)據(jù)具有強(qiáng)大的擬合能力,訓(xùn)練后的系統(tǒng)能在故障發(fā)生前給出故障發(fā)生的概率,準(zhǔn)確地預(yù)測故障類型,實現(xiàn)了故障預(yù)測功能。3 結(jié)束語