(北京信息科技大學(xué)現(xiàn)代測控教育部重點實驗室, 北京100192)
大型設(shè)備故障預(yù)測是保障其安全運行和實現(xiàn)科學(xué)維護的關(guān)鍵技術(shù)。在故障預(yù)測中,狀態(tài)趨勢預(yù)測技術(shù)能夠在設(shè)備發(fā)生故障前預(yù)測判斷設(shè)備運行狀態(tài)的發(fā)展趨勢。煙氣輪機是將催化裂化再生煙氣中所具有的熱能和動能通過膨脹做功轉(zhuǎn)變?yōu)闄C械能的高速旋轉(zhuǎn)機械,是具有顯著節(jié)能和環(huán)保效益的石油煉廠關(guān)鍵性設(shè)備。煙氣輪機的大部分故障不是瞬時發(fā)生的,故障從開始發(fā)生到發(fā)展總有一段出現(xiàn)異常現(xiàn)象的時間,而且有征兆可尋。故障的漸發(fā)性使得煙氣輪機的狀態(tài)趨勢可以被預(yù)測,對煙氣輪機進行狀態(tài)趨勢預(yù)測能夠揭示設(shè)備運行狀態(tài)的發(fā)展變化,有利于避免設(shè)備惡性事故和續(xù)發(fā)性事故的發(fā)生,對保障煙氣輪機的安全運行具有重要意義[1-2]。
隨著設(shè)備監(jiān)測診斷系統(tǒng)和工業(yè)計算機技術(shù)及數(shù)據(jù)技術(shù)的發(fā)展,大量的設(shè)備運行狀態(tài)信息的數(shù)據(jù)被采集并儲存起來。以采集的數(shù)據(jù)為基礎(chǔ)挖掘其中隱含信息進行預(yù)測的神經(jīng)網(wǎng)絡(luò)得到廣泛的應(yīng)用[3-4]。Elman動態(tài)遞歸神經(jīng)網(wǎng)絡(luò)具有高度自學(xué)習(xí)、自組織和自適應(yīng)能力, 只要有足夠的訓(xùn)練樣本,就可以通過學(xué)習(xí)和訓(xùn)練實現(xiàn)以任意精度逼近任意函數(shù)。文獻[5]將Elman神經(jīng)網(wǎng)絡(luò)應(yīng)用于液體火箭發(fā)動機故障預(yù)測,并進行多參數(shù)多步預(yù)測,研究結(jié)果表明,Elman預(yù)測模型較傳統(tǒng)的靜態(tài)BP網(wǎng)絡(luò)預(yù)測模型預(yù)測效果更好,收斂速度更快,精度更高,適合非線性動態(tài)系統(tǒng)的預(yù)測建模。文獻[6]將Elman神經(jīng)網(wǎng)絡(luò)用于煙煤與生物質(zhì)混燒灰熔點的預(yù)測,文獻[7]將Elman神經(jīng)網(wǎng)絡(luò)用于溫度的預(yù)測,均取得了不錯的預(yù)測效果。同時,Elman神經(jīng)網(wǎng)絡(luò)與其他方法結(jié)合而衍生出多種特殊形式的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如小波神經(jīng)網(wǎng)絡(luò)、遺傳小波神經(jīng)網(wǎng)絡(luò)等,因此在預(yù)測研究中具有很好的應(yīng)用效果[8-9]。
目前,基于Elman神經(jīng)網(wǎng)絡(luò)的狀態(tài)趨勢預(yù)測研究主要集中在預(yù)測網(wǎng)絡(luò)的優(yōu)化以及與其他方法的結(jié)合方面,對基于Elman趨勢預(yù)測的預(yù)測步長多是依經(jīng)驗設(shè)定,預(yù)測步長的設(shè)定沒有客觀依據(jù),且對Elman神經(jīng)網(wǎng)絡(luò)預(yù)測的研究大都沒有對數(shù)據(jù)異常值和缺失的數(shù)據(jù)進行處理,沒有考慮所用數(shù)據(jù)的可靠性。為此,本研究從確保預(yù)測所用數(shù)據(jù)的可靠性和為給趨勢預(yù)測設(shè)定客觀有效的最優(yōu)預(yù)測步長兩方面出發(fā),提出一種改進Elman神經(jīng)網(wǎng)絡(luò)的趨勢預(yù)測方法,并構(gòu)建了三層改進Elman神經(jīng)網(wǎng)絡(luò)進行煙氣輪機運行狀態(tài)趨勢預(yù)測實例分析,以驗證所提出方法的有效性。
圖1 Elman神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Structure of Elman neural network
Elman神經(jīng)網(wǎng)絡(luò)是一種帶有延遲反饋環(huán)節(jié)的動態(tài)遞歸型神經(jīng)網(wǎng)絡(luò),在前饋網(wǎng)絡(luò)的基礎(chǔ)上增加了適合于處理動態(tài)特性的機制,使Elman網(wǎng)絡(luò)系統(tǒng)具有多層前饋網(wǎng)絡(luò)無限逼近任意非線性映射的能力。如圖1所示,Elman神經(jīng)網(wǎng)絡(luò)除具有輸入層、隱含層、輸出層單元外,還有1個特殊的聯(lián)系單元,即承接層,用來記憶隱含層單元前一時刻的輸出值。承接層使Elman網(wǎng)絡(luò)具有動態(tài)記憶的功能,使系統(tǒng)具有適應(yīng)時變特性的能力[10-11]。
Elman神經(jīng)網(wǎng)絡(luò)的非線性狀態(tài)空間表達式為:
(1)
x(k)=f(w1xc(k)+w2(u(k-1))+b1,
(2)
xc(j)=x(k-1),
(3)
(4)
基于Elman神經(jīng)網(wǎng)絡(luò)的煙氣輪機運行狀態(tài)趨勢預(yù)測,通過煙氣輪機當(dāng)前狀態(tài)和發(fā)展趨勢內(nèi)在的聯(lián)系和慣性規(guī)律進行聯(lián)想預(yù)測。煙氣輪機運行狀態(tài)數(shù)據(jù)是按時間排列的有序數(shù)列,序列具有時間依存性,即運行狀態(tài)兩個不同時刻點之間具有相關(guān)性。相關(guān)程度的大小通過樣本相關(guān)系數(shù)來衡量,相關(guān)程度越大,兩個不同時刻信號相關(guān)程度越高[12]。因此,利用煙氣輪機運行狀態(tài)數(shù)據(jù)序列具有的時間依存性,計算煙氣輪機數(shù)據(jù)序列不同時延的相關(guān)系數(shù),以相關(guān)系數(shù)最大值點對應(yīng)的時間延遲為最優(yōu)預(yù)測步長,為預(yù)測步長的設(shè)定提供科學(xué)依據(jù)。
煙氣輪機運行狀態(tài)數(shù)據(jù)序列xi與時間延遲τ后序列的樣本相關(guān)系數(shù)計算公式為:
(5)
樣本相關(guān)系數(shù)ρ的取值范圍為[-1,1],相關(guān)系數(shù)越接近±1則表示煙氣輪機運行狀態(tài)數(shù)據(jù)序列xi與時間延遲τ后序列的相關(guān)程度越大。|ρ|≤0.3時表示煙氣輪機運行狀態(tài)數(shù)據(jù)與時延τ后樣本序列低度相關(guān);0.3≤|ρ|≤0.5表示數(shù)據(jù)序列實相關(guān);0.5≤|ρ|≤0.8表示數(shù)據(jù)序列顯著相關(guān);0.8≤|ρ|≤1表示數(shù)據(jù)序列高度相關(guān)。|ρ|≥0.3時煙氣輪機運行狀態(tài)可以預(yù)測,相關(guān)程度越大則說明預(yù)測效果越好,對應(yīng)的相關(guān)程度最大值時的時間延遲即為最優(yōu)預(yù)測步長。
為了評價改進Elman神經(jīng)網(wǎng)絡(luò)狀態(tài)趨勢預(yù)測的效果,在保證全面評價預(yù)測效果又不增加計算量的情況下,選取均方根誤差、平均相對誤差和平均絕對誤差作為預(yù)測模型的評價指標(biāo)。
①均方根誤差RMSE為:
(6)
②平均相對誤差MAPE為:
(7)
③平均絕對誤差MAE為:
(8)
在煙氣輪機狀態(tài)趨勢預(yù)測中,由于現(xiàn)場偶然性因素及突發(fā)性因素如現(xiàn)場電網(wǎng)電壓波動、載荷波動等的影響致使在預(yù)測所用的數(shù)據(jù)存在異常值、缺失等,而異常值和數(shù)據(jù)缺失會導(dǎo)致樣本量的減少,這不僅增加了狀態(tài)趨勢預(yù)測的難度,而且會導(dǎo)致趨勢預(yù)測的結(jié)果產(chǎn)生偏差,不能準(zhǔn)確預(yù)測設(shè)備狀態(tài)發(fā)展趨勢,因此,必須對異常值、缺失的數(shù)據(jù)進行處理,以確保預(yù)測所用數(shù)據(jù)的可靠性。
1.4.1 異常值處理
圖2 箱線圖方法識別異常值示意圖Fig.2 Diagram of boxplot method to identify outliers
目前判別異常值的經(jīng)典方法如萊因達準(zhǔn)則(PanTa)、格拉布斯準(zhǔn)則(Grubbs)、狄克遜準(zhǔn)則(Dixon)等,但這些方法都是以假定數(shù)據(jù)服從正態(tài)分布為前提的,而實際煙氣輪機運行狀態(tài)數(shù)據(jù)往往并不嚴(yán)格服從正態(tài)分布,應(yīng)用這些經(jīng)典方法判斷異常值其有效性有限[13]。
為有效判別煙氣輪機運行狀態(tài)數(shù)據(jù)的異常值,引入以四分位數(shù)和四分位距為基礎(chǔ)的箱線圖方法進行異常值處理。箱線圖方法判別異常值對數(shù)據(jù)沒有作任何限制性要求,不需要事先假定數(shù)據(jù)服從特定的分布形式,在識別異常值方面有一定的優(yōu)越性[14-16]。在箱線圖方法中,異常值被定義為小于Q1-1.5IQR(Q1為下四分位數(shù),IQR為四分位距)或大于Q3-1.5IQR(Q3為上四分位數(shù))的值,如圖2所示。由于四分位數(shù)具有一定的耐抗性,多達25 %的數(shù)據(jù)可以變得任意遠而不會很大地擾動四分位數(shù),因此,箱線圖識別異常值的結(jié)果比較客觀。
1.4.2 缺失數(shù)據(jù)插補
在煙氣輪機狀態(tài)趨勢預(yù)測中,若缺失數(shù)據(jù)過多時,則數(shù)據(jù)完全失去了可利用價值,任何填充方法都無濟于事;若數(shù)據(jù)缺失在一個能處理的范圍內(nèi)時,但填充方法不恰當(dāng)也會影響狀態(tài)趨勢預(yù)測結(jié)果準(zhǔn)確度。缺失數(shù)據(jù)的插補需要選擇合理的數(shù)據(jù)代替缺失數(shù)據(jù),插補到原數(shù)據(jù)缺失的位置上,以便符合數(shù)據(jù)的分布和規(guī)律[17]。
缺失數(shù)據(jù)插補的目的并不是插補單個缺失值,而是插補缺失數(shù)據(jù)所服從的分布,因此,計算描述插補后數(shù)據(jù)分布規(guī)律的均值和標(biāo)準(zhǔn)誤差、峰度、偏態(tài)和變異系數(shù)等描述數(shù)據(jù)分布的指標(biāo)參數(shù),以插補后數(shù)據(jù)分布的指標(biāo)參數(shù)與原始數(shù)據(jù)越接近的插補方法為最優(yōu)。描述插補后數(shù)據(jù)分布規(guī)律的參數(shù)計算公式如下:
(9)
(10)
②峰度因子為:
(11)
③偏態(tài)因子為:
(12)
④變異系數(shù)為:
CV=σ×100 %。
(13)
煙氣輪機工作狀態(tài)數(shù)據(jù)序列中,振動特性數(shù)據(jù)能夠反映煙氣輪機的機械動特性,比起其他狀態(tài)參數(shù)更直接、快速、準(zhǔn)確地反映設(shè)備的運行狀態(tài)。監(jiān)測煙氣輪機前軸承YT-7702A通道一段連續(xù)40 d的振動通頻值數(shù)據(jù),結(jié)果如表1所示,并以此進行狀態(tài)趨勢預(yù)測。
表1 煙氣輪機振動參數(shù)列表Tab.1 List of vibration parameters of flue gas turbine
圖3 箱線圖判別煙氣輪機YT-7702A通道振動數(shù)據(jù)異常值Fig.3 Boxplot method to distinguish outlier of YT-7702A channel vibration data for flue gas turbine
利用箱線圖方法對煙氣輪機YT-7702A通道的振動通頻值數(shù)據(jù)進行異常值判別,結(jié)果如圖3所示。由圖3可以看出,點12為異常值,點40為極端異常值。
對箱線圖分析得出的異常值,首先查詢煙氣輪機工藝有無大的波動或調(diào)整,其次查看探頭的間隙電壓是否真實可靠。由于儀表失靈造成的振動假象不少,通過查看探頭的間隙電壓來判斷儀表是否失靈。在確認(rèn)煙氣輪機工藝無調(diào)整后,查看煙氣輪機參數(shù)列表如表1,點12、點40對應(yīng)的轉(zhuǎn)速正常,但點40對應(yīng)時間點的間隙電壓(探頭的間隙電壓)異常,綜合判斷后將點12異常值保留,剔除點40的異常值,插補適宜的值進行后續(xù)的趨勢預(yù)測。
對煙氣輪機前軸承YT-7702A通道振動數(shù)據(jù)進行分析,發(fā)現(xiàn)有效數(shù)據(jù)33個,占82.5 %;缺失數(shù)據(jù)7個,占17.5 % ,缺失數(shù)據(jù)所占比例在合理范圍內(nèi),可以對缺失數(shù)據(jù)進行插補。分別應(yīng)用鄰近點中位數(shù)、鄰近點均值和線性趨勢方法進行缺失數(shù)據(jù)插補,并計算數(shù)據(jù)分布的均值、標(biāo)準(zhǔn)誤差、峰度因子、峭度因子和變異系數(shù)。在插補操作中鄰近點中位數(shù)、鄰近點均值插補方法鄰近點取6個,各缺失數(shù)據(jù)差補方法的數(shù)據(jù)分布指標(biāo)比較如表2所示。
由表2可知,各種缺失數(shù)據(jù)插補方法均能使插補后數(shù)據(jù)的均值、標(biāo)準(zhǔn)誤差、峰度因子、峭度因子和變異系數(shù)較原始數(shù)據(jù)的有不同程度的縮小;與其他方法相比,鄰近點中位數(shù)插補方法的指標(biāo)和原始數(shù)據(jù)最為接近,與原始數(shù)據(jù)分布最為接近,缺失數(shù)據(jù)插補效果最優(yōu)。
表2 各缺失數(shù)據(jù)插補方法的數(shù)據(jù)分布指標(biāo)Tab.2 Data distribution index parameters of missing data interpolation method
2.4.1 確定最優(yōu)預(yù)測步長及Elman神經(jīng)網(wǎng)絡(luò)預(yù)測參數(shù)
按照式(5)計算煙氣輪機前軸承YT-7702A通道振動通頻值數(shù)據(jù)序列不同時間延遲的相關(guān)程度,得到的不同時延下序列的樣本相關(guān)系數(shù)結(jié)果如圖4所示。
從圖4可以看出,不同時間延遲下的煙氣輪機振動序列的相關(guān)系數(shù)均表現(xiàn)出明顯的波動性,且相關(guān)系數(shù)從正相關(guān)切換到負相關(guān)一次,說明不同時延下數(shù)據(jù)序列的相關(guān)關(guān)系處于動態(tài)變化中的。時延為1時自相關(guān)系數(shù)最大,為0.639 62,此時數(shù)據(jù)序列顯著相關(guān),選取最優(yōu)預(yù)測步長為1進行循環(huán)迭代預(yù)測;時延為3時自相關(guān)系數(shù)次大,為0.604 59;時間延遲為2時自相關(guān)系數(shù)排第三,為0.566 48;時間延遲為4時自相關(guān)系數(shù)排第四,為0.530 43。
圖4 YT-7702A數(shù)據(jù)序列的相關(guān)系數(shù)Fig.4 Correlation coefficient of YT-7702A data series
2.4.2 確定Elman神經(jīng)網(wǎng)絡(luò)趨勢預(yù)測其他參數(shù)
為有效進行狀態(tài)趨勢預(yù)測,構(gòu)建目標(biāo)誤差為0.001的3層Elman神經(jīng)網(wǎng)絡(luò)。針對振動通道數(shù)據(jù)的特點,選取輸入層神經(jīng)元個數(shù)為5,隱含層根據(jù)Kolmogorov定理確定為11,輸出設(shè)置為最優(yōu)預(yù)測步長1,進行單步循環(huán)預(yù)測。針對梯度下降算法存在的收斂速度慢、易陷入局部最小值的問題,Elman神經(jīng)網(wǎng)絡(luò)采用LM算法進行學(xué)習(xí)訓(xùn)練。LM算法是梯度下降法與高斯—牛頓法的結(jié)合,對于訓(xùn)練次數(shù)及準(zhǔn)確度,其明顯優(yōu)于共軛梯度法及變學(xué)習(xí)率的梯度下降法,能夠保證權(quán)值的每次調(diào)整都使誤差減小,避免網(wǎng)絡(luò)的振蕩[18]。
圖5 不同預(yù)測步長的Elman神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果圖Fig.5 Elman neural network prediction results of different prediction steps
為避免在神經(jīng)網(wǎng)絡(luò)的計算過程中發(fā)生數(shù)值溢出,對網(wǎng)絡(luò)輸入層和輸出層的各單元值進行標(biāo)準(zhǔn)化處理。網(wǎng)絡(luò)選用Tansig函數(shù),其標(biāo)準(zhǔn)的數(shù)據(jù)輸入和輸出限定范圍是[-1,1],效果比較理想的歸一化區(qū)間為[-0.8,0.8],[-0.9,0.9]。采用式(14)將樣本數(shù)據(jù)歸劃到(-0.9,0.9)區(qū)間。歸一化處理的數(shù)據(jù)完成訓(xùn)練后,網(wǎng)絡(luò)輸出的結(jié)果要進行反變換才能得到實際值,即:
(14)
2.4.3 不同預(yù)測步長的預(yù)測比較
對插補后煙氣輪機前軸承YT-7702A通道全數(shù)據(jù)序列進行趨勢預(yù)測,其中,訓(xùn)練數(shù)據(jù)30個,預(yù)測數(shù)據(jù)10個,進行單步循環(huán)預(yù)測,并與預(yù)測步長為3、2和4的Elman神經(jīng)網(wǎng)絡(luò)預(yù)測進行效果對比。不同預(yù)測步長的Elman神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果如圖5所示,不同預(yù)測步長的Elman神經(jīng)網(wǎng)絡(luò)預(yù)測誤差比較如表3所示。
表3 不同預(yù)測步長的Elman神經(jīng)網(wǎng)絡(luò)預(yù)測效果的比較Tab.3 Comparison of prediction results of Elman neural network with different prediction steps
從圖5可以看出,不同預(yù)測步長的Elman神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果實際值存在上下波動,但Elman神經(jīng)網(wǎng)絡(luò)1步預(yù)測較其他預(yù)測步長更能貼近實際煙氣輪機的運行狀態(tài)趨勢。Elman神經(jīng)網(wǎng)絡(luò)1步預(yù)測在第5、6、8天的預(yù)測與實際值的趨勢有所不同,主要原因是由于數(shù)據(jù)量偏少,網(wǎng)絡(luò)訓(xùn)練不充分造成的。比較表3的1步和3步預(yù)測步長的Elman神經(jīng)網(wǎng)絡(luò)預(yù)測效果,發(fā)現(xiàn)1步預(yù)測步長的均方根誤差RMSE、平均相對誤MAPE、平均絕對誤差MAE均較比3步預(yù)測步長的小,充分說明了1步預(yù)測步長比其他預(yù)測步長預(yù)測精度高,驗證了利用數(shù)據(jù)相關(guān)程度確定最優(yōu)預(yù)測步長的有效性。
2.4.4 與其他神經(jīng)網(wǎng)絡(luò)的預(yù)測效果比較
對插補后煙氣輪機前軸承YT-7702A通道振動全數(shù)據(jù)進行不同神經(jīng)網(wǎng)絡(luò)類型的1步最優(yōu)循環(huán)預(yù)測,以驗證Elman神經(jīng)網(wǎng)絡(luò)的預(yù)測效果。不同神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果如圖6所示,預(yù)測性能比較如表4所示。
從圖6可以看出,Elman神經(jīng)網(wǎng)絡(luò)1步預(yù)測較BP網(wǎng)絡(luò)1步預(yù)測和RBF 1步預(yù)測更接近實際的煙氣輪機運行狀態(tài)趨勢,結(jié)合表4的不同神經(jīng)網(wǎng)絡(luò)單步預(yù)測效果比較,可以發(fā)現(xiàn)Elman 1步預(yù)測步長的均方根誤差RMSE、平均相對誤差MAPE、平均絕對誤差MAE均比BP和RBF1步預(yù)測步長的小,充分說明Elman 神經(jīng)網(wǎng)絡(luò)的預(yù)測精度比BP和RBF網(wǎng)絡(luò)的預(yù)測精度高,驗證了遞歸型Elman神經(jīng)網(wǎng)絡(luò)在趨勢預(yù)測中的有效性。
神經(jīng)網(wǎng)絡(luò)均方根誤差/μm平均相對誤差/%平均絕對誤差/μmElman2.2373.241.817BP2.7714.012.262RBF3.0244.332.440
為揭示石油煉化的煙氣輪機設(shè)備運行發(fā)展的趨勢,提高煙氣輪機狀態(tài)趨勢預(yù)測的精度,從確保預(yù)測所用數(shù)據(jù)的可靠性和為給趨勢預(yù)測設(shè)定客觀有效的最優(yōu)預(yù)測步長兩方面出發(fā),提出一種改進Elman神經(jīng)網(wǎng)絡(luò)的趨勢預(yù)測方法,研究結(jié)論如下:
①引入的箱線圖異常值判別方法能夠簡捷快速、直觀明了地判別數(shù)據(jù)中的異常值,對缺失數(shù)據(jù)進行插補,鄰近點中位數(shù)插補方法最能反映原始數(shù)據(jù)的分布,能夠為煙氣輪機的狀態(tài)趨勢預(yù)測提供可靠的全數(shù)據(jù)序列。
②根據(jù)煙氣輪機運行狀態(tài)數(shù)據(jù)序列具有的時間依存性,計算數(shù)據(jù)序列不同時延的相關(guān)程度,以相關(guān)系數(shù)最大值點對應(yīng)的時延為最優(yōu)預(yù)測步長。最優(yōu)預(yù)測步長較其他預(yù)測步長Elman神經(jīng)網(wǎng)絡(luò)方法預(yù)測誤差上最小、預(yù)測精度更高,同時Elman最優(yōu)預(yù)測步長預(yù)測方法的預(yù)測精度較BP、RBF神經(jīng)網(wǎng)絡(luò)精度更高。
③改進Elman神經(jīng)網(wǎng)絡(luò)能夠為煙氣輪機的狀態(tài)趨勢預(yù)測提供一種有效的預(yù)測方法,該方法也可應(yīng)用于其他關(guān)鍵設(shè)備的趨勢預(yù)測中。