張 玲,卞建鵬,郝培旭,李亞敏,孫曉云
(石家莊鐵道大學 電氣與電子工程學院,石家莊 050043)
電力變壓器是發(fā)電廠和變電所不可或缺的設備,在輸變電環(huán)節(jié)中發(fā)揮著重要作用,其故障的發(fā)生將會影響電網的安全運行,保證電力變壓器正常運行對重要負荷不間斷供電以及電力系統(tǒng)穩(wěn)定運行有著重要意義.目前油中溶解氣體分析(dissolved gas analysis,DGA)技術較成熟,被認為是分析電力變壓器是否存在潛在故障的有效方法[1].DGA對于處理時間序列具有良好的效果,首先在油色譜在線監(jiān)測裝置上獲取變壓器油中各氣體含量值,形成時間序列進行分析[2],通過分析結果對采樣氣體濃度按時間分析其發(fā)展趨勢并進行下一時間點的預測.良好的預測結果有助于檢修人員及時發(fā)現變壓器中潛伏性故障,預防故障的發(fā)生[3].
目前已對油中溶解氣體濃度預測問題進行了大量的研究,該問題的研究對變壓器故障診斷提供了良好的數據基礎,大致分為三種方法:統(tǒng)計預測方法、智能預測方法以及組合預測方法.文獻[4]中應用非時序有監(jiān)督學習和時間序列模型對變壓器油中溶解氣體體積分數進行預測,該模型對時間序列預測精度不高;文獻[5]應用組合優(yōu)化預測模型預測變壓器中H2的溶解濃度.時間序列模型在預測線性序列時具有良好的效果,預測結果對于變壓器后續(xù)的故障診斷提供了可靠的數據,但油中溶解氣體濃度序列具有較強的非線性程度,時間序列在處理非線性序列上存在一定的局限性.對于傳統(tǒng)智能算法而言,其不能獲取序列數據之間的時序關聯性,因此對油中溶解氣體濃度的預測達不到較高的精度,影響變壓器故障診斷的準確率[6].目前深度學習技術正在不斷發(fā)展,日漸成熟,越來越多的研究也從傳統(tǒng)智能算法轉變?yōu)樯疃葘W習.循環(huán)神經網絡(recurrent neural network,RNN)在建立具有時間關聯的序列的模型問題中表現出了比傳統(tǒng)的神經網絡模型更明顯的優(yōu)勢,但RNN在訓練過程中存在一定的弊端,例如梯度彌散與梯度爆炸等.而長短期記憶(long short-term memory,LSTM)神經網絡是循環(huán)神經網絡的一種,在結構上與RNN的不同之處是它在RNN網絡結構的基礎上添加了“記憶”單元結構,該單元結構的引入有效解決了RNN在訓練過程中出現的問題[7].
文獻[8]運用經驗模態(tài)分解(empirical mode decomposition,EMD)方法對獲取的油中溶解氣體序列進行平穩(wěn)化處理,將原始序列通過EMD分解為一組時間尺度不同的子序列分量,再建立LSTM神經網絡預測模型對各子序列分量進行預測.但EMD算法存在混疊問題,導致EMD分解失效.因此,本文采用了補充集合經驗模態(tài)分解(complementary ensemble empirical mode decomposition,CEEMD)算法對變壓器油中的溶解氣體進行分解,然后采用LSTM算法進行預測以抑制噪聲的影響.在對數據進行歸一化后,劃分訓練集和測試集,之后采用R/S類分析法計算數據時序的Hurst指數,分析其重標度的累積均值離差的標度行為,從而驗證時序的非線性,并根據R/S類分析法計算出H值的大小將CEEMD分解出的分量構成微尺度、中尺度和宏尺度3種分量.針對三種分量分別進行人工蜂群算法(artificial bee colony,ABC)-LSTM網絡進行訓練和預測.
經驗模態(tài)分解算法是一種對信號自身進行特征分解的自適應信號分解法,在處理非線性信號的問題上有著很大的優(yōu)勢[9].但是原始的EMD算法會把同一標尺信號分解到一個或多個分量點,使信號具有多個標尺類型,從而出現混疊問題.為此,研究人員構造了一種有效的噪聲輔助處理辦法——CEEMD[10].CEEMD算法是在集合經驗模態(tài)分解(ensemble empirical mode decomposition,EEMD)的基礎上改變噪聲的添加方式,其算法是加入N對相反的噪聲,通過EMD算法分解為一組具有不同時間尺度的子序列分量,再經過2N次集成平均,最終得到有效的分解結果.具體分解步驟如下:
1) 在原始信號中每次加入一組符號相反、幅值相同的白噪聲信號,如式(1)~(2)所示.
(1)
(2)
其中:x(t)為原始信號;r(t)為正負噪聲.
2) 對y(t)進行EMD分解,得到加入正負噪聲的IMF1和 IMF2分量.
3) 將IMF1和IMF2的集成平均值作為最終的分解結果.
進行EMD處理時,多次的均值化處理能夠有效消除噪聲的影響,最終取得較為準確的結果.相比于EEMD,CEEMD分解過程中添加的成對白噪聲可以抵消時間序列的噪聲干擾,有利于子序列分量的重構.
由于傳統(tǒng)的人工神經網絡系統(tǒng)無法有效的對序列數據進行分析,其產生的輸出結果之間缺少有效的關聯,難以體現數據和時間之間的對應關系,RNN是專門用于處理有序數列的[11],RNN網絡結構如圖1所示.
圖1 RNN網絡結構Fig.1 Structure of RNN
圖1中,xt為t時刻的輸入,ht為隱藏層,zt為輸出層,Wxh、Whz、Whh分別為輸入層到隱藏層、隱藏層到輸出層以及上一個隱藏層到下一個隱藏層的權重矩陣.
與傳統(tǒng)的神經網絡模型相比,RNN神經網絡模型加入了“記憶”這一概念,將序列數據定義成一類以時間步長為參數的遞進時間序列,將時間參數融合在運算學習的過程中,使得每一個計算結果不僅僅基于當前時間節(jié)點,同時還與上一時間點的結果有關.RNN處理任意長度序列的能力只存在于理論層面,由于現實梯度彌散以及爆炸的出現,這一方法只能對短期依賴的序列進行處理.
長短期記憶神經網絡的記憶單元結構如圖2所示,計算過程為:首先通過t-1時刻的外部狀態(tài)ht-1和t時刻輸入xt進行三個門的計算;再利用輸入門it和遺忘門ft相結合對記憶單元ct進行更新;最后與輸出門ot進行結合將內部狀態(tài)傳遞給外部狀態(tài)ht.
圖2 LSTM記憶網絡結構Fig.2 Structure of LSTM memory network
LSTM網絡的輸入由t時刻的輸入值xt,t-1時刻的輸出值ht-1以及門控單元狀態(tài)ct-1三部分構成;網絡總輸出由t時刻的輸出值ht及門控單元狀態(tài)ct構成.遺忘門、輸入門和輸出門三個門分別處理記憶單元遺忘、輸入和輸出程度問題.
LSTM最終的輸出如式(3)~(5)所示.
(3)
(4)
ht=ot·tanh(ct).
(5)
LSTM網絡作為一種以RNN為基礎參照的學習神經網絡,其重點在于將信息傳遞模式進行優(yōu)化,引入門控理念,產生較為有效且梯度長時間穩(wěn)定流動的路徑,經過線性循環(huán),從根本上解決RNN長期依賴的弊病.
人工蜂群算法是基于蜜蜂群體的特定智能行為的最優(yōu)化算法[12].本文提出一種基于ABC-LSTM網絡的預測模型,具體步驟如下:
1) 參數進行初始化設置.其中ABC算法參數設置包括:雇傭蜂數量N,食物源最大循環(huán)次數limit,最大迭代次數MaxCycle;LSTM模型參數設置包括:隱含層神經元數量numHiddenUnits、分塊尺寸minBatchSize、最大訓練周期數maxEpochs以及學習率LR的搜素范圍.根據式(6)生成N個初始種群[13].
xij=xj min+rand(0,1)(xj max-xj min),
(6)
其中:i=1,2,…,N;j=1,2,…,D,D為待優(yōu)化的參數個數.
2) 適應度函數采用均方根誤差(RMSE),訓練前N個食物源的適應度.計算公式如式(7)所示.
(7)
式中:xi為真實值;ki為預測值;fi為食物源的適應度.
3) 雇傭蜂和觀察蜂進行篩選和計算.雇傭蜂根據式(8)對食物源xij進行篩選區(qū)分.觀察蜂根據式(9)計算每個食物源被選取的概率值Pi.
vij=xij+φij(xij-xkj),
(8)
(9)
其中:xij為初始值;xkj為候選值;φij為[-1,1]范圍內的隨機數.
4) 偵查蜂對無效食物源進行舍棄,根據式(6)重新定義食物源.
5) 根據給定條件進行判定,滿足條件,結束搜索,否則重復步驟3),直至取得最優(yōu)解.
6) 將最優(yōu)解輸入到模型中得到優(yōu)化后的模型,再把測試集數據輸入到優(yōu)化后的模型中,進行預測[14].建立該預測模型的流程如圖3所示.
圖3 ABC-LSTM網絡建模流程圖Fig.3 Flow chart of ABC-LSTM network modeling
本文采用四川電力科學研究院所提供的電力變壓器樣本數據集對油浸式電力變壓器中溶解氣體數據進行分析[15],與故障特性相關的特征氣體有CH4、C2H6、C2H4、C2H2、H2、CO、CO2,主要以其中5種氣體含量作為氣體特征參數.5種氣體分別為H2、CH4、C2H6、C2H4、C2H2,氣體含量作為輸入層,預測結果作為輸出層.樣本總數共計245個,劃分203個樣本為訓練集,42個樣本為測試集.
1) 讀取數據.部分數據如表1所列.文中以H2的監(jiān)測數據序列為例進行分析.
表1 變壓器部分溶解氣體數據Tab.1 Partial dissolved gas data of transformer μL/L
2) R/S非線性分析.在進行CEEMD分解之前需要計算時間序列的分形Hurst指數,以衡量數據的統(tǒng)計相關性.本文采用R/S類分析法計算Hurst指數[16],其可以用來表征溶解氫序列的非線性程度.
赫斯特指數H=0.5,表明時間序列隨機游走;0.5 3) CEEMD分解.針對溶解H2序列進行多模態(tài)的分解測試,當模態(tài)數為7的時候,測試顯示各分解波的得分最平穩(wěn).運用CEEMD將其分解成IMF1~IMF7分量和一個剩余分量R[18].分解結果如圖4所示. 圖4 CEEMD分解結果Fig.4 CEEMD decomposition results 4) R/S類分析法進行分量重構.由于CEEMD分解出的分量過多,利用式(10)分別計算各分量的Hurst指數,log(R/S)與log(n)存在線性關系,見表2和圖5. R/S=CnH, (10) 圖5 IMF和剩余分量R的Hurst指數Fig.5 Hurst index of IMF and residual component R 式中:R為重新標度的極差;H為Hurst指數值;S為標準差;n為區(qū)間長度;C為常數. 根據IMF分量和剩余分量R之間log(R/S)與log(n)的線性關系以及H值大小,將各分量重構成微尺度(H≤0.5)、中尺度(0.5 表2 不同IMF分量和剩余分量R的Hurst指數Tab.2 Hurst index of different IMF components and residual components R 圖6 不同尺度重構圖Fig.6 Reconstruction map of different scales 將三種重構分量分別進行ABC-LSTM網絡訓練和預測,經ABC優(yōu)化后的LSTM模型參數如表3所列[20].訓練結果如圖7所示,Loss表示網絡損失函數. 表3 LSTM模型優(yōu)化前后參數對比Tab.3 Comparison of parameters before and after LSTM model optimization 圖7 訓練結果Fig.7 Training results 微尺度、中尺度和宏尺度測試集的預測結果如圖8所示. 圖8 不同尺度測試集預測結果Fig.8 Prediction results of different scale test sets 將三種不同尺度分量的預測結果線性求和重構得到溶解H2最終預測結果,經驗證重構后的預測精度比直接預測氣體濃度的精度高.不同模型對溶解氫氣預測結果對比如圖9所示. 圖9 溶解氫氣預測結果Fig.9 Prediction results of dissolved hydrogen 本文選擇均方根誤差(RMSE)、平均相對誤差均值(MAPE)以及預測精度作為模型評價指標來衡量預測結果水平[21]. 將本文所提的CEEMD-ABC-LSTM網絡預測模型與EMD-LSTM、LSTM、ABC-SVM、ABC-BP網絡預測方法進行對比[22],結果如表4所列.根據表4可得,相較于EMD-LSTM、LSTM、ABC-BP和ABC-SVM預測模型,CEEMD-ABC-LSTM預測模型的RMSE指標分別降低了4.58%、8.94%、11.72%、11.40%;MAPE指標分別降低了0.29%、0.4%、0.6%、0.54%;預測精度分別提高了2.51%、6.61%、8.71%、8.40%.由表4中數據分析可知CEEMD-ABC-LSTM模型在三種指標下均表現出更好的適應性. 表4 不同模型預測結果對比Tab.4 Comparison of prediction results of different models 對不同算法進行誤差分析[23],如圖10所示,用boxplot顯示數據誤差的離散分布情況.由于樣本誤差數值范圍較大,所以對各種算法的樣本誤差進行歸一化處理,由于CEEMD分解消除了時間序列數據間噪聲耦合并采用分量重構的方法,由圖10可得,與EMD-LSTM、LSTM、ABC-BP和ABC-SVM相比,CEEMD-ABC-LSTM算法的誤差范圍更集中且誤差最大值和中位數更小,故本文提出的預測模型魯棒性更好. 圖10 不同算法誤差分布圖Fig.10 Error distribution of different algorithms 對不同氣體濃度預測結果如表5所列,可得CEEMD-ABC-LSTM網絡模型預測方法無論在平均相對誤差、根均方誤差和預測精度方面均優(yōu)于其他幾種方法,預測結果更穩(wěn)定. 表5 不同氣體濃度預測結果對比Tab.5 Comparison of prediction results of different gas concentrations 本文主要對變壓器油中的溶解氣體進行CEEMD分解后采用ABC-LSTM算法進行預測,并應用實例進行分析比對,結論如下: 1) 運用CEEMD分解可以有效地抑制EMD的模態(tài)混疊現象,將非平穩(wěn)、非線性信號自適應地分解成若干個不同尺度的固有模態(tài)分量,有利于進一步挖掘時序特性. 2) 與EMD-LSTM、LSTM、ABC-BP和ABC-SVM相比,CEEMD-ABC-LSTM由于針對微尺度、中尺度和宏尺度三種分量分別進行訓練和預測,并將不同尺度的預測結果運用線性求和進行重構,因此具有較高的預測穩(wěn)定性與可靠性. 本研究取得了不錯的故障特征氣體預測效果,可為后續(xù)變壓器的故障診斷和狀態(tài)評估提供理論指導.3.2 基于ABC-LSTM網絡變壓器氣體預測
3.3 預測模型評價
4 結論