王士彬, 李多, 趙娜, 謝文龍, 黃偉, 季鴻宇
(1. 國網(wǎng)重慶市電力公司市南供電分公司, 重慶 401336;2. 重慶理工大學(xué)電氣與電子工程學(xué)院, 重慶 400054)
油浸式電力變壓器作為輸變電系統(tǒng)中的核心設(shè)備之一[1], 發(fā)生故障時會導(dǎo)致電網(wǎng)正常供電受影響, 及時發(fā)現(xiàn)變壓器潛在故障并準確識別故障類型對確保電網(wǎng)穩(wěn)定可靠供電具有重要意義。 目前, 油中溶解氣體分析(dissolved gas analysis, DGA) 技術(shù)已被廣泛應(yīng)用于工程實踐中[2], 特征氣體法將油中溶解氣體H2、 CH4、 C2H4、 C2H2、 C2H6等作為特征氣體, 通過分析特征氣體含量識別故障類型, 國內(nèi)外學(xué)者基于DGA 數(shù)據(jù)將特征氣體比值作為特征量提出Dornenburg 比值法[3]、 IEC 三比值法[4]、 Rogers 四比值法等診斷方法。 由于油中溶解氣體含量與變壓器故障類型之間復(fù)雜的映射關(guān)系,特征氣體法和比值法無法精確識別變壓器故障類型, 已逐漸成為一種輔助方式。
近年來, 將智能算法與DGA 技術(shù)相結(jié)合已成為提升變壓器故障診斷準確率和可靠性的重要方法, 例如神經(jīng)網(wǎng)絡(luò)[5-6]、 支持向量機[7-8]、 模糊理論[9]等。 上述方法有效提升了診斷準確率, 但由于算法本身的局限性仍存在不足: 神經(jīng)網(wǎng)絡(luò)所需訓(xùn)練樣本過大, 收斂速度過慢, 效率較低; 支持向量機分類性能受核參數(shù)和懲罰因子的值影響; 模糊理論對于樣本數(shù)據(jù)完整性要求較高, 且存在學(xué)習(xí)能力不足的問題。 核極限學(xué)習(xí)機 (kernel extreme learning machine, KELM)[10]在極限學(xué)習(xí)機(extreme learning machine, ELM) 的基礎(chǔ)上引入核函數(shù)思想, 有效解決了ELM 因隨機生成初始權(quán)值和閾值而導(dǎo)致分類效果差的問題, 但單一核函數(shù)難以同時保證學(xué)習(xí)精度和泛化性。
針對上述問題, 提出一種基于改進北方蒼鷹算法(improved northern goshawk optimization algorithm,INGO) 優(yōu)化HKELM 的變壓器故障診斷方法。首先利用ReliefF 算法進行特征優(yōu)選, 然后引入Logistic-tent 混沌映射、 柯西變異和非線性遞增權(quán)重改進北方蒼鷹優(yōu)化算法, 提高北方蒼鷹算法(northern goshawk optimization, NGO) 的尋優(yōu)能力和收斂精度, 同時將多種核函數(shù)加權(quán)構(gòu)成HKELM;再使用改進后的INGO 算法對HKELM 模型參數(shù)進行優(yōu)化; 最后與不同診斷模型的診斷效果進行對比, 驗證所提方法的有效性和可靠性。
北方蒼鷹優(yōu)化算法 ( northern goshawk optimization, NGO) 是由Mohammad Dehghani 等人于2021 年提出的一種新型群智能優(yōu)化算法[11]。 該算法模擬北方蒼鷹的狩獵行為, 結(jié)構(gòu)簡單、 性能優(yōu)良。 北方蒼鷹的捕獵過程可分為兩個階段: 獵物識別階段、 追擊和逃逸階段。
1.1.1 獵物識別階段
北方蒼鷹在此階段會隨機選擇一個獵物并攻擊, 數(shù)學(xué)表達式如下:
式中,Pi表示第i只北方蒼鷹所選獵物的位置;FPi是目標函數(shù)值;Fi為第i個解的目標函數(shù)值;k為[1,N] 的自然數(shù);Xi,new,P1表示第i只北方蒼鷹在此階段的新狀態(tài);xi,j,new,P1表示第i只北方蒼鷹在j維的新狀態(tài);Fi,new,P1是其對應(yīng)的目標函數(shù)值;r為[0, 1] 的隨機數(shù);I的值為1 或2。
1.1.2 追擊和逃逸階段
在對獵物發(fā)起攻擊后, 獵物會試圖逃跑, 北方蒼鷹會對獵物發(fā)起追擊, 此階段數(shù)學(xué)表達式如下:
式中,R表示狩獵半徑;t為當(dāng)前迭代次數(shù);T為最大迭代次數(shù);Xi,new,P2是在第二階段第i只北方蒼鷹的新狀態(tài);xi,j,new,P2為此階段第i只北方蒼鷹在第j維的新狀態(tài);Fi,new,P2為對應(yīng)的目標函數(shù)值。
標準的NGO 算法雖具有良好的穩(wěn)定性及較高的收斂精度, 但同大多數(shù)傳統(tǒng)群智能算法一樣, 種群初始化仍采用隨機分布的方式, 從而導(dǎo)致初始解分布不均勻。 其次, 在標準NGO 算法的第二階段,北方蒼鷹追捕獵物的速度非??? 會導(dǎo)致算法搜索速度加快, 易陷入局部最優(yōu)解的情況。
為進一步提升NGO 算法的性能, 從以下三個方面對NGO 算法進行改進: 引入Logistic-tent 混沌映射初始化種群, 提升求解效率; 引入柯西變異策略對最優(yōu)蒼鷹個體的位置進行擾動, 避免算法陷入局部最優(yōu); 引入非線性遞增權(quán)重, 平衡全局搜索和局部開發(fā)的能力。 改進后的INGO 算法流程如圖1所示。
圖1 INGO 算法流程
1.2.1 Logistic-tent 混沌映射初始化種群
初始種群直接影響算法的收斂速度和尋優(yōu)效果, 在標準NGO 算法初始化時, 北方蒼鷹初始位置分布不均, 造成部分初始解局部聚集, 因此引入Logistic-tent 混沌映射初始化種群, 使初始種群在解空間中分布更加均勻, 提升算法的尋優(yōu)速度。 其表達式如下:
式中,γ為控制參數(shù), 取值范圍 (0, 4) ;Xn∈[0, 1] ;n為迭代次數(shù); modl 表示對該式進行取模運算。
1.2.2 柯西變異策略
標準NGO 算法在尋優(yōu)時所有蒼鷹個體均向最優(yōu)個體聚集, 在算法后期, 種群多樣性會隨之降低, 導(dǎo)致算法易陷入局部最優(yōu)的情況。 為降低局部最優(yōu)對算法尋優(yōu)能力的影響, 引入柯西變異策略對當(dāng)前最優(yōu)個體進行擾動, 以確保算法能順利跳出局部極值區(qū)。 柯西變異源自于柯西分布, 柯西分布函數(shù)表達式如下:
將柯西變異算子引入NGO 算法中, 充分利用其擾動能力調(diào)整最優(yōu)蒼鷹個體的目標函數(shù)值, 表達式如下:
式中,Cauchy(0, 1) 為標準柯西分布函數(shù);Xbest表示最優(yōu)蒼鷹個體的目標函數(shù)值。
1.2.3 引入非線性遞增權(quán)重
為降低NGO 算法迭代后期最優(yōu)個體對種群中其他個體的吸引力[12], 引入一種非線性遞增權(quán)重β, 如式(10) 所示。 在迭代初期, 較小的β能提升算法的全局搜索能力。 而在迭代后期, 較大的β能加快算法的收斂速度。 新的位置更新公式如式(11) 所示:
式中,T為最大迭代次數(shù)。
為驗證INGO 算法的有效性, 選取Schwefel 函數(shù)和Rastrigin 函數(shù)作為測試函數(shù)進行性能測試, 并與粒子群優(yōu)化算法 (particle swarm optimization,PSO)、 灰狼優(yōu)化算法 (grey wolf optimization,GWO)、 鯨魚優(yōu)化算法 ( whale optimization algorithm, WOA) 和標準NGO 算法進行對比。Schwefel 函數(shù)為單峰值函數(shù), 有唯一最小值0, 但存在很多局部極小值, 通常用來測試算法跳出局部最優(yōu)的能力, 表達式為:
Rastrigin 函數(shù)為多峰值函數(shù), 同樣具有很多局部極小值, 有唯一最小值0, 可用來測試算法的全局開發(fā)能力, 表達式如式(13) 所示:
對這兩個測試函數(shù)進行尋優(yōu)測試, 最大迭代次數(shù)Tmax=1 000, 維數(shù)d=30, 測試結(jié)果如圖2、 圖3和表1 所示。
表1 五種優(yōu)化算法尋優(yōu)結(jié)果比較
圖2 f1 (x ) 尋優(yōu)過程
圖3 f2 (x ) 尋優(yōu)過程
由圖2、 圖3 和表1 可知, 對于測試函數(shù)f1(x) , 改進后的INGO 算法迭代74 次找到最優(yōu)值0, 其余4 種算法均未達到最優(yōu)值; 對于測試函數(shù)f2(x) , INGO 算法僅用4 次迭代尋找到最優(yōu)值0,明顯快于其余4 種算法。 以上結(jié)果表明改進后的INGO 算法相對于其他4 種算法在收斂速度、 收斂精度和尋優(yōu)能力上表現(xiàn)最佳, 驗證了改進策略的有效性。
極限學(xué)習(xí)機(extreme learning machine, ELM)以單隱層前向神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)改進而來, 結(jié)構(gòu)相較于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)更加簡易, 有效地提升了算法性能[13]。 ELM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖4 所示。
圖4 ELM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
假設(shè)有n個訓(xùn)練樣本(xi,yi), 其中xi為輸入,yi為輸出,i=1, 2, 3, …,n。 對于一個隱含層節(jié)點數(shù)為K, 激活函數(shù)為g(x) 的ELM 神經(jīng)網(wǎng)絡(luò), 其矩陣表述為:
式中,H為ELM 隱含層輸出矩陣;T為訓(xùn)練樣本真實值所構(gòu)成的矩陣;β為隱含層節(jié)點與輸出層之間的權(quán)值矩陣;ωi為第i個隱含層節(jié)點與輸入層節(jié)點之間的權(quán)值;bi為第i個隱含層節(jié)點的閾值。
通過求解式(13) 的最小范數(shù)最小二乘解,可得到最優(yōu)權(quán)值β*。 最優(yōu)權(quán)值求解公式為:
式中,H+為矩陣H的Moore-Penrose 廣義逆變換。
為進一步提升ELM 的學(xué)習(xí)能力和泛化性,Huang 等人將核函數(shù)思想引入ELM, 構(gòu)造出一種新的核極限學(xué)習(xí)機(KELM)。 核函數(shù)由于具有良好的非線性映射能力, 使得KELM 性能更加穩(wěn)定且泛化能力更加出色[14]。 基于Mercer's 條件定義可得:
式中, 由核函數(shù)矩陣ΩELM替代ELM 中的隨機矩陣HHT;h(x) 為ELM 神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點輸出函數(shù);K(xi,xj) 為核函數(shù), 合適的核函數(shù)對于KELM 的性能有著極大的提升, 常用的核函數(shù)有徑向基(radial basis function, RBF) 核函數(shù)、 多項式核(polynomial, Poly) 函數(shù)和線性核函數(shù)等。 RBF 作為典型的局部型核函數(shù)具有較強的學(xué)習(xí)能力, 但泛化能力較弱; 多項式核函數(shù)為全局型核函數(shù), 學(xué)習(xí)能力較弱但泛化能力強[15]。 為進一步提升KELM的學(xué)習(xí)能力和泛化性, 將RBF 和Poly 核函數(shù)加權(quán)組合成混合核函數(shù)[16], 表達式為:
式中,σ為RBF 核函數(shù)的寬度參數(shù);c和d為Poly核函數(shù)的核參數(shù);μ為兩個核函數(shù)間的權(quán)重系數(shù)。
將單位矩陣E和正則化系數(shù)C加入ELM 神經(jīng)網(wǎng)絡(luò)的隨機矩陣HHT的主對角線元素上, 此時ELM 神經(jīng)網(wǎng)絡(luò)輸出權(quán)值β*計算公式為:
基于式 (17)、 (18) 可求得HKELM 的輸出為:
由于HKELM 模型中參數(shù)較多, 為避免人工設(shè)置初始參數(shù)誤差大, 利用INGO 對HKELM 模型的正則化系數(shù)C、 混合核函數(shù)參數(shù)σ、c、d和μ進行優(yōu)化。
為提高HKELM 的分類性能, 利用INGO 算法對HKELM 模型的初始參數(shù)進行尋優(yōu), 以得到更加準確可靠的變壓器故障診斷結(jié)果。 INGO-HKELM變壓器故障診斷模型流程如圖5 所示。
圖5 基于INGO-HKELM 的變壓器故障診斷流程
該流程主要分為以下4 個步驟:
1) 收集以H2、 CH4、 C2H4、 C2H2、 C2H6體積分數(shù)作為特征量的變壓器故障樣本數(shù)據(jù)集, 根據(jù)以上氣體之間的相對比值構(gòu)建候選特征集, 對樣本數(shù)據(jù)進行歸一化處理, 劃分測試集和訓(xùn)練集。
2) 利用ReliefF 算法計算各候選特征的權(quán)重值并排序, 選擇出最優(yōu)輸入特征集。
3) 利用改進后的INGO 算法對HKELM 模型的初始參數(shù)進行優(yōu)化。
4) 將步驟2) 中所選特征作為INGO-HKELM模型的輸入進行故障診斷。
按照DL/T 722—2014 《變壓器油中溶解氣體分析和判斷導(dǎo)則》, 將變壓器運行狀態(tài)分為低溫過熱、 中溫過熱、 高溫過熱、 局部放電、 低能放電、高能放電和正常這7 種類型, 類別編號為1—7。文中試驗所用數(shù)據(jù)來源于文獻[17] 和[18], 共計248 組變壓器DGA 數(shù)據(jù), 按照7 ∶3 的比例劃分為訓(xùn)練集和測試集。 變壓器運行狀態(tài)編號及樣本分布見表2。
表2 運行狀態(tài)編號及樣本分布
目前, 大部分變壓器故障診斷方法都是采用H2、 CH4、 C2H4、 C2H2、 C2H6等主要特征氣體或部分氣體之間的相對比值作為輸入特征量。 由于變壓器故障類型與特征氣體濃度之間映射關(guān)系極其復(fù)雜, 為進一步挖掘故障表征與故障類型之間的聯(lián)系, 本文以上述5 種氣體為基礎(chǔ), 參照文獻[19]、 [20] 構(gòu)建變壓故障特征集, 見表3, 其中C1 =CH4+C2H4+C2H2+C2H6, C2 =CH4+C2H4+C2H2, ALL=H2+CH4+C2H4+C2H2+C2H6。
表3 變壓器故障候選特征及編號
合理的輸入特征能極大地提升診斷準確率, 為獲取包含信息豐富、 冗余度小和維度低的輸入特征集, 選用ReliefF 算法進行輸入特征子集的選擇。ReliefF 是一種快速高效的過濾式特征選擇算法,通過計算每個特征的權(quán)重表示特征對于分類的作用, 如圖6 所示, 權(quán)重值越大, 對于分類作用越大。
圖6 特征權(quán)重柱狀圖
將權(quán)重值由大到小排序并選取前m個最大特征作為輸入特征,m值與分類正確率的關(guān)系如圖7所示。 由圖7 可知, 當(dāng)m為7 時(輸入特征編號為11、 17、 10、 8、 19、 13、 12), 故障診斷率最高為86.34%, 故選取前7 維特征作為輸入特征。
圖7 不同m 取值的故障診斷模型正確率對比圖
求取INGO-HKELM 模型對測試集診斷結(jié)果的準確率, 圖8 為診斷結(jié)果的混淆矩陣, 表4 給出了INGO-HKELM 故障診斷模型的評價指標。 由圖8和表4 可知, 所提INGO-HKELM 模型對變壓器7種運行狀態(tài)的查全率和查準率均在80%以上; 經(jīng)計算, 故障診斷準確率為93.2%, 表明所提模型具有良好的診斷性能。
表4 INGO-HKELM 模型評價指標%
圖8 INGO-KHELM 故障診斷結(jié)果
將經(jīng)過ReliefF 篩選后的特征作為輸入特征,以分類準確率為目標函數(shù), 利用INGO、 NGO 和PSO 算法對HKELM 的初始參數(shù)進行優(yōu)化, 得到最優(yōu)參數(shù)。 此外, 為驗證INGO-HKELM 故障診斷模型的優(yōu)越性, 選取GWO-KELM、 SMA-SVM、PSO-DELM 三種優(yōu)化型診斷模型進行對比, 上述模型診斷結(jié)果見表5。 上述所有模型迭代次數(shù)均為50 次, 初始種群為30。
表5 不同診斷模型故障診斷結(jié)果對比
由表5 可知, 文中所提INGO 優(yōu)化HKELM 模型相較于PSO 和NGO 優(yōu)化HKELM 模型具有更高的診斷準確率和更快的收斂速度; 與GWO -KELM、 SMA-SVM、 PSO-DELM 三種優(yōu)化型診斷模型相比, 文中所提出的INGO-HKELM 模型同樣具有更高的診斷準確率和更快的收斂速度, 表明所提出的INGO-HKELM 變壓器故障診斷模型收斂速度快、 診斷精度高, 具有一定的優(yōu)勢。
為說明文中所提變壓器故障診斷模型的優(yōu)越性, 與基于DGA 的IEC 三比值法進行診斷結(jié)果對比, 對同一測試集進行故障診斷, 診斷結(jié)果見表6。 由本文所提方法的故障診斷正確率為93.2%,IEC 三比值法診斷正確率為70%, 但IEC 三比值法對于高溫過熱狀態(tài)的識別優(yōu)于文中所提方法, 其余運行狀態(tài)的識別文中所提方法均優(yōu)于IEC 三比值法。 綜合來看, 文中所提出的變壓器故障診斷模型相較于IEC 三比值法具有更好的診斷性能。
表6 不同方法診斷準確率對比%
對文獻[21] 所提供實例進行分析, 某變電站500 kV 主變壓器發(fā)生故障, 油色譜數(shù)據(jù)見表7。
表7 某500 kV 主變油色譜數(shù)據(jù)μL/L
利用文中所提出的INGO-HKELM 變壓器故障診斷模型對表7 數(shù)據(jù)進行故障識別, 得出該主變壓器發(fā)生高溫過熱故障的結(jié)論, 與實際故障相符, 驗證了INGO-HKELM 模型的準確性。
本文提出基于INGO-HKELM 的變壓器故障診斷方法, 通過對比分析, 得出如下結(jié)論:
1) 在標準北方蒼鷹算法的基礎(chǔ)上引入混沌映射、 柯西變異策略和非線性特征權(quán)重三種策略對其進行改進, 結(jié)果表明, 改進策略有效提升了算法的收斂速度和精度, 證明改進方法的有效性。
2) 利用ReliefF 算法對變壓器故障數(shù)據(jù)進行特征優(yōu)選, 去除了冗余信息。 使用改進后的北方蒼鷹算法優(yōu)化HKELM 的參數(shù), 提高了HKELM 的診斷準確率和泛化能力。
3) 通過變壓器實際故障數(shù)據(jù)驗證表明, 文中所提出的INGO-HKELM 模型相較于其他故障診斷模型具有更高的診斷準確率和收斂速度。
本文所提出的INGO-HKELM 模型有效提高了故障診斷準確率, 但在輸入特征的選擇方面仍有改進的空間, 后續(xù)可研究CO、 CO2對故障診斷的影響。