黎煒,宋永強,郭文東,宋仕軍,王杰
(國家電網寧夏電力公司吳忠供電公司,寧夏吳忠 751100)
目前,電網公司通過智能資產管理和控制運營成本為用戶提供更高質量的服務。輸電系統(tǒng)最重要的資產——電力變壓器,發(fā)生故障的風險會隨著使用時間而逐漸增加[1-3]。變壓器故障通常會導致電網大面積斷電,且更換一個變壓器的費用又較為昂貴。因此,電網公司必須有效管理這些資產,并及時檢測設備的運行狀態(tài)以降低運營成本和設備的故障率[4]。
通常電網公司依靠專家來分析從變壓器收集的數據,并使用常規(guī)方法診斷變壓器的狀態(tài)[5]。當專家無法及時趕到現(xiàn)場時,難以進行故障診斷。此外,常規(guī)方法如三值比較法和色譜分析法有時無法得到全面準確的診斷結果[6-8]。
近年來,各種機器學習算法如支持向量機(support vector machine,SVM)[9]、樸素貝葉斯分類器(naive bages classifier,NB)[10-11]、BP神經網絡[12]和決策樹算法[13]因其分類性能被廣泛應用到變壓器的故障診斷之中。單個決策樹算法需要選擇具有判別性的特征才能有較好的分類能力。而集成學習[14-16]可以通過構建并融合多個基學習器來提升單個分類器的性能,被廣泛用于金融、生物醫(yī)學和電力工程等領域。因此,本文提出了基于決策樹集成算法的電力變壓器狀態(tài)評估方法以進行輔助診斷。構建一個集成學習系統(tǒng)通常包括以下3步:(1)從數據集中采樣部分數據構建訓練集;(2)訓練一系列基分類器;(3)融合基分類器構建決策分類器。使用集成學習的方法能有效提高分類器的精度和泛化能力。本文首先使用多目標二進制編碼遺傳算法從變壓器溶解氣體中選擇出有效的特征,然后使用訓練樣本訓練多個基決策樹分類器,并使用遺傳算法選擇性集成部分基分類器以構造強分類器提升分類性能。最后,使用D-S融合規(guī)則融合基分類器的分類結果得到最終的診斷結果。由此驗證,該系統(tǒng)可以有效地提高變壓器故障的診斷精度。
變壓器在不同的運行狀態(tài)下會產生不同程度的能量,導致變壓器內進行著不同的化學反應,并生成不同濃度的氣體[17-18](如:H2、CH4、C2H4、C2H6和C2H2)溶解在變壓器油中,通過分析變壓器油中這些溶解氣體的成分可評估變壓器的故障類型。目前,為了分析變壓器的故障類型,提出了幾種標準和方法,如IEEE C57.104和IEC 60599標準[17]。雖這些標準和方法均具有一定的檢測精度,但其檢測精度受變壓器的類型、運行環(huán)境和技術條件影響,僅使用這些方法并不能保證診斷結果的正確性。
在上述檢測標準中通常將變壓器的故障分為3大類:局部放電(partial discharge,PD)、電能放電(electric discharge,ED)和過熱(over heating faults,OHF)。表1總結了IEC 60599的變壓器故障診斷標準。在表1中前3種故障類型分別為PD和ED,其余的為OHF。不同溶解氣體的比值也可用于故障診斷,稱為R和P比,并可以分別由表2中的F6~F10和F11~F13表示。本文使用R和P比值、5種溶解氣體(F1~F5)含量以及5種溶解氣體(F14)的累積值作為變壓器故障診斷的輸入特征。
表1 IEC 60599的變壓器故障診斷標準Tab.1 Transformer fault diagnosis criteria as per IEC 60599
表2 電力變壓器故障診斷所使用的特征Tab.2 Characteristics the fault diagnosis of power transformers uses
圖1 優(yōu)化目標示例Fig.1 A sample of optimization objectives
在機器學習中通常使用特征選擇技術來降低訓練數據的維度,并選擇最相關的特征來增強分類器的性能。傳統(tǒng)的特征選擇方法均是使用單目標優(yōu)化算法,本文則使用多目標遺傳算法來選擇有效的特征。
為降低特征的維度,本文使用多目標二進制編碼遺傳算法來選擇出有效的特征。優(yōu)化目標用一個長度為14的二值向量表示。如圖1所示,其中1表示選擇該特征;0表示不選擇該特征。在該多目標特征子集選擇問題中,本文通過選擇最優(yōu)的特征子集和最少的特征數量來最小化分類器誤差,并使用5折交叉驗證來計算分類誤差。通常一個分類器的分類性能可由式(1)來衡量。
式中:k表示交叉驗證的次數;n表示樣本數目;y?表示每一個樣本的目標值;y表示分類算法的輸出值。
本文構建的多目標特征子空間選擇模型為
式中:wtr=0.8表示訓練集的權重;Fitnesstr表示訓練集的分類誤差;Fitnessval表示驗證集的分類誤差,Nf表示選擇的特征種類數目。式(2)用于最小化特征子集的分類誤差,式(3)用于最小化特征數量以減小誤差診斷系統(tǒng)的復雜度。
本文使用C4.5決策樹作為集成系統(tǒng)的基分類器,并使用遺傳算法選擇部分分類性能和多樣性較好的基分類器構建決策系統(tǒng),最后使用D-S融合規(guī)則得到最終的分類結果。該集成系統(tǒng)構建流程圖,如圖2所示。
這里假設有一個包含N個樣本的訓練集D={(x1,y1),(x2,y2),…,(xN,yN)},其中表示一個樣本實例,n為所選擇特征的個數,yi=(1,2,…,K)表示樣本的類別。
圖2 集成系統(tǒng)構建流程圖Fig.2 Flow chart of the Integrated system construction
為了增強決策樹的分類性能,本文從所有訓練得到的基分類器中選擇泛化能力最優(yōu)和數量最小的基分類器組合成一個強分類器。由于泛化能力和分類器數量是相互矛盾的,即基分類器的數目越少得到的決策分類器的精度會越低。為了使得到的決策分類器既具有較高的分類精度又有較少的基分類器數目,本文使用多目標遺傳算法來優(yōu)化這2個目標。
使用上文給出的訓練集D,訓練得到T個基決策樹分類器,令Hs為最終得到的分類器組合,其中s∈{0,1}T,若st=1則分類器ht被選擇。表示決策分類器對樣本i的輸出,則每次迭代需要優(yōu)化的目標函數有以下2個。
目標1,分類精度:本文計算每個樣本的均方誤差來表示分類器的分類精度,最大化分類精度即使均方誤差最小,集成分類器的預測精度表示如式(4)所示,本文使用10折交叉驗證來計算穩(wěn)定的誤差估計值。
目標2,分類器數目:基分類器的數目越少,基分類器間的多樣性也會越高,決策分類器Hs的數目為
本文所構建的多目標優(yōu)化函數如式(6)所示。
本文使用二值編碼遺傳算法求解上述問題,并簡稱為EDTE(evolutionary decision tree ensemble)。由于傳統(tǒng)的遺傳算法專注于全局搜索而忽略了局部信息,本文使用文獻[15]提出的VDS(variable depth search)算法進行局部搜索以提升遺傳算法解的質量。詳細的EDTE算法流程如下所述。EDTE算法。
步驟如下:
1)隨機置s的部分位為0,其他位為1,得到種群P={s};
2)Repet;
3)隨機均勻的從P中選擇一個s;
4)以1/T的概率翻轉s的部分位,得到s′;
5)若P中不存在優(yōu)于s'的解,則刪除弱于s′的解,并將s′插入P中;
6)調用VDS進行局部搜索得到Q;
7)若P中不存在優(yōu)于Q的解,則刪除弱于Q的解,并將Q插入P中。
輸出:使目標函數g(s)最小的s。
為了得到最終的診斷結果,需要組合所有基分類器的分類結,最好的方法是計算出變壓器發(fā)生故障的概率。Dempster-Shafer(D-S)理論是一種擴展貝葉斯推理的方法,其能捕獲和組合不同來源的信息,下面簡要介紹其原理。
D-S方法主要包括3種函數:概率質量函數m、置信度函數Bel和似真度函數Pl。其中,概率質量函數是D-S組合中最重要的函數,其符合式(7)所示的條件:
D-S組合能融合基分類器的輸出m1和m2得到最終的決策結果,具體的融合方式如式(8)所示:
為了驗證本文所提出算法的有效性,使用了一個包含101個樣本的溶解氣體數據集進行仿真測試。該數據集中4種變壓器狀態(tài)的樣本數量,如表3所示。在圖3中使用H2含量為橫軸,CH4含量為縱軸畫出了各種故障類型的分布情況。從圖中可以看出,各種樣本的分布情況極不均衡,而使用單一的決策樹算法難以準確對其分類。本文將這101組數據按6:2:2的方式隨機分成訓練集、驗證集和測試集。
表3 溶解氣體數據集中4種變壓器狀態(tài)的樣本數量Tab.3 Sample number of 4 transformer states in dissolved gas data
圖3 各種故障類型樣本的分布情況Fig.3 Distribution of samples of various types of failures
在第1部分給出了本文使用的14種特征類型。在特征選擇部分,文中首先選擇每種故障類型的決定性特征,并將其作為訓練分類器的輸入特征。下面具體介紹ED故障類型的特征選擇過程與結果。
如圖4所示,首先給出了ED故障的特征選擇階段得到的5個非決定解S1~S5,這5個解分別對應著能有效分類ED故障的特征組合。分別使用這5組特征訓練分類器,并使用多目標二進制編碼遺傳算法來選擇精度和多樣性均較高的解。在表4中,給出了5折交叉驗證得到的各組特征的分類誤差。從該表中可以看出,使用S3的特征組合能得到更好的故障診斷性能。因此,使用S3的特征組合作為ED故障的分類特征。如表5所示為4種電壓變壓器狀態(tài)所對應的最優(yōu)特征組合。
表4 ED故障得到的種特征組合在驗證集上的誤差Tab.4 Errors of the combinations of features obtained by ED faults on the validation set
圖4 不同特征組合所對應的驗證集誤差Tab.4 Errors of the combinations of features obtained by ED faults on the validation set
表5 4種變壓器狀態(tài)得到的最優(yōu)特征組合Tab.5 The optimal combination of 4 kinds of transformer states
本部分將文中提出的EDTE算法與SVM、NB和單個決策樹算法進行比較,并使用5折交叉驗證求取平均分類精度。如圖5所示,給出了在不同截斷閾值下的分類精度曲線。從圖5中可以看出,本文提出的EDTE算法幾乎在所有閾值下均能得到較好的精度。
圖5 不同截斷閾值下各算法的分類精度曲線Fig.5 Classification accuracy curve of each algorithm under different truncation thresholds
如圖6所示給出了不同算法對測試集上各樣本的診斷概率,診斷概率表示分類器對分類結果的確定程度。在圖6中畫出了一條黑色的截斷閾值線,表示90%的診斷概率。從圖6中可以看出,90%的診斷概率下本文提出的EDTE算法只分類錯誤2個樣本,而SVM、NB和DT算法分別誤判3、7和8個樣本。因此,本文提出的算法具有較高的分類精度,且相對于單個決策樹算法具有較大的提升。
圖6 不同算法在測試集上的分類結果Fig.6 Classification results of different algorithms on the test set
電力變壓器的運行狀態(tài)隨著環(huán)境的變化而變化,且不同的變壓器正常運行時溶解氣體的組成也各不相同。本文提出了基于決策樹集成算法的電力變壓器狀態(tài)評估方法以進行輔助診斷。該方法首先使用多目標二進制編碼遺傳算法從變壓器溶解氣體的14種特征中選擇有效的分類特征。然后,使用這些特征訓練一系列基決策樹分類器,并使用遺傳算法選擇集成部分精度較高的決策樹構造強分類器提升分類性能。最后,使用D-S融合規(guī)則融合基分類器的分類結果得到最終的診斷結果。通過將本算法與SVM、NB和單個決策樹算法進行比較,表明該算法不僅提升了決策樹的分類性能,且能夠提高電力變壓器的診斷精度,具有良好的實用性。
[1]ZHANG X,GOCKENBACH E.Asset-management of transformers based on condition monitoring and standard diagnosis[J].IEEE Electrical Insulation Magazine,2008,24(4):26-40.
[2]楊啟平,薛五德,藍之達.變壓器絕緣老化的診斷與壽命評估[J].變壓器,2004,41(2):13-17. YANG Qiping,XUE Wude,LAN Zhida.Diagnosis and life evaluation of transformer insulation aging[J].Transformer,2004,41(2):13-17.
[3]ABU-ELANIEN A E B,SALAMA M M A.Asset management techniques for transformers[J].Electric Power Systems Research,2010,80(4):456-464.
[4] 楊佳華,楊振睿,陸駿,等.基于風險概率的電力變壓器設備風險評估技術研究[J].電網與清潔能源,2012,28(3):44-49. YANG Jiahua,YANG Zhenrui,LU Jun,et al.Study on risk assessment of power transformer equipment based on risk probability[J].Power Grid and Clean Energy,2012,28(3):44-49.
[5] 劉嘉林,董明,安珊,等.電力變壓器局部放電帶電檢測及定位技術綜述[J].絕緣材料,2015(8):1-7. LIU Jialin,DONG Ming,AN Shan,et al.A summary of partial discharge detection and location technology for power transformers[J].Insulation Materials,2015(8):1-7.
[6]施恂山,馬宏忠,張琳,等.PSO改進RBPNN在變壓器故障診斷中的應用[J].電力系統(tǒng)保護與控制,2016,44(17):39-44. SHI Xunshan,MA Hongzhong,ZHANG Lin,et al.PSO improved the application of RBPNN in transformer fault diagnosis[J].Power System Protection and Control,2016,44(17):39-44.
[7] 呂守國,崔玉新,馮迎春,等.基于綜合分析方法的變壓器故障診斷技術與軟件開發(fā)[J].電力系統(tǒng)保護與控制,2017(10):98-102. LYU Shouguo,CUI Yuxin,F(xiàn)ENG Yingchun,et al. Transformerfaultdiagnosis technology and software development based on comprehensive analysis method[J]. Power System Protection and Control,2017(10):98-102.
[8] 金貴陽,楊克己,戴永軍,等.智能配電變壓器的串變調壓和基于漏磁的絕緣故障檢測技術[J].電力系統(tǒng)保護與控制,2017,45(5):103-108. JIN Guiyang,YANG Keji,DAI Yongjun,et al.String distortion control of intelligent distribution transformer and insulation fault detection technology based on magnetic flux leakage[J].Power System Protection and Control,2017,45(5):103-108.
[9] 呂忠,周強,周琨,等.基于遺傳算法改進極限學習機的變壓器故障診斷[J].高壓電器,2015(8):49-53. LYU Zhong,ZHOU Qiang,ZHOU Kun,et al.Fault diagnosis of transformer based on genetic algorithm to improve ultimate learning machine[J].High Voltage Apparatus,2015(8):49-53.
[10]郭棟,熊文真,徐建新,等.基于變精度粗糙集與量子貝葉斯網絡的變壓器故障診斷研究[J].計算機應用與軟件,2017(2):93-99. GUO Dong,XIONG Wenzhen,XU Jianxin,et al.Study on transformer fault diagnosis of variable precision rough set and Bayesian network based on quantum[J].Computer Applications and Software,2017(2):93-99.
[11]林志鋒.基于正態(tài)云模型與改進貝葉斯分類器的變壓器故障診斷[D].保定:華北電力大學,2016.
[12]公茂法,柳巖妮,王來河,等.基于混沌優(yōu)化粒子群BP神經網絡的電力變壓器故障診斷[J].電測與儀表,2016,53(15):13-16. GONG Maofa,LIU Yanni,WANG Laihe,et al.Fault diagnosis of power transformer based on chaotic optimization particle swarm BP neural network[J].Electric Measurement and Instrumentation,2016,53(15):13-16.
[13]董明,屈彥明,周孟戈,等.基于組合決策樹的油浸式電力變壓器故障診斷[J].中國電機工程學報,2005,25(16):35-41.
DONG Ming,QU Yanming,ZHOU Mengge,et al.Fault diagnosis of oil immersed power transformer based on combination decision tree[J].Proceedings of the Chinese Society of Electrical Engineering,2005,25(16):35-41.
[14]簡治平.基于集成學習的特征選擇及穩(wěn)定性分析[D].廣州:中山大學,2010.
[15]LINS,KERNIGHANBW.Aneffectiveheuristicalgorithmfor the traveling-salesman problem[J].Operations Research,1973,21(2):498-516.
[16]郭文陽.基于支持向量機的選擇性集成算法研究[D].合肥:合肥工業(yè)大學,2015.
[17]GHONEIM S S M,TAHA I B M.A new approach of DGA interpretation technique for transformer fault diagnosis[J]. InternationalJournalofElectricalPower& Energy Systems,2016,81(7):265-274.
[18]SINGH J,KUMARI P,KAUR K,et al.Condition assessment of power transformer using SVM based on DGA[C]. Al-Sadeq International Conference on Multidisciplinary in It and Communication Science and Applications,IEEE,2016.