律方成 金 虎 王子建 張 波
(華北電力大學(xué)河北省輸變電設(shè)備安全防御重點實驗室 保定 071003)
局部放電(Partial Discharge,PD)是SF6氣體絕緣組合電器(Gas Insulated Switchgear,GIS)絕緣劣化的主要表現(xiàn)形式,不同放電類型所反映的絕緣劣化機理不同,而且不同放電類型對GIS 絕緣造成的損害程度不同[1,2],因此,對GIS 局部放電進行模式識別已經(jīng)成為GIS 狀態(tài)評估方面的重要部分[3-5]。
在局部放電模式識別領(lǐng)域,主要是從原始特征中選出對分類有利的特征子集,常見的方法有統(tǒng)計特征參數(shù)法[6,7]、波形特征參數(shù)法[8]和圖像矩特征參數(shù)法等[9]。但是,在局部放電特征參數(shù)提取的過程中,得到的特征變量往往數(shù)量較多,造成特征空間維數(shù)較高,不僅給分類器帶來負擔(dān),甚至造成識別率下降,所以對特征空間進行降維是必要的,而主成分分析法作為一種統(tǒng)計特征參數(shù)法[10],其最大的優(yōu)點就是有效將高維特征空間降到低維空間,已經(jīng)在很多領(lǐng)域取得了較好的效果,本文采用該方法對GIS 局部放電特征空間算子進行分析。
局部放電模式識別不僅需要提取有利的特征量,選擇合適的分類器也是至關(guān)重要的。GIS 局部放電模式識別是一個多分類問題,而Damoulasy 等人提出了多分類相關(guān)向量機(Milticlass Relevance Vector Machine,M-RVM),該方法基函數(shù)權(quán)值少數(shù)非零,診斷速度快,另外可有效解決小樣本、高維、非線性分類問題,更重要的是該方法通過引入多項概率似然函數(shù),可以直接實現(xiàn)多分類[11,12]。因此,本文選擇M-RVM 作為GIS 局部放電模式識別分類器。
在GIS 局部放電檢測中,超高頻(Ultra High Frequency,UHF)法檢測的是超高頻波段(300~3 000MHz),抗干擾能力強,靈敏度高[13],基于此,本文在實驗室模擬了4 種典型的局部放電模型,采用UHF 法獲取了相應(yīng)的局部放電信號,通過主成分分析法對UHF 信號統(tǒng)計參量進行降維處理,提取了新的特征量,然后用多分類相關(guān)向量機對GIS 局部放電進行模式識別。
采用自行設(shè)計的 252kVGIS 局部放電仿真平臺,整個平臺長5m,高4.15m,為了方便試驗和節(jié)約SF6氣體,該平臺采用盆式絕緣子將腔體隔開成為多個單獨的小氣室;超高頻探頭的檢測頻段為300~1 500MHz,試驗電路接線示意圖和GIS 局部放電仿真平臺結(jié)構(gòu)圖分別如圖1 和圖2 所示:
圖1 試驗電路接線示意圖Fig.1 The experimental circuit wiring diagram
圖2 GIS 局部放電仿真平臺結(jié)構(gòu)圖Fig.2 The structure of GIS partial discharge simulation platform
針對GIS 局部放電的特點,設(shè)計了4 種典型的放電模型:尖端放電、內(nèi)部放電、懸浮放電和沿面放電,相關(guān)結(jié)構(gòu)如圖3 所示。
圖3 局部放電模型結(jié)構(gòu)示意圖1、3、8、12—高壓電極 2、6、11、14—低壓電極4、5、7、10、13—環(huán)氧樹脂 9—銅柱Fig.3 The structure of PD models
模型參數(shù)如下:尖端放電模型,高壓針電極曲率半徑為0.5mm,錐角30°,尖長15mm,電極間距離為10mm;內(nèi)部放電模型,放電模型上下2 層均采用厚3mm 的環(huán)氧樹脂板,中間采用1mm 厚的環(huán)氧樹脂板作絕緣介質(zhì),絕緣板上有直徑為10mm 的圓孔,絕緣板之間用環(huán)氧樹脂膠粘結(jié);懸浮放電模型,接地電極上放直徑100mm,厚5mm 的環(huán)氧樹脂板,環(huán)氧樹脂板上面靠近邊緣處放置直徑 10mm,高10mm 的銅柱;沿面放電模型,兩個板電極之間縱向放置一個直徑10mm,長10mm 的環(huán)氧樹脂棒。為了減小表面毛刺的影響,電極表面和邊緣均打磨光滑,為了消除電極引線處的放電,設(shè)計并加工了光滑的球形螺帽。
根據(jù)2.1 節(jié)實驗獲取的UHF 信號,得到了局部放電次數(shù)N、總放電量QT、最大放電量Qmax等統(tǒng)計參數(shù),針對局部放電模式識別的需求,最終選擇局部放電UHF 信號最大放電幅值相位分布Qmax(Φ)、放電重復(fù)率相位分布N(Φ)及局部放電幅值分布Q三個不同二維圖譜,分別提取出包括局部峰個數(shù)P、偏斜度S、放電量因數(shù)R、陡峭度K、相位中值M、相位不對稱度B、互相關(guān)系數(shù)C 共26 個統(tǒng)計算子,這些統(tǒng)計參數(shù)從不同角度描述譜圖特性,同時為了消除量綱的影響,各個參數(shù)均采用了標(biāo)準(zhǔn)化處理。各特征參數(shù)對應(yīng)關(guān)系如表1 所示。獲取的典型UHF 圖譜如圖4 所示。
表1 統(tǒng)計參數(shù)表Tab.1 Statistical parameters table
圖4 UHF 信號統(tǒng)計圖譜Fig.4 The statistical graph of UHF signals
2.2節(jié)中得到的特征參數(shù)共有26 個,構(gòu)成的特征空間維數(shù)很高,參數(shù)之間的相關(guān)性較大,可能存在信息冗余,直接送入分類器進行模式識別不但會給分類器帶來較大的負擔(dān),而且也可能產(chǎn)生比較大的誤差。主成分及因子分析方法使得提取出的特征量既可以全面表征放電譜圖特征,同時又降低了特征空間維數(shù),減小了分類器的負擔(dān)。
大量的特征參量,可能造成信息重疊,通過因子相關(guān)性分析,可以找出反映變量之間共同特性的少數(shù)公共因子變量,從而可以判斷數(shù)據(jù)是否適合進行主成分分析。以特征量K1~K5為例進行相關(guān)性分析。常用的檢驗方法有KMO 檢驗和Bartlett 球形檢驗,KMO 是用于檢驗因子分析是否適用的指標(biāo),若它在0.5~1 之間,表示適合;小于0.5 表示不適合。Bartlett 球形檢驗是通過x2 檢驗來完成對變量之間是否相互獨立的檢驗。若統(tǒng)計量取值較大,且對應(yīng)的顯著性水平較小,則因子分析是適用的。運用SPSS 軟件對統(tǒng)計出的K1~K5變量進行分析,輸出檢驗結(jié)果下:KMO 的值0.713,變量之間存在較強的偏相關(guān)性;Bartlett 球形檢驗為127.13,顯著性水平為0,拒絕零假設(shè),變量之間適合進行因子分析,可以進行主成分分析。
針對陡峭度5 個特征參數(shù),通過求解協(xié)方差矩陣的特征值和與之對應(yīng)的特征向量,將原來的相關(guān)向量進行線性變換。對得到的特征值進行分析,選擇值大于1 的特征根作為主成分進行分析,從而達到降維的目的。表2 列出了協(xié)方差矩陣的特征值及方差貢獻率,圖5為貢獻率隨主成分變化趨勢圖。
表2 特征值及其貢獻率Tab.2 Characteristic values and its contribution rate
圖5 貢獻率隨主成分變化趨勢圖Fig.5 The trend chart of contribution rate with the principal components changing
由圖5 分析得到,從第3 個主成分開始,貢獻率變化趨勢已趨于平穩(wěn),且貢獻率逐漸減小,其貢獻可忽略不計。因此,取前2 個主成分是比較合適的,可以很好地反映絕大部分變量信息。這樣由原來的5 個指標(biāo)轉(zhuǎn)化為2 個新指標(biāo),起到了降維作用。SPSS 分析軟件得到主成分系數(shù)如表3 所示。
表3 主成分系數(shù)表Tab.3 Principal components coefficient table
從上表可知,2 個主成分的線性組合為
根據(jù)上面的線性組合可以得到主成分的值,同樣的方法可以計算出局部峰個數(shù)P、偏斜度S、放電量因數(shù)R、相位中值M、相位不對稱度B、互相關(guān)系數(shù)C 的主成分,提取出的成分如表4 所示。通過主成分分析,提取出26 個特征變量的10 個主成分因子,各參數(shù)的信息表征率均在76%以上。
表4 提取的主成分Tab.4 Extracted principal components
根據(jù)2.1 節(jié)可知,本文GIS 局部放電模型共分為4 類,是一個多分類問題,而多分類相關(guān)向量機(Milticlass Relevance Vector Machine,M-RVM)是Damoulasy 等人在二分類核函數(shù)學(xué)習(xí)、高斯過程組合協(xié)方差函數(shù)方法以及高斯先驗處理多項概率似然函數(shù)方法的基礎(chǔ)上,提出的一種可以直接實現(xiàn)多分類的方法,只要采用一個M-RVM 分類器即可實現(xiàn)GIS 的多種狀態(tài)類別的識別。
M-RVM 通常采用0-1 的向量形式來表示類別,設(shè)需要識別的GIS 狀態(tài)類別為L 種,則可以采用L維的0-1 列向量的形式來表示該L 種狀態(tài)的類別標(biāo)簽。本文中,GIS 局部放電由尖端放電、內(nèi)部放電、懸浮放電和沿面放電4 種放電模型構(gòu)成,分別采用4 維列向量(0,0,0,1)T、(0,0,1,0)T、(0,1,0,0)T、(1,0,0,0)T作為GIS 上述4 種狀態(tài)的類別標(biāo)簽。
M-RVM 采用分層貝葉斯模型結(jié)構(gòu),通過引入多項概率似然函數(shù)(Multinomial Probit Likelihood),實現(xiàn)了多分類和輸出類別成員概率。
式中 ynl——Y 的第n 行l(wèi) 列的元素;
wl——W 的第l 列;
Nx(m, v)——代表x 服從均值為m,方差為v 的正態(tài)分布。
引入多項概率聯(lián)系函數(shù)如式(3),將回歸目標(biāo)轉(zhuǎn)化為類別標(biāo)簽。
圖6 分層貝葉斯模型Fig.6 Hierarchical Bayesian Model
由最大后驗概率估計的方法可得
因此給定類別時,基于最大后驗概率(MAP)的權(quán)重更新方法如式(5)。
根據(jù)式(5),可以推導(dǎo)出輔助變量的E-step 形式。若?.c≠i,如式(6)[15]
Gamma 分布的均值為
由于基于 M-RVM 的模式分類方法采用一個M-RVM 分類器識別GIS 的多種局部放電模式類別,因此要求選取的輸入特征變量能夠同時表征所要甄別的多種狀態(tài)類別,而根據(jù)第2 和第3 節(jié)已經(jīng)獲取了表征GIS 局部放電模式的26 個原始特征量以及采用主成分分析法降維后的10 個特征量,為了對比分析,分別輸入這兩種特征參數(shù),輸入?yún)?shù)均采用了標(biāo)準(zhǔn)歸一化。
M-RVM 通常采用的核函數(shù)有:線性核函數(shù),多項式核函數(shù)和徑向基核函數(shù)(RBF)等。該文選擇模式識別中通常采用的RBF 核函數(shù)。
M-RVM 診斷方法的診斷輸出是GIS 隸屬于各種狀態(tài)類別的概率值,對于把GIS 狀態(tài)劃分為L 種狀態(tài)類別的情況,輸出可以采用L 維行向量的形式,該L 維行向量中的元素分別代表GIS 隸屬于L 種狀態(tài)類別的概率,其對應(yīng)關(guān)系與M-RVM 分類器學(xué)習(xí)時狀態(tài)類別采用的表示方法有關(guān)。
本文把GIS 絕緣故障狀態(tài)設(shè)置為4 類,對應(yīng)于GIS 局部放電狀態(tài)類別的上述表達形式。M-RVM 分類器的診斷輸出向量模式為:[PZ,PN,PX,PY],其中PZ,PN,PX,PY分別代表GIS 的狀態(tài)為尖端放電、內(nèi)部放電、懸浮放電和沿面放電的概率值,記輸出向量的索引集為I={Z,N,X,Y }。診斷結(jié)果為最大概率值對應(yīng)的GIS 狀態(tài),即
基于M-RVM 的GIS 局部放電模式識別具體分類過程如下,流程如圖7 所示。
圖7 基于M-RVM 的GIS 局部放電模式識別流程圖Fig.7 Flow chart of GIS partial discharge pattern recognition based on M-RVM
(1)依據(jù)研究問題的特點,劃分GIS 的局部放電模式狀態(tài),并確定各種狀態(tài)相應(yīng)的表示方法。
(2)依據(jù)獲取的 GIS 局部放電參數(shù),選取M-RVM 分類器的輸入特征變量,確定M-RVM 分類器的診斷輸出表示方式。
(3)選取樣本數(shù)據(jù)[ X,t]。
(4)選取核函數(shù)并確定核函數(shù)參數(shù)。
(5)將樣本數(shù)據(jù)分為訓(xùn)練集[Xtr,ttr]和測試集[ Xte,tte],進行M-RVM 模型學(xué)習(xí)和測試。
表5 和表6 給出采用BN、SVM 和M-RVM 方法的GIS 模式識別的結(jié)果。其中,SVM 核函數(shù)選用RBF,采用“一對一”的分類方法;BN 采用貝葉斯分類器。BN、SVM 和M-RVM 方法均按4.2 節(jié)確定輸入向量,得到的3 個分類器錯分率曲線如圖8所示。
通過上面的曲線可以看出M-RVM 分類器的錯分率明顯低于另外兩種算法,最終得到的識別結(jié)果如表5 和表6 所示。
圖8 錯分率曲線Fig.8 Wrong classification rate curves
表5 降維前BN、SVM 和M-RVM 方法的GIS 模式識別正確率Tab.5 Comparison of pattern recognition accuracy among BN,SVM and M-RVM method before dimension reduction
表6 降維后BN、SVM 和M-RVM 方法的GIS 模式識別正確率Tab.6 Comparison of pattern recognition accuracy among BN,SVM and M-RVM method after dimension reduction
文章設(shè)計了252kVGIS 局部放電超高頻檢測仿真平臺,模擬了4 種典型的GIS 局部放電模型,獲取了相應(yīng)的超高頻信號統(tǒng)計特征量,采用主成分分析法對原始特征空間進行了降維處理,結(jié)合多分類相關(guān)向量機對GIS 局部放電進行了模式識別,取得了如下結(jié)論:
(1)根據(jù)4 種典型的放電模型,獲取了UHF信號中最大放電幅值相位分布Qmax(Φ)、放電重復(fù)率相位分布N(Φ)及局部放電幅值分布Q 三個不同二維圖譜,并且從統(tǒng)計數(shù)據(jù)中提取了26 個原始特征量。
(2)采用主成分分析法可以有效的實現(xiàn)特征空間的降維處理,將原始的26 個特征量降為10 個新的特征量,并且以新的特征量作為輸入量進行GIS局部放電模式識別,其識別率大于85%。
(3)采用多分類相關(guān)向量機作為模式分類器,無論是采用原始的26 個特征參量還是降維后的10個特征參量,其識別率都要高于BN、SVM 分類器。
[1]司文榮,李軍浩,袁鵬,等.基于波形非線性映射的多局部放電脈沖群快速分類[J].電工技術(shù)學(xué)報,2009,24(3):217-228.Si Wenrong,Li Junhao,Yuan Peng,et al.The fast grouping technique of PD sequence based on the nonlinear mapping of pulse shapes[J].Transactions of China Electrotechnical Society,2009,24(3):217-228.
[2]李信,李成榕,丁立健,等.基于特高頻信號檢測GIS 局放模式識別[J].高電壓技術(shù),2003,14(3):16-20.Li Xin,Li Chengrong,Ding Lijian,et al.Identification of PD patterns in gas insulated swichgear(GIS)based on UHF signals[J].High Voltage Engineering,2003,14(3):16-20.
[3]唐炬,周倩,許中榮,等.GIS 特高頻局放信號的數(shù)學(xué)建模[J].中國電機工程學(xué)報,2005,25(19):106-110.Tang Ju,Zhou Qian,Xu Zhongrong,et al.Establishment of mathematical model for partial discharge in GIS using UHF method[J].Proceedings of the CSEE,2005,25(19):106-110.
[4]Judd M D,Cleary G P,Bennoch C J.Applying UHF partialdischarge detection to power transformers[J].IEEE Power Engineering Review,2002,22(8):57-59.
[5]司文榮,李軍浩,袁鵬,等.氣體絕緣組合電器多局部放電源的檢測與識別[J].中國電機工程學(xué)報,2009,29(16):119-125.Si Wenrong,Li Junhao,Yuan Peng,et al.Detection and identification techniques for multi-PD sources in GIS[J].Proceedings of the CSEE,2009,29(16):119-125.
[6]胡文堂,高勝友,余紹峰,等.統(tǒng)計參數(shù)在變壓器局部放電模式識別中的應(yīng)用[J].高電壓技術(shù),2009,35(2):277-281.Hu Wentang,Gao Shengyou,Yu Shaofeng,et al.Application of statistic parameters in recognition of partial discharge in transformers[J].High Voltage Engineering,2009,35(2):277-281.
[7]Gulski E,Kreuger F H.Computer-aided recognition of discharge sources[J].IEEE Transactions on Electrical Insulation,1992,27(1):82-92.
[8]Mazroua A A.Discrimination between PD pulse shapes using different neural network paradigms[J].IEEE Transactions on Dielectrics and Electrical Insulation,1994,1(6):1119-1131.
[9]張曉虹,張亮,樂波,等.基于局部放電的矩特征分析大電機主絕緣的老化[J].中國電機工程學(xué)報,2002,22(5):94-98.Zhang Xiaohong,Zhang Liang,Le Bo,et al.Analysis onaging condition of stator winding insulation of generator basedon the moment characteristics of partial discharge[J].Proceedings of the CSEE,2002,22(5):94-98.
[10]廖瑞金,楊麗君,孫才新,等.基于局部放電主成分因子向量的油紙絕緣老化狀態(tài)統(tǒng)計分析[J].中國電機工程學(xué)報,2006,26(14):114-119.Liao Ruijin,Yang Lijun,Sun Caixin,et al.Aging conditionassessment of oil-paper based on principal component and fac-tor analysis of partial discharge[J].Proceedings of the CSEE,2006,26(14):114-119.
[11]Damoulas T,Girolami M A.Probabilistic multi-class multi-kernel learning:on protein fold recognition and remote homology detection[J].Bioinformatics,2008,24(10):1264-1270.
[12]Girolami M,Rogers S.Hierarchic Bayesian models for kernel learning[C].In Proceedings of the 22nd International Conference on Machine Learning,Bonn,Germany,2005,241-248.
[13]李信,李成榕,丁立健,等.基于特高頻信號檢測GIS 局放模式識別[J].高電壓技術(shù),2003,14(3):16-20.Li Xin,Li Chengrong,Ding Lijian,et al.Identification of PD patterns in gas insulated swichgear(GIS)based on UHF signals[J].High Voltage Engineering,2003,14(3):16-20.
[14]Psorakis I,Damoulas T,Girolami M A.Multiclass relevance vector machines:sparsity and accuracy[J].IEEE Transactions on Neural Networks,2010,21(10):1588-1598.
[15]Damoulas T,Girolami M A.Combining feature spaces for classification[J].Pattern Recognition,2009,42(11):2671-2683.