楊世海,李 濤,陳銘明,陳 晶,李志新
(1.國網(wǎng)江蘇省電力公司電力科學研究院,江蘇 南京 210019;2.福建億榕信息技術(shù)有限公司,福建 福州350003)
基于數(shù)據(jù)挖掘的智能電網(wǎng)在線故障診斷與分析
楊世海1,李 濤2,陳銘明1,陳 晶2,李志新1
(1.國網(wǎng)江蘇省電力公司電力科學研究院,江蘇 南京 210019;2.福建億榕信息技術(shù)有限公司,福建 福州350003)
基于智能電網(wǎng)故障在線診斷與分析的目的,本文采用基于關(guān)聯(lián)規(guī)則挖掘改進的Apriori算法,分析了電網(wǎng)三態(tài)數(shù)據(jù)的特性,并利用關(guān)聯(lián)規(guī)則建立測試數(shù)據(jù)庫,用于故障診斷在線挖掘;對傳統(tǒng)的Apriori算法進行改進,使其只在起始掃描數(shù)據(jù)庫一次,用以獲取當前所有項集的支持度計數(shù),解決了原算法多次掃描數(shù)據(jù)庫的弊端,明顯提高了在線挖掘效率。工程應用測試結(jié)果表明,該算法可有效提高在線故障診斷的實用化水平,具有很好的工程應用價值。
智能電網(wǎng);故障信息;聯(lián)合規(guī)則挖掘;在線故障診斷
隨著智能電網(wǎng)相關(guān)技術(shù)在國內(nèi)的發(fā)展與普及,其自我感知、自我檢測、自我預防成為電網(wǎng)所必需的智能運行能力[1]。其中,自我故障診斷能力具有重要作用,即當電網(wǎng)發(fā)生故障時,如何從海量故障數(shù)據(jù)中提取有效信息,自動、快速地診斷電網(wǎng)中的故障設(shè)備,輔助調(diào)度運行人員及時處理,成為目前故障在線診斷所急需解決的問題。
傳統(tǒng)的電網(wǎng)在線故障診斷通?;趩我粩?shù)據(jù)源,這使得其診斷結(jié)果在正確性、實時性及全面性等方面難以達到預期效果,以致未能在調(diào)度中心得以實用[2]。因此,國內(nèi)外諸多學者針對電網(wǎng)故障的多數(shù)據(jù)源特性先后提出了多種電網(wǎng)故障診斷方法,如專家系統(tǒng)[3]、模糊理論[4]、信息理論[5]等,然而以上方法對于處理海量數(shù)據(jù)信息的能力和不確定故障信息的容錯性仍不甚理想。因此近年來有關(guān)數(shù)據(jù)挖掘的相關(guān)技術(shù)被應用于電網(wǎng)故障診斷,并取得了較理想的研究成果[6-7],其中,關(guān)聯(lián)規(guī)則挖掘因?qū)Q策的生成具有重要的實用價值而備受關(guān)注[8-10],但應用于電網(wǎng)故障診斷方面的成果并不多,如文獻[9-10]分別分析了故障信息序列中必有或特有的信息,提出了對應的關(guān)聯(lián)規(guī)則挖掘方法。
基于此,文中結(jié)合電網(wǎng)三態(tài)數(shù)據(jù)的特性,將基于關(guān)聯(lián)規(guī)則挖掘改進的Apriori算法應用于電網(wǎng)在線故障診斷中。利用關(guān)聯(lián)規(guī)則建立建立用于故障診斷在線挖掘的測試數(shù)據(jù)庫;對傳統(tǒng)的Apriori算法進行改進,使其只在起始掃描數(shù)據(jù)庫一次,用以獲取當前所有項集的支持度計數(shù),解決了原算法多次掃描數(shù)據(jù)庫的弊端,明顯提高了在線挖掘效率。工程應用算例測試結(jié)果表明,該算法可有效提高在線故障診斷的實用化水平,具有較高的工程應用價值。
智能電網(wǎng)故障診斷以反映電網(wǎng)設(shè)備故障信息為基礎(chǔ),在線故障診斷所需采集的原始數(shù)據(jù)有:穩(wěn)態(tài)數(shù)據(jù)的開關(guān)變位、保護告警/動作事件、斷路器狀態(tài)、隔離開關(guān)狀態(tài)、保護定值、通道狀態(tài)、動態(tài)數(shù)據(jù)的電壓、電流突變以及暫態(tài)數(shù)據(jù)的電壓、電流突變等,其電網(wǎng)故障數(shù)據(jù)源特性如表1所示。
從時間維角度可知,電網(wǎng)發(fā)生故障后,穩(wěn)態(tài)和動態(tài)數(shù)據(jù)的上送時間比暫態(tài)數(shù)據(jù)要短的多,故應盡量利用穩(wěn)態(tài)和動態(tài)數(shù)據(jù);而從空間維角度來看,利用穩(wěn)態(tài)數(shù)據(jù)可實現(xiàn)故障范圍的全方位監(jiān)視[11-13]。目前,電網(wǎng)故障時存在的數(shù)據(jù)丟失、上送速度慢及電網(wǎng)正常運行時存在的誤遙信等因素使得3種狀態(tài)的故障數(shù)據(jù)不穩(wěn)定,進而導致在線故障診斷實用化程度較低[12],因此,在線故障診斷在算法設(shè)計過程中需要充分考慮電網(wǎng)數(shù)據(jù)現(xiàn)狀,綜合運用調(diào)度端的多源信息進行分析,以減小數(shù)據(jù)可靠性不高對在線故障診斷正確率的影響。
表1 電網(wǎng)故障數(shù)據(jù)源特性
2.1 測試數(shù)據(jù)庫及關(guān)聯(lián)規(guī)則模型的建立
設(shè)C={C1,C2,…,Cm}表示保護測試條件,D={O}為保護的動作狀況,其中Ci(0≤i≤m)和O都是概念層。保護測試數(shù)據(jù)庫為T={T1,T2,…,Tn}。T中的每個元祖 Ti(1≤i≤n)的表示形式為(c1,c2,…,cm,0),其中ci∈Lset(Ci),0∈Lset(0)。在數(shù)據(jù)被存入T之前,對各數(shù)據(jù)進行離散化處理[14-15]。
保護測試關(guān)聯(lián)規(guī)則是形如X?Y的蘊涵式,其中,X,Y分別是C和D的模式。規(guī)則X?Y在事務(wù)集W中成立,具有支持度s,其中s是中事務(wù)W包含X∪Y的百分比。規(guī)則X?Y在事務(wù)集W中具有置信度c,其中c是中事務(wù)W包含X的事務(wù)同時也包含Y的百分比。用相關(guān)規(guī)則表示模式X與模式Y(jié)之間的相關(guān)度:
根據(jù)概率論,若P(X∪Y)=P(X)P(Y)成立,則說明模式X的出現(xiàn)時獨立于模式的,若相關(guān)度大于1說明模式X和Y是正相關(guān)的。
2.2 Apriori改進算法設(shè)計
Apriori算法是一種挖掘單維關(guān)聯(lián)規(guī)則頻繁項集的算法,使用逐層搜索迭代,由連接和剪枝兩步構(gòu)成。但該算法在挖掘過程中存在一定的不足:如需多次掃描數(shù)據(jù)庫以確定各個候選項集的支持度計數(shù);運算時間受頻繁項集長度影響顯著。針對上述問題,此處提出一種改進方案,其改進后的算法執(zhí)行流程如圖1所示,其具體步驟為:
1)對D進行首次掃描,并對其中的各單項事務(wù)統(tǒng)計支持度,產(chǎn)生候選l-項集C1。從項集C1中刪除支持度計數(shù)小于最小支持度的項[16],從而得到頻繁l-項集L1;
2)建立各單項事務(wù)統(tǒng)計的事務(wù)總列表;
3)利用L1自連接生成候選2-項集C2及其對應的各單項事務(wù)列表,并進行項集的求交集運算;
4)由上一步運算得到的中間候選項集C2確定侯選集C2,最終生成頻繁2-項集L2;
5)依次重復步驟3)直到不再產(chǎn)生新的候選項集即完成挖掘。
3.1 算法改進性能驗證
在進行系統(tǒng)性能實測之前,需建立故障數(shù)據(jù)挖掘庫,并驗證改進算法的優(yōu)越性。以福建省供電公司近3年內(nèi)的收集200余次故障記錄數(shù)據(jù)為基礎(chǔ),建立容量為200項的數(shù)據(jù)挖掘庫,容量為20項的無故障測試數(shù)據(jù)庫,并在某服務(wù)器上進行挖掘算法測試,其測試內(nèi)容為在挖掘庫中增加50項不良記錄,用于模擬故障事件中的丟失信息、錯誤信息和冗余信息,檢驗程序的健壯性。分3次測試,第1次測試為只挖掘200項正常的故障記錄;第2次為在增加30項有缺失信息和20項有冗余信息的挖掘測試;第3次為10項有缺失信息和40項有冗余信息的挖掘測試。測試結(jié)果如表2所示,可看出,利用改進算法產(chǎn)生的規(guī)則對測試庫中20項故障記錄進行診斷,規(guī)則匹配度全部達到0.8以上,且效率大為提高。在有缺失信息的情況下,適當降低可信度仍然可以挖掘出有效的規(guī)則;冗余信息對挖掘的影響較小,說明該算法可把握重要關(guān)聯(lián)規(guī)則,濾除干擾。
3.2 在線故障診斷測試
為測試算法的在線故障診斷功能,以圖2所示的故障電網(wǎng)局部拓撲結(jié)構(gòu)為例,進行實地在線診斷。其測試信息序列如表3所示。該改進算法診斷的故障結(jié)果為 “線路1過負荷保護動作,切除線路1成功;線路2中DL2差動保護動作電流差動保護動作,切除線路2成功,重合閘失敗,引起相鄰線路三相過負荷誤動,匹配度0.81,建議檢查過負荷保護”。事后分析證明過負荷保護和電流差動保護均為誤動,診斷基本正確。
圖1 Apriori改進算法流程圖
表2 不良數(shù)據(jù)記錄的挖掘測試結(jié)果
圖2 故障電網(wǎng)局部拓撲圖
表3 電網(wǎng)局部主要故障序列
文中研究了智能電網(wǎng)故障在線診斷問題。結(jié)合電網(wǎng)三態(tài)數(shù)據(jù)的特性,利用關(guān)聯(lián)規(guī)則建立建立用于故障診斷在線挖掘的測試數(shù)據(jù)庫;改進了傳統(tǒng)的Apriori算法,解決了原算法多次掃描數(shù)據(jù)庫的弊端,減小了計算量。工程應用算例測試結(jié)果表明,該算法可有效提高在線故障診斷的實用化水平,具有較高的工程應用價值,對智能電網(wǎng)的建設(shè)和應用推廣也應具有很好的經(jīng)濟效益和社會效益。
[1]姚建國,嚴勝,楊勝春,等.中國特色智能調(diào)度的實踐與展望[J].電力系統(tǒng)自動化,2009,33(17): 16-20.
[2]陳玉林,陳允平,孫金莉,等.電網(wǎng)故障診斷方法綜述[J].中國電力,2006,39(5):27-31.
[3]杜一,張沛超,郁惟鏞.基于事例和規(guī)則混合推理的變電站故障診斷系統(tǒng) [J].電網(wǎng)技術(shù),2004,28(1):34-37.
[4]周明,任建文,李庚銀.基于模糊推理的分布式電力系統(tǒng)故障診斷專家系統(tǒng) [J].電力系統(tǒng)自動化,2001,25(24):33-36.
[5]湯磊,孫宏斌,張伯明.基于信息理論的電力系統(tǒng)在線故障診斷 [J].中國電機工程學報,2003,23(7):5-11.
[6]于之虹,郭志忠.基于數(shù)據(jù)挖掘理論的電力系統(tǒng)暫態(tài)穩(wěn)定評估[J].電力系統(tǒng)自動化,2003,27(8): 45-48.
[7]孫雅明,廖志偉.基于事件序列數(shù)據(jù)挖掘原理的高壓輸電線系統(tǒng)故障診斷[J].電力系統(tǒng)自動化,2004,28(5):20-24.
[8]張云濤,于治棱,張化祥.關(guān)聯(lián)規(guī)則中頻繁項集高效挖掘的研究[J].計算機工程與應用,2011(3): 139-141.
[9]張斌,孫哲.關(guān)聯(lián)規(guī)則技術(shù)在電力系統(tǒng)中的應用[J].電網(wǎng)技術(shù),2007,5(1):63-66.
[10]李再華,白曉民,周子冠,等.基于特征挖掘的電網(wǎng)故障診斷方法[J].中國電機工程學報,2010,30(10):16-22.
[11]Hirokane M,Kouno S,Nomura Y.Extraction of minimum decision algorithm using rough sets and genetic algorithms [C].The Sixth International Conference on Machine Learning and Applications,Kansai University,Osaka,2007.
[12]Chen-Ching L,Marino S,Hanjin Miao.On-line fault diagnosis using sequence-of-events recorder information[J].IEEE Transactions on Automatic Control,1996,31(7):339-344.
[13]閃鑫,趙家慶,張劍,等.基于三態(tài)數(shù)據(jù)的電網(wǎng)在線綜合故障診斷[J].電力系統(tǒng)自動化,2012,36(23):79-84.
[14]劉海蓉,閨仁武.一種改進的加權(quán)關(guān)聯(lián)規(guī)則挖掘算法[J].現(xiàn)代電子技術(shù),2011,21(12):51-54.
[15]董志赟,樂全明,鄭華珍,等.高壓電網(wǎng)子站故障選線診斷新方案研究[J].繼電器,2006,34(10): 7-11.
[16]朱金壇,數(shù)據(jù)挖掘Apriori算法的改進[J].電子設(shè)計工程,2013,21(15):37-40.
On-line fault diagnosis and analysis of smart power grid based on data mining
YANG Shi-hai1,LI Tao2,CHEN Ming-ming1,CHEN Jing2,LI Zhi-xin1
(1.State Grid Jiangsu Electric Power Research Institute,Nanjing 210019,China;2.Fujian Yirong Information Technology co.,LTD.,F(xiàn)uzhou 350003,China)
For the purpose of on-line fault diagnosis and analysis for smart power grids,this paper designed the improved Apriori algorithm based on united rules mining.Through analyzing the features of power grid three state data,test database which would be used for on-line fault diagnosis was found by using united rules.The traditional Apriori algorithm was improved to scan the database initially,in order to observe the frequency counting of all present itemsets,which solved the shortage of scanning the database frequently,and increased the efficiency on on-line mining.The results of engineering application tests indicated that the algorithm proposed in this paper could enhance the practical level of on-line fault diagnosis,which had good project application benefit.
smart power grid;fault information;united rules mining;on-line fault diagnosis
TN87
:A
:1674-6236(2017)01-0136-04
2015-12-28稿件編號:201512282
楊世海(1976—),男,安徽合肥人,碩士研究生,高級工程師。研究方向:電力系統(tǒng)自動化與電能計量技術(shù)。