余劍鋒, 何云良, 吳華華, 魏驍雄, 陳博, 鐘震遠
(1.國網(wǎng)浙江省電力有限公司, 浙江, 杭州 311100;2.國網(wǎng)浙江省電力有限公司營銷服務(wù)中心, 浙江, 杭州 311100)
隨著智能配電網(wǎng)的不斷應(yīng)用,提高了電網(wǎng)的供電效率以及可靠性,同時可以實現(xiàn)獲取電網(wǎng)的相關(guān)數(shù)據(jù),提高電網(wǎng)的搶修效率。智能電網(wǎng)平臺通常只能對于停電故障發(fā)生后進行業(yè)務(wù)處理的管理,無法實現(xiàn)根據(jù)故障數(shù)據(jù)的故障研判,因此一些研究者對配電網(wǎng)數(shù)據(jù)的研判方案進行了研究:文獻[1]提出了基于配電網(wǎng)拓?fù)浣Y(jié)構(gòu)等效耦合故障研判方法,分析了配電網(wǎng)故障研究與判斷的基本原理以及常見的配電網(wǎng)故障研究與判斷邏輯,實現(xiàn)了分布式配電網(wǎng)拓?fù)渚W(wǎng)絡(luò)結(jié)構(gòu)單故障和多故障的準(zhǔn)確判斷;文獻[2]提出了融入低壓智能電表的配電網(wǎng)故障研判,結(jié)合低壓GIS對配電網(wǎng)自動化系統(tǒng)等多源業(yè)務(wù)系統(tǒng)數(shù)據(jù)進行智能診斷,開發(fā)低壓整體故障分析儀,設(shè)置配電中的定位網(wǎng)絡(luò),低壓故障類型識別和分析等功能模塊,實現(xiàn)低壓配電網(wǎng)的模塊化應(yīng)急維修。通常采用的研判模式的開發(fā)接口較多,難以適應(yīng)大型電網(wǎng),且以上幾種研判方案均是在故障出現(xiàn)導(dǎo)致停電后才對單一節(jié)點的數(shù)據(jù)進行處理,無法對整體數(shù)據(jù)進行關(guān)聯(lián)查找。因此研判結(jié)果的準(zhǔn)確性受到了影響,需要進一步的改進[3-4]。
用隨機森林算法對配電網(wǎng)中的數(shù)據(jù)進行提取和訓(xùn)練,包括電能運行數(shù)據(jù)、設(shè)備管理數(shù)據(jù)及故障數(shù)據(jù),以此來獲得相對應(yīng)的異常數(shù)據(jù)集,并作為未來停電研判的基礎(chǔ)[5-6]。首先設(shè)獲取到的配電網(wǎng)存在m個樣本的數(shù)據(jù)集G,而在進行數(shù)據(jù)集樣本采樣過程中獲得的數(shù)據(jù)集為D。在數(shù)據(jù)集G隨機提取樣本并將樣本拷貝至D內(nèi),并重復(fù)m次,得到存在數(shù)據(jù)集G內(nèi)m個數(shù)據(jù)的數(shù)據(jù)集D。那么在進行m次的采樣時不會抽到的概率為(1-1/m),得到極限值:
(1)
該過程可以通過Bootstrap來進行反復(fù)抽取,并保證獲得數(shù)據(jù)集的集中率在37%左右。那么得出的樣本就可以作為OOB樣本,作為隨機森林算法的樣本。而在隨機森林算法中通過抽取后的樣本數(shù)據(jù)集D中的k類樣本占比為pk(k=1,2,…,|y|),那么D的信息熵則為
(2)
其中,特征集內(nèi)的特征a屬于離散型的數(shù)據(jù),則對于特征a的取值則存在V種可能,即{a1,a2,…,av},且對于樣本集D的劃分可以使用特征a來進行。并在其中產(chǎn)生出V個分支點。設(shè)在第V個分支中包含的數(shù)據(jù)集D中的特征a中取值av的樣本為Dv。計算得出離散特征a的數(shù)據(jù)集D劃分出的信息熵:
(3)
而當(dāng)特征a屬于連續(xù)數(shù)據(jù)時,特征a則可以根據(jù)取得遞增情況來進行排序,并將取值得出的相鄰點看作不同可能下的分裂[7-8],則對數(shù)據(jù)集D的信息熵劃分則改變?yōu)?/p>
(4)
式中,DL以及DR代表通過分裂點分出的兩部分子集,并以此來獲得特征a所劃分的集合D的熵值。在確定不同特征下的數(shù)據(jù)類型并獲得相應(yīng)的信息熵,進而則可以計算其中的信息增益:
Gain(D,a)=Ent(D)-Enta(D)
(4)
則增益率計算為
Gainratio(D,a)=Gain(D,a)/IV(a)
(5)
而其中IV(a)的計算式為
(6)
以此得出隨機森林運算的樣本訓(xùn)練模式,用以進行停電事件研判。
配電網(wǎng)停電通常受到其中的故障原因,在對配電網(wǎng)停電的研判時,需要對配電網(wǎng)的故障情況進行考慮[9-10]。本文采用分層拓?fù)淠P蛠磉M行配電網(wǎng)故障情況的運算,建立的配電網(wǎng)分層拓?fù)淠J饺鐖D1所示。
圖1 配電網(wǎng)拓?fù)淠P褪疽鈭D
(7)
在配電網(wǎng)中,當(dāng)用戶發(fā)出故障信息或觸發(fā)故障檢測設(shè)備的情況下,通常可以直接獲取到故障用戶的位置,實現(xiàn)對用戶的定位。在該條件下點子集為Ck=(ck1,ck2,…,ckn)T,而其中的故障信息向量為Pk=(pck1,pck2,…,pckn),那么配變層的父節(jié)點tk所對應(yīng)故障信息pTk為
(8)
就此建立配電網(wǎng)的故障停電模型,來對故障情況下停電原因進行判斷。
相關(guān)的配電網(wǎng)研判方案,在具體實現(xiàn)時,可以使用兼容性較高的自動數(shù)據(jù)處理方法來進行,以適應(yīng)當(dāng)前智能電網(wǎng)的需求。本文對于配電網(wǎng)的研判采用自動數(shù)據(jù)來進行,開發(fā)通過PMS2.0來進行,并在其中導(dǎo)入上文中的運算方式。研判過程如圖2所示。
圖2 停電數(shù)據(jù)研判流程圖
停電數(shù)據(jù)研判流程如下:
(1)首先使用上文中的完成訓(xùn)練的隨機森林算法,處理配電網(wǎng)中的數(shù)據(jù),得出會導(dǎo)致停電的故障樣本數(shù)據(jù);
(2)將故障樣本數(shù)據(jù)導(dǎo)入至配電網(wǎng)的分層拓?fù)淠P?,得出得到具體的故障參數(shù);
(3)依據(jù)配電網(wǎng)中帶有的監(jiān)測對用戶的停電時間和用戶標(biāo)識、停電起始時間和終止時間進行數(shù)據(jù)監(jiān)測。同時進行判斷,在可靠性的停電中,獲取到用戶中的表示和在研判中的PMS2.0中的對配電網(wǎng)中故障停電的搶修ID,并對用戶的停電終止時間,進行故障研判,大致得出相應(yīng)的預(yù)計電力恢復(fù)時間;
(4)最后將搭載研判方案的PMS2.0與配電網(wǎng)中的數(shù)據(jù)許可相聯(lián)系,使方案可以隨著搶修進度的推進校正得出的數(shù)據(jù)結(jié)果,從而得到實時的停電事件研判結(jié)果。
為了驗證配電網(wǎng)的研判方案的可行性,設(shè)計對比實驗。以某地變電站構(gòu)成的配電網(wǎng)作為停電研判方案的驗證基礎(chǔ)。并采用文獻[1]、文獻[2]中的研判方案與本文方案中的算法對其中的數(shù)據(jù)進行運算。并判斷3種研判方案對于配電網(wǎng)故障數(shù)據(jù)的查全率以及查準(zhǔn)率。
實驗的對象配電網(wǎng)絡(luò),基于如下的變電站網(wǎng)絡(luò)而建立,網(wǎng)絡(luò)簡化圖如圖3所示。
圖3 簡化變電站網(wǎng)絡(luò)
配電網(wǎng)的信號域數(shù)據(jù)如表1所示。
表1 配電網(wǎng)絡(luò)信息域和數(shù)據(jù)
在該配電網(wǎng)絡(luò)中,T代表網(wǎng)絡(luò)中的變壓器,L1、L2均為用戶的輸電線路。A、B、C、D代表配電網(wǎng)絡(luò)母線,圖3中的M1~M8均代表配電網(wǎng)絡(luò)中的量測裝置,分別為變頻電源檢測器、電流檢測器、高壓開關(guān)裝置、集中處理器、功率檢測器、饋線終端裝置、遠程終端單元及數(shù)字量模塊。
實驗對配電網(wǎng)的故障網(wǎng)絡(luò)預(yù)測,過程中的使用數(shù)據(jù)相同,并依據(jù)其中的查準(zhǔn)率以及查全率兩種指標(biāo)來進行判斷,實驗評判指標(biāo)計算方法如下:
(9)
(10)
式中,precision代表實驗中研判方案對故障數(shù)據(jù)的查準(zhǔn)率,recall代表實驗中研判方案對故障數(shù)據(jù)的查全率,Np代表預(yù)測正確樣本數(shù),Nt代表進行處理的樣本數(shù),Nr代表真實樣本數(shù)。
本文實驗在進行數(shù)據(jù)預(yù)處理時,對于故障量進行區(qū)間劃分,共分為3類的故障量數(shù)據(jù)類別,分別為1~5、6~10、11~15。對于類別1的實驗結(jié)果如表2所示。
表2 類別1數(shù)據(jù)研判結(jié)果
在表2中,COUNT_2_1代表電壓等級為1的故障數(shù)據(jù),COUNT_2_2代表電壓等級為2的故障數(shù)據(jù),COUNT_2_3代表電壓等級為3的故障數(shù)據(jù),COUNT_2_4代表電壓等級為4的故障數(shù)據(jù),COUNT_2代表該配電網(wǎng)下的故障總故障數(shù)據(jù),COUNT_1代表非配電網(wǎng)的用戶設(shè)備故障數(shù)據(jù)。在表2中可以發(fā)現(xiàn),文獻[1]方法的查準(zhǔn)率維持在69%~90%之間,查全率維持在80%~91%之間;文獻[2]方法的查準(zhǔn)率較高,維持在81%~91%之間。但由于文獻[2]方法查全率較低,維持在65%~76%之間,查準(zhǔn)結(jié)果置信程度不高,而所提研判方案的查準(zhǔn)率維持在86%~93%之間,查全率在97%~99.78%之間,在查準(zhǔn)和查全上均存在優(yōu)勢。對于類別2的實驗結(jié)果如表3所示。
表3 類別2數(shù)據(jù)研判結(jié)果
從表3可知,文獻[1]方法的查準(zhǔn)率維持在69%~75%,查全率在69%~88%;文獻[2]方法的查準(zhǔn)率在66%~81%之間,查全率在90%~99.37%之間;所提方案的查準(zhǔn)率在91%~95%之間,查全率在98%~100%。對類別3的數(shù)據(jù)研判結(jié)果如表4所示。
表4 類別3數(shù)據(jù)研判結(jié)果
從表4可以看出,文獻[1]方法、文獻[2]方法的性能下降嚴(yán)重,進行分析得出,類別3的故障數(shù)據(jù)通常是由于其他節(jié)點的故障,從而導(dǎo)致一系列故障,從而導(dǎo)致停電的出現(xiàn),由于其他方法均針對單一節(jié)點進行數(shù)據(jù)研判,因此無法得到可靠的研判數(shù)據(jù)。同時可以證明本文設(shè)計的配電網(wǎng)停電研判方法的可行性。
利用隨機森林算法,對配電網(wǎng)中的所有數(shù)據(jù)進行了過濾或監(jiān)測,實驗表明所提方案提高了研判方案的數(shù)據(jù)查全率及查準(zhǔn)率,對不同類別故障的研判精確度較高。但本文研究由于采用了對電網(wǎng)數(shù)據(jù)的實時監(jiān)測,容易對服務(wù)器造成過多占用,因此未來將會結(jié)合云計算技術(shù),將部分?jǐn)?shù)據(jù)的計算分離,降低服務(wù)器的運算壓力。