谷海彤 張遠(yuǎn)亮 盧翔智 崔卓 杜錦陽
摘要:戶變拓?fù)潢P(guān)系的準(zhǔn)確識別一直是電網(wǎng)運(yùn)營過程中一個(gè)亟待解決的難題,從技術(shù)上尋求臺區(qū)戶變拓?fù)潢P(guān)系信息識別的方法已迫在眉睫。針對智能電網(wǎng)中部分集采臺區(qū)存在戶變關(guān)系混亂的情況,本文利用數(shù)據(jù)挖掘技術(shù)對電力通訊載波信號數(shù)據(jù)進(jìn)行分析,基于增量式?jīng)Q策樹算法設(shè)計(jì)了臺區(qū)戶變拓?fù)潢P(guān)系的辨識方法,實(shí)現(xiàn)了戶變拓?fù)潢P(guān)系及時(shí)準(zhǔn)確的維護(hù)。實(shí)際運(yùn)行結(jié)果表明:該模型較之傳統(tǒng)的決策樹算法和貝葉斯模型具有更高的準(zhǔn)確度,能有效提高臺區(qū)用戶信息識別的實(shí)時(shí)性和可靠性。
關(guān)鍵詞:數(shù)據(jù)挖掘;戶變拓?fù)潢P(guān)系識別;通訊載波
中圖分類號:TM76 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2019)12-0116-02
0 引言
計(jì)量自動(dòng)化系統(tǒng)是智能電網(wǎng)的重要組成部分,然而由于多種因素,投入運(yùn)行的部分集采臺區(qū)存在戶變關(guān)系混亂的情況,影響臺區(qū)線損分析等關(guān)鍵技術(shù)指標(biāo),進(jìn)而阻礙了計(jì)量自動(dòng)化系統(tǒng)的推廣應(yīng)用。近年來,數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等智能技術(shù)的發(fā)展為實(shí)現(xiàn)臺區(qū)戶變關(guān)系的識別提供了諸多行之有效的方法,這些理論和技術(shù)已經(jīng)在電網(wǎng)運(yùn)營中取得了成功的經(jīng)驗(yàn),例如,將數(shù)據(jù)挖掘應(yīng)用于智能電網(wǎng),鄒云峰鄧?yán)肒均值聚類(K-means)實(shí)現(xiàn)了臺區(qū)合理線損預(yù)測[1]、張藍(lán)宇等運(yùn)用聚類算法和關(guān)聯(lián)分析法,搭建了線損管控、評估與智能診析模型實(shí)現(xiàn)了臺區(qū)線損管理的快速診斷決策[2]。本文則利用與電網(wǎng)拓?fù)潢P(guān)系緊密相關(guān)的載波技術(shù),基于通信載波中所能夠提供的計(jì)量信息,提出了一種基于增量決策樹算法的戶變拓?fù)潢P(guān)系辨識方法,通過數(shù)據(jù)挖掘的方式建立戶變拓?fù)潢P(guān)系的識別模型并對其進(jìn)行維護(hù),用以提升戶變拓?fù)潢P(guān)系識別的準(zhǔn)確率。
1 系統(tǒng)工作原理
本系統(tǒng)利用寬帶載波技術(shù),實(shí)現(xiàn)了基于增量式?jīng)Q策樹算法的戶變拓?fù)潢P(guān)系識別相關(guān)的設(shè)備,在電網(wǎng)運(yùn)營具體實(shí)施時(shí),主站發(fā)送開始臺區(qū)識別指令,CCO將該指令轉(zhuǎn)給戶變識別設(shè)備,戶變識別設(shè)備發(fā)射信號,由臺區(qū)內(nèi)寬帶載波(STA)模塊負(fù)責(zé)回應(yīng),CCO根據(jù)收到的上報(bào)數(shù)據(jù)利用決策樹算法進(jìn)行拓?fù)潢P(guān)系的自動(dòng)識別,并與自己網(wǎng)內(nèi)的拓?fù)錂n案進(jìn)行比較,將分類異常的用戶進(jìn)行剔除.該過程主要分為兩個(gè)階段:第一階段為啟動(dòng)階段,其示意圖如圖1所示,待識別臺區(qū)(A)中的集中器載波模塊進(jìn)行數(shù)據(jù)廣播,要求站點(diǎn)啟動(dòng)臺區(qū)識別功能,正常廣播的數(shù)據(jù),其他臺區(qū)的站點(diǎn)也有可能回應(yīng)。由抄控寶于過零點(diǎn)發(fā)射識別信號。該信號采用的頻率和調(diào)制方式與正常PLC通訊方式不同。其內(nèi)容為本臺區(qū)通訊模塊的SNID和工作模式。
臺區(qū)識別流程第二階段為下發(fā)SNID并生成正確表檔案,其示意圖如圖2所示,由臺區(qū)A集中器模塊發(fā)起讀命令,來查看各節(jié)點(diǎn)回應(yīng)信號并進(jìn)行增量式?jīng)Q策樹的識別算法,根據(jù)識別的分類結(jié)果,CCO模塊會(huì)發(fā)現(xiàn)STA2_21屬于異常分類,而STA1_24屬于本區(qū)域的正常分類。于是可根據(jù)此結(jié)果生成正確的檔案。因此節(jié)點(diǎn)STA1_24會(huì)知道自己的SNID已經(jīng)錯(cuò)誤,會(huì)主動(dòng)退出臺區(qū)B并加入臺區(qū)A,如圖2中灰色節(jié)點(diǎn)所示,即完成了臺區(qū)的正確辨識。
臺區(qū)識別流程的結(jié)束由發(fā)起時(shí)定義的超時(shí)時(shí)間決定,目前一般定義為60分鐘以內(nèi)。臺區(qū)識別結(jié)束后,所變更的臺區(qū)對應(yīng)關(guān)系會(huì)被恢復(fù)為與主站設(shè)置檔案一致。即臺區(qū)識別只提供正確的臺區(qū)對應(yīng)表,并不更改集中器檔案,防止本地檔案與主站不一致。
2 增量式?jīng)Q策樹算法
決策樹分類算法是通過一系列規(guī)則對數(shù)據(jù)進(jìn)行分類的過程,用于來發(fā)現(xiàn)數(shù)據(jù)中蘊(yùn)涵的分類規(guī)則[3]。但是由于電網(wǎng)大數(shù)據(jù)的特性,數(shù)據(jù)集隨時(shí)間推移不斷增大,如果每次建模過程都需要對所有數(shù)據(jù)進(jìn)行訓(xùn)練會(huì)大幅度增加算法的時(shí)空復(fù)雜度。理論上基于貝葉斯估計(jì)的增量學(xué)習(xí)分類器是解決這個(gè)問題的有效途徑,該算法在已有數(shù)據(jù)集的基礎(chǔ)上,僅針對新樣本對原有模型進(jìn)行更新,可以保證算法的快速性和有效性。因此本文考慮將兩者相結(jié)合,建立戶變拓?fù)潢P(guān)系的辨識模型。該算法主要分為兩個(gè)階段,首先將樣本訓(xùn)練集的一部分作為初始樣本數(shù)據(jù)集來生成初始決策樹T0;然后在初始決策樹的基礎(chǔ)上執(zhí)行后續(xù)新樣本的增量學(xué)習(xí)。
假設(shè)根據(jù)某個(gè)樣本數(shù)據(jù)集生成的決策樹中一個(gè)節(jié)點(diǎn)屬性空間為D,之后依據(jù)此樣本數(shù)據(jù)集的屬性空間和分類情況作為貝葉斯分類器的參數(shù),當(dāng)接收到新的樣本數(shù)據(jù)后,對到達(dá)這個(gè)節(jié)點(diǎn)的樣本數(shù)據(jù)進(jìn)行樸素貝葉斯分類,這種節(jié)點(diǎn)稱為貝葉斯結(jié)點(diǎn)。增量式?jīng)Q策樹算法執(zhí)行過程如圖3所示[4],當(dāng)產(chǎn)生一個(gè)新的訓(xùn)練集樣本時(shí),決策樹算法將該實(shí)例與已生成決策樹中劃分的屬性進(jìn)行匹配,并在到達(dá)葉節(jié)點(diǎn)時(shí)終止操作。如果到達(dá)的節(jié)點(diǎn)不是貝葉斯節(jié)點(diǎn),則需要判斷該實(shí)例的劃分是否正確。如果劃分結(jié)果準(zhǔn)確,則決策樹的結(jié)構(gòu)參數(shù)不會(huì)發(fā)生任何更改,否則,如果基于貝葉斯分類方法的結(jié)果比決策樹分類方法更加準(zhǔn)確,則將此節(jié)點(diǎn)轉(zhuǎn)換為貝葉斯節(jié)點(diǎn)。如果該節(jié)點(diǎn)是貝葉斯節(jié)點(diǎn),則結(jié)合實(shí)例更新修正該節(jié)點(diǎn)的貝葉斯參數(shù)。因此,可以根據(jù)上述流程,通過連續(xù)遞歸的方式構(gòu)建增量式?jīng)Q策樹。
3 實(shí)驗(yàn)結(jié)果分析
本文主要利用載波通信數(shù)據(jù)來對算法進(jìn)行對比實(shí)驗(yàn)測試對某供電營業(yè)所所屬45個(gè)臺區(qū)戶變拓?fù)潢P(guān)系進(jìn)行了模型有效性的檢驗(yàn),測試數(shù)據(jù)中所有臺區(qū)的用電客戶數(shù)量為3846個(gè),通訊載波信息記錄數(shù)約為120萬條。在網(wǎng)絡(luò)的建立和測試過程中,利用電力載波通信信號品質(zhì)數(shù)據(jù)作歸一化處理作為訓(xùn)練樣本輸入數(shù)據(jù),信號品質(zhì)范圍為0-1,選用本文提出的增量式?jīng)Q策樹算法與經(jīng)典決策樹C4.5算法和貝葉斯分類算法的耗時(shí)以及準(zhǔn)確率進(jìn)行對比,測試戶變拓?fù)潢P(guān)系識別模型的性能分別如圖4和圖5所示。實(shí)驗(yàn)中選取不同大小的數(shù)據(jù)集進(jìn)行測試,橫坐標(biāo)中的數(shù)字1,2,3,4分別代表數(shù)據(jù)集大小為1000,5000,10000和20000。
從圖4和圖5中可以看出,增量決策樹算法在沒有明顯增加計(jì)算負(fù)擔(dān)的前提條件下,其分類準(zhǔn)確率比其他兩種算法有明顯提升,同時(shí),隨著數(shù)據(jù)量的增大準(zhǔn)確率波動(dòng)較小,體現(xiàn)了該算法優(yōu)良的分類性能以及算法的魯棒性。
4 結(jié)語
本文面向臺區(qū)戶變拓?fù)潢P(guān)系的辨識問題,將決策樹算法和貝葉斯增量式學(xué)習(xí)融合,提出了基于載波技術(shù)的增量式?jīng)Q策樹算法用以準(zhǔn)確識別臺區(qū)戶變拓?fù)潢P(guān)系。測試結(jié)果表明該算法能夠滿足電力公司對戶變拓?fù)潢P(guān)系識別精度的要求,在計(jì)量自動(dòng)化系統(tǒng)的推廣應(yīng)用方面發(fā)揮了積極的作用。
參考文獻(xiàn)
[1] 鄒云峰,梅飛,李悅.基于數(shù)據(jù)挖掘技術(shù)的臺區(qū)合理線損預(yù)測模型研究[J].電力需求側(cè)管理,2015,17(4):25-29.
[2] 張藍(lán)宇,陳藝云,海入.基于數(shù)據(jù)挖掘技術(shù)的臺區(qū)線損智能診斷研究及應(yīng)用[J].湖南電力,2019,39(2):16-20.
[3] 刁智華,趙春江,郭新宇.一種新的基于平衡決策樹的SVM多類分類算法[J].控制與決策,2011(1):149-152.
[4] 王明星.數(shù)據(jù)挖掘算法優(yōu)化研究與應(yīng)用[D].安徽大學(xué),2014.
Research on the transformer area identification algorithm based on data mining
GU Hai-tong,ZHANG Yuan-liang,LU Xiang-zhi,CUI Zhuo,DU Jin-yang
(Guangzhou Power Supply Bureau Co., Ltd., Guangzhou? Guangdong? 510620)
Abstract:The accurate maintenance of the topology relationship of the transformer area has always been a difficult problem for the power grid company. At present, technical breakthroughs must be sought to solve the bottleneck problem of accurately identifying the topology relationship across the transformer area. In this paper, an incremental decision tree algorithm was proposed to identify the relationship based on the analysis of the power line carrier communication technology through the data mining technology. The actual operation results showed that the model has the advantages of high recognition accuracy than the Bayesian model and can effectively improve the real-time and reliability of user information identification.
Key words:data mining;transformer area identification;power line carrier