黃文思,陳 婧,谷 峪
(國網信通億力科技有限責任公司,福建 福州 350003)
在同期線損管理系統(tǒng)全面建設的推動下,傳統(tǒng)同期線損管理工作中存在的弊端不斷突顯,對運檢、調度以及營銷等專業(yè)數(shù)據也提出了更高質量要求。因此,快速實現(xiàn)與現(xiàn)行營配數(shù)據相符的匹配方案和識別方案,已成為供電企業(yè)發(fā)展的必由之路。此外,隨著市場經濟體制的不斷完善,供電行業(yè)所面臨的市場競爭機制也在不斷完善,優(yōu)勝劣汰已成為供電企業(yè)普遍面臨的發(fā)展難題,而基于大數(shù)據技術的營配調數(shù)據智能匹配和識別方案的運用,能夠實現(xiàn)在確保供電系統(tǒng)正常運行的同時,降低生產經營成本,能提高供電企業(yè)市場競爭能力和盈利能力[1]。
基于大數(shù)據技術的營配調數(shù)據智能匹配和識別方案主要包含Person相關系數(shù)、BP神經網絡-時間序列及TF-IDF等應用。其中,Person相關系數(shù)的相關算法流程為:開始計算→得出Person相關系數(shù)→分析兩變量之間的關系→獲取計算結果。BP神經網絡-時間序列的算法流程為:開始計算→神經網絡初始化→輸入歷史供電量及影響因素數(shù)據→訓練神經網絡時間序列預測模式→輸出預測結果→判斷計算誤差是否達到可接受范圍;若達到可接受范圍,則獲取計算結果,若達不到可接受范圍,系統(tǒng)則會返回訓練神經網絡時間序列預測模式重新開始計算,直至誤差達到可接受范圍。TF-IDF算法流程為:開始計算→計算詞頻TF→計算逆文件IDF→計算TF-IDF的乘積→獲取計算結果。
本文采用的數(shù)據主要來源于陽泉市區(qū)、國網陽泉、陽泉郊區(qū)、陽泉平定、陽泉大戶以及陽泉盂縣等供電公司,選取數(shù)據的時間為2015年5月至2017年7月,數(shù)據類型為電網運行狀態(tài)下的數(shù)據,主要包含了各供電公司的供電量、售電量、線損量以及線損率等,采集數(shù)據的頻率為1天/次。
2.1.1 實驗過程與分析
隨著公司管理水平提高、網架結構和電力設備的改善,電網線損率也有了較明顯的下降,但還有其他一些非可控的因素影響線損率統(tǒng)計。因此,定量地分析各區(qū)域供電公司每日供電量、售電量以及線損波動等指標之間的相關性,將表現(xiàn)異常的數(shù)據篩選出來,并在營配調系統(tǒng)中智能識別線變和臺戶異常掛載,為電網的管理、評估以及決策提供真實可靠的參考依據。
(1)數(shù)據預處理
靠站數(shù)據挖掘工作前,需要對所收集的數(shù)據進行預處理,便于將原始數(shù)據進行必要的清洗集成、轉化、離散以及規(guī)約,使其達到挖掘算法、獲取信息所制定的最低標準和規(guī)范[2]。此外,對原始數(shù)據進行預處理,還可以完善殘缺的數(shù)據,對數(shù)據中存在的錯誤信息進行及時糾正,將所需要的數(shù)據挑選出來進行數(shù)據集成,同時把不適應的數(shù)據格式轉化為系統(tǒng)所要求的格式,最終實現(xiàn)數(shù)據類型和格式相同的處理目的。經過預處理的數(shù)據,能夠滿足實驗所需要的樣本數(shù)據,并提升實驗結果的可靠性與真實性。
(2)供電量與售電量的差值
模型在分析比較系統(tǒng)供電量和售電量的差值時,可以事先判斷出某一區(qū)域發(fā)生線損異常的大致情況。同時設置一個閾值,將其與供電量與售電量的差值進行對比,當差值大于所設置的閾值時,則可提示該區(qū)域存在線損異常的情況。然后運用TF-IDF算法對該區(qū)域的臺戶關系及線變關系的異常掛載情況等進行篩選,從而鎖定異常用戶的局地位置。當售電量與供電量的差值小于所設置閾值時,則需要進一步分析用戶電量和線損電量的相關性,從而判斷該區(qū)域是否存在線損異常情況。
(3)線損電量和供電量的相關性
線損電量和用戶電量的Pearson相關系數(shù)的計算,有助于確定是否對數(shù)據進行直接校驗。當兩者之間的相關性較強時,可以直接對其進行校驗;當兩者的相關性較弱時,需要通過繼續(xù)預測線損率的方式決定是否使用TF-IDF分析電力設備的異常掛載情況。
(4)線損電量預測
如果線損電量和供電量不存在強相關關系,則對線損電量進行預測,預測線損電量和實際線損電量之間的差值,當差值大于實驗設定的閾值時,模型認為統(tǒng)計的線損電量出現(xiàn)異常,需要繼續(xù)進行TF-IDF篩選電力設備的異常掛載[3]。本文采用BP神經網絡結合時間序列的方式預測售電量,同時將預測結果作為計算線損電量的依據,達到預測線損電率的目的。如果預測線損率和實際線損率超過閾值,可以判斷該區(qū)域存在線損異常的情況,需使用TF-IDF算法找出異常掛載的電力設備。
(5)TF-IDF篩查電力設備異常掛載
為準確搜集引起線損出現(xiàn)異常計算結果的原因,文章使用TF-IDF算法判斷出電力設備地址和異常掛載情況。例如,線路、變壓器、臺區(qū)及用戶關系等出現(xiàn)異常掛載,從而實現(xiàn)準確鎖定線損異常位置、提升處理線損異常情況的質量和效率等目的。
(6)校驗
將通過該模型得到的線損異常區(qū)域以及定位的異常掛載的電力設備通知電網工作人員,工作人員對實驗結果進行實地考察和認證,以驗證結果的準確性。如果結果誤差較大,則調整模型及模型中的參數(shù)再次進行實驗,以保證本文模型的準確性和可靠性。
2.2.1 相關性分析結果
對陽泉市區(qū)及周邊縣城的電網中供電量和線損數(shù)據進行Pearson相關系數(shù)的計算,得出在前5個地區(qū)中供電量與線損電量之間存在著加強的相關性,而孟縣供電公司的相關系數(shù)r卻僅有0.154 6,因此可以判斷孟縣供電公司所覆蓋的供電區(qū)域極有可能存在線損異常的情況,需要對孟縣的線損電量進行預測。
(1)線損電量預測
本文主要運用預測售電量的方式實現(xiàn)線損電量的預測,所以將售電量數(shù)據作為預測模型中的樣本數(shù)據,表1為預測盂縣售電量的樣本數(shù)據。
表1 預測盂縣售電量樣本數(shù)據
節(jié)假日類型中,1表示為節(jié)假日,0表示為工作日。
神經網絡-時間序列模型的輸入層為售電量預測模型,把影響售電量的因素經過對策反復訓練后,將均方差控制為0.002。將成熟的模型運用于孟縣售電量的預測,結果顯示售電量與實際數(shù)據之間存在較大的差距,超過了事先設定的閾值,因此需要運用TF-IDF算法確定孟縣的供電量,從而判斷該區(qū)域是否存在電力設備異常掛載的情況。
(2)TF-IDF篩查電力設備異常掛載結果
第一,電力設備無異常掛載。對仙人臺區(qū)的所有用戶地址進行TF-IDF分析后,結果顯示山西省、陽泉市、盂縣及仙人等用戶地址的詞頻TF值均為0.83,說明山西省、陽泉市、盂縣及仙人等4個詞語的TF值相等,即上述4個臺區(qū)中所有用戶地址的出現(xiàn)頻率是相同的,不存在詞語出現(xiàn)頻率偏低的情況,因此可以得出該臺區(qū)無異常用戶的結論。
第二,電力設備出現(xiàn)異常掛載。對李家莊臺區(qū)的所有用戶地址進行TF-IDF分析后,得出山西省、陽泉市、盂縣以及李家莊潘等用戶地址的詞頻TF值分別為0.071、0.069、0.072以及0.004 7,其中潘的TF值明顯低于其他區(qū)域,因此可以判斷該地區(qū)遠遠小于其他詞語,說明李家莊臺區(qū)帶有潘的用戶有可能不屬于該臺區(qū)。為再一次驗證結果的準確性,對東杜臺區(qū)所有用戶地址的所有用戶地址進行TF-IDF分析,結果顯示、陽泉市、盂縣、東杜及一變等詞頻的TF值分別為0.067、0.066、0.066及0.000 9。對東杜臺區(qū)內的所有用戶地址進行統(tǒng)計分析后,得出地址為山西省陽泉市盂縣路家村鎮(zhèn)東杜村的有73戶,而地址為山西省陽泉市盂縣西潘鄉(xiāng)的僅有1戶,即該用戶有可能存在異常掛載的情況,工作人員進行現(xiàn)場確認后,進一步落實了該用戶確實不屬于這一臺區(qū),需要在營配調系統(tǒng)中修改掛載關系。
第三,采用TF-IDF算法分析線變關系與臺戶關系。該模塊通過分析盂縣供電量和線損電量的相關關系,判斷盂縣有可能存在線損異常,需要使用TF-IDF算法對孟縣的線變關系和臺戶關系進行分析,通過對盂縣2 000多個臺區(qū)的臺戶關系進行分析,得出26個臺區(qū)可能出現(xiàn)了異常掛載的結論,經過工作人員現(xiàn)場校驗后,對16個臺區(qū)的影長掛載情況進行了確認,通過營配調系統(tǒng)對該區(qū)域的錯誤進行糾正后,線損異常現(xiàn)象有了很大程度的改善。因此,本文建立的基于TF-IDF算法的同期線損數(shù)據治理模型,能夠有效地解決電力設備異常掛載的情況,在提高工作質量和工作效率的同時,降低了供電公司的運營成本,值得推廣和使用[4]。
基于TF-IDF算法的同期線損數(shù)據治理模型在解決電力設備異常掛載時準確率很高,減少了人工對所有臺區(qū)逐一現(xiàn)場排查的盲目性和工作量,有效控制了此項工作的維護成本[5]。此外,根據設備地址識別設備是否正常掛載,為電網的營配調貫通提供了一種新思路,提高了電網運行參數(shù)。例如,線損率等數(shù)據計算結果的準確性,為電網企業(yè)實現(xiàn)降本增效目標提供了有力的數(shù)據支撐。