江元,徐熠彬,劉曉焜,楊曉軍
(國網(wǎng)甘肅省電力公司,甘肅 蘭州 730030)
在電力企業(yè)快速發(fā)展的背景下,異常用電現(xiàn)象屢屢出現(xiàn),極大地影響了電力企業(yè)的穩(wěn)定運行,傳統(tǒng)的用戶用電異常行為判定主要通過統(tǒng)計用戶某一時期的用電量來進行,同時,還需要電力稽查人員到一線進行實地稽查,對用戶異常行為作出最終判定,這種判定方式要求用戶用電數(shù)據(jù)具有較高的準確性與可靠性,還需要投入大量的人力,無法達到預期的判定效果[1]。近些年來,隨著電力企業(yè)對系統(tǒng)的不斷升級,電力用戶的用電數(shù)據(jù)被保存在云端系統(tǒng),通過對用電數(shù)據(jù)進行分析與處理,實現(xiàn)用戶用電行為的判定[2]。
以往提出的基于邏輯回歸的用戶異常用電行為判定方法,首先根據(jù)用戶新增用電數(shù)據(jù)建立識別模型,并給出異常用電識別公式[3];采用識別模型構(gòu)建用戶異常用電數(shù)據(jù)邏輯回歸方程,設(shè)定異常用電方差;根據(jù)計算出的用戶異常用電方差對異常用電行為進行判定,該判定方法可實現(xiàn)對用戶異常行為的判定,但效果較差,運算步驟較多且復雜,容易出現(xiàn)誤判情況[4]。
為此,該文提出了基于高維隨機矩陣的用戶異常用電行為判定方法,根據(jù)實驗研究驗證該文判定方法的工作性能。
為了實現(xiàn)對用戶異常用電行為的準確判定,在進行用電行為判定前,需要篩選用戶異常用電數(shù)據(jù),用電數(shù)據(jù)包括三相電壓數(shù)據(jù)不完整、用電數(shù)據(jù)編號不匹配、電量抄表不成功、異常用電缺失數(shù)據(jù)、遺漏數(shù)據(jù)等。采用數(shù)據(jù)篩選規(guī)則篩選出用戶正常用電數(shù)據(jù)與異常用電數(shù)據(jù),設(shè)定異常用電數(shù)據(jù)權(quán)值,根據(jù)用電數(shù)據(jù)權(quán)值進行篩選[5-7]。具體篩選流程如下:
采用數(shù)據(jù)篩選規(guī)則篩選出用戶正常用電數(shù)據(jù)與異常用電數(shù)據(jù)。采集電力公司存儲的用戶用電數(shù)據(jù),將這些用戶用電數(shù)據(jù)按照用電類型、電表所在臺區(qū)、臺區(qū)編號格式、用戶大量用電時間進行分類,分類后以數(shù)據(jù)包的形式存儲到Hbase 行鍵中,設(shè)定用電數(shù)據(jù)權(quán)值,計算篩選出的用戶用電數(shù)據(jù)的權(quán)重,如果權(quán)重與權(quán)值的偏差率大于20%,則說明篩選出的用戶用電數(shù)據(jù)為異常用電數(shù)據(jù),如果權(quán)重與權(quán)值的偏差率小于20%,則篩選出的用戶用電數(shù)據(jù)為正常用電數(shù)據(jù)[8]。
采用權(quán)值分析方法進行用戶異常用電數(shù)據(jù)的篩選,其中,設(shè)用戶的用電行為為x,對電力用戶某一段時間的用電數(shù)據(jù)進行篩選與分析時,設(shè)用戶某一段時間的所有用電數(shù)據(jù)為A,用電數(shù)據(jù)權(quán)值為i,用戶用電數(shù)據(jù)篩選公式為:
式中,數(shù)據(jù)篩選特征為ym;數(shù)據(jù)分類特征為zm;Sm表示用戶用電數(shù)據(jù)權(quán)重;m表示用戶用電數(shù)據(jù)量,其中,m<i<n,通過該公式計算用戶用電數(shù)據(jù)權(quán)重,獲得用戶用電數(shù)據(jù)權(quán)重與權(quán)值的偏差率大于20%,則篩選出來的用戶用電數(shù)據(jù)為異常數(shù)據(jù)。改變權(quán)值大小,則通過以上公式可篩選出用戶用電正常數(shù)據(jù)[9-12]。
將篩選出來的用戶異常用電數(shù)據(jù)按照電壓判斷規(guī)則記錄異常原因和異常數(shù)據(jù),導致出現(xiàn)異常數(shù)據(jù)的原因可能為電力線路電壓過低、過高或者電力系統(tǒng)記錄的用戶用電數(shù)據(jù)出現(xiàn)缺失等原因,將以上異常原因進行匯總構(gòu)建異常數(shù)據(jù)信息庫,臨時存儲到電力系統(tǒng)的服務(wù)終端內(nèi)。
接下來保存篩選出的異常用電數(shù)據(jù)。利用spark 組件,將異常數(shù)據(jù)信息庫匯總的異常數(shù)據(jù)相關(guān)信息分批存儲到電力系統(tǒng)的用電異常數(shù)據(jù)庫內(nèi),異常信息包括用電地點、用電倍率、異常用電的三相電壓以及量測數(shù)據(jù),以上異常用電數(shù)據(jù)信息可幫助判定用戶異常用電行為。
電力用戶在用電過程中,其用電數(shù)據(jù)可作為是否存在異常用電行為的判定依據(jù),通過計量系統(tǒng)可以自動測量用戶用電數(shù)據(jù)的電壓、電流、瞬時電壓、瞬時功率等信息數(shù)據(jù),當電力用戶正常用電時,以上信息數(shù)據(jù)以時間序列形式保存在電網(wǎng)系統(tǒng)中,隨著用電行為的進行,這些信息數(shù)據(jù)穩(wěn)定波動,當電力用戶進行異常用電行為時,以上信息數(shù)據(jù)將劇烈波動,在波動過程中會出現(xiàn)最大值與最小值,應(yīng)用高維隨機矩陣原理,根據(jù)用電數(shù)據(jù)分類特征,建立電力用戶異常用電行為判定方法的模型[13]。
由于矩陣內(nèi)的各數(shù)據(jù)具有不同的采樣頻率,因此需要對隨機矩陣內(nèi)的每個數(shù)據(jù)參數(shù)進行數(shù)值歸一化處理,以保證各個指標的有效性[14-15]。
由以上構(gòu)建的高維隨機矩陣與協(xié)方差矩陣,對電力系統(tǒng)中用戶的異常用電行為進行判定。當電力系統(tǒng)中有用戶在進行異常用電時,協(xié)方差矩陣中的特征值將發(fā)生劇烈波動,可以通過波動范圍圈定異常用電用戶,并通過協(xié)方差特征值分布情況檢測用戶異常用電情況,判定流程如圖1 所示。
圖1 基于高維隨機矩陣的用戶異常用電行為判定過程
選擇該臺區(qū)某一時間段內(nèi)電壓、電流超額的異常用電數(shù)據(jù)建立高維隨機矩陣,選取數(shù)據(jù)庫中的數(shù)據(jù)與異常用電數(shù)據(jù)分別作為矩陣的行、列參數(shù),調(diào)整高維隨機矩陣的行列比例,根據(jù)異常用電數(shù)據(jù)高維隨機矩陣構(gòu)建協(xié)方差矩陣,由協(xié)方差矩陣的時間序列分布與特征值分布情況,檢測各條線路的用電情況。將篩選出的用戶正常用電數(shù)據(jù)與異常用電數(shù)據(jù)作為用電數(shù)據(jù)結(jié)構(gòu)參數(shù),建立的異常用電行為判定模型為:
式中,w表示正常用電數(shù)據(jù),b表示異常用電數(shù)據(jù),a表示異常用電數(shù)據(jù)種類,y表示用戶的異常用電行為,c表示用電數(shù)據(jù)結(jié)構(gòu)[16]。
然后,確定異常用電用戶。應(yīng)用大數(shù)據(jù)理論,當電力系統(tǒng)的運行出現(xiàn)異常時,構(gòu)建的高維隨機矩陣與協(xié)方差矩陣中的數(shù)據(jù)將出現(xiàn)異常波動,高維隨機矩陣的行列值將不符合矩陣的要求,矩陣特征值也將出現(xiàn)異常偏離情況,由偏離程度確定異常用電線路,采集該條線路上所有用戶的用電量、用電時間、用電數(shù)據(jù)的有功功率、電壓等數(shù)據(jù),構(gòu)建高維隨機矩陣與協(xié)方差矩陣,根據(jù)矩陣的特征值譜分布情況確定該條線路的異常用電用戶。通過異常用電行為判定模型獲取異常用電高維隨機矩陣,即:
式中,y1,y2,…,yn表示時間序列參數(shù),根據(jù)異常用電高維隨機矩陣構(gòu)建協(xié)方差矩陣,即:
其中,Yn表示矩陣內(nèi)的協(xié)方差;yi表示第i個異常用電用戶的時間序列參數(shù),y表示協(xié)方差特征值。
最后,對異常用電用戶的用電行為進行判定。異常線路與異常用電用戶確定完畢后,選取異常線路上異常用電用戶的用電數(shù)據(jù),利用該用電數(shù)據(jù)構(gòu)建高維隨機矩陣,通過矩陣的行列比值與矩陣特征值的波動程度,輸出對該用電行為的判斷結(jié)果。通過以上建立的高維隨機矩陣與協(xié)方差矩陣可實現(xiàn)用戶異常用電行為的判定。
為了驗證該文提出的基于高維隨機矩陣的用戶異常用電行為判定方法的有效性,選用該文判定方法與大數(shù)據(jù)挖掘判定方法、邏輯回歸判定方法進行實驗對比。
選用的實驗對比線路為西北電網(wǎng)某臺區(qū)的線路,線路A 為異常線路,線路B 為正常線路,西北電網(wǎng)某臺區(qū)的線路拓撲結(jié)構(gòu)如圖2 所示。
圖2 電網(wǎng)線路拓撲結(jié)構(gòu)
觀察圖2 可知,實驗中的臺區(qū)電網(wǎng)設(shè)置了兩條支路,分別是線路A 和線路B,在線路A 上設(shè)置5 個節(jié)點,在線路B 上設(shè)置7 個節(jié)點,共有12 個節(jié)點,除了節(jié)點1 為電源節(jié)點外,節(jié)點2 至節(jié)點10 都為用戶節(jié)點。記錄兩個不同線路的用電總量數(shù)據(jù),其中線路A 存在異常行為。
同時選用該文方法和傳統(tǒng)方法對圖2 的電網(wǎng)拓撲結(jié)構(gòu)中的用戶進行用電行為判定。根據(jù)大數(shù)據(jù)理論可知,在用電系統(tǒng)工作正常時,用戶的概率密度函數(shù)值滿足M-P 定律,可以以獨立的方式同步分布,而一旦出現(xiàn)異常,用電節(jié)點的特征值譜密度函數(shù)將會偏離M-P 定律,同時選用該文提出的異常用電行為判定方法和傳統(tǒng)行為判定方法進行對比實驗,判斷用戶是否存在異常。實驗結(jié)果如圖3、4所示。
圖3 線路A用戶行為異常判定實驗結(jié)果
由圖4 可知,在檢測正常線路B 時,該文判定方法和傳統(tǒng)判定方法都能夠檢測出正常線路,判定用戶不存在異常用電行為。而在檢測非正常線路A時,該文提出的基于高維隨機矩陣的用戶異常用電行為判定方法和基于大數(shù)據(jù)挖掘的用戶異常用電行為判定方法都能檢測出存在異常用電情況,而基于邏輯回歸的用戶異常用電行為判定方法無法確定存在故障的線路,判定能力最弱,因此不適用于實際應(yīng)用中。
圖4 線路B用戶行為異常判定實驗結(jié)果
在確定異常電路后,分析異常用戶用電時間段,選用該文提出的用戶異常用電行為判定方法和傳統(tǒng)的基于大數(shù)據(jù)挖掘的用戶異常用電行為判定方法共同判定用戶異常行為時間段。根據(jù)高維理論可知,電網(wǎng)在非正常運行的情況下,用電總量內(nèi)部的特征值半徑會有兩個突變點,分別對應(yīng)起始時間和終止時間,確定兩個特征點之間的區(qū)段。得到線路A 的用戶異常時間區(qū)段判定結(jié)果如圖5 所示。
圖5 線路A用戶異常時間區(qū)段判定結(jié)果
根據(jù)圖5 可知,第420~510 d 和第750~880 d 為用戶異常時間段,該文提出的基于高維隨機矩陣的判定方法能夠準確地定位時間段,而傳統(tǒng)的基于大數(shù)據(jù)判定方法僅能定位750~880 d 的用戶異常時間段,無法檢測到第420~510 d 存在的異常數(shù)據(jù),且得到的平均譜半徑與實際值相差較大。
綜上所述,該文提出用電行為判定方法能夠分析用戶異常位置,同時確定異常時間段,而傳統(tǒng)的邏輯回歸判定方法與大數(shù)據(jù)挖掘判定方法雖然能夠確定異常用戶,卻無法精準地定位時間段,不能實現(xiàn)用電用戶判定。
該文選擇電力系統(tǒng)中的用戶異常用電數(shù)據(jù)構(gòu)建高維隨機矩陣與協(xié)方差矩陣,相比于傳統(tǒng)方法,該文提出的判定方法更適合實際工程,對于未來電網(wǎng)發(fā)展有重要意義。該文提出的判定方法需要采集大量信息才能完成高維隨機矩陣的建立,因此未來需要引入更多的信息采集方法來提高判定速度。