摘 要:為了優(yōu)化用電異常核算效果,提高用電異常檢出率,借助物聯(lián)網(wǎng)與數(shù)據(jù)挖掘技術(shù),提出了一種用電異常精細化核算算法。首先,利用物聯(lián)網(wǎng)技術(shù),采集用戶用電數(shù)據(jù),并對采集到的用電數(shù)據(jù)進行標(biāo)準(zhǔn)化轉(zhuǎn)換處理;然后,提取用戶用電數(shù)據(jù)特征,計算特征向量的重要性指數(shù)并排序;最后,利用數(shù)據(jù)挖掘算法中的孤立森林算法,劃分多尺度特征節(jié)點數(shù)據(jù)空間,使用iTree深度計算用電數(shù)據(jù)異常分值,實現(xiàn)用電異常核算。實驗結(jié)果表明,在應(yīng)用該算法后,用電異常的檢出率顯著提升,最高可達98%。
關(guān)鍵詞:物聯(lián)網(wǎng);數(shù)據(jù)挖掘;電量數(shù)據(jù);異常檢測;精細化核算;孤立森林
中圖分類號:TP39;TN082 文獻標(biāo)識碼:A 文章編號:2095-1302(2025)01-00-03
0 引 言
用電異常核算指對電力用戶的用電數(shù)據(jù)進行實時監(jiān)控和分析,旨在及時發(fā)現(xiàn)異常用電情況,進而有針對性地對其作出處理[1],從而有效減少能源浪費、提高電力使用效率、保障電力系統(tǒng)的安全穩(wěn)定運行[2-3]。如何對用電異常進行精細化核算,成為了當(dāng)前電力行業(yè)亟待解決的問題。傳統(tǒng)的用電異常核算方法主要依賴于人工巡檢和統(tǒng)計分析,不僅效率低下,而且難以發(fā)現(xiàn)潛在的用電異常。
物聯(lián)網(wǎng)和數(shù)據(jù)挖掘技術(shù)的發(fā)展,為用電異常精細化核算提供了新的解決方案。通過這兩種技術(shù)的結(jié)合,可以實現(xiàn)對用戶用電數(shù)據(jù)的全面分析和利用,從而為用電異常精細化核算提供有用的信息和支持?;诖?,本文提出了基于物聯(lián)網(wǎng)和數(shù)據(jù)挖掘技術(shù)的用電異常精細化核算算法。
1 基于物聯(lián)網(wǎng)的用戶用電數(shù)據(jù)采集
物聯(lián)網(wǎng)技術(shù)在用戶用電數(shù)據(jù)采集領(lǐng)域的應(yīng)用,可以使得數(shù)據(jù)采集更加智能、高效和準(zhǔn)確。通過物聯(lián)網(wǎng)傳感器可以實時采集用戶用電設(shè)備的數(shù)據(jù),并將其傳輸至數(shù)據(jù)中心,使電力公司可以及時了解用戶的用電情況,進行實時監(jiān)測和分析。物聯(lián)網(wǎng)技術(shù)支持大規(guī)模的傳感器部署,能夠覆蓋更多的用戶和設(shè)備,從而采集并分析更多的用電數(shù)據(jù),為電力公司提供更全面的信息基礎(chǔ)。物聯(lián)網(wǎng)技術(shù)使得用電數(shù)據(jù)可以通過云平臺進行遠程訪問和控制,電力公司可以隨時隨地監(jiān)控用戶用電情況,并根據(jù)需求進行優(yōu)化調(diào)整,提供個性化的能源服務(wù)。
為了提高用電數(shù)據(jù)采集的效率與準(zhǔn)確性,本文借助物聯(lián)網(wǎng)技術(shù),對用戶用電數(shù)據(jù)進行采集。具體步驟如下:在電力用戶的用電設(shè)備上安裝物聯(lián)網(wǎng)傳感器[4-6];遠程采集中心發(fā)布采集任務(wù),輪詢物聯(lián)網(wǎng)數(shù)據(jù)庫,獲取滿足條件的采集任務(wù)[7-8];分解采集任務(wù),得出若干個子任務(wù),通過消息總線,將子任務(wù)轉(zhuǎn)發(fā)給協(xié)議棧;協(xié)議棧對子任務(wù)進行解析后發(fā)送給集中器,組成相應(yīng)的報文;物聯(lián)網(wǎng)傳感器根據(jù)報文采集相應(yīng)的用電數(shù)據(jù),并將采集結(jié)果發(fā)送給執(zhí)行模塊。數(shù)據(jù)采集過程中,需要綜合考慮電壓波動的幅度、頻率等因素對設(shè)備運行可能造成的影響。最后,通過物聯(lián)網(wǎng)通信技術(shù),將傳感器采集到的用電數(shù)據(jù)傳輸至數(shù)據(jù)采集中心。
2 用戶用電數(shù)據(jù)預(yù)處理
用戶用電數(shù)據(jù)采集完畢后,需要對數(shù)據(jù)進行標(biāo)準(zhǔn)化預(yù)處理,將用電數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一尺度,便于不同特征之間的比較和分析。同時,提升用電數(shù)據(jù)的準(zhǔn)確性與可靠性,為后續(xù)的用電異常精細化核算奠定良好的基礎(chǔ)。標(biāo)準(zhǔn)化預(yù)處理的具體計算公式見式(1):
" "(1)
式中:xi、xi' 分別表示標(biāo)準(zhǔn)化轉(zhuǎn)換前后的用電數(shù)據(jù);max(xi)、min(xi)分別表示樣本中用電數(shù)據(jù)的最大值與最小值。通過式(1),能夠?qū)崿F(xiàn)對不同量綱用電數(shù)據(jù)的運算與特征分析。將標(biāo)準(zhǔn)化處理后的用電數(shù)據(jù)存儲到數(shù)據(jù)庫中,以便后續(xù)進行數(shù)據(jù)挖掘與用電異常核算。
3 提取多尺度用電特征
用戶用電數(shù)據(jù)預(yù)處理完成后,接下來需要進行多尺度用電特征的提取。由于后續(xù)用電異常精細化核算是以用戶用電數(shù)據(jù)特征為基礎(chǔ)的,因此,所提取的用電特征越具有代表性,后續(xù)的核算結(jié)果便越精確?;诖?,本文開展了用戶多尺度用電特征提取的研究。
首先,依據(jù)上述預(yù)處理后的數(shù)據(jù),提取出所有的用戶用電數(shù)據(jù)特征,見表1。
其次,對各指標(biāo)作矢量量化,并求出其重要性指數(shù),具體計算公式見式(2):
(2)
式中:Pi表示第i個用電特征向量的重要性指數(shù);wi表示指標(biāo)權(quán)重;Si表示第i個特征向量;m表示用電特征向量的數(shù)量。通過式(2)計算特征向量的重要性指數(shù),并從大到小對特征向量進行排序。選取排名前5的特征向量,組合在一起形成新的特征集合[9-10]。分析提取用電數(shù)據(jù)特征,借助數(shù)據(jù)挖掘技術(shù),研究用電數(shù)據(jù)的趨勢和周期性變化,以便發(fā)現(xiàn)異常值。
4 基于數(shù)據(jù)挖掘的用電異常精細化核算算法設(shè)計
多尺度用電特征提取完畢后,接下來需要利用數(shù)據(jù)挖掘技術(shù),設(shè)計用電異常精細化核算算法。本文所提出的基于數(shù)據(jù)挖掘的用電異常精細化核算算法設(shè)計主要分為2個階段。
(1)利用數(shù)據(jù)挖掘中的孤立森林方法,構(gòu)建用電樣本的分析架構(gòu)。首先,設(shè)計t個iTree,將其進行組合以形成孤立森林。其次,從用電數(shù)據(jù)中隨機選取ψ個用電數(shù)據(jù)樣本點,組成待核算的子樣本集,共同置于孤立森林的樹根節(jié)點中。在當(dāng)前樹根節(jié)點數(shù)據(jù)中,隨機設(shè)定一個用電異常核算維度,并圍繞該核算維度生成切割點p。以p點為中心,構(gòu)造一個超平面。在該平面內(nèi),劃分節(jié)點數(shù)據(jù)空間,生成2個形狀、規(guī)格均相同的子空間。統(tǒng)計核算維度中大于和小于p的用電數(shù)據(jù),放入2個子空間內(nèi)。隨后,遞歸處理子節(jié)點,不斷分解出新的用電數(shù)據(jù)子節(jié)點,直至用電數(shù)據(jù)無法再進一步分解為止,完成孤立森林構(gòu)建。
(2)計算被核算用電樣本的異常分值。在獲取t個iTree后,將先前提取到的多尺度用電特征分別輸入到iTree的各個節(jié)點中,對整個孤立森林進行迭代訓(xùn)練。然后,用生成的迭代訓(xùn)練結(jié)果,對用電測試數(shù)據(jù)進行全方位、多維度的評估。在此基礎(chǔ)上,將用電數(shù)據(jù)x均勻地分布在孤立森林中的每一棵iTree中,并根據(jù)用電數(shù)據(jù)的多尺度特征,確定數(shù)據(jù)在iTree中所處的深度,即數(shù)據(jù)最終落在iTree的第幾層。以iTree的深度作為判定用電數(shù)據(jù)異常程度的依據(jù),深度越小,則用電數(shù)據(jù)異常分值越高。異常分值的具體計算公式為:
(3)
式中:h(x)表示被核算樣本在孤立森林中檢索到的節(jié)點深度;E[·]表示對t個iTree取均值;c(ψ)表示孤立森林平均路徑長度。通過式(3)計算用電數(shù)據(jù)異常分值s(x),根據(jù)經(jīng)驗設(shè)定0.5為界限值。若s(x)≥0.5,則說明用電存在異常隱患;若s(x)lt;0.5,說明用電數(shù)據(jù)正常。s(x)越接近1,說明用電異常的可能性越高;s(x)越接近0,說明用電異常的可能性越低。
由此,構(gòu)建基于數(shù)據(jù)挖掘的用電異常精細化核算算法,實現(xiàn)對用電異常行為的識別、分類和核算,為電力行業(yè)的運營、管理和決策提供科學(xué)依據(jù)和支持。
5 實驗分析
5.1 實驗準(zhǔn)備
本實驗旨在驗證基于物聯(lián)網(wǎng)和數(shù)據(jù)挖掘技術(shù)的用電異常精細化核算算法的有效性和準(zhǔn)確性。首先,進行實驗環(huán)境配置,使算法能夠穩(wěn)定運行。實驗環(huán)境配置如下:服務(wù)器采用Intel Xeon 處理器,有著16 GB內(nèi)存和1 TB SSD硬盤;操作系統(tǒng)選用Ubuntu 18.04 LTS;物聯(lián)網(wǎng)采集軟件使用MQTT Broker(如Eclipse Mosquitto);數(shù)據(jù)挖掘工具選擇Weka 3.8.5。其次,分別連接寬帶網(wǎng)絡(luò)與無線網(wǎng)絡(luò),以保證數(shù)據(jù)傳輸速度和穩(wěn)定性,方便移動設(shè)備訪問。本文所使用的資料是一家供電公司所提供的實際用電資料。數(shù)據(jù)集的時間范圍為一個月,采樣頻率為1次/min。該實驗數(shù)據(jù)集包含約1億條用電數(shù)據(jù)記錄,總大小約為12 GB,其中用電異常數(shù)據(jù)大小約為1 GB,均標(biāo)有標(biāo)簽。數(shù)據(jù)集內(nèi)所有數(shù)據(jù)的格式均為CSV格式。根據(jù)時序?qū)?shù)據(jù)進行分類,并將其分為訓(xùn)練樣本和測試樣本。
將本文提出的算法設(shè)置為實驗組,將文獻[1]中的方法設(shè)置為對照組1,將文獻[4]中的方法設(shè)置為對照組2。
5.2 核算結(jié)果分析
設(shè)定用電數(shù)據(jù)量分別為2 GB、4 GB、6 GB、8 GB、10 GB、12 GB,在用電數(shù)據(jù)量增加的情況下,測定應(yīng)用3種算法后的用電異常檢出率,并作出對比,結(jié)果如圖1所示。
通過圖1的對比結(jié)果可知,本文算法表現(xiàn)出了良好的性能優(yōu)勢;在用電數(shù)據(jù)量持續(xù)增加的情況下,本文算法用電異常檢出率始終高于另外2個對照組,最高達到了98%。這說明該算法能夠在數(shù)據(jù)集中有效地提取出異常用電行為的特征,并對其進行分類和識別,對用電異常行為的識別能力更強,能夠準(zhǔn)確地核算出潛在的用電異常情況,從而有效預(yù)防和減少電力資源的浪費和損失。
6 結(jié) 語
本文提出了用電異常精細化核算算法,一方面通過物聯(lián)網(wǎng)技術(shù),實時采集與監(jiān)控電力用戶的用電情況,實現(xiàn)用電數(shù)據(jù)的全面監(jiān)測和數(shù)據(jù)共享;另一方面通過數(shù)據(jù)挖掘技術(shù),對采集到的用電數(shù)據(jù)進行進一步地分析和挖掘,為電力行業(yè)的運營和管理提供科學(xué)決策和支持。實驗結(jié)果表明,該算法可以有效地提高用電異常核算的準(zhǔn)確性,降低電力行業(yè)的運營成本,推動電力行業(yè)的智能化發(fā)展,促進可持續(xù)發(fā)展。
參考文獻
[1] 武亞光,張才俊,程飛飛. 基于FP-growth算法的多尺度用電異常行為檢測方法[J]. 電子設(shè)計工程,2023,31(23):118-121.
[2] 鄭世英,牛清林,劉偉,等. 電力用戶異常用電的深度神經(jīng)網(wǎng)絡(luò)檢測方法[J]. 電力需求側(cè)管理,2023,25(6):82-87.
[3] 錢旭盛,朱萌,翟千惠,等. 基于改進孤立森林算法的異常用電行為識別方法[J]. 沈陽工業(yè)大學(xué)學(xué)報,2023,45(6):601-606.
[4] 潘駿,夏祥武,李梁,等. 基于關(guān)聯(lián)潮流感知與高斯混合模型的異常用電檢測[J]. 電力建設(shè),2023,44(11):138-148.
[5] 陳慧,陳適,郭銀婷,等. 基于正則自編碼器及Optuna尋優(yōu)的異常用電數(shù)據(jù)清洗研究[J]. 電力需求側(cè)管理,2023,25(5):53-58.
[6] 閆相偉,宋國壯,劉怡豪. 基于改進Stacking集成分類算法的用戶用電信息異常識別[J]. 電子技術(shù)應(yīng)用,2023,49 (8):13-18.
[7] 孟宋萍,彭偉,田晨璐. 基于門控循環(huán)單元的非均衡數(shù)據(jù)驅(qū)動異常用電檢測方法[J]. 計算機測量與控制,2023,31 (10):54-60.
[8] 吳澤黎,李清清,梁皓. 基于BiLSTM-CatBoost模型的電力用戶異常用電檢測[J]. 自動化與儀表,2023,38(5):22-27.
[9] 田健,杜暄,韓碩辰,等. 基于物聯(lián)網(wǎng)技術(shù)的低壓居民日均電量異常自動判斷系統(tǒng)設(shè)計[J]. 微型電腦應(yīng)用,2023,39(5):123-128.
[10] 顧臻,莊葛巍,賀青,等. 基于LOF+SVM的異常用電用戶分階段識別方法[J]. 電氣傳動,2023,53(3):90-96.