摘 要:本文基于神經(jīng)架構(gòu)搜索技術(shù),利用大規(guī)模智能電表數(shù)據(jù)進行訓(xùn)練,自動判斷電流、電壓和功率特征,旨在提高竊電行為的準確識別度并降低誤報率。本文采用神經(jīng)架構(gòu)搜索算法構(gòu)建的竊電識別模型,更精準地識別竊電行為。研究的最終目標在于加強供電公司對竊電行為的監(jiān)測,提高打擊能力,保障電網(wǎng)安全、穩(wěn)定地運行。該方法的應(yīng)用十分廣泛,可推動智能電表技術(shù)的發(fā)展,為電力行業(yè)提供更高效的管理手段。
關(guān)鍵詞:神經(jīng)架構(gòu)搜索;智能電表;竊電行為
中圖分類號:TM 73 " " " " " " " " 文獻標志碼:A
傳統(tǒng)的竊電識別方法主要是人工檢測與統(tǒng)計分析,存在識別準確性低、易受人為因素影響等問題。為了提高竊電行為的識別效果,研究人員開始應(yīng)用機器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)。其中,基于神經(jīng)架構(gòu)搜索的智能電表竊電識別方法成為研究的熱點。
1 問題闡述
本文的主要目標是利用智能電表采集電力用戶的真實用電量數(shù)據(jù),通過分析數(shù)據(jù)缺失信息,對竊電行為檢測模型進行優(yōu)化與改良。為實現(xiàn)該目標,本文引入神經(jīng)架構(gòu)搜索算法。該算法能夠自動定義用電特征并計算竊電嫌疑度,從而將用戶分為高或低竊電嫌疑度組別。該算法通過測算用戶的竊電嫌疑度,判斷該用戶是否存在竊電行為。本文設(shè)竊電懷疑度為P。當P≥0.5時,表示該用戶竊電懷疑度高,其發(fā)生竊電行為的概率較大;當Plt;0.5時,表示該用戶竊電懷疑度低,通常情況下不存在竊電行為[1]。本文調(diào)取中國國家電網(wǎng)中的公開數(shù)據(jù),總結(jié)了42373個用戶在1036天內(nèi)的用電數(shù)據(jù),并通過試驗分析,論證了基于該算法構(gòu)建的切點識別模型的有效性。
2 數(shù)據(jù)輸入
本文將收集的數(shù)據(jù)轉(zhuǎn)化為m×n數(shù)據(jù)矩陣,其中n表示用戶數(shù)量,m表示時間節(jié)點數(shù)據(jù),如公式(1)所示。
(1)
式中:Xn為第n個用戶的用電量數(shù)據(jù)序列。
本文中,n=42373,m=1029。考慮計算的簡便性,剔除最后7天的數(shù)據(jù),以便將數(shù)據(jù)轉(zhuǎn)化為矩陣。在此基礎(chǔ)上,利用卷積神經(jīng)網(wǎng)絡(luò),將矩陣X轉(zhuǎn)變?yōu)閿?shù)據(jù)張量,即X'(42373×147×7),最終得到Xi'(147×7)。將數(shù)列設(shè)定為7列,對應(yīng)一周7天的用電周期,以便進行對比,如公式(2)所示。
(2)
3 基于神經(jīng)架構(gòu)搜索的竊電識別方法
隨著人工智能技術(shù)快速發(fā)展,作為深度學(xué)習(xí)中的一個新興領(lǐng)域,神經(jīng)架構(gòu)搜索被廣泛應(yīng)用于眾多場景。竊電識別是電力系統(tǒng)中的關(guān)鍵問題,本文引入神經(jīng)框架搜索對其進行優(yōu)化,旨在提高檢測精確度和效率。
3.1 基于貝葉斯優(yōu)化的神經(jīng)架構(gòu)搜索方法
在竊電識別的應(yīng)用中,基于貝葉斯優(yōu)化的神經(jīng)架構(gòu)搜索可以有效縮短模型搜索時間,快速定位到具有高精度識別能力的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[2]。本文將一個準確度較高的竊電識別神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)定為F,成本函數(shù)設(shè)定為Cost(·),用電數(shù)據(jù)集D分為訓(xùn)練集Dtrain和測試集Dval。假設(shè)存在一個最優(yōu)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)f*,如公式(3)、公式(4)所示。
f*=argminf∈FCost(f(θ*),Dval) (3)
θ*=argminθL(f(θ),Dtrain) (4)
式中:θ*為f的結(jié)構(gòu)參數(shù);F為覆蓋全部神經(jīng)架構(gòu)。
3.2 基于神經(jīng)架構(gòu)搜索的竊電識別模型
本文構(gòu)建的竊電識別模型由卷積層、全連接層和輸出層組成。卷積層負責從輸入的電表數(shù)據(jù)中自動提取有用的局部特征。全連接層負責將這些特征進行整合,可將提取的多維特征向量壓縮為一個更低維度的特征空間,從而用于最終的分類或回歸任務(wù)[3]。輸出層負責對整合后的特征進行加權(quán)求和,并輸出一個表示竊電嫌疑度的數(shù)值。該層會使用Sigmoid或者Softmax作為激活函數(shù),以便輸出1個0~1的概率值。
3.3 竊電檢測流程
需要收集足夠的電力使用數(shù)據(jù),包括正常使用和竊電情況。數(shù)據(jù)需要經(jīng)過清洗、歸一化和標注等預(yù)處理步驟,使其適用于后續(xù)的模型訓(xùn)練。在此階段,本文應(yīng)用神經(jīng)框架搜索進行模型自動搜索。利用貝葉斯優(yōu)化或其他策略,系統(tǒng)會自動評估并選擇最佳的神經(jīng)網(wǎng)絡(luò)架構(gòu)。選定最佳網(wǎng)絡(luò)架構(gòu)后,使用標注的數(shù)據(jù)進行模型訓(xùn)練。利用深度學(xué)習(xí)技術(shù),模型會學(xué)習(xí)到竊電和正常用電間的區(qū)別。一旦模型訓(xùn)練完成,就可以使用該模型對新的電力使用數(shù)據(jù)進行竊電識別[4]。
4 性能評估
4.1 數(shù)據(jù)集
本文將數(shù)據(jù)集導(dǎo)入竊電識別模型,去除數(shù)據(jù)中顯示為“Nan”的數(shù)據(jù),剩余數(shù)據(jù)均為真實有效的用電數(shù)據(jù)。對有效數(shù)據(jù)進行預(yù)處理,最終得到竊電識別數(shù)據(jù)(見表1)。
4.2 數(shù)據(jù)預(yù)處理
不同用戶的用電量差異巨大,為避免出現(xiàn)甲用戶與乙用戶在單位時間內(nèi)用電量下降比例不同,需要對過濾后的有效數(shù)據(jù)進行歸一化運算,將原始數(shù)據(jù)轉(zhuǎn)變?yōu)闊o綱數(shù),如公式(5)所示。
(5)
式中:W為原始數(shù)據(jù)序列;W'為經(jīng)過歸一化處理的數(shù)據(jù)序列。
4.3 驗證方法
本文引入多折交叉驗證模型。該模型適用于僅有一個預(yù)測目的場景,與本文研究的“預(yù)測用戶是否為竊電用戶”的目標一致。
4.4 性能指標
通常情況下,在一個大的供電區(qū)域中,有竊電行為的用戶數(shù)量極少,因此在利用用戶用電數(shù)據(jù)判斷竊電行為的過程中,正常用電數(shù)據(jù)與竊電用戶的用電數(shù)據(jù)比例差異懸殊,如果采用傳統(tǒng)的準確率比較,就容易出現(xiàn)誤差。其原因在于絕大用戶被判定為“非竊電用戶”,該判斷的準確率通常會超過90%,但該判斷結(jié)果無法準確反映本文設(shè)計的竊電識別算法的性能。因此,本文引入精準率評價指標、召回率評價指標以及綜合評價指數(shù)F1,將3項指標代入折交叉驗證法中,進而印證基于神經(jīng)網(wǎng)絡(luò)搜索算法的竊電識別模型的有效性[5]。這3項指標的計算過程如公式(6)~公式(8)所示。
(6)
(7)
(8)
式中:Precision為精準評價指數(shù);Recall為召回率評價指數(shù);TP為“竊電用戶集”中被判定為竊電用戶的用戶數(shù);EP為“正常用戶集”中被判定為竊電用戶的用戶數(shù);FN為“竊電用戶集”中被判定為正常用戶的用戶數(shù)。
竊電檢測工作的核心是確保準確性和查全率。如果檢測方法不夠準確,可能會導(dǎo)致誤判,從而引發(fā)不必要的人力和物力投入,甚至可能侵害無辜消費者的權(quán)益。相反,如果檢測方法查全率低,可能會導(dǎo)致許多竊電行為逍遙法外,從而加劇電力公司的經(jīng)濟損失。因此,本文引入F1分數(shù)作為評價指標。該指標是查全率(召回率)和查準率(精確率)的調(diào)和平均值。查全率反映了檢測方法查出所有竊電行為的能力,查準率則反映了被檢測出來的竊電行為中真實竊電行為的比例。F1分數(shù)綜合考慮了這2個方面,為相關(guān)研究人員提供了一個全面、準確的評估工具。通過不斷優(yōu)化竊電檢測方法,提高F1分數(shù),電力公司能更有效地打擊竊電行為,確保誠信和公平。
4.5 試驗結(jié)果
神經(jīng)框架搜索算法竊電識別模型混淆矩陣見表2,其中TN為“正常用戶集”中被判定為正常用戶的用戶數(shù)量。分析表2中的數(shù)據(jù)可以發(fā)現(xiàn),F(xiàn)N的280個用戶被劃入“竊電用戶集”的主要原因在于這部分用戶缺失值信息較少,該模型無法利用缺失值信息對其進行準確識別。被該模型識別為竊電用戶與非竊電用戶的電力用戶數(shù)量分布如圖1所示。
隨機從“使用原始數(shù)據(jù)”的簇和“使用特征提取”的簇中調(diào)取9位用戶的用電數(shù)據(jù),并對該數(shù)據(jù)進行可視化轉(zhuǎn)化(如圖2所示)。
圖2中,橫軸為用電天數(shù),縱軸為月數(shù),其中黃色部分為“有數(shù)據(jù)缺失”的用電數(shù)據(jù)。分析圖2可以明顯看出,未被該模型識別為“竊電用戶”的缺失值很少,其平均數(shù)量僅為6;而被判定為“竊電用戶”的數(shù)據(jù)中,存在數(shù)據(jù)缺失的數(shù)據(jù)數(shù)量較多,平均為539個。由此可以證明,利用數(shù)據(jù)缺失信息能夠較準確地判斷用戶是否存在竊電行為。
需要注意的是,上述試驗采集數(shù)據(jù)的間隔為1天。如果用戶采用打開電表蓋子的方式進行竊電且“開蓋→修改數(shù)據(jù)”行為發(fā)生在一天之內(nèi),則模型不會讀取到該用戶存在數(shù)據(jù)缺失的問題。因此,如果僅使用缺失值信息來判斷用戶是否有竊電行為,則無法檢測出使用開蓋修改數(shù)據(jù)方式進行竊電活動的用戶。針對該問題,本文嘗試將開蓋數(shù)據(jù)與存在缺失值的數(shù)據(jù)進行融合,令該模型能夠覆蓋絕大多數(shù)竊電行為判斷場景。此外,對“正常用戶集”中被判斷為“竊電用戶”的81個用戶進行深入分析可知,產(chǎn)生誤判的主要原因如下。1)在采集數(shù)據(jù)過程中會有一定的數(shù)據(jù)包丟失概率,導(dǎo)致該用戶的用電數(shù)據(jù)不完整,進而導(dǎo)致模型判斷錯誤。2)集中器發(fā)生故障,導(dǎo)致用戶的用電數(shù)據(jù)丟失,被模型判斷為“竊電用戶”。
5 結(jié)論
本文采用基于神經(jīng)架構(gòu)搜索的方法對智能電表進行竊電識別,取得了一定成果。該成果揭示了在電能竊取行為中,基于神經(jīng)架構(gòu)搜索的模型具有較好的性能和高效的特征學(xué)習(xí)能力。在理論方面,本文深入挖掘了神經(jīng)架構(gòu)搜索的潛力,為智能電表竊電識別領(lǐng)域提供了新的思路和方法。自動搜索合適的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可以大幅減少人工設(shè)計模型的工作量,并能獲得更好的性能。在實際應(yīng)用方面,基于神經(jīng)架構(gòu)搜索的智能電表竊電識別方法具有實際應(yīng)用價值。準確識別電能竊取行為可以幫助電力公司及時發(fā)現(xiàn)非法竊電行為,有效降低電網(wǎng)安全風(fēng)險和經(jīng)濟損失。未來可以進一步優(yōu)化搜索算法、提高效率,并結(jié)合硬件優(yōu)化等技術(shù)進行應(yīng)用。此外,本文使用的數(shù)據(jù)集也可以進一步擴充和完善,以提高模型的泛化能力和適用性,為電力系統(tǒng)的安全與管理做出更大貢獻。
參考文獻
[1]湯淵,吳裕宙,蘇盛,等.基于改進深度極限學(xué)習(xí)機的光伏擴容用戶識別方法[J].電力系統(tǒng)及其自動化學(xué)報,2022,35(11):13-16.
[2]鄒念,張穎,蘇盛,等.基于小時尺度周期特征自編碼器的用戶竊電識別方法[J].電網(wǎng)技術(shù),2023,47(6):2558-2567.
[3]馮小峰,姚誠智,楊俊華.基于Stacking集成學(xué)習(xí)的竊電檢測研究[J].電測與儀表,2023,12(8):10-12.
[4]劉文浩,馮玥,姜東良.基于AMI數(shù)據(jù)驅(qū)動的竊電用戶識別研究[J].制造業(yè)自動化,2022,44(11):5-8.
[5]夏睿,高云鵬,朱彥卿,等.基于SE-CNN模型的竊電檢測方法研究[J].電力系統(tǒng)保護與控制,2022,50(20):117-126.