鄧明斌 徐志淼 鄧志飛 張 卓 遲艷杰
(廣州供電局有限公司 廣州 510620)
基于多特征融合的竊電識(shí)別算法研究?
鄧明斌 徐志淼 鄧志飛 張 卓 遲艷杰
(廣州供電局有限公司 廣州 510620)
針對(duì)目前專(zhuān)變大用戶(hù)竊電手法多樣化,而傳統(tǒng)的防竊電技術(shù)可行性較低。基于國(guó)內(nèi)外研究現(xiàn)狀,提出一套基于多特征融合的異常用電智能分析模型的實(shí)施方案。通過(guò)對(duì)異常用電的表現(xiàn)行為進(jìn)行特征提取,基于每個(gè)特征采用機(jī)器學(xué)習(xí)方法學(xué)習(xí)用電異常的判決閾值,針對(duì)每一個(gè)具體特征均進(jìn)行了獨(dú)立的異常檢測(cè)后,采用多特征融合的方法對(duì)獨(dú)立的檢測(cè)結(jié)果進(jìn)行融合,獲得綜合的結(jié)果。將該結(jié)果通過(guò)異常指數(shù)分析模型計(jì)算異常指數(shù),最后通過(guò)異常閾值篩選出異常用電戶(hù)。通過(guò)該方法,基本能夠做到將用電行為異常的竊電用戶(hù)篩選出來(lái)。
用電行為;特征提??;多特征融合;竊電識(shí)別
反竊電一直是供電企業(yè)關(guān)注的問(wèn)題。特別是針對(duì)專(zhuān)變大用戶(hù),由于其用電量普遍較大,當(dāng)發(fā)生竊電行為時(shí),電量損失極為嚴(yán)重[1~2]。隨著科技的發(fā)展,竊電行為更直接導(dǎo)致用電行為異常的表現(xiàn)形式多種多樣。由此可見(jiàn),不同的竊電手段會(huì)表現(xiàn)出完全不同的電氣特征和行為特征,如果僅采用單一特征模型進(jìn)行異常行為的檢測(cè)必將會(huì)產(chǎn)生較大偏差,難以決策。
因此,通過(guò)綜合分析目前竊電行為的多樣化及其表現(xiàn)特征的差異性,將建立一種基于多特征融合的異常用電智能分析模型。圖1給出了基于多特征融合的異常用電分析模型組成。根據(jù)不同竊電手段可能導(dǎo)致的不同電氣特征和行為特征進(jìn)行獨(dú)立檢測(cè)評(píng)估,然后采用特征融合算法將獨(dú)立評(píng)估結(jié)果進(jìn)行融合,形成最終的評(píng)估結(jié)果,并基于綜合評(píng)估結(jié)果展開(kāi)異常用電行為的檢測(cè)與定位[3~4]。
圖1 基于多特征融合的異常用電分析模型
根據(jù)竊電行為和用戶(hù)竊電特點(diǎn),并參考供電行業(yè)同行對(duì)專(zhuān)變用戶(hù)的竊電嫌疑系數(shù)產(chǎn)生影響的指標(biāo),擬從電氣特征和用電行為特征對(duì)用戶(hù)進(jìn)行竊電嫌疑檢測(cè)。用電行為特征主要有日用電量離散系數(shù)、用戶(hù)/行業(yè)月用電量離散系數(shù)比[5],各項(xiàng)特征具體描述如下[6~7]:
1)額定電壓偏離度。由于用戶(hù)電壓總能保持平穩(wěn),當(dāng)采集的電壓數(shù)據(jù)發(fā)生大幅向下波動(dòng),必然產(chǎn)生用電異常。因此,采集的電壓數(shù)據(jù)與報(bào)裝的額定電壓的偏離程度,可以較好地體現(xiàn)用電異常的程度。
2)電壓不平衡度。三相電壓不平衡率指三相電壓間的差異,其可以反映出電壓欠壓現(xiàn)象,電壓不平衡度計(jì)算式為[8]
式中,avedev為三相電壓的平均絕對(duì)偏差;mean為三相電壓的平均值。電壓不平衡度越低,表明電壓異常的概率越低,反之越高。
3)電流不平衡度。類(lèi)比于電壓的不平衡度,三相電流的不平衡率能夠很好地反映電流的欠流現(xiàn)象,計(jì)算式如下:
4)電流相關(guān)系數(shù)。電流相關(guān)系數(shù)主要考察三條相線(xiàn)上負(fù)載同步工作的程度,用電異常的三相電流數(shù)據(jù)的運(yùn)行軌跡差異較大,各相線(xiàn)上測(cè)量到的電流數(shù)據(jù)的相關(guān)性減弱。因此,電流相關(guān)性數(shù)值越大,表明電流異常的概率越低,反之電流異常的概率越高。
5)日用電量離散系數(shù)。該特征主要觀(guān)察用電戶(hù)用電行為的長(zhǎng)期一致性,如果用電行為穩(wěn)定,則波動(dòng)率在一個(gè)較小的幅度內(nèi)波動(dòng),否則將出現(xiàn)劇烈波動(dòng)。日用電量波動(dòng)率主要由日用電量標(biāo)準(zhǔn)差和均值進(jìn)行計(jì)算,具體計(jì)算式如下:
正常用戶(hù)的日用電行為應(yīng)保持平穩(wěn),日用電量離散度系數(shù)具有較小的波動(dòng)率,反之則具有較大的波動(dòng)率。
6)用戶(hù)/行業(yè)月用電量離散系數(shù)比。
正常用戶(hù)/行業(yè)月電量離散度系數(shù)比較穩(wěn)定、規(guī)律,而且值相對(duì)較小。相反異常用戶(hù)/行業(yè)月電量離散度系數(shù)則變化很明顯,波動(dòng)較大,而且值相對(duì)偏高。
對(duì)于每一種特征,特征閾值的設(shè)定需要通過(guò)對(duì)歷史正常用戶(hù)和竊電用戶(hù)的用電數(shù)據(jù)采用數(shù)據(jù)挖掘中的聚類(lèi)分析技術(shù),針對(duì)每一項(xiàng)特征都進(jìn)行聚類(lèi)分析(具體采用基于歐氏距離的K-means),得出各項(xiàng)特征的正常類(lèi)、嫌疑類(lèi)和異常類(lèi)三類(lèi),并繼續(xù)用機(jī)器學(xué)習(xí)技術(shù)對(duì)各項(xiàng)特征的上述三類(lèi)分別進(jìn)行學(xué)習(xí),學(xué)習(xí)出各類(lèi)判決閾值。
通過(guò)定義多種用電特征,并分別提供了各項(xiàng)用電特征的計(jì)算公式與異常檢測(cè)算法,得到每個(gè)特征在檢測(cè)周期內(nèi)的判決結(jié)果。由于多種用電特征為獨(dú)立的評(píng)估結(jié)果,需要進(jìn)行多特征融合,形成最終的評(píng)估結(jié)果,并基于綜合評(píng)估結(jié)果展開(kāi)異常用電行為的檢測(cè)與定位。因此,基于廣泛應(yīng)用于智能決策、專(zhuān)家系統(tǒng)以及工業(yè)控制領(lǐng)域的證據(jù)理論,設(shè)計(jì)了用電異常行為檢測(cè)的多特征融合算法。
基于多特征融合模型的訓(xùn)練框架為概率分布,因此需要將各個(gè)特征依據(jù)各自的判決閾值轉(zhuǎn)化為對(duì)應(yīng)的正常、嫌疑、異常的概率分布。假設(shè)檢測(cè)周期為一天,特征1、特征2、特征3為每一個(gè)小時(shí)對(duì)應(yīng)一個(gè)特征,特征4、特征5、特征6為每一天對(duì)應(yīng)一個(gè)特征,因此需要通過(guò)不同的方法將每個(gè)特征的判決結(jié)果轉(zhuǎn)化為對(duì)應(yīng)的概率分布。
針對(duì)特征1、特征2、特征3,通過(guò)判別閾值分別判別每小時(shí)每個(gè)特征屬于正常類(lèi)、嫌疑類(lèi)還是異常類(lèi),并統(tǒng)計(jì)檢測(cè)周期內(nèi)的每個(gè)特征屬于N(正常)、N(嫌疑)、N(異常)的小時(shí)數(shù),按照式(5)即可將每個(gè)特征轉(zhuǎn)換為對(duì)應(yīng)概率分布。
針對(duì)特征4、特征5、特征6,通過(guò)判別閾值分別得到每天每個(gè)特征屬于正常類(lèi)、嫌疑類(lèi)還是異常類(lèi),按照反距離加權(quán)法即可將每個(gè)特征轉(zhuǎn)換為對(duì)應(yīng)概率分布,具體計(jì)算如式(6)所示。
其中,d(正常)、d(嫌疑)、d(異常)分別為特征訓(xùn)練閾值時(shí)聚類(lèi)的正常,嫌疑異常中心點(diǎn)的距離。
將用電行為是否異常視為需要判決的問(wèn)題,用電特征異常檢測(cè)算法的輸出所有可能結(jié)果的集合為正常、嫌疑、異常三部分,該集合即為一個(gè)用電異常辨識(shí)框架。由于m(?)=0,m(正常)+m(嫌疑)+m(異常)=1,因此完全符合證據(jù)理論的模型條件。多特征融合算法描述如下[9~10]:
1)首先將所有用電戶(hù)的用電行為均劃分為三類(lèi),即{正常,嫌疑,異常},將此組合作為多特征融合算法的用電異常識(shí)別框架;
2)基于用電異常識(shí)別框架,借助用電特征異常檢測(cè)算法輸出的每一個(gè)用電戶(hù)的每一項(xiàng)用電特征的屬于正常、嫌疑、異常的概率分布,即m(正常)、m(嫌疑)、m(異常),將它們組成一個(gè)用電異常可信度分配;
3)對(duì)于每一個(gè)用電戶(hù)的多項(xiàng)用電特征,借助用電特征異常檢測(cè)算法就可以獲得多個(gè)對(duì)應(yīng)的用電異??尚哦确峙?;
4)由于多項(xiàng)用電特征的用電異常可信度分配在統(tǒng)一的用電異常識(shí)別框架內(nèi),即可以用改進(jìn)的D-S合并法則完成多項(xiàng)特征的用電異常可信度分配完成合并,具體的合并如下:
(1)對(duì)n個(gè)用電特征,每個(gè)用電特征正常、嫌疑、異常的概率分布為{m(A1),m(A2),m(A3)},設(shè)特征i和j的沖突大小為kij,則:
(2)定義k為n個(gè)特征集中每對(duì)特征沖突總和的平均,它反映了證據(jù)兩兩之間的沖突程度,定義ε為特征的可信度,其計(jì)算公式為ε=e-k;當(dāng)證據(jù)之間的沖突增大時(shí),證據(jù)的可信度將降低。
(3)定義 p(A)和q(A)分別對(duì)應(yīng)n個(gè)特征的乘積、平均值具體計(jì)算如下:
(4)設(shè)歸一化常數(shù):
新的合成公式如下:
經(jīng)過(guò)上述多特征融合算法步驟后,輸出的m(正常)、m(嫌疑)、m(異常)、m(x),即為多個(gè)用電特征異常檢測(cè)結(jié)果的融合評(píng)估結(jié)果,其中m(x)為不確定百分比。但該結(jié)果無(wú)法直接用于判斷用電戶(hù)的用電行為異常程度。
需要采用用電行為異常指數(shù)算法對(duì)多特征融合結(jié)果進(jìn)行評(píng)估。用電異常指數(shù):
異常用電指數(shù)的數(shù)值越高表明用戶(hù)的用電行為異常程度越高,竊電的可能性越高;反之,則越低。通過(guò)對(duì)正常用戶(hù)和竊電用戶(hù)的歷史數(shù)據(jù)評(píng)估得到的用電異常指數(shù),采用Kmeans算法進(jìn)行聚類(lèi)分析,將所有歷史綜合評(píng)估聚為兩類(lèi)正常與異常,設(shè)定竊電閾值。
以廣州市2016年10月17日這一天20個(gè)專(zhuān)變大用戶(hù)的用電數(shù)據(jù)為例,分析多特征融合算法對(duì)于異常用電行為分析的檢測(cè)效果。將這20個(gè)專(zhuān)變用戶(hù)的用電數(shù)據(jù)分別進(jìn)行特征提取,基于訓(xùn)練閾值判決,然后將各個(gè)特征的判決結(jié)果基于多特征進(jìn)行融合,得到融合后正常、嫌疑、異常、不確定的百分比,最后按照異常指數(shù)算法將融合的結(jié)果轉(zhuǎn)化為異常指數(shù)。具體融合結(jié)果如表1所示。
通過(guò)對(duì)歷史正常用戶(hù)和異常用戶(hù)綜合評(píng)估,采用Kmeans算法進(jìn)行聚類(lèi)分析,確定異常指數(shù)的判決閾值為0.45,依據(jù)該閾值可判斷在20個(gè)用戶(hù)中,有6個(gè)用戶(hù)是竊電用戶(hù),14個(gè)用戶(hù)是正常用戶(hù)。通過(guò)對(duì)比正常用戶(hù)和異常用戶(hù)該天基于多特征融合的結(jié)果,正常用戶(hù)的正常百分比遠(yuǎn)大于嫌疑和不確定百分比,異常百分比極小,而異常用戶(hù)的正常百分比較小,異常和不確定百分比偏大。對(duì)比用戶(hù)的用電行為異常指數(shù),用戶(hù)用電行為越正常,用電異常指數(shù)越趨近于0;當(dāng)用戶(hù)用電行為出現(xiàn)異常時(shí),則異常指數(shù)越趨近于1。
表1 廣州市部分專(zhuān)變大用戶(hù)基于多特征融合的用電行為分析表
因此,基于多特征融合算法能夠較好地篩選出用電行為異常的用戶(hù),最終通過(guò)現(xiàn)場(chǎng)檢查、鎖定查獲竊電戶(hù)。
基于多特征融合的異常用電智能分析模型的實(shí)施方案,通過(guò)對(duì)異常用電的表現(xiàn)進(jìn)行特征提取,基于每個(gè)特征采用機(jī)器學(xué)習(xí)方法學(xué)習(xí)用電異常的判決閾值,針對(duì)每一個(gè)具體特征均進(jìn)行了獨(dú)立的異常檢測(cè)。不同于常規(guī)的加權(quán)求和方法,而是采用多特征融合的方法對(duì)獨(dú)立的檢測(cè)結(jié)果進(jìn)行融合,獲得綜合的、便于理解的評(píng)估結(jié)果。當(dāng)然在實(shí)際的應(yīng)用中,還需要對(duì)經(jīng)現(xiàn)場(chǎng)確認(rèn)存在竊電行為,或存在誤報(bào)的用電數(shù)據(jù)分析結(jié)果反饋至分析模型,對(duì)各類(lèi)閾值進(jìn)行不對(duì)的訓(xùn)練和優(yōu)化,使分析模型不斷提高精度,且穩(wěn)定工作。
總而言之,綜合運(yùn)用基于多特征融合的異常用電模型分析,能夠?qū)⒎仙鲜鎏卣鞯母`電用戶(hù)及時(shí)準(zhǔn)確地篩選出來(lái),更好地維護(hù)正常的供用電秩序。
[1]蔡淞,魯帥.基于多特征融合的人臉識(shí)別研究[J].計(jì)算機(jī)應(yīng)用與軟件,2015,32(12):140-144.CAI Song,LU Shuai.The face recognition based on multi-feature fusion[J].Computer Applications and Soft?ware,2015,32(12):140-144.
[2]戰(zhàn)揚(yáng).融合紋理特征和形狀特征的醫(yī)學(xué)圖像分類(lèi)方法[J].信息技術(shù),2013(6):44-46.ZHAN Yang.The medical image classification method of fusion texture features and shape features[J].Information Technology,2013(6):44-46.
[3]王大偉,陳定榮,何亦征.面向目標(biāo)識(shí)別的多特征圖像融合技術(shù)綜述[J].航空電子技術(shù),2011,42(2):6-12.WANG Dawei,CHEN Dingrong,HE Yizheng.A Survey of Feature-level Image Fusion Based on Target Recognition[J].Avionics Technology,2011,42(2):6-12.
[4]戴雯惠.一種基于多特征融合的彩色圖像檢索方法[J].電腦與信息技術(shù),2011,19(5):15-17.DAI Wenhui.A color image retrieval method based on multi feature fusion[J].Computer and Information Tech?nology,2011,19(5):15-17.
[5]楊麗召.基于多特征融合的行為識(shí)別算法研究[D].成都:電子科技大學(xué),2013:16-17.YANG Lizhao.Research on behavior recognition algorithm based on multi feature fusion[D].Chengdu:University of Electronic Science and Technology,2013:16-17.
[6]劉濤,楊勁鋒,闕華坤,等.自適應(yīng)的竊漏電診斷方法研究及應(yīng)用[J].電氣自動(dòng)化,2014(2):60-62.LIU Tao,YANG Jinfeng,QUE Huakun,et al.Study and Application of a Self-adaptive D iagnosis Method for Elec?tricity Stealing and Leakage[J].Electrical Automation,2014(2):60-62.
[7]譚致遠(yuǎn).基于用電行為分析的在線(xiàn)用電異常及風(fēng)險(xiǎn)監(jiān)測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].廣州:華南理工大學(xué),2015:23-24.TAN Zhiyuan.The design and implementation of the on?line power consumption anomaly and risk monitoring sys?tem based on the analysis of the use of electricity[D].Guangzhou:South China University of Technology,2015:23-24.
[8]黃朝凱,林銳濤,姚偉智,等.基于準(zhǔn)實(shí)時(shí)數(shù)據(jù)的反竊電在線(xiàn)監(jiān)測(cè)及診斷分析模型的研究[J].電子設(shè)計(jì)工程,2015,23(14):155-157.HUANG Chaokai,LIN Ruitao,YAO Weizhi,et al.The re?search of expert decision system of online anti-electricity stealing monitoring based on analysis of electrical behav?iors[J].Electronic Design Engineering,2015,23(14):155-157.
[9]張良,劉曉勝,戚佳金,等.一種低壓電力線(xiàn)通信改進(jìn)分級(jí)蟻群路由算法[J].電工技術(shù)學(xué)報(bào),2014,29(2):318-323.ZHANG Liang,LIU Xiaosheng,QI Jiajin,et al.Study of Improved Hierarchical Ant Colony Routing Algorithm for Low-Voltage Power Line Communication[J].Transactions of China Electrotechnical Society,2014,29(2):318-323.
[10]劉博,劉曉勝,徐殿國(guó).基于新距離測(cè)度的電能質(zhì)量測(cè)量數(shù)據(jù)壓縮算法[J].電工技術(shù)學(xué)報(bào),2013,28(9):129-136.LIU Bo,LIU Xiaosheng,XU Dianguo.Power Quality Measuring Data Compression Based on New Distance Measurement[J].Transactions of China Electrotechnical Society,2013,28(9):129-136.
Study on Stealing Recognition Model Based on Multi Feature Fusion
DENG Mingbin XU ZhimiaoDENG ZhifeiZHANG ZhuoCHI Yanjie
(Guangzhou Power Supply Bureau Co.,Ltd.,Guangzhou 510620)
For the present situation,the stealing power methods of specialized users are various.At the same time,the feasi?bility of traditional anti-stealing power measures is low.A scheme of abnormal electricity intelligent analysis model based on multi-feature fusion is provided for this phenomenon.This scheme extracts the features of abnormal power performance and then judge the feature with threshold which is trained by machine learning methods.By fusing the judged result of each feature with the multi-feature fusion,the result can be transformed to abnormal exponent for screening of abnormal based on abnormal threshold.By this method,abnormal electricity users will be screened out basically.
electrical behavior,feature extraction,feature fusion,stealing recognition
Class Number TP391
TP391
10.3969/j.issn.1672-9722.2017.12.016
2017年6月4日,
2017年7月16日
鄧明斌,男,碩士,工程師,研究方向:營(yíng)銷(xiāo)稽查與反竊電技術(shù)。徐志淼,男,碩士,助理工程師,研究方向:營(yíng)銷(xiāo)稽查與反竊電技術(shù)。鄧志飛,男,助理工程師,研究方向:營(yíng)銷(xiāo)現(xiàn)場(chǎng)檢查工作。張卓,女,碩士,工程師,研究方向:營(yíng)銷(xiāo)現(xiàn)場(chǎng)檢查工作。遲艷杰,女,助理工程師,研究方向:營(yíng)銷(xiāo)稽查工作、大數(shù)據(jù)分析和反竊電技術(shù)。