祝宇楠,徐 晴,劉 建,田正其,周 超
(國網(wǎng)江蘇省電力公司電力科學(xué)研究院國家電網(wǎng)電能計(jì)量重點(diǎn)實(shí)驗(yàn)室,江蘇南京210019)
數(shù)據(jù)挖掘在智能電能表故障分析中的應(yīng)用
祝宇楠,徐晴,劉建,田正其,周超
(國網(wǎng)江蘇省電力公司電力科學(xué)研究院國家電網(wǎng)電能計(jì)量重點(diǎn)實(shí)驗(yàn)室,江蘇南京210019)
自2009年推廣以來,全國范圍內(nèi)已安裝運(yùn)行數(shù)億只智能電能表,國家電網(wǎng)公司采取集中檢定模式對其進(jìn)行裝出前的管理,并配套了用電信息采集系統(tǒng)監(jiān)控其現(xiàn)場運(yùn)行狀態(tài),管理部門可在相應(yīng)平臺(tái)上獲得智能電能表海量的質(zhì)量數(shù)據(jù)。文中嘗試在矩陣實(shí)驗(yàn)室(MATLAB)環(huán)境下,通過訓(xùn)練神經(jīng)網(wǎng)絡(luò),建立現(xiàn)場智能電能表故障數(shù)據(jù)與檢定數(shù)據(jù)之間聯(lián)系,討論采用數(shù)據(jù)挖掘技術(shù)分析檢定數(shù)據(jù)以提前獲得智能電能表故障信息的可能性及有效性,為電能表的質(zhì)量管控提供另一種工具。
智能電能表;數(shù)據(jù)挖掘;故障分析;神經(jīng)網(wǎng)絡(luò)
隨著信息技術(shù)的發(fā)展,智能電能表突破傳統(tǒng)業(yè)務(wù),集成了雙向多費(fèi)率計(jì)量、實(shí)時(shí)互動(dòng)、負(fù)荷控制、能效管理等多種功能,由此引入了系統(tǒng)復(fù)雜性,可靠性下降。自2009年推廣以來,全國范圍內(nèi)已安裝運(yùn)行智能電能表4億多只,不可避免地出現(xiàn)了由設(shè)計(jì)或工藝問題導(dǎo)致的設(shè)備故障。這些電表拆回后雖進(jìn)行了故障分析,但由于數(shù)量多、故障原因繁雜、缺乏規(guī)模化分析手段,多數(shù)分析結(jié)果被當(dāng)成個(gè)體、偶然發(fā)生的情況來處理,其反映的深層信息有待進(jìn)一步研究;同時(shí),未開展故障信息與其他質(zhì)量數(shù)據(jù)之間的關(guān)聯(lián)性研究。
數(shù)據(jù)挖掘是從大量數(shù)據(jù)中發(fā)現(xiàn)并提取隱藏信息的過程[1],已有數(shù)據(jù)挖掘在用電及相關(guān)信息領(lǐng)域的應(yīng)用實(shí)例。文獻(xiàn)[2]采用數(shù)據(jù)挖掘技術(shù)對AM I計(jì)量數(shù)據(jù)的電能誤差進(jìn)行分析,發(fā)現(xiàn)超差電表,使校準(zhǔn)有的放矢。文獻(xiàn)[3]研制了一套計(jì)量裝置在線監(jiān)測和智能診斷系統(tǒng),可運(yùn)用數(shù)據(jù)挖掘技術(shù)對用戶違約用電竊電和計(jì)量裝置故障進(jìn)行智能診斷。文獻(xiàn)[4]將數(shù)據(jù)挖掘技術(shù)與用電大數(shù)據(jù)信息化技術(shù)結(jié)合,通過臺(tái)區(qū)線損異常智能診斷模型,對臺(tái)區(qū)線損異常進(jìn)行管理,提高了企業(yè)的經(jīng)濟(jì)效益。文獻(xiàn)[5]在建立關(guān)口電能表性能狀態(tài)評估模型的基礎(chǔ)上,采用數(shù)據(jù)挖掘技術(shù)對檢測數(shù)據(jù)進(jìn)行誤差變化趨勢分析、狀態(tài)研究、性能分析等??梢?,采用數(shù)據(jù)挖掘可以發(fā)現(xiàn)傳統(tǒng)統(tǒng)計(jì)方法難以確立大量數(shù)據(jù)之間的隱形關(guān)系,為故障診斷等提供有效的分析手段。文中分析了電能表生命周期內(nèi)的質(zhì)量數(shù)據(jù)內(nèi)容及其來源,然后通過基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù)分析大量智能電能表故障信息與其他質(zhì)量信息的宏觀關(guān)聯(lián)性,以期通過數(shù)據(jù)之間內(nèi)在聯(lián)系發(fā)現(xiàn)故障征兆。
1.1智能電能表生命周期
每一只智能電能表都帶有唯一的資產(chǎn)編號(hào),其整個(gè)生命周期中,通過該資產(chǎn)編號(hào)可將時(shí)間維度上的所有質(zhì)量數(shù)據(jù)聯(lián)系起來。智能電能表的生命周期按時(shí)間先后順序可分為以下4個(gè)階段。
(1)設(shè)計(jì)生產(chǎn):智能電能表廠家依據(jù)產(chǎn)品標(biāo)準(zhǔn)、需求方特殊要求等進(jìn)行表計(jì)的設(shè)計(jì)與生產(chǎn),為每只電能表分配資產(chǎn)編號(hào),并在出廠前進(jìn)行參數(shù)設(shè)置、老化試驗(yàn)等初步檢測;
(2)檢測驗(yàn)收:供貨前質(zhì)量監(jiān)督信息的統(tǒng)計(jì)分析過程,包括到貨后抽樣樣品全性能檢測和整個(gè)到貨批次表計(jì)的全檢驗(yàn)收。質(zhì)量數(shù)據(jù)包括準(zhǔn)確度、電氣要求、電磁兼容、通信功能、一致性、費(fèi)率控制等試驗(yàn)結(jié)果;
(3)現(xiàn)場運(yùn)行:裝出后電能表將在現(xiàn)場工作運(yùn)行,此過程中記錄的各種異常數(shù)據(jù)或異常事件有時(shí)能反映出自身質(zhì)量缺陷或性能退化;
(4)退出運(yùn)行:電能表不能正常工作被拆回分揀或超出規(guī)定運(yùn)行時(shí)間退出現(xiàn)場運(yùn)行,可能進(jìn)行故障分析或分揀,提取故障質(zhì)量信息。
電能表的質(zhì)量數(shù)據(jù)在整個(gè)生命周期內(nèi)是不斷變化和積累的,任何一個(gè)階段的質(zhì)量數(shù)據(jù)都可能與故障信息相關(guān)。
1.2用電信息采集系統(tǒng)與智能電能表的集中檢定
現(xiàn)代的電能計(jì)量系統(tǒng)是由智能電能表、數(shù)據(jù)采集設(shè)備、主站及連接這些設(shè)備的通信網(wǎng)絡(luò)組成。國家電網(wǎng)公司在此基礎(chǔ)上建立了用電信息采集系統(tǒng)(EEDAS)。用電信息采集系統(tǒng)通過對配電變壓器及終端用戶進(jìn)行用電數(shù)據(jù)的監(jiān)測和采集,實(shí)現(xiàn)遠(yuǎn)程付費(fèi)、階梯電價(jià)、負(fù)荷管理,最終達(dá)到自動(dòng)抄表、錯(cuò)峰用電、用電檢查、負(fù)荷預(yù)測和節(jié)約用電成本等目的。EEDAS已積累了大量的電能表運(yùn)行數(shù)據(jù),蘊(yùn)含著電能表狀態(tài)和性能信息。
另外,國家電網(wǎng)公司還建立了省級(jí)集中檢定制度,在供貨初期即對所有智能電能表進(jìn)行計(jì)量檢定,只有符合檢定規(guī)范要求的電能表才能配送至現(xiàn)場運(yùn)行。此過程中,裝出前誤差等反映其性能的檢定數(shù)據(jù)均記錄在省級(jí)計(jì)量中心生產(chǎn)調(diào)度平臺(tái)(MDS)上,這些信息目前僅代表檢定時(shí)電能表的某些性能,與電能表的長期性能、質(zhì)量有無關(guān)聯(lián)尚無研究。
傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)適用于線性、結(jié)構(gòu)化的數(shù)據(jù)關(guān)系,由于智能電能表質(zhì)量數(shù)據(jù)結(jié)構(gòu)不統(tǒng)一,且非線性、持續(xù)性及噪音是普遍存在的,因此需要一種不同于傳統(tǒng)的理論和方法來解決大量質(zhì)量數(shù)據(jù)關(guān)聯(lián)分析的問題[6]。在有足夠的數(shù)據(jù)且網(wǎng)絡(luò)足夠大的時(shí)候,神經(jīng)網(wǎng)絡(luò)可高效地學(xué)習(xí)帶有非線性分類的結(jié)構(gòu)模式[7]?;谏窠?jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法步驟如下∶
(1)生成矩陣形式的數(shù)據(jù)表;
(2)確定輸出變量,生成輸出量向量表;
(3)確定神經(jīng)網(wǎng)絡(luò)類型、內(nèi)部算法參數(shù)、神經(jīng)元數(shù)量等;
(4)將輸入數(shù)據(jù)表劃分為訓(xùn)練集、驗(yàn)證集、測試集三部分,初始化三者比例,驗(yàn)證集、測試集中的示例數(shù)遠(yuǎn)少于訓(xùn)練集中的示例數(shù);
(5)用訓(xùn)練集的輸入輸出量訓(xùn)練神經(jīng)網(wǎng)絡(luò);
(6)將驗(yàn)證集提供給訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行判別;
(7)將測試集提供給訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行測試;
(8)若驗(yàn)證、測試結(jié)果符合預(yù)期,則(9);否則,重新修改神經(jīng)元數(shù)目、或更改訓(xùn)練集、驗(yàn)證集、測試集三者比例,重復(fù)(5—8);
(9)結(jié)束。
3.1故障數(shù)據(jù)預(yù)處理
將智能電能表故障進(jìn)行分類并導(dǎo)入系統(tǒng)的數(shù)據(jù)表中備用。智能電能表的故障可分為硬件、軟件、通信3個(gè)方面的故障,其中硬件故障又可追溯至整機(jī)、模塊、元器件等3層級(jí)。國家電網(wǎng)公司在電能表質(zhì)量管控相關(guān)管理辦法中總結(jié)了智能電能表的49種故障類型,在剔除外觀、安裝環(huán)境等原因明顯的故障類型后,典型的硬件故障按照模塊層級(jí)分類如表1所示。
表1 典型的模塊層級(jí)故障分類
表1中幾種故障類型均是在現(xiàn)場運(yùn)行或退出運(yùn)行環(huán)節(jié)中發(fā)現(xiàn)的,數(shù)據(jù)均記錄在EEDAS中。為了了解故障發(fā)生前,是否能從已有的檢測檢驗(yàn)數(shù)據(jù)中發(fā)現(xiàn)故障隱患,需要將檢測檢驗(yàn)數(shù)據(jù)進(jìn)行整理。需要說明的是,若故障與檢測檢驗(yàn)數(shù)據(jù)含有某種隱形關(guān)聯(lián),這種關(guān)聯(lián)只能通過大量數(shù)據(jù)的趨勢體現(xiàn)出來。文中根據(jù)江蘇省級(jí)計(jì)量中心現(xiàn)有檢測檢驗(yàn)手段,提取檢測環(huán)節(jié)中可獲得的63個(gè)實(shí)驗(yàn)結(jié)果進(jìn)行數(shù)據(jù)關(guān)聯(lián)分析,這63個(gè)試驗(yàn)結(jié)果包括“制造商”、“檢定臺(tái)號(hào)”、各種平衡負(fù)載下的“相對誤差”、“平均誤差”、“采樣值”、“校核計(jì)度示數(shù)”、“時(shí)鐘日計(jì)時(shí)誤差”等各類數(shù)據(jù)。
3.2數(shù)據(jù)挖掘算法實(shí)現(xiàn)
數(shù)據(jù)挖掘的目的是找到輸入變量與每種故障的聯(lián)系,以及每個(gè)輸入變量(因素或特征)對每種故障的影響量有多大。將EEDAS中導(dǎo)出的所有故障電能表進(jìn)行預(yù)處理后,分別通過唯一的資產(chǎn)編號(hào)從記錄檢定檢驗(yàn)數(shù)據(jù)的MDS中找到對應(yīng)的63類數(shù)據(jù),生成數(shù)據(jù)表,作為數(shù)據(jù)挖掘算法的輸入(訓(xùn)練項(xiàng)之一)。
為表述清楚起見,下文示例只選取“誤差超差”及“RS-485通信失敗”2種故障,這2種故障均為智能電能表的主要失效模式,示例重點(diǎn)研究上述63種檢測數(shù)據(jù)結(jié)果與這2種故障的關(guān)聯(lián)。
采用矩陣實(shí)驗(yàn)室(MATLAB)神經(jīng)網(wǎng)絡(luò)模式識(shí)別工具箱對輸入數(shù)據(jù)進(jìn)行訓(xùn)練。由于訓(xùn)練過程中不僅需要上述故障信息,還需要非故障表的相關(guān)信息,因此,以1∶2的比例在EEDAS與MDS中隨機(jī)提取非故障表的63類數(shù)據(jù),與故障數(shù)據(jù)表合成總數(shù)據(jù)表,作為模式識(shí)別工具箱的輸入。以三維向量[1,0,0],[0,1,0],[0,0,1]分別表示非故障表、通信模塊失效、計(jì)量模塊失效3種情況,即輸出量1,2,和3。輸出向量維數(shù)=失效模式數(shù)+1。
選取前饋神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,其具有1個(gè)隱藏層和1個(gè)輸出層。該神經(jīng)網(wǎng)絡(luò)采用的內(nèi)部算法為反向傳播共軛梯度法,停止準(zhǔn)則選取均方差,當(dāng)其小于給定閾值時(shí),訓(xùn)練停止。為得到更好的訓(xùn)練效果,輸入輸出的向量順序在每次計(jì)算時(shí)都會(huì)重新調(diào)整。上述過程流程如圖1所示,選取的神經(jīng)網(wǎng)絡(luò)如圖2所示。
圖1 用電能表數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)過程流程
圖2 兩層前饋神經(jīng)網(wǎng)絡(luò)
圖3 訓(xùn)練集70%驗(yàn)證集15%測試集15%及10神經(jīng)元時(shí)的訓(xùn)練結(jié)果
3.2訓(xùn)練步驟及結(jié)果
為得到最佳訓(xùn)練效果,設(shè)計(jì)以下2步訓(xùn)練步驟。
(1)第Ⅰ步。固定訓(xùn)練集、驗(yàn)證集和測試集的比例,調(diào)整神經(jīng)網(wǎng)絡(luò)隱藏層中的神經(jīng)元數(shù)量:設(shè)定訓(xùn)練集70%、驗(yàn)證集15%、測試集15%,神經(jīng)網(wǎng)絡(luò)隱藏層中的神經(jīng)元數(shù)量范圍為10-1000。按照本文第2小結(jié)介紹的算法步驟對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。圖3—5表示了神經(jīng)元數(shù)量分別為10,100,1000時(shí)各自最好的訓(xùn)練結(jié)果。圖4混淆矩陣中3個(gè)訓(xùn)練結(jié)果正確率達(dá)到了100%,高于圖3和圖5。由此可見,固定訓(xùn)練集、驗(yàn)證集、測試集的比例時(shí),100神經(jīng)元可達(dá)到最好的訓(xùn)練效果。
(2)第Ⅱ步。固定神經(jīng)網(wǎng)絡(luò)隱藏層中的神經(jīng)元數(shù)量,調(diào)整訓(xùn)練集、驗(yàn)證集和測試集的比例:固定神經(jīng)網(wǎng)絡(luò)隱藏層神經(jīng)元數(shù)100,調(diào)整訓(xùn)練集、驗(yàn)證集和測試集比例,圖6中為50%,25%,25%;圖7中比例調(diào)整為60%,20%,20%。訓(xùn)練該神經(jīng)網(wǎng)絡(luò),圖6、圖7所示分別為各自情況中效果最好的一次,然而均不如比率為75%,15%,和15%時(shí)的情況(如圖4所示)。
分析訓(xùn)練集70%、驗(yàn)證集15%、測試集15%、100神經(jīng)元時(shí)的訓(xùn)練結(jié)果可知,智能電能表“誤差超差”及“RS-485通信失敗”2種故障與檢測檢驗(yàn)環(huán)節(jié)中記錄的63個(gè)檢測量結(jié)果有一定的關(guān)系。按輸出結(jié)果顯示,根據(jù)檢測檢驗(yàn)環(huán)節(jié)預(yù)測2種故障的正確性均為75%。
圖5 訓(xùn)練集70%驗(yàn)證集15%測試集15%及1000神經(jīng)元時(shí)的訓(xùn)練結(jié)果
圖6 訓(xùn)練集50%驗(yàn)證集25%測試集25%及100神經(jīng)元時(shí)的訓(xùn)練結(jié)果
圖7 訓(xùn)練集60%驗(yàn)證集20%測試集20%及100神經(jīng)元時(shí)的訓(xùn)練結(jié)果
采用基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù)對故障智能電能表故障分析數(shù)據(jù)與檢測檢驗(yàn)環(huán)節(jié)的記錄數(shù)據(jù)進(jìn)行了關(guān)聯(lián)性分析,驗(yàn)證了通過前期的檢驗(yàn)檢測數(shù)據(jù)預(yù)測運(yùn)行環(huán)節(jié)中2種故障類型發(fā)生的可能性。值得注意的是,文中所訓(xùn)練的神經(jīng)網(wǎng)絡(luò)是采用6000只故障表和12 000只非故障表組成的數(shù)據(jù)集合,按照全國電網(wǎng)數(shù)以億計(jì)的智能表來算,文中所采用的數(shù)據(jù)遠(yuǎn)遠(yuǎn)不夠,要想得到準(zhǔn)確性更高的預(yù)測結(jié)果,需將故障表的全集作為輸入數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。分析結(jié)果可以幫助改進(jìn)智能電能表的制造過程,制定更有針對性的批次輪換計(jì)劃,提高智能電能表整體質(zhì)量。
[1]李欣.基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法研究[D].大慶:大慶石油學(xué)院,2003.
[2]郭景濤.面向智能電網(wǎng)AM I的網(wǎng)絡(luò)計(jì)量關(guān)鍵技術(shù)與用戶用電數(shù)據(jù)挖掘研究[D].天津:天津大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,2011.
[3]肖堅(jiān)紅,嚴(yán)小文,周永真,等.基于數(shù)據(jù)挖掘的計(jì)量裝置在線監(jiān)測與智能診斷系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].電測與儀表,2014,51(14):62-67.
[4]宋玉,鄭海雁,尹飛.基于智能用電大數(shù)據(jù)分析的臺(tái)區(qū)線損管理[J].電力信息與通信技術(shù),2015,13(8):132-135.
[5]張建偉,曹敏,王昕,等.基于數(shù)據(jù)挖掘技術(shù)的關(guān)口電能表檢測數(shù)據(jù)分析統(tǒng)計(jì)平臺(tái)設(shè)計(jì)[C]//2011年云南電力技術(shù)論壇-2011年云南電力技術(shù)論壇論文集(入選部分).昆明:云南省電機(jī)工程學(xué)會(huì),2011.
[6]郭慶琳,祖向榮.基于神經(jīng)網(wǎng)絡(luò)與遺傳算法的汽輪機(jī)組數(shù)據(jù)挖掘方法[J].電力自動(dòng)化設(shè)備,2008,28(3):41-44.
[7]ABU-MOSTAFA Y.S,MAGDON-ISMAILM,LIN H.T.Learning from Data,AMLBook.com,2012.
Data M ining App lication in Smart M eter Fault Analysis
ZHU Yunan,XU Qing,LIU Jian,TIAN Zhengqi,ZHOU Chao
(StateGrid Key Laboratory of Electric EnergyMetering,State Grid Jiangsu Electric PowerCompany Electric PowerResearch Institute,Nanjing 210019,China)
Since 2009,hundredsofmillions of smartmeters havebeen installed nationwide.State Grid Corporation of China manages the asset by centralized inspection in large scale.Meanw hile,a system called Pow er User Electric Energy Data Acquire System wasbuiltup tomonitor the operation statusof thesemeters.Therefore,vastamounts of life-time data of the meters can be obtained from the centralized inspection system asw ell as the data acquire system.This paper proposed a way of establishing the connections between fault data and inspection data by training neural network under MATLAB environment.And then the possibility and effectiveness to obtain fault information of smartmeters in advance by datam ining isdiscussed,to providean alternativeway of quality controlof smartmeters.
smartmeter;datam ining;faultanalysis;neuralnetwork
TM 933.4
A
1009-0665(2016)05-0019-05
祝宇楠(1983),女,吉林人,工程師,從事電測量及電測儀器儀表工作;
徐晴(1973),女,江蘇南通人,研究員級(jí)高工,從事電測量及電測儀器儀表工作;
劉建(1981),男,河南信陽人,高級(jí)工程師,從事電測量及電測儀器儀表工作;
田正其(1987),男,江蘇南通人,工程師,從事電測量及電測儀器儀表工作;
周超(1987),男,江蘇宜興人,工程師,從事電測量及電測儀器儀表工作。
2016-07-05;
2016-08-08