史鵬博,李 蕊,李銘凱,趙 成,朱錦山
(國(guó)網(wǎng)北京電力科學(xué)研究院,北京100162)
智能電網(wǎng)融合了電網(wǎng)基礎(chǔ)設(shè)施和網(wǎng)絡(luò)系統(tǒng),具有典型的網(wǎng)絡(luò)物理系統(tǒng)(cyber physical system,CPS)[1],其旨在將電力技術(shù)應(yīng)用于能源系統(tǒng),以實(shí)現(xiàn)雙向電力流[2]。智能電表作為整個(gè)配電網(wǎng)的傳感器,可以測(cè)量用電量并將記錄的數(shù)據(jù)發(fā)送給能源管理中心[3],對(duì)應(yīng)數(shù)據(jù)的使用有助于通過(guò)CPS為智能電網(wǎng)規(guī)劃和運(yùn)行提供及時(shí)的決策[4]。對(duì)于智能電表數(shù)量眾多、應(yīng)用場(chǎng)合復(fù)雜的情況,如何提高智能電表故障檢測(cè)能力成為電網(wǎng)企業(yè)關(guān)注的焦點(diǎn)[5,6]。
智能電網(wǎng)先進(jìn)計(jì)量基礎(chǔ)設(shè)施(advanced metering infrastructure,AMI)為人們提供了豐富的測(cè)量、通信、計(jì)算和存儲(chǔ)資源,這些信息引起了人們的關(guān)注[7]。用數(shù)據(jù)分析檢測(cè)故障智能電表的方法很多。文獻(xiàn)[8]提出了一種綜合考慮層次結(jié)構(gòu)和儀表數(shù)據(jù)的智能電表生成模型,但當(dāng)面對(duì)大量的智能電表數(shù)據(jù)時(shí),該方法效果急劇下降;文獻(xiàn)[9]提出了一種面向概念漂移的異常檢測(cè)能力定義方法,該方法采用長(zhǎng)短期記憶網(wǎng)絡(luò)來(lái)描述和預(yù)測(cè)消費(fèi)者的行為,然而檢測(cè)精度并不高;文獻(xiàn)[10]描述了一種考慮電流和功率特征之間關(guān)系的比較方法來(lái)檢測(cè)異常設(shè)備,考慮較為單一,無(wú)法處理較為復(fù)雜的情況;文獻(xiàn)[11]介紹了一種數(shù)據(jù)挖掘技術(shù)來(lái)檢測(cè)異常數(shù)據(jù)和能量竊取,該方法結(jié)合最大信息系數(shù)理論和聚類技術(shù),發(fā)現(xiàn)任意形狀的異常用戶,對(duì)歷史數(shù)據(jù)的依賴較為嚴(yán)重;文獻(xiàn)[12]中提出了一種結(jié)合Bollinger帶和部分可觀測(cè)馬爾可夫決策過(guò)程的技術(shù)來(lái)檢測(cè)異常數(shù)據(jù)和能量竊??;并采用概率自適應(yīng)模型提高效率,然而其操作過(guò)于復(fù)雜,計(jì)算量大;文獻(xiàn)[13]提出一種通過(guò)比較前后能耗來(lái)檢測(cè)欺詐和異常使用的方法;文獻(xiàn)[14]提出了一種基于隨機(jī)矩陣?yán)碚摰漠惓J褂煤湍芰勘I竊檢測(cè)器,研究了能量消耗與系統(tǒng)異常狀態(tài)的關(guān)系,但考慮的因素較為單一。
在相關(guān)的工作中,雖然已經(jīng)有了許多成熟的方法[15~17],并且一些研究工作已經(jīng)得到了實(shí)際應(yīng)用,但在實(shí)際應(yīng)用中仍然存在一些局限性。利用機(jī)器學(xué)習(xí)和強(qiáng)化學(xué)習(xí)相關(guān)算法檢測(cè)異常電能表的思想雖然簡(jiǎn)單易行,但其結(jié)果取決于具體的系統(tǒng)結(jié)構(gòu)和數(shù)據(jù)集。通過(guò)檢查儀表誤差來(lái)檢測(cè)故障儀表是一種有效的方法,在線儀表誤差估計(jì)是一種能夠?qū)崿F(xiàn)大規(guī)模檢測(cè)的新思路。誤差估計(jì)精度僅限于數(shù)據(jù)和系統(tǒng)信息,所采集的系統(tǒng)特征和測(cè)量數(shù)據(jù)越多,估計(jì)精度越高;然而,一些系統(tǒng)信息存在如能量損失、系統(tǒng)信息丟失等現(xiàn)象,在實(shí)際系統(tǒng)中很難獲得,缺少這些信息將影響檢測(cè)精度和方法性能。
本文主要提出了大范圍誤差檢測(cè)模型。采用能耗數(shù)據(jù)構(gòu)造線性方程,由方程的解可導(dǎo)出儀表誤差估計(jì)量;在其基礎(chǔ)上,結(jié)合分類和遞歸理論的儀表誤差計(jì)算方法,對(duì)能量損失率水平相近的數(shù)據(jù),采用決策樹(shù)和聚類方法對(duì)不同的配置數(shù)據(jù)進(jìn)行分類,構(gòu)造線性方程,用遞推最小二乘法求解,得到誤差估計(jì)量;最終通過(guò)算例分析證明所提模型的有效性。
電能數(shù)據(jù)由智能電表記錄并送數(shù)據(jù)中心存儲(chǔ),具體拓?fù)鋱D如圖1所示。在低壓電能系統(tǒng)中,電能表采用拓?fù)浣Y(jié)構(gòu),即在一些低精度單相電能表前安裝高精度三相電能表。高精度電能表是電網(wǎng)的主電能表,低精度電能表是電能網(wǎng)的子表。其中,子表記錄一個(gè)住宅用戶的電壓、電流和能耗值,而主表記錄一個(gè)區(qū)域內(nèi)所有用戶的總值。儀表功能異常、內(nèi)部元件退化、工作環(huán)境變化等所造成的抄表誤差是智能電表檢定中廣泛使用的一種指標(biāo),將電表誤差與官方規(guī)定的閾值進(jìn)行比較得到抄表誤差。若儀表誤差超過(guò)閾值,儀表將被視為故障儀表。
圖1 故障儀表檢測(cè)流程Fig.1 Workflow of meter detection
本研究的目的是以電能數(shù)據(jù)分析的方式,藉由估測(cè)電表讀數(shù)誤差來(lái)偵測(cè)故障電能表。儀表誤差估計(jì)方法包括4個(gè)步驟。首先,進(jìn)行數(shù)據(jù)采集,作為工作的基礎(chǔ)部分,其需要獲取能源信息(電能消耗、電壓、電流等)和系統(tǒng)信息(儀表ID、位置號(hào)等),其以固定的頻率傳輸?shù)綌?shù)據(jù)中心;然后,對(duì)數(shù)據(jù)進(jìn)行處理,去除異常儀表數(shù)據(jù)和聚類代表性剖面數(shù)據(jù);其次,根據(jù)能量平衡關(guān)系建立方程,求解得到儀表誤差;最后,估計(jì)誤差,若其高于調(diào)節(jié)閾值的則為故障儀表。
儀表數(shù)據(jù)采集自AMI系統(tǒng)。如圖2所示,儀表通過(guò)電力線載波、RS485和無(wú)線通信方式向接入點(diǎn)發(fā)送測(cè)量數(shù)據(jù)。通常安裝在接入點(diǎn)的集中器,用于收集電表數(shù)據(jù),然后上傳到云數(shù)據(jù)中心進(jìn)行進(jìn)一步分析。數(shù)據(jù)包括電能表測(cè)量數(shù)據(jù),如電能消耗、電壓、電流等,系統(tǒng)信息包括電能表ID、表號(hào)、日期、時(shí)間等。
圖2 AMI數(shù)據(jù)采集系統(tǒng)Fig.2 AMI data acquisition system
電能首先通過(guò)主電能表,然后再通過(guò)子表。在同一時(shí)間間隔內(nèi),通過(guò)主表的能量流為通過(guò)子表能量的總和。具體關(guān)系如下:
(1)
式中:Ej(i)是子表j支路i上的實(shí)際能量消耗;E0(i)是實(shí)際總能量消耗。
在實(shí)際能源系統(tǒng)中,由于內(nèi)部元件的退化以及環(huán)境變化、安裝不正常等外部因素的影響,存在測(cè)量誤差。此外,能量損失的存在使得功率損耗也較難估計(jì)。若考慮能量損失和儀表誤差,式(1)可改寫為:
(2)
式中:αj為子表j的相對(duì)誤差;φj(i)為子表j的記錄能耗值;φ0(i)為主表的使用值;E(i)是系統(tǒng)中的能量損失。其中,主表精度高于子表誤差,其誤差可以忽略。
通過(guò)n次測(cè)量,可以建立矩陣方程如下:
ΦTΘ=Y
(3)
其中:
儀表誤差可由式(3)算出。智能電表自耗eM(i)、電力線損耗eN(i)和漏電損耗eL(i)是電能損耗的主要組成部分。能量損失E(i)的表達(dá)式如下:
E(i)=eM(i)+eN(i)+eL(i)+ε(i)
(4)
式中ε(i)是誤差項(xiàng)。其余各項(xiàng)的表達(dá)式如下:
(5)
eN(i)=U2σt(i)
(6)
(7)
數(shù)據(jù)處理是估計(jì)模型中的一項(xiàng)重要工作。在實(shí)際系統(tǒng)中,由于一些參數(shù)的缺乏,能量損失很難估計(jì),而能量損失項(xiàng)對(duì)方程求解有重要影響。如果能量損失誤差項(xiàng)大于所有子表誤差引起的能量損失,則誤差估計(jì)會(huì)變得準(zhǔn)確。智能電能表的抄表誤差是一個(gè)不隨使用時(shí)間增長(zhǎng)的常數(shù);反之,在不同的能量負(fù)荷下,儀表誤差會(huì)發(fā)生變化。
在模型中,主儀表的使用值應(yīng)大于子儀表的總和??紤]到竊電和電源斷線,應(yīng)剔除子表讀數(shù)之和超過(guò)主表的數(shù)據(jù)。為了減少電能損耗和電能負(fù)荷對(duì)儀表誤差求解的影響,本文提出一種基于決策樹(shù)和聚類的數(shù)據(jù)處理方法。
數(shù)據(jù)首先分為異常數(shù)據(jù)和正常數(shù)據(jù),然后將正常數(shù)據(jù)分為輕載和重載負(fù)荷。輕載數(shù)據(jù)是指電表電流值小于電表額定電流,重載時(shí)電表電流大于額定電流。然后對(duì)不同能量損失率的數(shù)據(jù)進(jìn)行分類。比值γ為:
(8)
當(dāng)γ落在不同的比值范圍內(nèi)時(shí),數(shù)據(jù)可以分為不同的能量損失水平。范圍為從(0,γmax/k]到((k-1)γmax/k,γmax]),k是節(jié)點(diǎn)數(shù)。選擇所需的聚類中心數(shù)R和K-means過(guò)程迭代移動(dòng)中心,使點(diǎn)與中心之間的總距離最小。對(duì)于給定的觀測(cè)集x(i)={x(i)1,x(i)2,…,x(i)n}和質(zhì)心c(j)={c(j)1,c(j)2,…,c(j)n}。x(i)與質(zhì)心c(j)之間的距離為:
(9)
給定簇C={C1,C2,…,CR}的質(zhì)心為c(j),聚類的目標(biāo)是使每個(gè)點(diǎn)到質(zhì)心的距離最?。?/p>
(10)
中心評(píng)估為:
(11)
式中ni為中心c(i)的觀測(cè)點(diǎn)數(shù)量。
主要采用決策樹(shù)方法對(duì)異常數(shù)據(jù)進(jìn)行初步識(shí)別,并將正常數(shù)據(jù)劃分為一個(gè)類似的能量損失水平部分。然后對(duì)數(shù)據(jù)進(jìn)行聚類,得到相似的特征數(shù)據(jù)用于儀表誤差估計(jì)。
子表矩陣是一個(gè)N×N維矩陣,其解是與儀表誤差有關(guān)的參數(shù)。遞歸模型可以同時(shí)更新參數(shù),節(jié)省存儲(chǔ)資源。為了重復(fù)更新估計(jì)結(jié)果,提高數(shù)據(jù)使用效率,采用遞推加權(quán)最小二乘模型求解方程。
為使殘差平方和最小,方程(3)的代價(jià)函數(shù)為:
(12)
θ的遞推加權(quán)最小二乘解為:
(13)
式中:W=diag(w1,w1,…,wn),W是權(quán)重因子矩陣。遞歸方程為:
(14)
(15)
在權(quán)重矩陣中使用指數(shù)遺忘因子。則估計(jì)方程為:
(16)
ζ(n)=P(n)Φ(n+1)·
(ΦT(n+1)P(n)Φ(n+1)+λ)-1
(17)
(18)
式中λ是遺忘因子。
均方根誤差(root mean square error,RMSE)被廣泛應(yīng)用于通過(guò)計(jì)算估計(jì)值與實(shí)際值之間的距離來(lái)評(píng)價(jià)估計(jì)性能。較小的RMSE意味著更好的性能。其定義為:
(19)
數(shù)據(jù)集采集自城市居民小區(qū)低壓電能系統(tǒng)中。在這個(gè)能源系統(tǒng)中部署了一個(gè)主表和122個(gè)子表。數(shù)據(jù)集由2014年8月至2016年8月間每24 h的所有電表的能耗值組成。此外,主表每15 min記錄1次電壓和電流值。大多數(shù)用戶是社區(qū)中的常住用戶。該子表的技術(shù)參數(shù)如下:額定功率1 100 W,額定電壓220 V,額定電流5 A。除了電表電量測(cè)量值外,儀表ID、系統(tǒng)ID和社區(qū)ID都記錄在數(shù)據(jù)集中。此外還刪除了數(shù)據(jù)集中的空行和格式錯(cuò)誤的行、冗余數(shù)據(jù)和無(wú)效數(shù)據(jù),然后提取出可用的數(shù)據(jù)。假設(shè)所有電表數(shù)據(jù)有效,系統(tǒng)中無(wú)竊電和設(shè)備故障。在此期間,所有儀表誤差保持不變。然后隨機(jī)嵌入故障表通過(guò)將超過(guò)2%的主儀表誤差分配給某些子儀表。大于2%的儀表誤差估計(jì)值將被視為故障儀表。首先對(duì)數(shù)據(jù)進(jìn)行篩選和分類,然后對(duì)數(shù)據(jù)進(jìn)行聚類和構(gòu)造線性方程來(lái)估計(jì)儀表誤差。
估計(jì)的儀表誤差如圖3所示。X軸為測(cè)量次數(shù),Y軸為儀表誤差。當(dāng)新數(shù)據(jù)輸入到模型時(shí),儀表誤差更新。
圖3 不同測(cè)量次數(shù)下的估計(jì)誤差Fig.3 Estimated error in different measurements
在圖3中,每一行顯示了每個(gè)遞歸的誤差估計(jì)量。隨著測(cè)量值的增加,估計(jì)量收斂到穩(wěn)定值。3個(gè)儀表的誤差明顯高于其他儀表,有些儀表的估計(jì)誤差非常接近于0,所需測(cè)量的數(shù)量取決于數(shù)據(jù)特點(diǎn)。進(jìn)行大約300次測(cè)量,可以找到誤差估計(jì)值的穩(wěn)定值。該遞推模型能很好地估計(jì)儀表誤差,且誤差變化不大。
圖4顯示了當(dāng)所有值保持穩(wěn)定時(shí)誤差估計(jì)器的詳細(xì)信息??梢钥闯?,電表28、55和79的表計(jì)誤差大于2%。79號(hào)儀表的最大誤差為8.596%,而55號(hào)儀表和28號(hào)儀表的誤差估計(jì)值分別為6.213%和4.669%,其他儀表的誤差估計(jì)值在-2%到2%的正常范圍內(nèi)。該方法的RMSE為0.21%,這意味著估計(jì)誤差與真實(shí)誤差值的偏差很小。誤差估計(jì)器能很好地反映儀表的誤差特性。
圖4 儀表誤差估計(jì)Fig.4 Meter error estimator
在相同的數(shù)據(jù)下,將所提方法與LU分解(LU factorization)、廣義最小殘差法(generalized minimal residual method,GMRES)進(jìn)行了比較。圖5顯示,由于子表矩陣的病態(tài)性,LU因子分解有一個(gè)不收斂的估計(jì)量。廣義最小殘差法得到的誤差估計(jì)量含有奇異值。表1顯示了3種方法的RMSE,所提出的方法具有最小的RMSE,而LU因子分解具有最大的RMSE。儀表誤差閾值為2%,RMSE不應(yīng)大于2%。LU分解方法表現(xiàn)出了糟糕的性能,而且通過(guò)對(duì)比RMSE值可見(jiàn),所提模型比GMRES性能更好。
圖5中的合計(jì)誤差為所提方法估計(jì)誤差RMSE變化曲線,曲線在零軸附近小幅波動(dòng),表明所提方法整體估計(jì)誤差準(zhǔn)確度高。
圖5 儀表誤差估計(jì)對(duì)比Fig.5 Meter error estimator comparison
表1 性能比較Tab.1 Performance comparison
圖6展示了系統(tǒng)中故障儀表數(shù)量與所提模型檢測(cè)正確率之間的關(guān)系。檢測(cè)正確率是指正確劃分電表狀態(tài)的數(shù)量所占的總電表數(shù)量的百分比??梢钥闯?,當(dāng)故障表數(shù)不大于23時(shí),所提模型運(yùn)行良好。正確率在90%以上,如果系統(tǒng)中部署的故障不超過(guò)10個(gè),則可以檢測(cè)到所有異常數(shù)據(jù)。隨著故障儀表的增多,模型性能會(huì)越來(lái)越差。
圖6 檢測(cè)正確率Fig.6 Detection rate
本文介紹了一種檢測(cè)智能電表故障的數(shù)據(jù)分析方法,主要提出了一種基于決策樹(shù)和聚類理論的電表誤差估計(jì)遞推算法。實(shí)驗(yàn)結(jié)果表明該方法具有良好的分類性能,且在相同的數(shù)據(jù)背景下,與常規(guī)方法相比,所提模型的檢出正確率更高。由于智能電表數(shù)據(jù)分析在電表檢測(cè)中有著廣泛的應(yīng)用和較高的經(jīng)濟(jì)價(jià)值,所提方法能為相關(guān)人員在邊緣計(jì)算環(huán)境下的圖像儀表誤差在線估計(jì)和智能儀表數(shù)據(jù)分析等方面提供理論支持。