王家駒, 萬(wàn)忠兵, 何仲瀟, 汪佳, 謝智, 王梟
(1. 國(guó)網(wǎng)四川省電力公司計(jì)量中心,四川 成都 610000;2. 清華四川能源互聯(lián)網(wǎng)研究院,四川 成都 610000)
智能電網(wǎng)是近些年來(lái)電力工業(yè)最重大的變革與創(chuàng)新,也是智慧城市建設(shè)的重要組成部分之一[1]。同時(shí),智能電網(wǎng)的快速發(fā)展也對(duì)配電網(wǎng)側(cè)的精細(xì)化管理提出了更高的要求[2]。然而配電臺(tái)區(qū)普遍存在線損計(jì)算異常等問(wèn)題,導(dǎo)致臺(tái)區(qū)運(yùn)行、規(guī)劃等多個(gè)高級(jí)應(yīng)用難以推進(jìn),難以對(duì)整個(gè)臺(tái)區(qū)實(shí)現(xiàn)智能化管控,會(huì)對(duì)用戶的安全用電造成直接的影響[3]。終端用戶難以和臺(tái)區(qū)管控的配電變壓器準(zhǔn)確配準(zhǔn)是造成該問(wèn)題的主要成因。因此,提出精準(zhǔn)且高效的臺(tái)戶關(guān)系辨識(shí)方法,對(duì)實(shí)現(xiàn)智能配電臺(tái)區(qū)“信息化、自動(dòng)化、互動(dòng)化”的具有重要意義。
傳統(tǒng)配電臺(tái)戶關(guān)系辨識(shí)主要分為如下兩種方法:①人工抄表統(tǒng)計(jì)方式,巡檢人員沿火線尋找變壓器各相對(duì)應(yīng)的終端用戶,并在臺(tái)區(qū)檔案上進(jìn)行記錄。顯然,該方法存在工作量大、準(zhǔn)確率低、信息更新不及時(shí)等問(wèn)題,隨著用戶數(shù)量與日俱增,弊病也越來(lái)越突出;②基于電力線通訊方式的統(tǒng)計(jì)方式,將電力通信作為傳輸信息,并在用戶端將信號(hào)解調(diào)為相位信號(hào),實(shí)現(xiàn)所屬臺(tái)區(qū)和相位辨識(shí)[4]。然而該方法存在辨識(shí)不穩(wěn)定和不準(zhǔn)確的問(wèn)題,會(huì)出現(xiàn)串線的等情況[5]。為此,文獻(xiàn)[6]提出了一種基于擾動(dòng)技術(shù)的工頻通信配電臺(tái)區(qū)用戶組網(wǎng)辨識(shí)改進(jìn)方法,實(shí)現(xiàn)臺(tái)戶關(guān)系的“一鍵式”定位。文獻(xiàn)[7]利用電能計(jì)量數(shù)據(jù)與資產(chǎn)數(shù)據(jù)實(shí)現(xiàn)臺(tái)區(qū)用戶的識(shí)別。文獻(xiàn)[8]搭建了基于BP(back propagation)神經(jīng)網(wǎng)絡(luò)算法,以多次通信信號(hào)為分析對(duì)象,從而減少串臺(tái)區(qū)的情況,但是對(duì)于設(shè)備的要求較高,存在一定的實(shí)施成本。
然而,隨著大數(shù)據(jù)智能電網(wǎng)的發(fā)展,大數(shù)據(jù)為臺(tái)戶關(guān)系辨識(shí)提供了一種全新途徑。在配電網(wǎng)的海量運(yùn)行數(shù)據(jù),如配變出口電壓、電流可間接反映配電網(wǎng)的線變關(guān)系。目前,針對(duì)該方面的研究成果較少。文獻(xiàn)[9]通過(guò)分析電壓數(shù)據(jù)存在于時(shí)間和空間的相關(guān)度,對(duì)各臺(tái)區(qū)的用戶進(jìn)行劃分,其準(zhǔn)確度還有待提高。文獻(xiàn)[10]以三相負(fù)荷不平衡臺(tái)區(qū)配變出口電壓的歸算結(jié)果作為線網(wǎng)關(guān)系的校驗(yàn)核心,但不適用于抵押用戶所屬臺(tái)區(qū)校驗(yàn)。實(shí)際電力系統(tǒng)中,電氣距離越近[11],用戶的電壓變化趨勢(shì)約接近?;诖耍闹刑岢隽嘶诙嗑S尺度分析(muti-dimensional scaling, MDS)算法和改進(jìn)K-means聚類算法的臺(tái)戶關(guān)系辨別方法。首先通過(guò)MDS算法對(duì)所采集的電壓數(shù)據(jù)進(jìn)行降維處理,以降低整體算法計(jì)算量,提高算法效率,再利用改進(jìn)K-means算法實(shí)現(xiàn)用戶聚類,最后根據(jù)聚類結(jié)果確定用戶的所述臺(tái)區(qū)及相別。最終算例分析證明了文中方法的有效性。
當(dāng)待識(shí)別智能電表數(shù)目眾多,且電表數(shù)據(jù)維度特別龐大時(shí),會(huì)造成算法耗時(shí)嚴(yán)重,效率低下。而考慮到應(yīng)用MDS進(jìn)行數(shù)據(jù)降維時(shí)能夠保證所有數(shù)據(jù)點(diǎn)在低維空間中的相似度等于在高維空間中的相似度,從而在降低數(shù)據(jù)維度提升算法效率的同時(shí)不會(huì)對(duì)辨識(shí)準(zhǔn)確度造成影響。因此,本文在利用改進(jìn)K-means聚類算法進(jìn)行臺(tái)戶關(guān)系辨識(shí)之前,首先利用MDS算法對(duì)采集到的電壓數(shù)據(jù)進(jìn)行降維處,從而降低整體算法計(jì)算量,提高算法效率。
文中采用MDS算法對(duì)用戶及變壓器低壓側(cè)的電壓數(shù)據(jù)進(jìn)行降維處理。MDS算法基于數(shù)據(jù)的相似性及相異性,以保持變量在高維空間與低維空間中歐式距離不變?yōu)樵瓌t,將變量從高維空間映射到低維空間,挖掘變量的潛在結(jié)構(gòu)。
(1)
算法目標(biāo)為獲得樣本d′在維空間的表示Z,其中d′ (2) 式中:zi為d′維空間中的第i個(gè)坐標(biāo)點(diǎn)。 定義矩陣T=ZZT,T矩陣中的元素為tij,矩陣Z的距離矩陣D中的元素為dij,其元素值為: (3) 則可得到: (4) D中元素和T中元素的關(guān)系如式(5)所示。 (5) 最后對(duì)T進(jìn)行特征值分解,如式(6)所示。 (6) 式中:U為特征向量;Λ為特征值矩陣。 基于MDS算法,使得降維后數(shù)據(jù)能很好地表達(dá)原多維數(shù)據(jù)的核心部分信息,從而在不影響聚類準(zhǔn)確度的情況下,極大提升算法效率。 典型臺(tái)區(qū)變與用戶電表之間的拓?fù)溥B接如圖1所示。同一相的臺(tái)區(qū)變壓器和用戶的電表之間具有確定的電氣連接,因此用戶側(cè)的電壓會(huì)與臺(tái)區(qū)變出口電壓的變化趨勢(shì)高度一致。處于同一臺(tái)區(qū)同一相別的用戶,電壓波動(dòng)規(guī)律具有很強(qiáng)的相似性,而屬于不同臺(tái)區(qū)的用戶,其電氣距離遠(yuǎn),電壓波動(dòng)相似性較差。而聚類分析作為一種被廣泛應(yīng)用的數(shù)據(jù)挖掘算法,可以按照事物的某些相似屬性,把事物聚集成類,使類間的相似性盡可能小,類內(nèi)相似性盡可能大。為此,文中采用改進(jìn)K-means算法對(duì)臺(tái)區(qū)用戶及變壓器低壓側(cè)電壓數(shù)據(jù)進(jìn)行聚類,從而實(shí)現(xiàn)臺(tái)區(qū)用戶的準(zhǔn)確識(shí)別。 K-means算法的核心思想是找出K個(gè)聚類中心c1,c2,…,ck,通常以歐式距離作為樣本相似程度的評(píng)估指標(biāo),并使得類間的相似性盡可能小,類內(nèi)相似性盡可能大。傳統(tǒng)K-means算法流程如圖2所示。 K-means算法簡(jiǎn)單,收斂速度快,但存在聚類個(gè)數(shù)難以確定、初始質(zhì)心選取不準(zhǔn)確、歐式距離作為評(píng)估樣本相似程度的有效性有限,常常出現(xiàn)聚類結(jié)果陷入局部最優(yōu)的情況[12]。為此,文中針對(duì)上述問(wèn)題,結(jié)合實(shí)際應(yīng)用場(chǎng)景的特點(diǎn),對(duì)K-means算法做出如下改進(jìn),從而達(dá)到提升辨別準(zhǔn)確度和縮短計(jì)算時(shí)間的目的。 1)聚類個(gè)數(shù)的選取 由于變壓器的個(gè)數(shù)N是已知的,因此可明確獲知最終的聚類個(gè)數(shù)為變壓器的總相數(shù)3N。這是臺(tái)區(qū)用戶辨識(shí)場(chǎng)景下的天然優(yōu)勢(shì)。 2)K-means初始聚類中心的選取 由于變壓器各相出口電壓數(shù)據(jù)是明確的,一方面不同變壓器各相的電壓數(shù)據(jù)正好隸屬不同的類,另一方面變壓器各相出口電壓能夠較好地反映各類數(shù)據(jù)的分布特征,作為聚類中心更有利于平方誤差準(zhǔn)則函數(shù)的收斂。因此,本文算法將變壓器出口電壓作為K-means的初始聚類中心,從而避免由于初始聚類中心選擇的隨機(jī)性帶來(lái)結(jié)果陷入局部最優(yōu)的僵局,實(shí)現(xiàn)準(zhǔn)確聚類。 3)重新定義相似度評(píng)估標(biāo)準(zhǔn) 經(jīng)典K-means聚類算法以歐式距離作為樣本相似度的評(píng)估指標(biāo)。歐式距離的計(jì)算公式如下: (7) 式中:Lpq為第p個(gè)樣本到第q個(gè)樣本的距離;n為樣本的數(shù)據(jù)維度;zpd為第p個(gè)行向量的第d維坐標(biāo);zqd為第q個(gè)行向量的第d維坐標(biāo)。 然而,由于歐式距離衡量的是多維空間中各個(gè)點(diǎn)之間的絕對(duì)距離,體現(xiàn)個(gè)體數(shù)值特征的絕對(duì)差異。而本文的理論基礎(chǔ)是同一臺(tái)區(qū)同一相變壓器和用戶電壓數(shù)據(jù)變化趨勢(shì)的一致性,更強(qiáng)調(diào)電壓波動(dòng)規(guī)律的一致性。因此歐式距離不是非常適合此場(chǎng)景。為此,文中引入相關(guān)系數(shù)作為評(píng)估相似度的標(biāo)準(zhǔn),從而提高算法的準(zhǔn)確率。相似系數(shù)的計(jì)算公式如式(8)所示。 (8) 同時(shí),通過(guò)中心化和標(biāo)準(zhǔn)化對(duì)原始的電壓數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,以避免噪聲數(shù)據(jù)所引起的誤差。 綜上,應(yīng)用流程如圖3所示。 以下述臺(tái)區(qū)樣本數(shù)據(jù)為例進(jìn)行算例分析。在該臺(tái)區(qū)內(nèi)某臺(tái)變壓器下共接入88戶用戶,并以1小時(shí)為采樣頻率對(duì)用戶側(cè)電壓進(jìn)行了7天的數(shù)據(jù)采樣。因此,最終聚類個(gè)數(shù)為3類。為驗(yàn)證文中所提方法的有效性,算例進(jìn)行如下三個(gè)仿真,并校驗(yàn)不同方法下的正確率。 方法1:設(shè)定最終聚類個(gè)數(shù),不設(shè)定初始聚類中心,仍采用歐式距離作為衡量相似度的標(biāo)準(zhǔn)。 方法2:設(shè)定最終聚類個(gè)數(shù),設(shè)定初始聚類中心,仍采用歐式距離作為衡量相似度的標(biāo)準(zhǔn)。 方法3:設(shè)定最終聚類個(gè)數(shù),設(shè)定初始聚類中心,采用相似系數(shù)作為衡量相似度的標(biāo)準(zhǔn)(文中所提方法)。 各個(gè)算法下的辨識(shí)準(zhǔn)確率如表1所示。比較方法1和方法2可知,設(shè)定K-means的初始聚類中心能夠?qū)⒂脩舯孀R(shí)的準(zhǔn)確度提升了近1.5倍。比較方法2和方法3可知,將相似系數(shù)代替歐式距離,作為相似度的衡量標(biāo)準(zhǔn),能夠?qū)崿F(xiàn)辨識(shí)精度由于87.5%到100%的提升。上述數(shù)據(jù)一定程度上證明了文中通過(guò)對(duì)K-means算法進(jìn)行改進(jìn),能夠有效提升用戶的辨識(shí)準(zhǔn)確度。 表1 不同方法下的用戶辨識(shí)準(zhǔn)確率 為驗(yàn)證文中方法的通用性,算例2針對(duì)不同數(shù)據(jù)量在以上3個(gè)場(chǎng)景下進(jìn)行反復(fù)10次的仿真測(cè)試,并取測(cè)試平均值作為最終的辨識(shí)結(jié)果。針對(duì)不同的數(shù)據(jù)量,以上3種方法的辨識(shí)準(zhǔn)確率如表2所示。 由表2可知,所采集到的數(shù)據(jù)量越大,算法的準(zhǔn)確度越高。方法3在低密度數(shù)據(jù)的情況下,依舊能夠保持100%的準(zhǔn)確度,并且精度不會(huì)隨復(fù)雜度增強(qiáng)(變壓器臺(tái)數(shù)增多)而降低。然而,方法1與方法2在相同數(shù)據(jù)體量下,隨著變壓器臺(tái)數(shù)的增加,其精度有明顯的下降,可見(jiàn)方法1與方法2受外界因素影響較大,用戶辨識(shí)結(jié)果不穩(wěn)定。 表2 不同數(shù)據(jù)量下的用戶辨識(shí)準(zhǔn)確率 因此,文中所提方法通過(guò)對(duì)配網(wǎng)運(yùn)行過(guò)程中產(chǎn)生的海量數(shù)據(jù)進(jìn)行降維聚類分析,能夠有效解決配網(wǎng)中線變不匹配的問(wèn)題。該方法無(wú)需增加任何的設(shè)備成本投入,且效果穩(wěn)定,具備大規(guī)模應(yīng)用的潛力。 文中提出了一種基于MDS和改進(jìn)K-means算法的臺(tái)戶關(guān)系辨識(shí)方法。該方法通過(guò)MDS算法實(shí)現(xiàn)數(shù)據(jù)降維,提升了后期聚類分析的計(jì)算速度。根據(jù)實(shí)際應(yīng)用場(chǎng)景特點(diǎn)對(duì)K-means算法進(jìn)行3個(gè)方面的改進(jìn),從而實(shí)現(xiàn)提升臺(tái)區(qū)用戶辨識(shí)準(zhǔn)確率與辨識(shí)穩(wěn)定度的目的。 算例結(jié)果分析表明,文中所提方法能夠有效提升臺(tái)區(qū)用戶辨識(shí)準(zhǔn)確率,在低密度數(shù)據(jù)、問(wèn)題復(fù)雜度增加的情況下依舊能保持極高的準(zhǔn)確率,效果穩(wěn)定,具備在實(shí)際場(chǎng)景中大規(guī)模運(yùn)用的潛力。2 臺(tái)戶關(guān)系辨識(shí)
2.1 K-means算法
2.2 改進(jìn)K-means算法
3 算例分析
3.1 算例1
3.2 算例2
4 結(jié)束語(yǔ)