基于多維尺度分析和改進(jìn)K-means的臺(tái)戶關(guān)系辨識(shí)方法

2020-08-14 02:28王家駒萬(wàn)忠兵何仲瀟汪佳謝智王梟

電氣自動(dòng)化 2020年2期

王家駒，萬(wàn)忠兵，何仲瀟，汪佳，謝智，王梟

(1. 國(guó)網(wǎng)四川省電力公司計(jì)量中心，四川成都 610000；2. 清華四川能源互聯(lián)網(wǎng)研究院，四川成都 610000)

0 引言

智能電網(wǎng)是近些年來(lái)電力工業(yè)最重大的變革與創(chuàng)新，也是智慧城市建設(shè)的重要組成部分之一[1]。同時(shí)，智能電網(wǎng)的快速發(fā)展也對(duì)配電網(wǎng)側(cè)的精細(xì)化管理提出了更高的要求[2]。然而配電臺(tái)區(qū)普遍存在線損計(jì)算異常等問(wèn)題，導(dǎo)致臺(tái)區(qū)運(yùn)行、規(guī)劃等多個(gè)高級(jí)應(yīng)用難以推進(jìn)，難以對(duì)整個(gè)臺(tái)區(qū)實(shí)現(xiàn)智能化管控，會(huì)對(duì)用戶的安全用電造成直接的影響[3]。終端用戶難以和臺(tái)區(qū)管控的配電變壓器準(zhǔn)確配準(zhǔn)是造成該問(wèn)題的主要成因。因此，提出精準(zhǔn)且高效的臺(tái)戶關(guān)系辨識(shí)方法，對(duì)實(shí)現(xiàn)智能配電臺(tái)區(qū)“信息化、自動(dòng)化、互動(dòng)化”的具有重要意義。

傳統(tǒng)配電臺(tái)戶關(guān)系辨識(shí)主要分為如下兩種方法：①人工抄表統(tǒng)計(jì)方式，巡檢人員沿火線尋找變壓器各相對(duì)應(yīng)的終端用戶，并在臺(tái)區(qū)檔案上進(jìn)行記錄。顯然，該方法存在工作量大、準(zhǔn)確率低、信息更新不及時(shí)等問(wèn)題，隨著用戶數(shù)量與日俱增，弊病也越來(lái)越突出；②基于電力線通訊方式的統(tǒng)計(jì)方式，將電力通信作為傳輸信息，并在用戶端將信號(hào)解調(diào)為相位信號(hào)，實(shí)現(xiàn)所屬臺(tái)區(qū)和相位辨識(shí)[4]。然而該方法存在辨識(shí)不穩(wěn)定和不準(zhǔn)確的問(wèn)題，會(huì)出現(xiàn)串線的等情況[5]。為此，文獻(xiàn)[6]提出了一種基于擾動(dòng)技術(shù)的工頻通信配電臺(tái)區(qū)用戶組網(wǎng)辨識(shí)改進(jìn)方法，實(shí)現(xiàn)臺(tái)戶關(guān)系的“一鍵式”定位。文獻(xiàn)[7]利用電能計(jì)量數(shù)據(jù)與資產(chǎn)數(shù)據(jù)實(shí)現(xiàn)臺(tái)區(qū)用戶的識(shí)別。文獻(xiàn)[8]搭建了基于BP(back propagation)神經(jīng)網(wǎng)絡(luò)算法，以多次通信信號(hào)為分析對(duì)象，從而減少串臺(tái)區(qū)的情況，但是對(duì)于設(shè)備的要求較高，存在一定的實(shí)施成本。

然而，隨著大數(shù)據(jù)智能電網(wǎng)的發(fā)展，大數(shù)據(jù)為臺(tái)戶關(guān)系辨識(shí)提供了一種全新途徑。在配電網(wǎng)的海量運(yùn)行數(shù)據(jù)，如配變出口電壓、電流可間接反映配電網(wǎng)的線變關(guān)系。目前，針對(duì)該方面的研究成果較少。文獻(xiàn)[9]通過(guò)分析電壓數(shù)據(jù)存在于時(shí)間和空間的相關(guān)度，對(duì)各臺(tái)區(qū)的用戶進(jìn)行劃分，其準(zhǔn)確度還有待提高。文獻(xiàn)[10]以三相負(fù)荷不平衡臺(tái)區(qū)配變出口電壓的歸算結(jié)果作為線網(wǎng)關(guān)系的校驗(yàn)核心，但不適用于抵押用戶所屬臺(tái)區(qū)校驗(yàn)。實(shí)際電力系統(tǒng)中，電氣距離越近[11]，用戶的電壓變化趨勢(shì)約接近?；诖耍闹刑岢隽嘶诙嗑S尺度分析(muti-dimensional scaling, MDS)算法和改進(jìn)K-means聚類算法的臺(tái)戶關(guān)系辨別方法。首先通過(guò)MDS算法對(duì)所采集的電壓數(shù)據(jù)進(jìn)行降維處理，以降低整體算法計(jì)算量，提高算法效率，再利用改進(jìn)K-means算法實(shí)現(xiàn)用戶聚類，最后根據(jù)聚類結(jié)果確定用戶的所述臺(tái)區(qū)及相別。最終算例分析證明了文中方法的有效性。

1 MDS算法

當(dāng)待識(shí)別智能電表數(shù)目眾多，且電表數(shù)據(jù)維度特別龐大時(shí)，會(huì)造成算法耗時(shí)嚴(yán)重，效率低下。而考慮到應(yīng)用MDS進(jìn)行數(shù)據(jù)降維時(shí)能夠保證所有數(shù)據(jù)點(diǎn)在低維空間中的相似度等于在高維空間中的相似度，從而在降低數(shù)據(jù)維度提升算法效率的同時(shí)不會(huì)對(duì)辨識(shí)準(zhǔn)確度造成影響。因此，本文在利用改進(jìn)K-means聚類算法進(jìn)行臺(tái)戶關(guān)系辨識(shí)之前，首先利用MDS算法對(duì)采集到的電壓數(shù)據(jù)進(jìn)行降維處，從而降低整體算法計(jì)算量，提高算法效率。

文中采用MDS算法對(duì)用戶及變壓器低壓側(cè)的電壓數(shù)據(jù)進(jìn)行降維處理。MDS算法基于數(shù)據(jù)的相似性及相異性，以保持變量在高維空間與低維空間中歐式距離不變?yōu)樵瓌t，將變量從高維空間映射到低維空間，挖掘變量的潛在結(jié)構(gòu)。

(1)

算法目標(biāo)為獲得樣本d′在維空間的表示Z，其中d′

(2)

式中:zi為d′維空間中的第i個(gè)坐標(biāo)點(diǎn)。

定義矩陣T=ZZT，T矩陣中的元素為tij，矩陣Z的距離矩陣D中的元素為dij，其元素值為：

(3)

則可得到：

(4)

D中元素和T中元素的關(guān)系如式(5)所示。

(5)

最后對(duì)T進(jìn)行特征值分解，如式(6)所示。

(6)

式中:U為特征向量;Λ為特征值矩陣。

基于MDS算法，使得降維后數(shù)據(jù)能很好地表達(dá)原多維數(shù)據(jù)的核心部分信息，從而在不影響聚類準(zhǔn)確度的情況下，極大提升算法效率。

2 臺(tái)戶關(guān)系辨識(shí)

典型臺(tái)區(qū)變與用戶電表之間的拓?fù)溥B接如圖1所示。同一相的臺(tái)區(qū)變壓器和用戶的電表之間具有確定的電氣連接，因此用戶側(cè)的電壓會(huì)與臺(tái)區(qū)變出口電壓的變化趨勢(shì)高度一致。處于同一臺(tái)區(qū)同一相別的用戶，電壓波動(dòng)規(guī)律具有很強(qiáng)的相似性，而屬于不同臺(tái)區(qū)的用戶，其電氣距離遠(yuǎn)，電壓波動(dòng)相似性較差。而聚類分析作為一種被廣泛應(yīng)用的數(shù)據(jù)挖掘算法，可以按照事物的某些相似屬性，把事物聚集成類，使類間的相似性盡可能小，類內(nèi)相似性盡可能大。為此，文中采用改進(jìn)K-means算法對(duì)臺(tái)區(qū)用戶及變壓器低壓側(cè)電壓數(shù)據(jù)進(jìn)行聚類，從而實(shí)現(xiàn)臺(tái)區(qū)用戶的準(zhǔn)確識(shí)別。

2.1 K-means算法

K-means算法的核心思想是找出K個(gè)聚類中心c1,c2,…,ck，通常以歐式距離作為樣本相似程度的評(píng)估指標(biāo)，并使得類間的相似性盡可能小，類內(nèi)相似性盡可能大。傳統(tǒng)K-means算法流程如圖2所示。

2.2 改進(jìn)K-means算法

K-means算法簡(jiǎn)單，收斂速度快，但存在聚類個(gè)數(shù)難以確定、初始質(zhì)心選取不準(zhǔn)確、歐式距離作為評(píng)估樣本相似程度的有效性有限，常常出現(xiàn)聚類結(jié)果陷入局部最優(yōu)的情況[12]。為此，文中針對(duì)上述問(wèn)題，結(jié)合實(shí)際應(yīng)用場(chǎng)景的特點(diǎn)，對(duì)K-means算法做出如下改進(jìn)，從而達(dá)到提升辨別準(zhǔn)確度和縮短計(jì)算時(shí)間的目的。

1)聚類個(gè)數(shù)的選取

由于變壓器的個(gè)數(shù)N是已知的，因此可明確獲知最終的聚類個(gè)數(shù)為變壓器的總相數(shù)3N。這是臺(tái)區(qū)用戶辨識(shí)場(chǎng)景下的天然優(yōu)勢(shì)。

2)K-means初始聚類中心的選取

由于變壓器各相出口電壓數(shù)據(jù)是明確的，一方面不同變壓器各相的電壓數(shù)據(jù)正好隸屬不同的類，另一方面變壓器各相出口電壓能夠較好地反映各類數(shù)據(jù)的分布特征，作為聚類中心更有利于平方誤差準(zhǔn)則函數(shù)的收斂。因此，本文算法將變壓器出口電壓作為K-means的初始聚類中心，從而避免由于初始聚類中心選擇的隨機(jī)性帶來(lái)結(jié)果陷入局部最優(yōu)的僵局，實(shí)現(xiàn)準(zhǔn)確聚類。

3)重新定義相似度評(píng)估標(biāo)準(zhǔn)

經(jīng)典K-means聚類算法以歐式距離作為樣本相似度的評(píng)估指標(biāo)。歐式距離的計(jì)算公式如下：

(7)

式中:Lpq為第p個(gè)樣本到第q個(gè)樣本的距離;n為樣本的數(shù)據(jù)維度;zpd為第p個(gè)行向量的第d維坐標(biāo);zqd為第q個(gè)行向量的第d維坐標(biāo)。

然而，由于歐式距離衡量的是多維空間中各個(gè)點(diǎn)之間的絕對(duì)距離，體現(xiàn)個(gè)體數(shù)值特征的絕對(duì)差異。而本文的理論基礎(chǔ)是同一臺(tái)區(qū)同一相變壓器和用戶電壓數(shù)據(jù)變化趨勢(shì)的一致性，更強(qiáng)調(diào)電壓波動(dòng)規(guī)律的一致性。因此歐式距離不是非常適合此場(chǎng)景。為此，文中引入相關(guān)系數(shù)作為評(píng)估相似度的標(biāo)準(zhǔn)，從而提高算法的準(zhǔn)確率。相似系數(shù)的計(jì)算公式如式(8)所示。

(8)

同時(shí)，通過(guò)中心化和標(biāo)準(zhǔn)化對(duì)原始的電壓數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理，以避免噪聲數(shù)據(jù)所引起的誤差。

綜上，應(yīng)用流程如圖3所示。

3 算例分析

3.1 算例1

以下述臺(tái)區(qū)樣本數(shù)據(jù)為例進(jìn)行算例分析。在該臺(tái)區(qū)內(nèi)某臺(tái)變壓器下共接入88戶用戶，并以1小時(shí)為采樣頻率對(duì)用戶側(cè)電壓進(jìn)行了7天的數(shù)據(jù)采樣。因此，最終聚類個(gè)數(shù)為3類。為驗(yàn)證文中所提方法的有效性，算例進(jìn)行如下三個(gè)仿真，并校驗(yàn)不同方法下的正確率。

方法1：設(shè)定最終聚類個(gè)數(shù)，不設(shè)定初始聚類中心，仍采用歐式距離作為衡量相似度的標(biāo)準(zhǔn)。

方法2：設(shè)定最終聚類個(gè)數(shù)，設(shè)定初始聚類中心，仍采用歐式距離作為衡量相似度的標(biāo)準(zhǔn)。

方法3：設(shè)定最終聚類個(gè)數(shù)，設(shè)定初始聚類中心，采用相似系數(shù)作為衡量相似度的標(biāo)準(zhǔn)(文中所提方法)。

各個(gè)算法下的辨識(shí)準(zhǔn)確率如表1所示。比較方法1和方法2可知，設(shè)定K-means的初始聚類中心能夠?qū)⒂脩舯孀R(shí)的準(zhǔn)確度提升了近1.5倍。比較方法2和方法3可知，將相似系數(shù)代替歐式距離，作為相似度的衡量標(biāo)準(zhǔn)，能夠?qū)崿F(xiàn)辨識(shí)精度由于87.5%到100%的提升。上述數(shù)據(jù)一定程度上證明了文中通過(guò)對(duì)K-means算法進(jìn)行改進(jìn)，能夠有效提升用戶的辨識(shí)準(zhǔn)確度。

表1 不同方法下的用戶辨識(shí)準(zhǔn)確率

3.2 算例2

為驗(yàn)證文中方法的通用性，算例2針對(duì)不同數(shù)據(jù)量在以上3個(gè)場(chǎng)景下進(jìn)行反復(fù)10次的仿真測(cè)試，并取測(cè)試平均值作為最終的辨識(shí)結(jié)果。針對(duì)不同的數(shù)據(jù)量，以上3種方法的辨識(shí)準(zhǔn)確率如表2所示。

由表2可知，所采集到的數(shù)據(jù)量越大，算法的準(zhǔn)確度越高。方法3在低密度數(shù)據(jù)的情況下，依舊能夠保持100%的準(zhǔn)確度，并且精度不會(huì)隨復(fù)雜度增強(qiáng)(變壓器臺(tái)數(shù)增多)而降低。然而，方法1與方法2在相同數(shù)據(jù)體量下，隨著變壓器臺(tái)數(shù)的增加，其精度有明顯的下降，可見(jiàn)方法1與方法2受外界因素影響較大，用戶辨識(shí)結(jié)果不穩(wěn)定。

表2 不同數(shù)據(jù)量下的用戶辨識(shí)準(zhǔn)確率

因此，文中所提方法通過(guò)對(duì)配網(wǎng)運(yùn)行過(guò)程中產(chǎn)生的海量數(shù)據(jù)進(jìn)行降維聚類分析，能夠有效解決配網(wǎng)中線變不匹配的問(wèn)題。該方法無(wú)需增加任何的設(shè)備成本投入，且效果穩(wěn)定，具備大規(guī)模應(yīng)用的潛力。

4 結(jié)束語(yǔ)

文中提出了一種基于MDS和改進(jìn)K-means算法的臺(tái)戶關(guān)系辨識(shí)方法。該方法通過(guò)MDS算法實(shí)現(xiàn)數(shù)據(jù)降維，提升了后期聚類分析的計(jì)算速度。根據(jù)實(shí)際應(yīng)用場(chǎng)景特點(diǎn)對(duì)K-means算法進(jìn)行3個(gè)方面的改進(jìn)，從而實(shí)現(xiàn)提升臺(tái)區(qū)用戶辨識(shí)準(zhǔn)確率與辨識(shí)穩(wěn)定度的目的。

算例結(jié)果分析表明，文中所提方法能夠有效提升臺(tái)區(qū)用戶辨識(shí)準(zhǔn)確率，在低密度數(shù)據(jù)、問(wèn)題復(fù)雜度增加的情況下依舊能保持極高的準(zhǔn)確率，效果穩(wěn)定，具備在實(shí)際場(chǎng)景中大規(guī)模運(yùn)用的潛力。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡