張洋瑞,楊 鵬,申洪濤,馮 波,趙俊鵬,陶 鵬
(國(guó)網(wǎng)河北省電力公司電力科學(xué)研究院,石家莊 050021)
基于聚類算法的低壓臺(tái)區(qū)線損分析方法研究
張洋瑞,楊 鵬,申洪濤,馮 波,趙俊鵬,陶 鵬
(國(guó)網(wǎng)河北省電力公司電力科學(xué)研究院,石家莊 050021)
針對(duì)低壓臺(tái)區(qū)損耗在電網(wǎng)總損耗中所占比重比較大的現(xiàn)狀,提出一種基于聚類算法的低壓臺(tái)區(qū)線損分析方法。介紹線損分析流程,根據(jù)臺(tái)區(qū)日均線損率、線損率變異系數(shù)、三相不平衡、功率因數(shù)異常等4個(gè)維度特征值構(gòu)建線損分析模型,并通過(guò)實(shí)際算例驗(yàn)證了該方法的可行性。
聚類算法;低壓臺(tái)區(qū);線損分析方法;線損分析模型
電網(wǎng)企業(yè)在電能輸送和營(yíng)銷過(guò)程中,自發(fā)電廠出線起至客戶電能表止,所產(chǎn)生的電能損耗和損失稱為電力網(wǎng)電能損耗,簡(jiǎn)稱線損。線損率是反映電網(wǎng)規(guī)劃設(shè)計(jì)、技術(shù)裝備水平和經(jīng)濟(jì)運(yùn)行水平的重要指標(biāo)[1]。按照理論線損計(jì)算,各電壓等級(jí)電網(wǎng)中,380 V電網(wǎng)(即低壓臺(tái)區(qū))線損率最高,約為6%~10%;按照統(tǒng)計(jì)線損計(jì)算,低壓臺(tái)區(qū)損耗約占電網(wǎng)總損耗的20%[2]。因此,研究低壓臺(tái)區(qū)線損情況具有重要意義。
聚類分析是一種根據(jù)數(shù)據(jù)本身結(jié)構(gòu)特征對(duì)數(shù)據(jù)進(jìn)行分類的方法,通過(guò)聚類分析,可以把數(shù)據(jù)分成若干個(gè)類別,使得類別內(nèi)部的差異盡可能的小,類別間的差異盡可能的大。聚類分析按照研究對(duì)象的不同,一般分為樣本聚類和變量聚類;按照分析方法不同,一般分為分層聚類、快速聚類和兩步聚類[3]
層次聚類法又稱系統(tǒng)聚類,主要思想是對(duì)相近程度最高的兩類進(jìn)行合并組成一個(gè)新類,不斷重復(fù)這一過(guò)程直至歸為一類。或者采用相反的過(guò)程,先把所有樣本歸為一類,再逐次分類,直至分為n類。
快速聚類法又稱K-均值聚類,主要思想是將數(shù)據(jù)視為K維空間上的點(diǎn),以距離為標(biāo)準(zhǔn)進(jìn)行聚類分析,將樣本分為指定的K類。其中K-means最為常用,改進(jìn)型算法K-Medoids也有較為廣泛的應(yīng)用。
兩步聚類又稱兩階段聚類,主要思想是先以距離為依據(jù)形成相應(yīng)的聚類特征樹(shù)節(jié)點(diǎn),構(gòu)建聚類特征樹(shù),然后通過(guò)信息準(zhǔn)則確定最優(yōu)分組個(gè)數(shù)對(duì)各個(gè)節(jié)點(diǎn)進(jìn)行分組。
依托用電信息采集系統(tǒng),對(duì)海量數(shù)據(jù)進(jìn)行深入挖掘,以低壓臺(tái)區(qū)線損率與計(jì)量在線監(jiān)測(cè)異常事件為分析對(duì)象,提出了一種基于聚類算法的低壓臺(tái)區(qū)線損分析方法,該方法的分析流程如圖1所示。
圖1 低壓臺(tái)區(qū)線損分析方法流程
2.1 基礎(chǔ)數(shù)據(jù)抽取
低壓臺(tái)區(qū)線損分析的目的在于確定臺(tái)區(qū)配電系統(tǒng)結(jié)構(gòu)運(yùn)行的合理性,找出配電系統(tǒng)運(yùn)行、計(jì)量裝置運(yùn)行以及線損管理等方面存在的薄弱環(huán)節(jié)。
為實(shí)現(xiàn)對(duì)臺(tái)區(qū)線損的深入分析,依托用電信息采集系統(tǒng),以一定范圍(市、縣供電公司)的低壓臺(tái)區(qū)為研究對(duì)象,抽取統(tǒng)計(jì)周期內(nèi)的臺(tái)區(qū)日線損率及計(jì)量在線監(jiān)測(cè)異常事件作為分析數(shù)據(jù),構(gòu)建原始數(shù)據(jù)矩陣。其中,臺(tái)區(qū)日線損率由用電信息采集系統(tǒng)每天采集的供、售電量自動(dòng)計(jì)算得出,計(jì)量異常事件選取對(duì)線損影響顯著的三相不平衡和功率因數(shù)異常兩類。
2.2 數(shù)據(jù)甄別處理
臺(tái)區(qū)日線損率受基礎(chǔ)檔案正確率、采集成功率、采集數(shù)據(jù)完整率等影響較大,因此需要對(duì)原始數(shù)據(jù)進(jìn)行甄別處理,篩除明顯異常的線損數(shù)據(jù)??紤]到線損率的大小和波動(dòng)情況能較好反映臺(tái)區(qū)線損水平,定義變量日均線損率和線損率變異系數(shù)。
其中,臺(tái)區(qū)日均線損率能夠反映線損率的平均水平;線損率變異系數(shù)能夠反映臺(tái)區(qū)線損率的離散情況,消除日均線損率差異較大的影響,其計(jì)算公式為:
2.3 特征值生成
三相不平衡及功率因數(shù)異常作為反映臺(tái)區(qū)統(tǒng)計(jì)周期內(nèi)是否發(fā)生計(jì)量異常事件的特征值,定義為離散變量,發(fā)生記為1,未發(fā)生記為0。
日均線損率雖然能反映臺(tái)區(qū)線損水平,但如果直接作為特征值使用K-means算法[4]進(jìn)行聚類分析,所得分組結(jié)果與當(dāng)前線損管理工作指標(biāo)不能完全吻合。將某市公司所轄臺(tái)區(qū)日均線損率作為特征值使用K-means算法進(jìn)行聚類分析,所得分組結(jié)果見(jiàn)表1和圖2。
表1 聚類分組結(jié)果
分組組內(nèi)數(shù)量中位數(shù)最小值最大值所占比例1 8729 2.46%0.00%4.69%35.83% 2 8698 6.90%4.70%9.59%35.71% 3 6016 12.12%9.60%16.99%24.70% 4 293 21.42%17.07%27.90%1.20% 5 173 34.03%28.19%41.77%0.71% 6 326 50.00%41.90%55.39%1.34% 7 49 61.77%56.14%66.32%0.20% 8 36 72.03%66.76%76.30%0.15% 9 16 82.63%79.02%86.41%0.07% 10 23 92.31%88.18%99.47%0.09%
圖2 聚類分組結(jié)果
從聚類結(jié)果可以看出,線損率分布呈階梯型,高于20%的臺(tái)區(qū)占總體比例較小。參考國(guó)家電網(wǎng)公司關(guān)于臺(tái)區(qū)月度同期線損的相關(guān)規(guī)定,將日均線損率定義為離散變量。線損率介于0~10%的臺(tái)區(qū)定義為“良”,線損率介于10%~20%的臺(tái)區(qū)定義為“中”,線損率大于20%的臺(tái)區(qū)定義為“差”。
將線損率變異系數(shù)定義為連續(xù)變量,與日均線損率、三相不平衡、功率因數(shù)異常以及臺(tái)區(qū)編號(hào)共同構(gòu)建特征值矩陣。
2.4 聚類分析
由于選取的特征值既有連續(xù)變量又有離散變量,且數(shù)據(jù)規(guī)模較大,故選取兩步聚類法作為聚類分析算法。同時(shí),兩步聚類法利用統(tǒng)計(jì)量作為距離指標(biāo)進(jìn)行聚類,并根據(jù)一定的統(tǒng)計(jì)標(biāo)準(zhǔn)來(lái)“自動(dòng)地”建議甚至于確定最佳的類別數(shù),結(jié)果的正確性更有保障。
聚類分析過(guò)程中選取施瓦茲貝葉斯準(zhǔn)則作為聚類準(zhǔn)則,并對(duì)連續(xù)變量進(jìn)行標(biāo)準(zhǔn)化處理,以達(dá)到更為精確的聚類分組結(jié)果。
從某供電公司分析區(qū)域抽取1個(gè)月的線損相關(guān)數(shù)據(jù)作為研究對(duì)象,經(jīng)過(guò)數(shù)據(jù)篩查和預(yù)處理后,得到反映線損管理水平的4個(gè)變量:日均線損率、線損率變異系數(shù)、三相不平衡和功率因數(shù)異常,以此作為聚類分析的特征值,如表2所示。
表2 聚類分析特征值
選取施瓦茲貝葉斯準(zhǔn)則作為判斷聚類效果的統(tǒng)計(jì)指標(biāo),進(jìn)行聚類分析,得到的聚類結(jié)果見(jiàn)表3。
表3 聚類分析結(jié)果
由表3聚類結(jié)果可以看出:
a.第1、2組日均線損率為良,變異系數(shù)均值較小,說(shuō)明線損率正常但略有波動(dòng),線路運(yùn)行水平和線損管理水平較好。但第2組有三相不平衡事件發(fā)生,說(shuō)明臺(tái)區(qū)內(nèi)存在負(fù)荷分配不均的情況,線損管理水平可進(jìn)一步提升。
b.第3組日均線損率為良,變異系數(shù)極大,且有功率因數(shù)異常事件發(fā)生,說(shuō)明統(tǒng)計(jì)周期內(nèi)線損率波動(dòng)劇烈,說(shuō)明可能存在計(jì)量裝置故障或配電設(shè)備老化等方面的問(wèn)題。
c.第5、7組日均線損率為中,變異系數(shù)均值很小,說(shuō)明線損率較高且波動(dòng)很小,線路運(yùn)行和線損管理水平一般。其中,第7組有三相不平衡發(fā)生,應(yīng)首先排查、處理臺(tái)區(qū)負(fù)荷分配不均問(wèn)題。
d.第4、6組日均線損率為差,變異系數(shù)均值很小,說(shuō)明線損率很高且波動(dòng)很小,線路運(yùn)行和線損管理水平較差。其中,第6組有三相不平衡發(fā)生,應(yīng)首先排查、處理臺(tái)區(qū)負(fù)荷分配不均問(wèn)題。
在臺(tái)區(qū)線損分析中,一般對(duì)月度線損較為重視,僅對(duì)月度線損率較高的臺(tái)區(qū)重點(diǎn)分析研究;而影響臺(tái)區(qū)線損的管理、技術(shù)因素有很多,需要逐一排查。以上提出了一種基于聚類算法的臺(tái)區(qū)線損分析方法,通過(guò)對(duì)臺(tái)區(qū)日均線損率、線損率變異系數(shù)、三相不平衡、功率因數(shù)異常等4個(gè)維度特征值的聚類分群,不僅清晰的展示了線損的平均水平和波動(dòng)情況,而且與三相不平衡和功率因數(shù)異常等技術(shù)線損因素密切聯(lián)系,對(duì)于臺(tái)區(qū)線損管理工作有一定的輔助決策作用。
[1] 趙全樂(lè).線損管理手冊(cè)[M].北京:中國(guó)電力出版社,2007.
[2] 余衛(wèi)國(guó),熊幼京,周新風(fēng),等.電力網(wǎng)技術(shù)線損分析及降損對(duì)策[J].電網(wǎng)技術(shù),2006,30(18):54-57.
[3] 陳勝可.spss統(tǒng)計(jì)分析從入門到精通[M].北京:清華大學(xué)出版社,2010.
[4] 張良均,陳俊德,劉名軍,等.數(shù)據(jù)挖掘:實(shí)用案例分析[M].北京:機(jī)械工業(yè)出版社,2013.
本文責(zé)任編輯:楊秀敏
Research of Low-voltage Distribution Network Loss Based on Cluster Analysis
Zhang Yangrui,Yang Peng,Shen Hongtao,Feng Bo,Zhao Junpeng,Tao Peng
(State Grid Hebei Electric Power Research Institute,Shijiazhuang 050021,China)
Aiming at low-voltage distribution network loss occupy larger proportion of total loss in the power grid,a low-voltage distribution network loss analysis method based on cluster analysis is proposed.Introduce process of loss analysis,according to the low-voltage distribution network average daily loss,coefficient of variation,three phase unbalance,power factor abnormal total of four-dimension characteristic value to construct the line loss analysis model,and the feasibility of the method is verified by practical example.
cluster analysis;low-voltage distribution network;line loss analysis method;line loss analysis model.
TM764.1
B
10019898(2017)02000803
20170109
張洋瑞(1985-),男,工程師,主要從事電力計(jì)量方面的工作。