鐘小強 陳程 董雨 李春生 徐冬冬
摘要:基于電力負荷特性分析,電力公司能夠為用戶提供更好的服務(wù)。以前的分析不能很好地表達用戶的用電負荷特性,因此,采用SOM神經(jīng)網(wǎng)絡(luò)聚類方法來解決這個問題。先對獲取的數(shù)據(jù)進行歸一化處理,然后采用MATLAB仿真輸出可視化聚類結(jié)果,最后得到了一個詳細的分析結(jié)果。根據(jù)SOM神經(jīng)網(wǎng)絡(luò)顯示的結(jié)果,不同類型公變用戶的用電行為是有差異的,因此有一個很好的聚類效果。
關(guān)鍵詞:SOM神經(jīng)網(wǎng)絡(luò);負荷特性曲線;聚類分析
中圖分類號:TM7 文獻標(biāo)識碼:A 文章編號:1007-0079(2014)33-0204-03
在國家提出建設(shè)堅強智能電網(wǎng)的背景下,提高電力營銷服務(wù)水平和智能用電技術(shù)已成為電網(wǎng)企業(yè)關(guān)注的焦點。電力營銷服務(wù)水平與智能用電技術(shù)的提升離不開在對電力用戶用電行為特征的準確、全面、及時地掌握,而從海量負荷數(shù)據(jù)中提取用戶日負荷特征曲線并進行深入分析成為研究用戶用電行為特征的一種有效方式。
從研究對象層面來看,以往相關(guān)研究側(cè)重專線用戶(負荷數(shù)據(jù)來源為SCADA系統(tǒng))和專變用戶,并以傳統(tǒng)意義上的行業(yè)分類作為提取負荷特征曲線時聚類的依據(jù)。從研究方法層面來看,電力用戶日負荷特征曲線的提取多使用聚類算法,主要有統(tǒng)計方法、機器學(xué)習(xí)方法、人工神經(jīng)網(wǎng)絡(luò)方法和面向數(shù)據(jù)庫的方法。人工神經(jīng)網(wǎng)絡(luò)因具有大規(guī)模的并行協(xié)同處理能力、較強的容錯能力、聯(lián)想能力、學(xué)習(xí)能力和自適應(yīng)能力,故能夠較好地適應(yīng)海量數(shù)據(jù)背景下的數(shù)據(jù)挖掘。應(yīng)用較多的典型的神經(jīng)網(wǎng)絡(luò)模型包括BP網(wǎng)絡(luò)、Hopfield網(wǎng)絡(luò)、ART網(wǎng)絡(luò)和Kohonen網(wǎng)絡(luò)。[1-3]BP網(wǎng)絡(luò)屬于有監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),需要提供聚類對象類別數(shù)量的先驗知識,而公變用戶缺乏傳統(tǒng)意義上類似專變用戶的行業(yè)分類,故不適合采用BP網(wǎng)絡(luò)。Hopfield網(wǎng)絡(luò)、ART網(wǎng)絡(luò)和Kohonen網(wǎng)絡(luò)都屬于無監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),在解決聚類問題上有其各自的優(yōu)缺點。
本文提出采用SOM神經(jīng)網(wǎng)絡(luò)[4-6]聚類算法提取公變用戶日負荷特征曲線,用MATLAB軟件進行仿真,輸出可視化聚類結(jié)果,并對聚類結(jié)果進行分析,驗證了采用SOM神經(jīng)網(wǎng)絡(luò)聚類算法提取出的公變用戶日負荷特征曲線能夠較好地顯示不同類型公變用戶用電行為特征上的差異,具備良好的聚類效果,同時為電網(wǎng)企業(yè)優(yōu)化電力營銷服務(wù)提供參考和指導(dǎo)。
一、SOM神經(jīng)網(wǎng)絡(luò)
SOM(Self-Organizing Map,自組織映射)神經(jīng)網(wǎng)絡(luò)是較為廣泛應(yīng)用于聚類的神經(jīng)網(wǎng)絡(luò)。它是由Cohonen提出的一種無監(jiān)督學(xué)習(xí)的競爭型神經(jīng)網(wǎng)絡(luò)模型,通過不斷縮小獲勝神經(jīng)元的鄰域來達到聚類的目的。主要功能是將輸入的高維空間數(shù)據(jù)映射到一個較低的維度,通常是一維或者二維輸出,同時保持數(shù)據(jù)原有的拓撲邏輯關(guān)系。
SOM神經(jīng)網(wǎng)絡(luò)由輸入層和輸出層兩層組成,輸入層中的每一個神經(jīng)元通過權(quán)與輸出層中的每一個神經(jīng)元相連,如圖1所示。輸入層的神經(jīng)元以一維的形式排列,輸入神經(jīng)元的個數(shù)由輸入矢量中的分量個數(shù)決定,輸出層的神經(jīng)元一般以一維或者二維的形式排列,計輸入層的神經(jīng)元數(shù)量為m,輸出層神經(jīng)元數(shù)量為c。輸入的樣本總數(shù)為n,第i個輸入樣本用矢量表示為,每個輸出神經(jīng)元的輸出值記為,。與第j個輸出神經(jīng)元相連的權(quán)用矢量表示為:。
Kohonen算法是無教師示教的聚類方法,它能將任意維輸入模式在輸入層映射成一維或二維離散圖形,并保持其拓撲結(jié)構(gòu)不變,即在無教師示教的情況下,通過對輸入模式的自組織學(xué)習(xí),在輸出層將聚類結(jié)果表示出來。此外,網(wǎng)絡(luò)通過對輸入模式的反復(fù)學(xué)習(xí),可以使連接權(quán)矢量空間分布密度與輸入模式的概率分布趨于一致,即連接權(quán)矢量空間分布能反映輸入模式的統(tǒng)計特性。該算法往往在完成極高維數(shù)、超大量數(shù)據(jù)和高度非線性問題的聚類,模式表征和數(shù)據(jù)壓縮,分類等任務(wù)時是一個很有效、很簡便,且快速、穩(wěn)健、泛化性好的算法。
Kohonen的學(xué)習(xí)算法如下:
(1)初始化:將整個輸入向量存儲在矩陣p中,對權(quán)值w進行初始化,權(quán)值向量的每一維的取值范圍同輸入向量每一維的取值范圍。
(2)選擇一個輸入向量,提供給網(wǎng)絡(luò)輸入層。
(3)按照下式計算輸出層每一個神經(jīng)元 j 的權(quán)值與輸入向量之差:,其中,。
(4)按照“勝者為王”的原則,對每一個神經(jīng)元j,以minDist中的最小值所對應(yīng)的神經(jīng)元 k作為勝者,對它和它的鄰域內(nèi)的神經(jīng)元的權(quán)值進行調(diào)整,假設(shè)當(dāng)前處于學(xué)習(xí)的第l步,權(quán)值的修正按照下式進行:
其中,lr表示學(xué)習(xí)速率,br表示鄰域調(diào)整率;表示獲勝神經(jīng)元的鄰域,即:。
(5)選擇另一個輸入向量,返回(3),直到所有的輸入向量全部提供給網(wǎng)絡(luò)。
(6)返回(2),直到達到最大訓(xùn)練步數(shù)。
二、MATLAB仿真算例
1.MATLAB仿真實現(xiàn)
對于日負荷特征曲線的提取,負荷曲線的采樣點越多,曲線越精細,越容易進行分類,研究數(shù)據(jù)來自于電力用戶用電信息采集系統(tǒng),從中提取公變用戶每15分鐘采集一次的有功功率構(gòu)成其日負荷曲線,一天共96個采樣點。從某省電力用戶用電信息采集系統(tǒng)中隨機抽取1000臺公用變壓器,選取其2012年7月10日(工作日,該省全年負荷最高日)作為典型日進行日負荷特征曲線提取和分析。每臺公變?nèi)肇摵汕€由96個有功采樣點組成。由于每臺公變額定容量大小不等,為了有效聚類,首先需要對負荷數(shù)據(jù)進行歸一化處理。
本文采用聚類SOM神經(jīng)網(wǎng)絡(luò),在MATLAB環(huán)境下,對這些數(shù)據(jù)進行聚類仿真。聚類SOM神經(jīng)網(wǎng)絡(luò)的MATLAB實現(xiàn)步驟如下:(1)準備數(shù)據(jù)源。首先從原始數(shù)據(jù)庫讀取相關(guān)數(shù)據(jù)(輸入樣本總數(shù)70,每一個樣本有96個采集時點)作為輸入矢量,并將其以二維數(shù)組70×96形式輸入。(2)確定參數(shù)。輸入神經(jīng)元個數(shù)為采集時點的個數(shù)96;輸出神經(jīng)元以二維數(shù)組3×3形式呈現(xiàn)。(3)運用rand( )函數(shù)產(chǎn)生[0,1)之間的隨機數(shù)作為權(quán)值。(4)調(diào)用SOM創(chuàng)建函數(shù)newsom( ),創(chuàng)建自組織映射網(wǎng)絡(luò)net=newsom( )。(5)對迭代次數(shù)net.trainParam.epochs賦值2000;對net.trainParam.show賦值20,表示每20次顯示一下誤差變化情況。(6)運用網(wǎng)絡(luò)訓(xùn)練函數(shù)train( )訓(xùn)練上述初始化后的網(wǎng)絡(luò)net=train( )。(7)調(diào)用plot( )畫輸入點; plotsom( )作訓(xùn)練后的權(quán)值點及其與相鄰權(quán)值點的連線。
2.仿真結(jié)果分析
經(jīng)MATLAB仿真運行后得到聚類結(jié)果圖2所示:
圖2所示為SOM神經(jīng)網(wǎng)絡(luò)聚類結(jié)果,將樣本公變用戶分為7個類別,為便于后文描述,不妨按照行優(yōu)先的順序為各激活的優(yōu)勝神經(jīng)元標(biāo)識聚類編號,依次分別為為:公變用戶第一類(包含13個樣本用戶)、公變用戶第二類(包含12個樣本用戶)、公變用戶第三類(包含5個樣本用戶)、公變用戶第四類(包含10個樣本用戶)、公變用戶第五類(包含10個樣本用戶)、公變用戶第六類(包含10個樣本用戶)、公變用戶第七類(包含10個樣本用戶)。
每個競爭層神經(jīng)元與各輸入神經(jīng)元之間的連接權(quán)構(gòu)成的向量代表了該優(yōu)勝神經(jīng)元所標(biāo)識類別的聚類中心即日負荷特征曲線,競爭層神經(jīng)元鄰域權(quán)值距離如圖3所示,顏色越深表示領(lǐng)域神經(jīng)元間的權(quán)值距離越遠,即鄰域神經(jīng)元的聚類中心距離越遠、提取的日負荷特征曲線差異越大。
圖4所示為通過SOM神經(jīng)網(wǎng)絡(luò)聚類算法提取的七大類公變用戶日負荷特征曲線。日負荷特征曲線較為明顯地反映了不同類型公變用戶在該典型日的用電行為。
第一類公變?nèi)肇摵商卣髑€呈現(xiàn)出明顯的午高峰和晚高峰特征,且晚高峰明顯高于午高峰。推測此類為城鎮(zhèn)居民生活的典型日負荷特征曲線,可能由于部分居民上班因素造成晚高峰高于午高峰;第二類公變?nèi)肇摵商卣髑€走勢同全網(wǎng)負荷基本一致,呈現(xiàn)出明顯午高峰和晚高峰,但午高峰一枝獨秀,可能該公變下的用戶類型較多,包括居民用戶和一般工商業(yè)用戶,由于各類用電特征比例與全網(wǎng)比例類似,形成具有全網(wǎng)負荷特征的曲線;第七類公變?nèi)肇摵商卣髑€與前六種主要集中在白天用電不同,主要在天黑時間段內(nèi)(晚上7點左右至第二天早上6點)用電,推測這類用戶主要集中在市政工程類。
三、總結(jié)與展望
本文將SOM神經(jīng)網(wǎng)絡(luò)聚類算法應(yīng)用到電力用戶日負荷特征曲線提取的研究中,選取某省公變用戶作為分析樣本,通過MATLAB仿真計算將樣本公變用戶分為七個類別,以優(yōu)勝神經(jīng)元與輸入神經(jīng)元之間連接權(quán)向量作為聚類中心即該類別用戶的日負荷特征曲線。根據(jù)提取出的日負荷特征曲線,結(jié)合電力用戶用電信息采集系統(tǒng)中的營銷檔案分析了不同類別公變用戶的用電特征與習(xí)慣。分析表明,采用SOM神經(jīng)網(wǎng)絡(luò)聚類算法提取日負荷特征曲線具有良好的效果,提取出的日負荷特征曲線能夠較好反映該類型用戶的用電行為與特征,為電力企業(yè)了解用戶用電習(xí)慣、細分電力市場、調(diào)整定價策略和實施需求側(cè)管理提供了有益參考。
下一步研究將考慮采用電力用戶全年負荷數(shù)據(jù)進行聚類分析,驗證小樣本下的聚類結(jié)果、發(fā)現(xiàn)新的用戶類型;同時改進SOM神經(jīng)網(wǎng)絡(luò)算法,使其適應(yīng)海量數(shù)據(jù)下的負荷曲線聚類分析,并通過調(diào)整競爭層神經(jīng)元個數(shù)與抑制權(quán)值使訓(xùn)練結(jié)果更加穩(wěn)定,得到更好的聚類效果。
參考文獻:
[1]馬玉梅,馬志超.基于人工神經(jīng)網(wǎng)絡(luò)的手寫阿拉伯?dāng)?shù)字識別[J].中央民族大學(xué)學(xué)報(自然科學(xué)版),2007,(4).
[2]劉小波,李亞玲,趙景濤,等.基于KOHONEN神經(jīng)網(wǎng)絡(luò)的電壓控制分區(qū)[J].浙江電力,2007,(3).
[3]莫禮平.基于Kohonen神經(jīng)網(wǎng)絡(luò)的故障診斷方法[J].成都大學(xué)學(xué)報(自然科學(xué)版),2007,(1).
[4]李培強,李欣然,陳輝華,等.基于模糊聚類的電力負荷特性的分類與綜合[J].中國電機工程學(xué)報,2005,(24).
[5]張紅斌,賀仁睦,劉應(yīng)梅.基于KOHONEN神經(jīng)網(wǎng)絡(luò)的電力系統(tǒng)負荷動特性聚類與綜合[J].中國電機工程學(xué)報,2003,(5).
[6]高琳琦,李從東.個性化產(chǎn)品推薦中的SOFM神經(jīng)網(wǎng)絡(luò)模型[J].天津師范大學(xué)學(xué)報(自然科學(xué)版),2006,(2).
(責(zé)任編輯:王意琴)