魯觀娜 呂言國 李文文 姜振宇 黃 凡
(1.國網(wǎng)冀北電力有限公司電力科學(xué)研究院 北京 100045)(2.華北電力科學(xué)研究院有限責(zé)任公司 北京 100045)(3.深圳市科陸智慧工業(yè)有限公司 深圳 518057)
電力負(fù)荷預(yù)測(cè)是制定發(fā)電計(jì)劃和電力系統(tǒng)發(fā)展規(guī)劃的基礎(chǔ),精確的負(fù)荷預(yù)測(cè)對(duì)于電力系統(tǒng)經(jīng)濟(jì)、安全、可靠地運(yùn)行具有重要意義[1]對(duì)電力系統(tǒng)短期負(fù)荷預(yù)測(cè)方法的探索,一直是國內(nèi)外學(xué)者關(guān)注的一個(gè)熱點(diǎn),多年來已經(jīng)提出了許多預(yù)測(cè)方法,如時(shí)間序列預(yù)測(cè)法[2],神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法[3],組合模型預(yù)測(cè)法[4],取得了很多卓有成效的進(jìn)展。目前已有的預(yù)測(cè)模型都是針對(duì)全部用戶的負(fù)荷值進(jìn)行預(yù)測(cè)[5~7],并未考慮到不同用戶的用電類型對(duì)負(fù)荷結(jié)果的影響。
本文針對(duì)城市電力負(fù)荷預(yù)測(cè)中存在的行業(yè)類型多,不同行業(yè)用戶乃至同一行業(yè)不同用戶用電負(fù)荷差異大,大量的用戶無明確的行業(yè)類型特征,城市不同時(shí)刻電力負(fù)荷差別大等問題,設(shè)計(jì)智能電表計(jì)量自動(dòng)化系統(tǒng)采集計(jì)量點(diǎn)數(shù)據(jù),開展基于用戶分群策略研究的電力實(shí)時(shí)負(fù)荷研究,提出了聚類算法與回歸算法結(jié)合的預(yù)測(cè)方法,對(duì)城市實(shí)時(shí)電力負(fù)荷預(yù)測(cè)具有一定的指導(dǎo)意義。
在實(shí)驗(yàn)中,設(shè)計(jì)智能電表計(jì)量自動(dòng)化系統(tǒng)采集計(jì)量點(diǎn)數(shù)據(jù)在進(jìn)行負(fù)荷預(yù)測(cè)時(shí),采用先對(duì)用戶進(jìn)行細(xì)分,再分別進(jìn)行預(yù)測(cè)的方法。即先對(duì)用戶按照負(fù)荷特性進(jìn)行分類,計(jì)算合適的用戶聚類簇?cái)?shù),利用聚類算法將用戶分為不同用電特征的幾大類,然后對(duì)各分群分別采用回歸算法進(jìn)行負(fù)荷建模與預(yù)測(cè),再將各個(gè)群組的預(yù)測(cè)結(jié)果進(jìn)行累加求和,形成最終的城市負(fù)荷預(yù)測(cè)。另外還可以將實(shí)際預(yù)測(cè)結(jié)果與歷史實(shí)際數(shù)據(jù)進(jìn)行對(duì)比,對(duì)預(yù)測(cè)結(jié)果評(píng)價(jià),并反饋至預(yù)測(cè)模型,通過調(diào)整建模參數(shù),提升預(yù)測(cè)模型精度,具體流程如圖1所示。
某供電局的智能電表計(jì)量自動(dòng)化系統(tǒng)采集的計(jì)量點(diǎn)數(shù)據(jù)主要包括:通信流量數(shù)據(jù)、表碼數(shù)據(jù)和瞬時(shí)量數(shù)據(jù)。通信流量數(shù)據(jù)包含終端編碼、數(shù)據(jù)日期、發(fā)送(下行)字節(jié)、接收(上行)字節(jié)、重連次數(shù)、數(shù)據(jù)流量、報(bào)警流量、心跳流量、在線時(shí)間等終端與主站之間的通信流量數(shù)據(jù)。表碼數(shù)據(jù)[8]包含正向有功表碼、反向有功表碼、正向無功表碼、反向無功表碼等用戶累計(jì)用電信息。瞬時(shí)量數(shù)據(jù)[9]包含有功功率、電流、電壓等用戶實(shí)時(shí)的用電信息。
本論文以某供電局2016年12月份的計(jì)量自動(dòng)化系統(tǒng)采集的58995個(gè)大客戶的瞬時(shí)量數(shù)據(jù)作為實(shí)驗(yàn)對(duì)象,以用戶實(shí)時(shí)功率數(shù)據(jù)為基礎(chǔ),研究電力用戶的分群策略,尋找在分群效果穩(wěn)定的數(shù)據(jù)簇?cái)?shù)目的確定方法,并在此基礎(chǔ)上,使用局部加權(quán)線性回歸算法,對(duì)每一類用戶進(jìn)行負(fù)荷預(yù)測(cè),并形成最后所有用戶的負(fù)荷。瞬時(shí)量數(shù)據(jù)表各字段屬性如表1所示。
為了精確描述電力負(fù)荷隨時(shí)間變化的規(guī)律,分析各種因素對(duì)電力負(fù)荷特性的影響程度,找出不同行業(yè)用戶具備的相同的用電模式,本文選取供電局提供的大客戶的連續(xù)4周的整點(diǎn)時(shí)刻的數(shù)據(jù)的均值作為該客戶每個(gè)小時(shí)的負(fù)荷值,以0點(diǎn)到23點(diǎn)共24個(gè)整點(diǎn)時(shí)刻的負(fù)荷作為聚類的維度,利用K-means算法[10]進(jìn)行聚類,分析各用戶的負(fù)荷波動(dòng)指標(biāo)。
表1 瞬時(shí)量字段表
將歸一化的用戶負(fù)荷均值數(shù)據(jù)利用K-means聚類算法在24個(gè)時(shí)間點(diǎn)維度上進(jìn)行聚類,從而將所有行業(yè)每個(gè)用戶的所有計(jì)量點(diǎn)按照負(fù)荷波動(dòng)指標(biāo)進(jìn)行分類,最終得出每個(gè)用戶所屬的用電負(fù)荷類別。
不同時(shí)刻的用電負(fù)荷的差值很大,例如白天工廠的用電負(fù)荷遠(yuǎn)遠(yuǎn)大于凌晨時(shí)刻的用電負(fù)荷。如果直接聚類,數(shù)據(jù)點(diǎn)距離會(huì)偏向于負(fù)荷值較大的時(shí)間維度影響,從而掩蓋其他時(shí)間維度的數(shù)據(jù)特征,導(dǎo)致聚類結(jié)果不準(zhǔn)確。所以需要對(duì)24個(gè)時(shí)間特征維度進(jìn)行數(shù)值歸一化處理,將所有的特征指標(biāo)維度縮放到同一尺度內(nèi)。
實(shí)驗(yàn)中采用z-score標(biāo)準(zhǔn)化(zero-mean normal?ization)方法[11],計(jì)算時(shí)對(duì)每個(gè)特征分別進(jìn)行,如式(1)所示:
其中,μ和σ分別代表數(shù)據(jù)集某特征列的均值和標(biāo)準(zhǔn)差,經(jīng)過該方法歸一化的數(shù)據(jù)屬性的均值為0,標(biāo)準(zhǔn)差為1。將每個(gè)用戶、每個(gè)維度歸一化之后的24個(gè)小時(shí)點(diǎn)的負(fù)荷均值作為該用戶的聚類維度,如表2的例子所示。
上述的例子中,F(xiàn)1是第一個(gè)特征維度,表示歸一化后0點(diǎn)時(shí)刻的負(fù)荷值,該用戶原始負(fù)荷值為3244.194kW,0點(diǎn)時(shí)刻所有用戶的負(fù)荷均值為3936.549kW,負(fù)荷標(biāo)準(zhǔn)差為4212.466kW,故由(3244.194-3946.549)/4212.466得到該用戶0點(diǎn)時(shí)刻的歸一化負(fù)荷值。
表2 聚類特征選取例子
K-means是一種將給定數(shù)據(jù)集劃分為K個(gè)數(shù)據(jù)簇的算法。需要?jiǎng)澐值拇氐臄?shù)量是需要提前指定的,簇的中心是在該簇中的所有數(shù)據(jù)的質(zhì)心(本文采用均值計(jì)算),由簇的中心來描述這個(gè)簇。算法運(yùn)行前需要指定簇的數(shù)目K及收斂條件。
一種用于度量聚類效果的指標(biāo)是SSE(Sum of Squared Error,誤差平方和)[12],即計(jì)算聚類穩(wěn)定后的所有數(shù)據(jù)點(diǎn)距離其所屬數(shù)據(jù)簇的中心的距離的總和,SSE值越小表示數(shù)據(jù)點(diǎn)越接近于它們的質(zhì)心,聚類效果也越好。因?yàn)閷?duì)誤差去了平方,因此更加重視那些遠(yuǎn)離中心的點(diǎn),可以通過遍歷所有質(zhì)心并計(jì)算點(diǎn)到每個(gè)質(zhì)心的距離來完成,如式(2)所示。
其中,表示第i條訓(xùn)練數(shù)據(jù)的第 j個(gè)特征,表示第i個(gè)訓(xùn)練數(shù)據(jù)所屬聚類質(zhì)心的第 j維特征。
為確定對(duì)數(shù)據(jù)集合適的K的選取,實(shí)驗(yàn)中令K從1(將所有的用戶歸到一個(gè)數(shù)據(jù)簇)到K為43(因?yàn)镵-means一般作為數(shù)據(jù)預(yù)處理,或者用戶輔助分類給數(shù)據(jù)添加標(biāo)簽,同時(shí)在實(shí)驗(yàn)室中發(fā)現(xiàn)隨著K的增加,聚類誤差的變化已經(jīng)接近于0,所以K的設(shè)置一般不會(huì)很大),在每個(gè)K值上重復(fù)運(yùn)行數(shù)次K-means(避免局部最優(yōu)解)并計(jì)算當(dāng)前K取值的誤差平方和[13],如圖2所示。
圖2中,X軸表示聚類數(shù)據(jù)簇K的取值,左側(cè)Y軸的圖例表示聚類結(jié)果的誤差平方和,對(duì)應(yīng)圖中的三角形圖標(biāo)的線條,右側(cè)Y軸的圖例表示誤差平方和的梯度。
從圖2可以看出,當(dāng)K取值為14的時(shí)候,聚類效果的誤差平方和已經(jīng)接近于水平軸,同時(shí)負(fù)荷差值的梯度在0附近波動(dòng),表明即使增加K的取值對(duì)聚類效果的誤差不會(huì)產(chǎn)生太大的影響,故選定14作為用戶分類的數(shù)據(jù)簇的數(shù)目。
基于上述的用戶分群策略,將用戶依據(jù)其用電模式,將其劃分到不同用戶組,接下來需要針對(duì)每一類用戶使用局部加權(quán)線性回歸算法[14],使用歷史負(fù)荷數(shù)據(jù)作為模型特征,預(yù)測(cè)未來某一天每個(gè)小時(shí)的負(fù)荷值,設(shè)計(jì)準(zhǔn)確性評(píng)價(jià)指標(biāo),將其與真實(shí)的負(fù)荷值進(jìn)行比對(duì),驗(yàn)證模型的有效性。
考慮到局部加權(quán)線性回歸算法優(yōu)越的運(yùn)算性能和大量用戶負(fù)荷的規(guī)律性,實(shí)驗(yàn)采用局部加權(quán)線性回歸分析方法。局部加權(quán)線性回歸算法只要求幾個(gè)簡單的特征就能快速地預(yù)測(cè)出曲線的趨勢(shì),實(shí)驗(yàn)中將其與線性SVR算法[15]進(jìn)行比對(duì),實(shí)驗(yàn)結(jié)果表明局部線性回歸算法在實(shí)時(shí)電量負(fù)荷預(yù)測(cè)方面非常有效。
通過上述的聚類,將用戶數(shù)據(jù)聚為14類數(shù)據(jù)簇,每一類均包含大量的計(jì)量點(diǎn)。在負(fù)荷預(yù)測(cè)的數(shù)據(jù)預(yù)處理階段,需將每一個(gè)數(shù)據(jù)簇中的計(jì)量點(diǎn)的負(fù)荷值按照整點(diǎn)時(shí)間疊加,得到該數(shù)據(jù)簇中所有的計(jì)量點(diǎn)的整點(diǎn)時(shí)刻的負(fù)荷總和,并按照時(shí)間排序。
為預(yù)測(cè)未來某一個(gè)時(shí)間點(diǎn)的負(fù)荷,將該時(shí)間點(diǎn)之前連續(xù)幾天的負(fù)荷數(shù)據(jù)作為其特征,數(shù)據(jù)構(gòu)造如下表所示,以8天共192維的數(shù)據(jù)作為特征的維度。
表3 回歸特征選取
預(yù)測(cè)某一天每個(gè)整點(diǎn)時(shí)刻的負(fù)荷值均從當(dāng)天零點(diǎn)時(shí)刻的負(fù)荷著手預(yù)測(cè),并將預(yù)測(cè)出來的負(fù)荷與之前的195維的數(shù)據(jù)組成新的訓(xùn)練樣本,以滑動(dòng)窗口的形式預(yù)測(cè)下一個(gè)時(shí)間點(diǎn)的負(fù)荷,不斷往復(fù),直到預(yù)測(cè)出最后一個(gè)時(shí)間點(diǎn)的負(fù)荷,從而將當(dāng)天所有時(shí)間點(diǎn)的負(fù)荷預(yù)測(cè)出來。
為確保仿真結(jié)果的準(zhǔn)確性,選取12月份最后一周的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù)集進(jìn)行7次交叉驗(yàn)證,每次預(yù)測(cè)一天24個(gè)小時(shí)的負(fù)荷,并以7天的預(yù)測(cè)準(zhǔn)確性的均值作為最后的實(shí)驗(yàn)結(jié)果。
局部加權(quán)線性回歸(Logically Weighted Linear Regression,LWLR)是對(duì)線性回歸的拓展,主要思路是給待預(yù)測(cè)點(diǎn)附近的每一個(gè)點(diǎn)賦予一定的權(quán)重,然后在這個(gè)子集上基于最小均方差來進(jìn)行普通的回歸,其目標(biāo)函數(shù)是加權(quán)的最小二乘:
其中,ω是權(quán)值,其作用在于根據(jù)要預(yù)測(cè)的點(diǎn)與數(shù)據(jù)集中的點(diǎn)的距離來為數(shù)據(jù)集中的點(diǎn)賦權(quán)值,當(dāng)某一點(diǎn)距離待預(yù)測(cè)的點(diǎn)較遠(yuǎn)時(shí),其權(quán)重較小,否則較大。
因?yàn)槊看文P途A(yù)測(cè)一個(gè)時(shí)間點(diǎn)的負(fù)荷值,需要評(píng)價(jià)的是預(yù)測(cè)負(fù)荷與真實(shí)負(fù)荷的差距,故實(shí)驗(yàn)采用如下的數(shù)據(jù)準(zhǔn)確性評(píng)價(jià)指標(biāo):
其中,Testvalue表示真實(shí)負(fù)荷值,Predictvalue表示預(yù)測(cè)負(fù)荷值,通過上述公式計(jì)算預(yù)測(cè)值與真實(shí)值之間的擬合程度。
在上述的數(shù)據(jù)預(yù)處理階段,為預(yù)測(cè)某時(shí)刻的負(fù)荷值,將該時(shí)刻之前的負(fù)荷值作為模型的特征,為確定合適的特征數(shù)目,以1天(24個(gè)數(shù)據(jù)點(diǎn))的數(shù)據(jù)到14天(336個(gè)數(shù)據(jù)點(diǎn))的數(shù)據(jù)作為模型特征,分別計(jì)算線性回歸和線性SVR的準(zhǔn)確性,結(jié)果如圖3所示。
由圖3可以看出,當(dāng)選取的數(shù)據(jù)特征在10天以內(nèi)時(shí),線性回歸的準(zhǔn)確率高于SVR,同時(shí),當(dāng)特征選取為8天(192維)的時(shí)候,兩種方法均達(dá)到最高的準(zhǔn)確性,故選用8天共192維數(shù)據(jù)作為負(fù)荷預(yù)測(cè)的特征數(shù)據(jù)。
以8天共196維的負(fù)荷值作為預(yù)測(cè)模型的特征,以上述的負(fù)荷預(yù)測(cè)模型使用滑動(dòng)窗口方法分別預(yù)測(cè)12月25日~12月31日所有時(shí)間點(diǎn)的負(fù)荷值,并按照時(shí)間點(diǎn)疊加求7天的均值,計(jì)算模型對(duì)每個(gè)時(shí)刻的預(yù)測(cè)準(zhǔn)確性,結(jié)果如圖4所示。
從上圖可以看出,在絕大多數(shù)的時(shí)間點(diǎn)上,線性回歸模型的預(yù)測(cè)準(zhǔn)確性均大于SVR,同時(shí)預(yù)測(cè)值均在97%以上,模型預(yù)測(cè)準(zhǔn)確性較高,具有一定的實(shí)用價(jià)值。
以8天共196維的負(fù)荷值作為預(yù)測(cè)模型的特征,以上述的局部加權(quán)線性回歸預(yù)測(cè)模型預(yù)測(cè)12月30日(周五)當(dāng)天每個(gè)整點(diǎn)時(shí)刻的負(fù)荷值,如下圖所示圖5基于LWLR的12月30日的整點(diǎn)時(shí)刻負(fù)荷預(yù)測(cè)結(jié)果
從圖5可以看出,局部加權(quán)線性回歸算法的預(yù)測(cè)值與原始負(fù)荷值基本匹配,由于使用前一個(gè)預(yù)測(cè)值加入訓(xùn)練數(shù)據(jù)來預(yù)測(cè)下一個(gè)時(shí)間點(diǎn),隨著誤差的累計(jì),后面的時(shí)間點(diǎn)較前面的時(shí)間點(diǎn)有更大的誤差。
采用某供電局的智能電表計(jì)量自動(dòng)化系統(tǒng)采集到的用戶負(fù)荷數(shù)據(jù),基于K-means聚類算法和線性回歸算法構(gòu)建了基于用戶分群研究的智能電表計(jì)量電力負(fù)荷預(yù)測(cè)模型,實(shí)驗(yàn)結(jié)果證明了該混合算法能依據(jù)歷史負(fù)荷信息有效地對(duì)預(yù)測(cè)當(dāng)天每個(gè)時(shí)刻的負(fù)荷進(jìn)行準(zhǔn)確性的預(yù)測(cè),表明在智能電網(wǎng)的負(fù)荷預(yù)測(cè)上,利用智能電表計(jì)量自動(dòng)化的數(shù)據(jù)挖掘理論是一種有效的嘗試。
[1]王保義,趙碩,張少敏.基于云計(jì)算和極限學(xué)習(xí)機(jī)的分布式電力負(fù)荷預(yù)測(cè)算法[J].電網(wǎng)技術(shù),2014,38(02):526-531.
[2]侯海良,孫妙平,蔡斌軍.基于RBF-ARX模型的短期電力負(fù)荷預(yù)測(cè)[J].河海大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,43(03):271-277.
[3]金鑫,李龍威,季佳男,等.基于大數(shù)據(jù)和優(yōu)化神經(jīng)網(wǎng)絡(luò)短期電力負(fù)荷預(yù)測(cè)[J].通信學(xué)報(bào),2016,37(1):36-42.
[4]蘇士美,王明霞,姚猛,等.基于WHAC-E組合預(yù)測(cè)模型的短期電力負(fù)荷預(yù)測(cè)[J].鄭州大學(xué)學(xué)報(bào)(工學(xué)版),2014,35(03):86-89.
[5]肖白,周潮,穆鋼.空間電力負(fù)荷預(yù)測(cè)方法綜述與展望[J].中國電機(jī)工程學(xué)報(bào),2013,33(25):78-92,14.
[6]肖勇,楊勁鋒,馬千里,等.基于模塊化回聲狀態(tài)網(wǎng)絡(luò)的實(shí)時(shí)電力負(fù)荷預(yù)測(cè)[J].電網(wǎng)技術(shù),2015,39(03):804-809.
[7]崔和瑞,彭旭.基于ARIMAX模型的夏季短期電力負(fù)荷預(yù) 測(cè)[J].電 力 系 統(tǒng) 保 護(hù) 與 控 制 ,2015,43(04):108-114.
[8]劉慶.電力營銷系統(tǒng)自動(dòng)化抄表問題探討[J].通訊世界,2014(17):20-21.
[9]Kavousian A,Rajagopal R,F(xiàn)ischer M.Determinants of residential electricity consumption:Using smart meter da?ta to examine the effect of climate,building characteris?tics,appliance stock,and occupants'behavior[J].Ener?gy,2013(55):184-194.
[10]趙莉,候興哲,胡君,等.基于改進(jìn)k-means算法的海量智能用電數(shù)據(jù)分析[J].電網(wǎng)技術(shù),2014,38(10):2715-2720.
[11]曲朝陽,陳帥,楊帆,等.基于云計(jì)算技術(shù)的電力大數(shù)據(jù)預(yù)處理屬性約簡方法[J].電力系統(tǒng)自動(dòng)化,2014,38(08):67-71.
[12]成衛(wèi)青,盧艷紅.一種基于最大最小距離和SSE的自適應(yīng)聚類算法[J].南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,35(02):102-107.
[13]張斌,莊池杰,胡軍,等.結(jié)合降維技術(shù)的電力負(fù)荷曲線集成聚類算法[J].中國電機(jī)工程學(xué)報(bào),2015,35(15):3741-3749.
[14]張素香,趙丙鎮(zhèn),王風(fēng)雨,等.海量數(shù)據(jù)下的電力負(fù)荷短期預(yù)測(cè)[J].中國電機(jī)工程學(xué)報(bào),2015,35(01):37-42.
[15]Hong W C,Dong Y,Zhang W Y,et al.Cyclic electric load forecasting by seasonal SVR with chaotic genetic al?gorithm[J].International Journal of Electrical Power&Energy Systems,2013,44(1):604-614.