賈犇 鐘建偉 戴小劍 田波 龍玉雪 解國倫
摘要:精確的負(fù)荷預(yù)測對提高電力系統(tǒng)運(yùn)行的可靠性和經(jīng)濟(jì)型起著重要作用。針對當(dāng)存在大量數(shù)據(jù)樣本時,支持向量機(jī)在進(jìn)行訓(xùn)練時收斂時間太長的問題,本文首先利用K-means聚類算法按照影響負(fù)荷的因素挑選相似日,然后用利用支持向量機(jī)對聚類后的數(shù)據(jù)進(jìn)行負(fù)荷預(yù)測,并將預(yù)測結(jié)果與神經(jīng)網(wǎng)絡(luò)算法預(yù)測的結(jié)果進(jìn)行對比。結(jié)果表明,基于K-means聚類與支持向量機(jī)相結(jié)合的負(fù)荷預(yù)測方法可以提高收斂速度和荷預(yù)測的精確度。
關(guān)鍵詞:K-means聚類分析;支持向量機(jī);負(fù)荷預(yù)測
中圖分類號:TM761 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2019)08-0072-03
0 引言
負(fù)荷預(yù)測是電力企業(yè)的重要部分之一[1-2]。精確的負(fù)荷預(yù)測可以提高電力系統(tǒng)可靠性與經(jīng)濟(jì)性[3-4]。如果負(fù)荷預(yù)測的值比真實值大太多,會增加電網(wǎng)的投資,加大運(yùn)行成本,浪費(fèi)資金[5-7];如果負(fù)荷預(yù)測的值比真實值小太多,會導(dǎo)致電網(wǎng)建設(shè)時設(shè)備不全,不能達(dá)到供電量的要求,使得電網(wǎng)的發(fā)展滯后[8-9]。本文首先利用K-means聚類算法按照影響負(fù)荷的因素挑選相似日,然后用利用支持向量機(jī)對聚類后的數(shù)據(jù)進(jìn)行負(fù)荷預(yù)測,最后以實例證明該方法的可行性。
1 K-means聚類
K-means算法是以距離為相似度進(jìn)行分類[10],其具體算法步驟如下:
(1)初始化:隨機(jī)選擇K個初始聚類中心Z=(Z1,Z2,…,Zk)。
(2)類劃分:如果樣本s與的距離小于s與其它聚類中心的距離,那么s歸為類。
Lij=? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)
(3)計算新的聚類中心點(diǎn):
Zi=∑s∈Zi? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)
(4)收斂判斷:
E=∑s∈R(s-Zi)2? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(3)
式中,s為樣本,Zi為i類的聚類中心。若E滿足條件則聚類結(jié)束,否則重復(fù)步驟(2)、(3),直到滿足條件為止。
2 支持向量機(jī)
給定的數(shù)據(jù)樣本集合為{(xi,yi),…,(xl,yl)}。其中xi∈Rn,yi ∈Rn,i=1,2,3,…,l。yi取任意實數(shù)[11]。SVM回歸的基本思想就是尋找Rn上的一個函數(shù)f(x),以便y=f(x)用來推斷出任意輸入一個x所對應(yīng)的y值[12]。即:
f(x)≤ω,(x)≥b? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (4)
式(4)中,(x)是從x到y(tǒng)的非線性映射,ω為權(quán)重矢量,b表示偏差。
ε不敏感損失函數(shù)定義為:
Lε(yi,f(x))=|y-f(x)|ε=max(0,|y-f(x)|-ε)? ? ? ? ? ? ?(5)
對式(4)最優(yōu)化:
RSVM(c)=ω+Lε(yi,f(x))? ? ? ? ? ? ? ? ? ? ? (6)
式(2.11)中,ω表示回歸函數(shù)對復(fù)雜性的表示能力,能使函數(shù)更加平坦;Lε(yi,f(x))表示訓(xùn)練誤差,可以減小誤差。C表示權(quán)重系數(shù)。為了更好的得到參數(shù)ω和b,引入兩個松弛變量ξi和ξi*,一個表示在目標(biāo)值之上超出ε所設(shè),另一個表示在目標(biāo)值之下超出ε所設(shè)。則式(6)可化為式(7):
RSVM(c)=ω+(ξi+ξi*)? ? ? ? ? ? ? ? ? ? ? ?(7)
其約束條件為:
(8)
引入拉格朗日函數(shù):
L(RSVM)=ω+(ξi+ξi*)-αi[ξi+ε-yi+f(x)] -αi*[ξi+ε+yi-f(x)]-(ξiγi-ξi*γi*)? ? ? ? ? ? ? (9)
其中αi,αi*≥0;γi,γi*≥0為拉格朗日系數(shù)。函數(shù)L對應(yīng)的ω、b、ξi、ξi*最小化,對αi、αi*、γi、γi*最大化。函數(shù)L的極值應(yīng)滿足以下條件:
(10)
引入核函數(shù)K(xi,yi),將式(10)代入式(9)中可以得到:
W(α,α*)=-(αi-αi*)(αj-αj*)K(xi·xj)+(αi-αi*)yi-(αi+αi*)ε? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (11)
JIA Ben1,ZHONG Jian-wei1,DAI Xiao-jian2, TIAN Bo2,LONG Yu-xue2,XIE Guo-lun3
(1.Hubei University for Nationalities, School of Information Engineering, Enshi Hubei? 445000;
2.State Grid Hubei Electric Power Co., Ltd. Enshi Power Supply Company, Enshi Hubei? 445000;
3.Hubei Yingfu Power Co., Ltd., Enshi Hubei? 445000)
Abstract:Accurate load forecasting plays an important role in improving the reliability and economy of power system operation. Aiming at the problem that the support vector machine has too long convergence time when training, there is a problem that the K-means clustering algorithm selects the similar day according to the factors affecting the load, and then uses the support vector machine to cluster the cluster. The data is used for load forecasting and the predicted results are compared with those predicted by neural network algorithms. The results show that the load forecasting method based on K-means clustering and support vector machine can improve the convergence speed and the accuracy of the load prediction.
Key words:K-means clustering analysis; support vector machine; load forecasting