国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聚類(lèi)分析的短期負(fù)荷智能預(yù)測(cè)方法研究

2014-08-08 14:14陳宏義李存斌施立剛
關(guān)鍵詞:負(fù)荷預(yù)測(cè)支持向量機(jī)聚類(lèi)

陳宏義+李存斌+施立剛

文章編號(hào):16742974(2014)05009405

收稿日期:20131222

基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(71271084);國(guó)家電網(wǎng)公司2014年總部科技項(xiàng)目65

作者簡(jiǎn)介:陳宏義(1966-),男,湖南漢壽人,中國(guó)能源建設(shè)集團(tuán)有限公司高級(jí)政工師,華北電力大學(xué)博士研究生

通訊聯(lián)系人,Email:shlg87@163.com

(1.華北電力大學(xué) 經(jīng)濟(jì)與管理學(xué)院,北京 102206;2.中國(guó)能源建設(shè)集團(tuán)有限公司,北京 100029)

摘 要:短期電力負(fù)荷預(yù)測(cè)作為電網(wǎng)企業(yè)的基本工作,其精度的提高對(duì)于電網(wǎng)企業(yè)運(yùn)營(yíng)管理和調(diào)度管理具有較大的意義,然而由于電力負(fù)荷受到諸多非線性因素的影響,因此得到高精度的電力負(fù)荷預(yù)測(cè)結(jié)果是比較困難的.本文首先利用數(shù)據(jù)挖掘中的kmeans聚類(lèi)技術(shù)對(duì)訓(xùn)練集的氣象數(shù)據(jù)進(jìn)行聚類(lèi)分析,分析提取相似日,在提取相似日的相關(guān)歷史數(shù)據(jù)后,建立支持向量機(jī)模型進(jìn)行短期電力負(fù)荷預(yù)測(cè).經(jīng)算例結(jié)果證明,由該方法得出的預(yù)測(cè)結(jié)果平均相對(duì)誤差為0.88%,和同結(jié)構(gòu)支持向量機(jī)預(yù)測(cè)的平均相對(duì)誤差(1.66%)以及ARMA預(yù)測(cè)的平均相對(duì)誤差(3.81%)相比,預(yù)測(cè)精度得到明顯的提高,證明了該方法的有效性.

關(guān)鍵詞:數(shù)據(jù)挖掘;負(fù)荷預(yù)測(cè);聚類(lèi);支持向量機(jī);kmeans

中圖分類(lèi)號(hào):TM715 文獻(xiàn)標(biāo)識(shí)碼:A

A New Forecasting Approach for Shortterm Load 

Intelligence Based on Cluster Method



CHEN Hongyi1,2, LI Cunbin1, SHI Ligang1

(1.School of Economics and Management, North China Electric Power Univ, Beijing 102206, China;

2.China Energy Engineering Group Co Ltd, Beijing 100029,China)

Abstract:Load forecasting is one of the basic issues of the electric power industry. However, because load has a certain social attributes, the improvement of the accuracy of load forecasting result is a difficult issue. This paper first used kmeans cluster method to find similar data from historical date and weather data, and then used support vector machine (SVM) for forecasting. Seen from the result, the proposed method's MAPE is 0.88%, but BPANN and ARMA are 1.66% and 3.81% respectively. It is proved that this method has a high accuracy.

Key words: data mining; load forecasting; clustering; support vector machine(SVM);kmeans



隨著電力工業(yè)市場(chǎng)化的進(jìn)展,短期電力負(fù)荷預(yù)測(cè)精度的提高對(duì)電網(wǎng)企業(yè)的電力調(diào)度安排,電網(wǎng)調(diào)度自動(dòng)控制,電網(wǎng)企業(yè)的營(yíng)銷(xiāo)行為具有十分重要的意義[1].20世紀(jì)80年代,國(guó)外學(xué)者Bunn和Farmer在研究負(fù)荷預(yù)測(cè)精度對(duì)電網(wǎng)企業(yè)的經(jīng)濟(jì)效益影響時(shí)就已經(jīng)指出,負(fù)荷誤差每增加1%將會(huì)增加10 000 000英鎊的電力經(jīng)營(yíng)成本[2],因此,負(fù)荷預(yù)測(cè)精度的提高對(duì)電網(wǎng)企業(yè)而言將會(huì)產(chǎn)生較大的社會(huì)經(jīng)濟(jì)效益.

很多研究負(fù)荷預(yù)測(cè)的學(xué)者已經(jīng)對(duì)電力負(fù)荷預(yù)測(cè)的建模問(wèn)題開(kāi)展深入研究,其方法包括回歸擬合預(yù)測(cè)模型、灰色預(yù)測(cè)方法、時(shí)間序列分析以及幾種方法組合在一起的組合預(yù)測(cè)方法等.近二十年來(lái),隨著人工智能領(lǐng)域的發(fā)展,越來(lái)越多的研究人員將神經(jīng)網(wǎng)絡(luò)為代表的人工智能預(yù)測(cè)方法應(yīng)用到負(fù)荷預(yù)測(cè)中,取得了一定的成果.其中人工神經(jīng)網(wǎng)絡(luò)由于具有無(wú)需先驗(yàn)經(jīng)驗(yàn)便可以按照任意精度進(jìn)行非線性擬合的優(yōu)點(diǎn),受到了眾多學(xué)者的青睞,成為近些年來(lái)主要的研究方法之一.國(guó)內(nèi)外學(xué)者對(duì)應(yīng)用神經(jīng)網(wǎng)絡(luò)進(jìn)行電力負(fù)荷預(yù)測(cè)的文獻(xiàn)進(jìn)行了綜述,并指出,和非智能的預(yù)測(cè)方法相比,神經(jīng)網(wǎng)絡(luò)得到的負(fù)荷預(yù)測(cè)結(jié)果精度更高[3-6].但是也有學(xué)者指出利用神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)的缺點(diǎn)是可能收斂于局部最優(yōu)解,并且在訓(xùn)練時(shí)需要大量的樣本[7].

支持向量機(jī)預(yù)測(cè)方法的出現(xiàn)極大地改善了神經(jīng)網(wǎng)絡(luò)的上述缺陷,具有要求確定的參數(shù)少、在理論上有全局最優(yōu)唯一解的特點(diǎn),在小樣本的條件下被認(rèn)為是可以替代神經(jīng)網(wǎng)絡(luò)的智能預(yù)測(cè)方法[8].很多學(xué)者針對(duì)支持向量機(jī)在不同領(lǐng)域內(nèi)的運(yùn)用展開(kāi)研究,均取得了不俗的效果,證明了支持向量機(jī)的實(shí)用性[9-11].但是由于短期的負(fù)荷預(yù)測(cè)受到大量復(fù)雜影響因素的多重非線性干擾,如氣象、電力的實(shí)時(shí)需求、經(jīng)濟(jì)影響、電力系統(tǒng)的影響、電力市場(chǎng)各參與方、政治活動(dòng)等.因此,無(wú)論模型如何先進(jìn),如果不盡可能地考慮這些因素的影響,很難進(jìn)一步提高負(fù)荷預(yù)測(cè)的精度.

近幾年,很多學(xué)者意識(shí)到利用數(shù)據(jù)挖掘技術(shù)首先對(duì)數(shù)據(jù)進(jìn)行處理,再利用模式識(shí)別技術(shù)提取出相應(yīng)的負(fù)荷預(yù)測(cè)影響相關(guān)的知識(shí),能夠進(jìn)一步提高預(yù)測(cè)的精度.在提取出的相關(guān)知識(shí)里,尤其是氣象相關(guān)的知識(shí),如分類(lèi)[12]、尋找相似日特征[13]等對(duì)提高負(fù)荷預(yù)測(cè)的精度作用最大.這表明將數(shù)據(jù)挖掘技術(shù)引入到電力負(fù)荷預(yù)測(cè)中不但是可行的,而且可以提高預(yù)測(cè)的精度.受此思路啟發(fā),本文首先利用待預(yù)測(cè)日的氣象因素,采用數(shù)據(jù)挖掘中的kmeans聚類(lèi)算法進(jìn)行聚類(lèi),得到相似日的結(jié)果,然后提取相似日的相關(guān)歷史負(fù)荷數(shù)據(jù),并利用支持向量機(jī)模型對(duì)負(fù)荷進(jìn)行預(yù)測(cè).由于該預(yù)測(cè)方法在建模前,首先通過(guò)聚類(lèi)方法找出和待預(yù)測(cè)日相似的負(fù)荷數(shù)據(jù)樣本進(jìn)行短期負(fù)荷預(yù)測(cè),因此和傳統(tǒng)預(yù)測(cè)方法利用近期樣本進(jìn)行預(yù)測(cè)相比,能夠有效地進(jìn)一步提高負(fù)荷預(yù)測(cè)的精度.

1 利用kmeans聚類(lèi)方法選取相似日數(shù)據(jù)

聚類(lèi)分析是對(duì)樣本或指標(biāo)按照各自的特性進(jìn)行分類(lèi)的一種多元統(tǒng)計(jì)分析方法,一般基于距離的標(biāo)準(zhǔn)對(duì)樣本數(shù)據(jù)分成不同的類(lèi)或者簇.和分類(lèi)相比,聚類(lèi)不需要先驗(yàn)知識(shí),即,可以在無(wú)監(jiān)督、無(wú)指導(dǎo)的條件下進(jìn)行機(jī)器學(xué)習(xí).聚類(lèi)目前應(yīng)用于很多領(lǐng)域中,包括數(shù)學(xué)、計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、生物學(xué)和經(jīng)濟(jì)學(xué)等.聚類(lèi)算法主要以統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)、智能計(jì)算等方法為基礎(chǔ),其中較著名的聚類(lèi)方法是kmeans劃分算法,也是最具有代表性的聚類(lèi)方法之一.該算法只需要一個(gè)參數(shù),即聚類(lèi)個(gè)數(shù)k,然后將樣本n分為k個(gè)簇,分類(lèi)原則是具有較高相似度的盡量劃分為一個(gè)簇,而不同簇之間的相似度則盡可能的小.kmeans 算法過(guò)程如下[14]:

1)從n個(gè)樣本中任選k個(gè)對(duì)象作為簇中心;

2)計(jì)算中心外樣本和中心之間的相似度(一般采用距離函數(shù));

3)按照相似度進(jìn)行分配,具有較高相似度的樣本聚類(lèi)為一簇;

4)計(jì)算聚類(lèi)后所得簇的新的簇中心,并不斷重復(fù),直到標(biāo)準(zhǔn)測(cè)度函數(shù)開(kāi)始收斂為止.

kmeans聚類(lèi)的標(biāo)準(zhǔn)測(cè)度函數(shù)一般采用如式(1)所示的均方差予以計(jì)算:

E=∑ki=1∑p∈Cip-mi2(1)

其中E是所有樣本的平方誤差的總和;p是聚類(lèi)空間中的樣本點(diǎn);mi是簇Ci的平均值.

由于短期電力負(fù)荷預(yù)測(cè)受到較多因素的影響,因此能否針對(duì)待預(yù)測(cè)日,利用和待預(yù)測(cè)日相近日的數(shù)據(jù)進(jìn)行預(yù)測(cè)是進(jìn)一步提高短期電力負(fù)荷預(yù)測(cè)精度的一個(gè)關(guān)鍵步驟.這是因?yàn)槔脭?shù)據(jù)挖掘在預(yù)測(cè)前先選取相似日可以將具有高度相似特征的類(lèi)似負(fù)荷點(diǎn)尋找出來(lái),尤其在利用智能算法對(duì)負(fù)荷進(jìn)行預(yù)測(cè)時(shí),可以避免由于具有不同特征的預(yù)測(cè)點(diǎn)對(duì)智能預(yù)測(cè)方法訓(xùn)練時(shí)產(chǎn)生的收斂慢的問(wèn)題.利用kmeans聚類(lèi)方法提取相似日電力負(fù)荷數(shù)據(jù),結(jié)合智能預(yù)測(cè)模型進(jìn)行預(yù)測(cè)的流程如下:

1)針對(duì)待預(yù)測(cè)日/時(shí)點(diǎn),收集相關(guān)預(yù)測(cè)影響因素的數(shù)據(jù),如天氣,日期類(lèi)型等,組成一條數(shù)據(jù)記錄;

2)對(duì)上述數(shù)據(jù)記錄,針對(duì)歷史負(fù)荷數(shù)據(jù)中的數(shù)據(jù),設(shè)定聚類(lèi)個(gè)數(shù)k,利用kmeans算法進(jìn)行聚類(lèi)尋找;

3)根據(jù)聚類(lèi)結(jié)果,記錄日期標(biāo)識(shí),按照預(yù)測(cè)的“近大遠(yuǎn)小”原則,選擇距離待預(yù)測(cè)日最近日期的相關(guān)歷史負(fù)荷數(shù)據(jù),確定出待預(yù)測(cè)日的輸入因素,建立智能預(yù)測(cè)模型進(jìn)行預(yù)測(cè).

2 支持向量機(jī)預(yù)測(cè)模型

本文的智能預(yù)測(cè)模型選取的是支持向量機(jī) (support vector machine,SVM),該模型是Vapnik于20世紀(jì)90年代中期提出的一種新的智能學(xué)習(xí)方法,起先用于非線性的模式識(shí)別問(wèn)題,隨著應(yīng)用領(lǐng)域的不斷擴(kuò)展和對(duì)支持向量機(jī)研究的深入,支持向量機(jī)逐漸應(yīng)用于非線性的擬合中,表現(xiàn)出了良好的性能,并且由于支持向量機(jī)利用結(jié)構(gòu)風(fēng)險(xiǎn)最小化代替了神經(jīng)網(wǎng)絡(luò)的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練,因此具有較好的泛化能力,在理論上能夠搜索到全局最優(yōu)解,能夠克服神經(jīng)網(wǎng)絡(luò)易陷入局部最小值的缺點(diǎn).由于支持向量機(jī)在小樣本的條件下學(xué)習(xí)速度快,因此可以認(rèn)為支持向量機(jī)方法是可以在小樣本條件下取代神經(jīng)網(wǎng)絡(luò)方法的較好的選擇.

支持向量機(jī)進(jìn)行非線性擬合預(yù)測(cè)方法的原理如下[1].

假設(shè)有訓(xùn)練樣本集G={(xi,di)},i=1,…,N,xi∈Rn,di∈R1.支持向量機(jī)回歸的基本原理是通過(guò)映射將數(shù)據(jù)映射到一個(gè)高維特征空間中,并在該空間中尋找一個(gè)輸入空間到輸出空間的非線性映射

Symbol`@@

ψ(x),其回歸函數(shù)如下:

y = f(x)=wψ(x)+b (2)

其函數(shù)逼近問(wèn)題等價(jià)于如下函數(shù)最?。邯?/p>

R(C)=(C/N)∑Ni=1Lε(di,yi)+‖w‖2/2 (3)

Lε(d,y)=0 d-y≤εd-y-εotherwise (4)

其中‖w‖2/2表示平滑程度,Lε(d,y)為ε敏感損失函數(shù).

通過(guò)引入兩個(gè)松弛變量ζ,ζ*,上述函數(shù)可以變成如下形式:

R(w,ζ,ζ*)=‖w‖2/2+C∑Ni=1(ζi+ζ*i)s.t.wψ(xi)+bi-di≤ε+ζ*i,i=1,2,…,Ndi-wψ(xi)-bi≤ε+ζi,i=1,2,…,Nζi,ζ*i≥0,i=1,2,…,N (5)

利用拉格朗日型和KarushKuhnTucker條

件,解其對(duì)偶問(wèn)題,可以得到支持向量機(jī)回歸函數(shù):

f(x,β,β*)=∑Ni=1(βi-β*i)K(x,xi)+b (6)

式中K(x,xi)稱(chēng)為核函數(shù),需要滿足Mercer條件,一般選取最常用的高斯核函數(shù)K(x,

Symbol`@@

xi)

Symbol`@@

Symbol}@@

exp(

Symbolm@@

‖

Symbol`@@

x

Symbol`@@

Symbolm@@

Symbol`@@

xi

Symbol`@@

‖2/2

SymbolsA@



Symbol`@@

2).

3 實(shí)證分析

本文以我國(guó)南方電網(wǎng)某地市級(jí)電力局的日整點(diǎn)負(fù)荷數(shù)據(jù)為例進(jìn)行實(shí)證分析.利用聚類(lèi)分析的因素?cái)?shù)據(jù)有日期類(lèi)型數(shù)據(jù)、氣象數(shù)據(jù)(包括氣壓相關(guān)數(shù)據(jù)、氣溫相關(guān)數(shù)據(jù)、濕度相關(guān)數(shù)據(jù)、降水量、人體舒適程度等)共12項(xiàng)屬性相關(guān)數(shù)據(jù),共組織形成54條記錄形式,將最后1條數(shù)據(jù)作為測(cè)試記錄使用.其具體數(shù)值如表1所示.

接下來(lái)對(duì)這些記錄進(jìn)行預(yù)處理,對(duì)于標(biāo)識(shí)型的數(shù)據(jù),利用數(shù)值予以替代.以星期為例,分別用0,1,…,6代替星期日,星期一,…,星期六,對(duì)于原本是數(shù)據(jù)類(lèi)型的屬性值,利用等距離方法將其離散化,從而得到初始分析記錄集.

對(duì)于支持向量機(jī)模型的訓(xùn)練,按照相關(guān)文獻(xiàn),將輸入層節(jié)點(diǎn)選取L(t-24i),L(t-j),其中i=1,2,3;j=1,2,即,使用待預(yù)測(cè)時(shí)點(diǎn)的前三個(gè)時(shí)點(diǎn)和同一聚類(lèi)中的日期待預(yù)測(cè)時(shí)間最近兩天的同一時(shí)點(diǎn)的數(shù)據(jù)作為輸入變量.此外,為方便對(duì)比分析,選取同結(jié)構(gòu)的支持向量機(jī),即,使用待預(yù)測(cè)時(shí)點(diǎn)的前三個(gè)時(shí)點(diǎn)和前兩天的同一時(shí)點(diǎn)數(shù)據(jù)作為輸入變量,同時(shí),利用自回歸滑動(dòng)平均模型ARMA(1,1)對(duì)上述數(shù)據(jù)分別進(jìn)行預(yù)測(cè).實(shí)驗(yàn)計(jì)算環(huán)境選擇matlab2011a,libsvm2.8.8軟件包,誤差對(duì)比分析采用平均相對(duì)誤差eMAPE,計(jì)算結(jié)果如表2所示.

eMAPE=1n∑ni=1A(i)-F(i)A(i)×100% (7)

從圖1和表2中可以明顯發(fā)現(xiàn),本文提出的方法具有較高的精度值,并且在大多數(shù)預(yù)測(cè)點(diǎn)上均表現(xiàn)良好,平均誤差值達(dá)到了0.88%,而同結(jié)構(gòu)未進(jìn)行聚類(lèi)尋找相似數(shù)據(jù)的支持向量機(jī)預(yù)測(cè)的平均誤差為1.66%,根據(jù)ARMA(1,1)得到的預(yù)測(cè)平均誤差為3.81%.從誤差對(duì)比中可以直觀地看出,本文的方法具有更高的擬合精度.

表1 處理后的待聚類(lèi)數(shù)據(jù)集

Tab.1 Clusters data set to be processed

最低

溫度

/℃

最高

溫度

/℃

7:00

溫度

/℃

16:00

溫度

/℃

最大

濕度

/(%rh)

最小

濕度

/(%rh)

人體舒

適程度

5

8

1

26

33

26.5

32.6

0.85

0.5

8

5

9

2

26

34

26.3

32.4

0.85

0.5

9

5

10

3

27

34

28.2

32.2

0.85

0.5

9

5

11

4

25

34

25.6

33.1

0.85

猜你喜歡
負(fù)荷預(yù)測(cè)支持向量機(jī)聚類(lèi)
基于模糊聚類(lèi)和支持向量回歸的成績(jī)預(yù)測(cè)
基于流形學(xué)習(xí)的自適應(yīng)反饋聚類(lèi)中心確定方法
基于密度的自適應(yīng)搜索增量聚類(lèi)法
基于高階BP神經(jīng)網(wǎng)絡(luò)的日最大負(fù)荷預(yù)測(cè)
電力系統(tǒng)短期負(fù)荷研究綜述
動(dòng)態(tài)場(chǎng)景中的視覺(jué)目標(biāo)識(shí)別方法分析
論提高裝備故障預(yù)測(cè)準(zhǔn)確度的方法途徑
電力系統(tǒng)負(fù)荷的一元線性模型預(yù)測(cè)方法
基于熵技術(shù)的公共事業(yè)費(fèi)最優(yōu)組合預(yù)測(cè)
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
灵川县| 高邮市| 鹿邑县| 恩平市| 郎溪县| 威宁| 江北区| 莱芜市| 周至县| 大洼县| 东乌| 海安县| 泾川县| 当涂县| 湖南省| 兰州市| 东海县| 津南区| 昭通市| 伽师县| 太原市| 沽源县| 弥渡县| 天等县| 宣城市| 广宗县| 金阳县| 英山县| 庄河市| 临高县| 克什克腾旗| 晋州市| 遂平县| 边坝县| 镇平县| 尖扎县| 左权县| 根河市| 诏安县| 东乌珠穆沁旗| 西乌珠穆沁旗|