郭宇杰,袁曉玲,李昌明,劉皓明
(1.河海大學(xué) 能源與電氣學(xué)院,南京 211100;2.中利騰暉光伏科技有限公司,江蘇 常熟 215500)
◆研究與探討◆
利用最佳相似日的光伏電站短期出力預(yù)測(cè)
郭宇杰1,袁曉玲1,李昌明2,劉皓明1
(1.河海大學(xué) 能源與電氣學(xué)院,南京211100;2.中利騰暉光伏科技有限公司,江蘇 常熟215500)
光伏發(fā)電系統(tǒng)的輸出功率易受輻照、溫度等環(huán)境因素影響,其輸出功率具有較大的波動(dòng)性和隨機(jī)性,并網(wǎng)時(shí)對(duì)電網(wǎng)的調(diào)度、保護(hù)等方面將產(chǎn)生較大影響,因此光伏發(fā)電出力預(yù)測(cè)研究逐漸發(fā)展,尤其是在短期、超短期出力高精度預(yù)測(cè)方面的研究[1]。光伏電站的出力預(yù)測(cè)方法主要可歸納為2類:直接預(yù)測(cè)法和間接預(yù)測(cè)法。直接預(yù)測(cè)法是直接對(duì)光伏發(fā)電系統(tǒng)的輸出功率進(jìn)行預(yù)測(cè);間接預(yù)測(cè)法首先對(duì)地表太陽(yáng)輻照強(qiáng)度進(jìn)行預(yù)測(cè),然后根據(jù)光伏發(fā)電系統(tǒng)的出力模型得到系統(tǒng)的輸出功率[2]。直接預(yù)測(cè)法較間接預(yù)測(cè)法相對(duì)簡(jiǎn)單,因此研究更為廣泛。而在采用直接預(yù)測(cè)法之前,先對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理,選出與預(yù)測(cè)日最為接近的歷史日作為其相似日。文獻(xiàn)[3]運(yùn)用歐氏距離公式比較預(yù)測(cè)日與各歷史日的氣象因素的差異度,選取差異度較小的歷史日作為預(yù)測(cè)日的相似日。文獻(xiàn)[4]利用灰色關(guān)聯(lián)系數(shù)法,綜合各個(gè)氣象因素的關(guān)聯(lián)系數(shù),得到預(yù)測(cè)日與各歷史日的關(guān)聯(lián)度,選取相似度最大的歷史日作為預(yù)測(cè)日的相似日。歐氏距離法反映的是各樣本空間距離的遠(yuǎn)近,關(guān)聯(lián)度反映的是樣本間的線性關(guān)系,即曲線形狀的相似性。而實(shí)際情況中,若只考慮其中一種關(guān)系,對(duì)預(yù)測(cè)日選擇相似日容易造成較大誤差,進(jìn)而影響光伏發(fā)電功率的預(yù)測(cè)精度。
本文利用加權(quán)歐氏距離法和相關(guān)系數(shù)法分別得到歷史樣本的出力水平相似日集和曲線形狀相似日集,判別預(yù)測(cè)日分別所屬相似日集,取二者交集得最佳相似日。選取預(yù)測(cè)日的最佳相似日作為預(yù)測(cè)模型輸入樣本,采用神經(jīng)網(wǎng)絡(luò)算法實(shí)現(xiàn)光伏電站短期出力預(yù)測(cè)。
所謂相似日是指和預(yù)測(cè)日的天氣情況最接近的歷史樣本,本文采用2種不同的聚類函數(shù):加權(quán)歐氏距離法和相關(guān)系數(shù)法對(duì)光伏電站歷史樣本進(jìn)行分類,考慮各歷史樣本間出力的距離關(guān)系和曲線形狀關(guān)系,對(duì)樣本進(jìn)行合理分類,取2種聚類集合的交
1.1出力水平相似日集
出力水平相似日集是指光伏出力曲線距離相距較小的集合,若采用傳統(tǒng)歐氏距離法作為聚類函數(shù),樣本中各對(duì)象對(duì)樣本的影響程度的差異會(huì)被忽略?;诖朔矫娴目紤],本文采用加權(quán)歐氏距離以提高聚類精度。
在對(duì)歷史樣本進(jìn)行出力水平相似日聚類時(shí),各樣本對(duì)象為經(jīng)過量化的每日天氣類型、最高溫度和最低溫度的環(huán)境因素?cái)?shù)據(jù),給定環(huán)境樣本集合X={X1,…,Xn,…,XN},其中Xn=[Xn1,…,Xnm,…XnM],N為樣本數(shù)量,M為各樣本的對(duì)象數(shù),這里M=3。給定光伏電站出力P={P1,…,PN},則自變量Xm對(duì)因變量P的偏相關(guān)因數(shù)rXm→P如式(1)所示[5]式中:-Pn為歷史樣本平均值;-PCk為歷史樣本聚類中心平均值。
式中:bm為偏回歸系數(shù);-Xm和-P分別為環(huán)境因素和光伏電站出力樣本的平均值。
根據(jù)各自變量的偏相關(guān)因數(shù)可得各自變量對(duì)因變量的影響權(quán)重ωm,如式(2)所示
給定聚類中心集合XC={XC1,…,XCk,…,XCK},其中XCk=[XCk1,…,XCkm,…,XCkM],K為聚類中心數(shù)量。引入權(quán)值ω=[ω1,…,ωm,…,ωM],則聚類中心XCk與各樣本Xn間的距離可表示為
1.2曲線形狀相似日集
樣本曲線形狀相似是指光伏出力曲線變化趨勢(shì)相近,采用相關(guān)系數(shù)法對(duì)歷史樣本進(jìn)行聚類[6]。設(shè)某歷史樣本出力為Pn=[Pn1,…,Pnl,…,PnL],歷史樣本聚類中心為PCk=[PCk1,…,PCkl,…,PCkL],l=1,2,…,L,本文中L是指每天光伏電站出力采集點(diǎn)總數(shù),則歷史樣本與聚類中心的相關(guān)系數(shù)如式(4)所示集為最佳相似日。
1.3最佳相似日的確定
當(dāng)出力水平相似日集與曲線形狀相似日集確定分類數(shù)后,對(duì)2個(gè)集合中各子集求取對(duì)應(yīng)環(huán)境因素聚類中心,根據(jù)式(3)求出預(yù)測(cè)日與2個(gè)集合中各子集環(huán)境因素聚類中心的距離矩陣分別為D1和D2,按距離最小原則分別確定其所屬兩大集合中的2個(gè)子集,二者的交集所對(duì)應(yīng)的歷史樣本作為預(yù)測(cè)日的最佳相似日。
K?means聚類算法是一種基于劃分的經(jīng)典聚類方法,其核心思想是把數(shù)據(jù)劃分為相似度最高的K類,而其主要存的問題如下:①隨機(jī)選取初始聚類中心易導(dǎo)致選中噪聲數(shù)據(jù)或孤立點(diǎn),使得算法迭代次數(shù)增多,算法運(yùn)行時(shí)間增長(zhǎng),同時(shí)也會(huì)使算法陷入局部極值;②算法自身無(wú)法判定最優(yōu)聚類數(shù)[7]。針對(duì)這2個(gè)問題,本文通過密度指標(biāo)選取K?means聚類算法的初始聚類中心,最終確定最大初始聚類數(shù)K0;通過WCBCR值確定出力水平相似日與曲線形狀形似日的最優(yōu)聚類數(shù)K*[10]。
2.1初始聚類中心的選取
為改善K?means聚類算法效果,本文基于密度指標(biāo)確定K?means聚類算法的初始聚類中心。定義數(shù)據(jù)X密度指標(biāo)T1,如式(5)所示[8]
式中:“‖‖·”表示向量的模;ha為一正數(shù),其取值如式(6)所示
根據(jù)最大值原則,將密度指標(biāo){Tn
1}(n=1,2,…,N)中最大的數(shù)據(jù)對(duì)應(yīng)的樣本記為Xn1,并將其作為第1個(gè)初始聚類中心,記作XC1,對(duì)應(yīng)的密度指標(biāo)記為TC1。
第k-1個(gè)聚類中心確定后,運(yùn)用式(7)對(duì)余下N-k+1個(gè)樣本數(shù)據(jù)(已去除Xn1,…,Xn,k-1)再進(jìn)行密度指標(biāo)計(jì)算
式中:為避免距離過近的聚類中心出現(xiàn),取h=1.5h[8]。
同樣根據(jù)最大值原則,從余下的N-k+1個(gè)樣本數(shù)據(jù)中選取第k個(gè)聚類中心XCk,對(duì)應(yīng)的密度指標(biāo)記為TCk。
通過上述?公式計(jì)算密?度指標(biāo)選取對(duì)應(yīng)聚類中心,直到滿足≥δ且<δ時(shí)結(jié)束。研究表明,δ≥0.5時(shí),可得到合理分類數(shù)[9]。通過以上計(jì)算可以得到最大初始聚類數(shù)為K0,此時(shí)對(duì)應(yīng)出力水平相似日和曲線形狀相似日的1×K0維密度指標(biāo)向量分別記為TC1和TC2。
2.2最優(yōu)聚類數(shù)的確定
本文選取預(yù)測(cè)日的最佳相似日時(shí),選用K?means聚類算法作為基礎(chǔ),取式(3)和式(4)作為聚類函數(shù),采用WCBCR聚類指標(biāo)作為評(píng)價(jià)函數(shù)確定最優(yōu)聚類數(shù)。WCBCR值定義為組內(nèi)距離平方和與組間距離平方和的比值式中:Ωk為第k類數(shù)據(jù)集。
WCBCR聚類指標(biāo)值越小,說明聚類效果越好[10],但過小的聚類指標(biāo)值可能會(huì)導(dǎo)致聚類集合為空集的情況,因此,最優(yōu)聚類數(shù)K*對(duì)應(yīng)著不存在空集下的最小WCBCR指標(biāo)。
3.1實(shí)驗(yàn)數(shù)據(jù)與計(jì)算
為驗(yàn)證本文的預(yù)測(cè)方法,收集某光伏電站2014年1月到12月的發(fā)電數(shù)據(jù)和當(dāng)?shù)貧庀笳景l(fā)布的環(huán)境數(shù)據(jù)。其中,發(fā)電數(shù)據(jù)為每天6:00~17:00每間隔15 min的采樣值;環(huán)境因素包括:天氣類型、最高溫度和最低溫度。選取天氣類型分別為晴天、雨天和陰轉(zhuǎn)多云的3個(gè)典型日作為預(yù)測(cè)日,經(jīng)過篩選最終分別確定為8月1日、8月13日和8月21日。
首先進(jìn)行出力水平相似日選擇。根據(jù)式(1)和式(2)求得每日天氣類型、最高溫度和最低溫度對(duì)出力的權(quán)值為ω=[0.52,0.43,0.05],然后再根據(jù)2.1節(jié)得到出力水平相似日和曲線形狀相似日的最大初始聚類數(shù)K0都為9,對(duì)應(yīng)出力水平相似日密度指標(biāo)TC1=[94.60,94.48,94.21,93.42,92.11,89.09,81.93,68.57,48.11],曲線形狀相似日密度指標(biāo)TC2=[47.67,47.64,47.56,47.31,46.70,44.85,41.35,35.01,24.11]。
將式(3)代入K?means聚類算法中,分類結(jié)果如表1所示。比較分類數(shù)為2至8的WCBCR值,雖然逐漸減小但減幅不大,而當(dāng)分類數(shù)為9時(shí),WCBCR值出現(xiàn)較大幅度降低,這是因?yàn)榇藭r(shí)聚類子集中出現(xiàn)空樣本集現(xiàn)象。式(8)中WCBCR計(jì)算表達(dá)式分母多加1項(xiàng)其值明顯變大,而分子幾乎不變,導(dǎo)致WCBCR值大幅減小。因此,確定出力水平相似日集最優(yōu)聚類數(shù)K*=8。曲線形狀相似日選擇過程與出力水平相似日類似,但K?means聚類算法中聚類函數(shù)及樣本變量不同,使用的是式(4)及歷史日各時(shí)刻的出力大小。通過WCBCR值判斷,曲線形狀相似日集最優(yōu)聚類數(shù)K*=6。
表1 2種相似日的聚類結(jié)果
當(dāng)出力水平相似日集聚類數(shù)為8類時(shí),3個(gè)預(yù)測(cè)日與出力水平相似日集各子集的距離矩陣D1為
同理,當(dāng)曲線形狀相似日集聚類數(shù)為6類時(shí),3個(gè)預(yù)測(cè)日與曲線形狀相似日集各子集的距離矩陣D2為
選取2個(gè)矩陣中各行向量最小值對(duì)應(yīng)的子集,各預(yù)測(cè)日對(duì)應(yīng)2個(gè)子集的交集作為最佳相似日。需要說明的是,不同天氣類型的預(yù)測(cè)日所對(duì)應(yīng)的出力水平相似日與曲線形狀相似日的交集中的樣本數(shù)量一般不同,對(duì)于天氣環(huán)境比較一致的如晴天,一般交集樣本較多,本文在交集中選取日期與預(yù)測(cè)日最接近的5個(gè)樣本作為最佳相似日。
3.2預(yù)測(cè)模型數(shù)據(jù)
本文選取3層BP神經(jīng)網(wǎng)絡(luò)[11]作為出力預(yù)測(cè)模型,輸入量選取最佳相似日中與預(yù)測(cè)日相似度最大的5日出力和環(huán)境數(shù)據(jù)及預(yù)測(cè)日的環(huán)境數(shù)據(jù),輸出量為預(yù)測(cè)日6:00~17:00每間隔15 min的發(fā)電功率。BP神經(jīng)網(wǎng)絡(luò)隱含層為單層,隱含層的節(jié)點(diǎn)數(shù)根據(jù)經(jīng)驗(yàn)選為19個(gè)[12]。
3.3預(yù)測(cè)結(jié)果與誤差分析
分別使用曲線形狀相似日、出力水平相似日和最佳相似日3種方法選取預(yù)測(cè)模型的輸入量進(jìn)行預(yù)測(cè),對(duì)3種天氣類型的預(yù)測(cè)日預(yù)測(cè)結(jié)果如圖1—圖3所示。
圖1 晴天光伏功率預(yù)測(cè)結(jié)果對(duì)比曲線
圖1是晴天的出力對(duì)比圖。由于晴天環(huán)境因素比較穩(wěn)定,光伏電站輸出功率相對(duì)穩(wěn)定,3種方法都有較高的預(yù)測(cè)精度。圖2和圖3分別是雨天和陰轉(zhuǎn)多云的出力預(yù)測(cè)對(duì)比圖,由于這2種天氣類型下太陽(yáng)輻照波動(dòng)較大,光伏電站輸出功率變化較為劇烈且規(guī)則性不強(qiáng),相對(duì)而言,最佳相似日選擇法比曲線形狀相似日和出力水平相似日具有更好的精度。為了清晰對(duì)比預(yù)測(cè)效果,采用平均絕對(duì)百分誤差(MAPE,mean absolute percentage error)和均方根誤差(RMSE,root mean square error)對(duì)預(yù)測(cè)效果進(jìn)行分析,結(jié)果如表2所示。
圖2 雨天光伏功率預(yù)測(cè)結(jié)果對(duì)比曲線
圖3 陰轉(zhuǎn)多云光伏功率預(yù)測(cè)結(jié)果對(duì)比曲線
表2 3種天氣類型的預(yù)測(cè)日出力預(yù)測(cè)誤差%
為了利用已有數(shù)據(jù)準(zhǔn)確預(yù)測(cè)光伏電站出力,對(duì)各類數(shù)據(jù)的預(yù)處理至關(guān)重要。本文結(jié)合出力水平相似日選取與曲線形狀相似日選取2種方法,由其交集確定最佳相似日集,保證了相似日在距離大小和形狀關(guān)系上的最大相似度。分別將出力水平相似日、曲線形狀相似日和最佳相似日作為神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的輸入量,通過實(shí)測(cè)數(shù)據(jù)仿真對(duì)比分析,驗(yàn)證了所提基于最佳相似日預(yù)測(cè)方法的優(yōu)勢(shì)。D
[1]Chen Changsong,Duan Shanxu,Cai Tao,et a1.Online 24 h solar power forecasting based on weather type classification using artificial neural network[J].Solar Energy,2011,85(11):2 856-2 870.
[2]Yuehui Huang,Jing Lu,Xiaoyuan Xu,et a1.Comparative study of power forecasting methods for PV stations[C]∥IEEE Conferences on Power System Technology.Hangzhou,China:2010:1-6.
[3] 李建紅,陳國(guó)平,葛鵬江,等.基于相似日理論的光伏發(fā)電系統(tǒng)輸出功率預(yù)測(cè)[J].華東電力,2012,40(1):153-157.
[4] 王曉蘭,葛鵬江.基于相似日和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的光伏陣列輸出功率預(yù)測(cè)[J].電力自動(dòng)化設(shè)備,2013,33(1):100-103.
[5] 白俊良,梅華威.改進(jìn)相似度的模糊聚類算法在光伏陣列短期功率預(yù)測(cè)中的應(yīng)用[J].電力系統(tǒng)保護(hù)與控制,2014,42(6):84-90.
[6] 康重慶,夏清,劉梅.電力系統(tǒng)負(fù)荷預(yù)測(cè)[M].北京:中國(guó)電力出版社,2007.
[7] 李飛,薛彬,黃亞樓.初始中心優(yōu)化的K?means聚類算法[J].計(jì)算機(jī)科學(xué),2002,29(7):94-96.
[8] 孫謙,姚建剛,趙俊,等.基于最優(yōu)交集相似日選取的短期母線負(fù)荷綜合預(yù)測(cè)[J].中國(guó)電機(jī)工程學(xué)報(bào),2013,33(4):126-134.
[9]Nikhil R P,Chakraborty D.Mountain and subtractive clustering method:Improvements and generalizations[J].International JournalofIntelligentSystems,2000,15(4):329-341.
[10]George J Tsekouras,Nikos D Hatziargyriou,Evangelos N Dialynas.Two?Stage pattern recognition of load curves for classification of electricity customers[J].IEEE Transactions on Power System,2007,22(3):1 120-1 128.
[11] 陳昌松,段善旭,殷進(jìn)軍.基于神經(jīng)網(wǎng)絡(luò)的光伏陣列發(fā)電預(yù)測(cè)模型的設(shè)計(jì)[J].電工技術(shù)學(xué)報(bào),2009,24(9):153-158.
[12] 袁曉玲,施俊華,徐杰彥.計(jì)及天氣類型指數(shù)的光伏發(fā)電短期出力預(yù)測(cè)[J].中國(guó)電機(jī)工程學(xué)報(bào),2013,33(34):57-64.
Short?term forecasting for photovoltaic power generation based on optimal similar set
GUO Yu?jie1,YUAN Xiao?ling1,LI Chang?ming2,LIU Hao?ming1
(1.College of Energy and Electrical Engineering,Hohai University,Nanjing 211100,China;2.Zhongli Talesun Science and Technology Co.,Ltd.,Changshu 215500,China)
提出一種基于最佳相似日的光伏電站短期出力預(yù)測(cè)方法。該方法利用密度指標(biāo)確定初始聚類中心優(yōu)化K?means聚類算法,采用加權(quán)歐式距離法獲得歷史樣本的出力水平相似日集,采用相關(guān)系數(shù)法獲得歷史樣本的曲線形狀相似日集,確定預(yù)測(cè)日出力水平相似日集和曲線形狀相似日集,選取兩集合的交集樣本作為最佳相似日。建立BP神經(jīng)網(wǎng)絡(luò)出力預(yù)測(cè)模型,采用光伏電站的實(shí)測(cè)數(shù)據(jù)訓(xùn)練預(yù)測(cè)模型,對(duì)比不同類型天氣的預(yù)測(cè)結(jié)果與實(shí)測(cè)數(shù)據(jù),表明論文的預(yù)測(cè)方法具有較高的預(yù)測(cè)精度。
光伏發(fā)電;短期出力預(yù)測(cè);出力水平相似;曲線形狀相似;最佳相似日
This paper proposes a short?term power forecasting method for photovoltaic generation based on optimal similar days. Density index is adopted to choose the initial clustering centers to op?timize K?means algorithm.Weighted Euclidean distance is used to get power generation level set of historical samples.Correlation coeffi?cient is used to get power generation shape set of historical samples. The intersection set of power level and power shape is the optimal similar set.Forecast model of BP neural network is constructed and trained by operation data from photovaltaic power station.Forecast re?sults reveal that the proposed method has high accuracy by compar?ing the forecast results and operation data in different type weathers.
photovoltaic generation;short?term power genera?tion forecasting;similar power generation level;similar power genera?tion shape;optimal similar set
TM615.2
B
2015-06-27;
2015-09-14
國(guó)家自然科學(xué)基金項(xiàng)目(51207044)
郭宇杰(1990),女,江蘇靖江人,碩士研究生,研究方向?yàn)楣夥l(fā)電出力預(yù)測(cè);袁曉玲(1971),女,安徽巢湖人,博士,副教授,從事新能源發(fā)電技術(shù)的研究及教學(xué)工作。李昌明(1983),男,江西萍鄉(xiāng)人,電氣工程師,從事光伏電站研發(fā)及運(yùn)營(yíng)管理;劉皓明(1977),男,江蘇鹽城人,博士,副教授,研究方向?yàn)橹悄茈娋W(wǎng)、電力系統(tǒng)伏壓運(yùn)行和電力市場(chǎng)。