程澤+劉琦+張霞
摘 要:針對(duì)光伏發(fā)電功率受多種天氣因素影響造成預(yù)測難度大的現(xiàn)狀,提出了一種基于彎曲高斯過程的混合模型,可以實(shí)現(xiàn)一天內(nèi)任意時(shí)刻的光伏出力的概率預(yù)測,獲得置信區(qū)間預(yù)測值和點(diǎn)預(yù)測值.該算法先由多元自適應(yīng)回歸樣條模型實(shí)現(xiàn)對(duì)多維輸入變量的約減,同時(shí)得到待預(yù)測值的先驗(yàn)數(shù)據(jù),然后利用模糊C均值算法按天氣類型對(duì)訓(xùn)練集數(shù)據(jù)和測試集的先驗(yàn)數(shù)據(jù)進(jìn)行聚類,得到相似樣本,再利用彎曲高斯過程模型對(duì)測試集數(shù)據(jù)進(jìn)行估計(jì),最后利用Bagging算法實(shí)現(xiàn)對(duì)子混合模型的集成學(xué)習(xí),得到待預(yù)測值的區(qū)間估計(jì)和點(diǎn)估計(jì).仿真及試驗(yàn)結(jié)果驗(yàn)證了該混合模型的有效性和可靠性.與高斯過程估計(jì)和BP神經(jīng)網(wǎng)絡(luò)分位數(shù)估計(jì)相比,該混合模型精度更高,實(shí)用性更強(qiáng).
關(guān)鍵詞:多元自適應(yīng)回歸樣條;彎曲高斯過程;Bagging算法;區(qū)間預(yù)測;光伏發(fā)電
中圖分類號(hào):TM 715 文獻(xiàn)標(biāo)志碼:A
A Research of Estimation of Solar Power Generation Based on
Warped Gaussian Process
CHENG Ze1,LIU Qi1,ZHANG Xia2
(1.School of Electrical and Information Engineering,Tianjin University,Tianjin 300072,China;
2.School of Civil Engineering,Qinghai Nationalities University,Xining 810007,China)
Abstract:Considering the situation that photovoltaicpower generation is affected by a variety of weather factors,a hybrid model was proposed based on warped Gaussian process to predict the power generation,where probability of photovoltaic power generation at any time in one day can be realized and prediction point and prediction interval can be obtained. Firstly,multivariate adaptive regression splines model was used to reduce multidimensional input variables,and to obtain the prior data of test. According to the type of weather,fuzzy C-means algorithm was then used to divide the training data and prior data of test,and to obtain the similar samples. The warped Gaussian process was also used to estimate the test data. Finally,bagging algorithm was used to realize the integrated study,and to obtain the prediction interval and prediction point. By the simulation and experimental results,the validity and reliability of this hybrid model was verified. The results show that the hybrid model improves both accuracy and practicability,compared with Gaussian process predictions and BP quantile regression neural network predictions.
Key words:multivariate adaptive regression splines;warped Gaussian process regression; Bagging algorithm; prediction interval;solar power generation
光伏發(fā)電在滿足能源需求、減少環(huán)境污染、改善能源結(jié)構(gòu)等方面發(fā)揮著重要的作用,近年來,成為繼風(fēng)力發(fā)電之后可再生能源發(fā)電的又一增長點(diǎn),在全球迅速發(fā)展.由于日照的晝夜周期性,光伏發(fā)電是一種典型的間歇式電源,光伏發(fā)電功率受到太陽輻照強(qiáng)度和天氣等多種因素的影響,其功率變化具有明顯的隨機(jī)性和波動(dòng)性,這些特性將使得大規(guī)模光伏發(fā)電并網(wǎng)對(duì)電網(wǎng)造成不良影響.因此對(duì)光伏發(fā)電功率的準(zhǔn)確預(yù)測,將對(duì)電網(wǎng)調(diào)度及電力系統(tǒng)的穩(wěn)定性和安全性具有重要的意義[1-2].
現(xiàn)今用于短期光伏功率預(yù)測的主要算法有人工神經(jīng)網(wǎng)絡(luò)算法、分類回歸算法、時(shí)間序列算法、馬爾科夫鏈算法、小波分析算法等[3-7].雖然不同的算法都有各自的優(yōu)點(diǎn),但同時(shí)也存在著缺點(diǎn),因此出現(xiàn)了將不同算法組合起來的綜合預(yù)測算法.文獻(xiàn)[8]提出將多尺度小波分解法與神經(jīng)網(wǎng)絡(luò)法組合進(jìn)行光伏發(fā)電預(yù)測.文獻(xiàn)[9]提出將GMDH神經(jīng)網(wǎng)絡(luò)與最小二乘支持向量機(jī)相結(jié)合進(jìn)行光伏發(fā)電預(yù)測.文獻(xiàn)[10]提出將PCA算法與最小二乘支持向量機(jī)算法組合進(jìn)行光伏發(fā)電預(yù)測.文獻(xiàn)[11]提出將灰色模型和BP神經(jīng)網(wǎng)絡(luò)算法組合進(jìn)行光伏發(fā)電預(yù)測.目前,光伏發(fā)電預(yù)測大多是點(diǎn)預(yù)測,即給出某一時(shí)刻的一個(gè)確定值,但是光伏發(fā)電功率具有較大隨機(jī)性,確定的點(diǎn)預(yù)測值很難表達(dá)預(yù)測結(jié)果的不確定,影響電網(wǎng)調(diào)度及電力系統(tǒng)的穩(wěn)定性和安全性.endprint
相比于點(diǎn)預(yù)測,概率預(yù)測很好地彌補(bǔ)了點(diǎn)預(yù)測無法度量預(yù)測結(jié)果不確定性的缺陷.概率預(yù)測方法能給出下一時(shí)刻可能的光伏功率值及其置信區(qū)間值,提供較全面的預(yù)測信息.文獻(xiàn)[12]應(yīng)用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)理論,建立光伏發(fā)電預(yù)測模型,在當(dāng)前時(shí)刻各影響因素水平的條件下,預(yù)測未來短期光伏發(fā)電量的概率分布.文獻(xiàn)[13]將預(yù)測誤差分布假設(shè)為正態(tài)分布和拉普拉斯分布進(jìn)行估計(jì),預(yù)測未來短期光伏發(fā)電功率的概率分布.
本文針對(duì)不同天氣狀況下光伏發(fā)電功率的概率分布進(jìn)行研究,直接得到發(fā)電功率的點(diǎn)預(yù)測值和置信區(qū)間預(yù)測值.首先采用多元自適應(yīng)回歸樣條模型得到待預(yù)測值的先驗(yàn)數(shù)據(jù)作為模糊C均值算法的輸入量,得到不同天氣狀況下的相似樣本,同時(shí)篩選出重要變量作為彎曲高斯過程模型的新輸入集.最后,將得到的95%置信區(qū)間預(yù)測值和點(diǎn)預(yù)測值與應(yīng)用高斯過程估計(jì)和神經(jīng)網(wǎng)絡(luò)分位數(shù)估計(jì)得到的置信區(qū)間預(yù)測值和點(diǎn)預(yù)測值進(jìn)行對(duì)比分析.實(shí)驗(yàn)結(jié)果表明,本文所提出方法的精度更高一些.
1 變量選擇和分類
1.1 多元自適應(yīng)回歸樣條
多元自適應(yīng)回歸樣條(Multivariate adaptive regression splines,簡稱MARS)是一種非線性、 非參數(shù)的回歸方法,可以構(gòu)造出由基函數(shù)描述的復(fù)雜非線性關(guān)系,提供具體的非線性關(guān)系公式和光伏功率預(yù)測值,同時(shí)獲得變量的重要程度,從而挑選出重要變量,實(shí)現(xiàn)變量的約減,提高預(yù)測精度.由文獻(xiàn)[14]可知,相比于普通的預(yù)測方法,如SVR,KNN,ARMAX模型,MARS模型具有較高的預(yù)測精度,可以提高相似樣本的選擇正確率.因此本文選擇MARS模型作為前期的預(yù)測模型.MARS的基本思想是構(gòu)造一個(gè)由基函數(shù)(Basis function,簡稱BF)來近似描述復(fù)雜非線性關(guān)系的回歸模型.
MARS模型以一組基函數(shù)組合的形式來擬合待預(yù)測的函數(shù)關(guān)系(x),定義如式(1)所示:
=(x)=α0+∑Mi=1αiBFi(x)(1)
式中:是輸出變量的預(yù)測值;α0是常數(shù);M是基函數(shù)個(gè)數(shù);BFi(x)和αi分別是第i個(gè)基函數(shù)和相應(yīng)的系數(shù).
常見的基函數(shù)表達(dá)式如式(2)所示.
BF=max(0,x-c)=x-c,x>c;0,otherwise.(2)
式中:c是節(jié)點(diǎn).當(dāng)x MARS算法分為前向過程、后向剪枝過程和模型選取三個(gè)步驟. 前向過程:模型的初始基函數(shù)集只包含一個(gè)常數(shù)項(xiàng),然后MARS模型通過重復(fù)的將一對(duì)基函數(shù)加進(jìn)模型,找到模型殘差平方和最大減少的基函數(shù)對(duì),從而使模型的精度得到最大限度的提高.MARS算法通過判斷MSE的變化來判斷模型性能是否得到改善.迭代過程一直持續(xù),直到殘差平方和足夠小而不發(fā)生變化為止,或者達(dá)到用戶設(shè)定的基函數(shù)個(gè)數(shù)最大值Mmax. 后向剪枝過程:剪枝過程根據(jù)廣義交叉驗(yàn)證(GCV,Generalized Cross Validation)準(zhǔn)則進(jìn)行, GCV(M)=1n∑ni=1(yi-i)21-C(M)n2(3) 式中:M是非常數(shù)的基函數(shù)數(shù)目;n是樣本數(shù);C(M)=M+1+dM;yi是訓(xùn)練數(shù)據(jù)的因變量;i是模型的預(yù)測值;d為懲罰因子,常取為3.前向過程通常會(huì)建立一個(gè)過度擬合的模型,雖然對(duì)于建模的數(shù)據(jù)擬合程度很高,但對(duì)于新數(shù)據(jù)的預(yù)測精度比較低,因此需要通過后向剪枝過程將造成模型過度擬合的基函數(shù)刪除,每步刪除一個(gè)使GCV值降低最大或者增加最小的基函數(shù),最終得到多個(gè)復(fù)雜度不同的模型. 模型選?。哼x出GCV值最小的一個(gè)子模型作為最終的輸出模型. 變量的選擇:模型建立以后,就可以估計(jì)自變量對(duì)模型的重要程度.由于每個(gè)自變量可以加入到不同的基函數(shù)中,每次去掉一個(gè)變量,保留其他變量,然后計(jì)算這個(gè)去掉變量對(duì)模型擬合程度的減少量.對(duì)模型擬合度減少量最大的變量被賦予最重要的權(quán)重(100%的權(quán)重),對(duì)于其他變量則根據(jù)各自對(duì)模型擬合程度的貢獻(xiàn)度賦予相應(yīng)的權(quán)重,對(duì)模型不重要的變量賦予0%的權(quán)重.通過變量的選擇,就可以將高維數(shù)據(jù)約減到低維數(shù)據(jù),選取主變量因素,提高預(yù)測精度和效率. 1.2 模糊C均值聚類法 在光伏發(fā)電功率預(yù)測研究中,訓(xùn)練樣本的選擇對(duì)于預(yù)測結(jié)果的準(zhǔn)確性有很大的影響,當(dāng)不同時(shí)期的天氣狀況相似的時(shí)候,其對(duì)應(yīng)的光伏發(fā)電功率也會(huì)接近,本文采用聚類的方法進(jìn)行相似樣本的選擇.由于光伏發(fā)電功率受多種天氣變量共同影響,若類型分類太多,對(duì)于分類準(zhǔn)確度的要求增高,分類錯(cuò)誤率會(huì)增大,同時(shí)會(huì)導(dǎo)致每種類型樣本數(shù)過少,影響模型預(yù)測準(zhǔn)確性,因此將其合并為具有代表性的兩類,分別對(duì)應(yīng)于晴天、陰天兩種天氣類型,其中由于雨雪等天氣的功率值都比較小,屬于陰天類型,將其歸于陰天一類. 模糊聚類[15]就是將n個(gè)樣本劃分為c類.在模糊劃分中,每個(gè)樣本并不是嚴(yán)格的被劃分為某一類,而是按照一定的隸屬度屬于某一類. 定義目標(biāo)函數(shù) J(U,V)=∑nk=1∑ci=1umikd2ik(4) 式中:uik為第k個(gè)樣本屬于第i類的隸屬度,U為隸屬度矩陣;V是聚類中心;umik是權(quán)重,為隸屬度的m次方;dik是樣本到聚類中心的距離. 模糊C均值聚類法的聚類準(zhǔn)則是求U和V,使J(U,V)取最小值.具體步驟如下所示: 1)確定類的個(gè)數(shù)c,冪指數(shù)m>1和初始隸屬度矩陣U(0),常取為[0,1]上的均勻分布隨機(jī)數(shù).令l=1,表示第一步迭代. 2)計(jì)算第l步的聚類中心V(l) v(l)i=∑nk=1(u(l-1)ik)mxk∑nk=1(u(l-1)ik)m,i=1,2,…,c(5) 3)修正隸屬度矩陣U(l),計(jì)算目標(biāo)函數(shù)J (l). u(l)ik=1∑cj=1d(l)ikd(l)jk2m-2,i=1,…,c,k=1,…,n(6)
J(l)(U(l),V(l))=∑nk=1∑ci=1(ulik)m(dlik)2(7)
式中:d(l)ik=‖xk-v(l)i‖.
4)對(duì)于給定的隸屬度終止容限εu>0,目標(biāo)函數(shù)終止容限εj>0,最大迭代步長Lmax,當(dāng)max{|u(l)ik-u(l-1)ik|}<εu或|J(l)-J(l-1)|<εJ或l>Lmax時(shí),停止迭代,否則l=l+1,回到步驟2).
經(jīng)過上述步驟后,就可以求得最終的隸屬度矩陣U和聚類中心V,使得J(U,V)的值最小.根據(jù)隸屬度矩陣U中元素值就可以確定樣本的類別,當(dāng)uik=max1≤i≤c{uik}時(shí),可將樣本xk歸為第j類.
2 基于彎曲高斯過程的概率估計(jì)
2.1 彎曲高斯過程
高斯過程回歸(Gaussian process for regression,簡稱GPR)模型[16]是非參數(shù)的非線性回歸模型,是一種概率分布估計(jì)模型,不僅可以獲得點(diǎn)預(yù)測值,還可以獲得置信區(qū)間預(yù)測值.針對(duì)本文研究的光伏發(fā)電功率預(yù)測問題,應(yīng)用彎曲高斯過程模型,可以實(shí)現(xiàn)光伏發(fā)電功率的概率分布預(yù)測,獲得更為全面的信息.基本思路是假設(shè)訓(xùn)練樣本服從高斯分布,利用貝葉斯理論計(jì)算出相應(yīng)的后驗(yàn)概率,然后利用最大似然法則求出相應(yīng)的最優(yōu)超參數(shù),最后利用得到的模型去預(yù)測測試樣本,得到待預(yù)測變量的概率分布.
假設(shè)有n個(gè)訓(xùn)練樣本的數(shù)據(jù)集D=(X,y),其中X表示n×d維輸入矩陣,y表示相應(yīng)的輸出變量,在標(biāo)準(zhǔn)高斯過程中,假設(shè)輸入矢量和輸出變量之間關(guān)系為:
yn=f(xn)+εn(8)
式中:yn是觀測值;εn是噪聲,εn~N(0,σ2n).
觀測值的協(xié)方差為cov(y)=K+σ2nI,觀測值的先驗(yàn)分布為
y~N(0,K+σ2nI)(9)
式中:K是n×m核函數(shù)矩陣,Knm=k(xn,xm),k是核函數(shù).
觀測值y與測試值f*的聯(lián)合分布可記為
yf*~N0,K(X,X)+σ2nIK(X,X*)K(X*,X)K(X*,X*)(10)
式中:假如有n個(gè)訓(xùn)練數(shù)據(jù),m個(gè)測試數(shù)據(jù),K(X*,X)表示測試點(diǎn)和訓(xùn)練點(diǎn)的m×n維協(xié)方差矩陣.預(yù)測值的后驗(yàn)分布即高斯回歸預(yù)測方程為
f*|X,y,X*~N(*,cov(f*))(11)
式中:
*=E[f*|X,y,X]=K(X*,X)[K(X,X)+σ2nI]-1y;
cov(f*)=K(X*,X*)-K(X*,X)[K(X,
X)+σ2nI]-1*K(X,X*)
*=*,2*=cov(f*)分別為預(yù)測值f*的均值和方差.
本文選擇常用的自相關(guān)平方指數(shù)作為協(xié)方差函數(shù),如式(12)所示.
k(xp,xq)=σ2fexp-12l2‖xp-xq‖2+σ2nδpq(12)
式中:xq,xp是訓(xùn)練集或測試集的變量;l,σf,σn為將要被學(xué)習(xí)的超參數(shù);δpq是符號(hào)函數(shù).
GP模型通過最大化對(duì)數(shù)邊緣似然函數(shù)來最優(yōu)化超參數(shù)θ.
logp(y|X,θ)=-12yT(K+σ2nI)-1y-
12log|(K+σ2nI)|-N2log2π(13)
式中:K為協(xié)方差矩陣.
但是在一些實(shí)際情況中,觀測值y和噪聲ε并不是高斯分布,例如本文研究的光伏發(fā)電功率由于受太陽輻照度、溫度等多種天氣變量的影響并不符合高斯分布.彎曲高斯過程[17](Warped gaussian process,簡稱WGP)引入了一個(gè)非線性單調(diào)彎曲函數(shù)g(y;ψ),利用彎曲函數(shù)將觀測值y轉(zhuǎn)換為隱性變量u,而隱性變量符合標(biāo)準(zhǔn)的高斯分布,可以應(yīng)用高斯過程模型,因此彎曲高斯過程模型解決了光伏發(fā)電功率不是高斯分布的問題,可以應(yīng)用在光伏發(fā)電功率預(yù)測問題上.彎曲函數(shù)如式(14)所示.
u=g(y;ψ)=y+∑Ii=1ajtanh(bj(y+cj))(14)
式中:y是觀測值;I是常數(shù),由引入的彎曲函數(shù)復(fù)雜性而定,常取為3;ψ={a,b,c}是將要被學(xué)習(xí)的參數(shù).
因此,在轉(zhuǎn)換后的訓(xùn)練集(X,u)上的對(duì)數(shù)似然函數(shù)可以寫成如式(15)所示.
logp(u|X,θ)=-12g(yT)(K+σ2nI)-1g(y)
-12log|(K+σ2nI)|+∑Nn=1logg(y)y|y=yn
-N2log2π(15)
然后采用極大化似然函數(shù)的方法求解出超參數(shù)θ和彎曲函數(shù)參數(shù)ψ,完成WGP模型的訓(xùn)練過程.
在隱空間中,一個(gè)新測試點(diǎn)X*的預(yù)測分布符合標(biāo)準(zhǔn)高斯分布:
p(u*|x*,D,θ)=N(*(θ),σ2*(θ))(16)
然后就可以通過彎曲函數(shù)得到原始觀測空間的預(yù)測概率分布:
p(y*|x*,D,θ,ψ)=
g′(y*)2πσ2*exp-(g(y*)-*)22σ2*(17)
2.2 Bagging集成學(xué)習(xí)算法
集成學(xué)習(xí)算法是機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)熱點(diǎn),該算法通過將一系列有差異的預(yù)測精度較低的基學(xué)習(xí)器(弱學(xué)習(xí)器)進(jìn)行組合,構(gòu)造成具有高預(yù)測精度的強(qiáng)預(yù)測器.彎曲高斯過程模型是一種基預(yù)測器,可以采用集成學(xué)習(xí)的方法增強(qiáng)模型的穩(wěn)定性和預(yù)測性能.本文采用Bagging集成學(xué)習(xí)方法[18].Bagging算法的基本思想是讓學(xué)習(xí)算法訓(xùn)練K輪,每輪的訓(xùn)練集Di通過在原始訓(xùn)練集D上隨機(jī)抽取的方式獲取,某個(gè)初始訓(xùn)練樣本在某輪訓(xùn)練集中可以出現(xiàn)多次或根本不出現(xiàn).然后利用由不同訓(xùn)練集訓(xùn)練出來的預(yù)測器Fi進(jìn)行預(yù)測,最后采用對(duì)輸出求均值或?qū)Σ煌敵鲑x予不同權(quán)重求和的方法得到最終強(qiáng)預(yù)測器的輸出結(jié)果.Bagging方法適合于高斯過程模型的集成[19].endprint
Bagging集成學(xué)習(xí)法包括三步:創(chuàng)建多個(gè)訓(xùn)練子集,構(gòu)建多個(gè)子預(yù)測器,組合成強(qiáng)預(yù)測器.步驟流程圖如圖1所示:
3 光伏出力概率預(yù)測流程
BMARS-WGP模型是一個(gè)結(jié)合了MARS模型、模糊C均值算法、WGP模型和Bagging算法的混合模型.
光伏出力預(yù)測流程如下:
1)首先采用公式y(tǒng)=x-min(x)max(x)-min(x)將原始數(shù)據(jù)做歸一化處理,作為MARS模型的輸入,得到預(yù)測值的先驗(yàn)數(shù)據(jù),同時(shí)篩選出重要變量,實(shí)現(xiàn)原始數(shù)據(jù)的降維.
2)將選擇出的重要變量X*組成新的變量集,利用模糊C均值算法將預(yù)測值的先驗(yàn)數(shù)據(jù)分為晴天和陰天兩種不同天氣狀況.
3)將新變量子集c作為彎曲高斯過程模型的輸入.
4)應(yīng)用Bagging集成算法將K個(gè)子彎曲高斯過程模型按照權(quán)重法組合成一個(gè)強(qiáng)彎曲高斯過程模型,最后應(yīng)用得到的模型實(shí)現(xiàn)測試集數(shù)據(jù)的預(yù)測,得到測試輸出的點(diǎn)預(yù)測值和區(qū)間預(yù)測值.其中各子模型的權(quán)重為:
αk=1(RMSE)ksum1RMSE(18)
式中:(RMSE)k為第k個(gè)子模型的均方根誤差值.
光伏發(fā)電功率預(yù)測的BMARS-WGP混合模型的結(jié)構(gòu)圖如圖2所示.
4 模型結(jié)果和討論
4.1 光伏電站數(shù)據(jù)
混合模型的數(shù)據(jù)采用國際電氣電子工程師學(xué)會(huì)能源預(yù)測工作組的太陽能預(yù)測中光伏電站2012至2014年的相關(guān)數(shù)據(jù),其中數(shù)據(jù)包括光伏板24小時(shí)的出力值和相應(yīng)的氣象參數(shù)值[20-22],該電站位于南半球,光伏板為固定式.由于在夜晚,光伏板的出力值為0,因此選取2012年5月1日到5月31日和2013年5月1日到5月31日21:00到次日08:00之間12個(gè)小時(shí)的兩個(gè)月數(shù)據(jù)作為模型的訓(xùn)練數(shù)據(jù),將2014年5月1日到5月31日21:00到次日08:00之間12個(gè)小時(shí)的數(shù)據(jù)作為測試數(shù)據(jù).
4.2 預(yù)測性能評(píng)估
本文所提出的混合模型不僅能夠獲得點(diǎn)預(yù)測值,還能夠獲得置信區(qū)間值,因此采用不同的性能評(píng)價(jià)指標(biāo).針對(duì)點(diǎn)預(yù)測,采用均方根誤差RMSE作為評(píng)價(jià)指標(biāo),
RMSE=∑Ni=1(yi-i)2N(19)
式中:N為測試數(shù)據(jù)個(gè)數(shù);yi為預(yù)測值;為真實(shí)輸出值.均方根誤差值越小,表明模型的預(yù)測精度越高.針對(duì)區(qū)間預(yù)測,采用95%的置信區(qū)間平均寬度和可靠性參數(shù)[21]1-α值來評(píng)估區(qū)間預(yù)測的性能.
1-α=γ1-αN×100%(20)
式中:γ1-α是落入置信區(qū)間的預(yù)測值的個(gè)數(shù);N是預(yù)測值的個(gè)數(shù).置信區(qū)間平均寬度越窄,1-α值越大,模型性能越好.
4.3 預(yù)測結(jié)果和比較分析
4.3.1 輸入變量的選擇
影響光伏出力的氣象因素很多,若將全部氣象因素作為彎曲高斯過程回歸模型的輸入變量,會(huì)增加預(yù)測復(fù)雜程度,影響預(yù)測精度.為此本文通過MARS模型挑選出重要變量,簡化計(jì)算,提高預(yù)測精度.
本文采用國際電氣電子工程師學(xué)會(huì)能源預(yù)測工作組的太陽能預(yù)測中光伏電站2012至2014年的相關(guān)數(shù)據(jù)作為訓(xùn)練樣本,其中數(shù)據(jù)包括光伏板每小時(shí)的出力值和12個(gè)氣象參數(shù)值.在MARS模型中通過將各變量加入到不同基函數(shù)中,每次去掉一個(gè)變量,保留其他變量,計(jì)算該變量對(duì)模型擬合程度的減少量,根據(jù)變量對(duì)模型擬合程度的貢獻(xiàn)度賦予不同的權(quán)重,通過MARS模型對(duì)12個(gè)氣象參數(shù)按照重要程度進(jìn)行排序.各變量的重要程度如表1所示,某些氣象參數(shù)重要程度低的原因是對(duì)模型擬合程度的貢獻(xiàn)度較低,因此被賦予了較低的權(quán)重.
變量的重要程度按照百分比表示,最重要的為100%,最不重要的為0%,從表1中可知各氣象參數(shù)變量的重要程度,選取重要程度超過20%的變量作為重要變量,組成預(yù)測模型的輸入變量集.其中重要變量及其定義如表2所示.
表3為變量約減前后彎曲高斯過程模型區(qū)間平均寬度和1-α值的對(duì)比結(jié)果.從表3可知,無論是晴天還是陰天,變量約減前的1-α值雖然略大于約減后的1-α值,但是變量約減前的預(yù)測區(qū)間平均寬度明顯大于約減后的區(qū)間平均寬度,所以可知經(jīng)過變量約減后的模型,預(yù)測準(zhǔn)確性得到了提升,更具有實(shí)用價(jià)值.
4.3.2 結(jié)果比較分析
為充分驗(yàn)證所提出的混合模型有效性,選取2014年5月份中3個(gè)晴天日和3個(gè)陰天日作為測試集,同時(shí)將預(yù)測結(jié)果同高斯過程模型和BP神經(jīng)網(wǎng)絡(luò)分位數(shù)模型分別就點(diǎn)預(yù)測和區(qū)間預(yù)測結(jié)果分別進(jìn)行對(duì)比分析.
圖3為本文所提出的混合模型3個(gè)晴天日和3個(gè)陰天日的預(yù)測結(jié)果圖,前3天為晴天日,后3天為陰天日,橫坐標(biāo)為時(shí)間,縱坐標(biāo)為光伏出力,陰影部分代表95%置信區(qū)間的預(yù)測區(qū)間.從圖3中可知,晴天日光照強(qiáng)烈,天氣變化平緩,光伏出力呈現(xiàn)一定規(guī)律性,點(diǎn)預(yù)測結(jié)果較為準(zhǔn)確,誤差較小,波峰處預(yù)測區(qū)間稍寬,整體預(yù)測區(qū)間較窄,整體預(yù)測精度比較高;陰天日光照較弱,光伏出力規(guī)律性較差,點(diǎn)預(yù)測結(jié)果相比晴天日較差,誤差較大,同時(shí)預(yù)測區(qū)間相比于晴天日較寬,整體預(yù)測精度較低.
圖4 (a)(b)分別為晴天和陰天各模型的點(diǎn)預(yù)測結(jié)果對(duì)比圖.橫坐標(biāo)為時(shí)間,縱坐標(biāo)為光伏出力.從圖4可知,晴天時(shí)刻,太陽輻射度較大,天氣變化比較平緩,光伏出力和預(yù)測結(jié)果的規(guī)律性較好,各模型預(yù)測結(jié)果都能夠較好地跟隨光伏出力的變化,誤差較??;陰天時(shí)刻,太陽輻射度較小,天氣變化波動(dòng)性較大,相比于晴天日,各模型都不能較好地跟蹤光伏出力情況,光伏出力和預(yù)測結(jié)果的規(guī)律性較差,各模型預(yù)測誤差有一定波動(dòng)性.
該圖與表4中的數(shù)據(jù)吻合,整體來看,各模型預(yù)測的陰天日整體精度要低于晴天日精度.
圖5為光伏出力在晴天和陰天兩種天氣下一天的實(shí)際出力值和預(yù)測值的對(duì)比分析圖.從圖5(a)可知,在晴天時(shí)刻,太陽輻射度較大,天氣變化比較平穩(wěn),混合模型能夠較為準(zhǔn)確地預(yù)測光伏出力情況,在7點(diǎn)到12點(diǎn)的上午時(shí)段,光伏出力呈現(xiàn)上升趨勢(shì),在中午時(shí)刻達(dá)到最大值,在13點(diǎn)到18點(diǎn)的下午時(shí)段,光伏出力呈現(xiàn)下降趨勢(shì),光伏出力整體變化較為平緩,混合模型的預(yù)測誤差較小,RMSE值為5.10%;在陰天時(shí)刻,太陽輻射度較小,光伏出力變化波動(dòng)相比于晴天時(shí)刻較大,同時(shí)混合模型的預(yù)測誤差也相應(yīng)增大,在11點(diǎn)到12點(diǎn)時(shí)間段,云量增加,天氣變化明顯,此時(shí)混合模型預(yù)測誤差變大,在12點(diǎn)到14點(diǎn)時(shí)間段,云量稍微減少,光伏出力增加,混合模型能較好跟蹤光伏出力,但14點(diǎn)到16點(diǎn)之間,云量再次增加,出現(xiàn)陣雨天氣,天氣突變,造成混合模型的預(yù)測誤差增大,陰天時(shí)刻的整體預(yù)測精度較差,RMSE值為8.26%.endprint
圖6(a)和(b)分別為2014年5月13號(hào)9點(diǎn)和13點(diǎn)的光伏出力概率分布估計(jì)圖,曲線為光伏出力值的概率密度曲線,加粗黑線為光伏出力實(shí)際值.從圖中可以看出,光伏出力實(shí)際值都落在了模型預(yù)測區(qū)間內(nèi),曲線的峰值點(diǎn)與光伏出力實(shí)際值點(diǎn)較為接近,即光伏出力預(yù)測值與實(shí)際出力值誤差較小.
圖7為兩個(gè)時(shí)刻不同預(yù)測方法的概率密度函數(shù)結(jié)果分析圖,從圖中可以看出所提出的方法(BWGP)獲得的概率密度曲線尖峰薄尾的特性明顯,預(yù)測結(jié)果的銳度特性更優(yōu).高斯回歸方法(GP)和神經(jīng)網(wǎng)絡(luò)分位數(shù)方法(QRNN)雖然也具有尖峰薄尾的特性,但性能不如彎曲高斯模型(WGP)和所提出的方法,另外所提出的混合模型不僅考慮到光伏出力的概率分布情況,還使用集成的思想,提高了模型的性能.
表4為不同模型點(diǎn)預(yù)測結(jié)果的均方根誤差值.由表可知,晴天日,所提出的混合模型(BWGP)的精度最高,RMSE值為0.061,其次為彎曲高斯過程模型(WGP),RMSE值為0.077,高斯過程模型(GP)RMSE值為0.080,神經(jīng)網(wǎng)絡(luò)分位數(shù)模型(QRNN)RMSE值為0.083;陰天日,各模型精度從高到低依次為混合模型、彎曲高斯過程模型、高斯過程模型、神經(jīng)網(wǎng)絡(luò)分位數(shù)模型,RMSE值分別為0.093,0.100,0.115,0.131.無論是晴天日還是陰天日,本文所提出的混合模型的點(diǎn)預(yù)測誤差是最小的,精度是最高的.
表5為各模型的區(qū)間預(yù)測結(jié)果,其中包含兩個(gè)評(píng)價(jià)指標(biāo),預(yù)測區(qū)間平均寬度和可靠性評(píng)價(jià)參數(shù)1-α,預(yù)測區(qū)間平均寬度值越小,1-α值越大,模型的實(shí)用性越高.由表5可知,本文所提出的混合模型在晴天日和陰天日的預(yù)測區(qū)間平均寬度值最小、1-α值較大,實(shí)用性最高.在晴天日,彎曲高斯過程模型和神經(jīng)網(wǎng)絡(luò)分位數(shù)模型的預(yù)測區(qū)間平均寬度值和1-α值基本一致,但在陰天日,雖然彎曲高斯過程模型預(yù)測區(qū)間平均寬度值小于神經(jīng)網(wǎng)絡(luò)分位數(shù)模型值,但是其1-α值也比神經(jīng)網(wǎng)絡(luò)分位數(shù)模型值小,兩個(gè)模型各有優(yōu)缺點(diǎn).在晴天日,神經(jīng)網(wǎng)絡(luò)分位數(shù)模型的預(yù)測精度要稍高于高斯過程模型,但在陰天日,雖然高斯過程模型的區(qū)間寬度要低于神經(jīng)網(wǎng)絡(luò)分位數(shù)模型,但是高斯過程模型的1-α值要小于神經(jīng)網(wǎng)絡(luò)分位數(shù)模型.綜合考慮,神經(jīng)網(wǎng)絡(luò)分位數(shù)模型的預(yù)測精度要高于高斯過程模型.整體而言,晴天日的預(yù)測區(qū)間平均寬度要小于陰天日值,1-α值要大于陰天日值,預(yù)測結(jié)果更加可靠,風(fēng)險(xiǎn)更低.
在電力系統(tǒng)規(guī)劃和并網(wǎng)系統(tǒng)控制中,區(qū)間預(yù)測是對(duì)預(yù)測值包含的風(fēng)險(xiǎn)做出的合理評(píng)估,可以給電網(wǎng)調(diào)度人員提供可靠的數(shù)據(jù)信息,保證電網(wǎng)的安全穩(wěn)定運(yùn)行,但是預(yù)測區(qū)間平均寬度值太大,1-α值太小都會(huì)使區(qū)間預(yù)測值的實(shí)用性降低.本文所提出的混合模型的預(yù)測區(qū)間平均寬度值較小,1-α值較大,實(shí)用性較高,可以有效地反映光伏發(fā)電功率的變動(dòng)特征.
5 總 結(jié)
本文提出了一種基于彎曲高斯過程的混合模型,將歷史氣象參數(shù)值和光伏發(fā)電功率值作為訓(xùn)練數(shù)據(jù),可以實(shí)現(xiàn)一天內(nèi)任意時(shí)刻的光伏發(fā)電功率的點(diǎn)預(yù)測和區(qū)間預(yù)測.利用多元自適應(yīng)回歸樣條模型篩選出重要變量,實(shí)現(xiàn)了輸入變量的約減,提高了區(qū)間預(yù)測的精度;利用模糊C均值法實(shí)現(xiàn)了對(duì)先驗(yàn)數(shù)據(jù)按不同天氣狀況的分類,得到相似樣本,提高了預(yù)測的可靠性;利用Bagging學(xué)習(xí)法實(shí)現(xiàn)了對(duì)子預(yù)測模型的集成學(xué)習(xí),提高了預(yù)測精度.經(jīng)過實(shí)驗(yàn)仿真證明該方法點(diǎn)預(yù)測誤差較小,預(yù)測區(qū)間平均寬度值較小,1-α值較大,預(yù)測精度較高,具有較高的實(shí)用性.不同天氣狀況對(duì)預(yù)測精度有較大的影響,下一步的工作是提高不同天氣的分類準(zhǔn)確度,進(jìn)一步提高預(yù)測精度.
參考文獻(xiàn)
[1] 龔鶯飛,魯宗相,喬穎,等.光伏功率預(yù)測技術(shù)[J].電力系統(tǒng)自動(dòng)化,2016,40(4):140-151.
GONG Yingfei,LU Zongxiang,QIAO Ying,et al. An overview of photovoltaic energy system output forecasting technology[J].Automation of Electric Power Systems,2016,40(4):140-151.(In Chinese )
[2] 李安壽,陳琦,王子才,等. 光伏發(fā)電系統(tǒng)功率預(yù)測方法綜述[J].電氣傳動(dòng),2016,46(6): 93-96.
LI Anshou,CHEN Qi,WANG Zicai,et al. Review of power forecast methods for photovoltaic generating system[J]. Electric Drive,2016,46(6): 93-96. (In Chinese )
[3] 丁明,王磊,畢銳.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的光伏發(fā)電系統(tǒng)輸出功率短期預(yù)測模型[J].電力系統(tǒng)保護(hù)與控制,2012,40(11):93-99.
DING Ming,WANG Lei,BI Rui. A short-term prediction model to forecast output power of photovoltaic system based on improved BP neural network[J].Power System Protection and Control,2012,40(11):93-99.(In Chinese )
[4] 楊錫運(yùn),劉歡,張斌,等.組合權(quán)重相似日選取方法及光伏輸出功率預(yù)測[J].電力自動(dòng)化設(shè)備,2014,34(9):118-122.
YANG Xiyun,LIU Huan,ZHANG Bin,et al. Similar day selection based on combined weight and photovoltaic power output forecasting[J].Electric Power Automation Equipment,2014,34(9):118-122.(In Chinese )endprint
[5] LI Yanting,SU Yan,SHU Lianjie. An ARMAX model for forecasting the power output of a grid connected photovoltaic system[J]. Renewable Energy,2014,66(6):78-89.
[6] 丁明,徐寧舟.基于馬爾科夫鏈的光伏發(fā)電系統(tǒng)輸出功率短期預(yù)測方法[J].電網(wǎng)技術(shù),2011,35(1):152-157.
DING Ming,XU Ningzhou. A method to forecast short-term output power of photovoltaic generation system based on Markov chain[J].Power System Technology,2011,35(1):152-157.(In Chinese)
[7] MANDAL P,MADHIRA S T S,HAQUE A U,et al. Forecasting power output of solar photovoltaic system using wavelet transform and artificial intelligence techniques[J]. Precedia Computer Science,2012,12(1):332-337.
[8] 朱紅路,李旭,姚建曦,等.基于小波分析與神經(jīng)網(wǎng)絡(luò)的光伏電站功率預(yù)測方法[J].太陽能學(xué)報(bào),2015,36(11):2725-2730.
ZHU Honglu,LI Xu,YAO Jianxi,et al. The power prediction method for photovoltaic power station based on wavelet analysis and neural networks[J]. Acta Energiae Solaris Sinica,2015,36(11):2725-2730.(In Chinese)
[9] GIORGI M G D,MALVONI M,CONDEGO P M. Comparison of strategies for multi-step ahead photovoltaic power forecasting models based on hybrid group method of data handling networks and least square support vector machine[J].Energy,2016,107:360-373.
[10]MALVONI M,GIORGI M G D,CONDEGO P M. Photovo-ltaic forecast based on hybrid PCA-LSSVM using dimensionality reducted data[J].Neurocomputing,2016,211:72-83.
[11]王新普,周想凌,邢杰,等.一種基于改進(jìn)灰色BP神經(jīng)網(wǎng)絡(luò)組合的光伏出力預(yù)測方法[J].電力系統(tǒng)保護(hù)與控制,2016,44(18):81-87.
WANG Xinpu,ZHOU Xiangling,XING Jie,et al. A prediction method of PV output power based on the combination of improved grey back propagation neural network[J].Power System Protection and Control,2016,44(18):81-87.(In Chinese)
[12]董雷,周文萍,張沛,等.基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的光伏發(fā)電短期概率預(yù)測[J].中國電機(jī)工程學(xué)報(bào),2013,33(增刊):38-45.
DONG Lei,ZHOU Wenping,ZHANG Pei,et al. Short-term photovoltaic output forecast based on dynamic Bayesian network theory[J]. Proceedings of the CSEE,2013,33(S):38-45.(In Chinese)
[13]JUNIOR J G D S F,OOZEKI T,OHTAKE H,et al. On the use of maximum likelihood and input data similarity to obtain prediction intervals for forecasts of photovoltaic power generation[J].Journal of Electrical Engineering & Technology,2015,10(3):1342-1348.
[14]LI Yanting,HE Yong,SU Yan,et al. Forecasting the daily power output of a grid-connected photovoltaic system based on multivariate adaptive regression splines[J].Applied Energy,2016,180:392-401.
[15]何正風(fēng).MATLAB概率與數(shù)理統(tǒng)計(jì)分析[M].北京:機(jī)械工業(yè)出版社,2012:277-283.
HE Zhengfeng. MATLAB probability and mathematical statistics analysis[M].Beijing: China Machine Press,2012:277-283.(In Chinese)endprint
[16]RASMUSEEN C E,WILLIAMS C K I. Gaussian Process for Machine Learning[M].MIT Press,2006.
[17]SNELSON E,RASMUSEEN C E,GHAHRAMANI Z. Warp-ed Gaussian Processes[J].Advances in Neural Information Processing Systems,2003,14: 337-344.
[18]李航.統(tǒng)計(jì)學(xué)習(xí)方法[M].北京:清華大學(xué)出版社,2012:137-151.
LI Hang.Statistical learning method[M].Beijing:Tsinghua University Press ,2012:137-151.(In Chinese)
[19]CHEN T,REN J. Bagging for Gaussian process regression[J]. Neurocomputing,2009,72(7/9):1605-1610.
[20]Global energy forecasting competition 2014[EB/OL]. 2014-08-15[2017-2-13].http://www.crowdanalytix.com/contests/global-energy-forecasting-competition-2014-probabilistic-solar-power-forecasting.
[21]HONG T,PINSON P,F(xiàn)AN S.Global energy forecasting competition 2012[J].International Journal of Forecasting,2014,30(2):357-363.
[22]PINSON P,NIELSEN H A,MOLLER J K,et al. Nonparametric probabilistic forecasts of wind power: required properties and evaluation[J].Wind Energy,2007,10(6): 497-516.endprint