李軍 杜雪
摘要:針對短期風(fēng)電功率預(yù)測,提出一類基于稀疏高斯過程(sparse gatlsSian processes,Sparse-GP)的概率預(yù)測方法。通過對數(shù)據(jù)集隨機(jī)劃分所形成的數(shù)據(jù)子集,給出基于數(shù)據(jù)點子集(subset of data-points,soD)近似、回歸子集(subset of regressors,soR)近似、投影過程(projected proeess,PP)近似算法的3種Sparse-GP方法,該方法不僅能給出模型的均值預(yù)測,而且能獲取模型的預(yù)測方差,這很好地解釋了模型置信水平。不同的sparse-GP方法在保持常規(guī)GP方法優(yōu)點的同時,還能解決GP方法隨著訓(xùn)練數(shù)據(jù)增加而產(chǎn)生的矩陣運(yùn)算困難等難題,且計算效率高。將具有不同協(xié)方差函數(shù)形式的sparse-GP方法應(yīng)用于不同地區(qū)的短期風(fēng)電功率單步與多步預(yù)測實例中,在同等條件下還與常規(guī)GP、sVM方法進(jìn)行對比。實驗結(jié)果表明,sparse-GP方法可以給出較好的預(yù)測效果,且適用于較大規(guī)模數(shù)據(jù)集的訓(xùn)練。
關(guān)鍵詞:稀疏高斯過程;風(fēng)電功率;概率預(yù)測;協(xié)方差函數(shù);近似算法
DoI:10.15938/j.emc.2019.08.009
中圖分類號:TM 614文獻(xiàn)標(biāo)志碼:A 文章編號:1007-449X(2019)08-0067-011
0引言
作為最重要的可再生清潔能源之一,風(fēng)能具有一定的隨機(jī)性、間歇性與不可控性,這些特性使得風(fēng)電場的風(fēng)力發(fā)電功率往往不易控制,給電網(wǎng)方式安排和調(diào)度運(yùn)行都帶來了困難和挑戰(zhàn)。準(zhǔn)確、可靠的風(fēng)電功率預(yù)測對于優(yōu)化電網(wǎng)運(yùn)行成本、提高電力系統(tǒng)可靠性都是至關(guān)重要的。目前,超短期、短期風(fēng)電功率預(yù)測由于能夠降低風(fēng)電功率波動性的影響,保證電力系統(tǒng)的穩(wěn)定運(yùn)行及可靠性,越來越引起研究者的廣泛關(guān)注。
前饋神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(support vector ma-chine,SVM)、進(jìn)化計算等人工智能方法在風(fēng)電功率的超短期與短期預(yù)測中已獲得了許多成功應(yīng)用。但是,這些方法一般僅能給出預(yù)測期望值的點預(yù)測,對風(fēng)電功率預(yù)測的不確定性不能給出定量描述。含風(fēng)電的電網(wǎng)規(guī)劃、運(yùn)行與安全穩(wěn)定分析領(lǐng)域則需要對風(fēng)電功率預(yù)測的波動趨勢范圍有較為準(zhǔn)確的估計,在給出模型均值點預(yù)測輸出的同時,還能給出預(yù)測的置信區(qū)間范圍,則更有助于評估依賴預(yù)測結(jié)果的決策風(fēng)險。因此,研究風(fēng)電功率的概率預(yù)測,在給出未來風(fēng)電功率期望預(yù)測值的同時,還提供風(fēng)電功率的預(yù)測區(qū)問或分布函數(shù),已成為當(dāng)前的重要研究方向之一。
高斯過程(gaussian processes,GP)作為貝葉斯機(jī)器學(xué)習(xí)方法之一,是一種概率意義上的核學(xué)習(xí)機(jī)。GP方法與SVM、核學(xué)習(xí)、正則化網(wǎng)絡(luò)等有著緊密聯(lián)系,以概率分布來表示先驗知識,在此基礎(chǔ)上構(gòu)建預(yù)測模型。與神經(jīng)網(wǎng)絡(luò)、SVM方法相比,GP方法的可調(diào)參數(shù)少,通過協(xié)方差函數(shù)的選擇和“超參數(shù)”的自適應(yīng)確定,能夠把先驗知識統(tǒng)一合并于模型中。在監(jiān)督機(jī)器學(xué)習(xí)的框架下,GP方法在給出模型預(yù)測均值的同時,還能獲取預(yù)測輸出方差,因此,其對模型置信度的解釋性更好。GP方法是概率預(yù)測建模的有力工具之一,近年來已應(yīng)用于混沌時間序列預(yù)測、短期風(fēng)速預(yù)測及交通流預(yù)測中,并取得了滿意的預(yù)測效果。文獻(xiàn)[17]則給出了另一種與SVM類似的稀疏概率建模方法一相關(guān)向量機(jī)(relevance vector machine,RVM),成功應(yīng)用于電力負(fù)荷預(yù)測中。
另一方面,與SVM方法類似,隨著訓(xùn)練數(shù)據(jù)集規(guī)模的增大,常規(guī)GP方法均會出現(xiàn)協(xié)方差矩陣或核矩陣運(yùn)算困難的問題,這導(dǎo)致其計算復(fù)雜度急劇增加,往往難以滿足矩陣計算時間和內(nèi)存空間的需求,在一定程度上限制了其應(yīng)用范圍。稀疏高斯過程方法(sparse gaussian process,sparse GP)方法采用矩陣稀疏近似算法,在保持常規(guī)GP方法優(yōu)點的同時,降低了矩陣計算的復(fù)雜度,能有效應(yīng)用于較大規(guī)模數(shù)據(jù)集的監(jiān)督學(xué)習(xí)中,從而也適用于具有較大規(guī)模數(shù)據(jù)集的回歸建模領(lǐng)域。
針對短期風(fēng)電功率預(yù)測,通過對訓(xùn)練數(shù)據(jù)集進(jìn)行隨機(jī)劃分,選取訓(xùn)練數(shù)據(jù)的子集,給出基于數(shù)據(jù)點子集(subset of datapoints,SoD)近似、回歸子集(subset of regressors,SoR)近似、投影過程(projectedprocess,PP)近似算法的3種不同Sparse-GP概率預(yù)測方法。為驗證所提Sparse-GP概率預(yù)測方法的有效性,將其應(yīng)用于不同地區(qū)的風(fēng)電功率單步與多步概率預(yù)測實例中,在同等條件下,還與常規(guī)GP、SVM方法進(jìn)行比較,同時還將進(jìn)一步分析不同Sparse-GP方法采用單一協(xié)方差函數(shù)及ARD特性的組合協(xié)方差函數(shù)時,對預(yù)測結(jié)果的影響。
基于訓(xùn)練數(shù)據(jù)集中所有n個數(shù)據(jù),SoR算法完成對GP的近似逼近求解。
1.3PP近似算法
作為一種降級GP,SoR算法可看作一種有限維廣義線性模型實現(xiàn)方式,SoD算法是一種非降級的GP實現(xiàn),但僅利用了m個數(shù)據(jù)點。投影過程(pro-jected process,PP)近似算法不僅能利用n個數(shù)據(jù),而且還是一種非降級的GP。因此,它又稱之為確定性訓(xùn)練條件(deterministic training conditional,DTC)逼近算法。
為了進(jìn)一步衡量Sparse-GP采用其他不同協(xié)方差函數(shù)的預(yù)測效果,表4、表5分別給出了采用不同的單一協(xié)方差函數(shù)以及單一協(xié)方差函數(shù)與ARD協(xié)方差函數(shù)先驗組合情形下,不同Sparse-GP及GP方法在訓(xùn)練結(jié)束后的目標(biāo)函數(shù)值以及測試集上的預(yù)測指標(biāo)對比。從表4看出,不同Sparse-GP與常規(guī)GP方法的預(yù)測結(jié)果相當(dāng),采用ARD協(xié)方差函數(shù)或NN協(xié)方差函數(shù)的Sparse-GP方法,其預(yù)測指標(biāo)最佳且略優(yōu)于表3中采用SE協(xié)方差函數(shù)的預(yù)測結(jié)果??傮w來看,采用ARD協(xié)方差函數(shù)能取得最好預(yù)測效果,且SoD算法略優(yōu)于SoR/PP算法的結(jié)果。
從表5看出,在采用ARD組合協(xié)方差函數(shù)情形下,常規(guī)GP方法的預(yù)測結(jié)果優(yōu)于表3、表4中采用其他單一形式協(xié)方差函數(shù)時的GP方法預(yù)測結(jié)果。Sparse-GP方法的MAPE、NMSE值要略優(yōu)于常規(guī)GP方法,其中,采用ARD與sE的組合協(xié)方差函數(shù)時,SoD算法獲得了最優(yōu)預(yù)測指標(biāo),采用ARD與Matv=5/2的組合協(xié)方差函數(shù)時,SoR/PP算法的預(yù)測指標(biāo)較占優(yōu),總體看,SoD算法的預(yù)測指標(biāo)略占優(yōu)。從分析結(jié)果看出,采用不同協(xié)方差函數(shù)的Sparse-GP及GP方法均可取得滿意的預(yù)測結(jié)果,其中采用ARD組合協(xié)方差函數(shù)的SoD算法的預(yù)測效果更好。
圖1~圖3分別給出了2015年5月8日~15日問,采用ARD與SED的組合協(xié)方差函數(shù)時,SoD、SoPdPP算法在測試集上與實際輸出的對比,同時給出了預(yù)測輸出方差,即誤差帶為預(yù)測值±2σ的概率區(qū)間輸出,其中σ為標(biāo)準(zhǔn)差。圖4進(jìn)一步給出了不同Sparse-GP方法的各點預(yù)測誤差比較,從圖1~圖4的結(jié)果清晰看出,不同Sparse-GP方法均取得了較好預(yù)測效果,且其均值預(yù)測完全位于置信區(qū)間內(nèi),這也驗證了Sparse-GP方法的概率預(yù)測效果。
3.2實例二
本小節(jié)實驗選取較大規(guī)模數(shù)據(jù)集的來自加拿大亞伯達(dá)省的國外某風(fēng)場實例,取2010年1月1日~4月8日之間的實測原始風(fēng)電功率數(shù)據(jù),采樣間隔為10min。實驗對連續(xù)相鄰兩個采樣點的數(shù)據(jù)進(jìn)行平均后作為預(yù)處理后的風(fēng)電功率值,即預(yù)處理后的采樣間隔是20min。取經(jīng)預(yù)處理后的2010年1月1日~3月11日問的約前5000組數(shù)據(jù)為訓(xùn)練數(shù)據(jù)集,其余為測試數(shù)據(jù)。預(yù)測目標(biāo)分別為提前20min及提前40min、60min的單步、多步預(yù)測。
為了對比不同Sparse-GP方法在測試集上進(jìn)行提前20min、40min和60min預(yù)測的效果,表6、表7分別給出采用單一協(xié)方差函數(shù)時,Sparse-GP方法的NMSE及MAPE指標(biāo)值。從表6~表7的結(jié)果看出,采用ARD協(xié)方差函數(shù)時,SoD、SoR/PP算法的NMSE值及MAPE值均最優(yōu),且SoD算法的NMSE略優(yōu)于SoR/PP算法,SoR/PP算法的MAPE值略占優(yōu)。
表8、表9進(jìn)一步分別給出了采用ARD組合協(xié)方差函數(shù)時,Sparse-GP方法的NMSE及MAPE指標(biāo)值比較。從表8看出,采用ARD與LIN組合的協(xié)方差函數(shù)時,SoD算法的NMSE值最優(yōu),采用ARD與sE組合的協(xié)方差函數(shù)時,SoR/PP算法的NMSE值最優(yōu),總體看,采用ARD與sE組合的協(xié)方差函數(shù)時,SoR/PP算法的NMSE值略占優(yōu)。
從表9看出,采用ARD與RQ的組合協(xié)方差函數(shù)時,SoD算法的MAPE值最優(yōu),采用ARD與LIN組合的協(xié)方差函數(shù)時,SoR/PP算法的MAPE值最優(yōu)??傮w看,采用ARD與LIN的組合協(xié)方差函數(shù)時,SoR/PP算法的MAPE值略占優(yōu)。表6~表9的結(jié)果表明,基于不同協(xié)方差函數(shù)的Sparse-GP方法均可以取得較好的預(yù)測結(jié)果,其中,采用ARD組合協(xié)方差函數(shù)時可獲得最好的預(yù)測效果,這也表明了其魯棒性好。
圖6~圖8分別給出了采用ARD協(xié)方差函數(shù)時,不同Sparse-GP方法進(jìn)行對2010年3月12日~4月8日之間的測試數(shù)據(jù)集進(jìn)行提前20min預(yù)測的輸出值與實際值對比,圖中還給出了位于95%置信區(qū)間下的預(yù)測誤差帶,即預(yù)測值±2σ的概率區(qū)間輸出。圖9進(jìn)一步給出SoD、SoR/PP算法的各點預(yù)測誤差對比。從圖6~圖9的結(jié)果看出,在較大規(guī)模數(shù)據(jù)集訓(xùn)練情形下,不同Sparse-GP方法均可取得了滿意的概率預(yù)測效果。
4結(jié)論
考慮到風(fēng)電功率具有隨機(jī)性與間歇性的特點,且進(jìn)一步考慮到隨著數(shù)據(jù)集的規(guī)模增加,現(xiàn)有常規(guī)GP或SVM方法會遇到矩陣運(yùn)算困難等缺點,采用時間序列建模的方式,提出一類基于Sparse-GP的預(yù)測方法。與常規(guī)GP方法相比,通過隨機(jī)劃分訓(xùn)練數(shù)據(jù)活動子集,所給出的SoD、SoR、PP 3種算法的計算復(fù)雜度有效降低,計算效率高。
通過不同地區(qū)風(fēng)場的短期風(fēng)電功率時間序列單步與多步預(yù)測實例進(jìn)行驗證,本文的實驗結(jié)果表明,分別采用單一協(xié)方差函數(shù)及組合協(xié)方差函數(shù)的Sparse-GP或GP方法,均可以給出較好預(yù)測效果,這也體現(xiàn)了該方法的魯棒性。其中,采用ARD協(xié)方差函數(shù)或ARD組合協(xié)方差函數(shù)時,Sparse-GP方法的預(yù)測效果更好。這也表明了Sparse-GP及GP方法可以將先驗知識與數(shù)據(jù)完美結(jié)合,能提供一個模型選擇與學(xué)習(xí)的貝葉斯建??蚣軔?,對模型的解釋性與透明性好,模型的推廣性好且具有一定的魯棒性。因此,作為一種適應(yīng)性更強(qiáng)的概率預(yù)測模型,Sparse-GP方法在風(fēng)電功率預(yù)測領(lǐng)域?qū)⒕哂泻芎玫膽?yīng)用潛力。