王 翔
(華北電力大學(xué),北京 102206)
電價作為電力系統(tǒng)實行市場化運行的核心內(nèi)容,很大程度上決定了市場參與者的成本與利潤。發(fā)電商需要準(zhǔn)確預(yù)測電價以便做出競標(biāo)策略,來規(guī)避風(fēng)險,追求最大收益;供電企業(yè)也需要根據(jù)準(zhǔn)確的電價預(yù)測信息來規(guī)劃其在現(xiàn)貨市場和長期雙邊合同中購電量的最優(yōu)購買分配方案;投資者也同樣需要參考準(zhǔn)確的電價預(yù)測信息做出正確的投資決策。因此,準(zhǔn)確的電價預(yù)測已成為電力市場各參與者共同關(guān)注的焦點[1]。
然而,由于影響因素眾多[2],如系統(tǒng)負(fù)荷需求,燃料價格,國民經(jīng)濟發(fā)展水平,市場參與者對電價的預(yù)期等,電價常表現(xiàn)出較強的波動性與隨機性,使得準(zhǔn)確預(yù)測電價的成為電力市場眾多的研究難點之一。
近年來,眾多學(xué)者專家就短期電價預(yù)測進(jìn)行了大量的研究,嘗試了多種預(yù)測模型和方法。現(xiàn)有的電價預(yù)測方法大致可分為兩類,即市場模擬法和基于歷史數(shù)據(jù)的預(yù)測方法。
市場模擬法,如隨機生產(chǎn)模擬[3-4],是通過模擬電力市場的競爭運營,來預(yù)測市場價格,但是,由于模擬法需要大量的系統(tǒng)、數(shù)據(jù)結(jié)構(gòu),計算量大,從而限制了其在較大電力系統(tǒng)中的應(yīng)用,并且在進(jìn)行模擬實體或環(huán)境條件實驗時,難以完全表現(xiàn)真實情境,容易出現(xiàn)對知識的片面理解,從而導(dǎo)致實驗準(zhǔn)確度不高;基于歷史數(shù)據(jù)的預(yù)測方法,如神經(jīng)網(wǎng)絡(luò)模型[5-8],支持向量機[9],時間序列法[10-13]和組合預(yù)測法[14-17]等,其特點是所需要的數(shù)據(jù)量相對較少,主要利用電價的長期歷史數(shù)據(jù)來預(yù)測市場價格。在基于歷史數(shù)據(jù)的概率學(xué)預(yù)測研究方面,文獻(xiàn)[18]基于非線性分位數(shù)回歸理論,利用神經(jīng)網(wǎng)絡(luò)計算概率分布,文獻(xiàn)[19]把支持向量回歸與核密度估計結(jié)合來計算概率密度函數(shù)。以上研究均未考慮時間因素的影響。文獻(xiàn)[20]考慮到電價的時序性特點,建立自回歸條件異方差模型對電價進(jìn)行預(yù)測,但是對計算量較大,電價波動異常,電價序列相鄰時段相關(guān)性較弱的電力市場來說,適用性較差。
本文提出了一種基于標(biāo)簽分布學(xué)習(xí)森林(Label Distribution Learning Forests,LDLFs)的電價概率預(yù)測模型,主要考慮負(fù)荷對實時電價的影響,與上述主要對短期電價進(jìn)行點預(yù)測的預(yù)測方法相比,基于LDLFs的電價預(yù)測模型能得到實時電價的概率密度函數(shù),它比點預(yù)測更能體現(xiàn)出電價的不確定性,可為發(fā)/售電提供更多的有用信息,這對電價波動異常的電力市場同樣適用。該模型由一個線性模型和可微決策森林組成,以電價、時間與負(fù)荷數(shù)據(jù)做輸入特征,經(jīng)線性變換得到新的抽象特征,然后隨機指派到分裂結(jié)點,在分裂結(jié)點的概率分裂函數(shù)下劃分到左右子樹,最終由葉子結(jié)點輸出電價的概率密度函數(shù)。在新加坡電力市場的電價數(shù)據(jù)集上的實驗結(jié)果顯示,本文所提方法不僅體現(xiàn)了電價的不確定性,而且與其他概率預(yù)測方法相比具有較高的預(yù)測精度。
標(biāo)簽分布學(xué)習(xí)(LabelDistributionLearning,LDL)是一個處理分類問題中標(biāo)簽?zāi):詥栴}的學(xué)習(xí)框架。LDL不是為一個實例分配一個或多個標(biāo)簽,而是學(xué)習(xí)對于給定實例的描述中標(biāo)簽間的相對重要性,例如一組標(biāo)簽集合的分布,在人臉年齡估計、影評打分預(yù)測等任務(wù)中有了初步的應(yīng)用。標(biāo)簽分布學(xué)習(xí)可以形式化為如下問題:
令X=Rm表示輸入空間[21],Y={y1,y2,…,yc}表示完成的標(biāo)簽集,其中C是可能標(biāo)簽值的個數(shù)。那么,標(biāo)簽分布學(xué)習(xí)問題可以看作,對于每一個樣本x∈X,都有一個標(biāo)簽分布這里,表示樣本x屬于第c個標(biāo)簽yc的概率,因此滿足約束條件LDL的目標(biāo)是學(xué)習(xí)輸入樣本x和它對應(yīng)的標(biāo)簽分布d之間的映射函數(shù)g:x→d。
標(biāo)簽分布學(xué)習(xí)的方法包括最大熵模型及表示、Boosting和SVR擴展等方法,但是它們要么由于模型的指數(shù)部分限制了分布形式的泛化,要么在表示學(xué)習(xí)上的局限性導(dǎo)致無法端到端的學(xué)習(xí)抽象特征。Shen等人[22]提出利用標(biāo)簽分布學(xué)習(xí)森林解決標(biāo)簽分布學(xué)習(xí)問題,得到了很好的效果。
受到標(biāo)簽分布學(xué)習(xí)森林的啟發(fā),本文提出基于標(biāo)簽分布學(xué)習(xí)森林的電價概率預(yù)測模型,將標(biāo)簽分布學(xué)習(xí)中的離散標(biāo)簽學(xué)習(xí)問題擴展到電價概率預(yù)測領(lǐng)域中的連續(xù)概率密度函數(shù)問題。具體概率預(yù)測模型如圖1所示。
圖1 標(biāo)簽分布學(xué)習(xí)森林電價概率預(yù)測模型流程圖
本模型由一個線性函數(shù)f和多個可微決策樹形成的可微決策森林組成。
一顆決策樹包括一組分裂節(jié)點N和一組葉子節(jié)點L。在每個分裂節(jié)點n∈N定義了一個分裂函數(shù)該函數(shù)以為參數(shù),決定一個樣本應(yīng)該被放入左子樹還是右子樹,每個葉子節(jié)點具有一個在標(biāo)簽集Y上的分布為了構(gòu)建一個可微決策樹[23],使用概率分裂函數(shù)其中σ(·)是一個sigmoid函數(shù),φ(·)是一個索引函數(shù),將函數(shù)的第個輸出與分裂節(jié)點n聯(lián)系上,f:x→RM是一個依賴于樣本x和參數(shù)Θ的實值特征學(xué)習(xí)函數(shù)。
分裂節(jié)點和函數(shù)f的輸出單元之間的聯(lián)系由φ(·)表示,在樹的學(xué)習(xí)之前是隨機產(chǎn)生的,之后,樣本x落入葉子節(jié)點l的概率:
其中,1(·)是指示函數(shù),分別代表節(jié)點n的左子樹和右子樹所擁有的葉子節(jié)點的集合,最終得到樹τ的輸出,即映射函數(shù)g定義為:
和其他模型相比,標(biāo)簽分布學(xué)習(xí)森林的優(yōu)點在于整個模型從原始特征輸入到電價概率輸出是一個端到端的學(xué)習(xí)過程,在整個模型訓(xùn)練過程中無需再對數(shù)據(jù)進(jìn)行處理。模型一體化學(xué)習(xí)的能力極大地減輕了工作量。
本文以2017年新加坡電力數(shù)據(jù)集為實證研究對象。由于電價是一個時間序列,因此,本文選取前十個點的電價、負(fù)荷及時刻點作為特征來預(yù)測第十一個點的電價,采取十折交叉驗證進(jìn)行試驗。
在進(jìn)行預(yù)測之前,先對數(shù)據(jù)進(jìn)行歸一化處理以消除量綱影響:
式中:為第j個指標(biāo)第i個樣本歸一化值;xij為該樣本指標(biāo)原始值;xj_min為第j個指標(biāo)所有樣本中的最小值;xj_max為第j個指標(biāo)所有樣本中的最大值。
由于模型得到的是電價的概率密度曲線,用之前點預(yù)測的損失函數(shù)來衡量預(yù)測誤差的效果并不理想,這里采用相對熵(Kullback-Leibler divergence,KLD)方法來度量。
相對熵的一般表達(dá)式為:
式中:p(x)為電價的真實概率密度,q(x)為預(yù)測電價概率密度,n為樣本可能標(biāo)簽值的個數(shù)。
實驗采用能源市場資源股份有限公司(Energy Market Company PteLtd)在新加坡電力市場的經(jīng)營數(shù)據(jù),選取2017年3月1日到5月30日批發(fā)電價及需求負(fù)荷數(shù)據(jù)作為測試算例,每隔半個小時一個數(shù)據(jù)點,共4416個數(shù)據(jù)點。考慮到電價是個時序特征,本文將相應(yīng)時刻點與星期得到獨熱向量,也作為特征輸入,采用十折交叉驗證進(jìn)行了大量的預(yù)測驗證工作,下面給出預(yù)測結(jié)果:
圖2是3月1日到5月30日間隨機抽取某一天的短期電價預(yù)測結(jié)果與真實結(jié)果概率密度曲線的對比,可以看出,在經(jīng)過500次迭代后,預(yù)測曲線已經(jīng)非常接近真實曲線,此時KLD=0.109014。從圖3上可以明顯看出,預(yù)測電價峰值總出現(xiàn)在真實電價周圍,且相距很近,預(yù)測結(jié)果良好。
圖2 真實電價與預(yù)測電價概率密度曲線對比圖
圖3 真實電價與預(yù)測電價峰值對比圖
為了更好地說明本文方法的預(yù)測效果,采用相同數(shù)據(jù),用另外三種模型對2017年5月31日的24個時間段進(jìn)行電價預(yù)測。
第一種為支持向量分位回歸模型(support vector quantile regression,SVQR),以0.01為步長選取100個分位點分別進(jìn)行訓(xùn)練,將訓(xùn)練得到的模型預(yù)測結(jié)果經(jīng)統(tǒng)計得到電價概率密度曲線;第二種同樣選取100個分位點,但在綜合預(yù)測結(jié)果時采取核密度估計(Kernel density estimation,KDE)的方法;第三種采取本文提出方法,但是不包含時刻點。4種模型的電價預(yù)測結(jié)果如表1所示。
表1 各方法日前電價數(shù)據(jù)對比
與其他三種方法相比,本文提出的方法對于電價波動較大的電力市場來說仍具有比較好的預(yù)測精度。同時,考慮到電價的時序性特點,本文將時間作為特征輸入,事實證明,考慮時間序列的LDLFs模型能得到更好的實時電價預(yù)測結(jié)果。
表2 各方法日平均百分比誤差比較
針對電力市場中電價時間序列的非平穩(wěn)隨機性特點,本文提出了基于標(biāo)簽分布學(xué)習(xí)森林的電價概率預(yù)測模型。通過對新加坡電力市場歷史數(shù)據(jù)的驗證,得出以下結(jié)論:
⑴ 本文方法充分考慮到了電價的時序性,將時刻點也納入考慮范圍;
⑵ 本文模型所得結(jié)果體現(xiàn)了電價非平穩(wěn)隨機性的特點,同時具有一定精度;
⑶ 本文所提方法在進(jìn)行算例測試時,較對比模型取得了更好的預(yù)測效果,對一些電價波動異常的時刻點也同樣適用,這說明線性函數(shù)與可微隨機森林的組合算法可以較好地處理電價概率預(yù)測問題。
參考文獻(xiàn)(References):
[1]劉麗燕,鄒小燕.GARCH族模型在電力市場電價預(yù)測中的比較研究[J].電力系統(tǒng)保護(hù)與控制,2016.44(4):57-63
[2]劉達(dá),牛曉東,楊光.電力市場中的電價影響因素[J].陜西電力,2009.1:9-12
[3] H.Y Yamin.Adaptive short-term electricity price forecasting using artificial neural networks in the restructured power markets[J].International Journal of Electrical Power&Energy Systems,2004.26(8):571-581
[4]Florian Ziel,Rick Steinert.Electricity Price Forecast using Sale and Purchase Curves:The X-Model[J].Energy Economics,2016.59(3):435-454
[5]王萌,景志濱,孫兵,等.基于BP神經(jīng)網(wǎng)絡(luò)的短期市場出清電價預(yù)測[J].中國電力教育,2011.30:100-102
[6]翁陳宇.基于神經(jīng)網(wǎng)絡(luò)的短期電價預(yù)測[D].西南交通大學(xué)碩士學(xué)位論文,2007.
[7]Zabir Haider Khan,Tasnim Sharmin Alin,Akter Hussain.Price Prediction of Share Market Using Artificial Neural Network 'ANN'[J]. InternationalJournal of Computer Application,2011.22(2):42-47
[8]吳興華,周暉.基于減法聚類及自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)的短期電價預(yù)測[J].電網(wǎng)技術(shù),2007.19:69-73
[9]Yao Gao Chen,Guangwen Ma,Electricity Price Forecasting Based on Support Vector Machine Trained by Genetic Algorithm[C],2009:292-295
[10]趙軍.基于區(qū)域和時間序列及電價政策的電網(wǎng)負(fù)荷建模研究[J].華東電力,2017.9:104-105
[11]寧藝飛,陳星鶯,顏慶國等.分時電價下大用戶概率響應(yīng)建模研究[J].電力需求側(cè)管理,2017.19(1):22-28
[12]鄧佳佳,黃元生,宋高峰.基于非參數(shù)GARCH的時間序列模型在日前電價預(yù)測中的應(yīng)用[J].電網(wǎng)技術(shù),2012.36(4):190-196
[13]夏君常.電力市場短期電價預(yù)測的時間序列模型研究[D].重慶大學(xué)碩士學(xué)位論文,2011.
[14]Akash Saxena,Sinrath Lal Surana,Deepak Saini.Hybrid Approach of Addictive and Multiplicative Decomposition Method for Electricity Price Forecasting[J],2017.
[15]Deepak Sain,Akash Saxena,R.C Bansal.Electricity price forecasting by linear regression and SVM[C],2017.
[16]Abbas Rahimi Gollou,Noradin Ghadimi,Abbas Rahimi Gollou等.A new feature selection and hybrid forecast engine for day-ahead price forecasting of electricity market[J].JournalofIntelligent& Fuzzy Systems,2017:1-15
[17]牛麗肖,王正方,臧傳治等.一種基于小波變換和ARIMA的短期電價混合預(yù)測模型[J].計算機應(yīng)用研究,2014.31(3):688-691
[18]何耀耀,許啟發(fā),楊善林等.基于RBF神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸的電力負(fù)荷概率密度預(yù)測方法[J].中國電機工程學(xué)報,2013.33(1):93-98
[19]何耀耀,聞才喜,許啟發(fā),撖奧洋.考慮溫度因素的中期電力負(fù)荷概率密度預(yù)測方法[J].電網(wǎng)技術(shù),2015.39(1):176-181
[20]劉麗燕.基于非參數(shù)GARCH模型的電力市場日前電價預(yù)測研究[D].重慶師范大學(xué)碩士學(xué)位論文,2016.
[21]X Geng.Label Distribution Learning.IEEE Trans.Knowl.Data Eng.,2016.28(7):1734-1748
[22]Shen W,Zhao K,Guo Y等.Label Distribution Learning Forests[C].In Advances in Neural Information Processing Systems,2017:834-843
[23]P.Kontschieder,M.Fiterau,A.Criminisi等.Deep neural decision forests[J].ICCV,2015:1467-1475