張強 歐淵 沈曉東 唐冬來
摘? 要:售電量預(yù)測的精度是影響售電公司利潤的一個重要因素。傳統(tǒng)售電量預(yù)測方法難以解決售電量數(shù)據(jù)序列的趨勢性、周期性與隨機性等問題。為此,本文提出一種多模型融合的售電量預(yù)測方法。首先,采用基于經(jīng)驗?zāi)B(tài)分解方法將日和月度售電量分解為高、中、低頻分量,構(gòu)建三種獨立的基模型,分別對不同頻分量進行預(yù)測;然后,基于歷史數(shù)據(jù)和同期的外部因素,包括時間和天氣條件等數(shù)據(jù),獨立訓(xùn)練基模型,再將各基模型的輸出進行融合獲得售電量預(yù)測數(shù)據(jù)。本文采用均方根誤差和平均絕對百分誤差作為評價標(biāo)準(zhǔn)。實驗結(jié)果表明,本文所提融合模型對比傳統(tǒng)單模型有更高的預(yù)測精度,且相比現(xiàn)有預(yù)測算法,融合模型預(yù)測更加準(zhǔn)確和穩(wěn)定。
關(guān)鍵詞:經(jīng)驗?zāi)B(tài)分解? 多模型融合? 售電量預(yù)測? 深度學(xué)習(xí)
中圖分類號:TU 47 ? ? ? ? ?文獻標(biāo)識碼:A? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2021)02(c)-0037-06
A Model Fusion Electricity Sales Forecasting Model Based on Empirical Modal Decomposition
ZHANG Qiang1? OU Yuan1? SHEN Xiaodong2*? TANG Donglai1
(1.Aostar Information Technologies Co., Ltd., Chengdu, Sichuan Province, 610041 China; 2.College of Electrical Engineering, Sichuan University, Chengdu, Sichuan Province, 610065 China)
Abstract:The precision of electricity sales forecast is an important factor affecting the profit of electricity sales companies. It is difficult to solve the trend, periodicity and randomness of data series of electricity sold by traditional forecasting methods. Therefore, this paper proposes a multi-model fusion method for electricity sales prediction. Firstly, daily and monthly electricity sold were decomposed into high, medium and low frequency components by empirical modal decomposition method. Three independent base models were constructed to predict different frequency components respectively. Then, based on the historical data and external factors of the same period, including time and weather conditions, the independent training base model was used, and then the output of each base model was fused to obtain the forecast data of electricity sales. In this paper, root mean square error and mean absolute percentage error are used as evaluation criteria. Experimental results show that the proposed fusion model has higher prediction accuracy than the traditional single model, and the fusion model is more accurate and stable than the existing prediction algorithms.
Key Words: Empirical modal decomposition; Multi model fusion; Electricity consumption forecast; Deep learning
隨著新一輪電改的逐步深入,電力交易市場進一步放開,售電市場逐步放開,產(chǎn)生了很多售電公司,但由于目前國內(nèi)尚未建立成熟的電力現(xiàn)貨市場機制,偏差電量考核成為了影響售電公司利潤的一個重要因素[1]。目前,降低偏差電量的方法多采用精確感知用戶行為、可控負荷調(diào)整[2]和基于市場交易的方式。但是,可控負荷的調(diào)整和基于市場交易的方式,可操作性差,主要還是停留在概念層面, 且能調(diào)整的幅度較小。在電力市場背景下,更加精確的用戶行為感知,將會最小化購售電偏差,降低由于偏差考核較大所帶來的懲罰費用,提高自身收益[3-4]。
傳統(tǒng)的用戶行為感知研究主要著眼于負荷預(yù)測。節(jié)點負荷與運行狀況緊密相關(guān),直接受到氣候條件等外部因素的影響,故當(dāng)前的負荷預(yù)測主要通過分析外部因素及節(jié)點的歷史負荷數(shù)據(jù)以實施預(yù)測。按照其所采用的預(yù)測算法,可以分為兩類:基于統(tǒng)計的方法和人工智能方法?;诮y(tǒng)計分析的方法,主要采用多元回歸分析、自回歸和滑動平均模型(ARMA)等技術(shù)進行?;谌斯ぶ悄芗夹g(shù)的算法,包括傳統(tǒng)的機器學(xué)習(xí)方法,即通過特征工程構(gòu)造并提取相應(yīng)的特征,并通過支持向量機等機器學(xué)習(xí)模型進行負荷預(yù)測;以及深度學(xué)習(xí)算法,即基于LSTM、GRU等神經(jīng)網(wǎng)絡(luò)架構(gòu)進行特征的自主學(xué)習(xí)并實施預(yù)測。上述提到的應(yīng)用于負荷預(yù)測的方法基本都是單一模型,文獻[5-6]提出使用模型組合的方式來提高預(yù)測精度并增強模型泛化能力,融合的方法主要是采用簡單的均值計算。然而各個模型對預(yù)測結(jié)果的作用是不同的,采用取平均的方法不能體現(xiàn)出這一點。
上述方法可用于日前或月前預(yù)測,但無法滿足售電市場中年度雙邊協(xié)商交易和月度集中競價交易對不同時間維度的預(yù)測需要。本文提出一種多模型融合的售電量預(yù)測方法。采用基于經(jīng)驗?zāi)B(tài)分解方法將日和月度售電量分解為高、中、低頻分量,構(gòu)建三種獨立的基模型,分別對不同頻分量進行預(yù)測?;跉v史數(shù)據(jù)和同期的外部因素,包括時間和天氣條件等數(shù)據(jù),獨立訓(xùn)練基模型,再將各基模型的輸出進行融合獲得售電量預(yù)測數(shù)據(jù)。
1? 基于經(jīng)驗?zāi)B(tài)分解的日和月度售電量分解
日和月售電量受溫度變化、環(huán)境變化、節(jié)假日、季節(jié)變化、產(chǎn)業(yè)發(fā)展以及經(jīng)濟結(jié)構(gòu)變化等外部環(huán)境因素的影響,呈現(xiàn)出明顯的趨勢性、周期性與隨機性。針對這三種特性采取不同的預(yù)估方法能減少各分量之間的相互影響。因此本文經(jīng)驗?zāi)B(tài)分解法(empirical mode decomposition, EMD )對日和月用電量序列進行分解,針對各分量不同特征進行處理。
經(jīng)驗?zāi)B(tài)分解能夠有效地分解非平穩(wěn)、非線性的時間序列,與傳統(tǒng)分解方法相比的優(yōu)點在于:在分解序列之前不必預(yù)先設(shè)置基函數(shù),在實際的分解過程中對任何類型的非平穩(wěn)、非線性信號都能夠得到較好的分解結(jié)果,并且具有很高的信噪比。EMD算法認(rèn)為信號由不同的IMF分量組合而成,并且這些分量同時具備線性和非線性特點。EMD分解的步驟如下。
(1)求出原始信號的極大值和極小值,而后按照找到的極大值和極小值得到上下的包絡(luò)線和。
(2)計算均值m(t)和差值d(t):
(1)
(2)
(3)如果d(t)滿足IMF上述所必需的兩個條件,則將其作為第一個IMF分量,記做c1,如果不符合條件重新執(zhí)行前兩個步驟,直到符合IMF分量的必要條件。將第一個IMF分量c1從信號中分離出來,可以得到殘余序列r1。
(3)
(4)將殘余序列r1重新進行步驟1和步驟2,當(dāng)rn單調(diào)或者小于預(yù)先設(shè)置的的常數(shù)值時,結(jié)束分解,此時的原始信號會被分解成n-1個IMF分量ci并得到最終的殘余分量rn,并且這些IMF分量包含了原始信號中的局部特征信息。EMD分解的完整過程可以由式(4)表示。
(4)
2? 各融合模型
2.1 基于注意力機制的長短時記憶網(wǎng)絡(luò)模型
LSTM網(wǎng)絡(luò)是一種改進的時間循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),用于處理時序信號。LSTM基本單元主要由輸入門、輸出門、遺忘門組成。在基本單元處理信息的過程中,最重要的是單元狀態(tài)的傳遞,即圖1中上方從ct-1到ct的水平線,它將信息從上一個單元傳遞到下一個單元。
LSTM單元根據(jù)t-1時刻記憶單元狀態(tài)值ct-1、隱藏層t-1時刻輸出值ht-1和t時刻輸入值,計算t時刻隱藏層輸出值ht。
Attention Model是一種模擬人腦注意力的機制模型,其目的是使神經(jīng)網(wǎng)絡(luò)有選擇地關(guān)注輸入特征,并將學(xué)習(xí)到的特征權(quán)重保存賦值給下一個時間步長的輸入向量,利用權(quán)值矩陣分配注意力,從而突出關(guān)鍵輸入特征對負荷預(yù)測的影響。
本文采用的注意力機制模型的第二層LSTM節(jié)點的輸出值表示Attention結(jié)構(gòu)的輸入特征序列,也作為Attention第一層隱藏層中的狀態(tài)值;表示當(dāng)序列點經(jīng)過注意力系數(shù)加權(quán)后的向量,是Attention最后一層隱藏層中所保存的向量,也是Attention層的輸出。
2.2 隨機森林模型
隨機森林是Beriman在2001年提出的一種基于Bagging算法的機器學(xué)習(xí)集成算法。隨機森林算法步驟如下:
(1)假設(shè)有無功負荷原始數(shù)據(jù)集A,則有放回的從A中隨機采樣生成n個訓(xùn)練集;
(2)利用每個訓(xùn)練集ai組成其對應(yīng)的決策樹,在決策樹的每個節(jié)點有M個特征,隨機從這M個特征中選取出m(mM)2)個特征作為當(dāng)前節(jié)點的分裂特征集,在每個節(jié)點上根據(jù)Gini系數(shù)選取最優(yōu)特征對該節(jié)點進行分裂;
(3)決策樹形成的過程中每個節(jié)點都要按照步驟2來分裂,假設(shè)重復(fù)以上步驟k次,構(gòu)造k棵最優(yōu)決策樹組成隨機森林;
(4)使用隨機森林進行決策,假設(shè)y代表輸出的負荷預(yù)測值,ti表示單棵決策樹,R為隨機森林模型,則決策公式為:
(5)
匯總每個決策樹對數(shù)據(jù)集的預(yù)測結(jié)果,得票數(shù)最多的預(yù)測值為最后的預(yù)測結(jié)果。隨機森林的隨機性體現(xiàn)在每顆數(shù)的訓(xùn)練樣本是隨機的,樹中每個節(jié)點的分類屬性也是隨機選擇的。有了這兩個隨機的保證,隨機森林就不會產(chǎn)生過擬合的現(xiàn)象了,并且實現(xiàn)簡單,計算資源開銷小。
2.3 XGBoost模型
XGBoos是一種廣泛使用的集成學(xué)習(xí)算法,是對傳統(tǒng)的Boosting算法的改進。傳統(tǒng)思路是結(jié)合多個弱學(xué)習(xí)器,每個弱學(xué)習(xí)器是一個CART回歸樹,然后對其輸出線性求和從而優(yōu)化模型。XGBoost模型表示如下所示:
(6)
式中,為第i個樣本的預(yù)測值;K為樹的數(shù)目,L為樹的集合空間;表示第i個數(shù)據(jù)點的特征向量;對應(yīng)第k棵樹獨立的樹的結(jié)構(gòu)q和葉子節(jié)點權(quán)重w的相關(guān)狀況。
3? 基于經(jīng)驗?zāi)B(tài)分解的多模型融合模型
具體的建模步驟如下:
(1)運用EMD分解算法得到多個不同的子序列。
(2)依據(jù)將序列分為高、中、低頻三類。
(3)分別使用基于注意力機制的長短時記憶網(wǎng)絡(luò)模型、隨機森林和XGBoost對高、中、低頻序列進行預(yù)測,分別得到各個子序列的預(yù)測結(jié)果。
(4)疊加并重構(gòu)各個子序列的預(yù)測結(jié)果,得到實際的預(yù)測結(jié)果。
4? 算例分析
本文實驗設(shè)備為Windows10 64位操作系統(tǒng),處理器為Intel(R) Core(TM)i5-8400 CPU @ 2.80GHz,內(nèi)存為8GB,硬盤4T,GPU顯卡GTX1080Ti11G。軟件架構(gòu)采用基于TensorFlow框架的Keras深度學(xué)習(xí)工具進行開發(fā)。Keras支持現(xiàn)代人工智能領(lǐng)域的主流算法,包括前饋結(jié)構(gòu)和遞歸結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),也可以通過封裝參與構(gòu)建統(tǒng)計學(xué)習(xí)模型。
4.1 數(shù)據(jù)準(zhǔn)備
本文實驗使用某省電力市場2018年交易數(shù)據(jù)作為基礎(chǔ)樣本,參考廣東電力市場月度偏差電量考核方式。
時間規(guī)則包括三個方面:首先,工業(yè)用電是當(dāng)今電力系統(tǒng)的主要負荷,由于政策因素,法定節(jié)假日的工業(yè)用電與其他時間極為不同,對售電量預(yù)測結(jié)果會產(chǎn)生一定的影響。本文中對于節(jié)假日和非節(jié)假日,分別用1和2表示;其次,以周為單位時段,工業(yè)、商用和民用用電均在一定程度上表現(xiàn)出周期性。本文使用0、1表示周六、周日,2~6表示周一到周五。最后,受用電習(xí)慣影響,一天之中白天的負荷遠高于夜間。本文將單日分為22:00~6:59和7:00~21:59,分別用1和2表示。以上三個尺度的信息構(gòu)成了售電量的時間特征。
天氣信息也是影響預(yù)測精度的關(guān)鍵外部因素,包括溫度條件和氣象條件兩類:溫度條件包括平均溫度、最高溫度和最低溫度。氣象條件包括濕度、風(fēng)速、氣壓和天氣類型。本文中所采用的天氣數(shù)據(jù)均來源于中國氣象網(wǎng)。
本文使用的輸入數(shù)據(jù)包含的特征如表1所示。在訓(xùn)練模型時候我們用向量來表示t時刻的數(shù)據(jù)點,其中包含了表1中所述的12個特征,然后用一個輸入序列來預(yù)測相應(yīng)的售電量輸出序列,yt表示t時刻未來時刻的售電量。
4.2 數(shù)據(jù)預(yù)處理
本文采用min-max數(shù)據(jù)標(biāo)準(zhǔn)化將原始數(shù)據(jù)進行歸一化處理,縮小其動態(tài)范圍,如式(7)所示。
(7)
式中,q*為標(biāo)準(zhǔn)化后的售電量;,分別為數(shù)據(jù)中的最大值和最小值。
4.3 誤差指標(biāo)
本文采用平均相對誤差(mean absolute percentage error, MAPE)和均方根誤差(root mean squard error, RMSE)用以評判模型預(yù)測的準(zhǔn)確性,計算公式為:
(8)
(9)
式中:為預(yù)測值;yt為實際值;N為總的樣本個數(shù)。
4.4 EMD分解
通過對原始的售電量時間序列進行經(jīng)驗?zāi)B(tài)分解,逐步分離出了11組IMF分量與1組殘余分量,分解結(jié)果如圖1所示。
從圖1的分解結(jié)果中可以看出,對于不同頻率的IMF分量,頻率較低的序列平穩(wěn)性大大提高,波動性較低。對于高頻的IMF分量,其隨機性和波動性十分明顯,無明顯規(guī)律可言。針對每個分量序列,可以通過大小將其大致分為高、中、低頻三類。
4.5 驗證融合模型的預(yù)測性能
為驗證本文所提出融合模型在進行短期售電量預(yù)測的性能,本節(jié)以2018年的數(shù)據(jù)作為訓(xùn)練集。
圖2為訓(xùn)練好的3個基模型和融合模型在測試集上的預(yù)測曲線圖??捎^察到,隨機森林RF的預(yù)測曲線比真實值偏高,XGBoost的預(yù)測曲線比偏低,Attention-LSTM的曲線擬合的程度最好。
本文選擇支持向量機回歸SVR模型[7]和人工神經(jīng)ANN網(wǎng)絡(luò)模型[8]與本文的融合模型進行橫向?qū)Ρ?,SVR和ANN模型結(jié)構(gòu)與參考文獻中相同。如圖3和圖4所示為三個模型在測試集上的MAPE和RMSE對比。可以看到融合模型的RMSE和MAPE值都是最優(yōu)。
4.6 驗證融合模型的穩(wěn)定性
模型在不同時間長度上的預(yù)測情況可以反映其穩(wěn)定性的強弱。因此為了驗證本文所提融合模型的穩(wěn)定性,選取數(shù)據(jù)集中12月份的第一天以及當(dāng)月分別建立天測試集和月測試集,使用本文方法進行預(yù)測。實驗結(jié)果如表2所示,可以看到在兩個測試集上本文所提的融合模型的RMSE和MAPE都最優(yōu),表明本文方法進行預(yù)測的預(yù)測精度和穩(wěn)定性都更強。
5? 結(jié)語
售電量預(yù)測的精度是影響售電公司收益的主導(dǎo)因素。本文提出一種多模型融合的售電量預(yù)測方法。采用基于經(jīng)驗?zāi)B(tài)分解方法將日和月度售電量分解為高、中、低頻分量,構(gòu)建三種獨立的基模型,分別對不同頻分量進行預(yù)測?;跉v史數(shù)據(jù)和同期的外部因素,包括時間和天氣條件等數(shù)據(jù),獨立訓(xùn)練基模型,再將各基模型的輸出進行融合獲得售電量預(yù)測數(shù)據(jù)。實驗結(jié)果表明,本文提出的融合模型相比各基模型的預(yù)測精度有較大提升,且穩(wěn)定性高。另外相比ANN和SVR售電量預(yù)測算法,本文方法預(yù)測的結(jié)果更優(yōu)。
參考文獻
[1] 趙博石,嚴(yán)宇,劉永輝,等.基于區(qū)域發(fā)電成本核準(zhǔn)的跨區(qū)跨省電力交易偏差電量定價方法[J].電網(wǎng)技術(shù),2016,40(11):3334-33418.
[2] Abdulaal A, Moghaddass R, Asfour S. Two-stage discrete-continuous multi-objective load optimization: An industrial consumer utility approach to demand response[J]. Applied Energy, 2017, 206(15):206-221.
[3] 白登輝.計及偏差電量考核機制的人工神經(jīng)網(wǎng)絡(luò)售電量預(yù)測模型[J].電工電能新技術(shù),2020,39(6):58-66.
[4] 喻小寶,譚忠富,馬佳樂,等.計及需求響應(yīng)的售電? 公司正偏差電量考核優(yōu)化模[J].電力系統(tǒng)自動化,2019,43(7):120-128.
[5] 劉文霞,龍日尚,徐曉波,等.考慮數(shù)據(jù)新鮮度和交叉熵的電動汽車短期充電負荷預(yù)測模型[J].電力系統(tǒng)自動化,2016,40(12):45-52.
[6] LI ZHIYI,LIU XUAN,CHEN LIYUAN.Load interval forecasting methods based on an ensemble of Extreme Learning Machines[C]//Proceedings of 2015 IEEE Power & Energy Society General Meeting.Denver,CO,USA: IEEE,2015:1-5.
[7] A BRACALE, G CARPINELLI, P De FALCO, T HONG. Short-term industrial reactive power forecasting. International Journal of Electrical Power & Energy Systems, vol. 107, pp. 177-185, May, 2019.
[8] J N FIDALGO, and J. A. P. LOPES. Load forecasting performance enhancement when facing anomalous events. IEEE Transactions on Power Systems, vol. 20, no. 1, pp. 408-415, Feb, 2005.