郭建鵬, 佘穎鈴, 溫步瀛
(1. 國網(wǎng)福建綜合能源服務(wù)有限公司,福建 福州 350007; 2. 福州大學(xué)電氣工程與自動化學(xué)院,福建 福州 350100)
合理的預(yù)測是正確決策的基礎(chǔ)和保證。負荷預(yù)測就是在考慮電力系統(tǒng)、氣候、經(jīng)濟等各種因素的前提之下,通過對已有數(shù)據(jù)的挖掘和分析,對未來負荷量做出預(yù)先估計。負荷預(yù)測常運用于電網(wǎng)的規(guī)劃、調(diào)度等問題,是其中不可或缺的一環(huán)[1]。
月度負荷預(yù)測可用于安排月度檢修計劃、水力調(diào)度計劃、煤電計劃等,是電力生產(chǎn),檢修,銷售決策的重要依據(jù)。企業(yè)可以通過合理安排發(fā)電計劃來降低生產(chǎn)成本、提高供電可靠性[2]。國內(nèi)外關(guān)于負荷預(yù)測的方法有回歸分析法[3]、灰色預(yù)測法[4]、模糊預(yù)測法[5]、時間序列法[6]、專家預(yù)測法[7]、神經(jīng)網(wǎng)絡(luò)法[8-9]等。文獻[10]通過最小二乘法建立中長期負荷預(yù)測模型,其原理簡單,但是對以往數(shù)據(jù)要求嚴格,影響因素的選取存在一定難度。文獻[11]利用層次分析法結(jié)合專家經(jīng)驗,對城市化要素主觀賦權(quán),采用模糊聚類分析預(yù)測多因素影響下的中長期負荷。文獻[12]使用灰色模型增加變權(quán)緩沖算子,并通過灰色關(guān)聯(lián)分析和粒子群算法來確定模型的最佳參數(shù)?;疑A(yù)測要求歷史數(shù)據(jù)呈指數(shù)變化趨勢,數(shù)據(jù)灰度越大,預(yù)測精度越低。文獻[9]分析了影響負荷模型的因素,采用人工神經(jīng)網(wǎng)絡(luò)對負荷模型參數(shù)進行預(yù)測,人工神經(jīng)網(wǎng)絡(luò)具有很好的自適應(yīng)能力,但存在學(xué)習(xí)速度慢和局部極小點等問題。
在電力系統(tǒng)負荷預(yù)測中,時間序列法使用較為廣泛,這類方法僅根據(jù)以往負荷數(shù)據(jù)建立隨時間變化的數(shù)學(xué)模型,具有所需數(shù)據(jù)量少、工作量小、計算速度快等優(yōu)點,對于平穩(wěn)序列的預(yù)測精度高,對于非平穩(wěn)序列則需要進行平穩(wěn)化處理。文獻[13]采用季節(jié)差分方法對數(shù)列進行平穩(wěn)化;文獻[14]根據(jù)月售電量的規(guī)律,利用X12季節(jié)調(diào)整法將月售電量分解為趨勢量、季節(jié)周期量和隨機量3個分量,從而提高預(yù)測量的穩(wěn)定性;文獻[15]利用小波分解將負荷分解為季節(jié)性需求負荷、需求響應(yīng)信號及各種氣象因素作用的負荷,然后利用自回歸積分滑動平均(auto regressive integrated moving average, ARIMA)模型對季節(jié)性需求負荷進行預(yù)測,用支持向量回歸模型對需求響應(yīng)信號及受氣象因素影響的負荷進行預(yù)測;文獻[16]根據(jù)協(xié)整理論建立電力負荷序列與輸入“溫度”序列之間的ARIMAX模型,其信息量比經(jīng)典自回歸積分滑動平均(auto regres-sive moving aver-age, ARMA)模型的信息量小,擬合結(jié)果更精確;文獻[17]考慮離群值對月度負荷的影響,建立計及離群值影響的季節(jié)性ARIMA月度負荷預(yù)測模型(regARIMA),預(yù)測精度比普通ARIMA模型有所提高。
本文應(yīng)用集合經(jīng)驗?zāi)B(tài)分解(ensemble empiri-cal mode decomposition ,EEMD)將負荷序列分解成若干分量,使得各分量平穩(wěn)化,再通過ARIMA模型對各分量進行預(yù)測,基于某地區(qū)的月負荷量數(shù)據(jù)進行算例分析,結(jié)果表明經(jīng)過EEMD分解后的預(yù)測值相比于未經(jīng)過分解的預(yù)測值精度更高,誤差更小,表明了EEMD-ARIMA模型在月負荷量預(yù)測中的實用性。
經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition, EMD)最早由美國科學(xué)家黃愕提出,能夠?qū)⒎瞧椒€(wěn)、非線性的時間序列信號自適應(yīng)分解為若干個單分量信號[18]。EMD不需要同小波分析一樣預(yù)先選定小波基函數(shù),其基本思想是根據(jù)信號的局部時變特性,將原始信號篩分為若干個本征模態(tài)函數(shù)(intrinsic mode function, IMF),各IMF分量都應(yīng)滿足2個條件:
(1) 任意IMF分量的極點和零點數(shù)量之差不大于1;
(2) 任意IMF的局部極大值和局部極小值的包絡(luò)線之和的均值為0。
EMD的基本理論就是將頻率混合的時間序列分解為頻率規(guī)律的IMF分量和殘余分量(residual component,RES),過程如下:
(1) 找到時間序列x(t)的所有局部極大值點和極小值點,利用三次樣條函數(shù)對原信號所有極大值點和極小值點分別進行擬合,構(gòu)成原信號的上下包絡(luò)線;
(2) 將上下包絡(luò)線形成的時間序列相加,并求取其平均值a1(t),將原信號序列與a1(t)相減得到新的信號序列h1,1(t),即:
h1,1(t)=x(t)-a1(t)
(1)
(3) 判別h1,1(t)是否滿足IMF的2個條件,如果滿足,則h1,1(t)為EMD分解的第一階IMF分量;若h1,1(t)不滿足IMF條件,則將h1,1(t)定義為原信號序列,重復(fù)步驟(1)—(2)直到前提滿足,此時得到的信號序列為第1個IMF分量,記為c1(t);
(4) 將原信號序列x(t)減去c1(t)得到r1(t):
r1(t)=x(t)-c1(t)
(2)
(5) 將r1(t)作為下一個要分解的原信號,重復(fù)(1)—(4)步驟n次,直到殘余分量rn(t)小于預(yù)設(shè)值,或為單調(diào)函數(shù)、常數(shù),分解完畢,最終x(t)可以表示為:
(3)
事實上IMF的上下包絡(luò)線很難始終為0,因此采用2個連續(xù)結(jié)果的標準差作為篩分終止判據(jù):
(4)
一般SD的取值在0.2~0.3之間,本文SD取0.3。
直接對原始序列進行EMD分解,容易在序列兩端產(chǎn)生發(fā)散,為了避免端點問題導(dǎo)致的模型失真,這里采用鏡像擬合算法。
當原始信號中摻雜幅值較小的間斷性噪聲時,EMD分解會產(chǎn)生模態(tài)混疊問題,這會使得IMF分量平穩(wěn)性較差,為了改善這種情況,出現(xiàn)了通過噪聲輔助的EEMD算法[19]。
EEMD算法的核心就是將高斯白噪聲加入待分解序列,從而改變原序列的極值點分布,解決模態(tài)混疊問題。由于加入的白噪聲會對原信號的分解結(jié)果產(chǎn)生一些影響,因此利用多重白噪聲求均值為零的特性,將加入白噪聲擾動后的原始分量分解得到的IMF分量分別求其平均值來控制噪聲對分解結(jié)果的影響。其具體分解步驟如下:
(1) 初始化添加白噪聲的次數(shù)(即試驗總次數(shù))Ne和幅值系數(shù)ε;
(2) 在原序列中加入隨機高斯白噪聲序列,其中Sj(t)是第j次加入的白噪聲序列,xj(t)是染噪信號:
xj(t)=x(t)+εsj(t)
(5)
(3) 對染噪信號xj(t)進行EMD分解,得到i個IMF分量cij(t)和剩余分量rj(t);
(4) 重復(fù)步驟(2)—(3)Ne次;
(5) 對Ne次重復(fù)操作后的信號進行EMD分解,對得到的IMF分量和剩余分量分別求均值:
(6)
(7)
(6) 最終x(t)的分解結(jié)果為:
(8)
ARIMA模型是由Box和Jenkins于1970年提出的一種時間序列分析方法[20-21],在平穩(wěn)序列預(yù)測方面應(yīng)用較多。
ARIMA模型可以表示為ARIMA(p,q,d)。其中,d為對非平穩(wěn)時間序列Y(t)差分的次數(shù),d次差分后得到平穩(wěn)序列X(t);p為自回歸階數(shù);q為滑動平均階數(shù)。
差分得到的X(t)可以用自回歸移動平均模型ARMA(p,q)來擬合,即:
Xt=c+φ1Xt-1+φ2Xt-2+…+φpXt-p+εt+θ1εt-1+θ2εt-2+…+θqεt-q
(9)
式中,前半部分為自回歸過程,c為常量,φ1,φ2,…,φp為自回歸系數(shù);后半部分為滑動平均過程,θ1,θ2,…,θq為移動平均系數(shù),εt為未檢測的白噪聲序列。
當q=0時,該模型為自回歸模型AR(p),式(9)可表達為:
Xt=c+φ1Xt-1+φ2Xt-2+…+φpXt-p+εt
(10)
當p=0時,該模型為滑動平均模型MA(q),式(9)可表達為:
Xt=c+εt+θ1εt-1+θ2εt-2+…+θqεt-q
(11)
其具體流程如圖1所示。
圖1 ARIMA模型建模流程Fig.1 ARIMA modeling process
ARIMA模型預(yù)測的基本思路是:先建立預(yù)測值的時間序列,對其進行差分平穩(wěn)化,通過自相關(guān)系數(shù)和偏自相關(guān)系數(shù)來確定模型階數(shù),然后進行參數(shù)的估計和檢驗,最后用參數(shù)合適的模型對預(yù)測量進行預(yù)測。
受經(jīng)濟、氣候等因素影響,月負荷量是非平穩(wěn)序列,所以要先對其進行平穩(wěn)化。因此,本文建立基于EEMD分解的月度負荷量預(yù)測模型,以下簡稱EMD-ARIMA預(yù)測模型。具體步驟如下:
(1) 對月負荷量進行EEMD分解,將其分解為不同時間尺度的分量;
(2) 對各分量分別進行ARIMA模型預(yù)測;
(3) 將各分量預(yù)測值相加,從而得到最終的月負荷量預(yù)測值。
為了評價不同的模型對預(yù)測結(jié)果的影響,本文從準確度和相似度2個方面對模型進行評價。
(1) 準確度。在數(shù)值方面,本文使用了歸一化絕對誤差EAE和歸一化均方根誤差ERMSE來對模型進行衡量:
(12)
(13)
(2) 相似度。在負荷曲線變化方面,本文用如下指標[18]:
(14)
為了驗證模型的可靠性與預(yù)測精度,本文基于某市2010年1月到2016年7月共79個月的負荷量數(shù)據(jù)來預(yù)測2016年8月到2017年7月12個月份的負荷量。
本文應(yīng)用Matlab軟件對月負荷量進行預(yù)測,先對原始序列進行ADF單位根檢驗,Tau統(tǒng)計量的P值為0.767 3,遠大于0.05,說明原序列是非平穩(wěn)序列。對負荷量進行EEMD自適應(yīng)分解(取Ne為100,ε為0.1),根據(jù)信號的局部時變特性將負荷量進行篩分,得到5個IMF分量和1個RES分量,各分量具有不同的時間尺度,其中IMF1和IMF2不具有規(guī)律性,為隨機分量,IMF3和IMF4為負荷量中的周期分量,而IMF5和RES分量為負荷量中的趨勢分量。其分量如圖2所示。
圖2 月負荷量的EEMD分解結(jié)果Fig.2 EEMD decomposition results of monthly load
對各分量進行平穩(wěn)性檢驗,若不平穩(wěn)則進行差分平穩(wěn)化,觀察各分量的自相關(guān)系數(shù)和偏自相關(guān)系數(shù),初步確定p和q的取值范圍為[0,10],選取置信水平為95%,通過信息最小準則(Akaike′s informa-tion creterion, AIC)確定具體參數(shù)如表1。
表1 模型參數(shù)的選取Tab.1 Selection of model parameters
負荷實際值、反向后傳(back propagation,BP)神經(jīng)網(wǎng)絡(luò)預(yù)測值、ARIMA模型預(yù)測值以及EEMD-ARIMA模型的預(yù)測值結(jié)果如圖3所示。
圖3 月負荷量預(yù)測結(jié)果Fig.3 Monthly load forecast results
3種模型預(yù)測結(jié)果的準確度和相似度數(shù)值如表2所示。在數(shù)值方面,不論是絕對誤差還是均方根誤差,本文模型的預(yù)測值誤差都小于其他2種模型,在4%以內(nèi)。而相似度方面,本文模型的相似度為0.999 2,比ARIMA模型的相似度更高,與實際負荷變化趨勢更相似。從數(shù)值和相似度2個方面,都可以看出EEMD-ARIMA模型的優(yōu)勢,經(jīng)過EEMD分解后,其分量比原始序列平穩(wěn),而ARIMA模型對平穩(wěn)性好的信號序列預(yù)測精度高,采用EEMD-ARIMA模型預(yù)測可有效降低誤差,提高預(yù)測精度。
表2 各類模型的性能比較Tab.2 Comparison of models
考慮到負荷量受氣候、經(jīng)濟等因素影響及平穩(wěn)性較差的問題,普通ARIMA模型難以取得較高精度,因此本文采用EEMD分解,用于原始數(shù)據(jù),得到有限個更為平穩(wěn)的分量,對各分量分別建立ARIMA預(yù)測模型。經(jīng)實驗對比,針對地區(qū)月負荷量預(yù)測,不管在數(shù)值方面還是相似度方面,EEMD-ARIMA預(yù)測模型都優(yōu)于ARIMA模型。