洪居華,林 毅,劉友波,余 希,鄭 歡,蔡期塬
(1.國網(wǎng)福建經(jīng)研院,福州 350109;2.四川大學電氣工程學院,成都 610065)
負荷預測有助于電網(wǎng)規(guī)劃人員制定發(fā)電計劃和需求響應計劃,將電力生產成本降至最低[1]。負荷預測的精度能夠影響規(guī)劃成效,文獻[2]中指出負荷預測誤差降低1%,電力運營商的成本能節(jié)省9 000 萬元。電網(wǎng)規(guī)劃、投資和市場交易都是基于準確的電力負荷預測完成的,準確的電力負荷預測是保證電力系統(tǒng)安全、可靠、經(jīng)濟運行的前提[3]。
近年來,研究人員提出了許多模型來預測不同時段的電力負荷。根據(jù)預測時段的不同,這些模型可分為短期、中期和長期負荷預測模型[4]。短期負荷預測(Short-term Load Forecasting,STLF)模型能夠預測未來幾周的負荷,預測結果用于電力系統(tǒng)的短期運行計劃,如發(fā)電計劃。若要預測未來幾個月到未來幾年的負荷,則需要中長期負荷預測模型。基于模型體系結構,負荷預測模型主要分為兩類:統(tǒng)計模型和數(shù)據(jù)驅動模型。傳統(tǒng)的統(tǒng)計模型是使用線性回歸函數(shù)建立的,其中STLF問題被視為時間序列預測問題[5];回歸模型是預測平穩(wěn)時間序列的有效方法。然而,負荷需求具有非平穩(wěn)性和非線性特征,因此近年來提出了數(shù)據(jù)驅動模型,主要在模糊邏輯[6]、人工神經(jīng)網(wǎng)絡[7]和支持向量機[8]的基礎上完成。此外,準確地進行負荷預測還需要考慮氣候(即溫度、濕度等)、時間和社會經(jīng)濟約束[9]。為了提高預測精度,各種混合模型相繼出現(xiàn)[10-11]。為了緩解傳統(tǒng)經(jīng)驗模型分解(Empirical Mode Decomposition,EMD)的端部效應和包絡限制,文獻[12]中提出了改進的經(jīng)驗模型分解方法(Improved Empirical Mode Decomposition,IEMD)。
本文提出了一種新的混合型負荷預測模型[9-12]。為了補償信號分解過程中的信息損失,引入T-Copula分析技術,將天氣因素(即外生變量)的影響納入到信號分解中。盡管IEMD能夠克服傳統(tǒng)EMD的局限性,但是只要將極值映射到邊緣附近就可以得到很好的結果。考慮到峰值負荷預測精度的重要性,從擬合的Copula模型計算風險值VaR,以確定峰值負荷指示變量。此外,為外生變量確定了4 個峰值負荷指示變量,將這些變量作為負荷預測模型的輸入,提高了高峰時段的負荷預測精度此外,深度置信網(wǎng)絡(Deep Belief Network,DBN)克服了傳統(tǒng)神經(jīng)網(wǎng)絡模型的不足,采用DBN對信號分解得到的數(shù)據(jù)進行處理。算例結果顯示,本文提出的由IEMD、T-Copula和DBN組成的混合模型在考慮外部變量的情況下,能提供更高的負荷預測精度。
若將第m 天的負荷曲線表示為:Em(t) =[Em(1),Em(2),…,Em(n)]T,t =1,2,…,n。STLF模型能夠得到Em(t)或者Em+1(t)。
目前,混合模型由于具有較高的預測精度被廣泛討論?;旌夏P头譃閮纱箢悾活愑貌煌哪P头謩e預測電力負荷[13],根據(jù)權重值獲得最終預測結果。文獻[13]中分別采用BP神經(jīng)網(wǎng)絡、基于遺傳算法的BP神經(jīng)網(wǎng)絡、小波神經(jīng)網(wǎng)絡、徑向基函數(shù)神經(jīng)網(wǎng)絡、廣義回歸神經(jīng)網(wǎng)絡、支持向量機等不同的模型對電力負荷需求進行預測,基于此,應用花授粉算法對多目標模型的權重進行優(yōu)化,通過加權平均確定預測值。另一類將電力負荷分解成若干分量,然后用恰當?shù)哪P停?4]預測每個分量,最終預測結果為各分量預測結果之和。小波變換分解效率并不高,因此,近年來,EMD被廣泛使用[10]。文獻[10]中使用EMD將電力負荷分解為幾個固定函數(shù)和一個殘差函數(shù),較好地預測了未來的負荷需求。其中,與EMD相關的端點效應和包絡極限降低了信號分解的效率,降低了負荷預測的準確性,并且沒有考慮外部變量的影響?;诖耍疚奶岢鲆环N綜合IEMD、T-Copula和DBN的混合預測模型。
本文提出的STLF 混合模型框架如圖1 所示,主要由負荷需求時間序列分解和外部輸入變量的相關處理組成。IEMD能提高信號分解效率。根據(jù)T-Copula相關性分析計算出的風險值VaR,確定峰值負荷指示變量,將峰值負荷指示變量作為輸入?yún)?shù)將提高峰值負荷預測的精度。
圖1 STLF混合模型的框架
使用IEMD 產生固定函數(shù)的低頻分量(IMF1、IMF2、IMF3等)和殘差函數(shù),相關步驟如下:
(1)利用IEMD將電力負荷需求時間序列分解為不同頻率的多個子序列,即(IMF1、IMF2、IMF3等)和殘差。
(2)將各IMF和殘差作為DBN輸入,得到各IMF和殘差的預測結果。
(3)對輸出結果進行加權平均,得到輸出OP1。
采用T-Copula處理外部輸入變量,計算能源負荷需求與4 個外部輸入變量(如干球溫度、濕球溫度、露點溫度和濕度)之間的上尾依賴關系。
(1)計算上尾相關參數(shù)λu=[λ1,λ2,λ3,λ4]和對應的VaR。然后根據(jù)VaR1、VaR2、VaR3、VaR4確定每個外部變量的峰值負荷指示變量。
(2)使用負荷需求、相關參數(shù)和峰值負荷指示變量對每個DBN模型進行預訓練。
(3)將每個DBN 獲得的輸出加權相加,得到輸出OP2。
3.1.1 傳統(tǒng)EMD方法
EMD通過不斷迭代將信號分解成具有不同幅值的規(guī)則低頻分量,包括固有函數(shù)IMF 和殘差函數(shù)。IMF性質如下:對于每一個IMF,在整個長度上的極值和過零點的個數(shù)應相等或最多相差1 個;在任何區(qū)域,由局部極值定義的包絡線平均值為零。為更清晰描述這兩個特性,給出從E(t)中提取IMF的迭代過程:
(1)確定負荷需求時間序列E(t)的局部極大值(Emax(t))和局部極小值(Emin(t)),并利用三次樣條曲線將它們連接起來構造上、下包絡線。
(2)確定兩個包絡線的平均值與原始負荷需求時間序列之間的差異。如果上下包絡線的平均值表示為g1(t),且E(t)&與g1(t)之間的差定義為d1(t),則:
當d1(t)滿足IMF的條件時,將它標記為I1(t),否則,重復上述步驟。
(3)確定殘差
(4)重復上述過程,直到殘差時間序列r1(t)是單調函數(shù),即殘差足夠小,沒有轉折點。
(5)使用EMD分解,原始負荷可表示如下:
則數(shù)據(jù)由IMF和一個殘差函數(shù)來表示。
EMD比小波變換、離散小波變換在分解復雜時間序列上更有優(yōu)勢,但存在以下問題[15]:傳統(tǒng)EMD的端部效應會導致數(shù)據(jù)兩端出現(xiàn)發(fā)散現(xiàn)象,末端極值無法確定為最大值或最小值,使包絡線發(fā)生畸變,影響分解。例如,第1 個分解步驟出現(xiàn)誤差,后一個分解動作將顯示相同的結果失真。此外,三次樣條插值會導致過調、負調現(xiàn)象,導致包絡線不完整,從而影響結果。
3.1.2 IEMD方法
IEMD方法能夠抑制末端效應和包絡限制。為了抑制端部效應,采用線性外推法來確定包含給定數(shù)據(jù)集的最終數(shù)據(jù)。確定上包絡線端點的過程如圖2 所示。A、B為兩個極大值,直線AB延伸到點C。如果交點C小于端點E的值,E 點被認為是上包絡線的最大值,如圖2 右端所示;如果C 大于端點E 的值,則點E被認為是上包絡線的最大值,如圖2 左端所示。同樣地可以確定下包絡線的端點。
圖2 確定包絡線最大值
傳統(tǒng)EMD算法會使用三次樣條函數(shù)計算信號的上下包絡,然后計算平均值。三次樣條曲線擬合的功率低,計算簡單,但會產生超、負調現(xiàn)象,使包絡偏離實際信號,形成不完全包絡。為了解決三次樣條曲線擬合的超、負調問題,許多學者提出了改進方法,如高階樣條函數(shù)法、多項式擬合法和分段冪函數(shù)插值法。本文對同一模擬信號采用非均勻有理B 樣條插值與三次樣條函數(shù)插值法相比較,發(fā)現(xiàn)前者得到了較好的結果。采用IEMD 后,信號分解結果如圖3 所示。結果表明,IEMD算法可以將信號分解為不同的頻率分量,不存在模式混合。
圖3 采用IEMD進行信號分解的結果
初步研究表明,電力負荷與外部輸入變量之間存在上尾依賴關系。Gumbel Copula 模型計算了電力負荷與4 個外部輸入變量之間的上尾依賴關系。二元Gumbel Copula模型可以定義為:
式中:fx1(x1(t))和fE(E(t))表示邊緣分布函數(shù);x1表示一個外部輸入變量;E表示系統(tǒng)負荷需求;f(x1(t),E(t))是二維聯(lián)合分布函數(shù);CP(x1,E)是Copula 函數(shù)。那么,確定每個外部變量的上尾相關參數(shù):
最大似然估計可用于確定Copula 模型的參數(shù)α。由于系統(tǒng)負荷需求與外部輸入變量存在非線性關系,采用基于樣本的典型最大似然估計法進行處理。最大似然估計法的目標表示為
式中:N表示外部輸入變量的數(shù)量。
Gumbel Copula的上尾相關參數(shù)λ1為
基于此,為所有外部輸入變量確定所需的Copula 參數(shù)。由于電力負荷數(shù)據(jù)的波動和峰值的多樣性,對峰值負荷進行有效的統(tǒng)計估計至關重要。本文引入閾值參數(shù)來確定各變量的峰值負荷指示變量,
基于VaR 計算峰值負荷指示變量有助于提高高峰時段的負荷預測精度。
峰值負荷指示變量的二進制值由以下公式確定:
式中:M(x1)表示變量x1的峰值負荷指示性變量;p的值設置為0.95。對4 個外部輸入變量進行計算。
Gumbel Copula模型確定了系統(tǒng)負荷與外部天氣變量之間的上尾依賴關系。將信號的默認值設為0.05,通過最大似然估計對模型參數(shù)進行估計。圖4給出了算例1 中系統(tǒng)負荷和外部氣象變量之間的相關性,為便于分析,圖中干球溫度、露點溫度、濕球溫度、濕度、系統(tǒng)負荷已進行標準化處理,表示當前值與最大值的比值,無量綱,取值在[0,1]區(qū)間,如系統(tǒng)負荷0.5表示當系統(tǒng)負荷為最大可能系統(tǒng)負荷的0.5 倍的情況。
干球溫度的尾部分布與尾部(0,0)點和(1,1)點有很強的相關性,干球溫度對系統(tǒng)負載影響很大。為了考慮系統(tǒng)負荷與外部變量的正相關或負相關,本文給出了皮爾遜相關矩陣,如表1 所示。表1 說明系統(tǒng)負荷與干球溫度、濕度正相關,與濕球溫度、濕度負相關。在95%置信水平下進行VaR計算,上尾依賴參數(shù)和變量值如表2 所示。
圖4 外部變量相關性分析
表1 系統(tǒng)負荷與外部變量相關性分析
表2 具有外部變量的系統(tǒng)負荷的上尾相關參數(shù)和VaR
該方法通過IEMD 將負荷需求數(shù)據(jù)分解為多個IMF和一個殘差。在相關性分析中,能夠得到上尾相關參數(shù),峰值負荷指示變量。將IMF、殘差、上尾相關參數(shù)、峰值負荷指示變量和系統(tǒng)負荷數(shù)據(jù)應用于DBN。圖5 給出了DBN的體系結構,每層單元之間沒有相互連接。受限玻爾茲曼機(Restricted Boltzmann Machine,RBM)是一種能夠學習輸入數(shù)據(jù)集上概率分布的神經(jīng)網(wǎng)絡[16]。DBN 預訓練過程將神經(jīng)網(wǎng)絡中的每個連續(xù)組視為RBM,其聯(lián)合概率為:
式中:h 表示隱藏層的輸入;v表示從可見層獲得的輸出;W表示隱藏神經(jīng)元的權重;a表示激活函數(shù)。對于每個RBM,都有一組隱藏層和可見層。
對于連續(xù)變量v的高斯-伯努利RBM為:
圖5 深度置信網(wǎng)絡結構示意圖
RBM的目標函數(shù)為:
分層預訓練要求DBN 在目標函數(shù)上遵循隨機梯度下降法進行訓練,參數(shù)(例如a、b、W)根據(jù)目標函數(shù)的梯度更新,如下所示:
式中:〈hi〉Ph|v(h |v)是關于輸入數(shù)據(jù)的條件分布的期望;〈hi〉recon是第i 次重構分布的期望。那么,參數(shù)更新如下:
訓練多個層時,使用上層輸出的條件期望作為下一層的輸入,然后繼續(xù)訓練下一層?;诜謱宇A訓練方法,初始化DBN算法的所有參數(shù)。以監(jiān)督學習的方式對參數(shù)進行調整,直到DBN 的損耗函數(shù)達到最小值。最后,將反向傳播算法應用于調整過程。所有參數(shù)都從上到下更新,從而減少了預測誤差。
為了識別負荷需求時序數(shù)據(jù)中的周期和模式,可以應用自相關函數(shù)選擇具有相同信息特征的子集。假設時序數(shù)據(jù)集為E =Et,t∈T,滯后時間k 時的自相關系數(shù)rk計算如下:
所提混合負荷預測模型在澳大利亞某地區(qū)數(shù)據(jù)集[17]和美國德克薩斯州某城市數(shù)據(jù)集[18]上進行測試。數(shù)據(jù)集主要包括:天氣數(shù)據(jù)(即干球溫度、濕球溫度、露點溫度和濕度)、時間分類數(shù)據(jù)(即小時、月、日)、社會數(shù)據(jù)(即工作日、周末、假日)和特定采樣時間的負荷需求。
平均絕對百分比誤差(MAPE)和均方根誤差(RMSE)用于評估不同模型的性能。
對于基于信號分解的DBN,日前負荷預測與外部變量的相關性分析,取前1 天Et-48~Et-96負荷數(shù)據(jù),以及前1 周所對同1 天Et-336~Et-348的負荷需求,作為DBN的輸入。DBN 輸入數(shù)量為100。上尾相關參數(shù)和峰值負荷指示變量也用于DBN 輸入。通過交叉驗證確定隱藏層的數(shù)目為3,每層隱神經(jīng)元的數(shù)目為30,
DBN的結構為100-30-30-30-1。隨機選擇10%的原始數(shù)據(jù)進行交叉驗證,根據(jù)結果將學習率設為0.1,迭代次數(shù)設為500 次。通過T-Copula 進行相關性分析時,默認閾值設為0.05。
采用Matlab R2017b 進行了仿真,并對兩個數(shù)據(jù)集進行了測試。對于這兩個算例,使用下式將數(shù)據(jù)集線性縮放至[0,1]:
算例1收集了澳大利亞某地區(qū)2013-01-01~2013-12-31 日的數(shù)據(jù)[17],采樣時間為0.5 h。后文將全年數(shù)據(jù)分為4 個季節(jié):1~3 月,4~6 月,7~9 月,10~12 月。周前負荷預測是將1 個月的3 周數(shù)據(jù)集作為訓練數(shù)據(jù)集,剩余1 周作為測試數(shù)據(jù)集。假設每日信息可用,信號分解得到的輸入數(shù)據(jù)集為8 個IMF 和殘差。利用自滯后相關,將這些分解后的信號應用于配電網(wǎng)負荷預測。相關性分析得到的輸入數(shù)據(jù)集包括上尾相關參數(shù)、二元峰值指示變量和根據(jù)學習環(huán)境設置得到的負荷需求數(shù)據(jù)集,基于DBN進行考慮外部變量的周負荷預測。對每個季節(jié),采用2 個月的數(shù)據(jù)集來評估所提方法的負荷預測性能。
圖6 提前兩周的負荷預測結果
負荷需求預測結果如圖6 所示,將該模型的預測結果與文獻[10]進行比較,每小時的平均誤差分布如圖7 所示。從平均誤差分布結果可以看出,高峰時段的負荷預測精度有所提高,這將有助于電力運營商制定正確的發(fā)電計劃和運維計劃。
圖7 誤差分布
為了便于比較,對澳大利亞多個地區(qū)進行了模擬,如表3 所示。由表3 可知,所提模型與文獻[10]中的方法相比,MAPE 值下降了21.19%,RMSE 值下降了16.93%,所提模型預測精度更高,說明IEMD 信號分解和T-Copula相關性分析能夠提高預測精度。
表3 算例1 的負荷預測性能比較
算例2基于美國德克薩斯州某城市2016-01-01~2016-12-31 的數(shù)據(jù)[18],采樣時間為1 h。如表4 所示,由于IEMD 和T-Copula 的聯(lián)合作用,MAPE 和RMSE 值顯著降低,該模型的MAPE 值下降了15.27%,RMSE值下降了13.86%。實際上,IEMD 通過計算VaR中的峰值負荷指示性變量,提高了信號分解效率,而T-Copula有助于提高高峰時段的負荷預測精度。
表4 算例2 的負荷預測性能比較
本文提出了一種基于IEMD和T-Copula的混合短期負荷預測模型。首先,利用IEMD 對負荷需求時間序列進行分解;其次,采用T-Copula 進行系統(tǒng)負荷與外部輸入變量的相關性分析,提高高峰時段負荷預測的準確性;然后,分別對兩個分量進行預測;最后將各部分的結果相加,得到最終的預測結果。利用澳大利亞和美國電力負荷統(tǒng)計數(shù)據(jù)驗證了該模型的有效性。結果表明:①IEMD 能更準確有效地提取電力負荷的線性和非線性分量;②通過T-Copula提高了高峰時段負荷預測的準確性;③DBN具有很好的處理電力負荷非線性分量的能力。結合每種模型的優(yōu)勢,混合模型可以捕捉到負荷多種特性,能夠獲得更準確的預測結果。此外,在混合模型中還可以加入一些未來可能的影響因素,如與需求響應相關的用戶信息,以及分布式可再生能源集成帶來的不確定性等。本文所提負荷預測模型對電網(wǎng)的短期發(fā)電、調度和運行提供一定的參考價值。