王洪亮,陳新源,趙雨夢
(昆明理工大學(xué) 電力工程學(xué)院,云南 昆明 650500)
智能電網(wǎng)作為研究熱點(diǎn)受到越來越多的關(guān)注。用戶是電網(wǎng)服務(wù)的對象,在智能電網(wǎng)中發(fā)揮著至關(guān)重要的作用。對用戶側(cè)數(shù)據(jù)進(jìn)行采集、傳輸和存儲,有利于管理電網(wǎng)發(fā)電需求。對用戶負(fù)荷數(shù)據(jù)進(jìn)行管理可以使電網(wǎng)更加安全可靠地運(yùn)行[1]。電力負(fù)荷預(yù)測在保證電力系統(tǒng)安全及經(jīng)濟(jì)運(yùn)行方面具有重要意義。進(jìn)行負(fù)荷預(yù)測,需要建立與之對應(yīng)的數(shù)學(xué)模型。隨著負(fù)荷預(yù)測理論研究的不斷深入,電力負(fù)荷預(yù)測的理論和方法也越來越多,例如神經(jīng)網(wǎng)絡(luò)、模糊理論、小波分析等[2]。但是這些方法仍具有局限性,例如神經(jīng)網(wǎng)絡(luò)算法要按照一定的準(zhǔn)則進(jìn)行學(xué)習(xí),然后才能工作,而且容易出現(xiàn)陷入局部極小的現(xiàn)象。目前已有的負(fù)荷預(yù)測理論方法已無法滿足預(yù)測速度和精度的要求,當(dāng)計(jì)算數(shù)據(jù)非常龐大時(shí),傳統(tǒng)方法就顯得力不從心,通常耗時(shí)幾小時(shí)甚至幾天。隨著智能電網(wǎng)的發(fā)展,需要進(jìn)行海量數(shù)據(jù)的收集、存儲和處理,因此亟需一種新的大數(shù)據(jù)處理方法[3]。新型負(fù)荷的出現(xiàn)也對電網(wǎng)提出更高的要求,在大量數(shù)據(jù)基礎(chǔ)上進(jìn)行數(shù)據(jù)預(yù)測就顯得十分重要[4]。在上述背景下,本文提出一種基于集合經(jīng)驗(yàn)?zāi)B(tài)分解和ARIMA-GRNN的混合負(fù)荷預(yù)測模型,兼顧了電力負(fù)荷內(nèi)在的線性特征與非線性特征,可以對電力系統(tǒng)負(fù)荷預(yù)測進(jìn)行有效分析。仿真結(jié)果表明,該模型算法較之傳統(tǒng)單一算法效果更加優(yōu)越。
經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)法是一種新型自適應(yīng)信號時(shí)頻處理方法,適用于非線性非平穩(wěn)信號的分析處理。EMD法依據(jù)數(shù)據(jù)自身的時(shí)間尺度特征來進(jìn)行信號分解,無須預(yù)先設(shè)定基函數(shù)。集合經(jīng)驗(yàn)?zāi)B(tài)分解方法(Ensemble Empirical Mode Decomposition,EEMD)是在EMD方法的基礎(chǔ)上發(fā)展起來的[5]。該方法的本質(zhì)是對時(shí)間序列數(shù)據(jù)進(jìn)行局部平穩(wěn)化處理,再進(jìn)行希爾伯特變換獲得時(shí)頻譜圖,從而得到有物理意義的頻率[6]。EEMD的思想是信號極值點(diǎn)影響固有模態(tài)函數(shù)(Intrinsic Mode Function,IMF)分量,若分量分布不均勻則會出現(xiàn)模態(tài)混疊。將頻譜均勻分布的白噪聲引入要分析的信號中,可使信號自動分布到合適的參考尺度上。集成均值的計(jì)算結(jié)果與原始信號的差值隨著集成平均次數(shù)的增加而減少[7]。由于零均值噪聲的特性,噪聲經(jīng)過多次平均計(jì)算后會相互抵消,因此可將集成均值的計(jì)算結(jié)果視作最終結(jié)果。
EEMD算法步驟如下:
步驟1將正態(tài)分布的白噪聲加到原始信號;
步驟2將加入白噪聲的信號作為一個(gè)整體,然后進(jìn)行EMD分解,得到各IMF分量;
步驟3重復(fù)步驟1和步驟2,每次加入新的正態(tài)分布白噪聲序列;
步驟4將每次得到的IMF做集成平均處理后的結(jié)果作為最終結(jié)果。
由于受到天氣變化、經(jīng)濟(jì)波動等多種外界因素的影響,負(fù)荷通常呈現(xiàn)非平穩(wěn)序列的特征,所以必須對其采取平穩(wěn)化處理。為了得到理想的預(yù)測結(jié)果,在數(shù)據(jù)進(jìn)入模型的訓(xùn)練過程之前,需要對電力負(fù)荷的原始數(shù)據(jù)進(jìn)行處理和分析。由于傳統(tǒng)的信號分解方法對于分解非線性非平穩(wěn)的負(fù)荷序列存在較大的局限性,故本文采用EEMD對原始負(fù)荷序列進(jìn)行分解。
ARIMA為差分自回歸滑動平均模型,又稱為求自回歸滑動平均模型,是時(shí)間序列預(yù)測分析方法之一。ARIMA時(shí)間序列法被廣泛應(yīng)用于電力系統(tǒng)負(fù)荷預(yù)測。該方法只需要通過前期的負(fù)荷數(shù)據(jù)便可以構(gòu)建基于時(shí)間的數(shù)學(xué)模型,不僅計(jì)算速度快,計(jì)算過程簡單,且只需少量數(shù)據(jù)就可以對平穩(wěn)序列達(dá)到較高的預(yù)測精度。但是,如果負(fù)荷數(shù)據(jù)為非平穩(wěn)序列,則需要在使用該方法前先實(shí)施平穩(wěn)化處理[8]。
如圖1所示,ARIMA模型是自回歸模型AR模型和MA模型的整合模型,是一種常用的時(shí)間序列預(yù)測模型。其模型具體形式為
圖1 ARIMA結(jié)構(gòu)圖Figure 1.ARIMA structure diagram
(1)
式中,t表示時(shí)間;yt為隨時(shí)間t變化的原始負(fù)荷時(shí)間序列數(shù)據(jù);Δdyt表示yt經(jīng)d次差分后的平穩(wěn)時(shí)間序列;εt表示隨時(shí)間t變化的零均值的白噪聲隨機(jī)誤差序列;Φi為AR模型第i階的估計(jì)參數(shù);p為AR模型的最佳階數(shù);θj為MA模型第j階的估計(jì)參數(shù);q為MA模型的最佳階數(shù)。
基于ARIMA時(shí)間序列建模步驟如圖2所示。如果負(fù)荷數(shù)據(jù)是一個(gè)非平穩(wěn)的時(shí)間序列,則首先需要對時(shí)間序列做d階差分,得到一個(gè)平穩(wěn)的時(shí)間序列[9]。然后,對自回歸階數(shù)和滑動平均階數(shù)嘗試取值進(jìn)行參數(shù)估計(jì),利用AIC、BIC、HQC等信息準(zhǔn)則挑選出最優(yōu)的ARIMA預(yù)測模型。最后,利用挑選出來的最優(yōu)ARIMA預(yù)測模型對負(fù)荷時(shí)間序列進(jìn)行預(yù)測分析[10]。
圖2 ARIMA建模圖Figure 2.ARIMA modeling diagram
廣義回歸神經(jīng)網(wǎng)絡(luò)(Generalized Regression Neural Network,GRNN)是一種徑向基神經(jīng)網(wǎng)絡(luò),具有很強(qiáng)的非線性映射能力和學(xué)習(xí)速度。GRNN最后收斂于樣本量集聚較多的優(yōu)化回歸,當(dāng)樣本數(shù)據(jù)較少時(shí),預(yù)測效果較好,還可以處理不穩(wěn)定數(shù)據(jù)[11]。雖然GRNN沒有徑向基精準(zhǔn),但在實(shí)際分類和擬合方面,特別是在數(shù)據(jù)精準(zhǔn)度比較差的時(shí)候,GRNN有著很大的優(yōu)勢[12]。
電力負(fù)荷預(yù)測是一個(gè)受諸多因素影響的具有隨機(jī)性、非線性、動態(tài)不確定性的過程,對預(yù)測精度有一定的要求。針對天氣、溫度等隨機(jī)因素對電力負(fù)荷的復(fù)雜影響,采用GRNN神經(jīng)網(wǎng)絡(luò)算法實(shí)現(xiàn)多種隨機(jī)因素影響的短期電力負(fù)荷預(yù)測。由于GRNN神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的魯棒性、非線性和自適應(yīng)等特性,因此可以利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力來學(xué)習(xí)歷史數(shù)據(jù)中包含的映射關(guān)系,再利用這種映射預(yù)測未來的電荷。
其中,X(x1,x2,…,xn)為輸入;Y(y1,y2,…,yn)為輸出。
如圖3所示,GRNN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層、模式層、求和層和輸出層。輸入層為向量,維度為m,樣本個(gè)數(shù)為n,線性函數(shù)為傳輸函數(shù)。隱藏層與輸入層全連接,層內(nèi)無連接,隱藏層神經(jīng)元個(gè)數(shù)與樣本個(gè)數(shù)相等,也是n,傳輸函數(shù)為徑向基函數(shù)。求和層中有兩個(gè)節(jié)點(diǎn):第一個(gè)節(jié)點(diǎn)為每個(gè)隱含層節(jié)點(diǎn)的輸出和;第二個(gè)節(jié)點(diǎn)為預(yù)期的結(jié)果與每個(gè)隱含層節(jié)點(diǎn)的加權(quán)和。輸出層的輸出是第二個(gè)節(jié)點(diǎn)除以第一個(gè)節(jié)點(diǎn)的值[13]。
圖3 GRNN結(jié)構(gòu)圖Figure 3.GRNN structure diagram
模式層函數(shù)為
(2)
式中,v為神經(jīng)元;Pv為神經(jīng)元v所在的模式層輸出;X為網(wǎng)絡(luò)輸入變量;Xv為第v個(gè)神經(jīng)元學(xué)習(xí)樣本;σ為高斯函數(shù)的寬度系數(shù),此處為光滑因子[14]。
求和層函數(shù)為
(3)
式中,n為神經(jīng)元最大值;SD為求和層的輸出。
對所有模式層神經(jīng)元的輸出進(jìn)行算術(shù)求和,其模式層與各神經(jīng)元的連接權(quán)值為1。
GRNN在逼近能力和學(xué)習(xí)速度上較其他神經(jīng)網(wǎng)絡(luò)算法有一定優(yōu)勢。GRNN最后收斂于樣本量積聚較多的優(yōu)化回歸面,且在樣本數(shù)據(jù)較少時(shí)具有較好的預(yù)測效果[15]。
電力系統(tǒng)負(fù)荷需求不僅包含時(shí)間序列變量,也受到溫度、天氣、經(jīng)濟(jì)等各種因素影響[16],進(jìn)而產(chǎn)生非線性變量,如下式所示
Zt=Tt+Xt
(4)
式中,Zt為t時(shí)刻的觀測值;Tt為t時(shí)刻的線性時(shí)間序列分量;Xt為t時(shí)刻的非線性預(yù)測分量預(yù)測值。
因此,無論是單一的時(shí)間序列算法還是非線性的神經(jīng)網(wǎng)絡(luò)算法,其對電力負(fù)荷預(yù)測都存在一定的局限性[17]。EEMD適用于非線性非平穩(wěn)信號的分析處理[18-19]。本文提出了一種基于集合經(jīng)驗(yàn)?zāi)B(tài)分解和ARIMA-GRNN混合模型的負(fù)荷預(yù)測方法,其具體建模過程如圖4所示。
圖4 EEMD-ARIMA-GRNN模型算法建模圖Figure 4.EEMD-ARIMA-GRNN model algorithm modeling diagram
步驟1采用某地電網(wǎng)歷史運(yùn)行負(fù)荷數(shù)據(jù)作為樣本原始數(shù)據(jù),使用EEMD方法將樣本原始數(shù)據(jù)分解出不存在模態(tài)混疊的IMF分量和余項(xiàng);
步驟2ARIMA(p,d,q)模型分為AR、I、MA共3部分。使用ARIMA(p,d,q)模型對每一項(xiàng)IMF分量進(jìn)行預(yù)測,首先需確定數(shù)據(jù)的差分階數(shù)d。對樣本數(shù)據(jù)進(jìn)行一次差分就能得到一個(gè)平穩(wěn)的負(fù)荷時(shí)間序列。負(fù)荷需求往往受到一些外界因素如天氣或經(jīng)濟(jì)的影響,所以歷史運(yùn)行負(fù)荷數(shù)據(jù)一般表現(xiàn)為負(fù)荷數(shù)據(jù)時(shí)間非平穩(wěn)時(shí)間序列;
步驟3對差分后平穩(wěn)的IMF分量分別求得其自相關(guān)系數(shù)ACF和偏自相關(guān)系數(shù)PACF,通過對自相關(guān)圖的分析,得到最佳階層p。通過偏自相關(guān)圖的分析,得到最佳階數(shù)q。確定具體ARIMA(p,d,q)預(yù)測模型。利用選定的ARIMA預(yù)測模型對IMF分量進(jìn)行預(yù)測分析得到預(yù)測數(shù)據(jù)。這些預(yù)測數(shù)據(jù)即為時(shí)間序列預(yù)測分量;
步驟4將通過步驟2得到的時(shí)間序列預(yù)測分量和樣本原始數(shù)據(jù)相減得到非線性分量數(shù)據(jù)。取歷史運(yùn)行負(fù)荷每天的最高溫度、最低溫度、平均溫度、平均相對濕度和降雨量特征作為GRNN神經(jīng)網(wǎng)絡(luò)算法的特征變量;非線性分量數(shù)據(jù)作為GRNN神經(jīng)網(wǎng)絡(luò)算法訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集。將訓(xùn)練數(shù)據(jù)集輸入模塊進(jìn)行訓(xùn)練,反映這些特征變量對負(fù)荷的影響規(guī)律,得到訓(xùn)練模型。再利用訓(xùn)練模型對測試數(shù)據(jù)集進(jìn)行測試,得到非線性預(yù)測分量預(yù)測值;
步驟5將所有時(shí)間序列預(yù)測分量和非線性預(yù)測分量兩者相加,即可得到具有更高精度的電力負(fù)荷預(yù)測值。
為了更加直觀地表明本文設(shè)計(jì)的復(fù)合模型的優(yōu)越性,本文選取均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)和平均絕對百分誤差(Mean Absolute Percentage Error,MAPE)3項(xiàng)數(shù)據(jù)來衡量預(yù)測模型的性能[16]。
RMSE是預(yù)測數(shù)據(jù)與實(shí)際數(shù)據(jù)差值平方和的算數(shù)平方根。均方根誤差用來描述數(shù)據(jù)序列的變化趨勢,其值越小,說明預(yù)測數(shù)值誤差越小,計(jì)算式如下
(5)
平均絕對誤差MAE和平均絕對百分誤差MAP可用來衡量預(yù)測算法性能,其值越小說明算法越好。
(6)
(7)
選取某地電網(wǎng)歷史負(fù)荷數(shù)據(jù),以2013年12月21日~2014年6月18日每天某個(gè)時(shí)刻共計(jì)180個(gè)數(shù)據(jù)作為樣本數(shù)據(jù)。使用ARIMA(p,d,q)模型進(jìn)行預(yù)測,通過對負(fù)荷數(shù)據(jù)進(jìn)行一次差分得到一個(gè)平穩(wěn)的負(fù)荷時(shí)間序列,即d為1。對差分后平穩(wěn)的負(fù)荷時(shí)間序列分別求得其自相關(guān)系數(shù)ACF和偏自相關(guān)系數(shù)PACF,得到最佳階層p為5,最佳階數(shù)q為8。確定具體ARIMA(5,1,8),預(yù)測模型,進(jìn)行預(yù)測分析得到預(yù)測數(shù)據(jù),并與原始數(shù)據(jù)進(jìn)行對比,得到原始數(shù)據(jù)與預(yù)測數(shù)據(jù)對比圖和相對誤差圖,如圖5和圖6所示。
圖5 ARIMA模型算法預(yù)測圖Figure 5.ARIMA model algorithm prediction diagram
圖6 ARIMA模型算法相對誤差圖Figure 6.Relative error diagram of ARIMA model algorithm
采用基于ARIMA時(shí)間序列的負(fù)荷預(yù)測,其預(yù)測趨勢大致上與實(shí)際數(shù)據(jù)相同,但個(gè)別極值預(yù)測偏差過大,相對誤差達(dá)到0.6,即在突發(fā)的外界因素條件影響下,采用單一的ARIMA時(shí)間序列的負(fù)荷預(yù)測方法不能滿足預(yù)測精度要求。
本文以2012年1月1日~2014年6月18日每天某個(gè)時(shí)刻共計(jì)900個(gè)數(shù)據(jù)作為樣本數(shù)據(jù),以2012年1月1日~2013年12月20日共計(jì)720個(gè)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),以2013年12月21日~2014年6月18日每天某個(gè)時(shí)刻共計(jì)180個(gè)數(shù)據(jù)作為測試數(shù)據(jù)。取負(fù)荷數(shù)據(jù)每天的最高溫度、最低溫度、平均溫度、平均相對濕度和降雨量特征作為GRNN神經(jīng)網(wǎng)絡(luò)算法的特征變量,將訓(xùn)練數(shù)據(jù)集輸入模塊進(jìn)行訓(xùn)練,反映這些特征變量對負(fù)荷的影響規(guī)律,得到訓(xùn)練模型。然后,再利用訓(xùn)練模型對測試數(shù)據(jù)集進(jìn)行測試,得到預(yù)測值,并與原始數(shù)據(jù)進(jìn)行對比,得到原始數(shù)據(jù)與預(yù)測數(shù)據(jù)對比圖和相對誤差圖,如圖7和圖8所示。
圖7 GRNN模型算法預(yù)測圖Figure 7.GRNN model algorithm prediction diagram
圖8 GRNN模型算法相對誤差圖Figure 8.Relative error diagram of GRNN model algorithm
基于GRNN神經(jīng)網(wǎng)絡(luò)算法的負(fù)荷預(yù)測法的預(yù)測趨勢與實(shí)際數(shù)據(jù)有較大差距,無法滿足負(fù)荷隨時(shí)間線性變化的特征,說明單一的神經(jīng)網(wǎng)絡(luò)算法同樣無法滿足負(fù)荷預(yù)測的精度要求。
以2012年1月1日~2014年6月18日每天某個(gè)時(shí)刻共計(jì)900個(gè)數(shù)據(jù)作為負(fù)荷數(shù)據(jù),先對其進(jìn)行ARIMA模型預(yù)測,通過計(jì)算確定ARIMA(2,1,6)預(yù)測模型。然后,利用挑選出來的ARIMA預(yù)測模型對負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測分析得到線性預(yù)測數(shù)據(jù),并與原始數(shù)據(jù)進(jìn)行相減。將差值數(shù)據(jù)分為GRNN神經(jīng)網(wǎng)絡(luò)算法訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集,取負(fù)荷每天的最高溫度、最低溫度、平均溫度、平均相對濕度和降雨量特征作為GRNN神經(jīng)網(wǎng)絡(luò)算法的特征變量。將訓(xùn)練數(shù)據(jù)集輸入模塊進(jìn)行訓(xùn)練得到訓(xùn)練模型,再利用訓(xùn)練模型對測試數(shù)據(jù)集進(jìn)行測試,得到非線性預(yù)測分量預(yù)測值。將非線性預(yù)測分量預(yù)測值和線性預(yù)測值相加得到最終預(yù)測值。原始數(shù)據(jù)與預(yù)測數(shù)據(jù)的對比圖和相對誤差圖如圖9和圖10所示。
圖9 ARIMA-GRNN模型算法預(yù)測圖Figure 9.Algorithm prediction diagram of ARIMA-GRNN model
圖10 ARIMA-GRNN模型算法相對誤差圖Figure 10.Relative error chart of ARIMA-GRNN model algorithm
采用基于ARIMA-GRNN混合模型算法進(jìn)行負(fù)荷預(yù)測,其預(yù)測趨勢大致與實(shí)際數(shù)據(jù)相同。相較于ARIMA方法,混合模型算法在負(fù)荷極點(diǎn)處的預(yù)測有了明顯的改善,基本滿足負(fù)荷預(yù)測的精度要求。
以2012年1月1日~2014年6月18日每天某個(gè)時(shí)刻共計(jì)900個(gè)數(shù)據(jù)作為樣本數(shù)據(jù),加入100組試驗(yàn)次數(shù)白噪音,白噪音標(biāo)準(zhǔn)偏差設(shè)置為0.2。通過EEMD將數(shù)據(jù)分解為IMF分量和余項(xiàng),對每項(xiàng)IMF分量進(jìn)行上述ARIMA-GRNN混合模型預(yù)測。將所有非線性分量與線性分量求和得到最終的預(yù)測值,如圖11~圖13所示。
圖11 負(fù)荷數(shù)據(jù)EEMD分解圖Figure 11.EEMD decomposition diagram of load data
圖12 EEMD-ARIMA-GRNN模型預(yù)測圖Figure 12.Algorithm prediction diagram of EEMD-ARIMA-GRNN model
圖13 EEMD-ARIMA-GRNN模型算法相對誤差圖Figure 13.Relative error chart of EEMD-ARIMA-GRNN model algorithm
基于EEMD-ARIMA-GRNN混合模型算法的負(fù)荷預(yù)測的預(yù)測趨勢與實(shí)際數(shù)據(jù)大致相同。在突發(fā)外界因素條件的影響下,極值處的預(yù)測值與實(shí)際數(shù)據(jù)相差較小,相對誤差也控制在0.23以內(nèi),說明本文所設(shè)計(jì)的預(yù)測方法可同時(shí)兼顧電力負(fù)荷內(nèi)在線性特征與非線性特征的特點(diǎn),滿足負(fù)荷預(yù)測的精度要求。
通過4次仿真實(shí)驗(yàn)得到4種預(yù)測算法的性能指標(biāo),如表1所示。
表1 性能指標(biāo)表Table 1. Performance index
通過對表中數(shù)據(jù)進(jìn)行分析,可知GRNN神經(jīng)網(wǎng)絡(luò)算法效果最差,傳統(tǒng)ARIMA模型算法和ARIMA-GRNN算法的誤差值次之。本文所提出的EEMD-ARIMA-GRNN混合模型算法性能最佳,3項(xiàng)數(shù)據(jù)均比傳統(tǒng)ARIMA模型算法和GRNN模型算法更加優(yōu)越。同時(shí),對比4次仿真實(shí)驗(yàn)相對誤差圖,可以清晰地看出混合模型算法的相對誤差在0.23之內(nèi),較大程度地提高了預(yù)測精度。綜上所述可知,相較于傳統(tǒng)單一算法,基于EEMD-ARIMA-GRNN混合模型的算法在電力負(fù)荷預(yù)測方面性能更優(yōu)。
針對傳統(tǒng)負(fù)荷預(yù)測方法難以兼顧電力負(fù)荷內(nèi)在的線性特征量與非線性特征量的問題,本文提出了一種基于EEMD和ARIMA-GRNN的混合負(fù)荷預(yù)測模型方法。仿真實(shí)驗(yàn)證明,本文所提出的混合算法比傳統(tǒng)的時(shí)間序列算法和單一的神經(jīng)網(wǎng)絡(luò)算法性能更加優(yōu)越,能夠滿足短期負(fù)荷預(yù)測的要求。但是,本文所提方法并未考慮混合模型的計(jì)算開銷及工程應(yīng)用實(shí)際需求,下一步研究中將對上述問題進(jìn)行探討。