方 娜,李俊曉,陳 浩,余俊杰
(1. 湖北工業(yè)大學(xué)太陽(yáng)能高效利用及儲(chǔ)能運(yùn)行控制湖北省重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430068;2. 湖北工業(yè)大學(xué)湖北省電網(wǎng)智能控制與裝備工程技術(shù)研究中心,湖北 武漢 430068)
負(fù)荷預(yù)測(cè)是根據(jù)系統(tǒng)的運(yùn)行特性、自然條件等多種因素來(lái)確定未來(lái)某特定時(shí)刻的負(fù)荷數(shù)據(jù)[1]。負(fù)荷預(yù)測(cè)作為電力系統(tǒng)經(jīng)濟(jì)調(diào)度的一項(xiàng)重要內(nèi)容,對(duì)于制定發(fā)送電計(jì)劃、確定機(jī)組最優(yōu)組合以及安全經(jīng)濟(jì)調(diào)度等意義重大[2]。
近年來(lái)隨著軟硬件技術(shù)的不斷提高,針對(duì)負(fù)荷預(yù)測(cè)的方法也在不斷更新,主要分為統(tǒng)計(jì)法、時(shí)間序列法和人工智能法。統(tǒng)計(jì)法主要包括卡爾曼濾波法[3],通過(guò)建立線性狀態(tài)方程減少噪聲帶來(lái)的干擾,在長(zhǎng)期負(fù)荷預(yù)測(cè)中效果較好;時(shí)間序列法是利用歷史負(fù)荷來(lái)預(yù)測(cè)未來(lái)負(fù)荷,以指數(shù)平滑法[4](Holt-Winters)、回歸分析法[5](Linear Regression)為主要代表,計(jì)算速度快,但僅適用于趨勢(shì)平滑的負(fù)荷數(shù)據(jù)曲線;人工智能法對(duì)于波動(dòng)較大的數(shù)據(jù)有較好的擬合能力,主要包括循環(huán)神經(jīng)網(wǎng)絡(luò)[6](Recurrent Neural Network,RNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)[7](Long Short-Term Memory,LSTM)、GRU等。RNN作為傳統(tǒng)神經(jīng)網(wǎng)絡(luò),且輸入輸出可以不定長(zhǎng),但當(dāng)序列較長(zhǎng)時(shí)容易發(fā)生梯度消失和梯度爆炸。LSTM在RNN基礎(chǔ)上改進(jìn),使用輸入門、輸出門、遺忘門控制信息,同時(shí)引入sigmoid函數(shù)并結(jié)合tanh函數(shù),添加求和操作,減少梯度消失和梯度爆炸,但在收斂速度上表現(xiàn)不佳。因此,GRU在LSTM的基礎(chǔ)上進(jìn)行改進(jìn),將遺忘門和輸入門合并成更新門,從而參數(shù)減少,加快收斂速度[8]。但是,GRU需要人工構(gòu)造特征關(guān)系,不能充分挖掘非連續(xù)特征在高維空間中的聯(lián)系,因此應(yīng)加入其它網(wǎng)絡(luò)來(lái)提升特征挖掘能力。
同時(shí),將負(fù)荷數(shù)據(jù)分解為不同頻率,并根據(jù)頻率高低選擇合適的預(yù)測(cè)模型,可以有效提高預(yù)測(cè)精度,常見(jiàn)的數(shù)據(jù)分解方法有小波分解[9](Wavelet Decomposition)和經(jīng)驗(yàn)?zāi)B(tài)分解[10](Empirical Mode Decomposition,EMD)。小波分解是一種指定小波基的數(shù)據(jù)分解方法,但是不同數(shù)據(jù)需選擇合適的小波基函數(shù)才能達(dá)到較好分解效果。EMD無(wú)需預(yù)先設(shè)定基函數(shù),可憑借數(shù)據(jù)自身的時(shí)間尺度特征進(jìn)行信號(hào)分解,但當(dāng)信號(hào)出現(xiàn)階躍性變化時(shí),易發(fā)生模態(tài)混疊現(xiàn)象。
為了提高負(fù)荷預(yù)測(cè)精度,本文提出一種添加白噪聲頻譜輔助的分解方法——集合經(jīng)驗(yàn)?zāi)B(tài)分解EEMD。將數(shù)據(jù)分解為頻率不同的若干個(gè)單一頻率的本征模函數(shù)(Intrinsic Mode Functions,IMF)和余波分量(Residual,Res),再根據(jù)過(guò)零率分為高頻分量和低頻分量;同時(shí),為了解決GRU需要人為構(gòu)造特征關(guān)系的缺點(diǎn),引入卷積神經(jīng)網(wǎng)絡(luò)(CNN),使其充分挖掘負(fù)荷數(shù)據(jù)中時(shí)序特征的聯(lián)系,用于預(yù)測(cè)隨機(jī)性較強(qiáng)的高頻分量,低頻分量波動(dòng)性較小則使用多元線性回歸;最后將其組合重構(gòu),實(shí)現(xiàn)完整負(fù)荷預(yù)測(cè)。
EEMD在EMD基礎(chǔ)上進(jìn)行改進(jìn),降低噪聲造成的干擾,提高預(yù)測(cè)精度。EEMD利用白噪聲頻譜的均勻分布,當(dāng)信號(hào)加在遍布整個(gè)時(shí)頻空間分布一致的白噪聲背景上時(shí),不同時(shí)間尺度的信號(hào)會(huì)自動(dòng)分布到合適的參考尺度上,并且由于零均值噪聲的特性,經(jīng)過(guò)多次平均,噪聲相互抵消,集成均值的結(jié)果就可作為最終結(jié)果[11]。具體步驟總結(jié)如下[11]:
1)在原始信號(hào)X(t)加入噪聲信號(hào)w(t)得到新信號(hào)X′(t)。
X′(t)=X(t)+w(t)
(1)
2)將X′(t)進(jìn)行EMD分解,得到IMF分量以及余波分量
(2)
3)重復(fù)1)2),每次加入強(qiáng)度相同序列不等的白噪聲
(3)
4)將各IMF取平均值求出最終的IMF分量
(4)
針對(duì)周期性強(qiáng)、趨勢(shì)平穩(wěn)的電力負(fù)荷曲線,相比于普通的神經(jīng)網(wǎng)絡(luò),多元線性回歸預(yù)測(cè)精度更高,在參數(shù)調(diào)整和預(yù)測(cè)速度上也有一定優(yōu)勢(shì)。多元線性回歸既不需要參數(shù)調(diào)整,同時(shí)在數(shù)據(jù)集較大時(shí)運(yùn)行速度依然較快,其矩陣表達(dá)式和展開(kāi)式分別為
Y=X×β+u
(5)
(6)
其中yi表示待預(yù)測(cè)負(fù)荷數(shù)據(jù),xij表示歷史負(fù)荷數(shù)據(jù),βi為回歸系數(shù),μ為隨機(jī)擾動(dòng)[13]。通過(guò)使用最小二乘法計(jì)算參數(shù),即可得到回歸函數(shù),用于預(yù)測(cè)趨勢(shì)較平滑的電力負(fù)荷數(shù)據(jù)。
(7)
多元線性回歸對(duì)于波動(dòng)性較強(qiáng)的負(fù)荷分量可能會(huì)產(chǎn)生無(wú)法收斂的情況,而GRU神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí)通過(guò)Adam優(yōu)化算法循環(huán)迭代修正權(quán)重,從而逐漸逼近隨機(jī)性較強(qiáng)的數(shù)據(jù),因此可以通過(guò)GRU來(lái)預(yù)測(cè)高頻分量。GRU結(jié)構(gòu)如圖1。
zt=σ(Wz·[ht-1,xt])
(8)
rt=σ(Wr·[ht-1,xt])
(9)
(10)
(11)
圖1 GRU結(jié)構(gòu)圖
為了充分挖掘數(shù)據(jù)中時(shí)序特征的聯(lián)系,在GRU中加入卷積神經(jīng)網(wǎng)絡(luò)(CNN)。CNN主要包括卷積層、池化層(Max Pooling)、全連接層(Fully Connected,F(xiàn)C)和輸出層,卷積層用來(lái)進(jìn)行特征提取,池化層壓縮并提取主要特征[15]。這種結(jié)構(gòu)可以減少權(quán)值數(shù)量,時(shí)間序列數(shù)據(jù)直接作為輸入,有效降低特征提取的復(fù)雜度。CNN模型使用梯度下降法訓(xùn)練參數(shù),能夠?qū)W習(xí)到時(shí)間序列數(shù)據(jù)中的特征,有效提取連續(xù)數(shù)據(jù)和非連續(xù)數(shù)據(jù)之間的潛在關(guān)系,挖掘時(shí)間序列維度間短期的相關(guān)性,并將特征向量以時(shí)序序列方式構(gòu)造并作為GRU的輸入,CNN-GRU模型如圖2。
圖2 CNN-GRU模型
電力負(fù)荷由于受氣候、電價(jià)等的影響,波動(dòng)較大,單一預(yù)測(cè)模型無(wú)法根據(jù)波動(dòng)規(guī)律做出調(diào)整,預(yù)測(cè)結(jié)果不夠理想。為了改善這種情況,基于“分解-多模型預(yù)測(cè)-組合”的思想,提出一種多頻組合預(yù)測(cè)模型,通過(guò)EEMD分解負(fù)荷數(shù)據(jù),再根據(jù)過(guò)零率,將其分為高低兩種頻率,分別使用CNN-GRU和多元線性回歸進(jìn)行預(yù)測(cè),最后將預(yù)測(cè)結(jié)果疊加組合實(shí)現(xiàn)對(duì)電力負(fù)荷的完整預(yù)測(cè),并使用有關(guān)評(píng)價(jià)指標(biāo)進(jìn)行評(píng)價(jià),具體流程如圖3。
圖3 負(fù)荷預(yù)測(cè)流程圖
預(yù)測(cè)結(jié)果誤差評(píng)價(jià)指標(biāo)采用平均絕對(duì)百分誤差(Mean Absolute Percent Error,MAPE)、均方根誤差(Root Mean Square Error,RMSE)和決定系數(shù)R2[16]。MAPE用來(lái)衡量預(yù)測(cè)準(zhǔn)確性,RMSE用來(lái)衡量預(yù)測(cè)值和實(shí)際值的誤差,R2反應(yīng)了y的波動(dòng)有多少能被x的波動(dòng)所描述,R2越接近于1,則預(yù)測(cè)曲線與真實(shí)曲線擬合效果越好,具體公式如下
(12)
(13)
(14)
數(shù)據(jù)選取于澳大利亞2006年1月2日—2006年6月2日的負(fù)荷數(shù)據(jù),其采樣間隔為30min,包含了電力負(fù)荷和各類氣候影響因素等共五類數(shù)據(jù)。
4.2.1 氣象影響因素選取
電力系統(tǒng)負(fù)荷受電價(jià)、天氣以及社會(huì)環(huán)境等諸多影響,因此可通過(guò)Pearson相關(guān)系數(shù)法來(lái)選取合適的氣象因素,有助于提高精度,計(jì)算公式如下
(15)
式中,xi指各類天氣數(shù)據(jù),yi為負(fù)荷數(shù)據(jù),當(dāng)γχy越大時(shí),則說(shuō)明該氣象因素對(duì)負(fù)荷影響越大。具體見(jiàn)表1。
表1 氣象因素相關(guān)系數(shù)表
由表1可知,可選擇干球溫度作為主要的氣候影響因素。
4.2.2 異常值處理和歸一化處理
電力負(fù)荷由于數(shù)據(jù)采集器故障或遺漏等原因,導(dǎo)致產(chǎn)生異常值或缺失值,在本數(shù)據(jù)集中通常采用平均值法進(jìn)行填充。
平均值填充后,還應(yīng)進(jìn)行數(shù)據(jù)歸一化。對(duì)于不同誤差評(píng)價(jià)指標(biāo),其量綱單位有所不同,而歸一化可以有效解決各誤差評(píng)價(jià)指標(biāo)之間的可比性,本次選擇的方法為min-max標(biāo)準(zhǔn)化,是對(duì)原始數(shù)據(jù)的線性變換,使結(jié)果值映射到[0,1]之間[17]。轉(zhuǎn)換函數(shù)如下
(16)
將經(jīng)過(guò)異常值處理和歸一化后的電力負(fù)荷數(shù)據(jù)進(jìn)行EEMD分解,可得到11組IMF和Res,如圖4。
由圖4可知,各IMF分量頻率較為穩(wěn)定,分布集中,克服了EMD所造成的模態(tài)混疊現(xiàn)象,通過(guò)如下公式計(jì)算得出各IMF過(guò)零率
圖4 EEMD分解圖
(17)
其中,Z為過(guò)零率,nzero為過(guò)零次數(shù),N為數(shù)據(jù)總數(shù)。為了較好地區(qū)分高低頻信號(hào),當(dāng)過(guò)零率低于0.01時(shí)被定義為低頻分量,高于0.01被定義為高頻分量。各分量過(guò)零率見(jiàn)表2。
表2 IMF過(guò)零率
由圖4可知,Res與IMF1相似,可將高頻分量依據(jù)過(guò)零率從大到小依次疊加,再與Res組合,形成高頻信號(hào)。通過(guò)MAPE、RMSE和R2對(duì)比分析得到較合適的組合分量,具體見(jiàn)表3。
表3 高頻個(gè)數(shù)選取
由表3可知,使用CNN-GRU模型預(yù)測(cè),當(dāng)提取高頻個(gè)數(shù)為5時(shí),其MAPE、RMSE和R2分別為1.36%、106.04 kW和0.9916,與其它組合相比,具有明顯優(yōu)勢(shì)。因此,按照過(guò)零率依次選取五個(gè)高頻信號(hào)與Res組合,并將剩余信號(hào)疊加組合形成低頻信號(hào)。通過(guò)把IMF分量以及Res疊加,可以縮短預(yù)測(cè)時(shí)間。
針對(duì)CNN-GRU混合模型,將GRU設(shè)定為兩層,神經(jīng)元個(gè)數(shù)分別為256和16,CNN設(shè)置為兩層,卷積核數(shù)目分別為128和32,內(nèi)核大小設(shè)定為4,經(jīng)試驗(yàn)證明,此時(shí)模型預(yù)測(cè)效果最佳。同時(shí)對(duì)EEMD-BP、EEMD-LSTM等模型進(jìn)行仿真,并調(diào)整參數(shù),尋找參數(shù)最優(yōu)。
5.3.1 EMD與EEMD預(yù)測(cè)結(jié)果對(duì)比
為了驗(yàn)證EEMD的優(yōu)越性,分別使用模型EMD-CNN-GRU-MLR和EEMD-CNN-GRU-MLR對(duì)2006年6月2日一天的電力負(fù)荷進(jìn)行預(yù)測(cè),具體見(jiàn)表4。
表4 EMD與EEMD的預(yù)測(cè)結(jié)果
由表4可知,EEMD-CNN-GRU-MLR模型相對(duì)于EMD-CNN-GRU-MLR,MAPE降低了0.04%,RMSE降低了1.33 kW,R2也有所提高。由圖5可知,無(wú)論是在波峰波谷,還是其它區(qū)域,EEMD-CNN-GRU-MLR更接近于真實(shí)值曲線,這是由于EEMD降低了噪聲所造成的模態(tài)混疊影響,分解得到的各IMF分量頻率穩(wěn)定,易于區(qū)分,預(yù)測(cè)精度提高。
圖5 EMD與EEMD預(yù)測(cè)結(jié)果對(duì)比
5.3.2 不同組合模型預(yù)測(cè)結(jié)果對(duì)比
為了驗(yàn)證EEMD、CNN、GRU和MLR之間的組合性能,將其進(jìn)行逐步組合,并分別預(yù)測(cè)一天(2006年6月2日)和兩周(2006年5月20日-2006年6月2日)的電力負(fù)荷,并根據(jù)MAPE、RMSE評(píng)估其模型性能,如表5所示。同時(shí),2006年6月2日每小時(shí)的預(yù)測(cè)負(fù)荷值和MAPE見(jiàn)附錄1。
表5 不同組合模型的預(yù)測(cè)結(jié)果
圖6 不同組合模型預(yù)測(cè)結(jié)果對(duì)比
由附錄1可知,GRU、EEMD-GRU、EEMD-GRU-MLR和EEMD-CNN-GRU-MLR模型的MAPE范圍分別在0.41%和4.88%、0.16%和3.07%、0.12%和3.43%、0.01%和1.82%之間,即EEMD-CNN-GRU-MLR的MAPE范疇最小。由表5可知,當(dāng)預(yù)測(cè)一日負(fù)荷數(shù)據(jù)時(shí),EEMD-CNN-GRU-MLR相比于其它模型在MAPE方面分別降低1.34%、0.44%、0.16%;當(dāng)預(yù)測(cè)兩周負(fù)荷數(shù)據(jù)時(shí),在MAPE和RMSE方面也有所降低。由圖6可知,GRU曲線較偏離真實(shí)值曲線,而EEMD-CNN-GRU-MLR和EEMD-GRU-MLR與真實(shí)值曲線較接近。由圖7可知,在波峰波谷時(shí),EEMD-CNN-GRU-MLR比EEMD-GRU-MLR擬合效果更好,這是由于CNN能夠挖掘負(fù)荷數(shù)據(jù)中時(shí)序特征的聯(lián)系,為GRU篩選出真實(shí)有效的輸入數(shù)據(jù),提高預(yù)測(cè)精度。
圖7 基于EEMD-GRU-MLR與EEMD-CNN-GRU-MLR模型預(yù)測(cè)結(jié)果對(duì)比
5.3.3 不同網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果對(duì)比
為了進(jìn)一步驗(yàn)證該模型在負(fù)荷預(yù)測(cè)方面的顯著優(yōu)勢(shì),將該預(yù)測(cè)模型分別與經(jīng)過(guò)EEMD分解的BP、LSTM和GRU等模型進(jìn)行對(duì)比,并進(jìn)行誤差評(píng)價(jià),具體見(jiàn)表6。
表6 不同網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果
由表6可知,相對(duì)于EEMD-BP、EEMD-LSTM、EEMD-GRU模型,EEMD-CNN-GRU-MLR在MAPE上分別降低了1.01%、0.65%、0.44%,RMSE下降了119.26kW、76.61kW、56.94kW。由圖8可知,模型EEMD-CNN-GRU-MLR無(wú)論曲線上升下降階段,還是波峰波谷,均比其它網(wǎng)絡(luò)模型曲線擬合效果好。這是由于其它預(yù)測(cè)模型不能根據(jù)數(shù)據(jù)波動(dòng)調(diào)整預(yù)測(cè)模型,而EEMD-CNN-GRU-MLR能夠根據(jù)不同頻率的信號(hào)采用不同的預(yù)測(cè)模型,從而使得預(yù)測(cè)精度提高。
圖8 不同網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果對(duì)比
短期負(fù)荷預(yù)測(cè)不僅關(guān)系到電力企業(yè)發(fā)送電規(guī)劃制定的合理性,嚴(yán)重時(shí)還會(huì)影響到電網(wǎng)的正常運(yùn)轉(zhuǎn)。本文提出一種基于“分解-多模型預(yù)測(cè)-組合”的電力負(fù)荷預(yù)測(cè)模型,先使用EEMD進(jìn)行數(shù)據(jù)分解,降低噪聲干擾,再進(jìn)行分頻預(yù)測(cè)。在進(jìn)行高頻預(yù)測(cè)時(shí),充分考慮氣候影響因素對(duì)負(fù)荷數(shù)據(jù)造成的波動(dòng),在GRU模型的基礎(chǔ)上加入卷積神經(jīng)網(wǎng)絡(luò),使其進(jìn)行數(shù)據(jù)特征提取,有效提高預(yù)測(cè)精度,趨勢(shì)平滑的低頻部分則使用多元線性回歸進(jìn)行預(yù)測(cè)。根據(jù)仿真結(jié)果可知,本文提出的模型在精度以及曲線擬合方面均表現(xiàn)良好,是一種有效的短期負(fù)荷預(yù)測(cè)方法。