陸嘉華,梅 飛,楊 賽,唐 瑜,華昊辰
(河海大學(xué)能源與電氣學(xué)院,江蘇 南京 211100)
構(gòu)建新型的電力系統(tǒng)是實(shí)現(xiàn)“雙碳”目標(biāo)的重要途徑,進(jìn)行準(zhǔn)確高效的短期負(fù)荷預(yù)測(cè)是實(shí)現(xiàn)電力系統(tǒng)安全穩(wěn)定經(jīng)濟(jì)運(yùn)行的重要條件[1]. 由于大量分布式電源在負(fù)荷側(cè)并網(wǎng)數(shù)目增加,氣象、日期等外部因素的影響進(jìn)一步增加了負(fù)荷不確定性[2]. 為了提高配電網(wǎng)運(yùn)行的穩(wěn)定性和運(yùn)行效率,對(duì)負(fù)荷影響因素進(jìn)行特征優(yōu)選,進(jìn)而構(gòu)建合理的負(fù)荷預(yù)測(cè)模型是實(shí)現(xiàn)這一目標(biāo)的重要措施.
短期負(fù)荷預(yù)測(cè)是指預(yù)測(cè)未來數(shù)小時(shí)至數(shù)天的負(fù)荷大小,對(duì)電力系統(tǒng)運(yùn)行、控制、調(diào)節(jié)等具有重要意義[3]. 目前針對(duì)負(fù)荷短期預(yù)測(cè)問題已有許多研究. 短期負(fù)荷預(yù)測(cè)方法可分為數(shù)學(xué)統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法[4],預(yù)測(cè)形式可分為確定性預(yù)測(cè)[5]和不確定性預(yù)測(cè)[6].
在構(gòu)建負(fù)荷預(yù)測(cè)模型時(shí),選擇適當(dāng)?shù)臍庀筇卣鲗?duì)模型性能的研究至關(guān)重要[7]. 通常采用經(jīng)驗(yàn)法[8]和相關(guān)性分析[9]來選擇這些特征,這些方法具有高效性且應(yīng)用廣泛. 此外,過濾法使用互信息(mutual information,MI)或皮爾遜相關(guān)系數(shù)來構(gòu)建特征子集,以修正特征輸入[10-11]. 然而,這可能導(dǎo)致特征之間的冗余性. 部分研究結(jié)合過濾法和包裝法以提高準(zhǔn)確性,同時(shí)也增加了模型訓(xùn)練時(shí)間[12]. 為了解決特征選擇和冗余性問題,一些研究使用正則化方法,通過模型權(quán)重來約束不重要的特征,使它們的權(quán)重趨近于零[13],從而提高了模型的泛化性能.
在時(shí)間序列預(yù)測(cè)中,深度學(xué)習(xí)方法相對(duì)于傳統(tǒng)方法更能挖掘負(fù)荷的非線性特征. 循環(huán)神經(jīng)網(wǎng)絡(luò)及其改進(jìn)算法被廣泛用于提取時(shí)序特征. 時(shí)域卷積神經(jīng)網(wǎng)絡(luò)(temporal convolution network,TCN)[14]能夠提取短時(shí)特征,而WaveNet模型則處理長(zhǎng)負(fù)荷時(shí)間序列[15]. 有些研究將卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)與長(zhǎng)短期記憶(long short-term memory,LSTM)神經(jīng)網(wǎng)絡(luò)相結(jié)合以提取不同時(shí)間尺度的特征[16],或?qū)NN與門控循環(huán)單元(gated recurrent unit,GRU)結(jié)合,以提高運(yùn)算效率[17]. 組合預(yù)測(cè)模型是提高模型泛化性能的一種方法. 分解算法和優(yōu)化算法分別用于構(gòu)建時(shí)序特征和調(diào)整超參數(shù),顯著提高了模型性能[18],或采用分層預(yù)測(cè)模型或通過分解算法構(gòu)建不同分量的預(yù)測(cè)模型,最后將它們的預(yù)測(cè)結(jié)果相加以獲得最終結(jié)果[19-21].
本文針對(duì)配電網(wǎng)負(fù)荷短期預(yù)測(cè)問題構(gòu)建了BP回歸模型與CNN結(jié)合雙向門控循環(huán)單元(Bi-directional gated recurrent unit,BiGRU)時(shí)間序列模型的組合預(yù)測(cè)模型. 首先針對(duì)多維氣象特征的選擇問題提出了一種特征選擇流程,基于特征選擇結(jié)果分別構(gòu)建回歸和時(shí)序預(yù)測(cè)模型的氣象特征輸入. 該組合預(yù)測(cè)模型第一部分通過BP回歸模型學(xué)習(xí)日期特征和實(shí)時(shí)氣象特征來擬合實(shí)際負(fù)荷值;第二部分構(gòu)建時(shí)間序列模型,將歷史氣象和歷史負(fù)荷時(shí)序特征作為時(shí)序模型輸入特征,輸出負(fù)荷預(yù)測(cè)值;第三部分構(gòu)建負(fù)荷短期預(yù)測(cè)模型,以前兩部分模型負(fù)荷預(yù)測(cè)結(jié)果作為模型輸入,同時(shí)考慮日類型特征,基于BP神經(jīng)網(wǎng)絡(luò)輸出最終負(fù)荷預(yù)測(cè)值. 通過對(duì)某地配電網(wǎng)10 kV母線預(yù)測(cè)算例分析,本文特征選擇方法提高了預(yù)測(cè)的準(zhǔn)確性,組合預(yù)測(cè)模型相較于單一回歸或時(shí)間序列模型具有更低的預(yù)測(cè)誤差,對(duì)負(fù)荷變化趨勢(shì)較大的非工作日預(yù)測(cè)效果有明顯改善.
作為模型的特征輸入集合需要考慮特征與負(fù)荷之間的相關(guān)性、特征之間的相關(guān)性大小即冗余性和多個(gè)特征的協(xié)同作用[22],通過綜合考慮特征三部分作用計(jì)算特征增益大小來選擇特征加入最優(yōu)特征子集中,使用最優(yōu)特征子集構(gòu)建模型可以提高模型預(yù)測(cè)準(zhǔn)確性.
考慮單個(gè)特征與負(fù)荷相關(guān)性,使用MI計(jì)算單個(gè)特征與負(fù)荷相關(guān)性以及特征之間的冗余性大小. 針對(duì)連續(xù)特征變量,互信息基于信息理論計(jì)算相關(guān)性,能夠很好的描述變量之間線性及非線性關(guān)系大小. 互信息的值越大變量之間的相關(guān)性越高,互信息為0時(shí)說明變量之間相互獨(dú)立. 兩個(gè)連續(xù)隨機(jī)變量之間互信息計(jì)算公式如式(1):
(1)
式中,X1、X2為兩個(gè)連續(xù)隨機(jī)變量,p(x1)為變量X1的概率密度函數(shù),p(x2)為變量X2的概率密度函數(shù),p(x1,x2)為兩個(gè)隨機(jī)變量聯(lián)合概率密度函數(shù).
(1)相關(guān)性計(jì)算.單個(gè)氣象特征與負(fù)荷互信息大小計(jì)算公式為:
Ci=MI(Xi,Y),Xi∈RF,
(2)
式中,Xi為原始特征集RF中第i個(gè)特征,Ci記作第i個(gè)氣象特征與負(fù)荷的互信息大小.Ci越大說明該氣象特征與負(fù)荷相關(guān)性越強(qiáng).
(2)冗余性計(jì)算.最優(yōu)特征集記作OF.使用Ri評(píng)價(jià)原始特征集中的單個(gè)特征Xi加入最優(yōu)特征集后的特征冗余性,計(jì)算公式為:
OF={X1,X2,…,Xm},
(3)
(4)
式中,Xj為最優(yōu)特征集中第j個(gè)特征,原始特征集合選擇的單個(gè)特征Xi與最優(yōu)特征子集的冗余性,選擇具有較小的冗余性特征,避免了最優(yōu)特征集中同時(shí)選擇多個(gè)相似特征.
(3)協(xié)同作用計(jì)算.協(xié)同作用指多個(gè)氣象特征變量同時(shí)對(duì)負(fù)荷變量的作用,用復(fù)相關(guān)系數(shù)度量,復(fù)相關(guān)系數(shù)越大,相關(guān)性越強(qiáng).復(fù)相關(guān)系數(shù)用于描述最優(yōu)特征集對(duì)標(biāo)簽的作用大小,基于多元線性回歸模型求得,計(jì)算公式為:
(5)
式中,yt為真實(shí)標(biāo)簽值,對(duì)應(yīng)實(shí)際負(fù)荷值;ya為真實(shí)標(biāo)簽值的平均值,yr為多元線性回歸的回歸值.考慮原始特征集的單個(gè)特征Xi加入最優(yōu)特征集,多元線性回歸值的計(jì)算參考式(6),進(jìn)一步計(jì)算協(xié)同作用大小Si,如式(7)所示:
yi=mlr({Xi}∪OF,y),
(6)
Si=r(yi,y),
(7)
式中,mlr表示多元線性回歸模型,自變量為最優(yōu)特征集和原始特征集中第i個(gè)特征的并集,y為回歸方程因變量即負(fù)荷真實(shí)值,yi對(duì)應(yīng)回歸方程回歸值.
(4)特征集增益計(jì)算.若考慮將原始特征集中單個(gè)特征Xi加入最優(yōu)特征集中,此時(shí)的最優(yōu)特征集增益可寫作Gi,計(jì)算公式如下:
Gi(α,β,Xi)=Ci-αRi+βSi,
(8)
式中,Ci為原始特征集中氣象特征Xi與負(fù)荷相關(guān)性大小,Ri為氣象特征Xi加入最優(yōu)特征集中的冗余性大小,Si為氣象特征加入最優(yōu)特征集后的協(xié)同作用大小,α和β分別為控制冗余性和協(xié)同作用的權(quán)重系數(shù).通過權(quán)重系數(shù)來控制單個(gè)氣象特征Xi加入最優(yōu)特征集時(shí)的增益正負(fù).當(dāng)Ci大于0時(shí)特征集增益為正,反之為負(fù).
原始?xì)庀筇卣骷蓛刹糠謽?gòu)成,一部分是氣象站采集的氣象數(shù)據(jù)中包含的各個(gè)氣象特征,另一部分包括考慮氣象耦合作用的綜合氣象因素影響,耦合氣象因素包括熱指數(shù)、溫濕指數(shù)、風(fēng)寒指數(shù)和人體舒適度指數(shù)[23],特征集中各氣象特征符號(hào)及其含義如表1所示.
表1 氣象特征符號(hào)及含義
將原始特征集合記為RF,寫作:
RF={GHI,UVI,T2M,T2MD,T2MW,QV2M,RH2M,PP,PS,WS10M,WD10M,HI,THI,WCI,CIHB}
(9)
基于原始特征集中單個(gè)特征加入最優(yōu)特征集中的特征集增益正負(fù),為正時(shí)將該特征加入最優(yōu)特征集,同時(shí)從原始特征集中去除;增益為負(fù)時(shí)則將該特征直接從原始特征集中去除;再進(jìn)行下一步迭代,直到原始特征集合為空集結(jié)束,輸出的結(jié)果為最優(yōu)特征集,記作OF.特征選擇流程如圖1所示,特征選擇流程如下所述.
圖1 特征選擇流程圖
第一步:輸入初始數(shù)據(jù)原始特征集RF、最優(yōu)特征集OF、權(quán)重系數(shù)α和β;
第二步:從原始特征集中選擇具有最大相關(guān)性的特征作為最優(yōu)特征集的初始特征;
第三步:從原始特征集中選擇具有最大相關(guān)性的特征,計(jì)算最優(yōu)特征集增益,若增益大于0,則將該特征加入最優(yōu)特征集,同時(shí)從原始特征剔除該特征,反之則直接從原始特征剔除該特征;
第四步:判斷原始特征集是否為空,滿足條件時(shí)結(jié)束程序,輸出最優(yōu)特征集,反之則跳轉(zhuǎn)至第三步.
將選擇流程中冗余性和協(xié)同作用權(quán)重系數(shù)α和β視為預(yù)測(cè)模型超參數(shù),通過粒子群優(yōu)化方法(particle swarm optimization,PSO)確定權(quán)重系數(shù)α和β,分別為0.212和0.017,得到最優(yōu)特征集OF為紫外線指數(shù)、地表2 m處干球溫度和相對(duì)濕度,寫作:
表2 時(shí)間日期特征符號(hào)及含義
OF={UVI,T2M,RH2M},
(10)
組合預(yù)測(cè)模型包含三個(gè)部分,其結(jié)構(gòu)如圖2所示:第一部分為BP回歸預(yù)測(cè)模型,第二部分為CNN-BiGRU時(shí)間序列預(yù)測(cè)模型,第三部分為組合預(yù)測(cè)模型. BP回歸預(yù)測(cè)模型對(duì)影響負(fù)荷的日期時(shí)間特征和未來氣象特征進(jìn)行解釋,而CNN-BiGRU學(xué)習(xí)歷史負(fù)荷和累積氣象因素時(shí)間序列中的時(shí)序信息.
圖2 負(fù)荷組合預(yù)測(cè)模型
BP回歸模型能夠較好的擬合非線性特征,但對(duì)于歷史負(fù)荷中時(shí)序特征提取不足,也沒能考慮氣象因素累積效應(yīng),因此本文負(fù)荷預(yù)測(cè)模型采用時(shí)間序列預(yù)測(cè)模型與BP回歸預(yù)測(cè)模型結(jié)合構(gòu)建的組合預(yù)測(cè)模型,以增強(qiáng)預(yù)測(cè)模型對(duì)不同時(shí)序特征學(xué)習(xí)能力.
針對(duì)負(fù)荷預(yù)測(cè)的實(shí)時(shí)特征量,如已知天氣預(yù)報(bào)值和預(yù)測(cè)點(diǎn)的日期、時(shí)間、特殊日特征,可以利用BP神經(jīng)網(wǎng)絡(luò)較強(qiáng)的非線性擬合能力,建立多元回歸模型,學(xué)習(xí)不同特征波動(dòng)在某個(gè)時(shí)刻值對(duì)負(fù)荷大小的影響. 回歸模型的氣象特征輸入為特征選擇后的最優(yōu)特征集OF,考慮負(fù)荷具有非常強(qiáng)的時(shí)間周期性特點(diǎn),據(jù)此建立回歸模型的時(shí)間輸入特征如表2所示.
動(dòng)態(tài)氣象特征賦權(quán)結(jié)構(gòu)將日期時(shí)間變量通過編碼層輸出氣象特征權(quán)重矩陣,用模型氣象特征輸入乘該權(quán)重矩陣,用于控制氣象特征在不同日期時(shí)間下輸入大小[10]. 如圖2第一部分所示,將加權(quán)后的氣象特征向量與時(shí)間日期特征融合作為回歸預(yù)測(cè)模型的特征輸入,最后輸出預(yù)測(cè)結(jié)果.
加權(quán)結(jié)構(gòu)編碼層由多層神經(jīng)網(wǎng)絡(luò)全連接層組成,如圖3所示. 輸出時(shí)變特征權(quán)重矩陣[ω1,ω2,…,ωm],將氣象特征矩陣[X1,X2,…,Xm]加權(quán).
圖3 氣象特征動(dòng)態(tài)加權(quán)結(jié)構(gòu)
記日期時(shí)間特征集為DF,將特征輸入記為XDF,考慮僅一層隱含層編碼結(jié)構(gòu),動(dòng)態(tài)氣象特征賦權(quán)過程可寫作:
[ω1,ω2,…,ωm]=φ(XDFW+b),
(11)
[X′1,X′2,…,X′m]=[ω1,ω2,…,ωm]⊙XOF,
(12)
式(11)中,XDF為日期時(shí)間輸入向量,W為編碼層權(quán)重系數(shù)矩陣,b為編碼層的偏置項(xiàng)向量,φ為激活函數(shù),ω為動(dòng)態(tài)特征權(quán)重.式(12)為特征賦權(quán)過程,m為OF中元素個(gè)數(shù),對(duì)兩向量進(jìn)行哈達(dá)瑪積運(yùn)算,結(jié)果即為加權(quán)氣象特征向量.
將加權(quán)后的氣象特征與時(shí)間日期特征分別由各自的編碼層進(jìn)行編碼,得到兩個(gè)相同維度的編碼特征向量,通過向量拼接來實(shí)現(xiàn)兩部分特征融合,其計(jì)算過程如式(13):
X=[X′OFW′OF+b′OF,XDFWDF+bDF],
(13)
式中,X為兩部分特征融合后的特征向量,即BP神經(jīng)網(wǎng)絡(luò)的輸入;X′OF為加權(quán)氣象特征,W′OF與b′OF分別對(duì)應(yīng)其編碼層的權(quán)重系數(shù)矩陣與偏置項(xiàng)向量;相應(yīng)的,WDF與bDF分別對(duì)應(yīng)時(shí)間日期特征輸入編碼層的權(quán)重系數(shù)矩陣與偏置項(xiàng)向量.
GRU簡(jiǎn)化了LSTM模型的輸入結(jié)構(gòu),降低了模型復(fù)雜度,同時(shí)采用雙向結(jié)構(gòu)來增強(qiáng)時(shí)序特征前后時(shí)序信息聯(lián)系. 一維CNN與循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)合模型用于學(xué)習(xí)長(zhǎng)時(shí)間序列信息,且在負(fù)荷預(yù)測(cè)中取得了較好的效果[24],一維CNN計(jì)算定義如式(14):
(14)
式中,Ti為輸入時(shí)序特征,?為卷積運(yùn)算,Ki為第i個(gè)濾波器的卷積核函數(shù),b為偏置項(xiàng),φ為激活函數(shù).
時(shí)序預(yù)測(cè)模型中GRU結(jié)構(gòu)的每個(gè)時(shí)間步長(zhǎng)狀態(tài)參數(shù)計(jì)算如公式(15)-(18):
(15)
(16)
(17)
h=z*h′+(1-z)*g,
(18)
式中,z為更新門,r為重置門;g為先前狀態(tài)門控制器,h為當(dāng)前時(shí)間步的激活狀態(tài),h′為上一時(shí)間步激活狀態(tài),x為當(dāng)前時(shí)間步輸入特征向量;Wz、Wr、Wg分別為對(duì)應(yīng)門控制器權(quán)重矩陣,bz、br、bg分別為對(duì)應(yīng)門控制器的偏置項(xiàng).
BiGRU以GRU為基礎(chǔ)加入雙向循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),學(xué)習(xí)時(shí)序特征時(shí)包含前向和反向兩個(gè)傳播方向,加強(qiáng)了GRU模型對(duì)時(shí)序特征的提取能力. 參考圖4中BiGRU結(jié)構(gòu),計(jì)算公式如式(19)-(21)所示:
圖4 CNN-BiGRU模型結(jié)構(gòu)
yt=φ1(W1ht+W′1h′t),
(19)
ht=φ2(W2xt+W3ht-1),
(20)
h′t=φ2(W′2xt+W′3h′t-1),
(21)
式中,xt和yt分別為第t時(shí)間步輸入和輸出,ht、ht′分別為第t時(shí)間步的前向?qū)雍头聪驅(qū)拥妮敵鰻顟B(tài)量;W1和W1′分別為前向和反向狀態(tài)量映射至輸出層權(quán)重矩陣;W2和W2′分別為輸入量映射至前向和反向狀態(tài)量的權(quán)重矩陣;W3和W3′分別為第t-1時(shí)間步前向和反向狀態(tài)量映射至第t時(shí)間步狀態(tài)量的權(quán)重矩陣;φ1和φ2分別為前向和反向兩個(gè)方向的激活函數(shù).
本文使用的誤差評(píng)價(jià)指標(biāo)采用平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE)、平均絕對(duì)誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE),用于評(píng)價(jià)不同預(yù)測(cè)模型的預(yù)測(cè)準(zhǔn)確性,同時(shí)采用確定性系數(shù)(coefficient of determination,R2)評(píng)價(jià)模型回歸預(yù)測(cè)能力,即預(yù)測(cè)變化趨勢(shì).
本文實(shí)驗(yàn)數(shù)據(jù)集采用江蘇省宿遷市某配電網(wǎng)10 kV母線負(fù)荷數(shù)據(jù),數(shù)據(jù)包含工業(yè)負(fù)荷、部分商業(yè)負(fù)荷和居民負(fù)荷;負(fù)荷數(shù)據(jù)采集時(shí)間為2019年1月1日至2021年12月31日,分辨率為15 min. 負(fù)荷所在地的氣象數(shù)據(jù)來源于NASA公開氣象數(shù)據(jù)網(wǎng)站,數(shù)據(jù)時(shí)間跨度與負(fù)荷數(shù)據(jù)保持一致,分辨率為1 h,各個(gè)特征類型及含義見表1. 對(duì)負(fù)荷數(shù)據(jù)進(jìn)行降采樣,使負(fù)荷采集間隔與氣象數(shù)據(jù)保持一致.
數(shù)據(jù)中連續(xù)缺失值采用相鄰兩日同一時(shí)刻的數(shù)值的平均值進(jìn)行填充,對(duì)不同量綱數(shù)據(jù)進(jìn)行最小最大歸一化處理.
本文實(shí)驗(yàn)特征選擇方法基于Skit-learn框架構(gòu)建,負(fù)荷回歸預(yù)測(cè)模型和時(shí)間序列模型均基于Keras和Tensorflow平臺(tái)搭建. 實(shí)驗(yàn)提取數(shù)據(jù)集最后31天用于測(cè)試集,剩余數(shù)據(jù)按7∶3劃分為訓(xùn)練集和驗(yàn)證集. 預(yù)測(cè)方式為短期預(yù)測(cè)中的日前預(yù)測(cè),其預(yù)測(cè)間隔為1 h,共有24個(gè)時(shí)間點(diǎn)負(fù)荷值. 實(shí)驗(yàn)通過實(shí)際日負(fù)荷數(shù)據(jù)更新預(yù)測(cè),對(duì)最后一個(gè)月31天的負(fù)荷值進(jìn)行預(yù)測(cè). 各模型參數(shù)設(shè)置如表3所示.
表3 模型主要參數(shù)
模型中間層由多層神經(jīng)網(wǎng)絡(luò)疊加,回歸模型和組合模型的實(shí)際堆疊層數(shù)為3層,每層單元個(gè)數(shù)分別為200、100和50,激活函數(shù)采用LeakyReLU,其計(jì)算公式如式(22)所示:
(22)
式中,x為激活函數(shù)輸入變量,λ為斜率系數(shù),λ>0,本文模型中λ取0.01.
模型訓(xùn)練學(xué)習(xí)率均采用指數(shù)調(diào)度形式,優(yōu)化方式采用Adam算法. 對(duì)比模型的參數(shù)設(shè)置與本文模型參數(shù)設(shè)置基本一致. 時(shí)間序列模型中間層堆疊層數(shù)為4層,激活函數(shù)采用tanh,模型數(shù)據(jù)結(jié)構(gòu)變化如圖5所示,Bs為Batch size大小.
圖5 模型各層數(shù)據(jù)結(jié)構(gòu)變化圖
為驗(yàn)證本文方法的有效性,首先針對(duì)不同特征選擇方法對(duì)模型性能的影響進(jìn)行分析,分別采用Pearson、MIC、隨機(jī)森林回歸(random forest regressor,RFR)特征排序方法和本文特征選擇方法結(jié)合回歸預(yù)測(cè)模型進(jìn)行預(yù)測(cè)性能對(duì)比,再將本文組合預(yù)測(cè)模型分別與文獻(xiàn)中常用時(shí)序模型進(jìn)行對(duì)比,包括LSTM、GRU以及CNN-GRU、CNN-BiLSTM、CNN-BiGRU,分別簡(jiǎn)化為CGRU、CBiLSTM、CBiGRU.
通過本文特征選擇方法對(duì)原始特征集中特征進(jìn)行選擇得到最優(yōu)特征子集,特征選擇方法中超參數(shù)α和β由PSO參數(shù)優(yōu)化方法基于訓(xùn)練集和驗(yàn)證集確定,種群大小為20,迭代次數(shù)為150,隨機(jī)化粒子初始位置,最大速度為0.01,目標(biāo)函數(shù)為模型預(yù)測(cè)誤差.
為對(duì)本文特征選擇方法的有效性進(jìn)行檢驗(yàn),對(duì)比特征選擇方法采用Pearson相關(guān)系數(shù)、MIC相關(guān)性和RFR對(duì)特征重要程度進(jìn)行排序,用相關(guān)性大小閾值或特征重要程度閾值得到特征選擇結(jié)果,結(jié)合BP回歸預(yù)測(cè)模型進(jìn)行負(fù)荷預(yù)測(cè),計(jì)算誤差進(jìn)行對(duì)比分析.
Pearson相關(guān)系數(shù)和MIC特征選擇的結(jié)果相同. 從表4中不同特征選擇方法的預(yù)測(cè)結(jié)果可以看出,本文提出的特征選擇方法具有最小的預(yù)測(cè)誤差,同時(shí)對(duì)負(fù)荷的變化趨勢(shì)擬合效果也具有一定的提升效果.
表4 各特征選擇方法預(yù)測(cè)性能
從表4的結(jié)果可以看出,基于相關(guān)性大小的Pearson和MIC特征選擇方法和RFR方法無法對(duì)特征的冗余性進(jìn)行限制,故同時(shí)選擇了輻照度和紫外線指數(shù)兩個(gè)特征. 本文的特征選擇方法同時(shí)考慮了特征多個(gè)因素,本文特征選擇流程提高了模型的預(yù)測(cè)準(zhǔn)確度.
由圖6中整體預(yù)測(cè)效果可以知道回歸模型相較于時(shí)序預(yù)測(cè)模型效果較差,在12月1日至4日輸入特征變化僅在日特征、時(shí)特征和氣象特征,故預(yù)測(cè)結(jié)果也較為平穩(wěn),5日回歸模型輸入中含有節(jié)假日和日類型信息,在負(fù)荷水平顯著降低時(shí)實(shí)現(xiàn)了較好的擬合效果.
圖6 各特征選擇方法1至7日回歸預(yù)測(cè)曲線
對(duì)于本文所提出的組合預(yù)測(cè)方法,對(duì)比模型選擇負(fù)荷預(yù)測(cè)中應(yīng)用廣泛的時(shí)間序列模型,預(yù)測(cè)結(jié)果統(tǒng)計(jì)如表5所示.
表5 各模型負(fù)荷預(yù)測(cè)性能
根據(jù)各個(gè)模型總體預(yù)測(cè)性能結(jié)果,本文預(yù)測(cè)模型在各性能評(píng)價(jià)指標(biāo)上都好于其它傳統(tǒng)預(yù)測(cè)模型及其改進(jìn)模型,驗(yàn)證了本文方法對(duì)準(zhǔn)確性的提升作用. 傳統(tǒng)時(shí)序預(yù)測(cè)模型中加入卷積層對(duì)模型的預(yù)測(cè)準(zhǔn)確度具有一定的提升作用,且具有雙向結(jié)構(gòu)的模型相較于沒有雙向結(jié)構(gòu)的模型的預(yù)測(cè)準(zhǔn)確性提升較為顯著. 相同模型結(jié)構(gòu)和參數(shù)下,使用BiGRU算法改善了傳統(tǒng)雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果.
通過分析預(yù)測(cè)結(jié)果中12月1日至7日,這段時(shí)間包括4個(gè)工作日和2個(gè)周末日,如圖7所示. 對(duì)比圖6 所示回歸模型預(yù)測(cè)結(jié)果,時(shí)序預(yù)測(cè)模型在負(fù)荷日內(nèi)的預(yù)測(cè)趨勢(shì)表現(xiàn)良好,表明時(shí)序模型具有出色的預(yù)測(cè)性能.
圖7 各模型1日至7日預(yù)測(cè)曲線
從圖8中可以觀察到,不同模型在12月1日、2日和5日的預(yù)測(cè)誤差存在明顯差異. 特別是加入卷積層的CGRU模型在負(fù)荷谷值處的預(yù)測(cè)效果優(yōu)于GRU模型,而加入雙向結(jié)構(gòu)的CBiGRU模型在峰值處的擬合效果明顯提高. 根據(jù)實(shí)際負(fù)荷曲線可以看出12月4日的負(fù)荷相對(duì)于前一天的變化較小,而從4日到5日的實(shí)際負(fù)荷有明顯下降趨勢(shì). 時(shí)序模型的預(yù)測(cè)受到前一天負(fù)荷大小的影響,導(dǎo)致5日負(fù)荷峰值處的預(yù)測(cè)結(jié)果偏高.
圖8 各模型1至7日每日預(yù)測(cè)MAPE
回歸預(yù)測(cè)結(jié)果和表6中的性能對(duì)比表明,本文方法利用組合模型中的回歸模型學(xué)習(xí)時(shí)間日期和節(jié)假日的特征,較好地捕捉了周末負(fù)荷變化趨勢(shì),從而提高了對(duì)周末負(fù)荷的預(yù)測(cè)性能.
表6 各模型不同日類型平均預(yù)測(cè)性能
本文提出了基于組合預(yù)測(cè)模型解決配電網(wǎng)母線短期預(yù)測(cè)問題,構(gòu)建特征選擇方法對(duì)影響負(fù)荷的多個(gè)氣象特征進(jìn)行優(yōu)選,通過在配電網(wǎng)10 kV母線負(fù)荷進(jìn)行預(yù)測(cè)分析得到以下結(jié)論:
(1)本特征選擇方法能夠從多個(gè)氣象特征中選出與負(fù)荷相關(guān)性最大、特征之間冗余性最小和具有最大協(xié)同作用的最優(yōu)特征集,相較于傳統(tǒng)相關(guān)性特征選擇方法降低了模型預(yù)測(cè)誤差;
(2)加入卷積神經(jīng)網(wǎng)絡(luò)和雙向循環(huán)神經(jīng)結(jié)構(gòu)的時(shí)序模型能提升模型時(shí)序預(yù)測(cè)能力;
(3)本文方法利用回歸與時(shí)序模型結(jié)合的組合預(yù)測(cè)模型對(duì)影響負(fù)荷特征進(jìn)行不同時(shí)間維度的學(xué)習(xí),總體預(yù)測(cè)結(jié)果相比于最優(yōu)卷積時(shí)序模型的MAPE降低了18.31%,且對(duì)于變化趨勢(shì)較大的周末負(fù)荷預(yù)測(cè)MAPE的誤差降低了17.20%.