許青,張齡之,梁琛,李亞昕
(1.國網(wǎng)甘肅省電力公司,甘肅 蘭州 730030;2.國網(wǎng)甘肅省電力公司電力科學(xué)研究院,甘肅 蘭州 730070)
隨著我國“雙碳”目標(biāo)的提出,以高比例新能源接入為典型特征的新型電力系統(tǒng)建設(shè)不斷發(fā)展[1]。截至2023年4月底,全國非化石能源發(fā)電裝機容量13.5億kW,占總裝機容量的50.8%,其中風(fēng)電裝機3.8億kW,太陽能發(fā)電裝機4.4億kW[2]。風(fēng)光等新能源發(fā)電具有的隨機性和波動性特征,使得高比例新能源滲透率電網(wǎng)的短期負荷預(yù)測不僅受到天氣、日期、經(jīng)濟等條件的影響,也需要考慮新能源的發(fā)電情況[3-5]。
精準(zhǔn)的負荷預(yù)測對電力系統(tǒng)的安全、穩(wěn)定、經(jīng)濟運行具有重要意義。當(dāng)前,常見的預(yù)測方法主要有傳統(tǒng)統(tǒng)計學(xué)方法和人工智能方法2類。前者包括回歸分析法、馬爾科夫鏈、時間序列法等,優(yōu)點在于原理簡單易懂,計算快捷,但非線性擬合能力不強,預(yù)測效果較差。后者包括支持向量機(support vector regression,SVR)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)及其相關(guān)改進網(wǎng)絡(luò)如卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、時間卷積網(wǎng)絡(luò)(temporal convolutional network,TCN)、長短期神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)等[6-11]。這類算法一般將影響預(yù)測項的各種特征量和預(yù)測項分別作為輸入項和輸出項,通過大量訓(xùn)練求解,非線性擬合能力較強,但預(yù)測結(jié)果受輸入項選擇影響較大。此外,SVR和CNN對數(shù)據(jù)的時序特性考慮不多,而TCN針對時序問題對CNN進行了改進,有效降低了預(yù)測誤差,被廣泛應(yīng)用在機組出力預(yù)測、負荷預(yù)測等場景中。
文獻[12]提出一種CNN-SVR聯(lián)合負荷預(yù)測模型,指出其預(yù)測結(jié)果準(zhǔn)確率比SVR、CNN等方法更高;文獻[13]提出基于雙向LSTM的超短期負荷預(yù)測模型,指出通過篩選網(wǎng)絡(luò)輸入項有利于提高預(yù)測精度;文獻[14]同樣指出提取關(guān)鍵特征值能夠提高預(yù)測模型的準(zhǔn)確性。但上述研究都缺乏對預(yù)測結(jié)果的修正環(huán)節(jié)。文獻[15]將歷史光伏出力數(shù)據(jù)與天氣預(yù)報相關(guān)聯(lián),提出一種考慮時序動態(tài)回歸的短期光伏出力預(yù)測方法;文獻[16]對風(fēng)電出力預(yù)測展開研究,指出針對不同天氣類型,分別建立預(yù)測模型能夠改進預(yù)測結(jié)果。可以看出,現(xiàn)有預(yù)測研究往往集中在風(fēng)、光出力和負荷等單一場景預(yù)測,很少將風(fēng)光出力因素納入負荷預(yù)測的研究范圍。而在高比例新能源電力系統(tǒng)中,風(fēng)光等新能源的隨機性與間歇性大大增加了電網(wǎng)調(diào)度的難度,在該場景下,有必要將新能源出力納入負荷預(yù)測研究范圍。文獻[17-19]對風(fēng)光聯(lián)合場景下的分布式電源規(guī)劃等進行研究,為本文提供了參考。
綜上,本文提出基于聯(lián)合時序場景的改進型TCN高比例新能源電網(wǎng)短期負荷預(yù)測方法。首先通過相關(guān)性距離刻畫風(fēng)光出力和負荷的聯(lián)合場景特性,將負荷預(yù)測場景進行分類;然后建立隨機森林(random forest)-時間卷積網(wǎng)絡(luò)(RF-TCN)預(yù)測模型,并通過Bootstrap對預(yù)測結(jié)果進行修正;最后,以甘肅某地實際電網(wǎng)為例進行仿真驗證,驗證本文所提方法的有效性。
隨著新型電力系統(tǒng)建設(shè)的不斷推進,我國電力系統(tǒng)新能源滲透率將不斷提高。本文所提負荷預(yù)測方法的核心在于考慮了風(fēng)光等新能源出力因素,并基于風(fēng)光出力與負荷關(guān)聯(lián)度劃分成不同預(yù)測場景。具體過程包括負荷與新能源出力相關(guān)性分析、RF-TCN短期負荷預(yù)測模型建立、未來負荷預(yù)測3個步驟,整體模型框架如圖1所示。
圖1 模型結(jié)構(gòu)框圖Fig.1 Model framework
整體模型簡述如下:
步驟1:利用3σ準(zhǔn)則剔除異常數(shù)據(jù)后,對負荷與新能源出力進行聯(lián)合時序場景分析,并劃分成不同的預(yù)測場景,方便后續(xù)對不同負荷預(yù)測場景進行精細化建模。
步驟2:建立改進型RF-TCN負荷預(yù)測模型,通過RF算法對負荷預(yù)測特征量進行篩選,訓(xùn)練模型參數(shù),并加入預(yù)測結(jié)果修正環(huán)節(jié)。
步驟3:利用常規(guī)預(yù)測方法對預(yù)測日風(fēng)光負荷進行預(yù)測,判別預(yù)測日所屬天氣類型,選取對應(yīng)預(yù)測模型。
3σ準(zhǔn)則是異常數(shù)據(jù)識別的常見方法,其內(nèi)涵在于將數(shù)值分布在均值3個標(biāo)準(zhǔn)差之外的數(shù)據(jù)看作異常數(shù)據(jù)并剔除。本文首先分析處理風(fēng)光負荷歷史數(shù)據(jù),接著考慮各場景下新能源出力曲線和負荷曲線之間的相關(guān)性,構(gòu)建聯(lián)合時序場景曲線如下:
(1)
式中:α、β、χ、Q分別為光伏出力、風(fēng)電出力、負荷和風(fēng)光負荷聯(lián)合時序場景曲線;T為數(shù)據(jù)序列中的時段數(shù)。
引入指標(biāo)δ刻畫聯(lián)合時序場景下風(fēng)光負荷相關(guān)性:
(2)
式中:αi,t、βi,t和χi,t分別為i日t時段的光伏出力、風(fēng)電出力和電網(wǎng)負荷;δi為i日風(fēng)光負荷相關(guān)性距離向量,其數(shù)值含義為負荷中風(fēng)光新能源發(fā)電以外的發(fā)電量;Ji為i日風(fēng)光負荷相關(guān)性距離向量。
假定A、B這2日的風(fēng)光負荷相關(guān)性距離分別是δA、δB,該2日相似性用式(3)衡量,該值越大,則相似性越低:
(3)
式中λAB為A、B 2日的日間相似度指標(biāo)。
綜上,可通過風(fēng)光負荷相關(guān)性距離劃分出不同天氣類型,并通過日間相似度指標(biāo)評價聚類結(jié)果。
對影響負荷預(yù)測的各種因素進行篩選有利于提高TCN負荷預(yù)測的準(zhǔn)確性。本章首先通過RF算法篩選影響負荷預(yù)測的關(guān)鍵特征量,然后利用TCN進行負荷預(yù)測。
RF算法常用于對非線性數(shù)據(jù)進行回歸和分類,核心結(jié)構(gòu)為決策樹,每顆決策樹都進行預(yù)測,然后通過加權(quán)或取最大值等方法得到預(yù)測結(jié)果。圖2所示為RF算法結(jié)構(gòu)。
圖2 隨機森林算法示意圖Fig.2 Diagrammatic sketch of RF algorithm
RF算法基于重要性程度進行特征量提取時,通常通過基尼指數(shù)(Gini index,GI)或袋外數(shù)據(jù)錯誤率2種指標(biāo)來衡量。基于GI的方式介紹如下。
設(shè)定原始數(shù)據(jù)具有K個特征量,X1,X2,X3,…,XK,以及H個種類,則在決策樹節(jié)點m的GI為
(4)
式中3σ為節(jié)點m的樣本屬于第h類的概率估計值。
特征量Xk在節(jié)點m的重要性程度VGI,km通過其分枝前后ηGI的變化量表示為
VGI,km=ηGI,m-ηGI,q-ηGI,r.
(5)
式中ηGI,q和ηGI,r為節(jié)點m分枝后2個新節(jié)點q和r的GI。
假定一共有Z棵決策樹,則特征量Xk在第z棵樹的重要性
(6)
式中M為特征量Xk在第z棵決策樹中的節(jié)點集合。VGI,km通過式(4)、(5)求取。特征量Xk的重要性
(7)
綜上,通過式(4)—式(7),實現(xiàn)數(shù)據(jù)原始特征量的排序和篩選。
TCN是在CNN基礎(chǔ)上的改進網(wǎng)絡(luò),適用于處理時序問題。TCN具有一種擴張因果卷積結(jié)構(gòu),能夠?qū)ι弦粚拥妮斎霐?shù)據(jù)進行擴張采樣,提取各種時序數(shù)據(jù)的特征。因果卷積能夠保證提取特征信息的因果性,t時刻的輸出yt依賴t及t時刻之前的輸入x0,x1,xt-2,…,xt-1。對于卷積核為2,擴張系數(shù)為別為1、2、4的TCN,擴張因果卷積結(jié)構(gòu)如圖3所示。
圖3 TCN擴張因果卷積結(jié)構(gòu)Fig.3 Dilated causal convolution structure of TCN
TCN擴張因果卷積通過跳過部分輸入,將卷積核拓展到更大的區(qū)域,通過改變膨脹系數(shù)d調(diào)整輸出數(shù)據(jù)所接收到的信息量。對于一維時序數(shù)據(jù)的輸入x∈Rn(Rn為n維實數(shù)空間)和濾波器f能夠通過濾波器系數(shù)u和膨脹系數(shù)d擴張視野,卷積運算如下[11]:
(8)
式中xs-d·i為輸入序列。
考慮高比例新能源電網(wǎng)中風(fēng)光出力對負荷預(yù)測的影響,聯(lián)合時序場景法將歷史日期數(shù)據(jù)歸類。各個預(yù)測模型以相似日為基礎(chǔ)進行訓(xùn)練。將待預(yù)測日前2日的負荷、風(fēng)光出力數(shù)據(jù)和經(jīng)RF提取的關(guān)鍵特征量作為模型輸入,而模型輸出為預(yù)測日的負荷預(yù)測結(jié)果。
此外,在進行網(wǎng)絡(luò)訓(xùn)練時,需要對輸入數(shù)據(jù)進行預(yù)處理,本文采用歸一化方法,將輸入量中的負荷、氣溫、風(fēng)速等數(shù)值歸一化,而對于日期、星期、節(jié)假日等輸入量則另做處理[20-21]。
(9)
本文的負荷預(yù)測結(jié)果是1日96個時段的負荷預(yù)測值,是一個有關(guān)時間的序列,各預(yù)測點對應(yīng)的負荷預(yù)測誤差也構(gòu)成一個時間序列。為了提升模型預(yù)測的準(zhǔn)確性,本文引入Bootstrap算法構(gòu)建預(yù)測誤差修正模型。
Bootstrap是用于估計統(tǒng)計量的采樣方法,它通過從樣本中有放回地抽取(即每次抽取都從全部樣本中抽取)多個子樣本,得到該統(tǒng)計量的抽樣分布,并由此計算置信區(qū)間。在Bootstrap中,通過計算每個子樣本與全樣本均值的差異來估計偏差。因此,利用Bootstrap對負荷預(yù)測誤差的分布特性進行統(tǒng)計推斷,并設(shè)置對應(yīng)的置信度區(qū)間劃分不同預(yù)測誤差范圍。當(dāng)負荷預(yù)測誤差在區(qū)間內(nèi),則不修正預(yù)測數(shù)據(jù),當(dāng)負荷預(yù)測誤差在區(qū)間外,則需要修正。具體計算原理見文獻[22]。
此外,常見的負荷預(yù)測評價指標(biāo)有均方根誤差(mean square error,MSE)和平均百分比誤差(mean absolute percentage error,MAPE)2項[1,23-25],本文創(chuàng)新性地引入最大絕對誤差(maximum absolute error,MAE)來評價負荷預(yù)測的準(zhǔn)確度,衡量負荷預(yù)測方法的局部最大誤差。
(10)
(11)
(12)
式中:ρMSE、ρMAE、ρMAPE分別為負荷預(yù)測的均方誤差、最大絕對誤差和平均百分比誤差;3σ、3σ為負荷預(yù)測真實值和預(yù)測值。
本文使用甘肅省某地區(qū)2022年1月1日至2022年12月31日的數(shù)據(jù)對所提出的負荷預(yù)測模型進行仿真驗證。截至2022年底,甘肅全省電力裝機容量6 803萬kW,包括風(fēng)電2 076萬kW、光伏1 445萬kW,新能源裝機占比52%??梢?,利用甘肅省相關(guān)數(shù)據(jù)對高比例新能源電網(wǎng)的負荷預(yù)測問題進行研究具有高度適用性。
通過第2章述方法,在利用3σ準(zhǔn)則剔除異常數(shù)據(jù)后,針對365個風(fēng)光負荷的相關(guān)性開展聯(lián)合分析。受制于當(dāng)前數(shù)據(jù)樣本數(shù)目不足,本文認為采用更多的分類意味著每類情況下樣本量降低,不利于TCN網(wǎng)絡(luò)的訓(xùn)練效果。因此,以1月1日為對比日,求取各日與該日的相似性距離,并據(jù)此將天氣共分為5種類別,如圖4所示(日期序號1對應(yīng)1月2日,364對應(yīng)12月31日,其他以此類推),各類別數(shù)目見表1。
表1 各日與1月1日相似性距離聚類類別數(shù)Tab.1 Clustering classification numbers of similarity distance between each day and January 1st
圖4 各日與1月1日相似性距離聚類結(jié)果Fig.4 Clustering results of similarity distance between each day and January 1st
由圖4可見,各個類型的天氣僅有第1種和第5種相對日期而言比較集中,其余3種分布較為分散。具體而言,第1種類型主要對應(yīng)冬季,第5種對應(yīng)的季節(jié)主要為夏季。這是因為本文的日期相似度指標(biāo)〔式(2)和式(3)〕,本質(zhì)上是衡量該日期負荷中除風(fēng)光出力外其余負荷曲線的相似度,在冬季/夏季時,風(fēng)電和光伏發(fā)電對負荷曲線的影響更集中。
以氣象、日期因素等構(gòu)建影響負荷預(yù)測的特征集,見表2所示。然后通過RF對特征量重要性進行排序,圖5所示為重要性分析結(jié)果。
表2 影響負荷預(yù)測的特征量Tab.2 Characteristic quantities affecting load prediction
圖5 隨機森林特征變量重要性分析結(jié)果Fig.5 Importance analysis results of RF algorithm
由圖5可知在選定的11個特征量中,前6個重要性得分較高,因此選取小時、最低氣溫、節(jié)假日、分時電價、平均氣溫、月份和待預(yù)測日前2日的負荷、風(fēng)光出力數(shù)據(jù)作為輸入項。
分別用本文模型和傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)、SVM和不含預(yù)測修正的TCN方法對2022年12月31日數(shù)據(jù)進行負荷預(yù)測。其中BP神經(jīng)網(wǎng)絡(luò)、SVM這2種方法不劃分天氣類型,且不修正預(yù)測結(jié)果。不經(jīng)分類和不經(jīng)修正方法與本文方法的區(qū)別僅在于不經(jīng)天氣類型劃分且不經(jīng)預(yù)測誤差修正,其余部分相同。各種方法的預(yù)測結(jié)果、預(yù)測結(jié)果MAE和預(yù)測結(jié)果評價依次如圖6、圖7和表3所示。需要說明的是,在本文的RF提取部分,已經(jīng)考慮預(yù)測日是否為工作日等因素,并得到影響負荷預(yù)測的關(guān)鍵特征量作為TCN的輸入項,因此預(yù)測日是否為工作日等因素對預(yù)測模型沒有影響。
表3 不同預(yù)測方法結(jié)果評價Tab.3 Evaluation of the results of different prediction methods
圖6 不同預(yù)測方法預(yù)測結(jié)果Fig.6 Prediction results of different prediction methods
圖7 不同預(yù)測方法預(yù)測結(jié)果MAE Fig.7 Absolute errors of prediction results of different prediction methods
分析圖6、圖7和表3,得出如下結(jié)論:
a)本文預(yù)測方法的預(yù)測精度明顯優(yōu)于其他方法,MAE為2.62%,MSE為16.55 MW,而MAPE為1.65%,就MAE和MAPE這2個指標(biāo)而言,相較其他方法分別提高了36%、43%、19%、11%和46%、48%、19%、10%,預(yù)測效果好。
b)BP神經(jīng)網(wǎng)絡(luò)和SVM預(yù)測精度明顯劣于其他3種方法,原因在于模型較為簡單,沒有深層挖掘數(shù)據(jù)信息。
c)通過對比本文方法、不經(jīng)天氣類型分類方法和不經(jīng)預(yù)測誤差修正方法發(fā)現(xiàn),不經(jīng)預(yù)測誤差修正方法的預(yù)測精度略優(yōu)于不經(jīng)天氣類型分類方法,這說明,有必要對含大規(guī)模新能源電網(wǎng)進行天氣類型劃分,以及對負荷預(yù)測結(jié)果進行誤差修正。
針對高比例新能源并網(wǎng)電網(wǎng),提出一種基于聯(lián)合時序場景的改進型TCN短期負荷預(yù)測方法。通過算例仿真,得出結(jié)論:
a)為充分考慮新能源出力對負荷預(yù)測的影響,通過聯(lián)合時序場景法劃分不同負荷預(yù)測場景,分別建立預(yù)測模型,能提升預(yù)測精度。
b)利用TCN充分考慮負荷的時序特征,并通過RF算法提取影響負荷預(yù)測的關(guān)鍵特征量,能提高預(yù)測精度。
c)通過Bootstrap算法對預(yù)測結(jié)果進行修正能夠提升預(yù)測準(zhǔn)確性。
仿真結(jié)果表明,本文方法能夠有效提高預(yù)測精度,并較好地解決高比例新能源電網(wǎng)的短期負荷預(yù)測問題。