張 賁,邵常寧,趙 燃
(1.國家電網(wǎng)公司華北分部,北京 100053;2.北京清軟創(chuàng)新科技有限公司,北京 100085)
短期負荷預測是電力系統(tǒng)運行的重要輔助決策手段,為電力調(diào)度部門安排日發(fā)電計劃、機組組合、優(yōu)化潮流以及經(jīng)濟調(diào)度提供科學依據(jù),對于保障國民經(jīng)濟安全運行有重要意義。
多年來許多學者對短期負荷預測進行了深入的研究,提出了大量的預測方法。這些方法從機理上大體可分為2類:基于趨勢外推思想的數(shù)學算法和考慮相關(guān)因素的智能算法。基于趨勢外推思想的算法主要包括倍比平滑法、時間序列法、回歸模型法等[1],這些方法以探究負荷本身的發(fā)展規(guī)律為思想進行預測,大多數(shù)以線性模型為主。外推方法在相關(guān)因素影響弱的地方能取得不錯的效果,但遇到相關(guān)因素變化劇烈的地方精度會變得很差,而且無法處理非線性問題??紤]相關(guān)因素的智能算法主要包括模糊邏輯法、人工神經(jīng)網(wǎng)絡(ANN)[2]和支持向量機(SVM)[3]等。這些方法是將經(jīng)過自適應訓練[4]后的相關(guān)因素量化參數(shù)作為輸入,建立龐大的非線性映射模型進行運算,能夠得到比較精確的預測結(jié)果。但其缺點為在數(shù)據(jù)處理、函數(shù)構(gòu)造、參數(shù)優(yōu)化等方面難度較大,一定程度限制了其應用。
一般而言,傳統(tǒng)外推方法能夠基本體現(xiàn)刨除未知因素之外用戶的用電習慣和負荷規(guī)律,預測結(jié)果與實際負荷之間的誤差與相關(guān)因素會有著強烈的依賴關(guān)系。對于特定地區(qū)而言,在一段時間內(nèi)某些相關(guān)因素的影響可能會穩(wěn)定存在[5]。本文所采取的思路即通過對歷史負荷預測誤差的研究建立誤差與相關(guān)因素的合理映射,從而對未來負荷預測進行修正以達到提高預測精度的目的。
誤差修正預測總體思路可以分為基于頻域分解法虛擬預測、建立誤差與相關(guān)因素映射、預測結(jié)果修正3個階段,如圖1所示。
圖1 誤差修正預測總體思路Fig.1 General concept of forecasting with deviation correction
首先對采集到的歷史負荷、氣象數(shù)據(jù)進行預處理以提高數(shù)據(jù)質(zhì)量,然后利用傳統(tǒng)頻域分解預測方法進行虛擬預測,與實際負荷相比得到多日預測誤差。對預測誤差與氣象指標進行線性檢驗,根據(jù)相關(guān)特性采取相應的回歸模型進行誤差預測,并對傳統(tǒng)方式的預測結(jié)果進行修正。在建立誤差預測流程前需要進行以下幾個部分的準備工作。
虛擬預測是負荷預測研究的常用手段,通過歷史負荷及相關(guān)因素(例如氣象)數(shù)據(jù)對已知負荷日進行假定的預測,通過虛擬預測的結(jié)果和歷史實際負荷的對比分析研究預測的精確度,探究影響預測精度的原因等。
豐富而準確的歷史數(shù)據(jù)是負荷分析和預測工作的前提,預測前有必要對歷史不良數(shù)據(jù)進行辨識與修正。文獻[4]提到了幾種常用的不良數(shù)據(jù)辨識修正方法,包括神經(jīng)網(wǎng)絡法、基于聚類分析及模糊理論的方法、間隙統(tǒng)計法(GSA)、殘差修正法等[6],主要針對大量歷史數(shù)據(jù)的自動辨識修正。本文研究的歷史樣本僅為一個月,數(shù)據(jù)較少,采取如下的簡單辨識方法。
a.確定歷史樣本。
設歷史樣本第 i天 t時刻的負荷為 Pi,t(i=1,2,…,n;t=1,2,…,T),n 為歷史天數(shù),T 為采樣點數(shù)。第s天為第i天的同類型日,s=i±7,則其t時刻的歷史負荷為 Ps,t。
b.逐點計算負荷偏差率:
設定偏差率的閾值為30%,超過閾值則視為不良數(shù)據(jù)需進行修正,不超過閾值則視為有效數(shù)據(jù)。
c.不良數(shù)據(jù)校正。
采取相鄰2點的負荷偏差率平均值作為校正偏差計算本點修正數(shù)據(jù),計算公式如下:
氣象因素的變化是影響負荷需求變動的重要因素,與預測誤差具有內(nèi)在關(guān)聯(lián)性。通常人們對外界冷熱干濕的感覺是在溫度、濕度及風力等多種氣象因素的綜合作用形成下,單一氣象指標無法準確描述人體的真實感覺。因此很多學者前后提出了許多考慮多個氣象因素的綜合氣象指數(shù)模型,如實感溫度、溫濕指數(shù)、風冷力指數(shù)、人體舒適度等[7]。本文所涉及的綜合氣象指標主要有以下3個。
a.實感溫度指數(shù)。
實感溫度是指人體在不同氣溫、濕度和風速條件下,所產(chǎn)生的熱感覺指標。實感溫度以靜止飽和的大氣(風速為0時,相對濕度為100%)條件下使人產(chǎn)生舒適的溫度,來代表不同風速、不同相對濕度、不同氣溫使人產(chǎn)生的同樣感覺。計算公式如式(1)所示。
其中,Te、Ta、Rh、v 分別為實感溫度(℃)、氣溫(℃)、相對濕度(%)、風速(m/s)。
b.溫濕指數(shù)。
溫濕指數(shù)是考慮溫度和濕度2種氣象因素的綜合氣象指標,計算公式如下:
其中,ET為溫濕指數(shù)(℃);Td為 14∶00 的溫度(℃);Rd為 14∶00 的相對濕度(%)。
c.舒適度指標。
舒適度指數(shù)是度量溫度、濕度、風速等氣象要素對人體的綜合作用,表征人體在大氣環(huán)境中舒適與否的綜合指標。其計算公式為:
其中,k為人體舒適度指數(shù)。
上述3種綜合氣象指標各有側(cè)重,需要根據(jù)地區(qū)的地理和氣候特點選取科學權(quán)重進行建模。
電力負荷是具有較強周期性的時間序列,因此可以通過時間序列的頻域分解方法進行分析[8]。設多日(一般取 14 d)的持續(xù)負荷序列為 P(t)(t=1,2,…,nT),對其作離散傅里葉變換(DFT)可得:
由離散傅里葉變換求得系數(shù)ai、bi,得到負荷序列分解后的一系列相互正交的正余弦分量和直流分量。根據(jù)頻譜特征提取出不同的頻率分量,通過離散傅里葉逆變換(IDFT)將其還原到時域,并通過適當組合重構(gòu)出下式:
其中,日周期分量 a0+D(t)和周周期分量 W(t)為標準的周期序列,體現(xiàn)了人們不受干擾的規(guī)律性用電特征,預測時可以直接外推獲得;L(t)為低頻分量,體現(xiàn)了變換速度緩慢的相關(guān)因素對負荷的影響,可以通過建模的方式作逼近預測;H(t)為高頻分量,體現(xiàn)了電力負荷的隨機波動,具有不可預測性。
剩余分量處理方法為低頻分量平滑方式[9],即待預測日t時刻的低頻分量為同一時刻各天歷史負荷低頻分量的一次指數(shù)平滑結(jié)果。
設平滑系數(shù)為 α?(0,1),根據(jù)“近大遠小”原則可將歷史上第j天的權(quán)重設定為αn-j+1,可得歸一化的權(quán)重為,則待預測日t時刻的低頻分量預測值為:
忽略高頻分量可得待預測日的預測結(jié)果:
其中,a0+Ds,t、Ws,t分別為待預測同類型日的日周期分量、周周期分量。
傳統(tǒng)頻域分解預測方法產(chǎn)生誤差的主要原因為低頻分量預測不準和高頻分量的忽略。高頻分量屬于噪聲分量,不可預測且含量小,可不予處理;目前所采取的低頻分量的預測方法主要有平滑方式、相關(guān)方式等,均無法跟蹤相關(guān)因素的變化而導致預測效果較差??紤]到相對于某個特定地區(qū)而言在一段時間內(nèi)某種相關(guān)因素的變化會遵循一定規(guī)律,而預測的誤差也會隨之呈現(xiàn)穩(wěn)定的變化趨勢,因此通過虛擬預測可以建立相關(guān)因素與誤差的映射。
第i天t時刻預測誤差為實際負荷與頻域分量法(低頻分量平滑方式)的差值:
設第i天第m種相關(guān)因素的映射值為xi,m,這里的映射值是指通過攝動方式進行自適應訓練得到的最優(yōu)值,具體訓練方法見文獻[3]所述。以氣象因素為例,很多情況下由于條件限制無法得到逐時氣象信息,而只能得到某一天的氣象特征指標,如最高溫度、平均溫度、風速、相對濕度等。由式(1)—(3)可以得到單一氣象因素與綜合氣象指標的非線性映射為:
其中,yi,1、yi,2、yi,3分別為實感溫度、溫濕指數(shù)與人體舒適度指數(shù)。為了與誤差建立一一對應關(guān)系,需要對每天的逐點誤差進行標幺化處理,恰當?shù)剡x取誤差的基值Ei。建立誤差基值與綜合氣象指標的數(shù)學映射如式(10)所示。
由上式得到綜合考慮3種綜合氣象指標的線性回歸模型,每種指標的回歸系數(shù)即反映了該氣象綜合指標在該地區(qū)和特定時間段的合理性。
通過回歸分析可以檢驗映射模型的線性度。以線性相關(guān)系數(shù)R2=0.8為檢驗標準,如果擬合系數(shù)大于0.8并且通過F檢驗,可以認為是線性模型進行多元線性回歸分析;如果擬合系數(shù)小于0.8或者沒有通過F檢驗,則視為非線性模型,采取支持向量機回歸分析。
支持向量機是由Vapnik等[10]提出的統(tǒng)計理論中發(fā)展而來的。大量研究顯示支持向量機能夠彌補ANN、模糊邏輯等人工智能算法的網(wǎng)絡結(jié)構(gòu)復雜、訓練時間長的不足,在處理小樣本、非線性、高維數(shù)等實際問題時具有優(yōu)勢,可以建立完善的非線性負荷預測模型。支持向量機的具體算法參見文獻[11],這里不再贅述。
對于大部分地區(qū)而言,在氣象平穩(wěn)的春冬季傳統(tǒng)預測方法精度足夠高,而在氣象劇烈變化的夏季預測精度較低,預測誤差與氣象因素會呈較強的線性相關(guān)特性。絕大多數(shù)情況下利用多元線性回歸分析即可得到擬合精度良好的線性模型,使問題得到簡化。
預測結(jié)果修正可以按以下步驟進行。
a.傳統(tǒng)預測結(jié)果處理。
b.待預測日誤差基值預測。
設當日預報氣象因素映射值為 x0,1、x0,2、…、x0,m,根據(jù) 2.2 節(jié)得到綜合氣象指標預測值:
c.待預測日逐點誤差預測。
采取平滑的方式得到待預測日誤差預測標幺曲線。設平滑系數(shù)β,則待預測日的誤差標幺曲線為:
將標幺曲線有名化可得待預測日逐點誤差e0,t=
經(jīng)過上述過程就可以得到誤差修正的最終預測結(jié)果:
以某省夏季負荷為算例進行研究,所采用的歷史樣本為2013年8月1日至8月25日負荷數(shù)據(jù)及氣象數(shù)據(jù),對16日至25日10 d的負荷進行虛擬預測,每個虛擬預測日都對其基準日前兩周的負荷數(shù)據(jù)進行頻域分解。得到虛擬預測的誤差進行建模后,對待預測日27日的負荷進行修正得到最后預測結(jié)果。以16日的虛擬預測為例,基準日前的兩周1日至14日的頻域分解結(jié)果如圖2所示,圖中橫軸td值為0、1 表示第 1 天 00∶00、12∶00,2、3 表示第 2 天 00∶00、12∶00,其他依此類推。
可以看到日分量和周分量為強周期性時間序列,而低頻分量和高頻分量的劇烈波動也反映了該省夏季氣象條件不穩(wěn)定的特征。按照第2.1節(jié)中所述的算法求得10 d歷史負荷虛擬預測的誤差,其三維分布如圖3所示。
圖3顯示誤差分布是呈現(xiàn)相同趨勢的一簇曲線,并在相同的時間出現(xiàn)峰谷值等。
在建立線性映射前需要首先對3種綜合氣象指標與誤差分布的關(guān)系進行研究,以確定哪種綜合指標對誤差分布具有主導影響。計算虛擬預測10 d的實感溫度、溫濕指數(shù)和人體舒適度,分別與預測誤差做擬合,其散點分布圖4所示。
圖2 頻域分解結(jié)果Fig.2 Results of frequency-domain decomposition
圖3 虛擬預測誤差分布三維圖Fig.3 3D diagram of virtual forecasting deviation distribution
觀察散點圖發(fā)現(xiàn),3種氣象因素與誤差基值的分布均有一定線性相關(guān)度。綜合考慮各個影響因素提出的線性回歸模型為:
其中,yi,1、yi,2、yi,3分別為歷史第 i天的實感溫度、溫濕指數(shù)和人體舒適度3種綜合氣象指標。多元線性回歸分析結(jié)果如表1所示。
圖4 綜合氣象指標與誤差散點圖分布Fig.4 Scatter diagram of deviation distribution for comprehensive meteorological indexes
表1 多元線性回歸分析結(jié)果Table1 Results of multivariate linear regression analysis
由表1可知,線性相關(guān)系數(shù)R2=0.8788,F(xiàn)統(tǒng)計量對應的概率P=0.0014<0.05(顯著性水平缺省值),可以用線性模型來建立誤差與綜合氣象指標的之間的映射??梢钥吹綔貪裰笖?shù)的擬合系數(shù)較大,證明了該省夏季的溫濕指數(shù)是較為合理的綜合氣象指標。
獲取待預測日的氣象預報值 x0,1、x0,2、x0,3、x0,4,用第2.3節(jié)中的方式進行誤差預測并得到誤差修正后的預測結(jié)果。誤差修正后的預測結(jié)果、未加修正的預測結(jié)果及實際負荷曲線的比較如圖5所示。
圖5 修正結(jié)果對比Fig.5 Comparison among real load,uncorrected forecasting and corrected forecasting
由圖5可以看到,經(jīng)過誤差修正后的預測結(jié)果與實際負荷曲線的吻合度較高,尤其在峰谷段非常精確地符合實際用電規(guī)律,相比未加修正的預測結(jié)果精度有明顯改善。其預測精度改善的根本原因為通過頻域分解算法將氣象對負荷的影響以誤差的形式從原負荷中剝離處理,對氣象因素以歸納為綜合氣象的方式與負荷進行了非線性相關(guān)建模,得到了高相關(guān)系數(shù)的誤差修正模型。國家電力調(diào)度考核標準提供的日負荷精準率計算公式[12]如下:
其中,N為第i日負荷總點數(shù);dit=(負荷預測值-負荷實際值)/負荷實際值×100%。根據(jù)準確率計算公式得到修正前后的準確率對比如表2所示。
表2 修正前后準確率對比Table 2 Comparison of accuracy between with and without correction
由上述結(jié)果可以看到8月16日負荷經(jīng)過誤差修正模型進行修正后的預測結(jié)果相比修正前提高了約6%,達到了非常高的預測精度。為了驗證誤差修正模型的預測效果,取考慮相關(guān)因素的預測模型中基于相似度計算的模式識別法和相似度外推法作為對照,按照本文的研究思路對2013年夏季6、7、8這3個月的負荷進行了算例研究,得到的各模型預測結(jié)果平均準確率對比如表3所示。
表3 多月平均預測準確率對比Table 3 Comparison of average forecasting accuracy for several months
表3顯示經(jīng)過誤差修正模型的平均預測準確率具有明顯的優(yōu)勢,相比模式識別法和相似度外推法準確率提高約2%~3%,在氣象波動劇烈、預測精度普遍較低的夏季達到了約96%的預測精度,體現(xiàn)了該模型的優(yōu)越性。
本文通過對傳統(tǒng)預測誤差的分析論證表明傳統(tǒng)預測方法的預測誤差具有規(guī)律性,與特定的相關(guān)因素存在關(guān)聯(lián),可以與之建立映射。頻域分解的預測誤差主要由非周期分量的預測不準所致,非周期分量與氣象因素具有較大關(guān)系。通過綜合氣象指標建立起單一氣象指標的映射集合,與預測誤差具有強線性相關(guān)關(guān)系,可以建立綜合氣象指標與預測誤差的線性回歸模型。最后以某省夏季負荷為例進行了算例驗證,并跟目前常用的考慮相關(guān)因素的預測算法進行預測效果對比,預測精度平均提高了2%~3%,充分證明本文所提出的誤差修正預測思路的正確性。
誤差修正是負荷預測的一個新思路,因為預測誤差往往蘊含著實際中某種因素的穩(wěn)定影響,因此誤差規(guī)律的研究是有價值的。對于自然氣象條件不穩(wěn)定的地區(qū)可以用支持向量機、神經(jīng)網(wǎng)絡或者模糊邏輯等方式進行非線性映射工具,結(jié)合本文所提出的線性回歸模型可以構(gòu)成完整的誤差修正預測體系,提高預測精度。
同時,在實際應用中,誤差修正的預測方法還存在依賴氣象信息的準確性、復雜映射關(guān)系難以確定等缺點。本文提出誤差修正是負荷預測的一個較新思路,有待進一步探討和完善。