李 震,張 思,任嫻婷,黃遠(yuǎn)平
(1.國網(wǎng)浙江省電力有限公司衢州供電公司,衢州 324000;2.國網(wǎng)浙江省電力公司,杭州 310007)
城市長期電力負(fù)荷預(yù)測對電力供電決策建議,保障電力系統(tǒng)安全穩(wěn)定的運行,提高電力的使用分配效率以及電力報價,電網(wǎng)規(guī)劃等方面都產(chǎn)生著至關(guān)重要的作用[1]。但是,由于多種原因,當(dāng)一個城市進(jìn)入城鎮(zhèn)化階段后期后,電力負(fù)荷趨勢會從快速增長階段向飽和階段和波動階段轉(zhuǎn)變,削弱了其規(guī)律性,使得以每年電力系統(tǒng)負(fù)荷數(shù)據(jù)為基礎(chǔ)的預(yù)測方法逐漸無法有效預(yù)測過渡轉(zhuǎn)變時期的負(fù)荷趨勢[2]。
近年來,電力系統(tǒng)長期負(fù)荷預(yù)測出現(xiàn)了兩種研究趨勢。其中一種研究趨勢是復(fù)合模型逐漸成為主流,文獻(xiàn)[3]中構(gòu)建了一種半?yún)?shù)模型來研究中長期預(yù)測中的不確定性,并估計未來負(fù)荷的概率分布。在文獻(xiàn)[4-5]中分別提出了通過蟻獅優(yōu)化算法優(yōu)化的灰色模型和通過改進(jìn)粒子群算法優(yōu)化的回歸模型。復(fù)合模型結(jié)合了不同單一模型的優(yōu)點,可以更好地描述負(fù)荷模式的變化,從而提高預(yù)測精度。但是上述文獻(xiàn)的預(yù)測方法在針對城鎮(zhèn)化過程中的電力負(fù)荷波動會產(chǎn)生較大的隨機誤差。
長期電力負(fù)荷預(yù)測的另一個研究趨勢是“大數(shù)據(jù)”這一概念受到越來越多人的關(guān)注,特別是聚類方法在負(fù)荷預(yù)測中得到了廣泛的應(yīng)用,尤其是在大數(shù)據(jù)分析中。文獻(xiàn)[6]采用分層聚類方法將相似的負(fù)荷曲線作為一個聚類集群,然后分別預(yù)測每個集群的未來負(fù)荷。文獻(xiàn)[7-8]利用了譜聚類算法和函數(shù)型聚類法為負(fù)荷預(yù)測做準(zhǔn)備。上述文章利用大數(shù)據(jù)的優(yōu)勢,有效地減少了長期電力負(fù)荷預(yù)測的隨機誤差,但是上述方法建模誤差較大,且模型的魯棒性、穩(wěn)定性較差。
為同時降低長期電力負(fù)荷預(yù)測的隨機誤差與建模誤差,在大數(shù)據(jù)的基礎(chǔ)上,提出了一種數(shù)據(jù)驅(qū)動線性聚類的ARIMA長期電力負(fù)荷預(yù)測方法。
設(shè)yt(t=1,2,…,T)是電力系統(tǒng)負(fù)荷的時間序列,yt由子序列yk,t(k=1,2,…,N)組成,其中N為子序列個數(shù),T為時間樣本個數(shù),通常以年為間隔。yk,t可以是變電站負(fù)荷序列,也可以是區(qū)域負(fù)荷序列,諸如此類的序列。存在如下關(guān)系:
(1)
所提出的線性聚類預(yù)處理方法是為了平滑多個變電站或區(qū)域負(fù)荷序列,從而提高建模精度。這里的線性聚類是指聚類標(biāo)準(zhǔn)。傳統(tǒng)的聚類方法通常根據(jù)相似度進(jìn)行分類,一個更好的線性特性意味著更顯著的規(guī)律性,從而能夠提升建模精度,因此提出根據(jù)負(fù)荷序列變化的線性程度將子序列進(jìn)行聚類,使得類中的所有子序列與數(shù)據(jù)集中所有子序列相比具有更好的線性特性。
因此,相應(yīng)的線性聚類方法可以轉(zhuǎn)為一個尋找全局最佳線性的最優(yōu)聚類優(yōu)化問題,可以用式(2)表示:
(2)
(3)
式(3)中:x是一個n維向量x=(x1,x2,…,xn),同時為了解決這個問題,進(jìn)行了如下迭代計算。
步驟1對每個子序列構(gòu)yk,t構(gòu)造最小二乘線法性擬合模型,計算線性擬合殘差對應(yīng)的RMS值,記為uk(k=1,2,…,N),作為每個原始子序列的線性衡量標(biāo)準(zhǔn)。
步驟2從步驟1中找到子序列中的最大RMS值ukmax,并將其標(biāo)記為ykmax,t。而ykmax,t是波動最明顯的子序列,通常也是最難構(gòu)建準(zhǔn)確模型的子序列。因此,ykmax,t是本次迭代的主要優(yōu)化目標(biāo)。
步驟3對總序列Yj,t=ykmax,t+yj,t(j=1,2,…,N,j≠k)構(gòu)造新的線性擬合模型,并計算相應(yīng)的擬合殘差的RMS值,標(biāo)記為Uj。這一步是看看是否有其他子序列可以與ykmax,t求和,從而改善線性擬合結(jié)果。
步驟4從步驟3中找出Uj的最小值,并將其標(biāo)記為Ujmin。如果:
Ujmin (4) 這就意味著存在一個子序列yjmin,t可以用ykmax,t求和來提高線性擬合結(jié)果。在這種情況下,把yjmin,t和ykmax,t替換成它們的和Yjmin,t,然后重復(fù)步驟1。當(dāng)Ujmin≥ukmax時,就可以結(jié)束迭代,因為這表明子序列不能通過求和進(jìn)一步平滑。在上述描述中,聚類準(zhǔn)則如式(4)所示,記為“準(zhǔn)則1”。 經(jīng)過這種線性聚類預(yù)處理后,子序列的平滑度得到了提高,而子序列的數(shù)目卻減少了,這為后續(xù)子序列的建模和預(yù)測創(chuàng)造了更好的條件。 Box和Jenkins在20世紀(jì)70年代提出了ARIMA模型,它能夠很好地描述和預(yù)測時間序列[9]。因此,用它來預(yù)測每個集群的總負(fù)荷,并分析負(fù)荷預(yù)測誤差。ARIMA (p,d,q)模型可以表示為 yt=φ1yt-1+φ2yt-2+…+φpyt-p+ εt-θ1εt-1-θ2εt-2-…-θqεt-q (5) 式(5)中:εt為白噪聲;φ、θ是系數(shù)。可以看到ARIMA模型包含兩個部分。 自回歸模型部分: yt=φ1yt-1+φ2yt-2+…+φpyt-p+εt (6) 移動平均模型部分 yt=εt-θ1εt-1-θ2εt-2-…-θqεt-q (7) 自回歸模型部分體現(xiàn)的是電力系統(tǒng)過去時刻的特性,而移動平均模型部分則反映了干擾對當(dāng)前系統(tǒng)狀態(tài)的影響。p和q是這兩部分對應(yīng)的順序。因為ARIMA模型只適用于平穩(wěn)時間序列,如果不是平穩(wěn)時間序列,則需進(jìn)行差分預(yù)處理,d為差分階。 進(jìn)一步為Si,t(i=1,2,…,M)構(gòu)建最優(yōu)的ARIMA模型,并分別預(yù)測它們未來負(fù)荷的值并相加,求得到最終的電力系統(tǒng)負(fù)荷預(yù)測。算法步驟如下,流程圖如圖1所示。 圖1 預(yù)測算法流程圖Fig.1 Flow chart of prediction algorithm 步驟1首利用單位根檢驗[10],判斷預(yù)處理后的序列Si,t是否穩(wěn)定。任何非平穩(wěn)序列都將通過差分計算轉(zhuǎn)化為平穩(wěn)序列。 步驟2為每個平穩(wěn)序列構(gòu)造ARIMA (p,d,q) 乘積模型,與參數(shù)p和q的組合不同。由于序列長度有限,將p和q限制在一個相對較低的階數(shù),以避免過擬合[11],令p=0,1,2;q=0,1。 步驟3在步驟2構(gòu)建的所有ARIMA模型中,利用赤池信息量準(zhǔn)則AIC找到每個平穩(wěn)序列的最優(yōu)模型。這是一個衡量建模效果的標(biāo)準(zhǔn),因為它既考慮了擬合精度又所建模型[12]的復(fù)雜性: AIC=2n+Tln(fRSS/T) (8) 式(8)中:n為構(gòu)建模型的參數(shù)個數(shù);T是序列的長度;fRSS是殘差平方和,反映了建模精度。一般來說,具有最小的AIC值的模型為最優(yōu)模型,因此為Si,t的最優(yōu)ARIMA模型數(shù)學(xué)表達(dá)式如下: (9) 步驟4根據(jù)步驟3中選擇的相應(yīng)的最優(yōu)ARIMA模型,預(yù)測每個預(yù)處理序列Si,t的未來值。預(yù)測結(jié)果用Si,t+τ,τ=1,2,…,ΔT表示;其中ΔT為預(yù)測周期。但是要注意的是,因為ARIMA模型的限制,ΔT不能太大。 步驟5將所有ARIMA預(yù)測結(jié)果進(jìn)行匯總,得到最終的電力系統(tǒng)負(fù)荷預(yù)測結(jié)果: (10) 在電力系統(tǒng)負(fù)荷預(yù)測過程中,預(yù)測誤差主要由兩部分組成:建模誤差和隨機誤差[13]。建模誤差是指建模的擬合值與真實值的差值。通常來說,負(fù)荷曲線越平滑,建模誤差越小,這樣所構(gòu)建的模型能更好地擬合負(fù)荷變化規(guī)律。隨機誤差是指由一些隨機的、不可預(yù)測的因素改變原有負(fù)荷變化規(guī)律而引起的預(yù)測誤差。因此,為了提高預(yù)測精度,既要提高建模精度,又要盡量減小隨機誤差。因此,首先從理論上分析基于ARIMA模型的不同預(yù)處理方法的預(yù)測誤差。為了簡單起見,提前做了兩個假設(shè): (1)由于ARIMA模型預(yù)測結(jié)果主要依賴于自回歸模型方法部分,假設(shè)電力系統(tǒng)負(fù)荷的時間序列遵循式(6)中自回歸模型的第一項,即: yt=φ1yt-1+εt,yk,t=φk,1yk,t-1+εk,t (11) (2)假定在電力系統(tǒng)負(fù)荷的時間序列中的白噪聲為高斯白噪聲,其標(biāo)準(zhǔn)差與負(fù)荷水平成正比: (12) 式(12)中:σ>0為比例系數(shù)。 則預(yù)測總誤差可表示為 (13) 設(shè)時間序列yt的ARIMA建模結(jié)果為 (14) (15) 由式(11)可得,φ1的實際值為 (16) 因此φ1的參數(shù)估算誤差為 (17) 式中:Δφ1為建模誤差的來源,其與εt成正比,與負(fù)荷水平y(tǒng)t成反比。如果直接對電力系統(tǒng)負(fù)荷進(jìn)行建模和預(yù)測,將會產(chǎn)生較小的建模誤差,這是因為電力系統(tǒng)負(fù)荷曲線的平滑性,使得負(fù)荷水平y(tǒng)t較高,噪聲εt的標(biāo)準(zhǔn)差較低。另一方面,如果對系統(tǒng)負(fù)荷的子序列進(jìn)行建模和預(yù)測,并將其進(jìn)行求和,得到電力系統(tǒng)負(fù)荷預(yù)測結(jié)果,每個子序列的建模誤差將更大。提出的DLC方法建立了一個基于平滑序列的預(yù)測模型,在一定程度上保證了模型的精度,從理論上來說,不如直接法但比數(shù)據(jù)驅(qū)動法要好。 預(yù)測結(jié)果的模型誤差可由以式(18)估算: (18) (19) 因為σ>0,yk,t>0,而對于不同的k,yk,t并不都相等,則有: (20) 式(20)為數(shù)據(jù)驅(qū)動法的理論基礎(chǔ):高斯白噪聲的方差比直接法計算的小。這樣,可以縮小預(yù)測的隨機誤差,并且可以通過數(shù)據(jù)驅(qū)動方法獲得更穩(wěn)定的電力系統(tǒng)負(fù)荷預(yù)測結(jié)果。而這正是使用大量變電站負(fù)荷數(shù)據(jù)的意義所在。同樣,數(shù)據(jù)驅(qū)動線性聚類方法也利用了大數(shù)據(jù)集的優(yōu)勢,使其隨機預(yù)測誤差小于直接法。 預(yù)測誤差可由式(21)得到: (21) 根據(jù)式(13),隨機預(yù)測誤差可以表示為 (22) 利用上海市的年度電力負(fù)荷數(shù)據(jù)去驗證提出方法的有效性。2005—2018年的電力負(fù)荷如圖2所示。電力系統(tǒng)負(fù)荷包含72個220 kV (N=83)變的變電站測得的數(shù)據(jù),每一個變電站的年度負(fù)荷曲線如圖3所示。 圖2 上海市電力負(fù)荷曲線Fig.2 Electric power load curve in Shanghai 圖3 上海市各個變電站負(fù)荷曲線Fig.3 Load curves of substations in Shanghai 根據(jù)上述數(shù)據(jù),利用2005—2015年的負(fù)荷數(shù)據(jù)建模,對2016—2018年的負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測從而驗證該方法的有效性。為便于比較,采用以下四種不同的預(yù)測方案。 (1)直接法:對圖2中的電力系統(tǒng)負(fù)荷數(shù)據(jù)直接建立最優(yōu)ARIMA模型,預(yù)測電力系統(tǒng)負(fù)荷峰值。利用最優(yōu)ARIMA模型直接預(yù)測電力系統(tǒng)負(fù)荷。模型的擬合與預(yù)測結(jié)果如圖4所示。 圖4 直接法電力負(fù)荷預(yù)測Fig.4 Direct power load forecasting 根據(jù)誤差的計算公式可知直接法的建模誤差為2.18%,平均預(yù)測誤差為10.02%,隨機誤差為7.84%。從圖4可以看出,上海的電力系統(tǒng)年負(fù)荷曲線相對較平滑,有利于建模,建模精度較高。然而,預(yù)測結(jié)果并不理想。這主要是由于負(fù)荷增長的變化模式造成的。上海市的城市化水平較高,正處于產(chǎn)業(yè)結(jié)構(gòu)調(diào)整,淘汰落后產(chǎn)能,加速發(fā)展第三產(chǎn)業(yè)的階段。與此同時,上海市的人口正在趨于飽和。在這種情況下,負(fù)荷增長模式發(fā)生了變化,這就會導(dǎo)致直接法的隨機誤差較大。 (2)數(shù)據(jù)驅(qū)動法:對圖3中的每個原始子序列建立最優(yōu)ARIMA模型,對每個子序列進(jìn)行預(yù)測,然后將所有預(yù)測結(jié)果進(jìn)行匯總,得到電力系統(tǒng)負(fù)荷預(yù)測結(jié)果。相應(yīng)的預(yù)測結(jié)果如圖5、圖6所示。 圖5 各變電站預(yù)測結(jié)果Fig.5 Prediction result of substations 圖6 數(shù)據(jù)驅(qū)動預(yù)測結(jié)果Fig.6 Data-driven prediction results 通過計算可知圖5中建模和預(yù)測的平均誤差分別為20.32%、26.46%,平均隨機誤差為6.13%。建模誤差的顯著增加是由于變電站的低負(fù)荷和高波動造成的。將圖5中的建模和預(yù)測結(jié)果進(jìn)行匯總后,可以得到圖6中的電力系統(tǒng)預(yù)測結(jié)果,電力系統(tǒng)建模和預(yù)測誤差分別為2.35%、3.65%,隨機誤差為1.30%??梢钥闯?,與直接法相比,隨機誤差有效地從7.84減小到1.30%,從而減小了預(yù)測誤差。但另一方面,建模誤差為2.35%,成為預(yù)測誤差的主要組成部分。 (3)經(jīng)典方法構(gòu)建了經(jīng)典的滾動GM(1,1)模型、彈性系數(shù)模型和回歸模型,然后直接預(yù)測電力系統(tǒng)負(fù)荷[14-16]。建模和預(yù)測結(jié)果如圖7所示。 圖7 經(jīng)典方法預(yù)測對比Fig.7 Prediction comparison of classical method 結(jié)果表明,三種經(jīng)典模型均具有較好的建模精度,分別為5.97%、3.51%和1.22%,但它們有一個共同的難題,就是難以把握預(yù)測區(qū)域的負(fù)荷變化規(guī)律,即隨機誤差過大,導(dǎo)致最后的預(yù)測誤差分別為11.25%、4.76%和9.43%。 (4)DLC方法:基于圖3中的子序列數(shù)據(jù),為了改進(jìn)數(shù)據(jù)驅(qū)動方法的建模精度,利用所提出的線性聚類方法對變電站負(fù)荷數(shù)據(jù)進(jìn)行預(yù)處理。 從圖8可以看出,經(jīng)過線性聚類方法得到的預(yù)處理數(shù)據(jù)比圖3中的原始數(shù)據(jù)要更為平滑,更加適合時間序列建模。根據(jù)計算平均建模誤差降低到了10.71%。此外,子序列的數(shù)量從72減少到了30,因此減少了計算量。更重要的是,變電站負(fù)荷集群預(yù)測結(jié)果更加穩(wěn)定,平均預(yù)測誤差降低到18.54%,隨機誤差為7.76%。 將圖8中的建模和預(yù)測結(jié)果進(jìn)行匯總,得到圖9中的電力系統(tǒng)預(yù)測結(jié)果,系統(tǒng)建模誤差為1.40%,預(yù)測誤差為2.67%,隨機誤差為1.27%。證明所提出的預(yù)測算法在保證建模精度的同時,也能夠降低隨機誤差。 圖8 準(zhǔn)則1DLC預(yù)處理子序列Fig.8 DLC pre-processing sub-sequence based on rule 1 圖9 準(zhǔn)則1電力負(fù)荷預(yù)測結(jié)果Fig.9 Power load forecasting result based on rule 1 在提出的線性聚類預(yù)處理方法中,聚類準(zhǔn)則至關(guān)重要。不同的聚類準(zhǔn)則會導(dǎo)致不同的聚類結(jié)果,從而導(dǎo)致不同的建模和預(yù)測效果??紤]將“準(zhǔn)則1”放寬標(biāo)準(zhǔn)至式(23),表示“準(zhǔn)則2”: (23) 可以看出,在放寬聚類標(biāo)準(zhǔn)后,子序列的數(shù)量進(jìn)一步減少到21個(M=21),且每個子序列都更加平滑。平均建模誤差為7.64%,預(yù)測誤差為14.96%,隨機誤差為7.32%。將它們匯總得到電力負(fù)荷預(yù)測結(jié)果如圖11所示,建模誤差為1.34%,預(yù)測誤差為3.47%,隨機誤差為2.13%。 通常來說,放寬聚類標(biāo)準(zhǔn)會使負(fù)荷曲線更加平滑,集群數(shù)量會越少,有利于建模精度,但不利于減小隨機誤差。而嚴(yán)格的標(biāo)準(zhǔn)結(jié)果恰恰相反。因此,理想的聚類準(zhǔn)則應(yīng)該是在集群數(shù)與負(fù)荷曲線平滑度之間做出適當(dāng)?shù)恼壑校瑥亩鴥?yōu)化預(yù)測精度。為了得到這樣一個最優(yōu)準(zhǔn)則,需要考慮負(fù)荷的特性,并對不同準(zhǔn)則下的聚類結(jié)果進(jìn)行分析比較。上述預(yù)測結(jié)果如表1所示。 圖10 準(zhǔn)則2的DLC預(yù)處理子序列Fig.10 DLC pre-processing sub-sequence based on rule 2 圖11 準(zhǔn)則2電力負(fù)荷預(yù)測結(jié)果Fig.11 Power load forecasting results based on rule 2 表1 預(yù)測結(jié)果對比Table 1 Comparison of predicted results 表1的結(jié)果對比驗證了所提出的數(shù)據(jù)驅(qū)動線性聚類ARIMA預(yù)測方法能夠降低隨機誤差。其次,該方法可以提供與直接法幾乎相同的建模精度,從而大幅度地提高了預(yù)測精度。 為了證明所提出的DLC方法的普適性,收集了四個不同城市的變電站負(fù)荷數(shù)據(jù),如圖12所示。要注意的是,這四個城市處于不同的城市化階段。圖13表明了各城市分別采用了兩種聚類準(zhǔn)則的DLC方法的建模和預(yù)測結(jié)果,預(yù)測誤差如表2所示。表2所示的四個不同城市的電力負(fù)荷預(yù)測結(jié)果均能夠保證較好的預(yù)測精度,證明了數(shù)據(jù)驅(qū)動線性聚類ARIMA方法的具備較好的魯棒性以及穩(wěn)定性。 圖12 變電站負(fù)荷數(shù)據(jù)Fig.12 Substation load data 圖13 各城市電力負(fù)荷預(yù)測結(jié)果Fig.13 Power load forecasting in each cities 表2 各城市的預(yù)測誤差對比Table 2 Comparison of prediction errors in each cities 最后,在提出的DLC方法的基礎(chǔ)上,以準(zhǔn)則1為例,對上海市2019—2022年的電力負(fù)荷進(jìn)行預(yù)測,預(yù)測結(jié)果如表3所示。圖14顯示了上海市每個集群的負(fù)荷增長和ARIMA預(yù)測結(jié)果以及總體負(fù)荷的增長。 表3 上海市預(yù)測結(jié)果Table 3 Forecast results in Shanghai 圖14 上海市子序列預(yù)測結(jié)果及電力負(fù)荷預(yù)測結(jié)果Fig.14 Prediction results and electric power load forecast result in Shanghai 針對城市因負(fù)荷波動而引起的電力系統(tǒng)長期負(fù)荷預(yù)測難題,提出了一種基于數(shù)據(jù)驅(qū)動的線性聚類ARIMA方法,通過理論分析與數(shù)據(jù)驗證得出如下結(jié)論。 (1)基于數(shù)據(jù)驅(qū)動的線性聚類ARIMA方法能夠在保證較低模型誤差的條件下降低長期電力負(fù)荷波動造成的隨機誤差,從而大大提升了長期電力負(fù)荷預(yù)測的精度。 (2)所提出的數(shù)據(jù)驅(qū)動線性聚類ARIMA方法對四個不同發(fā)展階段城市的電力負(fù)荷預(yù)測結(jié)果表明該方法具有較好的適應(yīng)性與穩(wěn)定性。 (3)基于數(shù)據(jù)驅(qū)動線性聚類ARIMA方法預(yù)測精度與聚類準(zhǔn)則的選取有較大關(guān)系。2 最優(yōu)ARIMA建模與預(yù)測
3 預(yù)測模型的建立
4 應(yīng)用結(jié)果
5 結(jié)論