肖白,李科,田春箏,王璟,何茜,張凱
(1.東北電力大學(xué)電氣工程學(xué)院,吉林 吉林132012;2.國(guó)網(wǎng)河南省電力公司經(jīng)濟(jì)技術(shù)研究院,450000;3.國(guó)網(wǎng)鄭州供電公司,鄭州450000)
空間負(fù)荷預(yù)測(cè)(Spatial Load Forecasting,SLF)是對(duì)待測(cè)區(qū)域內(nèi)負(fù)荷時(shí)空特性的預(yù)測(cè),是城市電網(wǎng)規(guī)劃設(shè)計(jì)的基礎(chǔ),也是一個(gè)涉及面廣、不確定性因素多的復(fù)雜問(wèn)題[1-5?。
SLF結(jié)果的準(zhǔn)確性將直接影響到城市電網(wǎng)的電源布點(diǎn)、供電路徑選擇、設(shè)備投運(yùn)等是否技術(shù)可行且經(jīng)濟(jì)合理[6-8]。
SLF與負(fù)荷預(yù)測(cè)的區(qū)別在于,SLF不僅要預(yù)測(cè)負(fù)荷的值,而且還要預(yù)測(cè)負(fù)荷增長(zhǎng)的地理情況[9]。由于SLF在預(yù)測(cè)負(fù)荷的值時(shí),所需負(fù)荷數(shù)據(jù)一般是元胞負(fù)荷每年的最大值,即只使用各元胞每年眾多歷史負(fù)荷數(shù)據(jù)中的一個(gè)值。可見(jiàn),若選用的元胞歷史負(fù)荷數(shù)據(jù)不考慮由于負(fù)荷數(shù)據(jù)在測(cè)量、通信等誤差造成的隨機(jī)波動(dòng)而建立負(fù)荷預(yù)測(cè)模型,就難以有效地模擬負(fù)荷發(fā)展變化規(guī)律,模型的預(yù)測(cè)精度也同樣不能得到保證[10-14]。因此,為確保在建模和預(yù)測(cè)過(guò)程中所使用的元胞歷史負(fù)荷數(shù)據(jù)能合理地反映元胞發(fā)展的趨勢(shì)和規(guī)律,從而提高SLF質(zhì)量,需進(jìn)行數(shù)據(jù)預(yù)處理方法的研究。
本文針對(duì)此問(wèn)題,提出運(yùn)用主成分分析技術(shù)來(lái)求取適用于SLF的元胞負(fù)荷合理最大值的方法。該方法以元胞歷史負(fù)荷數(shù)據(jù)分析為基礎(chǔ),通過(guò)主成分分析技術(shù)將得到的各元胞負(fù)荷分解出表征各元胞負(fù)荷數(shù)據(jù)總體信息的主成分分量和刻畫(huà)隨機(jī)波動(dòng)的非主成分分量。綜合歸納兩種分量,通過(guò)剔除非主成分分量來(lái)抑制隨機(jī)波動(dòng)對(duì)預(yù)測(cè)結(jié)果精度帶來(lái)的不利影響,盡量避免隨機(jī)波動(dòng)影響到負(fù)荷發(fā)展的總體趨勢(shì),提取表征元胞負(fù)荷的總體信息的主成分分量的最大幅值作為元胞負(fù)荷合理最大值,實(shí)例分析表明,該方法能夠提高SLF結(jié)果的精確度。
首先根據(jù)城市電網(wǎng)中每條10 kV饋線的供電范圍生成元胞;其次利用(Principal Component Analysis,PCA)技術(shù),通過(guò)設(shè)定適合的累計(jì)貢獻(xiàn)率將各元胞負(fù)荷分解為表征總體信息的主成分分量和刻畫(huà)隨機(jī)波動(dòng)性的非主成分分量,通過(guò)“主成分分析反演”的方法來(lái)剔除具有隨機(jī)波動(dòng)性的非主成分分量,從而抑制其給SLF帶來(lái)的不利影響;最后將經(jīng)過(guò)“主成分分析反演”所得到的主成分分量中的最大值作為元胞負(fù)荷合理最大值。確定元胞負(fù)荷合理最大值方法的原理示意圖如圖1所示。
圖1 確定元胞負(fù)荷合理最大值方法的原理圖Fig.1 Schematic diagram of ascertaining reasonable maximal value of cellular load
主成分分析方法是研究多個(gè)數(shù)值變量間相關(guān)性的一種多元統(tǒng)計(jì)方法。在基本保持原變量信息不變的前提下,能通過(guò)原變量的少數(shù)幾個(gè)線性組合來(lái)代替原變量并揭示原變量之間的關(guān)系,從而達(dá)到利用較少的互不相關(guān)的變量反映原變量的絕大部分信息的目的[15-16]。主成分求解步驟如下:
以樣本X=數(shù)據(jù)為例,其式中n是樣本個(gè)數(shù);p是樣本的維數(shù);xij為第i個(gè)樣本中第j維數(shù)據(jù)。
(1)將X簡(jiǎn)化為X=(x1,x2,…,xp),依式(1)對(duì)X標(biāo)準(zhǔn)化處理;
式中x*j為標(biāo)準(zhǔn)化的數(shù)據(jù);E(xj)和Var(xj)分別為xj的平均值和方差。
(2)按照式(2)求取樣本數(shù)據(jù)的相關(guān)矩陣R=(rij)p×p。
式中Cov(xi,xj)為樣本數(shù)據(jù)矩陣第i列與第j列間的協(xié)方差。
(3)依式(3)和式(4)計(jì)算相關(guān)矩陣R的特征值和特征向量,并將特征值從大到小排列,即λ1≥λ2≥…≥λp,與之對(duì)應(yīng)的特征向量為p1,p2,…,pp。
式中λi為特征值;pi為特征向量。
(4)依式(5)求取主成分矩陣。
將主成分矩陣簡(jiǎn)化為Y=(y1,y2,…,yp),其中y1,y2,…,yp分別為第1,2,…,p主成分,各個(gè)成分間互不相關(guān)且所含信息量依次減少。
(5)計(jì)算各個(gè)主成分的貢獻(xiàn)率,其中第k個(gè)主成分的貢獻(xiàn)率的計(jì)算公式如下。
(6)按照各成分的貢獻(xiàn)率由大到小的順序排列,并按照式(3)~式(7)求取累計(jì)貢獻(xiàn)率M。
PCA的目的是在保證基本信息不變的前提下,減少數(shù)據(jù)量,從而簡(jiǎn)化數(shù)據(jù)分析問(wèn)題。通過(guò)累計(jì)貢獻(xiàn)率M的合理選取,進(jìn)而得出主成分?jǐn)?shù)量m的取值,通常M取90%以上。在主成分矩陣中取出前m個(gè)成分,便完成了主成分提取。
PCA在幾何意義上就是對(duì)原空間的數(shù)據(jù)用新的坐標(biāo)系表示[17]。盡管經(jīng)過(guò)PCA計(jì)算得到的主成分可以保證信息基本不變,但得到的主成分?jǐn)?shù)據(jù)在幅值上和原始數(shù)據(jù)相比發(fā)生很大的變化,故經(jīng)PCA處理后得到的負(fù)荷數(shù)據(jù)不能直接替代原負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測(cè)。為了使經(jīng)PCA計(jì)算得到的主成分?jǐn)?shù)據(jù)能夠應(yīng)用在SLF中,而不是單單對(duì)影響元胞負(fù)荷變化的影響因素變量進(jìn)行降維,本文提出了主成分分析反演的方法。
所謂主成分分析反演就是與PCA的計(jì)算過(guò)程的相反計(jì)算。PCA的計(jì)算過(guò)程實(shí)質(zhì)就是通過(guò)矩陣的相乘使得矩陣發(fā)生旋轉(zhuǎn),從而完成降維,故將其進(jìn)行逆旋轉(zhuǎn)到原來(lái)位置即可完成反演,從而解決由于經(jīng)PCA處理后導(dǎo)致得到的主成分分量不能直接用于SLF的問(wèn)題。
在PCA的主成分提取步驟中對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,是為了解決樣本中各個(gè)數(shù)據(jù)量綱不同的問(wèn)題。而對(duì)于負(fù)荷數(shù)據(jù)而言,任何一個(gè)負(fù)荷值的量綱都相同,因此在對(duì)負(fù)荷數(shù)據(jù)做主成分分析時(shí),不需要標(biāo)準(zhǔn)化這一環(huán)節(jié),減少了PCA的計(jì)算量。
以樣本X為例,得到主成分y1,y2,…,ym以及非主成分ym+1,ym+2,…,yp將非主成分分量設(shè)為 0,依式(8)完成反演。
式中為剔除非主成分分量后的數(shù)據(jù);為非主成分分量設(shè)為0的主成分矩陣;inv(P)為特征向量矩陣的逆矩陣。
經(jīng)此變換,不僅解決了數(shù)據(jù)經(jīng)PCA處理后不能直接用于SLF,而且在反演過(guò)程中剔除了視為刻畫(huà)隨機(jī)波動(dòng)性的非主成分分量,從而抑制隨機(jī)波動(dòng)性帶來(lái)的不利影響。
本文通過(guò)分析元胞歷史負(fù)荷數(shù)據(jù)提出了基于PCA確定元胞負(fù)荷最大值的方法。其具體計(jì)算步驟如下:
(1)按照城市電網(wǎng)中每條10 kV饋線的供電區(qū)域來(lái)生成元胞;
(2)經(jīng)大量嘗試得出累計(jì)貢獻(xiàn)率設(shè)定為99.8%時(shí)是合適的。此時(shí)運(yùn)用PCA技術(shù)將各元胞負(fù)荷分解出的主成分分量能夠表征元胞負(fù)荷總體信息,同時(shí)非主成分分量也可以較好地刻畫(huà)隨機(jī)波動(dòng)性;
(3)利用提出的主成分分析反演方法對(duì)主成分分量和非主成分分量進(jìn)行處理。處理后的結(jié)果不僅剔除了隨機(jī)波動(dòng)帶來(lái)的不利影響,同時(shí)解決了經(jīng)PCA計(jì)算得到的主成分分量不能直接應(yīng)用于SLF的問(wèn)題;
(4)將主成分分量經(jīng)主成分分析反演后所得數(shù)據(jù)中的最大值作為元胞負(fù)荷最大值,從而完成元胞負(fù)荷最大值的確定。
以東北某城市中的一個(gè)供電分局為例,該局所轄26條10 kV饋線的各自供電范圍如圖2所示[18-19]。
圖2 待預(yù)測(cè)區(qū)域中的元胞Fig.2 Cellular in the forecast regional
按照28條饋線供電區(qū)域生成28個(gè)元胞。已知2004年至2008年一年的負(fù)荷歷史數(shù)據(jù)。若以一年為一個(gè)時(shí)點(diǎn),則每個(gè)元胞有5個(gè)最大負(fù)荷值。為敘述方便,將直接使用每年中的最大負(fù)荷作為元胞負(fù)荷最大值的方法稱(chēng)為“傳統(tǒng)方法”;將本文確定元胞負(fù)荷最大值的方法稱(chēng)為“PCA方法”。
各實(shí)測(cè)的元胞負(fù)荷最大值與基于“PCA方法”得到的元胞負(fù)荷合理最大值詳見(jiàn)附錄中的表2。
在“傳統(tǒng)方法”和“PCA方法”兩種條件下,分別單獨(dú)使用“灰色理論法”、“指數(shù)平滑法”、“線性回歸法”預(yù)測(cè)2009年各元胞負(fù)荷的最大值,預(yù)測(cè)結(jié)果見(jiàn)表1。由于“北大線”和“西安線”在2009年的負(fù)荷實(shí)測(cè)值為0,故未在表1中給出。
表1 各元胞的負(fù)荷預(yù)測(cè)結(jié)果Tab.1 Results of load forecasting for each cellular
表2中各方法預(yù)測(cè)結(jié)果的總體預(yù)測(cè)誤差見(jiàn)表3。
表3 元胞負(fù)荷的總體預(yù)測(cè)誤差Tab.3 Overall forecasting errors of cellular load
由表3可以看出,“PCA方法”的SLF誤差均小于“傳統(tǒng)方法”的SLF誤差。
文章提出了一種基于PCA技術(shù)確定元胞負(fù)荷最大值的方法,該方法用于SLF時(shí),能夠處理元胞負(fù)荷數(shù)據(jù)的測(cè)量、采集、傳輸會(huì)受到某些不確定性因素的影響導(dǎo)致預(yù)測(cè)精度降低問(wèn)題。該方法利用PCA將元胞負(fù)荷進(jìn)行分解,得到主成分分量與非主成分分量,通過(guò)提出主成分分析反演方法不僅剔除了非主成分分量,避免了隨機(jī)波動(dòng)性給SLF帶來(lái)的不利影響,同時(shí)解決了元胞負(fù)荷經(jīng)PCA分解得到的主成分分量不能直接用于SLF的問(wèn)題。*