王國彬,武 晗,白 楊,張 羽,劉 會,殷占貴
(1.國網(wǎng)寧夏電力有限公司電力科學(xué)研究院,銀川 750011;2.國家電網(wǎng)有限公司營銷部,北京 100032;3.國網(wǎng)(寧夏)綜合能源服務(wù)有限公司, 銀川 750011;4.國網(wǎng)寧夏電力有限公司, 銀川 750011;5.國網(wǎng)中衛(wèi)供電公司,寧夏 中衛(wèi) 755000)
精準(zhǔn)的負(fù)荷預(yù)測能夠保證發(fā)電計劃的合理規(guī)劃,并且使供電能夠有效有序地進(jìn)行,有效提升整個系統(tǒng)的運行效率。一方面,短期負(fù)荷預(yù)測對于電力調(diào)度安全具有重要意義;另一方面,隨著我國電力市場逐步走向成熟,電力市場交易對于電力系統(tǒng)的短期負(fù)荷預(yù)測提出了新的要求,負(fù)荷預(yù)測的精度對于參與市場交易的主體而言,意味著直接的經(jīng)濟效益。
電力負(fù)荷的變化由社會經(jīng)濟因素和自然因素共同決定,依據(jù)電力系統(tǒng)歷史負(fù)荷數(shù)據(jù)的連續(xù)性和周期性等特點可以預(yù)測出未來某一時間段的負(fù)荷數(shù)據(jù),已經(jīng)可以達(dá)到較高精度;但隨著電力現(xiàn)貨市場交易等新的要求,對預(yù)測精度提出更高要求,同時隨著大數(shù)據(jù)、采集存儲等信息技術(shù)的快速發(fā)展,利用高維度、大量數(shù)據(jù)提高預(yù)測精度逐漸得到重視[1],但大量數(shù)據(jù)的使用也帶來了“維數(shù)災(zāi)難”。一方面,“維數(shù)災(zāi)難”造成關(guān)鍵的因素和數(shù)據(jù)被淹沒,無法被挖掘,進(jìn)而造成預(yù)測精度陷入瓶頸,難以繼續(xù)提高;另一方面,高維度的、巨量的數(shù)據(jù)造成預(yù)測模型越來越復(fù)雜,計算速度也越來越慢,不得不對計算能力不斷擴容,造成計算能力的浪費,所以,在電力短期負(fù)荷預(yù)測中,為了不斷提高預(yù)測精度,降低預(yù)測模型的復(fù)雜程度,在構(gòu)建特征向量集時先對高維度的數(shù)據(jù)進(jìn)行降維處理是必要的。在電力負(fù)荷預(yù)測中,數(shù)據(jù)處理的復(fù)雜程度有限,主要采用主成分分析法( PCA)和核主成分分析( KPCA)降維方法[2]。
支持向量機( SVM)是一種廣泛應(yīng)用于統(tǒng)計分類和回歸分析的人工智能算法,屬于監(jiān)督式學(xué)習(xí)的方法,近年被用于短期電力負(fù)荷預(yù)測[3-4],具有理論成熟、魯棒性好、計算簡單等優(yōu)點。
隨著科學(xué)研究的深入,短期電力負(fù)荷預(yù)測方法不僅種類繁多、與時俱進(jìn),而且逐漸發(fā)展成熟,理論體系逐漸完善[5-8]。但是,對于不同種類算法,尤其是人工智能預(yù)測算法的適用性研究尚未得到有效開展。實際應(yīng)用中,每一種智能算法均有其適合的應(yīng)用場景,針對電力負(fù)荷預(yù)測,多種智能算法均有相關(guān)研究,但是少有研究者結(jié)合特征降維方法和智能算法,通過算法的耦合進(jìn)一步提高預(yù)測精度。
本文重點研究主成分分析的特征降維方法和支持向量機的智能預(yù)測算法,提出基于主成分分析和支持向量機的短期負(fù)荷預(yù)測方法。
影響短期負(fù)荷變化的因素包括時間因素、氣象因素、特殊活動因素及其他因素等[9]。
時間因素主要包括季節(jié)因素、節(jié)假日因素和工作日因素等。季節(jié)因素主要是由于隨著春夏秋冬季節(jié)的變化,加上氣溫的影響,造成短期負(fù)荷存在季節(jié)性差異。典型的節(jié)假日因素如春節(jié)、國慶等重大節(jié)日,工廠停工、學(xué)校停學(xué),第二產(chǎn)業(yè)用電負(fù)荷將降到最低,對短期負(fù)荷預(yù)測具有非常大的影響。工作日因素體現(xiàn)為每一周的工作日負(fù)荷與周末具有一定差異性。
氣象因素對于短期負(fù)荷具有重要影響。主要的氣象因素包括日最高溫度、日最低溫度、日平均溫度、相對濕度、降水量等。當(dāng)某種氣候現(xiàn)象發(fā)生時,可能造成用電負(fù)荷發(fā)生重大變化,如夏季最高氣溫顯著上升時,制冷負(fù)荷顯著增加,造成用電負(fù)荷增加。
特殊活動主要包括特殊的政治活動、大型體育賽事等,也包括重要節(jié)假日產(chǎn)生的人口遷徙活動等。政治活動期間,如APEC會議、北京“兩會”等,有可能要求提前停工,將對短期負(fù)荷產(chǎn)生直接影響。
除了以上3種因素外,還包括一些自然災(zāi)害、設(shè)備故障、大停電事故等因素。地震發(fā)生后對區(qū)域供電的影響,如臺灣大停電事故等。
PCA作為一種特征降維的方法,可以提取主成分的特征數(shù)據(jù),從而達(dá)到降低數(shù)據(jù)維度的效果。支持向量機回歸(SVR)是SVM的一個重要分支,以SVR為基礎(chǔ),建立短期的電力負(fù)荷預(yù)測模型,可以有效提高預(yù)測速度。本文結(jié)合兩者的優(yōu)勢,提出一種基于PCA和SVR的短期負(fù)荷預(yù)測模型。PCA對數(shù)據(jù)樣本進(jìn)行預(yù)處理,通過線性變換,消除數(shù)據(jù)之間的噪聲和相關(guān)性,將多個指標(biāo)組合成少數(shù)幾個能包含樣本數(shù)據(jù)信息的指標(biāo),降低樣本空間的維數(shù),進(jìn)而節(jié)約空間,簡化計算過程,提升SVM運算速度。
對短期電力負(fù)荷樣本數(shù)據(jù)展開主成分分析,獲得降低維度的主成分分量。把所有歷史負(fù)荷數(shù)據(jù)整理成樣本矩陣,矩陣大小為m×k維:
(1)
中心化樣本矩陣:
(2)
計算特征數(shù)據(jù)集的協(xié)方差:
(3)
計算協(xié)方差矩陣的特征值并取出最大的個特征值所對應(yīng)的特征向量,輸出投影矩陣,假設(shè)通過變換后的坐標(biāo)系是{w1,w2,…,wd},其中w為標(biāo)準(zhǔn)正交基向量。如果將數(shù)據(jù)降維后,特征數(shù)據(jù)xi于低維坐標(biāo)系的投影為zi=(zi1,zi2,…,zid),基于zi來構(gòu)造xi,結(jié)果為:
(4)
(5)
(6)
以式(6)為約束函數(shù),得出PCA降維之后的主成分分量。
2.2SVM算法訓(xùn)練
為建立短期負(fù)荷預(yù)測模型,使用前文2.1所得的經(jīng)PCA降維之后的主成分分量為樣本數(shù)據(jù),再進(jìn)行SVM算法訓(xùn)練。獲得目標(biāo)模型后,將模型付諸實際應(yīng)用,預(yù)測未來的短期電力負(fù)荷。
運用SVM算法求解回歸問題,PCA算法降維之后得到m個n維主成分樣本數(shù)據(jù),其中n (7) 構(gòu)成新的訓(xùn)練樣本集{(xi,yi),i=1,2,…,m},其中xi∈Rn,yi∈R,分別為輸入值和輸出值,Rn和R分別為n維和1維實數(shù)空間。 首先,基于SVM算法,使用非線性內(nèi)積函數(shù)將輸入的數(shù)據(jù)轉(zhuǎn)換到高維空間,然后在高維空間中,把轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行線性回歸分析構(gòu)造估計函數(shù)。假設(shè)訓(xùn)練樣本集為 {(xi,yi),i=1,2,…,n},其中xi∈RN為N維樣本輸入值,yi∈R為樣本輸出值,n為樣本數(shù)。引入非線性支持向量機估計函數(shù),表達(dá)式如下: f(x)=ω×φ(xi)+b (8) 式中:ω×φ(x)為高維空間向量ω與非線性映射φ(x)的內(nèi)積,ω的維數(shù)即為高維空間維數(shù),b∈R為偏置量。將松弛變量ξ和ξ*引入到式(8)中,并求解ω、b使得整個解空間(包括樣本點)滿足函數(shù): (9) 其約束條件為 (10) 式中:C為懲罰系數(shù),C越大表示對訓(xùn)練誤差超過 的數(shù)據(jù)樣本懲罰越大;ε為不敏感損失函數(shù),它規(guī)定回歸函數(shù)的誤差要求,ε越小回歸函數(shù)與輸出值的誤差越小,估計精度就越高。其表達(dá)形式為: L[y,f(x)]=|y-f(x)|ε (11) 由于上述問題屬于高維特征空間的凸二次問題,因此引入任意對稱函數(shù)K(xi,xj),并使其滿足Mercer條件,從而作為核函數(shù)代替非線性映射φ(x)。采用Wolfe對偶定理并結(jié)合拉格朗日乘子法,將該問題轉(zhuǎn)化為對偶函數(shù)進(jìn)行求解: (12) 其約束條件為: (13) 對式(11)所示目標(biāo)函數(shù)進(jìn)行求解,可得支持向量機的回歸估計函數(shù): (14) (15) 式中σ2為核函數(shù)的形狀參數(shù)。 以SVM的短期負(fù)荷預(yù)測作為基礎(chǔ),PCA降維輸出的歷史短期負(fù)荷主成分分量作為訓(xùn)練樣本集,訓(xùn)練得到基于PCA降維和支持向量機的短期負(fù)荷預(yù)測模型。 以式(14)、(15)所示模型預(yù)測未來短期的電力負(fù)荷。 采用某城市日用電負(fù)荷數(shù)據(jù)作為原始數(shù)據(jù),相關(guān)因素數(shù)據(jù)包括天氣陰晴、日最高氣溫、日最低氣溫、日平均氣溫、相對濕度、降水量、星期、節(jié)假日、月度GDP、國家PMI指數(shù)、國家CPI指數(shù)、重大活動、災(zāi)害事故。先使用歷史1年的數(shù)據(jù)進(jìn)行學(xué)習(xí),然后預(yù)測下一個月的用電負(fù)荷。分別采用人工神經(jīng)網(wǎng)絡(luò)(ANN)、SVR和本文提出的PCA+SVR預(yù)測算法模型,得到預(yù)測結(jié)果見圖1、圖2,3種預(yù)測方法預(yù)測結(jié)果指標(biāo)對比見表1。 圖1 3種預(yù)測方法預(yù)測結(jié)果的平均絕對百分比誤差(eMAPE) 圖2 3種預(yù)測方法預(yù)測結(jié)果的均方根誤差(eRMSE) 表1 3種預(yù)測方法預(yù)測結(jié)果指標(biāo)對比 PCA降維后前5個主成分的累計方差貢獻(xiàn)率達(dá)到了92%,選擇前5個為主成分特征向量。預(yù)測算法運行時間上集中在2 000~8 000 ms,多次運行取平均值,SVR、ANN和PCA+SVR運行時間約為3 815、5 951和3 398 ms。 預(yù)測結(jié)果顯示,采用本文算法的PCA+SVR預(yù)測模型效果最佳,MAPE和RMSE指標(biāo)遠(yuǎn)優(yōu)于SVR和ANN模型。ANN和SVR兩種模型的預(yù)測精度接近,MAPE和RMSE指標(biāo)差異較小。直接對比PCA+SVR和SVR模型,MAPE平均降低62.5%,RMSE平均降低62.9%,運行時間減少12%,說明本文提出算法預(yù)測精度和速度均得到提高。 本文重點研究了基于主成分分析降維和支持向量機回歸的短期負(fù)荷預(yù)測方法,通過PCA降維與SVR智能算法的耦合形成新的預(yù)測模型,提高了短期負(fù)荷預(yù)測精度和速度。2.3 算例分析
3 結(jié)論