,,志遠(yuǎn),
(國(guó)網(wǎng)烏魯木齊供電公司,新疆 烏魯木齊 830011)
電力工業(yè)的根本目標(biāo)是通過科學(xué)的規(guī)劃最大限度地提高發(fā)電和用電效率,提高電力系統(tǒng)運(yùn)行的經(jīng)濟(jì)性。而電力負(fù)荷預(yù)測(cè)一直是電力系統(tǒng)有效規(guī)劃和經(jīng)濟(jì)運(yùn)行的重要組成部分。
短期電網(wǎng)負(fù)荷預(yù)測(cè)是電力系統(tǒng)運(yùn)行決策的關(guān)鍵,對(duì)電力系統(tǒng)的機(jī)組組合、減少發(fā)電備用、提高經(jīng)濟(jì)調(diào)度、保持系統(tǒng)可靠性以及維護(hù)調(diào)度都有重要意義[1-2]。近年來,準(zhǔn)確的短期電網(wǎng)負(fù)荷預(yù)測(cè)在電力市場(chǎng)管制中得到了更大的重視和面臨更大的挑戰(zhàn)。
短期電網(wǎng)負(fù)荷預(yù)測(cè)算法需要處理從一個(gè)小時(shí)到幾天的負(fù)載預(yù)測(cè)。由于短期負(fù)載具有極大的隨機(jī)性,因此短期電網(wǎng)負(fù)荷預(yù)測(cè)的復(fù)雜性對(duì)電力運(yùn)營(yíng)者是一個(gè)極大挑戰(zhàn)。在過去的幾十年里,人們提出了許多預(yù)測(cè)模型。這些預(yù)測(cè)模型可以分為傳統(tǒng)模型或基于機(jī)器學(xué)習(xí)的模型。前者包括時(shí)間序列預(yù)測(cè)器,如自回歸移動(dòng)平均外生變量模型[3]。這些傳統(tǒng)模型是基于線性回歸模型,不能準(zhǔn)確代表復(fù)雜負(fù)載的非線性特征[4]。不同的機(jī)器學(xué)習(xí)技術(shù)也被用于短期電網(wǎng)負(fù)荷預(yù)測(cè),如人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)[5]、徑向基函數(shù)(radial basis function,RBF)[6]、模糊神經(jīng)模型[7]和支持向量回歸[8]。
預(yù)測(cè)過程依賴于對(duì)某一國(guó)家或地區(qū)電力需求歷史數(shù)據(jù)的分析,還可以考慮許多其他因素,如天氣預(yù)報(bào)和商業(yè)計(jì)劃。因此,需要整個(gè)歷史數(shù)據(jù)來訓(xùn)練預(yù)測(cè)模型,但是這樣的方法其缺點(diǎn)是,如果考慮到新的信息則所有參數(shù)都可能需要重新訓(xùn)練。此外,這種龐大的數(shù)據(jù)量和預(yù)期的復(fù)雜預(yù)測(cè)過程導(dǎo)致需要大量的計(jì)算能力。研究人員試圖找到近似方法來最小化這一數(shù)據(jù)量,并將所需的計(jì)算能力降到最低。這些研究試圖盡量減少數(shù)據(jù)采樣量等。許多方法解決了這些回溯問題,其中一個(gè)采用了中的局部預(yù)測(cè)器[9-10]。
經(jīng)濟(jì)約束在任何算法研究中都起著主要作用。云計(jì)算的出現(xiàn)解決了研究人員和開發(fā)人員面臨的許多經(jīng)濟(jì)問題。在云計(jì)算技術(shù)之前,超級(jí)計(jì)算機(jī)是獲得巨大計(jì)算能力的唯一合適選擇,顯然這是一個(gè)非常昂貴的選擇。有許多計(jì)算系統(tǒng)可以提供巨大的計(jì)算能力,如分布式系統(tǒng)、網(wǎng)格計(jì)算、互聯(lián)網(wǎng)計(jì)算以及量子計(jì)算等,但云計(jì)算技術(shù)是最具性價(jià)比的選擇,獲得了廣泛的商業(yè)應(yīng)用。為此,一些研究試圖借助云計(jì)算技術(shù)為短期負(fù)荷預(yù)測(cè)提供足夠的計(jì)算能力[11-13]。
一般來說,電力負(fù)荷由不同的消耗單元組成。各種因素都影響著電力負(fù)荷的變化,如天氣、重大事件、經(jīng)濟(jì)因素和隨機(jī)因素。短期負(fù)荷預(yù)測(cè)可以被認(rèn)為是一個(gè)多變量預(yù)測(cè)問題。它可以作為回歸問題的函數(shù)來求解。次日負(fù)荷為回歸模型的輸出,歷史負(fù)荷數(shù)據(jù)及其影響因素為回歸模型的輸入。歷史數(shù)據(jù)庫(kù)提供訓(xùn)練數(shù)據(jù)。該回歸問題的最終目標(biāo)是從歷史負(fù)荷數(shù)據(jù)及其影響因素中找到一個(gè)具有良好泛化能力的預(yù)測(cè)負(fù)荷映射函數(shù)。歷史負(fù)荷數(shù)據(jù)被分為兩個(gè)不同的數(shù)據(jù)集:一個(gè)是訓(xùn)練數(shù)據(jù)集用來訓(xùn)練回歸模型;另一個(gè)是測(cè)試數(shù)據(jù)集用來評(píng)估訓(xùn)練后的回歸模型[14]。
基于統(tǒng)計(jì)學(xué)習(xí)理論提出的支持向量回歸(support vector regression,SVR)[15]已被研究作為一種有前景的電力負(fù)荷預(yù)測(cè)方法。其優(yōu)勢(shì)主要來自于采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,并作為經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則的替代方案,它可以通過求解二次問題來獲得最優(yōu)的全局解。
SVR的執(zhí)行有兩個(gè)主要特征:二次規(guī)劃和核函數(shù)。二次規(guī)劃問題將用線性約束求解得到SVR的參數(shù)。核函數(shù)的靈活性使該技術(shù)能夠搜索寬范圍的解空間。SVR的主要目標(biāo)是通過非線性映射將數(shù)據(jù)x映射到高維特征空間,并在該特征空間中執(zhí)行線性回歸[16-17]:
f(x)=〈w,x〉+b
(1)
式中:<.,.>表示點(diǎn)積;w包含必須從數(shù)據(jù)中估計(jì)的系數(shù);b是一個(gè)實(shí)常數(shù)。使用Vaunink的ε-不敏感損失函數(shù)[18],將整體優(yōu)化為
(2)
約束條件為
(3)
(4)
約束條件為
(5)
輸出是一個(gè)獨(dú)特的全局優(yōu)化結(jié)果,其形式如下:
(6)
式中,Q(xi,x)是核函數(shù)。在SVR中采用核函數(shù),所有必要的計(jì)算可以直接在輸入空間中計(jì)算。核函數(shù)存在各種各樣的內(nèi)核,如線性、雙曲正切、高斯徑向基函數(shù)、多項(xiàng)式等[19]。在這里,使用常用的RBF內(nèi)核:
Q(xi,x)=e-γ‖xi-x‖2
(7)
SVR的參數(shù)C、γ和ε在SVR的性能中起著至關(guān)重要的作用。因此,選擇這些參數(shù)的正確值可以最大限度地減少預(yù)測(cè)誤差?;诤说腟VRs需要計(jì)算數(shù)據(jù)集中每個(gè)點(diǎn)之間的距離函數(shù)
(8)
基于SVR解決短期電網(wǎng)負(fù)荷預(yù)測(cè)問題可以歸納為以下步驟:
1)加載歷史數(shù)據(jù)并將其分為訓(xùn)練集和驗(yàn)證集;
2)準(zhǔn)確確定SVR的參數(shù);
3)使用定義的參數(shù)訓(xùn)練SVR以獲得支持向量和相應(yīng)的系數(shù);
4) 利用式(6)得到預(yù)測(cè)的負(fù)載。
為檢驗(yàn)云計(jì)算平臺(tái)在電力負(fù)荷預(yù)測(cè)領(lǐng)域的影響,實(shí)驗(yàn)旨在測(cè)試兩點(diǎn):一是使用Azure ML實(shí)現(xiàn)負(fù)荷預(yù)測(cè)技術(shù)的準(zhǔn)確性;二是測(cè)試執(zhí)行時(shí)間的改進(jìn)。
該數(shù)據(jù)集收集了從2016年1月至2017年12月的0.5 h電力負(fù)荷、2016年至2017年的日平均溫度以及2016年至2017年的假期信息。目標(biāo)是預(yù)測(cè)2018年1月的每日最大負(fù)荷,并用2018年1月的負(fù)荷實(shí)際值驗(yàn)證計(jì)算預(yù)測(cè)值。
設(shè)計(jì)實(shí)驗(yàn)的實(shí)現(xiàn)有兩個(gè)選擇:本地實(shí)現(xiàn)和基于云的實(shí)現(xiàn)。對(duì)于本地實(shí)現(xiàn),可使用臺(tái)式計(jì)算機(jī)及使用MATLAB軟件實(shí)現(xiàn)所提出的算法。臺(tái)式計(jì)算機(jī)具有以下規(guī)格: Microsoft Windows 10,Intel Core i7 2.7 GHz,RAM 16 GB。 對(duì)于基于云的實(shí)現(xiàn),則用Azure ML[20]。
實(shí)驗(yàn)考慮了兩個(gè)主要的性能指標(biāo):第1個(gè)也是最重要的一個(gè)是執(zhí)行時(shí)間(TExecution);第2個(gè)是預(yù)測(cè)準(zhǔn)確性。所有實(shí)驗(yàn)將使用4個(gè)度量來評(píng)估預(yù)測(cè)準(zhǔn)確度:平均絕對(duì)百分比誤差(MAPE)、最大誤差幅度(MAX)、平均絕對(duì)誤差(MAE)和歸一化均方誤差(NMSE)。這些值由式(9)至式(13)定義:
(9)
MAX=max(|Ai-Pi|)
(10)
(11)
(12)
(13)
實(shí)驗(yàn)包括了4種不同的實(shí)驗(yàn)方案,用以比較和評(píng)估所提出的基于SVR算法的短期電網(wǎng)負(fù)荷模型在云計(jì)算平臺(tái)和單機(jī)計(jì)算平臺(tái)上的性能差異。
所有這些實(shí)驗(yàn)方案的目標(biāo)是使用訓(xùn)練集訓(xùn)練上面所述的預(yù)測(cè)模型,再使用這個(gè)預(yù)測(cè)模型來預(yù)測(cè)2018年1月的31天內(nèi)的最大日負(fù)荷,并與實(shí)際負(fù)荷進(jìn)行比較。所提出的各實(shí)驗(yàn)方案的訓(xùn)練數(shù)據(jù)有所不同,如表1所示。
表1 實(shí)驗(yàn)方案的數(shù)據(jù)集
4種實(shí)驗(yàn)方案的執(zhí)行結(jié)果如表2、圖1和圖2所示。結(jié)果表明,使用云計(jì)算平臺(tái)的執(zhí)行時(shí)間遠(yuǎn)遠(yuǎn)少于使用基于本地機(jī)器的單機(jī)計(jì)算平臺(tái)的執(zhí)行時(shí)間。特別是在訓(xùn)練數(shù)據(jù)相對(duì)較大的在實(shí)驗(yàn)方案2中,云計(jì)算平臺(tái)與單機(jī)計(jì)算平臺(tái)的執(zhí)行時(shí)間相比,時(shí)間執(zhí)行的改進(jìn)在10倍以上。值得指出的是,在云計(jì)算平臺(tái)上進(jìn)行的第2次實(shí)驗(yàn)時(shí)比第1次運(yùn)行更快,例如,實(shí)驗(yàn)方案2的第2次執(zhí)行時(shí)間等于9 s,遠(yuǎn)低于第1次的72 s。此外,從預(yù)測(cè)精度來看,兩者幾乎相同,在實(shí)驗(yàn)方案4的情況下實(shí)現(xiàn)了最佳預(yù)測(cè)精度為2.04%。
圖1 單機(jī)平臺(tái)和云平臺(tái)執(zhí)行時(shí)間對(duì)比
前面提出了一種基于支持向量回歸預(yù)測(cè)(SVR)算法短期電網(wǎng)負(fù)荷模型,并通過實(shí)驗(yàn)分別在云計(jì)算平臺(tái)和單機(jī)計(jì)算平臺(tái)上實(shí)現(xiàn)了該模型。在兩個(gè)平臺(tái)的對(duì)比實(shí)驗(yàn)中,選擇執(zhí)行時(shí)間和預(yù)測(cè)精度作為性能指標(biāo)。對(duì)于所使用的實(shí)驗(yàn)數(shù)據(jù)集,單機(jī)計(jì)算平臺(tái)和云計(jì)算平臺(tái)實(shí)現(xiàn)的算法預(yù)測(cè)精度是相同的;但是,在云計(jì)算平臺(tái)實(shí)現(xiàn)的算法執(zhí)行時(shí)間顯著減小。一般來說,SVR并不推薦用于大型數(shù)據(jù)集,因?yàn)樗挠?jì)算成本很高,而前面采用云計(jì)算平臺(tái)體現(xiàn)了較好的計(jì)算效率,因此所進(jìn)行的實(shí)驗(yàn)結(jié)果可為相關(guān)研究提供借鑒。
表2 實(shí)驗(yàn)結(jié)果
圖2 各個(gè)實(shí)驗(yàn)方案下預(yù)測(cè)值和實(shí)際值的偏差