張 瑋 秦晨暉 王 浩 張 鑫 邵梓翔 楊文韜
(國(guó)網(wǎng)甘肅省電力公司甘南供電公司)
電力行業(yè)作為保障經(jīng)濟(jì)發(fā)展和人民生活最重要的二次能源的基礎(chǔ)產(chǎn)業(yè),在我國(guó)經(jīng)濟(jì)運(yùn)行調(diào)節(jié)方面起著重要作用。電能無法存貯具有即發(fā)即用的特殊性,這對(duì)電能的生產(chǎn)、傳輸、配送以及銷售的過程提出了更高的要求,因此,根據(jù)以用定發(fā)的原則,需要通過剖析歷史負(fù)荷相關(guān)數(shù)據(jù),獲取后期負(fù)荷的實(shí)際狀況,提前安排發(fā)電、輸電及供電方案[1]。
負(fù)荷預(yù)測(cè)可理解為合理計(jì)及各項(xiàng)條件,應(yīng)用數(shù)學(xué)措施對(duì)負(fù)荷變動(dòng)規(guī)則進(jìn)行探究,確定某特定時(shí)刻或時(shí)段的負(fù)荷數(shù)值的過程。電力需求量的預(yù)測(cè)結(jié)果影響發(fā)電設(shè)備的裝機(jī)類型、輸電網(wǎng)的運(yùn)行及配電系統(tǒng)新增容量的大小。BP神經(jīng)網(wǎng)絡(luò)是目前應(yīng)用較多的一種負(fù)荷預(yù)測(cè)方法,具有非線性映射能力、自學(xué)習(xí)和自適應(yīng)能力及容錯(cuò)能力等優(yōu)點(diǎn),然而BP神經(jīng)網(wǎng)絡(luò)也存在收斂速度緩慢、預(yù)測(cè)能力矛盾等問題[2]。本文首先采用ElasticNet彈性網(wǎng)回歸對(duì)大數(shù)據(jù)進(jìn)行篩選,剔除冗余數(shù)據(jù),獲得有效樣本集;其次,考慮可用于解決非線性最小二乘問題的LM算法,利用LM算法對(duì)BP神經(jīng)網(wǎng)絡(luò)的負(fù)荷預(yù)測(cè)模型進(jìn)行優(yōu)化,實(shí)現(xiàn)模型預(yù)測(cè)精度和收斂速度的提升。
負(fù)荷預(yù)測(cè)結(jié)果是系統(tǒng)調(diào)度的重要參考依據(jù),負(fù)荷預(yù)測(cè)值的準(zhǔn)確性與電能質(zhì)量息息相關(guān),同時(shí)負(fù)荷預(yù)測(cè)也是電力系統(tǒng)優(yōu)化的環(huán)節(jié)之一。電力負(fù)荷預(yù)測(cè)是供電企業(yè)的重要任務(wù),預(yù)測(cè)精度達(dá)標(biāo)時(shí),發(fā)電側(cè)可以更加經(jīng)濟(jì)合理地計(jì)劃發(fā)電機(jī)組的運(yùn)行與檢修,保證供電系統(tǒng)科學(xué)合理地安排機(jī)組出力[3]。
隨著新一輪電力體制變革的持續(xù)進(jìn)行,電網(wǎng)企業(yè)將不再負(fù)責(zé)售電業(yè)務(wù),僅依照政府規(guī)定的輸配電價(jià)收取過網(wǎng)費(fèi),涌現(xiàn)出各種不同背景的售電公司。對(duì)售電公司來說,核心競(jìng)爭(zhēng)力就是負(fù)荷預(yù)測(cè)水平,準(zhǔn)確的負(fù)荷預(yù)測(cè)系統(tǒng)不僅可以幫助企業(yè)更好地進(jìn)行規(guī)劃投資,同時(shí)可以有效降低成本、增加利潤(rùn)收益[4]。
負(fù)荷預(yù)測(cè)具體流程如圖1所示。
圖1 的負(fù)荷預(yù)測(cè)整體流程可以概括為:
(1)確定目的,制定預(yù)測(cè)計(jì)劃
根據(jù)現(xiàn)有數(shù)據(jù)材料,科學(xué)準(zhǔn)確地預(yù)測(cè)電力電量需求,實(shí)現(xiàn)以精確的負(fù)荷、電量測(cè)算依據(jù),合理指導(dǎo)規(guī)劃、建設(shè)、運(yùn)行等各個(gè)環(huán)節(jié)的目的。
(2)背景調(diào)查,收集資料
目標(biāo)明確后,需要根據(jù)要求收集預(yù)測(cè)過程中需要使用的相關(guān)資料數(shù)據(jù)。確定想要預(yù)測(cè)負(fù)荷的所在的地點(diǎn)及時(shí)間長(zhǎng)短;確定預(yù)測(cè)負(fù)荷的期限,根據(jù)目標(biāo)收集相關(guān)歷史數(shù)據(jù),包含所要用到數(shù)據(jù)的分布及氣象因素等信息,收集數(shù)據(jù)可靠性決定了準(zhǔn)確預(yù)測(cè)能否順利實(shí)現(xiàn),防止因收集數(shù)據(jù)存在過大偏差導(dǎo)致預(yù)測(cè)結(jié)果失準(zhǔn)情況的出現(xiàn);
(3)整理資料,數(shù)據(jù)預(yù)處理
數(shù)據(jù)獲取完畢后,需對(duì)數(shù)據(jù)進(jìn)行整理,觀察數(shù)據(jù)中是否存在缺失或者異常點(diǎn),若存在則需要對(duì)這些數(shù)據(jù)進(jìn)行相關(guān)處理。
(4)數(shù)據(jù)挖掘,分析數(shù)據(jù)
采用數(shù)據(jù)挖掘?qū)?shù)據(jù)進(jìn)行分析處理,可以在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí),進(jìn)而得到有價(jià)值的數(shù)據(jù)資料[5];同時(shí),數(shù)據(jù)挖掘一般要通過編程實(shí)現(xiàn),注重?cái)?shù)學(xué)和計(jì)算機(jī)等方法的綜合應(yīng)用,所以在數(shù)據(jù)處理過程中引入數(shù)據(jù)挖掘技術(shù),以解決資料收集分析困難,數(shù)據(jù)繁雜的問題。
(5)搭建負(fù)荷預(yù)測(cè)模型
搭建系統(tǒng)負(fù)荷預(yù)測(cè)模型的過程就是明確負(fù)荷預(yù)測(cè)輸入值與預(yù)測(cè)量之間關(guān)系的過程??梢詫?duì)電力負(fù)荷進(jìn)行預(yù)測(cè)的措施有很多,然而每種方法存在各自的優(yōu)點(diǎn)和不足,在實(shí)際運(yùn)行時(shí)間中,一般選用多種方法進(jìn)行負(fù)荷預(yù)測(cè),并對(duì)預(yù)測(cè)結(jié)果進(jìn)行比對(duì)[6]。
(6)確定預(yù)測(cè)結(jié)果,分析對(duì)比
對(duì)模型求解獲得預(yù)測(cè)結(jié)果,通過誤差分析對(duì)模型存在的優(yōu)勢(shì)和不足進(jìn)行評(píng)估。不同負(fù)荷預(yù)測(cè)模型獲得的預(yù)測(cè)結(jié)果間存在差異,分析對(duì)比后對(duì)模型進(jìn)行修正,得到最佳算法。
由負(fù)荷特性分析可知,電力負(fù)荷的變動(dòng)以歷史負(fù)荷數(shù)據(jù)為基礎(chǔ)受多方面因素影響,如天氣、環(huán)境等多重外部因素。電網(wǎng)企業(yè)的智能化進(jìn)程不斷推進(jìn),信息和能量的交互產(chǎn)生了大量結(jié)構(gòu)復(fù)雜、關(guān)系緊密的電力負(fù)荷相關(guān)數(shù)據(jù),電力負(fù)荷大數(shù)據(jù)化現(xiàn)象突出,要想順利完成負(fù)荷預(yù)測(cè)任務(wù),需對(duì)電力負(fù)荷相關(guān)數(shù)據(jù)進(jìn)行挑選及特征提取,排除不相干及多余數(shù)據(jù)的干擾,建立有效樣本集?;貧w分析是一種預(yù)測(cè)性質(zhì)的建模措施,普遍應(yīng)用于分析預(yù)測(cè)、時(shí)間序列模型和探究變量間因果關(guān)系的問題中[7]。
回歸分析可以對(duì)兩個(gè)或者多個(gè)變量之間的關(guān)系進(jìn)行估計(jì),揭示因變量和自變量之間的關(guān)系,允許使用者對(duì)不同尺度上測(cè)量變量的影響進(jìn)行比對(duì),幫助使用者評(píng)價(jià)得出最佳的變量集,用于預(yù)測(cè)模型的構(gòu)建。
大多數(shù)回歸技術(shù)均可用于預(yù)測(cè)分析,常見的回歸模型包括:
(1)線性回歸:因變量是連續(xù)的,自變量的連續(xù)性不做過多要求,回歸線的實(shí)質(zhì)是線性的。
(2)邏輯回歸:邏輯回歸用來計(jì)算成功或者失敗的概率。當(dāng)因變量是二進(jìn)制時(shí),可以選擇采用邏輯回歸。
(3)多項(xiàng)式回歸:一個(gè)自變量的指數(shù)大于1的回歸方程,可確定為多項(xiàng)式回歸方程。多項(xiàng)式回歸的最佳擬合線時(shí)數(shù)據(jù)點(diǎn)的曲線。
(4)逐步回歸:處理問題中含有多個(gè)孤立變量時(shí),可以采用逐步回歸。獨(dú)立變量通過自動(dòng)過程進(jìn)行選取,排除人為因素影響。
(5)嶺回歸:嶺回歸是當(dāng)數(shù)據(jù)遭受多重共線性時(shí)使用的一種技術(shù)。通過引入偏差度進(jìn)而有效減少方差。
(6)套索回歸:套索回歸對(duì)回歸系數(shù)的絕對(duì)值進(jìn)行處理,可以降低變異性并提升回歸模型的準(zhǔn)確度。
(7)彈性回歸:彈性回歸屬于嶺回歸和套索回歸的混合技術(shù),同時(shí)使用L2和L1正則化。當(dāng)有多個(gè)相關(guān)的特征時(shí),采用彈性網(wǎng)絡(luò)可以對(duì)問題進(jìn)行有效處理。套索回歸大概率隨機(jī)選擇其中一個(gè),而彈性回歸一般會(huì)選擇多個(gè)。
不同的回歸技術(shù)有其自身的優(yōu)缺點(diǎn)和適用范圍,本文采用結(jié)合套索回歸和嶺回歸技術(shù)的ElasticNet彈性網(wǎng)回歸,對(duì)電力負(fù)荷有關(guān)數(shù)據(jù)進(jìn)行變量篩選處理及特征提取。彈性回歸在高度相關(guān)變量的情況下支持群體效應(yīng),具有兩個(gè)收縮因子λ1和λ2,對(duì)所選變量的數(shù)目不存在限制,適用于解決變量數(shù)目過多的問題。
人工神經(jīng)網(wǎng)絡(luò)是在現(xiàn)代神經(jīng)學(xué)、生物學(xué)、心理學(xué)等學(xué)科探究的基礎(chǔ)上產(chǎn)生的,是一種模擬人腦神經(jīng)組織的計(jì)算系統(tǒng),它具有生物神經(jīng)系統(tǒng)的基本特征,在一定程度上借鑒了人腦功能。
BP神經(jīng)網(wǎng)絡(luò)作為目前應(yīng)用最多的一種神經(jīng)網(wǎng)絡(luò)形式,具備非線性映射能力、泛化能力、容錯(cuò)能力、自學(xué)習(xí)和自適應(yīng)能力等優(yōu)點(diǎn),但是由于使用場(chǎng)景的不斷更新擴(kuò)張,BP神經(jīng)網(wǎng)絡(luò)也顯現(xiàn)出了較多的缺點(diǎn)和問題,比如局部極小化問題、收斂速度慢、預(yù)測(cè)能力和訓(xùn)練能力的矛盾等問題。本文利用LM算法對(duì)BP神經(jīng)網(wǎng)絡(luò)的負(fù)荷預(yù)測(cè)模型進(jìn)行優(yōu)化,改進(jìn)輸入信號(hào)的正向傳遞和誤差信號(hào)的反向傳輸過程,提高BP神經(jīng)網(wǎng)絡(luò)模型的負(fù)荷預(yù)測(cè)精度以及收斂速度。
3.1.1 傳統(tǒng)預(yù)測(cè)模型
BP神經(jīng)網(wǎng)絡(luò)是經(jīng)過誤差逆向傳播算法進(jìn)行訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),這種神經(jīng)網(wǎng)絡(luò)可以通過學(xué)習(xí)以及存儲(chǔ)的方式來表示任意的輸入層和輸出層的m維到n的映射關(guān)系[8]。這種m維到n的映射關(guān)系不需要提前給出某種數(shù)學(xué)方程式。BP神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu)如圖2所示。
圖中:Xm為輸入層的輸入值;bij為隱含層的閾值;Wij為輸入層和隱含層之間的權(quán)值;Yp為隱含層的值;bjk為輸出層的閾值;Wjk為輸出層和隱含層之間的權(quán)值;Zl為第l個(gè)節(jié)點(diǎn)的輸出;m為輸入層的維度;p為隱含層的節(jié)點(diǎn)總數(shù);l為輸出層的維度。
3.1.2 模型的局限性
實(shí)際使用中,人工神經(jīng)網(wǎng)絡(luò)更多采用BP神經(jīng)網(wǎng)絡(luò)及其優(yōu)化形式進(jìn)行替代。BP神經(jīng)網(wǎng)絡(luò)具有分布式存儲(chǔ)信息、信息處理和存儲(chǔ)合二為一及自組織、自學(xué)習(xí)等特點(diǎn),具有解決所有復(fù)雜性非線性問題的能力,但是BP神經(jīng)網(wǎng)絡(luò)也具有一些難以克服的局限性[9]:
(1)易陷入局部最優(yōu)。BP算法理論上可以實(shí)現(xiàn)任意非線性映射,但在實(shí)際應(yīng)用中,會(huì)面臨陷入到局部最小值的問題。
(2)初始權(quán)重敏感。BP神經(jīng)網(wǎng)絡(luò)需要對(duì)初始權(quán)值進(jìn)行隨機(jī)確定,這就導(dǎo)致BP神經(jīng)網(wǎng)絡(luò)一般具有難以復(fù)現(xiàn)的特點(diǎn)。
(3)樣本依賴性。BP算法的結(jié)果與樣本的選擇相關(guān)聯(lián),如果學(xué)習(xí)樣本不具有代表性,或者額外數(shù)據(jù)和矛盾數(shù)據(jù)較多,則模型難以達(dá)到預(yù)期效果。
針對(duì)上述問題中提及的BP算法具有隨機(jī)性、易陷入局部最小值等問題,引入BP神經(jīng)網(wǎng)絡(luò)的優(yōu)化算法。
3.2.1 LM算法的基本原理
LM算法是使用較為廣泛的非線性最小二乘算法,它是利用梯度求最大(?。┲档乃惴?,同時(shí)具有梯度法和牛頓法的優(yōu)點(diǎn)。當(dāng)λ很小時(shí),步長(zhǎng)等于牛頓法步長(zhǎng);當(dāng)λ很大時(shí),步長(zhǎng)約等于梯度下降法的步長(zhǎng)。LM算法能夠相對(duì)有效的防止神經(jīng)網(wǎng)絡(luò)陷入局部最優(yōu),而且LM算法的收斂速度快,有很強(qiáng)的穩(wěn)定性。算法在進(jìn)行過程中對(duì)參數(shù)進(jìn)行修改,結(jié)合高斯-牛頓算法以及梯度下降法的優(yōu)點(diǎn),并在不足處進(jìn)行挖完善。LM算法可以表示為:
當(dāng)μk增加時(shí),算法接近于最速下降法;當(dāng)μk減小時(shí),算法接近于牛頓法。
3.2.2 LM算法改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型
訓(xùn)練目標(biāo)誤差不同會(huì)對(duì)BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果產(chǎn)生影響。誤差越大,訓(xùn)練所需要的時(shí)間就越少,但是預(yù)測(cè)結(jié)果的誤差會(huì)越大,可能無法得到結(jié)果預(yù)期值;相反誤差越小,訓(xùn)練所需要的時(shí)間就越多,預(yù)測(cè)結(jié)果的誤差就越小,精度就越高,但是算法會(huì)出現(xiàn)不收斂的情況[10]。LM算法可以促進(jìn)BP神經(jīng)網(wǎng)絡(luò)收斂速度,能夠快速并精確地?cái)M合函數(shù)曲線,但卻沒有使網(wǎng)絡(luò)的泛化能力得到増強(qiáng)。設(shè)誤差函數(shù)為Ee,則有:
其中,n為訓(xùn)練樣本數(shù)量,Oi為網(wǎng)絡(luò)實(shí)際輸出,ti為期望輸出。
如果僅從有限個(gè)樣本中恢復(fù)一個(gè)函數(shù)的解無法獲取全面的信息,得到的結(jié)果很可能會(huì)產(chǎn)生較大的誤差。采用正則化方法,在原有算法的基礎(chǔ)上增加權(quán)重衰減項(xiàng),用于限制逼近函數(shù),防止過度擬合的發(fā)生。此時(shí)網(wǎng)絡(luò)的性能函數(shù)改進(jìn)為:
其中:ωi為神經(jīng)網(wǎng)絡(luò)的互聯(lián)權(quán)值,M為神經(jīng)網(wǎng)絡(luò)中全部連權(quán)值的個(gè)數(shù)。參數(shù)λ和β決定了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練目標(biāo)。采取貝葉斯正則化方法,可得出:
其中:γ表示網(wǎng)絡(luò)中有在減少耗費(fèi)函數(shù)取值方面有效果的參數(shù)個(gè)數(shù)。算法流程如圖2
BP神經(jīng)網(wǎng)絡(luò)具備很強(qiáng)的自適應(yīng)能力,同時(shí),還具有可以自主學(xué)習(xí)、信息記憶以及優(yōu)化計(jì)算的優(yōu)點(diǎn)。通過LM算法對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,能夠解決BP神經(jīng)網(wǎng)絡(luò)局部極小化和收斂速度慢的問題,改進(jìn)后的預(yù)測(cè)模型適用于短期及中長(zhǎng)期負(fù)荷預(yù)測(cè)等多種場(chǎng)景,更具可靠性。