余建平 孔 亮 袁秋實 楊宏宇
(1.國網(wǎng)上海市電力公司浦東供電公司,上海200122;2.上海博英信息科技有限公司,上海200240)
在進行配網(wǎng)規(guī)劃時,需要綜合考慮未來電網(wǎng)在運行時的各項指標,為電網(wǎng)正常運行提供更好的支撐,因此,需選取能準確反映電網(wǎng)狀態(tài)的特征量作為計算規(guī)劃后的評估指標,建立配網(wǎng)多維規(guī)劃適應(yīng)性分析體系,該體系主要用于指導未來的規(guī)劃方對電網(wǎng)未來運行的適應(yīng)性所造成的影響進行分析。
為了實現(xiàn)精準的電網(wǎng)分析,需要對現(xiàn)狀網(wǎng)進行持續(xù)的數(shù)據(jù)集成與大數(shù)據(jù)集的構(gòu)建,用于對不同規(guī)劃類型(電網(wǎng)規(guī)劃、能源規(guī)劃)項目在實際投入運行階段進行適應(yīng)性分析,進而為下一步的電網(wǎng)精準規(guī)劃提供輔助建議。
對負荷的預(yù)測工作一般簡單采用自然增長率+新增大用戶負荷增長的方法,精細化程度不夠,未考慮氣象數(shù)據(jù)對負荷的影響。
氣象因素對用電負荷有著重要影響,在負荷預(yù)測工作中,需要考慮氣象因素的影響,運用回歸分析方法,擬合出目標線路的最大負荷—氣象數(shù)據(jù)曲線,提高負荷預(yù)測的準確度。
氣象因素是影響電力負荷的重要因素,包括溫度、濕度、風速、氣壓等。在各類氣象因素中,以溫度的影響最為直觀。
以商業(yè)用電[1]為例,大型商場用電負荷主要是空調(diào)、電梯、室內(nèi)照明,受季節(jié)的影響明顯,夏季溫度高,空調(diào)負荷占較大比重,一般在13:00左右達到峰值,冬季溫度低,采暖負荷占較大比重。商業(yè)負荷表現(xiàn)出極強的時間性和季節(jié)性,與溫度變化關(guān)系密切。
在居民用電負荷中,居民生活用電受季節(jié)性影響較強,氣象因素尤其是溫度因素對居民用電負荷影響較大。一般會出現(xiàn)兩個高峰,即早高峰、晚高峰,峰谷差較大,早高峰出現(xiàn)在12:00—13:00之間;夏季午后次高峰較大,主要受降溫負荷的影響;最大負荷出現(xiàn)在21:00—22:00之間。同時,冬夏季日負荷變化趨勢相似,基本與人們的日常生活規(guī)律相一致。
“回歸”是由英國生物學家提出的,現(xiàn)在這個名詞被用來泛指變量之間的一般數(shù)量關(guān)系。
回歸分析法指利用數(shù)據(jù)統(tǒng)計原理,對大量統(tǒng)計數(shù)據(jù)進行數(shù)學處理,確定因變量與某些自變量的相關(guān)關(guān)系,建立一個相關(guān)性較好的回歸方程(函數(shù)表達式),并加以外推,用于預(yù)測今后因變量的變化的分析方法。
回歸分析是一種預(yù)測性的建模技術(shù),這種技術(shù)通常用于預(yù)測分析以及發(fā)現(xiàn)變量之間的因果關(guān)系。
回歸分析是建模和分析數(shù)據(jù)的重要工具,使用回歸分析益處良多,通過回歸分析可以指示自變量和因變量之間的顯著關(guān)系,也可指示多個自變量對一個因變量的影響強度。
掌握多種回歸模型時,基于自變量和因變量的類型、數(shù)據(jù)的維數(shù)以及數(shù)據(jù)的其他基本特征去選擇最合適的技術(shù)非常重要。
常用的回歸方法有線性回歸、多項式回歸等。以線性回歸為例,線性回歸是最為人熟知的建模技術(shù)之一。在該技術(shù)中,因變量是連續(xù)的,自變量(單個或多個)可以是連續(xù)的也可以是離散的,回歸線的性質(zhì)是線性的。線性回歸使用最佳的擬合直線(也就是回歸線)建立因變量和一個或多個自變量之間的聯(lián)系。用一個等式來表示它,即:
式中,β1表示回歸方程中自變量的系數(shù),稱為回歸系數(shù);β0表示回歸方程的常數(shù)項,稱為回歸常數(shù);e為隨機誤差項,代表的是由其他一切隨機因素引起的誤差。
這個等式可以根據(jù)給定的單個或多個預(yù)測變量來預(yù)測目標變量的值。
線性回歸有以下幾個要點:
(1)自變量與因變量之間必須有線性關(guān)系;
(2)多元回歸存在多重共線性、自相關(guān)性和異方差性;
(3)線性回歸對異常值非常敏感,它會嚴重影響回歸線,最終影響預(yù)測值;
(4)多重共線性會增加系數(shù)估計值的方差,使得估計值對于模型的輕微變化異常敏感,結(jié)果就是系數(shù)估計值不穩(wěn)定;
(5)在存在多個自變量的情況下,我們可以使用向前選擇法、向后剔除法和逐步篩選法來選擇最重要的自變量。
對于線性模型中的參數(shù)通常用普通最小二乘法求解,我們以最簡單的一元線性模型來解釋最小二乘法。
對于一元線性回歸模型,假設(shè)我們從總體中獲取了n組觀察(x1,y1),(x2,y2),…,(xn,yn)。對于平面中的這n個點,可以使用無數(shù)條曲線來擬合。要求樣本回歸函數(shù)盡可能好地擬合這組值。綜合起來看,這條直線處于樣本數(shù)據(jù)的中心位置最合理。
選擇最佳擬合曲線的標準可以確定為:使總的擬合誤差(即總殘差)達到最小。有以下三個標準可以選擇:
(1)用“殘差和最小”確定直線位置是一個途徑。但很快發(fā)現(xiàn)計算“殘差和”存在相互抵消的問題。
(2)用“殘差絕對值和最小”確定直線位置也是一個途徑。但絕對值的計算比較麻煩。
(3)最小二乘法的原則是以“殘差平方和最小”確定直線位置。用最小二乘法除了計算比較方便外,得到的估計量還具有優(yōu)良特性。這種方法對異常值非常敏感。
最常用的是普通最小二乘法[2]:所選擇的回歸模型應(yīng)該使所有觀察值的殘差平方和達到最?。≦為殘差平方和),即采用平方損失函數(shù)。用數(shù)學公式描述就是:
其中,yi是觀察得到的真實值,yie表示根據(jù)y=β0+β1x估算出來的值,即上式可以寫成:
對于這種形式的函數(shù)求導,函數(shù)的極值點為偏導為0的點。
將這兩個方程稍微整理一下,使用克萊姆法則,很容易求解得出:
求出的β0、β1即為回歸方程的系數(shù)。
決定系數(shù)(R2):決定系數(shù)是一個回歸直線與樣本觀測值擬合優(yōu)度的相對指標,反映了因變量的變異中能用自變量解釋的比例,可以作為判斷擬合效果好壞的一個指標。其數(shù)值在0~1之間,可以用百分數(shù)表示。如果擬合決定系數(shù)R2接近于1,說明因變量不確定性大部分都能由回歸方程解釋,回歸方程擬合優(yōu)度就好;反之,如果R2不大,說明回歸方程的效果不好,應(yīng)該進行修改。
收集某地區(qū)過去3年的歷史負荷數(shù)據(jù)和溫度數(shù)據(jù),運用統(tǒng)計擬合和回歸迭代的方法,擬合每條中壓線路的最大負荷—溫度數(shù)據(jù)曲線,確立負荷和溫度數(shù)據(jù)之間對應(yīng)關(guān)系的計算公式,精準抓住負荷變化的影響因素。
針對數(shù)據(jù)進行梳理,針對“擬合負荷—溫度關(guān)系曲線和計算公式”的研究內(nèi)容收集相關(guān)區(qū)域2015—2017年間每日的最大負荷數(shù)據(jù),在中國天氣網(wǎng)收集該地區(qū)2015—2017年間每日的最高氣溫。
數(shù)據(jù)清洗和收集:對每日的最高溫度數(shù)據(jù)及最大負荷數(shù)據(jù)進行清洗工作,對特別突出的數(shù)據(jù)與業(yè)務(wù)部門進行核實,并對數(shù)據(jù)進行處理及清洗。
變量選擇:本次研究內(nèi)容為負荷與氣溫的敏感關(guān)系并求出計算公式,所以對變量的選擇如下:日最大電負荷(P_S)、日期(DAY)、日最高溫度(MaxT)。
(1)建立時間與最大負荷的關(guān)系趨勢:分析最大負荷的分布情況,如圖1所示。
圖1 分布圖
(2)采用回歸的統(tǒng)計學方法建立模型:對最高溫度與日最大負荷進行回歸分析。分別采用線性、對數(shù)、二次、S、指數(shù)等方法進行曲線估算,得出模型描述、模型摘要以及擬合圖,表1為模型描述,表2為模型摘要,圖2為擬合圖形。
表1 模型描述
表2 模型摘要
通過計算結(jié)果可以看到,R2最好的是二次方程,為0.709。
(3)根據(jù)計算結(jié)果選擇R2最好的方程作為預(yù)測方程式。通過上面的計算結(jié)果得知,二次方程R2最好,為0.709。所以通過二次方程對數(shù)據(jù)進行重新計算,得到二次方程的擬合曲線,并計算估計值,表3為模型估算值,圖3為擬合曲線。
圖2 擬合圖形
表3 估算值
圖3 擬合曲線
(4)根據(jù)計算的結(jié)果,使用二次方程及參數(shù)估算進行方程式的計算。
(5)模型驗證,將2018年5月的歷史溫度導入公式計算平均絕對值誤差,相應(yīng)結(jié)果如表4所示。
本文主要考慮了氣象因素中溫度對負荷的影響,分析了日最高溫度和日最大負荷之間的關(guān)系,根據(jù)某一地區(qū)的實際負荷數(shù)據(jù)和溫度數(shù)據(jù),應(yīng)用回歸分析的方法,擬合最高溫度和最大負荷曲線,使得負荷預(yù)測更加精細化。
表4 模型驗證