魏震波,余 雷
(四川大學(xué)電氣信息學(xué)院,四川成都 610065)
短期電力負(fù)荷預(yù)測(cè)是電力系統(tǒng)安排發(fā)電計(jì)劃、經(jīng)濟(jì)調(diào)度電網(wǎng)、確定備用容量的基礎(chǔ),較高的預(yù)測(cè)精度對(duì)電網(wǎng)的安全可靠運(yùn)行有著重要作用[1-3]。隨著智能電表等監(jiān)測(cè)設(shè)備的大量安裝,基于大量數(shù)據(jù)分析進(jìn)行短期負(fù)荷預(yù)測(cè)成為可能[4-5]。
多年來(lái),為解決負(fù)荷預(yù)測(cè)中電力負(fù)荷序列因隨機(jī)性、非平穩(wěn)、非線性所帶來(lái)的困擾,許多學(xué)者一直致力于探索更優(yōu)的短期負(fù)荷預(yù)測(cè)方法[6-8]。有學(xué)者基于隨機(jī)森林算法預(yù)測(cè)負(fù)荷[9],有學(xué)者基于誤差補(bǔ)償預(yù)測(cè)負(fù)荷[10],也有學(xué)者提出考慮利用負(fù)荷周期性特征即頻率特性,先將電力負(fù)荷進(jìn)行分類后再做預(yù)測(cè),理論上可以提高總負(fù)荷預(yù)測(cè)精度。如文獻(xiàn)[11-12]分別以變分模態(tài)分解和經(jīng)驗(yàn)?zāi)B(tài)分解對(duì)總負(fù)荷進(jìn)行信號(hào)分解,再對(duì)各信號(hào)分量進(jìn)行負(fù)荷預(yù)測(cè),有效提高了預(yù)測(cè)精度,但是模態(tài)分解模糊了單個(gè)樣本概念,其運(yùn)算過(guò)程亦可能造成樣本特征的丟失。為保持樣本獨(dú)立性,可采用聚類算法對(duì)所有樣本進(jìn)行聚類[13]。
目前,主流聚類算法大致分為原型聚類、密度聚類、層次聚類3 類。其中,原型聚類是通過(guò)“原型”即樣本空間中具有代表性的點(diǎn)進(jìn)行聚類,Kmeans 算法是其典型代表,它假設(shè)同簇樣本的分布空間為圓形,極大地限制了算法的合理分類,即使是更加優(yōu)越的高斯混合聚類,依然假設(shè)同簇樣本分布于橢圓空間中。并且,Kmeans 算法中初始簇心對(duì)最終結(jié)果會(huì)產(chǎn)生較大影響,亦無(wú)法識(shí)別噪音[14],最終的聚類數(shù)目往往也需要人為選定[15]。密度聚類,其代表是DBSCAN 算法,它基于1 組鄰域參數(shù)(ε,MinPts)來(lái)進(jìn)行聚類,其中ε代表半徑閾值,MinPts代表半徑范圍內(nèi)需求的樣本數(shù)。該算法雖然不需要手動(dòng)設(shè)置聚類數(shù),能自動(dòng)識(shí)別噪音,其簇也不受樣本分布形狀影響[16],但不同簇密度差異較大時(shí)性能受較大影響。此外,由于涉及2 個(gè)超參數(shù),當(dāng)數(shù)據(jù)規(guī)模較大時(shí),調(diào)參會(huì)變得較為困難[17]。層次聚類的代表是自底向上的AGNES 算法,它不像原型聚類依賴于“原型”,不需要調(diào)參,但需要人為設(shè)定聚類數(shù),無(wú)法識(shí)別噪音,而且聚類結(jié)果受簇間距離衡量方式影響較大[18]。因此,若將密度聚類與層次聚類算法相結(jié)合,則密度層次聚類算法(Density-based Clustering-Hierarchical Clustering,DC-HC)可自適應(yīng)聚類數(shù)、甄別噪音、同簇樣本不受樣本分布形狀限制,并且具備較高自適應(yīng)度,多數(shù)情況下不需要手動(dòng)調(diào)參。
綜上成果與問(wèn)題,本文考慮采用快速傅里葉變換(Fast Fourier Transformation,F(xiàn)FT)計(jì)算得到樣本期望頻率,并將其作為聚類特征量,采用DC-HC 算法進(jìn)行聚類,實(shí)現(xiàn)對(duì)原始數(shù)據(jù)的預(yù)處理;然后,將處理后的各類樣本按類疊加,分別使用長(zhǎng)短時(shí)記憶(Long Short Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)進(jìn)行負(fù)荷預(yù)測(cè),將各分量預(yù)測(cè)結(jié)果再次疊加,得到最終負(fù)荷預(yù)測(cè)值。通過(guò)實(shí)際算例驗(yàn)證了本文思路及方法的合理性與有效性。
對(duì)有限長(zhǎng)離散信號(hào)z(n),n=0,1,...,N-1,采用式(1)進(jìn)行變換,即:
式中:Z(k)為z(n)的離散傅里葉變換,k=0,1,...,N-1;W為單位向量。
FFT 將z(n)按照n的奇偶性分解為偶數(shù)序列z1(n1)與奇數(shù)序列z2(n2),其長(zhǎng)度都是N/2,即:
式中:n1為偶數(shù),n2為奇數(shù),且n1,n2?n。
則有:
式中:Z1(k)和Z2(k)分別為z1(n1)和z2(n2)的離散傅里葉變換。
總負(fù)荷由所有樣本按時(shí)序疊加得到,對(duì)任一樣本,由采樣定理可知FFT 能求出最大頻率為采樣頻率一半的振幅頻譜,記某樣本的s個(gè)對(duì)應(yīng)頻率值為w1,w2,…,ws,振幅為A1,A2,…,As,取σ1=1,2,...,s,σ2=1,2,...,s,提出單個(gè)樣本的期望頻率w計(jì)算方法為:
首先計(jì)算出距離矩陣D,其第i行第j列元素di,j代表第i個(gè)樣本與第j個(gè)樣本的歐式距離。若數(shù)據(jù)集共有m個(gè)樣本,則距離矩陣D為m×m的方陣,其后所有運(yùn)算均圍繞D展開。
簇與簇的合并遵循以下3 個(gè)原則:
1)除開自由點(diǎn),所有簇都能通過(guò)內(nèi)部距離運(yùn)算確定請(qǐng)求與某外部點(diǎn)合簇或是拒絕與該點(diǎn)合簇。
2)規(guī)定小于等于5 個(gè)點(diǎn)的簇不能拒絕來(lái)自外部的合簇請(qǐng)求。
3)大于5 個(gè)點(diǎn)的簇可以拒絕來(lái)自外部的合簇請(qǐng)求。
以S表示樣本點(diǎn),C表示簇。對(duì)非自由點(diǎn)Si,其所在簇記為Cp。要考察簇Cp是否請(qǐng)求與其簇外點(diǎn)Sj合并,則需計(jì)算閾值T,若di,j≤T,則簇Cp請(qǐng)求與Sj所在簇Cq合并,反之則拒絕,閾值計(jì)算方法分為以下兩種情況,分別用T1和T2表示:
(1)若Si所在簇Cp為初始簇,記Sl為與Si同簇的另一樣本,則:
式中:y為對(duì)數(shù)幾率函數(shù),如式(6)所示:
式中:x為現(xiàn)有簇?cái)?shù)與初始簇?cái)?shù)的比值,x∈(0,1]。
(2)若Si所在簇Cp樣本數(shù)目大于2,則通過(guò)D矩陣找到簇Cp內(nèi)與樣本Si距離不大于di,j的所有樣本,加上樣本Si本身,構(gòu)成判定團(tuán)體Gi。進(jìn)一步在此定義“核心距離”:若判定團(tuán)體Gi內(nèi)共有a個(gè)樣本,由于每2 個(gè)樣本間有1 個(gè)距離,則共有a(a-1)/2 個(gè)距離值,找到其中a-1 個(gè)距離值使a個(gè)樣本在拓?fù)浣Y(jié)構(gòu)上能夠完全相連,并保證a-1 個(gè)距離值總和最小,則a-1 個(gè)距離值叫做判定團(tuán)體Gi的核心距離,記為d1,d2,…da-1;判定團(tuán)體的核心距離可以通過(guò)最小生成樹算法求得[19]。進(jìn)一步有:
式中:λ=1,2,...,a-1;dλ為樣本距離;h1,h2,h3,h4為修正系數(shù),使所有數(shù)值處于一個(gè)合適區(qū)間。
希望T2的判定計(jì)算隨簇?cái)?shù)量的減少越來(lái)越嚴(yán)格,并且其減少速率的變化率也越來(lái)越大,即T2相對(duì)簇?cái)?shù)的一階導(dǎo)數(shù)為正,二階導(dǎo)數(shù)為負(fù),并且希望在簇?cái)?shù)最多和最少兩種極端情況下T2差別不應(yīng)過(guò)大,這部分運(yùn)算由系數(shù)h2完成,即:
其中,h2原型函數(shù)為式(6)所表示的對(duì)數(shù)幾率函數(shù),式(9)、式(10)分別為其一階導(dǎo)數(shù)y′和二階導(dǎo)數(shù)y″,即:
觀察式(6)、式(9)、式(10)可知,對(duì)數(shù)幾率函數(shù)基本滿足系數(shù)h2控制需求,進(jìn)一步對(duì)對(duì)數(shù)幾率函數(shù)分別沿自變量和因變量方向進(jìn)行圖像的縮放和平移,設(shè):
式中:g,b,r,f為控制圖像變換的變量。
由式(9)、式(10)可知,對(duì)數(shù)幾率函數(shù)本身就滿足系數(shù)h2對(duì)一階導(dǎo)數(shù)和二階導(dǎo)數(shù)的需求,則圖像不需要左右平移,即g=0,并且由于圖像未進(jìn)行左右平移,b,r,f的值并不影響系數(shù)h2對(duì)其低階導(dǎo)數(shù)的需求;對(duì)于類似式(6)的函數(shù),一般認(rèn)為當(dāng)函數(shù)值到達(dá)最大值的90%后增長(zhǎng)率變緩,為保證系數(shù)變化具有差異性并考慮自變量范圍x∈(0,1],則有:
求解式(12)得b=ln19≈2.944 4;為避免簇?cái)?shù)最多和最少兩種極端情況下系數(shù)差異過(guò)大,考慮如式(13)的約束:
求解式(13)得0.263 2f-0.684 2r≥0,取r=1,則可取f=2.599 5。
系數(shù)h3與小團(tuán)體Gi中樣本個(gè)數(shù)a成負(fù)相關(guān),即a越大,樣本Sj與小團(tuán)體Gi相對(duì)而言越遠(yuǎn),T2越小。h3計(jì)算如式(14):
參考以標(biāo)準(zhǔn)差判定離群點(diǎn)的方式,取ζ=1,2,...,a-1,則系數(shù)h4為Gi的核心距離標(biāo)準(zhǔn)差為:
式中:dζ為樣本距離。
若滿足條件di,j≤t,則簇Cp請(qǐng)求與簇Cq合并,受約束于2.1 節(jié)合簇原則,對(duì)稱性地計(jì)算簇Cq(Sj)與點(diǎn)Si之間的閾值,并進(jìn)一步判定簇Cq是否請(qǐng)求與簇Cp合并。
DC-HC 算法流程如下:
1)根據(jù)輸入樣本計(jì)算得到距離矩陣D。
2)由D矩陣找到所有互為彼此最近樣本的2個(gè)樣本構(gòu)成初始簇,并在D矩陣中將所有簇內(nèi)距離值位置置為非數(shù)值。
3)找到D矩陣中的當(dāng)前最小數(shù)值di,j,依照2.1節(jié)方法計(jì)算閾值并判定是否合簇,并將di,j和dj,i位置置為非數(shù)值。若不合簇則跳到步驟5)。
4)將新合簇形成的簇內(nèi)距離值在D矩陣中置為非數(shù)值。
5)若D矩陣不全為非數(shù)值,則返回步驟3)。
選取費(fèi)舍爾鳶尾花數(shù)據(jù)集(iris)、Matlab 內(nèi)置聚類測(cè)試數(shù)據(jù)集(kmeansdata)、三角圓數(shù)據(jù)集(data1)、雙月數(shù)據(jù)集(data2)4 個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集,分別采用Kmeans,AGNES,DBSCAN,DC-HC 4 種聚類方法對(duì)4 個(gè)數(shù)據(jù)集進(jìn)行聚類。
層次聚類算法AGNES 選用豪斯多夫距離衡量Cp和Cq2 簇間距離distH(Cp,Cq)[14],即:
其中,
式中:disth(Cp,Cq)為從Cp到Cq的單方向豪斯多夫距離。
使用4 組數(shù)據(jù)集和4 種聚類方法,可得到16組聚類結(jié)果,分別采用以下6 種聚類內(nèi)部評(píng)估指標(biāo)進(jìn)行測(cè)評(píng):(1)DB 指數(shù)[14];(2)Dunn 指數(shù)[14];(3)輪廓指數(shù)[14];(4)CH 指數(shù)[20];(5)VCV 指數(shù)[21];(6)MST 指數(shù)[21]。
數(shù)據(jù)集data1 和data2 在4 種聚類算法下的分類情況如圖1 所示。其中,橫、縱坐標(biāo)代表相對(duì)位置,無(wú)單位,下文同。
圖1 4種聚類算法對(duì)data1和data2的分類直觀圖Fig.1 Visual distribution maps of data1 and data2 clustered by fourclustering algorithms
以圖1(e),(f)的分類結(jié)果作為外部評(píng)估標(biāo)準(zhǔn)數(shù)據(jù),對(duì)4 種聚類算法的聚類效果分別采用3 種聚類外部評(píng)估指標(biāo)進(jìn)行測(cè)評(píng):(1)Jaccard 系數(shù)[14];(2)FM指數(shù)[14];(3)Rand 指數(shù)[14]。
參照各指標(biāo)在不同數(shù)據(jù)集下的不同聚類算法最優(yōu)得票進(jìn)行統(tǒng)計(jì)。若不同算法對(duì)同一數(shù)據(jù)集有相同分類方案且在某評(píng)估指數(shù)下最優(yōu),則均得票,統(tǒng)計(jì)結(jié)果如表1 所示。
表1 各聚類算法最優(yōu)得票統(tǒng)計(jì)Table1 Optimal voting statistics of clustering algorithms
綜合考慮表1 結(jié)果和各算法特性可知:(1)就經(jīng)驗(yàn)預(yù)期而言,AGNES 算法與Kmeans 算法表現(xiàn)相近,但對(duì)比圖1(a)和(c)評(píng)估結(jié)果,AGNES 算法在數(shù)據(jù)集data1 下的表現(xiàn)遠(yuǎn)不如Kmeans 算法。若排除data1,采用AGNES,Kmeans 兩種算法對(duì)剩余3個(gè)數(shù)據(jù)集應(yīng)用9 個(gè)指標(biāo)進(jìn)行最優(yōu)得票數(shù)統(tǒng)計(jì),并經(jīng)計(jì)算可知Kmeans 算法得11 票,AGNES 算法得10票,與預(yù)期相符,說(shuō)明豪斯多夫距離不適用于數(shù)據(jù)集data1,進(jìn)一步說(shuō)明簇間距離衡量方式將會(huì)對(duì)類似AGNES 的層次聚類算法產(chǎn)生決定性影響;(2)DCHC 算法由于繼承了密度聚類不受樣本分布形狀的特性,因此其在data1 和data2 兩個(gè)特定數(shù)據(jù)集下表現(xiàn)略劣于DBSCAN 算法,但遠(yuǎn)優(yōu)于另外2 種算法。由此可以預(yù)見,當(dāng)數(shù)據(jù)呈現(xiàn)高維特性時(shí),樣本點(diǎn)在超空間中的分布形狀會(huì)更加趨向于非圓形化,這時(shí)DC-HC 算法和DBSCAN 算法將更具優(yōu)越性。在最終得票統(tǒng)計(jì)上,DBSCAN 算法略優(yōu)于DC-HC 算法,但DBSCAN 算法存在二維超參數(shù),當(dāng)數(shù)據(jù)量較大時(shí)調(diào)參困難;并且DBSCAN 算法無(wú)法應(yīng)對(duì)不同簇密度差異較大的聚類場(chǎng)景,而密度差異往往在高維數(shù)據(jù)下被擴(kuò)大。因此面對(duì)大量高維數(shù)據(jù)時(shí),DC-HC 算法適用性更強(qiáng)。
使用data1 和data2 兩個(gè)可視數(shù)據(jù)集隨機(jī)添加15 個(gè)樣本點(diǎn)對(duì)DC-HC 算法進(jìn)行抗噪性測(cè)試,噪音點(diǎn)均用黑點(diǎn)表示,測(cè)試結(jié)果如圖2 所示。
圖2 DC-HC算法抗噪性測(cè)試Fig.2 Noise resistance testing of DC-HC algorithm
對(duì)比圖2 與圖1(e),(f)可知,藍(lán)色方框選中的點(diǎn)為新添加的樣本點(diǎn),但DC-HC 算法并未將其判定為噪音點(diǎn),而距離更遠(yuǎn)的點(diǎn)才被判定為噪音,可見DC-HC 算法具備良好的抗噪能力。
循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)被廣泛用于各類時(shí)序問(wèn)題,然而在誤差沿時(shí)間反向傳播的過(guò)程中,梯度進(jìn)行多次疊加將會(huì)導(dǎo)致梯度消失或梯度爆炸,因此RNN 很難處理長(zhǎng)時(shí)序問(wèn)題。進(jìn)而產(chǎn)生一種改進(jìn)的循環(huán)網(wǎng)絡(luò):LSTM 網(wǎng)絡(luò)[22-24]。
為解決梯度難以沿時(shí)間長(zhǎng)距離反向傳播的問(wèn)題,LSTM 新增單元狀態(tài)c并引入“門”的概念。其輸入包括μ,β,c3 類,輸出包括β,c2 類。其中μt為t時(shí)刻輸入,βt為t時(shí)刻網(wǎng)絡(luò)輸出,如圖3 所示。
圖3 LSTM時(shí)序邏輯結(jié)構(gòu)Fig.3 Structure of LSTM sequential logic
本文以愛爾蘭可持續(xù)能源管理局(Sustainable Energy Authority of Ireland,SEAI)于2011 年5 月發(fā)布的愛爾蘭智能電表實(shí)測(cè)用戶用電數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)集[25]。
采用FFT 計(jì)算每個(gè)樣本的振幅頻譜,根據(jù)式(4)計(jì)算對(duì)應(yīng)期望頻率;再以期望頻率作為特征量使用DC-HC 算法對(duì)愛爾蘭電力負(fù)荷數(shù)據(jù)集進(jìn)行聚類,共有10 個(gè)樣本被DC-HC 算法歸類為噪音。
4.3.1 LSTM負(fù)荷預(yù)測(cè)
將各類負(fù)荷(噪音樣本算作噪音類負(fù)荷)按類疊加,以1 h 負(fù)荷量為1 個(gè)時(shí)間節(jié)點(diǎn),選取1 到120時(shí)間節(jié)點(diǎn)劃分為訓(xùn)練集,121 到144 時(shí)間節(jié)點(diǎn)作為測(cè)試集,使用LSTM 神經(jīng)網(wǎng)絡(luò)進(jìn)行負(fù)荷預(yù)測(cè),預(yù)測(cè)結(jié)果如圖4 和圖5 所示。由圖4 可知,6 類實(shí)際負(fù)荷中的大部分負(fù)荷曲線與預(yù)測(cè)曲線具有較高的一致性,預(yù)測(cè)效果較好。噪音類負(fù)荷曲線規(guī)律性較弱,所以預(yù)測(cè)效果并不理想,但由于噪音類樣本較少,噪音類總負(fù)荷量相對(duì)于相同時(shí)間內(nèi)負(fù)荷總量很少,因此噪音類負(fù)荷預(yù)測(cè)對(duì)最終的總負(fù)荷預(yù)測(cè)影響很小。
圖4 6類負(fù)荷實(shí)際曲線及預(yù)測(cè)曲線Fig.4 Actual and predictive curves of six kinds of loads
圖5 噪音類負(fù)荷實(shí)際曲線及預(yù)測(cè)曲線Fig.5 Actual and predictive curves of noise loads
使用本文所提FFT-DC-HC-LSTM 算法,將121—144 共24 個(gè)節(jié)點(diǎn)所有預(yù)測(cè)結(jié)果進(jìn)行疊加后,得到圖6 曲線。
圖6 24個(gè)節(jié)點(diǎn)總負(fù)荷曲線及預(yù)測(cè)曲線Fig.6 Total load and forecating load of 24 nodes
由圖6 可知,采用本文算法進(jìn)行負(fù)荷預(yù)測(cè)的結(jié)果與實(shí)際負(fù)荷的運(yùn)行規(guī)律基本一致。
4.3.2 聚類算法對(duì)LSTM負(fù)荷預(yù)測(cè)影響
為評(píng)估各方案預(yù)測(cè)精度,進(jìn)一步采用均方根誤差(Root Mean Square Error,RMSE)和平均絕對(duì)百分誤差(Mean Absolute Percentage Error,MAPE)評(píng)估預(yù)測(cè)效果,數(shù)學(xué)表達(dá)為:
式中:為第θ個(gè)時(shí)段的實(shí)際負(fù)荷值;Pθ為第θ個(gè)時(shí)段的預(yù)測(cè)負(fù)荷值;υ為預(yù)測(cè)時(shí)間內(nèi)的節(jié)點(diǎn)數(shù)。
將4.3.1 節(jié)預(yù)測(cè)方案與以下4 種方案進(jìn)行對(duì)比:(1)使用Kmeans 聚類負(fù)荷數(shù)據(jù)后進(jìn)行預(yù)測(cè);(2)使用AGNES 聚類負(fù)荷數(shù)據(jù)后進(jìn)行預(yù)測(cè);(3)使用DBSCAN 聚類負(fù)荷數(shù)據(jù)后進(jìn)行預(yù)測(cè);(4)不使用聚類方法預(yù)處理負(fù)荷數(shù)據(jù),直接進(jìn)行負(fù)荷預(yù)測(cè)。對(duì)比結(jié)果如表2 所示。
表2 預(yù)測(cè)方案誤差值對(duì)比Table 2 Comparison of error values between predictive schemes
由表2 數(shù)據(jù)可知:(1)對(duì)原始電力負(fù)荷數(shù)據(jù)使用聚類算法進(jìn)行預(yù)處理后再按類分別進(jìn)行負(fù)荷預(yù)測(cè),可有效降低預(yù)測(cè)總誤差;(2)在以負(fù)荷預(yù)測(cè)為目的負(fù)荷數(shù)據(jù)聚類預(yù)處理過(guò)程中,DC-HC 算法表現(xiàn)優(yōu)于其它算法。
4.3.3 不同預(yù)測(cè)算法比較
在均使用DC-HC 算法進(jìn)行數(shù)據(jù)預(yù)處理的前提下,采用LSTM、門控循環(huán)單元(Gated Recurrent Unit,GRU)、非線性自回 歸(Nonlinear Autoregressive,NAR)、RNN、多層感知機(jī)(Multilayer Perceptron,MLP)、支持向量回歸(Support Vector Regression,SVR)及一種集成決策樹(AdaBoost-Decision Tree,AB-DT)作為預(yù)測(cè)算法進(jìn)行預(yù)測(cè)誤差及穩(wěn)定性對(duì)比,對(duì)比結(jié)果如表3 所示:(1)預(yù)測(cè)誤差,每個(gè)預(yù)測(cè)算法均獨(dú)立訓(xùn)練20 批次并取多次預(yù)測(cè)的平均值作為最終結(jié)果進(jìn)行誤差計(jì)算;(2)穩(wěn)定性,單個(gè)預(yù)測(cè)算法每批次訓(xùn)練的最終預(yù)測(cè)結(jié)果均計(jì)算誤差,并以此計(jì)算所有誤差值的標(biāo)準(zhǔn)差。
由表3 數(shù)據(jù)可知:(1)MLP,SVR 和AB-DT 算法雖然輸出穩(wěn)定,但由于并非時(shí)序模型,因此在預(yù)測(cè)精度上并不理想;(2)綜合預(yù)測(cè)精度和算法穩(wěn)定性,在負(fù)荷預(yù)測(cè)問(wèn)題中,LSTM 算法應(yīng)被優(yōu)先考慮使用。
表3 不同預(yù)測(cè)算法比較Table 3 Comparison of different predictive algorithms
本文提出了一種基于FFT、DC-HC 和LSTM 網(wǎng)絡(luò)的短期負(fù)荷預(yù)測(cè)方案,借助FFT 得到負(fù)荷數(shù)據(jù)期望頻率并以之作為特征量,使用DC-HC 算法聚類負(fù)荷,再將聚類結(jié)果按類分別使用LSTM 進(jìn)行負(fù)荷預(yù)測(cè),最終疊加各分量得到預(yù)測(cè)總負(fù)荷。研究結(jié)論具體如下:
1)通過(guò)FFT 進(jìn)行特征提取再聚類電力負(fù)荷數(shù)據(jù)的按類預(yù)測(cè)方法,可有效提高短期負(fù)荷預(yù)測(cè)精度。
2)相較其它算法,LSTM 算法應(yīng)用于本文負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測(cè)具有更高精度且更加穩(wěn)定。
3)相較其它聚類算法,DC-HC 算法在負(fù)荷預(yù)測(cè)中具有更好的數(shù)據(jù)預(yù)處理效果。
4)DC-HC 算法具有自適應(yīng)聚類數(shù)、抗噪性、簇空間分布自由等優(yōu)點(diǎn),相較傳統(tǒng)聚類方法具有更大的適用范圍和更強(qiáng)的適用性。
接下來(lái),研究受外部相關(guān)時(shí)序變量影響的時(shí)序數(shù)據(jù)預(yù)測(cè)模型是今后工作重點(diǎn)。