謝文龍,張蓮,王士彬,李多,楊家豪
(1.重慶理工大學(xué)電氣與電子工程學(xué)院,重慶 400054; 2.國(guó)網(wǎng)重慶市電力公司市南供電分公司,重慶 401336)
隨著社會(huì)經(jīng)濟(jì)的快速發(fā)展,電力需求持續(xù)增長(zhǎng),電力市場(chǎng)也日趨復(fù)雜多變。“十四五”期間,我國(guó)將堅(jiān)持綠色低碳發(fā)展理念,優(yōu)化調(diào)整能源結(jié)構(gòu),提高能源安全保障水平[1]。2022年夏季,受極端高溫、強(qiáng)降雨等自然災(zāi)害影響,部分地區(qū)出現(xiàn)用電荒,導(dǎo)致供電緊張甚至斷電。因此,在當(dāng)前形勢(shì)下開展短期電力負(fù)荷預(yù)測(cè)研究不僅可以提高電力系統(tǒng)運(yùn)行效率、降低運(yùn)營(yíng)成本、提升服務(wù)水平,還可以豐富相關(guān)理論體系和方法論等方面的理論意義[2]。
為了提升電力負(fù)荷預(yù)測(cè)的精確性,需要深刻把握負(fù)荷變化的規(guī)律性。電力負(fù)荷序列呈現(xiàn)出周期性、隨機(jī)性等特點(diǎn),實(shí)質(zhì)上構(gòu)成一類隨機(jī)的非平穩(wěn)時(shí)間序列。近年來,負(fù)荷預(yù)測(cè)領(lǐng)域?qū)⒅悄芩惴ㄅc神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)相結(jié)合,而長(zhǎng)短期記憶網(wǎng)絡(luò)(long short term memory,LSTM)也是公認(rèn)對(duì)時(shí)間序列處理最好的模型之一。針對(duì)電力負(fù)荷序列特點(diǎn)所進(jìn)行的分解,也成為了提升負(fù)荷預(yù)測(cè)精度和可靠性的重要方法[3]。例如經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)[4]、集合經(jīng)驗(yàn)?zāi)B(tài)分解等。上述的LSTM模型和模態(tài)分解的方法雖然有效地提升了預(yù)測(cè)精度,但方法本身存在局限性。LSTM收斂速度過慢,參數(shù)選擇對(duì)于預(yù)測(cè)結(jié)果的精度影響很大[5];EMD容易混疊,生成包含虛假信息的模態(tài)分量,會(huì)對(duì)預(yù)測(cè)結(jié)果產(chǎn)生較大影響;集合經(jīng)驗(yàn)?zāi)B(tài)分解[6]采用疊加高斯白噪聲的方法,來減少序列外部因素的影響[7],但是處理不當(dāng)易引入噪聲,影響結(jié)果準(zhǔn)確性。而變分模態(tài)分解(variational mode decompostion,VMD)自適應(yīng)、完全非遞歸的模態(tài)變分和信號(hào)處理的方法,克服了EMD模態(tài)混疊的問題;除此之外,對(duì)序列分解后,如果將模態(tài)直接代入模型預(yù)測(cè),會(huì)導(dǎo)致計(jì)算量龐大[8],同時(shí)影響預(yù)測(cè)結(jié)果的精度[9]。
針對(duì)上述問題,提出了基于VMD-PE-IPOA優(yōu)化的LSTM預(yù)測(cè)模型。該模型利用VMD的優(yōu)點(diǎn)有效地避免了模態(tài)混疊;并通過排列熵合并模態(tài),減少了計(jì)算規(guī)模;然后使用改進(jìn)鵜鶘優(yōu)化算法(improved pelican optimization algorithm,IPOA)更高效準(zhǔn)確地尋找到最優(yōu)模型參數(shù);最后使用兩份數(shù)據(jù)集,與不同預(yù)測(cè)模型和不同優(yōu)化算法的結(jié)果進(jìn)行對(duì)比,驗(yàn)證了本文所提方法的有效性和可靠性。
變分模態(tài)分解是一種自適應(yīng)信號(hào)分解方法,在2014年由DRAGOMIRETSKIY等人[10]提出。它可以通過控制每個(gè)本征模函數(shù)(intrinsic mode function,IMF)的中心頻率和帶寬來減少模態(tài)混疊現(xiàn)象。對(duì)原始序列采用模態(tài)分解,可以降低復(fù)雜度高和非線性強(qiáng)的時(shí)間序列非平穩(wěn)性,分解獲得包含多個(gè)不同頻率尺度且相對(duì)平穩(wěn)的子序列[11]。
VMD的分解過程是變分問題的求解過程,通過迭代找到變分模型的最優(yōu)解,確定每個(gè)模式的帶寬和中心頻率。因此,VMD可以自適應(yīng)地分解頻域信號(hào),分離每個(gè)模式[12]。將原始負(fù)荷信號(hào)分解成IMF,每個(gè)IMF都可表示為:
uk(t)=Akcos[φk(t)]
(1)
(2)
式中:Ak(t)為瞬時(shí)幅值,Ak(t)≥0;φk(t)為相位;ωk(t)是瞬時(shí)頻率。
具體的步驟如下:
1)步驟1,對(duì)于每個(gè)模態(tài),使用希爾伯特變換計(jì)算相關(guān)的解析信號(hào)以獲得單邊頻譜,并與調(diào)諧到相應(yīng)估計(jì)中心頻率的指數(shù)e-jωkt混合,將模式的頻譜移動(dòng)到基帶:
(3)
式中:δ(t)為單位脈沖函數(shù);uk(t)為模態(tài)函數(shù)。
2)步驟2,在通過解調(diào)信號(hào)的高斯平滑度估計(jì)帶寬,即梯度的平方范數(shù)。由此產(chǎn)生的約束變分問題如下:
(4)
3)步驟3,為了求解式(4),利用二次懲罰因子α在有限權(quán)重下的良好收斂特性,以及拉格朗日乘子λ對(duì)約束的嚴(yán)格性,將式(4)的約束性變分問題轉(zhuǎn)化為非約束性問題,得到增廣拉格朗日表達(dá)式如下:
(5)
(6)
(7)
(8)
4)步驟4,直到滿足式(9),停止迭代,否則返回步驟3。
(9)
式中:N為最大迭代次數(shù);ε為收斂精度。
滿足式(9)后,原始信號(hào)f被分解為k個(gè)模態(tài)向量uk(t),最后通過傅里葉反變換到時(shí)域。
排列熵(permutation entropy,PE)值是一種用來表征時(shí)間序列或者混沌動(dòng)力系統(tǒng)的復(fù)雜程度的無量綱指標(biāo)[13]。它的計(jì)算方法是將時(shí)間序列分成若干個(gè)子序列,然后對(duì)每個(gè)子序列進(jìn)行排序,得到不同的排列模式,再計(jì)算每種排列模式出現(xiàn)的概率,最后用信息熵公式求和得到排列熵值[14]。
簡(jiǎn)單地說,排列熵值的大小表示時(shí)間序列或者混沌動(dòng)力系統(tǒng)的隨機(jī)程度:熵值越小,說明時(shí)間序列或者混沌動(dòng)力系統(tǒng)越簡(jiǎn)單、規(guī)則;反之,熵值越大,則時(shí)間序列或者混沌動(dòng)力系統(tǒng)越復(fù)雜、隨機(jī)[15]。
對(duì)于一組時(shí)間序列{X(i),i=1,2,…,N},對(duì)其進(jìn)行相空間重構(gòu),得到矩陣Y為
(10)
式中:τ為延遲時(shí)間;m為嵌入維數(shù);K為重構(gòu)空間中重構(gòu)分量的個(gè)數(shù),其中K=N-(m-1)τ。
在矩陣Y中,每一行都是一個(gè)重構(gòu)分量,總共有K個(gè)重構(gòu)分量。將這些重構(gòu)分量進(jìn)行升序排列有:
x(i+(j1-1)τ)≤x(i+(j2-1)τ)≤…≤x(i+(jm-1)τ)
(11)
式中:用j1,j2,…,jm來表示Y中各個(gè)元素所在列索引。
如若排序過程中,相鄰兩個(gè)值相等,則以這兩個(gè)值中列索引ji的下標(biāo)升序排列。如此對(duì)于任意一個(gè)時(shí)間序列重構(gòu)得的矩陣,矩陣Y就被映射到了一組符號(hào)序列:
S(k)=(j1,j2,…,jm),k=1,2,…,K
(12)
時(shí)間序列X(i)的排列熵依照香農(nóng)熵(Shannon entropy)的形式可定義為:
(13)
Hp(m)最大值為ln(m!),將Hp(m)進(jìn)行歸一化處理為:
H=Hp(m)/lnm!
(14)
在經(jīng)過歸一化處理后,H的取值范圍為0≤H≤1,H值的大小反映了時(shí)間序列的隨機(jī)性程度。H值增大,對(duì)應(yīng)著時(shí)間序列隨機(jī)性增強(qiáng)[16]。
在式(10)中,嵌入維數(shù)m和延遲時(shí)間τ需要提前選取,參數(shù)的選取對(duì)排列熵的計(jì)算結(jié)果會(huì)產(chǎn)生影響,根據(jù)Christoph的研究,嵌入維數(shù)m一般取3~7。本文嵌入維數(shù)m取為3,延遲時(shí)間τ取為1[17]。
PE值的計(jì)算能夠量化序列X(i)的復(fù)雜程度??梢酝ㄟ^比較各模態(tài)熵值的大小來比較它們各自的復(fù)雜程度。PE值能夠有效地反映IMF分量的復(fù)雜程度,這為IMF分量的重構(gòu)和建模簡(jiǎn)化提供了理論依據(jù)[18]。
LSTM神經(jīng)網(wǎng)絡(luò)是一種改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò),它通過巧妙的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì),可以學(xué)習(xí)時(shí)間序列中的長(zhǎng)短期依賴信息,從而在處理時(shí)間序列數(shù)據(jù)時(shí)表現(xiàn)出色。循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,下方的x是輸入層,紫色部分s是隱藏層,O是輸出層。
LSTM結(jié)構(gòu)如圖2所示,記憶單元位于單元的中心,用藍(lán)色圓圈表示。輸入為已知數(shù)據(jù),輸出為預(yù)測(cè)結(jié)果Ot。記憶單元中的三個(gè)門用綠色圓圈表示。此外,單元的狀態(tài)由St表示,每個(gè)門的輸入是預(yù)處理數(shù)據(jù)Xt和記憶單元的先前狀態(tài)St-1。圖2中的紅色是匯合點(diǎn),表示相乘。
圖1 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖2 LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
輸入門:it=σ(W(i)Xt+U(i)St-1)
(15)
遺忘門:ft=σ(W(f)Xt+U(f)St-1)
(16)
輸出門:ot=σ(W(o)Xt+U(o)St-1)
(17)
(18)
最終輸出:
Ot=ot°tanh(St)
(19)
通過不同門的功能,LSTM的長(zhǎng)短時(shí)記憶單元在時(shí)間序列內(nèi)部具備捕獲復(fù)雜相關(guān)特征的能力。這種特性避免了傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)存在的權(quán)重溢出問題,以及梯度消失和梯度爆炸等困擾,從而賦予網(wǎng)絡(luò)更為優(yōu)越的性能[19]。
鵜鶘優(yōu)化算法(pelican optimization algorithm,POA)是一種自然啟發(fā)的優(yōu)化算法,旨在解決工程優(yōu)化問題[20]。相比其他算法,它具有調(diào)整參數(shù)少、收斂速度快、計(jì)算簡(jiǎn)單等優(yōu)點(diǎn)[21]。POA基于鵜鶘捕魚的行為,將搜索空間視為一片湖泊,把要優(yōu)化的適應(yīng)度值視為魚。該算法具有隨機(jī)初始化、局部搜索和自適應(yīng)參數(shù)調(diào)整等特點(diǎn),可用于多個(gè)基準(zhǔn)優(yōu)化問題,并顯示出優(yōu)異的解決方案質(zhì)量和收斂速度[22]。POA的具體步驟如下:
1)初始化
假設(shè)m維空間中有N只鵜鶘,第i只鵜鶘在m維空間中的位置為Xi=(xi,1,xi,2,…,xi,m),N只鵜鶘的位置X表示為:
(20)
式中:Xi代表第i只鵜鶘;xi,m代表第i只鵜鶘在第m個(gè)維度上的位置。
在初始化階段,鵜鶘隨機(jī)分布在一定范圍內(nèi),而鵜鶘的位置更新被描述為:
(21)
式中:jlow,jup是鵜鶘的搜索范圍,分別代表搜索下界和搜索上界;r代表介于(0,1)之間的隨機(jī)數(shù)。
2)搜索階段
在搜索階段,鵜鶘通過在空間中隨機(jī)搜索來尋找潛在的食物來源。獵物的位置隨機(jī)生成,每次迭代期間鵜鶘位置隨之更新:
(22)
式中:xi,j,P1是第i只鵜鶘在探索階段之后,在第j維度的新狀態(tài);pj是第j維度中獵物的位置;Fp是其適應(yīng)度值;I是等于1或者2的隨機(jī)數(shù),參數(shù)I影響POA準(zhǔn)確探測(cè)搜索空間的探索能力。
在鵜鶘搜索階段結(jié)束時(shí),將比較前后兩個(gè)適應(yīng)度值,把鵜鶘位置更新為適應(yīng)度值最小的位置。在此更新過程中,需防止種群移動(dòng)到非最優(yōu)位置。
(23)
式中:Xi,p1表示第i只鵜鶘的最新狀態(tài);Fi,p1是探索階段的適應(yīng)度。
3)定位階段
在這一階段鵜鶘會(huì)定位獵物位置并開始捕獵。這個(gè)過程中的數(shù)學(xué)模型如下:
(24)
式中:xi,j,P2是第i只鵜鶘在定位階段之后,在第j維度的新狀態(tài);R為常數(shù),等于0.2;R(T-t/T)表示種群成員xi,j的鄰域半徑,在每個(gè)成員附近進(jìn)行局部搜索以收斂到更好的解;t是當(dāng)前迭代次數(shù);T是最大迭代次數(shù)。
當(dāng)定位階段結(jié)束后,比較前后的適應(yīng)度值大小,將鵜鶘位置更新為適應(yīng)度值最小的位置。
(25)
經(jīng)過上述搜索階段和定位階段調(diào)整所有種群成員位置后,根據(jù)種群狀態(tài)和適應(yīng)度值,更新最佳的捕食策略。隨后POA進(jìn)入下一迭代,重復(fù)執(zhí)行步驟2)搜索階段和步驟3)定位階段,直到最大迭代次數(shù)。
POA相較于其他優(yōu)化算法有很大優(yōu)勢(shì),但其隨機(jī)初始優(yōu)化種群會(huì)導(dǎo)致鵜鶘個(gè)體的初始解空間分布不均,搜索能力較弱,容易陷入局部最優(yōu)[23]。為增加種群的豐富度和提高尋優(yōu)效率,采用Logistic混沌映射初始化種群及融合反向?qū)W習(xí)和柯西變異策略。改進(jìn)后的IPOA算法流程如圖3所示。
圖3 IPOA算法流程
1)Logistic混沌映射初始化種群
從數(shù)學(xué)形式上看,Logistic映射是一個(gè)相對(duì)簡(jiǎn)單的映射方法。經(jīng)驗(yàn)實(shí)踐表明,它的混沌系統(tǒng)具有良好的安全性。因此,本文選擇使用Logistic映射對(duì)種群中的最優(yōu)個(gè)體進(jìn)行混沌映射,用于生成符合Logistic映射規(guī)律的隨機(jī)數(shù)序列。Logistic映射生成的隨機(jī)數(shù)序列用于初始化搜索個(gè)體的位置。其表達(dá)式如下:
yn(t)=byn(t+1)[1-yn(t-1)]
(26)
式中:yn∈[0,1];t表示迭代次數(shù);b是控制參數(shù),決定了Logistic映射的演變過程,取值范圍是1≤b≤4,一般取4,代表系統(tǒng)處于完全混沌狀態(tài)下。
2)融合柯西變異和反向?qū)W習(xí)策略
反向?qū)W習(xí)的核心目標(biāo)在于以當(dāng)前解為基礎(chǔ),運(yùn)用反向?qū)W習(xí)機(jī)制來搜索相應(yīng)的反向解,并經(jīng)過評(píng)估比較后,保留表現(xiàn)較優(yōu)的解。為了更有效地實(shí)現(xiàn)最優(yōu)解的搜索,將反向?qū)W習(xí)策略融入到POA中,數(shù)學(xué)表征如下:
(27)
(28)
(29)
柯西變異受柯西分布啟發(fā),柯西分布概率密度表達(dá)式為:
(30)
當(dāng)a=1時(shí),稱為標(biāo)準(zhǔn)柯西分布,記作C(0,1)。將標(biāo)準(zhǔn)柯西分布引入算法中,對(duì)目標(biāo)位置進(jìn)行更新,其表達(dá)式為:
Xi,j,t+1=Xbest(t)+C(0,1)*Xbest(t)
(31)
為了提升算法的優(yōu)化效能,引入了一種動(dòng)態(tài)選擇策略來更新目標(biāo)位置。在特定概率下,交替采用反向?qū)W習(xí)策略和柯西變異算子擾動(dòng)策略,從而靈活地更新目標(biāo)位置。至于采取何種策略進(jìn)行目標(biāo)位置更新,由選擇概率Ps決定,其計(jì)算公式為:
(32)
式中:θ為調(diào)整參數(shù),根據(jù)仿真結(jié)果,當(dāng)θ取0.5時(shí),優(yōu)化結(jié)果最好。
具體選擇策略根據(jù)結(jié)果判斷,如果r 雖然上述兩種擾動(dòng)策略可以增強(qiáng)算法脫離局部空間的能力,但經(jīng)過擾動(dòng)變異后,新位置的適應(yīng)度值是否更優(yōu)并不能直接判斷得到結(jié)果。因此,引入貪婪規(guī)則,在擾動(dòng)變異更新之后通過比較新舊位置的適應(yīng)度值來決定是否更新。具體的更新規(guī)則可以表達(dá)為: (33) 1)第一步:首先確定VMD的模型輸入變量K,并對(duì)歷史負(fù)荷數(shù)據(jù)進(jìn)行VMD分解,得到各個(gè)子模態(tài)。 2)第二步:根據(jù)排列熵分析結(jié)果確定最優(yōu)模態(tài)分量數(shù),并將排列熵值相近的模態(tài)進(jìn)行子模態(tài)重組。然后對(duì)重組后的模態(tài)各自進(jìn)行預(yù)測(cè),形成LSTM的輸入樣本集。 3)第三步:采用IPOA算法尋找各子序列LSTM模型最優(yōu)超參數(shù),分別是學(xué)習(xí)率、隱含層神經(jīng)元個(gè)數(shù)、正則化系數(shù)。并將最優(yōu)的LSTM預(yù)測(cè)模型應(yīng)用于各自序列的預(yù)測(cè)中。 4)第四步:最后將各個(gè)子序列的預(yù)測(cè)結(jié)果相加,得到最終預(yù)測(cè)結(jié)果。 建模流程如圖4所示。 圖4 建模流程 在 VMD中,在運(yùn)行之前需要提前設(shè)置好分解的模態(tài)數(shù)K,過多會(huì)引起模式的重疊和附加噪聲,若過少則會(huì)導(dǎo)致模態(tài)分解不完全。因此,設(shè)置正確的K值對(duì)于VMD處理及去噪至關(guān)重要[24]。 為了確定信號(hào)的模態(tài)數(shù)K,可以采用各模態(tài)的中心頻率值。首先將K值的范圍設(shè)置在8~12,然后對(duì)每個(gè)K值進(jìn)行分解,檢查每個(gè)K值對(duì)應(yīng)的各模態(tài)中心頻率是否存在相近的情況。如果存在相近的情況,則說明信號(hào)被過分解。經(jīng)過反復(fù)試驗(yàn),將K值設(shè)為10為宜。 若利用LSTM預(yù)測(cè)模型直接對(duì)每一個(gè)模態(tài)進(jìn)行預(yù)測(cè),會(huì)增加計(jì)算工作量。為縮小計(jì)算規(guī)模,利用排列熵理論對(duì)每一模態(tài)進(jìn)行復(fù)雜度分析,根據(jù)分析得到的排列熵值進(jìn)行合并疊加。為了通過排列熵來量化合并各模態(tài),本文采用以下方式來計(jì)算: (34) 當(dāng)I≤pij時(shí),合并兩個(gè)模態(tài),形成一個(gè)新的子序列,否則就單獨(dú)列為一個(gè)子序列。I為pij兩個(gè)模態(tài)序列的PE值之差。根據(jù)式(34)計(jì)算可以得到新的子序列。 試驗(yàn)在處理器AMD Ryzen7、顯示適配器RTX3060Laptop、內(nèi)存16G、1TB固態(tài)硬盤硬件設(shè)備下完成,采用Windows 11的MATLAB2019b建立預(yù)測(cè)模型。LSTM的種群規(guī)模為30,最大迭代次數(shù)為200。LSTM求解步長(zhǎng)為12,輸出長(zhǎng)度為1,解法器采用Adam梯度下降算法,激活函數(shù)為ReLU,網(wǎng)絡(luò)迭代200次。 本文以華東某地區(qū)地方電網(wǎng)2018年1月1日至9月30日的電力負(fù)荷為數(shù)據(jù)樣本[25]。負(fù)荷數(shù)據(jù)采樣周期為15 min,每天96組數(shù)據(jù),共26 208組數(shù)據(jù)。負(fù)荷曲線如圖5所示。本文將前80%的負(fù)荷數(shù)據(jù)作為模型訓(xùn)練樣本,將后20%的負(fù)荷數(shù)據(jù)作為預(yù)測(cè)模型測(cè)試樣本,并與實(shí)際負(fù)荷對(duì)比。 圖5 原始電力負(fù)荷數(shù)據(jù) 本文采用移動(dòng)平均插值法和移動(dòng)中位數(shù)法填補(bǔ)缺失數(shù)據(jù)。具體方法是:設(shè)定鄰近區(qū)域,用窗口長(zhǎng)度為30的移動(dòng)均值代替缺失樣點(diǎn)的平均值,用移動(dòng)中位數(shù)替換數(shù)據(jù)中的NaN值。這兩種方法適合樣點(diǎn)分布均勻、密集且變化緩慢的情況,主要優(yōu)勢(shì)在于消除隨機(jī)干擾、降低噪聲、計(jì)算簡(jiǎn)便快速。 驗(yàn)證模型優(yōu)劣通常用均方根誤差ERMSE,平均絕對(duì)百分比誤差EMAPE,決定系數(shù)ER2三個(gè)指標(biāo)來衡量,它們能夠有效反映模型預(yù)測(cè)的精度與擬合程度。具體的計(jì)算方式為: (35) (36) (37) 懲罰因子α控制了VMD算法中信號(hào)的頻帶寬度,α越大,則帶寬越寬,反之亦然。根據(jù)相關(guān)文獻(xiàn)的介紹和經(jīng)驗(yàn),本文將懲罰因子α取3 000。VMD的主要參數(shù)設(shè)置見表1。 表1 VMD主要參數(shù)設(shè)置 電力負(fù)荷數(shù)據(jù)進(jìn)行變分模態(tài)分解后,得到的各個(gè)模態(tài)分量如圖 6 所示??梢杂^察到第1階模態(tài)反映了一定的趨勢(shì)變化,而后面 9階模態(tài)則呈現(xiàn)出周期性。通過使用模態(tài)分解,可以挖掘原始負(fù)荷序列中的趨勢(shì)和周期性,并有助于預(yù)測(cè)模型更好地理解數(shù)據(jù)特征,從而降低預(yù)測(cè)難度。 利用排列熵理論對(duì)各個(gè)模態(tài)的復(fù)雜度進(jìn)行分析,并根據(jù)排列熵值將它們合并疊加。這樣就避免了直接用LSTM預(yù)測(cè)模型對(duì)每個(gè)模態(tài)進(jìn)行預(yù)測(cè)而產(chǎn)生的大量計(jì)算量。 從圖7和表2可以直觀看出,模態(tài)7—9的PE值非常接近,可以把這3個(gè)模態(tài)合并疊加,生成一個(gè)新的序列。模態(tài)5則明顯和其余模態(tài)區(qū)別開來,將其單獨(dú)作為一個(gè)序列,新的序列號(hào)見表3。 圖7 各模態(tài)的排列熵 表2 IMF分量的排列熵值 表3 模態(tài)組合后新序列號(hào) 模態(tài)合并如圖8所示。從圖6和圖8的對(duì)比中可以看出,合并前后分量減少了4個(gè),這大大降低后續(xù)建模的計(jì)算量。 圖8 模態(tài)合并 為評(píng)估模型的精確度,將長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)模型、反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BP)模型、支持向量機(jī)回歸(support vector regression,SVR)模型與真實(shí)值曲線進(jìn)行對(duì)比,預(yù)測(cè)結(jié)果評(píng)價(jià)函數(shù)對(duì)比見表4,預(yù)測(cè)效果對(duì)比如圖9所示(每15 min進(jìn)行一次采樣)。從預(yù)測(cè)結(jié)果來看,無論是EMAPE、ERMSE還是ER2,LSTM模型均優(yōu)于BP、SVR預(yù)測(cè)模型。 表4 不同模型預(yù)測(cè)效果比較 圖9 不同模型預(yù)測(cè)效果對(duì)比 在此基礎(chǔ)上,采用經(jīng)VMD-PE處理得到的6個(gè)模態(tài)作為樣本數(shù)據(jù),將訓(xùn)練樣本的前80%作為訓(xùn)練集,后20%作為測(cè)試集,代入LSTM網(wǎng)絡(luò)進(jìn)行訓(xùn)練。利用經(jīng)IPOA優(yōu)化超參數(shù)后的LSTM網(wǎng)絡(luò),為6個(gè)模態(tài)構(gòu)建了基于LSTM的預(yù)測(cè)模型。由表4可知,經(jīng)過變分模態(tài)分解后的LSTM模型精度有所提升。經(jīng)過PE合并后,各項(xiàng)評(píng)價(jià)指標(biāo)精度有較小的提升。在實(shí)際模型訓(xùn)練中,訓(xùn)練時(shí)長(zhǎng)從369.98 s降低至221.99 s,證明通過排列熵組合合并后,在未降低精度的情況下,提高了模型的訓(xùn)練速度。 針對(duì)分解并重組后的每個(gè)模態(tài),本文引入了POA、粒子群優(yōu)化(particle swarm optimization,PSO)、鯨魚優(yōu)化算法(whale optimization algorithm,WOA)、灰狼優(yōu)化器(grey wolf optimizer,GWO),以及改進(jìn)后的IPOA算法來尋找最優(yōu)的LSTM模型超參數(shù),并將最優(yōu)的LSTM預(yù)測(cè)模型應(yīng)用于各自模態(tài)的預(yù)測(cè)中。最后,將各個(gè)模態(tài)的預(yù)測(cè)結(jié)果相加,得到最終的負(fù)荷預(yù)測(cè)結(jié)果,評(píng)價(jià)函數(shù)和預(yù)測(cè)效果分別見表5和如圖10所示,圖10中每15 min進(jìn)行一次采樣。 表5 不同優(yōu)化算法的LSTM模型預(yù)測(cè)效果對(duì)比 圖10 不同優(yōu)化算法的LSTM模型預(yù)測(cè)效果對(duì)比 分析表4、表5和圖9、圖10可以看出,在對(duì)原始序列數(shù)據(jù)不進(jìn)行任何處理的情況下,LSTM模型在處理數(shù)據(jù)的時(shí)候,預(yù)測(cè)的精度高于BP模型和SVR模型。但是采用單一的LSTM模型預(yù)測(cè)時(shí),由于歷史數(shù)據(jù)復(fù)雜程度高、數(shù)據(jù)量較大,預(yù)測(cè)的精度整體偏差。采用VMD-PE-IPOA-LSTM預(yù)測(cè)方法進(jìn)行預(yù)測(cè)后,EMAPE僅為0.865%,ERMSE僅為33.833 kW,ER2也是最接近1的,達(dá)到了0.980。整體來看,本文提出的預(yù)測(cè)方法,其ERMSE和EMAPE都低于其他對(duì)比預(yù)測(cè)方法,預(yù)測(cè)精度更高,并且基本還原了真實(shí)電力負(fù)荷曲線的變化趨勢(shì)。由此可以說明,本文采取的預(yù)測(cè)模型具有良好的預(yù)測(cè)效果和性能。 為了進(jìn)一步驗(yàn)證本文所提方法的有效性和普適性,追加福建某地區(qū)的最大用電負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測(cè)。以福建某地區(qū)地方電網(wǎng)2016年1月1日至12月31日的電力負(fù)荷為數(shù)據(jù)樣本。負(fù)荷數(shù)據(jù)采樣周期為15 min,每天96組數(shù)據(jù),共35 136組數(shù)據(jù)。將前80%的負(fù)荷數(shù)據(jù)作為模型訓(xùn)練樣本,將后20%的負(fù)荷數(shù)據(jù)作為預(yù)測(cè)模型測(cè)試樣本,并與實(shí)際負(fù)荷對(duì)比。 根據(jù)2.1節(jié)和2.2節(jié)方法,得到VMD的最優(yōu)模態(tài)分解個(gè)數(shù)為8個(gè),合并重組得到4個(gè)子模態(tài)。五種不同模型和不同優(yōu)化算法的的預(yù)測(cè)誤差對(duì)比見表6和表7。 表6 不同模型預(yù)測(cè)效果比較 表7 不同優(yōu)化算法的LSTM模型預(yù)測(cè)效果對(duì)比 由表6可以看出,相較于LSTM、BP、SVR這三種單一預(yù)測(cè)模型,經(jīng)過VMD-PE處理的LSTM模型仍然在精度和擬合度方面更優(yōu)。通過分析表7可以發(fā)現(xiàn),在上述基礎(chǔ)上,使用優(yōu)化算法后的模型性能得到了明顯地提升,其中IPOA的提升效果最為突出,相較于VMD-PE-LSTM模型,EMAPE提升了59.16%,ERMSE提升了25.12%,ER2也更接近1,預(yù)測(cè)效果更好。 綜合表4—7的信息可以得出,本文所提出的預(yù)測(cè)模型在不同類型數(shù)據(jù)下的預(yù)測(cè)誤差均優(yōu)于其余幾種預(yù)測(cè)模型,能夠滿足電力負(fù)荷短期預(yù)測(cè)的精度要求,具有普適性。 本文提出了一種基于VMD-PE-IPOA-LSTM的短期負(fù)荷預(yù)測(cè)模型,提高了短期負(fù)荷預(yù)測(cè)精度,并通過試驗(yàn)得到以下結(jié)論: 1)通過引入變分模態(tài)分解算法,將負(fù)荷數(shù)據(jù)分解為若干個(gè)復(fù)雜程度較低的模態(tài);通過計(jì)算模態(tài)分解排列熵的方法,將原模態(tài)進(jìn)行合并重組,挖掘出更多的負(fù)荷數(shù)據(jù)信息,降低預(yù)測(cè)難度,并對(duì)每個(gè)模態(tài)建立預(yù)測(cè)模型。各項(xiàng)評(píng)價(jià)函數(shù)表明,該方法提高了模型的整體預(yù)測(cè)精度。 2)在標(biāo)準(zhǔn)鵜鶘優(yōu)化算法的基礎(chǔ)上引入了Logistic混沌映射、融合柯西變異和反向?qū)W習(xí)這兩種策略進(jìn)行改進(jìn)。結(jié)果表明,改進(jìn)策略有效提升了模型的預(yù)測(cè)精度,驗(yàn)證了本文預(yù)測(cè)方法的可靠性。 文中所提出的IPOA-LSTM模型有效提高了負(fù)荷預(yù)測(cè)的精度,未來可以考慮更多的輸入特征,例如溫度、濕度、風(fēng)速等,進(jìn)一步提高模型的準(zhǔn)確性。2 建立模型
2.1 模態(tài)分解個(gè)數(shù)確定
2.2 模態(tài)合并
3 實(shí)例分析
3.1 仿真環(huán)境
3.2 數(shù)據(jù)來源
3.3 數(shù)據(jù)預(yù)處理
3.4 評(píng)價(jià)指標(biāo)
3.5 模態(tài)分解與合并
3.6 VMD-PE-IPOA-LSTM預(yù)測(cè)模型性能評(píng)價(jià)
3.7 VMD-PE-IPOA-LSTM模型在其他數(shù)據(jù)樣 本中的應(yīng)用
4 結(jié)論