張弘鵬,劉家慶,郭希海,孫 羽,徐 崢
(國家電網(wǎng)有限公司 東北分部,沈陽 110180)
利用清潔能源發(fā)電是未來的趨勢,而光伏發(fā)電是新能源的一種重要方式。但光伏發(fā)電方式的光功率受日照強度、溫度等諸多因素影響,故發(fā)電量會隨時間有較大的波動。而設(shè)備產(chǎn)生的電能直接被并入電網(wǎng),這樣勢必會給電網(wǎng)調(diào)峰和調(diào)度帶來巨大壓力。因此,正確地預(yù)測光伏發(fā)電系統(tǒng)在某個時間段內(nèi)光功率變化情況,對電網(wǎng)的穩(wěn)定運行具有重要意義,也受到學術(shù)界和產(chǎn)業(yè)界的廣泛關(guān)注[1]。
現(xiàn)有的光功率預(yù)測方法大致可以分為統(tǒng)計分析方法和人工智能方法2類。其中,基于套索算法[2]、基于統(tǒng)計升尺度[3]和基于整合移動平均自回歸模型[4-5]的系列方法都屬于統(tǒng)計分析方法。此類方法中模型較為簡單,不能適應(yīng)氣象數(shù)據(jù)的隨機變化,故其總體預(yù)測能力較差。人工智能方法主要基于各種神經(jīng)網(wǎng)絡(luò)、支持向量機、馬爾可夫模型等,也有研究人員利用集成學習和信息融合的思想來解決問題[6-8]。目前,基于神經(jīng)網(wǎng)絡(luò)的方法是此問題領(lǐng)域最常見的解決方法,這是因為神經(jīng)網(wǎng)絡(luò)具有擬合未知的復(fù)雜函數(shù)關(guān)系的能力,善于處理分類與預(yù)測問題。求解未來的光功率問題既是一個預(yù)測問題,又可以轉(zhuǎn)化為對發(fā)電量等級進行預(yù)測的分類問題,故神經(jīng)網(wǎng)絡(luò)非常適用于此領(lǐng)域?,F(xiàn)有神經(jīng)網(wǎng)絡(luò)中反向傳播神經(jīng)網(wǎng)絡(luò)[9-10](BPNN, back propagation neural networks)、長短期記憶網(wǎng)絡(luò)(LSTM, long short term memory)[11-12]、自組織神經(jīng)網(wǎng)絡(luò)[13]、徑向基神經(jīng)網(wǎng)絡(luò)[14]、模糊神經(jīng)網(wǎng)絡(luò)[15],以及極限學習機等類神經(jīng)網(wǎng)絡(luò)方法都被應(yīng)用到了光伏發(fā)電量預(yù)測問題中,并取得良好的效果。例如,白會杰[16]與田義[17]將一些人工智能基礎(chǔ)模型用于光伏發(fā)電量預(yù)測,經(jīng)過實驗對比發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)的判別能力高于傳統(tǒng)統(tǒng)計學的ARIMA模型、決策回歸樹、支持向量回歸算法及梯度提升樹?;诖耍芯咳藛T也提出了許多對基礎(chǔ)神經(jīng)網(wǎng)絡(luò)進行優(yōu)化或改進的新方法[18-21],來預(yù)測復(fù)雜環(huán)境下的光伏發(fā)電量。
在現(xiàn)有的基于神經(jīng)網(wǎng)絡(luò)的光伏發(fā)電預(yù)測方法中,BPNN和LSTM是2種常用模型。這是因為BPNN是最具普適性的神經(jīng)網(wǎng)絡(luò),可以擬合各種類型、各種特征的數(shù)據(jù)[22]。LSTM則適用于處理序列數(shù)據(jù),尤其是時間序列數(shù)據(jù),它更能關(guān)注樣本數(shù)據(jù)在時間維度上所具有的特征,可以應(yīng)對實際時序數(shù)據(jù)分類問題中,各種因素在實際發(fā)揮作用時的遲滯性問題與影響累積性問題[23]。光伏設(shè)備所采集的環(huán)境數(shù)據(jù)恰是時間序列數(shù)據(jù),所以LSTM和BPNN能夠取得更好的預(yù)測結(jié)果。
然而以上方法都是從單個視角出發(fā),或是注重全局擬合,或是僅關(guān)注時序特征,未能同時發(fā)揮各種神經(jīng)網(wǎng)絡(luò)的優(yōu)勢,使預(yù)測模型受采集數(shù)據(jù)的變化影響較大,導致預(yù)測結(jié)果精度較低、穩(wěn)定性較差?;诖?,文中提出了一種基于雙深度神經(jīng)網(wǎng)絡(luò)的光功率預(yù)測方法,利用長短期記憶網(wǎng)絡(luò)LSTM與前饋神經(jīng)網(wǎng)絡(luò)BPNN的各自優(yōu)勢學習光伏發(fā)電時序數(shù)據(jù),并通過遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)待定結(jié)構(gòu)參數(shù),最大化模型整體目標函數(shù)精度來搜索最優(yōu)解,得到更加準確和魯棒的預(yù)測結(jié)果。
文中算法以BPNN和LSTM為基礎(chǔ)判別器,通過遺傳算法將二者融合為更高精度的雙深度神經(jīng)網(wǎng)絡(luò)光功率預(yù)測方法。本節(jié)對文中用到的BPNN、LSTM和遺傳算法等基礎(chǔ)知識進行簡單介紹。
BPNN為使用反向傳播算法的人工神經(jīng)網(wǎng)絡(luò)[22],其中每個計算單元可以抽象為一個非線性函數(shù),對傳來的數(shù)據(jù)進行如式(1)的處理,該表達式以數(shù)學形式還原了人腦中神經(jīng)元間化學信號轉(zhuǎn)換為神經(jīng)元上電信號的類似激活過程。
z(l)=W(l)·a(l-1)+b(l),
a(l)=fl(z(l)),
(1)
式中:上標和下標l表示該神經(jīng)元所處的層;a(l)表示神經(jīng)元的輸出;W(l)表示網(wǎng)絡(luò)權(quán)重;b(l)為對應(yīng)偏置向量;fl(·) 表示使用的激活函數(shù),常用的激活函數(shù)有非線性修正單元(RELU,rectified linear unit)、擠壓函數(shù)(sigmoid型)等。
要訓練BPNN神經(jīng)網(wǎng)絡(luò)使其能夠?qū)W習數(shù)據(jù)的規(guī)律,就要為其設(shè)置一個損失函數(shù),用來衡量神經(jīng)網(wǎng)絡(luò)輸出值與目標輸出值(標簽)之間的差距。通過使用反向傳播的梯度下降法,不斷地修正神經(jīng)網(wǎng)絡(luò)中各計算單元的可調(diào)參數(shù)W、b,可以使損失函數(shù)達到極小化。此時,模型輸出值已達到最接近目標輸出值的狀態(tài)。模型訓練完畢,可以用來對其他數(shù)據(jù)進行預(yù)測或分類。
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN, recurrent neural network)是一種具有一定記憶能力的人工神經(jīng)網(wǎng)絡(luò)[23]。在RNN中某一時刻t隱藏層與其上一時刻t-1的隱藏層間存在反饋連接,此連接將上一時間段內(nèi)的信息——外部狀態(tài)ht-1傳入當前時刻,來實現(xiàn)記憶功能。在RNN中,每個計算單元可以用如下函數(shù)表達:
zt=Uht-1+Wxt+b,
ht=fl(zt),
(2)
式中:zt表示t時刻隱藏層的凈輸入值;ht為隱藏層狀態(tài)值;U是狀態(tài)權(quán)重矩陣。每一時刻網(wǎng)絡(luò)的凈輸入不僅與當前的樣本數(shù)據(jù)有關(guān),也與上一時刻隱藏層的信息輸入有關(guān)。
長短期記憶網(wǎng)絡(luò)(LSTM)是RNN最常用的變體形式,它引入了門機制,可以解決標準RNN模型在樣本數(shù)據(jù)過多時所產(chǎn)生的一些問題。每個LSTM計算單元中包含3個控制信息流量的“門”,分別為輸入門it, 遺忘門ft和輸出門ot,每種門在(0,1)之間取值。LSTM還引入了內(nèi)部狀態(tài)ct,它專門用于隱藏層間循環(huán)信息傳遞,同時也輸出信息給隱藏層的外部狀態(tài)。內(nèi)部狀態(tài)與外部狀態(tài)共同影響下一時刻。其單元結(jié)構(gòu)如圖1所示。
圖1 長短期記憶網(wǎng)絡(luò)(LSTM)的單元結(jié)構(gòu)Fig. 1 Unit structure of long short-term memory network (LSTM)
遺傳算法[24]源自生物學領(lǐng)域“適者生存”的思想,它模擬生物種群在繁衍時基因的隨機自由組合以及DNA交叉、突變、異位等變異過程,常被用于參數(shù)選擇、組合優(yōu)化、規(guī)劃設(shè)計等問題。遺傳算法對要進行優(yōu)化的參數(shù)進行編碼,編碼串可視為基因,經(jīng)過個體間每代繁衍過程的基因隨機組合和變異,會得到眾多新的參數(shù)取值及參數(shù)組合形式。這些參數(shù)在適應(yīng)函數(shù)(即優(yōu)化的目標函數(shù))下的值,就是該個體的適應(yīng)度。每代僅保留一定數(shù)量的優(yōu)秀個體,適應(yīng)度較高的個體有更大的概率被保留,這樣可以保證在優(yōu)秀解的基礎(chǔ)上逐步向最優(yōu)解靠近。
遺傳算法的本質(zhì)是在給定的參數(shù)取值范圍內(nèi)進行非線性地、隨機地搜索,找到使目標函數(shù)達到最優(yōu)的一組解??蓪⑵溆糜趯ふ椅闹心P腿诤系淖罴驯壤禂?shù)。
不同來源的光伏發(fā)電的數(shù)據(jù)雖在采集屬性、頻次和參數(shù)單位等方面等存在差異,但都是標準的時間序列數(shù)據(jù)。LSTM具有記憶功能,可以探尋相鄰的序列沿時間維度的特征,而BPNN從數(shù)據(jù)整體出發(fā)去擬合樣本的真實分布,從而能夠做出正確判別。LSTM和BPNN的特點決定了其擅于處理時間序列問題,2種網(wǎng)絡(luò)各有側(cè)重,將二者的決策進行有效融合能達到優(yōu)勢互補的作用,進而可以得到具有更高判別能力的魯棒模型。因此,融合BPNN和LSTM的特點,文中提出了基于雙深度神經(jīng)網(wǎng)絡(luò)的光功率預(yù)測方法,如圖2所示。首先,對采集到的光功率數(shù)據(jù)進行預(yù)處理,使其滿足BPNN和LSTM 2個深度神經(jīng)網(wǎng)絡(luò);然后,訓練、優(yōu)化BPNN和LSTM 2個深度神經(jīng)網(wǎng)絡(luò),分別預(yù)測光功率數(shù)據(jù)結(jié)果;最后,利用遺傳算法優(yōu)化2個深度神經(jīng)網(wǎng)絡(luò)的融合系數(shù),得到更加準確的光功率預(yù)測結(jié)果。具體過程如圖2所示。
圖2 雙深度神經(jīng)網(wǎng)絡(luò)融合算法結(jié)構(gòu)圖Fig. 2 Schematic diagram of double deep neural network fusion algorithm
BPNN可以擬合各種類型、各種特征的數(shù)據(jù),因此可以用其擬合預(yù)測光伏發(fā)電序列數(shù)據(jù)。在本模型使用的BPNN結(jié)構(gòu)中,使用交叉熵損失函數(shù)與梯度下降法優(yōu)化更新網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù),完成光功率序列數(shù)據(jù)的預(yù)測,具體函數(shù)求解過程如下:
首先,定義交叉熵損失函數(shù)定義:
(3)
然后,利用梯度下降法計算各層梯度:
(4)
在反向傳播過程中,對各層參數(shù)進行更新:
(5)
最后,利用優(yōu)化更新好的BPNN神經(jīng)網(wǎng)絡(luò)預(yù)測光功率數(shù)據(jù)值。
LSTM是一種典型的適用于處理序列數(shù)據(jù)尤其是時間序列數(shù)據(jù)的模型,可以應(yīng)對時序數(shù)據(jù)分類問題中,各種因素在實際發(fā)揮作用時的遲滯性與影響累積性問題。光伏設(shè)備所采集的環(huán)境數(shù)據(jù)恰是時間序列數(shù)據(jù),因此可以通過優(yōu)化更新LSTM預(yù)測光功率數(shù)據(jù)值。同BPNN神經(jīng)網(wǎng)絡(luò)一樣,循環(huán)神經(jīng)網(wǎng)絡(luò)也使用反向傳播學習方法——隨時間反向傳播算法,優(yōu)化更新整個深度預(yù)測網(wǎng)絡(luò)。在具體優(yōu)化更新過程中,主要計算3種門(遺忘門ft、輸入門it、輸出門ot)、節(jié)點狀態(tài)及激活值,為
ft=σ(Wfχ(t-1)+Ufht+bf),
(6)
it=σ(Wiχ(t-1)+Uiwt+bi),
(7)
at=tan h(Waχ(t-1)+Uawt+ba),
(8)
Ct=C(t-1)⊙ft+it⊙at,
(9)
ot=σ(Woχ(t-1)+Uowt+bo),
(10)
ht=ot⊙tanh(Ct),
(11)
式中:權(quán)重W*、U*為各門處的權(quán)重b*為偏置;⊙表示向量元素乘。最后利用優(yōu)化好的LSTM預(yù)測光功率數(shù)值。
尋找融合的比例參數(shù)問題本質(zhì)上是一種目標優(yōu)化問題,利用遺傳算法的搜索功能,可以找到使兩者融合效果達到最佳的比例參數(shù)。用遺傳算法尋找最佳融合系數(shù),每代個體的適應(yīng)度應(yīng)為融合后的多模態(tài)模型所具有的判別精度。適應(yīng)度函數(shù)為
f(?1,?2)=a(g(X)) ,
(12)
式中:a(·)是正確率統(tǒng)計函數(shù);g(X)為多模態(tài)模型給出的對數(shù)據(jù)集X中每個樣本所屬等級的判斷,定義為
g(X|?1,?2)=?1·B(X)+?2·R(X),
(13)
式中:B(X)是BPNN對輸入X的判別結(jié)果;R(X)是RNN對輸入X的判別結(jié)果。
在得到遺傳算法的雙深度網(wǎng)絡(luò)融合優(yōu)化結(jié)果后,即可得到文中提出模型的最終預(yù)測值。由于遺傳算法是在解空間內(nèi)進行隨機的搜索,每次將獲得的不同的最優(yōu)解,所以遺傳算法的缺點是帶有一定的不可重復(fù)性。對于文中光功率預(yù)測問題,由于融合結(jié)果對融合系數(shù)即遺傳算法的待優(yōu)化參數(shù)相對不敏感,所以遺傳算法的缺點很難體現(xiàn)出來。加之,構(gòu)成此算法的基礎(chǔ)單模態(tài)模型都是由具有容錯能力的神經(jīng)網(wǎng)絡(luò)來實現(xiàn)的,所以文中算法具有一定的魯棒性。算法詳細操作過程如表1所示。
表1 雙深度網(wǎng)絡(luò)融合算法
針對文中提出的基于雙深度神經(jīng)網(wǎng)絡(luò)的光功率預(yù)測方法進行實驗分析,在具體的實驗中選用東北電網(wǎng)的光伏發(fā)電歷史數(shù)據(jù),包括東北電網(wǎng)全網(wǎng)、遼寧電網(wǎng)、吉林電網(wǎng)、黑龍江電網(wǎng)和蒙東地區(qū)電網(wǎng),進行BPNN和LSTM2個深度網(wǎng)絡(luò)的融合預(yù)測模型分析,并通過預(yù)測正確率指標驗證文中提出融合模型和各單深度網(wǎng)絡(luò)模型(BPNN和LSTM)的精度。以下將對實驗數(shù)據(jù)選取和預(yù)處理,以及實驗過程調(diào)試和實驗結(jié)果分析進行詳細介紹。
實驗數(shù)據(jù)來自東北電網(wǎng)電力研究所:包含東北電網(wǎng)全網(wǎng)、遼寧電網(wǎng)、吉林電網(wǎng)、黑龍江電網(wǎng)和蒙東地區(qū)電網(wǎng)的光伏發(fā)電歷史數(shù)據(jù)。每個地區(qū)的數(shù)據(jù)包含輻照度、風速、實發(fā)電量等實時采用數(shù)據(jù)。數(shù)據(jù)的采用間隔為15 min,采樣時間范圍為2019年1月1日~11月3日。此外,由于光伏發(fā)電情況受溫度等環(huán)境因素影響,在實驗中從網(wǎng)絡(luò)上獲取了上述地區(qū)在該段時間的歷史天氣情況,使用每天的最高氣溫和最低氣溫作為實驗數(shù)據(jù)的附加指標。
將上述的輻照度、風速、實發(fā)電量采樣數(shù)據(jù),每4個為一組取平均值,獲得每小時的時均參數(shù),得到每天24小時的數(shù)據(jù)。將獲取的每天最高最低氣溫,插值到24個小時。認為最高溫度出現(xiàn)在12時,最低溫度出現(xiàn)在0時。
在實發(fā)電量的最高值和最低值間取2個閾值,將實發(fā)電量劃分為高、中、低三個等級,此實際應(yīng)用問題轉(zhuǎn)化為了三分類問題。借鑒“相似日”思想[18],實際發(fā)電量可以反映當前很多不可測量因素對發(fā)電能力及發(fā)電設(shè)備效率的綜合影響,所以對每條數(shù)據(jù)來說,其上一時段的實發(fā)電量也是有價值的數(shù)據(jù),可將其作為本時刻的一維屬性。
綜上,數(shù)據(jù)集共有307×24=7 368條數(shù)據(jù),每條時間序列共有4條屬性和1個標簽,屬性即輻照度、風速、溫度、上一時間段內(nèi)實發(fā)電量。將數(shù)據(jù)劃分為測試集和訓練集,供實驗使用,具體如表2所示。
表2 數(shù)據(jù)集描述
按照文中提出算法的步驟進行實驗,分別將2個基礎(chǔ)神經(jīng)網(wǎng)絡(luò)模型BPNN和LSTN訓練優(yōu)化至最佳狀態(tài)。此時,2種神經(jīng)網(wǎng)絡(luò)的主要參數(shù)如表3所示。
表3 BPNN和LSTM在最佳狀態(tài)下的參數(shù)
當2個深度神經(jīng)網(wǎng)絡(luò)調(diào)整至最優(yōu)時,利用遺傳算法優(yōu)化選擇2個深度網(wǎng)絡(luò)的融合權(quán)重,得到最后權(quán)重后,可以獲取最優(yōu)的雙深度神經(jīng)網(wǎng)絡(luò)融合預(yù)測結(jié)果。在用遺傳算法優(yōu)化2種深度模型的融合加權(quán)系數(shù)過程中,為了更好地完成隨機搜索,將用于融合的待優(yōu)化參數(shù)由2個分裂為4個,賦予其不同的參數(shù)范圍限制。在實驗中對優(yōu)化參數(shù)在設(shè)定范圍內(nèi)進行隨機初始化,并對遺傳算法進行20代繁衍,得到加權(quán)系數(shù)的最優(yōu)解。
表4和圖3展示了BPNN和 LSTM 2種深度網(wǎng)絡(luò)分別在各測試集的判別精度和2種深度網(wǎng)絡(luò)在遺傳算法作用下的融合判別精度,以及遺傳算法給出的2個深度網(wǎng)絡(luò)的歸一化融合系數(shù)。
表4 實驗比較結(jié)果
圖3 各算法比較結(jié)果Fig. 3 Comparison results of different methods
從圖3可以看出,對于東北、吉林、黑龍江和蒙東電網(wǎng)等大多數(shù)數(shù)據(jù)集,2種基本的神經(jīng)網(wǎng)絡(luò)判別能力相近,融合后的模型正確率高于任一種單視圖判別模型。當2種基本模型的判別能力相差較大時,如遼寧電網(wǎng)數(shù)據(jù)集,BPNN和LSTM的正確率相差達9%,此時融合后的結(jié)果也不會比單視圖模型中的最大精度值低。由此雙神經(jīng)網(wǎng)絡(luò)模型可以將正確率穩(wěn)定在單神經(jīng)網(wǎng)絡(luò)的最佳狀態(tài)。
如表4所示,通過遺傳算法求解的模態(tài)網(wǎng)絡(luò)參數(shù)在不同數(shù)據(jù)集上表現(xiàn)有所不同,致使不同深度網(wǎng)絡(luò)在不同數(shù)據(jù)集結(jié)果預(yù)測上起到的作用也不盡相同。例如,在東北全網(wǎng)數(shù)據(jù)集上BPNN網(wǎng)絡(luò)在融合預(yù)測結(jié)果中起到了較大作用,占到0.656的比重,而在遼寧電網(wǎng)數(shù)據(jù)集上,BPNN網(wǎng)絡(luò)的比重只占到0.33。這說明,面對不同電網(wǎng)數(shù)據(jù)集時,由于數(shù)據(jù)特點的不同,深度神經(jīng)網(wǎng)絡(luò)的選擇對預(yù)測結(jié)果影響巨大,如果預(yù)測網(wǎng)絡(luò)選擇不當將嚴重影響預(yù)測結(jié)果的精度。例如,如果在遼寧電網(wǎng)數(shù)據(jù)集上,只是用BPNN網(wǎng)絡(luò)進行預(yù)測,得到結(jié)果的正確率僅為80.05%;而選擇融合網(wǎng)絡(luò)對數(shù)據(jù)進行預(yù)測,結(jié)果精度可以達到89.01%。即使單神經(jīng)網(wǎng)絡(luò)選擇相對合理時能夠得到相對較高的預(yù)測精度,如東北全網(wǎng)、吉林、黑龍江、蒙東電網(wǎng)等單網(wǎng)絡(luò)預(yù)測結(jié)果,但數(shù)據(jù)中也可能存在部分數(shù)據(jù)不適用于選擇的網(wǎng)絡(luò),因此選擇雙網(wǎng)融合預(yù)測能夠得到更加有效和魯棒的預(yù)測結(jié)果,例如,使用雙網(wǎng)融合得到的結(jié)果全部優(yōu)于單網(wǎng)預(yù)測結(jié)果(如表4最后一列所示)。
綜上,文中提出的基于雙深度神經(jīng)網(wǎng)絡(luò)的光功率預(yù)測方法能夠有效融合2個深度網(wǎng)絡(luò)的優(yōu)點,使其適應(yīng)于不同數(shù)據(jù)集,得到更加有效和穩(wěn)定的數(shù)據(jù)預(yù)測結(jié)果。
文章針對由氣象因素和歷史發(fā)電數(shù)據(jù)預(yù)測光伏發(fā)電光功率存在的問題,提出了基于BPNN和LSTM的雙深度神經(jīng)網(wǎng)絡(luò)融合模型,該模型結(jié)合了兩者在時序數(shù)據(jù)處理上的數(shù)據(jù)擬合與特征學習的能力,可以獲得較高的光功率預(yù)測精度和穩(wěn)定的預(yù)測結(jié)果。在東北電網(wǎng)實際數(shù)據(jù)集上的實驗結(jié)果表明,文中提出的模型能夠充分融合2種深度網(wǎng)絡(luò)的特點,其判別能力強于單一深度網(wǎng)絡(luò)模型,且具有一定的魯棒性。