王鵬翔,沈 娟,王菁旸,林重馳
(1.三峽大學電氣與新能源學院,湖北宜昌 443002;2.三峽大學土木與建筑學院,湖北宜昌 443002)
目前,傳統(tǒng)化石能源日益增長的需求對環(huán)境造成較大危害,綠色環(huán)保的可再生能源越來越受到重視。在雙碳目標下太陽能作為國內外能源領域應用廣泛、技術成熟的新能源之一,如何對其進行高效利用成為研究熱點。太陽能利用中的光伏發(fā)電由于其簡單、直接等優(yōu)點成為主流應用形式,但其易受光照、溫度等環(huán)境因素的影響,出力具有隨機性和間歇性。光伏發(fā)電出力的隨機波動性使得其大規(guī)模并入電網會對電力系統(tǒng)的穩(wěn)定運行造成負面影響[1-2]。對光伏發(fā)電出力進行準確預測,可減弱其并入電網的波動性,有利于電網對新能源發(fā)電的調度,有利于電力系統(tǒng)的安全穩(wěn)定運行。
國內外學者對于光伏預測的預測方法主要分為統(tǒng)計模型法和物理模型法。物理模型法是對光伏發(fā)電的實時云層圖像以及太陽能轉換為電能的物理過程進行精確的計算,通過精準的計算從而得出預測值[3]統(tǒng)計模型法是通過對光伏電站的歷史出力數據以及天氣歷史數據進行分析、處理。再通過神經網絡[4-6],極限學習機[7-9],支持向量機[10-12]等自適應學習算法對光伏發(fā)電功率進行預測。文獻[13]提出了通過變分模態(tài)分解(Variational Mode Decomposition,VMD)算法降低數據的非平穩(wěn)性,再結合稀疏高斯混合過程專家模型(Mixture of Sparse Gaussian Process experts model,MSGP)及深度回聲狀態(tài)網絡(Deep Echo State Network,DESN)建立光伏發(fā)電短期預測模型,采用VMD 算法對數據的預處理提高了預測精度。文獻[14-15]分別采用了不同的算法對BP 神經網絡(Back Propagation Neural Network,BP)進行優(yōu)化,與單純的BP 神經網絡相比,提高了收斂速度及預測精度。文獻[16]提出構建基于天氣分類和改進BP 神經網絡的光伏發(fā)電功率預測模型,通過對天氣類型的分類,在一定程度上提高了預測精度。
本文在現有的研究基礎上,提出一種基于主成分分析(Principal Component Analysis,PCA)和局部均值分解(Local Mean Decomposition,LMD)鯨魚優(yōu)化算法優(yōu)化后的極限學習機光伏功率短期預測模型。首先通過主成分分析法,篩選出與光伏發(fā)電功率相關性高的天氣因素。再利用局部均值分解算法,將選取出來的天氣因素及光伏發(fā)電功率序列進行分解,得到一系列具有不同特征的分量,然后將各分量通過鯨魚優(yōu)化算法優(yōu)化的極限學習機進行預測,各分量所得到的的預測結果進行疊加,其和即為最終預測結果。將本文預測方法與傳統(tǒng)的極限學習機(Extreme Learning Machine,ELM),鯨魚優(yōu)化算法(Whale Optimization Algorithm,WOA)優(yōu)化后的ELM 模型進行對比分析,仿真結果證明,本文所提方法具有更高的預測精度。
ELM[17]相比于傳統(tǒng)BP 神經網絡、支持向量機等,算法結構更簡單。通過對ELM 輸入權重和隱含層數進行設置,隨機產生權重和閾值初值,然后利用最小二乘法獲得最優(yōu)權重值及閾值。ELM 算法學習速度更快,且對非平穩(wěn)信號的處理性能更強,其算法結構如圖1 所示。
圖1 ELM算法結構圖Fig.1 ELM algorithm structure
圖1 中,ELM 模型含輸入層、隱含層和輸出層:輸入變量為N個,即N組不同的樣本訓練數據x j,j=1,…,N通過隱含層設置函數g(ai,bi,xj),i=1,2,…,T將樣本數據映射至輸出層矩陣Z。模型表達式如下[3]:
式中:H為極限學習機的隱含層輸出矩陣;Z為極限學習機的輸出矩陣;β為極限學習機隱含層與輸出層之間權值的矩陣;ai為輸入層所有節(jié)點與隱含層第i個節(jié)點間對應權值的矩陣;bi為第i個隱含層節(jié)點的閾值。
在隱含層輸出矩陣H中,由最小二乘法計算出最優(yōu)的權值為
式中:H+為矩陣H的廣義逆矩陣。
鯨魚算法通過模仿座頭鯨搜索獵物行為而建立的一種優(yōu)化算法,分為逐漸搜索和隨機搜索[18-19]。逐漸搜索行為模型表達式為:
隨機搜索行為模型表達式為:
式中:D為座頭鯨到獵物處的距離;A和C為隨機系數;X*(t)和X(t+1) 分別為當前最佳位置與下一迭代后最佳位置;t為當前迭代位置;Xrand為隨機位置。
結合WOA 算法,可解決ELM 模型在樣本訓練中由于隨機選取閾值和權值而導致輸出結果相差較大的問題。通過WOA 算法尋找出閾值和權值,可增加ELM 模型用于預測時的精準度及平穩(wěn)性。結合WOA 算法的ELM 模型流程圖如圖2 所示。
圖2 鯨魚優(yōu)化算法的ELM原理圖Fig.2 ELM schematic diagram of whale optimization algorithm
PCA 是一種降維的統(tǒng)計方法,它將眾多具有一定相關性的數據,重新組合為一組表明各數據間相關性關系的指標[20-21]。而在光伏發(fā)電的原始數據中包括了光照輻射度,器件溫度,天氣溫度,光伏發(fā)電功率多個影響因素。各影響因素間存在一定的相關性,通過PCA 對各影響因素進行篩選降維,降低相關性較低的因素對光伏功率預測精準度的影響。表1 為各類天氣因素與光伏發(fā)電功率的相關系數。
表1 光伏功率與天氣因素的相關系數Table 1 Correlation coefficient between photovoltaic power and weather factors
主成分分析法的計算原理如下:
有m個數據序列進行主成分分析:x1,x2,…,xm,有n個評價對象,第i個評價對象的第j個指標為xij。
首先對原始數據進行標準化,得到標準矩陣X?,然后計算相關系數矩陣R,然后將特征值λ與特征向量e由特征方程|λI-R|=0 解得。根據式(7)計算各特征值貢獻率,選取貢獻率高的特征值所對應的特征向量組成矩陣。
最后將原始數據矩陣換至m個特征向量的空間中。
式中:emp為原相關矩陣第m個特征值對應的p維特征向量;ym為第m個分量。
將光伏歷史數據選取部分作為原始數據序列,由光照輻射度、器件溫度、天氣溫度、氣壓、相對濕度和光伏功率共同組成,對部分數據進行主成分分析,得到表1 中相關系數及表2 的各成分貢獻率。
表2 主成分特征值及貢獻率Table 2 Principal component eigenvalues and contribution rate
由表1、表2 可看出,光照輻射度與光伏功率的相關性最大,且成正相關性,天氣溫度和光伏功率的相關性也呈正相關,且相關性較高。器件溫度與相對濕度和光伏功率的相關性較低,氣壓與光伏功率為負相關且相關性較低。因此,選取光照輻射度與天氣溫度作為預測模型的輸入。
由于天氣具有隨機性、間歇性的特點,導致光伏發(fā)電功率也受到影響。而非平穩(wěn)的信號會對光伏發(fā)電預測結果產生較大影響。LMD 可以將非平穩(wěn)的信號分解為一系列具有不同特征的乘積函數(Product Function,PF)分量,在最大程度上避免由于天氣的隨機性和間歇性帶來的影響[22-24]。分解步驟如下:(1)將原始信號x(t)中極值點ni全部找出來,計算極值點ni和ni+1的均值mi和包絡值ai;(2)將所有的局部均值mi和包絡值ai在對應時刻進行延伸,將延伸線用平滑線連接起來,由此計算出局部均值函數m11(t)以及包絡函數a11(t);(3)原始信號x(t)中分離m11(t),得到h11(t),用a11(t)對h11(t)進行解調,計算得到s11(t);(4)s11(t)求包絡函數a12(t),若a12(t)為1,則s11(t)是純調頻函數,迭代結束,否則將s11(t)視為原始信號,重復上述步驟繼續(xù)迭代,直到s1n(t)為純調頻函數止;(5)將上述步驟中得到的所有包絡值相乘得到包絡信號a1(t),將a1(t)與s1n(t)相乘即得原始信號的第一個PF 分量,即:
將第一個分量PF 從原始信號中分離出來:
將剩余信號u1(t)視作原始信號,重復步驟(1)—(5),直到uk(t)是單調函數為止,迭代次數為k次。此時,x(t)可由k個PFi函數和殘余分量uk(t)重組得到:
由于天氣隨機性、間歇性的特點,光伏功率具有同樣的特點。根據主成分分析法,完成了對天氣因素的篩選,將光照輻射度與光伏功率作為預測模型的輸入,再通過局部均值分解算法對這兩類數據序列進行分解,分解為具有不同特征的乘積分量,由于得到的殘余分量過小且對預測并無影響,在仿真中不作考慮。通過WOA-ELM 預測模型對各乘積分量分別進行預測。光照輻射度與光伏功率的分解圖如下圖3 所示。
圖3 LMD分解圖Fig.3 LMD decomposition
由本文上述所介紹的PCA 算法、LMD 算法、WOA-ELM 算法,提出一種新的光伏發(fā)電短期預測方法,預測方法步驟圖如圖4 所示,預測方法的具體流程如下:
圖4 預測方法步驟圖Fig.4 Step diagram of prediction method
1)由主成分分析法對各類天氣因素進行選取,篩選出于發(fā)電功率相關系數高的因素作為模型輸入變量。
2)將(1)中選取的數據序列進行局部均值分解,將原始數據序列分解為具有不同特征的分量,消除原數據序列波動性與隨機性帶來的不良影響。
3)將分解后的各子分量分別帶入WOA-ELM預測模型中,得到各分量的預測結果,由于分解所得結果其和為原始數據,因此將各分量預測結果進行等權疊加即為最終預測結果。
4)根據誤差指標對仿真結果進行分析,并與其他預測方法進行比較。
本文采用某光伏電站所采集的全年光伏發(fā)電功率數據以及對應時間段的天氣數據,此光伏電站的最大裝機容量為100 MW,所采集的數據間隔為15 min。通過Matlab 仿真軟件建立本文所提預測模型,預測模型的輸出結果與輸入數據序列的時間間隔相同。在原始數據樣本中選擇七月的全部數據作為測試集,然后在全年中選出晴天、雨天、變化天氣作為驗證集。將預測當天的歷史天氣數據及歷史光伏功率數據作為輸入,通過PCA-LMD-WOAELM(方法1)獲得晴天,雨天和陰天在未來1 d 內的變化曲線,同時引用傳統(tǒng)的ELM(方法2),WOAELM(方法3)在同樣條件下對3 種天氣進行預測。
為對本文預測結果進行分析與評估,選取均方根誤差(Root Mean Square Error,RMSE)和平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)對預測結果進行評估,其量值分別為ERMS和EMAP,同時與其他預測方法進行對比分析。通過誤差指標值對各模型的預測結果進行比較分析。下圖5—7 分別為晴天、雨天、變化天氣在1 d 內各預測模型結果,表3 為各預測模型誤差指標值。
表3 不同天氣下各模型誤差指標Table 3 Error indicators of each model under different weather conditions
圖5 晴天時各模型預測結果Fig.5 Prediction results of each model in sunny days
式中:n為預測樣本的總數;pi為預測功率值;qi為實際功率值;xˉ為實際功率平均值。
圖6 雨天時各模型預測結果Fig.6 prediction results of each model in rainy days
由圖5—圖7 及表3 可知,通過鯨魚優(yōu)化算法優(yōu)化過得極限學習機的預測效果,明顯更優(yōu)于傳統(tǒng)的極限學習機模型,而將數據進行降維和特征提取的PCA-LMD-WOA-ELM 模型的預測效果更優(yōu)于單純的WOA-ELM 模型。在晴天時,ELM 模型的RMSE 和MAPE 分別為7.340 1 和14.684 5,預測效果最差,WOA-ELM 模型的RMSE 和MAPE 相較于傳統(tǒng)ELM 分別下降至5.746 5 和10.357 4,預測效果較好,PCA-LMD-WOA-ELM 的誤差指標值最小,可以看出數據處理對于預測模型的重要性。在下雨天,3 種模型的RMSE 分別為1.822 8,1.438 4,0.527 9,MAPE 分別為37.615 7,30.361 2,10.357 4,同樣可以看出3 種模型在預測效果上的優(yōu)劣。在變化天氣的條件下,傳統(tǒng)ELM 和WOA-ELM 的誤差指標相差較小,但是仍然有一定差距,且仍是本文所提模型預測效果最優(yōu)。
圖7 突變天氣時各模型預測結果Fig.7 Prediction results of various models in abrupt weather
通過對于3 種模型誤差指標的詳細分析,結合仿真圖的對比可得,本文所提預測模型在數據分析、處理上明顯優(yōu)于其他模型,預測結果的穩(wěn)定性較高,平穩(wěn)性更好。
本文針對目前光伏預測中存在模型輸入影響因素較多,光伏受天氣擾動大的問題,提出一種基于PCA-LMD-WOA-ELM 的組合式光伏預測方法。基于某光伏電站的歷史數據,結合本文所提預測模型,通過仿真實驗分析,得出如下結論:
1)針對影響因素較多的問題,通過PCA 可以很好的對數據進行篩選降維,將相對濕度、氣壓等相關性不大的數據篩選后,由仿真圖與數據對比可看出,預測結果有明顯的提升。
2)針對光伏功率易受到天氣因素的影響,使得光伏功率同樣具有隨機性與間歇性的特點,提出使用LMD 算法將數據序列進行分解為多個分量,各分量具有不同的特征,再由各分量分別預測,最后預測結果疊加,由仿真圖及數據可看出,預測效果更優(yōu)。
3)本文將兩種算法與WOA-ELM 結合,對目前光伏預測存在的問題進行了改進,且本文所提方法對于多種天氣都能較準確的預測。