解振學,林 帆,王若谷,張 耀,高 欣,王建學
(1.國網(wǎng)陜西物資公司,陜西西安 710054;2.陜西省智能電網(wǎng)重點實驗室,西安交通大學陜西西安 710049;3.國網(wǎng)陜西電力科學研究院,陜西西安 710100)
近年來,我國可再生能源產(chǎn)業(yè),尤其是光伏發(fā)電產(chǎn)業(yè)發(fā)展迅猛。截至2019 年底,全國可再生能源發(fā)電裝機總?cè)萘恳堰_7.94×108kW,占全部電力裝機的39.5%,其中,光伏發(fā)電裝機容量為2.04×108kW,同比增長17.3%[1]。在國家政策影響下,分布式光伏發(fā)電增長尤為迅速,截至2019 年底,全國分布式光伏累計裝機已達6.263×107kW,同比增長24.2%,2019年內(nèi)的增長容量為1.220×107kW,同比增長41.3%[2]。
光伏發(fā)電功率預測可以根據(jù)預測提前期劃分為超短期、短期、中長期預測等。超短期預測主要關(guān)注未來數(shù)小時內(nèi)的光伏出力情況,對于日內(nèi)的電網(wǎng)調(diào)度計劃調(diào)整與電力市場交易具有重要指導意義。
目前超短期光伏發(fā)電功率預測的實用方法主要有2 類:(1)結(jié)合氣象云圖分析的預測方法;(2)基于數(shù)據(jù)驅(qū)動的預測方法[3]。在基于云圖的預測方法中,文獻[4]描述了一種以衛(wèi)星云圖與地面遙感數(shù)據(jù)作為輸入的人工神經(jīng)網(wǎng)絡(luò)模型,預測提前期為2 h。文獻[5]結(jié)合衛(wèi)星云圖與數(shù)值天氣預報結(jié)果進行了提前期為4 h 的光伏功率預測。除衛(wèi)星云圖外,地基云圖也有所應(yīng)用。文獻[6]根據(jù)地基云圖與數(shù)值天氣預報進行了未來4 h 內(nèi)的光伏功率預測。文獻[7]介紹了位于美國San Diego 的地基云圖分析系統(tǒng),并用該系統(tǒng)對未來15min 內(nèi)的太陽輻照度進行準確預測。文獻[8]以實時采集的全天空圖像和太陽輻照數(shù)據(jù)作為輸入,預測未來1~10 min 內(nèi)的每分鐘平均太陽輻照。在數(shù)據(jù)驅(qū)動型的預測方法中,文獻[9]基于動態(tài)人工神經(jīng)網(wǎng)絡(luò)方法進行提前1 h 的光伏功率預測。文獻[10]則采用改進的共軛梯度算法對動態(tài)神經(jīng)網(wǎng)絡(luò)光伏功率預測模型的訓練進行優(yōu)化,獲得了精度較高的預測。文獻[11]基于以氣象信息為主要特征的光伏功率相似日思想,采用動量優(yōu)化方法訓練BP 神經(jīng)網(wǎng)絡(luò)預測模型。類似地,文獻[12]在相似日歷史數(shù)據(jù)的基礎(chǔ)上,采用回聲狀態(tài)神經(jīng)網(wǎng)絡(luò)建立了光伏功率短期預測模型。除單一的非線性預測方法外,組合方法也得到廣泛研究。文獻[13]混合AR 模型和Lucheroni 模型[14]提出了CARDS 模型,用于預測未來數(shù)小時內(nèi)的太陽輻照強度。文獻[15]結(jié)合小波變換技術(shù)與人工智能技術(shù),進行了提前1 h 的光伏功率預測。文獻[16]采用深度信念網(wǎng)絡(luò)進行光伏發(fā)電功率短期預測,并通過粒子群算法對神經(jīng)網(wǎng)絡(luò)的訓練過程進行優(yōu)化。文獻[17]采用模糊技術(shù)挖掘歷史數(shù)據(jù)的規(guī)律,配合在線加性學習,滾動預測未來數(shù)十分鐘內(nèi)的光伏發(fā)電功率。文獻[18]使用Elman 神經(jīng)網(wǎng)絡(luò)[19]進行光伏功率短期預測,并采用改進的布谷鳥算法[20]對Elman 神經(jīng)網(wǎng)絡(luò)預測模型的結(jié)構(gòu)與狀態(tài)進行優(yōu)化。文獻[21]采用加入Soft attention 機制的雙向LSTM 模型[22]作為光伏發(fā)電量預測模型,并使用粒子流算法優(yōu)化預測模型參數(shù)。
文獻[3-21]所提出的光伏發(fā)電功率預測方法都在氣象數(shù)據(jù)采集與存儲方面存在較高要求,而我國光伏發(fā)電產(chǎn)業(yè)的現(xiàn)狀是配套的氣象觀測設(shè)備普遍不完善,沒有上述預測算法所需要的高精度氣象觀測數(shù)據(jù)。
因此,本文提出了一種基于時序動態(tài)回歸的超短期光伏發(fā)電功率預測方法,僅需要歷史光伏發(fā)電功率數(shù)據(jù)與數(shù)值天氣預報作為輸入,即可獲得較高精度的預測結(jié)果。算例結(jié)果表明:在原始數(shù)據(jù)集相同的情況下,與一般時序模型相比,本文提出的模型在超短期預測上的預測精度明顯更高。
本文所使用的光伏功率數(shù)據(jù)來源于澳大利亞某光伏電站(149°E,35°S)[23],數(shù)據(jù)范圍為2012 年4月至2013 年6 月,共計447 d,等距采樣間隔為1 h。數(shù)據(jù)集包括2 部分:(1)歸一化的光伏電站實際發(fā)電功率;(2)歐洲中期天氣預報中心提供的數(shù)值天氣預報(Numerical Weather Prediction,NWP),其中與光伏發(fā)電最相關(guān)的氣象要素為地表太陽輻射累計值(Surface Solar Radiation Down Accumulation,SSRDA)。2 部分數(shù)據(jù)的時間分辨率相同,在分析前,數(shù)據(jù)均已經(jīng)過歸一化處理。
原始的SSRDA 數(shù)據(jù)為每小時累計值,對其作差分后獲得每小時輻射量(Hourly Surface Solar Radiation Down,HSSRD),其量值記作HSSRD。與光伏發(fā)電功率直接聯(lián)系的是同時刻的太陽輻射強度,對HSSRD 作二階滑動平均可以更好地近似這一物理量,如式(1)所示,得到新時間序列平滑后每小時輻射量(Smoothed Hourly Surface Solar Radiation Down,SHSSRD),其量值記作SSSRD。其與光伏發(fā)電功率數(shù)據(jù)的相關(guān)性如圖1 所示。根據(jù)圖1 數(shù)據(jù),SHSSRD 與光伏發(fā)電功率的相關(guān)系數(shù)為0.877,兩者表現(xiàn)出較強的相關(guān)性。
圖1 SHSSRD與光伏發(fā)電功率的散點圖Fig.1 Scatter plot of SHSSRD and photovoltaic power
式中:t為時間刻度。
除了圖1 所展示的線性相關(guān)性以外,光伏發(fā)電功率與SHSSRD 的相關(guān)性也可能表現(xiàn)為非線性形式。通過將二者分別作自然對數(shù)變換,得到如圖2所示的散點圖。
圖2 SHSSRD與光伏發(fā)電功率經(jīng)對數(shù)變換與-0.1倍伸縮后的散點圖Fig.2 Scatter plot of SHSSRD and photovoltaic power after log-transformation and multiplying by-0.1
為了方便展示,圖2 中的數(shù)據(jù)經(jīng)過了-0.1 倍的伸縮,這一操作不影響數(shù)據(jù)相關(guān)性。根據(jù)圖2 數(shù)據(jù),經(jīng)自然對數(shù)變換后,SHSSRD 與光伏發(fā)電功率的相關(guān)系數(shù)增加到0.945,說明SHSSRD 與光伏發(fā)電功率的相關(guān)性具有顯著的非線性特征。圖2 最右側(cè)的數(shù)據(jù)點比較分散,這是因為這些點對應(yīng)著原數(shù)據(jù)中光伏發(fā)電功率接近于0 的部分。
因為太陽日升日落及太陽高度角隨季節(jié)變化的自然規(guī)律,光伏發(fā)電功率時間序列具有復雜的季節(jié)性。將光伏發(fā)電功率全體數(shù)據(jù)按照1 d 中不同的時刻加以分類,得到箱線圖如圖3 所示。
圖3 光伏發(fā)電功率按照1 d中不同時刻分類的箱線圖Fig.3 Box plot of photovoltaic power classified by different time of day
圖3 描繪了各分類子集的中位數(shù)、上下四分位數(shù)、最小最大值等統(tǒng)計指標。據(jù)此判斷,光伏發(fā)電功率的時間序列具有明顯的日季節(jié)性。另外,將光伏電站全天發(fā)電量按月份分類,得到的箱線圖如圖4 所示。從圖4 可以看出,光伏發(fā)電功率時間序列也具有較為明顯的年季節(jié)性。
圖4 光伏電站全天發(fā)電量按照月份分類的箱線圖Fig.4 Box plot of daily electricity generation from solar power station by month
根據(jù)1.1 節(jié)的相關(guān)性分析結(jié)果,可基于回歸原理選擇SHSSRD 數(shù)據(jù)作為輸入變量,來預測光伏發(fā)電功率,回歸方程可寫為如下2 種形式:
式中:Pt為t時刻光伏發(fā)電功率;β0為回歸截距;β1為回歸斜率;εt為回歸殘差。
式(2)和式(3)的結(jié)構(gòu)相同,都是線性回歸模型,只是式(3)中經(jīng)過了對數(shù)變換,因此將式(2)稱為回歸模型的普通形式,式(3)則稱為對數(shù)形式。無論哪種形式,簡單回歸模型只能捕獲時間序列中蘊含的部分信息,殘差項εt仍然保留著大量未被充分利用的信息。
殘差信息的挖掘?qū)τ谔岣呋貧w類預測模型的預測精度具有重要意義。而且,殘差項本身就是一個時間序列,本文采用整合移動平均自回歸模型(Autoregressive Integrated Moving Average,ARIMA)對上述回歸模型的殘差項進行建模預測[24]。
1)平穩(wěn)時間序列的獲取方法。ARIMA 方法只能應(yīng)用在平穩(wěn)時間序列上。平穩(wěn)序列是指類似于白噪聲的無明顯趨勢性與季節(jié)性的時間序列。然而,式(2)和式(3)中含有規(guī)律信息的殘差εt仍然可能不是平穩(wěn)時間序列,此時需要通過差分運算獲得平穩(wěn)序列。這里給出時刻后移算子B,如式(4)所示:
式中:εt-1為t-1 時刻的殘差項。
2)自回歸模型(Autoregressive Model,AR)與滑動平均模型(Moving Average Model,MA)。在獲得平穩(wěn)時間序列后,可以選擇AR 預測模型或MA 預測模型。AR 模型是利用歷史數(shù)據(jù)的加權(quán)平均進行預測,如式(5)所示:
式中:yt為回歸殘差經(jīng)過可能的差分運算后獲得的平穩(wěn)時間序列;c為常數(shù)項;φi為歷史數(shù)據(jù)yt-i的權(quán)重;p為正整數(shù);et為預測誤差。
MA 模型則是利用歷史預測誤差的加權(quán)平均進行預測,如式(6)所示。
式中:θi為歷史預測誤差et-i的權(quán)重;q為正整數(shù)。
式中:f為數(shù)學變換,這里可以取恒等變換(對應(yīng)回歸方程式(1)),也可以取對數(shù)變換(對應(yīng)回歸方程式(2));Bi為后移算子的i次方,表示將時刻后移i個單位,i為自然數(shù);ηt為ARIMA 部分的預測誤差。
由于SHSSRD 數(shù)據(jù)來源于數(shù)值天氣預報,不可避免存在誤差,因此在刻畫光伏發(fā)電功率序列的季節(jié)性方面(見1.2 節(jié)),完全依賴對SHSSRD 進行回歸并不可取。為了準確刻畫光伏發(fā)電的季節(jié)性特征,本文引入諧波分量作為額外的預測變量,以配合ARIMA 方法挖掘原始回歸殘差中剩余的季節(jié)性特征。
對于季節(jié)性周期為m的時間序列,可以定義如式(8)所示的1 組諧波分量:
式中:k為諧波次數(shù);x2k-1,t,x2k,t分別為第k次諧波分量的余弦部分與正弦部分;K為諧波最大次數(shù),1≤K≤0.5m。
值得注意的是,K若取值較大,不僅會使運算量大幅增加,還可能導致過擬合問題,因此K并非越大越好。另外,因為SHSSRD 數(shù)據(jù)對光伏發(fā)電功率的年季節(jié)性已經(jīng)有所體現(xiàn),而且在超短期預測中,年季節(jié)性的影響要遠小于日季節(jié)性,所以這里只引入m=24 的諧波分量以刻畫關(guān)鍵的日季節(jié)性。
根據(jù)式(7)和式(8),可得到考慮季節(jié)性諧波分量的動態(tài)回歸模型,如式(9)所示:
老式B-29、B-59型轟炸機夜以繼日地將多達百萬噸的炸彈扔在北越的公路上,第二天早晨你就會發(fā)現(xiàn)越南人又在上面通過了……盡管美國擁有絕對的制空權(quán)和制海權(quán),但實際上從未有效切斷過越南的全部交通線,航空兵皮特·希拉里把轟炸效果描述為“將垃圾從路北邊挪到了路南邊。第二天,我們再把這點垃圾從路南邊挪到路北邊”。
式中:βk,1,βk,2為第k次諧波分量的系數(shù)。
根據(jù)式(9),光伏發(fā)電功率的超短期預測結(jié)果將由2 部分組成:(1)回歸部分,主要來自SHSSRD和諧波分量的貢獻;(2)殘差部分,主要由ARIMA方法基于歷史殘差序列得到。
在算例分析中,本文采用第1 節(jié)介紹的數(shù)據(jù)集,驗證時序動態(tài)回歸模型的有效性,檢驗其在超短期光伏發(fā)電功率預測問題上的預測精度。從圖3可以看出,每天從22:00 到次日5:00 這段時間內(nèi),光伏發(fā)電功率為0。因此,光伏發(fā)電功率的超短期預測將分時段進行:夜晚時段(20:00 到次日5:00共10 h)的預測結(jié)果直接取0;白天時段(6:00 到19:00 共14 h)利用式(9)所示的動態(tài)回歸模型進行預測。因此僅對白天時段進行建模預測,故需要提前去除數(shù)據(jù)集內(nèi)的夜晚時段數(shù)據(jù),同時式(9)中諧波項的季節(jié)性周期設(shè)為m=14。
式(9)中待定參數(shù)可以分為2 類:(1)第一類包括回歸參數(shù)β0,β1,βk,1,βk,2與ARIMA 公式中的系數(shù)φi,θi和常數(shù)項c等,它們被稱為普通參數(shù),可基于歷史時間序列計算得到。其中,計算回歸參數(shù)采用最小二乘估計,計算ARIMA 公式中的參數(shù)采用極大似然估計。在此過程中用到的歷史時間序列長度被稱為滑動窗口長度;(2)第二類參數(shù)包括滑動窗口長度,ARIMA 模型的階數(shù)p,d,q及諧波分量的最高次數(shù)K,它們被稱為超參數(shù)。本文通過時序交叉驗證來確定超參數(shù)的最佳取值。
全體數(shù)據(jù)集被劃分為訓練集(前12 月,共5 110 h)和測試集(后3 月,共1 274 h)。時序交叉驗證在訓練集上進行,當確定普通參數(shù)和超參數(shù)的取值后,在測試集上檢驗?zāi)P偷念A測精度,評估指標統(tǒng)一采用均方根誤差(Root Mean Square Error,RMSE),其量值為ERMS。
通過在訓練集上執(zhí)行時序交叉驗證,可確定ARIMA 的最優(yōu)階數(shù)組合為(2,0,0),諧波分量最大次數(shù)為7,得到式(9)的具體形式,如式(10)所示。同時也確定滑動窗口長度為420 h(30 d)。
為展示式(10)中各分量對預測精度的貢獻,設(shè)置3 個對照模型進行對比測試:(1)模型1,僅考慮SHSSRD 回歸項,即采用式(2)所示的普通回歸形式;(2)模型2,在模型1 的基礎(chǔ)上,增加ARIMA 項,即式(7)所示模型;(3)模型3,在模型2 的基礎(chǔ)上,增加諧波分量,即本文所提預測模型,如式(10)所示。
在測試集中隨機選取1 d(2013 年6 月3 日),3個模型的超短期滾動預測結(jié)果(預測提前期為1 h)如圖5 所示。
圖5 3個模型的超短期滾動預測結(jié)果Fig.5 Very short-term rolling forecast results of three models
從圖5 可看出,缺少ARIMA 項的模型1 預測效果明顯比模型2、模型3 差;模型2、模型3 在下午時段的預測結(jié)果基本一致,在上午時段,引入諧波分量的模型3 預測效果相較模型2 有很大改進。表1 列出了3 個模型在測試集上超短期滾動預測的預測精度評估結(jié)果。
表1 3個模型在測試集上的超短期滾動預測RMSETable 1 Very short-term rolling forecast RMSE of three models on the test set
表1 數(shù)據(jù)表明,從模型1 到模型3,通過增加ARIMA 項和諧波分量,模型預測精度得到很大提高。此外,表1 還給出對數(shù)形式(式(3))動態(tài)回歸模型的預測精度,雖然其總體預測效果要差于普通形式的動態(tài)回歸模型,但通過分析每天各時刻的預測精度,發(fā)現(xiàn)對數(shù)形式在16:00 到次日6:00(忽略夜晚時段,見3.1 節(jié)實驗設(shè)定)的預測精度明顯高于普通形式。表2 列出了從16:00 到次日6:00 這一時段內(nèi),模型3 普通形式和對數(shù)形式的各時刻預測精度,包括訓練集評估結(jié)果和測試集評估結(jié)果。
表2 模型3的對數(shù)形式與普通形式在16:00到次日6:00時段內(nèi)的各時刻預測精度RMSETable 2 Forecast RMSE between logar-ithmic and normal forms of model 3 from 16:00 to 6:00
綜合表1 和表2 展現(xiàn)的預測精度結(jié)果,本文采用一種混合預測方案,即在原實驗設(shè)定下,進一步將白天時段劃分為2 個時段:從7:00 到15:00 為第一時段,采用普通形式的動態(tài)回歸模型進行預測;從16:00 到次日6:00 為第二時段,采用對數(shù)形式的動態(tài)回歸模型進行預測。這種混合預測方案既保留普通形式模型優(yōu)良的整體預測精度,同時也改善了在局部時段的預測精度。
為檢驗第3.2 小節(jié)提出的混合預測方法的有效性,本文選擇了3 種基于時間序列的光伏發(fā)電功率超短期預測模型作為對照組:(1)snaive 方法,即將前1 d 的同時刻實測數(shù)據(jù)作為預測結(jié)果;(2)STL+ETS 方法,是一種數(shù)據(jù)分解算法,可以分解得到光伏發(fā)電功率的日季節(jié)性分量,并以snaive 方法給出日季節(jié)性分量的預測結(jié)果[25]。去除日季節(jié)性分量的剩余部分則采用ETS(指數(shù)平滑)模型進行預測,ETS模型以歷史數(shù)據(jù)的加權(quán)平均作為預測結(jié)果,權(quán)重系數(shù)按指數(shù)衰減;(3)STL+ARIMA 方法,其基本思路與STL+ETS 方法類似,不同點在于用ARIMA 模型取代ETS 模型,經(jīng)交叉驗證可得ARIMA 的最優(yōu)階數(shù)組合為(3,1,2)。
在測試集中隨機選取2 d,2013 年5 月29 日為多云天,分別采用4 個模型進行超短期滾動預測(預測提前期為1h),其中2013 年5 月11 日為晴天的結(jié)果如圖6 所示,2013 年5 月29 日為多云天的結(jié)果如圖7 所示。
圖6 4個模型在晴天的超短期滾動預測結(jié)果Fig.6 Very short-term rolling forecast results of four models on a sunny day
圖7 4個模型在多云天的超短期滾動預測結(jié)果Fig.7 Very short-term rolling forecast results of the four models on a cloudy day
從圖6 可看出,4 種模型在晴天的預測效果都很好,但是本文所提混合方法的整體預測精度明顯要更高,尤其表現(xiàn)在上午光伏發(fā)電功率爬升時段。在圖7 中,snaive 方法由于不能對天氣變化做出響應(yīng),因此預測精度最差;而另外2 種對照方法的預測精度也不理想;總體上看,混合預測方法是4 種方法中跟隨發(fā)電功率變化最準確、最快速的方法,因此其預測精度也最高。
表3 列出了4 種方法在測試集中的滾動預測精度評估結(jié)果。為使評價更全面,除RMSE 外,表3還給出了各方法預測值的平均絕對誤差(Mean Absolute Error,MAE),其量值為EMA。表3 評估結(jié)果顯示,在超短期預測精度上,基于動態(tài)回歸模型的混合預測方法明顯高于其他3 種對照方法。
表3 4種方法在測試集上的超短期滾動預測精度Table 3 Very short-term rolling prediction accuracy of four methods on the test set
為了檢驗所提方法對不同時間段的魯棒性,將3 個月測試集數(shù)據(jù)(2013 年4—6 月)按時間先后分為6 部分(每半月構(gòu)成一部分),分別統(tǒng)計4 個模型在6 個時段滾動預測誤差(只包括預測提前期為1 h 的預測)的RMSE 值,得到結(jié)果如圖8 所示。
圖8 4種方法測試集超短期滾動預測的分時段RMSE統(tǒng)計結(jié)果Fig.8 Time-segmented RMSEs of very short-term rolling forecasting of four methods on the test set
從圖8 可看出,在4 種預測方法中,所提混合方案在6 個時間段內(nèi)的預測效果均為最佳,且在不同時段內(nèi)的預測精度差別不大,說明所提方法具有一定的時間魯棒性。
本文提出的基于動態(tài)回歸的超短期光伏發(fā)電功率預測方法,僅需要歷史光伏發(fā)電功率數(shù)據(jù)與數(shù)值天氣預報作為輸入即可實現(xiàn)較高精度的預測。算例結(jié)果表明了與單一的普通形式回歸模型相比,綜合了普通形式回歸模型與對數(shù)形式回歸模型的混合預測方法具有更好的預測效果。算例也驗證了相較于一般的時序模型,本文所提出的預測方法在超短期光伏發(fā)電功率預測方面預測精度更高。