李一,楊茂,蘇欣
(現(xiàn)代電力系統(tǒng)仿真控制與綠色電能新技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室(東北電力大學(xué)),吉林 吉林 132012)
受到復(fù)雜、變化多端的氣象因素影響,光伏電站的有效功率輸出具有強(qiáng)烈的波動性和不確定性,光伏發(fā)電系統(tǒng)并網(wǎng)后可能會影響電力系統(tǒng)的發(fā)電計劃及檢修機(jī)組等任務(wù)[1-3],光伏出力曲線的預(yù)測對調(diào)度部門與未來發(fā)電規(guī)劃具有重要意義。
明確功率序列各分量特征有助于提高功率預(yù)測效果,文獻(xiàn)[4]闡明了光伏功率序列可分解為多種頻率分量,分別代表受不同氣象因素影響而產(chǎn)生的功率分量,但并未考慮實(shí)際物理意義[5-6],實(shí)現(xiàn)高低頻序列進(jìn)一步合并,增加計算成本的同時,無法解決間斷信號數(shù)據(jù)的存在會導(dǎo)致單一本征模態(tài)分量(intrinsic mode function,IMF)中包含多種頻率分量[7-10],不符合IMF 的定義。文獻(xiàn)[11]將光伏功率曲線進(jìn)行分解預(yù)測,提出不同特征分量分別建模預(yù)測,在考慮突變天氣的影響下,引入白噪聲輔助分解,但這些噪聲并未濾除,在后續(xù)預(yù)測中可能增加預(yù)測誤差,降低模型預(yù)測的準(zhǔn)確性。
光伏日出力曲線受氣象因素影響會出現(xiàn)多種類型,劃分出全年可能出現(xiàn)的趨勢序列一定程度上能夠減小預(yù)測誤差,文獻(xiàn)[12]針對光伏出力的特點(diǎn),使用K-means 算法距離公式選擇歐式距離,從大量原始數(shù)據(jù)集中劃分不同特征的出力序列,但每次預(yù)測得到的聚類中心并不固定[13],無法確定聚類初始中心,同時可能會出現(xiàn)波動劇烈但幅值較大的序列與光伏出力曲線平緩幅值較小的序列劃入同一聚類簇中,直接影響該出力類型的模型建立及預(yù)測效果。文獻(xiàn)[14]闡明了馬爾科夫鏈模型具有很好的預(yù)測效果,但對于區(qū)間劃分沒有考慮狀態(tài)轉(zhuǎn)移矩陣的特點(diǎn)[15-20],當(dāng)日出力最值未處于某一區(qū)間端點(diǎn)時,狀態(tài)轉(zhuǎn)移概率矩陣無法控制兩種相反的變化,導(dǎo)致模型預(yù)測精度下降。文獻(xiàn)中針對馬爾科夫鏈模型出現(xiàn)平穩(wěn)分布及訓(xùn)練集數(shù)據(jù)存在常返態(tài)的情況并未做出假設(shè)與解決辦法。預(yù)測模型可以提取有效特征作為模型的輸入[21-22],同時也可以作為模型改進(jìn)的依據(jù)[23],但未考慮模型輸入特征量的增加對計算成本及預(yù)測精度的影響。
在以上方法研究的基礎(chǔ)上,提出通過集成聚類劃分得到物理意義明確的兩個分量,即趨勢序列與隨機(jī)序列,避免因分解后各分量分別建模導(dǎo)致誤差積累及噪聲引入造成影響[24]。集成聚類方法既保證處理大數(shù)據(jù)集的高效性,同時避免單一聚類方法結(jié)果不唯一[25-27]。根據(jù)馬爾科夫鏈模型的優(yōu)勢,考慮其建模特點(diǎn),在傳統(tǒng)模型基礎(chǔ)上使用一階差分提取趨勢序列波動變化特征[28-30],并以此為依據(jù)劃分特征時段,各區(qū)間分別建模預(yù)測,防止因進(jìn)入平穩(wěn)分布導(dǎo)致預(yù)測不收斂,同時充分發(fā)揮狀態(tài)轉(zhuǎn)移矩陣控制單一變化速率的優(yōu)勢[31-32]。本文利用光伏電站實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行建模來驗(yàn)證所提模型的有效性以及不同地理位置條件下的適用性。
受輻照度、濕度等氣象條件因素的影響,光伏電站日出力曲線整體趨勢各不相同。處于相似天氣情況下的功率輸出差值更小,利用聚類算法篩選與待預(yù)測日功率曲線趨勢相似、數(shù)值接近的聚類中心作為典型代表可以提升后續(xù)模型的預(yù)測精度[12]。典型聚類算法包括密度聚類、層次聚類、網(wǎng)格聚類、劃分聚類以及基于模型的聚類方法。單一聚類方法難以實(shí)現(xiàn)既保證聚類效果又能確定聚類個數(shù),針對大量數(shù)據(jù),單一方法的聚類精度與聚類效率無法同時兼顧,并且不能判斷最優(yōu)聚類數(shù)量。
通過分析傳統(tǒng)聚類算法的優(yōu)缺點(diǎn),結(jié)合層次聚類的高精度與劃分聚類的高效性,本文提出一種集成聚類算法。使用劃分聚類K-means 算法將歷史功率數(shù)據(jù)集進(jìn)行初步聚類獲得樣本簇聚類中心,在此基礎(chǔ)上將得到的聚類中心繼續(xù)做層次聚類,劃分聚類代替層次聚類處理大量數(shù)據(jù)提高效率,節(jié)省了層次聚類需要計算的樣本間距離矩陣的存儲空間。本文選擇戴維森保丁指數(shù)(Davies-Bouldin index,DBI)和輪廓系數(shù)(silhouette coefficient)來確定最優(yōu)聚類個數(shù),公式如式(1)—(3)表示。
式中:avg為簇內(nèi)樣本間平均距離;n為樣本個數(shù);m為樣本維數(shù);xit、xjt為樣本點(diǎn);DBI為戴維森堡丁指數(shù);k為聚類個數(shù);Ci、Cj為樣本簇;ci、cj為樣本簇聚類中心;S(i)為輪廓系數(shù);b(i)為簇外樣本間距離;a(i)為簇內(nèi)樣本間距離;i、j為變量序數(shù)的下標(biāo);t為變量維數(shù)下標(biāo)。
馬爾科夫鏈(Markov chain,MC)是一種能反映事件對象離散狀態(tài)間變化過程的數(shù)學(xué)模型,具有無后效性,即待預(yù)測時刻的狀態(tài)僅由其相鄰前一時刻所處狀態(tài)決定,與其他時刻無關(guān)。光伏功率序列可視作一種不同狀態(tài)間的轉(zhuǎn)移過程,馬爾科夫鏈模型可以通過建立狀態(tài)轉(zhuǎn)移概率矩陣預(yù)測功率變化趨勢及待預(yù)測時刻功率值處于不同狀態(tài)區(qū)間的概率。
馬爾科夫鏈模型單步預(yù)測結(jié)果為功率預(yù)測值處于各狀態(tài)區(qū)間內(nèi)的概率值,多組狀態(tài)區(qū)間使用列向量PN表示,如式(4)所示。
式中:PN為各狀態(tài)區(qū)間概率列向量;P(xN)為處于對應(yīng)狀態(tài)區(qū)間的概率;n為狀態(tài)區(qū)間數(shù)量;N為預(yù)測序數(shù)。
模型用于預(yù)測曲線變化的狀態(tài)轉(zhuǎn)移矩陣為方陣,階數(shù)等于狀態(tài)數(shù)量,矩陣第N行元素代表由狀態(tài)xN向其他狀態(tài)轉(zhuǎn)移的概率值(包括轉(zhuǎn)移至狀態(tài)本身),轉(zhuǎn)移概率矩陣P如式(5)所示。
式中PN1為矩陣元素,物理意義為狀態(tài)xN向狀態(tài)x1轉(zhuǎn)移的概率。
單獨(dú)轉(zhuǎn)移概率矩陣中元素值Pij的分母為元素所在行數(shù),即轉(zhuǎn)移前狀態(tài)出現(xiàn)的總次數(shù);分子為由狀態(tài)i變?yōu)闋顟B(tài)j的頻數(shù)。待預(yù)測值或狀態(tài)PN+1根據(jù)式(6)來確定。
狀態(tài)轉(zhuǎn)移概率矩陣可以有效地跟蹤序列的變化趨勢、引導(dǎo)數(shù)據(jù)轉(zhuǎn)移方向,并控制預(yù)測值增減速率。傳統(tǒng)馬爾科夫鏈模型有一定的局限性,在出現(xiàn)曲線變化速率突變、數(shù)值波動劇烈的情況下,單一狀態(tài)轉(zhuǎn)移矩陣無法應(yīng)對預(yù)測過程中出現(xiàn)的復(fù)雜變化。當(dāng)數(shù)據(jù)出現(xiàn)常返態(tài),即數(shù)值多次經(jīng)歷同一狀態(tài)區(qū)間,MC模型將進(jìn)入平穩(wěn)分布導(dǎo)致預(yù)測無法進(jìn)行,而數(shù)據(jù)波動的存在成為出現(xiàn)平穩(wěn)分布的充分條件。狀態(tài)轉(zhuǎn)移概率矩陣對預(yù)測效果有直接影響,矩陣元素由狀態(tài)區(qū)間劃分決定,區(qū)間間隔過大會導(dǎo)致單步預(yù)測值難以估計;區(qū)間間隔太小容易導(dǎo)致矩陣變?yōu)橄∈杈仃?,增加矩陣維數(shù)降低預(yù)測效率。一般情況下,單獨(dú)轉(zhuǎn)移概率矩陣只能反映序列的一種變化,那么提取待預(yù)測序列有效變化特征,并以此為依據(jù)劃分預(yù)測區(qū)間可以提升模型精度。對光伏日出力曲線進(jìn)行一階差分處理,結(jié)果如圖1所示。
圖1 光伏日功率曲線一階差分值Fig.1 First order difference values of PV daily power curve
由圖1 可知,光伏功率曲線在上升及下降時段的變化速率并不恒定,單獨(dú)狀態(tài)轉(zhuǎn)移矩陣無法達(dá)到預(yù)測目標(biāo),根據(jù)上文分析,使用多個表達(dá)不同變化趨勢的狀態(tài)轉(zhuǎn)移概率矩陣代替原始矩陣可以提升預(yù)測效果,不同矩陣分別對應(yīng)預(yù)測過程中某一變化速率。一階差分值既能反映數(shù)據(jù)波動,也可以體現(xiàn)序列變化情況,針對馬爾科夫鏈模型單步預(yù)測的特點(diǎn),在預(yù)測前對訓(xùn)練集數(shù)據(jù)做一階差分處理,得到能夠體現(xiàn)原始序列變化速率及相鄰兩點(diǎn)間增減關(guān)系的數(shù)據(jù)。根據(jù)一階差分值劃分的各區(qū)間分別對應(yīng)一個特征時段,為防止矩陣維數(shù)向極端發(fā)展,同一特征時間段為連續(xù)且變化速度接近的序列。
隨機(jī)序列為光伏實(shí)際功率序列與趨勢序列的差值,代表光伏電站出力受云層移動、降雨等天氣因素影響產(chǎn)生的高頻率短時波動。根據(jù)其頻率高、幅值小等特點(diǎn),使用ARIMA(autoregressive integrated moving average model)模型對隨機(jī)序列進(jìn)行預(yù)測,模型可表示為式(7)。
式中:L為滯后算子;d為差分階數(shù);p為自回歸階數(shù);q為移動平均階數(shù);Φi為自適應(yīng)系數(shù);θi為移動平均系數(shù);εt為殘差序列;Xt為待計算變量。
差分整合移動平均自回歸模型的步驟如下:1)選擇ADF 方法做單位根檢驗(yàn)判斷隨機(jī)序列的平穩(wěn)性,當(dāng)滯后算子多項(xiàng)式未出現(xiàn)單位根時,待預(yù)測序列為平穩(wěn)的;反之,為非平穩(wěn)。對非平穩(wěn)隨機(jī)序列做d次一階差分處理直到檢驗(yàn)為平穩(wěn)序列為止,d即差分階數(shù);2)求取自相關(guān)函數(shù)與偏自相關(guān)函數(shù),通過赤池信息準(zhǔn)則判斷AIC 最小值來確定模型的階數(shù)q和p;3)模型的參數(shù)通過最小二乘法得到,使用殘差白噪聲檢驗(yàn)及參數(shù)的顯著性檢驗(yàn)來判斷參數(shù);4)使用ARIMA模型預(yù)測隨機(jī)序列。
光伏發(fā)電日功率曲線在趨勢上呈現(xiàn)一條類拋物線,受環(huán)境與氣象因素影響在該拋物線的基礎(chǔ)上再附加一些波動。本文數(shù)據(jù)來自吉林省某光伏電站實(shí)際數(shù)據(jù)。在預(yù)測開始之前對數(shù)據(jù)集進(jìn)行檢驗(yàn),保證同一電站功率及NWP(numerical weather prediction)數(shù)據(jù)在不同時段的通用性。
首先使用劃分聚類K-means 算法將光伏功率樣本集分成多個樣本簇,再利用層次聚類將數(shù)值和趨勢接近的聚類中心聚合得到新的聚類簇,集成聚類算法從原始功率數(shù)據(jù)集中提取出所有光伏出力類型曲線并以各聚類簇的聚類中心作為趨勢序列,最終聚類個數(shù)通過DBI 指數(shù)與輪廓系數(shù)來確定,其中DBI 指數(shù)表征聚類簇內(nèi)距離與其他簇間距離的關(guān)系,值越小聚類效果越好;輪廓系數(shù)為正表示樣本聚類合格,結(jié)果值越大效果越好。各聚類中心分別代表不同發(fā)電情況下的光伏出力類型。
不同聚類方法得到的隨機(jī)序列數(shù)值概率分布情況如圖2 所示。從圖中可以看出,作為劃分趨勢序列與隨機(jī)序列的方法,集成聚類的隨機(jī)序列數(shù)值擬合曲線處于0 值及其附近值較小區(qū)間的概率更高,表明集成聚類較劃分聚類能更好地將體現(xiàn)整體變化情況的數(shù)據(jù)保留在趨勢序列中。聚類算法本身無法確定劃分的最終個數(shù),引用DBI指數(shù)與輪廓系數(shù)確定最優(yōu)聚類樣本簇數(shù)量,DBI 指數(shù)值如圖3 所示。由圖可知,集成聚類的DBI指數(shù)要低于其他聚類方法,說明其聚類效果更好并且當(dāng)聚類個數(shù)為5 時,DBI 指數(shù)達(dá)到最低,此時輪廓系數(shù)為0.426 8,因此最優(yōu)聚類個數(shù)為5 個,本文劃分出5 種光伏出力類型,即趨勢序列。
圖2 不同聚類方法下的隨機(jī)序列數(shù)值分布Fig.2 Numerical distribution of random sequences under different clustering methods
圖3 不同聚類算法DBI指數(shù)Fig.3 Comparison of DBI index of different clustering algorithms
使用改進(jìn)MC 模型預(yù)測趨勢序列,可以有效避免序列存在波動導(dǎo)致MC 模型進(jìn)入平穩(wěn)分布。通過皮爾遜相關(guān)系數(shù)選擇NWP 中與功率序列相關(guān)性較高的氣象數(shù)據(jù)來確定待預(yù)測日的出力類型和波動數(shù)據(jù)。單獨(dú)狀態(tài)轉(zhuǎn)移概率矩陣預(yù)測單一增減變化趨勢的效果最優(yōu),如果按固定時段劃分預(yù)測區(qū)間,大概率會出現(xiàn)變化情況差異較大的兩個時間段被歸進(jìn)一個預(yù)測區(qū)間中,同時也可能將待預(yù)測序列幅值所在時點(diǎn)未劃至區(qū)間端點(diǎn),使該區(qū)間出現(xiàn)兩種完全相反的變化趨勢,直接導(dǎo)致此時間段準(zhǔn)確率下降甚至預(yù)測不收斂。由于前一區(qū)間的最后預(yù)測數(shù)值為相鄰下一區(qū)間的初始值,且馬爾科夫鏈模型具有無后效性,導(dǎo)致預(yù)測精度不高的數(shù)值介入其他預(yù)測區(qū)間,形成惡性循環(huán),降低整體預(yù)測準(zhǔn)確率。光伏發(fā)電日出力在一天內(nèi)呈現(xiàn)兩種相反的變化趨勢,全天的特征時段劃分至少以正午時刻為分界點(diǎn)劃為兩段,在此基礎(chǔ)上通過一階差分處理挖掘待預(yù)測時間段的序列特征進(jìn)一步劃分特征時段。
圖4 為趨勢序列改進(jìn)MC 模型與傳統(tǒng)MC 模型預(yù)測對比散點(diǎn)圖,點(diǎn)集越靠近等值線預(yù)測精度越高,5 種序列可視為不同季節(jié)及天氣下的光伏出力類型。由圖可知,改進(jìn)MC 模型預(yù)測結(jié)果更接近實(shí)際值,相比于直接固定時段劃分方法,特征時段的劃分不僅提升了預(yù)測精度和預(yù)測效率,也降低了計算成本。隨機(jī)序列由ARIMA 模型預(yù)測得出結(jié)果,同趨勢序列預(yù)測結(jié)果相加得到最終預(yù)測值。
圖4 劃分特征時段模型與傳統(tǒng)模型對比散點(diǎn)圖Fig.4 Scatter diagram comparing the model of dividing characteristic period with the traditional model
改進(jìn)MC模型預(yù)測框架圖如圖5所示。
圖5 預(yù)測框架圖Fig.5 Forecasting frame diagram
本文數(shù)據(jù)選用吉林省某光伏電站2017—2018年實(shí)際光伏發(fā)電運(yùn)行數(shù)據(jù)及NWP 數(shù)據(jù)。選取電站中某一場站進(jìn)行單場預(yù)測,時間分辨率為15 min,裝機(jī)容量為20 MW。清除功率序列異常數(shù)據(jù),以2017 年1 月1 日至12 月31 日全年數(shù)據(jù)作為訓(xùn)練集,2018年1月1日至12月31日數(shù)據(jù)作為測試集,檢驗(yàn)本文提出模型的可行性,選擇傳統(tǒng)MC-ARIMA 模型、改進(jìn)MC 模型、傳統(tǒng)MC 模型以及LSTM 長短時記憶網(wǎng)絡(luò)作為對比模型。
本文衡量模型預(yù)測效果的評價指標(biāo)為均方根誤差(root mean square error,RMSE)、平均絕對誤差(mean absolute error,MAE)、平均絕對百分比誤差(mean absolute percentage error,MAPE)和均方誤差(mean square error,MSE),計算公式如分別如式(8)—(10)所示。
式中:n為樣本數(shù)據(jù)數(shù)量;PPi為i時刻實(shí)際功率;PMi為i時刻預(yù)測功率;Cap為裝機(jī)容量。
集成聚類算法首先使用K-means 算法進(jìn)行初步劃分,本文初步聚類樣本簇數(shù)量設(shè)定為20;其次,層次聚類進(jìn)一步合并上一步得到的聚類中心,樣本間距離度量計算公式選擇歐氏距離,聚類結(jié)果如2.1 節(jié)所示,5 種趨勢序列包含的樣本數(shù)量分布如圖6所示。
圖6 各趨勢序列樣本數(shù)分布情況Fig.6 Distribution of sample number of each trend series
根據(jù)餅狀圖分布情況及NWP 數(shù)據(jù)分析,趨勢序列a 所在樣本簇為數(shù)值波動較為劇烈的集合,占比很小,包含雨天等天氣類型;序列b 代表夏季多云天氣電站出力情況;序列c 為晴天發(fā)電狀態(tài);序列d 為春秋兩季類晴天出力類型;序列e 代表陰天天氣下的發(fā)電狀態(tài),該狀態(tài)在全年中占比最大。
以待預(yù)測日NWP 數(shù)據(jù)為依據(jù)選擇對應(yīng)的趨勢序列以及隨機(jī)序列進(jìn)行建模。根據(jù)皮爾遜相關(guān)系數(shù)選取與光伏功率序列相關(guān)性較高的短波輻射、溫度及相對濕度為主要依據(jù)。
以趨勢序列b 為例,將趨勢序列進(jìn)行一階差分處理,結(jié)果如圖7 所示,開機(jī)時光伏功率上升速率較慢;在10:00 功率增速最大;接近幅值時增速開始下降,下午光伏功率曲線變化趨勢與上午相反,根據(jù)一階差分值將序列劃分為6 個特征時段分別建模預(yù)測。全天共96 個時點(diǎn),無光照時間段不參與預(yù)測過程,其中第一段時點(diǎn)區(qū)間為[19,28];第二段為[28,38];第三段為[38,45];第四段為[45,54];第五段為[54,65];第六段為[65,77],第45時點(diǎn)出現(xiàn)序列最大功率值。
圖7 趨勢序列b一階差分值Fig.7 Trend series b first order difference value
劃分特征時段后,各區(qū)間根據(jù)功率數(shù)值規(guī)定狀態(tài)區(qū)間,每一段的初始功率值為上一段預(yù)測值,初始值的狀態(tài)轉(zhuǎn)移計入轉(zhuǎn)移概率矩陣中,區(qū)間最后功率的狀態(tài)轉(zhuǎn)移由下一矩陣承接,不計入當(dāng)前特征時段中,趨勢序列b 預(yù)測結(jié)果對比如圖8 所示。從對比圖中可以看出,本文方法模型相比于傳統(tǒng)MC 模型預(yù)測效果更好,預(yù)測曲線變化速率以及數(shù)值更接近實(shí)際出力曲線。由于不需要直接固定劃分大量時段,減少大量計算成本,同時也防止因固定劃分使曲線幅值未處于區(qū)間端點(diǎn),導(dǎo)致預(yù)測精度下降。提取隨機(jī)序列,通過ARIMA 模型得到預(yù)測結(jié)果,與趨勢序列預(yù)測曲線相疊加得到最終預(yù)測曲線,所有出力類型預(yù)測結(jié)果如圖9—13所示。
圖8 趨勢序列b預(yù)測對比Fig.8 Comparison of trend series b predication values
圖9 趨勢序列a出力類型Fig.9 Trend series a output type
圖10 趨勢序列b出力類型Fig.10 Trend series b output type
圖11 趨勢序列c出力類型Fig.11 Trend series c output type
圖12 趨勢序列d出力類型Fig.12 Trend series d output type
圖13 趨勢序列e出力類型Fig.13 Trend series e output type
從所有出力類型圖可以看出,本文所提模型預(yù)測曲線整體趨勢上更接近實(shí)際功率曲線,當(dāng)待預(yù)測曲線出現(xiàn)小幅值的波動時預(yù)測效果更好;波動較劇烈時,本文所提方法預(yù)測曲線更靠近實(shí)際出力曲線,在非晴天天氣類型下對比模型誤差快速增大,但本文模型均方根誤差、絕度誤差等指標(biāo)均保持最小,在不同出力類型下準(zhǔn)確率相比其他模型更高一些。根據(jù)各類型待預(yù)測日NWP 數(shù)據(jù)可知,晴天天氣類型下各模型預(yù)測效果差距不大,當(dāng)待預(yù)測日出現(xiàn)了云層遮擋及降雨天氣情況,本文提出的模型在陰天天氣類型下預(yù)測數(shù)值并未過分偏離實(shí)際出力值,預(yù)測精度高于其他對比模型。
為進(jìn)一步說明模型預(yù)測精度,選取一天中出力類型不唯一,即出現(xiàn)多種天氣類型的日出力序列作為待預(yù)測日,預(yù)測結(jié)果如圖14 所示。由圖可知,在雨轉(zhuǎn)晴天的天氣情況下,本文模型的預(yù)測更加靈活,相較于對比模型預(yù)測曲線更接近實(shí)際曲線,可以更準(zhǔn)確地預(yù)測一天中出現(xiàn)多種光伏出力類型序列。
圖14 混合出力類型Fig.14 Mixed output type
各誤差評價指標(biāo)雷達(dá)圖如圖15所示,所有可能出現(xiàn)的出力類型準(zhǔn)確率最低為89.18%,最高為97.71%,均高于傳統(tǒng)MC模型在內(nèi)的其他模型,說明本文所提模型在不同季節(jié)和天氣情況下具有較高的準(zhǔn)確率。其中,趨勢b 類型的待預(yù)測日下午出現(xiàn)了較大波動,RMSE 值為0.052 3,略高于類型a。類型d 的RMSE 值與MAE 值等誤差指標(biāo)均為最高,表明本文所提模型由于氣象因素影響產(chǎn)生序列波動越劇烈,誤差越大,準(zhǔn)確率較高的類型a誤差最低,其MAE值為0.015 1,MSE值為0.394 2。代表突變天氣的趨勢d 類型,本文所提模型MAE 值為0.050 4,對比模型MAE值最低為0.058 5,對比模型預(yù)測誤差均高于本文預(yù)測方法。綜上所述,本文模型在氣象條件惡劣條件預(yù)測效果更好,在所有天氣類型及多種出力類型下準(zhǔn)確率均為最高且誤差最小。
圖15 各種出力類型評價指標(biāo)Fig.15 Evaluation indexes of various output types
該光伏電站2018 年全年發(fā)電短期預(yù)測評價指標(biāo)平均值如表1 所示,本文模型準(zhǔn)確率高于其他對比模型,全年平均值為92.63%,各誤差指標(biāo)均為最小,其中相比于傳統(tǒng)MC 模型的RMSE 值減小了0.084 4,MAE 值降低了0.038 3,相較于LSTM 模型準(zhǔn)確率提高了6.99%。改進(jìn)后的MC 模型相比傳統(tǒng)模型在誤差上有所減小,其中MSE 值減小了2.169 4,說明改進(jìn)MC 模型可以有效減小各時刻預(yù)測值與實(shí)際值的偏差。本文所提模型誤差要低于單獨(dú)改進(jìn)MC 模型,結(jié)合前文各趨勢序列預(yù)測結(jié)果加以分析,表明MC 模型針對波動頻數(shù)較大的情況,預(yù)測效果較差,而配合ARIMA 模型分別預(yù)測趨勢與隨機(jī)序列能大大提高準(zhǔn)確率。同傳統(tǒng)MCARIMA 模型相比,本文模型準(zhǔn)確率提高了1.76%,說明改進(jìn)MC 模型能更好地預(yù)測趨勢序列,進(jìn)而在整體上減小預(yù)測誤差。
表1 吉林省電站評價指標(biāo)平均值Tab.1 Average value of evaluation index of Jilin power station
為體現(xiàn)本文模型的適用性,選擇氣象因素差異大、經(jīng)緯度及地理位置等相差較遠(yuǎn)的青海省某光伏電站的數(shù)據(jù)進(jìn)行預(yù)測。該電站裝機(jī)容量為40 MW,使用數(shù)據(jù)為2018 年至2019 年光伏功率及對應(yīng)的NWP 數(shù)據(jù),其中2018 年作為訓(xùn)練集;2019 年為測試集,全年各項(xiàng)評價指標(biāo)平均值如表2 所示??梢钥闯觯疚哪P歪槍μ鞖庾兓闆r較為復(fù)雜的地區(qū)準(zhǔn)確率仍然滿足短期功率預(yù)測要求,且誤差較小,該模型對不同地區(qū)、不同光伏輸出類型具有一定的適用性。
表2 青海省電站評價指標(biāo)平均值Tab.2 Average value of evaluation index of Qinghai power station
為解決光伏功率具有隨機(jī)性等特點(diǎn)及傳統(tǒng)馬爾科夫鏈模型難以預(yù)測功率序列波動較大的問題,結(jié)合劃分聚類處理數(shù)據(jù)的高效性與層次聚類抗干擾性的優(yōu)點(diǎn),提出通過集成聚類提取聚類中心作為光伏功率曲線的趨勢序列,將代表波動的隨機(jī)序列幅值降到最小。利用一階差分處理得到序列變化趨勢來劃分特征時段以改進(jìn)馬爾科夫鏈模型,使用改進(jìn)MC 模型預(yù)測趨勢序列,防止因出現(xiàn)常返態(tài)進(jìn)入平穩(wěn)分布導(dǎo)致預(yù)測停止收斂;在保證預(yù)測精度的同時,減小計算成本。根據(jù)ARIMA 模型的特點(diǎn),使用該模型預(yù)測隨機(jī)序列。
對吉林省光伏電站進(jìn)行建模預(yù)測,本文所提預(yù)測模型全年平均準(zhǔn)確率為92.63%,高于其他對比模型。模型預(yù)測值的年平均RMSE 值比傳統(tǒng)馬爾科夫鏈模型減少1.76%,相較于LSTM 模型下降6.99%,MAE 和MSE 誤差值均為最小。通過對青海省光伏電站建模預(yù)測,本文所提模型全年平均準(zhǔn)確率為90.14%,相比于傳統(tǒng)MC 模型提高了7.07%,證明本文模型針對不同地區(qū)、不同氣象類型具有適用性。
本文模型主要聚焦于功率數(shù)據(jù)的處理與應(yīng)用,預(yù)測針對NWP 數(shù)據(jù)的使用較少。后續(xù)工作將在引入氣象數(shù)據(jù)來提升預(yù)測方法的精度,同時在空間相關(guān)性層面進(jìn)行研究,完善預(yù)測模型的不足。