尚慶功 ,杭舟 ,尚暖
(1.國網(wǎng)江蘇省電力有限公司連云港市贛榆區(qū)供電分公司,連云港 222100;2.國網(wǎng)江蘇省電力有限公司東??h供電分公司,連云港 222300;3.國網(wǎng)江蘇省電力有限公司連云港供電分公司,連云港 222000)
國家能源結(jié)構(gòu)轉(zhuǎn)型的深入、雙碳發(fā)展戰(zhàn)略的實施,加快了可再生能源的發(fā)展,其利用率呈連年增高發(fā)展態(tài)勢變化[1-3]。太陽能是自然界中的天然能源,對其進行高效利用可滿足碳中和背景下的碳排放要求,因此光伏發(fā)電在各個國家均受到高度關(guān)注。分布式光伏的應(yīng)用對國家能源產(chǎn)業(yè)化發(fā)展起到了積極促進作用[4-6]。但分布式光伏發(fā)電會隨著氣象條件的改變而不斷發(fā)生變化,具有穩(wěn)定性低的特點,將其接入配電網(wǎng),可能會造成配電網(wǎng)電壓的波動、電能質(zhì)量的下降等[7,8]。
時珉等人針對分布式光伏入網(wǎng)功率預(yù)測問題,采用隨機森林算法確定光伏出力特征參數(shù)后,將其作為自適應(yīng)神經(jīng)模糊推理算法的輸入,實現(xiàn)模型的離線訓(xùn)練[9];趙濱濱等人為提高配電網(wǎng)的協(xié)同優(yōu)化控制效果,研究了分布式光伏預(yù)測方法,利用基于ARIMA 的預(yù)測模型,來獲得分布式光伏功率預(yù)測結(jié)果[10]。以上方法均未考慮地理位置差異帶來的氣象信息時移問題,導(dǎo)致光伏出力預(yù)測結(jié)果并不夠準(zhǔn)確。
在實際應(yīng)用中,受成本等因素的影響,各分布式光伏站點并不完全具有數(shù)值天氣預(yù)報(NWP)數(shù)據(jù),存在氣象數(shù)據(jù)缺失問題[11]。依據(jù)各分布式光伏站點間的空間關(guān)聯(lián)性,利用區(qū)域內(nèi)光伏基站的完備NWP 數(shù)據(jù)進行目標(biāo)光伏站點出力預(yù)測,是存在預(yù)測誤差的,這主要是分布式光伏站點地理位置差異導(dǎo)致的氣象信息時移引起的[12]。為解決預(yù)測誤差問題,提出考慮信息時移的分布式光伏接入配電網(wǎng)功率預(yù)測方法,通過確定最佳時移量完成分布式光伏站點氣象數(shù)據(jù)存在的偏移修正,在對分布式光伏出力數(shù)據(jù)特征進行選擇后,輸入到基于注意力機制卷積雙向GRU 預(yù)測模型中,以實現(xiàn)其功率的準(zhǔn)確預(yù)測。
在分布式光伏接入配電網(wǎng)中,各光伏電站輸出功率具有空間關(guān)聯(lián)性,將具有NWP 的集中式光伏電站作為基站,可實現(xiàn)目標(biāo)光伏電站功率的預(yù)測,但由于各光伏電站地理位置的差異,使得各光伏電站氣象數(shù)據(jù)具有時間偏移性。考慮地理位置差異引發(fā)的信息時移,修正目標(biāo)光伏電站的氣象信息,是實現(xiàn)分布式光伏接入配電網(wǎng)功率精準(zhǔn)預(yù)測的重要途徑。理想情況下,在已知基站與目標(biāo)光伏電站的地理位置后,即可完成時間偏移量的計算,但在實際工作中,可能存在分布式光伏電站經(jīng)緯度數(shù)據(jù)缺失問題,故在獲取集中式光伏電站的歷史氣象數(shù)據(jù)后,繪制其氣象曲線,再對其作平移處理,以使目標(biāo)光伏電站輸出功率曲線與其具有最大關(guān)聯(lián)性,實現(xiàn)時移量的獲取。具體為:采用皮爾遜相關(guān)系數(shù)分析氣象數(shù)據(jù)中的關(guān)鍵氣象因子、光伏輸出功率之間的關(guān)聯(lián)關(guān)系,獲取與光伏輸出功率具有最大關(guān)聯(lián)的氣象因子,將其視為對照變量,完成最優(yōu)時移的確定。經(jīng)研究發(fā)現(xiàn),影響光伏輸出功率變化的重要氣象因子為總輻照度,因此,將其視為變量實現(xiàn)最優(yōu)時移的求取。
將原時間點作為起點,沿左右方向完成總輻照度歷史信息數(shù)據(jù)的移動處理后,對此刻的總輻照度大小進行運算,同時確定各目標(biāo)光伏電站歷史出力皮爾遜相關(guān)系數(shù),從中篩選出最大皮爾遜相關(guān)系數(shù)(PCC),與之對應(yīng)的平移量即為目標(biāo)光伏電站的最佳氣象時移量。將15 min 作為分布式光伏接入配電網(wǎng)功率預(yù)測周期ΔT,由于最佳時移量可能存在非整數(shù)倍ΔT的情況,通過三次樣條差值處理總輻照度變量,經(jīng)加密后,可獲取周期為Δt=15 min 的密集氣象數(shù)據(jù)。最佳時移量的確定過程為:
第一步:獲取歷史氣象數(shù)據(jù),通過運算確定總輻照度序列,表示為R={rT1,rT2,…,rTn},P={pT1,pT2,…,pTn}為與之相對應(yīng)的光伏出力序列。對于歷史氣象數(shù)據(jù),其時間序列通過T1,T2,…,Tn表示,其數(shù)量表示為n。
第二步:對R進行三次樣條差值處理,加密后的總輻照度序列通過Rnew=表示,t1,t2,…tq,…,t3n-2為處理后的時間序列。
第三步:設(shè)定q為1。
第四步:將Rnew中的元素q作為起始點,選擇n-4 個點,ΔT表示時間周期,對Rnew進行校正處理,獲得R′new,對R′new與P的皮爾遜相關(guān)系數(shù)進行求取,并保存在集合A中。
第五步:令q=q+1,當(dāng)q>3n-2,則跳轉(zhuǎn)至步驟六,反之,返回步驟四。
第六步:對A中的皮爾遜相關(guān)系數(shù)進行降序排列,確定最大系數(shù)對應(yīng)的平移量,確定最佳時移量。
采用隨機森林算法對分布式光伏原始數(shù)據(jù)特征進行重要度分析,以完成高貢獻特征的選擇,從而提高功率預(yù)測模型的預(yù)測效果。該算法原理是將B作為分布式光伏原始數(shù)據(jù)集,以反復(fù)抽樣方式對B數(shù)據(jù)集進行處理,獲得若干個樣本后,完成新樣本子集的確定,由此構(gòu)建決策樹,獲得的數(shù)量為k的決策樹構(gòu)成了決策森林。該算法通過對構(gòu)造的若干決策樹的排列分布,使得分布式光伏原始數(shù)據(jù)的特征選擇能力獲得顯著提升。
在通常狀況下,各決策樹的分布概率具有一致性,不同決策樹的學(xué)習(xí)率大小對隨機森林算法的擬合誤差起決定性作用。對于樣本數(shù)據(jù)集B,其子集表示為C;對B進行抽取時,未被采樣到的樣本定義為樹外樣本,通過B-表示,其子集表示為C-。分布式光伏原始數(shù)據(jù)特征的貢獻度可通過擬合誤差值來確定,如式(1)所示
式中:gx(i)——將B作為預(yù)測原始數(shù)據(jù)集時得到的擬合屬性參數(shù),及x經(jīng)過置換處理后確定的擬合屬性參數(shù);x——分布式光伏原始數(shù)據(jù)特征參數(shù);I——對于樹外樣本的誤差函數(shù);yi——第i個數(shù)據(jù)的擬合屬性參數(shù)。
選擇S(xj)值高的分布式光伏原始數(shù)據(jù)特征,用以作為后續(xù)功率預(yù)測模型的輸入。
1.3.1 雙向門控循環(huán)控制網(wǎng)絡(luò)
GRU 是在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)結(jié)構(gòu)基礎(chǔ)上發(fā)展而來,其優(yōu)勢是避免了傳統(tǒng)RNN 網(wǎng)絡(luò)訓(xùn)練過程中梯度下降等問題[13]。GRU 網(wǎng)絡(luò)基本結(jié)構(gòu)如圖1所示,在t時間的時間序列輸入信息通過Xt表示。重置門、更新門是其重要組成部分,分別表示為Rt、Zt,其中,Rt是t時刻輸入Xt的函數(shù),可對t-1 時刻歷史狀態(tài)信息的輸入量進行控制,以便獲取Xt中的短期依賴關(guān)系;Zt為t-1 時刻隱含狀態(tài)Ht-1的函數(shù),用于反映t時刻隱含狀態(tài)中所含歷史信息的多少,對輸入Xt中長期依賴關(guān)系的確定產(chǎn)生有利影響。利用sigmoid 函數(shù)對門限區(qū)間進行控制,使其滿足(0,1);隱含、候選隱含狀態(tài)分別通過Ht表示。
圖1 GRU 網(wǎng)絡(luò)基本結(jié)構(gòu)圖Fig.1 Basic structure of GRU network
基于GRU 網(wǎng)絡(luò)結(jié)構(gòu),可確定式(2)至式(5)。
式中:σ——激活函數(shù);Wxr,Whr,Wxz,Whz,Wxh,Whh——GRU 網(wǎng)絡(luò)涉及的權(quán)值矩陣;br,bz,bh——Rt、Zt的偏置量。單向GRU 網(wǎng)絡(luò)僅能通過獲取歷史輸入信息以實現(xiàn)當(dāng)前時刻輸出結(jié)果的預(yù)估,具有單方向傳播性,容易發(fā)生遺忘問題,使得關(guān)鍵時序信息發(fā)生缺失。為此,構(gòu)建雙向GRU 網(wǎng)絡(luò)模型,將目標(biāo)光伏電站的時間序列特征數(shù)據(jù)作為模型輸入,分別通過正向、逆向?qū)W習(xí)實現(xiàn)雙GRU 模型的訓(xùn)練,對正、逆向?qū)W習(xí)過程中的最終狀態(tài)向量作拼接處理,實現(xiàn)分布式光伏接入配電網(wǎng)功率預(yù)測結(jié)果的確定。雙向GRU網(wǎng)絡(luò)模型能夠兼顧歷史數(shù)據(jù)以及未來信息的學(xué)習(xí),準(zhǔn)確獲取分布式光伏的動態(tài)變化趨勢,提高了預(yù)測模型的預(yù)測性能。
1.3.2 注意力機制(Attention)
注意力機制是模仿人類視覺觀察事物的特點,以獲取高價值信息的過程,在時序預(yù)測等領(lǐng)域受到廣泛關(guān)注。注意力機制原理是在已知時間序列輸入信息的基礎(chǔ)上,獲取其特征權(quán)值以實現(xiàn)輸入的加權(quán)求和處理,通過重要特征賦予的權(quán)值大、非重要特征賦予的權(quán)值小的方式實現(xiàn)輸入信息重要部分的學(xué)習(xí),以達到預(yù)測精度提升目標(biāo)[14,15]。將Attention 機制引入到雙向GRU 模型中,以獲取目標(biāo)光伏電站與配電網(wǎng)內(nèi)鄰近氣象信息時間位點間的聯(lián)系,以實現(xiàn)分布式光伏接入配電網(wǎng)功率預(yù)測模型的氣象時移量的修正。采用卷積神經(jīng)網(wǎng)絡(luò)對輸入時間序列的各個時間步進行捕捉,經(jīng)過滑動窗內(nèi)隱含層矩陣的若干次一維卷積操作后,實現(xiàn)若干時間模式的確定,如式(6)所示
式中:Qi——對于雙向GRU 模型,其隱含層矩陣的第i個行向量;Dj——第j個卷積核。
利用激活函數(shù)確定與評分對應(yīng)的第i個行向量注意力權(quán)值,表示為αi,再計算αi與QD i的乘積,并作加和處理后,可獲得上下文向量,如式(8)所示
式中:m——對于時間模式矩陣總行數(shù)。
利用全連接層對vt與qt作融合處理,即可完成時間步輸出結(jié)果的確定,如式(9)所示
式中:Wh——該層權(quán)值;[·]——兩向量間的融合處理。
1.3.3 基于注意力機制的卷積雙向GRU 的功率預(yù)測模型
為實現(xiàn)分布式光伏接入配電網(wǎng)功率的精準(zhǔn)預(yù)測,構(gòu)建了基于注意力機制的卷積雙向GRU 網(wǎng)絡(luò),利用卷積神經(jīng)網(wǎng)絡(luò)對輸入時間序列的各個時間步進行捕捉,通過Attention 機制降低地理位置差異引起的氣象信息時移問題,實現(xiàn)分布式光伏接入配電網(wǎng)功率預(yù)測模型的氣象時移量的修正?;谧⒁饬C制的卷積雙向GRU 的功率預(yù)測模型具體為:
該功率預(yù)測模型采用隨機森林算法對特征貢獻度進行計算,以此確定光伏出力數(shù)據(jù)特征,將其輸入到功率預(yù)測模型中,以T為時間步滑動窗口,在對其作預(yù)處理的基礎(chǔ)上,可得到X=[xT1,xT2,…,xTn]的時間序列。通過雙向GRU 網(wǎng)絡(luò)對獲取的時間序列特征進行學(xué)習(xí),利用卷積神經(jīng)網(wǎng)絡(luò)對其各個時間步進行捕捉,其結(jié)構(gòu)中由卷積、池化層構(gòu)成,數(shù)量分別為2、1,卷積核均設(shè)定為1 ×1。利用注意力機制對功率預(yù)測模型中的氣象時移進行修正,再利用全連接層對分布式光伏接入配電網(wǎng)功率進行預(yù)測,如式(10)所示
式中:yt——在t時間點,分布式光伏接入配電網(wǎng)功率預(yù)測;WO,bo——權(quán)值矩陣及偏置。
最后通過輸出層對其進行輸出。
以某地區(qū)分布式光伏接入配電網(wǎng)為研究對象,利用Matlab 工具進行模擬分析,該區(qū)域配電網(wǎng)內(nèi)含有的分布式光伏站點數(shù)量為6,標(biāo)記為Ⅰ-Ⅵ,對應(yīng)容量為22.5 kW、110.6 kW、137 kW、98 kW、148 kW、64 kW。獲取該區(qū)域各光伏站點2020 年5 月1 日-10 月30 日出力數(shù)據(jù),由功率計量表以15 min 為一個采樣周期對其實際功率值進行96 點采集,從區(qū)域氣象站獲取同期NWP 數(shù)據(jù),構(gòu)建原始數(shù)據(jù)集。將2020 年10 月27 日前的光伏出力及氣象數(shù)據(jù)作為預(yù)測模型訓(xùn)練樣本,采用本方法對后三天的分布式光伏輸出功率進行預(yù)測,分析預(yù)測效果。
基于原始數(shù)據(jù)集獲取各分布式光伏出力曲線,將其與氣象總輻照度曲線進行對比,分析兩曲線的變化特點,試驗結(jié)果如圖2 所示。
圖2 總輻照度、分布式光伏出力曲線分析圖Fig.2 Analysis of total irradiance and distributed photovoltaic output curve
分析圖2 可知,各分布式光伏出力曲線變化趨勢相近,只在曲線峰值與外形上存在不同,這是由于各分布式光伏裝機容量等因素差異造成的;氣象總輻照度曲線的運行趨勢與之大體相同,表明可通過對總輻照度曲線進行平移處理,實現(xiàn)氣象數(shù)據(jù)信息的修正。試驗結(jié)果表明,通過氣象站的NWP 數(shù)據(jù)進行分布式光伏接入配電網(wǎng)功率預(yù)測是可取的。
各分布式光伏站點地理位置存在差異,利用相同氣象數(shù)據(jù)對分布式光伏接入配電網(wǎng)功率進行預(yù)測,將會產(chǎn)生較大誤差,因此,確定最佳時移量實現(xiàn)氣象信息數(shù)據(jù)的偏移糾正顯得十分必要。通過計算不同時移量下的總輻照度與各分布式光伏站點出力的皮爾遜相關(guān)系數(shù)(PCC)的變化,實現(xiàn)最佳時移量的確定,試驗結(jié)果如表1 所示。
表1 總輻照度與各光伏站點出力的PCC 計算結(jié)果分析Tab.1 PCC calculation results analysis of total irradiance and output of each photovoltaic station
分析表1 可知,采用本方法對各光伏站點的最佳時移量進行確定,能夠獲得PCC 值計算結(jié)果,確定最大PCC 值對應(yīng)的時移量,Ⅰ-Ⅵ各分布式光伏站點的最佳時移量分別為-10、-10、-10、5、-5、-15,將光伏出力曲線作為參照,當(dāng)總輻照度曲線移向其左側(cè)時,時移量即標(biāo)記為負數(shù),反之則用正數(shù)標(biāo)記。
以Ⅰ分布式光伏站點為例,采用本方法對該站點2020 年10 月28~30 日(典型日)的輸出功率進行預(yù)測,并與未考慮信息時移的預(yù)測結(jié)果與Ⅰ的實際出力值進行對比,通過分析預(yù)測誤差驗證文章方法的功率預(yù)測性能,試驗結(jié)果如圖3 至圖5 所示。
圖3 10 月28 日(晴天)功率預(yù)測結(jié)果分析圖Fig.3 Analysis of power prediction results on October 28th (clear day)
分析圖3 可知,10 月28 日為晴天,光照充足,分布式光伏發(fā)電運行期間氣象條件波動幅度很小,在未考慮信息時移時,預(yù)測結(jié)果也未存在大幅度偏差;預(yù)測結(jié)果與實際功率值基本一致,二者間誤差極小。由圖4 可知,10 月29 日為陰天,日照強度變化較大,分布式光伏發(fā)電的波動幅度隨之增大,功率曲線不平滑,功率預(yù)測較為精準(zhǔn),誤差雖比晴天時有所提升,但仍在允許范圍之內(nèi);不考慮信息時移的預(yù)測結(jié)果誤差較大,明顯偏離實際功率值。圖5 中,該日為晴轉(zhuǎn)小雨天氣,6 點以后隨著太陽光照強度的增加,光伏出力不斷上升,13 點左右天氣開始轉(zhuǎn)陰,光照強度大幅開始減弱,光伏輸出功率值大幅度下滑,16 時左右雨停,但此刻日照強度不足,Ⅰ分布式光伏輸出功率僅有小幅度增高,18 點后功率值不斷減小,直至Ⅰ分布式光伏停止運行,輸出功率降低至0。預(yù)測曲線仍可以與實際功率曲線保持一致的走勢規(guī)律,未有大幅度誤差波動,但未考慮信息時移的預(yù)測結(jié)果則偏離實際功率值,預(yù)測誤差過大。試驗結(jié)果表明,本方法因考慮信息時移,對氣象數(shù)據(jù)進行修正,有效提升了功率預(yù)測效果。
圖4 10 月29 日(多云)功率預(yù)測結(jié)果分析圖Fig.4 Analysis of power prediction results on October 29th (cloudy)
圖5 10 月30 日(晴轉(zhuǎn)小雨)功率預(yù)測結(jié)果分析圖Fig.5 Analysis of power forecast results on October 30th (clear to light rain)
應(yīng)用本方法對某地區(qū)分布式光伏接入配電網(wǎng)功率進行預(yù)測,利用最佳時移量糾正地理差異造成的氣象數(shù)據(jù)偏移造成的誤差,通過對不同氣象條件下的分布式光伏功率預(yù)測結(jié)果驗證文章方法的應(yīng)用效果。試驗結(jié)果表明:本方法可對各分布式光伏的最佳時移量進行確定,完成氣象信息時移的修正;能夠?qū)θN不同氣象條件下的分布式光伏輸出功率進行預(yù)測,預(yù)測誤差低。