楊 琪,王維慶,2*,王海云,2,高 敏
(1.新疆大學(xué) 電氣工程學(xué)院,新疆 烏魯木齊830047;2.教育部可再生能源發(fā)電與并網(wǎng)控制工程技術(shù)研究中心,新疆 烏魯木齊830047;3.國(guó)網(wǎng)阿合奇縣供電公司,新疆 阿合奇843500)
煤礦、石油等能源日益枯竭,生態(tài)環(huán)境不斷惡化,太陽(yáng)能作為可持續(xù)發(fā)展的清潔能源備受關(guān)注,太陽(yáng)能發(fā)電是太陽(yáng)能利用的主要方式之一.光伏發(fā)電系統(tǒng)的輸出功率與太陽(yáng)輻射量密切相關(guān),準(zhǔn)確預(yù)測(cè)光伏系統(tǒng)輸出功率是電網(wǎng)安全穩(wěn)定運(yùn)行的關(guān)鍵,因此太陽(yáng)輻射量的準(zhǔn)確預(yù)測(cè)尤為重要[1-2].
研究人員對(duì)光伏出力和太陽(yáng)輻射量的預(yù)測(cè)做了大量的研究,文獻(xiàn)[3]分析影響光伏出力的因素,建立基于BP神經(jīng)網(wǎng)絡(luò)的光伏發(fā)電短期出力的預(yù)測(cè)模型,但模型缺乏對(duì)輸入量的優(yōu)選,影響預(yù)測(cè)精度.文獻(xiàn)[4]設(shè)計(jì)了基于相似日理論和BP神經(jīng)網(wǎng)絡(luò)的光伏陣列輸出功率的預(yù)測(cè)模型,改善了預(yù)測(cè)精度.文獻(xiàn)[5]建立了具有超強(qiáng)泛化能力的小波神經(jīng)網(wǎng)絡(luò)短期發(fā)電量的預(yù)測(cè)模型,進(jìn)一步提高了太陽(yáng)輻射量的預(yù)測(cè)精度,但需要大量與預(yù)測(cè)日相似的數(shù)據(jù).文獻(xiàn)[6]建立了基于氣象預(yù)測(cè)信息以及 BP 神經(jīng)網(wǎng)絡(luò)的光伏功率預(yù)測(cè)模型,但沒(méi)有對(duì)氣象數(shù)據(jù)進(jìn)行合理的預(yù)處理.文獻(xiàn)[7]提出了基于蟻群BP 神經(jīng)網(wǎng)絡(luò)的太陽(yáng)輻射強(qiáng)度的改進(jìn)預(yù)測(cè)方法,但也忽略了數(shù)據(jù)的預(yù)處理.文獻(xiàn)[8]用模糊理論結(jié)合支持向量機(jī)預(yù)測(cè)光伏發(fā)電量,但模糊集合的劃分需要龐大的數(shù)據(jù)和經(jīng)驗(yàn).文獻(xiàn)[9]提出了基于模糊聚類的預(yù)測(cè)算法,對(duì)光伏出力進(jìn)行短期預(yù)測(cè).文獻(xiàn)[10]提出了基于模糊神經(jīng)網(wǎng)絡(luò)的光伏功率控制方法.文獻(xiàn)[11]基于測(cè)試水平面及不同傾角斜面上太陽(yáng)輻射量,提出了針對(duì)直接輻射轉(zhuǎn)換系數(shù)的修正方法.文獻(xiàn)[12] 提出了基于小波包-神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法,利用小波包變換對(duì)輻射強(qiáng)度序列進(jìn)行多尺度分解.文獻(xiàn)[13]提出了一種基于GBDT(gradient boosting decision tree)算法的短期負(fù)荷預(yù)測(cè)模型,GBDT算法可應(yīng)用于電力預(yù)測(cè)領(lǐng)域.文獻(xiàn)[14]提出了改進(jìn)的 GBDT 短期負(fù)荷預(yù)測(cè)算法,算法具有較高的預(yù)測(cè)精度.
綜上所述,現(xiàn)有的太陽(yáng)輻射量預(yù)測(cè)重在算法改進(jìn),忽略了對(duì)原始數(shù)據(jù)的修正,預(yù)測(cè)結(jié)果存在一定誤差.GBDT算法已運(yùn)用于電力負(fù)荷預(yù)測(cè)領(lǐng)域,筆者擬將GBDT算法運(yùn)用于太陽(yáng)輻射量預(yù)測(cè),提出一種相關(guān)性分析和GBDT組合的太陽(yáng)輻射量預(yù)測(cè)算法.
相關(guān)性分析是對(duì)兩個(gè)或多個(gè)具備相關(guān)性的變量進(jìn)行分析,衡量變量間的密切程度[15].相關(guān)性一般分為:正相關(guān)、負(fù)相關(guān)和無(wú)相關(guān).Pearson相關(guān)系數(shù)[16]能較好地表示變量的相關(guān)性,其表達(dá)式為
(1)
其中:sim(X,Y)表示變量X、Y間的相似度,i表示某變量的第i個(gè)樣本,n為樣本總數(shù).
當(dāng)sim(X,Y)大于0表示兩變量正相關(guān)、小于0表示兩變量負(fù)相關(guān).當(dāng)0<|sim(X,Y)|<0.5時(shí),表示兩變量低度相關(guān);當(dāng)0.5≤|sim(X,Y)|<0.8時(shí),表示兩變量中度相關(guān);當(dāng)|sim(X,Y)|≥0.8時(shí),表示兩變量高度相關(guān).筆者利用相關(guān)性分析各氣象因素與太陽(yáng)輻射量的相關(guān)性,根據(jù)具體的相關(guān)性和實(shí)際情況,選擇高度相關(guān)和中度相關(guān)的變量作為預(yù)測(cè)算法的最優(yōu)輸入指標(biāo).
梯度提升決策樹(shù)預(yù)測(cè)函數(shù)[17]的表達(dá)式為
(2)
其中:x為輸入樣本,ht為第t棵回歸樹(shù),ωt為回歸樹(shù)參數(shù),ρt為第t棵回歸樹(shù)的權(quán)重.
對(duì)于N個(gè)樣本, 預(yù)測(cè)函數(shù)的最優(yōu)值為
(3)
其中:L為損失函數(shù).
梯度提升決策樹(shù)算法的迭代過(guò)程如下:
(1) 定義
(4)
其中:fi為弱學(xué)習(xí)器.
(2) 構(gòu)造基于回歸樹(shù)的訓(xùn)練樣本、目標(biāo)函數(shù)分別為
(5)
L(yi,F(xi))=(yi-F(xi))2,
(6)
其中:(yi,xi)∈R×RN.
(3) 基于梯度下降方向,訓(xùn)練決策樹(shù),得到的擬合數(shù)據(jù)為
(7)
其最佳擬合數(shù)據(jù)為
(8)
(4) 求得梯度下降方向的最佳步長(zhǎng)為
(9)
其中:ρt0為第t顆回歸樹(shù)的初始權(quán)重.
(5) 求得第t棵回歸樹(shù)的弱學(xué)習(xí)器為
ft=ρ*ht(xi,ω*).
(10)
(6) 迭代后的預(yù)測(cè)函數(shù)為
Ft(x)=Ft-1(x)+ft,
(11)
若損失函數(shù)滿足誤差收斂條件或得到的回歸樹(shù)的t值達(dá)到預(yù)設(shè)值,則迭代終止;若不滿足,則繼續(xù)迭代.
影響太陽(yáng)輻射量的因素眾多,且太陽(yáng)輻射量與氣象數(shù)據(jù)的耦合關(guān)系復(fù)雜,數(shù)據(jù)龐大冗余,需要挑選出與太陽(yáng)輻射相關(guān)性較強(qiáng)的因素.
3.1.1 輸入指標(biāo)選擇
影響太陽(yáng)輻射量的相關(guān)氣象數(shù)據(jù)主要有:平均晴空太陽(yáng)輻射量、晴空日照比、平均日照比、地表最高溫度、地表平均溫度、地表最低溫度、距地10 m最高溫度、距地10 m平均溫度、距地10 m最低溫度、距地50 m平均溫度、距地10 m濕度、地表濕度、相對(duì)濕度、地表風(fēng)速、距地50 m風(fēng)速、大氣壓強(qiáng)、站點(diǎn)海拔.對(duì)烏魯木齊某地2017年全年數(shù)據(jù)做相關(guān)性分析,分析結(jié)果如表1所示.
表1 太陽(yáng)輻射量影響因素的相關(guān)性
由表1可知,各影響因素與太陽(yáng)輻射量的相關(guān)性有大有小、正負(fù)不同.選擇相關(guān)性高度相關(guān)和中度相關(guān)的指標(biāo),對(duì)于低度相關(guān)的因素不予考慮,故最終選擇平均晴空太陽(yáng)輻射量、晴空日照比、平均日照比、地表平均溫度、距地10 m平均溫度、相對(duì)濕度、站點(diǎn)海拔、大氣壓強(qiáng)為該文預(yù)測(cè)算法輸入量.
3.1.2 數(shù)據(jù)矯正
原始數(shù)據(jù)中存在大量的畸形數(shù)據(jù),將原始數(shù)據(jù)直接作為預(yù)測(cè)算法的輸入量會(huì)嚴(yán)重影響算法訓(xùn)練精度和預(yù)測(cè)結(jié)果.為給預(yù)測(cè)算法提供良好的數(shù)據(jù),設(shè)計(jì)程序剔除原始輸入中的粗大誤差數(shù)據(jù),剔除之后的數(shù)據(jù)作為新的輸入量,流程如圖1所示.
圖1 數(shù)據(jù)矯正流程圖
由圖1可知,首先,輸入數(shù)據(jù),根據(jù)精度設(shè)置擬合曲線的參考方差Rf,設(shè)置擬合次數(shù)n(n從0開(kāi)始);然后,程序自動(dòng)對(duì)數(shù)據(jù)做n+1次擬合,計(jì)算每次擬合曲線的方差R,當(dāng)擬合曲線方差R符合參考方差Rf的要求時(shí)輸出擬合值yn;最后,對(duì)原數(shù)據(jù)做誤差矯正,輸出矯正數(shù)據(jù)y0,將其作為預(yù)測(cè)算法輸入值.
相關(guān)性分析和GBDT組合的太陽(yáng)輻射量預(yù)測(cè)算法流程如圖2所示.
圖2 組合預(yù)測(cè)算法流程圖
組合預(yù)測(cè)算法步驟如下:
(1) 選取歷史數(shù)據(jù),分析各因素與太陽(yáng)輻射量的相關(guān)性,根據(jù)相關(guān)性大小選取合適的輸入量;
(2) 對(duì)選取的輸入量進(jìn)行預(yù)處理,剔除粗大誤差數(shù)據(jù);
(3) 將矯正后的數(shù)據(jù)輸入GBDT預(yù)測(cè)模型Fn,設(shè)置抽樣次數(shù)N,訓(xùn)練預(yù)測(cè)算法直到滿足要求,停止訓(xùn)練并輸出預(yù)測(cè)結(jié)果;
(4) 利用均值法得到最終預(yù)測(cè)結(jié)果.
利用MATLAB軟件對(duì)太陽(yáng)輻射量的影響因素做相關(guān)性分析及數(shù)據(jù)矯正,利用相關(guān)性分析和GBDT組合的太陽(yáng)輻射量預(yù)測(cè)算法預(yù)測(cè)太陽(yáng)輻射量.訓(xùn)練樣本和預(yù)測(cè)樣本均來(lái)源于烏魯木齊某地太陽(yáng)輻射量數(shù)據(jù)和氣象數(shù)據(jù).
若原始數(shù)據(jù)直接用于預(yù)測(cè)算法,將嚴(yán)重影響預(yù)測(cè)算法的精準(zhǔn)度,筆者使用數(shù)據(jù)矯正方法對(duì)其進(jìn)行矯正,以提高預(yù)測(cè)精度.圖3為2017年烏魯木齊大氣壓強(qiáng)數(shù)據(jù)矯正前后的對(duì)比.由圖3可知,矯正值與原始值的曲線基本相同,僅部分?jǐn)?shù)據(jù)有所不同,表明矯正方法不會(huì)過(guò)多改變數(shù)據(jù)原有的信息,只會(huì)對(duì)原始數(shù)據(jù)中少數(shù)畸形數(shù)據(jù)進(jìn)行矯正.
圖3 大氣壓強(qiáng)矯正前后的對(duì)比
平均晴空太陽(yáng)輻射量、晴空日照比、平均日照比、地表平均溫度、距地10 m平均溫度、相對(duì)濕度、站點(diǎn)海拔、大氣壓強(qiáng)和太陽(yáng)輻射量作為實(shí)驗(yàn)數(shù)據(jù).以烏魯木齊某地2017年太陽(yáng)能輻射量數(shù)據(jù)和氣象數(shù)據(jù)做訓(xùn)練樣本數(shù)據(jù),以該地2018年1月1日到3月20日的80組數(shù)據(jù)為預(yù)測(cè)樣本數(shù)據(jù),利用該文組合預(yù)測(cè)算法進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖4所示.由圖4可知,預(yù)測(cè)值與實(shí)際值基本吻合,部分?jǐn)?shù)據(jù)有偏差,總體預(yù)測(cè)效果良好.圖5是預(yù)測(cè)值與真實(shí)值的相對(duì)誤差,誤差多數(shù)在10%以內(nèi),少數(shù)大于10%,極少數(shù)超過(guò)15%,預(yù)測(cè)精度達(dá)到要求.
圖4 太陽(yáng)輻射量預(yù)測(cè)結(jié)果
圖5 太陽(yáng)輻射量預(yù)測(cè)結(jié)果的相對(duì)誤差
為驗(yàn)證該文組合預(yù)測(cè)算法的優(yōu)越性,將該文算法的預(yù)測(cè)結(jié)果與BP神經(jīng)網(wǎng)絡(luò)、模糊神經(jīng)網(wǎng)絡(luò)、小波神經(jīng)網(wǎng)絡(luò)算法進(jìn)行對(duì)比,結(jié)果如圖6所示.
圖6 預(yù)測(cè)算法對(duì)比
由圖6可知,4種算法的預(yù)測(cè)結(jié)果整體趨勢(shì)基本相同,但在預(yù)測(cè)精度上有一定差別,該文算法預(yù)測(cè)精度最高, BP神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)精度最差.為定量分析預(yù)測(cè)算法的精度,分別計(jì)算4種算法預(yù)測(cè)結(jié)果的平均相對(duì)誤差和均方根誤差,結(jié)果如表2所示.
表2 算法誤差分析
由表2可知,該文算法的均方根誤差和平均相對(duì)誤差均小于其他算法,分別為0.547 6和8.04%,而B(niǎo)P神經(jīng)網(wǎng)絡(luò)算法的最大,分別為0.740 4和39.08%;模糊神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)算法的預(yù)測(cè)精度均略高于BP神經(jīng)網(wǎng)絡(luò).
筆者提出一種相關(guān)性分析和GBDT組合的太陽(yáng)輻射量預(yù)測(cè)算法.相關(guān)性分析和數(shù)據(jù)矯正方法能有效處理誤差數(shù)據(jù).預(yù)測(cè)實(shí)例分析結(jié)果表明,相比其他算法,該文組合算法的預(yù)測(cè)精度更高,為太陽(yáng)輻射量的高精預(yù)測(cè)打下了堅(jiān)實(shí)的基礎(chǔ).