吳詩(shī)芹,陸豪乾
(1.江蘇林洋新能源科技有限公司林洋新能源研究院,南京 210004;2.江蘇林洋光伏運(yùn)維有限公司,南京 210004)
太陽(yáng)輻射能是光伏發(fā)電系統(tǒng)的唯一能量來(lái)源。由于受到晝夜交替、季節(jié)更迭、天氣變化、地理位置等因素的影響,導(dǎo)致光伏發(fā)電具有間歇性、隨機(jī)性、波動(dòng)性的特點(diǎn)。因此,準(zhǔn)確預(yù)測(cè)并網(wǎng)型光伏發(fā)電系統(tǒng)的輸出功率,對(duì)電網(wǎng)調(diào)度,以及電網(wǎng)的安全穩(wěn)定和經(jīng)濟(jì)高效運(yùn)行具有重要意義。
目前已有許多預(yù)測(cè)并網(wǎng)型光伏發(fā)電系統(tǒng)輸出功率的方法,并以各類(lèi)神經(jīng)網(wǎng)絡(luò)算法及將神經(jīng)網(wǎng)絡(luò)算法與粒子群算法、遺傳算法等相結(jié)合的算法為主[1-2]。而且由于神經(jīng)網(wǎng)絡(luò)算法的學(xué)習(xí)能力與泛化能力較強(qiáng),該算法得到了更為廣泛的應(yīng)用[3]。
文獻(xiàn)[4]提出了一種基于Elman神經(jīng)網(wǎng)絡(luò)模型的光伏發(fā)電系統(tǒng)輸出功率的短期預(yù)測(cè)方法。結(jié)果顯示,晴天條件下,該模型的預(yù)測(cè)精度較高;但在陰雨天氣條件下,該模型的預(yù)測(cè)結(jié)果不理想。文獻(xiàn)[5]提出了通過(guò)提高氣象數(shù)據(jù)的聚類(lèi)效果來(lái)提高訓(xùn)練集與待預(yù)測(cè)日的相關(guān)度,從而提升光伏發(fā)電系統(tǒng)輸出功率短期預(yù)測(cè)精度的方法。但由于氣象數(shù)據(jù)維度較多,很難采集到所有維度的氣象數(shù)據(jù),導(dǎo)致相關(guān)度的提高受到限制。文獻(xiàn)[6]基于思維進(jìn)化算法和反向傳播(BP)神經(jīng)網(wǎng)絡(luò)算法建立了一種光伏發(fā)電系統(tǒng)輸出功率的短期預(yù)測(cè)模型,提高了BP神經(jīng)網(wǎng)絡(luò)算法的預(yù)測(cè)精度。但BP神經(jīng)網(wǎng)絡(luò)算法易出現(xiàn)局部最優(yōu)和迭代收斂慢的問(wèn)題。文獻(xiàn)[7]提出了通過(guò)對(duì)不同時(shí)刻氣象因子賦予不同的影響權(quán)重來(lái)改進(jìn)相似樣本的輸出選取與特征提取,從而進(jìn)行光伏發(fā)電系統(tǒng)的功率預(yù)測(cè)。但由于此方法需要對(duì)不同時(shí)刻的氣象因子賦予不同的權(quán)重,存在聚類(lèi)過(guò)程較為復(fù)雜、計(jì)算量太大的缺點(diǎn)。文獻(xiàn)[8-9]提出了小波分析和神經(jīng)網(wǎng)絡(luò)相結(jié)合的預(yù)測(cè)方法,降低了神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)誤差,更適合光伏發(fā)電系統(tǒng)輸出功率的超短期預(yù)測(cè)。文獻(xiàn)[10]建立了基于遺傳算法-模糊徑向基神經(jīng)網(wǎng)絡(luò)算法的預(yù)測(cè)模型,但該模型中相似日的選取過(guò)于簡(jiǎn)單,未考慮空氣相對(duì)濕度等氣象因素對(duì)光伏發(fā)電系統(tǒng)輸出功率的影響。
為進(jìn)一步提高光伏發(fā)電系統(tǒng)輸出功率的預(yù)測(cè)精度,本文提出了一種基于相似日理論和LIBSVM軟件中支持向量機(jī)回歸(SVR)算法的光伏發(fā)電系統(tǒng)輸出功率預(yù)測(cè)方法,并與同樣采用相似日理論的反向傳播(BP)神經(jīng)網(wǎng)絡(luò)算法、徑向基(RBF)神經(jīng)網(wǎng)絡(luò)算法和Elman神經(jīng)網(wǎng)絡(luò)算法的仿真結(jié)果進(jìn)行了比較分析,對(duì)本文所提出的預(yù)測(cè)方法的有效性進(jìn)行了驗(yàn)證。
眾所周知,太陽(yáng)輻射能是光伏發(fā)電系統(tǒng)輸出功率的唯一能量來(lái)源。而研究發(fā)現(xiàn),影響光伏發(fā)電系統(tǒng)輸出功率的因素很多,其中氣象因素包括太陽(yáng)輻照度、大氣溫度和相對(duì)濕度、風(fēng)速及氣壓等。不同的季節(jié)、天氣類(lèi)型或地理位置,均會(huì)導(dǎo)致光伏發(fā)電系統(tǒng)的輸出功率不同。
相似日理論的基本原理是:對(duì)于氣象特征參數(shù)相似的日期,這些日期的光伏發(fā)電系統(tǒng)輸出功率曲線也會(huì)近似相同。因此,選擇一個(gè)與待預(yù)測(cè)日具有相似氣象數(shù)據(jù)的日期作為相似日,將相似日的光伏發(fā)電系統(tǒng)輸出功率作為參考值,可以得到待預(yù)測(cè)日的光伏發(fā)電系統(tǒng)輸出功率。
1)按春季(3~5月)、夏季(6~8月)、秋季(9~11月)、冬季(12~次年2月)4個(gè)季節(jié)的時(shí)間序列將光伏發(fā)電系統(tǒng)的輸出功率及與其相關(guān)的氣象數(shù)據(jù)分為4個(gè)樣本集;然后再根據(jù)太陽(yáng)輻照度、大氣溫度和相對(duì)濕度這3個(gè)氣象因素,采用聚類(lèi)方法將各個(gè)樣本集內(nèi)的數(shù)據(jù)分為晴天、多云、陰天、雨(雪)天等幾個(gè)樣本子集。
2)由于在實(shí)際工程中,風(fēng)速、氣壓等物理量的采集數(shù)據(jù)嚴(yán)重缺失,但這些數(shù)據(jù)不是影響光伏發(fā)電系統(tǒng)輸出功率的主要因素,因而本文將太陽(yáng)輻照度、大氣溫度和相對(duì)濕度作為相似日提取時(shí)的輸入?yún)?shù)。根據(jù)數(shù)值天氣預(yù)報(bào)提供的待預(yù)測(cè)日的氣象數(shù)據(jù),在上述樣本子集中找出3~5個(gè)與待預(yù)測(cè)日具有相似氣象數(shù)據(jù)的日期。
3)將相似日的氣象數(shù)據(jù)輸入LIBSVM軟件中的SVR模型,并進(jìn)行訓(xùn)練。
在光伏發(fā)電系統(tǒng)的實(shí)測(cè)數(shù)據(jù)中會(huì)存在少量數(shù)據(jù)缺失的情況,可以通過(guò)線性插值的方法補(bǔ)全缺失值;對(duì)春季、夏季、秋季、冬季4個(gè)樣本集中的離群值,可以通過(guò)與該值臨近的實(shí)測(cè)值進(jìn)行補(bǔ)正。同時(shí),由于太陽(yáng)輻照度、大氣溫度及相對(duì)濕度等物理量的量綱不同,取值范圍不等,因此需要先對(duì)太陽(yáng)輻照度、大氣溫度、相對(duì)濕度等數(shù)據(jù)進(jìn)行歸一化處理,然后再用聚類(lèi)算法提取相似日。
LIBSVM軟件是由中國(guó)臺(tái)灣大學(xué)林智仁教授等開(kāi)發(fā)設(shè)計(jì)的一款簡(jiǎn)單、易于使用和快速有效進(jìn)行支持向量機(jī)(SVM)模式識(shí)別與回歸的軟件包,該軟件可用于解決分類(lèi)和回歸等諸多問(wèn)題。
本文案例采用LIBSVM軟件中的SVR算法,SVR算法是指利用SVM逼近函數(shù)的方法。
SVR算法為:給定一個(gè)數(shù)據(jù)序列{xi,yi}∈ (x,y),其中i=1, 2, …,n。n表示總的訓(xùn)練樣本個(gè)數(shù),x是xi的集合,y是yi的集合。其中,x為影響光伏發(fā)電系統(tǒng)輸出功率的因素,包括太陽(yáng)輻照度、大氣溫度、相對(duì)濕度、風(fēng)速等;xi為n個(gè)影響因素樣本中的第i個(gè)樣本;y為光伏發(fā)電系統(tǒng)輸出功率;yi為n個(gè)輸出功率樣本中的第i個(gè)樣本。
基于光伏發(fā)電系統(tǒng)運(yùn)行歷史數(shù)據(jù)庫(kù),提取出系統(tǒng)采集到的太陽(yáng)輻照度、大氣溫度、相對(duì)濕度及光伏發(fā)電系統(tǒng)輸出功率等歷史數(shù)據(jù)。根據(jù)SVR算法,建立光伏發(fā)電系統(tǒng)輸出功率預(yù)測(cè)模型,即尋找影響輸出功率的因素與輸出功率之間的關(guān)系,回歸函數(shù)的公式為:
支持向量機(jī)的本質(zhì)是基于核函數(shù)的方法,核函數(shù)的選擇會(huì)直接影響到分類(lèi)結(jié)果的準(zhǔn)確性。常用的核函數(shù)包括:1)RBF核函數(shù),比如K(xi x)=exp(-||x–xi||2/σ2),其中σ是寬度系數(shù)。2)線性核函數(shù),比如,K(xi x)=xi x。3)多項(xiàng)式核函數(shù),比如K(xi x)=(xi x+1)d,其中d為多項(xiàng)式的次數(shù),默認(rèn)值為3。4)Sigmoid核函數(shù),比如K(xi x)=tanh[γ(xi x)+θ],其中γ的默認(rèn)值為1/k,k為類(lèi)別數(shù);θ用來(lái)設(shè)置核函數(shù)中的coef0,默認(rèn)值為零。上述常用的核函數(shù)中,RBF核函數(shù)的運(yùn)算復(fù)雜度相對(duì)較低,因此本文選用RBF核函數(shù)[15-18]。
對(duì)于模型參數(shù)如何選擇,目前尚無(wú)統(tǒng)一的理論方法,一般是結(jié)合具體問(wèn)題,憑借經(jīng)驗(yàn)或通過(guò)反復(fù)試驗(yàn)確定相關(guān)參數(shù)[16,19]。采用LIBSVM軟件中的SVR算法進(jìn)行計(jì)算時(shí),需要設(shè)置nu、v和ε等參數(shù),其中,nu的不同取值分別表示設(shè)置不同的計(jì)算模式;v表示交叉驗(yàn)證模式,v值必須大于2;ε表示終止閾值。對(duì)于本文的算例,通過(guò)驗(yàn)算比較,最終選擇的參數(shù)是nu=0.5,v=5(表示5折交叉驗(yàn)證),允許的終止閾值ε=0.0001。
本文以江蘇省某光伏電站的實(shí)測(cè)數(shù)據(jù)為例進(jìn)行仿真計(jì)算。測(cè)試時(shí)間為2018年12月~2019年11月,每天07:00~17:00,每隔15 min采集1組數(shù)據(jù),采集內(nèi)容包括太陽(yáng)輻照度、大氣溫度、相對(duì)濕度和光伏發(fā)電系統(tǒng)的輸出功率。由于7月受?chē)?guó)家電網(wǎng)安全大檢查的影響,導(dǎo)致部分?jǐn)?shù)據(jù)未能上傳,存在數(shù)據(jù)缺失;此外,由于少數(shù)日期采集到的樣本數(shù)據(jù)缺失太多,所以這些日期的樣本數(shù)據(jù)直接舍棄。因此,采集數(shù)據(jù)實(shí)際的有效天數(shù)為334天,每天采集41組數(shù)據(jù),每組數(shù)據(jù)包括太陽(yáng)輻照度、大氣溫度、相對(duì)濕度、光伏發(fā)電系統(tǒng)輸出功率這4個(gè)氣象參數(shù),共計(jì)54776個(gè)樣本數(shù)據(jù)。
為了驗(yàn)證本文所提預(yù)測(cè)方法的有效性,在每個(gè)季節(jié)不同天氣類(lèi)型的每個(gè)樣本子集中各選擇3個(gè)日期作為待預(yù)測(cè)日的相似日,組成測(cè)試集。將測(cè)試集中每個(gè)日期的太陽(yáng)輻照度、大氣溫度及相對(duì)濕度作為輸入?yún)?shù),分別采用SVR算法、RBF神經(jīng)網(wǎng)絡(luò)算法、BP神經(jīng)網(wǎng)絡(luò)算法及Elman神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)光伏發(fā)電系統(tǒng)的輸出功率,并將預(yù)測(cè)值與實(shí)際的光伏發(fā)電系統(tǒng)輸出功率(實(shí)際值)進(jìn)行對(duì)比。
春季、夏季、秋季、冬季這4個(gè)季節(jié)不同天氣類(lèi)型時(shí)利用不同算法預(yù)測(cè)的光伏發(fā)電系統(tǒng)輸出功率曲線,以及實(shí)際的光伏發(fā)電系統(tǒng)輸出功率曲線情況,分別如圖1~ 圖4所示。
由于采用BP神經(jīng)網(wǎng)絡(luò)算法和Elman神經(jīng)網(wǎng)絡(luò)算法時(shí),二者初始化時(shí)的權(quán)值和閾值是隨機(jī)的,因而采用這2種算法進(jìn)行預(yù)測(cè)時(shí),每次預(yù)測(cè)的結(jié)果會(huì)不一樣。
圖1 春季不同天氣類(lèi)型時(shí)各種算法的光伏發(fā)電系統(tǒng)輸出功率預(yù)測(cè)值與實(shí)際值曲線Fig. 1 Curves of predicted output power and actual output power of PV power generation system of various algorithms in different weather types in spring
圖2 夏季不同天氣類(lèi)型時(shí)各種算法的光伏發(fā)電系統(tǒng)輸出功率預(yù)測(cè)值與實(shí)際值曲線Fig. 2 Curves of predicted output power and actual output power of PV power generation system of various algorithms in different weather types in summer
圖3 秋季不同天氣類(lèi)型時(shí)各種算法的光伏發(fā)電系統(tǒng)輸出功率預(yù)測(cè)值與實(shí)際值曲線Fig. 3 Curves of predicted output power and actual output power of PV power generation system of various algorithms in different weather types in autumn
圖4 冬季不同天氣類(lèi)型時(shí)各種算法的光伏發(fā)電系統(tǒng)輸出功率預(yù)測(cè)值與實(shí)際值曲線Fig. 4 Curves of predicted output power and actual output power of PV power generation system of various algorithms in different weather types in winter
由圖1~圖4可知,采用LIBSVM軟件中SVR算法預(yù)測(cè)的光伏發(fā)電系統(tǒng)輸出功率曲線與實(shí)際的光伏發(fā)電系統(tǒng)輸出功率曲線最為接近。
本文采用均方誤差MSE作為評(píng)價(jià)預(yù)測(cè)結(jié)果的標(biāo)準(zhǔn),MSE值越小,表明預(yù)測(cè)的準(zhǔn)確度越高。
表1為分別采用4種預(yù)測(cè)方法時(shí)得到的MSE值。
表1 4種預(yù)測(cè)方法得到的MSE值Tabel 1 MSE value obtained by four predicted methods
從表1中可以看出,采用SVR算法預(yù)測(cè)光伏發(fā)電系統(tǒng)輸出功率時(shí)得到的MSE值明顯低于采用其他3種預(yù)測(cè)方法時(shí)得到的MSE值,這說(shuō)明SVR算法的預(yù)測(cè)準(zhǔn)確度最高。
仿真計(jì)算過(guò)程顯示,由于采用BP神經(jīng)網(wǎng)絡(luò)算法和Elman神經(jīng)網(wǎng)絡(luò)算法時(shí)引入了隨機(jī)數(shù),因此采用這2種算法時(shí)每次的預(yù)測(cè)結(jié)果均不一樣。而采用SVR算法不僅預(yù)測(cè)結(jié)果明顯優(yōu)于其他2種算法,且每次的預(yù)測(cè)結(jié)果均一致。
用于模型訓(xùn)練的樣本數(shù)量及其與待預(yù)測(cè)日的相似程度對(duì)預(yù)測(cè)結(jié)果有顯著影響,樣本數(shù)量越多,預(yù)測(cè)結(jié)果就越準(zhǔn)確;樣本與待預(yù)測(cè)日的相似度越高,預(yù)測(cè)結(jié)果也越準(zhǔn)確。
針對(duì)提高并網(wǎng)型光伏發(fā)電系統(tǒng)輸出功率預(yù)測(cè)的準(zhǔn)確性,有助于電網(wǎng)的安全穩(wěn)定和經(jīng)濟(jì)高效運(yùn)行,本文提出了一種基于LIBSVM軟件中SVR算法的光伏發(fā)電系統(tǒng)輸出功率預(yù)測(cè)方法,并與同樣采用相似日理論的BP神經(jīng)網(wǎng)絡(luò)算法、RBF神經(jīng)網(wǎng)絡(luò)算法和Elman神經(jīng)網(wǎng)絡(luò)算法的仿真結(jié)果進(jìn)行了比較分析,得出以下結(jié)論:
1)采用SVR算法時(shí)得到的MSE值明顯低于采用BP神經(jīng)網(wǎng)絡(luò)算法、RBF神經(jīng)網(wǎng)絡(luò)算法及Elman神經(jīng)網(wǎng)絡(luò)算法時(shí)得到MSE值,這說(shuō)明SVR算法的準(zhǔn)確度最高;
2) 用于模型訓(xùn)練的樣本數(shù)量及其與待預(yù)測(cè)日的相似程度對(duì)預(yù)測(cè)結(jié)果有顯著影響,樣本數(shù)量越多,預(yù)測(cè)結(jié)果就越準(zhǔn)確;樣本與待預(yù)測(cè)日相似度越高,預(yù)測(cè)結(jié)果也越準(zhǔn)確。