楊 婷,陳黎來,李世紀(jì),呂高宇,吳巧鑫,曾艾東
(南京工程學(xué)院電力工程學(xué)院, 江蘇 南京 211167)
據(jù)統(tǒng)計,截至2020年12月底,我國光伏并網(wǎng)裝機(jī)共2.53×108kW.2021年全國風(fēng)電、光伏發(fā)電量占全國用電量的11%左右[1].光伏出力具有分散性、間歇性、隨機(jī)性與波動性的典型特征,隨著光伏滲透率的不斷提高,給電網(wǎng)電能質(zhì)量和設(shè)備安全帶來嚴(yán)重影響,同時將使得電網(wǎng)對光伏出力的調(diào)度、管理難度進(jìn)一步增大.因此,針對光伏發(fā)電功率開展精確預(yù)測,可以促進(jìn)光伏與電網(wǎng)友好互動,提高電網(wǎng)對光伏柔性調(diào)度能力,提升消納清潔能源的效率,助力我國實現(xiàn)“碳達(dá)峰”和“碳中和”目標(biāo)[2].
光伏發(fā)電是典型多變量耦合隨機(jī)過程,建立光伏發(fā)電功率模型的方法可分為物理建模、統(tǒng)計建模以及混合建模[3].文獻(xiàn)[4]建立了氣溶膠光學(xué)厚度物理模型,能夠?qū)椪諒?qiáng)度實現(xiàn)預(yù)測.但建模過程若僅考慮輻照強(qiáng)度,將遺漏許多關(guān)鍵氣象因子,導(dǎo)致預(yù)測模型準(zhǔn)確性受到嚴(yán)重影響[5-6].統(tǒng)計建模通過對歷史數(shù)據(jù)進(jìn)行統(tǒng)計分析,找出其內(nèi)在規(guī)律實現(xiàn)預(yù)測.基于統(tǒng)計理論運(yùn)用機(jī)器學(xué)習(xí)算法建立遺傳算法[7]、神經(jīng)網(wǎng)絡(luò)[8-10]、支持向量機(jī)[11]、日前算法[12]以及極限學(xué)習(xí)機(jī)[13]等預(yù)測模型,該類模型本質(zhì)上為黑箱模型,存在物理機(jī)理不清晰的缺陷,模型的精確性高度依賴訓(xùn)練樣本數(shù)據(jù)量,算法復(fù)雜程度較高,不利于工程實現(xiàn),適用于短期、超短期預(yù)測.混合建模綜合物理建模與統(tǒng)計建模兩種方法,通過歷史數(shù)據(jù)進(jìn)行統(tǒng)計分析,找出其內(nèi)在蘊(yùn)含規(guī)律構(gòu)建物理模型.文獻(xiàn)[14-15]采用混合建模方法建立光伏發(fā)電功率預(yù)測的線性回歸模型,相比經(jīng)典物理模型預(yù)測精度顯著提高,與統(tǒng)計建模相比具有明確的物理機(jī)理,且其技術(shù)路線易工程化,適用性更佳.由于現(xiàn)有模型構(gòu)建過程中歷史數(shù)據(jù)所包含的氣象因子種類有限,導(dǎo)致預(yù)測模型KMO(Kaiser-Meyer-Olkin)檢驗結(jié)果較差[15],提取的主成分會丟失較多的特征信息,嚴(yán)重降低了模型的有效性.
考慮光伏發(fā)電功率受到多種氣象因子的影響,在模型構(gòu)建過程中準(zhǔn)確提取氣象因子特征量將進(jìn)一步提高功率預(yù)測精度.針對上述問題,基于數(shù)據(jù)驅(qū)動思想,本文提出一種主成分分析與逐步線性回歸相結(jié)合的光伏發(fā)電功率預(yù)測混合建模方法.
設(shè)光伏發(fā)電功率Ph為因變量,將光伏發(fā)電功率歷史樣本數(shù)據(jù)進(jìn)行歸一化處理后,采用Pearson相關(guān)性系數(shù)作為相關(guān)性分析指標(biāo)對多維氣象因子自變量進(jìn)行預(yù)選,其表達(dá)式為:
(1)
Pearson系數(shù)直觀反映因變量與自變量相關(guān)性強(qiáng)弱,通常|r|>0.4認(rèn)為有明顯的相關(guān)性.篩選出與因變量存在較強(qiáng)相關(guān)性的自變量后,進(jìn)一步檢驗變量之間的相關(guān)性是否顯著.構(gòu)造基于t分布的顯著性檢驗統(tǒng)計量為:
(2)
式中,n為單個氣象因子樣本數(shù)量.
由t分布中得到顯著性指標(biāo)sig,當(dāng)sig<0.05時,認(rèn)為X與Y顯著線性相關(guān).
對p個氣象因子自變量X1、X2、X3、…、Xp建立光伏發(fā)電功率預(yù)測模型:
(3)
式中:β為回歸系數(shù),由最小二乘法計算得出.
采用逐步線性回歸建模時,逐步引入自變量,每引入一個自變量后都要對其進(jìn)行F檢驗,并對已經(jīng)入選的自變量逐個進(jìn)行t檢驗.當(dāng)舊的自變量由于新引入的自變量變得不再顯著時,將其刪除.F檢驗的構(gòu)造統(tǒng)計量為:
(4)
在F分布表中查表得到對應(yīng)的sig,當(dāng)sig<0.05時,認(rèn)為模型顯著.
1.3.1 擬合程度檢驗
R2是功率預(yù)測模型擬合程度的決定系數(shù),表示自變量對因變量的解釋程度,R2越接近1表示擬合程度越好,計算式為:
(5)
由于R2隨著功率預(yù)測模型中自變量個數(shù)的增加而增大,為了防止R2虛假增大,引入調(diào)整系數(shù):
(6)
1.3.2 有效性檢驗
通過德賓沃森系數(shù)DW檢驗?zāi)P褪欠翊嬖谧韵嚓P(guān)性,公式為:
(7)
式中,Ut為誤差項.
當(dāng)DW趨近于2時,表明自相關(guān)性造成的影響可以被忽略.若模型存在較強(qiáng)的自相關(guān)性,會使最小二乘法擬合出的β系數(shù)不具備有效性,甚至導(dǎo)致模型預(yù)測功能失效.
1.3.3 多重共線性檢驗
方差膨脹系數(shù)VIF用于檢驗功率預(yù)測模型是否存在多重共線性,同時檢驗當(dāng)前模型所包含的自變量是否冗余,公式為:
(8)
式中,ri為第i個自變量對剩余自變量作相關(guān)分析的負(fù)相關(guān)系數(shù).
當(dāng)VIF>5時,表明當(dāng)前模型存在嚴(yán)重共線性,需要進(jìn)一步修正.
若模型未通過有效性或多重共線性檢驗,需采用主成分分析對已預(yù)選的氣象因子自變量進(jìn)行解耦和降維重構(gòu),將多個自變量轉(zhuǎn)換為少數(shù)的主成分變量.
1.4.1 適用性分析
對待提取主成分的多個氣象因子自變量做KMO和巴特利特(Bartlett)球形檢驗.檢驗統(tǒng)計量KMO是用于比較自變量間簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的指標(biāo),表達(dá)式為:
(9)
式中:p為自變量個數(shù);rij為變量i和j的Pearson系數(shù).
當(dāng)KMO>0.65時,表明所選擇的氣象因子自變量適合提取主成分.Bartlett球形檢驗用于檢驗自變量是否各自獨立,由相關(guān)系數(shù)矩陣的行列式計算得到Bartlett球形檢驗分布.如果該分布的sig<0.05,認(rèn)為自變量間存在相關(guān)性,適合做主成分分析.
1.4.2 主成分提取步驟
1) 對初始模型所包含的氣象因子自變量歷史樣本數(shù)據(jù)X做標(biāo)準(zhǔn)化處理,處理后的數(shù)據(jù)記為X′;
2) 構(gòu)造數(shù)據(jù)矩陣V進(jìn)行特征分解,求取特征值λi和對應(yīng)的特征向量ωi,降序排列特征值λi;
基于主成分分析-線性回歸的光伏發(fā)電功率預(yù)測模型的構(gòu)建流程如圖1所示.
圖1 光伏發(fā)電功率預(yù)測模型流程圖
歷史樣本數(shù)據(jù)與訓(xùn)練數(shù)據(jù)均源自澳大利亞愛麗絲泉微型光伏發(fā)電單元[16],額定功率為10.5 kW,數(shù)據(jù)采集周期為每5 min一組.經(jīng)過基本數(shù)據(jù)清洗,去除夜間數(shù)據(jù)和無效數(shù)據(jù)后樣本數(shù)據(jù)總數(shù)約為44 000組.設(shè)因變量為光伏發(fā)電功率Ph(W),潛在的自變量為樣本數(shù)據(jù)中所有的氣象因子,包括總水平輻射強(qiáng)度G、陣列輻射強(qiáng)度P、法向輻射強(qiáng)度D、風(fēng)向WD、風(fēng)速WS、垂直風(fēng)速WV、溫度T、濕度H.
考慮到云層運(yùn)動將會對太陽輻照產(chǎn)生影響,且云層運(yùn)動與風(fēng)速有較強(qiáng)的關(guān)系,在無法直接獲得云層運(yùn)動信息的情況下,采用與風(fēng)速相關(guān)的信息代替云層運(yùn)動信息.通過對比分析多種對風(fēng)速信息經(jīng)過數(shù)學(xué)變換后的新因子與光伏發(fā)電功率的相關(guān)性,得出對風(fēng)速取對數(shù)后的數(shù)據(jù)與光伏發(fā)電功率的相關(guān)性最高,且二者有顯著關(guān)系,因此將其定義為LNWS,選取其作為預(yù)選變量.采用Pearson系數(shù)與t分布統(tǒng)計量對樣本數(shù)據(jù)進(jìn)行相關(guān)性分析與檢驗,結(jié)果如表1所示.
表1 相關(guān)性分析結(jié)果
表1的9種氣象因子與發(fā)電功率均有顯著性關(guān)系.其中:G、P、D均與發(fā)電功率呈現(xiàn)極強(qiáng)的正相關(guān)關(guān)系;T、H、LNWS與光伏發(fā)電功率呈現(xiàn)較強(qiáng)的正相關(guān)或負(fù)相關(guān)關(guān)系;WS、WD、WV與發(fā)電功率的相關(guān)性較弱.依據(jù)相關(guān)性分析結(jié)果,預(yù)選出|r|>0.4的G、P、D、T、LNWS、H6個氣象因子作為初始模型的自變量.依據(jù)t分布統(tǒng)計量得到的顯著性指標(biāo)sig,認(rèn)為G、P、D、T、LNWS、H6個氣象因子與光伏功率顯著線性相關(guān).
將6個氣象因子自變量對發(fā)電功率因變量做逐步線性回歸建模,并對模型進(jìn)行擬合程度與有效性檢驗,結(jié)果如表2所示.
表2 逐步線性建模檢驗結(jié)果
經(jīng)過對比分析,包含G、H、D、T、LNWS以及P的模型6,由于其擬合程度與有效性檢驗結(jié)果均優(yōu)于其他模型,被選為初始模型.通過逐步線性回歸建模后得到初始模型所包含自變量的回歸系數(shù)βi,結(jié)果如表3所示.
表3 初始模型擬合系數(shù)結(jié)果
表4為初始模型多重共線性檢驗VIF結(jié)果,其中變量P與G未通過共線性檢驗.
表4 初始模型VIF系數(shù)結(jié)果
表2所示初始模型6的DW為1.999,表示初始模型無需針對自相關(guān)性進(jìn)行修正.由于初始模型中變量P與G未通過共線性檢驗,因此采用主成分分析對初始模型進(jìn)行修正.隨機(jī)挑選初始模型中的若干個自變量進(jìn)行KMO檢驗,選擇通過KMO檢驗且結(jié)果最優(yōu)的自變量組合進(jìn)行主成分分析.經(jīng)過分析,G、P與D組合的KMO檢驗值最優(yōu),檢驗值為0.685;G、P與D合成變量與剩余自變量的Bartlett球形檢驗為0,表示合成變量與剩余自變量完全獨立.
G、P、D在合成變量中的占比系數(shù)分別為0.358、0.363、0.334,其數(shù)值來源于特征向量矩陣αi,將該合成變量定義為綜合輻射強(qiáng)度:
E=0.358G+0.363P+0.334D
(10)
通過主成分累積特征值方差百分比衡量提取出的主成分對于被提取自變量的解釋程度,一般取值在85%~95%.表5表明所提取的主成分能夠比較全面解釋被提取自變量特征.
表5 主成分總方差解釋
表6所示為經(jīng)過修正模型的檢驗結(jié)果,表明修正模型仍然通過了擬合程度與自相關(guān)性檢驗.
表6 修正模型檢驗結(jié)果
修正模型擬合系數(shù)和VIF如表7所示,經(jīng)過修正后的VIF均滿足VIF≤5的要求.
表7 修正模型擬合系數(shù)與VIF
綜合分析表6、表7,修正模型各項系數(shù)均滿足擬合程度、自相關(guān)性檢驗以及多重共線性檢驗要求.
將修正模型與經(jīng)典模型、未修正模型的預(yù)測效果進(jìn)行對比分析,進(jìn)一步評價修正模型的正確性、有效性與優(yōu)劣性.
修正模型擬合結(jié)果的散點分布如圖2所示.設(shè)定標(biāo)準(zhǔn)差超過[-3,3]可認(rèn)為是異常值.殘差分析結(jié)果表明,由大約44 000組樣本數(shù)據(jù)得到的擬合結(jié)果中存在650組左右的異常值,占比約1.47%.
圖2 回歸值與殘差的散點圖
圖3和圖4分別為標(biāo)準(zhǔn)化殘差的P-P回歸圖與直方圖.從圖3和圖4可以得出,殘差滿足正態(tài)分布,表明了修正模型的合理性.
圖3 標(biāo)準(zhǔn)化殘差的P-P回歸圖
圖4 標(biāo)準(zhǔn)化殘差直方圖
為定量分析修正模型預(yù)測能力,采用R2、均方根誤差(RMSE)、平均絕對誤差百分比(MAPE)對預(yù)測精度進(jìn)行評價.隨機(jī)抽取樣本訓(xùn)練數(shù)據(jù),通過對不同時間尺度,如單日、單周以及單月的光伏發(fā)電功率進(jìn)行預(yù)測,對表8所示的經(jīng)典模型、未修正模型與修正模型的預(yù)測精度進(jìn)行對比分析.
表8 各模型預(yù)測精度
圖5所示為不同時間尺度下光伏發(fā)電功率預(yù)測結(jié)果對比.由圖5的真實值、經(jīng)典模型、未修正模型以及修正模型預(yù)測結(jié)果可見,在不同時間尺度下,修正模型的預(yù)測結(jié)果準(zhǔn)確度明顯優(yōu)于其他模型,更接近真實值.
將修正模型與經(jīng)典模型、未修正模型的預(yù)測精度進(jìn)行量化,對比分析結(jié)果如表9所示.
表9 三種模型預(yù)測精度對比結(jié)果
從對比分析RMSE結(jié)果,單日修正模型比經(jīng)典模型與未修正模型預(yù)測精度分別提高了約34.1%、2.1%;單周修正模型比經(jīng)典模型與未修正模型的預(yù)測精度分別提高了約17.3%、2.9%;單月修正模型比經(jīng)典模型與未修正模型的預(yù)測精度分別提高了約47%、19%.
提高光伏發(fā)電功率的預(yù)測精度是增強(qiáng)其可調(diào)度性的有效手段.基于數(shù)據(jù)驅(qū)動思想,提出基于主成分分析-線性回歸的光伏發(fā)電功率預(yù)測模型的混合建模方法.首先提出了基于相關(guān)性分析的自變量預(yù)選、基于逐步線性回歸的初始模型構(gòu)建以及基于主成分分析的模型修正理念;然后合理選取輻射強(qiáng)度、濕度、溫度以及風(fēng)速的對數(shù)等多維氣象因子自變量,其中綜合輻射強(qiáng)度是包含水平總輻射強(qiáng)度、陣列輻射強(qiáng)度以及法向輻射強(qiáng)度等特征信息的合成變量;最后通過對擬合程度、有效性、多重共線性等指標(biāo)進(jìn)行綜合檢驗分析,表明了修正模型的合理性.
通過對模型預(yù)測能力進(jìn)行對比分析,得出基于主成分分析-線性回歸建立的光伏發(fā)電功率預(yù)測模型的表現(xiàn)明顯優(yōu)于經(jīng)典模型,表明了所提混合建模方法的有效性與優(yōu)越性,且其技術(shù)路線具有易于工程實現(xiàn)的特點,對快速建立光伏發(fā)電功率預(yù)測模型有一定的參考價值.