王麗婕 冬 雷 高 爽
(1.北京信息科技大學(xué)電氣工程系 北京 100192 2.北京理工大學(xué)自動化學(xué)院 北京 100081)
?
基于多位置NWP與主成分分析的風(fēng)電功率短期預(yù)測
王麗婕1冬 雷2高 爽2
(1.北京信息科技大學(xué)電氣工程系 北京 100192 2.北京理工大學(xué)自動化學(xué)院 北京 100081)
數(shù)值天氣預(yù)報(NWP)信息對風(fēng)電功率短期預(yù)測模型的準(zhǔn)確性起著重要作用??紤]風(fēng)電場周圍多個位置的NWP信息,提出聚類分析與主成分分析相結(jié)合的方法對風(fēng)力發(fā)電功率短期預(yù)測進(jìn)行研究。通過聚類分析提取歷史數(shù)據(jù)中與預(yù)測日NWP最相近的樣本,然后用主成分分析法對樣本日信息進(jìn)行處理,獲得更加準(zhǔn)確反映風(fēng)電場特性的參數(shù)。通過對依蘭風(fēng)電場的發(fā)電功率進(jìn)行預(yù)測,證實了該方法的有效性,其準(zhǔn)確度比基于單位置NWP的預(yù)測模型提高了4.65%。
風(fēng)電功率預(yù)測 數(shù)值天氣預(yù)報 多位置 主成分分析 聚類分析
隨著風(fēng)力發(fā)電技術(shù)的不斷發(fā)展,風(fēng)電單機(jī)容量和并網(wǎng)型風(fēng)電場的規(guī)模都在不斷增加,在電力需求中所占比例也越來越大。如果穿透率過高,風(fēng)速的間歇性和波動性將會對電力系統(tǒng)的安全穩(wěn)定運行以及電能質(zhì)量帶來不利影響[1]。如果能對風(fēng)速和風(fēng)電功率進(jìn)行較準(zhǔn)確的預(yù)測,可大幅降低電網(wǎng)旋轉(zhuǎn)備用容量,從而有效降低風(fēng)力發(fā)電系統(tǒng)成本,并為電網(wǎng)運行調(diào)度提供可靠的依據(jù)[2]。
風(fēng)電功率預(yù)測按照預(yù)測的時間長度可分為超短期預(yù)測和短期預(yù)測。超短期預(yù)測主要使用風(fēng)電場SCADA系統(tǒng)記錄的風(fēng)速、功率等歷史數(shù)據(jù)來建模,可預(yù)測的尺度一般是幾個小時,主要用于對風(fēng)電場的運行進(jìn)行控制和穩(wěn)定電能質(zhì)量。短期預(yù)測必須使用數(shù)值天氣預(yù)報(NWP)數(shù)據(jù),能預(yù)測提前幾十個小時到幾天的發(fā)電量,用于電網(wǎng)調(diào)度及風(fēng)電功率競價上網(wǎng)[3]。
我國用于風(fēng)電場發(fā)電功率預(yù)測的專用數(shù)值天氣預(yù)報的開發(fā)較晚,所以之前很多研究及成果都集中在風(fēng)電功率的超短期預(yù)測上。文獻(xiàn)[4,5]所采用的主成分分析法是對SCADA系統(tǒng)采集的風(fēng)速、風(fēng)向、溫度、濕度等進(jìn)行處理,僅能預(yù)測未來幾小時的發(fā)電功率。預(yù)測時間較短,不能滿足電力系統(tǒng)運行調(diào)度的需要。
國外對風(fēng)電功率預(yù)測的研究起步較早,已經(jīng)出現(xiàn)了很多商業(yè)軟件,所以預(yù)測所需的數(shù)據(jù)比較完善。數(shù)值天氣預(yù)報會直接影響風(fēng)電功率預(yù)測模型的準(zhǔn)確性[6]。文獻(xiàn)[7]采用風(fēng)電場周邊多個位置的NWP信息來提高模型的準(zhǔn)確度,但只考慮了10 m高度處的風(fēng)速、風(fēng)向。文獻(xiàn)[8,9]都是使用多個NWP模型參與風(fēng)電場功率預(yù)報,一個模型的分辨率低,提供初值和邊值條件,另一個模型的分辨率高,提供更準(zhǔn)確的氣象信息。而我國目前還沒有多個獨立的天氣預(yù)報系統(tǒng)同時進(jìn)行風(fēng)電場需要的氣象預(yù)測。
因此,在僅有一個天氣預(yù)報系統(tǒng)的條件下,本文提出了主成分分析法與多位置NWP相結(jié)合的短期風(fēng)電功率預(yù)測方法。綜合考慮風(fēng)電場周圍多個位置多個高度的NWP信息,首先采用聚類分析法提取出與預(yù)測日信息最相近的樣本,然后用主成分分析法對樣本日信息進(jìn)行處理,得到對風(fēng)功率影響較大的主要成分作為神經(jīng)網(wǎng)絡(luò)模型的輸入。將該方法應(yīng)用于我國依蘭風(fēng)電場的實際功率預(yù)測中,取得了令人滿意的結(jié)果。
聚類分析是將研究對象按照一定度量標(biāo)準(zhǔn)分成不同類別的統(tǒng)計分析技術(shù)。目前較常用的一種聚類算法是K均值聚類法,其基本思想是將每一個樣本劃分到離均值最近的類別中,它是以距離的遠(yuǎn)近為標(biāo)準(zhǔn)進(jìn)行聚類的。
K均值聚類算法一般包括以下處理步驟[10]:
(1)將所有數(shù)據(jù)分為K個初始類,選取K個樣本點為初始聚類中心,記為z1(l),z2(l),…,zk(l), 其中初始值l=1;
(2)按照最近鄰規(guī)則將所有樣本分配到各聚類中心所代表的K類ωj(K)中,各類所包含的樣本數(shù)為Nj(l);
(3)計算各類的均值向量,并將該向量作為新的聚類中心
(1)
式中,j=1,2,…,k;i=1,2,…,Nj(l);
(4)若zj(l+1)≠zj(l), 表示聚類結(jié)果并不是最佳的,則返回步驟(2),繼續(xù)迭代計算;
(5)若zj(l+1)=zj(l), 迭代過程結(jié)束,此時的聚類結(jié)果就是最優(yōu)聚類結(jié)果。
主成分分析也稱主分量分析,是揭示大樣本、多變量數(shù)據(jù)或樣本之間內(nèi)在關(guān)系的一種方法,旨在利用降維的思想,把多變量轉(zhuǎn)換為少數(shù)幾個變量,降低觀測空間的維數(shù),以獲取最主要的信息。
設(shè)原始變量X1,X2,…,Xp的觀測n次數(shù)據(jù)矩陣為
主成分分析法的計算步驟如下[5]:
(1)將原始數(shù)據(jù)標(biāo)準(zhǔn)化,即對同一變量減去其均值再除以標(biāo)準(zhǔn)差,以消除量綱影響。
(2)
(3)
(4)
(2)求相關(guān)系數(shù)矩陣M。
(5)
且有mij=mji,mii=1。
(3)求M的特征值及特征向量。
(k=1,2,…,n;j=1,2,…,n)
(6)
(4)確定主成分的個數(shù)m。
方差貢獻(xiàn)率和累計方差貢獻(xiàn)率分別為
(7)
(8)
根據(jù)累計方差貢獻(xiàn)率來選取主成分的個數(shù)。通常累計方差貢獻(xiàn)率大于75%~95%時,對應(yīng)的前m個主成分便包含p個原始變量所能提供的絕大部分信息,主成分個數(shù)就是m個,后面其他的主成分可以舍棄。
由于NWP的位置對于風(fēng)電場的功率預(yù)測模型有一定程度的影響,建模時可選用風(fēng)電場中多個位置的NWP信息綜合起來考慮。NWP信息的數(shù)據(jù)間隔通常為15 min,每組信息中包含多個區(qū)域不同高度的風(fēng)速、風(fēng)向、溫度、氣壓,每天的NWP數(shù)據(jù)量非常大,過多的數(shù)據(jù)加入到模型中會降低模型的泛化能力。為了獲取對預(yù)測準(zhǔn)確度影響最大的數(shù)據(jù),首先利用聚類分析法在歷史數(shù)據(jù)中查找與預(yù)測當(dāng)天NWP數(shù)據(jù)最相似的樣本日作為訓(xùn)練樣本。
選取的相似樣本中,每一時刻的NWP信息包含有多個位置不同高度的氣象信息。通常情況下,影響風(fēng)力發(fā)電功率的因素之間有一定的相關(guān)性,從而使得多位置NWP提供的信息在一定程度上有所重疊,這會增加計算的復(fù)雜性,甚至給預(yù)測帶來較大誤差。利用主成分分析法對這些信息進(jìn)行特征提取,消除不必要的干擾項,得到對風(fēng)功率影響較大的主要成分作為神經(jīng)網(wǎng)絡(luò)模型的輸入,風(fēng)電場的功率作為模型的輸出。圖1為基于多位置NWP與主成分分析的風(fēng)電功率預(yù)測方法結(jié)構(gòu)圖。
圖1 基于多位置NWP與主成分分析的功率預(yù)測結(jié)構(gòu)圖Fig.1 Structure diagram of prediction based on principal component analysis of NWP from multiple locations
對我國黑龍江依蘭風(fēng)電場2012年1~2月的NWP數(shù)據(jù)和實測風(fēng)功率數(shù)據(jù)進(jìn)行分析、建模和預(yù)測。數(shù)據(jù)分辨率為15 min。選擇2012年2月4日作為預(yù)測日,預(yù)測長度為一天(96步)。
歐洲中尺度氣象預(yù)報中心提供了依蘭風(fēng)電場4個典型區(qū)域的NWP數(shù)據(jù),4個區(qū)域的經(jīng)度、緯度如圖2所示。每個區(qū)域包含3個高度(34 m、67 m、112 m),共12個位置。每個高度包括風(fēng)速、氣溫、風(fēng)向3個信息,氣壓信息不分位置,所以整個風(fēng)電場某一時刻的NWP信息為37個:1個氣壓、12個風(fēng)速、12個氣溫、12個風(fēng)向。
圖2 依蘭風(fēng)電場4個典型區(qū)域NWP數(shù)據(jù)的位置Fig.2 Four locations of NWP in Yilan wind farm
4.1 聚類分析結(jié)果
為了方便處理,將每天作為一個數(shù)據(jù)對象,由一個7維向量表示,稱為日NWP向量,表示為X=[Pav,Vmin,Vmax,Tmin,Tmax,Dsin,Dcos],其中的變量依次代表日氣壓平均值、日風(fēng)速最小值、日風(fēng)速最大值、日氣溫最小值、日氣溫最大值、日風(fēng)向正弦平均值、日風(fēng)向余弦平均值。
由于日NWP向量中各分量的量綱不同,需要進(jìn)行歸一化處理,氣壓、風(fēng)速和氣溫分別除以各自的歷史最大值,風(fēng)向正弦和余弦值均為歸一化數(shù)值,不需再作處理。
距離定義為
(9)
式中,di為預(yù)測日與歷史樣本i的歐氏距離;xm為預(yù)測日的日NWP向量;xi為歷史數(shù)據(jù)的日NWP向量,i=1,2,…,n,其中n為樣本數(shù)。
選擇2012年2月4日之前的20天歷史數(shù)據(jù)做聚類分析,采用K均值聚類算法,得到準(zhǔn)則函數(shù)與分類數(shù)K的關(guān)系曲線如圖3所示。取準(zhǔn)則函數(shù)曲線拐點處的K作為最佳分類數(shù),得到K=3。
圖3 準(zhǔn)則函數(shù)與分類數(shù)K的關(guān)系Fig.3 Relationship between the criterion function and the number of categories K
在分類數(shù)K=3的情況下,20個歷史樣本日的所屬類別情況如表1所示。其中有4天屬于第3類,有1天屬于第2類,其他均屬于第1類。由式(1)計算出這3類的聚類中心(歸一化)分別為:
第1類:[0.988 0.183 0.438 -1.130 -0.804 0.042 0.051]
第2類:[0.988 0.555 0.863 -1.151 -0.853 0.119 0.189]
第3類:[0.993 0.047 0.268 -0.856 -0.551 -0.020 -0.125]
表1 樣本所在聚類情況Tab.1 The clustering of the samples
預(yù)測日2月4日的歸一化日NWP向量為[0.981 0.340 0.801 -0.932 -0.579 0.113 -0.052],與3類聚類中心的歐式距離分別為0.51、0.48和0.63,距離第2類聚類中心最近,所以預(yù)測日所屬分類為第2類。由表1可看出,屬于第2類的樣本為2012年2月2日,將其用于模型的訓(xùn)練中。
4.2 主成分提取
相似樣本中一共有96個數(shù)據(jù)點,每個數(shù)據(jù)點有37個NWP信息,包含1個氣壓、12個風(fēng)速、12個溫度和12個風(fēng)向信息。氣壓用P表示,由于氣壓只有一個,所以不做主成分提取,將其直接作為網(wǎng)絡(luò)模型的一個輸入量。v1~v12依次表示區(qū)域1高度34 m、67 m和112 m的風(fēng)速、區(qū)域2高度34 m、67 m和112 m的風(fēng)速、區(qū)域3高度34 m、67 m和112 m的風(fēng)速、區(qū)域4高度34 m、67 m和112 m的風(fēng)速;和風(fēng)速的表示形式類似,t1~t12依次表示區(qū)域1、2、3、4高度34 m、67 m和112 m的氣溫,d1~d12依次表示區(qū)域1、2、3、4高度34 m、67 m和112 m的風(fēng)向。
按照第2節(jié)介紹的主成分計算步驟分別對2月2日樣本12維的風(fēng)速向量、12維的風(fēng)向向量和12維的氣溫向量進(jìn)行主成分提取。計算各指標(biāo)標(biāo)準(zhǔn)化后的相關(guān)系數(shù)矩陣M,M的特征值、相應(yīng)的單位特征向量以及貢獻(xiàn)率,并依據(jù)累積貢獻(xiàn)率提取主成分。
風(fēng)速主成分計算結(jié)果如表2所示,由于第一主成分的貢獻(xiàn)率已達(dá)95%以上,所以僅選第一主成分即可。
表2 風(fēng)速主成分特征值及方差貢獻(xiàn)率Tab.2 Eigenvalues and contribution rate of wind speed principal component
氣溫主成分計算結(jié)果如表3所示,由于第一主成分的貢獻(xiàn)率已達(dá)99%以上,所以僅選第一主成分即可。
風(fēng)向主成分計算結(jié)果如表4所示,由于第一主成分的貢獻(xiàn)率已達(dá)95%以上,所以僅選第一主成分即可。
經(jīng)過主成分提取,得到了更加準(zhǔn)確反映風(fēng)電場特性的參數(shù)。其中,12維的風(fēng)速向量降低到1維,第一主成分分量記為VPCA1;12維的氣溫向量降低到1維,第一主成分分量記為TPCA1;12維的風(fēng)向向量降低到1維,第一主成分分量記為DPCA1。
表3 氣溫主成分特征值及方差貢獻(xiàn)率Tab.3 Eigenvalues and contribution rate of temperature principal component
表4 風(fēng)向主成分特征值及方差貢獻(xiàn)率Tab.4 Eigenvalues and contribution rate of wind direction principal component
4.3 模型建立與仿真結(jié)果
選取VPCA1、DPCA1、TPCA1這3個主成分分量和氣壓作為預(yù)測模型的輸入,記為PCA-4維,預(yù)測模型采用GRNN神經(jīng)網(wǎng)絡(luò),GRNN窗口寬度參數(shù)s=0.5,對應(yīng)時刻的風(fēng)功率作為模型的輸出,用2月2日數(shù)據(jù)進(jìn)行訓(xùn)練,得到預(yù)測模型。隨后,對2月4日的發(fā)電功率進(jìn)行預(yù)測。
圖4為各種模型的預(yù)測曲線,其中持續(xù)模型是國外普遍使用的一種參考模型[11]。從圖中可看出,利用多位置NWP建模包含的信息量多,預(yù)測值最接近于實際值。而基于單位置NWP的模型只考慮了風(fēng)電場中一個位置的氣象信息,天氣預(yù)報的誤差導(dǎo)致多個點的風(fēng)電功率預(yù)測值低于真實值。
圖4 各種模型預(yù)測結(jié)果對比Fig.4 Comparison of different prediction models
表5列出了各種模型的平均絕對誤差(NMAE)、均方根誤差(NRMSE)和最大預(yù)測誤差(δmax)[12]。由表5可知,采用多位置NWP的神經(jīng)網(wǎng)絡(luò)模型的各種預(yù)測誤差最小,平均絕對誤差和均方根誤差分別為風(fēng)電場總裝機(jī)容量的12.35%和15.66%,整體預(yù)測效果較好,可滿足工程應(yīng)用的需要。其平均絕對誤差比采用單位置NWP建模提高了4.65%,比持續(xù)模型提高了近10%。多個位置的NWP包含的信息量多,充分考慮了風(fēng)電場周圍的氣象狀況,可顯著提高模型的預(yù)測準(zhǔn)確度,使預(yù)測值更接近于實際值。
表5 預(yù)測模型的誤差對比Tab.5 Errors of different prediction models
由于數(shù)值天氣預(yù)報信息對風(fēng)電功率預(yù)測的準(zhǔn)確性有較大影響,本文將聚類分析、主成分分析、多位置NWP三者結(jié)合起來,進(jìn)行風(fēng)力發(fā)電功率的預(yù)測。多位置NWP包含了風(fēng)電場周圍不同地點不同高度的氣象信息,聚類分析能提取出與預(yù)測日NWP最接近的歷史數(shù)據(jù)來作為訓(xùn)練樣本,主成分分析能獲得更加準(zhǔn)確反映風(fēng)電場特性的參數(shù)。該方法有效降低了訓(xùn)練數(shù)據(jù)量,減少了輸入樣本的維數(shù),降低了網(wǎng)絡(luò)訓(xùn)練的難度,提高了模型的預(yù)測準(zhǔn)確度。與只使用一個位置NWP建模相比,風(fēng)電功率預(yù)測的平均絕對誤差由17%降低到12.35%。
[1] 張麗英,葉廷路,辛耀中,等.大規(guī)模風(fēng)電接入電網(wǎng)的相關(guān)問題及措施[J].中國電機(jī)工程學(xué)報,2010,30(25):1-9. Zhang Liying,Ye Tinglu,Xin Yaozhong,et al.Problems and measures of power grid accommodating large scale wind power[J].Proceedings of the CSEE,2010,30(25):1-9.
[2] 王賀,胡志堅,張翌暉,等.基于聚類經(jīng)驗?zāi)B(tài)分解和最小二乘支持相量機(jī)的短期風(fēng)速組合預(yù)測[J].電工技術(shù)學(xué)報,2014,29(4):237-245. Wang He,Hu Zhijian,Zhang Yihui,et al.A hybrid model for short-term wind speed forecasting based on ensemble empirical mode decomposition and least squares support vector machines[J].Transactions of China Electrotechnical Society,2014,29(4):237-245.
[3] Soman S S,Zareipour H,Malik O,et al.A review of wind power and wind speed forecasting methods with different time horizons[C].North American Power Symposium (NAPS),Arlington,TX,2010:1-8.
[4] 何東,劉瑞葉.基于主成分分析的神經(jīng)網(wǎng)絡(luò)動態(tài)集成風(fēng)功率超短期預(yù)測[J].電力系統(tǒng)保護(hù)與控制,2013,41(4):50-54. He Dong,Liu Ruiye.Ultra-short-term wind power prediction using ANN ensemble based on the principal components analysis[J].Power System Protection and Control,2013,41(4):50-54.
[5] 周松林,茆美琴,蘇建徽.基于主成分分析與人工神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率預(yù)測[J].電網(wǎng)技術(shù),2011,35(9):128-132. Zhou Songlin,Mao Meiqin,Su Jianhui.Prediction of wind power based on principal component analysis and artificial neural network[J].Power System Technology,2011,35(9):128-132.
[6] Ernst B,Oakleaf B,Ahlstrom M L,et al.Predicting the wind[J].IEEE Power & Energy Magazine,2007,10(11):79-89.
[7] Khalid M,Savkin A V.A method for short-term wind power prediction with multiple observation points[J].IEEE Transactions on Power Systems,2012,27(2):579-586.
[8] Stathopoulos Christos,Kaperoni Akrivi,Galanis George,et al.Wind power prediction based on numerical and statistical models[J].Journal of Wind Engineering and Industrial Aerodynamics,2013,112(1):25-38.
[9] Lazic Lazar,Pejanovic Goran,Zivkovic Momcilo.Wind forecasts for wind power generation using the Eta model[J].Renewable Energy,2010,35(6):1236-1243.
[10]Wei Wei,Zhang Yajie,Wu Guilian,et al.Ultra-short-term/short-term wind power continuous prediction based on fuzzy clustering analysis[C].IEEE Innovative Smart Grid Technologies-Asia,2012:1-6.
[11]Sideratos G,Hatziargyriou N.Using radial basis neural networks to estimate wind power production[C].IEEE Power Engineering Society General Meeting,2007:1-7.
[12]Q/GDW 588-2011.風(fēng)電功率預(yù)測功能規(guī)范[S].
Wind Power Short-term Prediction Based on Principal Component Analysis of NWP of Multiple Locations
WangLijie1DongLei2GaoShuang2
(1.Beijing Information Science and Technology University Beijing 100192 China 2.Beijing Institute of Technology Beijing 100081 China)
Numerical weather prediction (NWP) plays an important role in the accuracy of the short-term wind power prediction models.Considering NWP information of multiple locations around a wind farm,this paper introduces a method based on the cluster analysis and the principal component analysis to study the short-term prediction of the wind power generating capacity.The sample in the historical data closest to the NWP of the forecast day is extracted by the clustering analysis.Then the principal component analysis of the sample information is proceeded to obtain the parameters which reflects the characteristics of the wind farm.Simulation is performed consideringthe wind power generation of Yilan wind farm.The results show that the method is effective and its precision improves 4.65% than the prediction model based on NWP of single location.
Wind power prediction,numerical weather prediction,multiple locations,principal component analysis,cluster analysis
2014-11-20 改稿日期2015-01-05
TM614
王麗婕 女,1983年生,博士,研究方向為風(fēng)力發(fā)電功率預(yù)測及風(fēng)電并網(wǎng)后的運行控制。(通信作者)
冬 雷 男,1967年生,副教授,博士,研究方向為電力電子與電力傳動以及新能源發(fā)電等。
北京市教委科技計劃面上項目(KM201511232007)資助。