王帥 杜欣慧 姚宏民
摘 要: 密度峰值聚類算法具有收斂速度快、魯棒性強、無需人為確定最佳聚類數(shù)等特點,具備較好的應用前景。為提高光伏功率預測的精度,提出一種將密度峰值聚類算法應用于短期光伏功率預測的方法,并進行了必要優(yōu)化。該方法首先通過類間距離優(yōu)化增強氣象數(shù)據(jù)的可分性;然后利用密度峰值聚類對其進行無標簽歸類,通過灰色關聯(lián)度匹配出與待預測日相關度最高的類別;最后將其作為Elman神經(jīng)網(wǎng)絡的訓練樣本,得到預測結果。Matlab仿真結果表明,該方法能夠明顯提高氣象數(shù)據(jù)的聚類效果,并有效提高光伏功率的短期預測精度。
關鍵詞: 密度峰值聚類; 光伏發(fā)電; 灰色關聯(lián)度; 相似日匹配; Elman神經(jīng)網(wǎng)絡; 短期功率預測
中圖分類號: TN830.4?34; TM715 文獻標識碼: A 文章編號: 1004?373X(2018)20?0141?05
Abstract: The density peak clustering algorithm has the characteristics of fast convergence speed, strong robustness, and no need to manually determine the optimal clustering numbers, which has a good application prospect. Therefore, a method of applying the density peak clustering algorithm to short?term photovoltaic power prediction is proposed and necessarily optimized to improve the accuracy of photovoltaic power prediction. In the method, the separability of meteorological data is enhanced by means of inter?class distance optimization. The density peak clustering is adopted to classify the meteorological data without using labels. The category that has the highest degree of correlation with to?be predicted days is matched by using the grey correlation degree, and finally taken as the training sample of the Elman neural network to obtain the prediction results. The Matlab simulation results show that the method can significantly improve the clustering effect of meteorological data and short?term prediction accuracy of photovoltaic power.
Keywords: density peak clustering; photovoltaic power generation; grey correlation degree; similar day matching; Elman neural network; short?term power prediction
光伏發(fā)電系統(tǒng)因其電能可控性強,調度管理便捷、調峰性能良好、響應迅速等優(yōu)點而得到了廣泛應用。但由于其輸出功率受風速、氣溫、陽光輻射度、日降雨量、氣壓等氣象因素影響存在較大隨機波動性[1?3],致使有功功率不穩(wěn)定而對電網(wǎng)造成干擾。因此,精準的光伏發(fā)電功率預測有助于降低對電網(wǎng)的影響,也便于電力工作人員的調度管理工作。
目前,采用較多的預測方法是神經(jīng)網(wǎng)絡預測法[4?5]。即使用歷史發(fā)電量與氣象數(shù)據(jù)組成的訓練樣本訓練神經(jīng)網(wǎng)絡的自學習能力,將待預測日的氣象特征(通過數(shù)值天氣預報獲得)輸入網(wǎng)絡后得到預測結果。其中,提高訓練樣本與待預測日的相關性極其重要。訓練樣本越精確、合理,神經(jīng)網(wǎng)絡的預測結果就越準確[6]。
文獻[7]通過相關性分析,確定出影響電量的主要氣象因素。利用傳統(tǒng)的SOM算法對天氣類型進行聚類,然后使用對應的神經(jīng)網(wǎng)絡進行預測。但僅選取氣溫與濕度作為氣象特征輸入量,其氣象特征的綜合代表性較差。當聚類數(shù)據(jù)集的特征量較多時,SOM算法又易陷入局部最優(yōu)。文獻[8]在提高訓練樣本準確性時使用了常規(guī)算法K?Means聚類,但未解決常規(guī)聚類算法收斂速度慢、需指定聚類個數(shù)、對噪聲點敏感等問題。文獻[9]提出一種全新聚類算法(密度峰值聚類),幾乎無需設定參數(shù)且在大規(guī)模數(shù)據(jù)集中具有魯棒性,能夠較好地克服以上問題,具備較好的應用前景。
本文將密度峰值聚類算法應用于短期光伏功率預測,首先基于直方圖均衡化原理實現(xiàn)類間距離優(yōu)化,提高密度峰值聚類算法的有效性。然后根據(jù)聚類結果計算灰色關聯(lián)度,匹配到更加準確合理的訓練樣本。最后,基于Elman神經(jīng)網(wǎng)絡得出預測結果,并對其誤差進行分析。
1.1 密度峰值聚類算法原理
密度峰值聚類算法首先明確了聚類中心的特點[9]:聚類中心的局部密度較大,其周圍被一些較低密度的鄰居所包圍;聚類中心距離那些局部密度更大的數(shù)據(jù)點相對較遠。
1.2 基于直方圖均衡化的類間距離優(yōu)化
1.2.1 距離矩陣[D]的定義
可將直方圖均衡化思想擴展至本文的聚類問題,即通過均衡化類簇之間的距離增強數(shù)據(jù)對比度,并提高數(shù)據(jù)可分性。
1.2.3 優(yōu)化過程
密度峰值聚類后各類均有唯一的中心,以類簇為整體,在保證每個類簇內部結構不變的前提下進行類間距離均衡化,能夠增強數(shù)據(jù)可分性。距離擴散的程度基于式(8),示意圖如圖2所示。
1.2.4 算法實現(xiàn)
由于每次被替換的元素僅屬某兩個類別,既不會影響其他類間距離,也不會影響任何類內距離。[D′]即為類間優(yōu)化后的全新距離矩陣。
2.1 結合灰色關聯(lián)分析法的相似日樣本匹配
在得到聚類結果后,通過灰色關聯(lián)分析法選取待預測日的相似日樣本。將各類簇的氣象特征向量作為比較數(shù)列,將待預測日的氣象特征向量(通過數(shù)值天氣預報獲得)作為參考數(shù)列。
2.2 Elman神經(jīng)網(wǎng)絡預測模型
Elman網(wǎng)絡可以看作是一個具有局部記憶單元和局部反饋連接的遞歸神經(jīng)網(wǎng)絡,其基本結構如圖3所示。
3.1 聚類結果分析
構建光伏系統(tǒng)的氣象特征量:平均風速、氣溫、陽光輻射度、日降雨量、最大風速和氣壓。每個特征量在5:00—19:00內每隔1 h采集1次,每日15個點,共180天。歸一化后形成[180×90]維的特征矩陣,計算距離矩陣后進行聚類分析。
首先執(zhí)行傳統(tǒng)密度峰值聚類算法如圖4所示。聚類中心過少,需進行優(yōu)化以挖掘隱含中心。
此時,應重新選取包括更多“疑似中心”在內的點作為初始中心。經(jīng)1.2.4節(jié)優(yōu)化后得到全新距離矩陣,作出決策圖與[γ]曲線,如圖5所示,優(yōu)化后聚類中心增多至5個。由此表明,經(jīng)過類間距離優(yōu)化后,某些“隱藏類簇”被挖掘出來。
3.2 聚類算法的性能分析
本文采用3種典型指標對不同時間跨度的10個數(shù)據(jù)集進行聚類有效性評價,評價結果如圖7~圖9所示。其中:SSE(誤差平方和)代表一個子類到所在類簇的聚類中心的歐氏距離,該值越小聚類效果越好;DBI(Davies?Bouldin Index)代表所有類之間最大相似度的均值,該值越小聚類效果越好;SC(輪廓系數(shù))結合了類簇內聚度和類間分離度兩個計算指標,該值越接近1聚類效果越好。
圖7比較了在優(yōu)化前后的SSE指標,優(yōu)化后SSE明顯下降;圖8比較了優(yōu)化前后的DBI指標,優(yōu)化后DBI下降同樣較為明顯;圖9比較了優(yōu)化前后的SC指標,優(yōu)化后SC出現(xiàn)了明顯提高。由此可見,優(yōu)化算法的優(yōu)化性能顯著,能夠有效提升聚類的有效性。
3.3 相似日匹配與功率預測分析
得到聚類結果后,通過2.1節(jié)相似日匹配方法計算出待預測日與各類簇之間的灰色關聯(lián)度[Rl]。其的計算結果,如表2所示。類簇2的關聯(lián)度最高,分別將其對應的氣象數(shù)據(jù)與發(fā)電數(shù)據(jù)作為訓練集,經(jīng)Elman模型學習后得出預測結果,如圖10所示。傳統(tǒng)算法的預測結果如圖11所示。
結合表3分析圖10、圖11可知,相較于傳統(tǒng)算法,優(yōu)化算法的功率預測曲線與實測曲線的契合度更高、預測誤差更小(僅為2.35%),預測整體精度得到了明顯提高。
本文提出一種基于密度峰值聚類的短期光伏功率預測方法,詳細闡述了聚類算法的原理、優(yōu)化過程的具體實現(xiàn)步驟,以及利用聚類結果實現(xiàn)短期光伏功率預測的過程。實驗結果表明,類間距離優(yōu)化能夠有效提高密度峰值聚類算法的有效性,且算法在優(yōu)化后能有效提高光伏功率的短期預測精度。
參考文獻
[1] 嵇靈,牛東曉,汪鵬.基于相似日聚類和貝葉斯神經(jīng)網(wǎng)絡的光伏發(fā)電功率預測研究[J].中國管理科學,2015,23(3):118?122.
JI Ling, NIU Dongxiao, WANG Peng. Photovoltaic load forecasting based on the similar day and Bayesian neural network [J]. Chinese journal of management science, 2015, 23(3): 118?122.
[2] 楊金煥,于化叢,葛亮.太陽能光伏發(fā)電應用技術[M].北京:電子工業(yè)出版社,2009.
YANG Jinhuan, YU Huacong, GE Liang. Application technology of solar photovoltaic power generation [M]. Beijing: Publishing House of Electronics Industry, 2009.
[3] 周念成,閆立偉,王強鋼.光伏發(fā)電在微電網(wǎng)中接入及動態(tài)特性研究[J].電力系統(tǒng)保護與控制,2010,38(14):119?127.
ZHOU Niancheng, YAN Liwei, WANG Qianggang. Research on dynamic characteristic and integration of photovoltaic generation in microgrids [J]. Power system protection and control, 2010, 38(14): 119?127.
[4] 王曉蘭,葛鵬江.基于相似日和徑向基函數(shù)神經(jīng)網(wǎng)絡的光伏陣列輸出功率預測[J].電力自動化設備,2013,33(1):100?103.
WANG Xiaolan, GE Pengjiang. PV array output power forecasting based on similar day and RBFNN [J]. Electric power automation equipment, 2013, 33(1): 100?103.
[5] 傅美平,馬紅偉,毛建容.基于相似日和最小二乘支持向量機的光伏發(fā)電短期預測[J].電力系統(tǒng)保護與控制,2012,40(16):65?69.
FU Meiping, MA Hongwei, MAO Jianrong. Short?term photovoltaic power forecasting based on similar days and least square support vector machine [J]. Power system protection and control, 2012, 40(16): 65?69.
[6] 程啟明,張強,程尹曼,等.基于密度峰值層次聚類的短期光伏功率預測模型[J].高電壓技術,2017,43(4):1214?1222.
CHENG Qiming, ZHANG Qiang, CHENG Yinman, et al. Short?term photovoltaic power prediction model based on hierarchical clustering of density peaks [J]. High voltage engineering, 2017, 43(4): 1214?1222.
[7] 代倩,段善旭,蔡濤,等.基于天氣類型聚類識別的光伏系統(tǒng)短期無輻照度發(fā)電預測模型研究[J].中國電機工程學報,2011,31(34):28?35.
DAI Qian, DUAN Shanxu, CAI Tao, et al. Short?term PV generation system forecasting model without irradiation based on weather type clustering [J]. Proceedings of the CSEE, 2011, 31(34): 28?35.
[8] 丁志勇,楊蘋,楊曦,等.基于連續(xù)時間段聚類的支持向量機風電功率預測方法[J].電力系統(tǒng)自動化,2012,36(14):131?135.
DING Zhiyong, YANG Ping, YANG Xi, et al. Wind power prediction method based on sequential time clustering support vector machine [J]. Automation of electric power systems, 2012, 36(14): 131?135.
[9] RODRIGUEZ A, LAIO A. Clustering by fast search and find of density peaks [J]. Science, 2014, 344(6191): 1492?1496.
[10] HAN J W, KAMBER M.數(shù)據(jù)挖掘:概念與技術[M].范明,孟小峰,譯.北京:機械工業(yè)出版社,2001.
HAN J W, KAMBER M. Data mining: concepts and techniques [M]. FAN Ming, MENG Xiaofeng, translation. Beijing: China Machine Press, 2001.