摘要:光伏功率精準預測有助于電網(wǎng)調(diào)度中心提前編制出科學的調(diào)度計劃,從而提升經(jīng)濟效益。提出一種基于相似日理論結(jié)合極限學習機(extreme learning machine,ELM)的光伏功率預測模型。首先,采用皮爾森相關(guān)系數(shù)法挑選出與光伏出力相關(guān)程度最強的氣象特征;其次,采用模糊C均值聚類法(fuzzy-c-means algorithm,F(xiàn)CM)將歷史樣本數(shù)據(jù)按照所選的氣象特征劃分相似日;最后,根據(jù)預測日天氣類型選取對應相似日數(shù)據(jù)樣本集,利用增量型極限學習機進行預測,將影響光伏出力的主要天氣特征量作為輸入,光伏發(fā)電功率作為輸出,并采用改進的果蠅優(yōu)化算法對極限學習機隱含層參數(shù)進行優(yōu)化。預測結(jié)果表明,提出的方法對光伏功率預測精度有明顯的提升。
關(guān) 鍵 詞:極限學習機; 皮爾森算法; 模糊C均值; 果蠅優(yōu)化算法氧化鈷; 納米結(jié)構(gòu); 電容器; 電催化
中圖分類號:TM614
文獻標志碼:A
doi:10.3969/j.issn.1673-5862.2024.04.013
Short-term photovoltaic power prediction based on similar days and EM-ELM
CUI Song1,2, LYU Yan1,2, CHEN Lanfeng1,2BAI Jiaqing1, ZHANG Dong2, LIU Quan3, LI Haoxuan3, NING Zhaoqiu3, FANG Wenmo4, SUN Ming4, SUN Zhiqiang4
(1. College of Physical Science and Technology, Shenyang Normal University, Shenyang 110034, China)(1. Graduate Department, Shenyang Institute of Engineering, Shenyang 110136, China; 2. Engineering Technology Research Institute, Shenyang Institute of Engineering, Shenyang 110136, China; 3. State Grid Tieling Power Supply Company, Tieling 112000, China; 4. Shenyang Aircraft Industry Company, Shenyang 110034, China)
Abstract:Accurate prediction of photovoltaic power can enable power grid dispatching center to work out scientific dispatching plan in advance and improve economic benefits. This paper presents a photovoltaic power prediction model based on the similar day theory combined with extreme learning machine(ELM). Firstly, Pearson correlation coefficient method was used to select the meteorological features with the strongest correlation degree with photovoltaic output. Secondly, the fuzzy c-means algorithm(FCM)was used to divide the historical sample data into similar days according to the selected meteorological characteristics. Finally, the data sample set corresponding to similar days was selected according to the weather types of the forecast days, and the incremental extreme learning machine was used for prediction. The main weather features affecting the photovoltaic output were taken as the input,and the photovoltaic power was taken as the output. The parameters of the hidden layer of the extreme learning machine were optimized by the improved fruit fly optimization algorithm. The prediction results show that the method proposed in this paper can significantly improve the prediction accuracy of photovoltaic power.
Key words:extreme learning machine; Pearson algorithm; fuzzy c-means; fruit fly optimization algorithm
光伏發(fā)電并網(wǎng)提高了電網(wǎng)的經(jīng)濟效益,推進了國網(wǎng)公司對“三型兩網(wǎng)、世界一流”[1-2]戰(zhàn)略的發(fā)展。但是,太陽能的不確定性和波動性很大,會對電力系統(tǒng)的安全與穩(wěn)定運行產(chǎn)生很大的影響。因此需要精準預測光伏發(fā)電功率[3],這有助于電網(wǎng)調(diào)度控制中心編制出科學合理的調(diào)度計劃,從而提高資源利用效率,產(chǎn)生顯著的經(jīng)濟效益。
目前,太陽能發(fā)電預測可以分為間接和直接兩種方法。間接法就是預測太陽的光照強度,然后再根據(jù)得到的光照強度預測光伏發(fā)電的出力情況,預測過程復雜且耗費時間;而直接法是直接選取歷史樣本數(shù)據(jù)集作為輸入進行預測的一種方法,可以節(jié)省大量的時間,同時也可以取得很高的預測精度。文獻[4]分別采用ELM和徑向基神經(jīng)網(wǎng)絡(luò)搭建光伏功率預測模型,通過仿真對比得到結(jié)果,具有更高的預測性能。文獻[5]則采用與模糊平均聚類方法結(jié)合的方式進行預測,其預測準確率明顯提高。文獻[6]提出一種基于 BP神經(jīng)網(wǎng)絡(luò)的模糊聚類預測方法,結(jié)果表明,該預測方法在各個時刻的預測精度都更高。文獻[7]提出一種基于粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)算法的預測模型,結(jié)果表明只有在晴朗天氣時的預測精度較高。文獻[8]提出了一種基于相似日的預測方法,并將其與高斯過程的回歸方法相結(jié)合,在晴天、陰天、雨天都能得到較好的預測效果。為了提升預測模型的精度,提出一種相似日和改進極限學習機的預測模型。采用皮爾森相關(guān)系數(shù)法,選擇對光伏出力影響較大的天氣特征結(jié)合歷史光伏出力聯(lián)合進行分析預測。利用 FCM算法將歷史數(shù)據(jù)集分為晴天、陰天和雨天三種,建立改進的果蠅優(yōu)化算法優(yōu)化改進的極限學習機模型,并應用不同的相似日樣本集對模型進行訓練;最后,根據(jù)預測日天氣類型選取對應的預測模型進行預測,得到光伏功率預測值。
1 相關(guān)性分析與相似日選取
1.1 相關(guān)性分析
光伏發(fā)電的發(fā)電量存在很大的隨機性和波動性。為了提升光伏功率的預測效率與精度,將選取與預測目標日相關(guān)的氣象特征結(jié)合光伏出力歷史數(shù)據(jù)進行預測分析。因此,對光伏功率的影響因素與相關(guān)性分析就顯得更加重要。
皮爾森相關(guān)系數(shù)可以反映兩個隨機變量之間的線性相關(guān)性。對于長度均為n的兩組數(shù)據(jù)x和y,建立x和y的Pearson相關(guān)系數(shù)數(shù)學模型如式(1)所示[9]:
式中:ρx,y表示x和y之間的相關(guān)系數(shù);xi和yi分別為各自所在序列中的第i個數(shù)據(jù)樣本;x-和y-分別為各自對應的序列x的均值和序列y的均值;ρx,y的取值在[1,-1]之間,若|ρx,y|靠近1,說明x和y之間相關(guān)性強;若|ρx,y|靠近0,說明x和y之間的相關(guān)性較弱;相關(guān)系數(shù)的正值和負值分別代表了x和y之間呈正相關(guān)性和負相關(guān)性,只要|ρx,y|gt;0.5,就可以說明x和y之間的相關(guān)性是較強的[10]。光伏發(fā)電功率與天氣特征之間的相關(guān)系數(shù)如表1所示。
由表1可知,光照強度對光伏出力影響最大,其次是溫度;而風速和風向與光伏出力的相關(guān)性不大;降雨量與光伏出力之間呈負相關(guān),且相關(guān)性小。因此,本文將太陽輻照度和溫度作為影響光伏出力的主要因素進行分析。光伏功率與太陽輻照度、環(huán)境溫度的關(guān)系分別如圖1、圖2所示。
為了避免數(shù)據(jù)本身對樣本造成影響,首先對數(shù)據(jù)進行歸一化處理。由圖1、圖2可見,太陽能輻照度與光伏功率之間的關(guān)系最為密切,環(huán)境溫度隨著光照強度的變化趨勢而發(fā)生變化,也具有一定的關(guān)聯(lián)性。因此選擇光照強度和環(huán)境溫度作為主要影響因素進行下一步的分析。
1.2 相似日選取
1.2.1 FCM聚類
模糊聚類算法在模式識別算法中屬于很重要的一種算法,其應用范圍不斷擴大,對聚類結(jié)果的需求也越來越高。FCM計算過程為:
步驟1:定義損失函數(shù)
其中:uij為隸屬度,表示了樣本i和簇j之間的隸屬度;U表示隸屬度矩陣;V表示聚類中心;m是隸屬度因子,m的取值為大于1的正數(shù);dij表示樣本i與簇j的聚類中心之間的歐式距離。
步驟2:初始化隸屬度矩陣U(0),并設(shè)置聚類的個數(shù)c,并開始第一次迭代,l=1。
步驟3:計算第l步的聚類中心V(l),聚類中心的更新過程如式(3):
步驟4:然后對隸屬度矩陣U(l)進行更新,并且計算聚類的損失函數(shù)J(l),其過程如式(4)和式(5)表示:
其中d(l)ij=‖xi-v(l)j‖。
步驟5:設(shè)定隸屬度的終止閾值εugt;0以及損失函數(shù)的終止閾值εJgt;0。當滿足下列條件其中之一時,即max{|x(l)ij-u(l-1)ij|}lt;εu或|J(l)-J(l-1)|lt;εJ時便停止迭代,否則返回步驟3繼續(xù)迭代過程。
通過以上的迭代過程就可以求得最佳的隸屬度矩陣U和聚類中心矩陣V。根據(jù)U可以確定樣本所屬的類別,劃分的方式為當uij=max1≤j≤c{uij}時,樣本xi就被歸為第j類。
2 改進的果蠅優(yōu)化算法
2.1 果蠅優(yōu)化算法
果蠅優(yōu)化算法[11](fruit fly optimization algorithm,F(xiàn)OA)是一種根據(jù)果蠅的活動衍生而來的一種優(yōu)秀的仿生算法。它具有設(shè)置參數(shù)較少、迭代速度快、尋優(yōu)能力強的優(yōu)勢。算法的尋優(yōu)過程如下:首先,隨機設(shè)定果蠅種群搜尋的目標方向。以下為果蠅優(yōu)化算法的計算過程:
Xi=xi+Δδx,Yi=yi+Δδy,i=1,2,…,n(6)
其中:Δδx、Δδy∈R;將隨機選取的果蠅群體的初始坐標(xi,yi);果蠅種群的規(guī)模為n。
Si表示味道濃度的判定值,通過以下的公式表示為:
在式(7)中,Disti=1/X2i+Y2i,該值代表了果蠅群體現(xiàn)在所處坐標與原點的距離。
其次,將Si代入適應度函數(shù)中得到該果蠅個體所處坐標的氣味濃度值Smelli,其表示形式為:
Smelli=f(Si)i=1,2,…,n(8)
最后,得到種群中最大的氣味濃度值Smellmax以及相應個體所處的坐標,(xSmellmax,ySmellmax)即為該個體所處的最佳目標位置,將該坐標代入式(8)中得到最優(yōu)值的搜索位置,最終通過迭代尋優(yōu)得到最優(yōu)值。
2.2 果蠅優(yōu)化算法的改進
傳統(tǒng)的果蠅算法在搜尋最佳味道濃度判定值Si時,果蠅個體隨機向不同方向飛行,容易使得果蠅群均往一個方向飛,導致FOA提前得到最優(yōu)值或者只得到局部最優(yōu)值的情況[12]。為了避免該問題的發(fā)生,提出了一種扇形區(qū)域搜索機制的果蠅優(yōu)化算法(sector search fruit fly optimization algorithm,SS-FOA),即按照果蠅種群個體的數(shù)量劃分果蠅個體搜索范圍所占角度,形成扇形搜索機制,改進后的果蠅群體在二維空間的分布范圍近似圓形,并使得果蠅個體在每一個扇形區(qū)域內(nèi)飛行,這樣保證了每個果蠅個體飛行方向的幾率都是一致的。為了擴大搜索范圍,在二維搜索區(qū)域的每一個角都放一只果蠅,提高算法的運算速度,具體步驟如下:
(1)初始化設(shè)置:最大的迭代次數(shù)T,種群規(guī)模Sizepop以及扇區(qū)的角度t通過經(jīng)驗進行人為選取,種群的初始化坐標為[Xi,Yi];其中t的角度間隔為0lt;2πSizepop-4lt;2π;
(2)由扇形區(qū)域搜索機制生成果蠅個體,并且搜索半徑是[0,L]內(nèi)的任意值,每個扇形區(qū)域的角度間隔為t,由式(6)推出
(3)設(shè)置并生成在四個角的固定方向上的果蠅個體,其搜索半徑為L
(4)找到果蠅個體的坐標[Xi,Yi],由式(6)求出果蠅個體的氣味濃度值Si;
(5)將果蠅個體位置的味道濃度Si帶入判定函數(shù)(8)中,從而求出該果蠅的Smelli,即為果蠅個體的適應度值;
(6)如果通過計算求出的最優(yōu)濃度值比當前濃度值好,則將新的最優(yōu)果蠅個體坐標作為下一次計算的種群坐標,并記錄其適應度;
(7)重復步驟(2)到(5),直到達到最終條件為止。
圖3和圖4分別為傳統(tǒng)果蠅算法和扇形搜索機制的果蠅算法隨機分布圖。從圖中可以看出,傳統(tǒng)果蠅算法因為果蠅個體飛行方向的隨機性,導致果蠅均往距離果蠅群中心較遠的方向飛行,而從SS-FOA的果蠅隨機分布圖看出,果蠅在一個圓形的搜索范圍內(nèi)進行尋優(yōu),每個果蠅在每個搜索方向的幾率相同,增強了算法的尋優(yōu)性能,從而說明改進了果蠅算法的有效性。
2.3 極限學習機原理
極限學習機是一種單隱層前饋式神經(jīng)網(wǎng)絡(luò),目前已經(jīng)廣泛地應用于識別未知的線性或非線性系統(tǒng)中,該算法如下所示。
假設(shè)將樣本數(shù)據(jù){(xj,tj)}Nj=1分為N組,其中,輸入xj∈Rn,輸出tj∈Rn。根據(jù)經(jīng)驗隨機選擇隱含層個數(shù)以及合適的激活函數(shù),將誤差與這N個樣本降到接近為零。這個過程描述如下:
其中:wi=[wi1,wi2,…,win]T,表示輸入節(jié)點與第i個隱含層神經(jīng)元之間的權(quán)重向量,βi=[βi1,βi2,…,βim]T表示第i個隱含層神經(jīng)元與輸出節(jié)點之間的權(quán)重向量,bi代表隱含層中第i個神經(jīng)元的偏置。
隱含層輸出矩陣形式如式(13)所示:
式(14)中,H用來表示隱含層的輸出矩陣,β用來表示隱含層神經(jīng)元與輸出節(jié)點之間的權(quán)重矩陣,T用來表示目標的輸出矩陣。g代表了ELM的激活函數(shù),本文采用sigmoid函數(shù)作為ELM隱含層的激活函數(shù),如式(15)所示。
式(15)中,x和g(x)分別代表了 ELM 中隱含層的輸入值和輸出值。
ELM的隱含層參數(shù)是隨機選擇的,當隱層參數(shù)確定以后,那么隱藏層的輸出矩陣就同時被確定下來,隱含層到輸出層的權(quán)值β可以采用最小范數(shù)的最小二乘方式求解:
‖Hβ*-T‖=‖HH+T-T‖=minβ‖Hβ-T‖(16)
其解可表示為:
β*=H+T(17)
式(17)中,H+為隱含層的輸出矩陣,并且H+為H的廣義逆矩陣。與傳統(tǒng)的梯度下降法的神經(jīng)網(wǎng)絡(luò)相比較,ELM避免了陷入局部極小值或計算量過高的缺點,它可以提高學習速度并且具有很好的泛化能力。但是隱含層個數(shù)的隨機性會造成計算量過大或者擬合度低的問題,影響算法性能,因此隱含層個數(shù)的選取是十分重要的。
2.4 誤差最小極限學習機
由于傳統(tǒng)極限學習機的隱藏層個數(shù)通常根據(jù)經(jīng)驗隨機確定,這使得其擬合性能在一定程度上受到網(wǎng)絡(luò)結(jié)構(gòu)的影響,為了提升極限學習機的預測效率及預測精度,本文運用誤差最小極限學習機(error minimized extreme learning machine,EM-ELM)來確定極限學習機的結(jié)構(gòu),其過程如表2所示。
3 構(gòu)建SS-FOA-EM-ELM短期光伏功率預測模型
3.1 改進果蠅優(yōu)化算法優(yōu)化EM-ELM
在EM-ELM網(wǎng)絡(luò)中,通過隱藏層節(jié)點的參數(shù)wi和bi求出權(quán)值向量β,但EM-ELM的缺點在于其參數(shù)具有隨機性,會對預測結(jié)果的準確性造成一定的影響[13]。為提升其學習的性能,本文引入SS-FOA算法對EM-ELM網(wǎng)絡(luò)的參數(shù)選取進行合理的優(yōu)化。
基于SS-FOA-EM-ELM的預測算法流程描述如下:
(1)SS-FOA算法進行參數(shù)初始化設(shè)置。
(2)把訓練數(shù)據(jù)集輸入EM-ELM模型,利用適應度函數(shù)求出果蠅的個體適應度,并確定其最佳位置。
(3)更新果蠅個體的濃度值和位置。
(4)通過對果蠅個體適應性的分析,得到果蠅個體的氣味濃度和位置信息。
(5)如果當前的迭代數(shù)tgt;T,則該算法結(jié)束,并輸出最佳權(quán)重w和隱含層偏置b,反之若t=t+1,則返回至步驟(2)步。
(6)將得到的最優(yōu)權(quán)重w和隱含層偏置b應用到EM-ELM算法過程中,從而得到一個經(jīng)過優(yōu)化的EM-ELM模型。
3.2 建模過程
傳統(tǒng)預測方法因歷史數(shù)據(jù)樣本數(shù)量大、時間冗長的特點,需要對數(shù)據(jù)樣本按季節(jié)、天氣類型進行分類,這樣處理會大大增加工作量。而采用相似日算法便會解決這一問題,還會有效提升預測效率。本文構(gòu)建了相似日和EM-ELM的短期光伏功率預測模型,建模過程如下:
(1)采用Pearson算法選擇與光伏發(fā)電功率相關(guān)性強的氣象因素,為聚類分析做準備。
(2)選取相關(guān)性強的氣象因素進行聚類分析,把相關(guān)性強的氣象因素作為FCM輸入劃分相似日,得到訓練樣本集。
(3)分別用不同相似日的樣本集訓練SS-FOA-EM-ELM預測模型,得到多個訓練好的預測模型。
(4)根據(jù)預測日天氣類型選取對應的預測模型進行預測。
4 算例分析
4.1 模型評價指標
本文采用平均絕對百分比誤差(mean absolute percentage error,MAPE)和均方根誤差(root mean square error,RMSE)兩種評價指標對模型的預測精確程度進行分析,其公式分別如式(18)和式(19)所示。
式(18)和式(19)中,Pti為功率實際值;Pprei為功率預測值;K為數(shù)據(jù)個數(shù)。
4.2 算例分析及對比
基于光伏發(fā)電只在白天工作的特點,數(shù)據(jù)采樣只能在白天進行。本文選取江蘇某光伏電站全年數(shù)據(jù)作為仿真樣本數(shù)據(jù)集,對每天7:30-16:30時段,每間隔15分鐘進行一次采樣,共37次。為驗證本文所提方法的準確性,建立FOA-EM-ELM、PSO-EM-ELM、ELM模型進行對比實驗,分別基于晴天、陰天、雨天3種天氣類型對光伏發(fā)電功率進行預測。
圖5~圖7為不同天氣類型下光伏功率預測圖,其中x軸為采樣點個數(shù),y軸代表光伏發(fā)電功率。
圖5為晴天時的光伏功率預測圖,可以看出,因為晴天的天氣狀況比較穩(wěn)定,因此四種模型的功率預測曲線都與實際值接近,均具有較好的預測精度。圖6為多云時的光伏功率預測圖,由于天氣狀況比晴天時波動性大,因此各個模型的預測精度較晴天時均有下降。圖7為雨天的光伏功率預測圖,可以看出,光伏發(fā)電受云層密度和光照的影響,四種模型的預測精度均受到不同程度影響。
由表3給出的預測結(jié)果的誤差指標可以看出,晴天時,四種模型中除ELM外其他模型的平均絕對百分比誤差在10%以內(nèi),預測結(jié)果都較準確。相比之下,本文所建立模型預測效果更加出色,均方根誤差只有1.03。多云時,ELM模型預測誤差超過20%,平均絕對百分比誤差超過15%。
本文所建立模型絕大多數(shù)預測點誤差控制在8%以內(nèi),均方根誤差只有2.18。雨天時,ELM模型誤差最高,平均絕對百分比誤差接近30%,F(xiàn)OA-EM-ELM和PSO-EM-ELM模型的預測誤差也均超過20%,而本文所建立模型的預測誤差絕大多數(shù)均控制在10%以內(nèi),均方根誤差僅為1.69,因此本文所建立模型具有更強的精度。
5 結(jié)論
考慮氣象特征以及天氣類型對光伏功率預測的影響,提出基于相似日和EM-ELM的短期光伏功率預測方法,構(gòu)建FCM結(jié)合改進果蠅優(yōu)化算法優(yōu)化誤差最小極限學習機的短期光伏功率預測模型,通過實驗仿真分析,得到以下結(jié)論:
(1)從適用性角度來看,本文所提模型相比其他三種天氣情況具有相對較高的預測精度,對短期光伏預測實際工程應用具有一定的參考意義。
(2)各個模型在晴天時的預測精度最高,相比之下,本文提出模型精度最好;在陰天和雨天時,因為天氣類型使得光伏電池板受光照的程度不同,導致預測精度均有所下降,與其他模型相比,本文提出的模型具有更高的預測精度。
參考文獻:
[1]張程熠,唐雅潔,李永杰,等.適用于小樣本的神經(jīng)網(wǎng)絡(luò)光伏預測方法[J].電力自動化設(shè)備,2017,37(1):101-106+111.
[2]龔鶯飛,魯宗相,喬穎,等.光伏功率預測技術(shù)[J].電力系統(tǒng)自動化,2016,40(4):140-151.
[3]岳增霖,金浩軒,張偉豪,等.基于OneNET 及微信小程序的校園運動場地預約系統(tǒng)[J].電子產(chǎn)品世界,2019,26(12):55-59.
[4]TANG P Z,CHEN D,HOU Y S.Entropy method combined with extreme learning machine method for the short-term photovoltaic power generation forecasting[J].Chaos Solitons Fractal,2016,89:243-248.
[5]張金金,張倩,馬愿,等.模糊聚類-Elman神經(jīng)網(wǎng)絡(luò)短期光伏發(fā)電預測模型[J].電測與儀表,2020,57(12):46-51.
[6]馬曉玲,張祥飛,龐清樂,等.模糊聚類-BP神經(jīng)網(wǎng)絡(luò)短期光伏發(fā)電預測模型[J].物聯(lián)網(wǎng)技術(shù),2021,11(10):69-72.
[7]臧冬,尹杭,劉洋.基于改進神經(jīng)網(wǎng)絡(luò)算法的光伏發(fā)電功率短期預測[J].電氣開關(guān),2020,58(3):49-53.
[8]孟安波,陳嘉銘,黎湛聯(lián),等.基于相似日理論和CSO-WGPR的短期光伏發(fā)電功率預測[J].高電壓技術(shù),2021,47(4):1176-1184.
[9]上官鑫,秦文萍,夏福良,等.基于暫態(tài)電壓Pearson 相關(guān)性的MMC 多端柔性直流配電網(wǎng)單極接地故障保護方案[J].高電壓技術(shù),2020,46(5):1740-1749.
[10]MOORE D S.Statistics:Concepts and controversies[M].New York:W.H.Freeman and Company,2017:290-096.
[11]張水平,王麗娜.果蠅優(yōu)化算法的進展研究分析[J].計算機工程與應用2021;57(6):22-29.
[12]孫小杰,孫學偉.基于MFOA-ELM的水質(zhì)等級預測研究[J].中國農(nóng)機化學報2019,40(8):176-181.
[13]朱敏,許愛強,許晴.基于改進多層核超限學習機的模擬電路故障診斷[J].兵工學報,2021,42(2):356-369.
【責任編輯:封文江】