国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進云分段模型的光伏功率缺失數據補齊研究

2020-12-16 04:45張弘鵬劉家慶段志偉徐志英
可再生能源 2020年12期
關鍵詞:包絡線輻照度散點

張弘鵬, 劉家慶, 段志偉, 徐志英, 方 淵

(1.國家電網公司東北分部, 遼寧 沈陽 110180; 2.國電南瑞科技股份有限公司, 江蘇 南京 211106)

0 引言

隨著光伏發(fā)電在電網中的占比逐漸增大,該技術越來越受到人們的重視。 完整、可信的光伏功率數據成為開展光伏功率預測、電網優(yōu)化控制和發(fā)電性能評估等研究的基礎[1]~[4]。在光伏電站實際運行的過程中,由于光伏發(fā)電設備和通信會發(fā)生偶然性故障,導致光伏功率數據出現(xiàn)大量異常和缺失的問題,極大地影響了研究人員挖掘光伏功率數據所蘊含的信息,因此,補齊光伏功率缺失數據不僅保證了光伏功率數據的完整性,也為光伏發(fā)電的研究奠定基礎。

導致光伏功率數據缺失的原因包括采集過程中的光伏功率數據缺失、處理異常數據后的光伏功率數據缺失[5],[6]。 目前,光伏功率缺失數據補齊的研究方法可分為3 類:第1 類方法為通過光伏功率數據本身的時序性補齊缺失數據,主要有均值法和相似片段法等,該類方法所用的模型比較簡單,且易于實現(xiàn),但由于該類方法未考慮光伏功率缺失數據的影響因素,過于依賴光伏功率數據本身的連續(xù)性,因此,高比例缺失數據和連續(xù)缺失數據的數據補齊效果較差[7],[8];第2 類方法為機器學習法,文獻[9]利用相關向量機回歸模型,基于互信息理論和最大相關、最小冗余原則,通過機器學習挖掘光伏功率與其他各影響因素之間的關系, 并利用上述關系對風電功率缺失數據進行補齊,該方法能夠在保持有效信息的基礎上,對高維數據進行降維,利用機器學習法時,須要對較多數據樣本進行訓練,由于計算的復雜度較高,因此, 需要較長的時間才能夠補齊缺失的大量光伏功率數據; 第3 類方法為通過構建光伏功率的條件概率分布模型實現(xiàn)光伏功率缺失數據的補齊,文獻[10]利用Copula 理論建立風電輸出功率的條件概率模型, 基于風機輸出功率的相關特性實現(xiàn)缺失數據的補齊,分析結果表明,該方法的補齊效果優(yōu)于多項式補齊法、持續(xù)法和平均值法。通過構建光伏功率的條件概率模型實現(xiàn)缺失數據的補齊,既考慮了缺失數據的相關影響因素,又能夠降低運算的復雜度。

由于光伏發(fā)電本身具有周期性、 波動性和隨機性等特點,因此,上述關于風電功率缺失數據和其他鄰域的補齊方法, 對光伏功率缺失數據的補齊效果有待考證。目前,國內對于光伏功率缺失數據補齊方法的研究尚處于起步階段, 而國外已有一些關于光伏功率缺失數據補齊方法相關研究的資料。 文獻[11]通過K-means 聚類算法,以相似的、 含有完整數據的歷史日期替代含有缺失數據的日期,該方法在一定范圍內是可行的,且可以用于不同類型的時間序列,但該方法過于依賴歷史數據的完整性和準確性。 文獻[12]首先建立了神經網絡方法;然后,運用該方法推測出太陽輻照度缺失數據;最后,通過太陽輻照度-光伏功率模型計算出對應的光伏功率數據。 該方法適用于太陽輻照度和對應光伏功率數據均缺失的情況,但利用神經網絡方法和太陽輻照度-光伏功率模型會不可避免地造成二次誤差。 文獻[13]通過插值方法對太陽輻照度進行缺失數據補齊,再通過神經網絡方法訓練生成的太陽輻照度-光伏功率模型,對光伏功率缺失數據進行補齊,該方法同樣會造成二次誤差。

本文對某光伏電站2018 年的光伏功率進行描述和預處理;然后,根據光伏功率輸出模型對光伏功率數據進行分段,并利用正向云算法建立傳統(tǒng)云模型;接著,利用聯(lián)合經驗函數擬合出太陽輻照度和光伏功率的聯(lián)合概率密度分布,從而得到各云分段的光伏功率條件概率擬合值,并結合云理論構建改進云模型,根據光伏功率缺失數據的波動性以及云模型的改進結果構建光伏功率缺失數據補齊模型;最后,利用不同方法對不同種類、不同數據缺失比例的光伏功率缺失數據進行補齊,并以準確率和平均相對誤差作為指標對各個數據補齊方法進行評價。 本文旨在探索一種更加適合光伏功率數據特征的缺失數據補齊方法。

1 光伏功率數據描述及預處理

本文采用吉林省吉林市高臺子區(qū)某光伏電站的光伏功率數據進行分析,該電站裝機容量為20 MW,光伏功率數據采集時間間隔為5 min。 2018年,高臺子地區(qū)某光伏電站輸出功率的時序圖如圖1 所示。

圖1 2018 年,高臺子地區(qū)某光伏電站輸出功率的時序圖Fig.1 Timing diagram of the output power of a photovoltaic power station in the Gaotaizi area in 2018

由圖1 可知,在光伏功率數據采集的過程中,存在某些光伏功率數據缺失的情況。其中,兩個較長的連續(xù)光伏功率數據缺失時段為1 月19 日6:10-1 月24 日22:30 和10 月20 日4:00 -10月26 日3:45。 此外,還存在某些隨機光伏功率數據缺失的時段,該組數據的缺失比例為4.67%。為達到國家電網公司發(fā)布的《光伏發(fā)電功率預測系統(tǒng)功能規(guī)范》 中關于實驗數據量的完整性須達到99%以上的要求[14],同時為了構建準確的光伏功率條件概率分布模型, 本文將剔除光伏功率缺失數據、光伏功率超過20 MW 的數據和無太陽輻照度,但仍有光伏功率輸出的數據,處理結果如圖2所示。

圖2 2018 年,高臺子地區(qū)某光伏電站發(fā)電功率數據預處理圖Fig.2 Preprocessing of photovoltaic power data of a photovoltaic power station in Gaotaizi district, 2018

由圖2 可知, 光伏功率大致會隨著太陽輻照度的升高而增加,但由于電池板溫度、空氣濕度、風速和光照入射角的影響, 某太陽輻照度下的光伏功率數據會分布得比較分散。

2 傳統(tǒng)云分段模型及實現(xiàn)

云模型由中國工程院院士李德毅于1995 年提出并應用于智能控制、 數據處理和數據挖掘等諸多領域。正向云算法通過正向云發(fā)生器實現(xiàn),令太陽輻照度為x,通過云模型得到的光伏功率(功率云滴)為gi,i=1,2,…,n。 云模型算法的計算步驟如下。

①以擬合的絕對殘差作為指標, 對光伏功率數據樣本進行擬合,若擬合的函數為Gaussian 函數,得到光伏功率數據樣本的近似表達式為

式中:y 為光伏功率數據;a,b,c 為擬合參數。

②逐漸改變擬合表達式中c 的大小, 使上包絡線y1與下包絡y2之間的數據約為整個實測數據的99%, 得到區(qū)間寬度Δc,Δc=|c1-c2|,c1,c2分別為上、 下包絡線的擬合參數,y1,y2的計算式分別為

③設光伏功率數據的3 個數字特征Ex=b,En=c,He=Δc/3。

④由云模型熵Enw和超熵Hew生成正態(tài)隨機熵為En2′=N(En,H)。

⑤求得一定太陽輻照度下的功率云滴gi。 gi的計算式為

⑥重復步驟④,⑤,直至生成各太陽輻照度下的功率云滴。

為了更加精確地包裹樣本數據,擬合曲線n(x)、上界函數h(x)和下界函數d(x)不采用同一種擬合函數。 通常,Hew為一個定值,Hew=c/3。 上、下包絡線的正態(tài)隨機熵Hes(x),Hed(x)的計算式分別為

本文參照文獻[15] 提供的理想光伏功率模型,確定了某一特定太陽輻照度x1,在該太陽輻照度下光伏出力與光照強度的關系開始由非線性關系變?yōu)榫€性關系;此外,還確定了另一特定太陽輻照度x2, 在該太陽輻照度下光伏出力與光照強度的線性相關性減弱。x1,x2分別為400,1 000 W/m2。

根據上述參數, 將太陽輻照度-光伏功率散點分為3 個云分段:當x∈[24,x1)時,太陽輻照度-光伏功率數據為下分段, 最小輸出功率所對應的太陽輻照度為24 W/m2;當x ∈[x1,x2)時,太陽輻照度-光伏功率散點數據為中分段; 當x∈[x2,1 270)時,太陽輻照度-光伏功率散點數據為上分段。

本文所采用的的包絡函數為高斯函數G(x)和線性函數P(x),二者的計算式分別為

光伏功率數據歸一化后, 對各云分段進行擬合, 為了滿足實驗要求以及剔除部分異常光伏功率數據,本文以包絡率為99%作為指標,得到擬合參數值,并分別用P(b,c)和G(a,b,c)表示各云分段的上、下包絡線,所用函數及參數如表1 所示。

表1 各云分段擬合或包絡函數表Table 1 Table of segmentation fit or envelope function

基于表1 的擬合包絡結果對光伏功率數據進行實際的擬合、包絡,得到的結果如圖3 所示。

圖3 利用擬合包絡得到的光伏功率隨太陽輻照度的分布圖Fig.3 Distribution map of photovoltaic power with solar irradiance obtained by fitting envelope

當包絡率為99.35%時, 傳統(tǒng)云分段模型算法結果如圖4 所示。

圖4 當包絡率為99.35%時,傳統(tǒng)云分段模擬結果Fig.4 When the envelope rate is 99.35%, the result of trad itional cloud segmentation simulation

由圖3,4 可知, 云模型結果并不能表示出太陽輻照度-光伏功率散點的聚散程度。

3 基于改進云分段模型的缺失數據補齊方法

本文基于Copula 理論的隨機熵算法提出了不同光伏功率數據片段的云分段模型算法如下。

①對光伏功率數據樣本的散點進行分段,得到光伏功率數據樣本的近似擬合表達式n(x),同時,進行上包絡線表達式h(x)與下包絡線表達式d(x)的擬合,使包絡率在99%以上。

②將實際的光伏功率數據樣本的散點分成上包絡點與下包絡點, 各云分段的太陽輻照度和光伏功率歸一化后, 求取太陽輻照度和光伏功率分布函數的聯(lián)合經驗函數 (具體模型見文獻[16]),從而得到特定太陽輻照度下光伏功率的條件概率分布。

③依照條件概率分布確定所需要的2 個熵:hiu(x),hid(x),其中,i∈[1,N],N 為云滴數,N 由包絡線與擬合線之間的寬度決定。

④設正態(tài)隨機常數ki=|N(0,1)|,該常數表征由于光伏功率存在復雜的影響因素導致自身產生隨機性。

⑤計算不同太陽輻照度條件下的功率云滴,以一次函數為例,上、下包絡線的云滴數表達式分別為

⑥重復步驟④,⑤,直至生成各太陽輻照度下的光伏功率云滴。

以中分段的上包絡點為例,太陽輻照度與光伏功率歸一化后的聯(lián)合經驗函數值如圖5所示。

圖5 中分段上包絡點聯(lián)合經驗分布Fig.5 Joint empirical distribution of envelope points on mid-segment

改進云分段模型的計算結果如圖6 所示。 由圖6 可知, 改進的云分段模型更加符合實際光伏功率散點分布特征。 改進云分段模型能得到完整的光伏功率散點條件概率分布密度P (gi|xi)。 其中:xi為不同時間點的太陽輻照度i ∈N+。

圖6 改進云分段模型結果Fig.6 Result of improve segmentation cloud model

設光伏功率數據缺失片段的數據點為(xk,gk),其中,k∈N+。 假設在光伏功率數據采集過程中,太陽輻照度數據完整且正確,即xk已知,gk未知,構建缺失數據補齊模型為

式中:(xl,xr) 為該缺失數據左側最接近已知光伏功率的散點;(xr,xl) 為缺失數據右側最接近已知光伏功率的散點;E[P(gi│xk)]為特定太陽輻照度下光伏功率散點的期望;g′k為光伏功率補齊的功率值。 該模型能夠針對不同波動性的缺失數據片段進行特定方法補齊。

4 算例分析

將光伏功率缺失數據補齊后,利用本文提出的方法、 滑動平均法、 傳統(tǒng)云模型和BP 神經網絡補齊方法同時對一定比例的光伏功率缺失數據進行補齊[17]。傳統(tǒng)云模型的補齊方法通過傳統(tǒng)云分段模型得到功光伏功率條件概率分布結果,然后通過式(3)補齊光伏功率缺失數據。BP 神經網絡方法將數據歸一化后,以太陽輻照度作為輸入, 光伏功率作為輸出,利用歷史完整光伏功率數據作為訓練集。通過平均相對誤差和準確率對光伏功率數據補齊效果進行評價。

w 的表達式為

r 的表達式為

式中:gk為缺失的功率值;g′k為補齊的功率值;C為裝機容量;K 為缺失數據的個數。

本文對10%,20%和30%的光伏功率數據進行隨機缺失和連續(xù)缺失。 利用不同方法對20%的光伏功率隨機、連續(xù)缺失數據進行補齊,結果分別如圖7,8 所示。

圖7 對20%光伏功率隨機缺失數據進行補齊的結果圖Fig.7 Figure of the result which completes random missing data for 20% PV power

圖8 對20%光伏功率連續(xù)缺失數據進行補齊的結果圖Fig.8 Figure of the result which completes continuousmissing data for 20% PV power

由圖7,8 可知,與其他3 種方法相比,對于光伏功率數據的隨機缺失和連續(xù)缺失, 本文方法的數據補齊結果,更加貼近實際光伏功率。

對于不同缺失條件下的補齊結果, 計算出各個方法補齊光伏數據的平均相對誤差和準確率,如表3 所示。

表3 不同缺失條件下,不同方法補齊光伏數據的平均相對誤差和準確率Table 3 Under the circumstance of different data missing, each method evaluates index statistics

由表3 可知, 隨著光伏功率數據缺失比例的增大,數據補齊的難度也在增大;光伏功率數據隨機缺失的補齊效果優(yōu)于連續(xù)缺失的補齊效果。 滑動平均法對小比例光伏功率數據隨機缺失的補齊效果較好 (光伏功率數據缺失率為10%的情況下,準確率為99.54%),但由于該方法僅依靠光伏功率數據缺失片段左右的2 個數據,隨著光伏功率數據隨機缺失比例的增大,該方法的補齊效果逐漸變差; 在光伏功率數據連續(xù)缺失情況下,該方法表現(xiàn)出嚴重的不適應性, 誤識別率達到10%以上。 對于傳統(tǒng)云分段模型數據補齊方法,數據補齊效果的穩(wěn)定性優(yōu)于滑動平均法,但在大比例光伏功率數據缺失的情況下(數據缺失率為30%),該方法的準確率低于83%,誤識別率高于13%。 對于BP 神經網絡方法在大比例光伏功率數據缺失情況下(數據缺失率為30%),數據補齊效果的準確性(參照準確率)和穩(wěn)定性(參照平均相對誤差)略優(yōu)于滑動平均法,但其他方法的數據補齊效果的準確性和穩(wěn)定性都低于傳統(tǒng)云分段方法和本文方法。 對于本文所用的方法,在不同光伏功率數據缺失情況下,數據補齊效果優(yōu)于其他3 種方法,在30%光伏功率數據缺失的情況下,數據補齊的準確率高于94%,誤識別率低于5.9%;對于30%光伏功率數據連續(xù)缺失情況下,數據補齊的準確率高于91%, 誤識別率低于6.5%。 綜上可知,本文方法對光伏功率缺失數據補齊效果有一定的提高。

5 結術語

①在光伏電站實際運行中, 光伏功率缺失數據阻礙了光伏功率的相關研究。 對于不同研究對象,采用的數據補齊方法不同,因此,對光伏功率缺失數據的補齊方法須進行特定研究。

②正向云分段模型體現(xiàn)了太陽輻照度-光伏功率散點的分布界限, 但特定太陽輻照度下光伏功率分布特點并不適合用正態(tài)隨機熵進行描述。本文通過對各分段太陽輻照度與光伏功率的分布構建聯(lián)合經驗函數, 對光伏功率條件概率分布進行擬合,結合云分段模型的隨機熵理論,改進了對太陽輻照度-光伏功率散點分布特點的描述。

③本文基于改進的云分段模型的結果能夠得到符合光伏功率數據分布特點的條件概率分布,根據該條件概率分布并考慮數據缺失片段的波動性建立了缺失數據的補齊模型,分析結果表明,本文方法對比傳統(tǒng)云模型、 均值法和BP 神經網絡方法更具有效性和實用性。

猜你喜歡
包絡線輻照度散點
利用Lorenz RR 散點圖快速診斷急危重心律失常
高血壓個體家庭連續(xù)自測收縮壓特征描述與分析
人定勝天
拋體的包絡線方程的推導
沖擊波散點和定點治療肱二頭肌長頭肌腱炎的臨床觀察
影響并網光伏電站發(fā)電量的因素
雙軸追蹤與固定式光伏系統(tǒng)運行特性對比研究
橢圓中由兩垂直直線引出的“包絡”
中國典型地區(qū)水平總輻射輻照度頻次特征*
雙軸追蹤與固定式光伏系統(tǒng)運行特性對比研究