于龍澤,肖 白,孫立國
(1.東北電力大學(xué)電氣工程學(xué)院,吉林 吉林 132012;2.華能吉林發(fā)電有限公司 九臺電廠,吉林 長春 130501)
隨著可再生能源發(fā)電滲透率的不斷提高,其出力的間歇性和隨機(jī)性嚴(yán)重影響著電力系統(tǒng)穩(wěn)定運(yùn)行,如何描述可再生能源出力不確定性是克服這些挑戰(zhàn)的關(guān)鍵問題[1].場景分析法能反映不確定變量的概率特征,是處理電力系統(tǒng)中可再生能源不確定性問題的主要方法,在電力系統(tǒng)優(yōu)化調(diào)度中對可再生能源出力使用場景集進(jìn)行描述,可以提高調(diào)度計劃對可再生能源出力隨機(jī)波動的適應(yīng)性[2-5].因此準(zhǔn)確地構(gòu)建可再生能源出力場景對于在多能源電力系統(tǒng)中促進(jìn)可再生能源消納和優(yōu)化運(yùn)行具有重要的意義.
現(xiàn)有的場景生成方法大多采用基于概率模型的方法,主要有Markov鏈法[6]、時間序列法[7]、場景樹生成法[8].這類方法首先通過歷史數(shù)據(jù)建立服從可再生能源發(fā)電出力分布規(guī)律的概率模型,然后通過抽樣的方法產(chǎn)生用于分析的新場景.文獻(xiàn)[9]假設(shè)風(fēng)功率預(yù)測誤差分布服從聯(lián)合正態(tài)分布,求得分布參數(shù)后,通過抽樣的方法得到各場景.文獻(xiàn)[10]將預(yù)測誤差分段處理,仍通過聯(lián)合正態(tài)分布建模并抽樣生成場景.然而,單個集中接入的風(fēng)電場及風(fēng)電場集群的誤差分布不服從正態(tài)分布.傳統(tǒng)的概率模型方法難以對可再生能源出力不確定性做出較為全面的建模,多數(shù)模型僅針對出力的某一特征進(jìn)行設(shè)計,由于實際現(xiàn)場環(huán)境復(fù)雜多樣,找到一個具有廣泛適用性并且易于求解參數(shù)的概率模型十分困難.
概率模型建立后,需要依靠抽樣來產(chǎn)生場景集,如蒙特卡洛抽樣[11]、拉丁超立方抽樣[12].足夠大的初始數(shù)據(jù)才有可能得到高精度的計算結(jié)果,然而抽樣場景集規(guī)模過大會影響計算效率.為此,人們又提出了包括后向消除、前向選擇、場景樹構(gòu)建[13]在內(nèi)的場景消減算法,但這些方法不僅加劇了生成模型的復(fù)雜度,同時還限制了生成場景的多樣性.
隨著人工智能技術(shù)的發(fā)展,深度學(xué)習(xí)因其泛化能力與數(shù)據(jù)表達(dá)能力強(qiáng),且完全依靠數(shù)據(jù)驅(qū)動,可無監(jiān)督、可自主學(xué)習(xí)等優(yōu)點(diǎn)在電力系統(tǒng)中的應(yīng)用越來越受到重視.文獻(xiàn)[14]提出一種基于條件變分自編碼器的風(fēng)光電出力隨機(jī)場景生成方法,其可根據(jù)編碼來生成對應(yīng)類型的出力場景.文獻(xiàn)[15]提出使用 GAN來學(xué)習(xí)可再生能源出力時間-空間相關(guān)性,并使用Wasserstein距離作為判別器損失函數(shù)來提高網(wǎng)絡(luò)訓(xùn)練質(zhì)量.文獻(xiàn)[16]提出一種基于GAN反向訓(xùn)練輸入噪聲的算法,并結(jié)合日前預(yù)測值生成可再生能源日前場景集.
目前的場景生成方法雖然有一定的發(fā)展,但仍存在一些問題:①傳統(tǒng)的概率模型方法未充分考慮可再生能源出力的各種相關(guān)性及未知性關(guān)系,同時實際環(huán)境復(fù)雜難以找到具有廣泛適用性的模型,且需要場景削減加劇了模型的復(fù)雜性;②現(xiàn)有研究缺少對可再生能源出力特征與深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)之間的關(guān)系研究,對模型的解釋性較差.
針對上述問題,本文提出基于改進(jìn)的條件深度卷積生成對抗網(wǎng)絡(luò)的風(fēng)光場景生成方法.條件深度卷積生成對抗網(wǎng)絡(luò)能夠?qū)W習(xí)到滿足條件的噪聲分布與真實數(shù)據(jù)訓(xùn)練集間的映射關(guān)系,采用Wasserstein距離作為判別器損失函數(shù)衡量生成場景間分布差異.并對可再生能源出力特征進(jìn)行分析,設(shè)計出適用于風(fēng)光場景生成的網(wǎng)絡(luò)結(jié)構(gòu).通過生成器和判別器間博弈訓(xùn)練使生成器高效地學(xué)習(xí)到可再生能源出力真實場景的概率分布特性.算例結(jié)果表明,本文所提出的方法,能夠?qū)W習(xí)到可再生能源出力特征,從而準(zhǔn)確的生成與真實場景接近的風(fēng)光出力場景.
生成對抗網(wǎng)絡(luò)(Generative Adversarial Nets,GAN)是由Goodfellow等在2014年首次提出的一種深度學(xué)習(xí)模型,其可以利用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)表征復(fù)雜的非線性關(guān)系并對復(fù)雜的信號進(jìn)行分類,以此來挖掘數(shù)據(jù)的內(nèi)在特征[17].
GAN由生成器(Generator,G)和判別器(Discriminator,D)兩部分組成.GAN的核心思想是在生成器和判別器間建立起min-max二人博弈,在每個訓(xùn)練階段,生成器的參數(shù)得到更新以生成新的樣本,而判別器嘗試區(qū)分真實歷史樣本和新生成的樣本.理論上,當(dāng)二者間的博弈在達(dá)到納什均衡時,GAN的最優(yōu)解將提供一個能夠準(zhǔn)確地反映真實數(shù)據(jù)分布特性的生成器,使得判別器無法區(qū)分樣本是來自生成器還是來自歷史訓(xùn)練數(shù)據(jù).此時,生成的場景與真實的歷史數(shù)據(jù)無法區(qū)分,因此盡可能真實.應(yīng)用GAN進(jìn)行風(fēng)光出力場景生成的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示.
圖1 用于可再生能源發(fā)電功率場景生成的GAN的結(jié)構(gòu)
G和D在訓(xùn)練過程中min-max二人博弈模型可用公式(1)表示:
(1)
公式中:E(·)為期望值;D(G(Z))為生成的數(shù)據(jù)G(Z)在D中判別為真的概率;D(x)為真實數(shù)據(jù)x在D中判別為真的概率;噪聲數(shù)據(jù)z的分布為z~Pz;Px為風(fēng)光數(shù)據(jù)x的真實分布.
深度卷積生成對抗網(wǎng)絡(luò)(Deep Convolutions Generative Adversarial Network,DCGAN)是對GAN的改進(jìn),它將卷積網(wǎng)絡(luò)引入GAN的結(jié)構(gòu)中,基于卷積網(wǎng)絡(luò)較強(qiáng)的特征提取能力來提升GAN生成的數(shù)據(jù)質(zhì)量[18].風(fēng)光出力具有豐富的特征,DCGAN的特點(diǎn)正好適用于提取風(fēng)光出力曲線的動態(tài)信息.本文在文獻(xiàn)[15]的研究工作基礎(chǔ)上,采用改進(jìn)的條件DCGAN模型以生成風(fēng)光出力場景,其網(wǎng)絡(luò)結(jié)構(gòu)及超參數(shù)選擇是在其基礎(chǔ)上進(jìn)行試驗的結(jié)果,批歸一化層的動量、激活函數(shù)均采用原文獻(xiàn)的默認(rèn)參數(shù).
DCGAN采用了兩個卷積神經(jīng)網(wǎng)絡(luò)來改善傳統(tǒng)GAN的結(jié)構(gòu),提升了網(wǎng)絡(luò)的穩(wěn)定性,并提高了數(shù)據(jù)樣本生成的質(zhì)量,加快了收斂的速度.
DCGAN中生成器G的結(jié)構(gòu)示意圖如圖2(a)所示;判別器D的結(jié)構(gòu)示意圖如圖2(b)所示.其中,生成器中包括全連接的多層感知機(jī)和兩個步長為2×2的反卷積層,可對輸入的噪聲進(jìn)行上采樣.判別器中則包括全連接的多層感知機(jī)和兩個步長為2×2的卷積層,用于對場景進(jìn)行下采樣.神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的所有權(quán)值均由中心正態(tài)分布初始化,標(biāo)準(zhǔn)偏差為0.02.在除輸入層外的每一層之前都采用批量歸一化的方法,通過將每一層的輸入歸一化為零均值和單位方差來穩(wěn)定學(xué)習(xí).除輸出層外,生成器中使用ReLU激活,判別器中使用Leaky-ReLU激活.
圖2 DCGAN生成網(wǎng)絡(luò)的結(jié)構(gòu)示意圖
在訓(xùn)練過程中,隨著迭代進(jìn)行,生成器通過調(diào)整網(wǎng)絡(luò)的權(quán)值提高生成數(shù)據(jù)與真實數(shù)據(jù)的相似度,同時判別器也通過學(xué)習(xí)提升判別能力,經(jīng)過反復(fù)迭代,到訓(xùn)練完畢時,判別器將無法區(qū)分輸入樣本的來源,此時DCGAN將可以準(zhǔn)確的對風(fēng)光出力場景進(jìn)行模擬生成.
條件生成對抗網(wǎng)絡(luò)(Conditional Generative Adversarial Networks,CGAN)是一種基于生成對抗網(wǎng)絡(luò)進(jìn)行改進(jìn)的生成式網(wǎng)絡(luò)[19],其將監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)技術(shù)進(jìn)行了結(jié)合,對指定類型數(shù)據(jù)樣本的泛化有較好的效果.與GAN相似的是CGAN保留了生成器與判別器的博弈結(jié)構(gòu),不同的是CGAN在生成器和判別器的輸入中均加入條件值的輸入,這使CGAN中的生成器能夠?qū)W習(xí)到滿足對應(yīng)條件下的樣本概率分布映射關(guān)系.
(2)
(3)
本文結(jié)合DCGAN和CGAN的優(yōu)點(diǎn)提出了改進(jìn)的條件深度卷積生成對抗網(wǎng)絡(luò)(C-DCGAN),建立風(fēng)光出力場景生成模型,其結(jié)構(gòu)如圖3所示.在生成器和判別器中均加入指定的標(biāo)簽y(如時間、天氣等),從而生成特定條件下的風(fēng)電光伏出力場景.結(jié)合CGAN中加入的類別標(biāo)簽信息,C-DCGAN訓(xùn)練過程中的博弈模型目標(biāo)函數(shù)在上節(jié)所述基礎(chǔ)上相應(yīng)調(diào)整如公式(4)所示.
圖3 用于可再生能源場景生成的C-DCGAN結(jié)構(gòu)
(4)
公式中:y為加入的數(shù)據(jù)樣本的類標(biāo)簽信息.
傳統(tǒng)GAN在訓(xùn)練中容易出現(xiàn)訓(xùn)練困難以及模式崩潰的問題,這是因為在傳統(tǒng)GAN中判別器D的損失函數(shù)等價于JS散度[20].當(dāng)生成樣本與真實樣本分布沒有重疊時,JS散度將恒為常數(shù).對于可再生能源出力場景生成,生成器需要學(xué)習(xí)場景分布的映射關(guān)系,若判別器使用JS散度作為損失函數(shù)將無法準(zhǔn)確衡量樣本分布之間的距離,在反向傳遞中會出現(xiàn)梯度消失使網(wǎng)絡(luò)訓(xùn)練困難的問題,從而影響生成場景集的準(zhǔn)確性.
而Wasserstein距離能夠有效衡量兩個概率分布之間的距離,即使兩個概率分布之間沒有重疊時仍能有效地描述分布之間的距離[21],Wasserstein距離的定義如下:
(5)
公式中:π(x,x′)為滿足p(x)與p(x′)邊緣分布的聯(lián)合概率密度分布;d(x,x′)為場景間距離測度.
使Wasserstein距離代替JS散度作為判別器損失函數(shù),能夠有效解決訓(xùn)練困難及模式崩潰問題并且能夠更好地擬合概率分布[22].但Wasserstein距離難以直接計算,因此通常使用其Kantorovich Rubinstein對偶形式來描述生成樣本與真實樣本之間的距離,當(dāng)其應(yīng)用于C-DCGAN中可表示為:
(6)
在公式(4)中引入函數(shù)D在定義域內(nèi)梯度罰函數(shù)可以保證判別器函數(shù)近似滿足1-Lipschitz連續(xù),使判別器損失函數(shù)能夠有效地描述Wasserstein距離,因此C-DCGAN的目標(biāo)函數(shù)轉(zhuǎn)換為:
(7)
使用Wasserstein距離作為判別器損失函數(shù)與傳統(tǒng)GAN不同的是判別器的任務(wù)不僅需要對生成樣本與真實樣本進(jìn)行區(qū)分,并且需要擬合樣本集之間的Wasserstein距離來準(zhǔn)確描述其分布之間的差異.為生成器擬合數(shù)據(jù)分布提供精確的訓(xùn)練方向,使生成器能夠映射條件概率分布,而非簡單地生成與真實樣本相近的數(shù)據(jù)[23].
使用我國西北某省的一年的(2017年6月1日-2018年5月31日)風(fēng)光出力實測歷史數(shù)據(jù)作為訓(xùn)練集,數(shù)據(jù)間隔取5 min,共有105 408組數(shù)據(jù),算例以一天連續(xù)288組數(shù)據(jù)作為一天樣本,對模型進(jìn)行訓(xùn)練驗證分析.算例中C-DCGAN模型通過深度學(xué)習(xí)框架Tensorflow搭建,調(diào)用GPU進(jìn)行CUDA并行計算加速模型訓(xùn)練.計算機(jī)CPU Intel Core i7 7900X 3.30GHz,內(nèi)存512GB,GPU NVIDIA GTX 1060,顯存16GB.算例首先驗證了本文所提場景生成方法的有效性,然后將C-DCGAN方法與基于Markov和Coupla理論的傳統(tǒng)場景生成方法進(jìn)行仿真對比.
將風(fēng)電和光伏發(fā)電1天288個點(diǎn)的出力數(shù)據(jù)組合并重塑成24×24的矩陣,經(jīng)過標(biāo)準(zhǔn)化處理后,作為C-DCGAN中判別器D的輸入.生成可再生能源發(fā)電功率場景時,如圖4、圖5所示.在訓(xùn)練過程中的判別器D的輸出和Wasserstein距離隨訓(xùn)練次數(shù)的變化曲線.
由圖4和圖5可知,當(dāng)訓(xùn)練初始階段,判別器D對Wasserstein距離的擬合并不準(zhǔn)確,因此判別器損失函數(shù)不斷升高.當(dāng)訓(xùn)練一定次數(shù)后后,真實樣本和生成樣本分布之間重合度逐漸變大,樣本分布間 Wasserstein距離減小,判別器損失函數(shù)將由上升趨勢逐漸轉(zhuǎn)變?yōu)橄陆第厔莶②呄蛴诜€(wěn)定,此時C-DCGAN訓(xùn)練收斂.
得到訓(xùn)練好的模型后從歷史數(shù)據(jù)中選擇部分曲線作為測試集,驗證生成場景的有效性.測試集中的曲線并沒有被模型學(xué)習(xí)過,而由圖6-圖9可見,模型自動產(chǎn)生了一些和測試集非常接近的曲線,這證明所提模型并不是簡單地重復(fù)生成訓(xùn)練集中的數(shù)據(jù),而是以所學(xué)習(xí)到的特征創(chuàng)造全新的數(shù)據(jù).測試集中的數(shù)據(jù)是真實的風(fēng)光出力歷史數(shù)據(jù),生成模型未使用這些數(shù)據(jù)進(jìn)行訓(xùn)練,但是在生成器生成的數(shù)據(jù)中卻可以發(fā)現(xiàn)一些曲線和測試集中的曲線高度相似,這也證明了生成器生成的數(shù)據(jù)是非常符合實際情景的,而且具備很強(qiáng)的泛化能力,這是傳統(tǒng)場景生成方法不可能做到的.
通過C-DCGAN可以生成指定標(biāo)簽下的場景,這需要在訓(xùn)練時對各個訓(xùn)練樣本添加一個標(biāo)簽y來表示標(biāo)簽信息.例如給訓(xùn)練樣本添加月份標(biāo)簽,訓(xùn)練后即可生成指定月份的場景數(shù)據(jù).
分別根據(jù)風(fēng)電和光伏日出力平均值大小相對于出力最大值的標(biāo)幺值制定所屬標(biāo)簽,如表1和表2所示.
表1 風(fēng)電日出力均值區(qū)間及其對應(yīng)標(biāo)簽
表2 光伏日出力均值區(qū)間及其對應(yīng)標(biāo)簽
將風(fēng)電的出力區(qū)間0 MW~2 000 MW劃分為10個區(qū)間,作出生成場景及真實場景中對應(yīng)標(biāo)簽數(shù)據(jù)的概率分布,如圖10~圖14所示.
同樣將光伏的出力區(qū)間0 MW~8 000 MW劃分為10個區(qū)間,作出生成場景及真實場景中對應(yīng)標(biāo)簽數(shù)據(jù)的概率分布,如圖15~圖18所示.
圖18 標(biāo)簽1的光伏生成場景和真實場景概率密度分布
從圖15-圖18可見,由C-DCGAN所生成的場景,實現(xiàn)了對訓(xùn)練集中每一類標(biāo)簽數(shù)據(jù)概率分布的良好擬合.例如,對于無風(fēng)日,風(fēng)電出力低于40 MW的概率達(dá)到了40%以上,而隨著風(fēng)力增大,概率分布“重心”也逐漸右移,這與歷史數(shù)據(jù)反映的規(guī)律一致.值得注意的是,僅通過一個C-DCGAN,實際上同時實現(xiàn)了對多類數(shù)據(jù)分布的擬合,這充分反映了深度神經(jīng)網(wǎng)絡(luò)強(qiáng)大的學(xué)習(xí)及表征能力,也說明了利用C-DCGAN同時生成幾種不同類型的風(fēng)電、光伏場景數(shù)據(jù)是完全可行的.
為驗證本文所提場景生成方法的準(zhǔn)確性,算例將C-DCGAN方法和基于Markov和Coupla理論的場景生成方法(簡稱MC法)進(jìn)行仿真對比,分析兩種方法在構(gòu)建可再生能源日前場景時的優(yōu)劣.算例使用的 Markov鏈針對歷史數(shù)據(jù)的天氣類型構(gòu)建狀態(tài)轉(zhuǎn)移矩陣,并利用Coupla函數(shù)描述風(fēng)光出力數(shù)據(jù)的時序特性.為了以直觀的方式對比不同方法生成的場景,算例給出我國西北某省2018年6月20日由2種方法生成的風(fēng)光功率曲線和概率分布,如圖19-22所示.
從圖19~圖22中可以看出,2種方法都可以生成與真實場景分布接近的風(fēng)光出力場景,但可以看出采用MC法生成的場景與真實場景的分布偏差更大.
為了更加直觀清晰的展示兩種生成方法的效果,引入擬合度指標(biāo)Rn來判斷兩種生成方法的擬合程度,Rn的表達(dá)式如式(8)所示.
(8)
公式中:xt為風(fēng)電或光伏出力的真實歷史數(shù)據(jù);xt*為生成的出力數(shù)據(jù);N為總時段數(shù),一天為288個時段.
對兩種方法的擬合度指標(biāo)進(jìn)行計算可得出,對于生成風(fēng)電的出力場景,本文方法的擬合度指標(biāo)為0.9,M-C法的擬合都指標(biāo)為0.65;對于生成的光伏出力場景,本文方法的擬合度指標(biāo)為0.92,M-C法的擬合度指標(biāo)為0.83,因此可知本文方法的擬合度最好.
也就是說,本文的C-DCGAN方法能夠更好的學(xué)習(xí)到訓(xùn)練集的數(shù)據(jù)的概率分布特征,從而驗證了本文方法能夠更為有效準(zhǔn)確的生成風(fēng)電光伏的出力場景.
本文提出了一種基于改進(jìn)的條件深度卷積生成對抗網(wǎng)絡(luò)的可再生能源場景生成方法,以 Wasserstein 距離作為判別器網(wǎng)絡(luò)損失函數(shù)來衡量樣本集間分布差異,設(shè)計并采用了適用于風(fēng)電光伏出力場景生成的C-DCGAN網(wǎng)絡(luò)結(jié)構(gòu).算例中驗證了本文所提出的場景生成方法的有效性與準(zhǔn)確性,本文具體結(jié)論如下:
(1)C-DCGAN結(jié)合了DCGAN和CGAN的優(yōu)點(diǎn),能夠較好地適應(yīng)可再生能源出力場景生成,并且深度卷積網(wǎng)絡(luò)結(jié)構(gòu)能有效反映可再生能源相關(guān)性特征,通過合理的正則化層以及激活函數(shù)引入能提升網(wǎng)絡(luò)的表達(dá)能力.本文構(gòu)建的C-DCGAN網(wǎng)絡(luò)能有效地學(xué)習(xí)到風(fēng)電光伏出力數(shù)據(jù)的分布特征.
(2)本文將所提出的C-DCGAN與基于Markov和Coupla理論的場景生成方法進(jìn)行仿真對比.結(jié)果表明C-DCGAN模型能夠生成與真實場景更為接近的風(fēng)光出力場景,能準(zhǔn)確描述可再生能源出力的不確定性.
(3)本文所提方法不涉及顯示的數(shù)據(jù)特征分析,采用純數(shù)據(jù)驅(qū)動的方法描述可再生能源出力不確定性,具有廣泛適用性,為可再生能源出力場景生成提供了一種新的方法.