国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Seq2Seq的機組組合優(yōu)化決策方法研究

2022-10-27 09:47:52
電氣技術與經(jīng)濟 2022年5期
關鍵詞:訓練樣本決策驅動

葉 迪

(國網(wǎng)福建省電力有限公司福州供電公司)

0 引言

機組組合(Unit Commitment,UC)問題是日前電力市場決策和發(fā)電計劃編制的重要理論基礎之一[1]。目前對機組組合問題的研究以模型構建和算法研究為主[2]。在當今能源變革日新月異的背景下,機組組合面臨的理論挑戰(zhàn)層出不窮,這種傳統(tǒng)的基于物理模型驅動的決策方法已經(jīng)難以適應電力系統(tǒng)快速發(fā)展的實際需求。

從工程實際而言,調(diào)度方法一旦用于實際,往往會積累大量結構化的歷史數(shù)據(jù),從長期來看,機組組合決策也具有一定的重復性,往年積累的歷史決策方案對于未來的機組組合決策也具有指導意義,而且實際運行決策數(shù)據(jù)往往是模型計算和人工修正結合的產(chǎn)物,因此,在理論上可以說是考慮了當時所面對的各種影響因素和限制條件[3]。同時,深度學習技術已經(jīng)在解決諸如輸電線路故障判斷[4]等電力系統(tǒng)實際問題中取得良好效果。因此,國內(nèi)團隊提出一種基于數(shù)據(jù)驅動的機組組合決策方法,不研究機組組合的內(nèi)在機理,而是通過長短時記憶網(wǎng)絡(Long Short-Term Memory,LSTM),利用海量歷史決策數(shù)據(jù)訓練,直接構建已知輸入量和決策結果間的映射關系[5]。

基于數(shù)據(jù)驅動的機組組合決策方法是以深度學習模型和訓練樣本為核心,通過深度學習模型學習訓練樣本之間的映射關系得到映射模型,并以此進行機組組合決策。可供使用的深度學習模型有循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Networks,RNN)、LSTM[6]和門限循環(huán)神經(jīng)網(wǎng)絡[7](Gated Recurrent Unit,GRU)等。隨著電力系統(tǒng)的發(fā)展,歷史訓練樣本已經(jīng)由類型單一、機組數(shù)目不變轉變?yōu)轭愋投鄻忧覚C組數(shù)目增加,因此現(xiàn)有的基于數(shù)據(jù)驅動的決策方法存在以下幾個缺點:

1)這種研究思路必須使用聚類算法,無法單獨處理含多種類型樣本的訓練集。

2)對每一次訓練而言,GRU模型的結構都不會改變,這就要求所有的樣本數(shù)據(jù)都具有相同的結構。

作為對現(xiàn)有基于數(shù)據(jù)模型驅動的機組組合決策方法的有效補充,本文方法主要有以下創(chuàng)新。

本文方法不需要再對歷史數(shù)據(jù)進行聚類處理,而是基于Seq2Seq模型,對于不同類別的訓練樣本,僅需要較少歷史調(diào)度數(shù)據(jù),即可構建日負荷和機組組合方案之間的映射關系,能夠直接處理樣本未聚類的SCUC問題,具有廣泛適用性。

基于標準算例的一系列仿真結果驗證了本文方法的正確性和有效性。

1 基于Seq2Seq模型的數(shù)據(jù)驅動機組組合決策框架

基于數(shù)據(jù)驅動的機組組合決策的最大特點是在長期使用過程中通過數(shù)據(jù)積累實現(xiàn)自我進化,以適應電力系統(tǒng)的發(fā)展。而在較長時間周期內(nèi),機組組合決策每一個訓練樣本的結構有可能并不相同,其樣本構成的是一種輸出序列維度可變的彈性樣本矩陣集合。如果直接將傳統(tǒng)的GRU模型用于機組組合映射關系的訓練,在面對不斷變化的樣本結構時,其適用性將很難保證,針對該問題,本文提出一種應對機組維度變化的數(shù)據(jù)驅動機組組合決策框架,決策框架如圖1所示。

圖1 基于Seq2Seq的數(shù)據(jù)驅動決策方法框架

對于機組維度變化的機組組合問題,本文方法首先使用機組數(shù)目轉換模型將樣本轉換為維度相等且能夠供Seq2Seq模型訓練的訓練樣本。其次對此類樣本聚集的訓練集進行樣本編碼處理,將機組組合矩陣轉換為包含矩陣所有機組啟停信息的樣本編碼行向量。在決策過程中,Seq2Seq模型對輸入、輸出序列進行分步錄入操作,從而使每一個神經(jīng)網(wǎng)絡的神經(jīng)元數(shù)量可變,且可以根據(jù)輸入輸出序列的長度自適應調(diào)整,因此訓練集內(nèi)樣本的多少不會影響模型的決策精度。而且,隨著不同類型歷史數(shù)據(jù)的積累,可供模型訓練的訓練樣本個數(shù)不斷增加,因此模型求解不同類別歷史樣本數(shù)據(jù)的兼容性會隨著數(shù)據(jù)的積累而不斷提升。但是,隨著訓練集容量的增加,Seq2Seq模型的訓練次數(shù)需要進行相應調(diào)整,不然容易出現(xiàn)過擬合或欠擬合問題。

2 基于Seq2Seq的機組組合深度學習模型及訓練算法

對于機組組合歷史調(diào)度數(shù)據(jù)這類與時序緊密關聯(lián)的訓練樣本,節(jié)點相互獨立的深度學習模型無法適用,而RNN這類時序模型具有處理時序相關數(shù)據(jù)的能力。但是,面對序列較長的樣本時,RNN模型會出現(xiàn)梯度消失現(xiàn)象。作為RNN的一種改進型,LSTM實現(xiàn)了模型對重要信息的記憶,有效解決了RNN訓練過程中可能出現(xiàn)的梯度消失的問題,但是其模型過于復雜,在處理高維度的訓練樣本時,不僅需要大量的計算資源,而且容易出現(xiàn)過擬合現(xiàn)象。針對該問題,Kyunghyun Cho等人在LSTM的基礎上將輸入門與遺忘門合并,并簡化記憶單元,提出一種新的網(wǎng)絡模型,即GRU,有效降低了模型的復雜度。由上文分析可知,單獨使用GRU模型僅能處理輸入、輸出序列維度均固定的樣本,無法學習訓練集中機組數(shù)目發(fā)生變化的訓練樣本。因此,以GRU模型為基礎,本文將構建一個包含Encoder-Decoder框架的基于Seq2Seq模型的機組組合深度學習模型。該框架的示意圖,如圖2所示。

圖2 Encoder-Decoder架構

由圖3可知,與傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡模型用單個神經(jīng)元讀取所有輸入量不同,Encoder是將輸入序列按照時間步驟分步讀入,然后再輸出整個序列的中間狀態(tài)C。由于循環(huán)神經(jīng)網(wǎng)絡可以記錄每一個訓練步驟的過程信息,因此理論上中間狀態(tài)C能夠計及整個輸入序列的信息。而在Decoder中,另一個循環(huán)神經(jīng)網(wǎng)絡執(zhí)行與Encoder相反的操作,把得到的中間狀態(tài)C分步解碼,形成最終的輸出序列。由此可見,Seq2Seq技術巧妙利用循環(huán)神經(jīng)網(wǎng)絡的時序記憶特性,采用兩個神經(jīng)網(wǎng)絡構成的復合結構對輸入、輸出序列進行分步錄入操作,從而使每一個神經(jīng)網(wǎng)絡的神經(jīng)元數(shù)量可變,且可以根據(jù)輸入輸出序列的長度自適應調(diào)整,成功實現(xiàn)了對維度可變的樣本序列的處理。

3 基于Seq2Seq的機組組合深度學習模型構建

針對機組組合歷史樣本數(shù)據(jù)的時序特征,本文構建的Seq2Seq模型中,Encoder模型的第t時間步的輸入輸出關系如式(1)~式(5)所示:

式中,PLt為考慮時序特性的輸入?yún)?shù);zt和rt為更新門和重置門;為GRU的待定輸出值;ht為GRU的隱藏狀態(tài);ht-1為前一時刻GRU的隱藏狀態(tài);Wr為輸入數(shù)據(jù)和zt之間的權重系數(shù);Wz為輸入數(shù)據(jù)和rt之間的權重系數(shù);Wh為輸入數(shù)據(jù)。α為神經(jīng)網(wǎng)絡中激活函數(shù)sigmoid。

根據(jù)式(1)~式(5),最后一個時刻GRU神經(jīng)元的輸出狀態(tài)CT即為該Encoder的輸入中間狀態(tài)Ci。

以GRU為神經(jīng)元,基于Seq2Seq技術構建Decoder模型如圖5所示。其中Decoder模型的第m時間步的輸入輸出關系如下所示:

式中,zm為第m個神經(jīng)元的輸出狀態(tài)向量;xm為第m個神經(jīng)元的輸入數(shù)據(jù);Hm為第m個神經(jīng)元的輸出數(shù)據(jù);其余參數(shù)符號意義與Encoder相同。

4 算例分析

本文算例的日負荷樣本以湖南電網(wǎng)日負荷特性曲線為基礎進行構造,SCUC模型建?;贗EEE118節(jié)點系統(tǒng),調(diào)度方案由CPLEX 12.5計算得到?;赟eq2Seq以及GRU的機組組合數(shù)據(jù)驅動模型均在Tensorflow 1.6.0平臺上完成訓練和測試。相關仿真計算均在英特爾酷睿i5-4460處理器/3.20GHz,8G內(nèi)存計算機上實現(xiàn)。

為了證明本文方法使用數(shù)據(jù)驅動和物理模型驅動相結合這一思路的有效性,使用本文方法與基于物理模型算法對第一類測試樣本進行決策,通過比對二者的決策時間來驗證本文方法的有效性。本文方法中數(shù)據(jù)驅動部分決策機組組合方案U,物理驅動模型求解經(jīng)濟調(diào)度過程,具體仿真結果如表1所示。

表1 本文方法和物理模型驅動方法對比

由表1可知,本文方法的總費用與基于物理模型驅動的決策模型完全相同,本文方法能夠節(jié)省2/3左右的決策時間。由此可知,本文方法能夠在保證決策精度的同時,具有更高的決策效率。為了進一步驗證數(shù)據(jù)驅動模型求解機組組合方案U的決策精度高低對整個決策模型所造成的影響,將表1中第三類測試樣本在1000次、1500次和2000次訓練映射模型1所得到的機組組合方案代入本文方法,并比對最終決策結果,具體仿真結果如表2所示。

表2 不同決策精度的機組組合方案對最終結果影響

由表2可知,較低的訓練次數(shù)會導致映射模型的決策精度降低,較低的決策精度最終會反饋在總費用上,決策精度越低,調(diào)度的總費用則越高。因此,上述仿真證明了求解機組組合方案U是本文方法的關鍵環(huán)節(jié)。

5 結束語

本文提出一種基于Seq2Seq模型的數(shù)據(jù)驅動機組組合智能決策方法。通過GRU-S2S模型學習日負荷與調(diào)度方案之間的映射關系,構建映射模型,并使用其進行機組組合決策,求解得到機組調(diào)度方案。本文得出的具體結論如下:

1)相較于基于物理模型驅動的決策模型,本文提出模型在具備相同經(jīng)濟效益前提下具有更短的決策時間,決策效率更高。

2)在處理SCUC問題時,本文模型證明較高的訓練次數(shù)可以有效提高決策精度,并進一步提高本文方法的經(jīng)濟性。

猜你喜歡
訓練樣本決策驅動
基于模糊PI控制的驅動防滑仿真系統(tǒng)分析
為可持續(xù)決策提供依據(jù)
屈宏斌:未來五年,雙輪驅動,砥礪前行
人工智能
軌旁ATC系統(tǒng)門控柜接收/驅動板改造
決策為什么失誤了
寬帶光譜成像系統(tǒng)最優(yōu)訓練樣本選擇方法研究
融合原始樣本和虛擬樣本的人臉識別算法
電視技術(2016年9期)2016-10-17 09:13:41
基于稀疏重構的機載雷達訓練樣本挑選方法
基于S3C6410的Wi-Fi驅動移植實現(xiàn)
遵化市| 阜新市| 高要市| 平舆县| 建平县| 兴义市| 常州市| 融水| 兴国县| 天门市| 离岛区| 达拉特旗| 阳江市| 安平县| 故城县| 宝清县| 武义县| 徐水县| 阿图什市| 瓦房店市| 绍兴县| 海伦市| 安西县| 苍南县| 布尔津县| 三原县| 旺苍县| 牡丹江市| 台湾省| 全南县| 岑巩县| 太仆寺旗| 荣昌县| 礼泉县| 徐州市| 博罗县| 巴塘县| 墨竹工卡县| 广平县| 金阳县| 即墨市|