戚煥興,殷林飛,萬俊,黃陽龍
(1.廣西電網(wǎng)北海供電局,廣西壯族自治區(qū)北海市536000;2.廣西大學(xué)電氣工程學(xué)院,南寧市530004)
在控制工程中,狀態(tài)反饋量與控制性能的矛盾始終存在。一方面,系統(tǒng)中更多的狀態(tài)反饋信息參與反饋控制將增加控制環(huán)與被控系統(tǒng)的耦合性,從而達(dá)到更優(yōu)的控制性能。系統(tǒng)全狀態(tài)信息協(xié)同反饋是實(shí)現(xiàn)最優(yōu)控制的前提[1]。另一方面,實(shí)際系統(tǒng)中,全狀態(tài)信息的測(cè)取通常是困難的,測(cè)取的狀態(tài)量越多,由于各種因素導(dǎo)致的誤差也會(huì)越大,個(gè)別狀態(tài)信息甚至無法測(cè)取,因此全狀態(tài)最優(yōu)反饋(full state optimal feedback,FSOF)控制[2]在實(shí)際工程中存在較大局限[3]。這一矛盾在互聯(lián)電力系統(tǒng)自動(dòng)發(fā)電控制(automatic generation control,AGC)問題中尤其凸顯。由于二次設(shè)備測(cè)量誤差等原因[4],各區(qū)域電網(wǎng)實(shí)時(shí)獲取其他區(qū)域電網(wǎng)的準(zhǔn)確狀態(tài)信息較為困難,并且由于區(qū)域跨度大,狀態(tài)信號(hào)的傳輸時(shí)延較大[5],增加了信號(hào)的不確定性。因此,長期以來,全狀態(tài)最優(yōu)反饋控制在AGC應(yīng)用中一直受到限制[6]。相反的,基于輸出反饋的AGC策略,如比例-積分 (proportional integral,PI)控制[7]、次優(yōu)(sub-optimal,SO)控制[8]等算法,雖然控制耦合性和控制性能欠佳,但因?yàn)橐子趯?shí)現(xiàn),在我國得到推廣使用并成為主流[9]。
然而,近年來,電力系統(tǒng)逐漸復(fù)雜化、多樣化,為自動(dòng)發(fā)電控制帶來了新的難題。一方面,新能源機(jī)組裝機(jī)容量逐年增加,發(fā)電能源逐漸環(huán)境友好化,風(fēng)力發(fā)電[10]、光伏發(fā)電[11]等電站的出力具有較大的不穩(wěn)定性,調(diào)頻能力較差[12],出力的隨機(jī)變化常被納入負(fù)荷擾動(dòng)范疇,發(fā)電側(cè)出力的整體隨機(jī)性增加;另一方面,家庭分布式發(fā)電入網(wǎng)增加[13]、電動(dòng)汽車逐漸興起[14]一定程度上增加了負(fù)荷的隨機(jī)性,負(fù)荷側(cè)甚至可能出現(xiàn)功率倒送的情況,配電網(wǎng)模型面臨重構(gòu)[15]。電力系統(tǒng)負(fù)荷-頻率控制(load-frequency control,LFC)模型日趨復(fù)雜化,傳統(tǒng)AGC策略逐漸無法滿足電力系統(tǒng)頻率穩(wěn)定性的要求。
近年來,一些新的控制算法逐漸被引入自動(dòng)發(fā)電控制領(lǐng)域,如模糊控制[16]、強(qiáng)化學(xué)習(xí)控制[17]以及自適應(yīng)控制[18]等,這些算法的引入在相當(dāng)程度上改善了自動(dòng)發(fā)電控制的性能,但其控制過程均缺少對(duì)整個(gè)系統(tǒng)全狀態(tài)信息的協(xié)同考慮,無法在性能指標(biāo)上達(dá)到最優(yōu)控制,存在一定的局限性。
針對(duì)上述問題,本文結(jié)合深度置信網(wǎng)絡(luò)(deep belief network,DBN)與最優(yōu)控制理論,提出深度置信網(wǎng)絡(luò)狀態(tài)最優(yōu)反饋 (deep belief network state optimal feedback,DBNSOF)算法,引入DBN對(duì)全狀態(tài)最優(yōu)反饋AGC系統(tǒng)進(jìn)行學(xué)習(xí),依靠DBN強(qiáng)大的非線性表達(dá)能力,辨識(shí)部分狀態(tài)信息與最優(yōu)控制值之間的高階函數(shù)關(guān)系,最終,DBN根據(jù)所輸入的系統(tǒng)部分狀態(tài)量,計(jì)算并輸出近似最優(yōu)發(fā)電調(diào)控值。該算法可實(shí)現(xiàn)非全狀態(tài)信息反饋下的系統(tǒng)近似最優(yōu)發(fā)電控制。
本文所提出的DBNSOF算法,一方面,減少了AGC狀態(tài)反饋量,降低對(duì)電氣測(cè)量及通信設(shè)備的要求,在實(shí)際系統(tǒng)中更易實(shí)現(xiàn);另一方面,DBN的非線性表達(dá)能力提高了反饋狀態(tài)量與被控系統(tǒng)間的耦合程度,提升了AGC性能,將更好地匹配與滿足智能電網(wǎng)背景下的運(yùn)行需求[19]。
在DBNSOF算法中,DBN的模型訓(xùn)練是基于數(shù)據(jù)實(shí)現(xiàn)的。因此,首先要實(shí)現(xiàn)基于全狀態(tài)最優(yōu)反饋的控制系統(tǒng),以便于數(shù)據(jù)獲取。本節(jié)對(duì)互聯(lián)電力系統(tǒng)LFC模型的全狀態(tài)最優(yōu)反饋控制的實(shí)現(xiàn)進(jìn)行介紹。
首先,建立互聯(lián)電力系統(tǒng)的初始LFC模型,系統(tǒng)LFC頻域模型圖如圖1所示,表1給出了系統(tǒng)參數(shù)。
圖1 兩區(qū)域互聯(lián)電力系統(tǒng)負(fù)荷-頻率控制模型Fig.1 LFC model of two-area interconnected power system
表1 兩區(qū)域互聯(lián)電力系統(tǒng)參數(shù)值Table 1 Parameter values of two-area interconnected power system
如圖1所示的互聯(lián)電力系統(tǒng)中,區(qū)域調(diào)度中心AGC將輸出機(jī)組功率調(diào)控命令ΔPc1和ΔPc2(即二次調(diào)頻命令),伴隨慣性時(shí)間Tg,該命令傳遞到調(diào)速器從而得到調(diào)節(jié)汽門的開度變化量ΔXg1與ΔXg2,再經(jīng)Tt延時(shí)傳遞至汽輪機(jī)從而得到調(diào)控發(fā)電機(jī)組機(jī)端出力變化量ΔPg1與ΔPg2,與區(qū)域外傳輸功率偏差量ΔPtie、負(fù)荷擾動(dòng)量ΔPL進(jìn)行加減運(yùn)算后得到區(qū)域功率—負(fù)荷偏差量,經(jīng)延時(shí)比例響應(yīng)后,輸出區(qū)域頻率偏差量Δf1與Δf2。而1/R1與1/R2分別作為Δf1與Δf2的負(fù)反饋增益,構(gòu)成一次調(diào)頻環(huán)。
如表1所示,系統(tǒng)參數(shù)中,PAN與PBN為區(qū)域基準(zhǔn)功率容量;fN為額定頻率;Tg1與Tg2為調(diào)速器慣性時(shí)間常數(shù);Tt1與Tt2為汽輪時(shí)間常數(shù);R1與R2為一次調(diào)頻的調(diào)差系數(shù);B1與B2為頻率偏差響應(yīng)系數(shù);Kp1與Kp2為負(fù)荷-頻率調(diào)節(jié)效應(yīng)系數(shù);Tp1與Tp2為其慣性時(shí)間常數(shù);T12為聯(lián)絡(luò)線同步系數(shù);α12為區(qū)域傳輸權(quán)重系數(shù)。
為求取上述系統(tǒng)的全狀態(tài)最優(yōu)反饋控制解,需將頻域模型轉(zhuǎn)化為時(shí)域模型,系統(tǒng)的狀態(tài)空間表達(dá)式如下:
(1)
其中,系統(tǒng)狀態(tài)量具體為:
X=[ΔXc1ΔPg1Δf1ΔPtieΔXc2ΔPg2Δf2]T
(2)
U=[ΔPc1ΔPc2]T
(3)
ΔPL=[ΔPL1ΔPL2]T
(4)
式中:X為狀態(tài)向量;U為控制向量;ΔPL為擾動(dòng)向量;A、B、G分別為狀態(tài)矩陣、控制矩陣、擾動(dòng)矩陣,且均為定常實(shí)矩陣,各矩陣取值由系統(tǒng)內(nèi)部耦合特性決定。
如果對(duì)該系統(tǒng)狀態(tài)空間添加線性最優(yōu)反饋環(huán),只能根據(jù)擾動(dòng)進(jìn)行延時(shí)比例調(diào)節(jié),如文獻(xiàn)[20]中最優(yōu)控制僅能對(duì)區(qū)域頻率偏差、傳輸功率偏差進(jìn)行有差調(diào)節(jié),存在局限性。二次調(diào)頻環(huán)應(yīng)能實(shí)現(xiàn)對(duì)系統(tǒng)的無差調(diào)節(jié),因此,需要對(duì)原系統(tǒng)狀態(tài)空間增加積分器,引入新的狀態(tài)量。在此引入?yún)^(qū)域控制誤差(area control error,ACE)的積分作為系統(tǒng)新增狀態(tài)量,該狀態(tài)量可表達(dá)為:
EACi=BiΔfi-ΔPtie
(5)
(6)
式中:i=1,2,分別代表兩個(gè)區(qū)域。
因此,新增積分項(xiàng)后的狀態(tài)空間表達(dá)式為:
(7)
系統(tǒng)狀態(tài)量為:
(8)
式中:Aa、Ba和Ga的取值詳見附錄A。
判斷該系統(tǒng)狀態(tài)空間的能控性,系統(tǒng)能控性矩陣為:
(9)
矩陣M滿秩,系統(tǒng)能控,新增的ACE積分項(xiàng)不改變閉環(huán)最優(yōu)系統(tǒng)穩(wěn)定性與可解性。
由于負(fù)荷擾動(dòng)項(xiàng)的存在,無法直接求解該狀態(tài)空間的全狀態(tài)最優(yōu)反饋矩陣,需進(jìn)行等效變換,化為標(biāo)準(zhǔn)型。
電力系統(tǒng)負(fù)荷具有階躍性,在實(shí)際系統(tǒng)中,負(fù)荷變化可被視為不斷進(jìn)行短期階躍的過程,而系統(tǒng)內(nèi)部狀態(tài)變化可視作從一個(gè)穩(wěn)態(tài)轉(zhuǎn)移到另一個(gè)穩(wěn)態(tài)的過程。在此基礎(chǔ)上,定義新的擾動(dòng)變量為:
(10)
定義新的狀態(tài)空間為:
(11)
(12)
其中,穩(wěn)態(tài)量ΔXae應(yīng)為:
(13)
且應(yīng)有:
ΔXgie=ΔPgie=ΔPLie
(14)
(15)
式中:i=1,2。
因此,近似等效轉(zhuǎn)換后的狀態(tài)空間應(yīng)為:
(16)
其中,系統(tǒng)零狀態(tài)為:
(17)
至此,經(jīng)過以上等效變換,系統(tǒng)的全狀態(tài)最優(yōu)反饋矩陣已可進(jìn)行求解。
首先,建立動(dòng)態(tài)性能指標(biāo)泛函為:
(18)
式中:J為性能指標(biāo)泛函;Q為狀態(tài)偏差量的權(quán)系數(shù)矩陣,為半正定實(shí)對(duì)稱方陣;R為控制偏差量的權(quán)系數(shù)矩陣,為正定實(shí)對(duì)稱方陣。Q和R可以從系統(tǒng)內(nèi)部狀態(tài)量與外部控制量綜合衡量AGC性能。
令:
(19)
(20)
構(gòu)建哈密頓函數(shù):
(21)
(22)
(23)
求解式(24),可得:
(24)
(25)
綜上,全狀態(tài)最優(yōu)反饋矩陣求解完畢。全狀態(tài)最優(yōu)反饋下的兩區(qū)域系統(tǒng)如圖2所示,經(jīng)系統(tǒng)全狀態(tài)協(xié)同反饋,AGC將輸出最優(yōu)發(fā)電調(diào)控值。
圖2 基于全狀態(tài)最優(yōu)反饋的兩區(qū)域互聯(lián)電力系統(tǒng)負(fù)荷-頻率控制系統(tǒng)Fig.2 LFC system of Two-area interconnected power system applying FSOF
第1節(jié)中建立的FSOF系統(tǒng)存在狀態(tài)反饋信息過量問題,在實(shí)際電力系統(tǒng)中難以實(shí)現(xiàn)。因此,本節(jié)提出了深度置信網(wǎng)絡(luò)狀態(tài)最優(yōu)反饋算法解決這一問題。
深度學(xué)習(xí)[21]是機(jī)器學(xué)習(xí)的分支,基于深度神經(jīng)網(wǎng)絡(luò)(deep neural networks,DNN)實(shí)現(xiàn),通過反向傳播(back propagation,BP)算法[22]、對(duì)比散度(contrastive divergence,CD)算法[23]等方法對(duì)數(shù)據(jù)樣本進(jìn)行學(xué)習(xí),DNN將獲取合適的權(quán)重與偏置等參數(shù),不斷逼近所需表達(dá)的自然模型或函數(shù)。
本文采用的DNN類型為深度置信網(wǎng)絡(luò)(deep belief network,DBN)[24]。DBN是由多個(gè)受限玻爾茲曼機(jī)(restricted boltzmann machine,RBM)堆疊而成的多層神經(jīng)網(wǎng)絡(luò),其模型結(jié)構(gòu)如圖3所示。
圖3 深度置信網(wǎng)絡(luò)模型Fig.3 Model of deep belief network
與傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)不同,DBN是一種基于能量定義的模型,其訓(xùn)練過程是基于能量驅(qū)動(dòng)的。
DBN的能量函數(shù)可表示為:
(26)
式中:v是可見神經(jīng)元的狀態(tài)向量;h是隱藏神經(jīng)元的狀態(tài)向量;vi是第i個(gè)可見神經(jīng)元的狀態(tài)量;hj是第j個(gè)隱藏神經(jīng)元的狀態(tài)量;wi,j是連接權(quán)重;bi是可見神經(jīng)元的偏置;cj是隱藏神經(jīng)元的偏置;θ是所有連接權(quán)重和偏置的參數(shù)集合??梢?,vi和hj的乘積可表示兩者之間的相關(guān)程度,其與連接權(quán)重wi,j一致時(shí),能夠得到θ的最大似然估計(jì)量。
DBN中神經(jīng)元的激活是基于概率分布的,(v,h)狀態(tài)的聯(lián)合概率分布可表示為:
(27)
式中:Z(θ)為歸一化函數(shù),其目的是使所有概率分布的總和等于1,可表達(dá)為:
Z(θ)=∑v,he-E(v,h 丨θ)
(28)
DBN內(nèi)各可見神經(jīng)元及隱藏神經(jīng)元的激活概率可分別表示為:
(29)
(30)
DBN的訓(xùn)練過程可分為以下兩個(gè)部分:
1)采用CD算法,對(duì)各RBM層進(jìn)行無監(jiān)督的逐層初始化訓(xùn)練,獲取適宜的RBM層內(nèi)權(quán)重及偏置。該部分為DBN的預(yù)訓(xùn)練過程,具體實(shí)現(xiàn)如下所示。
步驟1:初始化權(quán)重、偏置及其他網(wǎng)絡(luò)參數(shù);
步驟2:令訓(xùn)練樣本(輸入樣本)為vi,根據(jù)式(31)計(jì)算對(duì)應(yīng)隱層節(jié)點(diǎn)的概率,并從這一概率分布中獲取隱層節(jié)點(diǎn)激活向量樣本hj;
步驟3:運(yùn)算vi和hj的外積,此為“正梯度”;
步驟5:運(yùn)算v′i和h′j的外積,此為“負(fù)梯度”;
步驟7:判斷能量函數(shù)是否到達(dá)訓(xùn)練目標(biāo)值,若到達(dá),訓(xùn)練結(jié)束;否則重復(fù)步驟2—6。
2)首尾相接堆疊各RBM構(gòu)成DBN,采用誤差反向傳播算法,對(duì)DBN進(jìn)行有監(jiān)督的訓(xùn)練,具體實(shí)現(xiàn)步驟如下所示。
步驟1:按batch加入訓(xùn)練樣本(輸入樣本與輸出樣本);
步驟2:根據(jù)輸入樣本與激活函數(shù)σ(·)對(duì)神經(jīng)元進(jìn)行激活,得到對(duì)應(yīng)的DBN輸出值;
步驟4:根據(jù)誤差函數(shù)的梯度等,修正權(quán)重及偏置,如
(梯度下降法);
步驟5:判斷誤差函數(shù)E是否到達(dá)所設(shè)定的目標(biāo)精度,若到達(dá),訓(xùn)練結(jié)束;否則重復(fù)步驟1—4。
DBN的預(yù)訓(xùn)練提升了復(fù)雜模型對(duì)關(guān)鍵特征的提取能力,一定程度上降低了深度網(wǎng)絡(luò)的訓(xùn)練難度。完成訓(xùn)練后,DBN已經(jīng)具備樣本特性,可根據(jù)輸入信息,計(jì)算輸出符合樣本特性的結(jié)果。
圖4闡述了DBNSOF算法及其智能發(fā)電控制器(smart generation controller,SGC)的實(shí)現(xiàn)過程。
圖4 深度置信網(wǎng)絡(luò)狀態(tài)最優(yōu)反饋算法Fig.4 DBN state optimal feedback control algorithm
DBNSOF算法可分為如下2個(gè)部分和8個(gè)步驟。
1)建立基于全狀態(tài)最優(yōu)反饋的負(fù)荷-頻率控制(FSOF-LFC)系統(tǒng)仿真模型。
步驟1:建立電力系統(tǒng)LFC模型;
步驟2:按1.2節(jié)對(duì)初始LFC模型的狀態(tài)空間作等效變化,按1.3節(jié)求取FSOF-LFC系統(tǒng)(參見圖2);
步驟3:建立FSOF-LFC系統(tǒng)的仿真模型,對(duì)系統(tǒng)輸入各類負(fù)荷擾動(dòng),采集系統(tǒng)狀態(tài)量和與最優(yōu)發(fā)電調(diào)控量的樣本集;
2)實(shí)現(xiàn)基于DBN的智能發(fā)電控制器。
步驟4:確定DBN架構(gòu)、訓(xùn)練算法、目標(biāo)精度等網(wǎng)絡(luò)初始化參數(shù);
步驟5:選定DBN的輸入狀態(tài)量;DBN輸出已確定為區(qū)域最優(yōu)發(fā)電調(diào)控值;
步驟6:加入步驟3中采集的訓(xùn)練樣本,根據(jù)2.1節(jié)中的方法,訓(xùn)練DBN;
步驟7:判斷訓(xùn)練是否收斂。若收斂,建立基于DBN 的LFC系統(tǒng),加入負(fù)荷擾動(dòng),測(cè)試所訓(xùn)練DBN的控制特性指標(biāo);否則返回步驟4;
步驟8:判斷DBN具備近似最優(yōu)控制特性,即,DBN是否與全狀態(tài)最優(yōu)反饋控制的響應(yīng)特性具有近似性。若近似最優(yōu),將DBN封裝于SGC,投入調(diào)度中心使用,并根據(jù)更新樣本集按2.1節(jié)的DBN有監(jiān)督訓(xùn)練算法對(duì)DBN進(jìn)行在線(自適應(yīng))訓(xùn)練,對(duì)DBN進(jìn)行微調(diào),增強(qiáng)其泛化能力,否則返回步驟5。
DBNSOF算法中的關(guān)鍵點(diǎn)在于DBN輸入狀態(tài)量的選定,需從兩方面權(quán)衡考慮:一方面,選定的狀態(tài)反饋量應(yīng)與發(fā)電調(diào)控量有較高的耦合性,以確保DBN訓(xùn)練收斂及其泛化能力;另一方面,選定的狀態(tài)量應(yīng)易于測(cè)量,并在保證自動(dòng)發(fā)電控制性能的前提下盡可能少,以確保工程中易于實(shí)現(xiàn)。此外,需選取適宜的DBN架構(gòu)與訓(xùn)練算法,以保證訓(xùn)練的收斂性和效率。
本文將基于控制性能標(biāo)準(zhǔn)(control performance standard,CPS)評(píng)價(jià)AGC性能,以下對(duì)CPS指標(biāo)進(jìn)行介紹。
電力系統(tǒng)自動(dòng)發(fā)電控制的目標(biāo)是使控制區(qū)域的頻率偏差Δf盡量小,并使各區(qū)域間的非計(jì)劃傳輸功率ΔPtie也盡量小[25]。因此,為共同衡量Δf、ΔPtie帶來的影響,北美電力可靠性委員會(huì)(NERC)在1997年提出了統(tǒng)計(jì)學(xué)性能指標(biāo)CPS[26],共同權(quán)衡了ACE和Δf帶來的影響。ACE和Δf越小,CPS指標(biāo)越優(yōu),自動(dòng)發(fā)電控制性能就越優(yōu)。CPS具體分為CPS1和CPS2兩個(gè)指標(biāo),如下:
(31)
(32)
其中,CPS1指標(biāo)一般取其1min平均值。CPS指標(biāo)合格充要條件為:滿足CPS1>200% 或滿足CPS1>100% 且 CPS2>90%。
本節(jié)通過仿真實(shí)驗(yàn),驗(yàn)證DBNSOF算法的控制性能。仿真實(shí)驗(yàn)的硬件環(huán)境為CPU型號(hào)為i5-7500 3.40 GHz、RAM容量為8 GB的個(gè)人工作站;軟件環(huán)境為MATLAB R2019b。
本節(jié)對(duì)基于DBNSOF算法的SGC實(shí)現(xiàn)過程作具體介紹,如以下步驟所示。
步驟1:此算例以基于IEEE標(biāo)準(zhǔn)兩區(qū)域系統(tǒng)進(jìn)行仿真,建立如圖1所示的電力系統(tǒng)LFC模型。
步驟2:根據(jù)1.2與1.3節(jié)求解得全狀態(tài)最優(yōu)反饋控制解,所得最優(yōu)反饋矩陣K0取值詳見附錄A,F(xiàn)SOF-LFC系統(tǒng)詳見圖2。
步驟3:在Simulink中建立步驟1中求解的全狀態(tài)最優(yōu)反饋控制系統(tǒng)仿真模型(如圖2所示),對(duì)系統(tǒng)輸入各類負(fù)荷擾動(dòng),其中包括正弦型擾動(dòng)、白噪音型擾動(dòng)、斜坡型擾動(dòng)等典型擾動(dòng),同時(shí)對(duì)系統(tǒng)中的各狀態(tài)量和最優(yōu)發(fā)電調(diào)控量進(jìn)行采樣。此次采樣的仿真時(shí)間為107 824 s,實(shí)際樣本寫入時(shí)間為213 s。
步驟4:構(gòu)建由3層RBM堆疊而成的DBN,DBN預(yù)訓(xùn)練采用CD算法,BP訓(xùn)練采用基于共軛梯度的BP算法[27],訓(xùn)練均方誤差目標(biāo)精度設(shè)定為9 MW2。
步驟5:DBN輸入選定為自區(qū)域頻率偏差與傳輸功率偏差及其組合運(yùn)算值,其中運(yùn)算方式包括組合基本四則運(yùn)算、積分運(yùn)算等,共構(gòu)成6個(gè)輸入,DBN輸出為區(qū)域最優(yōu)發(fā)電調(diào)控值;
步驟6:對(duì)DBN加入對(duì)應(yīng)類型的訓(xùn)練樣本,按2.1節(jié)中的方法,訓(xùn)練DBN。其中,預(yù)訓(xùn)練(無監(jiān)督訓(xùn)練)樣本來自于步驟3中所采集的區(qū)域頻率偏差和傳輸功率偏差;有監(jiān)督訓(xùn)練樣本來自于所采集的區(qū)域頻率偏差、傳輸功率偏差和區(qū)域最優(yōu)發(fā)電調(diào)控值。此次訓(xùn)練中,兩區(qū)域DBN訓(xùn)練樣本均超100萬組,訓(xùn)練誤差下降過程如圖5所示,已收斂至目標(biāo)精度。理論上,兩DBN均應(yīng)已具備最優(yōu)發(fā)電控制特性。將DBN封裝于SGC內(nèi),輸入?yún)^(qū)域頻率偏差Δf與傳輸功率偏差ΔPtie,即可輸出近似最優(yōu)發(fā)電調(diào)控值ΔPao,SGC模型如圖6藍(lán)色區(qū)域所示。
圖5 深度置信網(wǎng)絡(luò)訓(xùn)練過程Fig.5 DBN training process
步驟7:對(duì)所設(shè)計(jì)的SGC作初步仿真實(shí)驗(yàn),測(cè)試其發(fā)電控制響應(yīng)特性。首先在Simulink環(huán)境中進(jìn)行建立LFC仿真模型,如圖6所示,模型參數(shù)見表1,其中,智能發(fā)電控制器通過S-function模塊調(diào)用訓(xùn)練好的DBN實(shí)現(xiàn)。向區(qū)域1輸入500 MW的階躍負(fù)荷擾動(dòng),DBNSOF、FSOF、SO、PI等控制算法下的發(fā)電控制響應(yīng)如圖7所示,控制性能指標(biāo)如表2所示,其中,td是延遲時(shí)間,tr是上升時(shí)間,ts是調(diào)節(jié)時(shí)間,Mp是超調(diào)量,ess是穩(wěn)態(tài)誤差(tss=60 s),上述指標(biāo)將用于衡量不同控制算法響應(yīng)的相似程度。根據(jù)圖表可知,DBNSOF控制與FSOF控制的各控制特性十分相近。
表2 階躍負(fù)荷擾動(dòng)下的AGC性能指標(biāo)Table 2 AGC performance index under step load disturbance
圖6 DBNSOF控制下的兩區(qū)域互聯(lián)系統(tǒng)負(fù)荷-頻率控制模型Fig.6 LFC model of two-area interconnected power system under DBNSOF control
圖7 階躍負(fù)荷擾動(dòng)下的自動(dòng)發(fā)電控制測(cè)試Fig.7 Automatic generation control test under step load disturbance
相較之下,SO控制存在振蕩,PI控制的響應(yīng)較慢,均劣于DBNSOF控制與FSOF控制。綜上,所訓(xùn)練的DBN是具備近似最優(yōu)控制特性的,基于DBNSOF算法的SGC已設(shè)計(jì)完成。本例具有典型性,對(duì)于其他電力系統(tǒng)LFC模型的SGC的設(shè)計(jì)工作,也可參照如上步驟進(jìn)行。
為驗(yàn)證DBNSOF算法的近似最優(yōu)性、穩(wěn)定性與魯棒性,在此對(duì)3.1節(jié)中所實(shí)現(xiàn)的SGC作進(jìn)一步仿真。
考慮實(shí)際電力系統(tǒng)是一個(gè)典型隨機(jī)系統(tǒng),在系統(tǒng)參數(shù)和外部負(fù)荷擾動(dòng)上均具有高度隨機(jī)性,該文將分別基于標(biāo)稱參數(shù)IEEE標(biāo)準(zhǔn)兩區(qū)域系統(tǒng)LFC模型和參數(shù)攝動(dòng)IEEE標(biāo)準(zhǔn)兩區(qū)域系統(tǒng)LFC模型進(jìn)行仿真(以下簡稱“標(biāo)稱參數(shù)系統(tǒng)”和“參數(shù)攝動(dòng)系統(tǒng)”)。其中,標(biāo)稱參數(shù)系統(tǒng)中各系統(tǒng)參數(shù)是固定的,具體值見表1;參數(shù)攝動(dòng)系統(tǒng)中各系統(tǒng)參數(shù)在表1的基礎(chǔ)上附加幅值為±0.3 pu、采樣周期為30 s的白噪音擾動(dòng),白噪聲擾動(dòng)是功率譜在整個(gè)頻域內(nèi)均勻分布的噪聲擾動(dòng),理論上可覆蓋實(shí)際系統(tǒng)中因各類情況產(chǎn)生的參數(shù)攝動(dòng)。對(duì)標(biāo)稱參數(shù)系統(tǒng)和參數(shù)攝動(dòng)系統(tǒng)輸入正弦擾動(dòng)與白噪音擾動(dòng)疊加形成的復(fù)合負(fù)荷擾動(dòng),其中,正弦擾動(dòng)的周期為1 256 s,幅值為1 000 MW,白噪音擾動(dòng)的幅值為±200 MW,采樣周期為10 s。采用4種算法進(jìn)行仿真運(yùn)算,AGC仿真結(jié)果如圖8和圖9所示,CPS指標(biāo)統(tǒng)計(jì)結(jié)果如表3和表4所示。其中的DBNSOF、FSOF、SO和PI分別代表深度置信網(wǎng)絡(luò)狀態(tài)最優(yōu)反饋、全狀態(tài)最優(yōu)反饋、次優(yōu)和比例-積分控制算法。
圖8 標(biāo)稱參數(shù)系統(tǒng)的自動(dòng)發(fā)電控制仿真結(jié)果Fig.8 AGC simulation results of nominal parameter system
圖9 參數(shù)攝動(dòng)系統(tǒng)的自動(dòng)發(fā)電控制仿真結(jié)果Fig.9 AGC simulation results of system with uncertain parameters
表3 標(biāo)稱參數(shù)系統(tǒng)的AGC仿真結(jié)果統(tǒng)計(jì)表Table 3 AGC simulative statistical results of nominal parameter system
表4 參數(shù)攝動(dòng)系統(tǒng)的AGC仿真結(jié)果統(tǒng)計(jì)表Table 4 AGC simulative statistical results of system with uncertain parameters
由以上算例分析結(jié)果可知,總體上,在上述兩次仿真中,DBNSOF的發(fā)電控制響應(yīng)曲線均與負(fù)荷擾動(dòng)曲線高度擬合,響應(yīng)準(zhǔn)確且迅速,仿真時(shí)段內(nèi)的Δf平均值為0.009 82 Hz(取表3和表4中更不利的數(shù)據(jù),下同),ACE平均值為22.585 MW,CPS1的平均值為199.729%,CPS2合格率為98.556%,各項(xiàng)指標(biāo)在各算法中均為最優(yōu)。DBNSOF算法在復(fù)雜擾動(dòng)下標(biāo)稱參數(shù)系統(tǒng)仿真中的響應(yīng)特性(圖8(b))與圖7一致,驗(yàn)證了DBNSOF的穩(wěn)定性。DBNSOF算法在參數(shù)攝動(dòng)系統(tǒng)仿真結(jié)果,對(duì)比標(biāo)稱參數(shù)系統(tǒng)仿真結(jié)果無明顯控制性能指標(biāo)下降(對(duì)比表3和表4),驗(yàn)證了DBNSOF算法的魯棒性。
以下將DBNSOF算法與其他算法作具體對(duì)比分析:
1)對(duì)比FSOF控制算法:在標(biāo)稱參數(shù)系統(tǒng)中,DBNSOF算法在復(fù)雜擾動(dòng)下的控制曲線仍與FSOF算法十分相似,各性能指標(biāo)也十分相近(見表3),進(jìn)一步驗(yàn)證了DBNSOF所具備的近似最優(yōu)性。在參數(shù)攝動(dòng)系統(tǒng)中,DBNSOF算法的各性能指標(biāo)對(duì)比標(biāo)稱參數(shù)系統(tǒng)時(shí)無明顯下降,優(yōu)于具有參數(shù)依賴性質(zhì)的FSOF算法(見表4)。該現(xiàn)象是DBN非線性處理能力和泛化能力的體現(xiàn)。
2)對(duì)比SO控制算法:SO的超調(diào)和振蕩使其能在連續(xù)負(fù)荷擾動(dòng)中更早達(dá)到下一短期穩(wěn)態(tài)值,因此其在標(biāo)稱參數(shù)系統(tǒng)仿真中達(dá)到了更好的性能指標(biāo)(見表3)。然而,振蕩系統(tǒng)的魯棒性一般較差,在某些參數(shù)攝動(dòng)情況下可能面臨失穩(wěn)問題,這在此次仿真中得到體現(xiàn)(見圖9(b)),各性能指標(biāo)急劇下降(見表4),這一風(fēng)險(xiǎn)是電力系統(tǒng)所不能承受的。此外,SO的振蕩性質(zhì)對(duì)調(diào)頻機(jī)組有不利影響。DBNSOF算法在上述問題中均優(yōu)于SO算法。
3)對(duì)比PI控制算法:在標(biāo)稱參數(shù)系統(tǒng)中,P系數(shù)和I系數(shù)整定良好的PI算法與DBNSOF算法的控制性能差距并不十分明顯。然而,在某些系統(tǒng)參數(shù)攝動(dòng)下,P分量可能引起振蕩(如圖9(b)所示),導(dǎo)致控制性能指標(biāo)下降(如表4所示),加大了與DBNSOF算法的差距。因此,DBNSOF算法是優(yōu)于PI算法的。
綜上,基于DBNSOF算法的SGC具備近似最優(yōu)發(fā)電控制特性,其CPS指標(biāo)在上述算法中最優(yōu),并具備更強(qiáng)的魯棒性。
本文設(shè)計(jì)的SGC在投入調(diào)度中心AGC系統(tǒng)使用后,仍可根據(jù)更新的發(fā)電調(diào)控歷史數(shù)據(jù)進(jìn)行在線訓(xùn)練和參數(shù)更新,SGC的泛化能力、穩(wěn)定性與魯棒性也將進(jìn)一步增強(qiáng)。
本文提出了深度置信網(wǎng)絡(luò)狀態(tài)最優(yōu)反饋算法,利用深度置信網(wǎng)絡(luò)的非線性表達(dá)能力,實(shí)現(xiàn)了減少狀態(tài)反饋量與提升自動(dòng)發(fā)電控制性能的雙目標(biāo),實(shí)現(xiàn)了由自區(qū)域頻率偏差與傳輸功率偏差組合反饋下的互聯(lián)電力系統(tǒng)近似最優(yōu)發(fā)電控制,可以解決全狀態(tài)最優(yōu)反饋控制在AGC中的應(yīng)用難題,符合智能電網(wǎng)建設(shè)中對(duì)AGC性能的更高要求。同時(shí),DBN的在線學(xué)習(xí)能力可以適應(yīng)電力系統(tǒng)產(chǎn)生的實(shí)時(shí)變化,更適用于系統(tǒng)隨機(jī)性更強(qiáng)的現(xiàn)代電力網(wǎng)絡(luò)。
此外,本文所提出的DBNSOF算法并不局限于自動(dòng)發(fā)電控制,對(duì)其他控制問題,如自動(dòng)電壓控制,也有借鑒意義,后續(xù)將應(yīng)用此算法進(jìn)行無功優(yōu)化等方向的研究。