申錦鵬,楊 軍,李 蕊,張 俊,王 曉,王飛躍
(1. 武漢大學電氣與自動化學院,湖北省武漢市 430072;2. 中國科學院自動化研究所復雜系統(tǒng)管理與控制國家重點實驗室,北京市 100190)
隨著新能源和電力電子設備大量接入[1],電力系統(tǒng)規(guī)模不斷擴大,電網(wǎng)運行工況日益復雜,給電力系統(tǒng)暫態(tài)穩(wěn)定評估(transient stability assessment,TSA)帶來了新的挑戰(zhàn)[2]。隨著人工智能技術(shù)的發(fā)展,以及廣域測量系統(tǒng)(wide area measurement system,WAMS) 、同 步 相 量 測 量 單 元(synchrophasor measurement unit,PMU)的普及,基于數(shù)據(jù)驅(qū)動的穩(wěn)定評估方法受到了廣泛關注[3]。
目前,已提出多種基于數(shù)據(jù)驅(qū)動的暫態(tài)穩(wěn)定評估算法,如決策樹[4]、支持向量機(support vector machine,SVM)[5]、集成學習[6]、深度學習[7]等。同時,生成對抗網(wǎng)絡(generative adversarial network,GAN)、增量學習、代理模型等機器學習方法也分別應用于解決數(shù)據(jù)不平衡、樣本更新、模型可解釋性等問題。但機器學習模型均有很強的領域垂直特性[3],即所應用的領域越垂直、越細致,其效果越好,但模型的通用性也隨之降低。
為解決以上問題,近年來有學者采用遷移學習方法,將原始場景中獲得的知識遷移至當前評估模型的構(gòu)建中,以實現(xiàn)電力系統(tǒng)暫態(tài)穩(wěn)定性的自適應評估。目前,遷移學習方法主要分為樣本遷移[8-9]、特征遷移[10-11]和模型遷移[12-13]。文獻[8]對源域和目標域樣本間的歐氏距離進行排序,根據(jù)樣本相似度選擇遷移樣本。文獻[9]基于關鍵故障持續(xù)時間和關鍵故障位置選擇遷移樣本,將選取的源域樣本和目標域少量樣本融合起來訓練模型,解決了新場景下訓練樣本不足的問題。文獻[10]基于遷移成分分析(transfer component analysis,TCA)算法,將源域和目標域映射到相似度更高的再生核希爾伯特空間以減少其邊緣概率分布的距離,使得對源域知識的篩選更加精細。但該方法仍需經(jīng)過特征提取、模型訓練等步驟,更新過程復雜。文獻[11]融合以上2 種方法,在原數(shù)據(jù)集中預先篩選關鍵特征,再用遷移樣本訓練模型,使模型評估速度和準確度得到進一步提高。文獻[12]基于模型遷移中的微調(diào)(finetuning)算法,凍結(jié)原模型輸入層、特征提取層,僅訓練更新全連接層,有效利用了原模型的特征挖掘能力,更新速度快、評估精度高。然而,使用新任務更新訓練模型會使其遺忘已經(jīng)學到的知識,即存在“災難性遺忘”問題[14]。
針對當前電力系統(tǒng)暫態(tài)穩(wěn)定自適應評估中存在的知識利用率低、更新過程復雜、無法兼顧樣本量和準確率、可持續(xù)學習能力差等問題,本文提出了一種基于改進域?qū)股窠?jīng)網(wǎng)絡(domain adversarial neural network,DANN)的端到端遷移學習方法。通過合理遷移原始數(shù)據(jù)以及模型,減少了所需訓練樣本規(guī)模,提高了模型更新速度和通用性,改善了“災難性遺忘”問題,實現(xiàn)了暫態(tài)穩(wěn)定的自適應評估。
基于數(shù)據(jù)驅(qū)動的電力系統(tǒng)暫態(tài)穩(wěn)定評估,本質(zhì)上是尋找量測數(shù)據(jù)與暫態(tài)穩(wěn)定性之間的映射關系,利用數(shù)學模型加以表征并實時應用。為在保證評估效果的前提下尋找不同映射間的聯(lián)系以增強模型通用性,減弱領域垂直特性帶來的影響,本文采用遷移學習方法。遷移學習是指將在解決一個問題時獲取的知識應用到解決另一個不同但相關的問題,以獲得更好的學習效果。其中,特征空間和特征空間邊緣概率分布共同構(gòu)成領域;已獲得的知識稱為源域;要學習的新知識稱為目標域[15];知識包括數(shù)據(jù)知識和模型知識;任務為解決問題需要構(gòu)建的模型。
在基于數(shù)據(jù)驅(qū)動的電力系統(tǒng)暫態(tài)穩(wěn)定評估方法中,特征空間就是高維電網(wǎng)量測數(shù)據(jù)空間。電力系統(tǒng)原始運行場景樣本充足,并已通過訓練獲得高質(zhì)量評估模型,故設定為源域;運行方式或拓撲結(jié)構(gòu)改變后,新運行場景下的特征空間沒有改變,而特征空間的邊緣概率分布不再滿足獨立同分布條件,領域發(fā)生變化,需要通過學習重新獲取評估結(jié)果,故設定為目標域。其中,源域和目標域的學習任務相同,均為實現(xiàn)電力系統(tǒng)暫態(tài)穩(wěn)定性的快速、準確判別。
GAN 是通過相互對抗完成模型訓練的深度學習框架(見附錄A 圖A1),廣泛應用于解決電力系統(tǒng)數(shù)據(jù)合成問題[8]。其目標函數(shù)為:
式中:E(·)為期望值函數(shù);gdata(x)為真實樣本分布;gnoise(z)為噪聲分布;x為真實的輸入樣本;z為隨機噪聲;G為生成器;D為判別器。
GAN 利用相悖的目標函數(shù)優(yōu)化網(wǎng)絡參數(shù)、減少損失:生成器不斷提高樣本生成能力,減小生成樣本和真實樣本之間差距,以此獲得逼真的樣本;判別器不斷提高判別能力,提升生成效果。
不同于樣本遷移或特征遷移方法,文獻[16]將對抗思想融入遷移學習中,提出了DANN。該網(wǎng)絡由特征提取器、標簽分類器和域分類器組成,如圖1所示。圖中:M為電網(wǎng)量測數(shù)據(jù)空間;N為特征空間;Gf、Gl、Gd分別為特征提取器、標簽分類器、域分類器;θf、θl、θd分別為Gf、Gl、Gd的參數(shù);Ll為標簽分類損失;Ld為域分類損失;λ為平衡系數(shù)。
圖1 DANN 結(jié)構(gòu)Fig.1 Structure of DANN
其中,源域和目標域的特征空間均為電網(wǎng)量測數(shù)據(jù)空間M,特征提取器Gf將輸入特征映射到一個新的特征空間N中,并和標簽分類器Gl共同構(gòu)成深度前饋神經(jīng)網(wǎng)絡用于標簽分類。
其損失函數(shù)為:
式中:xi和yi分別為輸入的第i個樣本及標簽。
為利用源域數(shù)據(jù)補充新場景下的訓練樣本,需要對齊源域和目標域在特征空間N中的邊緣概率分布。為此,DANN 算法基于對抗思想分別構(gòu)建了域分類器Gd和梯度翻轉(zhuǎn)層(gradient reversal layer,GRL)。域分類器與標簽分類器共享輸入特征,域分類器的輸出為樣本來源(源域或目標域),其結(jié)果用于領域分類,損失函數(shù)為:
式中:di為第i個樣本的域類別標簽。
在誤差反向傳播的過程中,梯度翻轉(zhuǎn)層將特征提取器參數(shù)的梯度乘以平衡系數(shù),使得特征提取器的目標變?yōu)樵龃笥蚍诸悡p失,進而縮小特征空間N中源域和目標域之間的邊緣分布距離。DANN 的總優(yōu)化目標Λ(θf,θl,θd)為:
式中:Ψs和Ψt分別為源域和目標域的樣本數(shù)量;Ld,i和Ll,i分別為第i個樣本的標簽分類損失和域分類損失。
標簽分類損失和域分類損失協(xié)同優(yōu)化特征提取器,提取源域和目標域公共特征的同時不斷提高模型分類性能,保證通用性。網(wǎng)絡各部分訓練目標分別為:
經(jīng)過迭代更新,最終計算求得的參數(shù)即為DANN 參數(shù)。
不同于圖像識別,電力系統(tǒng)模式識別的樣本組成、數(shù)據(jù)結(jié)構(gòu)、評價指標、場景變化均有特殊性,需要根據(jù)其特點設計模型結(jié)構(gòu)、損失函數(shù)以及訓練方式,對DANN 算法做出調(diào)整改進。
2.1.1 輸入特征與訓練樣本構(gòu)建
基于數(shù)據(jù)驅(qū)動的暫態(tài)穩(wěn)定評估中輸入特征選擇方法主要分為3 類:1)利用穩(wěn)態(tài)特征,雖然不存在采樣時間過長無法保證實時性的問題[17],但無法區(qū)分故障位置、持續(xù)時間、故障方式等反映擾動的信息,從而導致準確性不足;2)利用故障清除后的瞬時特征,在只考慮單重故障的情況下,故障清除后的系統(tǒng)不會再受到外來因素干擾,能夠充分考慮擾動信息[18];3)采集故障切除后一定周期內(nèi)的時序數(shù)據(jù),在時間遞歸神經(jīng)網(wǎng)絡中取得了良好的效果[19]。
隨著系統(tǒng)中PMU 的廣泛安裝,可利用PMU 實時上傳的信息對電網(wǎng)中的故障進行在線識別。在此基礎上,選取故障發(fā)生前、故障發(fā)生時、故障清除后的三段式特征數(shù)據(jù),既可包含時間維度信息又能減少信息冗余。本文選擇各發(fā)電機有功及無功功率、母線電壓幅值及相角、負荷有功及無功功率、線路有功及無功功率等物理量作為輸入特征[20],構(gòu)建三段式輸入特征,如附錄A 圖A2 所示,由此將數(shù)據(jù)集轉(zhuǎn)化 為 1 維 卷 積 神 經(jīng) 網(wǎng) 絡(one-dimensional convolutional neural network,1D-CNN)的 輸 入形式。
與DANN 原始的無監(jiān)督訓練應用場景不同,暫態(tài)穩(wěn)定評估中目標域為含標簽數(shù)據(jù),利用少量含標簽數(shù)據(jù),一方面,可以進行數(shù)據(jù)和模型知識的遷移;另一方面,可以用于更新判斷穩(wěn)定(簡稱判穩(wěn))模型。因此,改進原DANN 模型,由源域和目標域標簽數(shù)據(jù)共同組成訓練樣本。
2.1.2 網(wǎng)絡搭建與參數(shù)設置
本文搭建的DANN 模型結(jié)構(gòu)如表1 所示。其中,特征提取器由卷積層構(gòu)成,標簽分類器和域分類器由多層隱藏層構(gòu)成。
表1 改進DANN 的模型結(jié)構(gòu)Table 1 Model structure of improved DANN
表1 中,卷積層(k1,k2)進行1 維卷積計算,其中,k1表示卷積核數(shù)目,k2表示感受野,即神經(jīng)網(wǎng)絡中神經(jīng)元的三段式數(shù)據(jù)輸入?yún)^(qū)域的大小。為加快網(wǎng)絡訓練和收斂的速度、控制梯度、防止過擬合,加入批規(guī)范化(batch normalization)層;輸出(flatten)層連接卷積輸出和分類器;池化層的窗口和滑動步長均為3;全連接層為2 層,激活函數(shù)為softmax,其余層激活函數(shù)均為ReLU;輸入層元素為100。不同于傳統(tǒng)DANN,為充分利用源域模型知識,在目標域訓練中保留了特征提取器和標簽分類器的結(jié)構(gòu)參數(shù)以加快模型更新速度。同時,對訓練過程做出如下改進。
在GAN 中,通常會對分類器進行預訓練以提升對抗效果。對于DANN,采用固定的損失函數(shù)無法靈活控制域分類器和特征提取器的訓練水平。因此,本文采用變梯度翻轉(zhuǎn)平衡系數(shù)λp:
式中:χ為系數(shù),通常設置為常數(shù)10;p為當前訓練迭代次數(shù)與總迭代次數(shù)的比值,代表從0 到1 的訓練進程。
隨著對抗訓練的進行,平衡系數(shù)λp會自適應地從0 逐漸增加,最終變?yōu)?。通過改變損失函數(shù),令模型在訓練初期更加重視域分類器性能,使其具有一定判別能力,避免了域分類器在訓練初期對噪聲信號過于敏感而致使對抗效果不理想。
選用Adam 優(yōu)化器,并為優(yōu)化器綁定一個學習率μp的指數(shù)衰減控制器:
式中:μ0=0.01,為初始學習率;σ和β為參數(shù),分別取10 和0.75。
學習率μp隨著迭代訓練次數(shù)的增加自動降低:在訓練初期,學習率較大,網(wǎng)絡可以迅速收斂;在訓練后期,學習率較小,網(wǎng)絡能更好地收斂到最優(yōu)解。梯度翻轉(zhuǎn)平衡系數(shù)和學習率與迭代訓練進程的關系如附錄A 圖A3 所示。
2.1.3 焦點損失函數(shù)
基于數(shù)據(jù)驅(qū)動的暫態(tài)穩(wěn)定評估方法存在樣本不平衡的問題,即大量的穩(wěn)定訓練樣本使模型更傾向于將未知樣本判斷為穩(wěn)定。為解決這一問題,一方面,通過欠采樣、過采樣、線性插值[21]、樣本生成[8]等方法可以得到平衡數(shù)據(jù)集用于訓練,但原始數(shù)據(jù)分布也隨之發(fā)生改變;另一方面,可以調(diào)整損失函數(shù)[22],提高失穩(wěn)判別準確率的同時保持原始數(shù)據(jù)分布。
本文對損失函數(shù)進行改進,采用焦點損失(focal loss,F(xiàn)L)函數(shù),如式(9)所示:
式中:Lfl為焦點損失函數(shù);y為標簽;y'∈[0,1],為預測結(jié)果;α>0.5,為平衡因子,通過參數(shù)α增加訓練過程中失穩(wěn)樣本的分類損失以提高失穩(wěn)樣本正確分類的重要性,解決樣本不平衡問題,取為穩(wěn)定樣本數(shù)占樣本總數(shù)的比例;γ>1,為調(diào)制因子,通過調(diào)制因子γ增加難分類樣本的損失,并增強模型在失穩(wěn)邊界上的樣本判別能力,如附錄A 圖A4 所示,通過仿真實驗最終取值γ=2。
2.1.4 判穩(wěn)依據(jù)及評價指標
利用受擾后各臺發(fā)電機的功角值計算暫態(tài)穩(wěn)定指標(transient stability index,TSI):
式中:Δδmax為任意時刻2 臺發(fā)電機功角差的最大值;ηTSI為暫態(tài)穩(wěn)定指標。
若ηTSI>0,則將樣本標注為0,代表系統(tǒng)穩(wěn)定;若ηTSI<0,則將樣本標注為1,代表系統(tǒng)失穩(wěn)。
表2 中,ξTP、ξTN、ξFP、ξFN分別為真穩(wěn)定、真失穩(wěn)、假穩(wěn)定、假失穩(wěn)樣本數(shù)。定義評價指標如下:
式中:φACC為準確率,代表模型總體評估效果;φRN為召回率,代表失穩(wěn)樣本被正確分類的比率,φRN越高,漏警率就越低。
根據(jù)域間距離提取數(shù)據(jù)知識的遷移學習方法,可能產(chǎn)生過擬合,需要對大矩陣進行求解并重新訓練模型,精度和實時性難以保證(見附錄A 圖A5)。微調(diào)遷移學習方法在更新訓練過程中可能會遺忘已學知識,模型通用性和可持續(xù)學習能力較差。改進DANN 通過標簽分類損失和域分類損失協(xié)同優(yōu)化特征提取器。一方面,將源域和目標域映射到滿足同分布的特征空間中,獲取可遷移數(shù)據(jù)知識,補充新場景下電力系統(tǒng)運行數(shù)據(jù);另一方面,不斷提高模型分類性能并保證通用性,獲取可遷移模型知識,在源域和目標域中均有良好的評估性能,無需復雜的遷移步驟,即可實現(xiàn)端到端的遷移學習。輸入原始數(shù)據(jù)就可直接得到可用結(jié)果,而不必關心復雜的中間過程。
基于改進DANN 的暫態(tài)穩(wěn)定自適應評估框架如圖2 所示,主要包括源域離線訓練、目標域遷移學習、在線暫態(tài)穩(wěn)定評估3 個環(huán)節(jié)。
圖2 基于改進DANN 的自適應暫態(tài)穩(wěn)定評估框架Fig.2 Framework of self-adaptive transient stability assessment based on improved DANN
1)根據(jù)歷史運行數(shù)據(jù)和時域仿真數(shù)據(jù)構(gòu)建源域樣本數(shù)據(jù)集,劃分訓練集和測試集并確定平衡因子α,利用標簽分類器焦點損失優(yōu)化前饋神經(jīng)網(wǎng)絡,并訓練源域判穩(wěn)模型;
2)當電網(wǎng)運行場景變化時,融合源域訓練集以及目標域少量帶標簽數(shù)據(jù),在改進DANN 中,一方面,基于域分類器損失和梯度翻轉(zhuǎn)層對抗訓練特征提取器,對齊源域及目標域數(shù)據(jù),另一方面,基于標簽分類器損失更新訓練源域判穩(wěn)模型;
3)實時采集在線運行數(shù)據(jù),用訓練好的模型進行快速、準確的暫態(tài)穩(wěn)定自適應評估。
為驗證本文所提自適應評估方法的有效性,基于深度學習框架Tensorflow2.4 和Keras 構(gòu)建改進的DANN,仿真硬件為Intel Core i5-6400 CPU、12 GB內(nèi)存的計算機。
首先,選取IEEE 39 節(jié)點典型電力系統(tǒng)為源域系統(tǒng),使用PSS/E 和Python 進行時域仿真,批量構(gòu)建樣本空間:仿真步長為0.008 3 s、總時長為20 s,故障類型均為三相短路故障,設置故障點位于各條線路首末端以及距首端20%、40%、60%、80%處,以5%為步長設置80%~120%范圍內(nèi)共9 種負荷水平,故障持續(xù)時間分別設置為0.1、0.2、0.3 s。除原始運行場景外,新增如下幾種目標域運行場景[9,11]。
場景T1:在80%~120%標準負荷水平下,切除2 臺發(fā)電機G7、G8 以及3 個負荷L16、L25、L29。
場景T2:在130%標準負荷水平下,發(fā)電機按105%標準出力,系統(tǒng)拓撲結(jié)構(gòu)保持不變。
場景T3:負荷在80%~120% 標準負荷水平下,切除2 條線路B26-B27、B26-B28。
為對比遷移學習方案效果,批量時域仿真構(gòu)建目標域樣本集,并按3∶1∶1 劃分訓練集、驗證集、測試集,如附錄B 表B1 所示。各場景系統(tǒng)拓撲結(jié)構(gòu)如附錄B 圖B1 所示。
首先測試改進DANN 的分類器性能,使用源域數(shù)據(jù)訓練的同時閉鎖域分類器對抗訓練過程,并與SVM、輕度提升機(light gradient boosting machine,LightGBM)等淺層模型,以及人工神經(jīng)網(wǎng)絡(artificial neutral network,ANN)、CNN 等深度學習模型對比評估效果。分類器采用網(wǎng)格搜索和交叉驗證尋得最優(yōu)參數(shù),其中SVM 采用徑向基核函數(shù),懲罰因子c的取值范圍為{0.1,1,10,100,1 000},核參數(shù)υ的取值范圍為{0.005,0.01,0.1,1},最終得到超參數(shù)c=100,υ=0.005;LightGBM 基分類器數(shù)量Wc的取值范圍為{50,100,150,200,250},葉子樹Wl的取 值 范 圍 為{3,4,5},最 終 得 到Wc=250,Wl=4;ANN 采用5 層隱藏層結(jié)構(gòu),優(yōu)化器為Adam,與DANN 綁定相同的學習率指數(shù)衰減控制器,激活函數(shù) 為ReLU 和softmax;CNN 結(jié) 構(gòu) 分 為2 種,其 中,1D-CNN 使用故障切除時刻的一段式數(shù)據(jù)以及對數(shù)損失函數(shù);采用焦點損失函數(shù)的CNN(focal loss-CNN,F(xiàn)L-CNN)與DANN 結(jié)構(gòu)相同,均為三段式數(shù)據(jù)輸入,包含2 層卷積網(wǎng)絡、批規(guī)范層、隱藏層以及全連接層,采用焦點損失函數(shù),訓練的批大小取153。各分類器在源域及目標域T1 測試集上的評估效果如表3 所示,其中,φACC,s、φACC,T1、φRN,s、φRN,T1分別為源域原始場景S 和目標域場景T1 的準確率及召回率。
表3 不同算法性能測試結(jié)果Table 3 Performance test results of different algorithms
由表3 可知:1)相較于淺層模型,由于深度學習模型采用了更復雜的隱藏層結(jié)構(gòu),其評估效果以及在目標域上的泛化能力均有提升;2)改進DANN 與FL-CNN 評估效果接近,通過構(gòu)造三段式數(shù)據(jù)和焦點損失函數(shù),在增加時間維度信息的同時提升了對失穩(wěn)樣本和臨界樣本的敏感程度,保證了總體準確率和召回率,相較其他模型效果更優(yōu);3)由于運行方式和拓撲結(jié)構(gòu)的改變,原始判穩(wěn)模型在新場景下評估效果不佳,無法直接使用,需要通過遷移學習改善。
為改善新場景下的評估性能,減弱或消除領域垂直特性的影響,基于改進DANN 自適應更新模型。遷移原始場景中已通過訓練得到的特征提取器Gf和標簽分類器Gl構(gòu)成初始分類器框架,參數(shù)及學習率與2.1.2 節(jié)一致。
以51 例樣本為一組,隨機生成多組目標域含標簽數(shù)據(jù),并與全部源域訓練集樣本一起構(gòu)成融合訓練集作為模型輸入,測試不同規(guī)模的目標域數(shù)據(jù)對評估效果的影響,結(jié)果如附錄B 圖B2 所示??梢?,隨著目標域樣本積累,評估準確率不斷升高,8 組樣本就可以獲得較高的準確率和召回率,均衡考慮樣本生成耗時和評估效果,最終確定樣本量為408。模型自適應訓練過程如圖3 所示。
圖3 遷移學習訓練結(jié)果Fig.3 Training results of transfer learning
使用 t 分布隨機近鄰嵌入(t-distributed stochastic neighbor embedding,t-SNE)工具將特征提取的可視化結(jié)果映射到二維平面,如圖3(a)至圖3(d)所示??梢?,訓練開始前源域和目標域特征分布差異較大,經(jīng)過30 輪次的Gf和Gd同步對抗訓練后,特征分布逐漸接近,類似于特征遷移,Gf最終提取到了公共特征。
訓練過程中損失及準確率的變化如圖3(e)所示。從圖中可以看出,域分類損失越大代表特征分布的差距越小、越易“混淆”域分類器的判斷。域分類損失先降低后升高,經(jīng)過25 輪次訓練后穩(wěn)定于0.24,代表在對抗過程中,受2 個分類器損失共同作用,源域和目標域特征分布先分離后趨于相似,最終達到了最接近水平;模型訓練前源域和目標域判穩(wěn)準確率分別為98.14%和86.55%,域分類器和梯度翻轉(zhuǎn)層將域分類器損失傳遞至特征分類器,使準確率分別暫時下降到48.37%和45.96%;同時,Gl將標簽分類損失傳遞至Gf,使其在提取公共特征的同時不斷提高分類準確率,Gf在2 種損失之間尋求均衡,最終將準確率分別提升至98.16%和96.38%。
為驗證所提出域?qū)惯w移學習方法的有效性,本節(jié)從樣本量需求、模型更新速度、可持續(xù)學習能力等方面比較基于遷移學習的自適應暫態(tài)穩(wěn)定評估方案。
3.4.1 評估性能比較
在遷移學習過程中,隨目標域樣本的積累,模型評估效果不斷逼近上限[23]。而在電力系統(tǒng)實時運行過程中,新場景下的暫態(tài)穩(wěn)定數(shù)據(jù)積累不足,如何利用最少的樣本、最短的更新時間達到最優(yōu)評估效果更加受到運行調(diào)度人員的關注。比較TCA[10]、微調(diào)算法[12]、改進DANN 等遷移學習方法的自適應評估效果,測試在目標系統(tǒng)中達到96%的相同判穩(wěn)準確率時不同遷移學習模型所需T1 場景的樣本量、樣本生成耗時和模型訓練用時,結(jié)果如表4 所示。
表4 不同遷移學習方法的對比Fig.4 Comparison of different transfer learning methods
由表4 可知:1)相比重新訓練模型,TCA 通過特征映射利用了源域的數(shù)據(jù)知識,對目標域數(shù)據(jù)的需求量較低。但由于該方法在提取特征時僅關注樣本間距離而未考慮判穩(wěn)準確性,同時需要對大矩陣進行求解并重新訓練模型,準確率僅達到93.11%,且訓練用時較長,適用于樣本缺少的過渡階段[10];2)微調(diào)算法保留了原模型的特征提取結(jié)構(gòu),更新用時大幅縮短,但由于缺少對源域數(shù)據(jù)的有效利用,所需目標域數(shù)據(jù)量較大,適用于樣本有所積累后的階段;3)本文采用的改進DANN 可同時遷移模型知識和數(shù)據(jù)知識,提高了對源域知識的利用率,在對抗訓練中尋找公共特征的同時能保證所提取的特征有益于準確率的升高,無需復雜的更新過程,真正做到了端到端的遷移學習,因此,所需目標域樣本量最少且更新用時最短,能夠滿足在線調(diào)度需求,適用于模型更新的各個階段。
3.4.2 可持續(xù)學習能力比較
電力系統(tǒng)運行場景實時更新,如定期維護與發(fā)電調(diào)度、負荷的季節(jié)性波動、故障切除系統(tǒng)狀態(tài)恢復等變化可能反復發(fā)生,通過微調(diào)算法更新后的模型難以保證在原始運行場景中的判穩(wěn)性能,存在“災難性遺忘”問題。
為進一步比較遷移學習方法的持續(xù)學習能力,構(gòu)建附錄B 表B2 所示的數(shù)據(jù)集。基于目標域訓練集連續(xù)更新模型,使用同時包含源域和目標域的融合測試集對比判穩(wěn)準確率,如圖4 所示。
圖4 持續(xù)學習能力對比Fig.4 Comparison of continuous learning ability
可見,由于模型結(jié)構(gòu)參數(shù)有限,隨著運行場景不斷更新,傳統(tǒng)遷移學習方法在模型更新過程中遺忘了所學知識,在已學系統(tǒng)中的表現(xiàn)不佳。而改進DANN 最大限度地利用了模型的知識容納量,保留了在源域中的評估性能,具有較好的持續(xù)學習能力。
為進一步驗證所提方法在應對大電網(wǎng)場景變化時的有效性,采用美國南卡羅萊納州500 節(jié)點電網(wǎng)算例進行測試,如附錄B 圖B3 所示。目標域場景TL1 設置為線路B87-B143、B388-B440、B464-B471斷開;目標域場景TL2 設置為負荷水平為130%標準負荷,發(fā)電機相應調(diào)整出力;目標域場景TL3 設置為切除B17 上的SENECA 和B224 上的UNION發(fā)電機以及B4、B321、B491 上的負荷。故障點設置為各條線路首末端以及距首端20%、40%、60%、80%處;負荷水平設置為標準負荷的90%、100%、110%這3 種水平;故障持續(xù)時間分別設置為0.1、0.2、0.3 s。批量仿真構(gòu)造10 835 個樣本的源域和各800 個樣本的目標域數(shù)據(jù)集。
設計模型結(jié)構(gòu)參數(shù)與2.1.2 節(jié)一致,經(jīng)過測試將訓練的批大小調(diào)整為64。由于該系統(tǒng)節(jié)點數(shù)目較多,輸入特征維數(shù)和判穩(wěn)復雜度也相應提升,經(jīng)過自適應訓練,模型在源域和目標域上的測試結(jié)果如表5 所示。其中,目標域測試數(shù)據(jù)集與表5 所示的融合測試集結(jié)構(gòu)相同。可以看出,由于大型電力系統(tǒng)網(wǎng)架結(jié)構(gòu)更加堅強,樣本不平衡更加嚴重,對召回率產(chǎn)生了一定影響;同時,源域系統(tǒng)訓練得到的模型泛化能力較強,經(jīng)過遷移學習,模型性能可以基本提升至原水平;在大規(guī)模電網(wǎng)中,本文所提方法保留了在原始運行場景中的評估性能,具有較強的持續(xù)學習能力。結(jié)果表明,基于改進DANN 的判穩(wěn)方法在大型電力系統(tǒng)實時運行中具有較強的適應性。
表5 美國南卡羅萊納州500 節(jié)點電網(wǎng)測試結(jié)果Table 5 Test results of South Carolina 500-bus power grid in USA
針對實際電力系統(tǒng)場景變化后判斷穩(wěn)定模型的更新問題,本文基于改進DANN 提出了一種端到端的暫態(tài)穩(wěn)定自適應評估方法。在IEEE 39 節(jié)點及美國南卡羅萊納州500 節(jié)點電網(wǎng)的測試結(jié)果表明:1)在增加時間維度信息的同時提升了對失穩(wěn)樣本和臨界樣本的敏感程度,保證了總體準確率和召回率;2)通過對抗訓練縮小了域間分布差異,對源域數(shù)據(jù)的有效遷移使其對目標域訓練樣本的需求量降低,提升了更新速度;3)所提方法充分利用了模型的知識容納量,與傳統(tǒng)遷移學習方法相比有更好的可持續(xù)學習能力。
本文通過固定輸入特征結(jié)構(gòu)的方式保證各領域間模型遷移的有效性。為在更復雜的運行場景中應用改進域?qū)惯w移學習方法,后續(xù)研究將對電網(wǎng)量測數(shù)據(jù)進行處理,尋找具有明確物理意義且不受電網(wǎng)形態(tài)規(guī)模約束的特征量,拓展所提方法的應用范圍。同時,如何結(jié)合樣本方法提高模型在大型電力系統(tǒng)穩(wěn)定評估中的召回率以及結(jié)合知識驅(qū)動方法與圖神經(jīng)網(wǎng)絡進一步減少樣本更新時間并提高樣本積累期的穩(wěn)定評估效果,也是值得研究的方向。
附錄見本刊網(wǎng)絡版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡全文。