葉睿愷,王慧芳,張 森,張亦翔
(浙江大學(xué) 電氣工程學(xué)院,浙江 杭州 310027)
我國(guó)“雙碳”戰(zhàn)略目標(biāo)促使逆變型分布式電源IIDG(Inverter Interfaced Distributed Generator)在配電網(wǎng)中逐漸呈現(xiàn)高占比的發(fā)展趨勢(shì)[1]。與傳統(tǒng)同步電機(jī)電源不同,IIDG 具有強(qiáng)非線性的故障特性,不僅要滿足低壓穿越要求[2],還受故障前運(yùn)行特性、接入位置、控制策略等因素影響。大量IIDG 的接入使得傳統(tǒng)短路電流計(jì)算方法難以直接應(yīng)用,迫切需要對(duì)含IIDG配電網(wǎng)短路電流計(jì)算方法進(jìn)行研究[3]。
針對(duì)IIDG 故障特性以及短路電流計(jì)算方法,國(guó)內(nèi)外學(xué)者已開(kāi)展了很多研究。文獻(xiàn)[4]詳細(xì)介紹了IIDG 的低壓穿越控制策略,并給出了短路電流的表達(dá)式;文獻(xiàn)[5-6]根據(jù)不同目標(biāo)的控制策略分析了不對(duì)稱故障下IIDG 的電流輸出特性;文獻(xiàn)[7]分析了IIDG 并網(wǎng)后的故障特性,得到了對(duì)稱故障與不對(duì)稱故障下短路電流計(jì)算模型;文獻(xiàn)[8]分析了IIDG 并網(wǎng)后對(duì)配電網(wǎng)的影響,給出了含少量IIDG 配電網(wǎng)短路電流計(jì)算通用模型;文獻(xiàn)[9]將IIDG 分為故障點(diǎn)上游和故障點(diǎn)下游并分別建立故障等效模型,采用基于疊加原理的迭代短路電流計(jì)算方法。上述研究均是基于機(jī)理的物理建模,不同控制策略下IIDG 模型不同,不同故障類型下不同的短路電流計(jì)算方法都需要迭代計(jì)算。當(dāng)IIDG 大量接入或網(wǎng)絡(luò)規(guī)模增大時(shí),上述方法因迭代計(jì)算耗時(shí)必將大增,甚至可能出現(xiàn)不收斂的情況。為提升計(jì)算速度,有學(xué)者對(duì)IIDG 模型做極簡(jiǎn)處理,例如用1.2~2 倍額定電流來(lái)表征,但這必將犧牲計(jì)算準(zhǔn)確性[10]。因此現(xiàn)有物理建模方法應(yīng)用于IIDG 占比高的大型配電網(wǎng)時(shí),會(huì)出現(xiàn)計(jì)算快速性與準(zhǔn)確性之間的矛盾。
為了解決該矛盾,文獻(xiàn)[11]基于機(jī)器學(xué)習(xí)思想提出了機(jī)理與數(shù)據(jù)融合驅(qū)動(dòng)的含IIDG 配電網(wǎng)短路電流計(jì)算方法,并與詳細(xì)的物理建模方法進(jìn)行對(duì)比,結(jié)果表明文獻(xiàn)[11]所提方法的計(jì)算誤差接近物理建模方法的計(jì)算誤差或更小,且計(jì)算速度快。同時(shí),電網(wǎng)規(guī)模、IIDG 接入數(shù)量對(duì)該方法的計(jì)算性能影響較小[12]。然而,該方法使用單輸出的學(xué)習(xí)模型,當(dāng)需要計(jì)算配電網(wǎng)中多個(gè)測(cè)量點(diǎn)電流值時(shí),必須針對(duì)每個(gè)測(cè)量點(diǎn)訓(xùn)練各自的學(xué)習(xí)模型,因此存在模型數(shù)量多的問(wèn)題。
為解決模型數(shù)量問(wèn)題,本文提出了含IIDG 配電網(wǎng)短路電流計(jì)算多輸出模型。對(duì)不同的多輸出模型進(jìn)行分析與對(duì)比,并根據(jù)獲得的配電網(wǎng)運(yùn)行狀態(tài)的實(shí)際條件,選擇2 種包含運(yùn)行方式和故障信息的輸入特征,分別進(jìn)行模型訓(xùn)練,最終實(shí)現(xiàn)了同時(shí)輸出配電網(wǎng)所有支路短路電流的目標(biāo)。
傳統(tǒng)機(jī)器學(xué)習(xí)的目標(biāo)多為建立單輸出模型,即采用訓(xùn)練完成的模型對(duì)特定目標(biāo)進(jìn)行回歸計(jì)算。實(shí)際問(wèn)題中往往需要同時(shí)解決多個(gè)任務(wù),且多個(gè)任務(wù)之間存在不同的相關(guān)性,因此需要研究多輸出回歸計(jì)算。根據(jù)多輸出回歸的子任務(wù)關(guān)聯(lián)方式,大致可分為問(wèn)題轉(zhuǎn)化和算法適應(yīng)方法2類[13]。
多輸出任務(wù)目標(biāo)是建立M個(gè)輸入與D個(gè)輸出之間的映射關(guān)系。問(wèn)題轉(zhuǎn)化的核心思想是將相應(yīng)的映射關(guān)系轉(zhuǎn)化為D個(gè)單輸出的形式,然后將D個(gè)單輸出模型拼合成1 個(gè)多輸出模型,達(dá)到同時(shí)輸出多個(gè)預(yù)測(cè)值的目的。問(wèn)題轉(zhuǎn)化的算法包括單目標(biāo)方法ST(Single-Target method)、多目標(biāo)回歸模型融合MTRS(Multi-Target Regressor Stacking)方法和回歸鏈RC(Regressor Chain)方法等。
設(shè)有N組樣本,Xl為第l組的輸入,Yl為第l組對(duì)應(yīng)的輸出,即第l組樣本的輸入、輸出為:
第二階段通過(guò)將第一階段的輸出預(yù)測(cè)值拼合作為訓(xùn)練集的輸入,在一定程度上考慮了多個(gè)輸出之間的潛在關(guān)系,對(duì)問(wèn)題轉(zhuǎn)化預(yù)測(cè)值偏差進(jìn)行了一定的修正,可以提升預(yù)測(cè)準(zhǔn)確性。但是,MTRS 方法本質(zhì)上與ST 類似,都是直接考慮輸入和輸出之間的映射,對(duì)于輸出之間的潛在關(guān)系的考慮并不全面。此外,MTRS 方法需要進(jìn)行2 次ST 計(jì)算,使得模型偏大、計(jì)算速度慢。
RC 方法是基于馬爾可夫隨機(jī)鏈的思想,根據(jù)確定的鏈順序?qū)γ總€(gè)輸出建立獨(dú)立的回歸模型。當(dāng)有D個(gè)輸出值時(shí),假設(shè)指定鏈順序C為:
最終將D個(gè)預(yù)測(cè)值一起輸出。由上述過(guò)程可見(jiàn),RC 方法將不同輸出考慮為不同狀態(tài),將不同狀態(tài)以輸入的方式挖掘多個(gè)輸出之間的相關(guān)性,因此考慮了不同輸出之間的關(guān)系。針對(duì)不同的實(shí)際問(wèn)題,應(yīng)根據(jù)輸出任務(wù)間的相關(guān)性選擇不同的問(wèn)題轉(zhuǎn)化方法,達(dá)到最佳的多輸出性能。含IIDG 配電網(wǎng)短路電流計(jì)算問(wèn)題中,由于IIDG 與系統(tǒng)電源提供的短路電流相位往往不同[8],各支路穩(wěn)態(tài)電流的幅值之間不再顯式地滿足基爾霍夫電流定律,但電流相量之間還是滿足基爾霍夫電流定律的,即輸出之間存在一定的相關(guān)性,因此將其他模型的輸出量納入輸入的MTRS和RC方法這2種多輸出模型方法適用于配電網(wǎng)短路電流多輸出計(jì)算,可充分挖掘不同支路電流間的潛在關(guān)系。
由于MTRS 和RC 方法是將單輸出模型拼合為多輸出模型,因此方法的性能與作為基學(xué)習(xí)器的單輸出模型性能密切相關(guān)。配電網(wǎng)短路電流計(jì)算由于輸入特征數(shù)量較多,使模型復(fù)雜程度增大;同時(shí)輸出電流數(shù)量多且有部分?jǐn)?shù)值相近,因而存在一定的過(guò)擬合風(fēng)險(xiǎn)。為此本文選擇近年來(lái)在各大比賽中性能表現(xiàn)優(yōu)秀的基學(xué)習(xí)器——極限梯度提升機(jī)XGBoost(eXtreme Gradient Boosting)[14]和輕量梯度提升機(jī)LightGBM(Light Gradient Boosting Machine)[15]。XGBoost 和LightGBM 都是梯度提升決策樹(shù)GBDT(Gradient Boosted Decision Tree)的改進(jìn)與高效實(shí)現(xiàn),其中XGBoost 采用的是按層生長(zhǎng)策略,能夠同時(shí)分裂同一層的葉子,從而進(jìn)行多線程優(yōu)化,可有效降低過(guò)擬合風(fēng)險(xiǎn);LightGBM 采用帶有深度限制的按葉子生長(zhǎng)策略,每次從當(dāng)前所有葉子中找到分裂增益最大的葉子進(jìn)行分裂,在分裂次數(shù)相同的情況下,該策略可以降低更多的誤差。此外,LightGBM 使用了基于梯度的單邊采樣對(duì)輸入進(jìn)行降維以降低模型復(fù)雜程度,因此其可以在保證計(jì)算準(zhǔn)確度的前提下降低模型復(fù)雜程度,使得模型計(jì)算速度更快。
但是,MTRS 方法每進(jìn)行一組樣本訓(xùn)練都需要更新一次輸入特征,RC 方法則需要更新D-1 次輸入特征,這可能導(dǎo)致LightGBM 速度慢于XGBoost。原因是LightGBM需要對(duì)新輸入特征使用互斥特征捆綁EFB(Exclusive Feature Bundling),當(dāng)輸入特征不變或變化次數(shù)少時(shí),EFB 能大幅提升算法性能,當(dāng)輸入特征變化次數(shù)多時(shí),EFB 有可能減慢速度。因此,在MTRS方法下LightGBM的速度可能比XGBoost快,在RC 方法下LightGBM 的速度可能比XGBoost 慢。
綜上所述,含IIDG 配電網(wǎng)短路電流計(jì)算多輸出模型采用問(wèn)題轉(zhuǎn)化方法時(shí),分別采用XGBoost 和LightGBM 作為基學(xué)習(xí)器,并對(duì)比基于MTRS和RC方法的多輸出模型性能。
算法適應(yīng)方法是將單輸出模型根據(jù)實(shí)際問(wèn)題進(jìn)行修改,用1 個(gè)模型同時(shí)輸出多個(gè)預(yù)測(cè)值。算法適應(yīng)方法的輸出映射不僅需要考慮輸入變量,更需要考慮不同輸出量之間的關(guān)系,以此提升多個(gè)預(yù)測(cè)值的準(zhǔn)確性。
算法適應(yīng)方法包含統(tǒng)計(jì)學(xué)方法、多輸出支持向量機(jī)、多輸出回歸樹(shù)、核函數(shù)方法、神經(jīng)網(wǎng)絡(luò)等多種方法。算法在修改之前是適用于單輸出模型的,針對(duì)不同的實(shí)際問(wèn)題,需要修改算法中的輸入、模型結(jié)構(gòu)、輸出標(biāo)簽、損失函數(shù)等參數(shù),不同的算法適應(yīng)方法修改方式并不完全相同。本文采用應(yīng)用較為廣泛的神經(jīng)網(wǎng)絡(luò)作為多輸出回歸預(yù)測(cè)的基礎(chǔ)算法。
神經(jīng)網(wǎng)絡(luò)一般是指全連接的人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neural Network),它將輸入層的神經(jīng)元全部連接至隱藏層,利用所有輸入特征計(jì)算得到輸出值,因此是利用輸入特征最充分、計(jì)算結(jié)果較為準(zhǔn)確的模型。然而,全連接人工神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練樣本數(shù)量要求高、模型計(jì)算量大。卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Network)可以解決以上問(wèn)題,其卷積層可以通過(guò)更少的計(jì)算步驟實(shí)現(xiàn)類似效果,對(duì)于復(fù)雜模型更有優(yōu)勢(shì)。CNN 的卷積層通過(guò)滑窗實(shí)現(xiàn)輸入特征的局部感知,即相鄰輸入數(shù)據(jù)可以為輸出提供更高價(jià)值。電網(wǎng)具有基爾霍夫電流、電壓定律,因此將輸入的電氣量特征相鄰排列,可使CNN 的卷積核獲得有益信息,進(jìn)而提升短路電流計(jì)算準(zhǔn)確性。
本文選用ANN 和CNN 作為算法適應(yīng)方法的代表算法,驗(yàn)證算法適應(yīng)多輸出模型應(yīng)用于含IIDG 配電網(wǎng)短路電流計(jì)算的有效性。
目前,IIDG 高占比的配電網(wǎng)示范工程已配置有微型同步相量測(cè)量單元μPMU(Micro-synchronous Phasor Measurement Unit),可直接獲得電壓幅值、電壓相位、有功、無(wú)功等數(shù)據(jù),這些數(shù)據(jù)量反映了配電網(wǎng)的運(yùn)行方式。然而,大部分配電網(wǎng)不具備上述條件,但一般在各支路上安裝有電流互感器,能獲得支路電流的有效值,并在系統(tǒng)電源和IIDG 接入處安裝有電壓互感器獲得電壓的有效值,這些測(cè)量值也能反映配電網(wǎng)的運(yùn)行方式。考慮配電網(wǎng)實(shí)際測(cè)量條件,分別采用上述2 類電氣量作為配電網(wǎng)運(yùn)行方式特征信息,再結(jié)合故障位置及過(guò)渡電阻,構(gòu)成樣本的輸入特征。故障類型則不作為輸入特征,因?yàn)椴煌收项愋拖屡潆娋W(wǎng)電氣量特征差異較大,樣本混合訓(xùn)練會(huì)降低模型性能,為此,與傳統(tǒng)短路電流計(jì)算習(xí)慣一致,針對(duì)不同故障類型調(diào)用不同的計(jì)算模型。樣本的標(biāo)簽為對(duì)應(yīng)上述輸入特征的各條線路短路電流穩(wěn)態(tài)值。
綜上所述,對(duì)于包含K個(gè)節(jié)點(diǎn)、E條支路的配電網(wǎng),假設(shè)有1 個(gè)系統(tǒng)電源接入節(jié)點(diǎn)和H個(gè)IIDG 接入節(jié)點(diǎn),則有2類短路電流計(jì)算模型輸入特征,即X1對(duì)應(yīng)配置μPMU 的配電網(wǎng),X2對(duì)應(yīng)未配置μPMU 的配電網(wǎng),分別如式(8)和式(9)所示。
式中:下標(biāo)k為節(jié)點(diǎn)編號(hào),節(jié)點(diǎn)1 為系統(tǒng)電源接入節(jié)點(diǎn);下標(biāo)e為支路編號(hào);|V|、θ、P、Q、I、V分別包含三相電壓幅值、電壓相位、有功、無(wú)功、支路電流、電壓有效值數(shù)據(jù),因此能應(yīng)用于不對(duì)稱配電網(wǎng);Fline為故障線路編號(hào);Floc為故障位置距離線路首端的位置百分比,F(xiàn)loc∈[0,100%),當(dāng)Floc=0 時(shí),認(rèn)為故障發(fā)生在首節(jié)點(diǎn)上;Ron為過(guò)渡電阻,發(fā)生接地故障時(shí)為相與地之間的電阻,僅相間故障時(shí)為相與相之間的電阻;SDGh為第h個(gè)IIDG的容量。
采用基于CNN 的算法適應(yīng)方法時(shí),為了更好地發(fā)揮CNN 的局部敏感特性,將輸入數(shù)據(jù)特征由一維修改至二維。具體是將反映運(yùn)行方式的特征數(shù)據(jù)分為不同數(shù)據(jù)層,式(8)中分為了電壓幅值層、電壓相位層、有功層和無(wú)功層,這些層以節(jié)點(diǎn)或支路編號(hào)對(duì)齊,且每層有3 行分別對(duì)應(yīng)三相。故障信息與IIDG信息單獨(dú)為1層,該層為稀疏矩陣,僅有故障和IIDG對(duì)應(yīng)的節(jié)點(diǎn)或支路編號(hào)有相應(yīng)信息,其余均為0。式(9)類似,只是將反映運(yùn)行方式的數(shù)據(jù)分為了電流層、電壓層。
計(jì)算準(zhǔn)確性一般由真實(shí)值yj與計(jì)算值y?j的差異來(lái)衡量,其中真實(shí)值通常由仿真獲得。通常采用平均絕對(duì)誤差MAE(Mean Absolute Error)、平均絕對(duì)百分比誤差MAPE(Mean Absolute Percentage Error)來(lái)衡量模型準(zhǔn)確度。MAE 和MAPE 指標(biāo)都受真實(shí)值影響:當(dāng)真實(shí)值大時(shí),MAE 受影響大;當(dāng)真實(shí)值小時(shí),MAPE受影響大。因此用MAE和MAPE這2個(gè)指標(biāo)綜合反映算法性能,避免真實(shí)值過(guò)大或過(guò)小帶來(lái)的影響。
多輸出模型中第j個(gè)輸出的MAE值δj定義為:
式中:λAPE為APE值;λj為第j個(gè)輸出的MAPE。
上述評(píng)價(jià)指標(biāo)的數(shù)值越小,模型準(zhǔn)確性越高。多輸出模型會(huì)產(chǎn)生D個(gè)δj和λj,為方便展示,文中選 用D個(gè)δj、λj指標(biāo)中的最大值δMAX、λMAX和平均值δMEAN、λMEAN。
對(duì)于機(jī)器學(xué)習(xí)而言,超參數(shù)是模型訓(xùn)練過(guò)程中需要重點(diǎn)調(diào)整的內(nèi)容,獲得最優(yōu)的超參數(shù)可以提升模型性能,使評(píng)價(jià)指標(biāo)δMEAN和λMEAN達(dá)到最小。不同類型的多輸出模型采用的超參數(shù)尋優(yōu)方式不完全相同。
對(duì)于問(wèn)題轉(zhuǎn)化方法,本文采用隨機(jī)采樣網(wǎng)格搜索與5 折交叉驗(yàn)證結(jié)合的方式進(jìn)行超參數(shù)尋優(yōu),以最終輸出的λMEAN作為評(píng)價(jià)標(biāo)準(zhǔn),驗(yàn)證超參數(shù)尋優(yōu)結(jié)果。XGBoost 最佳超參數(shù)組合為:基分類器為400個(gè),樹(shù)最大深度為10,子節(jié)點(diǎn)權(quán)重為2,子采樣系數(shù)為0.8,特征采樣系數(shù)為0.8。LightGBM 最佳超參數(shù)組合為:基分類器為430 個(gè),葉子數(shù)為20,子采樣系數(shù)為0.8,特征采樣系數(shù)為0.9。
對(duì)于基于神經(jīng)網(wǎng)絡(luò)的多輸出模型,超參數(shù)更為復(fù)雜,為避免網(wǎng)格搜索陷入局部最優(yōu),調(diào)參選用效率更高的貝葉斯調(diào)參法。本文使用3層全連接的ANN,每一層都需要使用激活函數(shù),激活函數(shù)選擇ReLU函數(shù),學(xué)習(xí)率為10-5,單次訓(xùn)練樣本100 個(gè)。CNN 最優(yōu)參數(shù)組合為:卷積核大小為3×3,填充半徑為1,激活函數(shù)為ReLU,池化層大小為2,學(xué)習(xí)率為10-5,單次訓(xùn)練樣本150 個(gè)。CNN 輸出層需要將前層卷積輸出展開(kāi),使用1 層全連接層連接,采用ReLU 激活獲得最終結(jié)果?;谏窠?jīng)網(wǎng)絡(luò)的多輸出模型均使用λMEAN作為損失函數(shù)。
含IIDG 配電網(wǎng)的短路電流多輸出計(jì)算模型包括訓(xùn)練和應(yīng)用兩部分。其中,訓(xùn)練需要大量樣本,通過(guò)仿真獲得樣本的方法同文獻(xiàn)[11],有所不同的是,提取的輸入特征有差異,且該文獻(xiàn)的樣本標(biāo)簽為1個(gè)測(cè)量點(diǎn),而本文的樣本標(biāo)簽為所有支路測(cè)量點(diǎn)。具體流程如下:
1)通過(guò)MATLAB/Simulink 建立所需的配電網(wǎng)模型;
2)在常見(jiàn)運(yùn)行方式區(qū)間內(nèi),隨機(jī)設(shè)置配電網(wǎng)運(yùn)行方式和故障信息;
3)進(jìn)行故障仿真,并記錄輸入特征和各條支路的短路電流穩(wěn)態(tài)值作為標(biāo)簽值。
重復(fù)上述步驟2)、3)即可獲取1 組訓(xùn)練樣本。訓(xùn)練樣本的數(shù)量可以根據(jù)訓(xùn)練效果進(jìn)行補(bǔ)充或調(diào)整。為了減少不同輸入特征數(shù)值大小對(duì)模型訓(xùn)練的影響,對(duì)輸入數(shù)據(jù)進(jìn)行歸一化預(yù)處理。模型訓(xùn)練過(guò)程本質(zhì)是調(diào)參過(guò)程,尋找模型最優(yōu)參數(shù)使得輸出結(jié)果誤差最優(yōu),達(dá)到預(yù)期則訓(xùn)練結(jié)束。模型應(yīng)用時(shí),輸入配電網(wǎng)的運(yùn)行方式特征信息、故障信息,根據(jù)故障類型調(diào)用訓(xùn)練好的對(duì)應(yīng)模型,則可輸出所有支路的短路電流值。
含IIDG 配電網(wǎng)結(jié)構(gòu)圖如圖1 所示,按照?qǐng)D1 以IEEE 34 節(jié)點(diǎn)配電網(wǎng)系統(tǒng)為基礎(chǔ)接入IIDG,IIDG 容量設(shè)定為:SDG1=500 kW,SDG2=200 kW,SDG3=500 kW,SDG4=400 kW。節(jié)點(diǎn)800 為系統(tǒng)電源接入點(diǎn),考慮最大和最小2種基礎(chǔ)運(yùn)行方式,等值阻抗分別為j0.5 Ω和j1 Ω。配電網(wǎng)電壓等級(jí)為24.9 kV,系統(tǒng)線路共有31 條,負(fù)荷參照文獻(xiàn)[16]設(shè)定,在最大、最小運(yùn)行方式下不發(fā)生改變。
圖1 含IIDG配電網(wǎng)結(jié)構(gòu)圖Fig.1 Structure of distribution network with IIDGs
隨機(jī)設(shè)置配電網(wǎng)運(yùn)行方式,模型參數(shù)設(shè)置同文獻(xiàn)[11]:等值電源阻抗在系統(tǒng)最大、最小等值阻抗區(qū)間內(nèi)隨機(jī)產(chǎn)生;IIDG 容量及負(fù)荷大小則在其原值的[80%,120%]范圍內(nèi)隨機(jī)產(chǎn)生;設(shè)置一定概率的隨機(jī)切除部分線路或IIDG。隨機(jī)設(shè)置故障線路編號(hào)Fline、故障發(fā)生位置Floc和過(guò)渡電阻Ron。上述運(yùn)行方式和故障信息的設(shè)置,均會(huì)通過(guò)式(8)或式(9)的輸入特征反映出來(lái)。需說(shuō)明的是,過(guò)渡電阻的設(shè)置范圍應(yīng)與故障類型相吻合,例如配電網(wǎng)單相接地短路故障的過(guò)渡電阻范圍可設(shè)置為[0,1 000]Ω[17],兩相相間短路故障的過(guò)渡電阻可設(shè)置更小的取值范圍,三相短路故障可不設(shè)置。
本算例以三相短路電流為例,通過(guò)仿真獲得10 000組樣本。由于仿真建模時(shí)IIDG采用較為精確的模型,因此仿真速度很慢,獲取10 000組樣本耗時(shí)約10 d。按照8∶2 的比例將樣本分為訓(xùn)練集和測(cè)試集。根據(jù)式(8),該配電網(wǎng)共有316 個(gè)輸入特征,根據(jù)式(9),則有91個(gè)輸入特征,輸出結(jié)果為80個(gè)。
文獻(xiàn)[11]采用XGBoost和LightGBM 模型進(jìn)行預(yù)測(cè),并已與物理建模方法進(jìn)行了對(duì)比,結(jié)果表明機(jī)器學(xué)習(xí)計(jì)算短路電流的準(zhǔn)確性。但文獻(xiàn)[11]為單輸出模型,若要輸出圖1虛線框中測(cè)量點(diǎn)①、②、③的短路電流,則需要建立3個(gè)模型,而本文所提方法僅需1個(gè)模型即可輸出上述3處測(cè)量點(diǎn)的短路電流。表1為不同方法預(yù)測(cè)節(jié)點(diǎn)834 發(fā)生三相短路故障時(shí)C 相短路電流的結(jié)果與模型的性能指標(biāo)。其中,XGBoost(單輸出)模型的數(shù)據(jù)來(lái)源于文獻(xiàn)[11],為測(cè)量點(diǎn)①的電流,MTRS-XGBoost(多輸出)和MTRS-LightGBM(多輸出)模型的結(jié)果為測(cè)量點(diǎn)①、②、③處的預(yù)測(cè)結(jié)果。因本文與文獻(xiàn)[11]的系統(tǒng)等值阻抗、負(fù)荷、IIDG容量等均在相同范圍內(nèi)隨機(jī)生成,故而運(yùn)行方式差異不會(huì)太大但無(wú)法保證完全一致,因此選擇了實(shí)際值較為接近的場(chǎng)景來(lái)進(jìn)行性能比較。
表1 單輸出模型與多輸出模型結(jié)果Table 1 Result of single-output model and multi-output model
由表1 可知,XGBoost(單輸出)模型只能預(yù)測(cè)單個(gè)測(cè)量點(diǎn)的短路電流,λAPE在可接受范圍內(nèi);而多輸出模型預(yù)測(cè)的短路電流,因考慮各輸出間的相關(guān)性,λAPE較單輸出模型更低。以測(cè)量點(diǎn)①為例,MTRSXGBoost(多輸出)和MTRS-LightGBM(多輸出)模型比XGBoost(單輸出)模型的λAPE小,分別降低了80.7%和73.4%。此外,對(duì)于不同測(cè)量點(diǎn)的短路電流,使用不同基學(xué)習(xí)器模型時(shí)短路電流誤差情況略有不同。綜上所示,采用多輸出模型計(jì)算含IIDG 配電網(wǎng)短路電流不僅有效,且準(zhǔn)確性更高。
此外,某運(yùn)行方式下測(cè)量點(diǎn)①、②、③的三相短路電流相量如附錄A圖A1所示。由圖可見(jiàn),IIDG 的接入使得各支路穩(wěn)態(tài)電流的幅值不再顯式地滿足基爾霍夫電流定律,但相量依然滿足基爾霍夫電流定律。
下面對(duì)基于問(wèn)題轉(zhuǎn)化方法和算法適應(yīng)方法的2類多輸出模型的性能進(jìn)行對(duì)比,同時(shí)對(duì)比式(8)和式(9)所示的輸入特征對(duì)計(jì)算性能的影響,結(jié)果如表2所示。表中:訓(xùn)練時(shí)間為完成模型訓(xùn)練的時(shí)間;測(cè)試時(shí)間為完成2000組測(cè)試的總耗時(shí);加粗?jǐn)?shù)值表示每種多輸出模型下的性能最優(yōu)項(xiàng)。對(duì)表2 進(jìn)行分析可得到下列結(jié)論。
表2 不同多輸出模型、不同基學(xué)習(xí)器、不同輸入特征的性能對(duì)比Table 2 Performance comparison of different multi-output models,base learners and input characteristics
1)6 種模型和2 種輸入特征均取得了較好的性能;δMAX、δMEAN、λMAX和λMEAN均在可接受范圍內(nèi);最長(zhǎng)測(cè)試時(shí)間為11.750 62 s,即最長(zhǎng)平均測(cè)試時(shí)間約為5.875 ms,而單輸出模型的平均預(yù)測(cè)時(shí)間為0.049 s[11],因此多輸出模型預(yù)測(cè)速度快,約為單輸出模型的8.4倍。
2)對(duì)比同一種多輸出模型使用不同輸入特征的計(jì)算性能可知,6 種模型選用式(8)所示的輸入特征時(shí),其MAPE 指標(biāo)優(yōu)于選用式(9)所示的輸入特征時(shí)的MAPE 指標(biāo);采用問(wèn)題轉(zhuǎn)化方法時(shí),多輸出模型的MAE 比較接近,而采用基于神經(jīng)網(wǎng)絡(luò)的算法適應(yīng)方法時(shí),多輸出模型的MAE 有一定差異,且選用式(8)、(9)所示的輸入特征均有可能獲得相對(duì)較優(yōu)的結(jié)果。因此,2 類輸入特征對(duì)多輸出模型的準(zhǔn)確度影響不大,在尚未普及μPMU 配置時(shí),可以使用式(9)所示的輸入特征。
3)在問(wèn)題轉(zhuǎn)化方法中,2 種基學(xué)習(xí)器的性能在準(zhǔn)確度方面差異并不大,但是在速度卻有快慢之分。采用MTRS 方法時(shí),在相同的輸入特征下,LightGBM的速度快于XGBoost,這證明在輸入特征變動(dòng)不頻繁的情況下,LightGBM 速度更快,但也因?yàn)镋FB 特性導(dǎo)致與XGBoost 的速度并沒(méi)有明顯的區(qū)分。采用RC 方法時(shí),EFB 特性反而成為了LightGBM 提升速度的障礙。
4)對(duì)比同一種輸入特征下不同多輸出模型的性能可以發(fā)現(xiàn):2 類問(wèn)題轉(zhuǎn)化方法中,XGBoost 基學(xué)習(xí)器的誤差略小于LightGBM 基學(xué)習(xí)器,計(jì)算速度方面更多地取決于所采用的問(wèn)題轉(zhuǎn)化方法,應(yīng)用時(shí)RC方法明顯快于MTRS 方法;算法適應(yīng)方法中,ANN 比CNN 有更低的誤差,而計(jì)算速度不如CNN,上述結(jié)論與理論分析一致。算法適應(yīng)方法的準(zhǔn)確度不如問(wèn)題轉(zhuǎn)化方法,但應(yīng)用速度快于問(wèn)題轉(zhuǎn)化方法。綜上,針對(duì)含IIDG 配電網(wǎng)短路電流計(jì)算問(wèn)題,采用問(wèn)題轉(zhuǎn)化方法的準(zhǔn)確性都非常高,計(jì)算速度最快的是選用XGBoost 基學(xué)習(xí)器的RC 方法。而神經(jīng)網(wǎng)絡(luò)多輸出方法適用于對(duì)準(zhǔn)確性要求一般,而對(duì)應(yīng)用速度要求極高的場(chǎng)合。此外,選取測(cè)量點(diǎn)①、②、③處的A 相電流的真實(shí)值與不同算法輸出進(jìn)行對(duì)比,結(jié)果見(jiàn)附錄A圖A2。由圖可見(jiàn),故障線路上基于ANN和CNN的短路電流預(yù)測(cè)值偏差較為明顯,其他差異不太明顯。
在實(shí)際應(yīng)用時(shí),數(shù)據(jù)采集過(guò)程可能出現(xiàn)部分特征數(shù)據(jù)丟失的情況。選用表2 中綜合性能較優(yōu)的方法,即分別使用MTRS、RC 拼合的XGBoost 算法和ANN 多輸出算法,輸入特征選用式(8),數(shù)據(jù)丟失以隨機(jī)置0 的方式表示。3 種模型在不同數(shù)據(jù)丟失比例rloss下的性能表現(xiàn)如表3 和附錄A 圖A3 所示,表3中加粗?jǐn)?shù)值為較小誤差數(shù)據(jù)。
表3 表明:在丟失1%的數(shù)據(jù)量時(shí),3 種模型的誤差均較小,當(dāng)丟失數(shù)據(jù)量大于等于3%時(shí),ANN 多輸出模型的誤差增大,準(zhǔn)確性明顯降低;使用問(wèn)題轉(zhuǎn)化的多輸出模型在丟失5%、10%的數(shù)據(jù)量情況下仍能保持較優(yōu)的性能,其中MTRS 模型誤差略優(yōu)于RC模型。
表3 不同數(shù)據(jù)丟失比例下多輸出模型的性能對(duì)比Table 3 Performance comparison among multi-output models with different rates of data loss
圖A3 為數(shù)據(jù)丟失比例高于10%的情況下,不同多輸出模型的λMEAN。由圖可見(jiàn):當(dāng)數(shù)據(jù)丟失比例在30%以下時(shí),MTRS-XGBoost 模型和RC-XGBoost模型的λMEAN均較??;當(dāng)數(shù)據(jù)丟失比例超過(guò)30%后,MTRS-XGBoost 模型和RC-XGBoost 模型的λMEAN快速上升;當(dāng)數(shù)據(jù)丟失比例為60%時(shí),MTRS-XGBoost模型和RC-XGBoost模型λMEAN與ANN 多輸出模型相近。由此可知,當(dāng)數(shù)據(jù)少量丟失的情況下,MTRS 和RC 方法均具有較好的抗干擾能力,當(dāng)數(shù)據(jù)丟失比例較高時(shí),2 種方法的誤差隨數(shù)據(jù)丟失比例的升高而快速增大。
含IIDG 配電網(wǎng)發(fā)生短路故障時(shí),IIDG 的輸出具有較強(qiáng)非線性特征,使得短路電流的迭代計(jì)算耗時(shí)增長(zhǎng),而采用簡(jiǎn)化模型又影響計(jì)算的準(zhǔn)確性。在IIDG 高占比接入配電網(wǎng)的發(fā)展趨勢(shì)下,本文提出了數(shù)據(jù)驅(qū)動(dòng)的含IIDG 配電網(wǎng)短路電流計(jì)算多輸出模型,解決了計(jì)算準(zhǔn)確性與計(jì)算速度之間的矛盾,得到如下結(jié)論。
1)針對(duì)含IIDG 配電網(wǎng)短路電流計(jì)算,選用多輸出模型,不僅解決了單輸出模型的模型數(shù)量過(guò)多的問(wèn)題,且具有更高的準(zhǔn)確性和更快的計(jì)算速度,例如采用MTRS-XGBoost 模型時(shí)λAPE降低了80.7%,最長(zhǎng)測(cè)試時(shí)間下也比單輸出模型快8.4倍,因此本文所提出多輸出模型能滿足在線應(yīng)用要求。
2)無(wú)論在常規(guī)的配電網(wǎng)數(shù)據(jù)采集條件,還是配置有μPMU 的條件下,都可以滿足所提多輸出模型的輸入特征條件;即使在輸入數(shù)據(jù)丟失30%的情況下,λMEAN仍能達(dá)到小于5%的要求。
3)相比較而言,基于MTRS 方法的多輸出模型具有準(zhǔn)確性高和抗干擾能力強(qiáng)的優(yōu)點(diǎn),雖然計(jì)算速度不及其他多輸出模型,但也遠(yuǎn)快于單輸出模型和物理建模計(jì)算速度。RC 方法的準(zhǔn)確性和抗干擾性能力與MTRS方法相近,但計(jì)算速度較MTRS方法快1 個(gè)數(shù)量級(jí),是較為穩(wěn)定的多輸出方法。使用神經(jīng)網(wǎng)絡(luò)的算法適應(yīng)方法具有最快的應(yīng)用速度,但是其準(zhǔn)確度相對(duì)略低,適用于對(duì)計(jì)算快速性要求極高的場(chǎng)景。
附錄見(jiàn)本刊網(wǎng)絡(luò)版(http://www.epae.cn)。