摘 要:針對(duì)輸電線路線路故障精度低的問(wèn)題,本文提出一種貝葉斯優(yōu)化隨機(jī)森林(Random Forest,RF)的輸電線路故障識(shí)別方法。通過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解提取故障特征,構(gòu)成特征集,采用貝葉斯優(yōu)化RF來(lái)挖掘特征集與短路故障類型之間的關(guān)系。結(jié)果表明,TPE-RF能快速優(yōu)化超參數(shù),提高診斷精度,避免過(guò)渡電阻、故障初始角的影響。
關(guān)鍵詞:輸電線路;故障識(shí)別;經(jīng)驗(yàn)?zāi)B(tài)分解;貝葉斯優(yōu)化;RF算法
中圖分類號(hào):TM 75" " " " " " " 文獻(xiàn)標(biāo)志碼:A
高壓輸電線路發(fā)生短路故障會(huì)對(duì)經(jīng)濟(jì)、工業(yè)生產(chǎn)和消費(fèi)用電等造成重大影響。因此,快速、準(zhǔn)確地辨識(shí)短路故障類型和發(fā)生故障的位置能夠加快故障線路檢修速度,減少故障帶來(lái)的經(jīng)濟(jì)損失[1-2]。
本文提出了一種基于貝葉斯優(yōu)化隨機(jī)森林的輸電線路故障識(shí)別方法(Tree-structured Parzen Estimator-Random Forest,
TPE-RF)。通過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)提取數(shù)據(jù),得到固有模態(tài)函數(shù)(Intrinsic Mode Function, IMF),提取樣本熵,構(gòu)成特征集。結(jié)合改進(jìn)的RF算法訓(xùn)練并測(cè)試特征樣本集,識(shí)別輸電線路短路故障具體類型。仿真結(jié)果表明,該方法可以高效識(shí)別輸電線路的短路故障類型。
1 特征提取
1.1 EMD
EMD是一種自適應(yīng)的信號(hào)處理方法,特別適合處理非平穩(wěn)和非線性的信號(hào)數(shù)據(jù)。通過(guò)EMD,可以將復(fù)雜的信號(hào)分解為1組IMF分量[3]。這些IMF分量能說(shuō)明信號(hào)的內(nèi)在結(jié)構(gòu)和動(dòng)態(tài)特性,并分析非線性、非穩(wěn)定的信號(hào)。當(dāng)處理復(fù)雜信號(hào)時(shí),這種分解方法優(yōu)勢(shì)突出,效果明顯,因此在許多領(lǐng)域都應(yīng)用廣泛。
1.2 樣本熵
樣本熵是一種度量信號(hào)復(fù)雜性的工具,能夠說(shuō)明信號(hào)序列的結(jié)構(gòu)[4]。使用樣本熵能夠更精確、高效地提取故障信號(hào)的特征信息,為后續(xù)的診斷和分析提供有力支持。
2 貝葉斯優(yōu)化的隨機(jī)森林模型
機(jī)器學(xué)習(xí)能夠充分挖掘非線性、混疊嚴(yán)重的故障信號(hào)的敏感特征,并剔除虛假特征,因此在國(guó)內(nèi)外輸電線路故障診斷領(lǐng)域逐漸成為研究熱點(diǎn)。
2.1 隨機(jī)森林
隨機(jī)森林是一種基于決策樹(shù)的集成學(xué)習(xí)算法,通過(guò)構(gòu)建多個(gè)決策樹(shù)并綜合它們的分類結(jié)果來(lái)分類[5]。與單一決策樹(shù)相比,隨機(jī)森林具有分類精度更高、穩(wěn)定性更好和抗噪聲能力更強(qiáng)等優(yōu)點(diǎn)。在訓(xùn)練過(guò)程中,隨機(jī)森林中的每個(gè)決策樹(shù)都是獨(dú)立構(gòu)建的,以增加模型的多樣性,降低過(guò)擬合風(fēng)險(xiǎn)。綜合多個(gè)決策樹(shù)的分類結(jié)果,利用隨機(jī)森林進(jìn)一步提高分類精度。隨機(jī)森林還保留了多值分類的特性,因此特別適合解決多值分類問(wèn)題。在隨機(jī)森林中的每個(gè)決策樹(shù)不是利用弱學(xué)習(xí)器來(lái)逐步提高模型的性能的,而是獨(dú)立構(gòu)建的,因此,與其他方法(例如 Boosting)相比,當(dāng)面對(duì)數(shù)據(jù)噪聲時(shí),隨機(jī)森林的穩(wěn)定性更好,其可以通過(guò)引入隨機(jī)性來(lái)避免過(guò)擬合問(wèn)題,并提高模型的泛化能力。綜上所述,隨機(jī)森林是一種強(qiáng)大而有效的分類器,適合處理多值分類問(wèn)題。
設(shè)原始訓(xùn)練集X={(x1,y1),(x2,y2),(xN,yN)},xm=[xm1,xm2,xmn]為第m個(gè)訓(xùn)練樣本,n為xm中特征值個(gè)數(shù),xm為訓(xùn)練樣本,ym為類別標(biāo)簽。利用Bootstrap方法從原始訓(xùn)練樣本集Xj(j=1,2,…n,)中隨機(jī)抽取多個(gè)訓(xùn)練樣本子集,構(gòu)建決策樹(shù)模型hj(x),獲得1組決策樹(shù)組成的分類器{h1(x),h2(x),h3(x),hj(x)}(j=1,2,…n)。當(dāng)測(cè)試樣本輸入訓(xùn)練好后的分類器時(shí),這組決策樹(shù)對(duì)樣本類別進(jìn)行投票,以確定其最終分類。通過(guò)這種方式,隨機(jī)森林整合多個(gè)決策樹(shù)的優(yōu)勢(shì),提高了分類的準(zhǔn)確性和穩(wěn)定性。其分類決策如公式(1)所示。
(1)
式中:hj(x)為第j棵決策樹(shù);I{·}為示性函數(shù),當(dāng)括號(hào)中的表達(dá)式滿足條件時(shí),其值為1,否則為0;y為樣本的類別標(biāo)簽;f(x)為第j棵決策樹(shù)的分類結(jié)果;n為決策輸個(gè)數(shù)。
2.2 貝葉斯優(yōu)化的隨機(jī)森林
在機(jī)器學(xué)習(xí)過(guò)程中,由于模型參數(shù)直接影響訓(xùn)練效果,因此參數(shù)設(shè)置十分重要,須在訓(xùn)練前設(shè)置RF的參數(shù),例如樹(shù)的最大深度、每個(gè)決策樹(shù)的最大葉子數(shù)量和學(xué)習(xí)率等。如果參數(shù)復(fù)雜,就會(huì)導(dǎo)致其可能的組合更多,人工調(diào)參更費(fèi)時(shí)、費(fèi)力且不一定能夠挖掘合適的組合,貝葉斯算法調(diào)參迭代次數(shù)少,速度快,能快速找到模型最佳參數(shù)組合。為了提高模型性能,本文采用貝葉斯算法。貝葉斯[6]算法流程執(zhí)行步驟如下。步驟一:設(shè)置待優(yōu)化參數(shù)范圍并初始化。為了保證算法穩(wěn)健、準(zhǔn)確,需要對(duì)RF的各參數(shù)設(shè)定一個(gè)合理的取值范圍。步驟二:估計(jì)概率密度,計(jì)算增益期望(Excepted Improvement,EI)。確定參數(shù)范圍后,估計(jì)概率密度。該步驟
的核心是通過(guò)采集函數(shù)來(lái)計(jì)算EI,EI反映參數(shù)組合的性能。步驟三:利用最佳參數(shù)組合訓(xùn)練預(yù)測(cè)模型。將EI值最大的參數(shù)組合輸入RF預(yù)測(cè)模型中進(jìn)行訓(xùn)練。步驟四:精度驗(yàn)證與算法迭代。步驟五:評(píng)估預(yù)測(cè)結(jié)果的精度是否滿足預(yù)期。如果滿足,算法就可以終止;如果不滿足,就需要返回步驟二重新開(kāi)始,直至找到滿足精度要求的最佳參數(shù)組合為止。
2.3 評(píng)價(jià)指標(biāo)
為了準(zhǔn)確評(píng)估模型的分類性能,本文采用準(zhǔn)確率(Accuracy)作為評(píng)價(jià)指標(biāo),計(jì)算過(guò)程如公式(2)所示。
(2)
式中:TP(真正)為將正類樣本預(yù)測(cè)為正類的數(shù)量;TN(真負(fù))為將負(fù)類樣本預(yù)測(cè)為負(fù)類的數(shù)量;FP(假正)為將負(fù)類樣本預(yù)測(cè)為正類的數(shù)量;FN(假負(fù))為將正類樣本預(yù)測(cè)為負(fù)類的數(shù)量。
公式(2)結(jié)果越接近1,模型的準(zhǔn)確度越高。
2.4 短路故障類型識(shí)別算法流程
TPE-RF故障類型識(shí)別方法包括以下4個(gè)執(zhí)行步驟。步驟一:收集原始數(shù)據(jù),為了方便計(jì)算,符合數(shù)據(jù)輸入的要求,預(yù)先對(duì)數(shù)據(jù)進(jìn)行歸一化處理。步驟二:通過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解,提取已歸一化數(shù)據(jù),計(jì)算樣本熵,構(gòu)成特征集,并按照一定比例分成訓(xùn)練集與測(cè)試集。步驟三:將訓(xùn)練集數(shù)據(jù)作為輸入,訓(xùn)練TPE-RF模型,使其能夠?qū)W習(xí)并識(shí)別數(shù)據(jù)中的模式和特征。步驟四:將測(cè)試集數(shù)據(jù)輸入已經(jīng)訓(xùn)練好的TPE-RF模型中,得到模型的識(shí)別結(jié)果。這個(gè)結(jié)果可以用于評(píng)估模型的性能和準(zhǔn)確度,進(jìn)一步優(yōu)化模型參數(shù)或結(jié)構(gòu)。
3 仿真分析
3.1 輸電線路案例
基于Simulink環(huán)境搭建輸電線路仿真模型,輸電線路結(jié)構(gòu)如圖1所示。正序參數(shù):電阻為1.648×10-2 Ω/km,電抗為1.348 mH/km,電容為8.68×10-3 μF/km。零序參數(shù):電阻為0.3 Ω/km,電感為3.639 mH/km,電容為6.166×10-3 μF/km。
本文從輸電線路仿真中選取過(guò)渡電阻、故障位置、故障類型和故障角度進(jìn)行故障仿真。故障參數(shù)設(shè)置見(jiàn)表1。
短路故障類型為單相接地短路故障、相間短路故障、兩相接地短路故障和三相接地短路故障,用標(biāo)簽識(shí)別不同類別的短路故障,類別標(biāo)簽見(jiàn)表2。
3.2 特征提取
在電力系統(tǒng)中,當(dāng)線路發(fā)生故障導(dǎo)致跳閘時(shí),會(huì)產(chǎn)生一系列電弧和各次諧波。本文采用EMD方法,深入分析線路兩端的電流波形。EMD能夠?qū)?fù)雜的電流波形分解為多個(gè)IMF分量,這有助于更細(xì)致地研究電流波形的特點(diǎn),準(zhǔn)確識(shí)別故障。在仿真試驗(yàn)部分,利用Simulink模型模擬瞬時(shí)性故障和永久性故障。為了保證研究的準(zhǔn)確性,選取從故障發(fā)生至合閘前的故障相電流作為分析的電流信號(hào)。在MATLAB軟件中,利用EMD分解這些信號(hào),得到多個(gè)IMF分量。
以故障相角差為15°的金屬性接地故障為例,當(dāng)故障點(diǎn)位于距離首段50%的位置時(shí),利用EMD深入分解瞬時(shí)性故障和永久性故障的電流信號(hào),結(jié)果如圖2所示。前7個(gè)IMF分量已經(jīng)包括原始數(shù)據(jù)的大部分信息。因此,以這7個(gè)IMF分量作為原始信號(hào)的代表,計(jì)算樣本熵,構(gòu)建特征集。采用該方法不僅提高了故障識(shí)別的準(zhǔn)確性,還為電力系統(tǒng)中的故障診斷提供一種有效的分析手段。
3.3 故障類型識(shí)別結(jié)果
本文提出TPE-RF模型,診斷結(jié)果如圖3所示。橫軸為測(cè)試樣本編號(hào),縱軸為故障對(duì)應(yīng)編號(hào),模型準(zhǔn)確率高達(dá)98.85%。
3.4 TPE-RF模型驗(yàn)證分析
為了驗(yàn)證TPE-RF故障識(shí)別模型的穩(wěn)定性,本節(jié)驗(yàn)證了4種類型的短路故障在不同過(guò)渡電阻和不同故障初始角狀態(tài)中的情況,驗(yàn)證結(jié)果見(jiàn)表3。
3.4.1 不同故障初始角驗(yàn)證分析
從表3可以看出,TPE-RF模型在各故障相角范圍內(nèi)均能準(zhǔn)確識(shí)別短路故障類型,這說(shuō)明TPE-RF模型的魯棒性較強(qiáng),能夠適應(yīng)不同的故障相角條件并識(shí)別故障類型。這個(gè)結(jié)果表明,當(dāng)處理輸電線路故障時(shí),TPE-RF模型能夠有效地克服故障相角的影響。
3.4.2 不同過(guò)渡電阻驗(yàn)證分析
不同過(guò)渡電阻測(cè)試集驗(yàn)證結(jié)果見(jiàn)表4,從表4可以看出,TPE-RF模型在各過(guò)渡電阻范圍內(nèi)均能準(zhǔn)確準(zhǔn)確識(shí)別短路故障類型。這表明TPE-RF模型具有較強(qiáng)的魯棒性,能夠適應(yīng)不同的過(guò)渡電阻條件并識(shí)別故障類型。這個(gè)結(jié)果表明,TPE-RF模型在處理輸電線路故障的過(guò)程中,能夠最大程度地減少過(guò)渡電阻的影響。
4 結(jié)論
本文提出了一種基于TPE-RF的輸電線路故障識(shí)別方法。該方法準(zhǔn)確率更高,達(dá)到98.85%。研究表明,基于TPE-RF的輸電線路故障識(shí)別模型對(duì)短路故障識(shí)別中的過(guò)渡電阻、初始故障角都有顯著影響,它適應(yīng)性良好,能夠準(zhǔn)確識(shí)別輸電線路短路故障的類型。
參考文獻(xiàn)
[1]宋國(guó)兵,陳哲鴻,侯俊杰,等.基于電荷量變化特征的高壓直流線路縱聯(lián)保護(hù)[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2020,32(10):9-16.
[2]費(fèi)春國(guó),霍洪雙.基于電流振幅與SVM的輸電線路故障分類[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2019,31(4):139-144.
[3]王仲平,何黎黎,丁更乾.基于EMD-LSTM-ARMA模型短期發(fā)電量組合預(yù)測(cè)[J].現(xiàn)代電子技術(shù),2023,46(3):151-155.
[4]蘇文勝,王奉濤,朱泓,等.基于小波包樣本熵的滾動(dòng)軸承故障特征提取[J].振動(dòng)測(cè)試與診斷,2011,31(2):5.
[5]楊杰,吳浩,董星星,等.基于電流故障分量特征和隨機(jī)森林的輸電線路故障類型識(shí)別[J].電力系統(tǒng)保護(hù)與控制,2021,49(13):53-63.
[6]杜茂康,張雪,肖玲,等.基于多目標(biāo)和貝葉斯優(yōu)化的短期負(fù)荷區(qū)間預(yù)測(cè)[J].國(guó)外電子測(cè)量技術(shù),2023,42(1):49-57.