考慮樣本類別不平衡的電網(wǎng)故障事件智能識別方法

2021-11-20 08:33衛(wèi)志農(nóng)石東明孫國強臧海祥沈培鋒

電力自動化設(shè)備 2021年11期

衛(wèi)志農(nóng)，石東明，張明，孫國強，臧海祥，沈培鋒

（1. 河海大學(xué) 能源與電氣學(xué)院，江蘇南京 211100；2. 國網(wǎng)江蘇省電力有限公司南京供電分公司，江蘇南京 210019）

0 引言

電網(wǎng)運行狀態(tài)異?；虬l(fā)生故障時，監(jiān)控系統(tǒng)將產(chǎn)生大量中文文本形式的告警信息。調(diào)度人員難以快速準(zhǔn)確判別對應(yīng)的事件類型，而基于人工智能的故障診斷技術(shù)能通過對監(jiān)控信息的推理分析實現(xiàn)故障事件的自主識別［1］，有效縮短異常事件判別時間，并提升后續(xù)事件處理效率，提高電網(wǎng)運行管理水平。

自然語言處理技術(shù)和機器學(xué)習(xí)的深入應(yīng)用使計算機能夠?qū)W習(xí)數(shù)字化表達(dá)后的告警信息，并挖掘海量數(shù)據(jù)中的特征，從而使電網(wǎng)智能告警逐漸擺脫對人工經(jīng)驗的依賴［2］。同時，深度學(xué)習(xí)作為機器學(xué)習(xí)的重要分支，通過擴展神經(jīng)元層的方式構(gòu)建更為深層的神經(jīng)網(wǎng)絡(luò)，可以深入挖掘輸入的電力數(shù)據(jù)中的隱含關(guān)鍵特征。文獻(xiàn)［3］構(gòu)建了基于卷積神經(jīng)網(wǎng)絡(luò)CNN（Convolution Neural Network）的電網(wǎng)假數(shù)據(jù)注入攻擊檢測模型；文獻(xiàn)［4］利用雙向長短期記憶網(wǎng)絡(luò)Bi-LSTM（Bidirectional Long-Short-Term Memory network）建立了底層量測數(shù)據(jù)與電力系統(tǒng)暫態(tài)穩(wěn)定類別之間的非線性映射關(guān)系。上述深度學(xué)習(xí)模型具有較好的泛化能力，但需要足量樣本支撐模型訓(xùn)練。電網(wǎng)中不同設(shè)備故障發(fā)生率存在差異，導(dǎo)致部分故障樣本量偏少，因此歷史故障樣本中存在類別不均衡現(xiàn)象，不利于智能診斷系統(tǒng)的模型訓(xùn)練與參數(shù)學(xué)習(xí)過程，影響事件識別結(jié)果。

目前，關(guān)于不平衡數(shù)據(jù)集的處理方法主要分為數(shù)據(jù)預(yù)處理法和分類法2 種。數(shù)據(jù)預(yù)處理法通過合成或丟棄一定數(shù)量樣本，降低各類別樣本量的差距，如單一的欠采樣、過采樣［5-6］，以及結(jié)合2種方法的混合采樣［7］，該類方法改變了數(shù)據(jù)分布，一定程度上破壞了樣本特征信息。分類法能夠保留樣本全部初始信息，包括代價敏感學(xué)習(xí)和集成學(xué)習(xí)。代價敏感學(xué)習(xí)通過引入代價敏感因子，增大模型訓(xùn)練過程中對少類別樣本的錯分代價，從而提高該類別樣本的分類可靠性。文獻(xiàn)［8］直接將錯分代價嵌入神經(jīng)網(wǎng)絡(luò)，以降低各類別樣本的平均錯分代價；文獻(xiàn)［9］提出了一種基于代價敏感學(xué)習(xí)的決策樹剪枝方法，在剪枝階段引入代價敏感的思想，使模型總損失值達(dá)到最??；文獻(xiàn)［10］通過對不同類別設(shè)置不同的代價因子，得到總代價最小的支持向量機SVM（Support Vector Machine）分類器，文獻(xiàn)［11］在此基礎(chǔ)上，將SVM 核函數(shù)作為選取特征的標(biāo)準(zhǔn)，進(jìn)一步提高了SVM算法對不平衡數(shù)據(jù)的分類準(zhǔn)確率。上述方法在改善對少類別樣本分類效果的同時，會影響多類別樣本的判別結(jié)果，不能有效提升模型的整體性能。集成學(xué)習(xí)可以將多個子分類模型（下文簡稱子模型）進(jìn)行融合，從而得到一個整體性能較好的分類器。Boosting、Bagging 和Stacking 算法［12-13］通過不同方式實現(xiàn)模型融合，但只適用于弱分類器。模型融合是一種整合多個強分類器的集成學(xué)習(xí)方法，目前常用的有最大值法、均值法、求和法等［14］，此類方法根據(jù)子模型計算出的各類別后驗概率或結(jié)果標(biāo)簽，采用特定公式進(jìn)行模型融合。但這種對各類別樣本分類結(jié)果進(jìn)行無差別融合的方法，原理較為簡單，無法整合子模型的優(yōu)勢。

針對上述方法的特點、局限性，本文以Bi-LSTM為基礎(chǔ)分類器，提出一種基于代價敏感學(xué)習(xí)和模型自適應(yīng)選擇融合的多分類問題處理方法，在提高少類別樣本的分類精度的同時，保持對多類別樣本的準(zhǔn)確分類。針對某市電網(wǎng)公司調(diào)度中心的告警信息的測試結(jié)果表明，本文方法對于各類故障均具有良好的判別結(jié)果，進(jìn)一步驗證了其在電網(wǎng)故障事件識別中的優(yōu)越性和可靠性。

1 Bi-LSTM原理

CNN 和循環(huán)神經(jīng)網(wǎng)絡(luò)RNN（Recurrent Neural Network）是目前應(yīng)用最為成熟、廣泛的2種深度學(xué)習(xí)模型。RNN 考慮輸入信息中的序列特征，擅長處理時序信息，Bi-LSTM 通過改進(jìn)RNN，解決了RNN 模型訓(xùn)練中梯度消失與梯度爆炸的問題，并結(jié)合當(dāng)前輸入前、后時刻的隱含信息，進(jìn)一步提高了RNN 對時序信息的挖掘能力。因此本文采用Bi-LSTM 作為基礎(chǔ)分類器，完成對內(nèi)部具有自然時序關(guān)系的電網(wǎng)告警信息的處理。

Bi-LSTM 的結(jié)構(gòu)單元包含輸入、長短期記憶網(wǎng)絡(luò)LSTM（Long Short Term Memory network）鏈、輸出3 個部分，其中LSTM 鏈由2 個反向LSTM 拼接而成，該網(wǎng)絡(luò)結(jié)構(gòu)包括輸入門、遺忘門、記憶單元和輸出門，具體結(jié)構(gòu)見附錄A圖A1。

輸入門對當(dāng)前時刻的網(wǎng)絡(luò)輸入信息進(jìn)行控制，通過Sigmoid 神經(jīng)網(wǎng)絡(luò)層和tanh 層計算當(dāng)前輸入中保存到記憶單元的信息，如式（1）、（2）所示。

式中：it、C?t分別為t時刻（當(dāng)前時刻）輸入門、臨時記憶單元的狀態(tài)；Wi、Wc分別為輸入門、臨時記憶單元的權(quán)值矩陣；ht-1、xt分別為t-1 時刻（前一時刻）隱含層的輸入、t時刻的輸入；bi、bc分別為輸入門、臨時記憶單元的偏置；σ(?)為Sigmoid激活函數(shù)。

遺忘門保存長期重要信息，按式（3）計算t-1 時刻隱含層中能夠保留在當(dāng)前時刻記憶單元的信息。

式中：ft為t時刻遺忘門的狀態(tài)；Wf、bf分別為遺忘門的權(quán)值矩陣和偏置。

遺忘門保留序列數(shù)據(jù)的長期重要信息，輸入門臨時記憶單元使得當(dāng)前時刻的無用信息不進(jìn)入記憶單元，兩者按式（4）共同決定記憶單元保存的信息。

式中：Ct、Ct-1分別為t時刻和t-1 時刻記憶單元的輸出值；⊙表示按元素相乘。

輸出門由當(dāng)前時刻的輸入、記憶單元和前一時刻的隱含層確定。

式中：Ot、ht分別為t時刻輸出門、LSTM 的輸出；Wo、bo分別為輸出門的權(quán)值矩陣和偏置。

Bi-LSTM 結(jié)合2 個時序相反的LSTM，構(gòu)成了結(jié)構(gòu)單元中的LSTM 鏈，能夠同時獲取當(dāng)前輸入前、后時刻的特征信息，其單元結(jié)構(gòu)見附錄A圖A2。

Ht經(jīng)過激活函數(shù)運算后即可得到樣本屬于各類別的概率，默認(rèn)取概率最大的類別作為計算結(jié)果。

2 基于代價敏感學(xué)習(xí)和模型自適應(yīng)選擇融合的電網(wǎng)故障識別方法

電網(wǎng)告警信息為中文文本形式，此類非結(jié)構(gòu)化的文本數(shù)據(jù)需要轉(zhuǎn)化為結(jié)構(gòu)化的數(shù)字表達(dá)，才能輸入Bi-LSTM 模型訓(xùn)練學(xué)習(xí)。本文采用Word2vec 模型訓(xùn)練得到告警數(shù)據(jù)的分布式向量。Word2vec 是一款由谷歌于2013 年公開開源的詞向量計算工具［15］，其基本思想是通過神經(jīng)網(wǎng)絡(luò)將每個詞映射成固定維數(shù)的實數(shù)向量，所有向量構(gòu)成蘊含語義信息的詞向量空間，不同詞向量在該空間中的距離可以表征詞語之間的語義相似性。詞向量訓(xùn)練完成后，計算單條告警信息中所有詞向量的平均值，得到固定維數(shù)的故障樣本句向量。

2.1 方法流程

傳統(tǒng)Bi-LSTM 模型更趨向于將樣本判為訓(xùn)練集數(shù)量多的類別，以減小損失值。本節(jié)提出一種基于代價敏感學(xué)習(xí)和模型自適應(yīng)選擇融合的電網(wǎng)故障事件識別方法，其能夠顯著降低樣本類別不均衡對電網(wǎng)故障事件識別結(jié)果的影響。電網(wǎng)故障事件識別的流程如附錄A圖A3所示，具體步驟如下：

1）利用Word2vec 模型將分詞后的電網(wǎng)告警信息轉(zhuǎn)化為高維向量，并求均值得到告警數(shù)據(jù)句向量，向量維度設(shè)置為300，向量化過程如圖1所示；

圖1 電網(wǎng)告警信息向量化過程Fig.1 Vectorization process of power grid warning information

2）構(gòu)建傳統(tǒng)深度學(xué)習(xí)模型，即采用交叉熵?fù)p失函數(shù)的Bi-LSTM，輸入故障樣本進(jìn)行監(jiān)督訓(xùn)練并調(diào)參，得到對大樣本故障類別具有較好識別率的子模型1；

3）自定義一個多分類代價敏感損失函數(shù)，代替模型1 中的交叉熵?fù)p失函數(shù)，增大模型訓(xùn)練過程中對小樣本的錯分代價，其余過程同步驟2），得到能夠準(zhǔn)確識別小樣本故障的子模型2；

4）將每例故障樣本輸入子模型1、2 進(jìn)行判別后，采用模型自適應(yīng)選擇融合方法對判別結(jié)果進(jìn)行融合，得到最終的故障事件識別結(jié)果并輸出。

2.2 多分類代價敏感損失函數(shù)

傳統(tǒng)的損失函數(shù)對所有類別的樣本設(shè)置相同的錯分權(quán)重，因此少類別樣本的損失易被淹沒。本文基于Lin Tsung-yi 等人提出的焦點損失函數(shù)［16］，構(gòu)建適用于多分類問題的代價敏感損失函數(shù)γFL，如式（8）所示。

式中：m和n分別為樣本類別數(shù)和樣本總數(shù)；yij和pij分別為樣本i屬于類別j的真實概率和預(yù)測概率；β∈[0，1]，為調(diào) 制因子；L為交叉熵損失函數(shù)；αj∈[0，1]，為權(quán)重因子，能夠區(qū)分不同類別樣本的錯分代價，樣本量越大，該類別樣本的錯分代價越小，否則錯分代價越大；Nj為屬于類別j的樣本的數(shù)量。

γFL由兩部分組成，第一部分為傳統(tǒng)交叉熵?fù)p失函數(shù)L，第二部分為考慮類別不平衡影響的代價敏感損失值計算。通過調(diào)制因子β調(diào)節(jié)兩者權(quán)重，β越小，第二部分占比越大，γFL對各類別樣本的區(qū)分程度越高。作為一種代價敏感損失函數(shù)，γFL通過對各類別樣本設(shè)置不同的權(quán)重因子，提高對少類別樣本的錯分代價，從而提高該類樣本的分類準(zhǔn)確性。

2.3 模型自適應(yīng)選擇融合方法

訓(xùn)練樣本不平衡度較大時，γFL中少類別樣本的錯分代價過大，破壞了模型對多類別樣本的分類效果。本節(jié)提出一種綜合考慮召回率與準(zhǔn)確率的模型自適應(yīng)選擇融合方法，在代價敏感學(xué)習(xí)的基礎(chǔ)上進(jìn)一步改善模型的整體分類性能。該方法首先以樣本類別為出發(fā)點，選擇召回率大的子模型代表該類別樣本的分類標(biāo)準(zhǔn)，使得模型融合后能夠盡可能全面地識別出此類別樣本；再結(jié)合子模型對各類別樣本的分類準(zhǔn)確率，推理得到最終的判別結(jié)果，從而降低模型融合后的整體誤判率。該方法的流程圖見附錄B 圖B1。以樣本總數(shù)為n、樣本類別為m、子模型個數(shù)為2為例，模型融合的具體過程如下。

1）計算子模型k（k=1，2）對類別j（j=1，2，…，m）樣本的分類召回率Rkj，如式（11）所示。對于每個樣本類別，選擇分類召回率大的子模型作為分類基準(zhǔn)，由此設(shè)定各類別的融合標(biāo)簽σj，如式（12）所示。

式中：fk(xi)為子模型k對樣本xi的預(yù)測標(biāo)簽；yi為樣本xi的真實標(biāo)簽；I（·）為邏輯判斷，括號內(nèi)表達(dá)式成立時取1，否則取0。

2）對于類別j樣本，結(jié)合σj取該類別樣本分類召回率較大的子模型，按照式（13）計算類別j樣本的分類準(zhǔn)確率，將其作為準(zhǔn)確率矩陣Δ的第j個元素，由此得到按分類召回率大小篩選出的準(zhǔn)確率矩陣Δ如式（14）所示。

式中：Pkj為子模型k對類別j樣本的分類準(zhǔn)確率；Pσj j為結(jié)合σj選取的召回率較大的子模型對類別j樣本的分類準(zhǔn)確率。

3）根據(jù)子模型分類結(jié)果，按照式（15）設(shè)置各樣本的融合標(biāo)簽。

式中：ωij為樣本xi對類別j的融合標(biāo)簽；fσj(xi)為結(jié)合σj選取的召回率較大的子模型對樣本xi的分類結(jié)果。

σj由式（15）計算得到，反映了能夠代表類別j樣本分類結(jié)果的子模型標(biāo)簽，若該標(biāo)簽對應(yīng)的子模型對樣本xi的分類結(jié)果與類別j一致，則將xi對類別j的融合標(biāo)簽設(shè)置為1，否則為0。在此基礎(chǔ)上按照式（16）計算融合后樣本xi屬于各類別的后驗概率。

式中：Πi為由后驗概率組成的矩陣，其第j列表示樣本xi屬于類別j的概率。Πi中最大值對應(yīng)的列索引即模型融合的輸出類別標(biāo)簽。Πi=0 時，取分類效果較好的子模型的分類標(biāo)簽作為輸出結(jié)果（默認(rèn)為子模型1）。模型融合后的輸出結(jié)果表達(dá)式為：

式中：max(Πi)為Πi中的最大值。

模型自適應(yīng)選擇融合方法依次考察子模型的召回率與準(zhǔn)確率指標(biāo)，在分析子模型分類性能的基礎(chǔ)上進(jìn)行決策，整合各子模型的分類優(yōu)勢，得到最終的輸出結(jié)果，實現(xiàn)了模型的選擇性融合與信息互補，同時可推廣應(yīng)用于2個以上子模型參與融合的場景。

3 算例分析

為驗證本文方法有效性，選取某市電網(wǎng)調(diào)度中心2016、2017 年的歷史告警信息進(jìn)行算例分析。首先根據(jù)工程需要，確定了若干種需要調(diào)控人員第一時間重點關(guān)注的異常跳閘類事件，然后以帶關(guān)鍵詞“分閘”的告警信息為標(biāo)志，提取該信息前后一段時間窗內(nèi)的離散告警信息集合，當(dāng)滿足一定規(guī)則時，構(gòu)成各類標(biāo)簽化事件樣本。從中提取9 種重要故障事件對應(yīng)的樣本，共得到13 554 例故障事件樣本。從每類故障事件樣本中隨機選取25 例作為測試集，其余作為訓(xùn)練集，并在訓(xùn)練過程中隨機抽取訓(xùn)練集中5%的樣本作為驗證樣本，以優(yōu)化模型參數(shù)。每組實驗取10 次測試結(jié)果的平均值作為參考標(biāo)準(zhǔn)。故障事件樣本分布情況如表1所示。

表1 故障事件樣本數(shù)量統(tǒng)計Table 1 Number statistics of fault event samples

分類模型常用的評價指標(biāo)有召回率、準(zhǔn)確率、F1值。召回率、準(zhǔn)確率計算公式分別見式（11）、（13），子模型k屬于類別j樣本的F1值的計算公式為：

F1 值是一種綜合考量準(zhǔn)確率與召回率的綜合評價指標(biāo)，通常F1 值越大，模型的分類性能越好。對于多分類模型，取所有類別的F1 值的期望作為該模型的整體F1值指標(biāo)。經(jīng)過測試對比，Word2vec 模型和Bi-LSTM 模型的參數(shù)設(shè)置情況分別見附錄C表C1、C2。

3.1 基礎(chǔ)分類器性能驗證

為了驗證Bi-LSTM 在電網(wǎng)故障事件識別中的優(yōu)越性，設(shè)置3組對比實驗，分別采用以CNN、LSTM以及結(jié)合CNN 與注意力（Attention）機制的組合深度學(xué)習(xí)模型Attention-CNN 作為基礎(chǔ)分類器。其中CNN 設(shè)置3 種卷積窗口，尺寸分別為3、4、5，每種窗口的卷積核數(shù)目為100，采用ReLU 激活函數(shù)，其他所需參數(shù)同附錄C 表C2；LSTM 的參數(shù)同附錄C 表C2。以不同深度學(xué)習(xí)模型作為基礎(chǔ)分類器，對算例進(jìn)行實驗對比，得到準(zhǔn)確率、召回率、F1值3種評價指標(biāo)，結(jié)果如圖2所示。

圖2 深度學(xué)習(xí)模型的評價指標(biāo)對比Fig.2 Comparison of evaluation indexes among deep learning models

由圖2 可以看出：CNN 雖然具有局部感知能力強的特點，能夠很好地處理圖像信息，但在處理時序信息時效果欠佳；Attention-CNN 在CNN 的基礎(chǔ)上引入注意力機制，能夠強化局部告警信息中蘊含的關(guān)鍵特征權(quán)重，以優(yōu)化模型對不同的告警事件的特征提取，但依然無法捕捉時序關(guān)聯(lián)特征，導(dǎo)致模型總體性能提升不大；LSTM 擅長處理時序信息，電網(wǎng)告警信息屬于時間相關(guān)的數(shù)據(jù)，因此分類效果比CNN 更好；Bi-LSTM 模型的準(zhǔn)確率、召回率與F1 值均最大，進(jìn)一步體現(xiàn)了Bi-LSTM 基于LSTM 進(jìn)行的改進(jìn)能夠考慮當(dāng)前輸入的前、后時刻的信息，優(yōu)化分類效果，作為基礎(chǔ)分類器的性能優(yōu)于其他3 種對比模型。后續(xù)實驗均以Bi-LSTM模型作為基礎(chǔ)分類器。

3.2 模型融合方法性能驗證

子模型1采用交叉熵?fù)p失函數(shù)，子模型2采用由式（8）構(gòu)建的代價敏感損失函數(shù)（β=0.1）。為對比本文的模型自適應(yīng)選擇融合方法（簡稱選擇法）的實用性，分別利用最值法、求和法對子模型進(jìn)行融合。對于每個樣本，最值法取各子模型中最大后驗概率對應(yīng)的類別標(biāo)簽作為融合結(jié)果；均值法計算所有子模型后驗概率的均值，得到融合后的后驗概率，并將最大概率對應(yīng)的類別標(biāo)簽作為最終輸出結(jié)果。子模型與不同模型融合方法的分類召回率如表2 所示，整體評價指標(biāo)對比如圖3所示。

圖3 子模型與模型融合方法的評價指標(biāo)對比Fig.3 Comparison of evaluation indexes among submodels and model fusion methods

表2 子模型與融合算法的分類召回率Table 2 Classification recall rate of submodels and fusion methods

對表2、圖3進(jìn)行分析后可得到如下結(jié)論。

1）由表2 可見：由于訓(xùn)練樣本類別的不平衡，子模型1 對樣本量較大的故障事件的識別效果更好，而對樣本量小的故障事件的識別效果較差，其中對類別9 樣本的分類召回率僅為69.74%；由于樣本類別不平衡度極大，子模型2 中樣本量大的故障事件的權(quán)重因子很小，因此對多類別樣本的召回率顯著降低，其中對類別1—3 樣本的分類召回率分別為53.87%、69.21%、52.34%；而對少類別樣本的召回率明顯提高，對類別9樣本的分類召回率增至95.68%。

2）結(jié)合表2 和圖3 可以看出：最值法、求和法單純從子模型預(yù)測的后驗概率出發(fā)，不能對子模型的性能進(jìn)行分析，因此無法有效結(jié)合各子模型學(xué)習(xí)到的信息，導(dǎo)致整體分類結(jié)果無明顯改善；模型自適應(yīng)選擇融合方法，綜合考慮了子模型的召回率與準(zhǔn)確率指標(biāo)，對于每個樣本均能夠靈活地選擇子模型的預(yù)測結(jié)果，從而保留子模型的優(yōu)勢性能，實現(xiàn)信息互補，在保證多類別樣本的分類效果的同時，有效增強了對少類別樣本的識別能力，準(zhǔn)確率、召回率、F1 值相比子模型均有進(jìn)一步的提升，分別達(dá)到了95.97%、95.78%、95.74%。

3.3 整體性能驗證

使用基于Python 的imblearn 工具包設(shè)置4 組實驗，對比分析本文方法在整體性能上的優(yōu)越性與可靠性。在進(jìn)行模型訓(xùn)練前，4 組實驗分別采用少數(shù)類別樣本合成技術(shù)SMOTE（Synthetic Minority Oversampling TEchnique）［17］、Borderline-SMOTE方法（kind=‘borderline-1’）［18］、SMOTE 與編輯最近鄰混合采樣方法（SMOTE-ENN）［19］和SMOTE-Tomek［20］混合采樣方法按默認(rèn)參數(shù)處理訓(xùn)練樣本，依次記為方法1—4。4種對比方法與本文算法的分類召回率見表3，整體評價指標(biāo)對比見圖4。

表3 對比方法和本文方法的分類召回率Table 3 Classification recall rate of comparison methods and proposed method

圖4 對比方法和本文方法的評價指標(biāo)對比Fig.4 Comparison of evaluation indexes among comparison methods and proposed method

綜合表3和圖4可以看出：

1）與其他考慮樣本類別不平衡的對比方法相比，本文方法的3種評價指標(biāo)均為最大，達(dá)到了95%以上，對各類故障事件的分類召回率也均在90%以上；

2）對于樣本類別不平衡度較大的數(shù)據(jù)集，過采樣算法易合成噪點數(shù)據(jù)，破壞樣本分布信息；混合采樣算法中欠采樣的引入會丟失部分樣本特征，破壞模型對多數(shù)類樣本的識別效果；

3）本文方法不改變樣本初始分布，保留全部特征信息，在提高少數(shù)類樣本的分類召回率的同時，有效維持了多數(shù)類樣本的分類召回率并提高了其分類準(zhǔn)確率，因此整體故障識別效果得到了顯著提高。

4 工程實際應(yīng)用

以2018 年8 月17 日“溫比亞”臺風(fēng)過境當(dāng)天所截取的某信息密集時段內(nèi)監(jiān)控信息作為對象，驗證本文方法的實際應(yīng)用效果。

當(dāng)天13:27—13:31 時段共產(chǎn)生了4 146 條告警信息，系統(tǒng)從告警信息中提取出7 項事故跳閘事件，并通過本文方法在0.5 s 內(nèi)得到故障事件識別結(jié)果，包括線路單相瞬時故障、單相永久故障、相間故障以及一項歷史樣本極少的母線故障實例，經(jīng)過驗證，識別結(jié)果均正確，其中母線故障事件識別結(jié)果如表4所示。雖然在線應(yīng)用樣本量少，但是本文方法表現(xiàn)出較高的識別準(zhǔn)確率，并正確識別出一項發(fā)生概率極低的母線故障事件，具有良好的工程應(yīng)用價值。

表4 母線故障實例識別結(jié)果Table 4 Recognition result of instance of bus fault

5 結(jié)論

本文針對電網(wǎng)故障事件中的樣本類別不平衡現(xiàn)象，提出一種基于代價敏感學(xué)習(xí)和模型自適應(yīng)選擇融合的多分類問題處理方法，實現(xiàn)了電網(wǎng)告警事件的智能識別?；趯δ呈须娋W(wǎng)公司調(diào)度中心告警歷史信息的實驗測試，所得結(jié)論如下：

1）通過本文構(gòu)建的多分類代價敏感損失函數(shù)，在損失函數(shù)中引入代價敏感因子，增大了少數(shù)類電網(wǎng)故障事件的錯分代價，優(yōu)化模型對該類樣本的特征學(xué)習(xí)能力，從而改善模型對少數(shù)類電網(wǎng)故障事件的識別性能；

2）綜合考慮召回率與準(zhǔn)確率的模型自適應(yīng)選擇融合方法，對2 個具有不同性能特點的模型進(jìn)行融合，結(jié)合子模型的優(yōu)勢，實現(xiàn)了模型的信息集成與優(yōu)勢互補，在保留對多數(shù)類故障事件識別能力的基礎(chǔ)上，提高了少數(shù)類故障事件的識別率，得到整體效果更好的電網(wǎng)故障識別模型。

后續(xù)可考慮將規(guī)則推理方法與深度學(xué)習(xí)進(jìn)行深度結(jié)合，提高電網(wǎng)中人工智能模塊的可靠性，同時進(jìn)一步擴展可識別事件的類型。

附錄見本刊網(wǎng)絡(luò)版（http：//www.epae.cn）。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡