基于改進XGBoost算法的XLPE電纜局部放電模式識別研究

2022-04-12 01:25劉維功王昊展時振堂黎德初胡學(xué)良李勁松

電測與儀表 2022年4期

劉維功，王昊展，時振堂，黎德初，胡學(xué)良，李勁松

(1. 中國石油化工股份有限公司大連石油化工研究院，遼寧大連 116045； 2. 大連理工大學(xué) 電氣工程學(xué)院，遼寧大連 116024； 3. 中國石油化工股份有限公司廣州分公司，廣州 510726)

0 引言

交聯(lián)聚乙烯(XLPE)電纜作為電能傳輸?shù)暮诵脑O(shè)備，其絕緣性能的優(yōu)劣將直接影響電能傳輸過程的穩(wěn)定性及電能質(zhì)量。局部放電是XLPE電纜早期絕緣缺陷的主要表現(xiàn)形式，其不僅導(dǎo)致XLPE電纜絕緣故障的主要原因，也是衡量XLPE電纜絕緣性能的重要指標(biāo)[1-2]，因此對XLPE電纜進行局部放電檢測能夠有效判斷其絕緣缺陷情況[3]。在對局部放電檢測的基礎(chǔ)上，為了進一步確定造成局部放電的原因及局部放電發(fā)生位置，因此需要對局放數(shù)據(jù)進行有效分析確定局部放電缺陷類型，及時發(fā)現(xiàn)并解決相應(yīng)的故障隱患，確保XLPE電纜長期穩(wěn)定運行[4]。

目前，國內(nèi)外學(xué)者對于局部放電的模式識別已經(jīng)展開了深入研究，部分學(xué)者提出了基于人工智能算法的局部放電模式識別方法，如專家系統(tǒng)[5-6]、決策樹[7-8]、隨機森林[9-11]、支持向量機[12-14]、反向傳播神經(jīng)網(wǎng)絡(luò)[15-17]、聚類算法[18]等。對于專家系統(tǒng)，其需要大量專家技術(shù)經(jīng)驗，在實際應(yīng)用中實施較為困難；決策樹模型可讀性好，效率高，但對中間值缺失敏感，易產(chǎn)生過擬合問題；隨機森林算法易出現(xiàn)過擬合現(xiàn)象，計算成本較高，同時受取值劃分較多的屬性影響較大；支持向量機算法本質(zhì)上是二分類算法，局放模式識別為多分類問題，面對多分類問題，參數(shù)設(shè)置繁瑣，構(gòu)造分類器過程繁瑣；BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速率較慢，同時極易陷入局部最優(yōu)解;聚類算法在解決高特征維度問題時，計算量會顯著增加。

基于上述分析，文章采用參數(shù)調(diào)優(yōu)XGBoost算法作為局部放電模式識別分類器。XGBoost算法具有正則化、并行處理運算、內(nèi)置交叉驗證和高度的算法靈活性等優(yōu)勢[19]，能夠有效解決上述算法存在的過擬合、陷入局部最優(yōu)解等問題，該算法在電力負(fù)荷預(yù)測領(lǐng)域應(yīng)用較為廣泛并取得一定成果，其在局部放電模式識別領(lǐng)域也具有良好的應(yīng)用潛力。文中搭建35 kV XLPE電纜局放試驗平臺，制作四種典型的電纜局部放電模型來模擬常見的電纜絕緣缺陷，進而獲取原始數(shù)據(jù)，并將原始數(shù)據(jù)導(dǎo)入MATLAB計算統(tǒng)計特征參數(shù)，以特征參數(shù)為輸入量，放電類型預(yù)測結(jié)果為輸出量，通過學(xué)習(xí)曲線調(diào)試確定最優(yōu)參數(shù)，將參數(shù)調(diào)優(yōu)后的XGBoost算法與決策樹、支持向量機(SVM)、BP神經(jīng)網(wǎng)絡(luò)等機器學(xué)習(xí)分類算法進行了比較，結(jié)果表明參數(shù)調(diào)優(yōu)XGBoost算法在識別準(zhǔn)確率上有較大提高，驗證了該方法的有效性。

1 XGBoost算法

XGBoost算法也稱極端梯度提升算法，其是在梯度提升機器算法基礎(chǔ)上進行了擴展，實現(xiàn)方式是通過集成多個不同弱分類器以增強分類效果。通過將其損失函數(shù)進行二階泰勒展開，能夠?qū)崿F(xiàn)對高維稀疏特征進行分布式處理，算法主要優(yōu)勢在于具備高準(zhǔn)確度，不易過擬合及可擴展性強等[20]。XGBoost模型基本流程圖如圖1所示。

圖1 XGBoost模型基本流程圖

XGBoost算法原理為：

設(shè)D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R)。其中，n代表不同局部放電類型樣本數(shù)量，m代表每個局部放電樣本對應(yīng)的特征參數(shù)數(shù)量，xi代表第i個樣本特征取值，yi代表第i個樣本對應(yīng)局部放電類型。這個樹集成模型得到終值的方式是通過持續(xù)添加新的決策樹，利用殘差多次迭代擬合，對應(yīng)公式如式(1)所示:

(1)

圖2 單個fK樹模型結(jié)構(gòu)示意圖

XGBoost算法目標(biāo)函數(shù)主要包括兩部分內(nèi)容，一部分代表損失函數(shù)項，另一部分代表正則懲罰項，將損失函數(shù)與正則懲罰項相結(jié)合即可實現(xiàn)對其整體最優(yōu)解的尋找，求解出的整體最優(yōu)解即可滿足對損失函數(shù)的下降和模型的復(fù)雜度的權(quán)衡[22]。XGBoost目標(biāo)函數(shù)具體公式如式(2)所示。

(2)

(3)

(4)

式中參數(shù)gi(損失函數(shù)一階導(dǎo)數(shù))對應(yīng)公式為：

(5)

參數(shù)hi(損失函數(shù)二階導(dǎo)數(shù))對應(yīng)公式為：

(6)

去掉常數(shù)項得到簡化的目標(biāo)函數(shù)：

(7)

定義Ij={i∣q(xi) =j}作為葉子節(jié)點j的樣本數(shù)集，根據(jù)公式(7)可得：

(8)

(9)

為了確保分割效果最佳，因此需要計算得到目標(biāo)函數(shù)數(shù)值即分支后增益數(shù)值[24]。假定IL和IR代表劃分后左右子樹(樹模型如圖2所示)葉子節(jié)點樣本集合，即I=IL∪IR，則劃分后增益如式(10)所示。

(10)

上述公式可以分解為：(1)新左葉葉子節(jié)點最優(yōu)權(quán)重；(2)新右葉葉子節(jié)點最優(yōu)權(quán)重；(3)原始葉葉子節(jié)點最優(yōu)權(quán)重；(4)葉子數(shù)目正則化參數(shù)。若分支后增益數(shù)值大于0，則說明添加對應(yīng)分支有助于優(yōu)化模型，提高模型識別準(zhǔn)確率，反之則應(yīng)對其進行修剪。后續(xù)通過學(xué)習(xí)曲線等方式獲取最優(yōu)參數(shù)的修枝策略即基于此原理進行。

2 局放實驗平臺搭建及缺陷模型構(gòu)建

2.1 交聯(lián)聚乙烯電纜與人工缺陷

試驗選取實際海上石油電力系統(tǒng)平臺應(yīng)用的35 kV交聯(lián)聚乙烯(XLPE)三芯電纜進行局部放電測試。交聯(lián)聚乙烯電纜如圖3所示。

圖3 XLPE電纜示意圖

通過查閱電纜局部放電絕緣缺陷構(gòu)建相關(guān)文獻(xiàn)[25-29]，常見的電纜絕緣缺陷有內(nèi)部氣隙放電、外部電暈放電以及絕緣劃傷等類型，因此實驗采用無絕緣缺陷電纜構(gòu)建以下四種電纜絕緣缺陷如圖4所示。

圖4 XLPE電纜絕緣缺陷模擬構(gòu)建示意圖

四種類型絕緣缺陷具體構(gòu)建方式為：

(1)電纜絕緣缺陷類型1：電纜絕緣層內(nèi)部氣隙放電：利用鉆孔設(shè)備在模型電纜XLPE表面制造若干個微孔，使少量空氣進入絕緣內(nèi)部，并向其中注入少量環(huán)氧樹脂并均勻涂抹于孔口周圍將孔口密封;

(2)電纜絕緣缺陷類型2：電纜本體劃傷絕緣缺陷放電：為了模擬電纜本體劃傷絕緣缺陷放電，采用對電纜絕緣層進行人為損傷，通過加壓測試效果進而不斷增加對絕緣層的破壞深度，直至絕緣缺陷放電現(xiàn)象較為明顯時停止破壞;

(3)電纜絕緣缺陷類型3：電纜外部尖刺電暈放電：首先選取直徑為0.5 mm，長度為10 cm的鋼釘，通過錘子敲打從電纜端頭嵌入導(dǎo)體內(nèi)部，將鋼釘大部分尖端外露與空氣直接接觸，進而模擬電纜外部電暈放電;

(4)電纜絕緣缺陷類型4：外半導(dǎo)體層爬電：在對模型電纜處理過程中，對外半導(dǎo)體層進行剝除操作，一端留有寬10 mm、長30 mm的外半導(dǎo)體層不完全剝除干凈。

2.2 試驗建立與數(shù)據(jù)獲取

實驗采用HD-iPD局放特高頻檢測系統(tǒng)(包括局放狀態(tài)檢測儀和一臺工業(yè)電腦)，結(jié)合高頻電流傳感器HFCT進行局放實驗，實驗系統(tǒng)結(jié)構(gòu)示意圖如圖5所示。

圖5 實驗系統(tǒng)結(jié)構(gòu)示意圖

實驗所用相關(guān)儀器設(shè)備及部分缺陷模型制作如圖6所示。

圖6 實驗儀器設(shè)備及部分缺陷模型制作

電纜試品參數(shù)為26/35 kV，單芯導(dǎo)體直徑13 mm，絕緣厚度10.5 mm，鉛套厚度1.9 mm，PE層厚度1.8 mm，鎧裝鋼絲直徑5.0 mm。

根據(jù)IEC60270局部放電試驗國家標(biāo)準(zhǔn)[30]，實驗電壓從零先升至2U0，在2U0等級保持10 s后，再降至1.73U0，隨后以1 kV為步長逐步減小試驗電壓，直至局放現(xiàn)象消失。原始數(shù)據(jù)格式為幅值-相位-時間戳的Excel表格，實驗共采集四種局放類型原始數(shù)據(jù)累計約1 300組。HD-iPD局放檢測系統(tǒng)以幅值-相位二維強度散點圖形式顯示局放圖譜，四種局放類型的局放圖譜如圖7所示。

圖7 4種局放類型幅值-相位二維強度圖譜

2.3 特征參數(shù)構(gòu)建

在局部放電圖譜相應(yīng)特征參數(shù)中，正負(fù)半周偏斜度Sk能夠表征與正態(tài)分布相比，圖譜的非對稱情況，與幅值-相位以及放電頻次-相位分布圖的對稱性具有密切的相關(guān)性，當(dāng)圖譜對稱分布時其偏斜度為零，呈斜線上升時偏斜度為負(fù)值，反之為正值。Ku能夠表征圖譜峰值尖銳度，該特征參數(shù)對內(nèi)部氣隙放電和外部電暈放電類缺陷具有良好的識別效果，例如，介質(zhì)中含有多個氣隙或為電暈放電，則其陡峭度為負(fù)值；介質(zhì)中含有單個氣隙放電現(xiàn)象，則其陡峭度為正值。m能夠表征局放圖譜在正負(fù)半周內(nèi)起始放電相位的差異性，例如內(nèi)部氣隙放電與本體劃傷絕緣缺陷放電類型相比，正負(fù)半周起始放電相位相差較大，提取該特征參數(shù)能夠有效區(qū)分不同放電類型。因此文中利用原始數(shù)據(jù)分別提取幅值，放電頻次兩種相位分布圖譜上述統(tǒng)計特征參數(shù)[31]。特征參數(shù)具體計算公式如下：

(11)

(12)

式中 Δx代表劃分的單位相窗寬度；xi代表第i個相窗對應(yīng)相位；W代表工頻狀態(tài)下半周內(nèi)包含相窗個數(shù)；pi、u和σ代表以相位為隨機變量時，第i個相窗內(nèi)事件發(fā)生的概率、均值以及標(biāo)準(zhǔn)差[32]。概率計算公式為：

(13)

式中yi表示相位分布圖譜對應(yīng)的縱坐標(biāo)。

均值u和標(biāo)準(zhǔn)差σ計算公式為：

(14)

(15)

相位不對稱度m能夠反映局放圖譜在正負(fù)半周內(nèi)起始放電相位的差別[33]，具體公式為：

(16)

3 基于改進XGBoost算法的局放模式識別

3.1 輸入量的確定

根據(jù)特征參數(shù)計算公式，利用MATLAB軟件編程批量處理局部放電原始數(shù)據(jù)，計算得到幅值-相位二維圖譜及放電頻次-相位二維圖譜的統(tǒng)計特征參數(shù)，兩類相位圖譜均可計算出正負(fù)半周偏斜度、正負(fù)半周陡峭度以及相位不對稱度，因此可分別提取5個統(tǒng)計特征參數(shù)，共計10個統(tǒng)計特征參數(shù)，將10個特征參數(shù)作為輸入量代入模型進行模式分類識別，提取的特征參數(shù)如表1所示。

表1 局部放電特征描述

3.2 輸出量的確定

通過實驗?zāi)M四種XLPE電纜局部放電類型，分別為內(nèi)部氣隙放電、本體劃傷絕緣缺陷放電、外部尖刺電暈放電、外半導(dǎo)體層爬電。對局部放電類型進行ont_hot編碼，如表2所示。

表2 局部放電模式one_hot編碼

3.3 局部放電模式識別流程

圖8 XLPE電纜局部放電模式識別流程

3.4 XGBoost模型參數(shù)調(diào)優(yōu)

取各類樣本的80%組成訓(xùn)練樣本集，各類樣本的20%組成測試樣本集，從訓(xùn)練集中取10%作為驗證集，然后對于訓(xùn)練集和驗證集采用交叉驗證方式，選取出最優(yōu)的超參數(shù)，把訓(xùn)練集和驗證集一起訓(xùn)練出最終的模型。訓(xùn)練樣本(含10%驗證集樣本)總數(shù)為1 044組，測試總樣本數(shù)為261組。各運行狀態(tài)下訓(xùn)練樣本及測試樣本組成如表3所示。

表3 四種局放類型樣本統(tǒng)計

首先是選擇進行訓(xùn)練的弱評估器(Booster)，主要有g(shù)btree，gblinear，dart三種，用默認(rèn)參數(shù)將特征參數(shù)輸入量代入三種弱評估器構(gòu)建的XGBoost算法模型，進而考量三種弱評估三種對應(yīng)模型效果得分如圖9所示。

圖9 XGBoost弱評估器選擇

通過訓(xùn)練可得到三種弱評估器對應(yīng)模型得分分別為gbtree(96.93%)，gblinear(83.52%)，dart(91.95%)。說明gbtree對實驗局放特征參數(shù)有更加良好的識別準(zhǔn)確性，因此XGBoost模型選用gbtree作為本模型弱評估器。

參數(shù)objective代表目標(biāo)函數(shù)的選擇，常用選擇有二分類使用的‘binary:logistic’以及‘binary:hinge’，而對于多分類問題則使用‘multi:softmax’，由于文中對不同類型局放模式識別屬于多分類問題，因此XGBoost算法選用softmax目標(biāo)函數(shù)做多分類，此時需要設(shè)置參數(shù)num_class(類別個數(shù))，由于本模型所要識別的局放類型共有四種，故num_class取值為4。

在完成對弱評估器及目標(biāo)函數(shù)的選取后，開始對弱評估器內(nèi)部參數(shù)進行優(yōu)化。首先是對n_estimators(迭代次數(shù))的調(diào)試，利用交叉驗證繪制模型得分-迭代次數(shù)學(xué)習(xí)曲線，選擇最優(yōu)迭代次數(shù)，學(xué)習(xí)曲線如圖10所示。由迭代次數(shù)學(xué)習(xí)曲線可知，XGBoost中迭代次數(shù)決定了模型學(xué)習(xí)能力，當(dāng)n_estimators取值為130時，模型學(xué)習(xí)能力最佳，對應(yīng)模型訓(xùn)練分?jǐn)?shù)為0.982 7。

圖10 迭代次數(shù)學(xué)習(xí)曲線

學(xué)習(xí)率(Learning_rate)主要作用是防止過擬合，實現(xiàn)方式是在更新中收縮步長，而提升模型效果會更多考慮從樹本身參數(shù)出發(fā)而不會選擇調(diào)整學(xué)習(xí)率，因此學(xué)習(xí)率(Learning rate)默認(rèn)設(shè)置為0.3。

再對Subsample參數(shù)進行調(diào)優(yōu)，其作用是控制對于每個弱評估器隨機采樣的比例，利用交叉驗證得到的調(diào)優(yōu)學(xué)習(xí)曲線如圖11所示。

圖11 Subsample調(diào)試學(xué)習(xí)曲線

Subsample取值范圍為[0,1]，由調(diào)參學(xué)習(xí)曲線結(jié)果可知，當(dāng)subsample取值為0.368 42時，模型效果最佳，此時模型訓(xùn)練分?jǐn)?shù)為0.984 67。

最后再對max_depth(樹的最大深度)參數(shù)進行調(diào)節(jié)，其作用是避免模型過擬合，調(diào)參優(yōu)化目標(biāo)是在確保準(zhǔn)確率的前提下讓訓(xùn)練集和測試集的結(jié)果盡可能接近。通過對max_depth參數(shù)進行調(diào)試可以發(fā)現(xiàn)，當(dāng)max_depth取值為6時模型準(zhǔn)確率最佳，因此max_depth取值為6。max_depth不同取值對比如圖12所示。

圖12 max_depth參數(shù)調(diào)優(yōu)對比

3.5 算法對比

為了測試改進后XGBoost算法模型的識別性能，分別采用決策樹、隨機森林、支持向量機(SVM)、BP神經(jīng)網(wǎng)絡(luò)、XGBoost模型(默認(rèn)參數(shù))對相同的數(shù)據(jù)集進行訓(xùn)練和故障診斷。決策樹算法和隨機森林算法均設(shè)置為默認(rèn)參數(shù)；支持向量機核函數(shù)選用rbf，核函數(shù)參數(shù)設(shè)置為0.1，規(guī)則化稀疏設(shè)置為200；BP神經(jīng)網(wǎng)絡(luò)輸入層為10個神經(jīng)元，隱藏層為58個神經(jīng)元，輸出層為4個神經(jīng)元，輸出層加softmax分類器。4種局放類型測試樣本共計261個，各故障識別結(jié)果如表4所示，混淆矩陣的結(jié)果如圖13所示,其中各個子圖分別為各模型在局放特征參數(shù)數(shù)據(jù)集上的混淆矩陣結(jié)果，圖中色塊顏色深淺僅代表數(shù)值大小。

圖13 各模型在電纜局放數(shù)據(jù)集上的混淆矩陣

由圖13和表4結(jié)果可知：

(1)通過觀察表格及各個模型在局放特征參數(shù)數(shù)據(jù)集上的混淆矩陣可以發(fā)現(xiàn)，不同的算法模型對局部放電模式識別準(zhǔn)確率均在80%以上，說明結(jié)合圖譜與原始數(shù)據(jù)計算得出的特征參數(shù)能夠很好地表征不同局放類型的特性；

(2)比較發(fā)現(xiàn)，模型對四種局部放電類型辨識效果不盡相同，其主要原因是局部放電具有一定隨機性，如外部電暈放電和絕緣缺陷放電存在一些相似特征等；

(3)XGBoost模型參數(shù)調(diào)優(yōu)，避免了模型過擬合，增加了模型的泛化能力，使得經(jīng)過參數(shù)調(diào)優(yōu)的XGBoost算法模型識別準(zhǔn)確率較未經(jīng)調(diào)參的XGBoost算法模型在識別準(zhǔn)確率上有了一定提高。

表4 不同方法識別結(jié)果

4 結(jié)束語

文章分析了XGBoost算法模型結(jié)構(gòu)和原理，提出了基于參數(shù)調(diào)優(yōu)的XGBoost算法模型，通過搭建35 kV XLPE海纜局部放電實驗平臺,模擬XLPE電纜局放缺陷模型獲取原始數(shù)據(jù)及局放圖譜，進而通過公式計算獲取特征參數(shù)。利用計算得到的特征參數(shù)作為輸入量，局放類型識別結(jié)果作為輸出量，經(jīng)過訓(xùn)練得到了XLPE電纜局部放電模式識別方法。得到結(jié)論如下：

(1)與傳統(tǒng)的決策樹、SVM、隨機森林、BP神經(jīng)網(wǎng)絡(luò)等機器學(xué)習(xí)算法相比，XGBoost算法模型對局放模式識別準(zhǔn)確率更高;

(2)通過對XGBoost算法中booster(弱評估器)、n_estimators(迭代次數(shù))、subsample(采樣比例)、max_depth(樹的最大深度)等參數(shù)調(diào)節(jié)優(yōu)化，使得經(jīng)過改進的XGBoost算法模型在原有基礎(chǔ)上識別準(zhǔn)確率提高了6.5%左右。

識別模型評價指標(biāo)除準(zhǔn)確性外，還需考慮模型的穩(wěn)定性，對于穩(wěn)定性問題文中并未考慮，后續(xù)需進一步對所提XLPE電纜局部放電模式識別算法模型的穩(wěn)定性進行研究。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡