劉維功,王昊展,時振堂,黎德初,胡學(xué)良,李勁松
(1. 中國石油化工股份有限公司大連石油化工研究院,遼寧 大連 116045; 2. 大連理工大學(xué) 電氣工程學(xué)院,遼寧 大連 116024; 3. 中國石油化工股份有限公司廣州分公司,廣州 510726)
交聯(lián)聚乙烯(XLPE)電纜作為電能傳輸?shù)暮诵脑O(shè)備,其絕緣性能的優(yōu)劣將直接影響電能傳輸過程的穩(wěn)定性及電能質(zhì)量。局部放電是XLPE電纜早期絕緣缺陷的主要表現(xiàn)形式,其不僅導(dǎo)致XLPE電纜絕緣故障的主要原因,也是衡量XLPE電纜絕緣性能的重要指標(biāo)[1-2],因此對XLPE電纜進行局部放電檢測能夠有效判斷其絕緣缺陷情況[3]。在對局部放電檢測的基礎(chǔ)上,為了進一步確定造成局部放電的原因及局部放電發(fā)生位置,因此需要對局放數(shù)據(jù)進行有效分析確定局部放電缺陷類型,及時發(fā)現(xiàn)并解決相應(yīng)的故障隱患,確保XLPE電纜長期穩(wěn)定運行[4]。
目前,國內(nèi)外學(xué)者對于局部放電的模式識別已經(jīng)展開了深入研究,部分學(xué)者提出了基于人工智能算法的局部放電模式識別方法,如專家系統(tǒng)[5-6]、決策樹[7-8]、隨機森林[9-11]、支持向量機[12-14]、反向傳播神經(jīng)網(wǎng)絡(luò)[15-17]、聚類算法[18]等。對于專家系統(tǒng),其需要大量專家技術(shù)經(jīng)驗,在實際應(yīng)用中實施較為困難;決策樹模型可讀性好,效率高,但對中間值缺失敏感,易產(chǎn)生過擬合問題;隨機森林算法易出現(xiàn)過擬合現(xiàn)象,計算成本較高,同時受取值劃分較多的屬性影響較大;支持向量機算法本質(zhì)上是二分類算法,局放模式識別為多分類問題,面對多分類問題,參數(shù)設(shè)置繁瑣,構(gòu)造分類器過程繁瑣;BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速率較慢,同時極易陷入局部最優(yōu)解;聚類算法在解決高特征維度問題時,計算量會顯著增加。
基于上述分析,文章采用參數(shù)調(diào)優(yōu)XGBoost算法作為局部放電模式識別分類器。XGBoost算法具有正則化、并行處理運算、內(nèi)置交叉驗證和高度的算法靈活性等優(yōu)勢[19],能夠有效解決上述算法存在的過擬合、陷入局部最優(yōu)解等問題,該算法在電力負(fù)荷預(yù)測領(lǐng)域應(yīng)用較為廣泛并取得一定成果,其在局部放電模式識別領(lǐng)域也具有良好的應(yīng)用潛力。文中搭建35 kV XLPE電纜局放試驗平臺,制作四種典型的電纜局部放電模型來模擬常見的電纜絕緣缺陷,進而獲取原始數(shù)據(jù),并將原始數(shù)據(jù)導(dǎo)入MATLAB計算統(tǒng)計特征參數(shù),以特征參數(shù)為輸入量,放電類型預(yù)測結(jié)果為輸出量,通過學(xué)習(xí)曲線調(diào)試確定最優(yōu)參數(shù),將參數(shù)調(diào)優(yōu)后的XGBoost算法與決策樹、支持向量機(SVM)、BP神經(jīng)網(wǎng)絡(luò)等機器學(xué)習(xí)分類算法進行了比較,結(jié)果表明參數(shù)調(diào)優(yōu)XGBoost算法在識別準(zhǔn)確率上有較大提高,驗證了該方法的有效性。
XGBoost算法也稱極端梯度提升算法,其是在梯度提升機器算法基礎(chǔ)上進行了擴展,實現(xiàn)方式是通過集成多個不同弱分類器以增強分類效果。通過將其損失函數(shù)進行二階泰勒展開,能夠?qū)崿F(xiàn)對高維稀疏特征進行分布式處理,算法主要優(yōu)勢在于具備高準(zhǔn)確度,不易過擬合及可擴展性強等[20]。XGBoost模型基本流程圖如圖1所示。
圖1 XGBoost模型基本流程圖
XGBoost算法原理為:
設(shè)D={(xi,yi)}(|D|=n,xi∈Rm,yi∈R)。其中,n代表不同局部放電類型樣本數(shù)量,m代表每個局部放電樣本對應(yīng)的特征參數(shù)數(shù)量,xi代表第i個樣本特征取值,yi代表第i個樣本對應(yīng)局部放電類型。這個樹集成模型得到終值的方式是通過持續(xù)添加新的決策樹,利用殘差多次迭代擬合,對應(yīng)公式如式(1)所示:
(1)
圖2 單個fK樹模型結(jié)構(gòu)示意圖
XGBoost算法目標(biāo)函數(shù)主要包括兩部分內(nèi)容,一部分代表損失函數(shù)項,另一部分代表正則懲罰項,將損失函數(shù)與正則懲罰項相結(jié)合即可實現(xiàn)對其整體最優(yōu)解的尋找,求解出的整體最優(yōu)解即可滿足對損失函數(shù)的下降和模型的復(fù)雜度的權(quán)衡[22]。XGBoost目標(biāo)函數(shù)具體公式如式(2)所示。
(2)
(3)
(4)
式中 參數(shù)gi(損失函數(shù)一階導(dǎo)數(shù))對應(yīng)公式為:
(5)
參數(shù)hi(損失函數(shù)二階導(dǎo)數(shù))對應(yīng)公式為:
(6)
去掉常數(shù)項得到簡化的目標(biāo)函數(shù):
(7)
定義Ij={i∣q(xi) =j}作為葉子節(jié)點j的樣本數(shù)集,根據(jù)公式(7)可得:
(8)
(9)
為了確保分割效果最佳,因此需要計算得到目標(biāo)函數(shù)數(shù)值即分支后增益數(shù)值[24]。假定IL和IR代表劃分后左右子樹(樹模型如圖2所示)葉子節(jié)點樣本集合,即I=IL∪IR,則劃分后增益如式(10)所示。
(10)
上述公式可以分解為:(1)新左葉葉子節(jié)點最優(yōu)權(quán)重;(2)新右葉葉子節(jié)點最優(yōu)權(quán)重;(3)原始葉葉子節(jié)點最優(yōu)權(quán)重;(4)葉子數(shù)目正則化參數(shù)。若分支后增益數(shù)值大于0,則說明添加對應(yīng)分支有助于優(yōu)化模型,提高模型識別準(zhǔn)確率,反之則應(yīng)對其進行修剪。后續(xù)通過學(xué)習(xí)曲線等方式獲取最優(yōu)參數(shù)的修枝策略即基于此原理進行。
試驗選取實際海上石油電力系統(tǒng)平臺應(yīng)用的35 kV交聯(lián)聚乙烯(XLPE)三芯電纜進行局部放電測試。交聯(lián)聚乙烯電纜如圖3所示。
圖3 XLPE電纜示意圖
通過查閱電纜局部放電絕緣缺陷構(gòu)建相關(guān)文獻(xiàn)[25-29],常見的電纜絕緣缺陷有內(nèi)部氣隙放電、外部電暈放電以及絕緣劃傷等類型,因此實驗采用無絕緣缺陷電纜構(gòu)建以下四種電纜絕緣缺陷如圖4所示。
圖4 XLPE電纜絕緣缺陷模擬構(gòu)建示意圖
四種類型絕緣缺陷具體構(gòu)建方式為:
(1)電纜絕緣缺陷類型1:電纜絕緣層內(nèi)部氣隙放電:利用鉆孔設(shè)備在模型電纜XLPE表面制造若干個微孔,使少量空氣進入絕緣內(nèi)部,并向其中注入少量環(huán)氧樹脂并均勻涂抹于孔口周圍將孔口密封;
(2)電纜絕緣缺陷類型2:電纜本體劃傷絕緣缺陷放電:為了模擬電纜本體劃傷絕緣缺陷放電,采用對電纜絕緣層進行人為損傷,通過加壓測試效果進而不斷增加對絕緣層的破壞深度,直至絕緣缺陷放電現(xiàn)象較為明顯時停止破壞;
(3)電纜絕緣缺陷類型3:電纜外部尖刺電暈放電:首先選取直徑為0.5 mm,長度為10 cm的鋼釘,通過錘子敲打從電纜端頭嵌入導(dǎo)體內(nèi)部,將鋼釘大部分尖端外露與空氣直接接觸,進而模擬電纜外部電暈放電;
(4)電纜絕緣缺陷類型4:外半導(dǎo)體層爬電:在對模型電纜處理過程中,對外半導(dǎo)體層進行剝除操作,一端留有寬10 mm、長30 mm的外半導(dǎo)體層不完全剝除干凈。
實驗采用HD-iPD局放特高頻檢測系統(tǒng)(包括局放狀態(tài)檢測儀和一臺工業(yè)電腦),結(jié)合高頻電流傳感器HFCT進行局放實驗,實驗系統(tǒng)結(jié)構(gòu)示意圖如圖5所示。
圖5 實驗系統(tǒng)結(jié)構(gòu)示意圖
實驗所用相關(guān)儀器設(shè)備及部分缺陷模型制作如圖6所示。
圖6 實驗儀器設(shè)備及部分缺陷模型制作
電纜試品參數(shù)為26/35 kV,單芯導(dǎo)體直徑13 mm,絕緣厚度10.5 mm,鉛套厚度1.9 mm,PE層厚度1.8 mm,鎧裝鋼絲直徑5.0 mm。
根據(jù)IEC60270局部放電試驗國家標(biāo)準(zhǔn)[30],實驗電壓從零先升至2U0,在2U0等級保持10 s后,再降至1.73U0,隨后以1 kV為步長逐步減小試驗電壓,直至局放現(xiàn)象消失。原始數(shù)據(jù)格式為幅值-相位-時間戳的Excel表格,實驗共采集四種局放類型原始數(shù)據(jù)累計約1 300組。HD-iPD局放檢測系統(tǒng)以幅值-相位二維強度散點圖形式顯示局放圖譜,四種局放類型的局放圖譜如圖7所示。
圖7 4種局放類型幅值-相位二維強度圖譜
在局部放電圖譜相應(yīng)特征參數(shù)中,正負(fù)半周偏斜度Sk能夠表征與正態(tài)分布相比,圖譜的非對稱情況,與幅值-相位以及放電頻次-相位分布圖的對稱性具有密切的相關(guān)性,當(dāng)圖譜對稱分布時其偏斜度為零,呈斜線上升時偏斜度為負(fù)值,反之為正值。Ku能夠表征圖譜峰值尖銳度,該特征參數(shù)對內(nèi)部氣隙放電和外部電暈放電類缺陷具有良好的識別效果,例如,介質(zhì)中含有多個氣隙或為電暈放電,則其陡峭度為負(fù)值;介質(zhì)中含有單個氣隙放電現(xiàn)象,則其陡峭度為正值。m能夠表征局放圖譜在正負(fù)半周內(nèi)起始放電相位的差異性,例如內(nèi)部氣隙放電與本體劃傷絕緣缺陷放電類型相比,正負(fù)半周起始放電相位相差較大,提取該特征參數(shù)能夠有效區(qū)分不同放電類型。因此文中利用原始數(shù)據(jù)分別提取幅值,放電頻次兩種相位分布圖譜上述統(tǒng)計特征參數(shù)[31]。特征參數(shù)具體計算公式如下:
(11)
(12)
式中 Δx代表劃分的單位相窗寬度;xi代表第i個相窗對應(yīng)相位;W代表工頻狀態(tài)下半周內(nèi)包含相窗個數(shù);pi、u和σ代表以相位為隨機變量時,第i個相窗內(nèi)事件發(fā)生的概率、均值以及標(biāo)準(zhǔn)差[32]。概率計算公式為:
(13)
式中yi表示相位分布圖譜對應(yīng)的縱坐標(biāo)。
均值u和標(biāo)準(zhǔn)差σ計算公式為:
(14)
(15)
相位不對稱度m能夠反映局放圖譜在正負(fù)半周內(nèi)起始放電相位的差別[33],具體公式為:
(16)
根據(jù)特征參數(shù)計算公式,利用MATLAB軟件編程批量處理局部放電原始數(shù)據(jù),計算得到幅值-相位二維圖譜及放電頻次-相位二維圖譜的統(tǒng)計特征參數(shù),兩類相位圖譜均可計算出正負(fù)半周偏斜度、正負(fù)半周陡峭度以及相位不對稱度,因此可分別提取5個統(tǒng)計特征參數(shù),共計10個統(tǒng)計特征參數(shù),將10個特征參數(shù)作為輸入量代入模型進行模式分類識別,提取的特征參數(shù)如表1所示。
表1 局部放電特征描述
通過實驗?zāi)M四種XLPE電纜局部放電類型,分別為內(nèi)部氣隙放電、本體劃傷絕緣缺陷放電、外部尖刺電暈放電、外半導(dǎo)體層爬電。對局部放電類型進行ont_hot編碼,如表2所示。
表2 局部放電模式one_hot編碼
圖8 XLPE電纜局部放電模式識別流程
取各類樣本的80%組成訓(xùn)練樣本集,各類樣本的20%組成測試樣本集,從訓(xùn)練集中取10%作為驗證集,然后對于訓(xùn)練集和驗證集采用交叉驗證方式,選取出最優(yōu)的超參數(shù),把訓(xùn)練集和驗證集一起訓(xùn)練出最終的模型。訓(xùn)練樣本(含10%驗證集樣本)總數(shù)為1 044組,測試總樣本數(shù)為261組。各運行狀態(tài)下訓(xùn)練樣本及測試樣本組成如表3所示。
表3 四種局放類型樣本統(tǒng)計
首先是選擇進行訓(xùn)練的弱評估器(Booster),主要有g(shù)btree,gblinear,dart三種,用默認(rèn)參數(shù)將特征參數(shù)輸入量代入三種弱評估器構(gòu)建的XGBoost算法模型,進而考量三種弱評估三種對應(yīng)模型效果得分如圖9所示。
圖9 XGBoost弱評估器選擇
通過訓(xùn)練可得到三種弱評估器對應(yīng)模型得分分別為gbtree(96.93%),gblinear(83.52%),dart(91.95%)。說明gbtree對實驗局放特征參數(shù)有更加良好的識別準(zhǔn)確性,因此XGBoost模型選用gbtree作為本模型弱評估器。
參數(shù)objective代表目標(biāo)函數(shù)的選擇,常用選擇有二分類使用的‘binary:logistic’以及‘binary:hinge’,而對于多分類問題則使用‘multi:softmax’,由于文中對不同類型局放模式識別屬于多分類問題,因此XGBoost算法選用softmax目標(biāo)函數(shù)做多分類,此時需要設(shè)置參數(shù)num_class(類別個數(shù)),由于本模型所要識別的局放類型共有四種,故num_class取值為4。
在完成對弱評估器及目標(biāo)函數(shù)的選取后,開始對弱評估器內(nèi)部參數(shù)進行優(yōu)化。首先是對n_estimators(迭代次數(shù))的調(diào)試,利用交叉驗證繪制模型得分-迭代次數(shù)學(xué)習(xí)曲線,選擇最優(yōu)迭代次數(shù),學(xué)習(xí)曲線如圖10所示。由迭代次數(shù)學(xué)習(xí)曲線可知,XGBoost中迭代次數(shù)決定了模型學(xué)習(xí)能力,當(dāng)n_estimators取值為130時,模型學(xué)習(xí)能力最佳,對應(yīng)模型訓(xùn)練分?jǐn)?shù)為0.982 7。
圖10 迭代次數(shù)學(xué)習(xí)曲線
學(xué)習(xí)率(Learning_rate)主要作用是防止過擬合,實現(xiàn)方式是在更新中收縮步長,而提升模型效果會更多考慮從樹本身參數(shù)出發(fā)而不會選擇調(diào)整學(xué)習(xí)率,因此學(xué)習(xí)率(Learning rate)默認(rèn)設(shè)置為0.3。
再對Subsample參數(shù)進行調(diào)優(yōu),其作用是控制對于每個弱評估器隨機采樣的比例,利用交叉驗證得到的調(diào)優(yōu)學(xué)習(xí)曲線如圖11所示。
圖11 Subsample調(diào)試學(xué)習(xí)曲線
Subsample取值范圍為[0,1],由調(diào)參學(xué)習(xí)曲線結(jié)果可知,當(dāng)subsample取值為0.368 42時,模型效果最佳,此時模型訓(xùn)練分?jǐn)?shù)為0.984 67。
最后再對max_depth(樹的最大深度)參數(shù)進行調(diào)節(jié),其作用是避免模型過擬合,調(diào)參優(yōu)化目標(biāo)是在確保準(zhǔn)確率的前提下讓訓(xùn)練集和測試集的結(jié)果盡可能接近。通過對max_depth參數(shù)進行調(diào)試可以發(fā)現(xiàn),當(dāng)max_depth取值為6時模型準(zhǔn)確率最佳,因此max_depth取值為6。max_depth不同取值對比如圖12所示。
圖12 max_depth參數(shù)調(diào)優(yōu)對比
為了測試改進后XGBoost算法模型的識別性能,分別采用決策樹、隨機森林、支持向量機(SVM)、BP神經(jīng)網(wǎng)絡(luò)、XGBoost模型(默認(rèn)參數(shù))對相同的數(shù)據(jù)集進行訓(xùn)練和故障診斷。決策樹算法和隨機森林算法均設(shè)置為默認(rèn)參數(shù);支持向量機核函數(shù)選用rbf,核函數(shù)參數(shù)設(shè)置為0.1,規(guī)則化稀疏設(shè)置為200;BP神經(jīng)網(wǎng)絡(luò)輸入層為10個神經(jīng)元,隱藏層為58個神經(jīng)元,輸出層為4個神經(jīng)元,輸出層加softmax分類器。4種局放類型測試樣本共計261個,各故障識別結(jié)果如表4所示,混淆矩陣的結(jié)果如圖13所示,其中各個子圖分別為各模型在局放特征參數(shù)數(shù)據(jù)集上的混淆矩陣結(jié)果,圖中色塊顏色深淺僅代表數(shù)值大小。
圖13 各模型在電纜局放數(shù)據(jù)集上的混淆矩陣
由圖13和表4結(jié)果可知:
(1)通過觀察表格及各個模型在局放特征參數(shù)數(shù)據(jù)集上的混淆矩陣可以發(fā)現(xiàn),不同的算法模型對局部放電模式識別準(zhǔn)確率均在80%以上,說明結(jié)合圖譜與原始數(shù)據(jù)計算得出的特征參數(shù)能夠很好地表征不同局放類型的特性;
(2)比較發(fā)現(xiàn),模型對四種局部放電類型辨識效果不盡相同,其主要原因是局部放電具有一定隨機性,如外部電暈放電和絕緣缺陷放電存在一些相似特征等;
(3)XGBoost模型參數(shù)調(diào)優(yōu),避免了模型過擬合,增加了模型的泛化能力,使得經(jīng)過參數(shù)調(diào)優(yōu)的XGBoost算法模型識別準(zhǔn)確率較未經(jīng)調(diào)參的XGBoost算法模型在識別準(zhǔn)確率上有了一定提高。
表4 不同方法識別結(jié)果
文章分析了XGBoost算法模型結(jié)構(gòu)和原理,提出了基于參數(shù)調(diào)優(yōu)的XGBoost算法模型,通過搭建35 kV XLPE海纜局部放電實驗平臺,模擬XLPE電纜局放缺陷模型獲取原始數(shù)據(jù)及局放圖譜,進而通過公式計算獲取特征參數(shù)。利用計算得到的特征參數(shù)作為輸入量,局放類型識別結(jié)果作為輸出量,經(jīng)過訓(xùn)練得到了XLPE電纜局部放電模式識別方法。得到結(jié)論如下:
(1)與傳統(tǒng)的決策樹、SVM、隨機森林、BP神經(jīng)網(wǎng)絡(luò)等機器學(xué)習(xí)算法相比,XGBoost算法模型對局放模式識別準(zhǔn)確率更高;
(2)通過對XGBoost算法中booster(弱評估器)、n_estimators(迭代次數(shù))、subsample(采樣比例)、max_depth(樹的最大深度)等參數(shù)調(diào)節(jié)優(yōu)化,使得經(jīng)過改進的XGBoost算法模型在原有基礎(chǔ)上識別準(zhǔn)確率提高了6.5%左右。
識別模型評價指標(biāo)除準(zhǔn)確性外,還需考慮模型的穩(wěn)定性,對于穩(wěn)定性問題文中并未考慮,后續(xù)需進一步對所提XLPE電纜局部放電模式識別算法模型的穩(wěn)定性進行研究。