周 敏
(國(guó)網(wǎng)江西省電力公司撫州供電公司,江西 撫州 344000)
在現(xiàn)代電力系統(tǒng)中,油色譜在線監(jiān)測(cè)裝置得到了廣泛應(yīng)用,成為保障電力系統(tǒng)安全、穩(wěn)定運(yùn)行的重要工具。對(duì)油色譜在線監(jiān)測(cè)裝置本身的故障,目前應(yīng)用較多的診斷方法是油中溶解氣體分析(DGA),但是從實(shí)際應(yīng)用來看,由于溶解氣體成分復(fù)雜,因此故障診斷的準(zhǔn)確率不高。目前,通過數(shù)據(jù)建模進(jìn)行裝置故障識(shí)別成為一種主流趨勢(shì),利用數(shù)學(xué)模型可以對(duì)在線監(jiān)測(cè)數(shù)據(jù)進(jìn)行降噪處理、擬合處理以及缺失值處理,讓最終的故障診斷結(jié)果更加可靠。其中,基于最近鄰編輯采樣法(ENN)的故障識(shí)別算法可以準(zhǔn)確、全面地識(shí)別油色譜在線監(jiān)測(cè)裝置的隱蔽故障,在該裝置的日常維護(hù)和故障檢修等方面發(fā)揮了重要作用。
該裝置的核心模塊包括油氣分離模塊、氣體組分檢測(cè)模塊、網(wǎng)絡(luò)通信模塊以及故障診斷模塊等,整體結(jié)構(gòu)如圖1所示。
圖1 變壓器油色譜在線監(jiān)測(cè)裝置
油氣分離模塊的功能是將溶解在油中并且將包括故障特征的氣體分離出來,為下一步的氣體檢測(cè)提供有利條件。如果該模塊發(fā)生故障,無法正常實(shí)現(xiàn)油氣分離,則油色譜在線監(jiān)測(cè)裝置無法在線監(jiān)測(cè)和準(zhǔn)確識(shí)別變壓器的運(yùn)行故障。氣體組分檢測(cè)模塊的功能是對(duì)油氣分離、氣體組分分離后的特征氣體進(jìn)行濃度檢測(cè),然后通過數(shù)模轉(zhuǎn)換器將物理信號(hào)變成電信號(hào),以便于下一步進(jìn)行計(jì)算機(jī)分析。電信號(hào)經(jīng)通信網(wǎng)絡(luò)傳輸至主控計(jì)算機(jī),利用各種算法、數(shù)學(xué)模型等完成故障診斷。
為進(jìn)一步提高在線監(jiān)測(cè)的即時(shí)性和準(zhǔn)確性,現(xiàn)階段的油色譜在線監(jiān)測(cè)裝置結(jié)構(gòu)更精密,故障類型也更多樣。根據(jù)以往的裝置檢修與維護(hù)經(jīng)驗(yàn)可以將其故障大體分為4個(gè)類型:1) 載氣欠壓故障,可能與氣瓶未完全打開、載氣端口漏氣等有關(guān)。如果載氣壓力不足,就會(huì)導(dǎo)致分離出來的特征氣體在色譜柱內(nèi)停留時(shí)間偏短,特征氣體的分析不徹底,影響故障診斷的精確性。2) 倒油故障,可能與廢油箱排油不暢、倒油管路堵塞等有關(guān)。如果廢油無法順利倒入廢油箱,也會(huì)導(dǎo)致該裝置無法正常運(yùn)行。3) 色譜電氣故障,可能與相關(guān)電子器件的老化、短路等有關(guān)。在發(fā)生該故障后,無法進(jìn)行正常的色譜分析,故障識(shí)別和診斷也會(huì)受到影響。4) 數(shù)據(jù)中斷故障,可能與通信網(wǎng)絡(luò)的硬件損壞有關(guān)。在發(fā)生該故障后,主控計(jì)算機(jī)無法正常接收氣體檢測(cè)數(shù)據(jù),從而不能識(shí)別和診斷該裝置的運(yùn)行工況。
由于油色譜在線監(jiān)測(cè)裝置的各類故障具有隱蔽性、突發(fā)性等特點(diǎn),如果采集樣本數(shù)量偏少,就會(huì)導(dǎo)致識(shí)別準(zhǔn)確率不高。因此,需要擴(kuò)大樣本數(shù)量,獲得包括大量樣板的訓(xùn)練集,通過計(jì)算機(jī)的深度學(xué)習(xí)和訓(xùn)練提高對(duì)故障的診斷精度。將故障發(fā)現(xiàn)時(shí)間點(diǎn)與假設(shè)故障發(fā)生時(shí)間點(diǎn)之間的時(shí)間間隔定義為故障時(shí)間窗口(),然后采集內(nèi)的油色譜在線監(jiān)測(cè)裝置的所有歷史數(shù)據(jù),并保存到訓(xùn)練集中。考慮訓(xùn)練集中存在不平衡數(shù)據(jù),還要對(duì)基于最近鄰編輯算法(ENN)對(duì)得到的訓(xùn)練集進(jìn)行重采樣。具體方法如下。
首先,設(shè)訓(xùn)練集={,,…,p,…,p},將中的所有樣本按照“數(shù)量”與“標(biāo)簽”分成2類,分別是多數(shù)類和少數(shù)類。從集合中任意選擇一個(gè)樣本p,用最近鄰算法求得p的3個(gè)最近鄰樣本,則待計(jì)算樣本p與其余樣本q的關(guān)系如公式(1)所示。
其次,將3個(gè)最近鄰樣本分別作為待計(jì)算樣本,繼續(xù)運(yùn)用最近鄰算法求其余樣本。
最后,在集合中所有樣本全部計(jì)算完畢后,得到一個(gè)新的樣本集,則中多數(shù)類樣本和少數(shù)類樣本的數(shù)量達(dá)到平衡狀態(tài),在該基礎(chǔ)上開展故障分類識(shí)別既可以提高故障分析速度,又能保證故障診斷精度。基于ENN的采樣流程如圖2所示。
圖2 最近鄰編輯算法采樣流程圖
基于故障識(shí)別算法的油色譜在線監(jiān)測(cè)裝置故障分類識(shí)別流程如下:1) 獲取故障工作清單(xi),輸入變壓器編號(hào)j。2) 對(duì)在故障時(shí)間窗口內(nèi)的歷史數(shù)據(jù)進(jìn)行重采樣,得到數(shù)據(jù)集(aj)。3) 將(aj)加入故障訓(xùn)練集中,添加故障標(biāo)簽。4) 在中運(yùn)用基于ENN算法進(jìn)行重采樣處理,得到新的數(shù)據(jù)集。5) 把中的所有數(shù)據(jù)輸入隨機(jī)森林?jǐn)?shù)學(xué)模型中。6) 采取“有放回取樣”的方法從中隨機(jī)抽選個(gè)樣本。7) 將每個(gè)獨(dú)立樣本構(gòu)成1個(gè)決策樹,獲得個(gè)決策樹。8) 分別對(duì)個(gè)決策樹進(jìn)行歸類,得到故障分類結(jié)果,完成故障識(shí)別。
隨機(jī)森林模型是一種由多個(gè)弱分類器組合形成的集成模型。該文基于Sklearn庫對(duì)隨機(jī)森林模型進(jìn)行參數(shù)優(yōu)化。從Sklearn庫中調(diào)取以下調(diào)優(yōu)函數(shù):1) 決策樹數(shù)量函數(shù)(n_estimators),利用該模型并使用有放回抽樣的方式從收集到的原始數(shù)據(jù)中獲得數(shù)據(jù),以生成決策樹,n_estimators表示決策樹的數(shù)量。該函數(shù)能保證決策樹的數(shù)量適中,既避免了決策樹數(shù)量過多導(dǎo)致算法運(yùn)行速度變慢的問題,又解決了決策樹數(shù)量太少導(dǎo)致分類識(shí)別精度不高的問題。2) 決策樹最大深度函數(shù)(max_depth),在樣本數(shù)量以及樣本特征較多的情況下,運(yùn)用該函數(shù)能夠有效提高模型的泛化性能和運(yùn)算速度。3) 最大特征數(shù)量函數(shù)(max_features),當(dāng)隨機(jī)森林模型生成分類決策樹時(shí),需要考慮其最大特征數(shù)是否合適。如果最大特征數(shù)≥原始數(shù)據(jù)集,則需要重新調(diào)整隨機(jī)森林模型,保證其產(chǎn)生的決策樹<原始數(shù)據(jù)集,縮短生成決策樹的時(shí)間,進(jìn)而提高故障識(shí)別效率。
該試驗(yàn)以Windows10系統(tǒng)作為平臺(tái),所選數(shù)據(jù)來自于30臺(tái)220 kV電力變壓器的油色譜在線監(jiān)測(cè)數(shù)據(jù),樣本數(shù)據(jù)共82 850條,特征氣體包括H、CO、CH和總烴等,詳細(xì)的氣體類型及監(jiān)測(cè)數(shù)據(jù)見表1。
表1 電力變壓器油色譜在線監(jiān)測(cè)數(shù)據(jù)(單位:μL/L)
對(duì)獲取到的油色譜在線監(jiān)測(cè)裝置相關(guān)數(shù)據(jù),使用遺傳算法進(jìn)行參數(shù)優(yōu)化。尋化標(biāo)準(zhǔn)設(shè)定如下:1) 決策樹的數(shù)量以[1,50]為尋優(yōu)空間。2) 決策樹的最大深度以[1,10]為尋優(yōu)空間。3) 最大特征數(shù)量以[1,8]為尋優(yōu)空間。4) 節(jié)點(diǎn)可分的最小樣本數(shù)以[1,50]為尋優(yōu)空間。5) 葉子節(jié)點(diǎn)最小權(quán)重以[0,0.2]為尋優(yōu)空間。
基于上述標(biāo)準(zhǔn),使用CostFuction函數(shù)進(jìn)行迭代尋優(yōu),迭代次數(shù)設(shè)定為100次,基于尋求結(jié)果繪制參數(shù)尋優(yōu)曲線圖,如圖3所示。
圖3 遺傳算法參數(shù)優(yōu)化
該試驗(yàn)將故障時(shí)間窗口設(shè)定為20,選擇油色譜在線監(jiān)測(cè)裝置的4項(xiàng)典型故障(倒油故障、載氣欠壓、數(shù)據(jù)中斷以及色譜電氣故障)展開分類預(yù)測(cè)。將優(yōu)化后的數(shù)據(jù)輸入基于ENN的隨機(jī)森林模型中,根據(jù)模型計(jì)算結(jié)果繪制故障識(shí)別混淆矩陣,如圖4所示。
圖4 故障識(shí)別混淆矩陣
該試驗(yàn)共選擇4項(xiàng)評(píng)價(jià)指標(biāo),分別是準(zhǔn)確率、查準(zhǔn)率、查全率以及查準(zhǔn)率和查全率的加權(quán)平均值。各指標(biāo)如公式(2)~公式(5)所示。
式中:為正確識(shí)別的正類樣本數(shù)量;為正確識(shí)別的負(fù)類樣本數(shù)量;為預(yù)測(cè)正類樣本的數(shù)量;為實(shí)際正類樣本的數(shù)量。
各項(xiàng)評(píng)價(jià)指標(biāo)的計(jì)算結(jié)果見表2。
表2 分類評(píng)價(jià)指標(biāo)統(tǒng)計(jì)
結(jié)合上表數(shù)據(jù)可以發(fā)現(xiàn),該算法模型平均分類正確率在90%以上,明顯高于人工判斷水平。在該基礎(chǔ)上,另外選擇2項(xiàng)指標(biāo)TPR(真正例率)和FPR(假正例率)來判斷數(shù)學(xué)模型在故障識(shí)別方面的應(yīng)用效果。2項(xiàng)指標(biāo)如公式(6)、公式(7)所示。
根據(jù)公式(6)、公式(7)的計(jì)算結(jié)果繪制多分類的ROC曲線圖。二維圖以作為軸,以作為軸,如圖5所示。
圖5 多分類的ROC曲線
在多分類ROC曲線圖中,引入作為模型性能的評(píng)價(jià)指標(biāo)。表示曲線的線下面積,越大,說明模型性能越好。其中,的取值范圍為[0,1]。由圖5可知,4條曲線的數(shù)值基本都維持在0.9左右,說明該算法模型對(duì)油色譜在線監(jiān)測(cè)裝置的4種常見故障均有良好的識(shí)別效果。綜合表2和圖5的數(shù)據(jù)可知,該文提出的基于ENN的故障識(shí)別算法能夠精準(zhǔn)識(shí)別油色譜在線監(jiān)測(cè)裝置常見的倒油故障、載氣欠壓、色譜電氣故障和數(shù)據(jù)中斷故障,在輔助設(shè)備管理人員開展日常檢修和故障排查方面發(fā)揮了實(shí)用價(jià)值。
油色譜在線監(jiān)測(cè)裝置是保證電力變壓器穩(wěn)定、可靠運(yùn)行的關(guān)鍵設(shè)備,如果該裝置發(fā)生故障,就不利于變壓器的檢修維護(hù),增加了變壓器發(fā)生故障的概率。經(jīng)試驗(yàn)證明,該文提出的一種基于最近鄰編輯采樣法的故障識(shí)別技術(shù)可以對(duì)油色譜在線監(jiān)測(cè)裝置的幾種常見故障進(jìn)行準(zhǔn)確識(shí)別,識(shí)別精度維持在90%以上。該技術(shù)的應(yīng)用可以及時(shí)發(fā)現(xiàn)油色譜在線監(jiān)測(cè)裝置的異常工況和潛在故障,可以保證在線監(jiān)測(cè)裝置的正常運(yùn)行。