国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在電網(wǎng)設(shè)備故障診斷中的應(yīng)用

2022-11-25 08:05內(nèi)蒙古電力集團(tuán)有限責(zé)任公司烏海供電分公司內(nèi)蒙古科技大學(xué)經(jīng)濟(jì)與管理學(xué)院
電力設(shè)備管理 2022年19期
關(guān)鍵詞:決策樹(shù)故障診斷變壓器

內(nèi)蒙古電力(集團(tuán))有限責(zé)任公司烏海供電分公司 余 洋 內(nèi)蒙古科技大學(xué)經(jīng)濟(jì)與管理學(xué)院 孫 斌

經(jīng)過(guò)多年的快速發(fā)展,我國(guó)的供電網(wǎng)絡(luò)已成為世界上規(guī)模最大、最復(fù)雜、效率最高的電力網(wǎng)絡(luò)系統(tǒng)。為監(jiān)控電網(wǎng)中各類(lèi)設(shè)備的運(yùn)行情況,在電力網(wǎng)絡(luò)系統(tǒng)中建設(shè)了許多信息系統(tǒng),存在電力設(shè)備基礎(chǔ)臺(tái)賬數(shù)據(jù)、運(yùn)行狀態(tài)電量數(shù)據(jù)等大量數(shù)據(jù)。這些數(shù)據(jù)具有種類(lèi)繁多、數(shù)據(jù)量大、數(shù)據(jù)格式復(fù)雜、價(jià)值密度低、分布廣等特點(diǎn)。需要一種數(shù)據(jù)處理技術(shù)來(lái)提高數(shù)據(jù)處理的效率和深度。數(shù)據(jù)挖掘技術(shù)在電力系統(tǒng)中具有廣闊的應(yīng)用前景。

目前很多學(xué)者都在探討如何利用數(shù)據(jù)挖掘技術(shù)提高電網(wǎng)設(shè)備管理能力。如FEI Siyuan(2018)分析并提出大數(shù)據(jù)技術(shù)在配電網(wǎng)運(yùn)行、檢修、規(guī)劃和資產(chǎn)管理的前景與展望[1];胥佳等(2020)提出一種基于Change-Point 的風(fēng)電數(shù)據(jù)挖掘算法,用來(lái)解決風(fēng)電機(jī)組故障及變化發(fā)生時(shí)間點(diǎn)查找問(wèn)題[2];黃大榮等(2017)通過(guò)數(shù)據(jù)挖掘的方法對(duì)電力變壓器故障數(shù)據(jù)進(jìn)行故障特征提取,采用模式識(shí)別理論實(shí)現(xiàn)故障診斷[3];蔡澤祥等(2019)將數(shù)據(jù)挖掘技術(shù)應(yīng)用到電力設(shè)備的狀態(tài)評(píng)估,為突破設(shè)備狀態(tài)評(píng)估的瓶頸帶來(lái)了全新的解決思路和技術(shù)手段[4]。

目前,烏海各級(jí)電網(wǎng)調(diào)度中心均配備運(yùn)行監(jiān)控和數(shù)據(jù)采集系統(tǒng)(SCADA)與能量管理系統(tǒng)(EMS)。在輸電網(wǎng)絡(luò)突發(fā)故障時(shí),相應(yīng)的數(shù)據(jù)監(jiān)控設(shè)備會(huì)產(chǎn)生報(bào)警信息,例如開(kāi)關(guān)跳閘、自動(dòng)保護(hù)裝置動(dòng)作、欠電壓、過(guò)電流和設(shè)備過(guò)負(fù)荷等信息并由專用網(wǎng)絡(luò)上傳到電力調(diào)度中心。特別是當(dāng)整體架構(gòu)規(guī)模巨大的電力輸送系統(tǒng)發(fā)生故障、電網(wǎng)發(fā)生復(fù)故障或自動(dòng)裝置動(dòng)作不正常時(shí),會(huì)在短時(shí)間內(nèi)產(chǎn)生大量的故障報(bào)警信息到達(dá)控制中心。其中包括大量的由保護(hù)或斷路器誤動(dòng)、拒動(dòng),信道傳輸干擾錯(cuò)誤,保護(hù)動(dòng)作時(shí)間偏差等因素造成的不確定性的知識(shí)和數(shù)據(jù)。

電網(wǎng)調(diào)度中心工作人員面對(duì)如此紛繁復(fù)雜的報(bào)警信息,要從中快速準(zhǔn)確的查找到故障源,判斷故障類(lèi)型,進(jìn)行正確的故障處理,專業(yè)知識(shí)的匱乏以及精神壓力可能會(huì)做出誤判,進(jìn)而造成電網(wǎng)故障范圍的擴(kuò)大或延長(zhǎng)供電系統(tǒng)恢復(fù)時(shí)間,因此變電設(shè)備故障診斷分析是電力生產(chǎn)業(yè)務(wù)的重中之重。

1 電網(wǎng)故障診斷模型構(gòu)建過(guò)程

1.1 數(shù)據(jù)選取與預(yù)處理

通過(guò)調(diào)研烏海地區(qū)的調(diào)度、生產(chǎn)相關(guān)主站系統(tǒng)數(shù)據(jù)和圖模情況,對(duì)多種電網(wǎng)監(jiān)控系統(tǒng)的跨平臺(tái)數(shù)據(jù)獲取和預(yù)處理?;陔娋W(wǎng)設(shè)備拓?fù)淠P蜆?gòu)建運(yùn)行數(shù)據(jù)、設(shè)備在線監(jiān)測(cè)及歷史故障信息等多維度統(tǒng)一存儲(chǔ)方式,結(jié)合多種大數(shù)據(jù)處理方法,對(duì)多源信息進(jìn)行一致性檢查、無(wú)效值剔除以及缺失值補(bǔ)漏,提供數(shù)據(jù)利用率。融合多種統(tǒng)計(jì)學(xué)模型與智能算法,建立數(shù)據(jù)關(guān)系預(yù)處理模型,對(duì)設(shè)備數(shù)據(jù)、運(yùn)行數(shù)據(jù)和生產(chǎn)數(shù)據(jù)等多元數(shù)據(jù)進(jìn)行預(yù)處理。

1.2 算法模型的選擇

數(shù)據(jù)挖掘算法的種類(lèi)多種多樣,技術(shù)特點(diǎn)和適應(yīng)性也不盡相同。因此需要根據(jù)不同的數(shù)據(jù)類(lèi)型選擇最為合適的算法。本文收集的設(shè)備狀態(tài)量是在設(shè)備不同故障類(lèi)型下獲得的,主要需要解決的是設(shè)備故障分類(lèi)問(wèn)題。由于涉及的狀態(tài)量較多,單一決策樹(shù)模型的分類(lèi)性能有時(shí)無(wú)法高效解決問(wèn)題。在決策樹(shù)算法的基礎(chǔ)上,學(xué)者專家又提出了一種具有更好的處理能力和處理效率的算法、即隨機(jī)森林算法。隨機(jī)森林算法得益于算法原理層次的隨機(jī)性和集成學(xué)習(xí)的優(yōu)勢(shì),使它在高維特征處理中具有更好的魯棒性,且抗過(guò)擬合能力更強(qiáng)。

1.3 基于隨機(jī)森林算法的電網(wǎng)設(shè)備故障診斷評(píng)估模型構(gòu)建過(guò)程

樣本集的抽樣。隨機(jī)森林算法是采用Bagging方法進(jìn)行抽樣的,Bagging 方法基于Bootstrap 重抽樣,可以增強(qiáng)樣本的隨機(jī)性。在從原始樣本集抽取樣本形成子樣本集的過(guò)程中,原始樣本集中的所有樣本都有可能被抽取。但受限算法特性,有一些樣本無(wú)法抽取,不被抽取的約為0.368。因此,隨機(jī)森林算法生成的每個(gè)子樣本集的樣本數(shù)約為原始樣本集的63.2%。子樣本集中的樣本會(huì)因Bagging 采樣特性而產(chǎn)生一些重復(fù),降低了構(gòu)造的決策樹(shù)產(chǎn)生局部最優(yōu)解的可能性,優(yōu)化了隨機(jī)森林算法的泛化性能。

決策樹(shù)的構(gòu)建。隨機(jī)森林的隨機(jī)性體現(xiàn)在子樣本集生成和屬性隨機(jī)選擇的過(guò)程中,建樹(shù)過(guò)程一般調(diào)用決策樹(shù)算法。通過(guò)比較決策樹(shù)常用的ID3、C4.5、CART 算法的特點(diǎn),考慮CART 算法只能生成二叉樹(shù),ID3算法傾向于選擇取值較多的屬性作為分支節(jié)點(diǎn),這會(huì)導(dǎo)致模型分類(lèi)性能下降。而C4.5算法不僅支持多個(gè)分支,還通過(guò)引入懲罰參數(shù)計(jì)算信息增益率,解決了ID3算法存在的問(wèn)題。故本文選擇C4.5算法作為隨機(jī)森林決策樹(shù)的構(gòu)建方法。

隨機(jī)森林的形成和組合。按照相同的建樹(shù)過(guò)程,將Bagging 抽取的不同數(shù)據(jù)集累計(jì)構(gòu)建起m 棵決策樹(shù)。將m 棵決策樹(shù)組合在一起就形成該數(shù)據(jù)集的隨機(jī)森林模型。根據(jù)各決策樹(shù)模型的輸出結(jié)果,按照規(guī)定好的投票機(jī)制(如一票否決制、少數(shù)服從多數(shù)、加權(quán)多數(shù)),決定隨機(jī)森林模型的最終輸出。

2 實(shí)例分析

2.1 樣本數(shù)據(jù)集的處理

本文收集的變壓器油中溶解氣體數(shù)據(jù)來(lái)源有烏海供電公司部分變壓器在線監(jiān)測(cè)和油化試驗(yàn)數(shù)據(jù)、內(nèi)蒙古電網(wǎng)變壓器歷史故障數(shù)據(jù)和期刊論文內(nèi)數(shù)據(jù),共收集了1039個(gè)用于構(gòu)建算法的變壓器油色譜樣本數(shù)據(jù)。樣本數(shù)據(jù)包括六種類(lèi)型的電力變壓器(正常、低能放電、高能放電、局部放電、中低溫過(guò)熱、高溫過(guò)熱)油所中溶解的H2、CH4、C2H6、C2H4、C2H2、CO、CO2的氣體含量。然后將收集故障數(shù)據(jù),按8∶2劃分為訓(xùn)練集1378組、測(cè)試集345組。在此基礎(chǔ)上進(jìn)行比較分析,驗(yàn)證隨機(jī)森林模型的性能。實(shí)驗(yàn)仿真平臺(tái)為Anaconda,編程語(yǔ)言為Python3.7。樣本集中各類(lèi)故障類(lèi)型個(gè)數(shù)為:高能放電275、高溫放電250、低能放電196、中低溫過(guò)熱152、正常狀態(tài)113、局部放電53。

2.2 模型參數(shù)的調(diào)整

調(diào)整參數(shù)的目的也是為了使模型達(dá)到泛化誤差的最低點(diǎn),從而使模型獲得更高的分?jǐn)?shù)。本文基于Python 的sklearn 庫(kù)對(duì)隨機(jī)森林模型的進(jìn)行參數(shù)調(diào)優(yōu),主要對(duì)模型影響最大的參數(shù)決策樹(shù)的數(shù)量(n_estimators)和決策樹(shù)最大深度(max_depth)進(jìn)行調(diào)優(yōu),直到最合適。調(diào)優(yōu)過(guò)程中測(cè)試集的準(zhǔn)確率變化如圖1。可看出,隨機(jī)森林的決策樹(shù)的數(shù)量和決策樹(shù)最大深度參數(shù)經(jīng)過(guò)5輪160次的迭代,變壓器故障的診斷正確率分別在第58、102、13、23、82次迭代中達(dá)到最優(yōu),如表1所示。根據(jù)測(cè)試集準(zhǔn)確率結(jié)果,最終選擇兩個(gè)參數(shù)分別50與8,準(zhǔn)確率最佳分?jǐn)?shù)為0.788461538。

表1 RF 測(cè)試集最佳參數(shù)表

2.3 模型結(jié)果分析與性能對(duì)比

2.3.1 不同模型性能對(duì)比

根據(jù)樣本集劃分,以無(wú)編碼比值作為特征參量輸入邏輯回歸模型、最近鄰算法模型、支持向量機(jī)分類(lèi)模型和隨機(jī)森林模型,進(jìn)行不同診斷模型的對(duì)比分析,其結(jié)果如表2所示。

表2 不同診斷模型的結(jié)果比較

可以看出,隨機(jī)森林診斷模型的各評(píng)價(jià)指標(biāo)均超過(guò)0.9,表現(xiàn)優(yōu)秀。本文提出模型分類(lèi)正確率較最近鄰算法模型、支持向量機(jī)分類(lèi)模型分別提升了8%和13%,衡量整體性能的F1分?jǐn)?shù)也遠(yuǎn)高于其余算法模型,這表明本文提出的診斷模型在故障診斷分類(lèi)方面具有優(yōu)越的性能。

2.3.2 不同故障集結(jié)果分析

為進(jìn)一步對(duì)比不同故障樣本集對(duì)模型診斷正確率的影響,將收集的樣本數(shù)據(jù)根據(jù)不同的故障類(lèi)型,分為6個(gè)樣本,再按8∶2比例劃分訓(xùn)練集和測(cè)試集,以未編碼比率作為特征輸入,通過(guò)比較獲得的診斷結(jié)果示于表3中??梢钥闯觯?shù)據(jù)、高能放電、中低溫過(guò)熱和高溫過(guò)熱等故障數(shù)據(jù)診斷精確率較高,F(xiàn)1分?jǐn)?shù)也均在0.8以上,診斷性能較好。

表3 不同故障集診斷結(jié)果比較

2.3.3 不同特征量對(duì)結(jié)果的影響

為了研究這些特征屬性對(duì)于整體模型的重要程度,分析了特征屬性對(duì)模型評(píng)分的影響,結(jié)果如圖1所示。可以看出,C10(C2H2/C2H4)、C13(C2H4/C2H6)、C14(C2H4/總)、C12(C2H2/總)、C11(C2H2/C2H6)對(duì)于整體的模型的影響程度排在1至5位。前三組特征量正是《變壓器油中溶解氣體分析與判斷導(dǎo)則》中推薦了三比值法的特征氣體含量,這從側(cè)面證明了該模型分類(lèi)的正確性。因此,對(duì)于特征量C14(C2H4/總)、C12(C2H2/總)在今后的故障診斷中,結(jié)合案例要重點(diǎn)關(guān)注其特征量,豐富故障的判斷依據(jù)。

將本文所開(kāi)發(fā)的故障預(yù)警系統(tǒng)應(yīng)用于烏海供電公司,通過(guò)實(shí)時(shí)分析該局110kV 新地變電站主變絕緣油色譜數(shù)據(jù),對(duì)主變的運(yùn)行狀況進(jìn)行了及時(shí)預(yù)警。圖3為烏海110kV 新地變電站主變絕緣油色譜在線監(jiān)測(cè)數(shù)據(jù),表4為烏海電業(yè)局110kV 新地變電站主變故障診斷結(jié)果。

表4 故障類(lèi)型診斷

通過(guò)絕緣油的熱力學(xué)研究表明,隨著故障點(diǎn)溫度的升高,變壓器油裂解產(chǎn)生的烴類(lèi)氣體按CH4->C2H6->C2H4->C2H2的順序推移。故障原因的分析也隨著氣體間含量比值的變化而改變。

3 結(jié)語(yǔ)

本文在研究各類(lèi)大數(shù)據(jù)算法的基礎(chǔ)上,提出一種基于隨機(jī)森林算法的變壓器故障診斷模型,并重點(diǎn)圍繞決策樹(shù)的數(shù)量和決策樹(shù)最大深度兩個(gè)參數(shù)進(jìn)行調(diào)整。以收集到的故障變壓器油中溶解氣體數(shù)據(jù)為例,對(duì)所提故障診斷模型進(jìn)行了數(shù)據(jù)訓(xùn)練和仿真測(cè)試。再通過(guò)對(duì)比邏輯回歸模型、最近鄰算法模型、支持向量機(jī)分類(lèi)模型以及隨機(jī)森林模型,得出提出的隨機(jī)森林模型具備更高的故障診斷正確率和性能。根據(jù)實(shí)際分析案例,證明了診斷模型的正確性和可行性,從而可以在以后的工作中將該診斷模型和系統(tǒng)運(yùn)用于實(shí)際,更早的發(fā)現(xiàn)了判斷設(shè)備故障,保障地區(qū)電網(wǎng)安全穩(wěn)定運(yùn)行。

猜你喜歡
決策樹(shù)故障診斷變壓器
比亞迪秦EV充電系統(tǒng)故障診斷與排除
基于神經(jīng)網(wǎng)絡(luò)的船舶電力系統(tǒng)故障診斷方法
基于包絡(luò)解調(diào)原理的低轉(zhuǎn)速滾動(dòng)軸承故障診斷
10KV變壓器配電安裝柜中常見(jiàn)問(wèn)題分析
理想變壓器的“三個(gè)不變”與“三個(gè)變”
簡(jiǎn)述一種基于C4.5的隨機(jī)決策樹(shù)集成分類(lèi)算法設(shè)計(jì)
變壓器經(jīng)濟(jì)運(yùn)行分析與應(yīng)用
變壓器經(jīng)濟(jì)運(yùn)行分析與應(yīng)用
決策樹(shù)學(xué)習(xí)的剪枝方法
理想變壓器的理解和應(yīng)用