(國(guó)網(wǎng)湖北省電力有限公司武漢供電公司,湖北武漢 430077)
隨著電網(wǎng)快速發(fā)展,投運(yùn)的變電站數(shù)量愈來(lái)愈多,二次設(shè)備投運(yùn)數(shù)量也在快速增多。與此同時(shí),二次設(shè)備出現(xiàn)缺陷的概率也在上升,使檢修人員需要更多時(shí)間去處理設(shè)備缺陷,降低工作效率。
通過(guò)查閱二次設(shè)備缺陷處理記錄,發(fā)現(xiàn)某些設(shè)備缺陷之間一定程度上存在關(guān)聯(lián)性。面對(duì)大量的缺陷處理記錄,采用數(shù)據(jù)挖掘算法使得厘清缺陷之間的關(guān)聯(lián)性成為可能[1-2]。
文中利用韓嘉煒等人于2000年提出的關(guān)聯(lián)分析算法即FP-Growth算法,對(duì)變電站二次設(shè)備產(chǎn)生的缺陷進(jìn)行關(guān)聯(lián)性分析[3],能為供電公司檢修人員提供缺陷預(yù)測(cè)功能,可在一定程度上提升工作效率。
在當(dāng)前技術(shù)條件下,武漢市尚在運(yùn)行的變電站包括綜合自動(dòng)化變電站和智能變電站兩種。兩種變電站的二次設(shè)備在實(shí)現(xiàn)方式上存在較大的區(qū)別,綜合自動(dòng)化變電站的功能由設(shè)備和電纜回路共同決定,而智能變電站則通過(guò)網(wǎng)絡(luò)直接將設(shè)備連接起來(lái),實(shí)現(xiàn)數(shù)據(jù)以及資源的共享、功能的集成化。
因此需借助關(guān)聯(lián)規(guī)則挖掘算法FP-Growth,分別對(duì)兩類(lèi)變電站的設(shè)備缺陷進(jìn)行關(guān)聯(lián)規(guī)則分析,以便發(fā)掘出其中存在的關(guān)聯(lián)性[4-6]。文中采用FP-Growth算法[7]中支持度與置信度這兩種指標(biāo)來(lái)發(fā)掘各類(lèi)設(shè)備缺陷之間的關(guān)聯(lián)規(guī)則。查閱了過(guò)往的缺陷處理記錄之后,不難將缺陷分為以下6種類(lèi)別:主變壓器二次設(shè)備的缺陷、110kV及220kV線路二次設(shè)備的缺陷、母線保護(hù)裝置的缺陷、10kV線路二次設(shè)備的缺陷、備自投裝置的缺陷、故障錄波裝置的缺陷。接下來(lái)通過(guò)數(shù)據(jù)挖掘的方式,對(duì)以上6類(lèi)設(shè)備的缺陷進(jìn)行關(guān)聯(lián)性分析[8-9],找到設(shè)備中出現(xiàn)故障頻次較高的部分,使檢修人員的工作效率更高。
由于變電站二次設(shè)備缺陷數(shù)量多、類(lèi)型復(fù)雜,為了能夠進(jìn)一步分析其中的關(guān)聯(lián)規(guī)則,就需要建立相應(yīng)的模型以便進(jìn)行數(shù)據(jù)挖掘。模型建立的流程圖如圖1所示。
圖1 變電站設(shè)備缺陷關(guān)聯(lián)規(guī)則建模流程圖
進(jìn)行數(shù)據(jù)挖掘前,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。首先將二次設(shè)備的缺陷,按照變電站類(lèi)型分為智能變電站和綜合自動(dòng)化變電站的缺陷;然后按照前文提到的缺陷分類(lèi)方式分為6種;然后將設(shè)備中常發(fā)生故障的部位(易損部位)羅列出來(lái);隨后對(duì)經(jīng)數(shù)據(jù)挖掘得到的關(guān)聯(lián)規(guī)則進(jìn)行支持度和置信度的驗(yàn)證,即可實(shí)現(xiàn)二次設(shè)備缺陷與易損部位之間的關(guān)聯(lián)性分析;最后將得到的關(guān)聯(lián)規(guī)則存入缺陷關(guān)聯(lián)性分析數(shù)據(jù)庫(kù)中。
文中采用FP-Growth算法進(jìn)行關(guān)聯(lián)規(guī)則分析。為確定挖掘到的關(guān)聯(lián)規(guī)則是否可靠,文中引入支持度與置信度來(lái)判定關(guān)聯(lián)規(guī)則的可靠性。以下范例中,以項(xiàng)目集N為例,分析事物X與事物Y之間的關(guān)聯(lián)規(guī)則:
(1)支持度(support)。在所有的數(shù)據(jù)中,{X,Y}出現(xiàn)的可能性,即項(xiàng)目集中{X,Y}同時(shí)出現(xiàn)的概率,如式(1)所示。
其中N表示項(xiàng)目集的總數(shù)。該指標(biāo)是判斷關(guān)聯(lián)規(guī)則可靠性的約束條件,能計(jì)算出關(guān)聯(lián)規(guī)則的出現(xiàn)頻率,通過(guò)設(shè)定最小支持度的閾值(minsup),刪去出現(xiàn)頻次較低的無(wú)意義規(guī)則,使頻繁出現(xiàn)的關(guān)聯(lián)規(guī)則得以保留,篩選出滿足式(2)的項(xiàng)集Z,即為頻繁項(xiàng)集。
(2)置信度(confidence)。在關(guān)聯(lián)規(guī)則中的事件X已經(jīng)發(fā)生的情況下,另一關(guān)聯(lián)規(guī)則事件Y發(fā)生的概率,即含有X項(xiàng)集情況下,同時(shí)含有Y項(xiàng)集的概率,如式(3)所示。
在經(jīng)過(guò)支持度、置信度驗(yàn)證后,剔除出現(xiàn)頻率低的干擾因素,篩選出符合條件的關(guān)聯(lián)規(guī)則。
以供電公司提供的近3年變電站二次設(shè)備缺陷處理記錄為例,對(duì)變電站二次設(shè)備缺陷進(jìn)行關(guān)聯(lián)規(guī)則分析。
經(jīng)數(shù)據(jù)預(yù)處理后,篩選出共計(jì)1560條數(shù)據(jù)采用FPGrowth算法進(jìn)行挖掘,尋找其中存在的關(guān)聯(lián)規(guī)則;結(jié)合專(zhuān)家經(jīng)驗(yàn),設(shè)置最小支持度為25%,最小置信度為65%。
為驗(yàn)證關(guān)聯(lián)規(guī)則分析的準(zhǔn)確性,文中將前兩年共計(jì)1060條數(shù)據(jù)作為訓(xùn)練樣本集,建立設(shè)備缺陷關(guān)聯(lián)性分析數(shù)據(jù)庫(kù);再將第三年共計(jì)500條數(shù)據(jù)作為測(cè)試集,對(duì)挖掘到的關(guān)聯(lián)規(guī)則進(jìn)行匹配與驗(yàn)證。
表1 訓(xùn)練樣本集中發(fā)現(xiàn)的關(guān)聯(lián)規(guī)則
首先對(duì)訓(xùn)練樣本集的1060條數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,將置信度與支持度作為約束條件得到可靠的設(shè)備缺陷關(guān)聯(lián)規(guī)則,如表1所示。
接下來(lái)對(duì)訓(xùn)練樣本集進(jìn)行數(shù)據(jù)學(xué)習(xí),挖掘二次設(shè)備缺陷與易損部位間存在的關(guān)聯(lián)規(guī)則并存入關(guān)聯(lián)性分析數(shù)據(jù)庫(kù)。
我們將第3年的500條數(shù)據(jù)作為測(cè)試集,對(duì)訓(xùn)練樣本集中發(fā)現(xiàn)的關(guān)聯(lián)規(guī)則進(jìn)行驗(yàn)證:將挖掘到的關(guān)聯(lián)規(guī)則、易損部位與測(cè)試集實(shí)際得到的關(guān)聯(lián)規(guī)則結(jié)果進(jìn)行對(duì)比,根據(jù)結(jié)果得出文中所采用方法的適用性。
通過(guò)數(shù)據(jù)挖掘出的關(guān)聯(lián)規(guī)則,從表1中的序號(hào)2來(lái)看,發(fā)現(xiàn)綜合自動(dòng)化站的備自投裝置若出現(xiàn)缺陷,可能由于保護(hù)裝置插件出現(xiàn)故障,能指導(dǎo)檢修人員對(duì)備自投裝置的插件增強(qiáng)維護(hù)力度,降低故障發(fā)生概率,提高可靠性。而通過(guò)表1中的序號(hào)5來(lái)看,能發(fā)現(xiàn)智能站母線保護(hù)裝置出現(xiàn)的故障,有較大概率是光纖故障引發(fā),可指導(dǎo)檢修人員加強(qiáng)光纖的維護(hù)。借此建立數(shù)據(jù)庫(kù),發(fā)現(xiàn)變電站設(shè)備存在的易損部位。
以兩個(gè)月的時(shí)長(zhǎng)為分類(lèi)方式,統(tǒng)計(jì)最后一年的數(shù)據(jù),如表2所示,用以驗(yàn)證文中算法在綜合自動(dòng)化變電站和智能變電站的適用性。從缺陷查準(zhǔn)率的結(jié)果中可知,綜合自動(dòng)化變電站較之智能站要高出10%,是由于智能站的大量數(shù)據(jù)通過(guò)網(wǎng)絡(luò)傳輸,出現(xiàn)故障的部位分散性較大,不利于檢修人員進(jìn)行維護(hù);而綜合自動(dòng)化變電站通過(guò)線纜及繼電器實(shí)現(xiàn)二次設(shè)備的繼電保護(hù),出現(xiàn)故障更易處理,故查準(zhǔn)率較高。因此文中所采用算法更適用于綜合自動(dòng)化變電站的二次設(shè)備缺陷預(yù)測(cè)。
表2 文中算法在兩類(lèi)變電站的缺陷查準(zhǔn)率
文中將二次設(shè)備的缺陷按照變電站類(lèi)型分為綜合自動(dòng)化站和智能站進(jìn)行分析,采用FP-Growth算法篩選出二次設(shè)備缺陷與易損部位之間的關(guān)聯(lián)規(guī)則,得出該算法適用性。
結(jié)果表明:利用文中算法,能剔除干擾數(shù)據(jù),較為高效發(fā)現(xiàn)變電站特別是綜合自動(dòng)化變電站中二次設(shè)備缺陷與易損部位之間的關(guān)聯(lián)規(guī)則,協(xié)助檢修人員發(fā)現(xiàn)二次設(shè)備缺陷,保障電網(wǎng)安全穩(wěn)定運(yùn)行。