国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于H-mine算法的變電站二次系統(tǒng)故障關(guān)聯(lián)分析

2021-10-16 06:10王鳴譽李鐵成任江波
關(guān)鍵詞:項集置信度關(guān)聯(lián)

王鳴譽,徐 巖,范 文,李鐵成,任江波

(1.華北電力大學 電氣與電子工程學院,河北 保定 071003;2.國網(wǎng)河北省電力有限公司電力科學研究院,河北 石家莊 050021;3.國網(wǎng)河北省電力有限公司,河北 石家莊 050021)

0 引 言

目前,智能變電站實現(xiàn)了數(shù)字化[1]。設(shè)備之間的物理回路變成了一種邏輯層面的連接關(guān)系[2],虛回路與物理回路的映射關(guān)系不可見,這種隱蔽的信息傳輸方式給運行人員帶來了很大的麻煩,目前二次回路的故障還是依賴工作人員的工作經(jīng)驗以及相應(yīng)的專業(yè)設(shè)備,同時故障發(fā)生時會產(chǎn)生很多冗余信息,同時這些故障信息還可能存在信息丟失或虛假信息,這使得故障難以迅速定位。

為解決上述問題,文獻[3]利用通信鏈路狀態(tài)對每一條回路進行分析,確定故障的大致位置,但是無法確定具體的故障裝置。文獻[4]采用了深度學習理論中的RNN模型,對二次設(shè)備故障進行建模,并利用典型二次回路驗證了該模型的性能,但是深度學習模型的選擇缺乏理論依據(jù),并且很難獲得完整的樣本集。文獻[5]提出了一種基于Petri網(wǎng)的GOOSE(Generic Object-Oriented Substation Event)回路故障診斷法,但是該方法需要用人力判斷變遷是否觸發(fā)。文獻[6]利用專家系統(tǒng)來對二次系統(tǒng)故障進行診斷,該方法所需的樣本量較大,很難做到完善,同時也不具備自學習的能力。

除了上述方法,目前關(guān)聯(lián)分析也被用于電力領(lǐng)域,關(guān)聯(lián)分析是數(shù)據(jù)挖掘中的一種關(guān)鍵的技術(shù),關(guān)聯(lián)分析的作用是發(fā)現(xiàn)不同數(shù)據(jù)之間的潛在聯(lián)系,通常關(guān)聯(lián)分析被用來進行通常用來預測數(shù)據(jù),文獻[7,8]利用apriori算法處理二次設(shè)備缺陷原因和二次設(shè)備之間的關(guān)系。但是apriori算法需要多次掃描整個數(shù)據(jù)庫,這大大降低了處理速度。文獻[9,10]使用FP-growth算法來分析二次設(shè)備缺陷,但由于該算法需要在過程中迭代產(chǎn)生大量臨時數(shù)據(jù)庫以及FP-tree,因此在稀疏數(shù)據(jù)庫中的處理速度較慢。

文獻[11]提出了一種H-mine算法,在運算時只處理總集中的一個分區(qū),因此在運算速度上H-mine算法要優(yōu)于apriori算法。同時由于H-mine在處理數(shù)據(jù)時不用產(chǎn)生大量相同前綴的FP-tree,因此該算法在處理大量稀疏數(shù)據(jù)時性能優(yōu)于FP-growth。

基于上述情況,本文提出了一種基于H-mine算法的二次系統(tǒng)故障診斷方法,該方法無需對每一條二次回路都做出分析,減少了關(guān)聯(lián)分析所需要的時間。使故障分析更加高效。

1 數(shù)據(jù)挖掘與關(guān)聯(lián)分析

1.1 數(shù)據(jù)挖掘的基本概念

數(shù)據(jù)挖掘的含義是找出隱藏在數(shù)據(jù)背后的信息,隨著近年來機器學習的發(fā)展,數(shù)據(jù)挖掘技術(shù)目前已經(jīng)在人工智能、商業(yè)、醫(yī)療業(yè)等行業(yè)得到廣泛應(yīng)用。

數(shù)據(jù)挖掘包括了:機器學習、統(tǒng)計學等領(lǐng)域的知識[12]。數(shù)據(jù)挖掘得到的結(jié)論不僅可以用來提高決策人員決策水平也可以用來預測事件的結(jié)果、為工作人員提供參考。

數(shù)據(jù)挖掘的過程包含如下幾個步驟:

(1)數(shù)據(jù)準備

數(shù)據(jù)準備主要是將數(shù)據(jù)進行篩選、合并,明確模糊數(shù)據(jù)、刪除壞數(shù)據(jù)、選擇出能夠利用的數(shù)據(jù),縮小挖掘的范圍。同時將這些數(shù)據(jù)進行初步處理。

(2)數(shù)據(jù)挖掘

數(shù)據(jù)挖掘指用合理的算法,選擇合適的軟件和工具,對上一步中處理好的數(shù)據(jù)進行挖掘操作,生成結(jié)果,以便于工作人員分析。

(3)解釋結(jié)果

根據(jù)上一步中挖掘出的結(jié)果,分析出有用的信息,還要刪除掉參考價值低的結(jié)果,篩選出參考價值高的結(jié)果,以便于決策人員分析。

1.2 關(guān)聯(lián)分析的基本概念

關(guān)聯(lián)分析是指在數(shù)據(jù)中尋找關(guān)聯(lián)關(guān)系,如此一來,便可以通過一種數(shù)據(jù)判斷另一種數(shù)據(jù)的可能的變化。關(guān)聯(lián)分析主要分為:關(guān)聯(lián)規(guī)則、序列模式[13]。

生活中關(guān)聯(lián)規(guī)則通常應(yīng)用在網(wǎng)站、超市、服務(wù)行業(yè)等領(lǐng)域,舉個例子,當我們在網(wǎng)頁上搜索我們想要的信息時,搜索框會根據(jù)我們輸入的部分信息彈出一些選項供我們選擇,我們可以從中選取想要的信息進行搜索。

這些選項便是根據(jù)我們輸入的信息生成的,生成關(guān)聯(lián)規(guī)則就像A→B,A是我們輸入的信息,在關(guān)聯(lián)規(guī)則中被稱為前項集。B是網(wǎng)頁彈出的選項,被稱為后項集。而關(guān)聯(lián)規(guī)則的含義是在A發(fā)生的情況下,B也會發(fā)生。文中將關(guān)聯(lián)規(guī)則設(shè)置為A為故障報警信號,B為故障原因的形式,以此來推斷二次系統(tǒng)發(fā)出某種故障信號時的具體故障原因。

定義I={i1,i2,…,im}是項目集合,含有k個項目的項目集合被稱作k項集、事務(wù)集T={t1,t2,…,tn}包含于I。衡量關(guān)聯(lián)規(guī)則強弱的指標主要為如下幾種:

(1)支持度:該指標表示某一種項目在集合中出現(xiàn)的頻率。如果某一項集的支持度不小于規(guī)定的最小值,那么則稱之為頻繁項集。該指標可以用來剔除那些出現(xiàn)次數(shù)太少沒有研究價值的數(shù)據(jù),其公式如下,A為事務(wù)集,N為事務(wù)總數(shù)。

(1)

(2)置信度:表示的是前項集發(fā)生的條件下,后項集發(fā)生的概率,置信度在文中是指二次系統(tǒng)發(fā)出故障報警信號A時,故障原因為B的概率,如果某一關(guān)聯(lián)規(guī)則的置信度不小于規(guī)定的最小值,則稱之為強關(guān)聯(lián)規(guī)則,計算公式如下,A、B為事務(wù)集:

(2)

(3)Kulc度:使用Kulc度是為了減少零事務(wù)的影響,Kulc度越大相關(guān)性越大。其公式如下:

(3)

式中:con為置信度;A、B為事務(wù)集。

(4)不平衡比:該式可以衡量在某一關(guān)聯(lián)規(guī)則下前后項集之間的關(guān)系密切程度,若不平衡比值接近于0,則證明在A發(fā)生的前提下,B大概率也發(fā)生,反過來也成立,二者有密切的關(guān)系,該關(guān)聯(lián)規(guī)則即為有意義的關(guān)聯(lián)規(guī)則;而如果不平衡遠大于零,則不能證明B發(fā)生同時A大概率發(fā)生,即兩種事務(wù)缺乏關(guān)聯(lián)關(guān)系,該關(guān)聯(lián)規(guī)則的參考價值較小。

其公式如下:

(4)

式中:Sup為支持度,A、B為事務(wù)集。

2 H-mine算法原理

H-mine通過生成H-struct來對數(shù)據(jù)進行處理,與FP-growth算法類似,使用頻繁項集增長的方法,不必生成大量的候選集。除此之外,與FP-growth相比,H-mine不生成FP-tree以及生成FP-tree所需要的迭代數(shù)據(jù)庫,從而在很多情況下節(jié)省了存儲空間和時間;與Apriori相比,H-mine不用多次遍歷總數(shù)據(jù)集,生成很多候選集,該算法只用遍歷兩次數(shù)據(jù)庫,生成H-struct,之后的每次掃描只在H-struct中進行。

H-mine首先掃描一遍數(shù)據(jù)庫,按照不小于最小支持度的原則篩選出符合要求的1-項集,并且按照排列順序?qū)⑦@些項集存儲在表H中。然后再掃描一次數(shù)據(jù)庫,將各事務(wù)按字母排列順序存儲在一個隊列中,由表格H中的各項作為頭指針把首項相同的事務(wù)串聯(lián)成一個鏈接。

下面用一個具體的例子來說明H-mine算法的原理,設(shè)置最小支持度計數(shù)為2。已知數(shù)據(jù)庫TDB的事務(wù)集以及篩選后的頻繁項如表1所示。

從表1中可見A、K、M、N、H、I不符和支持度要求,這便是第一次掃描,將事務(wù)集篩選后得到表H:{B:3,C:2,D:3,E:2,F(xiàn):2,G:3}。而文章需要挖掘的頻繁項集分為:包含B項、包含C項但不包含B項、包含D項但不包含C項和B項、包含E項但不包含D、C、B項、包含F(xiàn)項但不包含E、D、C、B項、以及只包含G項。

將H表中的元素作為頭指針建立H-struct。如圖1所示。

表H也被稱作Header table H,它包括三個區(qū)域,分別是頻繁項、支持度計數(shù)以及它們的指針。表H中的結(jié)點通過指針將所有首項相同的事務(wù)連接起來,如上圖中的項B,它鏈接首項都是B的1、2、4三個事務(wù),項C鏈接3事務(wù),而項D、E、F、G由于沒有首項是這些項的事務(wù),因此不必建立鏈接。

在建立H-struct的時候進行了第二次掃描,建立好H-struct后,數(shù)據(jù)挖掘工作便只在H-struct上進行,首先在H-struct中對表H中的五個1-項集進行挖掘,遍歷B隊列,找出B隊列中的所有頻繁項,建立表HB,結(jié)構(gòu)與表H相同,但支持度計數(shù)則是根據(jù)B隊列中的元素來記錄的??梢郧蟮幂敵龅念l繁2-項集為:{BD:3,BG:2}。如圖2所示。

圖2 表HB圖

以此類推,挖掘包含B、D的項,這次不僅要挖掘BD隊列,還要在其中插入表H中已經(jīng)建立過指針的2事務(wù),因為它里面同時含有B和D,從而得到完整的BD數(shù)據(jù)集,這次挖出了頻繁3-項集BDG:2。最后還要搜索以BG為首項的事務(wù),但是由于表H和表HB中沒有指向BG的指針,所以沒有頻繁項集產(chǎn)生。綜上所述便是挖掘以B為首項的事務(wù)的過程,接下來是挖掘包含C但不包含B的頻繁項集,這個過程需要挖掘C隊列和B隊列中包含C隊列的隊列,因此需要將B隊列插入到適當?shù)奈恢茫鐖D3所示,BCDG被插入到CEFG之后。

圖3 建立C隊列的過程圖

需要注意的是在挖掘C隊列的時候,不產(chǎn)生關(guān)于B的頻繁項集。其他的頻繁項集也是按照同樣的方法來進行挖掘。

上述挖掘完畢之后,將所有的頻繁項集按照公式(2)計算關(guān)聯(lián)規(guī)則的置信度,例如上例中的BD∶3和B∶3,可以得到B→D的置信度為100%。最后,按照置信度指標選出符合要求的關(guān)聯(lián)規(guī)則。

H-mine算法的流程圖如圖4所示。

圖4 H-mine流程圖

3 二次回路模型以及故障數(shù)據(jù)庫的建立

3.1 故障數(shù)據(jù)庫的建立

智能站二次回路故障報警數(shù)據(jù)主要通過綜合自動化系統(tǒng)的報警信息以及網(wǎng)絡(luò)分析裝置的監(jiān)測信息的獲得,其中綜合自動化系統(tǒng)包括的主要報警信息有:智能裝置的異常報警信號、斷路器的監(jiān)測報警信號以及電源系統(tǒng)的報警信號。而智能站配置網(wǎng)絡(luò)分析裝置記錄的報文主要包括SV采樣報文、GOOSE通信報文以及MMS通信報文,這些報文經(jīng)過交換機的處理,直接傳送到調(diào)度系統(tǒng)。

文中主要分析的是智能裝置的報警信號以及網(wǎng)絡(luò)分析裝置給出的網(wǎng)絡(luò)異常報文中的SV采樣報文和GOOSE通信報文。其中智能裝置報警信號主要包括:數(shù)據(jù)采樣異常、裝置自檢異常、電源失電故障等。

SV采樣報文需要檢測的主要有以下幾項:采樣計數(shù)是否正常、采樣頻率是否正常、數(shù)據(jù)同步是否正常、配置文件是否正常,上述幾種情況只要有一種出現(xiàn)異常,則觸發(fā)事件異常告警。

GOOSE通信報文需要檢測的主要包括:報文計數(shù)是否正常、流量是否不大于流量上限、是否出現(xiàn)斷鏈情況、配置文件是否正常,上述幾種情況只要出現(xiàn)一種異常,則觸發(fā)異常告警。

報警數(shù)據(jù)的結(jié)構(gòu)圖如圖5所示。

圖5 故障數(shù)據(jù)結(jié)構(gòu)圖

文中數(shù)據(jù)庫中的故障數(shù)據(jù)來源于檢修記錄以及調(diào)度管理系統(tǒng),包括二次系統(tǒng)異常情況、二次系統(tǒng)檢驗中發(fā)現(xiàn)的問題與處理情況,將這些數(shù)據(jù)是用自然語言描述的,在篩選前需要人工提取。這些數(shù)據(jù)可以具體分為:廠站名稱、發(fā)生故障的時間、報警內(nèi)容、故障類型、元件,這些數(shù)據(jù)組成了多源異構(gòu)數(shù)據(jù)集[14]異構(gòu)是指這些數(shù)據(jù)包括數(shù)字信息、自然語言描述的文字;多源是指數(shù)據(jù)存在多個來源。

這些數(shù)據(jù)在進行關(guān)聯(lián)分析前首先要經(jīng)過處理,首先將自然語言描述的內(nèi)容進行統(tǒng)一,尤其是檢修記錄表中人工記錄的報警信號和故障裝置,如:在某些記錄中出現(xiàn)的“GOOSE斷鏈”、“GOOSE中斷”,等描述GOOSE中斷的信號統(tǒng)一改成斷鏈;在數(shù)據(jù)庫中,同一故障裝置的記錄有時也會因為人為原因出現(xiàn)偏差,如:110 kV#線路智能終端A和IL1101A:151智能終端1,因此,需要將這些數(shù)據(jù)統(tǒng)一成:110 kV線路智能終端151。

處理后得到的標準數(shù)據(jù)庫模型如表2。

表2 數(shù)據(jù)庫模型表

文章主要是對報警內(nèi)容和故障類型之間的關(guān)聯(lián)關(guān)系進行挖掘,尋找報警信息與故障原因之間的關(guān)聯(lián)規(guī)則可以幫助運行人員更加方便的做出診斷,數(shù)據(jù)挖掘時,需要故障數(shù)據(jù)處理成如下集合形式:

N=(n1,n2,n3)

(5)

式中:n1表示故障的具體裝置;n2表示故障報警信息;n3表示故障原因。

在對故障數(shù)據(jù)庫中的故障數(shù)據(jù)進行關(guān)聯(lián)分析時,由于現(xiàn)有的技術(shù)還不足以完美的處理自然語言,因此在進行關(guān)聯(lián)分析時還需要在每一項中附加項目識別碼,如此一來不僅為關(guān)聯(lián)分析提供了方便,同時還可以防止在同一種數(shù)據(jù)類型下生成關(guān)聯(lián)規(guī)則,即關(guān)聯(lián)分析只在報警內(nèi)容和故障類型之間進行,不會在報警內(nèi)容內(nèi)部或者故障類型內(nèi)部進行同種數(shù)據(jù)類型的分析。

綜上所述,故障分析的步驟分為以下幾步:

(1)將數(shù)據(jù)處理后導入庫中;

(2)從數(shù)據(jù)庫導入訓練集數(shù)據(jù);

(3)將數(shù)據(jù)用H-mine算法進行關(guān)聯(lián)分析;

(4)檢查是否符合支持度指標要求;

(5)得出關(guān)聯(lián)規(guī)則;

(6)整理出符合置信度、Kulc度、以及不平衡比指標要求的結(jié)果;

(7)將關(guān)聯(lián)規(guī)則整理后,作為診斷結(jié)果提供給運行人員當作參考。

故障診斷流程圖如圖6所示。

圖6 故障診斷流程圖

3.2 二次回路模型的建立

關(guān)于二次回路模型的建立,文獻[15]提出了一種基于圖的遍歷算法的虛實回路對應(yīng)法,文獻[16]利用SCD(Substation Configuration Description)文件的網(wǎng)絡(luò)、虛端子配置信息以及裝置信息來實現(xiàn)SCD文件可視化。通過查閱相關(guān)文獻[17-20]以及結(jié)合實際SCD文件,文章采用解析SCD文件中的部分字段來實現(xiàn)二次回路的構(gòu)建。

SCD文件中的PhusConn元素含有IED的物理端口信息,包括端口、插頭類型等,其中Port字段描述了物理端口號、Cable字段描述了端口所連接的光纖。

在SCD文件中的Inputs部分含有每個裝置的GOOSE和SV連線信息。其中包括裝置本身的輸入虛端子信號和來自其他裝置的輸出信號,每個內(nèi)部虛端子信號對應(yīng)一個外部輸出信號。

由很多的元素構(gòu)成,每個代表一個虛端子連線。中的intAdir屬性值就是虛端子的內(nèi)部地址;其余屬性,如daName、doName、iedName等,級聯(lián)后就是外部裝置的輸出信號。

綜上所述,文章首先解析SCD文件得到物理端口號以及光纖標識,其次再利用Inputs字段得到虛回路的端子連接關(guān)系,最后根據(jù)虛端子連線和物理端口號尋找每個虛回路所包含的實際物理裝置,實現(xiàn)二次回路的建模。以便于后續(xù)分析。

4 算例分析

以某智能站為例,該站經(jīng)過SCD文件解析后的二次回路圖如圖7所示。

圖7 二次回路圖

上圖中L為光纖、PM是母線保護裝置、PL是線路保護裝置101、IL是智能終端151、SW是交換機、CL為測控單元101:

變電站二次回路經(jīng)過可視化,看不見的虛回路變成了可視的物理回路,以便于后續(xù)的故障診斷。

以數(shù)據(jù)庫中近幾年來的二次故障數(shù)據(jù)為例,對二次系統(tǒng)故障報警信號和故障類型進行關(guān)聯(lián)分析,首先篩選出四分之一的數(shù)據(jù)作為測試集,對結(jié)果進行驗證。其次設(shè)置最小支持度為1%,最小置信度為40%,Kulc閾值為0.4。采用H-mine算法進行挖掘,尋找關(guān)聯(lián)規(guī)則。最后還需要把挖掘出來的關(guān)聯(lián)規(guī)則用來與Kulc度量和不平衡比進行對比,篩選出那些有意義的強關(guān)聯(lián)規(guī)則。

挖掘出的某變電站部分置信度較高的幾則關(guān)聯(lián)規(guī)則如表3,表3中的故障信息為關(guān)聯(lián)前項集、故障原因為關(guān)聯(lián)后項集。

表3 部分強關(guān)聯(lián)規(guī)則

經(jīng)過上述數(shù)據(jù)挖掘工作,發(fā)現(xiàn)智能變電站二次故障報警信息和故障原因之間的關(guān)系,最后利用剩下的四分之一的數(shù)據(jù)驗證結(jié)果,將故障信息和挖掘到的故障原因與測試集中的實際情況進行人工對比,核對在出現(xiàn)某種故障信息的情況下,挖掘出的故障原因與實際故障原因的匹配率,即可驗證挖掘結(jié)果的準確率,對比結(jié)果如表4、表5所示。

表4 驗證結(jié)果

表5 驗證結(jié)果

由上表可見,關(guān)聯(lián)分析準確率可以達到90%左右,驗證了關(guān)聯(lián)分析在二次系統(tǒng)故障診斷方面的準確性,這些結(jié)果可以作為工作人員在檢修時的參考依據(jù),為維修人員提供便利。

與此同時,本文引入了沒有引入Kulc度量和不平衡比這兩個指標時的關(guān)聯(lián)分析結(jié)果,并將這些分析結(jié)果與測試集進行對比,由于沒有引入Kulc度量和不平衡比這兩個指標,關(guān)聯(lián)規(guī)則受到零事務(wù)和無意義的關(guān)聯(lián)規(guī)則的影響,可以發(fā)現(xiàn),此時準確率較低。

驗證過程如下,將測試集中的故障特征信號作為關(guān)聯(lián)規(guī)則的前置條件,找尋符合指標要求的關(guān)聯(lián)規(guī)則,驗證關(guān)聯(lián)規(guī)則的后件是否與數(shù)據(jù)庫中的故障元件一致。

算例1:圖7所述的變電站某次保護誤動時,調(diào)度中心收到如下報警信號:保護裝置101 GOOSE斷鏈、智能終端151 GOOSE斷鏈兩種告警信號,從圖7中可以看到保護裝置、智能終端兩種設(shè)備之間有一條光纖鏈路,根據(jù)該變電站數(shù)據(jù)挖掘結(jié)果可以發(fā)現(xiàn)在以上信息為關(guān)聯(lián)規(guī)則前置條件時,后件為L8鏈路故障的關(guān)聯(lián)規(guī)則的置信度為63.6%,其他結(jié)果均不滿足置信度指標要求,因此可以判斷故障發(fā)生在L8鏈路。對比數(shù)據(jù)庫,發(fā)現(xiàn)與數(shù)據(jù)庫中的故障元件一致。

算例2:在該變電站某次二次系統(tǒng)故障中,二次系統(tǒng)出現(xiàn)如下告警信號:11-7合并單元 GOOSE斷鏈、測控裝置101 GOOSE斷鏈、合并單元11-7 裝置異常告警。從圖7可知該故障發(fā)生在合并單元-交換機-測控裝置這條回路上。從該站的關(guān)聯(lián)分析結(jié)果可以發(fā)現(xiàn)故障原因為11-7合并單元 2-A端口和測控裝置1-A端口的置信度均大于50%,但是經(jīng)過不平衡比計算,只有11-7合并單元2-A端口的不平衡比符合指標要求,因此故障發(fā)生的在11-7合并單元2-A端口。對比數(shù)據(jù)庫得知結(jié)論正確。

除此之外,為了驗證H-mine算法性能的優(yōu)越性,本文還設(shè)置了幾組數(shù)據(jù)作為樣本,用apriori算法和H-mine算法分別對他們進行關(guān)聯(lián)分析,挖掘出頻繁項集,設(shè)置最小支持度為1%,同時將它們處理這些數(shù)據(jù)的時間記錄下來,做成對比圖,結(jié)果如圖8所示。

圖8 apriori和H-mine對比圖

從圖8可見,H-mine算法相比較于傳統(tǒng)的apriori算法耗時較短、效率較高。同時隨著樣本數(shù)量的越來越多,傳統(tǒng)apriori算法和H-mine算法相比耗時差越來越大。由此可以證明H-mine算法的性能優(yōu)于apriori算法。

由于故障數(shù)據(jù)庫中報警信號種類繁多、故障類型也大不相同,因此庫中的數(shù)據(jù)較為稀疏;同時又由于數(shù)據(jù)庫的數(shù)據(jù)樣本過多,因此不應(yīng)將支持度指標設(shè)置的太大,文中選擇的指標是1%,這更增加了在FP-growth算法中生成的FP-tree分枝,與H-mine算法相比較,F(xiàn)P-tree的運算速度會比較慢。圖9是兩者運算速度比較,最小支持度設(shè)置為1%。

圖9 FP-growth和H-mine對比圖

從圖9可見,H-mine算法和FP-growth算法相比在處理稀疏數(shù)據(jù)時,明顯效率更高,而且隨著數(shù)據(jù)越來越多,H-mine算法的優(yōu)勢也越來越明顯。

5 結(jié) 論

文中利用H-mine算法對變電站二次系統(tǒng)故障進行診斷,該算法利用H-struct與傳統(tǒng)apriori、FP-growth算法相比減少了耗時,可以實現(xiàn)對故障數(shù)據(jù)的快速挖掘,找到故障原因與故障報警信息之間的關(guān)聯(lián)關(guān)系。使用H-mine算法進行分析時,無需對每一條二次回路都進行分析,只需利用歷史數(shù)據(jù)便可以得到關(guān)聯(lián)規(guī)則,關(guān)聯(lián)規(guī)則可以作為診斷結(jié)果給二次系統(tǒng)檢修人員提供參考依據(jù)和建議。

猜你喜歡
項集置信度關(guān)聯(lián)
基于數(shù)據(jù)置信度衰減的多傳感器區(qū)間估計融合方法
基于哈希表與十字鏈表存儲的Apriori算法優(yōu)化
一種基于定位置信度預測的二階段目標檢測方法
Sp-IEclat:一種大數(shù)據(jù)并行關(guān)聯(lián)規(guī)則挖掘算法
基于哈希樹的并行關(guān)聯(lián)規(guī)則挖掘算法研究?
“一帶一路”遞進,關(guān)聯(lián)民生更緊
奇趣搭配
智趣
校核、驗證與確認在紅外輻射特性測量中的應(yīng)用
試論棋例裁決難點——無關(guān)聯(lián)①
县级市| 会昌县| 沾化县| 崇义县| 大厂| 广东省| 崇文区| 石阡县| 吐鲁番市| 桂阳县| 正蓝旗| 姜堰市| 信阳市| 陆良县| 宁蒗| 丹东市| 长治市| 江华| 鹤庆县| 海口市| 安吉县| 威宁| 封开县| 诏安县| 呼和浩特市| 兴城市| 平乐县| 中阳县| 稻城县| 龙泉市| 昌宁县| 平凉市| 景德镇市| 白沙| 东山县| 五华县| 永寿县| 永宁县| 革吉县| 乌苏市| 梁河县|