朱文灝 郭其一
(1.同濟大學電子與信息工程學院,上海 201804;2.上海施耐德低壓終端電器有限公司,上海 201109)
在電力電子和現(xiàn)代控制理論的發(fā)展背景下,微電網第一次被R.H.Lasseter 教授于2001年提出[1]。這是一種新型的基于信息網絡的能量供應和管理技術,有利于能源可持續(xù)發(fā)展、需求側管理和各種能源最大限度地使用[2]。計算機憑其快速的計算能力被廣泛用作微網故障分析,它能快速的、準確的給出分析結果,并為調度決策提供合理的操作參考[3]。
微網系統(tǒng)故障往往具有復雜性,傳統(tǒng)的數學方法不能描述具有多重故障類型的模型[4]。隨著人工智能技術的發(fā)展,尤其是在仿真人類處理各種問題的能力方面的發(fā)展,使其被許多學者廣泛接受,并成功應用于電力系統(tǒng)故障檢測領域。C.A.Petri 發(fā)展了Petri 網絡數學模型,這個模型適用與小范圍內具有穩(wěn)定結構電網的故障檢測[5]。但同時,這個模型在設備數量經常變化的大范圍電網應用上存在許多局限性。為了減少故障樣本記錄和無價值的條件特征,Z.Pawlak 將粗糙集理論應用于電網故障檢測[6]。LA Zadeh 提出了一種基于模糊理論的電網故障檢測模型,來處理非確定性問題[7]。但當存在許多不確定性因素時,問題仍很難求解。Pitts 將人工神經網絡應用到故障檢測中,該方法便于將故障類型和故障信號的邏輯關系分清楚[8]。但人工神經網絡在應用前需要進行訓練,此訓練的收斂速度緩慢。該方法只有在系統(tǒng)結構不變的情況下適用。Lee 提出一種基于貝葉斯網絡的模型[9],和傳統(tǒng)故障檢測方法相比,這個模型具有清晰的邏輯和快速的處理速度,以及強壯的學習能力和良好的容錯性。但它也存在缺點,比如,每個節(jié)點的條件概率分布不是由貝葉斯網絡定義,而是由來自經驗的統(tǒng)計分析技巧所決定。在傳統(tǒng)故障檢測方法的基礎上,本文提出了一種基于貝葉斯網絡的關聯(lián)規(guī)則挖掘和頻繁項集優(yōu)化的算法。
Apriori 算法是一種用于搜索頻繁項集的基本算法,該算法采用逐層搜索的迭代方法,也就是用k-項集搜索(k+ 1)-項集[10]。該算法通過頻繁項集屬性中的先驗知識,首先生成頻率1-項集L1,然后生成頻率2-項集,直到生成某頻率的r項集Lr為空。
在第k次循環(huán)中,候選的k-項集第一次生成了Ck集。每個候選項由一個(k- 2)-節(jié)點生成,此節(jié)點處在兩個只有一個不同項(此項屬于Lk-1)的頻繁項集中。在Ck中的項集就是頻繁項集的候選項,并且最后的頻繁項集Lk一定是Ck的子集。為了決定其是否可加入Lk,須在數據庫事務中核實每個元素,該算法由于存在可觀的輸入、輸出計算量,因而其性能得到限制。
Apriori 算法基本步驟是:首先,迭代識別所有的頻繁項目集,要求頻繁項集的支持率不低于用戶設定的最低值;其次,從頻繁項集中構造支持度和可信度不低于用戶設定的最低值的強關聯(lián)規(guī)則。
在生成項集Ck的每步前,Apriori 算法有賴于相應頻繁k- 1項集,并搜索數據庫來計算每個候選項集的支持度,以便生成頻繁項集,這需要花費許多時間和空間。因此,生成很小的候選項集的過程在提高頻繁項集搜索效率方面起到重要的作用。而且,在Apriori 算法中,候選集Ck和Lk-1會在Ck具有很大可能性的地方同步生成。Hash 技術能去除那些不需要的候選項來降低Ck的可能性,因而可以降低時間和空間消耗并增強算法的效率。
在Apriori 算法中,當在D中的事務和在I中的項目數據量很大時,在L1中的項目數也會變的很大,假設為m,那么聯(lián)合生成的候選2-項集C2生成數為因此,支持度的計算量會變得十分巨大。
運用Hash 技術的主要目的是解決這個沖突。本文采用二維Hash(散列)函數來避免這個沖突。在項目集I= {I1,I2,… ,Ik,… ,Im}中的每個項目I k(k= 1,2,… ,m)具有一個順序值:1,2,… ,k,… ,m。order(x)和order(y)表示為在候選項集2-中的項目x和y的順序值。則二維散列函數為,
此處,
p1≠p2,且其是相對質數。
若p1和p2的值很大,散列表能覆蓋更多空間;若它們很小,則會導致沖突。因而,p1和p2須根據項目數調整并定義最小支持度。
h1(x,y)和h2(x,y)為H(x,y)下標。當散列數映射出1 個單位,則計數值增加1。
在掃描數據庫和生成L1的同時,每個2-項目集在每項事務中被二維散列函數計數。在數據庫掃描完后,L1和二維散列表均被獲得,且表內每個單位的值是一個事項的累積值。如果事項數值等于或大于最小minsup,則2-項目集屬于L2,否則它不為2-頻繁項集。
若有一個新的訓練樣本,則能在現(xiàn)有樣本數據集中學習并將新數據歸類。此貝葉斯理論和本文的任務需求一致。
此公式能表達成貝葉斯等式。
可以通過式(6),根據訓練數據得到估計值。其實,預測出每個P(si)較容易,只要從訓練數據中計算每個目標值si的頻率即可。然而,如果沒有收集相當大數量的訓練數據,則不能通過此方法預測 不同的因為此項數量等于可 能的例子數和可能的目標值的乘積,此方法需要大量的訓練項集。為了獲得合理的估計,每個樣本須在樣本空間出現(xiàn)多次。
貝葉斯算法有一個簡單假設:若給定樣本的目標值,則x1,x2,… ,xn的共同概率等于每個單一屬性的概率乘積。
將此式代入式(6),則可得在貝葉斯算法中的公式
此處sNB是從貝葉斯算法計算得到的目標值。在貝葉斯算法中,從訓練數據中估計得出的不同的的項目數只是不同的目標數和特征值的乘 積,這個數比的總數小很多。
如果用此方法計算的某一條件概率為0,則無論其它特征概率值為多少,其值始終為0。這些特征是獨立的,所以目標值會被它們的連續(xù)乘積所影響。為避免在有限樣本中存在的概率為0 的問題,采用m-估計法進行優(yōu)化,以便使得分類更精確。m-估計定義如下:
此處,v表示為分類ni中樣本數,vx表示為mi的樣本數(同分類ni樣本相似);u表示為與樣本相關的特征;p為測試器指定的參數。如果訓練集為 0,則因而,在分類ni中特征mi的先 驗概率為p。樣本的等價值決定了概率p和v x/v之間的關系。
本文采用基于關聯(lián)規(guī)則挖掘和貝葉斯網絡算法的微網故障檢測方法,同時考慮早期故障數據冗余和由于微網故障檢測不確定性導致的偏差。具體流程如圖1所示。
圖1 微網故障檢測流程圖
根據此流程圖,具體算法如下:
1)從保護器或斷路器處采集的動作信息作為條件特征,故障元件作為決策特征,選取訓練樣本集,并根據過去的故障樣本建立初始決策表S;將其輸入輸入數據庫,以生成關聯(lián)規(guī)則挖掘目標的數據資源。
2)運用關聯(lián)規(guī)則交互挖掘初始決策表,減少多余目標和特征。應注意到,當支持度和可信度門限值低時,會生成大量的弱關聯(lián)規(guī)則并且挖掘時間會變長。反之,則一些有價值的關聯(lián)規(guī)會被忽略。實際上,可采用較小的樣本數量進行交互挖掘迭代,通過不斷地調節(jié)門限值來確定合適的門限值。然后,將此方法用于以支持度和可信度為目標的大數據處理。
3)貝葉斯網絡初始化。
4)采用改進后的Apriori 算法對新生成的特征集進行數據挖掘,得到符合支持度限值的頻繁項集;對每個頻繁項集建立關聯(lián)規(guī)則,并選取其最小可信度和關聯(lián)度大于1 的強壯項集。忽略支持度小于最小值的項集,從而減少搜索空間。
5)建立基于步驟(2)關聯(lián)規(guī)則的貝葉斯模型:
對于每條規(guī)則,X?C并且從NewRules中依次提??;提取與X相應的可信度,并將X?C加入貝葉斯網絡。
6)將故障區(qū)域值C(c1,c2,… ,cn)(指決策表內的決策特征)作為貝葉斯網絡的父節(jié)點,并將已減 少的關聯(lián)規(guī)則組Rmai(x1,x2,… ,xn)中的條件特征作 為子節(jié)點,建立貝葉斯網絡。
7)訓練每個節(jié)點,并計算每個父節(jié)點的先驗概率和每個子節(jié)點的條件概率。
8)實時故障檢測。
給出的實時故障檢測信息為X(x1,x2,...,xn),包 括完整的信息、非完整的信息、甚至錯誤的信息。采用已訓練的貝葉斯網絡,對這些信息進行診斷,并計算可能的故障區(qū)域的概率。
最后,對得到的可能的故障區(qū)域概率進行篩選,并將最大概率的故障區(qū)域Ck作為最終診斷結果輸出。
為驗證此改進算法的有效性,本文進行了仿真實驗。實驗選用7 個電網故障樣本,此樣本分別具有條件特征:斷路器B1、B2、B3;過電流保護C1、C2、C3;距離保護R1。每個特征值為0 或1,分別代表斷路器的合和分狀態(tài)。決策特征為故障區(qū)域,通常表示為線路S1、S2、S3,見表1。
表1 初始微網故障檢測決策表
上述故障信息經基于貝葉斯網絡和關聯(lián)規(guī)則的檢測模型進行數據挖掘后,得到的結果見表2。
表2 微網故障檢測結果表
圖2記錄了當前模型檢測結果和實際結果之間的誤差。
從表2和圖2可見,基于貝葉斯網絡和關聯(lián)數據挖掘的檢測模型能較好地應用于微網故障檢測,并且檢測誤差遠遠低于Apriori 算法和貝葉斯算法。
圖2 診斷誤差的統(tǒng)計結果比較
微網具有電流雙向貫通和局部短路承受能力低的特點,傳統(tǒng)的配電網技術不再適用于微網的發(fā)展。鑒于此,本文提出了一種改進的基于貝葉斯模型和關聯(lián)規(guī)則挖掘的檢測模型。仿真實驗結果表明此模型能有效地且大量地減少傳統(tǒng)算法在配電網故障檢測中產生的誤差。
[1] 周建萍,朱建萍,徐司聰.微網孤島運行時短路故障檢測的仿真研究[J].中國電力,2014,47(3): 85-89.
[2] 杜敏杰,馬善釗,王建國,等.基于核密度估計的實時SVDD 算法與電路故障檢測應用[J].計算機測量與控制,2014,22(4): 1039-1041,1045.
[3] 張哲軍.引入推理模型的大型電網設備的故障檢測方法[J].科技通報,2014,30(2): 111-113,135.
[4] 杜華.基于關聯(lián)規(guī)則的船舶供電系統(tǒng)故障檢測方法研究[J].計算機測量與控制,2014,22(1): 233-235.
[5] 張咪.一種遠端故障檢測方案的設計與實現(xiàn)[J].電子技術應用,2013,39(12): 126-128,131.
[6] 張海濤,高錦宏,吳國新,等.蟻群優(yōu)化算法在風電偏航故障檢測中的應用[J].可再生能源,2013,31(11): 48-50,55.
[7] 原艷紅.大型煤炭機電設備的故障檢測方法研究[J].計算機仿真,2013,30(8): 380-383.
[8] 鄭樹松,李紅梅.電動汽車PMSM 驅動系統(tǒng)的故障檢測[J].微電機,2013,46(8): 55-59.
[9] 王娟,張瑾.高壓電力計量系統(tǒng)故障診斷與應用研究[J].科學技術與工程,2013,13(19): 5617-5620.
[10] 杜敏杰,蔡金燕.基于樣本約簡的實時SVDD 算法與電路故障檢測應用[J].微電子學與計算機,2013,30(7): 86-90.