朱文慧++周志兵
[摘 要]針對(duì)電力通信中存在的不確定性和復(fù)雜性的特點(diǎn),提出一種基于粗糙理論與貝葉斯理論的電力通信系統(tǒng)故障檢測模型。文章首先利用粗糙理論刪除不重要的特征屬性,然后通過數(shù)理統(tǒng)計(jì)方式,得到不同特征屬性出現(xiàn)的概率;再次,在該基礎(chǔ)上,構(gòu)建最小屬性集的貝葉斯網(wǎng)絡(luò)故障診斷模型;最后通過試驗(yàn)驗(yàn)證了上述故障定位方法的有效性。
[關(guān)鍵詞]貝葉斯模型;粗糙集;故障檢測;診斷模型;最小屬性
中圖分類號(hào):TQ275 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-914X(2018)03-0398-01
電力信息通信系統(tǒng)故障診斷是電力信息通信支持系統(tǒng)的重要組成部分。但由于電力信息通信系統(tǒng)線路、硬件和軟件系統(tǒng)眾多,某個(gè)設(shè)備或系統(tǒng)發(fā)生故障,會(huì)引發(fā)的一連串故障。同樣的出現(xiàn)某個(gè)故障現(xiàn)象可能的故障原因也很多。因此為了保障智能電網(wǎng)的平穩(wěn)運(yùn)行,如果電力信息通信系統(tǒng)發(fā)生某個(gè)故障告警,需要快速的從大量的故障原因中準(zhǔn)確找出故障根源??焖?、準(zhǔn)確、的定位電力信息通信系統(tǒng)的故障原因能提高整個(gè)智能電網(wǎng)運(yùn)行的魯棒性和可靠性, 提高電網(wǎng)服務(wù)質(zhì)量,具有十分重要的價(jià)值。
1 粗糙集理論
1.1 粗糙集定義
粗糙集理論用于研究不完整數(shù)據(jù)、不精確知識(shí)的表達(dá)、學(xué)習(xí)、歸納等方法。粗糙集理論是一種刻畫不完整性和不確定性信息的數(shù)學(xué)工具,能有效地分析和處理不精確、不一致、不完整等各種不完備信息,并從中發(fā)現(xiàn)隱含的知識(shí),揭示潛在的規(guī)律。該理論以對(duì)觀察和測量所得的數(shù)據(jù)進(jìn)行分類的能力為基礎(chǔ),認(rèn)為知識(shí)是基于對(duì)對(duì)象分類的能力,將知識(shí)理解為對(duì)數(shù)據(jù)的劃分,這種劃分在特定空間上由等價(jià)關(guān)系構(gòu)成,將等價(jià)關(guān)系對(duì)空間的劃分與知識(shí)等同。粗糙集理論利用已知的知識(shí)庫,將不精確或不確定的知識(shí)用已知的知識(shí)庫中的知識(shí)來(近似)刻畫,用上近似、下近似和邊界來刻畫信息的不確定性。使用等價(jià)關(guān)系集 R 對(duì)離散表示的空間 U 進(jìn)行劃分,知識(shí)表示為 R 對(duì) U 劃分的結(jié)果。知識(shí)庫 K可以定義為:屬于 R 中的所有可能的關(guān)系對(duì) U 的劃分,記為:
(1)
給定一組數(shù)據(jù) U與等價(jià)關(guān)系集 R,在 R 下對(duì) U的劃分,稱為知識(shí),記為 U/ R 。如果集合 K 能表示成基本等價(jià)類組成的并集時(shí),則稱集合 K 是可精確定義。否則集合 K 稱為非精確集或粗糙集。即如果一個(gè)等價(jià)關(guān)系集對(duì)知識(shí)的劃分存在矛盾時(shí), 則將導(dǎo)致知識(shí)的不確定劃分,可用粗糙度來度量,使用兩個(gè)精確集, 即粗糙集的上近似和下近似來描述。
(2)
式中,PRS 為集合X利用粗糙集表達(dá)的知識(shí)庫集合K。
1.2 特征屬性化簡
在由粗糙集構(gòu)成的一個(gè)知識(shí)庫中,有一些特征屬性是不相關(guān)或者不重要的,為了達(dá)到特征向量降維的目的,可以在保持知識(shí)庫分類能力不變的前提下,刪除其中不相關(guān)或者不重要的特征屬性。屬性約簡可以使粗糙集能夠獲得分類所需的最小特征屬性集,可以在不影響分類精度的條件下降低特征向量的維數(shù),得到最簡約的顯式表達(dá)的分類規(guī)則,是其他方法無法得到顯式規(guī)則,是粗糙集的主要優(yōu)勢。
設(shè)R為一族等價(jià)關(guān)系,,如果,則稱r為R中必要的。如果每一個(gè)都為R中所必要的,則稱R為獨(dú)立的。設(shè),如果Q是獨(dú)立的,且ind(Q),則稱Q為P的一個(gè)約簡。此時(shí),P可以由多種約簡。P中所有必要關(guān)系組成的集合稱為P的核,記為core(P),表示P的所有約簡組成的交集。
2 基于貝葉斯的診斷模型構(gòu)建
2.1 貝葉斯理論
一個(gè)Bayes網(wǎng)絡(luò)是一個(gè)有向無循環(huán)圖,圖中的節(jié)點(diǎn)用隨機(jī)變量表示,連線代表節(jié)點(diǎn)之間的影響概率,用條件概率表示。數(shù)學(xué)描述為:
若論域,其中表示為各個(gè)節(jié)點(diǎn)。則各節(jié)點(diǎn)的聯(lián)合概率為:
(3)
Bayes網(wǎng)絡(luò)的核心是計(jì)算后驗(yàn)條件概率分布,設(shè)節(jié)點(diǎn)有m個(gè)基本事件事件發(fā)生時(shí),網(wǎng)絡(luò)中某一節(jié)點(diǎn)Q的條件概率分布為:
(4)
根據(jù)上述公式可計(jì)算與節(jié)點(diǎn)相關(guān)聯(lián)的所有節(jié)點(diǎn)的條件概率,進(jìn)而獲得導(dǎo)致事件的最可能發(fā)生問題的節(jié)點(diǎn),即導(dǎo)致故障的可能原因。
2.2 電力信息通信系統(tǒng)RS-BN故障診斷構(gòu)建
2.2.1構(gòu)建思路
粗糙集理論只應(yīng)用了故障和原因之間的關(guān)聯(lián)信息,對(duì)于由故障過程中總結(jié)出來的先驗(yàn)知識(shí)沒有考慮。Bayes網(wǎng)絡(luò)在故障診斷時(shí),充分利用先驗(yàn)知識(shí)考察全部的系統(tǒng)屬性。由于引起故障的系統(tǒng)屬性有一些是與故障內(nèi)在原因不相關(guān)或不重要的,Bayes網(wǎng)絡(luò)計(jì)算了大量的冗余屬性。電力信息通信系統(tǒng)中有大量的系統(tǒng)屬性,故障類型眾多。因此,本文將融合貝葉斯網(wǎng)絡(luò)與粗糙集的優(yōu)點(diǎn),首先利用粗糙集對(duì)冗余屬性的約簡能力,將系統(tǒng)中冗余的系統(tǒng)屬性約簡掉,在此基礎(chǔ)上,結(jié)合系統(tǒng)運(yùn)行過程中的先驗(yàn)知識(shí),獲取具有最小診斷集的貝葉斯網(wǎng)絡(luò)模型。
2.2.2算法構(gòu)建
本文實(shí)現(xiàn)的電力信息通信系統(tǒng)RS-BN故障診斷模型的詳細(xì)算法步驟;
算法的具體步驟如下:
①對(duì)系統(tǒng)運(yùn)行的故障記錄原始數(shù)據(jù)進(jìn)行整理分析,抽取特征屬性項(xiàng)、合并近義詞和同義詞,進(jìn)行詞頻統(tǒng)計(jì)。
②根據(jù)先驗(yàn)知識(shí),形成包括所有系統(tǒng)屬性值的故障決策表。
③利用粗糙集理論對(duì)決策表進(jìn)行特征屬性約簡,形成最小決策規(guī)則集,建立故障診斷知識(shí)庫。
④根據(jù)診斷知識(shí)庫保留的特征屬性的詞頻統(tǒng)計(jì)信息與故障數(shù)量計(jì)算獲得特征屬性的先驗(yàn)概率信息。
⑤建立系統(tǒng)的貝葉斯網(wǎng)絡(luò)故障信息診斷模型,包括網(wǎng)絡(luò)結(jié)構(gòu)中所有存在關(guān)聯(lián)關(guān)系的節(jié)點(diǎn)以及節(jié)點(diǎn)間的連線、原因節(jié)點(diǎn)到中間結(jié)點(diǎn)、故障節(jié)點(diǎn)的條件概率或聯(lián)合條件概率。
利用上述建立的故障診斷模型,進(jìn)行電力信息系統(tǒng)故障診斷時(shí),全部故障原因節(jié)點(diǎn)發(fā)生的概率計(jì)算方法如下:
①把結(jié)果節(jié)點(diǎn)向量輸入到貝葉斯網(wǎng)絡(luò)中。
②對(duì)于網(wǎng)絡(luò)中的每一個(gè)沒處理過的結(jié)點(diǎn)n,如果它具有發(fā)生的事實(shí)(證據(jù)),則標(biāo)記它為已經(jīng)處理過,否則繼續(xù)向下執(zhí)行。
③如果它的所有子結(jié)點(diǎn)中有一個(gè)沒有處理則不處理這個(gè)結(jié)點(diǎn),否則繼續(xù)向下執(zhí)行。
④根據(jù)節(jié)點(diǎn)n所有子結(jié)點(diǎn)的概率以及條件概率或聯(lián)合條件概率,根據(jù)條件概率公式,計(jì)算結(jié)點(diǎn)n的概率分布,并把結(jié)點(diǎn)n標(biāo)記為已處理。
⑤重復(fù)②至④,處理完所有節(jié)點(diǎn)。
此時(shí),每個(gè)原因結(jié)點(diǎn)的概率分布就是它的發(fā)生/不發(fā)生的概率。根據(jù)原因節(jié)點(diǎn)的概率分布,對(duì)故障原因根據(jù)概率大小進(jìn)行排序,如存在概率相近的情況,按照并列事件處理,據(jù)此在系統(tǒng)中依次檢測故障原因所對(duì)應(yīng)的系統(tǒng)屬性,進(jìn)而快速準(zhǔn)備的定位故障原因。
3 實(shí)驗(yàn)驗(yàn)證
3.1 屬性約簡
給出某一電力信息系統(tǒng)出現(xiàn)訪問故障時(shí)節(jié)點(diǎn)指向3個(gè)模塊節(jié)點(diǎn)“信息設(shè)備”、“通信設(shè)備”、“平臺(tái)軟件”的有向連接圖。同時(shí),應(yīng)用粗糙集屬性約簡后可得到最小屬性集,由此獲得最小屬性集的診斷規(guī)則。
3.2 概率統(tǒng)計(jì)
以2012~2016年某市電力通信網(wǎng)絡(luò)故障頻率進(jìn)行統(tǒng)計(jì),可以得到各故障原因最小屬性集的概率。并依次為依據(jù)計(jì)算出貝葉斯網(wǎng)絡(luò)中所有連接線的概率信息。依據(jù)RS-BN故障診斷模型計(jì)算獲得此時(shí)每個(gè)系統(tǒng)屬性導(dǎo)致故障的概率。概率大的屬性,發(fā)生故障的可能性較大,從而實(shí)現(xiàn)故障原因的快速定位,提高診斷效率。
4 結(jié)束語
利用粗糙集對(duì)冗余的系統(tǒng)特征屬性進(jìn)行化簡,獲得最小的特征屬性集,建立最小屬性集的貝葉斯網(wǎng)絡(luò)故障診斷模型,其中網(wǎng)絡(luò)中的條件概率根據(jù)運(yùn)行記錄中的詞頻信息計(jì)算獲得,實(shí)驗(yàn)結(jié)果證明本文方法可有效、快速的定位電力信息通信系統(tǒng)的故障信息,對(duì)保障電網(wǎng)的正常運(yùn)行具有重要價(jià)值。endprint