王遠(yuǎn)敏
(貴州省興義民族師范學(xué)院,貴州興義 562400)
電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫中的過負(fù)荷數(shù)據(jù)挖掘方法研究
王遠(yuǎn)敏
(貴州省興義民族師范學(xué)院,貴州興義562400)
電力網(wǎng)絡(luò)中的分散控制系統(tǒng)(distributed control systems,DCS)數(shù)據(jù)庫中寄存有海量的電力數(shù)據(jù),進(jìn)行電力系統(tǒng)智能調(diào)度和控制。對電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫中的過負(fù)荷數(shù)據(jù)的有效挖掘是實現(xiàn)電力網(wǎng)絡(luò)系統(tǒng)過載保護(hù)的關(guān)鍵環(huán)節(jié)。當(dāng)前對DCS數(shù)據(jù)庫的過負(fù)荷數(shù)據(jù)挖掘采用基于決策樹特征分類方法進(jìn)行特征提取和挖掘?qū)崿F(xiàn),在過負(fù)荷數(shù)據(jù)序列的廣域子空間中產(chǎn)生大量干擾噪聲,挖掘算法的置信度較低。提出一種基于經(jīng)驗?zāi)B(tài)分解和決策樹分類結(jié)合的電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫中的過負(fù)荷數(shù)據(jù)挖掘方法。構(gòu)建了電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫結(jié)構(gòu)模型,在DCS數(shù)據(jù)庫中進(jìn)行數(shù)據(jù)流信號模型構(gòu)建,采用經(jīng)驗?zāi)B(tài)分解算法對數(shù)據(jù)信號流進(jìn)行固有模態(tài)時頻特征提取,以此特征為基礎(chǔ),采用決策樹分類算法實現(xiàn)過負(fù)荷數(shù)據(jù)的準(zhǔn)確檢測和挖掘。仿真結(jié)果表明,采用該算法能有效實現(xiàn)對電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫中的過負(fù)荷數(shù)據(jù)的特征提取和分類挖掘,誤碼率較低,性能優(yōu)越于傳統(tǒng)算法。
電力網(wǎng)絡(luò);分散控制系統(tǒng);數(shù)據(jù)庫;數(shù)據(jù)挖掘
電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫在煤電廠、火電廠和水利發(fā)電廠的發(fā)電和供電數(shù)據(jù)管理中具有廣泛的應(yīng)用。電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫中寄存了海量的電力數(shù)據(jù),其中包括了電網(wǎng)功耗數(shù)據(jù)、電壓數(shù)據(jù)、用戶信息數(shù)據(jù)以及電網(wǎng)功率數(shù)據(jù)等,對電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫中的過負(fù)荷數(shù)據(jù)進(jìn)行準(zhǔn)確有效的挖掘,確保電網(wǎng)安全穩(wěn)定運行[1]。
電力網(wǎng)絡(luò)分散控制數(shù)據(jù)庫采用冗余配置和診斷模件集合的方式構(gòu)成,具有高度的可靠性,DCS數(shù)據(jù)庫支持多種現(xiàn)場總線標(biāo)準(zhǔn),底層漢化的軟件平臺具備強(qiáng)大的處理功能,電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫實現(xiàn)了核電、火電、熱電、石化等電網(wǎng)數(shù)據(jù)的完整監(jiān)控管理,由于DCS數(shù)據(jù)庫的規(guī)模龐大,系統(tǒng)構(gòu)成復(fù)雜,對DCS數(shù)據(jù)庫中的過負(fù)荷數(shù)據(jù)的挖掘具有一定的難度[2],傳統(tǒng)方法中對DCS數(shù)據(jù)庫中的過負(fù)荷數(shù)據(jù)挖掘的方法主要有神經(jīng)網(wǎng)絡(luò)控制算法、語義特征提取算法、支持向量機(jī)數(shù)據(jù)挖掘算法和時頻特征分析算法等,以數(shù)據(jù)庫中的過負(fù)荷數(shù)據(jù)的特征提取方法實現(xiàn)數(shù)據(jù)挖掘成為未來發(fā)展的主要趨勢[3],并取得了一定的研究成果,其中,文獻(xiàn)[4]提出一種功率譜特征提取的電網(wǎng)數(shù)據(jù)庫的異常數(shù)據(jù)挖掘算法,實現(xiàn)要有現(xiàn)場控制站(I/O站)構(gòu)建和數(shù)據(jù)通信,提高了數(shù)據(jù)性能,但該算法需要對電網(wǎng)數(shù)據(jù)庫的過負(fù)荷數(shù)據(jù)進(jìn)行分級管理和調(diào)度,增大了計算的復(fù)雜性,在干擾環(huán)境下的過負(fù)荷檢測性能不高。文獻(xiàn)[5]中,對DCS數(shù)據(jù)庫的過負(fù)荷數(shù)據(jù)挖掘采用基于決策樹特征分類方法進(jìn)行特征提取和挖掘?qū)崿F(xiàn),在過負(fù)荷數(shù)據(jù)序列的廣域子空間中產(chǎn)生大量干擾噪聲,挖掘算法的置信度較低[6-9]。
1.1電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫結(jié)構(gòu)
首先構(gòu)建電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫結(jié)構(gòu)模型,電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫是一個由過程控制級和過程監(jiān)控級組成級聯(lián)數(shù)據(jù)庫。電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫主要由數(shù)據(jù)通訊系統(tǒng)、人機(jī)接口單元(操作員站OPS、工程師站ENS)、機(jī)柜、電源等組成。電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫工作結(jié)構(gòu)示意圖如圖1所示。
電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫具備開放的體系結(jié)構(gòu),具有全網(wǎng)絡(luò)節(jié)點查詢能力,可以提供多層開放數(shù)據(jù)接口。DCS數(shù)據(jù)庫提供方便的組態(tài)連接查詢能力,與用戶自主開發(fā)專用高級控制算法結(jié)合實現(xiàn)數(shù)據(jù)管理和調(diào)度。
圖1 電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫工作結(jié)構(gòu)Fig.1 DCS database working structure of the power network
在上述描述了電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫工作結(jié)構(gòu)和基本特性的基礎(chǔ)上,給出DCS數(shù)據(jù)庫的數(shù)據(jù)結(jié)構(gòu)及存儲模型。對電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫進(jìn)行過負(fù)荷數(shù)據(jù)挖掘,根本上來說是對數(shù)據(jù)庫中的異常數(shù)據(jù)信息進(jìn)行特征處理的過程,DCS數(shù)據(jù)庫的數(shù)據(jù)結(jié)構(gòu)模型狀態(tài)方程描述為:
令A(yù)={a1,a2,…,an}為電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫信息流功率復(fù)雜關(guān)聯(lián)規(guī)則的屬性集,B={b1,b2,…,bm}為過負(fù)荷數(shù)據(jù)挖掘?qū)傩灶悇e集,ai的屬性值為{c1,c2,…,ck},電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫體系結(jié)構(gòu)采用動態(tài)散列的混合型級聯(lián)方式進(jìn)行數(shù)據(jù)控制,采用一個連通的無向圖G=(V,E,W)表示過程監(jiān)控級,其中V為DCS數(shù)據(jù)庫任何兩個節(jié)點的關(guān)聯(lián)特征集合,其中V={v1,v2,…,vN},所有級聯(lián)數(shù)據(jù)節(jié)點都有相同的數(shù)據(jù)容量r,過負(fù)荷數(shù)據(jù)關(guān)聯(lián)規(guī)則矢量模型的邊(u,v)∈E,表示電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫中詞頻特征之間的關(guān)系,W={ω1,ω2,…,ωm}邊的權(quán)值集合?;赥akens嵌入定理,結(jié)合相空間重構(gòu)算法,采用合適的冗余配置得到電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫高維數(shù)據(jù)結(jié)構(gòu)空間為:
式中:x(t)為電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫信息流時間序列;J為相空間的時間窗函數(shù);m為DCS數(shù)據(jù)的信息流嵌入維數(shù);Δt為過負(fù)荷數(shù)據(jù)的采樣時間滑動窗口寬度。在高維相空間中對電力網(wǎng)絡(luò)數(shù)據(jù)庫的負(fù)荷數(shù)據(jù)進(jìn)行特征分析和提取,實現(xiàn)數(shù)據(jù)挖掘。
1.2數(shù)據(jù)流信號模型構(gòu)建
在上述進(jìn)行電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫結(jié)構(gòu)分析和DCS數(shù)據(jù)庫高維數(shù)據(jù)結(jié)構(gòu)空間構(gòu)建的基礎(chǔ)上,在高維相空間中進(jìn)行電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫的數(shù)據(jù)信息流信號模型構(gòu)建,然后采用信號處理算法實現(xiàn)特征提取和數(shù)據(jù)挖掘。
1960年代,美國心理學(xué)家蒂莫西·利里宣稱:“解放自己,調(diào)轉(zhuǎn)方向,退出體制?!睘榇耍栒俜弥禄脛N覀円驳拇_因此而看到了很多“畫得不像自己老師”的所謂現(xiàn)代藝術(shù)家。但是,不要忘記,他們的“不像”里,有著害人的致幻劑成分。
假設(shè)電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)信息流是一組線性調(diào)頻信號,信號的時間序列函數(shù)為:
式中:t為數(shù)據(jù)采樣時間點;x(t)為號幅度信息;τ為時延參數(shù);P為能量密度譜。對電力網(wǎng)絡(luò)數(shù)據(jù)庫中的數(shù)據(jù)流信號x(t)的進(jìn)行短時傅里葉變換,定義為:
式中:h*(τ-t)為時傅里葉變換的系統(tǒng)狀態(tài)函數(shù),它的實質(zhì)是加了窗的傅里葉變換。計算電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫信號模型的短時傅里葉變換對應(yīng)的能量密度譜:
式中:f為數(shù)據(jù)采樣頻率;|.|表示去歐式距離,通過對短時傅里葉變換對應(yīng)的能量密度譜計算,正確反映頻率與時間變化的關(guān)系。根據(jù)Heisenberg測不準(zhǔn)原理,計算數(shù)據(jù)信息流的時頻分辨率,進(jìn)一步提高對低頻段過負(fù)荷數(shù)據(jù)的挖掘性能,數(shù)據(jù)信息流的時頻分辨率計算公式為:
式中:x(t)為可調(diào)窗口的平方可積函數(shù);ψ(t)為Heisenberg基小波函數(shù),參數(shù)a和τ有關(guān)。通過在信號上加一個變尺度滑移窗來實現(xiàn)對信號頻譜上的不同頻率成分的特征分析,通過上述處理進(jìn)行DCS數(shù)據(jù)庫的數(shù)據(jù)信息流信號模型構(gòu)建,為進(jìn)行下一步的特征提取和數(shù)據(jù)挖掘提供信號輸入源函數(shù)。
2.1經(jīng)驗?zāi)B(tài)分解及過負(fù)荷數(shù)據(jù)的特征提取
在DCS數(shù)據(jù)庫中進(jìn)行數(shù)據(jù)流信號模型構(gòu)建和數(shù)據(jù)庫的數(shù)據(jù)結(jié)構(gòu)分析的基礎(chǔ)上,進(jìn)行過負(fù)荷數(shù)據(jù)挖掘優(yōu)化設(shè)計,分析傳統(tǒng)方法可見,當(dāng)前對DCS數(shù)據(jù)庫的過負(fù)荷數(shù)據(jù)挖掘采用基于決策樹特征分類方法進(jìn)行特征提取和挖掘?qū)崿F(xiàn),在過負(fù)荷數(shù)據(jù)序列的廣域子空間中產(chǎn)生大量干擾噪聲,挖掘算法的置信度較低。為了克服傳統(tǒng)算法的弊端,本文提出一種基于經(jīng)驗?zāi)B(tài)分解(Empirical mode decomposition,EMD)和決策樹分類結(jié)合的電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫中的過負(fù)荷數(shù)據(jù)挖掘方法。EMD方法能夠直觀地顯示分解信號所得的若干IMF分量,計算電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)局部特征時間尺度為:
式中:ykj為數(shù)據(jù)陣元矢量;N為數(shù)據(jù)長度,對任意過負(fù)荷數(shù)據(jù)信號x(t),本文采用經(jīng)驗?zāi)B(tài)分解得到過負(fù)荷數(shù)據(jù)的包絡(luò)特征為:
式中:a(t)和θ(t)分別為電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)信息流的HHT頻譜包絡(luò)和相位,對DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)的包絡(luò)矢量z(t)實行高斯離散采樣,經(jīng)過“篩分”過程,使用EMD方法將信號進(jìn)行分解,得到對高頻分量為:
式中:z(t)為DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)信號的IMF分量;x(t)為DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)的幅度調(diào)制實部;y(t)為小波分解尺度,對x(t)與1/t進(jìn)行經(jīng)驗?zāi)B(tài)分解卷積,固定頻率段的時域波形,得到EMD后的過負(fù)荷數(shù)據(jù)信號x(t)的第n個行固有模態(tài)時頻特征IMF分量有:
式中:rn為固有模態(tài)時頻特征的殘余信號;IMF分量為cn,弱殘余信號rn的幅值非常小,當(dāng)該值小于預(yù)先設(shè)定好的值,那么提取的固有模態(tài)時頻特征即為過負(fù)荷數(shù)據(jù)的信息特征,以此實現(xiàn)數(shù)據(jù)挖掘。
2.2決策樹數(shù)據(jù)分類
在上述特征提取的基礎(chǔ)上,利用訓(xùn)練集建立決策樹模型,引入C4.5決策樹模型進(jìn)行過負(fù)荷數(shù)據(jù)分類挖掘,電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)決策樹分類模型如圖2所示。常見的數(shù)據(jù)分類器有BP神經(jīng)網(wǎng)絡(luò)分類器、貝葉斯分類器、SVM分類器,而傳統(tǒng)的分類器進(jìn)行過負(fù)荷數(shù)據(jù)分類中,由于在高維相空間中產(chǎn)生大量干擾噪聲,分類算法的置信度較低,本文采用決策樹模型更有利于電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)的挖掘和分類。電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)決策樹分類模型如圖2所示。
圖2中,電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫的過負(fù)荷測試數(shù)據(jù)集進(jìn)行8次決策樹數(shù)據(jù)測試,得到過負(fù)荷數(shù)據(jù)固有模態(tài)時頻特征的主特征決策樹分叉圖,跟蹤屬性取值{0,1}映射到?jīng)Q策樹中表現(xiàn)為映射值{No,Yes},采用Weka系統(tǒng)默認(rèn)值推薦實驗參數(shù),電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫的過負(fù)荷數(shù)據(jù)的固有模態(tài)時頻特征設(shè)置類型設(shè)置為164類,提取的主特征類型為19類,產(chǎn)生數(shù)據(jù)伴隨狀態(tài)序列集,分類過程中過負(fù)荷數(shù)據(jù)出現(xiàn)的概率權(quán)重為:
式中:β為數(shù)據(jù)干擾頻率;w(epkq)初步的數(shù)據(jù)篩選后的特征輸出,最后得到DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)的挖掘的判別函數(shù)為:
式中:α為決策樹類別調(diào)節(jié)系數(shù);W為電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫的過負(fù)荷數(shù)據(jù)固有模態(tài)特征的二叉樹分裂類間距離,其取值范圍為0≤α≤1。由此實現(xiàn)數(shù)據(jù)挖掘算法改進(jìn)。
圖2 電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)決策樹分類模型Fig.2 Decision tree classification model of power network DCS database overload data
為了驗證本文算法在實現(xiàn)電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫的過負(fù)荷數(shù)據(jù)挖掘中的性能,進(jìn)行仿真實驗。仿真實驗的軟件環(huán)境建立在Matlab仿真軟件基礎(chǔ)上,硬件環(huán)境為:IntelCore3-530 1G內(nèi)存,操作系統(tǒng)為Windows 7。構(gòu)建電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫模型,過負(fù)荷數(shù)據(jù)的信號模型表型為一組頻帶為5~15 kHz、時寬為6 ms的線性調(diào)頻信號,電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫體系結(jié)構(gòu)采用動態(tài)散列的混合型級聯(lián)方式進(jìn)行數(shù)據(jù)控制,假設(shè)DCS數(shù)據(jù)庫信息流矢量長度為N,N=1 024,對電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫信息流序列連續(xù)數(shù)據(jù)集屬性離散化處理,以此為基礎(chǔ)構(gòu)建DCS數(shù)據(jù)庫高維數(shù)據(jù)結(jié)構(gòu)空間,相空間重構(gòu)中,時間窗函數(shù)J取值為12 s,嵌入維數(shù)m取值為4,時間窗口帶寬Δt=3 ms。在上述仿真環(huán)境和參數(shù)設(shè)定的基礎(chǔ)上,根據(jù)電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)的信號模型偏移程度分析,得到電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)的經(jīng)驗?zāi)B(tài)分解EMD結(jié)果如圖3所示。
圖3 電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)的經(jīng)驗?zāi)B(tài)分解結(jié)果Fig.3 Empirical mode decomposition results of DCS power network database overload data
根據(jù)圖3中所示的各層EMD分解結(jié)果,對數(shù)據(jù)信號流進(jìn)行固有模態(tài)時頻特征提取,得出弱殘余信號即為過負(fù)荷數(shù)據(jù),得到過負(fù)荷數(shù)據(jù)挖掘結(jié)果如圖4所示。
圖4 DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)挖掘結(jié)果Fig.4 DCS database overload data mining results
圖4中,虛線部分?jǐn)?shù)據(jù)序列表示進(jìn)行經(jīng)驗?zāi)B(tài)分解和固有模態(tài)時頻特征提取處理后的殘余分量數(shù)據(jù),即為本文需要挖掘的過負(fù)荷數(shù)據(jù),從仿真結(jié)果可見,采用本文算法能有效實現(xiàn)對DCS數(shù)據(jù)庫過負(fù)荷數(shù)據(jù)挖掘,為了定量分析本文算法的挖掘性能。采用本文算法進(jìn)行固有模態(tài)時頻特征提取挖掘處理后,采用決策樹分類器對挖掘數(shù)據(jù)進(jìn)行分類,并和傳統(tǒng)方法進(jìn)行對比,C4.5決策樹分類下過負(fù)荷數(shù)據(jù)挖的誤碼率(Bit error rate,BER)對比結(jié)果如圖5所示,從圖5可見,采用本文算法,誤碼率較低,挖掘精度較高。
對電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫中的過負(fù)荷數(shù)據(jù)的有效挖掘是實現(xiàn)電力網(wǎng)絡(luò)系統(tǒng)的過載保護(hù)的關(guān)鍵環(huán)節(jié)。當(dāng)前對DCS數(shù)據(jù)庫的過負(fù)荷數(shù)據(jù)挖掘采用基于決策樹特征分類方法進(jìn)行特征提取和挖掘?qū)崿F(xiàn),在過負(fù)荷數(shù)據(jù)序列的廣域子空間中產(chǎn)生大量干擾噪聲,挖掘算法的置信度較低。提出一種基于經(jīng)驗?zāi)B(tài)分解和決策樹分類結(jié)合的電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫中的過負(fù)荷數(shù)據(jù)挖掘方法。構(gòu)建了電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫結(jié)構(gòu)模型,在DCS數(shù)據(jù)庫中進(jìn)行數(shù)據(jù)流信號模型構(gòu)建,采用經(jīng)驗?zāi)B(tài)分解算法對數(shù)據(jù)信號流進(jìn)行固有模態(tài)時頻特征提取,以此特征為基礎(chǔ),采用決策樹分類算法實現(xiàn)過負(fù)荷數(shù)據(jù)的準(zhǔn)確檢測和挖掘,研究結(jié)果證明,采用本文算法對DCS數(shù)據(jù)庫中的過負(fù)荷數(shù)據(jù)挖掘性能較好,誤碼率較低,特征分類精度較高,展示了優(yōu)越性能。
圖5 C4.5決策樹分類下過負(fù)荷數(shù)據(jù)挖的誤碼率Fig.5 Bit error rate of the overload data mining under the C4.5 decision tree classification
[1]王曙燕,耿國華,李丙春.決策樹算法在醫(yī)學(xué)圖像數(shù)據(jù)挖掘中的應(yīng)用[J].西北大學(xué)學(xué)報:自然科學(xué)版,2005,35(3):262-265.WANG Shuyan,GENG Guohua,LI Bingchun.The application of decision tree algorithm in medical image data mining[J].Joumal of Norlhwest Universily:Nalural Seience Edlition,2005,35(3):262-265(in Chinese).
[2]饒翔,王懷民,陳振邦,等.云計算系統(tǒng)中基于伴隨狀態(tài)追蹤的故障檢測機(jī)制[J].計算機(jī)學(xué)報,2012,35(5):856-870.RAO Xiang,WANG Huaimin,CHEN Zhenbang,et al.Detecting faults by tracing companion states in cloud computing systems[J].Chinese Journal of Computers,2012,35(5):856-870(in Chinese).
[3]孔英會,車轔轔,苑津莎,等.基于小波分解和數(shù)據(jù)挖掘中決策樹算法的電能質(zhì)量擾動識別方法[J].電網(wǎng)技術(shù),2007,31(23):78-82.KONG Yinghui,CHE Linlin,YUAN Jinsha,et al.A power quality disturbance identification method based on wavelet decomposition and decision tree algorithm in data mining[J].Power System Technology,2007,31(23):78-82(in Chinese).
[4]李紅升.基于粒子群算法改進(jìn)電力信息系統(tǒng)的安全研究[J].科技通報,2013,29(4):158-161.LI Hongsheng.Study on improvement of power information system security based on particle swarm optimization algorithm[J].Bulletin of Science and Technology,2013,29(4):158-161(in Chinese).
[5]郭麗.面向PID電力系統(tǒng)信息安全自動控制研究[J].科技通報,2013,29(2):39-41.GUO Li.PID oriented information security in power system automatic control research[J].Bulletin of Science and Technology,2013,29(2):39-41(in Chinese).
[6]楊來,史忠植,梁帆,等.基于Hadoop云平臺的并行數(shù)據(jù)挖掘方法[J].系統(tǒng)仿真學(xué)報,2013,25(5):936-944.YANG Lai,SHI Zhongzhi,LIANG Fan,et al.Parallcl approach in data mining bascd on hadoop cloud platform[J].Journal of System Simulation,2013,25(5):936-944(in Chinese).
[7]張國良,姚二亮,湯文俊,等.一種自適應(yīng)的GraphSLAM魯棒閉環(huán)算法[J].信息與控制,2015,44(3):316-320,327.ZHANG Guoliang,YAO Erliang,TANG Wenjun,et al.AN adaptive robust loop closure algorithm for graph SLAM[J].Information and Control,2015,44(3):316-320,327(in Chinese).
[8]王進(jìn),陽小龍,隆克平.基于大偏差統(tǒng)計模型的Http-Flood DDoS檢測機(jī)制及性能分析[J].軟件學(xué)報,2012,23(5):1272-1280.WANG Jin,YANG Xiaolong,LONG Keping.Http-Flood DDoS detection scheme based on large deviation and performance analysis[J].Journal of Software,2012,23(5):1272-1280(in Chinese).
[9]鄭海雁,王遠(yuǎn)方.標(biāo)簽集約束近似頻繁模式的并行挖掘[J].計算機(jī)工程與應(yīng)用,2015,51(9):135-141.ZHENG Haiyan,WANG Yuanfang.Parallel mining on label-constraint proximity pattern[J].Computer EngineeringandApplications,2015,51(9):135-141(in Chinese).
Research on Overload Data Mining Method in Power Network DCS Database
WANG Yuanmin
(Guizhou Xingyi Normal University for Nationalities,Xingyi 562400,Guizhou,China)
A mass of power data is stored in the distributed control system(distributed control systems,DCS)database of the power network for the intelligent scheduling and control of the power system.The effective mining of the overload data in the DCS database is a key link in the realization of the overload protection of the electric power network system.At present,the overload date in the DCS database is mined based on the decision tree feature classification method to extract features and realize mining,and this method produces a lot noise in the wide area subspace of the overload data sequence,therefore the mining algorithm is of low confidence.To this end,a method of data mining based on combination of the empirical mode decomposition and decision tree classification is proposed in this paper.The DCS database structure model of the power network is built and the data flow signal model is built in the DCS database,and the intrinsic mode time-frequency feature are extracted in the data signal flow using the empirical mode decomposition algorithm.On the basis of the extracted feature,the accurate defection and mining of the overload data are realized using the decision tree classification algorithm.The simulation results show that the proposed algorithm can effectively extract and classify the overload data in the DCS database of the power network,and the error rate is low,and the performance is superior to the traditional algorithm.
power network;distributed control system;database;data mining
1674-3814(2015)11-0036-05
TP391
A
2015-06-08。
王遠(yuǎn)敏(1982—),女,講師,研究方向為計算機(jī)應(yīng)用技術(shù)。
(編輯徐花榮)
《貴陽交通智能控制與誘導(dǎo)技術(shù)研究》(黔科合J字[2013]2456)。
Project Supported by“Research on Guiyang Intelligent Control and Induction Technology”of Science and Technology Fund of Guizhou Province(J[2013]2456).