李 金,高 壽
(1.中國南方電網(wǎng)電力調(diào)度控制中心,廣東 廣州 510663; 2.南瑞集團(tuán)公司(國網(wǎng)電力科學(xué)研究院),江蘇 南京 210003)
一種基于數(shù)據(jù)挖掘分析的設(shè)備狀態(tài)評價(jià)方法
李 金1,高 壽2
(1.中國南方電網(wǎng)電力調(diào)度控制中心,廣東 廣州510663;2.南瑞集團(tuán)公司(國網(wǎng)電力科學(xué)研究院),江蘇 南京210003)
為提高電力設(shè)備狀態(tài)評估的準(zhǔn)確性和效率,提出了一種將數(shù)據(jù)挖掘方法應(yīng)用到設(shè)備狀態(tài)評價(jià)中的思路和方法。介紹了基于數(shù)據(jù)挖掘方法的狀態(tài)評價(jià)模型,從大量設(shè)備歷史數(shù)據(jù)庫中采集電力設(shè)備的臺賬信息、在線監(jiān)測信息、運(yùn)行信息等作為設(shè)備評價(jià)的基礎(chǔ)參量,將這些歷史數(shù)據(jù)分別歸類為不同狀態(tài)的數(shù)據(jù)集,然后對每個(gè)數(shù)據(jù)集提取其主要特征向量,以此作為設(shè)備狀態(tài)評價(jià)分類依據(jù)。該方法為設(shè)備狀態(tài)評估提供了新的思路。
數(shù)據(jù)挖掘;主成分分析;電力設(shè)備狀態(tài)評價(jià)
隨著社會發(fā)展和經(jīng)濟(jì)的不斷進(jìn)步,社會各行業(yè)對電力設(shè)備安全、穩(wěn)定、可靠地運(yùn)行提出了越來越高的要求,電力行業(yè)傳統(tǒng)的按固定周期對所有電力設(shè)備進(jìn)行監(jiān)測診斷的方法難以有效地對電力設(shè)備的狀態(tài)進(jìn)行有效評估和分析,預(yù)測設(shè)備故障狀態(tài),存在工作量大、維修滯后、檢修過剩等問題[1-3]。而設(shè)備的狀態(tài)評價(jià)技術(shù)是實(shí)施狀態(tài)檢修的核心,只有在準(zhǔn)確評價(jià)設(shè)備的實(shí)時(shí)運(yùn)行狀態(tài)的基礎(chǔ)上,才能合理安排設(shè)備檢修的項(xiàng)目和時(shí)間。
本文將數(shù)據(jù)挖掘分析算法應(yīng)用到設(shè)備狀態(tài)評價(jià)中,通過對大量設(shè)備歷史運(yùn)行數(shù)據(jù)進(jìn)行特征提取和降維處理,提取出能夠表征設(shè)備運(yùn)行狀態(tài)的特征信息,然后結(jié)合設(shè)備當(dāng)前運(yùn)行情況,對設(shè)備狀態(tài)進(jìn)行評估,為設(shè)備狀態(tài)檢修工作安排提供數(shù)據(jù)基礎(chǔ)。
在傳統(tǒng)的有限數(shù)據(jù)設(shè)備狀態(tài)評價(jià)系統(tǒng)中,狀態(tài)量的選取往往是單一的,故障/缺陷情況也是單一的,兩者對應(yīng)的關(guān)聯(lián)規(guī)律性較弱。采用數(shù)據(jù)挖掘的方法對設(shè)備狀態(tài)進(jìn)行評價(jià),重點(diǎn)要獲取設(shè)備狀態(tài)量與設(shè)備狀態(tài)之間的關(guān)聯(lián)關(guān)系[4]。而在大數(shù)據(jù)環(huán)境下,所采集的設(shè)備狀態(tài)量數(shù)量較多,無疑會增加分析問題的難度和復(fù)雜性,因此本文對設(shè)備狀態(tài)量集合采用降維方法,去除冗余設(shè)備裝態(tài)量,提取出設(shè)備狀態(tài)量與設(shè)備狀態(tài)之間的關(guān)聯(lián)關(guān)系。目前在降維領(lǐng)域應(yīng)用較為廣泛的方法有:主成分分析法[5]、因子分析[6]、局部線性嵌入(Locally Linear Embedding,LLE)、等距映射(Isometric Mapping,ISOMAP)[7]等。LLE、ISOMAP等方法適合連續(xù)時(shí)間信號的降維處理[8],而設(shè)備狀態(tài)量信息中的設(shè)備臺賬信息、運(yùn)行信息等多為離散信息量,因此本文采用主成分分析方法對設(shè)備狀態(tài)量進(jìn)行降維操作,提取表征設(shè)備狀態(tài)的關(guān)鍵信息。
本文設(shè)計(jì)的設(shè)備狀態(tài)評價(jià)模型包括:提取大量設(shè)備歷史運(yùn)行信息,將這些運(yùn)行信息分類成不同狀態(tài)的信息集;采用主成分分析法提取各個(gè)狀態(tài)信息集的特征信號;對于待評價(jià)設(shè)備的當(dāng)前運(yùn)行情況,將該運(yùn)行信息投影到狀態(tài)信息集的特征空間進(jìn)行設(shè)備狀態(tài)評價(jià)。
主成分分析(Principal Component Analysis,PCA)是多元統(tǒng)計(jì)過程控制的常用方法之一,通過一組標(biāo)準(zhǔn)正交變換,將原始數(shù)據(jù)集線性變換為一組包含原始數(shù)據(jù)的大部分信息的主成分集合,可基本表征原始數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)從高維到低維的變換[9-10]。PCA 法已應(yīng)用于電力系統(tǒng)的短期負(fù)荷預(yù)測、暫態(tài)穩(wěn)定評估、汽輪機(jī)故障診斷等方面[11-15]。
PCA算法步驟可以描述為:
假設(shè)訓(xùn)練樣本集為X=[x1,x2,…,xn]T。
該樣本的平均向量為:
(1)
構(gòu)造樣本集的協(xié)方差矩陣為:
(2)
計(jì)算出協(xié)方差矩陣的特征向量αi和對應(yīng)的特征值λi。這些特征向量組成的矩陣A就是訓(xùn)練樣本集的正交基底,將協(xié)方差矩陣的特征值按大到小排序:λ1≥λ2≥…≥λk≥…>0,可將主成分構(gòu)成的變換矩陣記為:A=(α1,α2,…,αk)T。
有了這樣一個(gè)降維的子空間,任何一個(gè)測試樣本都可以向其作投影ω=Ay,即并獲得一組坐標(biāo)系數(shù),即低維向量ω。
整個(gè)過程可以分為以下3個(gè)階段:
(1)提取設(shè)備歷史運(yùn)行信息,并將這些歷史運(yùn)行信息根據(jù)設(shè)備狀態(tài)的嚴(yán)重程度不同分為嚴(yán)重、異常、注意、正常等數(shù)據(jù)集,并對原始樣本集進(jìn)行歸一化處理。
(2)采用主成分分析法實(shí)現(xiàn)各數(shù)據(jù)集的特征優(yōu)化,以減少設(shè)備特征狀態(tài)量的維數(shù),減少設(shè)備評價(jià)信號數(shù)據(jù)的復(fù)雜度。
(3)通過最近鄰算法實(shí)現(xiàn)設(shè)備狀態(tài)評價(jià)。當(dāng)需要評價(jià)的樣本到來時(shí),首先計(jì)算其與各個(gè)數(shù)據(jù)特征集中心的距離來確定其所屬的狀態(tài),取其中最小距離的狀態(tài)集作為設(shè)備狀態(tài)評價(jià)的最終結(jié)果。
目前,電力設(shè)備狀態(tài)評價(jià)的方案主要根據(jù)標(biāo)準(zhǔn)導(dǎo)則對設(shè)備進(jìn)行打分評估,而數(shù)據(jù)挖掘技術(shù)和設(shè)備監(jiān)測技術(shù)的發(fā)展為電力設(shè)備狀態(tài)評價(jià)提供了新思路。本文在傳統(tǒng)電網(wǎng)設(shè)備狀態(tài)評價(jià)方法基礎(chǔ)上,將數(shù)據(jù)挖掘算法引入設(shè)備評價(jià)方法中,提出基于數(shù)據(jù)挖掘算法的設(shè)備狀態(tài)評價(jià)方法。
以數(shù)據(jù)挖掘方法進(jìn)行設(shè)備狀態(tài)評價(jià)的首要問題在于表征設(shè)備狀態(tài)的各個(gè)維度的狀態(tài)信息量的獲取。
與電網(wǎng)設(shè)備狀態(tài)關(guān)系密切的數(shù)據(jù)信息來源較為復(fù)雜,要對設(shè)備狀態(tài)進(jìn)行評估,首先要收集設(shè)備的相關(guān)信息,包括:(1)設(shè)備臺賬信息,此類信息作為固定參數(shù)自記錄以后不再變化,作為某項(xiàng)狀態(tài)量直接參與狀態(tài)評估時(shí)的計(jì)算;(2)設(shè)備在線監(jiān)測信息,此類信息采集周期短,時(shí)效性強(qiáng),反映了設(shè)備的實(shí)時(shí)健康狀態(tài),作為最主要的設(shè)備狀態(tài)評估參數(shù),在設(shè)備評價(jià)時(shí)應(yīng)給與最大的權(quán)重占比;(3)設(shè)備運(yùn)行信息、定檢信息、缺陷信息,此類信息通常采用周期性采集方式獲取,對設(shè)備狀態(tài)評價(jià)結(jié)果的準(zhǔn)確性有重要的參考作用;(4)其他信息,包括溫度、氣象、環(huán)境等因素,此類信息相對穩(wěn)定,但會對設(shè)備狀態(tài)評價(jià)結(jié)果產(chǎn)生影響。
經(jīng)過數(shù)據(jù)采集階段獲取設(shè)備狀態(tài)信息量以后,要對采集到的數(shù)據(jù)進(jìn)行數(shù)據(jù)清理、集成、變換,使獲取到的數(shù)據(jù)能夠滿足數(shù)據(jù)挖掘算法的要求。
(1)數(shù)據(jù)清理:按照固定規(guī)則丟棄部分采集到的設(shè)備狀態(tài)量數(shù)據(jù),如在線監(jiān)測信息不符合預(yù)定的數(shù)據(jù)格式、超出正常閾值范圍、數(shù)據(jù)發(fā)生跳變等情況。
(2)數(shù)據(jù)集成:將不同來源、格式、特點(diǎn)性質(zhì)的設(shè)備狀態(tài)量在邏輯上統(tǒng)一起來,將其轉(zhuǎn)換為適合挖掘的統(tǒng)一形式。如設(shè)備狀態(tài)量信息中包含n項(xiàng)信息量,則將該信息轉(zhuǎn)換為一個(gè)n維向量:[x1,x2,…,xn]T。
基于主成分分析法提取關(guān)鍵信息參量的步驟如下:
(1)將采集到的設(shè)備歷史狀態(tài)量集合分為嚴(yán)重、異常、注意、正常四個(gè)集合,記為X1,X2,X3,X4。
每個(gè)集合的數(shù)據(jù)集Xi={xi1,xi2,…,xin},其中n表示抽取的樣本個(gè)數(shù),xij表示數(shù)據(jù)集Xi中第j個(gè)訓(xùn)練樣本。
λi1≥λi2≥…≥λik>0
αi1,αi2,…,αik為對應(yīng)的特征向量。
(3)確定主成分向量數(shù)量。設(shè)有m個(gè)主成分能夠表征設(shè)備狀態(tài),令
(3)
式(13)表示特征值λi1,λi2,…,λim累計(jì)貢獻(xiàn)90%的置信區(qū)間,由此確定m個(gè)特征向量作為能夠表征狀態(tài)集的主成分向量αi1,αi2,…,αik。
(4)計(jì)算原始設(shè)備狀態(tài)量矩陣在新的m維特征空間中的投影:
Ti=AiXi=[αi1,αi2,…,αim]T·[xi1,xi2,…,xin]
(4)
式中:Ai=[αi1,αi2,…,αim]T表示特征因子矩陣,αi1,αi2,…,αik是λi1,λi2,…,λim對應(yīng)的特征向量。
(6)對于待評價(jià)設(shè)備狀態(tài)信息量y,計(jì)算其在各狀態(tài)集特征空間中的投影:
ωi=Aiy
(5)
計(jì)算ωi與所有該狀態(tài)集信息量在m維特征空間中的歸一化投影的距離,取其中的最小值所在的狀態(tài)集作為該待評價(jià)設(shè)備的所屬狀態(tài)。
(7)根據(jù)上述導(dǎo)則對設(shè)備總體評價(jià)的規(guī)定,可以得到設(shè)備整體狀態(tài)的計(jì)算公式為:
(6)
設(shè)備狀態(tài)量參數(shù)集合的建立綜合考慮了電網(wǎng)公司歷史運(yùn)行信息、實(shí)時(shí)監(jiān)測信息、靜態(tài)臺賬參數(shù)信息等不同類型的參數(shù),在這些參數(shù)基礎(chǔ)上進(jìn)行數(shù)據(jù)挖掘分析,相比于現(xiàn)有的狀態(tài)評價(jià)導(dǎo)則,本文方法具有可信度高、代表性強(qiáng)的特點(diǎn)。通過某測控裝置的相關(guān)數(shù)據(jù)對本方法進(jìn)行了初步驗(yàn)證,而由于電網(wǎng)設(shè)備運(yùn)行環(huán)境復(fù)雜的特點(diǎn),參數(shù)體系的選擇、算法的實(shí)用性和準(zhǔn)確性方面還需要結(jié)合實(shí)際情況進(jìn)一步驗(yàn)證。
(1)從設(shè)備臺賬信息、歷史運(yùn)行信息、監(jiān)測信息中提取出設(shè)備狀態(tài)量,將狀態(tài)量以連續(xù)型數(shù)據(jù)或離散型數(shù)據(jù)表示。其中臺賬信息包括圖紙?jiān)O(shè)計(jì)質(zhì)量、裝置制造質(zhì)量、施工安裝質(zhì)量、投產(chǎn)驗(yàn)收質(zhì)量等信息。歷史運(yùn)行信息包括家族缺陷、裝置缺陷、檢修信息等信息。監(jiān)測信息包括自檢信息、監(jiān)測數(shù)據(jù)等實(shí)時(shí)運(yùn)行數(shù)據(jù)。表1給出了部分監(jiān)測信息數(shù)據(jù)類型。
表1 測控裝置部分監(jiān)測信息
(2)從電網(wǎng)公司歷史數(shù)據(jù)庫中抽取采樣數(shù)據(jù)進(jìn)行主成分分析,如表2所示, 并計(jì)算各狀態(tài)集特征空間。
表2 樣本集
測試中設(shè)置m=16時(shí)可將4個(gè)狀態(tài)集均降維至90%的置信區(qū)間。將測試樣本投影至各個(gè)狀態(tài)集的特征空間,驗(yàn)證結(jié)果如表3所示。
表3 測試結(jié)果
從表3結(jié)果可以看出,從正常、注意、異常、嚴(yán)重四種狀態(tài)的樣本集中各抽取25個(gè)樣本作為測試樣本,將它們投影在表2計(jì)算形成的訓(xùn)練樣本特征空間中進(jìn)行分類,本算法的設(shè)備狀態(tài)評價(jià)的準(zhǔn)確率均在80%以上,具備良好的效果。
本文以設(shè)備狀態(tài)評價(jià)作為研究對象,將數(shù)據(jù)挖掘方法引入到電力設(shè)備狀態(tài)評價(jià)中,建立了電力設(shè)備狀態(tài)評估的大數(shù)據(jù)分析架構(gòu),為設(shè)備狀態(tài)評價(jià)方法提供了新的思路。同時(shí),數(shù)據(jù)挖掘技術(shù)不斷地深入電力企業(yè)的各個(gè)領(lǐng)域,為將來電力系統(tǒng)健康、安全、穩(wěn)定的發(fā)展提供了更多應(yīng)用渠道。目前數(shù)據(jù)挖掘在電力系統(tǒng)中的應(yīng)用尚處于試探的階段,隨著“數(shù)據(jù)大爆炸時(shí)代”的到來,數(shù)據(jù)挖掘必然會對現(xiàn)有的統(tǒng)計(jì)學(xué)方法帶來巨大的沖擊。
[1] 許婧,王晶,高峰. 電力設(shè)備狀態(tài)檢修技術(shù)研究綜述[J]. 電網(wǎng)技術(shù),2000,24(8):48-52.
[2] 吳杰余,張哲,尹項(xiàng)根. 電氣二次設(shè)備狀態(tài)檢修研究[J]. 繼電器,2002,30(2):22-24.
[3] SAMROUT M,YALAOUI F,CHATELET E. New methods to minimize the preventive maintenance cost of series-parallel systems using ant colony optimization [J]. Reliability Engineering and System Safety,2005,89(3): 346-354.
[4] 宮宇,呂金壯. 大數(shù)據(jù)挖掘分析在電力設(shè)備狀態(tài)評估中的應(yīng)用[J]. 南方電網(wǎng)技術(shù),2014,8(6):74-77.
[5] 趙一婕,劉滌塵,吳軍. 基于線性判別分析與主成份分析的骨干網(wǎng)架生存性評估方法[J]. 電網(wǎng)技術(shù),2014,38(2):388-394.
[6] 羅玉波. 關(guān)于因子分析用于綜合排名的一個(gè)注記[J]. 西南大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,35(4):106-110.
[7] Tan Pangning. 數(shù)據(jù)挖掘?qū)д揫M]. 范明,范宏建,譯. 北京:人民郵電出版社,2013.
[8] 嚴(yán)英杰,盛戈皞,陳玉峰. 基于關(guān)聯(lián)規(guī)則和主成分分析的輸電線路狀態(tài)評價(jià)關(guān)鍵參數(shù)體系構(gòu)建[J]. 高壓電技術(shù),2015,41(7):2308-2314.
[9] 趙曉君,鄭倩. 基于PCA-KNN聚類的通用在線故障診斷算法設(shè)計(jì)[J]. 計(jì)算機(jī)測量與控制,2015,23(8):2762-2765.
[10] 浦路平,趙鵬大,胡光道. 基于PCA和K-均值聚類的有監(jiān)督分裂層次聚類方法[J]. 計(jì)算機(jī)應(yīng)用研究,2008,25(5):1412-1414.
[11] 楊國慶,張宇. 數(shù)據(jù)挖掘技術(shù)在電力設(shè)備狀態(tài)檢修中的應(yīng)用[J]. 上海電力學(xué)院學(xué)報(bào),2012,28(2):176-180.
[12] 劉寶英,楊仁剛. 基于主成分分析的最小二乘支持向量機(jī)短期負(fù)荷預(yù)測模型[J]. 電力設(shè)備自動化,2008,28(11): 13-17.
[13] 廖志偉,孫雅明. 基于數(shù)據(jù)挖掘模型的高壓輸電系統(tǒng)故障診斷[J]. 電力系統(tǒng)自動化,2001,25(15):15-19.
[14] 成永強(qiáng). 基于數(shù)據(jù)挖掘的設(shè)備狀態(tài)檢修[D]. 北京: 華北電力大學(xué),2005.
[15] 王師霜. 二次設(shè)備狀態(tài)評價(jià)數(shù)據(jù)挖掘技術(shù)的研究與應(yīng)用[D]. 北京: 華北電力大學(xué),2013.
A method of power equipment state assessment based on data mining technique
Li Jin1,Gao Shou2
(1. Power Dispatching and Communication Center of CSG,Guangzhou 510663,China; 2. NARI Group Corporation (State Grid Electric Power Research Institute),Nanjing 210003,China)
To improve the accuracy and efficiency of the power equipment condition assessment,a method of power equipment state assessment based on data mining technique is proposed in this paper. The state evaluation model based on data mining is introduced. In this method,the power equipment on-line monitoring information,inventory information,and operation information are collected from equipment history database as the basis of evaluation of equipment parameters. These historical data are classified into different data sets for each data set,then the feature vector is extracted. The data mining technique is used to extract main feature vector as classification of equipment state evaluation. The method provides a new way of thinking for the equipment state evaluation.
data mining; principal component analysis; power equipment condition assessment
TP311
A
10.19358/j.issn.1674-7720.2017.24.021
李金,高壽.一種基于數(shù)據(jù)挖掘分析的設(shè)備狀態(tài)評價(jià)方法J.微型機(jī)與應(yīng)用,2017,36(24):72-75.
2017-05-19)
李金(1979-),男,碩士,高級工程師,主要研究方向:電力系統(tǒng)自動化。
高壽(1982-),男,碩士,工程師,主要研究方向:電力系統(tǒng)自動化。