齊金定 孫濤 單巖 鄭少華 于振洪 孫靜
摘要:輸電線路具有距離長、覆蓋區(qū)域廣等特點(diǎn),容易受天然環(huán)境及人為成分的影響較多,致使線路的運(yùn)作維護(hù)工作存在較大困難,如何從海量數(shù)據(jù)中挖掘出有效信息,實(shí)現(xiàn)對輸電線路的故障診斷,是急需要解決的問題。提出一種基于支持向量機(jī)(Support Vector Machine,SVM)算法的數(shù)據(jù)挖掘方法,將其應(yīng)用于輸電線路故障診斷方面,可以從輸電線路海量信息中找出潛藏的模式和其中的規(guī)則,成為調(diào)度人員處理事件的協(xié)助工具,起到降低事故處理耗時、防止事故擴(kuò)大的作用,提高輸電線路運(yùn)行和維護(hù)的質(zhì)量。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;SVM算法;故障分析
中圖分類號:TP393文獻(xiàn)標(biāo)志碼:A文章編號:1008-1739(2019)23-68-4
0引言
輸電線路是電力系統(tǒng)的重要組成部分,將發(fā)電、變電、供配電的廠站設(shè)備和用戶有機(jī)地聯(lián)接成一個整體,具有線長、點(diǎn)多和面廣的特點(diǎn)。它的運(yùn)行狀態(tài)直接關(guān)系到電力系統(tǒng)的可靠運(yùn)行,影響著電力用戶的用電安全和良好的用電體驗。并且,隨著現(xiàn)代電網(wǎng)的規(guī)模、容量和覆蓋范圍越來越大,輸電線路在國民經(jīng)濟(jì)和人民生活中占有重要地位,電網(wǎng)故障停電將會給社會生產(chǎn)和人民生活造成重大的經(jīng)濟(jì)損失。輸電線路因為具有運(yùn)送距離長、覆蓋區(qū)域廣等特點(diǎn),容易受自然環(huán)境及人為因素的影響較多,致使線路的運(yùn)維工作存在較大困難[1],同時隨著信息化的建設(shè),輸電線路每年都會產(chǎn)生大量數(shù)據(jù),因此,如何從海量數(shù)據(jù)中挖掘出所需要的知識,使現(xiàn)代電力系統(tǒng)在完成日常生產(chǎn)管理工作的基礎(chǔ)上,實(shí)現(xiàn)對電力系統(tǒng)的實(shí)時監(jiān)測、故障診斷以及故障預(yù)測等功能,是現(xiàn)代智能電網(wǎng)需要解決的問題。數(shù)據(jù)挖掘技術(shù)是大數(shù)據(jù)分析中的關(guān)鍵技術(shù),其實(shí)質(zhì)是從海量數(shù)據(jù)中挖掘出隱含的知識,并將發(fā)現(xiàn)的數(shù)據(jù)轉(zhuǎn)化為信息,信息轉(zhuǎn)化為知識,知識轉(zhuǎn)化為行動,行動轉(zhuǎn)化為價值。
1數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘(Data Mining,DM)的概念由美國計算機(jī)學(xué)會在1995年提出,是指從海量的、隨機(jī)的、不完整的、模糊的數(shù)據(jù)中,提取出人們所需信息的過程。與這一術(shù)語相近的有許多,例如從數(shù)據(jù)庫中發(fā)現(xiàn)知識、數(shù)據(jù)分析、知識抽取、模式分析、數(shù)據(jù)采集和信息收割等[2]。總的來說,DM可以被認(rèn)為是機(jī)器學(xué)習(xí)和數(shù)據(jù)庫衍生的產(chǎn)物,主要作用就是利用這二者對海量數(shù)據(jù)進(jìn)行分析和管理。本文選取SVM算法進(jìn)行研究。
1.1 SVM算法
SVM算法由Vapnik等學(xué)者提出,是近些年來機(jī)器學(xué)習(xí)、模式識別以及神經(jīng)網(wǎng)絡(luò)等學(xué)術(shù)界公認(rèn)的最有影響力的成就之一。SVM是統(tǒng)計學(xué)習(xí)理論中較新的理論,采用結(jié)構(gòu)風(fēng)險最小化原理,兼顧訓(xùn)練誤差和泛化能力,在解決小樣本、非線性和高維數(shù)局部極小值等問題中表現(xiàn)出特有優(yōu)勢[3]。
SVM自提出以來,經(jīng)過近二十年的發(fā)展,已經(jīng)在許多領(lǐng)域取得了豐碩成果。現(xiàn)有SVM發(fā)展方向主要分為4個方面:
①改進(jìn)SVM的運(yùn)算速度,使其適應(yīng)大規(guī)模數(shù)據(jù)集的研究,例如序列最小化算法等;
②對原有的SVM的形式優(yōu)化,簡化其中的計算過程;
③根據(jù)結(jié)構(gòu)風(fēng)險最小化原則以及SVM的一些原理而提出的新算法,例如廣義SVM等;
④根據(jù)結(jié)構(gòu)風(fēng)險最小原則以及核函數(shù)思想,在傳統(tǒng)的線性算法上構(gòu)造出相應(yīng)的核形式,例如核主成分分析。
1.2 SVM基本原理
SVM的核心內(nèi)容就是升維、線性化和核函數(shù),最終目的是尋找一個定義最優(yōu)線性超平面,使得訓(xùn)練樣本集中類型不同的點(diǎn)處于超平面的兩側(cè),與此同時,超平面兩側(cè)的空白區(qū)域必須達(dá)到最大。SVM理論能完美地支持二維2類線性可分?jǐn)?shù)據(jù)。
1.3 SVM算法求解過程
SVM優(yōu)化的實(shí)質(zhì)是對其參數(shù)進(jìn)行優(yōu)化。SVM分類器的好壞判別標(biāo)準(zhǔn),主要取決于其泛化能力和機(jī)器學(xué)習(xí)的復(fù)雜程度,簡而言之就是所構(gòu)建模型對未知數(shù)據(jù)測試的精準(zhǔn)程度,SVM模型的確定主要在于懲罰系數(shù)與核函數(shù)參數(shù)的選擇。
傳統(tǒng)SVM參數(shù)分類問題尋優(yōu)需要對,(分別表示懲罰系數(shù)、核函數(shù)參數(shù))組合在給定范圍(2個參數(shù)范圍)一般為lb =-1:1:14,lb =-8:-1:-23內(nèi)進(jìn)行窮盡搜索,搜索次數(shù)等于2個參數(shù)向量長度的乘積,搜索總耗時等于搜索次數(shù)與訓(xùn)練樣本個數(shù)的乘積。
SVM算法求解過程如圖2所示。
2輸變電系統(tǒng)大數(shù)據(jù)分析概述
電力系統(tǒng)的整個運(yùn)行過程中會產(chǎn)生海量多源異構(gòu)數(shù)據(jù),也就是大數(shù)據(jù),保證現(xiàn)代電網(wǎng)安全運(yùn)行的前提是能夠及時處理這些海量數(shù)據(jù)。其中,輸變電設(shè)備狀態(tài)監(jiān)測數(shù)據(jù)占絕大部分,既包含設(shè)備的基本信息,也包含設(shè)備運(yùn)行中的在線狀況監(jiān)測信息,數(shù)據(jù)量十分巨大,這對數(shù)據(jù)處理能力的可靠性和實(shí)時性要求很高[5]。
2.1輸變電系統(tǒng)大數(shù)據(jù)特點(diǎn)
輸變電系統(tǒng)中的數(shù)據(jù)具備大數(shù)據(jù)標(biāo)志性的“4V”特征,即規(guī)模大、類型多、價值密度低和變化快[6],具體特點(diǎn)如下。
①規(guī)模大
輸變電設(shè)備狀態(tài)數(shù)據(jù)規(guī)模很大,量級一般都是以TB,PB為單位。例如,數(shù)據(jù)采集與監(jiān)視控制SCADA系統(tǒng),按10 000個遙測點(diǎn),采樣間隔為3~4 s計算,每年將會產(chǎn)生1.03 TB數(shù)據(jù)(1.03 TB=12字節(jié)/幀* 0.3幀/s*10 000遙測點(diǎn)*86 400 s/d*365天)。
②類型多
輸變電設(shè)備狀態(tài)數(shù)據(jù)類型呈現(xiàn)多樣化的特點(diǎn),包括各種歷史數(shù)據(jù)、實(shí)時數(shù)據(jù)、文本數(shù)據(jù)、多媒體數(shù)據(jù)等結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù)。對于不同類型的數(shù)據(jù)處理方式以及處理要求也都是不一樣的。例如,輸電線路系統(tǒng)中線路的臺賬信息通常是以文本數(shù)據(jù)的形式被記錄,而線路的運(yùn)行狀況則往往是以圖片或者視頻的方式被記錄。
③價值密度低
輸變電設(shè)備狀態(tài)數(shù)據(jù)存在價值密度低的特點(diǎn)。輸變電設(shè)備運(yùn)行過程中記錄了海量數(shù)據(jù),而其中絕大多數(shù)都屬于正常數(shù)據(jù),僅有非常稀少的故障數(shù)據(jù),然而這些極少量的故障數(shù)據(jù)比正常數(shù)據(jù)更具有價值,它能夠有助于操作者了解設(shè)備的真實(shí)狀況。例如,輸變電設(shè)備狀態(tài)監(jiān)測連續(xù)24 h的監(jiān)測數(shù)據(jù)中真正有價值的可能僅僅只有1~2 s。
④數(shù)據(jù)處理速度要求快
由于電力系統(tǒng)的特殊性,操作者往往需要在極短暫的時間內(nèi)做出正確的操作,這就需要系統(tǒng)能在數(shù)以ms的時間內(nèi)對海量數(shù)據(jù)進(jìn)行有效分析,以輔助操作者做出決策[7]。
3基于SVM算法的故障診斷分析
選取某地一條輸電線路的連續(xù)4個月的運(yùn)行數(shù)據(jù)作為訓(xùn)練樣本,以第5個月的運(yùn)行數(shù)據(jù)作為基礎(chǔ)測試樣本,由于輸電線路實(shí)際運(yùn)行中出現(xiàn)的故障極少,而故障樣本數(shù)量較少將會使實(shí)驗結(jié)果展現(xiàn)不夠直觀,因此在訓(xùn)練樣本以及測試樣本中添加了該等級線路歷史數(shù)據(jù)中的故障數(shù)據(jù),擴(kuò)充了故障數(shù)據(jù)量,使實(shí)驗展示的結(jié)果更加直觀,增強(qiáng)了實(shí)驗的說服力。
實(shí)驗選取輸電線路的有功功率、無功功率、電流和電壓4個指標(biāo)作為故障判斷依據(jù)。運(yùn)用SVM模型進(jìn)行實(shí)驗。此外,實(shí)驗過程中針對不同的故障類型,分別建立了訓(xùn)練模型,并利用測試樣本數(shù)據(jù)進(jìn)行了實(shí)驗。將SVM模型的參數(shù)設(shè)定為lb =-1:1:14,lb =4:-1:-11能搜尋到最優(yōu)參數(shù)組合,以得到最優(yōu)的時間效率和精確度。
通過算法驗證表明,訓(xùn)練樣本數(shù)據(jù)在經(jīng)過訓(xùn)練之后,使該模型實(shí)現(xiàn)智能故障診斷功能,用測試樣本數(shù)據(jù)進(jìn)行故障診斷時,測試樣本中的輸電線路故障類型已被檢測,基本實(shí)現(xiàn)了輸電線路智能化診斷功能,達(dá)到了實(shí)驗預(yù)期效果,達(dá)到了將大數(shù)據(jù)技術(shù)運(yùn)用到輸電線路故障診斷的目的。
4結(jié)束語
通過介紹大數(shù)據(jù)分析中的DM、SVM算法等技術(shù),輸變電系統(tǒng)大數(shù)據(jù)的特點(diǎn)和關(guān)鍵問題,提出的SVM算法在處理回歸和模式識別等問題上具有獨(dú)到的優(yōu)勢,使其非常適應(yīng)于輸電線路故障診斷研究,可以從輸電線路海量的信息中,找出潛藏的模式和其中的規(guī)則,成為調(diào)度人員處理事件的協(xié)助工具,能夠起到降低事故處理耗時、防止事故擴(kuò)大的作用,提高輸電線路運(yùn)行和維護(hù)的質(zhì)量,提高電力系統(tǒng)的運(yùn)行穩(wěn)定性,保障大電網(wǎng)穩(wěn)定安全運(yùn)行。
參考文獻(xiàn)
[1]張東霞,苗新,劉麗平,等.智能電網(wǎng)大數(shù)據(jù)技術(shù)發(fā)展研究[J].中國電機(jī)工程學(xué)報,2015,35(1):2-12.
[2]邵峰晶,于忠清.數(shù)據(jù)挖掘原理與算法[M].北京:中國水利水電出版社,2003.
[3]芮璋現(xiàn),肖海波.支持向量機(jī)(SVM)及其應(yīng)用[J].福建電腦, 2007(4):110.
[4] Vapnik V N, Golowich S E, Smola A. Support Vector Method for Function Approximation, Regression Estimation, and Signal Processing [J]. Advances in Neural Information Processing Systems, 1997: 281-287.
[5]周志華.機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘[J].中國計算機(jī)學(xué)會通訊, 2007,3(12):27-37.
[6]夏火松.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:科學(xué)出版社, 2004.
[7]宋亞奇,周國亮,朱永利.智能電網(wǎng)大數(shù)據(jù)處理技術(shù)現(xiàn)狀與挑戰(zhàn)[J].電網(wǎng)技術(shù),2013,37(4):927-935.
[8]金澈清,錢衛(wèi)寧,周傲英.流數(shù)據(jù)分析與管理綜述[J].軟件學(xué)報,2004,5(8):1172-1181.