● 湖南·國(guó)網(wǎng)永州供電公司 蔣 濤 湯新華 李 娟
線變關(guān)系是指供電企業(yè)線路與變壓器之間的對(duì)應(yīng)關(guān)系,通常每臺(tái)變壓器都連接到固定的線路上,線變關(guān)系正確與否將直接影響到配電搶修效率和優(yōu)質(zhì)服務(wù)質(zhì)量的好壞,同時(shí)也決定著線損計(jì)算正確與否。目前核對(duì)線變關(guān)系的主要方法是現(xiàn)場(chǎng)核對(duì),通過現(xiàn)場(chǎng)與圖紙、系統(tǒng)對(duì)比,發(fā)現(xiàn)差異并整改問題,實(shí)現(xiàn)三者的統(tǒng)一。對(duì)配電變壓器新增、改接、銷戶引起的線變關(guān)系變動(dòng)要加強(qiáng)管理,確保系統(tǒng)檔案與現(xiàn)場(chǎng)一致,避免前清后亂。實(shí)際工作中,受多種因素影響,線變關(guān)系在系統(tǒng)檔案中會(huì)出現(xiàn)與現(xiàn)場(chǎng)不一致的情況,管理人員難以及時(shí)發(fā)現(xiàn)檔案中存在的問題。
基于“同一線路終端停電時(shí)間一致”原理,永州供電公司利用數(shù)據(jù)挖掘技術(shù)建立識(shí)別模型,為識(shí)別檔案中線變關(guān)系正確與否提供一種新的手段,可以極大地提高線變關(guān)系核對(duì)效率,減少大量的人工操作。
隨著電力采集終端在現(xiàn)場(chǎng)安裝率和運(yùn)行穩(wěn)定性的不斷提高,利用其對(duì)現(xiàn)場(chǎng)臺(tái)區(qū)運(yùn)行狀況進(jìn)行監(jiān)測(cè)已成為現(xiàn)實(shí)?,F(xiàn)場(chǎng)運(yùn)行的終端根據(jù)自身供電情況產(chǎn)生對(duì)停/上電的判斷,并將判斷結(jié)果主動(dòng)上報(bào)形成停/上電記錄,記錄僅局限于對(duì)單個(gè)終端的運(yùn)行工況。
停電事件的生成包括終端停/上電和電能表掉電事件的生成。本文僅分析與線路有關(guān)的臺(tái)區(qū)停電數(shù)據(jù),因此重點(diǎn)研究終端停/上電數(shù)據(jù)的生成。
根據(jù)《智能電能表及采集終端事件記錄采集規(guī)則》,終端停/上電事件為1級(jí)緊急事件,終端生成事件后,采集終端采用光纖、手機(jī)網(wǎng)絡(luò)等方式主動(dòng)上報(bào)事件數(shù)據(jù)到主站,而后主站向終端下發(fā)確認(rèn)命令。
由于用電現(xiàn)場(chǎng)環(huán)境復(fù)雜、情況多變,采集終端可能由于供電回路異常、軟件設(shè)計(jì)差異、通道通信、終端時(shí)鐘等原因,出現(xiàn)現(xiàn)場(chǎng)未停電情況下生成停電事件并主動(dòng)上報(bào)主站,或是發(fā)生了一次停電卻多次上報(bào)停電事件等情況。因此,在利用停電數(shù)據(jù)進(jìn)行數(shù)據(jù)分析時(shí),要充分研究停電事件生成原理,掌握終端停/上電數(shù)據(jù)質(zhì)量的影響因素,對(duì)誤報(bào)干擾信息進(jìn)行清理,保留有價(jià)值的數(shù)據(jù)。
終端停/上電數(shù)據(jù)來源為“電力用戶用電信息采集系統(tǒng)”中的主站停/上電事件查詢,由縣供電公司分月導(dǎo)出。整個(gè)實(shí)現(xiàn)過程分成5個(gè)步驟,分別是數(shù)據(jù)可視化、數(shù)據(jù)清洗、數(shù)圖轉(zhuǎn)換、聚類分析和結(jié)果可視化,其中數(shù)據(jù)清洗、數(shù)圖轉(zhuǎn)換、聚類分析3個(gè)步驟重點(diǎn)在于對(duì)數(shù)據(jù)進(jìn)行處理,由于涉及到大數(shù)據(jù)量的計(jì)算,可以通過Python編程形成一個(gè)可執(zhí)行文件自動(dòng)完成;數(shù)據(jù)可視化和結(jié)果可視化使用Tableau工具完成,最終結(jié)果是形成停電圖紋PDF文件和異動(dòng)臺(tái)區(qū)Excel文件。
根據(jù)電力用戶用電信息采集系統(tǒng)主站停/上電查詢界面,其數(shù)據(jù)是以停電事件為記錄,即每一個(gè)記錄代表每一個(gè)終端上報(bào)的停/上電事件,對(duì)終端一次完整的停/上電事件進(jìn)行記錄,數(shù)據(jù)包括用戶編號(hào)、線路名稱、停電發(fā)生時(shí)間和停電結(jié)束時(shí)間。
停電數(shù)據(jù)可視化有助于了解、發(fā)現(xiàn)數(shù)據(jù)的特點(diǎn)。利用Tableau工具可以對(duì)終端停/上電數(shù)據(jù)進(jìn)行可視化分析并得到結(jié)果??梢暬Y(jié)果以單個(gè)臺(tái)區(qū)為記錄,反映單個(gè)臺(tái)區(qū)在一段時(shí)間(本文取1個(gè)月)內(nèi)的停電時(shí)間和停電時(shí)長(zhǎng),每一個(gè)條紋代表一次停電,每個(gè)條紋位置對(duì)應(yīng)停電時(shí)間點(diǎn),條紋的寬度代表停電時(shí)長(zhǎng)。由此可以發(fā)現(xiàn)每個(gè)臺(tái)區(qū)的停電圖形有其自身的獨(dú)特性,類似于人類的“指紋”,為此,筆者提出了“停電圖紋”的概念,通過特定停電圖紋可以快速地識(shí)別一個(gè)臺(tái)區(qū)。據(jù)此可以利用停電圖紋的相似性來聚類臺(tái)區(qū),將停電圖紋相似度極高(即多次停電相同)的臺(tái)區(qū)歸成一類,然后將聚類結(jié)果與檔案數(shù)據(jù)比對(duì),把有差異的情況視為異動(dòng)。
通過對(duì)業(yè)務(wù)數(shù)據(jù)形成的理解和停電數(shù)據(jù)的分析,發(fā)現(xiàn)停/上電數(shù)據(jù)質(zhì)量上存在問題,主要表現(xiàn)在:停電時(shí)間不規(guī)范,標(biāo)準(zhǔn)停電時(shí)間格式為yyyy/m/d h:mm,不規(guī)范停電缺失時(shí)間格式為yyyy/m/d,經(jīng)過分析,缺失時(shí)間以0點(diǎn)0分為主,解決辦法是按標(biāo)準(zhǔn)格式補(bǔ)齊數(shù)據(jù)。
另外,為提高聚類分析的準(zhǔn)確度,聚類分析使用的停電圖紋要基于多次停/上電的數(shù)據(jù),因此要清洗掉分析數(shù)據(jù)中停電次數(shù)僅為一次的臺(tái)區(qū)數(shù)據(jù)。
通過數(shù)據(jù)分析,發(fā)現(xiàn)即使是同一時(shí)間同一線路的臺(tái)區(qū)數(shù)據(jù)中的停電時(shí)間也存在不一致的情況,時(shí)間偏差集中在1~5分鐘,最大偏差可達(dá)30分鐘,存在這種現(xiàn)象的原因是終端時(shí)鐘不一致所致。鑒于停電偏差的問題,直接使用時(shí)間點(diǎn)來聚類的效果會(huì)很差,通過使用停電圖紋可以有效避免時(shí)間偏差的問題,提高數(shù)據(jù)分析成效。
以2月份國(guó)網(wǎng)道縣供電公司道萬線三角街臺(tái)區(qū)(采集點(diǎn))為例,該臺(tái)區(qū)共停電4次,總停電時(shí)長(zhǎng)598分鐘。經(jīng)過數(shù)據(jù)可視化,轉(zhuǎn)換成4個(gè)條紋,對(duì)應(yīng)相應(yīng)的時(shí)間點(diǎn)、時(shí)長(zhǎng)等停電特征,形成了該臺(tái)區(qū)2月份的停電圖紋,如圖1所示。
圖1 停電圖紋數(shù)圖轉(zhuǎn)換過程
把可視化的停電圖紋以數(shù)字的方法存儲(chǔ),首先建立以分鐘為顆粒度的時(shí)間序列,以一個(gè)月30天計(jì)算,時(shí)間序列長(zhǎng)度為30×24×60=43200個(gè)單元,每一個(gè)單元表示該臺(tái)區(qū)在這一分鐘是否停電,未停電為0,停電為1,最終形成該臺(tái)區(qū)停電圖紋序列。將當(dāng)月所有臺(tái)區(qū)停電序列放在一起,就形成了當(dāng)月的停電圖紋矩陣,在此數(shù)據(jù)基礎(chǔ)上再開展圖紋相似度的計(jì)算。
2.4.1 聚類算法選擇
聚類是將物理對(duì)象或抽象對(duì)象的集合分成由類似的對(duì)象組成的多個(gè)類的過程,聚類是一種無監(jiān)督學(xué)習(xí)。本文使用的聚類算法是DBSCAN算法,它是一個(gè)有代表性的基于密度的聚類算法。與劃分和層次聚類方法不同,它將簇定義為密度相連的點(diǎn)的最大集合,能夠把具有足夠高密度的區(qū)域劃分為簇,并可在噪聲的空間數(shù)據(jù)庫(kù)中發(fā)現(xiàn)任意形狀的聚類。DBSCAN算法不需要事先知道要形成的簇類的數(shù)量,可以發(fā)現(xiàn)任意形狀的簇類,并能夠識(shí)別出噪聲點(diǎn),且對(duì)于數(shù)據(jù)庫(kù)中樣本的順序不敏感。正是基于以上特點(diǎn),本文選擇了DBSCAN算法作為實(shí)現(xiàn)過程中的聚類算法。
2.4.2 聚類算法實(shí)現(xiàn)
利用Python編程對(duì)停電圖紋進(jìn)行聚類,在結(jié)果數(shù)據(jù)中增加3個(gè)字段:歸類、問題歸類、異常點(diǎn)。歸類是聚類算法計(jì)算的直接結(jié)果,算法以圖紋相似大于90%為條件,將臺(tái)區(qū)自動(dòng)聚類,聚類結(jié)果以自然數(shù)(0、1、2 ...)標(biāo)記歸類,每一個(gè)歸類將停電特征相近的臺(tái)區(qū)進(jìn)行統(tǒng)一標(biāo)記編號(hào)。
問題歸類是指同一歸類中,當(dāng)出現(xiàn)多個(gè)不唯一的線路名稱時(shí)視為問題,將同一歸類中線路名稱種類不為1的歸類標(biāo)記為問題歸類。
異常點(diǎn)是在問題歸類中查找線變關(guān)系有可能出錯(cuò)的臺(tái)區(qū),按同線路臺(tái)區(qū)出現(xiàn)數(shù)量的多少為判斷,數(shù)量少的線路名稱上的臺(tái)區(qū)為異常點(diǎn),算法默認(rèn)線變關(guān)系中多數(shù)臺(tái)區(qū)的線變關(guān)系是正確的。
聚類算法的結(jié)果利用Tableau工具進(jìn)行可視化處理成停電圖紋。通過停電圖紋,可以發(fā)現(xiàn)檔案在道萬線上的三角街臺(tái)區(qū)與道上線的其它臺(tái)區(qū)停電圖紋非常相似。對(duì)于停電時(shí)間和時(shí)長(zhǎng)如此相似的臺(tái)區(qū),筆者初步判定道萬線三角街臺(tái)區(qū)、道縣上關(guān)鄉(xiāng)石門村油茶基地臺(tái)區(qū)位于道上線上,這2個(gè)臺(tái)區(qū)檔案可能存在問題,將此異動(dòng)下發(fā)到基層單位進(jìn)行核對(duì),結(jié)果證明判斷正確。
整個(gè)實(shí)現(xiàn)過程將數(shù)據(jù)可視化技術(shù)和數(shù)據(jù)挖掘技術(shù)緊密結(jié)合,通過編程方法進(jìn)行封裝,操作人員只需要按要求提供有效的終端停/上電數(shù)據(jù),一個(gè)程序、一張圖即可通過停電圖紋識(shí)別線變關(guān)系。
在實(shí)現(xiàn)工作中,模型能發(fā)現(xiàn)和解決很多問題,但同時(shí)仍存在一些問題,比如單個(gè)母線多次停電導(dǎo)致多條不同線路停電圖紋一致,臺(tái)區(qū)單次停電較長(zhǎng)會(huì)影響相似度的對(duì)比,程序界面不友好,分析數(shù)據(jù)基于離線數(shù)據(jù),這些都是下一步需要改進(jìn)的地方。
停電圖紋識(shí)別線變關(guān)系是對(duì)停電數(shù)據(jù)的挖掘和應(yīng)用,充分挖掘停電數(shù)據(jù)的價(jià)值。通過數(shù)據(jù)分析,可以大大降低業(yè)務(wù)部門現(xiàn)場(chǎng)核查的工作量,同時(shí)形成有效的監(jiān)督手段,充分利用數(shù)據(jù)來督辦現(xiàn)場(chǎng)工作。