李囈瑾
(云南電網(wǎng)信息中心,云南 昆明 650000)
信息技術(shù)飛速發(fā)展背景下,數(shù)據(jù)規(guī)模持續(xù)擴(kuò)大。大數(shù)據(jù)時(shí)代的到來,增加了數(shù)據(jù)分析和數(shù)據(jù)處理的難度。數(shù)據(jù)挖掘技術(shù)是以現(xiàn)代計(jì)算機(jī)信息技術(shù)為支撐,通過構(gòu)建數(shù)據(jù)庫的方式實(shí)現(xiàn)數(shù)據(jù)信息的處理。從海量數(shù)據(jù)中挖掘有價(jià)值的信息,能更好地適應(yīng)大數(shù)據(jù)的發(fā)展要求。為提升數(shù)據(jù)的精準(zhǔn)度和利用率,必須對不完全模糊數(shù)據(jù)進(jìn)行信息篩除[1]。數(shù)據(jù)挖掘系統(tǒng)基礎(chǔ)模型如圖1所示。
圖1 數(shù)據(jù)挖掘基礎(chǔ)模型
現(xiàn)階段的電網(wǎng)運(yùn)營監(jiān)控中,電力企業(yè)經(jīng)常遇到一些問題,影響電網(wǎng)的穩(wěn)定發(fā)展。為實(shí)現(xiàn)電網(wǎng)開放模式的過渡,必須合理運(yùn)用數(shù)據(jù)挖掘技術(shù)。為加強(qiáng)對電網(wǎng)運(yùn)營狀況的實(shí)時(shí)控制,必須使原本復(fù)雜的電網(wǎng)運(yùn)行監(jiān)控系統(tǒng)更加簡潔、科學(xué)。運(yùn)用數(shù)據(jù)挖掘技術(shù)的過程中,需調(diào)整好大數(shù)據(jù)環(huán)境,以保障疏忽信息的質(zhì)量,實(shí)現(xiàn)數(shù)據(jù)處理的系統(tǒng)化、精確化及高效化。
目前,數(shù)據(jù)挖掘技術(shù)大致可分為三種類型。第一,統(tǒng)計(jì)分析型。該類型強(qiáng)調(diào)依照一定規(guī)律來挖掘數(shù)據(jù),是最成熟的一種數(shù)據(jù)挖掘技術(shù)。實(shí)際應(yīng)用的數(shù)據(jù)挖掘工具有變量分析、聚類分析及時(shí)間序列分析等。先通過數(shù)據(jù)分析找出存在的規(guī)律,然后運(yùn)用不同模型完成數(shù)據(jù)挖掘。第二,知識(shí)發(fā)現(xiàn)型,該類型的基本原理是從數(shù)據(jù)倉庫中過濾有用信息,然后對其中隱含的位置信息進(jìn)行挖掘。知識(shí)發(fā)現(xiàn)型數(shù)據(jù)挖掘技術(shù)的典型應(yīng)用包括人工智能神經(jīng)網(wǎng)絡(luò)和DNA遺傳序列組等。第三,其他數(shù)據(jù)挖掘。該類型包括文本數(shù)據(jù)挖掘、空間數(shù)據(jù)挖掘、分布式數(shù)據(jù)挖掘以及萬維網(wǎng)數(shù)據(jù)挖掘等。對于文本等非機(jī)構(gòu)數(shù)據(jù),采用文本數(shù)據(jù)挖掘;對于地理影像數(shù)據(jù),采用空間數(shù)據(jù)挖掘;對于網(wǎng)絡(luò)數(shù)據(jù),采用萬維網(wǎng)數(shù)據(jù)挖掘[2]。
電網(wǎng)運(yùn)營監(jiān)控平臺(tái)建設(shè)中,應(yīng)用數(shù)據(jù)挖掘技術(shù)完成數(shù)據(jù)的高效混輸,然后配合專業(yè)的計(jì)算機(jī)軟件,實(shí)現(xiàn)數(shù)據(jù)信息的篩選和分析工作,進(jìn)而判斷數(shù)據(jù)的準(zhǔn)確性和價(jià)值性,以保證電網(wǎng)的正常運(yùn)營監(jiān)控。相關(guān)結(jié)果可直接顯示在數(shù)據(jù)顯示終端。電網(wǎng)運(yùn)營監(jiān)控平臺(tái)包括了數(shù)據(jù)倉庫、挖掘模型及顯示終端等,其核心部分是源數(shù)據(jù)、數(shù)據(jù)倉庫及顯示終端。核心部分構(gòu)成了電網(wǎng)運(yùn)營監(jiān)控平臺(tái)的系統(tǒng)框架,使原本復(fù)雜的系統(tǒng)區(qū)域簡單化和規(guī)范化。系統(tǒng)中,源數(shù)據(jù)能通過相應(yīng)的數(shù)據(jù)通道實(shí)現(xiàn)高效傳輸,經(jīng)由數(shù)據(jù)處理中心進(jìn)行處理后,顯示在顯示終端。數(shù)據(jù)處理環(huán)節(jié)的核心部分是數(shù)據(jù)挖掘,不僅可從海量數(shù)據(jù)中剔除虛假信息,而且可挖掘出數(shù)據(jù)的潛在價(jià)值。最終結(jié)果顯示階段,要求相關(guān)人員做好顯示終端的選擇工作,確保檢測到的各種數(shù)據(jù)信息能清晰準(zhǔn)確地顯示出來,如全面監(jiān)測、協(xié)調(diào)控制、綜合管理及運(yùn)營分析等[3]。
電網(wǎng)運(yùn)營監(jiān)控平臺(tái)中,數(shù)據(jù)倉庫主要體現(xiàn)系統(tǒng)的非功能性需求,包含兩個(gè)組成部分。第一,DW/DM,即數(shù)據(jù)倉庫本身結(jié)構(gòu)的多維度性。電力企業(yè)可根據(jù)實(shí)際需求,利用電網(wǎng)運(yùn)營監(jiān)控平臺(tái)合理設(shè)置數(shù)據(jù)的不同要求,配合有效的分類標(biāo)準(zhǔn)逐步完成繁雜數(shù)據(jù)的整理規(guī)劃,便于數(shù)據(jù)的綜合處理,也方便了電力企業(yè)進(jìn)行數(shù)據(jù)更新和利用。第二,ODS。它是強(qiáng)調(diào)將業(yè)務(wù)邏輯作為前提,配合E-R模型來反映操作流程,其組成部分包括主數(shù)據(jù)和交易數(shù)據(jù)。建設(shè)ODS應(yīng)用部分的過程中,需結(jié)合相關(guān)要求進(jìn)行表格設(shè)計(jì),以確保ODS表結(jié)構(gòu)能與原系統(tǒng)表結(jié)構(gòu)合并,為后續(xù)的數(shù)據(jù)統(tǒng)計(jì)分析提供便利[4]。
完成電網(wǎng)運(yùn)營監(jiān)控平臺(tái)系統(tǒng)框架的架設(shè)后,需配合有效算法挖掘數(shù)據(jù)倉庫中的數(shù)據(jù)信息。為提升電網(wǎng)運(yùn)營監(jiān)控工作水平,技術(shù)人員必須根據(jù)實(shí)際情況做好算法的設(shè)計(jì)選擇。數(shù)據(jù)計(jì)算過程中,需用到相應(yīng)的ETL工具,經(jīng)由OSD完成源數(shù)據(jù)的統(tǒng)計(jì)分析工作,然后再利用DW/DM實(shí)現(xiàn)數(shù)據(jù)的分類匯總整理。分析數(shù)據(jù)處理的總體流程發(fā)現(xiàn),基本原理是運(yùn)用映射關(guān)系、數(shù)據(jù)目標(biāo)以及數(shù)據(jù)源來實(shí)現(xiàn)數(shù)據(jù)計(jì)算,其中,映射關(guān)系指數(shù)據(jù)源和數(shù)據(jù)目標(biāo)實(shí)現(xiàn)的過程,數(shù)據(jù)源代表原始數(shù)據(jù)或者所有數(shù)據(jù)的輸入端;數(shù)據(jù)目標(biāo)多表現(xiàn)為數(shù)據(jù)表和經(jīng)過統(tǒng)計(jì)分析后的數(shù)據(jù),本身存在一定規(guī)律性。
電網(wǎng)運(yùn)營監(jiān)控平臺(tái)能為電力企業(yè)開展電網(wǎng)運(yùn)行監(jiān)控工作提供可靠的數(shù)據(jù)挖掘環(huán)境,提升監(jiān)控效果。因此,構(gòu)建數(shù)據(jù)倉庫時(shí),應(yīng)依照電網(wǎng)運(yùn)行監(jiān)控主體的現(xiàn)實(shí)需求,做好合理地規(guī)劃設(shè)計(jì),盡可能減少冗余數(shù)據(jù)和無用數(shù)據(jù)[5],以降低大數(shù)據(jù)對電網(wǎng)運(yùn)營監(jiān)控工作的負(fù)面影響。同時(shí),合理使用數(shù)據(jù)挖掘技術(shù),以便高效地完成數(shù)據(jù)源的篩選分析。構(gòu)建數(shù)據(jù)倉庫時(shí),應(yīng)明確主題,并進(jìn)一步細(xì)化主題內(nèi)容。條件允許時(shí),可分為多個(gè)子主題,使所有子主題中的數(shù)據(jù)挖掘都可與主題相互對應(yīng)。電力企業(yè)在開展電網(wǎng)運(yùn)營監(jiān)控平臺(tái)建設(shè)的過程中,需確保子主題能與企業(yè)自身的業(yè)務(wù)數(shù)據(jù)相互對應(yīng)。此外,考慮到實(shí)踐中可能需要通過維表實(shí)現(xiàn)數(shù)據(jù)庫不同區(qū)域數(shù)據(jù)的連接,應(yīng)將數(shù)據(jù)庫建設(shè)成多維數(shù)據(jù)集,確保使用價(jià)值最大化。
信息化技術(shù)的飛速發(fā)展使數(shù)據(jù)挖掘技術(shù)的功能越來越完善。電網(wǎng)運(yùn)營監(jiān)控平臺(tái)在卡站監(jiān)控展示的過程中,可供選擇的展示形式包括柱狀圖、餅狀圖、維恩圖以及折線圖等。不同的展示形式適用于不同的需求,確保了技術(shù)人員和管理人員能對數(shù)據(jù)變化進(jìn)行動(dòng)態(tài)分析,為電網(wǎng)運(yùn)營監(jiān)控管理工作提供參考。如果需表達(dá)電網(wǎng)運(yùn)營監(jiān)控的工作量,可選擇條形圖或者柱狀圖;如果需表達(dá)數(shù)據(jù)的變化趨勢,可選擇折線圖;如果需表達(dá)數(shù)據(jù)之間的交叉關(guān)系,可采用維恩圖(見圖2)。
圖2 監(jiān)控展示圖表類組件
經(jīng)濟(jì)的發(fā)展使社會(huì)對電能的需求持續(xù)增長,電網(wǎng)規(guī)模迅速擴(kuò)大。運(yùn)營監(jiān)控工作直接影響電網(wǎng)的穩(wěn)定、可靠運(yùn)行。電力企業(yè)面對新的發(fā)展環(huán)境,應(yīng)積極探索新的方法來保證電網(wǎng)運(yùn)營監(jiān)控工作效果。將數(shù)據(jù)挖掘技術(shù)應(yīng)用到電網(wǎng)運(yùn)營監(jiān)控平臺(tái)建設(shè),可實(shí)現(xiàn)海量數(shù)據(jù)的高效處理和深入挖掘,方便工作人員掌控和使用數(shù)據(jù)信息,保障電網(wǎng)的穩(wěn)定、可靠運(yùn)行。