廖楚京
(南方電網(wǎng)科學(xué)研究院有限責(zé)任公司,廣東廣州 510663)
在現(xiàn)代化信息技術(shù)和互聯(lián)網(wǎng)得到飛速發(fā)展的今天,企業(yè)本身的運(yùn)營管理也發(fā)生了巨大的改變。電力企業(yè)內(nèi)部當(dāng)中,電力營銷可以幫助企業(yè)在市場競爭當(dāng)中取得一定的優(yōu)勢(shì),對(duì)于電力企業(yè)來說可以得到持續(xù)化的有效發(fā)展,不斷的推動(dòng)電力營銷信息化的建設(shè)過程,最終實(shí)現(xiàn)電力大數(shù)據(jù)信息化的營銷模式構(gòu)建。在此種情況下,電力企業(yè)需要緊跟時(shí)代步伐,構(gòu)建出大數(shù)據(jù)的管理中心,實(shí)現(xiàn)信息化的運(yùn)營模式。我國的電力企業(yè)營銷信息化建設(shè)的過程當(dāng)中,缺乏對(duì)營銷數(shù)據(jù)的整體挖掘和分析,因此對(duì)于潛在的問題沒有辦法在第一時(shí)間內(nèi)進(jìn)行針對(duì)性的處理,帶來了一定的阻礙制約問題。
在電力大數(shù)據(jù)平臺(tái)當(dāng)中,主要存在幾方面特點(diǎn):(1)規(guī)模相對(duì)較大,大數(shù)據(jù)平臺(tái)當(dāng)中的數(shù)據(jù)量很大,且在按照一定規(guī)律的基礎(chǔ)上形成了一定程度的規(guī)模。(2)多樣性,數(shù)據(jù)的類型多種多樣,在海量的數(shù)據(jù)集群當(dāng)中,需要對(duì)其對(duì)應(yīng)的類型進(jìn)行歸類,實(shí)現(xiàn)結(jié)構(gòu)性的整理分析。在電力企業(yè)內(nèi)部的電力營銷發(fā)展當(dāng)中,需要實(shí)現(xiàn)多個(gè)方面的關(guān)鍵技術(shù),此種技術(shù)可以對(duì)工作需求進(jìn)行最大限度的滿足,同時(shí)也可以減輕工作人員的任務(wù)量。第一,需要實(shí)現(xiàn)集成管理技術(shù),工作人員在應(yīng)用數(shù)據(jù)的基礎(chǔ)上實(shí)現(xiàn)合并應(yīng)用,呈現(xiàn)一定的格式和特點(diǎn),最終對(duì)數(shù)據(jù)可以實(shí)現(xiàn)有效的整合,并且將其轉(zhuǎn)化為穩(wěn)定的數(shù)據(jù)集合來對(duì)系統(tǒng)的運(yùn)行進(jìn)行保障。第二,分析技術(shù),在該技術(shù)當(dāng)中,需要借助于計(jì)算機(jī)、統(tǒng)計(jì)學(xué)等多個(gè)學(xué)科知識(shí),來實(shí)現(xiàn)數(shù)據(jù)群的數(shù)據(jù)規(guī)律探索。根據(jù)其探索出的規(guī)律來實(shí)現(xiàn)分析做出一定的決策。在該技術(shù)當(dāng)中,可以分為幾個(gè)子類,其中包含了分布式計(jì)算技術(shù),可以對(duì)數(shù)據(jù)進(jìn)行分布式處理和存儲(chǔ);內(nèi)存計(jì)算技術(shù),實(shí)現(xiàn)數(shù)據(jù)的高速讀取的同時(shí),還可以實(shí)現(xiàn)線上的實(shí)時(shí)計(jì)算。流處理技術(shù),可以對(duì)控制之外的數(shù)據(jù)進(jìn)行處理。
在對(duì)電力企業(yè)營銷信息化建設(shè)的過程當(dāng)中,需要基于其現(xiàn)狀的基礎(chǔ)上進(jìn)行對(duì)策分析,在其現(xiàn)狀方面,主要集中體現(xiàn)在以下幾個(gè)方面:
首先,在數(shù)據(jù)的聯(lián)系方面不密切,現(xiàn)代信息技術(shù)和電力營銷的融合程度主要是借助于大數(shù)據(jù)技術(shù)的應(yīng)用,來實(shí)現(xiàn)對(duì)營銷數(shù)據(jù)的分析,以此來對(duì)客戶的真實(shí)需求進(jìn)行掌握和了解,根據(jù)客戶的需求來進(jìn)行服務(wù)內(nèi)容的制定,最終來對(duì)客戶的用電服務(wù)進(jìn)行提升,提升電力企業(yè)的經(jīng)濟(jì)效益。在現(xiàn)階段很多的電力企業(yè)內(nèi)部,電力營銷信息化的建設(shè)缺乏對(duì)數(shù)據(jù)信息的深度挖掘,在內(nèi)容的建設(shè)方面容易滯后,因此其現(xiàn)代化的信息技術(shù)應(yīng)用水平相對(duì)較低,造成了數(shù)據(jù)信息的價(jià)值未能完全發(fā)揮的現(xiàn)象。在此種情況下,電力營銷的方案需要實(shí)現(xiàn)針對(duì)性科學(xué)性的建設(shè)。部分電力企業(yè)內(nèi)部甚至于存在電力營銷信息化建設(shè)和數(shù)據(jù)信息聯(lián)系不密切的現(xiàn)象,對(duì)于客戶的用電需求不能最大限度的滿足,最終對(duì)于電力營銷的活動(dòng)質(zhì)量造成影響[1]。其次,在地域性方面存在差異現(xiàn)象,電力營銷信息化建設(shè)的基礎(chǔ)工作需要實(shí)現(xiàn)數(shù)據(jù)的錄入和信息數(shù)據(jù)庫的建設(shè),但是在各個(gè)地區(qū)當(dāng)中電力營銷的客戶的需求存在一定的差異性,導(dǎo)致了電力企業(yè)對(duì)營銷數(shù)據(jù)的提取不夠完整,在要求高的地區(qū)當(dāng)中信息較為完整,但是要求需求一般或者較低的營銷數(shù)據(jù)提取方面不完善,缺乏區(qū)間數(shù)據(jù)的交流和合作,因此導(dǎo)致了營銷信息建設(shè)的水平相對(duì)較低,電力企業(yè)出現(xiàn)了不平衡的現(xiàn)象,最終降低了整體行業(yè)的電力營銷信息化建設(shè)水平的發(fā)展。最后,在描述性方面相對(duì)較弱,部分電力企業(yè)內(nèi)部對(duì)于數(shù)據(jù)信息的采集工作沒有高度重視,因此營銷數(shù)據(jù)的采集方面缺乏完整性,對(duì)于客戶的實(shí)際需求無法精確客觀的描述,因此對(duì)于電力營銷的實(shí)際方案無法進(jìn)行精準(zhǔn)定位,導(dǎo)致了后續(xù)工作流程的制約和影響。與此同時(shí),在電力營銷的信息化建設(shè)過程當(dāng)中,對(duì)于營銷數(shù)據(jù)所缺乏的交流合作,會(huì)造成資源的浪費(fèi),降低其工作質(zhì)量,在一定程度上阻礙了電力企業(yè)自身的發(fā)展和進(jìn)步,對(duì)于客戶和市場的整體需求也無法進(jìn)行滿足[2]。
在電力營銷數(shù)據(jù)管理的過程當(dāng)中, 本文借助于Hadoop平臺(tái)來實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的分布式計(jì)算應(yīng)用處理,在其平臺(tái)內(nèi)部,兩個(gè)關(guān)鍵的組件分別為分布式的文件存儲(chǔ)系統(tǒng),即為HadoopDistributed File System,簡稱HDFS,數(shù)據(jù)處理組件,即為MapReduce,可以實(shí)現(xiàn)對(duì)數(shù)據(jù)分布式存儲(chǔ)和處理。與此同時(shí),還包含了多個(gè)組件來對(duì)數(shù)據(jù)進(jìn)行分析和處理,比如Pig,Zookeeper,Tez,Hive,HBase等。
在營銷數(shù)據(jù)方面可以借助于HDFS技術(shù)來實(shí)現(xiàn)存儲(chǔ)和管理,對(duì)數(shù)據(jù)采取集群分布式的存儲(chǔ)下,最大限度的滿足批量數(shù)據(jù)存儲(chǔ)的需求。在HDFS的集群當(dāng)中,底層分布的大量計(jì)算機(jī)端口可以在光纖的作用下高速組合連接為集群,在集群當(dāng)中,其機(jī)器主要利用主從結(jié)構(gòu)來對(duì)數(shù)據(jù)進(jìn)行分析。在HDFS1.0當(dāng)中,主節(jié)點(diǎn)可以利用1臺(tái)機(jī)器來進(jìn)行,被稱之為名稱節(jié)點(diǎn),其他的節(jié)點(diǎn)作為從節(jié)點(diǎn),也就是數(shù)據(jù)節(jié)點(diǎn)。對(duì)于HDFS2.0來說,需要利用2臺(tái)機(jī)器來進(jìn)行主節(jié)點(diǎn)的分區(qū)管理,名稱節(jié)點(diǎn)被當(dāng)成了整個(gè)集群的管家,實(shí)現(xiàn)集群的元數(shù)據(jù)服務(wù)提供,可以對(duì)數(shù)據(jù)起到一個(gè)類似于目錄的作用,其中的名稱節(jié)點(diǎn)可以對(duì)存儲(chǔ)的具體數(shù)據(jù)進(jìn)行分析。對(duì)于數(shù)據(jù)存儲(chǔ)來說,需要實(shí)現(xiàn)傳感器、營銷系統(tǒng)、用戶信息采集系統(tǒng)以及應(yīng)用程序、微信平臺(tái)等多個(gè)方面采集到的數(shù)據(jù)進(jìn)行數(shù)據(jù)的存儲(chǔ)請(qǐng)求,其中主節(jié)點(diǎn)本身會(huì)在系統(tǒng)當(dāng)中進(jìn)行新文件的創(chuàng)建,根據(jù)數(shù)據(jù)節(jié)點(diǎn)的可靠程度實(shí)現(xiàn)存儲(chǔ)響應(yīng),對(duì)于存儲(chǔ)數(shù)據(jù)的過程,其名稱階段對(duì)于其數(shù)據(jù)可以實(shí)行分塊處理,為數(shù)據(jù)塊進(jìn)行副本的創(chuàng)建,根據(jù)其特定的存儲(chǔ)策略來對(duì)其進(jìn)行分配到對(duì)應(yīng)的數(shù)據(jù)節(jié)點(diǎn)當(dāng)中,需要在數(shù)據(jù)節(jié)點(diǎn)進(jìn)行返回確認(rèn)信號(hào)和更新消息之后,才可以完成存儲(chǔ)數(shù)據(jù)的操作。對(duì)于讀取數(shù)據(jù)來說,需要遵循就近原則,客戶端發(fā)出的請(qǐng)求需要從名稱節(jié)點(diǎn)來對(duì)各個(gè)數(shù)據(jù)副本放置到對(duì)應(yīng)的位置列表內(nèi),在這個(gè)過程當(dāng)中,需要明確數(shù)據(jù)塊的實(shí)際存儲(chǔ)節(jié)點(diǎn),借助于HDFS在特定應(yīng)用程序接口的基礎(chǔ)上實(shí)現(xiàn)客戶端和數(shù)據(jù)節(jié)點(diǎn)的身份表示,如果其中的數(shù)據(jù)節(jié)點(diǎn)和客戶端同屬于同一個(gè)機(jī)架,則需要對(duì)數(shù)據(jù)節(jié)點(diǎn)當(dāng)中的副本進(jìn)行優(yōu)先讀取。在名稱節(jié)點(diǎn)當(dāng)中,元數(shù)據(jù)和操作日志的文件兩種數(shù)據(jù)接口可以實(shí)現(xiàn)對(duì)數(shù)據(jù)的更新和一系列操作。主節(jié)點(diǎn)操作之后,可以對(duì)存儲(chǔ)元數(shù)據(jù)的FsImage將底層進(jìn)行加載,實(shí)現(xiàn)EditLog內(nèi)部當(dāng)中可以實(shí)現(xiàn)數(shù)據(jù)的整個(gè)操作合并,比如創(chuàng)建、以及刪除等,最終可以得出最新的元數(shù)據(jù)。對(duì)于EditLog不斷增大的問題可以利用第二節(jié)名稱節(jié)點(diǎn)來對(duì)其進(jìn)行解決。最終實(shí)現(xiàn)較高的數(shù)據(jù)操作效率。在Hadoop平臺(tái)當(dāng)中,需要實(shí)現(xiàn)數(shù)據(jù)的集群分布式存儲(chǔ),HDFS本身具備自身的備份機(jī)制,對(duì)于電力營銷來說,可以對(duì)數(shù)據(jù)的準(zhǔn)確性、完整性和實(shí)用性進(jìn)行最大限度的保障。值得注意的是,想要打破數(shù)據(jù)屏障,就需要實(shí)現(xiàn)數(shù)據(jù)共享與交互,利用HBase數(shù)據(jù)庫來實(shí)現(xiàn)對(duì)松散數(shù)據(jù)做出集成管理。其中HBase借助于思維坐標(biāo)可以實(shí)現(xiàn)映射表的排列式的存儲(chǔ),借助于庫函數(shù)、主服務(wù)器、區(qū)域服務(wù)器等多種主要的功能組件來實(shí)現(xiàn)文件存儲(chǔ)系統(tǒng)的操作[3]。
對(duì)于電力營銷的數(shù)據(jù)方面,包含多個(gè)類型,比如時(shí)序數(shù)據(jù)、時(shí)空數(shù)據(jù)、流數(shù)據(jù)等。時(shí)序數(shù)據(jù)當(dāng)中,可以記錄用戶的基礎(chǔ)信息,比如用戶的地址電話以及電力用電量等,時(shí)空數(shù)據(jù),可以為電力企業(yè)的電網(wǎng)來提供出優(yōu)質(zhì)的架構(gòu)和資源的分配狀態(tài)。對(duì)于流數(shù)據(jù)來說,具備快速持續(xù)的特點(diǎn),對(duì)電力營銷的數(shù)據(jù)分析之前,首先,對(duì)數(shù)據(jù)做出預(yù)處理,在這個(gè)部分當(dāng)中,可以利用Z-score標(biāo)準(zhǔn)來進(jìn)行數(shù)據(jù)的優(yōu)化,對(duì)數(shù)據(jù)進(jìn)行分布確定,對(duì)于數(shù)據(jù)的標(biāo)準(zhǔn)差和均值進(jìn)行規(guī)劃范的處理,對(duì)電力營銷大數(shù)據(jù)做出處理和計(jì)算的過程當(dāng)中,針對(duì)于不同的數(shù)據(jù)處理需要采用數(shù)據(jù)模式來進(jìn)行處理,根據(jù)數(shù)據(jù)類型和用途實(shí)現(xiàn)共同的協(xié)作。其次,在MapReduce的功能當(dāng)中,可以實(shí)現(xiàn)營銷數(shù)據(jù)的處理,其中涉及到了底層文件的存儲(chǔ)系統(tǒng),對(duì)于任務(wù)執(zhí)行的過程當(dāng)中,可以利用Task Tracker的心跳方式對(duì)自身的資源使用狀況和任務(wù)運(yùn)行進(jìn)度來進(jìn)行發(fā)送。最后,在對(duì)電力營銷數(shù)據(jù)挖掘和價(jià)值提升的過程當(dāng)中,需要利用關(guān)聯(lián)規(guī)則、聚類分析、統(tǒng)計(jì)分析、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、回歸分析等方式來發(fā)現(xiàn)數(shù)據(jù)當(dāng)中隱藏的信息,以此來完成用電負(fù)荷、客戶需求、電路線損的預(yù)測等工作,對(duì)于數(shù)據(jù)價(jià)值的提升也可以得到最大限度的提升[4]。
除此之外,還需要對(duì)電力營銷數(shù)據(jù)管理的過程當(dāng)中,借助于相關(guān)手段來對(duì)數(shù)據(jù)當(dāng)中所包含的信息進(jìn)行發(fā)掘,比如關(guān)聯(lián)規(guī)則、聚類分析、統(tǒng)計(jì)分析、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、回歸分析等手段,以此來幫助實(shí)現(xiàn)用電負(fù)荷、客戶需求以及電路線損的預(yù)測等工作,實(shí)現(xiàn)數(shù)據(jù)價(jià)值的有效提升。在用電負(fù)荷的預(yù)測工作當(dāng)中,電能本身具備大量的儲(chǔ)存特點(diǎn),電力企業(yè)本身的發(fā)電、供電、配電過程當(dāng)中需要實(shí)現(xiàn)對(duì)用戶用電負(fù)荷的預(yù)測,以此來實(shí)現(xiàn)工序平衡的狀態(tài)。避免了由于電量過多造成的大量電能浪費(fèi)的現(xiàn)象,從而對(duì)不必要的生產(chǎn)和運(yùn)營成本進(jìn)行增加和浪費(fèi);相反如果電量過少,則不能滿足日常用戶基本的用電需求,對(duì)于設(shè)備的正常運(yùn)行狀態(tài)也就無法操作。由此,用戶耗電量在各種因素下,需要根據(jù)數(shù)據(jù)基礎(chǔ)來實(shí)現(xiàn)深入的挖掘和分析,以此來發(fā)現(xiàn)各因素和電能供應(yīng)之間所存在的關(guān)聯(lián)關(guān)系,最大限度的提升電力企業(yè)本身的供電協(xié)調(diào)能力,最終實(shí)現(xiàn)企業(yè)供電協(xié)調(diào)能力的有效提升。在各個(gè)季節(jié)和工作日以及時(shí)間段的過程當(dāng)中,用戶本身的耗電量也不盡相同,在關(guān)聯(lián)關(guān)系的發(fā)掘過程當(dāng)中,可以利用FP-growth的方式來進(jìn)行發(fā)掘用電負(fù)荷和時(shí)間之間存在的關(guān)聯(lián)關(guān)系。在分析的過程當(dāng)中,核心算法為FP-tree,借助于構(gòu)建出的框架來進(jìn)行頻繁的挖掘。搭建的過程當(dāng)中,需要最大限度的實(shí)現(xiàn)對(duì)數(shù)據(jù)庫的掃描,以此來得出數(shù)據(jù),根據(jù)數(shù)據(jù)特點(diǎn)來實(shí)現(xiàn)節(jié)點(diǎn)的創(chuàng)建,對(duì)數(shù)據(jù)集進(jìn)行掃描的過程當(dāng)中,可以根據(jù)其搭建的框架來進(jìn)行標(biāo)記。對(duì)于電力營銷的可視化操作來說,數(shù)據(jù)本身在經(jīng)過集成分析之后,可以進(jìn)入到數(shù)據(jù)倉庫當(dāng)中,其數(shù)據(jù)的類型和實(shí)際應(yīng)用需求基礎(chǔ)上可以得出數(shù)據(jù)可視化的主題,從而構(gòu)建出已經(jīng)有的模型。在對(duì)數(shù)據(jù)模型生成的過程當(dāng)中,可以從已經(jīng)有的模型庫當(dāng)中進(jìn)行要素的繪制獲取,根據(jù)應(yīng)用需求來進(jìn)行重組[5]。在此種方式下,可以在全球的廣域網(wǎng)前端部分進(jìn)行財(cái)務(wù)可視化的圖像繪制。在電力營銷領(lǐng)域當(dāng)中,可以借助于文本、數(shù)據(jù)、圖、多維數(shù)據(jù)以及時(shí)空數(shù)據(jù)等技術(shù),將采集到的數(shù)據(jù)進(jìn)行直觀的方式呈現(xiàn)。也就是對(duì)數(shù)據(jù)分析的結(jié)果進(jìn)行圖形化的展示,從而對(duì)數(shù)據(jù)實(shí)現(xiàn)跟蹤觀察監(jiān)控。
綜上所述,現(xiàn)代化信息技術(shù)的發(fā)展促進(jìn)了互聯(lián)網(wǎng)和電網(wǎng)的聯(lián)合建設(shè)發(fā)展,在大數(shù)據(jù)技術(shù)的運(yùn)營下,對(duì)于電力營銷大數(shù)據(jù)平臺(tái)的建設(shè)實(shí)現(xiàn)營銷模式的有效轉(zhuǎn)變,創(chuàng)新其營銷管理的方式?,F(xiàn)階段當(dāng)中,數(shù)據(jù)驅(qū)動(dòng)營銷管理模式下的電力營銷還未完全實(shí)現(xiàn),但是隨著電力營銷信息化水平的不斷提升,大數(shù)據(jù)可以實(shí)現(xiàn)電力營銷管理新活力的注入和增加,最終為電力企業(yè)的營銷工作效率得到促進(jìn)和提升,實(shí)現(xiàn)營銷服務(wù)水平的支撐建設(shè)。