方志丹
摘 要:隨著信息技術(shù)大數(shù)據(jù)時(shí)代的到來(lái),以及供電局信息化建設(shè)的逐步推進(jìn)和深化,信息業(yè)務(wù)系統(tǒng)的應(yīng)用數(shù)據(jù)飛速增長(zhǎng),對(duì)這些數(shù)據(jù)有效的處理需求也日趨提升。該文從電力行業(yè)角度,在業(yè)務(wù)和硬件層面列舉了目前信息系統(tǒng)應(yīng)用數(shù)據(jù)處理所面臨的問題和對(duì)數(shù)據(jù)分析技術(shù)的應(yīng)用需求,闡述了數(shù)據(jù)分析技術(shù)對(duì)電力行業(yè)信息數(shù)據(jù)的應(yīng)用思路并進(jìn)行了探討和展望。
關(guān)鍵詞:數(shù)據(jù)分析 信息系統(tǒng) 應(yīng)用數(shù)據(jù)
中圖分類號(hào):TM73 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2015)10(a)-0057-02
在物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、電子商務(wù)、社交媒體等基于網(wǎng)絡(luò)的信息技術(shù)的快速發(fā)展和廣泛應(yīng)用的作用下,全球的信息數(shù)據(jù)量呈現(xiàn)出指數(shù)增長(zhǎng)的趨勢(shì),IDC《數(shù)字宇宙》(Digital Universe)[1]在2014年的研究報(bào)告中指出,全球的數(shù)據(jù)總量按照每年40%的幅度增長(zhǎng),即每?jī)赡攴环?,在這個(gè)速度下,到2020年時(shí)全球數(shù)據(jù)總量將可以達(dá)到4.4ZB(即4.4萬(wàn)億GB)。在這樣的環(huán)境下,各種信息應(yīng)用數(shù)據(jù)的迅速產(chǎn)生和積累也促使著企業(yè)的信息化加速進(jìn)入大數(shù)據(jù)階段,其中,雖然有2/3的數(shù)據(jù)創(chuàng)建自個(gè)人,但各企業(yè)仍須對(duì)85%的數(shù)據(jù)負(fù)有各種相關(guān)責(zé)任。
傳統(tǒng)信息系統(tǒng)對(duì)數(shù)據(jù)的創(chuàng)建和使用的依據(jù)僅建立在業(yè)務(wù)流程和業(yè)務(wù)模型的基礎(chǔ)上,實(shí)現(xiàn)底層業(yè)務(wù)關(guān)系數(shù)據(jù)的增刪查改基礎(chǔ)操作,而對(duì)海量數(shù)據(jù)、對(duì)不同類型和范疇數(shù)據(jù)的價(jià)值提取卻存在不少的缺陷。與之相比,基于數(shù)學(xué)分析理論的數(shù)據(jù)分析技術(shù)側(cè)重于海量數(shù)據(jù)處理,跳出傳統(tǒng)信息系統(tǒng)的形式約束,可對(duì)已收集到的數(shù)據(jù)進(jìn)行進(jìn)一步統(tǒng)計(jì)分析和挖掘,從而獲取這些數(shù)據(jù)更深層的意義或規(guī)律,更深入發(fā)掘數(shù)據(jù)背后的隱藏價(jià)值,能進(jìn)一步提高信息利用率,提高數(shù)據(jù)效益。
如今,傳統(tǒng)信息系統(tǒng)已逐漸無(wú)法滿足對(duì)大數(shù)據(jù)的處理需求,中國(guó)的互聯(lián)網(wǎng)、政府、金融、通訊等行業(yè)和企業(yè)都在逐步深入和逐步拓展對(duì)大數(shù)據(jù)和數(shù)據(jù)分析技術(shù)的應(yīng)用,從結(jié)構(gòu)化數(shù)據(jù)到半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),以充分挖掘各行業(yè)數(shù)據(jù)的表層及潛在或隱藏的價(jià)值。同樣,近年來(lái),隨著電力行業(yè)的信息化不斷推廣和深入,諸如電力營(yíng)銷管理、營(yíng)配信息集成、GIS、資產(chǎn)管理等大型、復(fù)雜業(yè)務(wù)系統(tǒng)的建設(shè)和廣泛投運(yùn),使得各層面的電網(wǎng)單位均面臨著對(duì)諸如電費(fèi)詳單、用戶分布、業(yè)務(wù)峰谷、服務(wù)器性能、存儲(chǔ)數(shù)據(jù)等方面的巨大數(shù)據(jù)量的處理和管理上的難題,加之相對(duì)于金融、通訊等行業(yè),電力行業(yè)的業(yè)務(wù)和用戶數(shù)據(jù)的變化性和多樣性較低,在價(jià)值提取方面更具難度,需要尋求適應(yīng)企業(yè)自身需求的數(shù)據(jù)分析技術(shù)對(duì)這些數(shù)據(jù)進(jìn)行更有效的統(tǒng)計(jì)、挖掘或預(yù)測(cè)。
1 電力行業(yè)信息系統(tǒng)現(xiàn)狀和數(shù)據(jù)分析需求
一般情況下,基于信息系統(tǒng)的各項(xiàng)業(yè)務(wù)均存在峰谷分布特性,即在某一時(shí)段會(huì)集中發(fā)生大量業(yè)務(wù)操作,此時(shí)用戶訪問量大、操作數(shù)多、服務(wù)器資源消耗高、網(wǎng)絡(luò)帶寬占用大、數(shù)據(jù)庫(kù)讀寫頻繁;反之,在另一時(shí)段則是業(yè)務(wù)低谷期,此時(shí)很少外部用戶訪問業(yè)務(wù)系統(tǒng),可分配服務(wù)器的一部分計(jì)算資源進(jìn)行數(shù)據(jù)整理或備份操作。
應(yīng)用系統(tǒng)層面上,根據(jù)電力營(yíng)銷系統(tǒng)的歷史業(yè)務(wù)記錄,可以看出,在用戶繳費(fèi)方面,本地供電局每月的用戶繳費(fèi)行為大體上集中出現(xiàn)在當(dāng)月的第一周之后(圖2),因此供電局需在用戶繳費(fèi)前完成大量的電費(fèi)計(jì)算、核查和發(fā)行操作(圖3),以確保用戶可以順利完成繳費(fèi)。
服務(wù)器運(yùn)維層面上,服務(wù)器計(jì)算資源的消耗與應(yīng)用系統(tǒng)業(yè)務(wù)使用量成正相關(guān)關(guān)系,業(yè)務(wù)繁忙程度越高,服務(wù)器出現(xiàn)資源異常的可能性就越大,所以保障服務(wù)器正常運(yùn)轉(zhuǎn)的需求也越高。以電力營(yíng)銷系統(tǒng)為例,其系統(tǒng)架構(gòu)總體上采用客戶機(jī)—負(fù)載均衡設(shè)備—應(yīng)用服務(wù)器—數(shù)據(jù)庫(kù)集群—存儲(chǔ)設(shè)備的結(jié)構(gòu)建設(shè),其中數(shù)據(jù)庫(kù)的IO、日志文件同步等指標(biāo)可在一定程度上反映出當(dāng)前業(yè)務(wù)量情況。圖4所示為某月各工作日對(duì)數(shù)據(jù)庫(kù)3個(gè)性能指標(biāo)的執(zhí)行等待時(shí)間統(tǒng)計(jì),可以看出,從該月第二周開始逐步出現(xiàn)一定程度的數(shù)值升高,此處反映該時(shí)段內(nèi)集中出現(xiàn)的客戶繳費(fèi)行為,引起數(shù)據(jù)庫(kù)讀寫量和事務(wù)量上升,從而增加了事務(wù)的等待時(shí)間。
另外,服務(wù)器硬件發(fā)生故障的概率雖然大體上隨著設(shè)備使用時(shí)長(zhǎng)的增長(zhǎng)而提高,但某些情況也會(huì)存在一定的偶然性和突發(fā)性。當(dāng)在業(yè)務(wù)過程中出現(xiàn)硬件故障,尤其是在業(yè)務(wù)高峰期,會(huì)出現(xiàn)較為嚴(yán)重的影響,這也要求運(yùn)維人員對(duì)業(yè)務(wù)高峰有一定的估測(cè)能力以及對(duì)設(shè)備故障有足夠快的響應(yīng)速度。
綜上,不論是面向客戶的行業(yè)主營(yíng)業(yè)務(wù),還是內(nèi)部的服務(wù)器性能消耗和信息系統(tǒng)日常使用,各項(xiàng)數(shù)據(jù)都在各方面存在一定的規(guī)律性特點(diǎn)或互相關(guān)聯(lián)的因素,這不僅對(duì)上述的業(yè)務(wù)量或服務(wù)器性能統(tǒng)計(jì)來(lái)說如此,對(duì)行業(yè)內(nèi)的各類具體數(shù)據(jù)同樣適用。然而,目前對(duì)這些數(shù)據(jù)的利用往往只停留在表層的增刪查改操作上,并不能很好地抽象出其中的特征或模式,造成信息利用率的下降。電力行業(yè)的數(shù)據(jù)具有數(shù)據(jù)量大、類型多、價(jià)值高的特點(diǎn),對(duì)控制管理和企業(yè)盈利的影響甚多,有專家分析稱,數(shù)據(jù)利用率每提高10%,電網(wǎng)的利潤(rùn)則可提高20%~49%。為了適應(yīng)大數(shù)據(jù)的逐步普及、適應(yīng)企業(yè)的改革與轉(zhuǎn)型、滿足新階段對(duì)信息技術(shù)的要求,亟需尋求合適的技術(shù)充分利用這些數(shù)據(jù),實(shí)現(xiàn)對(duì)變化趨勢(shì)的預(yù)測(cè)和拓展企業(yè)核心能力、提高企業(yè)經(jīng)濟(jì)效益的目的。
2 數(shù)據(jù)分析技術(shù)在電力行業(yè)的應(yīng)用
常用的數(shù)據(jù)分析方法包括聚類分析、相關(guān)分析、回歸分析等涉及統(tǒng)計(jì)學(xué)和概率論的理論,目前市面常用的數(shù)據(jù)分析軟件有SPSS、Stata、SAS、R、Matlab等系統(tǒng),分別適用于不同專業(yè)程度的應(yīng)用場(chǎng)景。
如今各行業(yè)已開始探索和采用這些技術(shù)來(lái)處理與行業(yè)自身相關(guān)的各項(xiàng)數(shù)據(jù),例如對(duì)根據(jù)時(shí)間和話費(fèi)等指標(biāo)分析移動(dòng)通信客戶的消費(fèi)行為[2]、利用收集的資料分析及發(fā)現(xiàn)銀行零售業(yè)務(wù)的潛在客戶[3]、利用關(guān)聯(lián)分析等方法評(píng)價(jià)病人病因、處方及藥物副作用[4]等,同樣,在電力行業(yè),可以從客戶用電量、用電時(shí)間、客戶分類和分布狀況、季節(jié)和氣候變化、政府法規(guī)政策、信息系統(tǒng)使用情況、計(jì)算和存儲(chǔ)資源消耗狀態(tài)等各項(xiàng)指標(biāo)著手進(jìn)行分析,實(shí)現(xiàn)相同或類似的目的。
利用數(shù)據(jù)分析技術(shù)處理電力行業(yè)數(shù)據(jù),優(yōu)化企業(yè)管理模式,提升企業(yè)經(jīng)營(yíng)水平,其適用場(chǎng)景包括以下方面。
2.1 客戶信息分析
類似于通訊行業(yè)的客戶行為和消費(fèi)分析,根據(jù)電力營(yíng)銷的大量的歷史數(shù)據(jù),一是可利用聚類分析的方式,在時(shí)間、空間和客戶性質(zhì)上分析客戶的用電行為和用電規(guī)律,采用手動(dòng)標(biāo)簽類別特征或?qū)?shù)據(jù)特征做自動(dòng)聚類的方法,對(duì)客戶群進(jìn)行不同粒度的細(xì)分,從而可在不同層面制定不同的更具針對(duì)性的營(yíng)銷方案和服務(wù)模式,也可避免供電業(yè)務(wù)的一刀切問題;二是可利用關(guān)聯(lián)分析的方式,統(tǒng)計(jì)收集到的可能與客戶用電存在影響關(guān)系的電價(jià)、氣候、環(huán)境、政策、交通等因素,提取這些因素與客戶用電數(shù)據(jù)的相關(guān)性,找出對(duì)其存在顯著影響性的成分,并據(jù)此優(yōu)化客戶的用電需求預(yù)測(cè)模型,從而通過多維的因素對(duì)市場(chǎng)和業(yè)務(wù)進(jìn)行分析和預(yù)判,也可實(shí)現(xiàn)避免客戶流失和發(fā)掘潛在客戶的目的。
2.2 業(yè)務(wù)服務(wù)質(zhì)量提升
目前,電力業(yè)務(wù)普遍只為客戶提供基礎(chǔ)性的供電服務(wù),僅確保客戶能夠正常用電。而隨著企業(yè)的改革和轉(zhuǎn)型,更大的需求是以客戶為中心,從客戶體驗(yàn)出發(fā),提供更為全面和豐富的電力增值服務(wù),可從地區(qū)、行業(yè)、客戶等不同層面的用電明細(xì)歷史數(shù)據(jù)提取出各自的用電規(guī)律和特殊需求,制定合理、優(yōu)化的營(yíng)銷方案或業(yè)務(wù)套餐,或讓客戶根據(jù)自身的用電行為和趨勢(shì)調(diào)整相應(yīng)的用電方案,提高客戶的用電效益。
2.3 協(xié)助優(yōu)化IDC資源
如前文所述,信息系統(tǒng)的資源使用量往往取決于其業(yè)務(wù)的使用情況。對(duì)于營(yíng)銷系統(tǒng),可從大量的客戶繳費(fèi)時(shí)間、繳費(fèi)數(shù)量和對(duì)應(yīng)的服務(wù)器資源使用記錄中擬合出服務(wù)器資源隨時(shí)間變化的占用曲線,并根據(jù)實(shí)際情況進(jìn)行適當(dāng)?shù)臉I(yè)務(wù)窗口或后臺(tái)數(shù)據(jù)處理窗口調(diào)整,在確保業(yè)務(wù)正常進(jìn)行的前提下降低業(yè)務(wù)高峰和提高空閑時(shí)段的資源利用率,此外,對(duì)業(yè)務(wù)量和數(shù)據(jù)存儲(chǔ)量的綜合測(cè)算,可對(duì)系統(tǒng)的存儲(chǔ)資源占用量趨勢(shì)做出更為準(zhǔn)確的短期和中期預(yù)測(cè),避免存儲(chǔ)資源池的短缺或浪費(fèi)問題;類似地,對(duì)于企業(yè)門戶、辦公自動(dòng)化、人力資源等內(nèi)部業(yè)務(wù)系統(tǒng),用戶訪問量分布和各端點(diǎn)間的數(shù)據(jù)交互數(shù)量則是影響其服務(wù)器計(jì)算和存儲(chǔ)資源使用的主要因素,也是形成對(duì)服務(wù)器的采購(gòu)、運(yùn)維和升級(jí)的具體需求的來(lái)源之一。
2.4 營(yíng)銷稽查數(shù)據(jù)的進(jìn)一步分析
本地供電局于2013年建成在線稽查業(yè)務(wù)精益化管理平臺(tái),投運(yùn)至今成效明顯,其中部分重要規(guī)則共篩查差錯(cuò)樣本2000多個(gè),糾錯(cuò)挽回或減少經(jīng)濟(jì)損失約450萬(wàn)元,為營(yíng)銷稽查工作、營(yíng)銷業(yè)務(wù)單位自我診斷、風(fēng)險(xiǎn)管控提供了強(qiáng)有力的支持。在此基礎(chǔ)上,根據(jù)對(duì)差錯(cuò)數(shù)據(jù)的數(shù)量、區(qū)段、等級(jí)、來(lái)源的分析,結(jié)合營(yíng)銷客戶信息分析,可推斷差錯(cuò)的性質(zhì)、原因和客戶用電行為、營(yíng)銷方案、收費(fèi)操作之間的聯(lián)系程度,趨利避害,進(jìn)一步規(guī)避問題數(shù)據(jù)乃至偷電行為的出現(xiàn)。
2.5 為電力基礎(chǔ)設(shè)施建設(shè)提供支持
電力基礎(chǔ)設(shè)施的選址往往需要以大量的前期調(diào)研為依據(jù),其影響涉及地區(qū)性質(zhì)、行業(yè)分布、人員密集程度、交通流量、氣候條件等社會(huì)環(huán)境因素,此外,隨著社會(huì)發(fā)展和城市建設(shè),若干已有的線路規(guī)劃、高壓桿塔、變壓器,乃至變電站、發(fā)電設(shè)施都可能成為發(fā)展阻礙成分,進(jìn)行改建則需進(jìn)一步花費(fèi)人力財(cái)力。通過對(duì)相關(guān)數(shù)據(jù)的分析,可以預(yù)測(cè)當(dāng)?shù)氐碾娏κ褂昧亢桶l(fā)展趨勢(shì),為基建選址提供更多的客觀的參考依據(jù)。
數(shù)據(jù)分析技術(shù)對(duì)電力行業(yè)信息數(shù)據(jù)的應(yīng)用并不只局限于上述的若干場(chǎng)景,在未來(lái)的信息技術(shù)發(fā)展過程中,各個(gè)信息系統(tǒng)、業(yè)務(wù)線條、電力運(yùn)營(yíng)單位之間的數(shù)據(jù)界限將逐漸淡化,形成具有更高關(guān)聯(lián)度的大數(shù)據(jù)整體,而大數(shù)據(jù)技術(shù)也會(huì)得到更廣泛的應(yīng)用。
3 結(jié)語(yǔ)
與物聯(lián)網(wǎng)、云計(jì)算等新興技術(shù)的快速普及一樣,大數(shù)據(jù)技術(shù)在企業(yè)發(fā)展過程中的重要性和影響力也逐漸顯現(xiàn)。隨著信息技術(shù)數(shù)據(jù)價(jià)值的日趨凸顯,電力行業(yè)在推進(jìn)信息化建設(shè)的過程中,需要加速完成的任務(wù)之一,便是快速適應(yīng)新時(shí)代的發(fā)展需求、利用現(xiàn)有資源和技術(shù),構(gòu)建大數(shù)據(jù)的技術(shù)環(huán)境,充分應(yīng)用數(shù)據(jù)分析技術(shù),提升信息化產(chǎn)業(yè)效益,為企業(yè)的總體發(fā)展提供更為有效的助推力。
參考文獻(xiàn)
[1] Vernon Turner,John F.Gantz,David Reinsel,et al.The Digital Universe of Opportunities:Rich Data and the Increasing Value of the Internet of Things[J]Australian Journal of Telecommunications & the Digital Economy,2014,2(3).
[2] 劉蓉,陳曉紅.基于數(shù)據(jù)挖掘的移動(dòng)通信客戶消費(fèi)行為分析[J].計(jì)算機(jī)應(yīng)用與軟件,2006(2):60-62,130.
[3] 王真真.我國(guó)中小商業(yè)銀行零售業(yè)務(wù)潛在客戶開發(fā)管理[D].大連:大連海事大學(xué),2012.
[4] 鄒北驥.大數(shù)據(jù)分析及其在醫(yī)療領(lǐng)域中的應(yīng)用[J].計(jì)算機(jī)教育,2014(7):24-29.