解林超 石佳 王仲鋒 紀(jì)德良
數(shù)據(jù)中心作為數(shù)據(jù)的集散中心和商務(wù)智能分析展現(xiàn)平臺,在大數(shù)據(jù)時代面臨著新的機遇和挑戰(zhàn)。目前,多數(shù)企業(yè)已建成一體化企業(yè)級數(shù)據(jù)中心平臺,能夠滿足日常業(yè)務(wù)的需求,但大數(shù)據(jù)時代對傳統(tǒng)數(shù)據(jù)中心的數(shù)據(jù)存儲、處理、交換、展現(xiàn)以及挖掘能力都提出了更高要求。
大數(shù)據(jù)
對傳統(tǒng)數(shù)據(jù)中心的影響
如今,非結(jié)構(gòu)化數(shù)據(jù)的重要性越來越大。傳統(tǒng)數(shù)據(jù)中心的數(shù)據(jù)一般來源于用戶通過個人電腦、移動終端、POS 機等常規(guī)渠道生成的結(jié)構(gòu)化數(shù)據(jù)。而大數(shù)據(jù)時代數(shù)據(jù)類型多樣化,半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)呈現(xiàn)爆發(fā)式增長,且增長速度遠(yuǎn)遠(yuǎn)超過結(jié)構(gòu)化數(shù)據(jù)。這些通過傳感器、監(jiān)測儀、機讀儀器等機器設(shè)備產(chǎn)生的天氣、位置、音頻、文本等海量復(fù)雜數(shù)據(jù)越來越多,企業(yè)開始使用這些數(shù)據(jù)來改進(jìn)產(chǎn)品、提高效率、尋找缺陷,其數(shù)據(jù)的重要性將會越來越大。
同時對數(shù)據(jù)的時效性要求也越來越高。傳統(tǒng)數(shù)據(jù)中心的數(shù)據(jù)更新周期基本為日、周、月,輔以少量的實時數(shù)據(jù)更新,商務(wù)智能也基本以日、周、月、季度和年為時間維度的靜態(tài)數(shù)據(jù)分析。大數(shù)據(jù)時代,對數(shù)據(jù)的處理速度和數(shù)據(jù)的時效性提出了更高要求,而當(dāng)今社會日益加劇的商業(yè)競爭讓每個企業(yè)都希望能通過實時分析報表和結(jié)果數(shù)據(jù)來隨時掌握企業(yè)運營狀況,并迅速作出決策和判斷。
以電力電量平衡測算為例,需要實時采集電網(wǎng)數(shù)據(jù)、實時分析、實時計算、快速測算結(jié)果,并反饋至電力調(diào)度部門進(jìn)行有序用電執(zhí)行預(yù)案的實時決策,如果相關(guān)數(shù)據(jù)獲取不及時則會大大影響調(diào)度部門對有序用電的分析和決策。
大數(shù)據(jù)逐漸改變了數(shù)據(jù)分析模式。傳統(tǒng)數(shù)據(jù)分析以結(jié)構(gòu)化數(shù)據(jù)分析為主,業(yè)務(wù)分析更是以被動式信息接受為主。大數(shù)據(jù)時代下,隨著數(shù)據(jù)的累積和增加,可做的分析和對比也越來越多。通過對大量的數(shù)據(jù)進(jìn)行分析,從而揭示數(shù)據(jù)之間隱藏的關(guān)系、模式和趨勢;通過結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)的融合關(guān)聯(lián)分析,實現(xiàn)文本分析、數(shù)據(jù)挖掘、圖形分析、空間分析等數(shù)據(jù)分析模式,為決策者提供不同角度不同形式的分析判斷依據(jù)。
大數(shù)據(jù)影響了信息基礎(chǔ)架構(gòu)。目前電力企業(yè)數(shù)據(jù)中心主要以Unix為代表的操作系統(tǒng)服務(wù)器硬件平臺、以O(shè)racle關(guān)系型數(shù)據(jù)庫為代表的企業(yè)級數(shù)據(jù)存儲平臺和以BW(數(shù)據(jù)倉庫Business Ware-house)、BO(業(yè)務(wù)對象,Business Object)為代表的企業(yè)級商務(wù)智能分析平臺組成。
隨著智能電網(wǎng)的發(fā)展,半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)呈現(xiàn)出快速增長的勢頭,大量部署的傳感器、監(jiān)視器、智能交互終端等設(shè)備都可以成為數(shù)據(jù)來源,并且其數(shù)據(jù)量大大超過了結(jié)構(gòu)化數(shù)據(jù)。大數(shù)據(jù)時代下,分布式處理的軟件框架使得 x86服務(wù)器開始大行其道,列存儲、內(nèi)存數(shù)據(jù)庫、NOSQL 存儲、流計算等技術(shù)將成為數(shù)據(jù)存儲和處理的主流技術(shù)。
傳統(tǒng)數(shù)據(jù)中心商務(wù)智能專注單一數(shù)據(jù)集的分析處理,這造成了不同類型數(shù)據(jù)之間的割裂。而大數(shù)據(jù)分析聚合多個數(shù)據(jù)集,注重不同類型數(shù)據(jù)的融合集成與關(guān)聯(lián)分析,是一種綜合關(guān)聯(lián)性分析。因此,傳統(tǒng)數(shù)據(jù)中心分析處理架構(gòu)已無法適應(yīng)大數(shù)據(jù)時代的分析要求。
大數(shù)據(jù)時代
傳統(tǒng)數(shù)據(jù)中心發(fā)展的思考
大數(shù)據(jù)的核心價值在于從海量的復(fù)雜數(shù)據(jù)中挖掘出有價值的信息,通過大數(shù)據(jù)技術(shù)進(jìn)行更快地分析、更準(zhǔn)確地預(yù)測,發(fā)掘出新的業(yè)務(wù)模式,創(chuàng)造新的商業(yè)發(fā)展機會。因此,大數(shù)據(jù)時代下,企業(yè)迫切需要思考如何應(yīng)用大數(shù)據(jù)技術(shù)改造完善已有數(shù)據(jù)中心平臺,提升企業(yè)的數(shù)據(jù)處理能力,提高數(shù)據(jù)分析水平,將大數(shù)據(jù)融入企業(yè)的整體數(shù)據(jù)方案。
分布式處理框架是大數(shù)據(jù)時代下數(shù)據(jù)中心架構(gòu)的基本特征,包括分布式存儲和分布式計算。分布式存儲采用了可擴展的系統(tǒng)架構(gòu),利用多臺存儲服務(wù)器分擔(dān)存儲負(fù)荷,它不但提高系統(tǒng)的可靠性、可用性和存取效率,還易于擴展。分布式計算將大量的分析計算任務(wù)分解為若干小任務(wù),然后將分解后的任務(wù)分配到不同的處理節(jié)點,最后將計算結(jié)果綜合起來得到最終的結(jié)果。分布式計算具有更強的并行計算能力和擴展性,且適合多類型數(shù)據(jù)的混合處理,因此,電網(wǎng)企業(yè)需要在原有數(shù)據(jù)中心架構(gòu)基礎(chǔ)上,構(gòu)建分布式處理框架,提升數(shù)據(jù)存儲和處理能力。
研究構(gòu)建大數(shù)據(jù)分析處理架構(gòu)。梳理電網(wǎng)企業(yè)數(shù)據(jù)中心現(xiàn)有的技術(shù)架構(gòu),研究大數(shù)據(jù)關(guān)鍵技術(shù),結(jié)合目前行業(yè)主流的大數(shù)據(jù)處理架構(gòu),重點研究基于大數(shù)據(jù)平臺的數(shù)據(jù)中心信息基礎(chǔ)架構(gòu),在保護(hù)企業(yè)現(xiàn)有信息化投資的基礎(chǔ)上,探索適合自身的大數(shù)據(jù)解決方案,將大數(shù)據(jù)融入企業(yè)整體數(shù)據(jù)方案。
利用大數(shù)據(jù)技術(shù)改造完善數(shù)據(jù)中心分析處理架構(gòu),研究融合結(jié)構(gòu)化數(shù)據(jù)、實時數(shù)據(jù)、位置數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的大數(shù)據(jù)信息基礎(chǔ)架構(gòu),構(gòu)建企業(yè)級大數(shù)據(jù)分析與挖掘平臺,實現(xiàn)不同類型數(shù)據(jù)的融合集成與關(guān)聯(lián)分析,支撐大數(shù)據(jù)分析應(yīng)用,提升數(shù)據(jù)分析和挖掘能力。
數(shù)據(jù)的核心是發(fā)現(xiàn)價值,駕馭數(shù)據(jù)的核心是分析。如何駕馭大數(shù)據(jù),如何在海量數(shù)據(jù)中挖掘有價值的信息是重中之重,因此企業(yè)更應(yīng)專注于數(shù)據(jù)中隱藏的價值,通過應(yīng)用大數(shù)據(jù)技術(shù)分析,充分挖掘數(shù)據(jù)的核心價值,不斷優(yōu)化業(yè)務(wù)流程,降低管理成本,輔助企業(yè)做出科學(xué)的決策,為企業(yè)的持續(xù)創(chuàng)新與發(fā)展積蓄力量。
信息的影響力取決于數(shù)據(jù)關(guān)聯(lián)的能力,聚合多個大數(shù)據(jù)集所獲得的新的洞察力要遠(yuǎn)遠(yuǎn)超出單一大數(shù)據(jù)集所獲得的洞察力。例如種子公司與農(nóng)作物保護(hù)提供商和氣象部門合作就綜合利用了多個大數(shù)據(jù)集,包括天氣數(shù)據(jù)、土壤濕度數(shù)據(jù)、土壤類型數(shù)據(jù)、種子數(shù)據(jù)和其他數(shù)據(jù),對這些數(shù)據(jù)進(jìn)行交叉關(guān)聯(lián)分析,可以幫助種植戶收獲更高的產(chǎn)量。而在電力企業(yè),將來自配電、用電、客戶、天氣等不同數(shù)據(jù)源的數(shù)據(jù)經(jīng)過轉(zhuǎn)換、整合,將會產(chǎn)生新的業(yè)務(wù)價值。
對電力交易數(shù)據(jù)、氣候數(shù)據(jù)與客戶家庭年齡結(jié)構(gòu)、生活習(xí)慣等因素融合分析,了解客戶用電行為,滿足客戶的差異化需求,并通過探尋深層需求開辟新的增值業(yè)務(wù)空間。
如何讓數(shù)據(jù)驅(qū)動業(yè)務(wù),這是大數(shù)據(jù)時代下數(shù)據(jù)中心必須思考的關(guān)鍵問題。傳統(tǒng)數(shù)據(jù)中心疲于應(yīng)付業(yè)務(wù)部門的需求,而大數(shù)據(jù)時代下,數(shù)據(jù)的復(fù)雜性決定了數(shù)據(jù)中心需要更加快速地應(yīng)對業(yè)務(wù)需求的變化和不確定性,因此數(shù)據(jù)中心必須由數(shù)據(jù)的保管者和服務(wù)者轉(zhuǎn)變?yōu)閿?shù)據(jù)的管理者和決策者,從被動的響應(yīng)業(yè)務(wù)部門的要求轉(zhuǎn)變?yōu)橹鲃酉驑I(yè)務(wù)部門提供數(shù)據(jù)服務(wù)。
數(shù)據(jù)驅(qū)動業(yè)務(wù)是指數(shù)據(jù)作為一種生產(chǎn)力將數(shù)據(jù)分析挖掘的信息實時、主動地反饋給業(yè)務(wù)決策者并影響、反哺企業(yè)業(yè)務(wù)的過程。大數(shù)據(jù)時代下,可以對企業(yè)業(yè)務(wù)進(jìn)行全過程分析、全方位監(jiān)控、模擬預(yù)測,實時進(jìn)行反饋,并及時調(diào)整決策改善業(yè)務(wù)發(fā)展方向,使得業(yè)務(wù)可以從數(shù)據(jù)上立即得以感知,業(yè)務(wù)可以用數(shù)據(jù)評價并由數(shù)據(jù)決策。
大數(shù)據(jù)技術(shù)是當(dāng)前較新的技術(shù)發(fā)展方向,國內(nèi)外已開展相關(guān)技術(shù)的研究與應(yīng)用,電力企業(yè)對電力大數(shù)據(jù)的技術(shù)研究也處于初級階段。大數(shù)據(jù)在業(yè)務(wù)領(lǐng)域中的應(yīng)用是一個循序漸進(jìn)的過程,對相關(guān)技術(shù)的應(yīng)用需要進(jìn)行客觀評估和充分論證,更要科學(xué)研判有關(guān)技術(shù)的發(fā)展前景,做出階段性發(fā)展規(guī)劃,構(gòu)筑符合企業(yè)實際的技術(shù)應(yīng)用主線。