周振煜,朱江,張明,萬(wàn)明
(南瑞集團(tuán)有限公司(國(guó)網(wǎng)電力科學(xué)研究院有限公司),南京210003)
隨著電網(wǎng)領(lǐng)域信息化的發(fā)展,電網(wǎng)企業(yè)根據(jù)各類業(yè)務(wù)場(chǎng)景興建的信息系統(tǒng)越來(lái)越多。信息系統(tǒng)及其基礎(chǔ)設(shè)施的正常運(yùn)行對(duì)電網(wǎng)企業(yè)的正常業(yè)務(wù)開(kāi)展有著重要保證。如何有效監(jiān)控并反饋信息系統(tǒng)運(yùn)行狀態(tài)也成為各個(gè)電網(wǎng)企業(yè)監(jiān)控管理的重要內(nèi)容之一[1]。
現(xiàn)階段電網(wǎng)企業(yè)針對(duì)信息化監(jiān)控也構(gòu)建了較多系統(tǒng),如基礎(chǔ)設(shè)施狀態(tài)采集、信息化環(huán)境運(yùn)行狀態(tài)展示、信息調(diào)度管控、資產(chǎn)資源管理等。數(shù)量繁多、功用不同的各類系統(tǒng)給監(jiān)控整體統(tǒng)一的管理帶來(lái)了一定挑戰(zhàn)[2]。分析目前的電網(wǎng)企業(yè)信息化監(jiān)控領(lǐng)域可以發(fā)現(xiàn)存在下述問(wèn)題:①I(mǎi)T資源配置信息分散,不同系統(tǒng)各自維護(hù)一套資源配置信息,導(dǎo)致部分系統(tǒng)間存在冗余甚至重復(fù)數(shù)據(jù),而依據(jù)不同維度建立的相關(guān)資源間關(guān)系分散在不同系統(tǒng)中,系統(tǒng)間資源信息缺少融合。②監(jiān)控?cái)?shù)據(jù)存在孤島,各類監(jiān)控?cái)?shù)據(jù)缺少關(guān)聯(lián)分析。當(dāng)前的監(jiān)控系統(tǒng)對(duì)應(yīng)用系統(tǒng)各類信息進(jìn)行分類,如設(shè)備的配置信息、運(yùn)行信息、告警日志等,但監(jiān)控信息的處理基本上是依據(jù)各類數(shù)據(jù)提取監(jiān)控指標(biāo)信息,各類數(shù)據(jù)之間信息割裂,缺少關(guān)聯(lián)分析,故障告警只能提示運(yùn)維人員哪里有問(wèn)題,無(wú)法定位導(dǎo)致問(wèn)題的原因,依然依賴于人工經(jīng)驗(yàn)做進(jìn)一步判斷。③可視化體驗(yàn)較低,系統(tǒng)拓?fù)鋬?nèi)容單一,使用價(jià)值比較低。目前的監(jiān)控可視化研究多數(shù)集中在通過(guò)豐富的圖元組合實(shí)現(xiàn)各類監(jiān)控指標(biāo)的展示,也有對(duì)系統(tǒng)體系關(guān)系的拓?fù)淇梢暬难芯浚鄙儋N近業(yè)務(wù)多維度統(tǒng)一的可視化應(yīng)用研究。
為解決本文前述的信息化監(jiān)控領(lǐng)域存在的問(wèn)題,本文設(shè)計(jì)的系統(tǒng)依據(jù)廣東電網(wǎng)公司用戶現(xiàn)實(shí)監(jiān)控全景化要求,將重點(diǎn)放在數(shù)據(jù)和系統(tǒng)功能的整合上,從而統(tǒng)一整個(gè)廣東電網(wǎng)公司信息監(jiān)控領(lǐng)域的IT資源配置信息,優(yōu)化系統(tǒng)拓?fù)淇梢暬瘍?nèi)容,集成展示重點(diǎn)業(yè)務(wù)需求的信息內(nèi)容。已在運(yùn)的監(jiān)控類系統(tǒng)、數(shù)據(jù)中心及管理應(yīng)用、全景式綜合展示,其中數(shù)據(jù)中心對(duì)外提供統(tǒng)一的IT配置信息獲取接口。
已在運(yùn)的監(jiān)控類系統(tǒng)是依據(jù)各個(gè)不同監(jiān)控需要構(gòu)建的具體業(yè)務(wù)系統(tǒng),是目前廣東電網(wǎng)信息化運(yùn)維的重要保證,從IT基礎(chǔ)設(shè)施運(yùn)行性能情況、信息化環(huán)境狀態(tài)分析及告警、信息調(diào)度流程管理等多個(gè)方面對(duì)當(dāng)前廣東電網(wǎng)信息化環(huán)境進(jìn)行監(jiān)控。各個(gè)系統(tǒng)中的拓?fù)湫阅苷故尽⒏婢芾碚故?、流程工單展示等?nèi)容都是當(dāng)前運(yùn)維監(jiān)控人員使用程度較高的模塊,這些模塊將作為構(gòu)建全景式運(yùn)行監(jiān)控系統(tǒng)的基礎(chǔ)?;谝延械男畔⒒O(jiān)控建設(shè)成果,可以避免重復(fù)的功能建設(shè),極大程度地減少新系統(tǒng)的建設(shè)投資,同時(shí)使用戶對(duì)新系統(tǒng)的熟悉度相對(duì)較高。數(shù)據(jù)中心及管理應(yīng)用提供新系統(tǒng)及所有已在運(yùn)的監(jiān)控類系統(tǒng)統(tǒng)一的IT資源配置,旨在解決當(dāng)前IT資源配置信息分散冗余等問(wèn)題。數(shù)據(jù)中心的建設(shè)需要分析現(xiàn)有信息化運(yùn)維監(jiān)控領(lǐng)域涉及的IT資源配置信息種類、屬性、關(guān)系等諸多要素[3]。
全景式綜合展示提供本系統(tǒng)監(jiān)控可視化界面,本文設(shè)計(jì)的系統(tǒng)將充分利用當(dāng)前信息監(jiān)控的建設(shè)成果,依據(jù)運(yùn)維過(guò)程中使用的相關(guān)等因素,將已有功能模塊進(jìn)行重新組合,包括功能整合和數(shù)據(jù)整合。最終通過(guò)以信息化業(yè)務(wù)系統(tǒng)為粒度,實(shí)現(xiàn)信息化業(yè)務(wù)系統(tǒng)全景式監(jiān)控內(nèi)容的展示。
數(shù)據(jù)中心作為全景式監(jiān)控系統(tǒng)進(jìn)行IT資源配置管理的重要模塊,在兼容現(xiàn)有監(jiān)控資源數(shù)據(jù)的同時(shí)需要兼顧擴(kuò)展性,因此本文的設(shè)計(jì)中基于CMDB的思想,對(duì)數(shù)據(jù)中心進(jìn)行了設(shè)計(jì)。
分析廣東電網(wǎng)公司現(xiàn)有監(jiān)控資源數(shù)據(jù),可以將資源配置數(shù)據(jù)按照類型劃分為主機(jī)、數(shù)據(jù)庫(kù)、中間件、路由器、交換機(jī)等,同時(shí)依據(jù)現(xiàn)實(shí)物理關(guān)系和各系統(tǒng)中已經(jīng)構(gòu)建的類型間關(guān)系,如:設(shè)備與設(shè)備、設(shè)備與應(yīng)用、應(yīng)用與應(yīng)用、資源與工單、采集與資源等等,得到本文構(gòu)建系統(tǒng)的資源模型,如圖1所示。
依據(jù)上述模型,可以實(shí)現(xiàn)數(shù)據(jù)中心的實(shí)體庫(kù)表設(shè)計(jì),同時(shí)將構(gòu)建自動(dòng)發(fā)現(xiàn)+標(biāo)準(zhǔn)流程+人工維護(hù)的數(shù)據(jù)中心數(shù)據(jù)的維護(hù)方式,即:
通過(guò)信息采集,實(shí)現(xiàn)運(yùn)行信息的自動(dòng)發(fā)現(xiàn)入庫(kù),降低維護(hù)成本,提高數(shù)據(jù)準(zhǔn)確性。
通過(guò)標(biāo)準(zhǔn)化的運(yùn)維流程,實(shí)現(xiàn)資源配置信息的變更維護(hù)。
通過(guò)維護(hù)界面,實(shí)現(xiàn)對(duì)無(wú)法自動(dòng)發(fā)現(xiàn)的信息進(jìn)行人工維護(hù),如負(fù)責(zé)人等信息。
數(shù)據(jù)中心還將設(shè)計(jì)統(tǒng)一的數(shù)據(jù)接口提供對(duì)外數(shù)據(jù)調(diào)用功能,本文定義下述接口規(guī)范來(lái)定義數(shù)據(jù)接入和消費(fèi)標(biāo)準(zhǔn),保證配置項(xiàng)數(shù)據(jù)的安全性、準(zhǔn)確性。
圖1 數(shù)據(jù)中心資源及關(guān)系
全景可視化的意義在于在有限的監(jiān)控可視化頁(yè)面中盡可能提供更豐富的信息。基于數(shù)據(jù)中心,將監(jiān)控?cái)?shù)據(jù)貫通,就可以在集成多個(gè)系統(tǒng)可視化頁(yè)面的同時(shí),提升每個(gè)可視化頁(yè)面的信息量,配合監(jiān)控大屏提升可視化體驗(yàn)。
廣東電網(wǎng)公司在已運(yùn)行的監(jiān)控類系統(tǒng)中篩選出下述重點(diǎn)使用的功能頁(yè)面:拓?fù)湫阅苷故?、告警管理展示、流程工單展示。其中拓?fù)湫阅苷故咎峁┝怂O(jiān)控的業(yè)務(wù)系統(tǒng)基礎(chǔ)設(shè)施及中間件等內(nèi)容的拓?fù)潢P(guān)系,提供端口、鏈路等性能狀態(tài)展示;告警管理展示提供所監(jiān)控的業(yè)務(wù)系統(tǒng)的硬件及軟件的異常狀態(tài)的告警通知,通過(guò)聲音、視覺(jué)、短信等多種方式對(duì)告警相關(guān)人員實(shí)現(xiàn)實(shí)時(shí)提示;流程工單展示信息化環(huán)境運(yùn)維的檢查、維修等工作的審批及通知。此3個(gè)監(jiān)控頁(yè)面存在如下相關(guān)性:當(dāng)告警信息提示業(yè)務(wù)系統(tǒng)異常,可通過(guò)拓?fù)淠K檢查錯(cuò)誤物理或者邏輯定位,對(duì)比流程工單信息排除正常檢修工作造成的異常,運(yùn)維人員僅需要對(duì)排除剩下的異常進(jìn)行問(wèn)題排除和原因分析。本系統(tǒng)設(shè)計(jì)中將對(duì)這三類展示功能實(shí)現(xiàn)集成,如下圖2所示:
圖2 全景可視化頁(yè)面
本文提出的一種基于數(shù)據(jù)中心的全景式運(yùn)行監(jiān)控系統(tǒng),該系統(tǒng)解決了多年信息化監(jiān)控系統(tǒng)建設(shè)導(dǎo)致的IT資源配置信息分散,數(shù)據(jù)冗余重復(fù);數(shù)據(jù)缺少關(guān)聯(lián),存在應(yīng)用孤島;各系統(tǒng)的可視化體驗(yàn)效果差的問(wèn)題。同時(shí)基于數(shù)據(jù)中心的設(shè)計(jì)對(duì)信息化監(jiān)控領(lǐng)域進(jìn)一步運(yùn)用大數(shù)據(jù)技術(shù),實(shí)現(xiàn)狀態(tài)預(yù)警,輔助決策支持等下一步發(fā)展奠定基礎(chǔ)。