張祖剛, 賈 琨
(中國電子工程設(shè)計(jì)院有限公司,北京 100142)
隨著物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù)的快速發(fā)展,以及國內(nèi)各行業(yè)數(shù)字化轉(zhuǎn)型工作的不斷推進(jìn),數(shù)據(jù)中心發(fā)展迅猛,我國目前已成為全球數(shù)據(jù)中心業(yè)務(wù)增長最快的地區(qū)之一。 與此同時(shí),隨著數(shù)據(jù)中心建設(shè)規(guī)模的不斷擴(kuò)大,需要監(jiān)測的基礎(chǔ)設(shè)施也變得越來越復(fù)雜和龐大,對數(shù)據(jù)中心運(yùn)維管理水平的要求也就越高。 數(shù)據(jù)中心基礎(chǔ)設(shè)施一旦出現(xiàn)故障就會(huì)立刻影響IT 系統(tǒng)的運(yùn)行,對數(shù)據(jù)傳輸、存儲(chǔ)的可靠性、安全性構(gòu)成威脅[1]。 如何更好地做好數(shù)據(jù)中心基礎(chǔ)設(shè)施的運(yùn)維管理問題變得尤為突出,也使得行業(yè)對數(shù)據(jù)中心智能運(yùn)維管理平臺(tái)的需求更加迫切。
數(shù)據(jù)中心是為集中放置的電子信息設(shè)備提供運(yùn)行環(huán)境的建筑場所,可以是一棟或幾棟建筑物,也可以是一棟建筑物的一部分,包括主機(jī)房、輔助區(qū)、支持區(qū)和行政管理區(qū)等[2]。
如果將大型數(shù)據(jù)中心看作是一個(gè)綜合型園區(qū),那這樣規(guī)模的數(shù)據(jù)中心僅應(yīng)用傳統(tǒng)的動(dòng)環(huán)監(jiān)控系統(tǒng)將會(huì)存在以下問題。 (1)設(shè)計(jì)、建設(shè)、應(yīng)用同質(zhì)化,難以滿足個(gè)性化需求。 (2)建筑物與建筑物之間,建筑物內(nèi)各子系統(tǒng)相對獨(dú)立,存在“信息孤島”的問題,智能化、智慧化水平低。 (3)數(shù)據(jù)采集孤立,難以實(shí)現(xiàn)系統(tǒng)聯(lián)動(dòng)。 (4)應(yīng)用可擴(kuò)展性差,擴(kuò)展成本較高。 (5)難以實(shí)現(xiàn)高效、便捷的集中式管理,運(yùn)維成本高。 (6)重要設(shè)備運(yùn)行狀態(tài)不易實(shí)時(shí)監(jiān)控,事故預(yù)警難以實(shí)現(xiàn)。
物聯(lián)網(wǎng)技術(shù)是指通過各種信息傳感器件,有線或無線網(wǎng)絡(luò),按約定協(xié)議,把各種末端設(shè)施設(shè)備與網(wǎng)絡(luò)連接,以實(shí)現(xiàn)信息交換和通信的一種網(wǎng)絡(luò)技術(shù)。 目前已廣泛應(yīng)用于工業(yè)、農(nóng)業(yè)、醫(yī)療等行業(yè)。
將物聯(lián)網(wǎng)技術(shù)應(yīng)用于數(shù)據(jù)中心智能運(yùn)維管理平臺(tái),可以有效地解決上述問題,主要表現(xiàn)在如下幾方面:(1)可實(shí)現(xiàn)數(shù)據(jù)中心智能運(yùn)維管理平臺(tái)各子系統(tǒng)互聯(lián)互通,使其具有更高的開放性和可靠性,打破傳統(tǒng)智能化系統(tǒng)的“信息孤島”問題,系統(tǒng)間可以方便實(shí)現(xiàn)聯(lián)動(dòng)控制。 (2)通過多協(xié)議物聯(lián)網(wǎng)網(wǎng)關(guān),實(shí)現(xiàn)各末端設(shè)備不同通訊協(xié)議的信息采集,使平臺(tái)數(shù)據(jù)采集更具有兼容性和廣泛性,滿足園區(qū)智能化終端設(shè)備的個(gè)性化設(shè)計(jì)需求。 (3)作為統(tǒng)一開放的物聯(lián)網(wǎng)平臺(tái),可以實(shí)現(xiàn)數(shù)據(jù)中心海量數(shù)據(jù)的采集、存儲(chǔ)、分析、挖掘,通過專家引擎識別運(yùn)維過程中的風(fēng)險(xiǎn)點(diǎn),做到故障預(yù)測預(yù)警,并形成專家診斷規(guī)則庫,實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)一、共享,為數(shù)據(jù)中心智能運(yùn)維管理平臺(tái)及應(yīng)用終端進(jìn)行數(shù)據(jù)建模和數(shù)據(jù)挖掘提供數(shù)據(jù)支撐。 (4)可進(jìn)行數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)備的運(yùn)行仿真和工作狀態(tài)模擬,實(shí)現(xiàn)數(shù)據(jù)中心智能運(yùn)維管理平臺(tái)及應(yīng)用終端的演示和演練。 平臺(tái)軟件架構(gòu)如圖1 所示。
圖1 數(shù)據(jù)中心智能運(yùn)維管理平臺(tái)軟件架構(gòu)
可以看到,該平臺(tái)分為采集層、接入層、平臺(tái)層、應(yīng)用層、展示層。
(1)采集層:數(shù)據(jù)采集的重要部分,也是物聯(lián)網(wǎng)技術(shù)應(yīng)用最多的地方。 從器件角度主要包括各類感應(yīng)器件和傳感網(wǎng)絡(luò),涉及到射頻、傳感、無線網(wǎng)絡(luò)、現(xiàn)場總線等核心關(guān)鍵技術(shù),包含動(dòng)環(huán)系統(tǒng)(包括動(dòng)力設(shè)備、配電設(shè)備、蓄電池、機(jī)房環(huán)境、機(jī)柜環(huán)境)、安防系統(tǒng)(包括視頻設(shè)備、門禁設(shè)備、電子監(jiān)控)、樓控系統(tǒng)(包括冷源設(shè)備、通風(fēng)設(shè)備、空調(diào)設(shè)備)、消防系統(tǒng)(包括火災(zāi)報(bào)警、廣播系統(tǒng))及其他各類子系統(tǒng)(包括IT 設(shè)施、微模塊、資產(chǎn)信息、智能照明、其他設(shè)備等)。
(2)接入層:通過各類網(wǎng)絡(luò)通訊技術(shù)和設(shè)備,將采集層各子系統(tǒng)和設(shè)備數(shù)據(jù)進(jìn)行接入,涉及Internet網(wǎng)絡(luò)、有線網(wǎng)絡(luò)、無線網(wǎng)絡(luò)、數(shù)據(jù)接入網(wǎng)關(guān)、IoT 網(wǎng)關(guān)等,支持SNMP、Modbus、OPC、BAC net、MQTT 等各種協(xié)議。
(3)平臺(tái)層:數(shù)據(jù)處理核心層級,包含數(shù)據(jù)的處理、分析、診斷能力的數(shù)據(jù)引擎;包括聯(lián)動(dòng)控制、權(quán)限管理、配置管理、服務(wù)接口等一系列的公共服務(wù)組件;包括模型庫、知識庫、算法庫、數(shù)據(jù)庫的專家系統(tǒng)引擎;還涉及無損實(shí)時(shí)數(shù)據(jù)壓縮傳輸、實(shí)時(shí)工作流引擎支持的業(yè)務(wù)調(diào)度等關(guān)鍵技術(shù)。
(4)應(yīng)用層:業(yè)務(wù)構(gòu)建核心層級,包括設(shè)施監(jiān)控、能效、容量、資產(chǎn)、連接、事件、變更、人員、智能巡檢、智慧運(yùn)維等業(yè)務(wù)管理模塊或服務(wù)。
(5)展示層:面向用戶的最終層級,以可視化大屏、移動(dòng)App、個(gè)人工作臺(tái)、報(bào)表展示等多樣化的交互方式,為用戶提供接入與訪問。
一個(gè)典型大型數(shù)據(jù)中心園區(qū)的智能運(yùn)維管理平臺(tái)系統(tǒng)結(jié)構(gòu)如圖2 所示。
圖2 數(shù)據(jù)中心智能運(yùn)維管理平臺(tái)系統(tǒng)結(jié)構(gòu)
系統(tǒng)接入層既實(shí)現(xiàn)縱向結(jié)構(gòu)的接入,同時(shí)在橫向上實(shí)現(xiàn)數(shù)據(jù)中心各子系統(tǒng)的互聯(lián)互通,并通過園區(qū)通訊網(wǎng)絡(luò)向數(shù)據(jù)中心智能運(yùn)維管理平臺(tái)提供數(shù)據(jù)源。 利用采集的實(shí)時(shí)數(shù)據(jù),向總控中心、運(yùn)維部門、物業(yè)管理部門等提供智能化應(yīng)用服務(wù),并依靠平臺(tái)基于物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù)實(shí)現(xiàn)的高級智慧化應(yīng)用服務(wù),為數(shù)據(jù)中心園區(qū)提供統(tǒng)一數(shù)字化智慧化運(yùn)維管理服務(wù)。
在數(shù)據(jù)中心智能運(yùn)維管理平臺(tái)軟件架構(gòu)中,應(yīng)用層是應(yīng)用服務(wù)業(yè)務(wù)構(gòu)建的核心層級,同時(shí)也最能體現(xiàn)管理平臺(tái)智能化、智慧化的特點(diǎn),其核心功能模塊如圖3 所示[3]。
圖3 功能框架
(1)設(shè)施監(jiān)控:針對數(shù)據(jù)中心基礎(chǔ)設(shè)施實(shí)現(xiàn)圖形化顯示、控制、分析、告警管理,實(shí)時(shí)監(jiān)控顯示設(shè)備的運(yùn)行狀態(tài)及變化趨勢;設(shè)備實(shí)時(shí)運(yùn)行參數(shù)顯示及告警管理,包括告警的顯示、處理和分析。 智能化應(yīng)用火災(zāi)報(bào)警聯(lián)動(dòng)如圖4 所示。
圖4 火災(zāi)報(bào)警聯(lián)動(dòng)
(2)能效管理:主要針對水、電、氣等能源消耗進(jìn)行統(tǒng)計(jì),以及通過采集、顯示、分析、診斷、維護(hù)、控制等管理技術(shù)進(jìn)行能效的持續(xù)優(yōu)化,形成具有全面、系統(tǒng)、安全的能效綜合職能管理功能,以達(dá)到能源消耗的節(jié)約與改善。 關(guān)鍵功能模塊包括能源組成、能源利用率、節(jié)能診斷、用能預(yù)警預(yù)測等。
(3)容量管理:對空間、電力、制冷、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施的容量進(jìn)行統(tǒng)計(jì)、分析、部署、展示,建立相關(guān)模型,優(yōu)化配置資源,提高容量利用率。 關(guān)鍵功能模塊包括容量監(jiān)視、容量優(yōu)化、容量分析等。
(4)資產(chǎn)管理:提供對數(shù)據(jù)中心資產(chǎn)設(shè)施的入庫、出庫、變更、盤點(diǎn)等的全生命周期管理,主要功能模塊包括資產(chǎn)臺(tái)賬及檢索、資產(chǎn)可視化、資產(chǎn)統(tǒng)計(jì)分析等。
(5)連接管理:呈現(xiàn)數(shù)據(jù)中心設(shè)備之間的連接關(guān)系,為數(shù)據(jù)中心運(yùn)維業(yè)務(wù)提供連接性關(guān)系的數(shù)據(jù)支撐。 關(guān)鍵功能模塊包括連接總覽、配置信息、設(shè)備操作、統(tǒng)計(jì)報(bào)表等。
(6)事件管理:主要包括事件識別和創(chuàng)建、事件處理與分析、事件升級、事件關(guān)閉等。
(7)變更管理:主要針對運(yùn)維過程中對數(shù)據(jù)中心基礎(chǔ)設(shè)施的增補(bǔ)、移除、修改等進(jìn)行管理。
(8)人員管理:對數(shù)據(jù)中心工作人員進(jìn)行全面管理,保障數(shù)據(jù)中心安全、高效、穩(wěn)定運(yùn)行,減少人為損失。
(9)智能巡檢:數(shù)據(jù)中心機(jī)器人智能巡檢是智能巡檢最為典型的應(yīng)用之一。
(10)智慧運(yùn)維:針對相關(guān)基礎(chǔ)設(shè)施進(jìn)行日常運(yùn)行、檢修和維護(hù)的管理工作,包含設(shè)備維保信息查詢、維保登記、維保預(yù)警、維保提醒、維保數(shù)據(jù)統(tǒng)計(jì)分析等功能。
針對當(dāng)前行業(yè)對數(shù)據(jù)中心運(yùn)維管理水平要求越來越高的實(shí)際狀況,提出并分析了基于物聯(lián)網(wǎng)技術(shù)的數(shù)據(jù)中心智能運(yùn)維管理平臺(tái),該平臺(tái)包括設(shè)施監(jiān)控、能效、容量、資產(chǎn)、連接、事件、變更、人員、智能巡檢、智慧運(yùn)維等核心功能模塊,滿足了行業(yè)對數(shù)據(jù)中心智慧運(yùn)維的迫切需求,將基礎(chǔ)設(shè)施多個(gè)子系統(tǒng)集成在統(tǒng)一平臺(tái),實(shí)現(xiàn)各系統(tǒng)數(shù)據(jù)充分共享,運(yùn)用物聯(lián)網(wǎng)、大數(shù)據(jù)處理、數(shù)據(jù)挖掘、人工智能等技術(shù),管理、分析、預(yù)警數(shù)據(jù)中心基礎(chǔ)設(shè)施面對的各種復(fù)雜多樣的運(yùn)維問題,實(shí)現(xiàn)了數(shù)據(jù)中心安全、可靠、節(jié)能運(yùn)行。