韓峰
摘要:目前上海聯(lián)通在上海各處有華為和中興通訊等多家自建或代建的數(shù)據(jù)中心,每個數(shù)據(jù)中心都要配備獨立專業(yè)的運維管理人員,而且各個數(shù)據(jù)中心的監(jiān)管數(shù)據(jù)對上匯總也比較復(fù)雜,需一套統(tǒng)一的頂層數(shù)據(jù)中心DCIM平臺來將各個數(shù)據(jù)中心的管理系統(tǒng)納入到這個平臺來進行統(tǒng)一的監(jiān)管。
關(guān)鍵詞:數(shù)據(jù)中心;運維管理;DCIM平臺;管理系統(tǒng);統(tǒng)一監(jiān)管
1緒論
目前上海聯(lián)通在上海的多個數(shù)據(jù)中心的管理平臺中有多個廠家的管理系統(tǒng),有中興力維,艾默生等多個廠家的系統(tǒng),管理水平參差不齊,沒有一個統(tǒng)一的標(biāo)準(zhǔn)化的要求。有些機房甚至還是采用傳統(tǒng)的人工的方式來日常維護,例如手動計算各種能耗分析,人工抄表式巡檢,點數(shù)式資產(chǎn)盤點等。這些管理手段耗時耗力,準(zhǔn)確度也很低。在聯(lián)通總部也無法直接獲取到一線數(shù)據(jù)中心的數(shù)據(jù)。隨著上海聯(lián)通業(yè)務(wù)的爆發(fā)式增長,也急需一套綜合智能管理平臺,在人手有限、滿足基本需求前提下,提升運維和運營的質(zhì)量。
這就需要一個“集中化、一體化、智能化”的垂直的頂層的DCIM管理平臺。
2.總體方案設(shè)計
2 1設(shè)計原則。方案設(shè)計本著“實用、可靠、先進、安全、經(jīng)濟和共享”的建設(shè)原則,系統(tǒng)設(shè)計需滿足以下原則:
1)整體性、便捷性
各智能化子系統(tǒng)統(tǒng)一界面、統(tǒng)一管理,在同一個界面上顯示各子系統(tǒng)如動環(huán)、門禁、巡更、樓控、廣播、信息發(fā)布等設(shè)備的狀態(tài),并可實現(xiàn)一體化操作,無需多平臺跳轉(zhuǎn)。
2)安全性
建立用戶安全機制,多用戶權(quán)限及強制密碼修改功能
重要設(shè)備如動環(huán)監(jiān)控單元采用雙電源冗余,統(tǒng)一管理平臺服務(wù)采用雙機備份,重要監(jiān)控點位采集設(shè)備冗余備份
3)開放性、擴展性
系統(tǒng)不僅可以向下集成各種軟硬件接口,還可對外提供各種接口,完全實現(xiàn)與其他平臺的無縫對接
隨著用戶業(yè)務(wù)的拓展,系統(tǒng)能方便的實現(xiàn)擴充與擴容,避免因擴充而需要更換中心設(shè)備或系統(tǒng)軟件等
4)穩(wěn)定性、可靠性
系統(tǒng)采用分層化、模塊化的設(shè)計,保證各智能化系統(tǒng)在擴容、升級時不影響其他系統(tǒng),整體綜合平臺可無間斷安全運行。
5)節(jié)能、經(jīng)濟性
統(tǒng)一管理平臺的設(shè)計是對各子系統(tǒng)管理平臺的優(yōu)化及集成,各類監(jiān)測數(shù)據(jù)統(tǒng)一管理,避免各子系統(tǒng)管理平臺的重復(fù)建設(shè),優(yōu)化管理入口及呈現(xiàn)界面,提升管理人員管理效率,節(jié)約人力成本。
2.2系統(tǒng)架構(gòu)
頂層DCIM管理平臺平臺建設(shè)需打破傳統(tǒng)運維各子系統(tǒng)獨立分散的垂直管理,將采用“集中化、一體化、智能化”的設(shè)計模式,實現(xiàn)主動、高效、流程化的運維管理。平臺架構(gòu)采用分層設(shè)計,實現(xiàn)功能總集成、流程總調(diào)度、資源全監(jiān)控。
3軟件架構(gòu)
3.1呈現(xiàn)層。提供多種用戶交互方式。
組態(tài)通過圖形化界面分多個層次展現(xiàn)園區(qū)全景,包括園區(qū)組態(tài)、樓棟組態(tài)、樓層組態(tài)、機房組態(tài)和設(shè)備組態(tài),組態(tài)界面可以通過控件進行任意的組合配置,按照用戶的要求形成實景或抽象的管理界面。
3.2業(yè)務(wù)層。業(yè)務(wù)層包括三個方面:統(tǒng)一管理功能,運維功能和管理功能。
3.3采集層。采集層有三類數(shù)據(jù)來源:
已有DCIM平臺的從平臺統(tǒng)一采集;
沒有平臺的各子系統(tǒng)單獨對接采集;
與聯(lián)通自有業(yè)務(wù)系統(tǒng)的對接;
4管理平臺功能
4.1事件流管理。以客戶服務(wù)為中心,個人工作臺作為運維人員的主要工作界面,包含關(guān)鍵參數(shù)展示及運維工作任務(wù)事項。
4.1.1關(guān)鍵參數(shù)顯示
關(guān)鍵參數(shù)指標(biāo)包括:能耗數(shù)據(jù)、資產(chǎn)信息、容量信息;
關(guān)鍵參數(shù)指標(biāo)的展示包括曲線圖、柱狀圖、趨勢圖等圖形化展示;
容量趨勢圖支持按年、月、日展示空間、電力、制冷容量信息。
4.1.2任務(wù)顯示
任務(wù)顯示模塊有待辦任務(wù)、已辦任務(wù)和我創(chuàng)建的任務(wù),包括任務(wù)名稱、任務(wù)類型、任務(wù)日期、級別、發(fā)派人等信息,根據(jù)任務(wù)級別可以區(qū)分任務(wù)的優(yōu)先級,主要級別有:緊急、重要、標(biāo)準(zhǔn)、次要;
已辦任務(wù)和我創(chuàng)建任務(wù)支持任務(wù)詳情查看功能和按照任務(wù)處理狀態(tài)進行查詢功能;
我創(chuàng)建的任務(wù)支持告警或資產(chǎn)工單創(chuàng)建菜單,根據(jù)工單類型跳轉(zhuǎn)至對應(yīng)的工單創(chuàng)建頁面;
待辦任務(wù)支持任務(wù)快速處理菜單,根據(jù)任務(wù)類型跳轉(zhuǎn)到詳細的任務(wù)處理頁面,在任務(wù)處理頁面可以查看任務(wù)詳細信息、任務(wù)指派人信息、任務(wù)處理意見等信息。
4.2告警統(tǒng)一管理。系統(tǒng)告警分為四級:一級告警、二級告警、三級告警和四級告警(重要程度從高到低),其中,一級告警以紅色標(biāo)識,二級告警以橙色標(biāo)識,三級告警以黃色標(biāo)識,四級告警以淡藍色標(biāo)識,告警級別、告警上下限值可根據(jù)需要更改。
4.3機房環(huán)境管理。機房環(huán)境管理提供對機房、機架、機位的溫濕度數(shù)據(jù)的分析、呈現(xiàn)、和告警等管理功能。動環(huán)數(shù)據(jù)綜合分析
動環(huán)數(shù)據(jù)綜合分析需要保證動環(huán)等系統(tǒng)的接口提供相應(yīng)數(shù)據(jù)(UPS監(jiān)控、精密空調(diào)監(jiān)控、配電柜監(jiān)控、漏水監(jiān)控、電池組監(jiān)控、柴發(fā)監(jiān)控、消防監(jiān)控、冷凍機監(jiān)控、冷卻塔監(jiān)控、門禁卡監(jiān)控等)。
4.4制冷、配電展示。集中監(jiān)控系統(tǒng)支持按照空間維度(基地-樓宇-模塊-機房-冷通道-機列-機柜)進行制冷、配電等的展示。同時集中監(jiān)控系統(tǒng)把制冷、電力等信息同步給資源管理系統(tǒng),資源管理系統(tǒng)可實現(xiàn)對制冷、電力等容量信息進行查詢統(tǒng)計、容量報表、低容量告警和容量配置等功能。
4.5聯(lián)動管理。1、系統(tǒng)支持自動保存所有的動環(huán)、門禁和視頻之間的聯(lián)動記錄,保存的內(nèi)容包括聯(lián)動的觸發(fā)事件信息(如××監(jiān)控量告警/消除、時間)和聯(lián)動的結(jié)果(如聯(lián)動XX攝像頭錄像、轉(zhuǎn)到預(yù)置位或觸發(fā)××遙控量)。
2.可單獨查詢聯(lián)動日志,可按任意時間、觸發(fā)條件(單選)和聯(lián)動結(jié)果(單選)組合查詢。
3.可以查詢聯(lián)動異常情況,如觸發(fā)事件和聯(lián)動結(jié)果對應(yīng)的對象已經(jīng)刪除等情況。可根據(jù)聯(lián)動異常情況批量刪除聯(lián)動規(guī)則。
4.63D視圖。系統(tǒng)支持機房仿真3D呈現(xiàn)。查詢定位設(shè)備設(shè)施。支持3D方式呈現(xiàn)機柜容量信息。支持查看機房溫度分布云圖,提供顏色一溫度刻度尺。支持歷史溫度云圖播放,鷹眼視圖、3D視角切換、收藏、定位,自動巡檢等功能。
4.7問題管理。問題可以提供界面手動錄入問題信息,提供統(tǒng)計、查詢和導(dǎo)出功能。
4.8容量管理。系統(tǒng)具備結(jié)合資產(chǎn)管理對空間、電力等容量信息進行查詢統(tǒng)計、容量報表、低容量告警和容量配置等功能。結(jié)合資產(chǎn)管理對空間、電力容量,冷量??奢敵鋈萘繄蟊怼⒏呷萘扛婢?、容量配置。
4.9資產(chǎn)管理。按照區(qū)域、機房、樓層、房間展示資產(chǎn)列表,根據(jù)資產(chǎn)維護日期和維護人自動發(fā)出設(shè)備維護提醒通知,維護人員可填寫維護信息,導(dǎo)出維護記錄
5某電信公司案例
一個電信公司的頻統(tǒng)計可能有100萬個組合條件。包括:站點,設(shè)備類型,監(jiān)控量類型,告警級別,告警時間段,告警次數(shù),搜索時間范圍。
某電信公司A 2013年~2016年,3年歷史數(shù)據(jù)合計27億條,高速查詢對比。
某電信公司B 2010-16年,5年歷史數(shù)據(jù):50億條,3萬種報警類型400萬條左右的報警數(shù)據(jù)。
由于自有的一些業(yè)務(wù)系統(tǒng)已經(jīng)比較成熟,將其融合到總格管理平臺內(nèi)能發(fā)揮更大的效益。同樣,自由業(yè)務(wù)系統(tǒng)需要定制對外接口,即可完成兩平臺的對接。
結(jié)語
在IDC領(lǐng)域,高速發(fā)展的IDC數(shù)據(jù)中心,也就意味著數(shù)據(jù)中心管理系統(tǒng)需要提升一個層次。大數(shù)據(jù)爆發(fā)的時代背景下,傳統(tǒng)的數(shù)據(jù)中心管理系統(tǒng),只能完成了第一層響應(yīng)響應(yīng)型分析,即收集數(shù)據(jù),報表統(tǒng)計,高速查閱;而目前設(shè)計的數(shù)據(jù)平臺,可完成第二層診斷型分析和趨勢分析;第三層預(yù)測性分析和預(yù)測模型的建立;以及第四層認知轉(zhuǎn)換這四個更高層級的分析。
后期的發(fā)展可以由聯(lián)通來提出業(yè)務(wù)模式、業(yè)務(wù)流程、業(yè)務(wù)時間軸,由供應(yīng)商根據(jù)實際需求來搭建數(shù)據(jù)模型,使得采集的龐大數(shù)據(jù)依附在模型里面發(fā)揮更加實際更加智能化的效果。