国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)中心智能運(yùn)維管理方案設(shè)計(jì)

2021-06-01 10:33:04嚴(yán)代彪
關(guān)鍵詞:數(shù)據(jù)中心運(yùn)維管理系統(tǒng)

嚴(yán)代彪

本文針對數(shù)據(jù)中心的特點(diǎn),以智能化運(yùn)維管理為目標(biāo),提出了數(shù)據(jù)中心智能運(yùn)維管理方案,設(shè)計(jì)了運(yùn)維門戶及展示管理、運(yùn)維資產(chǎn)配置管理、運(yùn)維服務(wù)管理、運(yùn)維監(jiān)控監(jiān)測告警管理、運(yùn)維自動(dòng)化管理及開放接口管理等主要內(nèi)容,為數(shù)據(jù)中心智能運(yùn)維管理系統(tǒng)建設(shè)提供指導(dǎo)。

云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)及人工智能等新一代信息技術(shù)蓬勃發(fā)展,數(shù)據(jù)中心的規(guī)劃、設(shè)計(jì)、建設(shè)和運(yùn)維呈現(xiàn)出綠色節(jié)能、向資本效率轉(zhuǎn)型、智能化和智能運(yùn)維管理等特點(diǎn)。隨著信息化進(jìn)程的日漸深化,智能化運(yùn)維在數(shù)據(jù)中心的作用已經(jīng)不僅限于基礎(chǔ)設(shè)施的建設(shè)、應(yīng)用及工具的維護(hù),數(shù)據(jù)中心業(yè)務(wù)對智能化運(yùn)維的依賴程度越來越大,這決定了智能化運(yùn)維已經(jīng)成為數(shù)據(jù)中心價(jià)值鏈中不可或缺的重要一環(huán)。本文針對數(shù)據(jù)中心的發(fā)展趨勢和特點(diǎn),以智能化運(yùn)維管理為目標(biāo),提出了數(shù)據(jù)中心智能運(yùn)維管理方案,設(shè)計(jì)了智能運(yùn)維門戶及展示管理、運(yùn)維資產(chǎn)配置管理、運(yùn)維服務(wù)管理、運(yùn)維監(jiān)控監(jiān)測告警管理、運(yùn)維自動(dòng)化管理及開放接口管理等主要內(nèi)容,為數(shù)據(jù)中心智能運(yùn)維管理系統(tǒng)建設(shè)提供指導(dǎo)。

數(shù)據(jù)中心面臨的挑戰(zhàn)

管理角度

首先就是經(jīng)濟(jì)性,包括網(wǎng)絡(luò)資源、空間資源和動(dòng)環(huán)資源如何有效地利用,以及縮減能源和維護(hù)人員的運(yùn)行費(fèi)用;其次是靈活性方面,包括如何識別和降低過度部署和冗余、靈活擴(kuò)展空間、制冷和供電容量,及更快地響應(yīng)業(yè)務(wù);第三就是可用性方面,如何實(shí)現(xiàn)精細(xì)化管理、及時(shí)排除隱患、處理復(fù)雜故障以及實(shí)現(xiàn)動(dòng)態(tài)資源管理;第四就是管理性方面,如何進(jìn)行有效地?cái)?shù)據(jù)分析支撐決策和規(guī)劃、實(shí)現(xiàn)系統(tǒng)一體化、系統(tǒng)統(tǒng)一協(xié)作和快速響應(yīng)、滿足大客戶服務(wù)等級協(xié)議(SLA)和自服務(wù)管理等。

技術(shù)角度

首先面臨的挑戰(zhàn)就是運(yùn)維海量數(shù)據(jù)的存儲(chǔ)、分析和處理問題。運(yùn)維人員必須隨時(shí)掌握服務(wù)器的運(yùn)行狀況,除了常規(guī)的服務(wù)器配置、資源占用情況等信息外,業(yè)務(wù)在運(yùn)行時(shí)會(huì)產(chǎn)生大量的日志、異常、告警和狀態(tài)報(bào)告等事件。通常每臺(tái)服務(wù)器每個(gè)時(shí)刻都會(huì)產(chǎn)生大量這樣的事件,在有數(shù)萬臺(tái)服務(wù)器的場合下,每天產(chǎn)生的事件數(shù)量是數(shù)億萬計(jì),存儲(chǔ)量在TB級別的。數(shù)據(jù)中心的服務(wù)器規(guī)模往往比較大,如何統(tǒng)一、自動(dòng)化處理這些事件的需求很強(qiáng)烈,畢竟登錄查看日志這種方式效率很低,而當(dāng)前的監(jiān)控軟件只能收集和處理眾多事件中的一部分,當(dāng)服務(wù)器數(shù)量多了以后,其擴(kuò)展能力、二次開發(fā)能力非常有限。

其次面臨的挑戰(zhàn)是多維度、多數(shù)據(jù)源的復(fù)雜性問題。多維度數(shù)據(jù)不僅包括常用的時(shí)間、地點(diǎn)(哪個(gè)服務(wù)器或組件)、內(nèi)容(錯(cuò)誤碼或狀態(tài)值),還應(yīng)當(dāng)包括地區(qū)、機(jī)房、服務(wù)池、業(yè)務(wù)線、服務(wù)和接口等,而數(shù)據(jù)分析人員則需要使用各種維度、組合各種指標(biāo)來生成報(bào)告、告警規(guī)章及Dashboard等。如何從異構(gòu)的數(shù)據(jù)源獲取數(shù)據(jù),還要考慮當(dāng)其中某個(gè)數(shù)據(jù)源失效、服務(wù)延遲時(shí),能否不影響整個(gè)系統(tǒng)的穩(wěn)定性。多數(shù)據(jù)源還有一個(gè)關(guān)鍵問題就是如何做到數(shù)據(jù)和展現(xiàn)分離,如果展現(xiàn)和數(shù)據(jù)的契合度太高,那么隨便一點(diǎn)變更就會(huì)導(dǎo)致前端界面展現(xiàn)部分的更改,帶來的工作量會(huì)非常大。

第三個(gè)技術(shù)挑戰(zhàn)就是復(fù)雜業(yè)務(wù)模型下的故障定位。業(yè)務(wù)模型(或系統(tǒng)部署結(jié)構(gòu))復(fù)雜帶來的最直接影響就是定位故障很困難,發(fā)現(xiàn)根源問題成本較高,需要多部門合作,開發(fā)、運(yùn)維人員相互配合分析(現(xiàn)在的大規(guī)模系統(tǒng)很難找到一個(gè)能掌控全局的人),即使這樣有時(shí)得出的結(jié)論也不見得各方都認(rèn)可。在復(fù)雜、異構(gòu)和各種技術(shù)混雜的業(yè)務(wù)系統(tǒng)中,如果想發(fā)現(xiàn)問題并定位故障,在各個(gè)系統(tǒng)中就必須有一個(gè)可追蹤、有共性的東西。然而,在現(xiàn)實(shí)中若想用某個(gè)體系來“一統(tǒng)天下”基本不可能,因?yàn)楦鞣N非技術(shù)因素可能會(huì)讓這種努力一直停留在規(guī)劃階段,尤其是大公司,部門之間的鴻溝是技術(shù)人員無法跨越的。

因此,面對以上挑戰(zhàn),數(shù)據(jù)中心應(yīng)建設(shè)“集中化運(yùn)維、一體化管理、智能化分析、流程化控制”的智能運(yùn)維管理系統(tǒng),才能實(shí)現(xiàn)智能化運(yùn)維的管理目標(biāo),減少運(yùn)維人員和維護(hù)成本,優(yōu)化資源管理,從整體上提高智能化運(yùn)維系統(tǒng)運(yùn)行協(xié)調(diào)性、安全性和資源共享性,發(fā)揮信息化建設(shè)的最大效益。

總體設(shè)計(jì)

總體原則

智能運(yùn)維管理方案立足體系建設(shè)的角度進(jìn)行設(shè)計(jì),總體原則遵循以下4個(gè)方面:

以完善的運(yùn)維服務(wù)制度、流程為基礎(chǔ)

為保障運(yùn)行維護(hù)工作的質(zhì)量和效率,應(yīng)制定相對完善、切實(shí)可行的運(yùn)行維護(hù)管理制度和規(guī)范,確定各項(xiàng)運(yùn)維活動(dòng)的標(biāo)準(zhǔn)流程和相關(guān)崗位設(shè)置等,使運(yùn)維人員在制度與流程的規(guī)范和約束下協(xié)同操作。

以先進(jìn)、成熟的運(yùn)維管理平臺(tái)為手段

通過建立統(tǒng)一、集成、開放并可擴(kuò)展的運(yùn)維管理平臺(tái),實(shí)現(xiàn)對各類運(yùn)維事件的全面采集、及時(shí)處理與合理分析,實(shí)現(xiàn)運(yùn)行維護(hù)工作的智能化和高效化。

以高素質(zhì)的運(yùn)維服務(wù)隊(duì)伍為保障

運(yùn)維服務(wù)的順利實(shí)施離不開高素質(zhì)的運(yùn)維服務(wù)人員,因此必須不斷提高運(yùn)維服務(wù)隊(duì)伍的專業(yè)化水平,才能有效利用技術(shù)手段和工具,做好各項(xiàng)運(yùn)維工作。

以智能化運(yùn)維管理為目的

智能化運(yùn)維管理需要實(shí)現(xiàn)智能監(jiān)控、智能檢測配置變更以及智能提示3個(gè)主要功能,自動(dòng)提示報(bào)警信息,自動(dòng)觸發(fā)智能運(yùn)維變更流程,方便運(yùn)維管理人員及時(shí)采取應(yīng)對措施。

2.總體架構(gòu)

數(shù)據(jù)中心運(yùn)行智能運(yùn)維管理系統(tǒng)由基礎(chǔ)設(shè)施運(yùn)維、支撐服務(wù)運(yùn)維、應(yīng)用系統(tǒng)運(yùn)維和安全防護(hù)系統(tǒng)運(yùn)維4部分組成,針對數(shù)據(jù)中心建立的網(wǎng)絡(luò)設(shè)備、計(jì)算設(shè)備、存儲(chǔ)設(shè)備和安全防護(hù)設(shè)備等進(jìn)行設(shè)備管控,同時(shí)對操作系統(tǒng)、數(shù)據(jù)庫和中間件等基礎(chǔ)軟件,以及一體化探測網(wǎng)絡(luò)應(yīng)用軟件、數(shù)據(jù)傳輸系統(tǒng)應(yīng)用軟件、信息處理與服務(wù)系統(tǒng)應(yīng)用軟件等提供軟件運(yùn)行實(shí)時(shí)監(jiān)測,智能運(yùn)維管理系統(tǒng)總體架構(gòu)如圖1所示。

資源層

是數(shù)據(jù)中心中所有的IT資源,是運(yùn)維服務(wù)的主要對象,包括基礎(chǔ)動(dòng)力環(huán)境、網(wǎng)絡(luò)通信資源、計(jì)算存儲(chǔ)資源、云資源和應(yīng)用業(yè)務(wù)系統(tǒng)資源。

服務(wù)層

包括資源接入服務(wù)、數(shù)據(jù)資源及數(shù)據(jù)支撐服務(wù)和共用的支撐服務(wù)。資源接入服務(wù)提供各種類型資源的接入功能,負(fù)責(zé)對資源的運(yùn)行數(shù)據(jù)進(jìn)行采集、控制等。數(shù)據(jù)資源及數(shù)據(jù)支撐服務(wù)負(fù)責(zé)對資源的基礎(chǔ)信息、資源狀態(tài)、性能和容量等數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、管理和分析等。共用服務(wù)的基礎(chǔ)支撐軟件是構(gòu)建系統(tǒng)所需基礎(chǔ)軟件運(yùn)行支撐、規(guī)范信息交換流程、提升系統(tǒng)間數(shù)據(jù)互聯(lián)互通互操作的能力,提供系統(tǒng)運(yùn)行、集成手段的基礎(chǔ)軟件系統(tǒng),為運(yùn)行管理保障系統(tǒng)各業(yè)務(wù)應(yīng)用軟件的研制與綜合集成提供共性基礎(chǔ)支撐。

監(jiān)控監(jiān)測告警

主要通過各種管理協(xié)議和管理接口適配,實(shí)現(xiàn)各類管理對象的管理信息采集和運(yùn)行狀態(tài)感知,收集高質(zhì)量、可信和準(zhǔn)確及時(shí)的信息,提供對上層運(yùn)維服務(wù)的支撐,保障業(yè)務(wù)流程的有效運(yùn)行,所管理的對象包括:網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)、安全、機(jī)房動(dòng)力環(huán)境及應(yīng)用服務(wù)系統(tǒng)等。

運(yùn)維服務(wù)管理

是為使服務(wù)達(dá)到其質(zhì)量目標(biāo)而以確定的方式實(shí)施的一系列規(guī)范化管理服務(wù)。運(yùn)維服務(wù)管理流程從流程的目標(biāo)和范圍、流程的觸發(fā)、流程的輸入和輸出、流程與其他流程的關(guān)系、流程的活動(dòng)、流程的參考設(shè)計(jì)、流程中的角色和職責(zé)以及流程的關(guān)鍵度量指標(biāo)等方面對流程進(jìn)行定義。

資源配置管理

主要包括資產(chǎn)管理和CMDB配置管理,資產(chǎn)管理服務(wù)是提供資源基礎(chǔ)信息、配置信息等管理;

運(yùn)維自動(dòng)化管理

為管理人員提供運(yùn)維自動(dòng)化能力,提供批量調(diào)度執(zhí)行運(yùn)維任務(wù),簡化運(yùn)維工作,應(yīng)對大量簡單重復(fù)運(yùn)維動(dòng)作,比如系統(tǒng)批量補(bǔ)丁升級。

統(tǒng)一門戶及展現(xiàn)管理

提供統(tǒng)一的綜合運(yùn)維平臺(tái)入口,使運(yùn)維人員能夠基于統(tǒng)一的整合管理界面,進(jìn)行運(yùn)維管理的信息查詢和相關(guān)操作。

組成功能

通過對運(yùn)維體系的分析,依托業(yè)界現(xiàn)有運(yùn)維相關(guān)的小工具小系統(tǒng),本文提出了一體化數(shù)據(jù)中心智能運(yùn)維管理系統(tǒng)的方案,主要包括綜合門戶系統(tǒng)、資產(chǎn)配置管理系統(tǒng)、健康監(jiān)測系統(tǒng)、運(yùn)維自動(dòng)化系統(tǒng)、運(yùn)維服務(wù)管理系統(tǒng)和運(yùn)維對外開放接口系統(tǒng)。這些系統(tǒng)可進(jìn)行單獨(dú)部署運(yùn)行,也可組合形成大系統(tǒng)。系統(tǒng)組成功能如圖2所示。

綜合門戶系統(tǒng)

提供統(tǒng)一的綜合運(yùn)維平臺(tái)入口,使運(yùn)維人員能夠基于統(tǒng)一的整合管理界面,進(jìn)行運(yùn)維管理的信息查看和相關(guān)操作。

資源配置管理系統(tǒng)

提供整合數(shù)據(jù)中心及項(xiàng)目資產(chǎn)基本信息、資產(chǎn)關(guān)聯(lián)信息、資產(chǎn)生命周期的管理功能,同時(shí)對系統(tǒng)運(yùn)行的配置信息進(jìn)行管理。

健康監(jiān)測告警管理系統(tǒng)

系統(tǒng)通過自動(dòng)化的健康監(jiān)測手段,對數(shù)據(jù)中心的動(dòng)力環(huán)境、IT基礎(chǔ)設(shè)施、應(yīng)用系統(tǒng)進(jìn)行全方位的監(jiān)測,同時(shí)從狀態(tài)、性能、容量多個(gè)維度判斷系統(tǒng)的運(yùn)行情況,一旦出現(xiàn)問題則通過聲光電、短信和郵件等多種方式進(jìn)行告警通知。

運(yùn)維服務(wù)管理系統(tǒng)

服務(wù)流程管理產(chǎn)品遵循ITIL/ITSS等IT服務(wù)管理標(biāo)準(zhǔn),建立以客戶為中心的運(yùn)維模式,將人、技術(shù)與流程進(jìn)行有效地融合,通過流程管理平臺(tái),制定內(nèi)部運(yùn)維流程,將運(yùn)維團(tuán)隊(duì)的服務(wù)產(chǎn)品化、標(biāo)準(zhǔn)化,提供了服務(wù)過程的設(shè)計(jì)、過程記錄、監(jiān)督與考核等事務(wù)的管理能力,同時(shí)提供了對IT的各項(xiàng)服務(wù)、能力進(jìn)行整合的職能。服務(wù)流程管理產(chǎn)品以高效的自主框架為流程處理引擎,并自主研發(fā)圖形化的自定義流程、流程狀態(tài)監(jiān)控、流程定制工具,方便用戶按照實(shí)際需求進(jìn)行定制流程與編制對應(yīng)的工單。

運(yùn)維自動(dòng)化管理

通過自動(dòng)化的方式批量完成運(yùn)維任務(wù),降低運(yùn)維工作量,規(guī)范運(yùn)維操作,同時(shí)支持故障與處理腳本關(guān)聯(lián),實(shí)現(xiàn)故障自愈等功能。

部署架構(gòu)

一個(gè)典型的數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)中分為業(yè)務(wù)網(wǎng)絡(luò)、存儲(chǔ)網(wǎng)絡(luò)和管理網(wǎng)絡(luò)等子網(wǎng)絡(luò),運(yùn)維系統(tǒng)需要與各個(gè)子網(wǎng)進(jìn)行對接,以接收各個(gè)子網(wǎng)的數(shù)據(jù)。在監(jiān)控過程中采集器部署到與被監(jiān)控網(wǎng)絡(luò)互通的網(wǎng)絡(luò)域,采集器采集數(shù)據(jù)后,發(fā)送給傳輸消息隊(duì)列,這要求采集器與消息隊(duì)列的網(wǎng)絡(luò)能夠互通。智能運(yùn)維管理系統(tǒng)部署架構(gòu),如圖3所示。

當(dāng)前云計(jì)算IaaS平臺(tái)的部署,經(jīng)常將網(wǎng)絡(luò)劃分成不同的子網(wǎng),不同的子網(wǎng)傳輸不同的流量,既方便運(yùn)維管理,也方便租戶使用,既安全又互不干涉。

管理網(wǎng):適用于進(jìn)行運(yùn)維管理,傳輸運(yùn)行數(shù)據(jù)、管理數(shù)據(jù)。

業(yè)務(wù)網(wǎng):適用于業(yè)務(wù)系統(tǒng)的流量,適用于業(yè)務(wù)系統(tǒng)使用,比如OA系統(tǒng)等。

存儲(chǔ)網(wǎng):適用于部署了基于x86架構(gòu)的分布式存儲(chǔ)、虛擬存儲(chǔ)或者大數(shù)據(jù)存儲(chǔ)平臺(tái),需要獨(dú)立的存儲(chǔ)網(wǎng)絡(luò)支撐存儲(chǔ)流量。

SAN網(wǎng):用于采取集中存儲(chǔ)的數(shù)據(jù)存儲(chǔ)環(huán)境,此網(wǎng)絡(luò)屬于光纖網(wǎng)絡(luò),監(jiān)控系統(tǒng)不會(huì)接入到光纖網(wǎng)絡(luò)。

工控網(wǎng):使用于機(jī)房環(huán)境監(jiān)控。

如果網(wǎng)絡(luò)進(jìn)行了管理、業(yè)務(wù)子網(wǎng)的劃分,那么要求部署監(jiān)控系統(tǒng)采集器的服務(wù)器或者虛擬機(jī)具備至少3個(gè)網(wǎng)卡、3個(gè)網(wǎng)址,分別屬于不同的子網(wǎng)。

監(jiān)控系統(tǒng)實(shí)現(xiàn)了對機(jī)房環(huán)境、網(wǎng)絡(luò)設(shè)備、安全設(shè)備、服務(wù)器硬件、操作系統(tǒng)、中間件、數(shù)據(jù)庫、業(yè)務(wù)系統(tǒng)以及日志等數(shù)據(jù)的監(jiān)控,不同的監(jiān)控對象,監(jiān)控?cái)?shù)據(jù)需要在不同的網(wǎng)絡(luò)中獲取。應(yīng)用服務(wù)器采用雙機(jī)冗余,部署資源管理、策略管理、系統(tǒng)管理、告警模塊和報(bào)表模塊等管理模塊,部署消息隊(duì)列、緩存、數(shù)據(jù)解析分析、外部接口等基礎(chǔ)軟件模塊。

技術(shù)路徑

微服務(wù)架構(gòu)設(shè)計(jì)

隨著微服務(wù)等新興架構(gòu)的提出,在框架輕量解耦、需求敏捷響應(yīng)、結(jié)構(gòu)自動(dòng)演化、資源彈性伸縮等方面有了長足進(jìn)步,但也會(huì)帶來性能損耗、整體資源要求高以及運(yùn)維復(fù)雜等缺點(diǎn)。在數(shù)據(jù)中心智能運(yùn)維管理系統(tǒng)建設(shè)過程中,需要充分結(jié)合現(xiàn)有信息系統(tǒng)特點(diǎn)和現(xiàn)狀要求,考慮機(jī)動(dòng)環(huán)境快速構(gòu)建、服務(wù)運(yùn)行自動(dòng)擴(kuò)容等場景,借鑒并兼容微服務(wù)中基于容器技術(shù)的服務(wù)持續(xù)集成、動(dòng)態(tài)遷移、彈性擴(kuò)展及監(jiān)控治理等技術(shù),實(shí)現(xiàn)服務(wù)持續(xù)集成、部署遷移和監(jiān)控治理等能力,提供更精準(zhǔn)敏捷的信息服務(wù)能力。

基于跨平臺(tái)監(jiān)控管理功能的設(shè)計(jì)及應(yīng)用

隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、通信技術(shù)和安全技術(shù)的飛速發(fā)展以及經(jīng)濟(jì)全球化的加速,以網(wǎng)絡(luò)、主機(jī)、存儲(chǔ)、數(shù)據(jù)庫和中間件作為主要信息化組成部件來說,擁有著交換、傳輸數(shù)據(jù)等各種業(yè)務(wù)網(wǎng)絡(luò),其設(shè)備數(shù)量也非常龐大。運(yùn)行管理技術(shù)是業(yè)務(wù)系統(tǒng)正常、經(jīng)濟(jì)效益和安全運(yùn)行的重要保證。對于在復(fù)雜的多技術(shù)應(yīng)用的場景下,如何使監(jiān)控管理功能適配多種技術(shù),并且能夠運(yùn)行在多種技術(shù)平臺(tái),是必須要考慮的技術(shù)選擇問題?;诳缙脚_(tái)的監(jiān)控管理就是通過一個(gè)管理平臺(tái)對互連的多個(gè)不同專業(yè)的IT運(yùn)行環(huán)境進(jìn)行全面的集中管理,對所提供的業(yè)務(wù)進(jìn)行端到端的管理,實(shí)施跨專業(yè)的故障定位和故障排除。它具有以下要求:管理所有IT資源、將各個(gè)系統(tǒng)的告警和性能信息統(tǒng)一到一個(gè)平臺(tái)、實(shí)現(xiàn)故障的跨專業(yè)綜合分析以及使用統(tǒng)一的用戶界面(GUI),使網(wǎng)絡(luò)管理和維護(hù)人員簡便易學(xué)。

基于分布式架構(gòu)監(jiān)控管理功能的設(shè)計(jì)及應(yīng)用

分布式架構(gòu)設(shè)計(jì),天然就有多個(gè)節(jié)點(diǎn),很容易通過主備、冗余、哈希等手段實(shí)現(xiàn)計(jì)算和存儲(chǔ)冗余備份,從而實(shí)現(xiàn)高可用。當(dāng)然分布式架構(gòu)多個(gè)節(jié)點(diǎn)的設(shè)計(jì)也帶來了保持一致性和高可靠性上的巨大挑戰(zhàn),分布式系統(tǒng)的存儲(chǔ)往往會(huì)設(shè)計(jì)成多份冗余,并盡可能在機(jī)架、機(jī)房甚至城市維度將冗余的數(shù)據(jù)分散在多處,以保障系統(tǒng)的高可用和業(yè)務(wù)連續(xù)性。隨著分布式架構(gòu)等新興架構(gòu)的提出,在框架輕量解耦、需求敏捷響應(yīng)、結(jié)構(gòu)自動(dòng)演化、資源彈性伸縮等方面有了長足進(jìn)步??紤]提高系統(tǒng)高穩(wěn)定性及可連續(xù)性等業(yè)務(wù)使用場景,借鑒分布式架構(gòu)等技術(shù),采集層、分析處理器、應(yīng)用層、數(shù)據(jù)庫存儲(chǔ)層實(shí)現(xiàn)多節(jié)點(diǎn)集群實(shí)現(xiàn),實(shí)現(xiàn)服務(wù)高效穩(wěn)定運(yùn)行、可持續(xù)擴(kuò)展等能力。

基于有代理和無代理相結(jié)合的數(shù)據(jù)采集技術(shù)

有代理Agent監(jiān)控方式是國外一些大廠產(chǎn)品普遍采用的方式,作為整個(gè)管理系統(tǒng)的組成部分,Agent的主要功能是用來采集監(jiān)控的基礎(chǔ)數(shù)據(jù)。Agent監(jiān)控方式的最大問題就是需要在每個(gè)被監(jiān)控的系統(tǒng)終端安裝一個(gè)代理軟件,這樣整個(gè)系統(tǒng)的部署及維護(hù)難度較大。而且運(yùn)行在每個(gè)被監(jiān)控端的代理一旦出現(xiàn)問題,還需要登錄到系統(tǒng)上去維護(hù)。Agentless監(jiān)控方式,是指在被監(jiān)控應(yīng)用所在的主機(jī)上面,不安裝代理軟件采集相應(yīng)的信息,而是通過一些標(biāo)準(zhǔn)的協(xié)議,包括主機(jī)使用的SNMP,Telnet,SSH,WMI等,以及應(yīng)用使用的JMX,JDBC,ODBC等實(shí)現(xiàn)監(jiān)控。對比Agent的監(jiān)控方式,Agentless在易用性、可維護(hù)性和性能損耗上的優(yōu)勢明顯。同時(shí),數(shù)據(jù)采集是整個(gè)管理平臺(tái)的基礎(chǔ),負(fù)責(zé)采集平臺(tái)運(yùn)行需要的數(shù)據(jù),在被監(jiān)測對象上部署Agent的方式,可能對業(yè)務(wù)系統(tǒng)產(chǎn)生沖突帶來不安全因素。Agent監(jiān)控方式的優(yōu)勢包括在監(jiān)控資源端采集的數(shù)據(jù)經(jīng)過壓縮處理后傳輸給監(jiān)控服務(wù)器、對網(wǎng)絡(luò)帶寬占用比較低、支持二次開發(fā)等。鑒于Agentless和Agent的各自優(yōu)缺點(diǎn),綜合2種方式的特性,支持2種方式的監(jiān)控采集,盡量做到揚(yáng)長避短。

基于ITIL以服務(wù)為中心的運(yùn)維服務(wù)管理

ITIL即信息技術(shù)基礎(chǔ)架構(gòu)庫,主要適用于IT服務(wù)管理(ITSM),ITIL為IT服務(wù)管理實(shí)踐提供了一個(gè)客觀、嚴(yán)謹(jǐn)和可量化的標(biāo)準(zhǔn)與規(guī)范。結(jié)合業(yè)界運(yùn)維過程管理標(biāo)準(zhǔn),本系統(tǒng)以ITIL和ISO20000為信息化服務(wù)流程規(guī)范,統(tǒng)一制定信息化服務(wù)流程,并由運(yùn)維流程子系統(tǒng)進(jìn)行統(tǒng)一管理,對服務(wù)流程實(shí)行統(tǒng)一集中監(jiān)控,提供直觀、美觀且圖形化的監(jiān)控視圖,動(dòng)態(tài)實(shí)時(shí)反映各項(xiàng)服務(wù)流程的執(zhí)行情況和效率。通過規(guī)范化的流程梳理,定義完善的服務(wù)臺(tái)統(tǒng)一接入、服務(wù)請求和事件處理流程、以及其他信息化運(yùn)維必須的流程。系統(tǒng)提供豐富多樣的統(tǒng)計(jì)分析工具和圖表展示,以報(bào)表形式形成信息化運(yùn)維管理周報(bào)及月報(bào),用于分析和統(tǒng)計(jì)各項(xiàng)服務(wù)管理流程的執(zhí)行情況及效率,為不斷優(yōu)化服務(wù)流程、提高運(yùn)維服務(wù)效率和用戶滿意度提供依據(jù)。

基于自動(dòng)化技術(shù)的配置管理數(shù)據(jù)庫搜集維護(hù)過程管理

配置管理數(shù)據(jù)庫(Configuration Management Database,CMDB)存儲(chǔ)與IT架構(gòu)中設(shè)備的各種配置信息,它與所有服務(wù)支持和服務(wù)交付流程都緊密相聯(lián),支持這些流程的運(yùn)轉(zhuǎn)、發(fā)揮配置信息的價(jià)值,同時(shí)依賴于相關(guān)流程保證數(shù)據(jù)的準(zhǔn)確性。過程管理主要是完成資產(chǎn)和配置的數(shù)據(jù)增刪改查操作,微軟的.net架構(gòu)和J2EE架構(gòu)是比較成熟的2類技術(shù)。采用自動(dòng)化的技術(shù)對CMDB的配置信息進(jìn)行自動(dòng)維護(hù),可極大地降低人工維護(hù)的工作量、提高數(shù)據(jù)的準(zhǔn)確性,充分發(fā)揮CMDB在運(yùn)維中的基礎(chǔ)作用。本系統(tǒng)模塊的側(cè)重點(diǎn)在配置和管理系統(tǒng)的狀態(tài)上,無需安裝Agent,主機(jī)通過SSH協(xié)議與監(jiān)控對象進(jìn)行通信,從運(yùn)維成本和維護(hù)性上來說,只需關(guān)注主機(jī)的運(yùn)行狀態(tài),不會(huì)增加額外的運(yùn)維成本。由于在運(yùn)維服務(wù)管理選擇了J2EE技術(shù),因此本系統(tǒng)的基礎(chǔ)技術(shù)路線也選擇J2EE體系。保證底層技術(shù)的一致性。在CMDB數(shù)據(jù)的維護(hù)中,部分?jǐn)?shù)據(jù)采用人工和基于SSH協(xié)議的自動(dòng)化結(jié)合的方式進(jìn)行。

數(shù)據(jù)中心的智能運(yùn)維管理的實(shí)現(xiàn),不僅減少了傳統(tǒng)人工運(yùn)維管理下的時(shí)間延遲,將運(yùn)維管理人員從重復(fù)性工作中解放出來,提高了工作效率,而且,基于一體化運(yùn)維管理平臺(tái)的智能運(yùn)維管理系統(tǒng)還可以實(shí)現(xiàn)自我狀態(tài)監(jiān)控,對運(yùn)維管理中的各種風(fēng)險(xiǎn)進(jìn)行預(yù)估,減少因?yàn)橹悄苓\(yùn)風(fēng)險(xiǎn)導(dǎo)致的成本支出,在今后,特別是大型數(shù)據(jù)中心的運(yùn)維管理中,將發(fā)揮越來越重要的作用。但是對于基于數(shù)據(jù)中心運(yùn)行的業(yè)務(wù)系統(tǒng)的運(yùn)維管理,還需要針對不同業(yè)務(wù)系統(tǒng),開發(fā)定制具體功能模塊,這也是智能運(yùn)維管理系統(tǒng)的短板。

猜你喜歡
數(shù)據(jù)中心運(yùn)維管理系統(tǒng)
酒泉云計(jì)算大數(shù)據(jù)中心
基于James的院內(nèi)郵件管理系統(tǒng)的實(shí)現(xiàn)
運(yùn)維技術(shù)研發(fā)決策中ITSS運(yùn)維成熟度模型應(yīng)用初探
基于LED聯(lián)動(dòng)顯示的違停管理系統(tǒng)
風(fēng)電運(yùn)維困局
能源(2018年8期)2018-09-21 07:57:24
民航綠色云數(shù)據(jù)中心PUE控制
電子測試(2018年11期)2018-06-26 05:56:24
雜亂無章的光伏運(yùn)維 百億市場如何成長
能源(2017年11期)2017-12-13 08:12:25
海盾壓載水管理系統(tǒng)
中國船檢(2017年3期)2017-05-18 11:33:08
基于ITIL的運(yùn)維管理創(chuàng)新實(shí)踐淺析
基于云計(jì)算的交通運(yùn)輸數(shù)據(jù)中心實(shí)現(xiàn)與應(yīng)用
鄂伦春自治旗| 南充市| 福鼎市| 扎囊县| 偃师市| 普兰县| 信丰县| 邯郸市| 扶沟县| 翁牛特旗| 巧家县| 兴和县| 宁化县| 石屏县| 伽师县| 股票| 大洼县| 金门县| 辽阳县| 房山区| 碌曲县| 大方县| 英山县| 罗源县| 方山县| 景洪市| 兴化市| 武乡县| 年辖:市辖区| 秦皇岛市| 临沧市| 黎川县| 呈贡县| 睢宁县| 洛隆县| 灵璧县| 个旧市| 西吉县| 阿荣旗| 肥乡县| 岳普湖县|