余梁
IT部門都曾面臨這樣的經(jīng)歷:當(dāng)服務(wù)器、網(wǎng)絡(luò)或設(shè)備等出現(xiàn)問題時,必須盡快做出反應(yīng),找出原因,定位故障。而問題出在哪里,通常很難快速判斷,頻繁的宕機和故障,給IT部門帶來很大的運維壓力。監(jiān)控運維管理軟件的出現(xiàn),讓IT部門運維團隊得到救贖,開始告別如此忙亂的場景。
市面上的監(jiān)控運維軟件,更多的是幾百臺設(shè)備以內(nèi)的監(jiān)控范圍,幾分鐘一個頻次的輪詢,對性能的要求不是特別高。而現(xiàn)在,需要實際監(jiān)控的設(shè)備數(shù)量由原來的幾百臺,已經(jīng)增長到幾萬臺甚至幾十萬臺。那么,原來為幾百臺設(shè)備而設(shè)定的監(jiān)控軟件,已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足這個時代的要求?,F(xiàn)在市面上的監(jiān)控運維軟件,基本單臺監(jiān)控服務(wù)器能夠監(jiān)控到300臺設(shè)備,每個設(shè)備大概有10個監(jiān)測點,相當(dāng)于是3 000個監(jiān)測點范圍;如果超過這個范圍,監(jiān)控軟件本身就會不穩(wěn)定,即使增加服務(wù)器或內(nèi)存數(shù)量,也無法提高監(jiān)控系統(tǒng)的性能。
“監(jiān)控易”是美信科技的一體化集中監(jiān)控運維平臺,采用自研的調(diào)度技術(shù),可以把監(jiān)測點的顆粒度精確到秒級,最快輪詢頻率為5 s一次,監(jiān)測點數(shù)量能夠到達(dá)10萬+以上,保證監(jiān)測數(shù)據(jù)的實時性和精確性。當(dāng)企事業(yè)單位關(guān)鍵設(shè)備出現(xiàn)異常時,能在第一時間里發(fā)現(xiàn)問題,發(fā)出報警,為IT運維團隊解決問題贏得寶貴的時間。而市面上一些監(jiān)控運維軟件,監(jiān)測點數(shù)量和量級規(guī)模有限,監(jiān)測頻率在長時間運行以后最多可達(dá)到分鐘級,一般是2~5 min。從整體上看,監(jiān)控易整體性能較市面上的普通監(jiān)控軟件具有很強的競爭力。美信科技監(jiān)控易之所以可以達(dá)到如此超高性能,是因為依托于獨立自主研發(fā)高性能的數(shù)據(jù)庫。
海量監(jiān)控,輪詢采集的瓶頸在于數(shù)據(jù)庫寫入。市場上通用的結(jié)構(gòu)化數(shù)據(jù)庫(如Oracle,SQL Sever,MYSQL)的運維監(jiān)控軟件,采用的數(shù)據(jù)庫為通用型,為保證數(shù)據(jù)唯一性、一致性等,寫入效率會有所降低。而監(jiān)控輪詢是每個輪詢周期都要寫入所有設(shè)備的監(jiān)控指標(biāo)數(shù)據(jù),高頻率、大數(shù)據(jù)量的寫入,必然對數(shù)據(jù)庫有特殊要求,即對高寫入要求很高。美信科技監(jiān)控易使用自主研發(fā)的非結(jié)構(gòu)化(NoSQL)數(shù)據(jù)庫,該數(shù)據(jù)庫專門針對網(wǎng)管輪詢高頻寫入需求而設(shè)計,輪詢頻率可以從分鐘級縮短到秒級,最快輪詢頻率可達(dá)5 s。IT運維人員可以自定義不同監(jiān)測點的輪詢頻率。美信科技監(jiān)控易目前能達(dá)到的運維效果,是記錄行數(shù)達(dá)到百億級,響應(yīng)時間都為秒級。所以說,這是美信科技監(jiān)控易性能領(lǐng)先的關(guān)鍵組件。經(jīng)過十幾年的發(fā)展,美信科技監(jiān)控易以“超高性能”優(yōu)勢獲得政府、國防軍工、金融、醫(yī)療、科技、教育以及能源等領(lǐng)域的廣泛應(yīng)用和高度評價。
以監(jiān)控易解決某知名集團公司A曾面臨的監(jiān)控運維難題為例,業(yè)務(wù)地域分布廣泛化帶來的監(jiān)控系統(tǒng)水平和垂直擴展需求。
A公司在全國創(chuàng)建5個智慧園區(qū),并計劃未來建成30個智慧園區(qū)。每個園區(qū)有5~10棟樓,但只有1~2個運維人員,每個園區(qū)都有大量的網(wǎng)絡(luò)設(shè)備、服務(wù)器、閘機、儲物柜PAD、攝像頭以及車位檢測器等終端設(shè)備需要監(jiān)控。然而,隨著園區(qū)的建設(shè)和擴展,面臨著各園區(qū)設(shè)備設(shè)施缺乏統(tǒng)一監(jiān)控管理,要管理的設(shè)備多,運維人員少,運維系統(tǒng)可靠性差,靈活可擴展性等挑戰(zhàn)。
A公司面臨的監(jiān)控運維難題已經(jīng)是當(dāng)下眾多企業(yè)、機構(gòu)非常普遍的情況。隨著業(yè)務(wù)的規(guī)模擴展,IT系統(tǒng)建設(shè)不斷深入,分布區(qū)域越來越廣泛。企業(yè)的監(jiān)控對象由以前的一個地區(qū)的一個局域網(wǎng)、一個機房、物聯(lián)網(wǎng)設(shè)備擴展到全國多個省市、甚至擴展到全球其他國家和地區(qū)。因此,核心機房分布于多個地點,部署范圍廣、設(shè)備更加繁雜,對于大量的網(wǎng)絡(luò)設(shè)備、服務(wù)器、應(yīng)用系統(tǒng)以及物聯(lián)網(wǎng)設(shè)備等沒有統(tǒng)一的監(jiān)控平臺,不能制定統(tǒng)一的預(yù)警管理策略。同時缺少對整體業(yè)務(wù)系統(tǒng)的健康狀況以及運行趨勢的檢測,無法及時判斷業(yè)務(wù)系統(tǒng)是否存在運行瓶頸及潛在的風(fēng)險,集團總部管理者無法從全局角度做出準(zhǔn)確的決策。因此,按照集團化的管理要求,監(jiān)控系統(tǒng)需要實現(xiàn)對多個地區(qū)的IT及設(shè)備進(jìn)行集中監(jiān)控管理,并且能夠?qū)崿F(xiàn)靈活擴展,以迎接未來業(yè)務(wù)向更高一臺階邁進(jìn)。
那么,如何實現(xiàn)一套監(jiān)控系統(tǒng)能夠監(jiān)控多個地區(qū)的IT機房及設(shè)備,且能夠滿足水平及垂直的靈活擴展需求呢?美信科技監(jiān)控易支持分布式架構(gòu),消息中間件、Webserver、數(shù)據(jù)庫等全部為獨立自主研發(fā)、自主可控。采用中央調(diào)度單元和分布式任務(wù)采集器所組成的分布式的調(diào)度管理和采集架構(gòu)。
A公司在全國擁有總部、上海、深圳、成都等多個智慧園區(qū),傳統(tǒng)的監(jiān)控系統(tǒng)要實現(xiàn)全面監(jiān)控,就需要在每個園區(qū)各部署一套監(jiān)控系統(tǒng)。此種部署模式離散、成本高,且監(jiān)控不全面。更重要的是因為缺乏統(tǒng)一管理,每個園區(qū)出現(xiàn)什么問題,總部領(lǐng)導(dǎo)并不清楚,等到客戶投訴或是發(fā)生更大的事故,領(lǐng)導(dǎo)才會發(fā)現(xiàn)。
美信科技監(jiān)控易一體化集中監(jiān)控平臺解決了以上問題,采用分布式部署模式,只需要在總部部署一套軟件,就能同時將全國所有的園區(qū)全部監(jiān)控起來。隨著園區(qū)的不斷增加,監(jiān)控系統(tǒng)能夠靈活地擴展,不需要每次從頭再來一遍,不需要耗費更多的成本。部署完成后,總部領(lǐng)導(dǎo)每天都能看到每個園區(qū)的運行情況,各個園區(qū)的運維人員根據(jù)權(quán)限可以看到自己的園區(qū)運行情況,很好地完成了園區(qū)運維管理的任務(wù),整個運維效率提升了90 %。根據(jù)規(guī)劃,A公司的智慧園區(qū)將來如果擴到30個,那么監(jiān)控易可以無縫擴展,無需改變原來的管理制度,即可保證智慧園區(qū)實現(xiàn)非常良好的運行狀態(tài)。
作為美信科技旗下新一代監(jiān)控的強勢品牌,監(jiān)控易以一庫、一碼、四支柱,打造IT運維國產(chǎn)化時代的核心競爭力。一庫———美信科技自主開發(fā)的高性能時序數(shù)據(jù)庫,支持10萬+設(shè)備監(jiān)控,是同類監(jiān)控規(guī)模的數(shù)倍。一碼———低代碼平臺,讓自主開發(fā)像搭積木一樣簡單。四支柱———全國產(chǎn)核心組件全自主開發(fā),完全符合信創(chuàng)要求。高性能輕松監(jiān)測上萬臺設(shè)備,大幅降低部署成本。一體化IT、動環(huán)、物聯(lián)網(wǎng)全覆蓋,監(jiān)控、資產(chǎn)、工單、流程及CMDB全支持。多層級支持公有云、私有云、混合云,多安全域,部、省、市多級設(shè)備的集中式監(jiān)控管理。