郭 濤,于 瀛,欒美生,祖宏權(quán)
(1 哈爾濱工業(yè)大學(xué) 網(wǎng)絡(luò)與信息中心,哈爾濱 150001;2 哈爾濱工業(yè)大學(xué) 圖書館,哈爾濱 150001)
隨著教育信息化的逐步深入,信息系統(tǒng)已經(jīng)成為校園建設(shè)的重要基礎(chǔ)設(shè)施,數(shù)字化校園的基礎(chǔ)建設(shè)愈發(fā)重要,其全局性地位日益增強(qiáng),對(duì)業(yè)務(wù)系統(tǒng)的穩(wěn)定性、可靠性要求也越來越高[1]。因此必須強(qiáng)化信息化校園運(yùn)維的管理和技術(shù)手段的建設(shè),在重視校園網(wǎng)及網(wǎng)內(nèi)業(yè)務(wù)系統(tǒng)運(yùn)維管理的同時(shí),對(duì)校園網(wǎng)的運(yùn)行服務(wù)、保障平臺(tái)進(jìn)行徹底的改進(jìn)和完善,重構(gòu)部分關(guān)鍵設(shè)備的納管流程,形成校內(nèi)統(tǒng)一的運(yùn)維管理平臺(tái),使之能適應(yīng)不斷增長(zhǎng)變化的校園業(yè)務(wù)的需要[2-3]??旖莸貛椭鷮W(xué)??头藛T與技術(shù)人員處理業(yè)務(wù),提高用戶故障的處理效率和服務(wù)的滿意度。
校園網(wǎng)絡(luò)運(yùn)行監(jiān)控和服務(wù)保障體系已成為學(xué)校的核心業(yè)務(wù)流程。建設(shè)健全校園網(wǎng)監(jiān)控,完善服務(wù)規(guī)范,建立智能化的咨詢服務(wù)內(nèi)部管理平臺(tái),從而能夠隨時(shí)隨地為用戶提供不間斷的保障服務(wù)。建設(shè)網(wǎng)絡(luò)、服務(wù)器和應(yīng)用的綜合監(jiān)控管理平臺(tái),利用相關(guān)技術(shù)和工具,逐步實(shí)現(xiàn)精細(xì)化、可視化和集約化管理。建設(shè)統(tǒng)一的運(yùn)維管理體系可以對(duì)校園內(nèi)網(wǎng)絡(luò)、設(shè)備、數(shù)據(jù)庫、中間件及應(yīng)用系統(tǒng)等資源進(jìn)行全面監(jiān)控,有利于各部門對(duì)其負(fù)責(zé)的資源進(jìn)行管理[4]??梢詫?duì)日常運(yùn)行維護(hù)工作提供高效的管理框架,建立更好的部門間溝通平臺(tái)。資源納管的建設(shè)將大大簡(jiǎn)化運(yùn)維流程、提高運(yùn)維效率,同時(shí)可使得面向全校各級(jí)部門的信息化服務(wù)質(zhì)量和服務(wù)水平實(shí)現(xiàn)大幅度提升。綜上所述,為學(xué)校當(dāng)前亟需統(tǒng)一的運(yùn)維管理體系平臺(tái),運(yùn)維平臺(tái)資源納管系統(tǒng)提供規(guī)范化、透明化、智能化、互動(dòng)化服務(wù)能力[5]。
目前網(wǎng)絡(luò)中心運(yùn)維工作枯燥繁瑣,雖然運(yùn)維人員工作十分忙碌,但教職工經(jīng)常抱怨“找不到人”、“解決問題太慢”等。另外缺少運(yùn)維監(jiān)控管理平臺(tái),運(yùn)維人員每天的工作量難以得到體現(xiàn)和量化,很難體現(xiàn)運(yùn)維人員工作的價(jià)值和意義。
由于缺乏網(wǎng)絡(luò)資源管理平臺(tái),應(yīng)用系統(tǒng)一旦無法使用,運(yùn)維人員首先要做的工作就是對(duì)問題進(jìn)行定位和排查。但是應(yīng)用系統(tǒng)故障往往不僅僅單是數(shù)據(jù)中心的問題,還有很多時(shí)候,涉及到了網(wǎng)絡(luò)和應(yīng)用系統(tǒng)本身故障,因此故障及問題定位非??简?yàn)運(yùn)維人員的經(jīng)驗(yàn)和技術(shù)水平。而在問題解決的過程中,如果應(yīng)用涉及到多個(gè)系統(tǒng),不同的運(yùn)維人員相互之間推卸責(zé)任的情況不在少數(shù)。即使多個(gè)運(yùn)維人員一起解決問題,不同人員的溝通效率低下,問題的描述不清和分工委派復(fù)雜的難題依然存在。
現(xiàn)存網(wǎng)絡(luò)運(yùn)維管理平臺(tái)自動(dòng)智能化程度不夠,通過對(duì)新華三技術(shù)股份有限公司、銳捷股份有限公司以及北京廣通新達(dá)軟件有限公司等調(diào)研了解,目前,各公司實(shí)現(xiàn)的網(wǎng)絡(luò)運(yùn)維管理平臺(tái)自動(dòng)智能化程度均存在一定程度的不足,例如,現(xiàn)有功能無法實(shí)現(xiàn)交換機(jī)更換后的一鍵式配置信息恢復(fù);現(xiàn)有功能無法實(shí)現(xiàn)故障和故障解決方案的自動(dòng)關(guān)聯(lián)聯(lián)動(dòng)等等[6-7]。
資源管理平臺(tái)設(shè)計(jì)旨在為網(wǎng)絡(luò)運(yùn)維人員實(shí)時(shí)提供各種設(shè)備運(yùn)行狀況,分析報(bào)表以及便捷的設(shè)備管理。能夠?qū)χ髁鲝S商的網(wǎng)絡(luò)、系統(tǒng)、主機(jī)、存儲(chǔ)、應(yīng)用、虛擬化等設(shè)備進(jìn)行統(tǒng)一監(jiān)控管理。能夠?qū)υO(shè)備進(jìn)行資源統(tǒng)計(jì)和直觀的顯示設(shè)備的工作狀態(tài)。以便于對(duì)學(xué)校的業(yè)務(wù)系統(tǒng)和日常運(yùn)行情況進(jìn)行監(jiān)控管理。
目前高校網(wǎng)絡(luò)運(yùn)維平臺(tái)主要功能包括設(shè)備管理、信息安全管理、日常管理、業(yè)務(wù)管理等模塊,但對(duì)目前校園網(wǎng)系統(tǒng)來說,這幾個(gè)功能遠(yuǎn)遠(yuǎn)不夠。目前的平臺(tái)需要實(shí)現(xiàn)虛擬網(wǎng)絡(luò)管理、網(wǎng)絡(luò)應(yīng)用管理、無線管理、主機(jī)資源管理等功能,可以從各個(gè)方面對(duì)網(wǎng)絡(luò)設(shè)備進(jìn)行監(jiān)測(cè)和管理,內(nèi)容包括網(wǎng)絡(luò)設(shè)備的可用性、性能、流量管理和業(yè)務(wù)分析等。通過持續(xù)監(jiān)測(cè)、報(bào)告網(wǎng)絡(luò)的運(yùn)行情況,有助于實(shí)時(shí)發(fā)現(xiàn)異常并及時(shí)告警。
校園網(wǎng)絡(luò)設(shè)備眾多已經(jīng)成為普遍現(xiàn)象,校園的接入設(shè)備在千臺(tái)以上,這還不包含核心設(shè)備、安全設(shè)備、服務(wù)器、物聯(lián)網(wǎng)設(shè)備等。如此龐大的設(shè)備數(shù)量,對(duì)于運(yùn)維人員的日常運(yùn)行維護(hù)的確是個(gè)挑戰(zhàn),通過資源監(jiān)控平臺(tái)可將各個(gè)樓宇的設(shè)備全部納管,包含管井的設(shè)備等。一旦發(fā)現(xiàn)某臺(tái)設(shè)備出現(xiàn)異常,平臺(tái)自動(dòng)將告警推送至手機(jī)APP中,這樣就能夠第一時(shí)間獲知故障現(xiàn)象,避免被動(dòng)發(fā)現(xiàn),在摸不著頭腦的情況下去解決問題。
設(shè)備加入到監(jiān)控管理平臺(tái)之后,通過web頁面就能實(shí)時(shí)查看到設(shè)備的運(yùn)行數(shù)據(jù),以及歷史運(yùn)行數(shù)據(jù),但相同的設(shè)備在不同的環(huán)境下應(yīng)用,自身的負(fù)載情況也不近相同。根據(jù)每個(gè)設(shè)備自身的運(yùn)行數(shù)據(jù)規(guī)律,設(shè)定符合其實(shí)際的個(gè)性化的閾值,這樣一旦設(shè)備出現(xiàn)性能方面告警,就知道設(shè)備肯定遇到了問題,運(yùn)維人員及早介入,避免形成故障了,再去事后搶救。
學(xué)校核心設(shè)備接口連接的都是重要的匯聚交換機(jī)或應(yīng)用服務(wù)器,一旦接口出現(xiàn)問題,帶來的影響很大,如果發(fā)現(xiàn)不及時(shí),不能準(zhǔn)確定位問題,迅速恢復(fù)正常,其他職能部門的投訴將接踵而至,現(xiàn)在通過資源監(jiān)控管理平臺(tái)可實(shí)時(shí)監(jiān)控接口的狀態(tài)信息,一旦核心接口出現(xiàn)掉線,立即反應(yīng),及時(shí)應(yīng)對(duì),快速恢復(fù),避免影響重要的業(yè)務(wù)應(yīng)用。
網(wǎng)絡(luò)出口流量能直接反映整個(gè)網(wǎng)絡(luò)性能的好壞,學(xué)校的出口設(shè)備連接了中國(guó)移動(dòng)、聯(lián)通、教育網(wǎng)等多個(gè)出口,掌握出口流量的占用率,對(duì)學(xué)校網(wǎng)絡(luò)暢通運(yùn)行,高效運(yùn)行起著至關(guān)重要的作用。通過對(duì)出口流量的監(jiān)控,不僅能夠及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)瓶頸,還能幫助判斷網(wǎng)絡(luò)中是否存在故障或安全隱患,這樣才能更好地保障學(xué)校網(wǎng)絡(luò)正常、穩(wěn)定、高效地運(yùn)行。
日常運(yùn)維工作中,可以通過微信、企業(yè)微信、短信等方式收到資源管理平臺(tái)的故障告警通知。通過資源管理系統(tǒng)對(duì)設(shè)備故障原因進(jìn)行預(yù)判,還可生成故障處理的工單。設(shè)備變更,設(shè)備故障都需審批和處理,整個(gè)故障生成,問題處理過程都有留痕。
最底層是IT基礎(chǔ)設(shè)施層,即運(yùn)維平臺(tái)的被管對(duì)象,總體設(shè)計(jì)原則要支持管理網(wǎng)絡(luò)信息中心運(yùn)行管理的所有對(duì)象;通過分類將網(wǎng)絡(luò)設(shè)備、服務(wù)器、計(jì)算存儲(chǔ)資源、系統(tǒng)應(yīng)用軟件、中間件、虛擬化資源、機(jī)房動(dòng)力環(huán)境實(shí)現(xiàn)統(tǒng)一納管。其次是業(yè)務(wù)處理,包括數(shù)據(jù)采集和數(shù)據(jù)處理。
第二層是業(yè)務(wù)處理層,包括數(shù)據(jù)采集和數(shù)據(jù)處理。數(shù)據(jù)采集可以實(shí)現(xiàn)網(wǎng)絡(luò)監(jiān)控、系統(tǒng)監(jiān)控、機(jī)房環(huán)境監(jiān)控、性能監(jiān)控,告警事件、日志等數(shù)據(jù)的集中采集。數(shù)據(jù)處理是對(duì)所有IT基礎(chǔ)設(shè)施的監(jiān)控,從而掌握IT資源的配置狀況和設(shè)備的運(yùn)行狀態(tài)、性能參數(shù),在此基礎(chǔ)上可按照業(yè)務(wù)進(jìn)行建模。
在業(yè)務(wù)處理部分,包含了性能管理及分析、統(tǒng)一事件管理、業(yè)務(wù)可用性管理、資產(chǎn)配置管理、自動(dòng)化操作管理、大數(shù)據(jù)日志分析等功能??闪私鈽I(yè)務(wù)的整體運(yùn)行情況,進(jìn)行業(yè)務(wù)預(yù)警和快速發(fā)現(xiàn)IT系統(tǒng)的根源故障,并可與服務(wù)管理流程平臺(tái)集成,及時(shí)響應(yīng)和規(guī)范化地處理故障。實(shí)現(xiàn)故障的閉環(huán)管理。
第三層是業(yè)務(wù)展示層,提供了多種展示視圖和方式,為不同的用戶提供不同的管理視圖,包括領(lǐng)導(dǎo)視圖、運(yùn)維門戶、自服務(wù)門戶和大屏展示視圖等。這樣能便于了解學(xué)校校園網(wǎng)絡(luò)設(shè)備的整體運(yùn)行情況,及時(shí)進(jìn)行故障報(bào)警和快速發(fā)現(xiàn)告警的根源故障。平臺(tái)總體架構(gòu)如圖1所示。
圖1 資源管理平臺(tái)總體框架
資源對(duì)象包括:網(wǎng)絡(luò)設(shè)備、服務(wù)器、存儲(chǔ)、數(shù)據(jù)庫、應(yīng)用、虛擬化、動(dòng)力環(huán)境等資源。其目前可通過手動(dòng)添加設(shè)備或自動(dòng)搜索設(shè)備把資源對(duì)象進(jìn)行納管,實(shí)現(xiàn)統(tǒng)一的監(jiān)控和管理。
其中網(wǎng)絡(luò)設(shè)備可對(duì)路由器、交換機(jī)、防火墻、負(fù)載均衡、vpn、堡壘機(jī)等網(wǎng)絡(luò)設(shè)備全面納管。支持跨廣域網(wǎng)分布式部署拓?fù)湟妗?蓪⒏饕娴耐負(fù)渌阉鹘Y(jié)果上傳到中心進(jìn)行匯總,創(chuàng)建出一張完整的拓?fù)鋱D,實(shí)現(xiàn)統(tǒng)一展現(xiàn),如圖2所示。
圖2 資源納管
性能管理支持管理多種協(xié)議采集資源的運(yùn)行狀態(tài)和性能狀態(tài)指標(biāo),如通過SNMP、IPMI、SSH、SMI-S、TELMET、JDBC、Syslog等協(xié)議讀取設(shè)備數(shù)據(jù)。
支持學(xué)習(xí)設(shè)備性能指標(biāo)的歷史數(shù)據(jù)(默認(rèn)5周以上,動(dòng)態(tài)自學(xué)習(xí)計(jì)算出設(shè)備該性能指標(biāo)的最佳閾值,當(dāng)性能指標(biāo)偏離于學(xué)習(xí)到的最佳閾值時(shí),平臺(tái)產(chǎn)生性能告警通知運(yùn)維人員)。
目前資源管理平臺(tái)在設(shè)備出現(xiàn)問題時(shí),告警方式支持多種提醒,如告警實(shí)時(shí)提醒告警板、告警提示音后續(xù)可擴(kuò)容、微信告警、APP告警,支持與學(xué)?,F(xiàn)有統(tǒng)一通信平臺(tái)進(jìn)行對(duì)接;平臺(tái)支持靈活定制告警級(jí)別,并支持自動(dòng)升級(jí)持續(xù)出現(xiàn)、重復(fù)發(fā)生以及超過規(guī)定處理時(shí)間仍未解決的告警;支持重復(fù)告警過濾,支持告警轉(zhuǎn)儲(chǔ)功能,提供告警信息的自動(dòng)轉(zhuǎn)儲(chǔ)功能,滿足轉(zhuǎn)儲(chǔ)條件的告警信息會(huì)被系統(tǒng)備份成文件后存儲(chǔ)到指定目錄下,并把轉(zhuǎn)儲(chǔ)的數(shù)據(jù)從系統(tǒng)中刪除。
打開資源管理模塊,就可直接看到網(wǎng)絡(luò)設(shè)備的運(yùn)行情況,以不同顏色顯示設(shè)備的緊急、重要、次要告警狀態(tài)。也可通過點(diǎn)擊功能模塊按鈕直接進(jìn)入到具體的詳情展示頁,方便網(wǎng)管對(duì)關(guān)鍵設(shè)備數(shù)據(jù)進(jìn)行實(shí)時(shí)監(jiān)控,歷史性進(jìn)行追溯。并可查看設(shè)備當(dāng)前告警列表;告警信息:顯示全局最新告警信息模塊、告警信息列表;待辦工單顯示待辦工單模塊、待辦工單列表,用戶可根據(jù)工單緊急程度進(jìn)行工單處理操作,基于任務(wù)的性能監(jiān)控,可以定制監(jiān)控任務(wù),也可長(zhǎng)期監(jiān)控被納管對(duì)象的詳細(xì)性能情況,按日?qǐng)?bào)、周報(bào)、月報(bào)等報(bào)表呈現(xiàn)便于工程師進(jìn)行周期性數(shù)據(jù)分析。
資源管理平臺(tái)需要采用B/S架構(gòu),便于通過web頁面進(jìn)行訪問,整體的架構(gòu)是分布式的,支持系統(tǒng)安裝、卸載、數(shù)據(jù)同步備份、數(shù)據(jù)恢復(fù)的可視化界面管理。支持各業(yè)務(wù)在首頁portal展示,每個(gè)widget具有折疊、還原、最大化、拖拉、關(guān)閉、新窗口打開等功能;系統(tǒng)支持6 000以上節(jié)點(diǎn)的數(shù)據(jù)采集要求;對(duì)現(xiàn)有網(wǎng)絡(luò)服務(wù)的數(shù)據(jù)進(jìn)行業(yè)務(wù)維度的資源管理,資源管理平臺(tái)的CMDB模塊在靜態(tài)資源維度進(jìn)行管控。
數(shù)據(jù)庫使用Microsoft SQL Server,支持部署到Windows、Linux平臺(tái),管理平臺(tái)功能設(shè)計(jì)中,采用模塊化的設(shè)計(jì)理念,將視圖、資源納管、網(wǎng)絡(luò)監(jiān)控、無線監(jiān)控、服務(wù)器監(jiān)控、應(yīng)用監(jiān)控等功能設(shè)計(jì)進(jìn)行分類納管和呈現(xiàn)[8]。
視圖分為自定義視圖、位置視圖和接口視圖,創(chuàng)建視圖后自動(dòng)生成拓?fù)洹F脚_(tái)具有多種類型的拓?fù)?,提供傳統(tǒng)的基于IP網(wǎng)絡(luò)的IP拓?fù)洹⒍油負(fù)浜袜従油負(fù)?。用戶可以根?jù)實(shí)際組網(wǎng)情況,自由定義自己關(guān)注的網(wǎng)絡(luò)拓?fù)湟晥D(自定義拓?fù)?。自定義視圖設(shè)計(jì),如圖3所示。
圖3 自定義視圖
對(duì)網(wǎng)絡(luò)設(shè)備的監(jiān)測(cè)是根據(jù)ping、snmp、ssh等協(xié)議進(jìn)行監(jiān)控,通過ping協(xié)議探測(cè)設(shè)備在線后,再通過snmp或ssh讀取設(shè)備的性能數(shù)據(jù),包括設(shè)備的在線狀態(tài)和運(yùn)行狀態(tài),以及設(shè)備的CPU、內(nèi)存、端口狀態(tài)、接口流量、接口發(fā)送速率、接口接收速率、丟包數(shù)、錯(cuò)包數(shù)等數(shù)據(jù),并將數(shù)據(jù)進(jìn)行存儲(chǔ)以備查閱。當(dāng)前校園網(wǎng)是有線、無線網(wǎng)絡(luò)同步覆蓋,通過將校園網(wǎng)有線、無線的網(wǎng)關(guān)都統(tǒng)一接在核心設(shè)備上。實(shí)現(xiàn)有線無線集中監(jiān)測(cè),統(tǒng)一監(jiān)控,及時(shí)發(fā)現(xiàn)故障,有效避免設(shè)備故障發(fā)現(xiàn)的響應(yīng)時(shí)間,網(wǎng)絡(luò)運(yùn)行穩(wěn)定率上升,保障網(wǎng)絡(luò)高可用性。
支持的網(wǎng)絡(luò)設(shè)備包括:路由器、交換機(jī)、防火墻、負(fù)載均衡、堡壘機(jī)、網(wǎng)閘、流量控制等,如圖4所示。
圖4 網(wǎng)絡(luò)設(shè)備監(jiān)測(cè)
需要支持對(duì)主流廠商服務(wù)器的全面監(jiān)控,可通過IPMI的方式對(duì)服務(wù)器的電源、硬盤、風(fēng)扇、主板進(jìn)行監(jiān)控,同時(shí)支持多種主機(jī)操作系統(tǒng)的監(jiān)控管理,提供業(yè)務(wù)主機(jī)整體負(fù)載情況的監(jiān)測(cè),包括CPU負(fù)載,內(nèi)存與虛擬內(nèi)存利用率,主機(jī)網(wǎng)絡(luò)會(huì)話數(shù)量、源與目的及流量,各個(gè)物理網(wǎng)絡(luò)接口流量,設(shè)備連續(xù)運(yùn)行時(shí)間等信息;并支持對(duì)業(yè)務(wù)主機(jī)各文件系統(tǒng)的磁盤空間大小、利用率、剩余空間,磁盤增長(zhǎng)率的監(jiān)測(cè);能實(shí)現(xiàn)主機(jī)上關(guān)鍵進(jìn)程的運(yùn)行狀況及其對(duì)CPU和內(nèi)存占用情況的管理等。
可實(shí)現(xiàn)主機(jī)一體化顯示,按照不同的操作系統(tǒng)進(jìn)行數(shù)據(jù)分類,系統(tǒng)將提供基礎(chǔ)信息、運(yùn)行信息、進(jìn)程管理、事件與告警、服務(wù)器硬件信息等各類管理信息的監(jiān)控和展示,如圖5所示。
圖5 服務(wù)器監(jiān)測(cè)
支持監(jiān)控的操作系統(tǒng):
Windows系統(tǒng)包括:各版本的Windows Server。
Unix系統(tǒng)包括:AIX、FreeBSD、OpenBSD、Solaris、Mac OS、HP-UX。
Linux系統(tǒng)包括:各種版本的Linux,支持國(guó)產(chǎn)麒麟操作系統(tǒng)。
應(yīng)用監(jiān)控需要對(duì)數(shù)據(jù)庫、中間件、常用標(biāo)準(zhǔn)協(xié)議等進(jìn)行監(jiān)控。其中根據(jù)學(xué)校實(shí)際IT環(huán)境,平臺(tái)需要支持對(duì)ORACLE、SQL Server、Informix等主流數(shù)據(jù)庫的監(jiān)控管理。支持監(jiān)測(cè)連接數(shù)是否過大、讀緩存命中率是否過低、寫緩存命中率是否過低、死鎖數(shù)量是否過大、回滾數(shù)是否過高等異常狀態(tài)。支持監(jiān)測(cè)表空間和數(shù)據(jù)文件的大小、狀態(tài)和使用率。
中間件監(jiān)控:根據(jù)實(shí)際IT環(huán)境,平臺(tái)要對(duì)J2EE(WebSphere、Weblogic、TOMCAT)、JBOSS、Tuxedo、Apache、Resin、IIS、Apache、Exchange、Domino等中間件實(shí)現(xiàn)監(jiān)控,如圖6所示。
圖6 應(yīng)用監(jiān)控可視化
對(duì)于一線工程師日常維護(hù)來說,故障發(fā)生是突發(fā)情況,而掌握設(shè)備運(yùn)行的關(guān)鍵狀態(tài)又是常態(tài)管理,為了滿足工程師對(duì)于所負(fù)責(zé)區(qū)域重點(diǎn)設(shè)備的狀態(tài)監(jiān)控,系統(tǒng)需要有自定義首頁功能,該功能提供基于角色的個(gè)性功能展示,不同的用戶可以自行選擇不同管理指標(biāo)以及展現(xiàn)方式,將自身重點(diǎn)關(guān)注的設(shè)備運(yùn)行情況放在首頁展示,做到重點(diǎn)實(shí)時(shí)掌握。
網(wǎng)絡(luò)資源管理平臺(tái)的測(cè)試環(huán)境:
硬件環(huán)境:資源監(jiān)控管理平臺(tái)運(yùn)行在服務(wù)器虛擬化的VMware虛擬機(jī)中,IP地址為10.160.10.22、10.160.10.24.
軟件環(huán)境:操作系統(tǒng) Windows Server 2012標(biāo)準(zhǔn)版,CPU在8核以上,128G內(nèi)存。數(shù)據(jù)庫使用SQL server 2012。瀏覽器:Google Chromee、Firefox、360極速版。
網(wǎng)絡(luò)環(huán)境:使用的是校園內(nèi)網(wǎng)環(huán)境,千兆局域網(wǎng),確保安全性能,降低使用風(fēng)險(xiǎn)。
運(yùn)行環(huán)境:給網(wǎng)絡(luò)設(shè)備劃分管理IP和管理VLAN并開通SNMP協(xié)議,統(tǒng)一配置只讀團(tuán)體名稱。通過資源監(jiān)控管理平臺(tái)自動(dòng)搜索、自動(dòng)納管、自動(dòng)采集。
測(cè)試結(jié)果:從系統(tǒng)試運(yùn)行情況來看,平臺(tái)滿足設(shè)備數(shù)據(jù)采集,包含設(shè)備cpu、mem、接口流量等性能數(shù)據(jù),端口實(shí)時(shí)up/down狀態(tài)、設(shè)備離線立即告警,及時(shí)通知。
總體滿足設(shè)計(jì)要求,系統(tǒng)運(yùn)行穩(wěn)定。
通過資源管理平臺(tái)設(shè)計(jì),目前已大幅提高了各類日常運(yùn)維的可視化程度、量化運(yùn)行質(zhì)量,提高IT系統(tǒng)運(yùn)行效率,為業(yè)務(wù)穩(wěn)定、高效、安全、不間斷運(yùn)行提供保障。為學(xué)校提供運(yùn)維支持、建立標(biāo)準(zhǔn)化的運(yùn)維機(jī)制,提升運(yùn)維中心的IT服務(wù)質(zhì)量和運(yùn)維管理水平。將網(wǎng)絡(luò)設(shè)備、無線設(shè)備、服務(wù)器、存儲(chǔ)、虛擬化、應(yīng)用、含數(shù)據(jù)庫,中間件等進(jìn)行分類納管統(tǒng)計(jì)和呈現(xiàn)?,F(xiàn)已實(shí)現(xiàn)以下功能:
(1)資源管理包含對(duì)所有納管設(shè)備的分類統(tǒng)計(jì),并顯示設(shè)備運(yùn)行狀態(tài)概覽。
(2)以視圖的形式呈現(xiàn)核心設(shè)備鏈路出口的收發(fā)速率及帶寬占用率。
(3)實(shí)時(shí)采集平臺(tái)納管設(shè)備的trap信息,過濾重復(fù)trap的同時(shí),比對(duì)閾值,超出標(biāo)準(zhǔn)值立即觸發(fā)告警通知。
(4)監(jiān)控大屏輪播展現(xiàn)3個(gè)校區(qū)的樓宇地圖,當(dāng)樓宇內(nèi)設(shè)備出現(xiàn)告警,所對(duì)應(yīng)樓宇開始閃爍,點(diǎn)擊樓宇亦可看到告警設(shè)備數(shù)量,再點(diǎn)擊對(duì)應(yīng)數(shù)值,可下鉆查看告警詳情頁面。
(5)采集到的告警信息,會(huì)同步推送到手機(jī)APP中,運(yùn)維人員能夠通過手機(jī)實(shí)時(shí)掌握設(shè)備的運(yùn)行狀態(tài)和告警消息,發(fā)現(xiàn)異常指標(biāo),及時(shí)響應(yīng),使設(shè)備快速恢復(fù)正常運(yùn)行狀態(tài)。
系統(tǒng)管理員通過監(jiān)測(cè)平臺(tái),查看系統(tǒng)所監(jiān)測(cè)的性能指標(biāo)/關(guān)鍵業(yè)務(wù),查看未恢復(fù)的告警統(tǒng)計(jì),查看設(shè)備中斷持續(xù)時(shí)間、重復(fù)次數(shù)及分析斷網(wǎng)原因,為了滿足工程師對(duì)于自身所關(guān)注的納管對(duì)象監(jiān)控要求,系統(tǒng)提供了自定義功能,該功能提供基于角色的個(gè)性展示功能,用戶可以自行選擇不同管理重點(diǎn)指標(biāo)以及展現(xiàn)方式,以便完成一圖呈現(xiàn)所有重點(diǎn)監(jiān)控;通過網(wǎng)絡(luò)拓?fù)鋱D,可以打開設(shè)備的面板,設(shè)備面板和真實(shí)面板相似,并通過端口形狀能夠辨別端口是光口還是電口,同時(shí)通過顏色能夠辨別端口是關(guān)閉、休眠、開啟3種狀態(tài)。
對(duì)當(dāng)前網(wǎng)絡(luò)線路的流量、帶寬占用比等信息進(jìn)行排名查看,并可進(jìn)一步查看指定線路的性能負(fù)載歷史記錄??杉皶r(shí)了解當(dāng)前負(fù)載較高的線路,在問題苗頭出現(xiàn)的時(shí)候,及時(shí)進(jìn)行處置,保障網(wǎng)絡(luò)不間斷的平穩(wěn)運(yùn)行。
網(wǎng)絡(luò)資源管理平臺(tái)的建設(shè)將帶動(dòng)網(wǎng)絡(luò)中心建立科學(xué)合理的運(yùn)維管理體系,應(yīng)用先進(jìn)、實(shí)用、高效的運(yùn)維管理工具和手段,由被動(dòng)管理向主動(dòng)管理轉(zhuǎn)變。大幅提高資源監(jiān)控系統(tǒng)日常運(yùn)維的可視化程度、量化運(yùn)行質(zhì)量,提高IT系統(tǒng)運(yùn)行效率,為業(yè)務(wù)穩(wěn)定、高效、安全、不間斷運(yùn)行提供保障。