摘要:為適應(yīng)數(shù)字化時(shí)代對(duì)企業(yè)網(wǎng)絡(luò)基礎(chǔ)設(shè)施運(yùn)維的新要求,探討了基于多源異構(gòu)數(shù)據(jù)的IT智能運(yùn)維體系的構(gòu)建與應(yīng)用,深度梳理了當(dāng)前企業(yè)IT基礎(chǔ)設(shè)施運(yùn)維的現(xiàn)狀和需求,據(jù)此提出了一個(gè)整合數(shù)據(jù)采集、分析、監(jiān)控、自動(dòng)化操作和安全管理等功能的智能運(yùn)維解決方案。結(jié)果表明:采用該智能運(yùn)維體系能夠顯著提升網(wǎng)絡(luò)運(yùn)維的效率和安全性、實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)設(shè)備和服務(wù)狀態(tài)的全面監(jiān)控,有效預(yù)防和響應(yīng)網(wǎng)絡(luò)安全威脅,支撐企業(yè)的數(shù)字化轉(zhuǎn)型。
關(guān)鍵詞:多源異構(gòu)數(shù)據(jù)智能運(yùn)維體系IT企業(yè)監(jiān)控系統(tǒng)
ResearchontheConstructionandApplicationofITIntelligentOperationandMaintenanceSystemBasedonMulti-SourceHeterogeneousData
LUKangyan
ZhanjiangBranch,CNOOCInformationTechnologyLtd.,Zhanjiang,GuangdongProvince,524057China
Abstract:Inordertomeetthenewrequirementsofenterprisenetworkinfrastructureoperationandmaintenanceinthedigitalage,thispaperdiscussestheconstructionandapplicationofITintelligentoperationandmaintenancesystembasedonmulti-sourceheterogeneousdata,deeplysortsoutthecurrentstatusandneedsofenterpriseITinfrastructureoperationandmaintenance,andproposesanintelligentoperationandmaintenancesolutionthatintegratesthefunctionsofdatacollection,analysis,monitoring,automationandsecuritymanagement.Theresultsshowthattheintelligentoperationandmaintenancesystemcansignificantlyimprovetheefficiencyandsecurityofnetworkoperationandmaintenance,achievethecomprehensivemonitoringofnetworkequipmentandservicestatus,effectivelypreventandrespondtonetworksecuritythreats,andsupportthedigitaltransformationofenterprises.
KeyWords:Multi-sourceheterogeneousdata;Intelligentoperationandmaintenancesystem;ITenterprises;Monitoringsystem
隨著數(shù)字化轉(zhuǎn)型加速,企業(yè)對(duì)計(jì)算機(jī)網(wǎng)絡(luò)基礎(chǔ)設(shè)施依賴增強(qiáng)。全球數(shù)據(jù)流量未來(lái)五年將增長(zhǎng)五倍,網(wǎng)絡(luò)安全事件頻發(fā),對(duì)網(wǎng)絡(luò)穩(wěn)定和安全性需求提高。智能化網(wǎng)絡(luò)運(yùn)維(ArtificialIntelligenceforITOperations,AIOps)技術(shù)依托云計(jì)算、大數(shù)據(jù)分析、人工智能(ArtificialIntelligence,AI)和機(jī)器學(xué)習(xí)(MachineLearning,ML)成為保障網(wǎng)絡(luò)運(yùn)行效率和安全的關(guān)鍵,實(shí)現(xiàn)網(wǎng)絡(luò)基礎(chǔ)設(shè)施的自動(dòng)化監(jiān)控、管理和優(yōu)化[1]。雖然,領(lǐng)先的IT企業(yè)和金融機(jī)構(gòu)已部署智能化NetOps解決方案,應(yīng)對(duì)網(wǎng)絡(luò)擴(kuò)張,但許多企業(yè)在實(shí)施中遇到運(yùn)維平臺(tái)缺失、子系統(tǒng)集成度低、運(yùn)維數(shù)據(jù)孤島等問(wèn)題,降低了運(yùn)維效率,增加了網(wǎng)絡(luò)運(yùn)行風(fēng)險(xiǎn)[2]。面對(duì)網(wǎng)絡(luò)安全形勢(shì)的挑戰(zhàn),迫切需要通過(guò)技術(shù)創(chuàng)新和系統(tǒng)整合構(gòu)建高效、安全和可靠的網(wǎng)絡(luò)智能運(yùn)維解決方案,為企業(yè)數(shù)字化轉(zhuǎn)型成功帶來(lái)希望。
1智能運(yùn)維的關(guān)鍵技術(shù)
如下表1所示,智能運(yùn)維實(shí)施需關(guān)注綜合監(jiān)測(cè)技術(shù)、數(shù)據(jù)分析與可視化技術(shù)、智能決策支持技術(shù)、自動(dòng)化運(yùn)維工具、運(yùn)維流程優(yōu)化技術(shù)和安全防護(hù)與響應(yīng)技術(shù)。
2系統(tǒng)架構(gòu)設(shè)計(jì)
2.1總體藍(lán)圖
基于云技術(shù)的計(jì)算機(jī)網(wǎng)絡(luò)智能運(yùn)維系統(tǒng),以數(shù)據(jù)為核心生產(chǎn)要素,構(gòu)建了一個(gè)全面的架構(gòu)體系。該系統(tǒng)采用“1+N”模式,目標(biāo)涵蓋網(wǎng)絡(luò)運(yùn)營(yíng)管理、生產(chǎn)組織及設(shè)備維護(hù)的現(xiàn)代化轉(zhuǎn)型[3],以維修業(yè)務(wù)策劃、用戶需求分析和生產(chǎn)組織優(yōu)化等設(shè)計(jì)策略實(shí)現(xiàn)了資源的高效配置和利用。
2.1.1智能云主線
整合企業(yè)內(nèi)外的網(wǎng)絡(luò)資源,構(gòu)建統(tǒng)一的云平臺(tái),依托云計(jì)算技術(shù)這一核心,推動(dòng)大數(shù)據(jù)和人工智能技術(shù)的應(yīng)用。利用云計(jì)算和邊緣計(jì)算的先進(jìn)技術(shù),提供集中的計(jì)算和數(shù)據(jù)分析能力,支持大規(guī)模網(wǎng)絡(luò)設(shè)備監(jiān)測(cè)、數(shù)據(jù)分析和智能化監(jiān)控。依托大數(shù)據(jù)技術(shù),優(yōu)化網(wǎng)絡(luò)安全運(yùn)維和信息化服務(wù),使服務(wù)的專業(yè)性和定制化增強(qiáng)。
2.1.2業(yè)務(wù)板塊創(chuàng)新
針對(duì)計(jì)算機(jī)網(wǎng)絡(luò)的管理、運(yùn)營(yíng)和服務(wù)需求,實(shí)施全生命周期的管理策略,構(gòu)建全方位服務(wù)體系[4]。創(chuàng)新形成了包括智能監(jiān)控、自動(dòng)化操作、安全防護(hù)、故障診斷、管理決策、工具集成、信息展示等多個(gè)關(guān)鍵業(yè)務(wù)領(lǐng)域,在新一代信息技術(shù)的支持下,深入探索計(jì)算機(jī)網(wǎng)絡(luò)智能運(yùn)維技術(shù)的應(yīng)用,加強(qiáng)技術(shù)和業(yè)務(wù)的融合發(fā)展。
2.1.3全面安全策略
構(gòu)建了全面的網(wǎng)絡(luò)信息安全策略,考慮到網(wǎng)絡(luò)的多層安全需求,實(shí)現(xiàn)智能運(yùn)維系統(tǒng)的安全保護(hù),建立完善的技術(shù)標(biāo)準(zhǔn)和設(shè)備狀態(tài)評(píng)估體系,推動(dòng)計(jì)算機(jī)網(wǎng)絡(luò)智能運(yùn)維的全面進(jìn)步,最大限度地發(fā)揮智能運(yùn)維在網(wǎng)絡(luò)安全管理中的核心作用。
2.1.4綜合能力構(gòu)建
在智能運(yùn)維的戰(zhàn)略指引和總體目標(biāo)下,目標(biāo)鎖定于構(gòu)建智能化和數(shù)字化驅(qū)動(dòng)的核心運(yùn)維能力,實(shí)現(xiàn)服務(wù)全覆蓋、流程優(yōu)化和信息共享。
2.1.5智能運(yùn)維設(shè)備配置
配置了服務(wù)器、路由器、交換機(jī)及其在線監(jiān)控設(shè)備、智能分析系統(tǒng)、安全防護(hù)工具等多套智能運(yùn)維工具和設(shè)備,為實(shí)現(xiàn)網(wǎng)絡(luò)的自動(dòng)化和智能化運(yùn)維提供硬件基礎(chǔ)。
2.2系統(tǒng)架構(gòu)
在架構(gòu)設(shè)計(jì)上,計(jì)算機(jī)網(wǎng)絡(luò)智能運(yùn)維系統(tǒng)采用了層次化和分布式架構(gòu),包含基礎(chǔ)設(shè)施與接入層(涵蓋數(shù)據(jù)采集、網(wǎng)絡(luò)連接和基礎(chǔ)設(shè)施管理)、平臺(tái)層和應(yīng)用展示層。該系統(tǒng)能夠與網(wǎng)絡(luò)監(jiān)控系統(tǒng)、環(huán)境及安全監(jiān)控系統(tǒng)、自動(dòng)化響應(yīng)系統(tǒng)、時(shí)間同步系統(tǒng)等進(jìn)行數(shù)據(jù)接口交換,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)設(shè)備狀態(tài)的實(shí)時(shí)監(jiān)測(cè)、智能故障診斷和預(yù)警及設(shè)備健康狀態(tài)管理,構(gòu)建完善的知識(shí)庫(kù)以支持故障應(yīng)急指揮。
在計(jì)算機(jī)網(wǎng)絡(luò)智能運(yùn)維系統(tǒng)中,基礎(chǔ)設(shè)施與接入層主要負(fù)責(zé)數(shù)據(jù)采集,包括服務(wù)器和網(wǎng)絡(luò)設(shè)備的狀態(tài)、故障記錄、操作日志、安全警報(bào)、配置管理、用戶活動(dòng)追蹤、運(yùn)維進(jìn)程監(jiān)控、性能評(píng)估、環(huán)境監(jiān)測(cè)等。該層的設(shè)計(jì)使數(shù)據(jù)能夠從各個(gè)感知點(diǎn)無(wú)縫匯聚并融合,克服了信息孤島的問(wèn)題,滿足了復(fù)雜的數(shù)據(jù)處理和應(yīng)用需求[5]。網(wǎng)絡(luò)構(gòu)建方面,該層支持站點(diǎn)間及站點(diǎn)到數(shù)據(jù)中心級(jí)別的有效連接,為數(shù)據(jù)傳輸和通信提供骨干網(wǎng)絡(luò),并實(shí)現(xiàn)不同網(wǎng)絡(luò)層次間的無(wú)縫集成。
平臺(tái)層負(fù)責(zé)處理從基礎(chǔ)設(shè)施與接入層獲取的信息,并執(zhí)行存儲(chǔ)、分析和計(jì)算任務(wù)。該層需要建立標(biāo)準(zhǔn)化的設(shè)備管理和健康評(píng)價(jià)指標(biāo)體系,并能根據(jù)數(shù)據(jù)性質(zhì)和應(yīng)用需求靈活選擇存儲(chǔ)解決方案,優(yōu)化運(yùn)維數(shù)據(jù)的集成利用。利用數(shù)據(jù)挖掘技術(shù),該層可以累積豐富的運(yùn)維知識(shí)庫(kù),支持基于人工智能的數(shù)據(jù)分析,為智能化決策提供必要的支持,從而以高效和精準(zhǔn)的方式提供操作和管理的智能輔助。
應(yīng)用及展示層為運(yùn)維人員、管理層和維護(hù)團(tuán)隊(duì)提供交互界面。這一層分為決策、管理、業(yè)務(wù)和接口4個(gè)子層。在決策子層,主要關(guān)注網(wǎng)絡(luò)系統(tǒng)運(yùn)維的長(zhǎng)期戰(zhàn)略、績(jī)效和成本管理;管理子層側(cè)重于檢修、維護(hù)流程和成本控制策略的制定與執(zhí)行;業(yè)務(wù)子層依靠大數(shù)據(jù)分析執(zhí)行網(wǎng)絡(luò)設(shè)備的實(shí)時(shí)監(jiān)控、異常檢測(cè)、趨勢(shì)分析和可靠性評(píng)估;接口子層則確保系統(tǒng)與其他監(jiān)控、安全、自動(dòng)化響應(yīng)等應(yīng)用的數(shù)據(jù)和資源整合,促進(jìn)跨領(lǐng)域的信息交流和協(xié)作,進(jìn)一步提升網(wǎng)絡(luò)智能運(yùn)維的效率和效果。
3系統(tǒng)功能
基于計(jì)算機(jī)網(wǎng)絡(luò)智能運(yùn)維系統(tǒng)的功能需求分析,該系統(tǒng)能夠?qū)崿F(xiàn)下表2中展示的核心功能。
3.1自動(dòng)化監(jiān)控檢測(cè)
利用高級(jí)監(jiān)控技術(shù),如自動(dòng)化巡檢腳本和網(wǎng)絡(luò)性能監(jiān)控工具,實(shí)時(shí)監(jiān)控關(guān)鍵網(wǎng)絡(luò)設(shè)備和服務(wù)的運(yùn)行狀態(tài)。系統(tǒng)支持自定義監(jiān)控規(guī)則,以實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)流量、服務(wù)器負(fù)載、應(yīng)用響應(yīng)時(shí)間等關(guān)鍵性能指標(biāo)的自動(dòng)追蹤和檢測(cè),及時(shí)發(fā)送告警信息,確保網(wǎng)絡(luò)環(huán)境的全面自動(dòng)化監(jiān)控。
3.2操作智能化
集成了基于AI的自動(dòng)化運(yùn)維工具,能夠支持遠(yuǎn)程自動(dòng)化執(zhí)行配置更改、軟件部署、故障恢復(fù)等操作。借助先進(jìn)的機(jī)器學(xué)習(xí)算法,系統(tǒng)可以自動(dòng)識(shí)別和執(zhí)行最優(yōu)操作流程,實(shí)現(xiàn)高度精確的操作執(zhí)行和快速問(wèn)題解決。
3.3安全智能化
融合了最新的網(wǎng)絡(luò)安全管理技術(shù)和工具,包括入侵檢測(cè)系統(tǒng)(IDS)、入侵防御系統(tǒng)(IPS)和安全信息與事件管理(SIEM)系統(tǒng)。結(jié)合訪問(wèn)控制和身份認(rèn)證機(jī)制,確保只有授權(quán)用戶能夠訪問(wèn)敏感網(wǎng)絡(luò)資源和數(shù)據(jù)。系統(tǒng)利用高級(jí)的安全算法和加密技術(shù)保護(hù)網(wǎng)絡(luò)環(huán)境,防止安全威脅和數(shù)據(jù)泄露。
3.4診斷智能化
引入了基于AI的故障診斷和預(yù)測(cè)管理系統(tǒng),對(duì)網(wǎng)絡(luò)設(shè)備和服務(wù)的實(shí)時(shí)數(shù)據(jù)進(jìn)行深度分析,以評(píng)估系統(tǒng)健康狀態(tài)、預(yù)測(cè)潛在故障并實(shí)施預(yù)防性維護(hù)策略,這一功能幫助系統(tǒng)管理員及時(shí)發(fā)現(xiàn)問(wèn)題并采取措施,避免故障發(fā)生或減輕其影響。
3.5管理智能化
采用全面的信息化管理平臺(tái)實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)設(shè)備、配置、工作計(jì)劃和工單的數(shù)字化管理。系統(tǒng)通過(guò)數(shù)據(jù)分析和機(jī)器學(xué)習(xí)技術(shù)評(píng)估運(yùn)維任務(wù)的效能,提供仿真培訓(xùn)和決策支持,優(yōu)化資源分配。此外,系統(tǒng)還能對(duì)網(wǎng)絡(luò)能源消耗進(jìn)行監(jiān)控和優(yōu)化,提高能效和減少運(yùn)營(yíng)成本。
4結(jié)語(yǔ)
綜上所述,基于多源異構(gòu)數(shù)據(jù)構(gòu)建并應(yīng)用IT智能運(yùn)維體系可解決當(dāng)前網(wǎng)絡(luò)運(yùn)維面臨的數(shù)據(jù)孤島、效率低下、網(wǎng)絡(luò)安全威脅等挑戰(zhàn)。本文依托云計(jì)算、大數(shù)據(jù)、AI、ML等前沿技術(shù),對(duì)智能運(yùn)維體系的設(shè)計(jì)理念與關(guān)鍵技術(shù)進(jìn)行了深入探討,詳細(xì)闡述了系統(tǒng)架構(gòu)與核心功能,最終得出以下結(jié)論:(1)實(shí)施智能運(yùn)維體系顯著提升了網(wǎng)絡(luò)運(yùn)維效率,自動(dòng)化監(jiān)控檢測(cè)、操作智能化等功能的介入減少了人為操作錯(cuò)誤,使問(wèn)題可被快速題解決;(2)該體系能有效提高網(wǎng)絡(luò)安全性,利用IDS、IPS和SIEM系統(tǒng),結(jié)合訪問(wèn)控制和身份認(rèn)證機(jī)制,為網(wǎng)絡(luò)環(huán)境提供了全方位安全防護(hù);(3)全面監(jiān)控與智能診斷增強(qiáng)了網(wǎng)絡(luò)系統(tǒng)的穩(wěn)定性,系統(tǒng)可基于數(shù)據(jù)分析評(píng)估系統(tǒng)健康狀態(tài),預(yù)防潛在故障;(4)智能運(yùn)維體系促進(jìn)了企業(yè)數(shù)字化轉(zhuǎn)型,在集成化平臺(tái)構(gòu)建、運(yùn)維模式創(chuàng)新等功能的支持下,運(yùn)維流程得以改善,幫助企業(yè)更好地適應(yīng)數(shù)字經(jīng)濟(jì)時(shí)代的新要求。
參考文獻(xiàn)
[1]張海彬,羅玉林,區(qū)云帆,等.基于中鐵貴州智慧社區(qū)管理的多源異構(gòu)數(shù)據(jù)集成方法[J].建筑技術(shù),2023,54(22):2808-2813.
[2]李超.數(shù)字新基建背景下能源工業(yè)云網(wǎng)多源異構(gòu)數(shù)據(jù)接入與融合研究[J].電子元器件與信息技術(shù),2023,7(11):106-109.
[3]閆佳和,李紅輝,馬英,等.多源異構(gòu)數(shù)據(jù)融合關(guān)鍵技術(shù)與政務(wù)大數(shù)據(jù)治理體系[J].計(jì)算機(jī)科學(xué),2024,51(2):1-14.
[4]庫(kù)新勃,張海龍,楊帥.基于XML格式融合多源異構(gòu)數(shù)據(jù)建設(shè)智慧社區(qū)數(shù)據(jù)管理平臺(tái)[J].電力勘測(cè)設(shè)計(jì),2023(8):1-5,17.
[5]石俊杰,趙子巖,何永遠(yuǎn),等.基于多源異構(gòu)數(shù)據(jù)湖平臺(tái)的電力信息通信多源異構(gòu)數(shù)據(jù)清洗方案[J].電力信息與通信技術(shù),2023,21(7):59-66.