商英俊 劉巖 尹廣彬
摘要:運(yùn)維管理系統(tǒng)的發(fā)展有兩大促進(jìn)因素,一是需求驅(qū)動(dòng),二是技術(shù)驅(qū)動(dòng)。新型網(wǎng)絡(luò)架構(gòu)的出現(xiàn)以及被管對(duì)象新特征對(duì)運(yùn)維提出了新的管理需求,同時(shí)人工智能和虛擬化等新技術(shù)的出現(xiàn),對(duì)于提升運(yùn)維管理的智能性奠定了基礎(chǔ)。結(jié)合OODA思想,研究了運(yùn)維管理的自感知、自分析、自決策、自?xún)?yōu)化等智能管控能力,同時(shí)研究了基于信息熵的探針和探測(cè)站點(diǎn)選擇,結(jié)合實(shí)際需求研究遠(yuǎn)程運(yùn)維和自動(dòng)巡檢,提升管理的時(shí)效性。
關(guān)鍵詞:自?xún)?yōu)化;虛擬網(wǎng)絡(luò)功能編排;遠(yuǎn)程運(yùn)維;自動(dòng)巡檢
中圖分類(lèi)號(hào):TP393文獻(xiàn)標(biāo)志碼:A文章編號(hào):1008-1739(2021)18-61-3
0引言
智能運(yùn)維是實(shí)現(xiàn)網(wǎng)絡(luò)運(yùn)行狀態(tài)實(shí)時(shí)監(jiān)控、資源按需動(dòng)態(tài)調(diào)控、故障快速定位診斷的重要手段。在網(wǎng)絡(luò)運(yùn)行過(guò)程中,需要實(shí)時(shí)監(jiān)控網(wǎng)絡(luò)運(yùn)行狀態(tài)和資源使用情況,基于應(yīng)用需求,按需動(dòng)態(tài)調(diào)控資源,及時(shí)排除故障。通過(guò)網(wǎng)絡(luò)的有效和高效運(yùn)行,滿(mǎn)足多樣化業(yè)務(wù)的高要求。
1自感知
1.1應(yīng)用需求感知
操作人員通過(guò)可視化向?qū)饺藱C(jī)界面,在應(yīng)用和網(wǎng)絡(luò)能收稿日期:2021-06-24力之間形成映射關(guān)系,轉(zhuǎn)化為對(duì)網(wǎng)絡(luò)資源的需求,包括源和目的地址、帶寬、優(yōu)先級(jí)、安全等級(jí)和時(shí)效性。
1.2多手段網(wǎng)絡(luò)狀態(tài)感知
網(wǎng)絡(luò)狀態(tài)感知的手段主要有:①定時(shí)輪詢(xún),基于配置文件靈活設(shè)定輪詢(xún)時(shí)間和參數(shù),定期進(jìn)行重要關(guān)鍵參數(shù)的采集和感知。②主動(dòng)上報(bào),網(wǎng)絡(luò)被管設(shè)備基于trap機(jī)制主動(dòng)上報(bào)自身運(yùn)行狀態(tài)和活躍告警消息,全方位細(xì)粒度的數(shù)據(jù)采集是精準(zhǔn)全面分析的基礎(chǔ)。③采集點(diǎn)部署流量探針等進(jìn)行流量信息的實(shí)時(shí)采集和監(jiān)視,在采集節(jié)點(diǎn)部署探針需要根據(jù)網(wǎng)絡(luò)實(shí)時(shí)動(dòng)態(tài)拓?fù)湔{(diào)整探針設(shè)備最佳部署位置,即探針的動(dòng)態(tài)部署算法。
探針動(dòng)態(tài)部署方法步驟[1-3]描述如下:
步驟1:基于多維感知手段實(shí)時(shí)監(jiān)測(cè)網(wǎng)絡(luò)運(yùn)行狀態(tài)。
因此,可以用信息熵增益A、B表示每個(gè)探針信息熵增益。其中,信息熵增益B可在離線環(huán)境下計(jì)算并存儲(chǔ),信息熵增益A基于計(jì)算推理的算法進(jìn)行計(jì)算,可大幅度降低探針信息熵增益計(jì)算的在線計(jì)算復(fù)雜度,減少計(jì)算時(shí)間。
步驟6:備選探針集合中信息增益最大的探針,進(jìn)行信息發(fā)送。
步驟7:計(jì)算網(wǎng)絡(luò)中剩余的不確定度( | ),代表網(wǎng)絡(luò)中所有節(jié)點(diǎn),如下:
如果網(wǎng)絡(luò)中剩余的不確定度小于設(shè)定的閾值,表明探針已經(jīng)將網(wǎng)絡(luò)運(yùn)行情況探測(cè)明白,結(jié)束探測(cè);否則返回步驟4,繼續(xù)選擇和發(fā)送探測(cè)任務(wù)。
步驟8:將已發(fā)送探針的返回結(jié)果作為故障診斷的輸入,進(jìn)行故障診斷和定位。
本方法將探針的信息熵增益簡(jiǎn)化為2個(gè)條件熵之差,分別在離線和在線環(huán)境下計(jì)算,節(jié)省了在線計(jì)算時(shí)間,降低了計(jì)算復(fù)雜度。因此高動(dòng)態(tài)網(wǎng)絡(luò)的故障探針的部署方法具有如下優(yōu)點(diǎn):
①用信息熵增益A和B的差的絕對(duì)值來(lái)表示探針的信息增益,為了減少在線計(jì)算時(shí)間,一個(gè)條件熵可以在離線模式下計(jì)算;②為了降低計(jì)算復(fù)雜度,另一個(gè)條件熵基于近似推理法計(jì)算獲得。
1.3自決策
自決策[7-9]是基于網(wǎng)絡(luò)運(yùn)行過(guò)程中的動(dòng)態(tài)應(yīng)用需求,實(shí)時(shí)更新網(wǎng)絡(luò)資源狀態(tài),或者根據(jù)網(wǎng)絡(luò)效能評(píng)估結(jié)果,進(jìn)行資源優(yōu)化調(diào)控策略的動(dòng)態(tài)生成。同時(shí),智能運(yùn)維需要調(diào)控位于不同地理位置、具有不同通信能力及屬于不同管理域的資源,需要進(jìn)行跨域網(wǎng)絡(luò)功能編排,需要運(yùn)維管理中心協(xié)同不同的管理域共同完成跨域的或者端到端的資源調(diào)控。
1.4自配置
自配置體現(xiàn)在兩方面,一是網(wǎng)絡(luò)開(kāi)通前的靜態(tài)籌劃和快速開(kāi)通,另一個(gè)是網(wǎng)絡(luò)運(yùn)行過(guò)程中的動(dòng)態(tài)調(diào)控配置。靜態(tài)籌劃和快速開(kāi)通,提供向?qū)娇梢暬绘I開(kāi)通配置。
同時(shí)在網(wǎng)絡(luò)運(yùn)行過(guò)程中進(jìn)行資源動(dòng)態(tài)調(diào)控,靈活設(shè)定多參數(shù)閾值,并制定對(duì)應(yīng)的資源調(diào)控策略。在網(wǎng)絡(luò)運(yùn)行過(guò)程中,基于設(shè)定的閾值,當(dāng)發(fā)現(xiàn)流量帶寬越限或節(jié)點(diǎn)鏈路故障等網(wǎng)絡(luò)異常事件發(fā)生時(shí),自動(dòng)觸發(fā)策略決策,實(shí)現(xiàn)網(wǎng)絡(luò)資源動(dòng)態(tài)調(diào)控和自配置。
1.5自?xún)?yōu)化
基于大數(shù)據(jù)對(duì)主動(dòng)上報(bào)和被動(dòng)感知的多維數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、去重、標(biāo)注、分析、融合和評(píng)估,分析網(wǎng)絡(luò)流量趨勢(shì)、基于任務(wù)的資源分配情況、故障率等,建立評(píng)估指標(biāo)體系是網(wǎng)絡(luò)效能評(píng)估的第一步,選擇評(píng)估算法,評(píng)估體系的選擇也可以是客觀指標(biāo),以網(wǎng)絡(luò)健康度為例,評(píng)估指標(biāo)體系包括實(shí)時(shí)性、資源利用率、快速組網(wǎng)能力、抗毀生存性、抗干擾性等多個(gè)一級(jí)指標(biāo),同時(shí)每個(gè)一級(jí)指標(biāo)可以根據(jù)實(shí)際需要進(jìn)行分解和細(xì)化。同時(shí)評(píng)估指標(biāo)體系還可以從用戶(hù)的主觀角度進(jìn)行設(shè)定,即基于用戶(hù)(QOE)的主觀評(píng)估。
在感知獲取的多維網(wǎng)絡(luò)數(shù)據(jù)的基礎(chǔ)上,基于網(wǎng)絡(luò)運(yùn)行狀態(tài)和歷史數(shù)據(jù),利用深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練和預(yù)測(cè),最終實(shí)現(xiàn)網(wǎng)絡(luò)態(tài)勢(shì)預(yù)測(cè),進(jìn)而實(shí)現(xiàn)前瞻性的運(yùn)維管控。
1.6 KVM和自動(dòng)巡檢
通過(guò)智能化和自動(dòng)化運(yùn)維管理,減少管理員管理和操作負(fù)擔(dān),提高管理效率。通過(guò)靈活設(shè)定和定時(shí)輪詢(xún)被監(jiān)控對(duì)象的告警參數(shù)閾值,實(shí)現(xiàn)告警精準(zhǔn)定位、故障診斷和前瞻性預(yù)測(cè),實(shí)現(xiàn)“零延時(shí)”運(yùn)維[10]。提高管理的實(shí)時(shí)性、準(zhǔn)確性和自動(dòng)化程度。
基于遠(yuǎn)程運(yùn)維實(shí)現(xiàn)對(duì)遠(yuǎn)程機(jī)房?jī)?nèi)的路由器、交換機(jī)、服務(wù)器等運(yùn)行狀態(tài)實(shí)時(shí)監(jiān)視和遠(yuǎn)程操作控制。設(shè)定自動(dòng)巡檢任務(wù)、任務(wù)開(kāi)始時(shí)間、任務(wù)結(jié)束時(shí)間及巡檢對(duì)象,設(shè)定定時(shí)器,自動(dòng)觸發(fā)自動(dòng)巡檢任務(wù),同時(shí)基于巡檢結(jié)果生成巡檢任務(wù)工作報(bào)告,分發(fā)推送至不同的值班首長(zhǎng)。讓值班首長(zhǎng)實(shí)時(shí)掌握值班崗位網(wǎng)絡(luò)情況,零時(shí)延處理網(wǎng)絡(luò)問(wèn)題。
2結(jié)束語(yǔ)
運(yùn)維管理系統(tǒng)的發(fā)展遵循需求牽引和技術(shù)驅(qū)動(dòng)。一方面大數(shù)據(jù)、云計(jì)算、人工智能等一系列新技術(shù),以及高動(dòng)態(tài)彈性網(wǎng)絡(luò)架構(gòu)的出現(xiàn),上述因素對(duì)運(yùn)維管理提出了新的智能化的管控需求。另一方面,運(yùn)維管理要適應(yīng)新的彈性網(wǎng)絡(luò)架構(gòu),在管理體制、管控流程、管理架構(gòu)等方面進(jìn)行適應(yīng)性提高,同時(shí)虛擬化、大數(shù)據(jù)和人工智能等新技術(shù)也要引入運(yùn)維管理,提升管理的智能性和主動(dòng)性,實(shí)現(xiàn)真正的零接觸、零延時(shí)運(yùn)維,實(shí)現(xiàn)無(wú)人值守運(yùn)維。
參考文獻(xiàn)
[1]薛明.基于SNMP局域網(wǎng)流量監(jiān)測(cè)系統(tǒng)的應(yīng)用研究[D].鄭州:鄭州大學(xué),2006.
[2]李濤,張亞群,劉岱平.面向服務(wù)的校園網(wǎng)流量監(jiān)控系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版),2009(1):154-156.
[3]宋進(jìn)紅,沈云琴.使用CactiEZ輕松構(gòu)建校園網(wǎng)絡(luò)流量監(jiān)控系統(tǒng)[J].河南城建學(xué)院學(xué)報(bào),2009,18(4):57-59.
[4]段宗濤,林莎.基于SNMP的網(wǎng)絡(luò)流量監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].微型機(jī)與應(yīng)用,2006(11):25-27.
[5]董加敏,王斌.基于SNMP協(xié)議的高校網(wǎng)絡(luò)流量監(jiān)控管理系統(tǒng)的研究[J].廣州大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,8(1):53-57.
[6]張彤,吳世榮.基于SNMP計(jì)算機(jī)網(wǎng)絡(luò)流量監(jiān)控系統(tǒng)研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011,21(1):88-91.
[7]徐鶴,王汝傳.一種P2P流量監(jiān)控系統(tǒng)的設(shè)計(jì)及實(shí)現(xiàn)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2009,19(10):6-10.
[8]趙英,黃九梅,董小國(guó).網(wǎng)絡(luò)流量監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用.2004(24):32-33.