李彥華 譚小波 武玉良
[摘 要]衛(wèi)星網(wǎng)絡(luò)的最根本的特征和功能是通信,本文針對衛(wèi)星網(wǎng)絡(luò)的這個特性,展開了衛(wèi)星網(wǎng)絡(luò)故障診斷技術(shù)的研究。設(shè)計(jì)了基于動態(tài)管理域劃分的衛(wèi)星網(wǎng)絡(luò)故障診斷模型。設(shè)計(jì)實(shí)現(xiàn)了管理域內(nèi)的衛(wèi)星網(wǎng)絡(luò)故障診斷專家系統(tǒng),并對知識獲取與表達(dá)、推理規(guī)則設(shè)計(jì)及系統(tǒng)模型建立等關(guān)鍵技術(shù)進(jìn)行了論述。另外,設(shè)計(jì)了管理域間的協(xié)作故障診斷模型。
[關(guān)鍵詞]專家系統(tǒng) 衛(wèi)星網(wǎng)絡(luò) 網(wǎng)絡(luò)故障診斷 診斷規(guī)則 管理域間協(xié)作診斷
[中國分類號]TP[文獻(xiàn)標(biāo)識碼]A[文章編號]1007-9416(2009)11-0104-01
1引言
衛(wèi)星網(wǎng)絡(luò)是由星際和星地鏈路連接在一起,由不同軌道、種類和性能的衛(wèi)星、星座及相應(yīng)地面設(shè)施組成的互連互通衛(wèi)星群體網(wǎng)絡(luò)。衛(wèi)星網(wǎng)絡(luò)與地面網(wǎng)絡(luò)不同,它具有以下特點(diǎn):(1)網(wǎng)元節(jié)點(diǎn)種類繁多;(2)網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜;(3)節(jié)點(diǎn)的資源有限;(4)網(wǎng)絡(luò)通信的傳輸延時較大;(5)節(jié)點(diǎn)運(yùn)行動態(tài)變化、節(jié)點(diǎn)間無線通信的質(zhì)量受空間環(huán)境影響嚴(yán)重等等。要使這樣一個復(fù)雜的異構(gòu)網(wǎng)絡(luò)能夠自主、高效的運(yùn)行,提高網(wǎng)絡(luò)的生存效能,就必須要保證網(wǎng)絡(luò)管理系統(tǒng)能夠及時、準(zhǔn)確的發(fā)現(xiàn)、診斷網(wǎng)絡(luò)故障。雖然我國的衛(wèi)星網(wǎng)絡(luò)的建設(shè)處于起步階段,將網(wǎng)絡(luò)故障診斷作為網(wǎng)絡(luò)本身的一項(xiàng)內(nèi)在功能來研究,對于衛(wèi)星網(wǎng)絡(luò)的健康發(fā)展具有重要意義。
2基于動態(tài)管理域劃分的網(wǎng)絡(luò)故障診斷模型
衛(wèi)星網(wǎng)絡(luò)管理系統(tǒng)是一種基于動態(tài)分層結(jié)構(gòu)的網(wǎng)絡(luò)管理體系。在這樣一個動態(tài)分層的網(wǎng)絡(luò)管理體系結(jié)構(gòu)中,為實(shí)現(xiàn)對整個網(wǎng)絡(luò)的高效管理,設(shè)計(jì)了基于動態(tài)注冊注銷的管理域劃分機(jī)制,使得衛(wèi)星網(wǎng)絡(luò)中的被管節(jié)點(diǎn)在某一時刻都?xì)w屬于某個管理分站的管轄范圍,而總控中心負(fù)責(zé)管理各個管理分站,并通過各個管理分站來實(shí)現(xiàn)對整個網(wǎng)絡(luò)的管理,從而實(shí)現(xiàn)對衛(wèi)星網(wǎng)絡(luò)的分層分布式管理?;谠摼W(wǎng)管體系結(jié)構(gòu),本文提出了基于動態(tài)管理域劃分的網(wǎng)絡(luò)故障診斷體系結(jié)構(gòu),它包括管理域內(nèi)的網(wǎng)絡(luò)故障診斷和管理域間協(xié)作故障診斷。
3 管理域內(nèi)的網(wǎng)絡(luò)故障診斷專家系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
衛(wèi)星網(wǎng)絡(luò)的節(jié)點(diǎn)成本較高,并且它們具有不可現(xiàn)場維護(hù)的特點(diǎn),因此,對網(wǎng)絡(luò)狀態(tài)的監(jiān)控與故障診斷提出了越來越高的要求,它要求建立智能化的故障診斷系統(tǒng),以實(shí)現(xiàn)監(jiān)控和診斷的自動化。
衛(wèi)星網(wǎng)絡(luò)最根本的特征和功能是通信,從這個意義上來說,所有的網(wǎng)絡(luò)故障最終都會集中體現(xiàn)在網(wǎng)絡(luò)節(jié)點(diǎn)的通信能力或狀態(tài)上。因此,本文將衛(wèi)星網(wǎng)絡(luò)節(jié)點(diǎn)的通信狀態(tài)以及網(wǎng)絡(luò)性能水平作為衛(wèi)星網(wǎng)絡(luò)故障診斷的內(nèi)容。
衛(wèi)星網(wǎng)絡(luò)故障診斷專家系統(tǒng)就是用以實(shí)現(xiàn)對網(wǎng)絡(luò)主要節(jié)點(diǎn)或設(shè)備(路由節(jié)點(diǎn)、交換節(jié)點(diǎn)、主機(jī)、網(wǎng)絡(luò)打印機(jī)等)的狀態(tài)監(jiān)測和故障診斷。本文參照SNMP協(xié)議構(gòu)造了專家系統(tǒng)的總體結(jié)構(gòu)模型。
該模型由數(shù)據(jù)采集及預(yù)處理模塊、知識庫模塊、推理診斷及解釋模塊、學(xué)習(xí)機(jī)制模塊及用戶界面模塊等5部分組成。
(1)數(shù)據(jù)采集及預(yù)處理模塊 該模塊主要通過三種方式獲得網(wǎng)絡(luò)狀態(tài)信息,它包括:Trap機(jī)制、管理站輪詢和代理端本地輪詢(即在MIB庫中加一個polling組)。然后,簡約處理信息以消除這冗余,并生成故障診斷專家系統(tǒng)全局工作內(nèi)存中所需要的事實(shí),以供推理機(jī)進(jìn)行故障的推理診斷。
(2)知識庫模塊 它是整個專家系統(tǒng)的關(guān)鍵部分。一個專家系統(tǒng)的好壞與知識庫的建設(shè)水平有著密切的關(guān)系。根據(jù)衛(wèi)星網(wǎng)絡(luò)的特點(diǎn),本文深入研究了衛(wèi)星網(wǎng)絡(luò)的通信方面的故障,以衛(wèi)星通信鏈路故障為例,設(shè)計(jì)了故障診斷規(guī)則以及基于XML形式的存儲格式。此外,還研究設(shè)計(jì)了其它類型的網(wǎng)絡(luò)故障的診斷規(guī)則。該模塊把設(shè)計(jì)的這些網(wǎng)絡(luò)故障診斷規(guī)則存儲起來,并且還能夠存儲推理過程中生成的中間結(jié)論、推理結(jié)果以及故障日志等。
(3)推理診斷及解釋模塊 該模塊是專家系統(tǒng)的核心,它根據(jù)數(shù)據(jù)采集及預(yù)處理模塊提供的診斷目標(biāo)和網(wǎng)絡(luò)事實(shí)數(shù)據(jù),利用知識庫中的知識對目標(biāo)進(jìn)行推理,獲得診斷結(jié)果。由于本文把重點(diǎn)放在了衛(wèi)星網(wǎng)絡(luò)的故障診斷規(guī)則的研究與設(shè)計(jì)上了,所以該模塊采用了專家外殼系統(tǒng)JESS的推理機(jī)制,沒有再設(shè)計(jì)新的推理機(jī)。
(4)學(xué)習(xí)機(jī)制模塊 該模塊提出了基于故障案例發(fā)生頻率的學(xué)習(xí)機(jī)制,并成功應(yīng)用于該專家系統(tǒng)中,它是指對于經(jīng)常發(fā)生的(即故障發(fā)生頻率高)網(wǎng)絡(luò)故障,如果它能夠在故障診斷“快表”里查詢到的話,不再經(jīng)過推理機(jī)診斷推理,而是直接返回診斷結(jié)果,這大大提高了故障診斷的效率。
(5)用戶界面模塊 主要用于完成人機(jī)交互、系統(tǒng)設(shè)置、問題描述、診斷結(jié)果顯示和系統(tǒng)的總體控制。該模塊允許對原有的專家知識庫進(jìn)行修正和補(bǔ)充,使其具有良好的可擴(kuò)展性。
4關(guān)鍵技術(shù)及其解決方法
(1)快速采集網(wǎng)絡(luò)信息,實(shí)現(xiàn)快速故障診斷。本文提出了代理端本地輪詢方式,它是指在代理端的MIB庫中加一個polling組,本組中的數(shù)據(jù)經(jīng)過一種運(yùn)算之后,把結(jié)果存入這個polling組中,當(dāng)該輪詢值超過某個閾值時,再向地面站報告該事件,這就使得代理端與地面站之間的交互次數(shù)大大減少,提高了信息搜集的效率。另外,在管理站定期輪詢過程中,通過建立優(yōu)先級輪詢機(jī)制,大大減少了帶寬浪費(fèi)。
(2)知識表達(dá)與存儲:經(jīng)過研究,本文采用產(chǎn)生式與面向?qū)ο笙嘟Y(jié)合的方法,把故障診斷規(guī)則表示出來,并以XML的形式存儲在專家系統(tǒng)的知識庫中。
5管理域間的協(xié)作故障診斷模型
當(dāng)某管理站在診斷網(wǎng)絡(luò)故障,需要域間協(xié)作時(可能是該域內(nèi)的節(jié)點(diǎn)無法與其它域內(nèi)的節(jié)點(diǎn)進(jìn)行通信,那么該類故障可能是節(jié)點(diǎn)間的通信鏈路受到干擾,也有可能是該域內(nèi)的網(wǎng)絡(luò)節(jié)點(diǎn)出現(xiàn)了故障或者其它域內(nèi)的網(wǎng)絡(luò)節(jié)點(diǎn)出現(xiàn)了故障),它向總控中心發(fā)起域間協(xié)作診斷請求;總控中心收到該請求后,將發(fā)送過來的協(xié)作診斷總體任務(wù)進(jìn)行任務(wù)劃分,劃分為若干個子任務(wù),即各個分管理站為實(shí)現(xiàn)該協(xié)作所要完成的診斷任務(wù)。這些子任務(wù)可以同時進(jìn)行,這樣發(fā)起請求的分管理站與其它分管理站之間建立了協(xié)作關(guān)系??偪刂行南蛟摲止芾碚炯捌渌终痉謩e發(fā)送各自的子任務(wù)。當(dāng)參與協(xié)作的分管理站完成各自任務(wù)后,將診斷結(jié)果返回給總控中心,總控中心就能夠確定故障源。最后,總控中心把故障診斷結(jié)果回送給發(fā)送請求協(xié)作的分管理站,完成該分管理站與其它分管理站之間的協(xié)作故障診斷。
6 結(jié)語
本文結(jié)合衛(wèi)星網(wǎng)絡(luò)的特點(diǎn),充分利用JAVA語言面向?qū)ο蟮木幊烫匦?在Windows XP平臺上仿真實(shí)現(xiàn)了一個基于SNMP協(xié)議的網(wǎng)絡(luò)故障診斷診斷專家系統(tǒng)。在故障信息采集過程中,提出了本地輪詢機(jī)制,減少了地面站與星上代理的交互次數(shù),這也是與地面網(wǎng)絡(luò)故障診斷的不同之處。本文提出的學(xué)習(xí)機(jī)制也加快了網(wǎng)絡(luò)故障診斷的效率。但是,該系統(tǒng)還僅是一種仿真實(shí)現(xiàn),還有待于未來在衛(wèi)星網(wǎng)絡(luò)中加以驗(yàn)證。
[參考文獻(xiàn)]
[1] 石榮德,趙廷弟,屠慶慈,常文兵.故障診斷專家系統(tǒng).北京航空航天大學(xué)學(xué)報,1995,21(4).
[2] 蘇利敏,侯朝楨,巍忠健.指揮控制系統(tǒng)的通信網(wǎng)絡(luò)故障診斷專家系統(tǒng)。計(jì)算機(jī)工程,2003,29(13).