歐陽欽 王宏斌
摘要:本文提出跨平臺(tái)帶外通信網(wǎng)管系統(tǒng)(SOCAN)解決方案,主要實(shí)現(xiàn)遠(yuǎn)程對(duì)網(wǎng)絡(luò)及專業(yè)網(wǎng)管的單座席遠(yuǎn)程集中監(jiān)控功能、遠(yuǎn)程實(shí)時(shí)查詢功能和遠(yuǎn)程故障診斷與數(shù)據(jù)配置功能,有效地解決了原網(wǎng)管難統(tǒng)管和必須到現(xiàn)場(chǎng)排除故障的問題,極大地降低了維護(hù)成本,提高了維護(hù)效率,增強(qiáng)了系統(tǒng)的穩(wěn)定性與可靠性,具有很高的實(shí)用價(jià)值。
關(guān)鍵詞:帶外通信;網(wǎng)管;SOCAN;遠(yuǎn)程訪問;集中統(tǒng)管;故障排除
中圖分類號(hào):TP393.07 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.3969/j.issn.1003-6970.2015.05.026
0 引言
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,以及信息化需求的增加,企業(yè)建成的IP網(wǎng)絡(luò)系統(tǒng)或?qū)I(yè)系統(tǒng)越來越大,也越來越多,一般每套系統(tǒng)都配置了相應(yīng)設(shè)備廠家的專業(yè)網(wǎng)管系統(tǒng)。這種部署主要帶來了三個(gè)方面的不足:一是由于各網(wǎng)管系統(tǒng)設(shè)備廠家、型號(hào)、接口定義各不相同,無法在一個(gè)網(wǎng)段內(nèi)實(shí)時(shí)自動(dòng)上報(bào)性能、告警數(shù)據(jù),實(shí)現(xiàn)單一席位的統(tǒng)一集中管理,隨著網(wǎng)管系統(tǒng)的增加,維護(hù)座席不斷增加,機(jī)房空間、維護(hù)人員與成本自然也增加。二是由于目前絕大部分單位的專業(yè)網(wǎng)管均采用“帶內(nèi)”模式,網(wǎng)管信息與業(yè)務(wù)信息通過同一邏輯信道傳送,一旦網(wǎng)管服務(wù)器、網(wǎng)絡(luò)交換機(jī)、路由器、防火墻或?qū)I(yè)設(shè)備(簡(jiǎn)稱網(wǎng)管關(guān)鍵設(shè)備)等發(fā)生故障,就會(huì)影響專業(yè)網(wǎng)管的運(yùn)行。三是由于現(xiàn)有的網(wǎng)絡(luò)管理多采用“帶內(nèi)”系統(tǒng),一旦出現(xiàn)設(shè)備級(jí)故障,很多情況下已經(jīng)無法通過網(wǎng)絡(luò)遠(yuǎn)程訪問故障對(duì)象,維護(hù)人員必須到現(xiàn)場(chǎng)排查故障,排障時(shí)間受技術(shù)人員到達(dá)現(xiàn)場(chǎng)的響應(yīng)速度影響,故障時(shí)間長(zhǎng),效率低下,特別是對(duì)于地處地形或氣候條件不佳、出車又不方便的單位影響更大。
1 解決方案
1.1 實(shí)現(xiàn)原理
解決方案采用跨平臺(tái)帶外通信網(wǎng)管系統(tǒng)(SOCAN),SOCAN部署在單位內(nèi)網(wǎng)上,如圖1所示。在遠(yuǎn)端專業(yè)機(jī)房或網(wǎng)絡(luò)機(jī)房部署串口交換機(jī)(cs)與鍵盤鼠標(biāo)顯示器交換機(jī)(KVMS),CS完成網(wǎng)絡(luò)設(shè)備RS232標(biāo)準(zhǔn)格式數(shù)據(jù)與TCP/IP標(biāo)準(zhǔn)格式數(shù)據(jù)的加密轉(zhuǎn)換通訊,KVMS完成專業(yè)網(wǎng)管服務(wù)器鍵盤、鼠標(biāo)、顯示器標(biāo)準(zhǔn)格式數(shù)據(jù)與TCP/IP標(biāo)準(zhǔn)格式數(shù)據(jù)的加密轉(zhuǎn)換通訊,通過“帶外”通道(網(wǎng)絡(luò)管理控制信息與用戶業(yè)務(wù)信息不在同一邏輯信道上傳輸)組網(wǎng)上傳數(shù)據(jù)。遠(yuǎn)端機(jī)房的關(guān)鍵設(shè)備的串口通過CS接人單位內(nèi)網(wǎng),延伸至控制中心;網(wǎng)管服務(wù)器的鍵盤、鼠標(biāo)、顯示器信號(hào)通過KVMS接入內(nèi)網(wǎng),模擬鍵盤、鼠標(biāo)、顯示器信號(hào)延長(zhǎng)至控制中心。在控制中心部署主、備服務(wù)器和SOCAN軟件,通過單位內(nèi)網(wǎng)實(shí)現(xiàn)專業(yè)網(wǎng)管系統(tǒng)與SOCAN的數(shù)據(jù)交互:通過“網(wǎng)管組”模塊(如圖2)實(shí)現(xiàn)專業(yè)網(wǎng)管運(yùn)行正常時(shí)的遠(yuǎn)程集中監(jiān)控管理功能,主要用于查詢性能和告警;通過“網(wǎng)絡(luò)管理”模塊(如圖2)實(shí)現(xiàn)關(guān)鍵設(shè)備異常時(shí)的故障遠(yuǎn)程診斷與處理功能,可對(duì)關(guān)鍵設(shè)備故障進(jìn)行遠(yuǎn)程串口級(jí)診斷、定位、配置和修復(fù);通過“系統(tǒng)管理”模塊(如圖2)實(shí)現(xiàn)“病例庫”功能和記錄歷史操作,便于日后審計(jì)和排障經(jīng)驗(yàn)積累。
1.2 模塊分析
根據(jù)實(shí)現(xiàn)原理,SOCAN主要包括網(wǎng)絡(luò)管理、系統(tǒng)管理和網(wǎng)管組3個(gè)一級(jí)模塊,告警信息、操作連接、拓?fù)涔芾?、設(shè)備管理、日志管理、系統(tǒng)信息、權(quán)限管理、任務(wù)管理、更新緩存數(shù)據(jù)、操作員自服務(wù)、按網(wǎng)系查詢、按功能查詢共13個(gè)二級(jí)模塊,以及最新告警、按區(qū)域呈現(xiàn)、按類型呈現(xiàn)、按廠商呈現(xiàn)、模塊管理、網(wǎng)元管理、批量導(dǎo)入網(wǎng)元信息、批量導(dǎo)人模塊信息、系統(tǒng)日志、操作日志、病例庫生成、病例庫管理、配置信息、統(tǒng)計(jì)信息、在線用戶、功能權(quán)限維護(hù)、功能角色維護(hù)、業(yè)務(wù)角色維護(hù)、操作員維護(hù)、任務(wù)分類、任務(wù)維護(hù)、性能查詢、告警查詢共26個(gè)三級(jí)模塊的架構(gòu),如圖2所示。
2 功效分析
2.1 功能分析
SOCAN采用帶外管理技術(shù),其業(yè)務(wù)承載也在帶外通道上,與專業(yè)網(wǎng)管“雙軌”運(yùn)行,既互不影響,又共享數(shù)據(jù),還提高了專業(yè)網(wǎng)管維護(hù)管理的可靠性。在控制中心,可以通過KVMS或CS的帶外通道顯示和查看系統(tǒng)的告警和性能數(shù)據(jù),也可以雙擊系統(tǒng)“網(wǎng)管組”的網(wǎng)管列表信息或“網(wǎng)絡(luò)管理”的網(wǎng)元列表信息,通過KVMS或CS的帶外通道連接相應(yīng)網(wǎng)元(網(wǎng)絡(luò)設(shè)備或服務(wù)器),主要實(shí)現(xiàn)了以下五大方面的功能:
(1)專業(yè)網(wǎng)管遠(yuǎn)程集中監(jiān)控功能:可在一個(gè)網(wǎng)段上進(jìn)行集中統(tǒng)一管理,遠(yuǎn)程實(shí)時(shí)查詢網(wǎng)管關(guān)鍵設(shè)備運(yùn)行的狀態(tài)與性能數(shù)據(jù),方便管理。
(2)關(guān)鍵設(shè)備遠(yuǎn)程故障診斷與數(shù)據(jù)配置功能:大多數(shù)情況維護(hù)人員通過串口級(jí)的設(shè)備連接訪問,可以進(jìn)行故障診斷與排除;個(gè)別情況如需去現(xiàn)場(chǎng)處理,維護(hù)人員通過這種方式進(jìn)行故障診斷與定位,方便做好備件和器材準(zhǔn)備。
(3)操作記錄與統(tǒng)計(jì)功能:SOCAN系統(tǒng)自動(dòng)記錄所有操作,形成詳細(xì)的“原始性”日志文件,便于事后管理審計(jì);并能記錄故障處理全過程,形成一個(gè)“病例庫”,為后續(xù)日常故障處理提供素材,經(jīng)驗(yàn)積累。
(4)核心數(shù)據(jù)審計(jì)與加密通信功能:SOCAN全程采用基于Web的端到端SSL-VPN128位加密,通過“系統(tǒng)管理”模塊實(shí)現(xiàn)安全可靠的分級(jí)管理,保證了賬戶信息、日志信息等核心數(shù)據(jù)的安全可靠。
(5)SOCAN狀態(tài)監(jiān)控功能:能管理不同廠家、型號(hào)和接口的大部分現(xiàn)有關(guān)鍵設(shè)備(帶串口),并自動(dòng)上報(bào)SOCAN的性能與告警數(shù)據(jù),實(shí)時(shí)反映SOCAN運(yùn)行狀態(tài),告警響應(yīng)時(shí)間一般<60秒。
2.2 效益分析
SOCAN可以統(tǒng)一管理多套不同的專業(yè)網(wǎng)管系統(tǒng),極大的提高了值勤效率;可以大大縮短故障排除的時(shí)間,提高運(yùn)維效率,降低運(yùn)維成本,減少斷機(jī)損失,具有較大的推廣應(yīng)用效益,主要體現(xiàn)在以下三個(gè)方面:
(1)SOCAN實(shí)現(xiàn)在一個(gè)座席上統(tǒng)一管理分散在不同地點(diǎn)的網(wǎng)管關(guān)鍵設(shè)備,可有效減少網(wǎng)管值勤人數(shù),提高值勤效率,有效的解決專業(yè)網(wǎng)系雜、維護(hù)人員壓力大的問題。
(2)SOCAN是一個(gè)帶外系統(tǒng),與專業(yè)網(wǎng)管“雙軌”并行運(yùn)行,可以作為現(xiàn)有維護(hù)體系很好的補(bǔ)充:在專業(yè)網(wǎng)管運(yùn)行正常時(shí),提供了一個(gè)統(tǒng)一的管理平臺(tái),其管理各種關(guān)鍵設(shè)備的行為不受專業(yè)網(wǎng)管系統(tǒng)運(yùn)行狀況(功能是否正常,運(yùn)行是否穩(wěn)定等)的影響,是一個(gè)“敬業(yè)的守護(hù)者”;同時(shí),在專業(yè)網(wǎng)管失效的情況下,也提供了一個(gè)備份的狀態(tài)監(jiān)控手段,可謂真正的“全時(shí)段的守護(hù)者”。
(3)SOCAN主要定位于對(duì)關(guān)鍵設(shè)備故障的遠(yuǎn)程處理,維護(hù)人員在控制中心即可對(duì)遠(yuǎn)端設(shè)備通過Console口登錄的方式進(jìn)行維護(hù)配置,模擬現(xiàn)場(chǎng)維護(hù)場(chǎng)景,大大縮短了排除故障的時(shí)間,提高運(yùn)維及故障恢復(fù)效率,降低運(yùn)維工作負(fù)荷,減少斷機(jī)斷網(wǎng)帶來的損失;對(duì)于無法遠(yuǎn)程解決的問題,通過SOCAN系統(tǒng),也可以初步判斷故障可能,為現(xiàn)場(chǎng)排障提供必要信息。
3 功能應(yīng)用
某總公司通過路由器與各分公司建立了企業(yè)內(nèi)網(wǎng),由于公司業(yè)務(wù)逐漸拓展,網(wǎng)絡(luò)也不斷擴(kuò)大,設(shè)備廠家、型號(hào)不統(tǒng)一,主要部署有eiseo、華為、H3C、TP-Link、中興等廠家的路由器、交換機(jī)、防火墻、服務(wù)器等。為了便于總公司對(duì)分公司的集中統(tǒng)管與及時(shí)排除分公司的設(shè)備級(jí)故障,公司部署了SOCAN系統(tǒng),分公司1通過24口的串口交換機(jī)將分公司l的各網(wǎng)絡(luò)交換機(jī)接人公司內(nèi)網(wǎng),通過單端口的KVM交換機(jī)將分公司1專業(yè)網(wǎng)管接入公司內(nèi)網(wǎng),如圖3所示。由于分公司1網(wǎng)絡(luò)管理經(jīng)驗(yàn)不足,經(jīng)常出現(xiàn)員工更改IP訪問外網(wǎng)的情況,某天總公司網(wǎng)管員小張通過SOCAN系統(tǒng)發(fā)現(xiàn)分公司1某二層eiseo交換機(jī)數(shù)據(jù)訪問流量短時(shí)間內(nèi)大幅增加,15端口出現(xiàn)了阻塞。為了不影響公司業(yè)務(wù),小張決定通過SOCAN系統(tǒng)遠(yuǎn)程對(duì)分公司1的故障進(jìn)行處理,并決定將分公司終端的MAC地址(有資料)在網(wǎng)絡(luò)交換機(jī)上與相應(yīng)端口綁定,以便從根本上解決問題。步驟如下:
(1)在PCI地址欄上輸入https:∥SOCAN主服務(wù)器ip后,輸入用戶名,密碼登錄到SOCAN系統(tǒng)上,進(jìn)入“網(wǎng)絡(luò)管理”一“操作連接”界面,雙擊如圖4所示的圈內(nèi)信息即可進(jìn)入cisco2960交換機(jī)默認(rèn)界面。
(2)進(jìn)入第15端口,使用no shut命令遠(yuǎn)程啟用;然后使用如圖5所示命令,將15端口與相應(yīng)的MAC地址綁定;其他端口作同樣操作。
(3)回到switch#狀態(tài),輸入“copy run start”保存以上數(shù)據(jù),輸入“ping網(wǎng)絡(luò)設(shè)備網(wǎng)管服務(wù)器ip”顯示可ping通,至此,問題已從遠(yuǎn)程得到解決。
(4)輸入病例名稱,通過“病例庫”功能生成“病例庫”。
4 結(jié)束語
針對(duì)各單位網(wǎng)絡(luò)與專業(yè)網(wǎng)管無法在一個(gè)網(wǎng)段內(nèi)單席位統(tǒng)管、故障診斷與排除必須到現(xiàn)場(chǎng)的弊病,提出SOCAN解決方案。一方面,與專業(yè)網(wǎng)管“雙軌”并行運(yùn)行,既能方便管理,互不影響,又能在專業(yè)網(wǎng)管失效時(shí)提供監(jiān)控手段,實(shí)現(xiàn)“全時(shí)段的守護(hù)”,利于設(shè)備的穩(wěn)定運(yùn)行;另一方面,通過將關(guān)鍵設(shè)備的串口接入系統(tǒng),實(shí)現(xiàn)遠(yuǎn)程串口級(jí)的操作,解決了由于管理、特殊地形或氣候條件出車不方便導(dǎo)致無法及時(shí)排除故障的問題,大大縮短了排障時(shí)間,提高了運(yùn)維效率,降低了斷機(jī)帶來的損失,節(jié)省了車程費(fèi)用。