顧牡丹+周輝奎
摘要:IP網(wǎng)絡(luò)基本承載所有核心網(wǎng)業(yè)務(wù),IP網(wǎng)絡(luò)故障是否能夠快速定位直接影響到業(yè)務(wù)的恢復(fù)時(shí)間,該文根據(jù)日常出現(xiàn)的故障進(jìn)行總結(jié)整理,形成一個(gè)通用的排錯(cuò)思路,為讀者能夠快速定位是否為IP問題以及提供一種IP問題的排錯(cuò)思路。
關(guān)鍵詞:CDMA網(wǎng)絡(luò);故障定位;問題排查
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)30-0017-02
1 概述
隨著電信CDMA項(xiàng)目業(yè)務(wù)的大量部署,作為承載所有核心網(wǎng)業(yè)務(wù)的IP網(wǎng)絡(luò)起著至關(guān)重要的作用,能否快速定IP網(wǎng)絡(luò)故障位直接影響到業(yè)務(wù)的恢復(fù)時(shí)間。IP網(wǎng)絡(luò)故障管理難主要因?yàn)閮牲c(diǎn):第一,告警數(shù)量泛濫,每天告警數(shù)量相當(dāng)多,并且一些告警定位后,又不需要作恢復(fù)工作,這時(shí)維護(hù)人員不堪重負(fù)。第二,如果當(dāng)故障發(fā)生了卻無任何的告警,只能依賴摸索排查,定位時(shí)間長,這主要依賴人的經(jīng)驗(yàn)。這兩種現(xiàn)象是故障管理工作者的最大困擾,作者通過深入診斷其根源,根據(jù)現(xiàn)網(wǎng)出現(xiàn)過的故障進(jìn)行總結(jié),形成一個(gè)通用的排錯(cuò)思路,供各現(xiàn)場參考。
2 故障應(yīng)急研究
IP網(wǎng)絡(luò)運(yùn)行的基礎(chǔ)是物理鏈路和SPF(Shortest Path First)算法,鏈路規(guī)劃比較簡單,路徑預(yù)期就比較清晰。如在絕大多數(shù)的中小型城域網(wǎng)絡(luò)設(shè)計(jì)中,網(wǎng)絡(luò)層次少和層次之間采用主備雙鏈路進(jìn)行保護(hù),路徑非主即備。對于類似這種網(wǎng)絡(luò),維護(hù)網(wǎng)絡(luò)拓?fù)鋱D至關(guān)重要,就可以滿足故障處理的需要。
登陸設(shè)備后,現(xiàn)場先做一個(gè)tech-support,隔15分鐘后,再做tech-support;故障問題處理流程如下:
圖1
2.1 查看IPBH 7750 log 99中有哪些告警信息
1)IPBH 7750上聯(lián)CN2 CE的端口、下聯(lián)CDMA網(wǎng)元是否出現(xiàn)中斷告警;
2)板卡CPM、MDA、IOM板卡的告警;
3)Pchip Memory Parity的告警;
4)Show port/mda/card XXXX detail可以查看端口、板卡的last change時(shí)間
5)Show system cpu查看系統(tǒng)cpu利用率;正常idle為80-90%
圖2
2.2 檢查傳輸側(cè)問題
主要是檢查BTS和IPBH之間的E1鏈路是否為正常:
圖3
如果Admin、Oper的狀態(tài)是down,說明IPBH7750至BTS 2M鏈路沒有起來,請查找傳輸,如果狀態(tài)誰up則表明IPBH7750至BTS 2M鏈路正常,排除傳輸問題。
IPBH與BTS IPCP協(xié)議封裝是否正常:
如果IPCP狀態(tài)不是opened狀態(tài),說明IPBH7750至SDH鏈路不正確,請查找傳輸問題,用戶可以通過自環(huán)進(jìn)行測試,如果IPCP狀態(tài)是opened,并且分配和本地相同的地址給對端,說明IPBH7750至SDH鏈路沒有問題,請查找SDH至BTS 2M鏈路。
圖4
2.3 檢查路由問題
首先排查CN2 CE和IPMUX之間鏈路是否正常,再確保兩端port是否為100和FULL;直連地址互ping,查看是否能夠ping通,確認(rèn)IPBH 7750是否有注冊MMC的匯總路由網(wǎng)段;因本地IPBH 7750和MMC不在同一地市,是需要跨CN2才能進(jìn)行互通,可以以本地IPBH接BTS的地址作為源地址ping注冊的MMC地址;如果Ping不通,則檢查CN2 CE路由問題。
IPBH和CN2 CE ospf鄰居是否建立;IPBH是否向CN2 CE發(fā)布該局點(diǎn)的匯總路由網(wǎng)段,檢查IPBH上靜態(tài)條目和發(fā)布CN2 CE的前綴掩碼看是否匹配,如過不匹配,則修改配置,確保兩者匹配;連接MMC側(cè)的IPBH判斷是否有BTS的匯總路由網(wǎng)段;以IPBH接MMC的地址作為源地址同IPBH接BTS的地址相ping;檢查端口狀態(tài)是否為100M和FULL,以及是否可ping通直連網(wǎng)段。
3 小結(jié)
IP網(wǎng)絡(luò)故障的快速定位直接影響到業(yè)務(wù)的恢復(fù)時(shí)間,通過常用的排錯(cuò)思路,根據(jù)現(xiàn)網(wǎng)出現(xiàn)過的故障進(jìn)行總結(jié),為讀者能夠快速定位是否為IP問題以及提供一種IP問題的排錯(cuò)思路。
參考文獻(xiàn):
[1] 白炎. IP承載網(wǎng)分布式網(wǎng)絡(luò)質(zhì)量監(jiān)測和故障定位技術(shù)的研究[D]. 天津: 天津大學(xué), 2013.
[2] 梁艷花, 王佳. 鏈路聚合在IP承載網(wǎng)中的應(yīng)用及優(yōu)化研究[J]. 電腦與信息技術(shù), 2015(1).
[3] 趙季紅. 多層傳送網(wǎng)的故障定位算法[J]. 南京郵電學(xué)院學(xué)報(bào):自然科學(xué)版, 2003(3).
[4] 魯蔚鋒. 兩跳中繼TDD-CDMA蜂窩網(wǎng)絡(luò)容量分析[J]. 東南大學(xué)學(xué)報(bào):自然科學(xué)版, 2013(4).