賈衛(wèi)平 馬曉悅
【摘要】 本文以多接口模式下的數(shù)字電路為依托,介紹了網(wǎng)絡(luò)故障排查和解決的基本方,并以E1-E1接口為例詳述故障處理步驟,從而為普遍情況下的數(shù)字電路專網(wǎng)故障排查和處理提出相應(yīng)策略。
【關(guān)鍵詞】 數(shù)字電路專網(wǎng) 網(wǎng)絡(luò)故障排查 解決方案
一、前言
數(shù)字電路專網(wǎng)是指用戶租用以2M帶寬為單位的SDH、PDH、MSTP線路組建的專網(wǎng),傳輸線路采用E1(G.703)、V.35、CPOS接口與用戶路由器對接。一般情況下運營商承擔傳輸線路DCE線纜(數(shù)據(jù)傳輸線纜)網(wǎng)絡(luò)接口以上部分的維護,路由器/交換機的DTE線纜(數(shù)據(jù)終端線纜)以下部分的維護主要由用戶承擔,運營商配合處理。
二、查找故障的基本方法
在處理故障時,一般應(yīng)遵循一“查看”、二“詢問”、三“思考”、四“動手”的基本方法。
(1)查看。首先到達現(xiàn)場后查看出現(xiàn)故障的現(xiàn)象,即查看設(shè)備的哪一部分出現(xiàn)故障,有何種告警產(chǎn)生,嚴重程度如何,造成多大危害等,才能透過現(xiàn)象看本質(zhì)。
(2)詢問。觀察完現(xiàn)象后,應(yīng)詢問各階段現(xiàn)場人員,是何種原因造成了此故障或者,比如是否有人修改了數(shù)據(jù)、刪除了文件、更換了單板、停電或雷擊、誤操作等等。
(3) 思考。問明情況后,透過現(xiàn)象、原因等,根據(jù)自己的知識作思考、分析,判斷何種原因可能引起該種故障等,作出較為正確的判斷。
(4) 動手 。根據(jù)前面三個步驟找出故障點,通過修改數(shù)據(jù)、更換單板及芯片等手段解決、排除故障。
三、排除故障的基本原則
故障排除的基本原則:應(yīng)遵循“先搶通后修復(fù)、先外部后傳輸、先單站后單板、先線路后支路、先高級后低級”的原則。
(1)在出現(xiàn)故障時,系統(tǒng)維護者要首先搶通業(yè)務(wù)然后進行故障修復(fù)。
(2)在定位故障時,應(yīng)先排除外部的可能因素,如光纖斷、終端設(shè)備故障或電源問題等,再考慮設(shè)備的問題;
(3)在定位故障時,要盡可能準確的定位出是哪臺設(shè)備的問題,再將故障定位到單板;
(4)群路板的故障常常會引起支路板上的異常告警,因此在故障定位時,先考慮群路,再考慮支路;
(5)在分析告警時,應(yīng)先分析高級別告警,再分析低級別告警。
四、解決故障的基本方法
(1)觀察分析法。當系統(tǒng)發(fā)生故障時,在設(shè)備、網(wǎng)管或命令行上將會出現(xiàn)相應(yīng)的告警信息。通過觀察設(shè)備上的告警燈運行情況,可以及時發(fā)現(xiàn)故障;當故障發(fā)生時,網(wǎng)管上會記錄告警事件和性能數(shù)據(jù)信息,通過分析這些信息,就可以初步判斷故障類型和故障點的位置。
(2)環(huán)回測試法。當通過觀察法不能解決故障時,我們可以考慮用逐段環(huán)回法來排除故障。在進行環(huán)回操作時,應(yīng)該先將故障業(yè)務(wù)通道的業(yè)務(wù)流程進行分解,畫出業(yè)務(wù)路由圖,將業(yè)務(wù)的源和宿,經(jīng)過的網(wǎng)元,所占用的通道和時隙號羅列出來。然后逐段環(huán)回,定位故障網(wǎng)元。故障定位到網(wǎng)元后通過線路側(cè)和支路側(cè)環(huán)回基本定位出可能存在故障的單板。最后結(jié)合其他處理辦法,確認故障單板予以更換排除故障。
(3)插拔法。對最初發(fā)現(xiàn)某種電路板故障時,可以通過插拔或撥動外部接口插頭的方法,如尾纖、同軸頭、轉(zhuǎn)接插頭等,排除因接觸不良引起的故障。但是一般不建議遇到問題馬上就插拔單板,因為這樣有可能忽略掉故障的真正原因,并且對下一步排除故障原因,帶來影響。
(4) 替換法。替換法就是使用一個工作正常的物件去替換一個被懷疑工作不正常的物件,從而達到定位故障、排除故障的目的。這里的物件,可以是一段線纜、一塊單板或一個設(shè)備。 替換物件,也可以替換線路,將正常的線路與故障的線路進行替換,用以縮小故障范圍。
(5) 儀表測試法 。儀表測試法表測試法指采用各種儀表,如誤碼儀、光功率計、光時域反射儀、SDH分析儀等來檢查傳輸故障。一般用于排除傳輸設(shè)備外部問題以及與其它設(shè)備的對接問題。例如:用2M誤碼儀測試業(yè)務(wù)通斷、誤碼;用萬用表測試供電電壓,檢查電壓過高或過低問題。
五、故障處理步驟
數(shù)字電路專網(wǎng)根據(jù)所提供網(wǎng)絡(luò)接口的不同主要劃分為以下幾類:E1-E1、V.35-V.35、E1-V.35、CPOS-E1/V.35。以E1-E1為例,故障處理步驟如下:
假設(shè)用戶節(jié)點B線路出現(xiàn)故障,A點路由器所對應(yīng)的B點WAN口為S0/0,處理步驟如下:
步驟1:查看局端、用戶端設(shè)備是否掉電。如果供電正常,進入步驟2;
步驟2:查看局端PDH光端機LOS燈(光路指示燈)是否告警。如果LOS燈告警(紅),檢查并修復(fù)光路。如果LOS燈正常(綠),進入步驟3;
步驟3:看局端PDH光端機LOF、AIS、E-3、E-6等常用告警指示燈是否異常。若無告警進入步驟4;
步驟4:開始環(huán)回測試。在B點將PDH光端機DCE線纜的BNC接頭使用2M對接頭進行對接,即對整條線路進行硬環(huán)回測試。在A點的路由器查看S0/0端口狀態(tài)。A點路由器配置模式下輸入Show interface s0/0,如果顯示Serial0/0 is up,line protocol is down(looped),則說明傳輸線路狀態(tài)正常,用戶檢查路由器配置或硬件是否正常。
如果顯示Serial0/0 is up,line protocol is down,進入步驟5;
步驟5:在B點通過PDH光端機的撥碼開關(guān)對遠端(即A點)進行軟環(huán)回測試,A點路由器如果顯示Serial0/0 is up,line protocol is down(looped),則故障點可定位于B點PDH光端機與用戶路由器之間連接的DCE電纜。檢查同軸電纜及兩端BNC接頭。
如果顯示Serial0/0 is up,line protocol is down,則按照步驟4、步驟5的環(huán)回測試方法逐級向上排查,直至找到故障點。
以上是E1-E1接口組網(wǎng)方式的故障處理步驟,其它類型接口的故障可參考該步驟排查。
六、小結(jié)
總之,在處理故障的過程中,我們一定要透過故障的表象找到其本質(zhì),才能實現(xiàn)故障的準確定位并迅速排除。這就需要我們了解故障定位的基本原則,明確故障處理的思路,掌握常見的故障處理方法,從而從容應(yīng)對各種異?,F(xiàn)象,提高故障處理的效果。
作者簡介:
賈衛(wèi)平,男,1981年4月生,陜西商洛人,本科學歷,陜西廣電網(wǎng)絡(luò)傳媒(集團)股份有限公司,數(shù)據(jù)業(yè)務(wù)運營公司集團銷售部總監(jiān),工程師。
單位地址:西安市曲江行政商務(wù)區(qū)曲江首座大廈,郵編 710061
聯(lián)系電話:87991134
馬曉悅,女,1987年11月生,陜西西安人,博士研究生,西安電子科技大學經(jīng)濟與管理學院,講師。