呂卓瓊 冷秀敏 欒洋
【摘 要】對華為OSN系列傳輸設備及網(wǎng)絡中常見故障的類型和產(chǎn)生原因進行了詳盡地分析和歸納,僅供業(yè)界同仁參考。
【關鍵詞】傳輸設備;告警;損耗
隨著電力通信網(wǎng)絡規(guī)模的不斷擴大,電力生產(chǎn)對通信網(wǎng)絡的需求與依賴越來越大,對于通信網(wǎng)絡的安全要求越來越高。一旦網(wǎng)絡出現(xiàn)故障,對電力生產(chǎn)會造成極大的損失。如何做到盡量縮短通信故障的處理時間,成為擺在各級管理者面前的一大難題。本人多年從事傳輸設備的維護工作,從以往的工作經(jīng)驗中總結(jié)出各類通信故障的特點,并提出快速查找和解決通信系統(tǒng)故障的方法和建議,希望與大家進行分享和交流,可能有不妥之處,歡迎批評指證。
作為通信設備維護人員,對故障定位的原則是“先外部,后傳輸;先單站,后單板;先線路,后支路;先高級,后低級”。那怎樣在實踐中根據(jù)設備網(wǎng)管告警及利用儀表等工具,在短時間內(nèi)定位并處理故障,是每一位維護人員應該具備的技能。
1 日常維護工作中,通過對網(wǎng)管中的告警巡視,判斷并分析故障產(chǎn)生告警的類型和原因
1.1 上下站間均有緊急告警的,常見以下三種情形
1)對于相鄰兩個設備,在網(wǎng)管上都有R-LOS、R-LOF告警,而沒有MS-RDI、MSREI,說明光纜很可能中斷,因為遠端劣化指示和遠端誤碼指示無法回傳。
2) 如果相鄰兩網(wǎng)元本端有R-LOS、R-LOF告警,另一端有MS-RDI、MSREI,說明遠端劣化指示和遠端誤碼指示能夠回傳,可能是光纖單芯或尾纖接頭過臟、衰耗異常曾大,或本端收方向光板或?qū)Χ税l(fā)方向光板故障。
3) 如果當前網(wǎng)元的上游站點、下游站點兩個相鄰設備都有相應的R-LOS和R-LOF,并且當前設備無法登陸,一般情況為當前設備掉電,造成兩個方向光路不通。
1.2 設備不能登錄,ECC不通,還需要確認業(yè)務是否正常。單個設備中常見故障及原因
1)如果一個或部分網(wǎng)元無法登錄,那么其原因可能是:
(1)光路衰耗大,誤碼過量,導致ECC通路不通;
(2)主控板故障;
(3)主控板ID拔碼不正確;
(4)網(wǎng)元掉電、斷纖。
2)如果全部網(wǎng)元不能登錄,則原因可能有:
(1)網(wǎng)管網(wǎng)元主控板故障;
(2)網(wǎng)線、網(wǎng)卡故障;
(3)計算機IP地址和網(wǎng)關網(wǎng)元IP地址不正確。
2 按照業(yè)務中斷及影響范圍進行故障定位和分析
2.1 某2 Mbit/s輸入中斷告警時,原因可能如下
(1)外部設備輸入中斷;
(2)2 Mbit/s同軸電纜故障;
(3)電纜頭焊接脫落;
(4)DDF架頭松動;
(4)支路板故障。
2.2 某一個VC4通道告警,原因可能如下
(1)時隙配置參數(shù)改變;
(2)設備交叉板故障;
(3)設備背板總線故障。
2.3 光路不通有R-LOS、R-LOF告警,原因可能如下
(1)線路光纜斷纖;
(2)光纖傳輸信號性能劣化;
(3)尾纖接頭太臟,衰耗過大;
(4)對端站點光板發(fā)送端故障或本端光板接收端故障,導致光功率異常;
(5)使用光板型號或模塊類型不匹配。
2.4 誤碼過量時,設備外部原因可能如下
(1)光纖性能劣化,損耗大;
(2)光纖接頭太臟,或連接不正確;
(3)設備接地不良;
(4)設備附近有強烈干擾源;
(5)設備散熱不良,工作溫度高;
(6)傳輸距離過短或過長。
3 任何設備都有一定的使用年限,長年運行的設備其內(nèi)部硬件老化或損壞會產(chǎn)生故障
可能有以下幾種情形:
(1)線路板接收側(cè)衰減過大;
(2)對端發(fā)送電路故障,或本端接收電路故障;
(3)時鐘同步性能不好;
(4)支路板故障;
(5)風扇故障。
4 保護倒換失敗及原因
目前,我局通信網(wǎng)絡采用的保護方式是二纖單身通道保護環(huán)通道保護環(huán)。該保護環(huán)有網(wǎng)絡具備自愈功能,當網(wǎng)絡發(fā)生故障時,不需要人為的干預,網(wǎng)絡本身能在極短的時間內(nèi)自動恢復傳送業(yè)務。但實際運行中可能會發(fā)生以下情形,導致保護倒換失?。?/p>
(1)邏輯系統(tǒng)屬性(保護關系)配置錯誤;
(2)支路板通道保護屬性配置錯誤;
(3)支路板、線路板和主控板故障。
5 維護中常見的人為故障有
1)更換光板時型號不統(tǒng)一,造成光功率過載或太低,導致光路不通,產(chǎn)生R-LOS或誤碼過量等故障;
2)在多個2 Mbit/s口同時處理和開通時,不同的2 Mbit/s線收發(fā)交叉互配,造成數(shù)據(jù)業(yè)務不通;
3)更換主控板時,忘記拔動或錯誤拔動ID碼,導致網(wǎng)元無法登錄;
4)風扇長期不清,導致設備產(chǎn)生大量指針調(diào)整和誤碼;
5)網(wǎng)管添加業(yè)務時不規(guī)范,發(fā)生時隙沖突,導致業(yè)務中斷;
6)PGND接地不良,造成單板頻繁損壞和誤碼;
7)光纜錯誤連接導致全網(wǎng)業(yè)務中斷;
8)市電接入電源設備時,火線零線反接,導致主控板反復復位;
9)尾纖保護不到位,導致老鼠咬斷尾纖,光路中斷。
6 利用SDH分析儀定位故障
誤碼測試是對整個傳輸鏈路運行工作情況的反饋方法,光口和電口的誤碼測試方法一樣,不同的只是信號結(jié)構(gòu)不一樣。通過儀表測試能把故障的范圍縮小,減少故障處理的時間,最終定位到故障設備單板。
光口和電口的誤碼測試(以2.5G光口誤碼測試為例)進行測試的儀表定位故障的步聚:
1)連接好設備,設備對應光口無告警,SDH分析儀無異常告警指示燈亮。最好在連接設備前,對SDH分析儀進行端口自環(huán),驗證儀表自身設置正確。
2)編輯信號結(jié)構(gòu)為STM-16光發(fā)光收在VC4級別停止解復用,即選中BULK,選用223-1的偽隨機序列(PRBS)信號,確認無誤后選中TX=RX,點中OK,儀表即修改為你選中的設置。此時如連接無誤,儀表應無告警。
3)進入誤碼測試界面,進行測試。通過不同的選項設置,測試結(jié)果值有不同的顯示方式,可顯示圖形、數(shù)字等。通過設置,使SDH測試儀只檢測自己需要測試的誤碼類型,一般設置為全‘ALL狀。
4)如果用來定位2M業(yè)務故障的話SDH分析儀要配置為2M信號結(jié)構(gòu)。并用儀表的2M接口連接設備DDF架端子,觀察儀表告警指示燈是否正常。正常后進行下面的步驟:
(1)連接好線纜后,把本站2M業(yè)務對應的光板進行環(huán)回,查看儀表2M業(yè)務是否正常,如果儀表測試結(jié)果顯示無誤碼或業(yè)務正常。說明本站設備沒有問題。
(2)對端站光板向儀表側(cè)環(huán)回,查看儀表2M業(yè)務是否正常,如果儀表測試結(jié)果顯示無誤碼或業(yè)務正常。說明對端站設備沒有問題。需要確認接入的業(yè)務信號是否正確。
7 通過不斷學習,提高故障處理能力
通信網(wǎng)絡技術更新很快,這要求網(wǎng)絡維護人員做到與時俱進,所以平時要養(yǎng)成好的習慣,筆者認為要做到以下幾個方面:
(1)加強對網(wǎng)絡通信技術學習,尤其要關注新技術;
(2)網(wǎng)絡障礙處理時,必須對當前網(wǎng)絡情況充分了解,尤其是網(wǎng)絡情況較為復雜時;
(3)對網(wǎng)絡故障相關信息做詳細記錄;便于故障處理;
(4)處理好障礙后,尤其是疑難障礙,及時總結(jié),積累經(jīng)驗;
(5)做好網(wǎng)絡日常維護工作,避免不必要的網(wǎng)絡故障發(fā)生;
(6)最后別忘了向設備廠商求助,同時也能積累自己處理故障的經(jīng)驗。
[責任編輯:鄧麗麗]