文/張寶霞,國家能源集團寧煤信息技術中心
隨著光傳輸網的不斷發(fā)展,網絡規(guī)模不斷擴大,對維護人員維護能力的要求越來越高,如何及時準確地判斷和處理誤碼,作為一個維護人員,一個是必須牢固掌握理論知識,對于最常見的障礙,快速果斷處理;二需要我們在實際中干線設備充分利用所學理論與實踐相結合,精心觀察,潛心研究,摸索經驗,提高應變能力,對于突發(fā)的疑難障礙,能在最快的時間內排除。
1)誤碼校驗和糾錯種類。誤碼檢驗和糾錯是提高數字信號傳輸質量的一種重要手段,在數字通信里誤碼檢測和糾錯的方法多種多樣,從比特間插奇偶校驗、循環(huán)冗余CRC校驗到前向FEC糾錯等等。在傳輸設備維護中,只有收端誤碼,沒有發(fā)端誤碼的概念,就是因為在數字信號的傳輸過程中,誤碼的發(fā)生不在發(fā)送方,而是在傳輸過程中產生的,所以誤碼只在接收方有反應。所以只能對接收端口進行性能檢測,而不能對發(fā)送端口進行性能檢測。2)OTN的糾錯技術。波分系統在傳輸10Gbit/s或更大速率信號時,在波長轉換單元板OTU上采用了帶外和帶內前向糾錯FEC技術,以提高系統的誤碼特性。3)什么是FEC。FEC是指發(fā)端發(fā)送用來糾錯的監(jiān)督碼元,收端收到監(jiān)督碼元后進行解碼,并糾正傳輸中的錯誤碼元。根據監(jiān)督碼元所處的位置,前向糾錯FEC可以分為帶內和帶外前向糾錯。根據ITU-T G.975建議,采用RS里德-索羅門碼(239,255)進行編碼,這里面有239個信息碼元和16個糾錯碼元。4)FEC的技術優(yōu)勢。對波分系統中的隨機單個突發(fā)性誤碼我們選擇FEC糾錯技術。有通用型FEC和增強型EFEC、超強型HD FEC、軟判決SD FE C等,它們的主要區(qū)別,體現在對信噪比容限的提高上,從FEC只能提高5db左右到SD FEC能提高12db左右。
光傳輸系統本端檢測到誤碼時,除本端上報誤碼性能或告警事件外,本端還將誤碼檢測情況通過開銷字節(jié)通知對端。根據本端和對端上報的這些性能和告警事件,可以方便地定位是哪一段通道或哪一個方向出現誤碼。表1給出了與誤碼相關的性能和告警事件列表。(表1)
表1 誤碼越限告警及性能事件檢測位置與作用
波分系統在傳輸10Gbit/s或更大速率信號時,在波長轉換單元板O TU上采用了帶外和帶內前向糾錯FEC技術,以提高系統的誤碼特性。
常用定位方法包括:①告警、性能分析法;②儀表測試法;③更改配置法;④經驗處理法;⑤環(huán)回法;⑥按照信號的類型,設備對接可以分為:線路側對接、支路側對接和輔助接口(如串行接口)對接。
在OTN系統中當業(yè)務主路由有大誤碼,備路由同樣存在少量誤碼時,由于業(yè)務倒換觸發(fā)設置不正確,經常會造成業(yè)務中斷的問題。ITU-TG.798定義了SF/SD兩種倒換條件,SF倒換由告警觸發(fā)(如LO S、LOF、LCK、OCI、AIS),而SD倒換只是由一個可以設定的“誤碼量”觸發(fā)。
對于設備器件性能不良或性能劣化的情況,替換法通常都是故障定位的好方法。通過單板對調、光纖對調、交叉板主備倒換或網絡保護倒換,查看誤碼是否發(fā)生變化,進而定位和排除故障。替換的對象可以是一段光纖、一個設備、一塊單板、一個業(yè)務通道或一個光器件等。替換法適用于排除傳輸外部設備的問題,如光纖、中繼電纜、交換機、供電設備等;或故障定位到單站后,用于排除單站內單板、通道、模塊或纖芯的問題。
全網時鐘不同步,不一定是傳輸設備有問題,可能是全網的時鐘規(guī)劃不合理。比如交換設備跟蹤一個時鐘源,傳輸設備又跟蹤另一個時鐘源,造成兩個網絡的時鐘源不同步。因此,首先確保光傳輸設備組成的傳輸網內時鐘源同步。如果還有問題,可以適當地調整全網的時鐘同步,使全網時鐘同步,以提高系統的傳輸性能。一般情況下,在傳輸網絡內,中心局網元采用內置時鐘源,其他網元跟蹤此時鐘源,可滿足傳輸網絡時鐘源的同步,使大部分交換、移動設備對接都正常。根據需要,更換單板。
在一些特殊的情況下,通過復位單板、掉電重啟等手段可有效排除故障、恢復業(yè)務。但因為該方法不利于故障原因的徹底查清,所以除非情況緊急,一般盡量少用。
分析法是根據業(yè)務信號的傳送方向,從接收端開始向上游方向逐段測試,根據測試結果判斷故障點。根據多年維護經驗,發(fā)現逐段測試非常浪費時間,尤其是干線網絡上,大多數干線業(yè)務信號流都較長,有的業(yè)務需要測試點可能多達幾十個,如果每一個點都進行15分鐘性能監(jiān)測,業(yè)務檢查一遍就需要花半天時間,對需要緊急處理的問題沒有任何幫助。所以具體辦法是先選擇業(yè)務的A端或者Z端測試,快速排查業(yè)務A端和Z端的問題,如果沒有找到故障點,再選擇中間一個OTN站進行測試,就是說需要跳站測試,這樣可以迅速縮小測試范圍,大大提高故障的處理效率。
處理誤碼問題就是要找到誤碼的源頭,利用先高階、后低階的原則,通過分析告警性能(利用一些誤碼告警性能的對應關系)或通過逐段環(huán)回,找到高階誤碼的源頭。如果存在線路誤碼,則先排除線路誤碼,這也是遵循先處理高階、后處理低階的原則。結合網管監(jiān)測告警類型把誤碼區(qū)域逐步縮小到最小范圍。在誤碼故障處理中靈活地使用這些方法,可以起到事半功倍的效果。