遆艷萍
【摘要】首先從ECC在SDH管理網(wǎng)中作用入手,進一步闡述了ECC路由的主要特點,將理論知識和實際工作相結(jié)合,對工作中遇見的典型故障案例全面深入進行了思考,對問題解決思路進行了深入分析,對具體維護實踐工作提供可用的參考價值。
【關(guān)鍵詞】ECC路由網(wǎng)管網(wǎng)關(guān)網(wǎng)元
SDH管理網(wǎng)就是管理SDH網(wǎng)絡(luò)單元的電信管理的組成部分,它由一系列分離的ECC及站內(nèi)數(shù)據(jù)通信鏈路組成,具有智能的網(wǎng)絡(luò)單元和采用嵌入的ECC是SDH管理網(wǎng)的重要特點,這兩者的結(jié)合使SDH管理網(wǎng)的信息傳送和相應(yīng)時間大大縮短,而且可以將網(wǎng)管功能經(jīng)ECC下載給網(wǎng)絡(luò)單元,從而實現(xiàn)分布式管理。因此ECC電路的維護在SDH維護中有很重要的作用。
一、ECC是什么?
ECC(Embedded control channel)即嵌入式控制通道,是SDH系統(tǒng)內(nèi)傳送網(wǎng)管消息的邏輯通道,用于SDH網(wǎng)元間通信,傳送TMN信息,實現(xiàn)網(wǎng)管對非網(wǎng)關(guān)網(wǎng)元的管理。SDH的數(shù)據(jù)通信通路DCC構(gòu)成了嵌入控制通道ECC協(xié)議棧的物理層,再生段DCCR使用STM-N段開銷字節(jié)D1-D3速率為192Kbit/s通道和復(fù)用段DCCM使用STM-N段開銷字節(jié)D4-D12速率為576Kbit/s的通道,DCCR可以接入中繼站和端站,DCCM是端站間網(wǎng)管信息的快車道。網(wǎng)管和網(wǎng)關(guān)網(wǎng)元之間通過TCP/IP協(xié)議傳遞信息,然后,網(wǎng)關(guān)網(wǎng)元和非網(wǎng)關(guān)網(wǎng)元之間通過ECC通信,最終實現(xiàn)了網(wǎng)管和非網(wǎng)關(guān)網(wǎng)元之間的通信。
二、ECC路由的特點
(1)ECC通信為一致路由。(2)ECC路由是雙向的。如對于無保護鏈,如果一根光纜斷,則無法登錄。(3)若路由正常,網(wǎng)管通過網(wǎng)關(guān)網(wǎng)元登錄非網(wǎng)關(guān)網(wǎng)元走網(wǎng)上的短路徑,若短路徑不正常,則走網(wǎng)上的長路徑,若長短路徑均不正常,則不能登錄。(4)ECC路由的分配與業(yè)務(wù)配置無關(guān),但與光接口板的環(huán)回狀態(tài)有關(guān),若是對遠端第一個VC4環(huán)回,可能會切斷ECC通信。(5)ECC通道的建立方式也是采用發(fā)端并發(fā),收端選擇建立路由的方式。(6)在建設(shè)網(wǎng)絡(luò)是需要充分考慮ECC路由,合理規(guī)劃ECC路由,將網(wǎng)關(guān)網(wǎng)元所轄的網(wǎng)元數(shù)控制在一個合理的范圍內(nèi)。
三、典型案例
1、ECC路由規(guī)劃不合理造成ECC通信異常。
現(xiàn)象描述:某日,傳輸機房SDH網(wǎng)管上分別有三個獨立的本地網(wǎng)上的網(wǎng)元不斷出現(xiàn)若干個網(wǎng)元顏色突然變灰又恢復(fù)的現(xiàn)象。傳輸設(shè)備無任何告警。
原因分析:傳輸設(shè)備在網(wǎng)管正常時,沒有任何告警,電路正常,ECC通路正常,但是又出現(xiàn)網(wǎng)管管理不到的現(xiàn)象。檢查ECC鏈路管理,發(fā)現(xiàn)與網(wǎng)關(guān)網(wǎng)元連接的ECC鏈路有240個網(wǎng)元,而實際這個網(wǎng)關(guān)網(wǎng)元應(yīng)管理的網(wǎng)元為 68個,經(jīng)過分析原來是在本地網(wǎng)進行網(wǎng)絡(luò)優(yōu)化時,將三個本地網(wǎng)通過155M光路連接起來,引起網(wǎng)關(guān)網(wǎng)元管理域分配不合理造成ECC阻塞,造成網(wǎng)管速度慢,部分網(wǎng)元短時間通信中斷,從而在網(wǎng)管上呈現(xiàn)網(wǎng)元顏色突然變灰又恢復(fù)的現(xiàn)象。
處理過程:由于原先三個本地網(wǎng)都有自己的網(wǎng)關(guān)網(wǎng)元,由于網(wǎng)絡(luò)優(yōu)化,相互開通了光路造成ECC通路阻塞,將相互之間的155M光路的ECC通路關(guān)閉,網(wǎng)管速度增加,經(jīng)常出現(xiàn)的部分網(wǎng)元突然變灰又恢復(fù)的現(xiàn)象沒有再出現(xiàn)。
2、網(wǎng)元ID重復(fù)導(dǎo)致設(shè)備故障后部分網(wǎng)元異常。
現(xiàn)象描述:某本地傳輸網(wǎng)1采用Optix2500+系統(tǒng)組成,某日其上一套2500+設(shè)備上報網(wǎng)元處于安裝態(tài),業(yè)務(wù)正常,該設(shè)備網(wǎng)元ID為9-15。
原因分析:由于設(shè)備處于安裝態(tài),初步定位為設(shè)備主控單板故障導(dǎo)致,其它有可能為人為操作導(dǎo)致業(yè)務(wù)刪除,而使設(shè)備處于安裝態(tài)。
處理過程:(1)現(xiàn)場備份網(wǎng)管數(shù)據(jù);(2)查看網(wǎng)元運行狀態(tài)為安裝態(tài):cfg-get-nestate;(3)查看網(wǎng)元主控的交叉數(shù)據(jù)為空:cfg-get-slot
3、SCC板故障引起ECC通信異常。
(1)OPTIX2500+系統(tǒng)組網(wǎng),如圖1所示。
現(xiàn)象描述:某本地網(wǎng)采用OPTIX2500+系統(tǒng)組網(wǎng),有五個網(wǎng)元,網(wǎng)絡(luò)結(jié)構(gòu)為鏈型結(jié)構(gòu),2號網(wǎng)元為網(wǎng)關(guān)網(wǎng)元,某日,網(wǎng)管發(fā)現(xiàn)4、5號網(wǎng)元登錄失敗,網(wǎng)管通信狀態(tài)正常,傳輸設(shè)備無任何告警。
原因分析:因1、2、3號網(wǎng)元能正常登錄,說明網(wǎng)管、網(wǎng)線正常??赡苁?號網(wǎng)元與4號網(wǎng)元光纜中斷,查看告警無異常告警,排除掉電、斷纖等可能。將故障定位到3-4網(wǎng)元之間。到4號網(wǎng)元查看,網(wǎng)元的SCC板的狀態(tài)運行正常,拔下4號網(wǎng)元的SCC板,2號網(wǎng)元的網(wǎng)管終端再次登錄,可登錄到5號,說明4號網(wǎng)元的SCC板故障。
處理過程:更換4號網(wǎng)元的SCC板,待SCC板開工后,重新下發(fā)數(shù)據(jù),再次從2號網(wǎng)元登錄,所有站點都登錄成功。
(2)Metro1000設(shè)備組網(wǎng)
現(xiàn)象描述:某局點,1-2-3-4-5共5個Metro1000設(shè)備組通道保護環(huán),1號網(wǎng)元為網(wǎng)關(guān)網(wǎng)元,其它4個以1號網(wǎng)元為網(wǎng)關(guān)網(wǎng)元。某日,3號網(wǎng)元頻繁瞬告脫管,其它網(wǎng)元正常。無傳輸告警。
原因分析及處理過程:由于3號網(wǎng)元頻繁瞬告脫管,但是沒有任何傳輸告警,所以將故障定位在2-3號網(wǎng)元之間的SCC板,到3號網(wǎng)元,3號網(wǎng)元SCC板正常,更換3號網(wǎng)元主控板,故障現(xiàn)象仍然存在。查詢當前主控板也無異常復(fù)位記錄,排除本站主控故障。檢查ECC路由信息,發(fā)現(xiàn)3號網(wǎng)元的ECC信息是由2號網(wǎng)元轉(zhuǎn)發(fā)的。懷疑網(wǎng)元2主控、東向光板或網(wǎng)元3西向光板傳遞ECC故障。將1號網(wǎng)元與2號網(wǎng)元連接方向的ECC關(guān)閉,則網(wǎng)元3的ECC信息由4號網(wǎng)元轉(zhuǎn)發(fā),觀察發(fā)現(xiàn)所有網(wǎng)元均正常登陸,無脫管現(xiàn)象。懷疑網(wǎng)元2主控故障。將2號網(wǎng)元主控板進行更換,故障排除。非網(wǎng)關(guān)網(wǎng)元網(wǎng)元脫管不一定是本端主控故障或傳遞光板的,也可能是上游ECC信息轉(zhuǎn)發(fā)站的主控故障,應(yīng)通過修改數(shù)據(jù)配置逐步逐段進行定位。
四、經(jīng)驗小結(jié)
ECC通道對SDH網(wǎng)元的管理至關(guān)重要,快速排除ECC故障,盡早恢復(fù)SDH網(wǎng)元間通信主要依據(jù)以下幾個方面:(1)故障處理的基本原則。故障的定位基本原則是“先外部,后傳輸;先網(wǎng)絡(luò),后網(wǎng)元,先高速,后低速;先高級,后低級”的原則。(2)ECC故障處理的基本原則。①排除外部因素,如網(wǎng)線、網(wǎng)卡、網(wǎng)管計算機、HUB、路由器等外部設(shè)備故障。②排除人為因素。檢查ECC路由規(guī)劃是否合理;網(wǎng)管計算機和網(wǎng)關(guān)網(wǎng)元的IP地址是否正確,;網(wǎng)元ID是否重復(fù);是否存在未將網(wǎng)元加入到系統(tǒng)管理域;是否人工設(shè)置人工路由。③將故障定位到單站或兩個站之間。檢查是否由于光路障礙或設(shè)備掉電引起。④檢查設(shè)備單板。檢查光接口板是否故障,檢查SCC板是否故障。
隨著光網(wǎng)絡(luò)傳輸產(chǎn)品的廣泛應(yīng)用,傳輸網(wǎng)管的監(jiān)控、配置數(shù)據(jù)等作用不斷完善,因此對ECC通道的維護也越來越重要,做好ECC通道的維護是保證通信鏈路”千里眼、順風耳”正常的前提。
【摘要】首先從ECC在SDH管理網(wǎng)中作用入手,進一步闡述了ECC路由的主要特點,將理論知識和實際工作相結(jié)合,對工作中遇見的典型故障案例全面深入進行了思考,對問題解決思路進行了深入分析,對具體維護實踐工作提供可用的參考價值。
【關(guān)鍵詞】ECC路由網(wǎng)管網(wǎng)關(guān)網(wǎng)元
SDH管理網(wǎng)就是管理SDH網(wǎng)絡(luò)單元的電信管理的組成部分,它由一系列分離的ECC及站內(nèi)數(shù)據(jù)通信鏈路組成,具有智能的網(wǎng)絡(luò)單元和采用嵌入的ECC是SDH管理網(wǎng)的重要特點,這兩者的結(jié)合使SDH管理網(wǎng)的信息傳送和相應(yīng)時間大大縮短,而且可以將網(wǎng)管功能經(jīng)ECC下載給網(wǎng)絡(luò)單元,從而實現(xiàn)分布式管理。因此ECC電路的維護在SDH維護中有很重要的作用。
一、ECC是什么?
ECC(Embedded control channel)即嵌入式控制通道,是SDH系統(tǒng)內(nèi)傳送網(wǎng)管消息的邏輯通道,用于SDH網(wǎng)元間通信,傳送TMN信息,實現(xiàn)網(wǎng)管對非網(wǎng)關(guān)網(wǎng)元的管理。SDH的數(shù)據(jù)通信通路DCC構(gòu)成了嵌入控制通道ECC協(xié)議棧的物理層,再生段DCCR使用STM-N段開銷字節(jié)D1-D3速率為192Kbit/s通道和復(fù)用段DCCM使用STM-N段開銷字節(jié)D4-D12速率為576Kbit/s的通道,DCCR可以接入中繼站和端站,DCCM是端站間網(wǎng)管信息的快車道。網(wǎng)管和網(wǎng)關(guān)網(wǎng)元之間通過TCP/IP協(xié)議傳遞信息,然后,網(wǎng)關(guān)網(wǎng)元和非網(wǎng)關(guān)網(wǎng)元之間通過ECC通信,最終實現(xiàn)了網(wǎng)管和非網(wǎng)關(guān)網(wǎng)元之間的通信。
二、ECC路由的特點
(1)ECC通信為一致路由。(2)ECC路由是雙向的。如對于無保護鏈,如果一根光纜斷,則無法登錄。(3)若路由正常,網(wǎng)管通過網(wǎng)關(guān)網(wǎng)元登錄非網(wǎng)關(guān)網(wǎng)元走網(wǎng)上的短路徑,若短路徑不正常,則走網(wǎng)上的長路徑,若長短路徑均不正常,則不能登錄。(4)ECC路由的分配與業(yè)務(wù)配置無關(guān),但與光接口板的環(huán)回狀態(tài)有關(guān),若是對遠端第一個VC4環(huán)回,可能會切斷ECC通信。(5)ECC通道的建立方式也是采用發(fā)端并發(fā),收端選擇建立路由的方式。(6)在建設(shè)網(wǎng)絡(luò)是需要充分考慮ECC路由,合理規(guī)劃ECC路由,將網(wǎng)關(guān)網(wǎng)元所轄的網(wǎng)元數(shù)控制在一個合理的范圍內(nèi)。
三、典型案例
1、ECC路由規(guī)劃不合理造成ECC通信異常。
現(xiàn)象描述:某日,傳輸機房SDH網(wǎng)管上分別有三個獨立的本地網(wǎng)上的網(wǎng)元不斷出現(xiàn)若干個網(wǎng)元顏色突然變灰又恢復(fù)的現(xiàn)象。傳輸設(shè)備無任何告警。
原因分析:傳輸設(shè)備在網(wǎng)管正常時,沒有任何告警,電路正常,ECC通路正常,但是又出現(xiàn)網(wǎng)管管理不到的現(xiàn)象。檢查ECC鏈路管理,發(fā)現(xiàn)與網(wǎng)關(guān)網(wǎng)元連接的ECC鏈路有240個網(wǎng)元,而實際這個網(wǎng)關(guān)網(wǎng)元應(yīng)管理的網(wǎng)元為 68個,經(jīng)過分析原來是在本地網(wǎng)進行網(wǎng)絡(luò)優(yōu)化時,將三個本地網(wǎng)通過155M光路連接起來,引起網(wǎng)關(guān)網(wǎng)元管理域分配不合理造成ECC阻塞,造成網(wǎng)管速度慢,部分網(wǎng)元短時間通信中斷,從而在網(wǎng)管上呈現(xiàn)網(wǎng)元顏色突然變灰又恢復(fù)的現(xiàn)象。
處理過程:由于原先三個本地網(wǎng)都有自己的網(wǎng)關(guān)網(wǎng)元,由于網(wǎng)絡(luò)優(yōu)化,相互開通了光路造成ECC通路阻塞,將相互之間的155M光路的ECC通路關(guān)閉,網(wǎng)管速度增加,經(jīng)常出現(xiàn)的部分網(wǎng)元突然變灰又恢復(fù)的現(xiàn)象沒有再出現(xiàn)。
2、網(wǎng)元ID重復(fù)導(dǎo)致設(shè)備故障后部分網(wǎng)元異常。
現(xiàn)象描述:某本地傳輸網(wǎng)1采用Optix2500+系統(tǒng)組成,某日其上一套2500+設(shè)備上報網(wǎng)元處于安裝態(tài),業(yè)務(wù)正常,該設(shè)備網(wǎng)元ID為9-15。
原因分析:由于設(shè)備處于安裝態(tài),初步定位為設(shè)備主控單板故障導(dǎo)致,其它有可能為人為操作導(dǎo)致業(yè)務(wù)刪除,而使設(shè)備處于安裝態(tài)。
處理過程:(1)現(xiàn)場備份網(wǎng)管數(shù)據(jù);(2)查看網(wǎng)元運行狀態(tài)為安裝態(tài):cfg-get-nestate;(3)查看網(wǎng)元主控的交叉數(shù)據(jù)為空:cfg-get-slot
3、SCC板故障引起ECC通信異常。
(1)OPTIX2500+系統(tǒng)組網(wǎng),如圖1所示。
現(xiàn)象描述:某本地網(wǎng)采用OPTIX2500+系統(tǒng)組網(wǎng),有五個網(wǎng)元,網(wǎng)絡(luò)結(jié)構(gòu)為鏈型結(jié)構(gòu),2號網(wǎng)元為網(wǎng)關(guān)網(wǎng)元,某日,網(wǎng)管發(fā)現(xiàn)4、5號網(wǎng)元登錄失敗,網(wǎng)管通信狀態(tài)正常,傳輸設(shè)備無任何告警。
原因分析:因1、2、3號網(wǎng)元能正常登錄,說明網(wǎng)管、網(wǎng)線正常??赡苁?號網(wǎng)元與4號網(wǎng)元光纜中斷,查看告警無異常告警,排除掉電、斷纖等可能。將故障定位到3-4網(wǎng)元之間。到4號網(wǎng)元查看,網(wǎng)元的SCC板的狀態(tài)運行正常,拔下4號網(wǎng)元的SCC板,2號網(wǎng)元的網(wǎng)管終端再次登錄,可登錄到5號,說明4號網(wǎng)元的SCC板故障。
處理過程:更換4號網(wǎng)元的SCC板,待SCC板開工后,重新下發(fā)數(shù)據(jù),再次從2號網(wǎng)元登錄,所有站點都登錄成功。
(2)Metro1000設(shè)備組網(wǎng)
現(xiàn)象描述:某局點,1-2-3-4-5共5個Metro1000設(shè)備組通道保護環(huán),1號網(wǎng)元為網(wǎng)關(guān)網(wǎng)元,其它4個以1號網(wǎng)元為網(wǎng)關(guān)網(wǎng)元。某日,3號網(wǎng)元頻繁瞬告脫管,其它網(wǎng)元正常。無傳輸告警。
原因分析及處理過程:由于3號網(wǎng)元頻繁瞬告脫管,但是沒有任何傳輸告警,所以將故障定位在2-3號網(wǎng)元之間的SCC板,到3號網(wǎng)元,3號網(wǎng)元SCC板正常,更換3號網(wǎng)元主控板,故障現(xiàn)象仍然存在。查詢當前主控板也無異常復(fù)位記錄,排除本站主控故障。檢查ECC路由信息,發(fā)現(xiàn)3號網(wǎng)元的ECC信息是由2號網(wǎng)元轉(zhuǎn)發(fā)的。懷疑網(wǎng)元2主控、東向光板或網(wǎng)元3西向光板傳遞ECC故障。將1號網(wǎng)元與2號網(wǎng)元連接方向的ECC關(guān)閉,則網(wǎng)元3的ECC信息由4號網(wǎng)元轉(zhuǎn)發(fā),觀察發(fā)現(xiàn)所有網(wǎng)元均正常登陸,無脫管現(xiàn)象。懷疑網(wǎng)元2主控故障。將2號網(wǎng)元主控板進行更換,故障排除。非網(wǎng)關(guān)網(wǎng)元網(wǎng)元脫管不一定是本端主控故障或傳遞光板的,也可能是上游ECC信息轉(zhuǎn)發(fā)站的主控故障,應(yīng)通過修改數(shù)據(jù)配置逐步逐段進行定位。
四、經(jīng)驗小結(jié)
ECC通道對SDH網(wǎng)元的管理至關(guān)重要,快速排除ECC故障,盡早恢復(fù)SDH網(wǎng)元間通信主要依據(jù)以下幾個方面:(1)故障處理的基本原則。故障的定位基本原則是“先外部,后傳輸;先網(wǎng)絡(luò),后網(wǎng)元,先高速,后低速;先高級,后低級”的原則。(2)ECC故障處理的基本原則。①排除外部因素,如網(wǎng)線、網(wǎng)卡、網(wǎng)管計算機、HUB、路由器等外部設(shè)備故障。②排除人為因素。檢查ECC路由規(guī)劃是否合理;網(wǎng)管計算機和網(wǎng)關(guān)網(wǎng)元的IP地址是否正確,;網(wǎng)元ID是否重復(fù);是否存在未將網(wǎng)元加入到系統(tǒng)管理域;是否人工設(shè)置人工路由。③將故障定位到單站或兩個站之間。檢查是否由于光路障礙或設(shè)備掉電引起。④檢查設(shè)備單板。檢查光接口板是否故障,檢查SCC板是否故障。
隨著光網(wǎng)絡(luò)傳輸產(chǎn)品的廣泛應(yīng)用,傳輸網(wǎng)管的監(jiān)控、配置數(shù)據(jù)等作用不斷完善,因此對ECC通道的維護也越來越重要,做好ECC通道的維護是保證通信鏈路”千里眼、順風耳”正常的前提。
【摘要】首先從ECC在SDH管理網(wǎng)中作用入手,進一步闡述了ECC路由的主要特點,將理論知識和實際工作相結(jié)合,對工作中遇見的典型故障案例全面深入進行了思考,對問題解決思路進行了深入分析,對具體維護實踐工作提供可用的參考價值。
【關(guān)鍵詞】ECC路由網(wǎng)管網(wǎng)關(guān)網(wǎng)元
SDH管理網(wǎng)就是管理SDH網(wǎng)絡(luò)單元的電信管理的組成部分,它由一系列分離的ECC及站內(nèi)數(shù)據(jù)通信鏈路組成,具有智能的網(wǎng)絡(luò)單元和采用嵌入的ECC是SDH管理網(wǎng)的重要特點,這兩者的結(jié)合使SDH管理網(wǎng)的信息傳送和相應(yīng)時間大大縮短,而且可以將網(wǎng)管功能經(jīng)ECC下載給網(wǎng)絡(luò)單元,從而實現(xiàn)分布式管理。因此ECC電路的維護在SDH維護中有很重要的作用。
一、ECC是什么?
ECC(Embedded control channel)即嵌入式控制通道,是SDH系統(tǒng)內(nèi)傳送網(wǎng)管消息的邏輯通道,用于SDH網(wǎng)元間通信,傳送TMN信息,實現(xiàn)網(wǎng)管對非網(wǎng)關(guān)網(wǎng)元的管理。SDH的數(shù)據(jù)通信通路DCC構(gòu)成了嵌入控制通道ECC協(xié)議棧的物理層,再生段DCCR使用STM-N段開銷字節(jié)D1-D3速率為192Kbit/s通道和復(fù)用段DCCM使用STM-N段開銷字節(jié)D4-D12速率為576Kbit/s的通道,DCCR可以接入中繼站和端站,DCCM是端站間網(wǎng)管信息的快車道。網(wǎng)管和網(wǎng)關(guān)網(wǎng)元之間通過TCP/IP協(xié)議傳遞信息,然后,網(wǎng)關(guān)網(wǎng)元和非網(wǎng)關(guān)網(wǎng)元之間通過ECC通信,最終實現(xiàn)了網(wǎng)管和非網(wǎng)關(guān)網(wǎng)元之間的通信。
二、ECC路由的特點
(1)ECC通信為一致路由。(2)ECC路由是雙向的。如對于無保護鏈,如果一根光纜斷,則無法登錄。(3)若路由正常,網(wǎng)管通過網(wǎng)關(guān)網(wǎng)元登錄非網(wǎng)關(guān)網(wǎng)元走網(wǎng)上的短路徑,若短路徑不正常,則走網(wǎng)上的長路徑,若長短路徑均不正常,則不能登錄。(4)ECC路由的分配與業(yè)務(wù)配置無關(guān),但與光接口板的環(huán)回狀態(tài)有關(guān),若是對遠端第一個VC4環(huán)回,可能會切斷ECC通信。(5)ECC通道的建立方式也是采用發(fā)端并發(fā),收端選擇建立路由的方式。(6)在建設(shè)網(wǎng)絡(luò)是需要充分考慮ECC路由,合理規(guī)劃ECC路由,將網(wǎng)關(guān)網(wǎng)元所轄的網(wǎng)元數(shù)控制在一個合理的范圍內(nèi)。
三、典型案例
1、ECC路由規(guī)劃不合理造成ECC通信異常。
現(xiàn)象描述:某日,傳輸機房SDH網(wǎng)管上分別有三個獨立的本地網(wǎng)上的網(wǎng)元不斷出現(xiàn)若干個網(wǎng)元顏色突然變灰又恢復(fù)的現(xiàn)象。傳輸設(shè)備無任何告警。
原因分析:傳輸設(shè)備在網(wǎng)管正常時,沒有任何告警,電路正常,ECC通路正常,但是又出現(xiàn)網(wǎng)管管理不到的現(xiàn)象。檢查ECC鏈路管理,發(fā)現(xiàn)與網(wǎng)關(guān)網(wǎng)元連接的ECC鏈路有240個網(wǎng)元,而實際這個網(wǎng)關(guān)網(wǎng)元應(yīng)管理的網(wǎng)元為 68個,經(jīng)過分析原來是在本地網(wǎng)進行網(wǎng)絡(luò)優(yōu)化時,將三個本地網(wǎng)通過155M光路連接起來,引起網(wǎng)關(guān)網(wǎng)元管理域分配不合理造成ECC阻塞,造成網(wǎng)管速度慢,部分網(wǎng)元短時間通信中斷,從而在網(wǎng)管上呈現(xiàn)網(wǎng)元顏色突然變灰又恢復(fù)的現(xiàn)象。
處理過程:由于原先三個本地網(wǎng)都有自己的網(wǎng)關(guān)網(wǎng)元,由于網(wǎng)絡(luò)優(yōu)化,相互開通了光路造成ECC通路阻塞,將相互之間的155M光路的ECC通路關(guān)閉,網(wǎng)管速度增加,經(jīng)常出現(xiàn)的部分網(wǎng)元突然變灰又恢復(fù)的現(xiàn)象沒有再出現(xiàn)。
2、網(wǎng)元ID重復(fù)導(dǎo)致設(shè)備故障后部分網(wǎng)元異常。
現(xiàn)象描述:某本地傳輸網(wǎng)1采用Optix2500+系統(tǒng)組成,某日其上一套2500+設(shè)備上報網(wǎng)元處于安裝態(tài),業(yè)務(wù)正常,該設(shè)備網(wǎng)元ID為9-15。
原因分析:由于設(shè)備處于安裝態(tài),初步定位為設(shè)備主控單板故障導(dǎo)致,其它有可能為人為操作導(dǎo)致業(yè)務(wù)刪除,而使設(shè)備處于安裝態(tài)。
處理過程:(1)現(xiàn)場備份網(wǎng)管數(shù)據(jù);(2)查看網(wǎng)元運行狀態(tài)為安裝態(tài):cfg-get-nestate;(3)查看網(wǎng)元主控的交叉數(shù)據(jù)為空:cfg-get-slot
3、SCC板故障引起ECC通信異常。
(1)OPTIX2500+系統(tǒng)組網(wǎng),如圖1所示。
現(xiàn)象描述:某本地網(wǎng)采用OPTIX2500+系統(tǒng)組網(wǎng),有五個網(wǎng)元,網(wǎng)絡(luò)結(jié)構(gòu)為鏈型結(jié)構(gòu),2號網(wǎng)元為網(wǎng)關(guān)網(wǎng)元,某日,網(wǎng)管發(fā)現(xiàn)4、5號網(wǎng)元登錄失敗,網(wǎng)管通信狀態(tài)正常,傳輸設(shè)備無任何告警。
原因分析:因1、2、3號網(wǎng)元能正常登錄,說明網(wǎng)管、網(wǎng)線正常??赡苁?號網(wǎng)元與4號網(wǎng)元光纜中斷,查看告警無異常告警,排除掉電、斷纖等可能。將故障定位到3-4網(wǎng)元之間。到4號網(wǎng)元查看,網(wǎng)元的SCC板的狀態(tài)運行正常,拔下4號網(wǎng)元的SCC板,2號網(wǎng)元的網(wǎng)管終端再次登錄,可登錄到5號,說明4號網(wǎng)元的SCC板故障。
處理過程:更換4號網(wǎng)元的SCC板,待SCC板開工后,重新下發(fā)數(shù)據(jù),再次從2號網(wǎng)元登錄,所有站點都登錄成功。
(2)Metro1000設(shè)備組網(wǎng)
現(xiàn)象描述:某局點,1-2-3-4-5共5個Metro1000設(shè)備組通道保護環(huán),1號網(wǎng)元為網(wǎng)關(guān)網(wǎng)元,其它4個以1號網(wǎng)元為網(wǎng)關(guān)網(wǎng)元。某日,3號網(wǎng)元頻繁瞬告脫管,其它網(wǎng)元正常。無傳輸告警。
原因分析及處理過程:由于3號網(wǎng)元頻繁瞬告脫管,但是沒有任何傳輸告警,所以將故障定位在2-3號網(wǎng)元之間的SCC板,到3號網(wǎng)元,3號網(wǎng)元SCC板正常,更換3號網(wǎng)元主控板,故障現(xiàn)象仍然存在。查詢當前主控板也無異常復(fù)位記錄,排除本站主控故障。檢查ECC路由信息,發(fā)現(xiàn)3號網(wǎng)元的ECC信息是由2號網(wǎng)元轉(zhuǎn)發(fā)的。懷疑網(wǎng)元2主控、東向光板或網(wǎng)元3西向光板傳遞ECC故障。將1號網(wǎng)元與2號網(wǎng)元連接方向的ECC關(guān)閉,則網(wǎng)元3的ECC信息由4號網(wǎng)元轉(zhuǎn)發(fā),觀察發(fā)現(xiàn)所有網(wǎng)元均正常登陸,無脫管現(xiàn)象。懷疑網(wǎng)元2主控故障。將2號網(wǎng)元主控板進行更換,故障排除。非網(wǎng)關(guān)網(wǎng)元網(wǎng)元脫管不一定是本端主控故障或傳遞光板的,也可能是上游ECC信息轉(zhuǎn)發(fā)站的主控故障,應(yīng)通過修改數(shù)據(jù)配置逐步逐段進行定位。
四、經(jīng)驗小結(jié)
ECC通道對SDH網(wǎng)元的管理至關(guān)重要,快速排除ECC故障,盡早恢復(fù)SDH網(wǎng)元間通信主要依據(jù)以下幾個方面:(1)故障處理的基本原則。故障的定位基本原則是“先外部,后傳輸;先網(wǎng)絡(luò),后網(wǎng)元,先高速,后低速;先高級,后低級”的原則。(2)ECC故障處理的基本原則。①排除外部因素,如網(wǎng)線、網(wǎng)卡、網(wǎng)管計算機、HUB、路由器等外部設(shè)備故障。②排除人為因素。檢查ECC路由規(guī)劃是否合理;網(wǎng)管計算機和網(wǎng)關(guān)網(wǎng)元的IP地址是否正確,;網(wǎng)元ID是否重復(fù);是否存在未將網(wǎng)元加入到系統(tǒng)管理域;是否人工設(shè)置人工路由。③將故障定位到單站或兩個站之間。檢查是否由于光路障礙或設(shè)備掉電引起。④檢查設(shè)備單板。檢查光接口板是否故障,檢查SCC板是否故障。
隨著光網(wǎng)絡(luò)傳輸產(chǎn)品的廣泛應(yīng)用,傳輸網(wǎng)管的監(jiān)控、配置數(shù)據(jù)等作用不斷完善,因此對ECC通道的維護也越來越重要,做好ECC通道的維護是保證通信鏈路”千里眼、順風耳”正常的前提。