韓加林
傳輸網(wǎng)管系統(tǒng)由網(wǎng)管和傳輸網(wǎng)絡(luò) 2部分組成,網(wǎng)絡(luò)結(jié)構(gòu)如圖 1所示。
圖 1 傳輸網(wǎng)管系統(tǒng)結(jié)構(gòu)圖
網(wǎng)管上層應(yīng)用 TCP/IP協(xié)議實現(xiàn)服務(wù)器和工作站的互通,下層應(yīng)用嵌入控制通路 (Embedded Control Channel,ECC)協(xié)議棧實現(xiàn)工作站與管轄的網(wǎng)元 (NE)節(jié)點的通信,SDH設(shè)備之間的通信使用 ECC。其中,網(wǎng)關(guān)網(wǎng)元 (GNE)與網(wǎng)管終端直接相連,也可通過 LAN、HUB、WAN相連,非網(wǎng)關(guān)網(wǎng)元與網(wǎng)關(guān)網(wǎng)元通過數(shù)字通信通路 (DCC)連接。網(wǎng)管和網(wǎng)關(guān)網(wǎng)元之間通過 TCP/IP協(xié)議傳遞信息,網(wǎng)關(guān)網(wǎng)元和非網(wǎng)關(guān)網(wǎng)元之間通過 ECC通信,從而實現(xiàn)了網(wǎng)管和非網(wǎng)關(guān)網(wǎng)元之間的通信。而ECC即嵌入式控制通道,用于 SDH網(wǎng)元間通信,傳送 TMN信息,實現(xiàn)網(wǎng)管對非網(wǎng)關(guān)網(wǎng)元的管理。在 2個 SDH網(wǎng)元之間有光纖連接時一般使用段開銷的再生段字節(jié) DCC字節(jié)傳送 TMN信息。在沒有光纖連接但需要交換 TMN信息的 2個網(wǎng)元之間一般使用擴(kuò)展ECC,即將2個網(wǎng)元通過網(wǎng)口經(jīng)交叉網(wǎng)線連接在一起,并傳送 TMN信息。
DCC:D1-D12,用于網(wǎng)元網(wǎng)管之間、網(wǎng)元和網(wǎng)元之間 OAM信息通路;D1-D3,DCCR用于再生段,帶寬 192 kb/s;D4-D12,DCCM,用于復(fù)用段,帶寬 576 kb/s。
ECC:DCC是其物理載體,用來傳遞 SDH網(wǎng)元之間的通信信息。
主控單元:通過管理接口與網(wǎng)元管理終端連接,負(fù)責(zé)收集傳輸系統(tǒng)的性能、告警等維護(hù)信息上報網(wǎng)管,并下發(fā)來自網(wǎng)管的各種命令,如配置、監(jiān)視等。同時通過 DCC通道和不同傳輸網(wǎng)元之間交換信息來實現(xiàn)對其他網(wǎng)元的管理。
網(wǎng)元脫管:是指網(wǎng)絡(luò)管理器或網(wǎng)元管理器與其監(jiān)控的網(wǎng)元不能正常通信。
一般來說,網(wǎng)元脫管不會引起傳輸設(shè)備所承載業(yè)務(wù)的中斷,但會給傳輸網(wǎng)管的監(jiān)控帶來極大的不便。因為它會導(dǎo)致網(wǎng)管無法實時監(jiān)控脫管的網(wǎng)元,而脫管網(wǎng)元的運行狀態(tài)及告警信息也無法上傳至網(wǎng)管,從而失去對網(wǎng)元監(jiān)控的連續(xù)性。網(wǎng)元脫管所造成的影響不僅與其在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中的位置有關(guān),而且影響的范圍也不同,會影響到單個網(wǎng)元或多個網(wǎng)元的監(jiān)控。如果處理不及時,有可能會造成大的通信故障。網(wǎng)元脫管的故障,具體來說分為以下幾種情況。
傳輸網(wǎng)元脫管分為硬件故障和軟件故障 2類。
1.如果單個或多個網(wǎng)元無法登錄,可能原因:①外部原因,如設(shè)備掉電、供電電壓過低、光纖性能劣化、損耗過高等;②操作不當(dāng),網(wǎng)管 ECC/DCC配置有誤;③設(shè)備故障,網(wǎng)卡故障、光板故障,或網(wǎng)元有大量的性能數(shù)據(jù)上報到網(wǎng)管造成ECC通道堵塞;④主控板故障;⑤主控板 ID撥碼不正確。
2.如果全部網(wǎng)元不能登錄,原因有:網(wǎng)關(guān)網(wǎng)元主控板故障,網(wǎng)線、網(wǎng)卡故障,計算機 IP地址和網(wǎng)關(guān)網(wǎng)元 IP地址不正確。
3.大面積網(wǎng)管脫管還有一個重要原因:管理網(wǎng)元數(shù)量太多,網(wǎng)元的 ECC處理能力有限,網(wǎng)管終端的管理能力也是有限的,要控制在 400個網(wǎng)元以下。網(wǎng)管終端的處理能力取決于網(wǎng)管的硬件配置,否則可能出現(xiàn)網(wǎng)絡(luò)大面積告警時 (骨干光纜中斷等),網(wǎng)管終端死機。不管網(wǎng)關(guān)網(wǎng)元設(shè)置在哪里,管理的網(wǎng)元數(shù)量都可能不夠用。如果不是網(wǎng)關(guān)網(wǎng)元單板故障,建議設(shè)置多個網(wǎng)關(guān)網(wǎng)元,合理分配每個網(wǎng)關(guān)網(wǎng)元處理的網(wǎng)元區(qū)域,關(guān)斷區(qū)域之間的ECC通道,各網(wǎng)關(guān)網(wǎng)元分別使用路由器將網(wǎng)管數(shù)據(jù)匯聚到網(wǎng)管服務(wù)器上,才能使問題迎刃而解。
4.更換主控板后,忘記撥動或錯誤撥動 ID碼,導(dǎo)致網(wǎng)元無法登錄。
鏈型傳輸網(wǎng)絡(luò)結(jié)構(gòu)如圖 2所示。網(wǎng)管 NM監(jiān)控正常,網(wǎng)元 1、2、3登錄成功,網(wǎng)元 4、5登錄失敗,NE4、NE5網(wǎng)管圖標(biāo)此時為灰色,網(wǎng)關(guān)通信正常,網(wǎng)元通信正常,查詢當(dāng)前告警,無任何告警。
圖 2 系統(tǒng)組網(wǎng)圖
網(wǎng)管終端能夠登錄網(wǎng)元 1、2、3,說明網(wǎng)管計算機工作正常。網(wǎng)絡(luò)結(jié)構(gòu)為鏈型,網(wǎng)元 3無告警、異常性能上報,排除了網(wǎng)元 3、4之間光路的問題,原因有:①網(wǎng)元 4主控板故障,造成 DCC通道不通 (DCC,通道為網(wǎng)管信息傳遞的通道),導(dǎo)致網(wǎng)元 5不能登錄;②網(wǎng)元 4的主控板處于復(fù)位狀態(tài),即主控板沒有正常開工;③網(wǎng)元 3的主控板工作不正常,導(dǎo)致本站到下游站的 DCC通道不能正常建立;④網(wǎng)元 4的時鐘板發(fā)給通信模塊的參考時鐘有問題,導(dǎo)致 D1、D2、D3字節(jié)處理有問題。
為此,查看網(wǎng)元 4主控板的狀態(tài),運行燈正常閃爍,沒有處于復(fù)位狀態(tài)。對主控板進(jìn)行復(fù)位,主控板開工后故障依舊,說明不是主控板處于復(fù)位狀態(tài)造成。拔下網(wǎng)元 4的主控板,使 DCC通道在網(wǎng)元 4穿通,再次用網(wǎng)管登錄,發(fā)現(xiàn)網(wǎng)元 4不能登錄,網(wǎng)元 5能夠登錄,說明網(wǎng)元 4的主控板出了問題。更換網(wǎng)元 4的主控板,再次登錄,結(jié)果所有站點登錄成功。
鐵通新疆分公司北疆省干傳輸組網(wǎng)如圖 3所示。使用的是中興 SDH傳輸設(shè)備,在省一干工程烏阿線 (子網(wǎng) 1、2)開通使用 1年后,又開通了省二干傳輸網(wǎng)絡(luò)烏塔、烏泰線 (子網(wǎng) 3)。為了便于北疆線省干的維護(hù)和管理,將省二干的設(shè)備通過奎屯接入省一干,卻出現(xiàn)了網(wǎng)管網(wǎng)元大面積脫管現(xiàn)象。當(dāng)子網(wǎng) 1、2網(wǎng)元監(jiān)控正常時,子網(wǎng) 3的所有網(wǎng)元脫管;當(dāng)子網(wǎng) 3監(jiān)控正常時,子網(wǎng) 2的網(wǎng)元全部脫管。屏蔽奎屯對 55新鎮(zhèn)的 DCC通道后,子網(wǎng)2恢復(fù)正常監(jiān)控。
網(wǎng)管在沒有加入省二干網(wǎng)絡(luò)監(jiān)控之前,以及對省二干進(jìn)行 DCC通道屏蔽后,省一干監(jiān)控正常,說明網(wǎng)管及傳輸光路沒有問題,問題可能出在 IP地址的設(shè)置上。檢查省一干和省二干網(wǎng)絡(luò)設(shè)置的各網(wǎng)元的 IP地址后發(fā)現(xiàn),省一干 (子網(wǎng) 1)主干區(qū)域網(wǎng)元的 IP地址均為 192.1.*.18,而昌吉所帶的一條支鏈 (子網(wǎng) 2)上 2個網(wǎng)元 IP地址為:193.1.*.18,省二干 (子網(wǎng) 3)各網(wǎng)元的 IP地址均為 193.1.*.18。由于子網(wǎng) 2和子網(wǎng) 3都使用了相同的網(wǎng)段 193.1.*.18,當(dāng)通過奎屯和昌吉這 2個轉(zhuǎn)換節(jié)點轉(zhuǎn)換 IP地址后,轉(zhuǎn)發(fā)到網(wǎng)管時出現(xiàn)監(jiān)控地址沖突,網(wǎng)管不能同時與重復(fù)的 193網(wǎng)段地址進(jìn)行路由通信,只能隨機的與其中一個地址通信,因此,出現(xiàn)子網(wǎng) 2或子網(wǎng) 3所有網(wǎng)元脫管的現(xiàn)象。
圖 3 北疆干傳輸網(wǎng)絡(luò)拓?fù)鋱D
如果要使網(wǎng)管能正確地管理所有的網(wǎng)元,必須在網(wǎng)管主機正確設(shè)置可達(dá)全網(wǎng)的IP路由。將子網(wǎng)2和子網(wǎng) 3的所有網(wǎng)元 IP地址改為同子網(wǎng) 1的地址段:192.1.*.18,其中*號的 ID號編碼不能重復(fù),脫管問題得到了徹底的解決。
后期經(jīng)過網(wǎng)絡(luò)優(yōu)化,省一干和省二干作為2個獨立的網(wǎng)絡(luò)接入烏魯木齊的網(wǎng)管。具體做法是:采用添加靜態(tài)路由的方法,將 2個不同網(wǎng)段的子網(wǎng)合并為一個子網(wǎng),2個子網(wǎng)之間用光路連接,打通 2個子網(wǎng)之間的 DCC監(jiān)控通道 (或用 HUB連接2個子網(wǎng)的網(wǎng)元)。在網(wǎng)管主機的網(wǎng)卡上綁定一個與網(wǎng)關(guān)網(wǎng)元 ID:192屬于同一網(wǎng)段的 IP地址:192.1.12.18,保證網(wǎng)管主機到網(wǎng)關(guān)網(wǎng)元有可達(dá)路由。設(shè)置到達(dá)其它網(wǎng)元的路由時,可用添加靜態(tài)路由的方法加以解決,用命令添加:route add 193.1.0.0mask 255.255.0.0 192.1.12.18即可。
1.IP地址沖突造成單個網(wǎng)元脫管的情況。西北環(huán)馬可尼設(shè)備升級時,當(dāng)增加 DXC設(shè)備后,疏勒河 192.6 SMA 16單個網(wǎng)元出現(xiàn)網(wǎng)元時通時斷的問題。經(jīng)查找,發(fā)現(xiàn) IP地址和網(wǎng)管中心打印機的IP地址發(fā)生沖突,修改打印機 IP地址后,網(wǎng)元監(jiān)控恢復(fù)正常。
2.IP地址沖突造成 2地市城域網(wǎng)網(wǎng)元交替脫管的情況。全疆傳輸集中網(wǎng)管建設(shè)的過程中,曾出現(xiàn)過伊犁城域網(wǎng)調(diào)通后,本地網(wǎng) 30多個網(wǎng)元監(jiān)控正常。在與網(wǎng)管中心接通 DCN路由幾分鐘后,伊犁城域網(wǎng)發(fā)生脫管現(xiàn)象,提示 “網(wǎng)絡(luò)上有重復(fù)的IP地址”。并且在伊犁城域網(wǎng)調(diào)通后的幾分鐘時間里,哈密本地網(wǎng)也發(fā)生脫管現(xiàn)象,經(jīng)網(wǎng)管中心查找原因,發(fā)現(xiàn) 2個本地網(wǎng)的網(wǎng)管 IP地址相同,IP地址被誤設(shè),修改后 2個本地網(wǎng)監(jiān)控恢復(fù)正常。
鐵通新疆分公司采用的傳輸設(shè)備有中興、華為、馬可尼、烽火等多個廠家的產(chǎn)品,不同廠家的 SDH設(shè)備在運行過程中都會出現(xiàn)網(wǎng)元脫管現(xiàn)象,引起故障的原因很多。對于維護(hù)人員來說,最重要的是了解網(wǎng)元脫管的原因,并能迅速定位和排除故障,使 SDH網(wǎng)管系統(tǒng)盡快恢復(fù)正常,保證通信的安全暢通。
[1] 魯剛平,熊煉.華為 SDH光傳輸設(shè)備維護(hù)[J].重慶工學(xué)院學(xué)報,2004,18(2):47-49.
[2] 張仁美.ZTE 622M SDH光傳輸設(shè)備故障檢修 1例[J].西部廣播電視,2005,(9):30.
[3] 王永超,蔡棟棟,年玉桂.光傳輸設(shè)備故障淺略分析[J].科技信息,2009,(11):714.
[4] ITU-TRec X.86/Y 1323-2001,EthernetOver LAPS.
(責(zé)任編輯:諸 紅)