引言:筆者單位內(nèi)部網(wǎng)絡間都采用OSPF動態(tài)路由協(xié)議。OSPF使用廣播在路由拓撲結構中交換路由的變化信息,從而選擇最小代價量度的路由,一旦建立鄰居關系之后,雙方路由器開始通信,周期性地互發(fā)Hello數(shù)據(jù)包來維護鄰居關系,并更新OSPF鏈路狀態(tài)數(shù)據(jù)庫。但是,可能由于通信鏈路質(zhì)量不佳、設備故障和配置丟失等原因造成路由協(xié)議未能啟用,導致通信網(wǎng)絡故障。本文筆者就結合實例和大家共同探討。
故障現(xiàn)象一
最近,由于單位網(wǎng)絡升級改造,單位與下級單位之間擴容為兩條相同帶寬的路由,一主一備分擔網(wǎng)絡負荷,提高網(wǎng)絡通信的穩(wěn)定性。下級單位報告說,升級改造后網(wǎng)絡速度的確有了明顯提高,但網(wǎng)速好了一段時間后就回到了升級改造前,上網(wǎng)速率非常慢,網(wǎng)絡擁塞現(xiàn)象比較明顯。
分析與排除:首先通過show ip route查看路由表,發(fā)現(xiàn)本級和下級單位之間只有一條主用信道的路由在用,而備用信道的路由沒有啟動。這就使得實際通信帶寬減少了50%,交換處理能力下降,網(wǎng)速降低。
而后輸入命令show ip ospf neighbor,通過查看OSPF配置,發(fā)現(xiàn)在該備用信道上,單位和分部之間并未建立鄰居關系。嘗試啟用OSPF協(xié) 議,其具體配置命令如下:
(global)router ospf 1
(router)network 互連網(wǎng)段 通配掩碼 area 0
例如,本級單位與下級單位的互聯(lián)網(wǎng)段是10.10.11.1/29,則 上 行 命令 為 :(router)network 10.10.11.1 0.0.0.7 area 0
執(zhí)行命令后,顯示雙方鄰居關系建立成功,兩條信道通信正常,故障排除。
故障現(xiàn)象二:下級單位報告聯(lián)不上網(wǎng),網(wǎng)絡聯(lián)接不通。分析與排除:首先觀察本單位到下級單位的物理端口是否正常,如果不正常,可能的原因是:一是本級單位到下級單位的線路阻斷,則處理線路問題。二是本單位到下級單位的端口損壞或者是下級單位的出口端口損壞,更換端口即可。
如果物理端口正常,則需要測試網(wǎng)絡的連通性。登錄路由器Ping下級單位路由器,如果不通,輸入命令“tracert 目的地址”,出現(xiàn)“** *”,說明該地址不可達,跟蹤不到路由。筆者最后用show ip route命令查看故障網(wǎng)絡的路由路徑時,發(fā)現(xiàn)下掛用戶的端口顯示line up、line protocle down,表明兩個路由器之間物理鏈路是Up的,但協(xié)議是Down的。通過比對兩端配置,確認網(wǎng)間網(wǎng)IP地址配置正確。再次輸入命令show ip ospf neighbor,發(fā)現(xiàn) OSPF 協(xié)議未啟動。
故障原因查找到了,排除方法也比較簡單,按照故障一中的方法啟動OSPF協(xié)議后,再Ping下級單位的路由器網(wǎng)關,網(wǎng)絡測試通過,故障排除。
圖1 路由器的部分日志信息
故障現(xiàn)象三:單位某部門報告說網(wǎng)絡不通,通過現(xiàn)場查看發(fā)現(xiàn)無法Ping通路由器網(wǎng)關,但可以Ping通匯聚層交換機。
分析與排除:筆者首先排除了匯聚層以下可能導致網(wǎng)絡故障的因素,直接登錄單位路由器查看日志信息,發(fā)現(xiàn)在互聯(lián)線路質(zhì)量不好的時間段,與該用戶交換機直連的端口頻繁出現(xiàn)Up/Down告警。圖1為路由器的部分日志信息。
很快,該端口變?yōu)閑rrdisable狀態(tài),對應的日志信息如下:
*Feb 9 10:46:31.967
ZZ: %PM-SP-4-
ERR DISABLE: link
flap error detected
on fastEthernet9/12,
putting in err-disable
state
*Feb 9 10:46:32.147 ZZ: %PM-SP-STDBY-4-ERR DISABLE: linkflap error detected on fastEthernet9/12, putting in err-disable s
查閱技術資料,該款路由器的以太網(wǎng)端口反復出現(xiàn)告警后會造成網(wǎng)絡不通。原因是該設備廠商為保證網(wǎng)絡的可靠性,啟用了保護功能:如在10秒鐘內(nèi)路由器的以太網(wǎng)端口反復出現(xiàn)5次以上Up/Down告警,路由器會因檢測到端口出現(xiàn)linkflap error錯誤,而將端口置于err-disable狀態(tài)。
針對這種情況,廠商也提供了相對應的自動恢復功能,只不過該功能默認關閉。輸入命令“errdisable recovery cause Linkflap”,可以啟動自動回復功能,提示設置自動恢復延時,默認為300秒,根據(jù)實際情況,設置自動恢復延時即可。