作者/路正霞、翟慧慧、董淑杰、姜麗珍,國網(wǎng)山東省電力公司陽谷縣供電公司
電力信息網(wǎng)絡雙通道故障自動探測策略探究
作者/路正霞、翟慧慧、董淑杰、姜麗珍,國網(wǎng)山東省電力公司陽谷縣供電公司
目前,一主一備的雙通道模式是大多數(shù)企業(yè)的信息主干網(wǎng)絡,其會在遇到故障時自動倒換通道。但在實際情況中,很多故障的發(fā)生不能有效識別和倒換,為信息網(wǎng)絡的可靠性造成影響。因此,本文對幾種主要電力信息網(wǎng)絡雙通道故障自動探測技術特征進行分析,并提出故障檢測和保護的應用方案。
電力信息;網(wǎng)絡雙通道;故障自動探測
光傳輸鏈路是電力企業(yè)具有的豐富資源,并廣泛應用了光傳輸以太鏈。信息網(wǎng)絡的主通道承載在光傳輸以太鏈路上,并和ATM廣域網(wǎng)相聯(lián);備通道主要是光纖直線的通道,并和數(shù)據(jù)通信網(wǎng)相聯(lián)。
主備優(yōu)先級的控制通過廣域網(wǎng)和信息網(wǎng)絡之間的兩臺邊界路由器(H3C SR2 H3C HR1),經(jīng)過開放式最短路徑優(yōu)先協(xié)議設置cost值。對于信息網(wǎng)絡而言,其不能有效保證Ethernet接口的故障檢測,特別是以以太鏈經(jīng)過傳送一些設備時,網(wǎng)絡設備的狀態(tài)不能被鏈路狀態(tài)反映出來。
同時,靜態(tài)路由具有高效、穩(wěn)定和安全的特點,能在接入路由之核心路由的級聯(lián)很好的適用,其缺陷是反映網(wǎng)絡動態(tài)變化的能力較差。缺省路由是SR1存在的問題,當中斷上級的遠端鏈路時,由于光傳輸設備的問題,導致SR1的G1/0/0端口始終UP,造成一直生效SRI這條缺省路由,繼而不能正常倒換到備用通道,出現(xiàn)路由黑洞的情況。
■2.1 BFD技術
雙向轉發(fā)檢測是一種獨立于上層應用程序的通用協(xié)議,和通道類型無關,通過對簡單hello機制的應用,便能進行故障的快速檢測,并可以實現(xiàn)毫秒級。同時,雙向轉發(fā)監(jiān)測是基于上層協(xié)議形成的BFD對話,其機制不實現(xiàn)自己的發(fā)現(xiàn)。通過接收雙向轉發(fā)檢測的發(fā)送和接收,對雙方的狀態(tài)進行判斷,并對發(fā)生的故障進行判斷,其機理相似于光傳輸中的“LOS”信號。
雙向轉發(fā)檢測的特點主要有幾點,第一是單跳檢測的有效時限,并能進行多跳檢測;第二是能夠按照實際需求設置檢測周期;第三是和多種上層協(xié)議進行聯(lián)合使用。
聯(lián)合使用快速重路由和雙向轉發(fā)檢測。在網(wǎng)絡結構比較復雜,或者比較大規(guī)模的網(wǎng)絡時,一旦有故障發(fā)生,路由會在收斂和計算方面耗費很長時間。網(wǎng)絡中指定的備份路由是FRR,其能在發(fā)生故障時實現(xiàn)快速的切換。而將雙向轉發(fā)檢測和FRR進行聯(lián)合使用,不僅能夠讓網(wǎng)絡故障的響應時間大大提升,還能有效降低故障時間。
聯(lián)合使用內(nèi)部網(wǎng)關協(xié)議和雙向轉發(fā)檢測。通常情況下,ISIS需要一秒鐘時間來檢測故障,OSPE需要兩秒的時間來進行故障檢測。而將OSPF、ISIS與BFD快速故障檢測進行聯(lián)動,能夠有效實現(xiàn)毫秒級的故障檢測時間。
圖1 雙向轉發(fā)檢測示意圖
將雙向轉發(fā)檢測部署到網(wǎng)絡邊緣。主干網(wǎng)絡和接入網(wǎng)絡的互聯(lián),其一般需要兩臺路由器設備或兩臺出口交換機,要保證雙出口網(wǎng)絡的穩(wěn)定性,則需要通過VRRP來實現(xiàn)。如果雙出口鏈路狀態(tài)通過BFD來進行探測,其將避免VRRP自身感知鏈路故障的這個階段,不僅節(jié)省了相應的時間,還能將故障倒換通過雙向轉發(fā)檢測聯(lián)動VRRP而快速實現(xiàn)。
一旦雙向轉發(fā)檢測出現(xiàn)故障,其會顯示幾種情況,第一是拆除鄰居會話;第二是監(jiān)測會話中的鏈路故障或設備;第三是將鄰居不可達的信息通知到本地上層協(xié)議;第四是中止上層協(xié)議鄰居關系,待到條件具備時啟動備用路徑。
■2.2 NQA技術
H3C等系列設備適合使用網(wǎng)絡質(zhì)量分析,其能實現(xiàn)多方面性能的監(jiān)測,第一是網(wǎng)絡時延;第二是網(wǎng)絡抖動;第三是網(wǎng)絡丟包率等。通過周期發(fā)送測試報文,能夠保證服務質(zhì)量,及網(wǎng)絡狀態(tài)的有效測量,將真實的網(wǎng)絡質(zhì)量系列參數(shù)提供給用戶。同時,網(wǎng)絡質(zhì)量分析能夠和TRACK實現(xiàn)有效的聯(lián)動,向TRACK反饋自身監(jiān)測到的信息,促使應用程序和TRACK產(chǎn)生聯(lián)動,以快速的反應網(wǎng)絡狀態(tài)變化。不僅如此,網(wǎng)絡質(zhì)量分析能夠實現(xiàn)對多種網(wǎng)絡測試類型的支持,包括并發(fā)的多測試組,如TCP和ICMP-echo等。目前,網(wǎng)絡質(zhì)量分析已經(jīng)和多種應用程序實現(xiàn)了聯(lián)動,其中包括靜態(tài)路由和VRRP等。
■2.3 IP SLA技術
通常情況下,Cisco設備會應用到互聯(lián)網(wǎng)服務等級協(xié)議,常在Cisco企業(yè)版IOS里面使用,其和NQA的用法有相似度。同時,其屬于一種主動網(wǎng)絡測量手段,能實現(xiàn)動態(tài)監(jiān)測,并能采取定期測試的方法。另外,互聯(lián)網(wǎng)網(wǎng)絡等級協(xié)議能和Cisco Track實現(xiàn)聯(lián)動。IP SLA探測的結果通過TRACK影響到浮動靜態(tài)路由、PBR和熱備份路由協(xié)議等,以快速實現(xiàn)故障的切換。
■2.4 TRACK技術
該技術的作用主要是聯(lián)動功能的實現(xiàn)。監(jiān)測模塊和應用模塊的應用橋梁需要通過TRACK聯(lián)動功能來實現(xiàn)。如在NQA、TRACK和靜態(tài)路由之間進行聯(lián)動建立。如果靜態(tài)路由被NQA監(jiān)測到不可達下一跳地址時,TRACK會被立即觸發(fā),并將靜態(tài)路由條目設為無效。這種聯(lián)動方式的實現(xiàn),能夠保證實時判斷靜態(tài)路由有效性,避免靜態(tài)路由無動態(tài)反應能力存在的缺陷。
基于電力網(wǎng)絡信息中存在的問題,想要準確進行其雙通道故障的探測,則需要將Track+NQA+靜態(tài)路由的方式采用到SR1上,當中斷主通道側光傳輸以太鏈路時,即使UP存在于G1/0/0,但經(jīng)過分析,IP:10.B.B.B并不可達。此時失效SR1缺省路由,實現(xiàn)備通道的倒換。雖然在主通道產(chǎn)生故障時,發(fā)送的數(shù)據(jù)會立即倒換至備用通道,但通過對下發(fā)缺省路由的合理采用,其能夠在整個OSPF域中實現(xiàn)缺省路由通告。所以,在最初進行電力信息網(wǎng)絡的設計時,一定要結合當時的運行情況,對鏈路條件進行全面考察和科學分析,如當大量光傳輸設備存在于網(wǎng)絡鏈路時,不能過于依賴輔助的探測方法,而需要先對動態(tài)路由協(xié)議組網(wǎng)進行考慮和采用,才能進一步提升其運行可靠性。基于這個問題,能夠通過OSPF協(xié)議的改變,并和BFD實現(xiàn)聯(lián)動,才能將問題妥善的解決。
總而言之,電力信息網(wǎng)絡的安全運行想要得到有效保證,需要建立在信息網(wǎng)絡雙出口故障自動倒換的基礎上。但在網(wǎng)絡組網(wǎng)的進行過程中,網(wǎng)絡工程師更加信賴自己的以往經(jīng)驗和方法,沒有對故障倒換進行全面的測試。所以,根據(jù)我國電力事業(yè)的發(fā)展需求,在初步進行網(wǎng)絡設計時,一定要對設備條件和鏈路進行全面的考察,嚴格檢測各個環(huán)節(jié),以及及時改正不足之處,并根據(jù)實際情況來完善網(wǎng)絡設計,才能提高電力信息網(wǎng)絡雙通道出現(xiàn)故障時的準確性,最終提升其自動化探測水平。
* [1]馬潤,李亞鵬,吳寧生等.安穩(wěn)通道在寧夏電力通信系統(tǒng)的配置應用[J].寧夏電力,2014,(6):48—52.