程曉飛 馬 恒 王振宇 顧畹儀
摘要:
文章概述了IP、SDH和WDM層網絡的生存性技術,重點介紹了光傳送網的光層生存性技術與光網絡恢復技術,還對故障定位、多層生存性機制的協調等問題進行了簡單介紹,最后給出了一個業(yè)務配置RWA算法與恢復RWA算法的實際方案。
關鍵詞:
波分復用;生存性;路由和波長分配
ABSTRACT:
The survivability techniques for IP, SDH and WDM layers are outlined and emphasis is put on the optical layer survivability techniques and the optical network restoration techniques for OTN. Relative Issues like fault location and coordination of multi-layer survivability mechanisms are briefly discussed. A practical scheme of routing and wavelength assignment algorithms for traffic control and restoration is also introduced.
KEY WORDS:
WDM; Survivability; RWA
1、背景概述
由于數據業(yè)務和語音業(yè)務爆炸式增長,驅使波分復用(WDM)技術不斷發(fā)展,波分復用的信道數不斷增加。單信道速率也由2.5Gbit/s到10Gbit/s再到40Gbit/s不斷提高。由于光傳送網能夠提供高速、寬帶的特性,因此,光傳送網成為傳送網的首選方案。網絡的生存性(Survivability)是指當網絡設備發(fā)生故障時,網絡能夠維持某種可容忍的服務水平的能力。在光傳送網容量較大時,一旦網絡故障導致傳輸業(yè)務失效,將造成巨大損失,因此網絡的生存性問題成為人們日益關注的重要問題。在網絡的各種生存性技術中,光層生存性技術具有響應快速、靈活的特點,能夠有效提高網絡的服務質量(QoS),減少業(yè)務的丟失,因此對光層的生存性研究具有重要的意義。
2、網絡生存性技術
網絡被劃分為不同的層面,各層通常提供了相對獨立的生存技術。IP、SDH和WDM層的生存技術是網絡中的重要生存技術。
2.1IP層的生存性技術
在IP層中,IP/MPLS能夠恢復多故障業(yè)務,同時對業(yè)務的操作粒度也很小,但IP層恢復的速度較慢,無法在故障出現時快速恢復。目前,在網絡層IP/MPLS完成的生存性方案通常考慮的是動態(tài)的路由方案和多協議標記交換(MPLS)的保護倒換方案。
(1)動態(tài)路由方案
動態(tài)路由方案是指在故障出現時,動態(tài)計算尋找可到達宿節(jié)點的有效備用路由,以此來替代網絡的故障路由,恢復故障業(yè)務。這些工作可以通過使用路由協議,在鄰接的路由器間交換用來更新路由器路由表的控制信息來完成。這使得IP包能使用備用動態(tài)路由繞過故障鏈路或故障節(jié)點,恢復業(yè)務的傳送。這些路由協議保證了網絡的生存性,同時獨立于下層的物理層。
網絡的路由器能以顯示或隱示的方式來檢測網絡故障。顯示方式中,本地檢測到故障后,故障信息通過路由器間定期交換的路由協議控制消息,通知鄰接的路由器。隱示方式是指通過定時器的超時來判斷(如KEEPALIVE和HELLO等消息)有線路故障,隱含了通知故障點,路由器檢測到線路故障后將重新計算受影響的路由并更新路由表,然后將更新的路由信息通過UPDATE消息,如鏈路狀態(tài)發(fā)布(LSA)或邊界網關協議(BGP-4),通知鄰接的路由器。動態(tài)的路由協議利用網絡的空閑資源,不受網絡資源拓撲改變的影響。動態(tài)的路由方案的缺點是恢復速度慢,恢復速度大約為十幾秒到幾分鐘,同時,其操作也具有不可預測性,這對于高速傳送網絡而言是重大缺陷。
(2)MPLS保護倒換方案
MPLS保護倒換方案是為了克服動態(tài)路由方案缺點的一種方案,通過預置一系列不同等級的通路,稱為標記交換通路(LSP),來完成保護倒換。這些標記交換通路在分配工作業(yè)務時已經計算完成,預先放置在分組包頭的標簽堆棧中作為備用通路。當故障發(fā)生時,可以從標簽堆棧中獲得。保護的實體可采用動態(tài)或預先決定的方式建立。
動態(tài)路由方案和多協議標記交換保護倒換方案可以基于鏈路級保護或通道級保護。通常動態(tài)的路由方案的恢復時間長,但網絡資源利用率高。多協議標記交換保護倒換方案的保護時間短。
2.2SDH層生存性技術
SDH和WDM光網絡有著相似的功能,都是面向連接的復用網絡,SDH是基于同步數字復用,WDM是基于波長復用。SDH和WDM光生存性結構都可分為保護倒換或恢復方案。自動保護倒換(APS)和自愈環(huán)(SHR)是最常用的保護方案。
(1)自動保護倒換
APS典型地被用于鏈路故障。主要包括1+1、1*9誜1和M*9誜N的APS。3種保護方式的不同在于分配不同的保護資源。在1+1的APS中,工作通路和保護通路上均傳送業(yè)務,接收端比較兩個信號的質量并接收更好的信號;在1*9誜1的APS中,信號由工作通路傳送,當接收端信號質量劣化,信號轉由保護通路傳送;在M*9誜N的APS中,N條工作通路共享M條保護通路。
(2)自愈環(huán)
SHR是網絡生存性非常成功的技術,SHR比APS具有更靈活的特點,可以處理節(jié)點故障和鏈路故障。高速的分插復用(ADM)和簡單的控制機制使得它具有很大的吸引力。單向的SHR(USHR)和雙向的SHR(BSHR)是SDH中的兩種SHR。USHR的保護有兩種不同的方式:鏈路保護倒換(USHR/L)和通道保護倒換(USHR/P)。USHR/L也稱為環(huán)回,在環(huán)回時,故障的鄰接節(jié)點將發(fā)生倒換,將受影響的業(yè)務倒換到保護環(huán)中。很明顯,環(huán)回也可以應用在節(jié)點故障中,將故障節(jié)點的鄰接節(jié)點進行環(huán)回,所有不以故障點為起始終止點的業(yè)務可以被保護。USHR/P通常是1+1保護方案,因為對信號的每個連接在兩個環(huán)上都運行。當故障出現并影響到一個信號時,節(jié)點上的ADM將決定那個信道的信號更好,并選擇此信道。典型的BSHR結構包括兩纖鏈路保護(BSHR/2)和四纖鏈路保護(BSHR/4)。BSHR/2中每個環(huán)中的一半容量作為保護資源預留。故障時故障的兩個鄰接節(jié)點將使用預留的保護資源將故障業(yè)務環(huán)回。BSHR/4中,兩根光纖作為工作光纖,兩根光纖作為保護光纖,故障時,故障鏈路鄰接節(jié)點將工作鏈路倒換到保護鏈路上,以環(huán)回受到影響的業(yè)務。
(3)動態(tài)恢復方案
動態(tài)恢復是指在網絡故障時動態(tài)發(fā)現網絡的空閑資源來恢復受影響的業(yè)務。恢復比保護具有更高的資源使用效率,但恢復時間更長,同時不能確保能100%地恢復故障業(yè)務。SDH網絡中用數字交叉連接系統(DCS)和控制器來實現動態(tài)的資源恢復??刂破骺梢杂眉惺交蚍植际絹硗瓿陕酚珊筒ㄩL分配(RWA)算法。保護和動態(tài)恢復方案是否優(yōu)劣要取決于網絡的拓撲。例如,對點對點系統,APS是最好的解決方案;在環(huán)形網絡中,SHR是最好的解決方案。目前通信網絡中大多使用保護方案,而在大規(guī)模的格形網絡(Mesh)中,APS和SHR可能會消耗掉更多的網絡資源,所以動態(tài)恢復方案是更好的解決辦法。但如何實現快速恢復是需要考慮的問題。
2.3WDM光層的保護和恢復技術
光網絡中,光層的保護和恢復(如圖1所示)發(fā)生在WDM層,具有高速響應、快速實現保護和恢復的特點。光網絡的生存性基于共享資源和動態(tài)恢復資源。光網絡生存技術通常包括兩種技術:保護和恢復。光網絡的保護是指為光網絡的承載業(yè)務提供預留的保護資源,當網絡故障時,故障業(yè)務將由預留的保護資源進行傳送來恢復受影響的業(yè)務;光網絡的恢復是指為光網絡的承載業(yè)務動態(tài)尋找網絡中剩余資源,通過利用網絡提供的富裕資源使得由于故障所帶來的阻塞快速而準確地得以消除。保護技術由于其預先指定網絡的保護資源,因此具有快速恢復業(yè)務的特點,但網絡資源的利用率不高;恢復技術能動態(tài)搜索網絡剩余資源,充
分利用了網絡資源,但恢復時間受到限制。
光層的保護和恢復技術(如圖2所示)又可分為:光信道(OCh)層和光復用段(OMS)層保護/恢復技術。OCh保護/恢復技術(見圖2a)是針對每個信道的,當故障時,光網絡為受影響的故障信道分配一條完整的(通常是通道無關的)保護/恢復通路來恢復故障信道;OMS保護/恢復技術(見圖2b)是針對復用段層的,當故障時,光網絡為受故障鏈路尋找一條替代路由來同時恢復故障鏈路上的所有業(yè)務。
通常空閑資源既能專用保護(空閑資源為某條工作通路專用)同時又能用作共享保護(空閑資源能同時為多條工作通路提供保護)。專用保護通常是指1+1和1*9誜1通路保護。1+1通路保護時,工作通路和保護通路同時傳送,宿節(jié)點終端動態(tài)監(jiān)測接收信號的質量來決定選取工作通路信號還是保護通路信號;1*9誜1保護通路時,僅在工作通路傳送信號,保護通路資源預留,但保護通路可以傳送業(yè)務優(yōu)先級低的額外業(yè)務。共享保護允許空閑的波長由多個工作波長共享以作為保護通路。當故障發(fā)生時,中斷的業(yè)務由保護資源傳送。在操作上需要一些信令來通知網絡節(jié)點新的傳送通路,并確保保護通路在不同鏈路上的保護波長能構成保護。
WDM光層保護和恢復技術的優(yōu)點有:
(1)高速
WDM層的恢復比其他高層的恢復速度更快,因為節(jié)點能在故障出現時就迅速動作,而不需要等待高層的指示信號。
(2)簡單
它比高層的恢復需要更少的協調性。
(3)高效
光層的恢復可更有效地利用恢復資源,因為資源是由不同的服務層共享的。
(4)透明性
波長的路由保護技術是獨立于高層使用的協議。
2.4WDM光網絡恢復路由和波長
分配算法
光網絡的恢復算法通常將路由問題和波長分配問題分開考慮?;謴吐酚伤惴ㄊ菫榇謴偷臉I(yè)務動態(tài)尋找一條替代路由。光網絡的恢復路由基于最短路徑優(yōu)先選取。故障類型通常考慮為針對節(jié)點故障和鏈路故障。光網絡的恢復策略可以基于不同故障選擇不同的恢復路由算法。
光網絡中鏈路故障是常見故障,當網絡出現鏈路故障時,恢復的路由算法可基于兩種備用路由策略:
(1)鏈路無關策略
選擇的恢復路由同故障鏈路無關。即在當前光網絡資源中尋找故障鏈路兩個端節(jié)點間的一條最短路由來替代故障鏈路。
(2)通道無關策略
選擇的恢復路由同原故障業(yè)務路由沒有共同鏈路。即在當前網絡資源中尋找一條除去原故障業(yè)務路由資源后的最短路由??梢钥吹剑阪溌窡o關的策略是鏈路層的恢復,屬于OMS層,它只需要為故障鏈路尋找替代鏈路,而路由的其它部分不變,因此其計算時間的復雜度低。但鏈路無關路由需要準確的故障定位信息、富余的網絡剩余資源,而且無法選取當前網絡中的最優(yōu)資源,對網絡中的資源分配效率不高,同時在故障業(yè)務路由上故障多的情況下效果不好。基于通道無關的恢復策略屬于OCh層,恢復針對的是通過故障鏈路的每條通路,其路由選擇策略選取了同原業(yè)務通路沒有相關鏈路的路由,因此,它無需等待故障定位,當檢測到故障時可以立即啟動恢復算法程序,在避開原通路的物理拓撲上,尋找一條備用的光通路,并將故障業(yè)務切換到恢復通路上。由于基于通路無關的恢復是針對每條受故障影響的業(yè)務,故障鏈路上的所有光通路均需要切換,恢復動作涉及到多節(jié)點動作。但基于通道無關的路由選取策略能選擇當前網絡的最優(yōu)路由,同時能較好地處理該故障路由上的多故障情況。
當光網絡的節(jié)點出現故障時,首先可以判斷光網絡節(jié)點的故障影響范圍,光網絡節(jié)點故障影響的范圍分為:整個節(jié)點失效、部分鏈路失效、部分通路失效。當光網絡故障導致部分鏈路失效或部分通路失效時(這種情況較常見),恢復算法可以優(yōu)先考慮節(jié)點內部動態(tài)重構光網絡節(jié)點結構,從而恢復節(jié)點部分鏈路或部分通路失效影響的業(yè)務,這樣只涉及到節(jié)點內部的動作,可大大節(jié)省恢復時間。當節(jié)點內部無法通過重構連接恢復所有的故障業(yè)務時,可采取基于OMS層的避開故障節(jié)點的業(yè)務路由算法,選擇優(yōu)化的恢復路由或基于OCh層的故障業(yè)務通路無關的恢復路由。
為恢復業(yè)務選取路由后,恢復算法需要為故障業(yè)務分配波長。各種不同的波長分配算法可參見文獻[3]?;謴退惴ㄒ蠡謴蜁r間盡量短,因此在路由和波長分配選擇上可以選擇時間復雜度低的算法來保證恢復時間。首次命中(FF)算法的計算時間復雜度低,是一種可行的選擇方案。
2.5故障檢測和故障定位
故障檢測和故障定位是光網絡各項生存性技術的基礎。
WDM光網絡中的主要故障有:
(1)節(jié)點故障
由于節(jié)點中器件的故障、器件的掉電、單板的插拔以及人為因素的影響導致在WDM光網絡中的節(jié)點產生故障。
(2)鏈路故障
由于自然因素和人為因素的影響,導致光纖鏈路的切斷,使得WDM光網絡的鏈路產生故障,影響傳輸的業(yè)務。
(3)通道故障
通道故障通常是指發(fā)射機、接收機或相關設備故障導致光通道產生故障。
基本的生存性故障因素主要被歸集為單鏈路或節(jié)點故障,這是因為光網絡光纖斷裂導致的鏈路故障更常見,而且一次僅考慮單設備故障更容易處理。
自然現象導致的無法控制的災難而產生的設備和節(jié)點故障以及信道的故障等都不是人們重點考慮的故障。
在SDH中,故障檢測和定位是由幀頭的字節(jié)和電的監(jiān)測手段來檢測數據丟失或誤碼率過大。但這種方法在光層中無法使用,因此光層利用信道的光功率級別、串擾或其他參數來檢測信道的連續(xù)性和質量。光監(jiān)控信道可以用來進行監(jiān)控,但在光監(jiān)控技術不很成熟時,電的監(jiān)控方案可以考慮。雖然電的監(jiān)控方案將導致信號的不透明傳送,但電的處理過程是按比特位來進行的,具有協議的透明性。
2.6WDM光網絡的多層保護協調機制
通常一些高層服務如SDH和ATM等有自己的保護/恢復的生存性機制。而WDM層生存性技術雖然擁有很多的優(yōu)越性,但仍然有一定的局限性,如:不能處理所有類型的故障,無法監(jiān)測到網絡所有的故障,不能對高層的故障進行保護,無法對業(yè)務的不同部分提供不同等級的保護,光網絡的某些限制條件也會限制鏈路的保護能力等。所以對網絡的生存性而言,需要多層保護機制。
在網絡多層生存性技術間沒有協調機制時,各層獨立地并行完成各自的生存性技術。雖然實施起來簡單,但占用的資源大,各層均占用保護/恢復資源,從而造成資源浪費,這將導致一些潛在的需要的保護/恢復操作無空閑資源可用。因此,WDM光網絡的多層保護協調機制是十分必要的。多層生存性技術的協調機制提出了分配不同功能給各層的高效恢復方案。層間的生存性協調方案通常有兩種:
(1)順序協調方案
順序協調方案是指各層按順序進行生存性動作,當本層無法恢復故障時,轉向下一層進行恢復。順序協調通常有3種方法:
a.自下而上(Bottom-up)的方法。恢復開始于最靠近故障的層,當某些故障業(yè)務在本層無法進行恢復時,將轉由上層完成。該方法能使用較為合適的顆粒度對故障業(yè)務進行恢復,而上層的更精細顆粒度的恢復在必要時才完成。自下而上的策略在恢復時間和設備費用上更有優(yōu)勢。
b.自上而下(Top-down)的方法?;謴烷_始于最上層,當上層無法恢復所有的故障業(yè)務時,生存性技術向下層擴展,下層的生存性技術被觸發(fā)。該方法的優(yōu)點是高層能更容易地區(qū)分不同業(yè)務的服務類型和等級,可以為不同的用戶的生存性提供不同的QoS。但低層卻難以檢測到高層是否能夠恢復業(yè)務。
c.第3種策略?;謴烷_始于中間層,依據接收到的告警或生存性的策略向上層或下層擴展。
(2)集成方案
集成方案是基于信號的多層恢復方案的集成。當故障發(fā)生時,恢復方案將對網絡所有層的恢復方案進行綜合考慮,并決定最佳層的恢復操作。集成方案是最靈活的一種方案,但如何配置、實現集成方案所必須的具有各種算法的智能控制是需要解決的問題。
2.7OXC節(jié)點業(yè)務配置和恢復方案
在中興通訊的OXC節(jié)點中,動態(tài)業(yè)務路由和波長分配方案采用集中式控制,動態(tài)業(yè)務的RWA算法問題被分成路由子問題和波長分配子問題,對路由選取策略采取自適應備用路由選取策略。網絡在業(yè)務到達前預先為每個節(jié)點計算多條備用路由,當業(yè)務到達時,主控節(jié)點分析備用路由集合,選取一條最佳路由和波長。動態(tài)業(yè)務到達時為業(yè)務分配路由和波長,將使網絡具有自動調節(jié)網絡流量分布、降低網絡阻塞概率、提高網絡性能的功能。通過調整備用路由集合,可以進一步滿足網絡其他傳送要求,如傳送距離限制等要求。當所有的備用路由均不能滿足傳送業(yè)務時,算法模塊可以調用波長變換模塊,采用虛波長通道來傳送業(yè)務。在重載網絡中,如波長變換不能使得光通道承載業(yè)務,則該業(yè)務阻塞。備用路由的計算是離線進行的,因此,具有較小的時間復雜度、較高的靈活性和較優(yōu)的網絡傳送性能。
在中興通訊的OXC節(jié)點中,恢復方案中采用的路由和波長分配恢復算法是RWA問題,屬于非多項式-完全(NP-完全)問題。在恢復方案中,恢復時間是衡量算法的重要指標。中興通訊的OXC節(jié)點生存性方案主要包括保護和恢復方案,其中保護主要應用于環(huán)網拓撲、邏輯環(huán)網拓撲(即Mesh拓撲中構建邏輯環(huán))和指定通道的1+1和1*9誜1結構,其保護倒換時間能滿足50ms的要求。在Mesh網絡拓撲的生存性技術中,中興通訊的OXC節(jié)點采用基于動態(tài)的恢復方案,波長分配采用時間復雜度低的FF算法,故障業(yè)務的恢復時間小于2ms。
3結束語
光網絡的生存性技術具有響應快速、靈活等特點,能減小網絡故障損失和提高服務質量。隨著光傳送網絡向超高速、超大容量的方向發(fā)展,光網絡生存性的研究將具有更重要的意義。□
參考文獻
1 ITU-T G.841. Types and Characteristics of SDH network protection architectures, 1998
2 Ramamurthy S, Mukherjee B. Survivable WDM Mesh Networks, Part II-Restoration. IEEE ICC‘99, 1999:2023—2030
3 Ramswami S. Survivable WDM Mesh Networks, Part I-Protection.IEEE INFOCOM‘99, NY, 1999, 2:744—751
4 Didier Colle, Maesschalck S D, Develder C, et al. Data-Centric Optical Networks and Their Survivability. IEEE Journal on Selected Areas in Communications, 2002, 20(1):6—20
5 Sophie De Maesschalck,Didier Colle. Intelligent Optical Networking for Multi-layer Survivability. IEEE Communications Magazine, 2002:42—49
6 Yinghua Ye, Sudhir Dixit. On Joint Protection/Restoration in IP-Centric DWDM-Based Optical Transport Networks. IEEE Communications Magazine, 2002:174—183
7 Zhang X, Qiao C. Wavelength Assignment for Dynamic Traffic in Multi-fiber WDM Networks. Proc 7th International Conference on Computer Communications and Networks, Lafayette, LA, Oct 1998:479—485
8 Zhou D Y, Subramaniam S. Survivability in Optical Networks. IEEE Network, 2000,14(6):16—23
(收稿日期:2002-06-03)
作者簡介
程曉飛,南京理工大學碩士畢業(yè),現為北京郵電大學電信工程學院在讀博士生。主要研究方向是WDM光網絡性能研究、WDM光網絡的保護和恢復、WDM光網絡路由和波長分配算法等。
馬恒,武漢華中理工大學碩士畢業(yè)。目前就職于深圳市中興通訊股份有限公司北京研究所,從事光傳輸系統的研究工作。
王振宇,中國科學院碩士畢業(yè)。目前就職于深圳市中興通訊股份有限公司北京研究所,從事光傳輸系統保護恢復方面的研發(fā)工作。
顧畹儀,北京郵電大學電信工程學院院長,教授,博士生導師。長期從事光纖通信領域的科研和教學工作。1992年獲國家有突出貢獻的中青年專家稱號,2001年獲全國優(yōu)秀教師稱號,已發(fā)表學術論文百余篇。主要研究方向為高速超長光纖通信系統、智能光網絡、新一代光節(jié)點設備。