王澤林,謝夢楠(中國聯(lián)通網(wǎng)絡(luò)技術(shù)研究院,北京100048)
國內(nèi)運營商互聯(lián)網(wǎng)骨干網(wǎng)一般按照雙平面設(shè)置,2 個平面流量基本均衡,同時能夠起到保護(hù)的作用。骨干網(wǎng)與城域網(wǎng)一般通過2 對路由器進(jìn)行互聯(lián),分別對應(yīng)2 個平面,兩網(wǎng)之間通過BGP 路由協(xié)議疏導(dǎo)互通流量。骨干網(wǎng)與城域網(wǎng)之間采用不同的互聯(lián)結(jié)構(gòu)、不同的路由策略均會引起骨干網(wǎng)2個平面流量的均衡問題,以及骨干網(wǎng)和城域網(wǎng)核心路由器之間流量的橫穿等問題。本文主要研究國內(nèi)運營商互聯(lián)網(wǎng)骨干網(wǎng)與城域網(wǎng)之間典型的互聯(lián)結(jié)構(gòu)以及相應(yīng)的路由策略,給出不同方案之間的比較。
運營商骨干網(wǎng)與城域網(wǎng)一般通過2對路由器進(jìn)行互聯(lián),分別對應(yīng)2個平面,連接方式分為口字型連接和交叉連接。
骨干網(wǎng)邊緣接入路由器(A路由器)與城域網(wǎng)核心路由器(CR)分平面互聯(lián)(見圖1)。CR1 與A1 路由器相聯(lián),CR2 與A2 路由器相聯(lián),CR1 和CR2 互聯(lián),A1 和A2路由器視流量情況決定是否互聯(lián)。CR1與A1路由器之間的鏈路用來疏通骨干網(wǎng)平面一與城域網(wǎng)之間的流量,CR2與A2路由器之間的鏈路用來疏通骨干網(wǎng)平面二與城域網(wǎng)之間的流量。
圖1 口字型連接示意圖
骨干網(wǎng)A 路由器與城域網(wǎng)CR 交叉互聯(lián)(見圖2)。CR1 與A1、A2 路由器相聯(lián),CR2 與A1、A2 路由器相聯(lián),CR1和CR2互聯(lián),A1和A2路由器視流量情況決定是否互聯(lián)。CR1 與A1、A2 路由器之間的鏈路以及CR2 與A1、A2 路由器之間的鏈路分別用來疏通骨干網(wǎng)2個平面與城域網(wǎng)之間的流量。
圖2 交叉連接示意圖
口字型連接結(jié)構(gòu)具有以下優(yōu)缺點。
a)優(yōu)點:單邊連接節(jié)省CR、骨干網(wǎng)A路由器端口資源和對應(yīng)鏈路的傳輸資源,且骨干網(wǎng)雙平面結(jié)構(gòu)清晰。
b)缺點:CR之間存在上行橫穿流量(可以配合調(diào)整CR下發(fā)到BRAS/SR的路由策略來避免此問題)。
交叉型連接結(jié)構(gòu)具有以下優(yōu)缺點。
a)優(yōu)點:CR之間不存在上行橫穿流量。
b)缺點:增加了CR、骨干網(wǎng)A路由器的端口消耗和傳輸資源的消耗,骨干網(wǎng)雙平面結(jié)構(gòu)不清晰。
考慮成本因素,推薦使用口字型連接。
骨干網(wǎng)與城域網(wǎng)之間通過EBGP進(jìn)行路由交換。
a)CR 給BRAS/SR 下發(fā)骨干網(wǎng)發(fā)布的明細(xì)路由。在CR 與城域網(wǎng)BRAS/SR 之間開啟IBGP,將CR 接收到的明細(xì)路由通過IBGP下發(fā)到BRAS/SR(根據(jù)業(yè)務(wù)開通情況可考慮下發(fā)其他路由)。上行流量根據(jù)明細(xì)路由進(jìn)行優(yōu)選,選擇不同的CR 作為出口進(jìn)入骨干網(wǎng)。此策略解決了口字型連接下CR間橫穿流量的問題。
b)CR 給BRAS/SR 下發(fā)默認(rèn)路由。在CR 與城域網(wǎng)BRAS/SR 之間使用IGP,通過下發(fā)默認(rèn)路由給BRAS/SR 設(shè)備,引導(dǎo)上行流量負(fù)載分擔(dān)到2 臺CR,如骨干網(wǎng)A路由器與CR之間采用口字型連接,則由于路由優(yōu)選的因素,部分上行流量會在CR之間進(jìn)行橫穿。
a)方式一:城域網(wǎng)2 臺CR 發(fā)布不同的用戶地址段(各一半)給骨干網(wǎng)。城域網(wǎng)2 臺CR 發(fā)布不同的用戶地址段給骨干網(wǎng)A路由器,同時要做到2臺CR發(fā)布的用戶路由基本均衡,來引導(dǎo)流量大致均分到2臺CR入城域網(wǎng)。
b)方式二:城域網(wǎng)2 臺CR 發(fā)布相同的用戶地址段(所有城域網(wǎng)用戶地址段)給骨干網(wǎng)。城域網(wǎng)2 臺CR發(fā)布相同的用戶路由給骨干網(wǎng)A路由器,同時在骨干網(wǎng)內(nèi)部啟用虛擬下一跳技術(shù),使流量在骨干網(wǎng)內(nèi)部負(fù)載均衡到2臺A路由器,進(jìn)而從骨干網(wǎng)進(jìn)入城域網(wǎng)。
虛擬下一跳技術(shù)是一種實現(xiàn)IBGP 的負(fù)載均衡辦法。假設(shè)網(wǎng)絡(luò)中用IBGP 承載用戶路由,IGP 為IS-IS,在2臺目的路由器(骨干網(wǎng)A路由器)中分別設(shè)置1個相同的虛擬地址,在與其他IBGP鄰居路由器宣告路由時,將該地址作為到達(dá)下一跳地址,在2臺目的路由器上再分別配置1 條靜態(tài)路由,將該虛擬地址的下一跳指向城域網(wǎng)CR 互聯(lián)接口的地址。采用該方式后,從源到目的的流量將在BGP 屬性Weight、Local Prefer?ence、AS-path、Origin、MED均相同的情況下,強行將到達(dá)目的的路由下一跳指向相同的虛擬地址。該地址對于源路由器在選路時完全相同,將以負(fù)載均衡的方式分別發(fā)送到2臺目的路由器(骨干網(wǎng)A路由器)。
采用此方法,還可以在目的路由器建立IBGP鄰居中設(shè)置路由策略控制部分路由(China169 A 路由器中可設(shè)置為城域網(wǎng)CR 發(fā)布的所有用戶路由)的虛擬下一跳,而其他路由的下一跳不變,提高路由的可控性。
2 種方式對比,方式二能更好地做到骨干網(wǎng)的流量均衡以及骨干網(wǎng)到城域網(wǎng)的流量均衡,但需要增加配置量,同時在骨干網(wǎng)使用虛擬下一跳技術(shù)之前,還需要全網(wǎng)規(guī)劃某運營商所有城域網(wǎng)的虛擬下一跳地址,避免重復(fù)。
基于上述的上、下行流量引導(dǎo)策略,考慮骨干網(wǎng)與城域網(wǎng)互聯(lián)結(jié)構(gòu)及策略時,可以有以下2種方案(方案不限于以下2 種,本文只挑選了最有可能的2 種進(jìn)行闡述)。
a)方案一:CR與A路由器之間口字型連接,CR與BRAS 間開啟IBGP 承載用戶路由,CR 向BRAS/SR 設(shè)備下發(fā)運營商網(wǎng)內(nèi)路由,2 臺CR 向直連的2 臺A 路由器各發(fā)一半的用戶路由,骨干網(wǎng)策略不變。流量流向參見圖3。
圖3 方案一流量流向圖
(a)上行流量引導(dǎo):根據(jù)明細(xì)路由進(jìn)行優(yōu)選。
(b)下行流量引導(dǎo):根據(jù)2臺A路由器向骨干發(fā)布的不同用戶路由進(jìn)行下行流量引流。
(c)優(yōu)點:無CR 間橫穿上行流量,無骨干網(wǎng)橫穿流量。
(d)缺點:2臺CR雖然是各發(fā)布一半的地址段,但由于不同地址段對應(yīng)的流量不一定相同,仍然可能會造成BRAS/SR至CR的鏈路流量不均衡。
b)方案二:CR 與A 路由器之間口字型連接,CR向BRAS 設(shè)備下發(fā)默認(rèn)路由,2 臺CR 向直連的2 臺A路由器發(fā)全部的城域網(wǎng)用戶路由,骨干網(wǎng)采用虛擬下一跳技術(shù),將發(fā)布用戶路由的下一跳地址指向1 個虛擬地址,虛擬地址的真實下一跳地址為2臺CR的地址(虛擬下一跳在2臺A路由器上設(shè)置)。參見圖4。
圖4 方案二流量流向圖
(a)上行流量引導(dǎo):從BRAS到CR負(fù)載分擔(dān)上行,CR到A路由器直接上行。
(b)下行流量引導(dǎo):骨干網(wǎng)內(nèi)流量負(fù)載分擔(dān)到2臺A路由器,從A路由器到CR流量直接下行,從CR到BRAS流量直接下行。
(c)優(yōu)點:無CR 間橫穿上行流量,無骨干網(wǎng)A 路由器之間平面間橫穿流量,骨干網(wǎng)流量均衡,BRAS到CR流量均衡,CR至A路由器流量均衡。
(d)缺點:全國所有A 路由器需要增加虛擬下一跳的配置,需要增加虛擬下一跳到CR 的實際下一跳的靜態(tài)路由配置,全國需統(tǒng)一規(guī)劃所有城域網(wǎng)的虛擬下一跳地址。
由于方案二需要全網(wǎng)統(tǒng)一增加A 路由器的配置,所以在該方案的實施過程中,不同城域網(wǎng)與骨干網(wǎng)之間路由策略的修改會有先后順序,不可避免地會出現(xiàn)過渡階段,當(dāng)某一城域網(wǎng)與骨干網(wǎng)之間已經(jīng)修改為方案一的路由策略方案,而對端城域網(wǎng)與骨干網(wǎng)之間還未修改時,方案二處于改造的中間狀態(tài),如圖5所示。
運營商互聯(lián)網(wǎng)骨干網(wǎng)與城域網(wǎng)的連接方式及互聯(lián)策略眾多,本文提出了2 種典型的互聯(lián)結(jié)構(gòu)及互聯(lián)策略方案供運營商選擇。不同方案的選擇應(yīng)綜合考慮技術(shù)方面的優(yōu)缺點、投資成本、改造難度等多種因素,在現(xiàn)有網(wǎng)絡(luò)結(jié)構(gòu)及互聯(lián)策略的基礎(chǔ)上逐步演進(jìn)。
圖5 方案二改造中間狀態(tài)流量流向圖
[1] 鄧煒,趙武,范春湘.利用BGP 虛擬下一跳技術(shù)實現(xiàn)IP 骨干網(wǎng)流量負(fù)載均衡[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2009(8):63-66.
[2] 陳敏.廣域網(wǎng)架構(gòu)與路由技術(shù)項目教程[M].北京:電子工業(yè)出版社,2013:213-255.
[3] Randy Zhang,Micah Bartell.BGP 設(shè)計與實現(xiàn)[M].北京:人民郵電出版社,2012:110-180.
[4] Priscilla Oppenheimer. Top-Down Network Design[M]. Indianapo?lis:Cisco Press,2011:51-78.
[5] Parkhurst,William R. Cisco BGP-4 Command and Configuration Handbook[M].Indianapolis:Cisco Press,2001:120-142.
[6] Faraz Shamim,Zaheer Aziz,Johnson Liu,et al.IP 路由協(xié)議疑難解析[M].北京:人民郵電出版社,2013:50-70.
[7] Jeff Doyle. TCP/IP 路由技術(shù)(第二卷)[M]. 北京:人民郵電出版社,2009:350-380.
[8] 張國清.路由技術(shù)(IPv4 版)[M].北京:電子工業(yè)出版社,2012:70-120.
[9] Todd Lammle.CCNA學(xué)習(xí)指南[M].北京:電子工業(yè)出版社,2009:267-387.
[10]Diane Teare.CCNP Route[M].北京:人民郵電出版社,2011:297-457.
[11]Russ White,Don Slice,Alvaro Retana.路由設(shè)計的優(yōu)化[M].北京:人民郵電出版社,2013:348-392.
[12]Zaheer Aziz,Johnson Liu,Abe Martey. IP 路由協(xié)議疑難解析[M].北京:人民郵電出版社,2013:52-137.
[13]Sam Halabi.Internet 路由結(jié)構(gòu)[M].北京:人民郵電出版社,2015:221-228.
[14] IETF RFC 4271.A Border Gateway Protocol 4(BGP-4)[S/OL].[2015-07-02].https://www.rfc-editor.org/rfc/rfc4271.txt.
[15] IETF RFC 1997. BGP Communities Attribute[S/OL].[2015-07-02].https://www.rfc-editor.org/rfc/rfc1997.txt.