王 杰 趙 超
中國移動通信集團(tuán)安徽有限公司 安徽 淮南 232000
云計算出現(xiàn)前,物理服務(wù)器“雙單一”特征非常明顯,即單一租戶和單一業(yè)務(wù),當(dāng)應(yīng)用需求還未呈幾何級數(shù)增長時,這樣的應(yīng)用與服務(wù)模式是能夠被接受的。但隨著網(wǎng)絡(luò)業(yè)務(wù)的不斷擴(kuò)張,數(shù)據(jù)中心規(guī)模也越來越龐大,以無限增加物理服務(wù)器的方式來滿足應(yīng)用需求顯然是不合適的,單臺服務(wù)利用率無法獲得提升。云計算的出現(xiàn)很好解決了這一問題,在虛擬化技術(shù)支持下,原來的物理服務(wù)器會被虛擬成若干臺服務(wù)器,提高了資源利用率和服務(wù)器使用率,有限的物理服務(wù)器數(shù)量即可滿足應(yīng)用需求。以四核CPU服務(wù)器為例,虛擬化技術(shù)可將一臺四核CPU服務(wù)器虛擬成四臺服務(wù)器,即每個CPU被虛擬成一臺虛擬機,而對于那些資源消耗有效的應(yīng)用來說,根據(jù)具體使用需求,可將一個CPU虛擬成兩臺、四臺,甚至更多臺虛擬機。
虛擬化技術(shù)在實現(xiàn)資源利用率提升的同時,也使服務(wù)器自由遷移變?yōu)榭赡堋T趥鹘y(tǒng)數(shù)據(jù)中心建設(shè)和應(yīng)用中,服務(wù)器遷移事件極少發(fā)生,因為會動用非常多的資源,且會影響IDC業(yè)務(wù)正常運行。在虛擬化環(huán)境下,服務(wù)器遷移并不會發(fā)生在物理空間上,而是在虛擬空間上來實現(xiàn),且在漸進(jìn)式內(nèi)存復(fù)制等技術(shù)方法的支持下,數(shù)據(jù)保存會變得更容易,任務(wù)完成難度也更低,更為重要的是,IDC業(yè)務(wù)并不是因此而受到影響。
在非云計算環(huán)境下,企業(yè)若要更好完成業(yè)務(wù)運營任務(wù),實現(xiàn)運營目標(biāo),滿足自身發(fā)展需要,一般會向運營商租用網(wǎng)絡(luò)硬件基礎(chǔ)設(shè)施,特別是對于那些大型企業(yè)和跨地區(qū)企業(yè)。這樣,企業(yè)就相當(dāng)于擁有了一個屬于自己的數(shù)據(jù)中心,必要時,也可進(jìn)行運維托管。云計算環(huán)境下則不同,企業(yè)并不需要直接向運營商租用網(wǎng)絡(luò)硬件基礎(chǔ)設(shè)施,而是直接租用網(wǎng)絡(luò)資源,包括計算和存儲,相比之下,這樣的租用模式并不需要單獨進(jìn)行運維,更不需要建立運維數(shù)據(jù)中心。而對于運營商來說,云計算環(huán)境下的數(shù)據(jù)中心會更為復(fù)雜,體量也更大,多租戶特征也被更充分體現(xiàn)出來。
網(wǎng)絡(luò)無阻塞的實現(xiàn)主要依靠于“胖樹結(jié)構(gòu)”應(yīng)用?!芭謽浣Y(jié)構(gòu)”是在原有樹形結(jié)構(gòu)基礎(chǔ)上提出的,它不算是新技術(shù)或新思路,只是對原有應(yīng)用的一種變形。樹形網(wǎng)絡(luò)架構(gòu)原理并不影響云計算應(yīng)用,但二者在根本性需求上卻存在沖突。眾所周知,云計算數(shù)據(jù)中心形成后,數(shù)據(jù)信息吞吐量較之前比有了很大提升,其內(nèi)部資源節(jié)點數(shù)量也隨需求的增加而明顯增多,若依然以傳統(tǒng)“南北向”流量模型為標(biāo)準(zhǔn)進(jìn)行應(yīng)用,網(wǎng)絡(luò)阻塞問題一定會更為嚴(yán)重,因此,有“南北向”流量模式向“東西向”流量模式轉(zhuǎn)變便成為必然。區(qū)別在于,“南北向”流量模式是一種用戶訪問服務(wù)器的流量模式,點到點特征較明顯;而“東西向”流量模式是一種由服務(wù)器到服務(wù)器的流量模式,具有面到面特征。
胖樹結(jié)構(gòu)解決了樹形結(jié)構(gòu)的“通信瓶頸”問題,隨著根節(jié)點附近帶寬逐漸增加,網(wǎng)絡(luò)阻塞現(xiàn)象也不會再發(fā)生。需要指出的是,由胖樹結(jié)構(gòu)所支持的數(shù)據(jù)中心網(wǎng)絡(luò),需要將全部核心交換機,以及網(wǎng)絡(luò)邊緣交換機進(jìn)行互聯(lián),且保證核心交換機與每一臺網(wǎng)絡(luò)邊緣交換機間有且僅有一條鏈路,這樣做的目的在于,能夠更好平衡數(shù)據(jù)流量,以此來降低網(wǎng)絡(luò)阻塞發(fā)生概率。
虛擬環(huán)境下的數(shù)據(jù)通信,其原理與物理環(huán)境下的數(shù)據(jù)通信原理相類似,只是當(dāng)在完成虛擬機與物理機通信時,需要將虛擬機與網(wǎng)絡(luò)端口進(jìn)行關(guān)聯(lián)。從數(shù)據(jù)交換的角度看,物理空間下的數(shù)據(jù)交換需要由物理機提供支持,而虛擬空間下數(shù)據(jù)交換則需要由虛擬機提供支持。但由于所處空間不同,虛擬交換機是無法直接被其他網(wǎng)絡(luò)設(shè)備所感知的,更加無法被網(wǎng)絡(luò)管理員直接管理,在這種情況下,通信流量監(jiān)管與端口策略等功能便無法實現(xiàn)。為更好解決“不感知”問題,IEEE 802.1Qbg Edge Virtual Bridging(以下簡稱EVB)定義了關(guān)于虛擬機網(wǎng)絡(luò)接入的技術(shù)標(biāo)準(zhǔn),如圖1。
圖1 EVB架構(gòu)圖
結(jié)合EVB架構(gòu)圖可知,一臺虛擬機包含多個VSI接口,虛擬機間可自由通信,也可通過中繼ER(邊界)和橋接LAN上的其他虛擬機進(jìn)行通信。一般情況下,同一臺物理服務(wù)器中的多臺虛擬機之間可進(jìn)行直接通信,這一通信方式被稱為虛擬邊緣橋接,即VEB。顯然,這樣的通信方式是無法滿足不同物理服務(wù)器中虛擬機間通信需求的。VEPA(虛擬以太端口匯聚)通信方式的制定解決了這一問題,在VEPA支持下,虛擬機間的流量交換行為將不再局限于某一臺物理服務(wù)器內(nèi),而是允許發(fā)生在上聯(lián)交換機上。事實上,即便是同一物理服務(wù)器中的兩臺或多臺虛擬機進(jìn)行數(shù)據(jù)傳輸,交換數(shù)據(jù)依然會被首先送往上聯(lián)交換機,然后再由上聯(lián)交換分配回另一臺或幾臺虛擬機上。上聯(lián)交換機會根據(jù)虛擬機的MAC地址來進(jìn)行尋址,確保數(shù)據(jù)轉(zhuǎn)發(fā)準(zhǔn)確。相比VEB,VEPA在實現(xiàn)不同物理服務(wù)器虛擬機間數(shù)據(jù)傳輸方面發(fā)揮了更好作用,但如果僅僅是完成同一物理服務(wù)器內(nèi)不同虛擬機間的數(shù)據(jù)傳輸,這樣的通信方式顯然不是最佳選擇,因此,EVB標(biāo)準(zhǔn)定義多通道技術(shù),即VEB和VEPA被允許同時存在于一臺物理服務(wù)器中,且各自有獨立的通道,這樣便為流量管理和網(wǎng)絡(luò)配置提供了便利。
作為一項新概念,“租戶Overlay網(wǎng)絡(luò)”主要是為了實現(xiàn)云計算數(shù)據(jù)中心大量租戶支持而被提出的。Overlay網(wǎng)絡(luò)位于IP層之上,其封裝格式較特殊,且格式并不固定,有VXLAN格式,也會有NVGRE格式,但都會通過報頭信息來對租戶進(jìn)行識別,映射加封裝的核心思想特征十分明顯。
結(jié)合圖2,VM1租戶在將數(shù)據(jù)發(fā)送出去后,邊緣交換機S1首先會收到數(shù)據(jù)信息,但它并不會立刻將數(shù)據(jù)轉(zhuǎn)發(fā)出去,而是將數(shù)據(jù)報文中的目的地址映射為S2(VM2直連邊緣交換機)的地址,而非實際地址VM2,之后對原始報文進(jìn)行封裝。當(dāng)邊緣交換機S2接收到數(shù)據(jù)報文后,會進(jìn)行解封,然后根據(jù)原始報文信息將數(shù)據(jù)傳遞給VM2。
圖2 租戶Overlay網(wǎng)絡(luò)
在整個過程中,封裝格式與映射管理是兩個關(guān)鍵點,封裝格式前面已做過介紹,映射管理一般有兩種類型,一是自發(fā)學(xué)習(xí),二是通過控制命令。不同類型對應(yīng)著不同數(shù)據(jù)中心規(guī)模,對于中小型數(shù)據(jù)中心來說,自發(fā)學(xué)習(xí)類型更適用,整個過程與傳統(tǒng)網(wǎng)絡(luò)體系的二層學(xué)習(xí)較類似,應(yīng)用起來也比較簡單。相比之下,通過控制命令具有更好擴(kuò)展性,一般大型數(shù)據(jù)中心應(yīng)用較多。
在傳統(tǒng)數(shù)據(jù)中心中,生成樹協(xié)議(STP)在防止二層網(wǎng)絡(luò)環(huán)路方面發(fā)揮了很好作用,但在云計算環(huán)境下,該協(xié)議缺點被更多暴露出來,比如:
(1)以避免環(huán)路發(fā)生為目的所作出的特定端口阻塞行為,將嚴(yán)重降低鏈路使用效率;
(2)無法實現(xiàn)等價多路徑轉(zhuǎn)發(fā);
(3)網(wǎng)絡(luò)收斂速度慢。
為彌補生成樹協(xié)議缺陷,支持大規(guī)模二層網(wǎng)絡(luò)的協(xié)議被提出,其中最常見的協(xié)議是多鏈路透明互聯(lián)協(xié)議(TRILL)和最短路徑橋接協(xié)議(SPB),該兩項協(xié)議均借鑒了三層路由設(shè)計思想,成功將二層技術(shù)優(yōu)點與三層技術(shù)優(yōu)點進(jìn)行融合,同時規(guī)避掉了原有缺點,同時以現(xiàn)有IS-IS路由協(xié)議來對網(wǎng)絡(luò)拓?fù)溥M(jìn)行計算和維護(hù)。
在TRILL協(xié)議運行方面,各支持TRILL協(xié)議運行的路由網(wǎng)橋會以IS-IS鏈路狀態(tài)路由協(xié)議為標(biāo)準(zhǔn)計算網(wǎng)絡(luò)拓?fù)?并借助SPF算法完成對單播數(shù)據(jù)轉(zhuǎn)發(fā)最短路徑的計算。而對于組播和廣播報文,以及未知單播來說,會根據(jù)分發(fā)樹進(jìn)行報文轉(zhuǎn)發(fā)。在防環(huán)路方面,TRILL協(xié)議規(guī)定了Hop Count字段,報文被轉(zhuǎn)發(fā)后,每經(jīng)過一個路由器,該字段數(shù)值就會在原有基礎(chǔ)上減掉“1”,當(dāng)字段數(shù)值被減為0時,報文便會被最后一個接受的路由網(wǎng)橋所丟棄。當(dāng)進(jìn)行組播轉(zhuǎn)發(fā)時,除了有Hop Count字段做支持外,還需要進(jìn)行反向路徑檢測。
在SPB協(xié)議方面,SPB協(xié)議主要是連接網(wǎng)橋與網(wǎng)橋,它在連接客戶端與數(shù)據(jù)中心過程中發(fā)揮了重要作用。該協(xié)議主要特點有:
(1)定義了I-SID,并用作區(qū)別多個不同拓?fù)?其數(shù)據(jù)信息以BVID的形式被封裝在數(shù)據(jù)報文中,這將有助于解決不同業(yè)務(wù)多拓?fù)滢D(zhuǎn)發(fā)的問題;
(2)所有到達(dá)UNI及其相關(guān)節(jié)點的SPT只用于進(jìn)行單播與組播報文轉(zhuǎn)發(fā);
(3)ECT以處理兩個UNI間存在多條等價路徑時負(fù)載均衡轉(zhuǎn)發(fā)。
在云計算需求下,數(shù)據(jù)中心從多個方面提供了具有現(xiàn)代化特征的數(shù)據(jù)信息服務(wù),包括協(xié)議與架構(gòu),運維與管理,并且在新技術(shù)支持下,應(yīng)用來自不同層面的應(yīng)用需求正不斷被滿足。目前,包括IETF和IEEE在內(nèi)的多個標(biāo)準(zhǔn)組織都在積極研究和制定基于與計算環(huán)境的數(shù)據(jù)中心應(yīng)用標(biāo)準(zhǔn),基于當(dāng)前主要應(yīng)用需求,虛擬化和多租戶被更多關(guān)注。另外,采用不同架構(gòu)對實現(xiàn)應(yīng)用目的也有影響,特別是在流量模型不同,以及無法實現(xiàn)拓?fù)浣Y(jié)構(gòu)統(tǒng)一的情況下,但需要新技術(shù)來作支持是卻不爭事實,只有不斷研制新技術(shù),才能滿足實際應(yīng)用需求,使原有架構(gòu)性能得到提升。