萬(wàn)寶秀 王智鋼 顧蕓涵 陳珠
摘 要:近年來,云計(jì)算作為一種新的服務(wù)模式已成為計(jì)算機(jī)科學(xué)領(lǐng)域的一個(gè)研究熱點(diǎn)。本文首先介紹了云計(jì)算的概念、特征及關(guān)鍵技術(shù),然后對(duì)云計(jì)算下的網(wǎng)絡(luò)通信從4個(gè)方面進(jìn)行了簡(jiǎn)單的分析,最后提出了筆者下一步研究的方向。
關(guān)鍵詞:云計(jì)算 通信 虛擬化 網(wǎng)絡(luò)技術(shù)
中圖分類號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2014)02(a)-0068-02
隨著輸水管道的日漸成熟,我們從自家打井取水逐漸過渡到通過水龍頭獲取來自自來水廠的水;隨著金融業(yè)的發(fā)展,人類從自己保藏財(cái)物逐漸過渡把錢存到銀行;同樣,隨著網(wǎng)絡(luò)通信技術(shù)的飛速發(fā)展,人類正在由通過利用個(gè)人存儲(chǔ)設(shè)備過渡到向數(shù)據(jù)中心獲取信息。云計(jì)算(cloud computing)是“第三次 IT革命”,它集中體現(xiàn)了信息時(shí)代網(wǎng)絡(luò)通信發(fā)展的方向。
1 云計(jì)算的概念
近年來,云計(jì)算作為一種新的服務(wù)模式,已經(jīng)成為IT業(yè)討論最多的話題。云計(jì)算是讓用戶在不了解資源的情況下做到按照需求分配,把資源虛擬化為一片云,我們可以通過網(wǎng)絡(luò)的按照需求擴(kuò)展方式來獲得所需的應(yīng)用軟件及互聯(lián)網(wǎng)相關(guān)的服務(wù)。自從2007年IBM提出云計(jì)算的概念時(shí),許多專家學(xué)者、相關(guān)產(chǎn)商以及專門的研究組織都相繼給出關(guān)于云計(jì)算的不同定義。結(jié)合自己的理解,筆者認(rèn)同云計(jì)算是將存儲(chǔ)、通信、網(wǎng)絡(luò)、管理解決方案以及相關(guān)業(yè)務(wù)應(yīng)用相聯(lián)系,以虛擬技術(shù)為核心,以用戶為主體,以網(wǎng)絡(luò)為載體的大型資源共享型商業(yè)服務(wù)模式。
2 云計(jì)算的特征及關(guān)鍵技術(shù)
“云”是存儲(chǔ)在互聯(lián)網(wǎng)集群上的資源,它包括硬件資源(服務(wù)器、存儲(chǔ)、CPU等)和軟件資源(應(yīng)用軟件、集成開發(fā)環(huán)境等),本地計(jì)算機(jī)只需要通過互聯(lián)網(wǎng)發(fā)送一個(gè)需求信息,遠(yuǎn)端就會(huì)有成千上萬(wàn)的計(jì)算機(jī)為用戶提供需要的資源并將結(jié)果返回到本地計(jì)算機(jī)。云計(jì)算的主要特征總結(jié)為以下五點(diǎn):共享模式;盈利模式;良好的擴(kuò)展性;更低的成本;良好的可伸縮性。云計(jì)算的關(guān)鍵技術(shù)概括為以下四點(diǎn):簡(jiǎn)單的程序模型;數(shù)據(jù)存儲(chǔ)與管理;分布式數(shù)據(jù)庫(kù);虛擬化技術(shù)。
3 云計(jì)算下的網(wǎng)絡(luò)通信分析
3.1 網(wǎng)絡(luò)虛擬化的實(shí)現(xiàn)
而隨著云計(jì)算的涌入,我們?cè)谒伎既绾螌?shí)現(xiàn)網(wǎng)絡(luò)虛擬化,如何實(shí)現(xiàn)物理機(jī)內(nèi)部的虛擬網(wǎng)絡(luò),外部網(wǎng)絡(luò)又如何靈活調(diào)整以適應(yīng)虛擬機(jī)對(duì)網(wǎng)絡(luò)不斷變化的要求,又如何確保網(wǎng)絡(luò)環(huán)境的安全性。
主機(jī)網(wǎng)絡(luò)虛擬化技術(shù)主要包括虛擬網(wǎng)卡技術(shù)和虛擬網(wǎng)橋技術(shù),現(xiàn)在一般每臺(tái)物理機(jī)均有兩塊物理網(wǎng)卡,其中一塊物理網(wǎng)卡用于連接外網(wǎng);另一塊網(wǎng)卡用于連接內(nèi)網(wǎng)交換機(jī)。在虛擬機(jī)內(nèi)部,虛擬機(jī)會(huì)看到兩塊網(wǎng)卡,一塊分配內(nèi)網(wǎng)IP地址;另一塊分配了公網(wǎng)IP地址。很顯然,虛擬機(jī)對(duì)外發(fā)送的數(shù)據(jù)包的路由選路是根據(jù)虛擬機(jī)自身的路由配置決定的。同一臺(tái)物理機(jī)中的多臺(tái)虛擬機(jī),我們還可以劃分VLAN,控制不同虛擬機(jī)間的通訊。
那么多塊虛擬網(wǎng)卡在同一臺(tái)物理服務(wù)器中共享一塊物理網(wǎng)卡的同時(shí)對(duì)外仍然表現(xiàn)為多塊獨(dú)立的網(wǎng)卡。這就借助于虛擬網(wǎng)橋,它是將多個(gè)虛擬網(wǎng)卡綁定到物理網(wǎng)卡并對(duì)虛擬網(wǎng)卡的流量進(jìn)行可控的一種技術(shù)手段。
除了主機(jī)網(wǎng)絡(luò)的虛擬化,網(wǎng)絡(luò)設(shè)備的虛擬化也是很重要的技術(shù),網(wǎng)絡(luò)設(shè)備虛擬化除了對(duì)于交換機(jī)核心架構(gòu)的無阻塞的要求外,我們可以將多臺(tái)設(shè)備邏輯的看成一臺(tái),類似于VSS(Virtual Switching Systems)技術(shù),可以將兩臺(tái)設(shè)備邏輯地堆疊在一起,能夠做到相互的備份。網(wǎng)絡(luò)設(shè)備虛擬化可以將多臺(tái)網(wǎng)絡(luò)設(shè)備虛擬成多臺(tái)虛擬網(wǎng)絡(luò)設(shè)備,管理員接入任何一個(gè)設(shè)備都可以對(duì)該虛擬設(shè)備進(jìn)行管理,從而在網(wǎng)絡(luò)部署和管理上都大大簡(jiǎn)化了工作量。
3.2 網(wǎng)絡(luò)通信流量監(jiān)控和性能
我們一般通過虛擬機(jī)交換機(jī)解決同一臺(tái)物理服務(wù)器內(nèi)部的虛擬機(jī)二層網(wǎng)絡(luò)互訪問題,但其實(shí)使用虛擬機(jī)交換機(jī)還存在兩大問題:一是虛擬機(jī)之間的流量監(jiān)控問題;二是性能問題,當(dāng)虛擬機(jī)網(wǎng)絡(luò)流量越大,虛擬交換機(jī)就會(huì)占用越多的CPU資源,同時(shí)也會(huì)降低了服務(wù)器支持更多虛擬機(jī)的能力。
為了解決這兩大問題,采用兩種技術(shù)標(biāo)準(zhǔn)是802.1Qgb-edge virtual bridging(邊緣虛擬橋技術(shù))和802.1BR-Bridge Port Extension。
邊緣虛擬橋技術(shù)是當(dāng)前用于解決虛擬化環(huán)境中的虛擬機(jī)與互聯(lián)網(wǎng)之間的溝通與管理邊界問題而產(chǎn)生,并在此標(biāo)準(zhǔn)802.1 Qbg定義的框架基礎(chǔ)上可以實(shí)現(xiàn)VM生命周期與網(wǎng)絡(luò)的自動(dòng)化關(guān)聯(lián)、網(wǎng)絡(luò)屬性的靈活變更。EVB技術(shù)中,VEB/VEPA各種部件位于服務(wù)器一側(cè),對(duì)服務(wù)器的流量進(jìn)行轉(zhuǎn)發(fā),VEB/VEPA各種部件轉(zhuǎn)發(fā)的流量包括虛擬服務(wù)器之間,和虛擬服務(wù)器與邊緣交換機(jī)(與物理服務(wù)器直連)之間的全部流量。從技術(shù)實(shí)現(xiàn)的角度,以及某些特殊應(yīng)用場(chǎng)景下,802.1Qbg的不同模式是可以同時(shí)存在的,并且技術(shù)上要求能夠多層級(jí)聯(lián),這在標(biāo)準(zhǔn)預(yù)備文檔中也進(jìn)行了描述。但在更多的場(chǎng)景下,并不需要復(fù)雜的級(jí)聯(lián)拓?fù)浜蛯哟?,?biāo)準(zhǔn)在使用上建議了一個(gè)基本的EVB架構(gòu)。
802.1BR-Bridge Port Extension是CISCO提出的新技術(shù),通過引入端口擴(kuò)展技術(shù),運(yùn)用了MPLS技術(shù)的思想,為以太網(wǎng)報(bào)文增加TAG標(biāo)簽,外部端口擴(kuò)展設(shè)備使用TAG中的信息來實(shí)現(xiàn)報(bào)文轉(zhuǎn)發(fā)和策略控制。當(dāng)然如何分發(fā)TAG必須新的協(xié)議的支持,雖說8021.Br提供了一整套的網(wǎng)絡(luò)虛擬化解決措施,但還是需要改變硬件設(shè)備來達(dá)到這樣的要求。
這兩種處于發(fā)展中的標(biāo)準(zhǔn),我們還不能說誰(shuí)更好,就像IP協(xié)議和ATM協(xié)議的發(fā)展一樣,隨著云計(jì)算技術(shù)的飛速發(fā)展,最終會(huì)有這樣的一種技術(shù)標(biāo)準(zhǔn)占據(jù)主流。
3.3 網(wǎng)絡(luò)通信中大數(shù)據(jù)的處理
我們正處在一個(gè)信息化的時(shí)代,據(jù)工業(yè)和信息化部電信管理局公布的最新統(tǒng)計(jì)數(shù)據(jù)顯示,我國(guó)網(wǎng)民數(shù)量達(dá)到5.64億人,手機(jī)網(wǎng)民規(guī)模4.2億,網(wǎng)民人均周上網(wǎng)時(shí)長(zhǎng)達(dá)20.5小時(shí)。伴隨著上網(wǎng)的人數(shù)激增,我們?cè)诨ヂ?lián)網(wǎng)中產(chǎn)生的數(shù)據(jù)也是呈指數(shù)級(jí)增長(zhǎng)。大量信息在給人們帶來方便的同時(shí)也帶來了很多的問題:第一是信息量大,難以消化;第二是信息真假難以辨識(shí);第三是信息安全難以保證;第四是信息形式不一致,難以統(tǒng)一處理。這樣的網(wǎng)絡(luò)環(huán)境下,人們開始提出一個(gè)新的口號(hào):“要學(xué)會(huì)拋棄信息”。人們開始想:“如何才能不被龐大的信息量淹沒,而是從中及時(shí)發(fā)現(xiàn)有用的知識(shí)、提高信息利用率?”這時(shí)出現(xiàn)了新的技術(shù),能夠挖掘有用信息,“綠色”了網(wǎng)絡(luò)存儲(chǔ)環(huán)境——數(shù)據(jù)挖掘(Data Mining)技術(shù)便應(yīng)用而生了。
數(shù)據(jù)挖掘的研究包括多個(gè)不同學(xué)科領(lǐng)域的技術(shù)和成果,使得目前的數(shù)據(jù)挖掘方法呈現(xiàn)多種多樣的形式。數(shù)據(jù)挖掘技術(shù)分為很多類,其中一種知識(shí)發(fā)現(xiàn)數(shù)據(jù)類挖掘技術(shù),它包括關(guān)聯(lián)規(guī)則、人工神經(jīng)元網(wǎng)絡(luò)、支持向量機(jī)、決策樹、粗糙集等多個(gè)方面。我們重點(diǎn)研究分布式并行關(guān)聯(lián)規(guī)則挖掘算法,該算法針對(duì)分布式應(yīng)用數(shù)據(jù)架構(gòu),不需要產(chǎn)生全局FP-tree,避免了FP-tree可能過大而內(nèi)存無法容納的問題,算法在各個(gè)主要步驟上都實(shí)現(xiàn)了并行處理。
結(jié)合現(xiàn)實(shí),比如交通事故,它產(chǎn)生的數(shù)據(jù)本質(zhì)是多維的,甚至是雜亂無章的,那么如何組織這些比較分散的數(shù)據(jù)呢?有必要研究一下車輛事故屬性。車輛事故屬性是指某次車輛事故發(fā)生時(shí),人車路環(huán)境和時(shí)空狀態(tài),以及車輛事故本身的特點(diǎn)。通過解析這些屬性,對(duì)其整理分析,進(jìn)行數(shù)據(jù)挖掘。然后,我們可通過建立一些交通事故屬性的模型,以層次圖的形式,列出這些事故屬性,并且找出這些屬性之間的相關(guān)聯(lián)系,比如車輛屬性、天氣屬性、道路屬性、駕駛者屬性、時(shí)間屬性等等類似,考慮到各屬性之間的相關(guān)性,可以結(jié)合數(shù)學(xué)建模的方法,構(gòu)建出星型全連接結(jié)構(gòu)的數(shù)據(jù)結(jié)構(gòu)i。最后我們可以借助關(guān)聯(lián)規(guī)則挖掘的算法求出所有的頻繁項(xiàng)集。
3.4 云計(jì)算下通信網(wǎng)絡(luò)的擁塞
由于遷移往往帶來服務(wù)器之間橫向流量的增加,導(dǎo)致云計(jì)算內(nèi)部的流量模型從以縱向流量(用戶訪問服務(wù)器流量)為主轉(zhuǎn)變?yōu)橐詸M向流量(服務(wù)器之間的流量)為主,這樣的轉(zhuǎn)變會(huì)使我們對(duì)網(wǎng)絡(luò)的要求也會(huì)隨之調(diào)整,否則肯定帶來網(wǎng)絡(luò)的擁塞問題。
現(xiàn)在數(shù)據(jù)中心的網(wǎng)絡(luò)架構(gòu)大多是分為核心、匯聚、接入層,這個(gè)時(shí)候如果當(dāng)兩臺(tái)不同分支的設(shè)備進(jìn)行互訪,仍然需要通過核心層,一方面增加了時(shí)延;另一方面也不適應(yīng)云計(jì)算環(huán)境下的橫向流量的通訊,因?yàn)楫?dāng)橫向流量激增,肯定會(huì)造成網(wǎng)絡(luò)的阻塞。如果我們能夠?qū)⑷龑泳W(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)化為二層結(jié)構(gòu)(如圖1),雖說簡(jiǎn)化,我們還是不能忽略網(wǎng)絡(luò)本身性能要求,在二層架構(gòu)下我們還是有很多問題需要處理,比如環(huán)路問題,傳統(tǒng)的方式我們主要采用STP,阻塞相應(yīng)的端口,這樣某個(gè)角度是浪費(fèi)了帶寬,將某條鏈路閑置。因此,在云計(jì)算環(huán)境下,研究者重新從數(shù)據(jù)層(Data plane)和控制層(control plane)角度,目前生成樹方面采用的MSTP,根據(jù)鏈路的條數(shù),創(chuàng)建MSTP的實(shí)例,在解決環(huán)路的同時(shí),也做到充分利用了帶寬。
4 結(jié)語(yǔ)
伴隨著很多廠家對(duì)云計(jì)算開發(fā)的投入,眾多領(lǐng)域已經(jīng)融入云計(jì)算技術(shù)及思想,筆者也開始自己關(guān)于云計(jì)算的探索,文章僅從四個(gè)方面對(duì)云計(jì)算下網(wǎng)絡(luò)通信進(jìn)行了分析,就目前我了解的其他方面,包括云計(jì)算通信平臺(tái)架構(gòu)搭建問題、數(shù)據(jù)關(guān)聯(lián)實(shí)現(xiàn)問題,想法還不夠成熟,我將會(huì)在后期的研究中加以探索。
參考文獻(xiàn)
[1] 雷萬(wàn)云,夏兆彥.云計(jì)算-企業(yè)信息化建設(shè)策略與實(shí)踐[M].清華大學(xué)出版社,2010(10):1-51.
[2] 王占京.VPN網(wǎng)絡(luò)技術(shù)與業(yè)務(wù)應(yīng)用[M].國(guó)防工業(yè)出版社,2015(5):11-103.
[3] 802.1Qbg - Edge Virtual Bridging ,http://www.ieee802.org/1/pages/802.1bg.html.
[4] 802.1BR - Bridge Port Extension ,http://www.ieee802.org/1/pages/802.1br.html.
[5] 徐雷.云計(jì)算下的網(wǎng)絡(luò)技術(shù)研究[J].通信學(xué)報(bào),2012(12):45-89.
[6] 吳昊.基于關(guān)聯(lián)規(guī)則的道路交通事故數(shù)據(jù)挖掘[C].長(zhǎng)春:吉林大學(xué)碩士學(xué)位論文集,2005.
[7] 王智鋼,王池社,馬青霞.分布式并行關(guān)聯(lián)規(guī)則挖掘算法研究[J].計(jì)算機(jī)應(yīng)用與軟件,2013(10):100-119.
[8] 王云.關(guān)聯(lián)規(guī)則挖掘在道路交通事故分析中的應(yīng)用[J].數(shù)據(jù)挖掘,2008(4):
[9] RyszardS.Michalski,IvanBratko,MiroslavKubat.機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘:方法和應(yīng)用[M].張洋,譯.子工業(yè)出版社,2004.