国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

跨地域分布數(shù)據(jù)中心高成本效益的任務(wù)調(diào)度

2019-12-07 08:43:52楊亞南李一鳴聶力海趙來平
應(yīng)用科學(xué)學(xué)報 2019年6期
關(guān)鍵詞:階梯數(shù)據(jù)中心定價

楊亞南,李一鳴,聶力海,張 寧,趙來平

天津大學(xué)智能與計算學(xué)部,天津300350

近年來,谷歌、Amazon、微軟已經(jīng)在大型數(shù)據(jù)中心進行了大量的投資以支持多種云服務(wù)及其客戶.云基礎(chǔ)設(shè)施提供商允許用戶按需租賃資源,并支持隨用隨付的計費模式.較低的設(shè)備成本及維護費用已經(jīng)成為吸引用戶將其應(yīng)用程序遷移到云的主要原因之一[1].提高云數(shù)據(jù)中心的成本效率可以鼓勵更多的用戶從云計算中獲益,也有利于云計算行業(yè)的發(fā)展.節(jié)約成本的方法很多,例如節(jié)約能源[2-4]、最小化因違反服務(wù)級別協(xié)議(service level agreement,SLA)而產(chǎn)生的成本[5]以及通過實例組合降低成本[6-7]等.對亞馬遜、Azure 和阿里云的研究發(fā)現(xiàn),云計算服務(wù)商提供不同規(guī)格的實例供用戶選擇,實例的價格通常因資源配置的不用而有所差異,同時即使對于同一規(guī)格的實例,因其在不同地域的數(shù)據(jù)中心也有著不同的定價.如“m1.small”的虛擬機(virtual machine,VM)實例.亞馬遜EC2 在日本東京的售價為0.067美元/h,比美國弗吉尼亞州的售價高39.6%,比愛爾蘭的售價高28.8%.同樣,微軟Azure的“standard A1”在日本東部地區(qū)的價格比印度中部地區(qū)的高22.7%,比美國中部地區(qū)的高35%.由阿里云香港數(shù)據(jù)中心提供的“ecs.n1.small”的價格比青島和杭州數(shù)據(jù)中心的高64.8%.

價格變動的原因來自于多個方面,例如站點投資、IT成本(服務(wù)器購買、網(wǎng)絡(luò)設(shè)備架設(shè)等)、經(jīng)營成本、能源費用[8-9]等組成了數(shù)據(jù)中心的總體構(gòu)建成本.目前,中國國家天文臺與天津大學(xué)正在合作開展中國虛擬天文臺項目[10-11],旨為天文學(xué)家搭建天文云數(shù)據(jù)平臺,利用大數(shù)據(jù)處理技術(shù)協(xié)調(diào)天文觀測活動.該項目涵蓋了位于北京、上海、南京、昆明、烏魯木齊等多地數(shù)據(jù)中心.由于北京商業(yè)用電的平均價格接近烏魯木齊的2 倍,因此同樣類型的VM 實例在北京的價格大約是烏魯木齊的3 倍.文獻[12]根據(jù)數(shù)據(jù)中心之間電價的變化設(shè)計策略以減少IaaS供應(yīng)商的電費開支;云IaaS 用戶能夠借助數(shù)據(jù)中心之間的價格差異減少相關(guān)的服務(wù)費用,從而節(jié)省大量的成本費用開支.

本文旨在改善跨地域分布的數(shù)據(jù)中心間數(shù)據(jù)處理的成本效益,通過利用跨地域分布云中的數(shù)據(jù)中心資源價格差異這一性質(zhì)來最小化總體成本(包括計算成本和傳輸成本).假設(shè)數(shù)據(jù)已經(jīng)分散存儲至云系統(tǒng)的各個數(shù)據(jù)中心內(nèi)部,則直接分配一個任務(wù)到存儲其輸入數(shù)據(jù)的數(shù)據(jù)中心可以降低總體數(shù)據(jù)傳輸成本,但由于待處理的數(shù)據(jù)可能分布在多個數(shù)據(jù)中心,因此數(shù)據(jù)傳輸是不可避免的,由此帶來了對應(yīng)的傳輸成本.理論上給出計算成本和通信成本的形式化描述,就可以估計出將任務(wù)分配給數(shù)據(jù)中心的總成本,然后將任務(wù)分配到成本最低的數(shù)據(jù)中心.但在實際應(yīng)用中,由于多種因素(如數(shù)據(jù)中心容量有限、安全性、服務(wù)性能(quality of service,QoS)保證、SLA 遵從性、隱私和其他相關(guān)法規(guī)要求等)的限制,上述做法有時并不可行.研究表明,跨地域分布云數(shù)據(jù)中心間的任務(wù)調(diào)度可以建模成一般分配問題(general assignment problem,GAP),該問題屬于NP難問題(即在多項式時間內(nèi)難以找到可行解).與此同時,數(shù)據(jù)中心對資源(如計算、網(wǎng)絡(luò)和存儲)采用不同定價模型也加劇了求解的復(fù)雜性.

本文在求解最優(yōu)化的調(diào)度方案時主要考慮線性定價和階梯定價兩種定價模型.對于線性定價,采用增廣拉格朗日乘子法(augmented Lagrange multiplier method,ALMM)來解決.由于ALMM 方法可能會產(chǎn)生不可行解,因此本文設(shè)計了一個調(diào)整算法來調(diào)整結(jié)果,保證其可行的同時實現(xiàn)總成本最小化的目標(biāo).對于分段定價,證明了在相同的任務(wù)和數(shù)據(jù)下該模型會給用戶帶來額外的成本,而此時ALMM 方法的效率由于組合爆炸而降低,例如當(dāng)任務(wù)總數(shù)超過7 個時,至少需要400 s 才能得到結(jié)果.為了提高任務(wù)調(diào)度過程的時間效率,本文還設(shè)計了一種啟發(fā)式的降值密度調(diào)度(decreased value density scheduling algorithm,DVDS)算法,目的是在較短的時間內(nèi)找到最經(jīng)濟的調(diào)度方案.實驗表明,DVDS 算法與ALMM 相比僅增加9.49%的成本,但卻在求解時間縮短了90%.

1 系統(tǒng)模型和問題定義

表1列出了跨地域數(shù)據(jù)中心問題模型中的符號定義.

1.1 云數(shù)據(jù)中心模型

將跨地域的云系統(tǒng)定義為GD=(ND,ED),其中ND={d1,d2,··· ,dm}表示跨地域分布的數(shù)據(jù)中心,代表數(shù)據(jù)中心之間的網(wǎng)絡(luò)帶寬.由于每個數(shù)據(jù)中心都具有計算和存儲能力,因此可以用于托管VM 并執(zhí)行數(shù)據(jù)密集型任務(wù).但值得注意的是各數(shù)據(jù)中心的計算能力有限且相互之間可能存在差異.若用dci表示di的計算能力,?di ∈ND,在任意的數(shù)據(jù)中心di上放置任務(wù)所需的總資源不能超過該數(shù)據(jù)中心的資源容量dci.每個數(shù)據(jù)中心都存儲了大量的數(shù)據(jù),這些數(shù)據(jù)以常規(guī)文件的形式存在.用F={f1,f2,··· ,fl}表示云計算系統(tǒng)中所有文件的集合,對于任意文件fi ∈F,fi的大小定義為S(fi),F(xiàn)(di)表示存儲在數(shù)據(jù)中心di上的所有文件.

表1 符號列表Table1 List of notations

圖1展示了一個云數(shù)據(jù)中心內(nèi)部資源-任務(wù)-數(shù)據(jù)文件三者之間關(guān)系的簡單示例.d為數(shù)據(jù)中心,R為數(shù)據(jù)中心間的路由,所有的數(shù)據(jù)中心通過不同的網(wǎng)絡(luò)鏈路互通.f為存儲在數(shù)據(jù)中心內(nèi)部的文件,每個數(shù)據(jù)中心還擁有不同數(shù)量的CPU 計算資源.

云提供商提供多樣化的VM 實例,包含各種離散的硬件配置.用I={τ1,τ2,··· ,τM}表示VM 的配置集合,用sk表示實例τk的運算速度,用表示租用價格,則實例τk在數(shù)據(jù)中心di上運行t時間段的計算成本記作C=.也就是說,成本費用與時間線性相關(guān),如圖2(a)所示.然而,當(dāng)用戶租用云資源時,服務(wù)提供商通常以時間為單位進行區(qū)間收費(例如Amazon EC2 收費的時間單位為1 h),此時成本費用則隨時間發(fā)生階梯變化,如圖2(b)所示.由于所需VM 的租用時間同文件傳輸量、網(wǎng)絡(luò)帶寬分配大小有關(guān),階梯定價同時受到多個因素的影響,對其進行細微調(diào)整都會影響整體的調(diào)度結(jié)果和總體成本,因此階梯定價使跨地域數(shù)據(jù)中心間的調(diào)度問題更加復(fù)雜.類似地,云提供商提供的網(wǎng)絡(luò)資源[23]包含離散的帶寬配置,這些配置集合用B表示:B={b1,··· ,bN}.則從di到dj、租用br帶寬且通信時間為t的傳輸成本可定義為其中是從di到di租用br帶寬的價格,br ∈B.

圖1 云數(shù)據(jù)中心模型示例Figure1 Example of cloud system

圖2 線性價格和階梯價格Figure2 Linear pricing and piecewise pricing

1.2 任務(wù)模型

將任務(wù)與文件之間的依賴關(guān)系網(wǎng)絡(luò)記作GV=(V ∪F,EV),其中V={v1,v2,··· ,vn}表示任務(wù)集合,表示文件和任務(wù)之間的關(guān)系,表示文件fl是任務(wù)vj的輸入之一.對于一個任務(wù)vj ∈V,有其中,vLj為該任務(wù)的計算負荷,vcj為任務(wù)vj所需的計算資源量,F(xiàn)(vj) 表示vj的輸入文件集合.圖3為一個任務(wù)模型的示例,任務(wù)和文件屬于多對多關(guān)系,多個任務(wù)可能將同一個文件作為輸入(如f3),而多個文件也可能作為同一個任務(wù)的輸入(如v3).

圖3 任務(wù)模型Figure3 Task model

1.3 問題定義

對于給定云模型和任務(wù)模型,以下為調(diào)度問題的形式化定義.

xijkr為一個二進制變量,定義為:如果選擇τk虛擬機和br帶寬在數(shù)據(jù)中心di中執(zhí)行任務(wù)vj,xijkr值為1;否則,其值為0.

任務(wù)的總成本包括數(shù)據(jù)傳輸成本和計算成本.因為數(shù)據(jù)中心內(nèi)的數(shù)據(jù)傳輸基本不產(chǎn)生開銷,因此只考慮由數(shù)據(jù)中心間的文件傳輸帶來的成本.任務(wù)vj的數(shù)據(jù)傳輸成本計算公式為

式中,表示從存儲文件由fl數(shù)據(jù)中心dfl到di傳輸文件fl所分配的帶寬,表示文件fl的傳輸時間.至于數(shù)據(jù)中心dfl到di之間的數(shù)據(jù)包發(fā)送和接收延遲相比數(shù)據(jù)傳輸耗時通常很小,因此可以忽略不計.

數(shù)據(jù)的計算成本與計算時間和價格有關(guān).如果輸入文件不在本地存放,則需要將此文件從遠程數(shù)據(jù)中心傳輸至本地的數(shù)據(jù)中心.在該場景下,必須等待文件傳輸完畢才可以執(zhí)行任務(wù),于是總體完成時間包括數(shù)據(jù)傳輸時間和CPU 運算時間,vj的計算成本公式為

式中,sτk為VMτk的計算速度.

因此任務(wù)vj的總成本為

拒絕任務(wù)vj可看作是將vj調(diào)度到擁有無限容量資源的虛擬數(shù)據(jù)中心dm+1(即),所提供VMs和帶寬vj資源以ψj為代價,即c(m+1)jkr=ψj,?k,r.給定m+1個數(shù)據(jù)中心,n個任務(wù),m種VM 類型配置和N種帶寬配置,可以形式化定義調(diào)度問題.其中,目標(biāo)函數(shù)T1為

約束條件為

其中,式(6)確保在數(shù)據(jù)中心di上運行的任務(wù)所需資源的總和不能超過dci;式(7)確保每個任務(wù)只能放置在一個數(shù)據(jù)中心上,且只能使用1 種類型虛擬機實例和1種帶寬配置;式(8)表示二進制變量xijkr的約束.

上面所構(gòu)造的調(diào)度問題是NP-hard 問題,該問題很難得到最優(yōu)解.為此,本文在線性定價和階梯定價模型[6]下首先使用ALMM 實現(xiàn)近似的最優(yōu)調(diào)度,然后設(shè)計了一種Adjusting 算法來調(diào)整ALMM 生成的不可行解,從而得到一個可行的調(diào)度方案.由于ALMM 的收斂速度過慢,因此本文又提出了一種快速啟發(fā)式算法逼近最優(yōu)解.

2 線性定價下的調(diào)度

本節(jié)將介紹在線性定價模型下的ALMM 方法和Adjusting 算法.根據(jù)對亞馬遜、谷歌等云提供商的調(diào)查發(fā)現(xiàn),VMs 帶寬的價格通常與VM 實例的帶寬配置成正比.對于VM 實例有:;對于帶寬則有:

從數(shù)據(jù)中心dfl到di租用br帶寬的價格可定義為

式中,α是一個常數(shù).將式(9)代入式(1)得

因此對于線性定價模型而言,傳輸成本與帶寬配置無關(guān).同樣,di中的VMτk的價格可以定義為

式中,β是一個常數(shù).將式(11)代入式(2)得

計算成本與VM 的計算速度sτk成正比且與數(shù)據(jù)中心間帶寬成反比,于是可以簡單地選擇最便宜的計算資源和最昂貴的VM 帶寬來實現(xiàn)最小化,使唯一的變量xijkr變成xij.如果將任務(wù)vj調(diào)度到數(shù)據(jù)中心di,則其值為1,否則將其設(shè)置為0.類似地,cijkr變成了cij.然后使用xij重新定義整數(shù)規(guī)劃的問題.此時目標(biāo)函數(shù)T2為

約束條件為

2.1 增廣拉格朗日乘子法

ALMM 方法分三步進行.首先,對約束優(yōu)化問題進行等價轉(zhuǎn)換變成一個無約束優(yōu)化問題.其次,建立一個動態(tài)微分方程組無約束優(yōu)化函數(shù).最后,采用4 階RungeKutta 法求解.

首先將0/1 約束替換為二次凹等式約束,有

利用松弛線性等式不等式約束和拉格朗日乘子松弛二次凹等式約束,可以推導(dǎo)出無約束的增廣拉格朗日函數(shù),公式為

式中,K為懲罰參數(shù),min2{}為min{}的平方.λ= [λ11,λ12,··· ,λmn]表示拉格朗日乘子向量.建立了如下動態(tài)系統(tǒng)

該動態(tài)微分方程組可以采用4 階RungeKutta 法求解.

ALMM 利用拉格朗日乘子函數(shù)來保證可行解的條件.雖然在開始階段可以避免陷入0/1可行解,但實驗發(fā)現(xiàn),有時仍然會違反式(6)所示的約束條件,尤其是當(dāng)問題的輸入大?。ㄈ蝿?wù)數(shù))增加時更是如此.例如,如果把圖3中任務(wù)調(diào)度到圖1的數(shù)據(jù)中心系統(tǒng)中,由ALMM(相關(guān)參數(shù)設(shè)置:K= 120,μ= 10,stepsize= 10?5)得到的結(jié)果顯示,任務(wù)v1和v4都被調(diào)度到數(shù)據(jù)中心d4.因為vc1=3,vc4=3,dc4=4,v1和v4的總資源需求超過了d4的總資源容量.因此違背了式(6)的約束條件.在這種情況下,調(diào)度方案必須適當(dāng)?shù)恼{(diào)整,從而在維持成本最小化的前提下得出可行的調(diào)度結(jié)果.

2.2 Adjusting 算法

當(dāng)ALMM 生成的解決方案不可行時需要調(diào)用Adjusting 算法.該算法的基本思想是,將任務(wù)的子集從過載的數(shù)據(jù)中心遷移到另一個數(shù)據(jù)中心,由任務(wù)遷移所增加的成本應(yīng)該盡可能的小.

假設(shè)數(shù)據(jù)中心da過載,用dVa表示調(diào)度到da的任務(wù)集合,?vj ∈dVa,對于數(shù)據(jù)中心da的任意調(diào)度任務(wù)vj,則將vj移動到另一個數(shù)據(jù)中心(?vd ∈ND并且dbda)所產(chǎn)生的成本增量為

為了降低成本,Adjusting 算法首先選擇其中一個可以最小化?cvjab的任務(wù)并將其移動至數(shù)據(jù)中心db,迭代此操作直到所有數(shù)據(jù)中心都能確保滿足資源容量約束.在遷移過程中,任務(wù)的總?cè)萘啃枨罂赡艹^了數(shù)據(jù)中心的總?cè)萘肯拗?事實上,即使已經(jīng)確定,仍然不能確保任務(wù)總能被完成.因此通過設(shè)置γ >1,保證僅當(dāng)其他數(shù)據(jù)中心的無可用容量時才將任務(wù)移動到虛擬任務(wù)vm+1.此時需要引入虛擬數(shù)據(jù)中心dm+1,將任務(wù)移到dm+1也就意味著拒絕該任務(wù).

算法1 展示了Adjusting 算法的設(shè)計,在第1~2 行分別定義了2 個變量:使用布爾變量full[i]表示數(shù)據(jù)中心di是否已滿,且初始化為false;Combsi表示數(shù)據(jù)中心di和除去di的數(shù)據(jù)中心中的所有任務(wù)組合.首先,找到過載的數(shù)據(jù)中心(第3~5行),并將其full[i]設(shè)置為true.然后,遍歷每個過載的數(shù)據(jù)di,移動其中一些任務(wù)(第6~17 行),將任務(wù)分配給其他數(shù)據(jù)中心.對于在數(shù)據(jù)di中的每一個任務(wù)vj按照式(18)計算,?dk ∈ND ∪dm+1.然后,對Combsi中的組合按照的升序(第10 行)進行排序.由此具有最小成本增量的的組合總是最先被選擇.在第11~17 行中,如果數(shù)據(jù)中心dk能容納任務(wù)vj,該任務(wù)就會被移動到數(shù)據(jù)中心dk,并且將所有任務(wù)vj的組合從Combsi中刪除(第14 行).若數(shù)據(jù)中心di不再過載,將full[i]設(shè)置為false(第15~17行).否則,在Combsi中移動下一個任務(wù).

3 階梯定價下的調(diào)度

在階梯定價模型下,資源按時間進行收費.如果任務(wù)的實際執(zhí)行時間不是時間單位的整數(shù),則進行向上取整.因此,式(10)和(12)分別轉(zhuǎn)換為

此時,與帶寬配置有關(guān).假設(shè)在圖1中有3 種可用的帶寬配置類型,其中b1= 512,b2=1 024,b3=2 048,且它們在數(shù)據(jù)中心d1和d4間的價格分別是=1.8 美元/h,=3.6 美元/h,= 7.2 美元/h.假設(shè)有兩種類型的VM 配置,計算速度分別為sτ1=400,sτ2= 800.它們在數(shù)據(jù)中心d4中的價格分別為= 1.6美元/h,= 3.2 美元/h.如果v2L=124,調(diào)度任務(wù)v2到數(shù)據(jù)中心d4,使用τ1配置的VM 執(zhí)行任務(wù)并且采用大小的帶寬進行數(shù)據(jù)傳輸(如文件f1),則總體成本計算為6.8,當(dāng)τ1和b2被選中時成本最小.因此對于階梯計價模型,除了需要分配數(shù)據(jù)中心,還需要為每個任務(wù)和每個文件數(shù)據(jù)流分配VM 和帶寬.

這里仍然使用ALMM 方法來解決(如式(5)~(8)).對應(yīng)的無約束增廣拉格朗日量函數(shù)為

動態(tài)系統(tǒng)的拉格朗日微分方程為

式中,p=1,2,··· ,m;q=1,2,··· ,n;u=1,2,··· ,M;v=1,2,··· ,N.

同樣,ALMM 的結(jié)果調(diào)度可能違反約束條件從而導(dǎo)致出現(xiàn)不可行解,需要應(yīng)用Adjusting算法進行調(diào)整.對ALMM 和Adjusting 算法的處理過程可以表示為

式中,ROUND()是Adjusting 算法中的上取整操作.

4 DVDS 算法

設(shè)置K= 120,μ= 10,stepsize= 10?5,采用圖1所示的云數(shù)據(jù)中心模型評估ALMM的效率.實驗發(fā)現(xiàn),隨著任務(wù)數(shù)量的增長,ALMM 收斂也變得非常慢.圖4(a)顯示,當(dāng)提交70 個任務(wù)時,在線性定價模型下ALMM 收斂到可行解所需要的時間超過10 min.此外,如果考慮階梯定價模式下,ALMM 在10 min 內(nèi)只能對10 個任務(wù)得到一個可行的解決方案(圖4(b)).為了提高效率,本文設(shè)計了一個啟發(fā)式搜索算法DVDS,旨在短時間內(nèi)找到一個較優(yōu)的調(diào)度方案.

定義uijkr為vj的值密度,則有顯然將任務(wù)調(diào)度到uijkr值小的數(shù)據(jù)中心可以降低總體調(diào)度結(jié)果的成本,同時為了解決數(shù)據(jù)中心的總?cè)萘抗?yīng)不足的情況,仍然引入虛擬數(shù)據(jù)中心dm+1來進行任務(wù)調(diào)度.

DVDS 算法的設(shè)計思想是:首先遍歷vj、di、τk、br所有可能的組合,計算對應(yīng)的cijkr和uijkr,其中vj ∈V,dj ∈ND ∪dm+1,τk ∈I,br ∈B(第2~3 行).然后將Combs 中的組合根據(jù)uijkr的值進行升序排列(第4 行).在算法的第5~8 行,迭代選擇具有最小uijkr值的Combs組合,并將對應(yīng)的任務(wù)vj調(diào)度到數(shù)據(jù)中心di,同時使用VM 配置τk和帶寬配置br.一旦任務(wù)vj的配置完成,它的所有相關(guān)數(shù)據(jù)將從Combs 中的組合移除(第8 行),然后算法繼續(xù)執(zhí)行,遍歷Combs 中的組合并調(diào)度下一個任務(wù).DVDS 算法的時間復(fù)雜度為O(mnMNlog(mnMN)).

表2 調(diào)度結(jié)果Table2 Schedule results

給定圖1中的云數(shù)據(jù)中心模型和圖3中的任務(wù)配置,設(shè)置γ=2,表2給出了ALMM、Adjusting 算法、DVDS 算法分別在線性定價和階梯定價模型下的調(diào)度結(jié)果.一般來講,階梯定價模型相比線性定價模型成本更高.線性定價中總是選擇最便宜的VM 和最昂貴的帶寬配置,而階梯定價模型則有更多不同方案可選擇.在這兩種模型中,ALMM 的調(diào)度都不能保證數(shù)據(jù)中心d4的資源約束不被打破,Adjusting 算法將任務(wù)v1從數(shù)據(jù)中心d4移動到虛擬數(shù)據(jù)中心d5.對于DVDS 算法,任務(wù)v1被調(diào)度到d5.此外,發(fā)現(xiàn)DVDS 調(diào)度方案產(chǎn)生的成本比ALMM 的更高.

5 性能評估

5.1 實驗環(huán)境設(shè)置

1)云數(shù)據(jù)中心系統(tǒng)

基于跨地域分布的數(shù)據(jù)中心系統(tǒng)China-VO 來評估ALMM+Adjusting 算法以及DVDS算法的性能.該系統(tǒng)由5 個具有不同的CPU 計算性能以及虛擬機(帶寬)價格的數(shù)據(jù)中心構(gòu)成.通過給數(shù)據(jù)中心配置不同數(shù)量的處理單元(process elements,PEs)來模擬每個數(shù)據(jù)中心的計算能力,例如北京、上海、南京、昆明、烏魯木齊5 處數(shù)據(jù)中心分別擁有900、850、690、350、160 個PE.對于帶寬配置則采用了兩種帶寬配置B={1 024,2 048}來模擬China-VO 系統(tǒng)內(nèi)部的網(wǎng)絡(luò).數(shù)據(jù)中心di到dj(?i,j ∈{1,··· ,5},i < j)的1 024 大小的帶寬每小時租用價格被設(shè)置為= 0.14+0.02(j ?i),對于2 048 大小的帶寬租用價格則翻倍.對于VM 也模擬了兩種不同的配置:I={800,1600}(單位:MHz).其中1 600 MHz 的CPU 對應(yīng)1 個完整的PE,而800 MHz 的CPU 對應(yīng)0.5 個PE.5 個數(shù)據(jù)中心在800 MHz 配置的CPU 的價格分別設(shè)置為{0.08,0.085,0.09,0.095,0.1}(單位:美元/h).對于1 600 MHz的CPU 則價格翻倍.

2)文件

模擬2 000 個不同大小的文件并將其分散存儲到5 個數(shù)據(jù)中心,其中每個文件的大小都從[1 024,3 072](單位:MB)的取值范圍中隨機選擇.

3)任務(wù)

由于ALMM 算法的收斂速度很慢,因此沒有模擬大規(guī)模的任務(wù)數(shù)量來評估ALMM+Adjusting 算法和DVDS 算法的性能.對于線性定價模型,最多模擬了150 個任務(wù),而對于階梯定價模型,最多模擬16 個任務(wù).每個任務(wù)都要求一定數(shù)量的CPU,該值從[10,80]的取值范圍中隨機生成.每個任務(wù)的輸入文件數(shù)量也從[1,30]隨機生成.任務(wù)vj的負荷由vLj=ηS(F(vj))/CCR,其中η是一個標(biāo)量權(quán)重因子,CCR 表示通信與計算的比率.通過初始化CCR=[0.1,1.0,10.0],可以在不同的工作負載下對算法進行性能評估,例如,通信密集型的負載,或者計算密集型的負載.在所有實驗中拒絕一個任務(wù)的懲罰參數(shù)γ都被設(shè)置為2.

本文的實驗評估是在配備了Xeon E5-2600 v3 CPU 和128 GB 內(nèi)存的高性能服務(wù)器上進行的.

5.2 執(zhí)行時間

圖4展示了線性定價模型和階梯定價模型下ALMM +Adjusting 算法和DVDS 算法的執(zhí)行時間與任務(wù)數(shù)量的函數(shù)關(guān)系.隨著任務(wù)數(shù)量的增加,通常ALMM +Adjusting 算法的執(zhí)行時間增長的比DVDS 算法的快得多.當(dāng)150 個任務(wù)在線性定價模型(參數(shù)為K= 120,μ=1.0,!stepsize = 10?5)下提交時,ALMM +Adjusting 算法收斂到一個可接受的時間需要近3 500 s,而DVDS 算法不到1 s 就能獲得結(jié)果.此外,對于階梯定價模型,ALMM+Adjusting算法調(diào)度16 個任務(wù)需要花費近2 000 s 才能收斂到可行解.由于耗時過長,因此不必進行更多實驗來對比執(zhí)行效率.

圖4 算法執(zhí)行時間Figure4 Execution time of proposed algorithms

5.3 成本

圖5(a)~(c)為線性定價模型下ALMM+Adusting 算法和DVDS 算法生成的成本.DVDS生成結(jié)果的成本一般大于ALMM +Adjusting 算法,因為ALMM 方法可以收斂到近似最優(yōu)解決方案.在線性定價模型中,當(dāng)任務(wù)數(shù)目小于50 時,兩者之間的差異很小.這是因為在這種情況下,大多數(shù)任務(wù)總是可以被調(diào)度到具有最低成本的數(shù)據(jù)中心同時滿足資源量約束.它們之間的差異隨著任務(wù)數(shù)量的增加而增加.在CCR=0.1、CCR=1.0、CCR=10.0 時,DVDS 算法平均比ALMM +Adjusting 算法增加9.59%、11.5%、10.3%的成本.因此,在不同類型的工作量下,兩者的成本沒有顯著差異.

圖5 總成本作為任務(wù)數(shù)量的函數(shù)(LP:線性定價,PP:階梯定價)Figure5 Total cost as a function of the number of tasks (LP:linear pricing,PP:piecewise pricing)

圖5中的(d)~(f)顯示了階梯定價模型下ALMM+Adjusting 算法產(chǎn)生的成本費用.與線性定價模型下的實驗設(shè)置不同,階梯定價模型中ALMM 算法收斂到一個較優(yōu)解需要花費大量的時間,因此采用了人工方法將數(shù)據(jù)中心的資源容量降低到范圍內(nèi)的隨機數(shù)[40,120].因為數(shù)據(jù)中心計算量有限,即使任務(wù)數(shù)量很少,算法也不可能在滿足約束的前提下,將每個任務(wù)都調(diào)度到合適的數(shù)據(jù)中心.可以看到,當(dāng)任務(wù)數(shù)小于7 時,兩種算法在成本上的差異是相當(dāng)小的.隨著任務(wù)數(shù)的增加,相比ALMM +Adjusting 算法成本高,DVDS算法平均分別在CCR=0.1、CCR=1、CCR=10 下多產(chǎn)生了12.8%、12.1%、10.8%的成本.

此外,在不改變文件的數(shù)量前提下,可以通過增加數(shù)據(jù)中心的數(shù)量來評估算法的性能.此時文件的存儲更加分散,數(shù)據(jù)中心間的文件傳輸量也隨之增多,任務(wù)調(diào)度過程也會產(chǎn)生更大的傳輸成本.從圖6可以看出,由于數(shù)據(jù)傳輸成本增加,兩種算法得到的調(diào)度結(jié)果成本隨著數(shù)據(jù)中心數(shù)量的增多而增加,但是當(dāng)數(shù)據(jù)中心的容量增加時,任務(wù)有可能被安排在更合適的數(shù)據(jù)中心上,因此兩種算法之間的差異減小.注意到當(dāng)數(shù)據(jù)中心數(shù)分別等于5 和11 時(圖6(a)和(b)),DVDS 算法產(chǎn)生的傳輸成本有所下降,這是由于實驗評估結(jié)果的隨機性導(dǎo)致的,如果進行多組實驗并計算統(tǒng)計分布,則這種現(xiàn)象會逐漸消除.即便如此,整體的調(diào)度結(jié)果成本也同數(shù)據(jù)中心數(shù)量正相關(guān),所以實驗結(jié)果是符合預(yù)期的.

圖6 總成本作為數(shù)據(jù)中心數(shù)量的函數(shù)Figure6 Total cost as a function of the number of datacenters

6 相關(guān)工作

針對云數(shù)據(jù)中心調(diào)度的成本和效率問題,科研工作者已經(jīng)開展了大量的研究.本文對其進行了總結(jié),這些研究基本大體上可以分為兩類:研究增加IaaS 供應(yīng)商收入與研究降低IaaS 用戶成本.

6.1 增加IaaS 供應(yīng)商收入

文獻[1]和[20]闡述了構(gòu)建云數(shù)據(jù)中心的成本.其中占比最大的部分是站點基礎(chǔ)設(shè)施投資成本,遠遠超過了IT 成本.并且約1/4 的年化總成本與運營費用有關(guān),其中能源費用占比10%以上.為了降低總成本,可以通過使用VM 整合節(jié)省能源,其中虛擬機被整合到幾個處于運行狀態(tài)的服務(wù)器上,其余的服務(wù)器可以切換至低功耗狀態(tài)[13-15].降低由于服務(wù)器故障或運行資源不足而導(dǎo)致的違反SLA 所帶來的成本,也可以增加云服務(wù)提供商的收入.文獻[16]提出的一種類似于binpacking 的算法將VM調(diào)度到可用的機器上,為IaaS 供應(yīng)商帶來更多的收入.為了應(yīng)對動態(tài)變化的資源需求,文獻[9]提出了市場驅(qū)動的資源分配算法來實現(xiàn)動態(tài)定價和調(diào)度請求處理,最大限度地提高云計算提供商的收入.文獻[17]利用不同數(shù)據(jù)中心之間的電價變化來降低IaaS 供應(yīng)商的電力成本.云提供商也可以在不增加云資源[18]的情況下通過增加任務(wù)請求從而提供更多服務(wù)來增加收入.為了提高云系統(tǒng)的資源效率,文獻[19-22]提出的云資源管理系統(tǒng)通過一系列的調(diào)度算法和數(shù)據(jù)放置優(yōu)化,提高了資源管理的效率,降低了運營成本.文獻[23]在容器級別通過彈性分配資源實現(xiàn)高效率的云系統(tǒng)資源配給,從而降低了云系統(tǒng)的運營成本.文獻[24]提供了橫向和縱向兩個維度的動態(tài)資源擴展操作,HPS+[25]采用超圖分割算法來實現(xiàn)高效的數(shù)據(jù)中心調(diào)度.這些方法在一定程度上提高了云數(shù)據(jù)中心的資源使用效率.

6.2 為IaaS 用戶節(jié)省成本

IaaS 用戶(或業(yè)務(wù)服務(wù)提供者)從云服務(wù)提供商租用VM 實例,并通過服務(wù)客戶來獲得收益.租用更多VM 可以減少作業(yè)響應(yīng)時間并降低違反SLA 帶來的風(fēng)險[26-29].然而,服務(wù)器增多后會提高服務(wù)的管理成本.文獻[30]通過研究IaaS 供應(yīng)商的動態(tài)定價方案和客戶滿意度優(yōu)化IaaS 用戶的效益.對于特定的工作負載,文獻[31]通過計算從IaaS 提供商租用的最優(yōu)服務(wù)器配置,使數(shù)據(jù)中心的預(yù)期收益最大化.文獻[32]提出了一種工作流調(diào)度算法,利用不同的VM實例,使最大完成時間和用戶的租用成本最小化.同樣,文獻[33]評估了12 種分配策略的作業(yè)完成時間和成本方面的性能.注意到當(dāng)前的IaaS 提供商提供了不同類型服務(wù)器供用戶選擇,其中包括不可撤銷的預(yù)留型實例和價格更便宜但可撤銷的彈性實例,IaaS 用戶可以利用兩者的組合來獲得顯著的經(jīng)濟收益[34].

7 結(jié) 語

本文對跨地域分布云數(shù)據(jù)中心系統(tǒng)的成本效率調(diào)度問題進行了形式化建模.使用ALMM方法來尋找每個任務(wù)的最優(yōu)調(diào)度結(jié)果.由于ALMM 生成的調(diào)度方案可能會違反數(shù)據(jù)中心的資源容量限制而不可行,因此本文提出了一種Adjusting 算法對ALMM 的結(jié)果進行調(diào)整,使其成為可行解.本文還設(shè)計了DVDS 算法,能在比ALMM 更短的時間內(nèi)獲得較優(yōu)的調(diào)度方案,而其產(chǎn)生的成本僅比ALMM 高出10%左右.

在以后研究中,將探討如何結(jié)合工作特點和系統(tǒng)進一步降低云服務(wù)提供商的運行成本以提高資源效率.

猜你喜歡
階梯數(shù)據(jù)中心定價
酒泉云計算大數(shù)據(jù)中心
本刊2020年36卷第12期版權(quán)頁定價勘誤
民航綠色云數(shù)據(jù)中心PUE控制
電子測試(2018年11期)2018-06-26 05:56:24
基于分層Copula的CDS定價研究
爬階梯
時光階梯
幸福(2016年9期)2016-12-01 03:08:50
有趣的階梯
幫爸爸定價
讀寫算(下)(2015年11期)2015-11-07 07:21:02
基于云計算的交通運輸數(shù)據(jù)中心實現(xiàn)與應(yīng)用
自主定價基本不可能
神农架林区| 宁蒗| 靖西县| 澄迈县| 渑池县| 运城市| 新闻| 吉水县| 阳春市| 镇沅| 龙游县| 昭平县| 西宁市| 阳城县| 乐平市| 南阳市| 五莲县| 云梦县| 河源市| 芒康县| 天等县| 九龙坡区| 西乡县| 灵台县| 新和县| 合山市| 瑞金市| 木里| 内黄县| 专栏| 老河口市| 库尔勒市| 阆中市| 天津市| 通州市| 湖南省| 云南省| 开远市| 营山县| 红安县| 新泰市|