王曉鈺,吳偉明,谷勇浩
(北京郵電大學(xué) 計(jì)算機(jī)學(xué)院,北京 100876)
基于云平臺(tái)的彈性Web集群擴(kuò)縮容機(jī)制的研究
王曉鈺,吳偉明,谷勇浩
(北京郵電大學(xué) 計(jì)算機(jī)學(xué)院,北京 100876)
彈性Web集群即隨著工作負(fù)載的變化,集群規(guī)模可以彈性變化的Web集群。本文研究彈性Web集群的擴(kuò)縮容機(jī)制,首先分析現(xiàn)有擴(kuò)縮策略的常用算法的優(yōu)缺點(diǎn),然后當(dāng)前策略的不足,提出新的擴(kuò)縮策略,使用更豐富的指標(biāo)進(jìn)行負(fù)載預(yù)測(cè),提高預(yù)測(cè)的準(zhǔn)確性;使對(duì)負(fù)載評(píng)估的結(jié)果帶有預(yù)測(cè)性,相對(duì)于簡(jiǎn)單的非預(yù)測(cè)性算法可以更早地做出擴(kuò)容決策,最終支撐Web應(yīng)用系統(tǒng)對(duì)外提供高可用和高性能的服務(wù)。
云平臺(tái),Web集群,彈性伸縮,GBDT
隨著互聯(lián)網(wǎng)的日益普及和用戶增多,Web應(yīng)用系統(tǒng)訪問量的爆炸式增長(zhǎng)的和訪問的不確定性對(duì)Web服務(wù)的穩(wěn)定性、伸縮性以及可靠性帶來了嚴(yán)峻的挑戰(zhàn)。固定集群部署模式是根據(jù)訪問量的峰值預(yù)估服務(wù)器數(shù)量然后搭建集群,集群規(guī)模固定,具有部署困難、資源利用率低和成本高昂等缺陷。然而在實(shí)際環(huán)境中,服務(wù)器會(huì)經(jīng)常出現(xiàn)不可預(yù)知的負(fù)載需求,此時(shí)需要快速增加集群中服務(wù)的數(shù)量來應(yīng)對(duì)額外負(fù)載,同時(shí)在流量下降時(shí),需要停止空閑服務(wù)以降低成本。因此構(gòu)建彈性集群,實(shí)現(xiàn)集群服務(wù)器數(shù)量的自動(dòng)伸縮顯得尤為重要。本文研究彈性伸縮理論在搭建彈性集群中的應(yīng)用,重點(diǎn)分析擴(kuò)縮容策略現(xiàn)有算法,并根據(jù)現(xiàn)有策略的優(yōu)缺點(diǎn)對(duì)擴(kuò)縮容策略提出改進(jìn)。
1.1 彈性Web集群概念
隨著系統(tǒng)日訪問量的增加,Web應(yīng)用承受的壓力會(huì)越來越大,隨之會(huì)帶來諸多性能問題,如QPS下降等。為了解決這些問題,Web應(yīng)用經(jīng)歷了從單機(jī)規(guī)模到分布式集群到規(guī)模可動(dòng)態(tài)變化模式的發(fā)展過程。云計(jì)算的一個(gè)重要特點(diǎn)就是云中的資源規(guī)??梢詣?dòng)態(tài)伸縮,為用戶提供可伸縮的服務(wù)。利用這個(gè)特點(diǎn),將Web集群搭建于云基礎(chǔ)設(shè)施上,可以從基礎(chǔ)架構(gòu)層實(shí)現(xiàn)彈性的集群規(guī)模。基于云平臺(tái)的彈性 Web集群是利用云平臺(tái)的基礎(chǔ)設(shè)施提供 Web服務(wù),并且集群規(guī)模可以隨著負(fù)載變化動(dòng)態(tài)調(diào)整的集群:在集群負(fù)載達(dá)到一定閾值時(shí),及時(shí)進(jìn)行擴(kuò)容操作,使之可以應(yīng)對(duì)訪問高峰,對(duì)外提供高可用的服務(wù);集群負(fù)載降到一定閾值時(shí)進(jìn)行縮容操作,減少集群規(guī)模,降低硬件成本。
Web集群的規(guī)模是與負(fù)載變化密切相關(guān)的,當(dāng)當(dāng)前資源無法滿足負(fù)載需求時(shí),需要對(duì)平臺(tái)資源進(jìn)行擴(kuò)展。但是擴(kuò)展資源會(huì)耗費(fèi)一定的時(shí)間,根據(jù)具體情況耗時(shí)從幾毫秒到幾分鐘不等,在這段時(shí)間內(nèi)新增加的資源無法馬上為用戶提供服務(wù),擴(kuò)容滯后,造成服務(wù)滿意度下降。因此,在集群的擴(kuò)縮容策略中,希望能通過對(duì)集群負(fù)載的預(yù)測(cè)來解決該問題,使集群能夠在性能發(fā)生問題之前就能提前發(fā)現(xiàn)負(fù)載的趨勢(shì),預(yù)先根據(jù)服務(wù)負(fù)載的變化動(dòng)態(tài)伸縮集群規(guī)模,防患于未然;在負(fù)載下降后,能夠及時(shí)發(fā)現(xiàn)并調(diào)整資源,節(jié)約成本。
1.2 彈性Web集群擴(kuò)縮容模型
彈性Web集群的規(guī)模變化從兩方面來保證:一是云平臺(tái)的基礎(chǔ)架構(gòu)支持資源動(dòng)態(tài)伸縮;二規(guī)模調(diào)整時(shí)間和調(diào)整算法,主要是利用Web部署系統(tǒng)的擴(kuò)縮策略模塊實(shí)現(xiàn)。整個(gè)模型包括云基礎(chǔ)架構(gòu)層、應(yīng)用部署與動(dòng)態(tài)擴(kuò)容層和客戶端三部分,如圖1所示。
圖1 基于云平臺(tái)的彈性Web集群模型Fig.1 Cloud-based elastic web cluster model
云基礎(chǔ)架構(gòu)層:將底層的計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源虛擬化,通過云層向上層提供虛擬化的資源。利用云計(jì)算技術(shù),用戶只用關(guān)心使用何種資源或服務(wù),而不必關(guān)心這些資源和服務(wù)如何提供,用戶所需要的只是一個(gè)能夠訪問互聯(lián)網(wǎng)的終端,用以提交請(qǐng)求和獲得結(jié)果,其他的都交由云端實(shí)現(xiàn)。云計(jì)算與虛擬化技術(shù)密切相關(guān),虛擬化技術(shù)使得云端的資源整合更為敏捷和有效,也使得用戶能夠更為細(xì)粒度地使用IT資源。
應(yīng)用部署與動(dòng)態(tài)擴(kuò)縮容層:自動(dòng)化部署系統(tǒng),包括對(duì)客戶端請(qǐng)求進(jìn)行處理的負(fù)載均衡器;提供具體 Web服各個(gè)容器(containers),每個(gè)容器上搭載負(fù)載監(jiān)控模塊,可以實(shí)時(shí)監(jiān)控各容器的負(fù)載情況;擴(kuò)縮策略模塊,根據(jù)當(dāng)前集群負(fù)載動(dòng)態(tài)判斷擴(kuò)縮容時(shí)機(jī),在必要時(shí)采取擴(kuò)縮容操作。
客戶端層:接收來自各個(gè)客戶端的請(qǐng)求,傳遞給部署在自動(dòng)化部署系統(tǒng),進(jìn)行獲取由部署在其中的Web應(yīng)用提供的服務(wù)。
本文主要研究應(yīng)用部署與動(dòng)態(tài)擴(kuò)縮容層中,擴(kuò)縮策略模塊的機(jī)制及算法改進(jìn)。
擴(kuò)縮容機(jī)制是實(shí)現(xiàn)彈性集群的重要一環(huán)。準(zhǔn)確的預(yù)測(cè)集群負(fù)載并能及時(shí)調(diào)整集群規(guī)模使之適應(yīng)當(dāng)前情況,是擴(kuò)縮容策略模塊中最重要的兩個(gè)內(nèi)容。
2.1 伸縮理論
伸縮理論關(guān)注的問題主要是在面臨超出現(xiàn)有集群最大承載能力的時(shí)候,如何通過調(diào)整集群的規(guī)模以提高集群的承載能力,從而保證用戶體驗(yàn)和系統(tǒng)服務(wù)的穩(wěn)定性,同時(shí)在集群負(fù)載很低的時(shí)候,盡可能的減少閑置服務(wù)器帶來的資源浪費(fèi)。根據(jù)伸縮對(duì)象的不同,可以將伸縮方法分為以下三類,如圖 2所示。
圖2 伸縮方法的分類Fig.2 Classification of telescopic method
(1)應(yīng)用的伸縮性
應(yīng)用的伸縮性表示構(gòu)建在集群上的應(yīng)用能夠在集群規(guī)模變化的同時(shí)也保持應(yīng)用性能變化的能力,例如在不斷擴(kuò)大規(guī)模的集群上應(yīng)用同樣能夠表現(xiàn)出很好的性能。
(2)技術(shù)的伸縮性
技術(shù)的伸縮主要體現(xiàn)在系統(tǒng)對(duì)新技術(shù)的適應(yīng)性。一般包含三個(gè)方面:版本伸縮性、空間伸縮性和異構(gòu)伸縮性。版本伸縮性是指應(yīng)用了新技術(shù)的版本確實(shí)可以提高系統(tǒng)的性能??臻g伸縮性是指在多處理系統(tǒng)中可擴(kuò)充的處理空間。異構(gòu)伸縮性類似于系統(tǒng)的兼容性,系統(tǒng)對(duì)于不同的組件具有很好的包容性,同時(shí)系統(tǒng)的輸出可以作為標(biāo)準(zhǔn)接口。
(3)資源的伸縮性
資源的伸縮性是指通過增加CPU、內(nèi)存等硬件資源的投入來提升軟件效率以達(dá)到更高的系統(tǒng)性能。平常所說的集群伸縮方法大多數(shù)是指資源的伸縮性,而資源的伸縮性又可以劃分為兩個(gè)子類。從伸縮的方向劃分,分為縱向的伸縮和橫向的伸縮。
縱向伸縮是指通過提升系統(tǒng)當(dāng)前各個(gè)節(jié)點(diǎn)的處理能力來達(dá)到提升系統(tǒng)整體處理 能力的伸縮方法。提高各節(jié)點(diǎn)的處理能力具體來說包括服務(wù)器升級(jí)現(xiàn)有的配置,例如更換主頻更高、多核的處理器,更換容量更大的內(nèi)存條,配置讀寫速度更快的硬盤、甚至替換為更高端、更強(qiáng)勁的處理器等。
橫向伸縮是單純地通過增加節(jié)點(diǎn)的數(shù)量來提升系統(tǒng)整體的處理能力。橫向伸縮的優(yōu)點(diǎn)在于當(dāng)每臺(tái)服務(wù)器成本比較低的情況下,可以很容易地搭建起一個(gè)系統(tǒng)性能有保障的集群,相比縱向伸縮集群,這個(gè)集群面對(duì)增加的用戶量或者數(shù)據(jù)量帶來的性能瓶 頸可以處理得更靈活、游刃有余,并且能夠很好的減少由于單臺(tái)服務(wù)器出現(xiàn)故障而對(duì)于系統(tǒng)整體帶來的影響。
考慮云計(jì)算的資源可動(dòng)態(tài)獲取的特點(diǎn),我們將動(dòng)態(tài)擴(kuò)縮容研究定位到資源的橫向伸縮。
2.2 常用擴(kuò)縮容算法
當(dāng)前階段常用的策略算法有:
(1)單指標(biāo)非預(yù)測(cè)性算法
常用的有CPU利用率為指標(biāo),不考慮多條歷史記錄,只關(guān)注當(dāng)前的負(fù)載,直接將歷史記錄中的最后一條數(shù)據(jù)(可認(rèn)為是當(dāng)前負(fù)載)作為擴(kuò)容指數(shù)輸出。這種算法簡(jiǎn)單有效,根據(jù)實(shí)時(shí)的負(fù)載大小與閾值進(jìn)行對(duì)比,超過了則擴(kuò)容,否則保持原樣。因此這種算法雖然簡(jiǎn)單,卻是目前工業(yè)界普遍采用的。
缺點(diǎn):容易受噪音干擾;反應(yīng)滯后,不具備預(yù)測(cè)性;無法預(yù)測(cè)到CPU之外的因素(內(nèi)存等)引起的負(fù)載過重情況。
(2)多指標(biāo)自回歸算法
自回歸模型一般用于統(tǒng)計(jì)和信號(hào)處理,是一種經(jīng)常被用來對(duì)各種自然現(xiàn)象進(jìn)行建模和預(yù)測(cè)的隨機(jī)過程。Web應(yīng)用的負(fù)載變化雖然不是自然現(xiàn)象,但其多變且難以準(zhǔn)確預(yù)測(cè)的特征在某種程度上具有一定的隨機(jī)性,因此可以用自回歸模型對(duì)負(fù)載進(jìn)行建模和預(yù)測(cè)。將多個(gè)負(fù)載指標(biāo)數(shù)據(jù)經(jīng)過處理,求出加權(quán)負(fù)載平均值作為指標(biāo),將之用自回歸算法處理得出擴(kuò)容指數(shù)。
缺點(diǎn):該方法可以實(shí)現(xiàn)預(yù)測(cè),且考慮了多種指標(biāo)的影響。但是沒有考慮到Web服務(wù)訪問暗含的規(guī)律性,預(yù)測(cè)性不夠高。
3.1 Web負(fù)載分析
為了能夠準(zhǔn)確地預(yù)測(cè)Web集群負(fù)載,需要對(duì)負(fù)載進(jìn)行收集分析,從而了解負(fù)載的特性,并針對(duì)這些特性來選擇最適合的方法來進(jìn)行平臺(tái)負(fù)載預(yù)測(cè)。在1997年和1998年,美國卡內(nèi)基梅隆大學(xué)的Peter A. Dinda分別對(duì)38臺(tái)不同的機(jī)器進(jìn)行長(zhǎng)期的跟蹤抽樣,這些機(jī)器包括集群服務(wù)器、計(jì)算服務(wù)器和桌面主機(jī)等,并通過長(zhǎng)期觀測(cè)獲取了大量的負(fù)載數(shù)據(jù),通過對(duì)這些負(fù)載數(shù)據(jù)的統(tǒng)計(jì)和分析,Dinda總結(jié)了負(fù)載的幾個(gè)特性,主要有以下六個(gè)方面:
1. 負(fù)載有很大的波動(dòng)性,這說明有必要通過預(yù)測(cè)算法來改善負(fù)載相關(guān)問題。
2. 方差和最大值之類的差異量數(shù)1與平均值是正相關(guān)的,平均負(fù)載高的機(jī)器也有較大的方差和最大值,這種關(guān)聯(lián)表明對(duì)高負(fù)載量的機(jī)器進(jìn)行預(yù)測(cè)更有價(jià)值。
3. 負(fù)載相對(duì)來說比較復(fù)雜,有時(shí)多峰分布的負(fù)載不能根據(jù)一般的分布曲線來預(yù)測(cè)。
4. 通過負(fù)載時(shí)間序列分析可以知道,負(fù)載與時(shí)間有很強(qiáng)的關(guān)聯(lián),也就是說上一時(shí)間段的負(fù)載對(duì)下一時(shí)間段的負(fù)載有很大影響。所以對(duì)于負(fù)載預(yù)測(cè)來說,線性模型也許是比較適合的預(yù)測(cè)模型。
5. 負(fù)載具有自相似性,其赫斯特指數(shù)范圍是0.63至 0.97,已經(jīng)接近赫斯特指數(shù)的上限 2。通過這個(gè)結(jié)果可知負(fù)載按照時(shí)間以復(fù)雜的方式變化著,并存在長(zhǎng)期依賴性。
6. 負(fù)載的變化在不同時(shí)間段顯示出不同特性。有時(shí)負(fù)載在一段較長(zhǎng)時(shí)間內(nèi)非常穩(wěn)定,但是會(huì)忽然有一個(gè)較大的波動(dòng),這種波動(dòng)可能是因?yàn)樾碌娜蝿?wù)被創(chuàng)建或銷毀等,針對(duì)這種突發(fā)波動(dòng),線性模型可能需要自適應(yīng)并進(jìn)行修改。
3.2 擴(kuò)縮容策略的改進(jìn)
從上一節(jié)的Web負(fù)載分析可以看出負(fù)載和時(shí)間具有強(qiáng)相關(guān)性,因此本文將實(shí)際負(fù)載視為一個(gè)時(shí)間序列。時(shí)間序列往往具有一定的規(guī)律性:比如對(duì)于電商性質(zhì)的Web應(yīng)用系統(tǒng)而言:
每日晚上的交易量都要大于白天的交易量;
每周周末的交易量要大于周內(nèi)的交易量;
節(jié)假日交易量大于平時(shí)交易量等。
從長(zhǎng)期來看,交易量變化具有規(guī)律性;從短期來看,交易量變化又具有隨機(jī)性。
當(dāng)前常用的擴(kuò)縮容算法沒有考慮到集群負(fù)載的時(shí)間特性,只是將Web集群常見的負(fù)載參數(shù)作為衡量指標(biāo)。GBDT算法是一種迭代的決策樹算法,可以同時(shí)將負(fù)載參數(shù)和時(shí)間參數(shù)作為算法模型的輸入,進(jìn)行負(fù)載預(yù)測(cè)。根據(jù)以上規(guī)律利用時(shí)間和負(fù)載特征,提出擴(kuò)縮容策略的改進(jìn),將GBDT算法用于負(fù)載預(yù)估,利用比其他算啊更豐富的衡量指標(biāo),可以增加負(fù)載指數(shù)預(yù)估準(zhǔn)確度;由于帶預(yù)測(cè)性,可以提前知道負(fù)載情況,必要時(shí)提前采取擴(kuò)縮容策略,且預(yù)測(cè)更加靈敏。
GBDT(Gradient Boosting Decision Tree),是一種迭代的決策樹算法,該算法由多棵決策樹組成,所有樹的結(jié)論累加起來做最終答案。它在被提出之初就和SVM一起被認(rèn)為是泛化能力(generalization)較強(qiáng)的算法。近些年更因?yàn)楸挥糜谒阉髋判虻臋C(jī)器模型而引起大家關(guān)注。
GBDT主要組成概念如下:
(1)DT回歸樹Regression Decision Tree
決策樹分為兩大類,回歸樹和分類樹。前者用于預(yù)測(cè)實(shí)數(shù)值,如明天的溫度、用戶的年齡、網(wǎng)頁的相關(guān)程度;后者用于分類標(biāo)簽值,如晴天/陰天/霧/雨、用戶性別、網(wǎng)頁是否是垃圾頁面。GBDT的核心在于累加所有樹的結(jié)果作為最終結(jié)果。
(2)GB梯度迭代Gradient Boosting
即通過迭代多棵樹來共同決策。GBDT的核心就在于,每一棵樹學(xué)的是之前所有樹結(jié)論和的殘差,這個(gè)殘差就是一個(gè)加預(yù)測(cè)值后能得真實(shí)值的累加量。
根據(jù)之前所述的 Web負(fù)載與時(shí)間強(qiáng)相關(guān)的特性,考慮使用某一段時(shí)間內(nèi)的歷史數(shù)據(jù)和時(shí)間特征預(yù)測(cè)未來時(shí)刻的負(fù)載情況。
考慮多種指標(biāo)的綜合因素作為指標(biāo)特征。選取的指標(biāo)有:cpu,內(nèi)存,請(qǐng)求響應(yīng)時(shí)間。采集的每組指標(biāo)組成指標(biāo)向量(x1,x2,x3),數(shù)據(jù)形式為由n條歷史數(shù)據(jù)組成的矩陣。對(duì)矩陣的每一行求加權(quán)平均值,將每項(xiàng)指標(biāo)都考慮進(jìn)去,但越重要的指標(biāo)相應(yīng)的權(quán)值也越大,對(duì)于第k行,按如下公式轉(zhuǎn)化為單一指標(biāo):
然后據(jù)負(fù)載與時(shí)間的強(qiáng)相關(guān)性,按時(shí)間衍生出多維特征,和負(fù)載指標(biāo)一起作為GBDT算法輸入,訓(xùn)練可根據(jù)歷史規(guī)律預(yù)測(cè)負(fù)載的模型。
此方法加入了對(duì)多指標(biāo)監(jiān)控值的綜合處理,著重考慮了最可能成為瓶頸的負(fù)載, 使得對(duì)不同負(fù)載特征的應(yīng)用具有了一定的普適性,避免由于單一指標(biāo)選擇不當(dāng)導(dǎo)致預(yù)測(cè)算法失效。同時(shí)該算法充分利用了負(fù)載與時(shí)間的強(qiáng)相關(guān)性,并且加入了短期趨勢(shì)指標(biāo),由此模型預(yù)測(cè)出的結(jié)果可以同時(shí)兼顧長(zhǎng)期規(guī)律和短期變化,增加預(yù)測(cè)結(jié)果的準(zhǔn)確度;將結(jié)果作為擴(kuò)容指數(shù)應(yīng)用于擴(kuò)縮策略,可以在負(fù)載高峰前提前擴(kuò)容,緩解滯后性。
設(shè)計(jì)實(shí)驗(yàn)驗(yàn)證GBDT算法在Web負(fù)載場(chǎng)景下的有效性。
用有規(guī)律性的周期函數(shù)加上噪聲模擬長(zhǎng)期有規(guī)律,短期有突發(fā)現(xiàn)象的負(fù)載情形,分別使用自回歸算法和gbdt算法進(jìn)行預(yù)測(cè)。評(píng)價(jià)指標(biāo)選用的是可決系數(shù),是指回歸平方和(ESS-explained sum of squares)在總變差(TSS-total sum of squares)中所占的比重。(其中TSS=ESS+SSR,SSR-sum of squares residual)可決系數(shù)可以作為綜合度量回歸模型對(duì)樣本觀測(cè)值擬合優(yōu)度的度量指標(biāo)??蓻Q系數(shù)越大,說明在總變差中由模型作出了解釋的部分占的比重越大,模型擬合優(yōu)度越好。反之可決系數(shù)小,說明模型對(duì)樣本觀測(cè)值的擬合程度越差。
yi示第 i個(gè)真實(shí)值, y?l表示第 i個(gè)預(yù)測(cè)變量,公式表示預(yù)測(cè)值和真實(shí)值的差距的平方和。
實(shí)驗(yàn)方法如下:將數(shù)據(jù)分為訓(xùn)練集(70%)和測(cè)試集(30%),用訓(xùn)練集分別訓(xùn)練兩種模型,并用測(cè)試集進(jìn)行測(cè)試,評(píng)價(jià)兩種算法的效果。
圖3 gbdt, 自回歸和原曲線結(jié)果合并展示Fig.3 Results’ combined display of gbdt,autoregressive and original curve
圖4 gbdt, 自回歸和原曲線結(jié)果分開展示Fig.4 Results’separately display of gbdt,autoregressive and original curve
從圖3和圖4中可以看出,在大多數(shù)時(shí)間段,本章的算法與實(shí)際曲線擬合得較緊密,預(yù)測(cè)效果較好。相比較來說,由于自回歸算法是基于對(duì)近幾個(gè)時(shí)間段負(fù)載直接計(jì)算的,造成預(yù)測(cè)結(jié)果總是比實(shí)際負(fù)載曲線滯后一些的后果,不能及時(shí)對(duì)負(fù)載做出準(zhǔn)確判斷。
圖5 gbdt算法和自回歸算法的可決系數(shù)比較Fig.5 Decisive factor comparison of gbdt algorithm and the autoregressive algorithm
從圖5中可以看出,在此實(shí)驗(yàn)場(chǎng)景下,gbdt算法的可決系數(shù)為0.95,高于自回歸算法的0.89,說明在擬合程度上gbdt算法優(yōu)于自回歸算法。說明在該算法在當(dāng)前負(fù)載的場(chǎng)景里效果更好。
該算法充分利用了負(fù)載與時(shí)間的強(qiáng)相關(guān)性,并且加入了短期趨勢(shì)指標(biāo),由此模型預(yù)測(cè)出的結(jié)果可以同時(shí)兼顧長(zhǎng)期規(guī)律和短期變化,增加預(yù)測(cè)結(jié)果的準(zhǔn)確度。
將結(jié)果作為擴(kuò)容指數(shù)應(yīng)用于擴(kuò)縮策略,可以在負(fù)載高峰前提前擴(kuò)容,緩解滯后性。
[1] Chieu T.C, Mohindra A, Karve A.A et al. Dynamic scaling of web applications in a virtualized cloud computing environment.in: Proceedings of the 2009 IEEE International Conference on e-Business Engineering. Washington, DC, USA: IEEE Computer Society, 2009. 281~286.
[2] Xu J. Analysis, Modeling and Simulation of Workload Patterns in Cloud. IEEE Transactions on Cloud Computing[J].2014, 2(2): 208—221.
[3] 何英東. 基于負(fù)載預(yù)測(cè)的OpenStack虛擬機(jī)智能管理[D].杭州. 浙江大學(xué), 2015.
[4] 單志廣, 戴瓊海, 林闖等. Web 請(qǐng)求分配和選擇的綜合方案與性能分析. 軟件學(xué)報(bào), 2001, 12(3): 355~366.
[5] 孫香花. 云計(jì)算研宄現(xiàn)狀與發(fā)展趨勢(shì)[J]. 計(jì)算機(jī)測(cè)量與控制, 2011, 19(5): 998-1001.
[6] 吳朱華. 云計(jì)算核心技術(shù)剖析[M]. 人民郵電出版社. 2011.66-67.
[7] 張敏輝, 趙錫奎. 基于云計(jì)算技術(shù)的研究與探討[J]. 數(shù)字技術(shù)與應(yīng)用, 2010, 12: 038.
[8] 田文洪, 趙勇. 云計(jì)算一資源調(diào)度管理[M]. 國防工業(yè)出版社. 2011. 29-30.
[9] 曾金龍, 肖新華, 劉清. Docker開發(fā)實(shí)踐[M]. 北京. 人民郵電出版社2015. 8. 11.
[10] 劉健. 可伸縮服務(wù)器集群的研究與實(shí)現(xiàn)[D]. 長(zhǎng)沙. 中國人民解放軍國防科學(xué)技術(shù)大學(xué), 2002.
[11] Tesauro G,Jong N K,Das R.A Hybrid Reinforcement Learning Approach to Autonomic Resource Allocation. Proceedings of the 3rd International Conference on Autonomic Computing[C]. Dublin. Ireland: ICAC, 2006. 65. 73.
[12] 余浩維. PaaS云中w如容器及調(diào)度的設(shè)計(jì)與實(shí)現(xiàn)[D]. 北京.北京郵電大學(xué), 2014.
[13] Chohan N, Bunch C, Pang S et al. AppScale design and implementation. UCSB Technical Report Number 2009-02,2009.
[14] Fedora Unified Network Controller, https://fedorahosted.org/func/.
Research on Elastic Web Cluster Capacity Expansion Mechanism Based on Cloud Platform
WANG Xiao-yu, WU Wei-ming, GU Yong-hao
(School of Computer Science, Beijing University of Posts and Telecommunications, Beijing 100876, China)
Resilient Web Cluster is a Web cluster with flexible scales as the workload changes. In this paper, we study the expansion and contraction mechanism of flexible Web clusters. Firstly, we analyze the advantages and disadvantages of the commonly used algorithms for existing expansion strategies. Then, we propose a new expansion and contraction strategy based on the current strategy. We use more abundant indexes to forecast the load to improve the accuracy of the result of load evaluation predictive. Compared with a simple non-predictive algorithm,it can make the expansion decision earlier, and ultimately support the Web application system to provide high availability and high performance services.
Cloud platform; Web cluster; Flexible scaling; GBDT
TP393.09
A
10.3969/j.issn.1003-6970.2017.11.004
本文著錄格式:王曉鈺,吳偉明,谷勇浩. 基于云平臺(tái)的彈性Web集群擴(kuò)縮容機(jī)制的研究[J]. 軟件,2017,38(11):24-28
國家自然科學(xué)基金項(xiàng)目資助(61173017,61370195);工信部通信軟科學(xué)項(xiàng)目資助(2014-R-42,2015-R-29);國網(wǎng)科技項(xiàng)目(SGTYHT/15-JS-191)
王曉鈺(1989-),女,北京郵電大學(xué)碩士研究生,研究方向:網(wǎng)絡(luò)管理、大數(shù)據(jù)。
吳偉明,教授,主要研究方向:現(xiàn)代網(wǎng)絡(luò)管理。