国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于廣義模糊軟集理論的云計(jì)算資源需求組合預(yù)測(cè)研究

2015-06-12 12:44:00徐達(dá)宇楊善林
中國(guó)管理科學(xué) 2015年5期
關(guān)鍵詞:計(jì)算資源相似性廣義

徐達(dá)宇,楊善林,羅 賀

(1.浙江農(nóng)林大學(xué)浙江省林業(yè)智能監(jiān)測(cè)與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 311300;2.合肥工業(yè)大學(xué)過(guò)程優(yōu)化與智能決策教育部重點(diǎn)實(shí)驗(yàn)室,安徽 合肥 230009)

?

基于廣義模糊軟集理論的云計(jì)算資源需求組合預(yù)測(cè)研究

徐達(dá)宇1,2,楊善林2,羅 賀2

(1.浙江農(nóng)林大學(xué)浙江省林業(yè)智能監(jiān)測(cè)與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 311300;2.合肥工業(yè)大學(xué)過(guò)程優(yōu)化與智能決策教育部重點(diǎn)實(shí)驗(yàn)室,安徽 合肥 230009)

論述了云計(jì)算資源需求預(yù)測(cè)的作用,提出了新的基于夾角余弦的廣義模糊軟集相似性度量方法,將相似性度量結(jié)果與預(yù)測(cè)精度相結(jié)合來(lái)獲得各單項(xiàng)預(yù)測(cè)模型的權(quán)重,并針對(duì)云計(jì)算環(huán)境中資源需求所表現(xiàn)出的短期動(dòng)態(tài)性和長(zhǎng)期周期性特征,選用自適應(yīng)神經(jīng)模糊推理系統(tǒng)ANFIS和季節(jié)性ARIMA模型SARIMA作為單項(xiàng)預(yù)測(cè)模型,以此構(gòu)建基于廣義模糊軟集理論的組合預(yù)測(cè)模型GFSS-ANFIS/SARIMA。最后將該模型用于云計(jì)算環(huán)境下的資源需求預(yù)測(cè)應(yīng)用中去。實(shí)驗(yàn)結(jié)果表明,與其它預(yù)測(cè)模型相比,該模型能有效提高預(yù)測(cè)精度,具有良好的預(yù)測(cè)性能。本文所提方法能為云計(jì)算資源的高效調(diào)度和分配提供決策支持。

云計(jì)算;廣義模糊軟集;相似性度量;組合預(yù)測(cè);自適應(yīng)神經(jīng)模糊推理系統(tǒng)

1 引言

云計(jì)算以承諾向用戶(hù)提供具有高可擴(kuò)展性、靈活性和成本效益的計(jì)算、存儲(chǔ)及其它各類(lèi)應(yīng)用服務(wù)而受到業(yè)界的廣泛關(guān)注。為了實(shí)現(xiàn)這些承諾,云計(jì)算服務(wù)提供商不僅需要通過(guò)構(gòu)建完善的基礎(chǔ)設(shè)施、采取迅速有效的管理機(jī)制對(duì)資源進(jìn)行規(guī)劃以提供高質(zhì)量服務(wù)來(lái)滿足用戶(hù)需求,同時(shí)還需要控制成本、提高利潤(rùn)來(lái)謀求自身的長(zhǎng)期發(fā)展,而云計(jì)算數(shù)據(jù)中心能源消耗所產(chǎn)生的費(fèi)用是運(yùn)營(yíng)成本中一個(gè)主要的構(gòu)成部分。Bianchini[1]指出一臺(tái)功率為300瓦特的服務(wù)器,一年內(nèi)將用去338美元電費(fèi)并釋放1300千克二氧化碳。相關(guān)統(tǒng)計(jì)還顯示,在2006年,美國(guó)全部的數(shù)據(jù)中心消耗了590億千瓦時(shí)電量,占全社會(huì)電力消費(fèi)的2%,價(jià)值共計(jì)約41億美元,截止到2011年這一數(shù)據(jù)已翻倍,數(shù)據(jù)中心如此巨大的電力消耗不僅增加了運(yùn)營(yíng)商的運(yùn)營(yíng)成本,而且還會(huì)因高功率運(yùn)行產(chǎn)生的大量熱量導(dǎo)致系統(tǒng)可靠性的降低和設(shè)備壽命的減短,繼而再次增加運(yùn)營(yíng)商固定資本的投入。另一方面,與高電力消耗形成鮮明對(duì)比的是數(shù)據(jù)中心資源的低利用率,研究顯示云計(jì)算數(shù)據(jù)中心各類(lèi)資源(CPU,內(nèi)存,網(wǎng)絡(luò)及存儲(chǔ)等)的平均利用率在10%至50%之間,超過(guò)60%的服務(wù)器處于閑置狀態(tài)[2], 即這些珍貴的資源在大部分時(shí)間里未得到充分利用。因而,如何運(yùn)用相關(guān)理論與方法來(lái)實(shí)現(xiàn)云計(jì)算資源的合理使用,建設(shè)具有能源意識(shí)數(shù)據(jù)中心,減小其對(duì)環(huán)境的負(fù)面影響,實(shí)現(xiàn)綠色計(jì)算成為近年來(lái)學(xué)界的研究熱點(diǎn)[3-4]。

云計(jì)算環(huán)境下的資源需求預(yù)測(cè)是實(shí)現(xiàn)云計(jì)算海量異構(gòu)資源有效管理以應(yīng)對(duì)動(dòng)態(tài)且不確定的多元化用戶(hù)需求,保證及時(shí)、可靠地將各種資源提供給使用者的同時(shí)降低運(yùn)營(yíng)商、服務(wù)提供商自身的成本,以及減少數(shù)據(jù)中心能源消耗過(guò)程中重要的一步。利用歷史數(shù)據(jù)對(duì)未來(lái)一段時(shí)間內(nèi)資源需求負(fù)荷進(jìn)行準(zhǔn)確的預(yù)測(cè),就可以運(yùn)用服務(wù)器運(yùn)行機(jī)制和虛擬化技術(shù)來(lái)實(shí)現(xiàn)整個(gè)云計(jì)算數(shù)據(jù)中心資源的合理分配,并為云計(jì)算運(yùn)營(yíng)商提供有力的決策支持。在先前的云計(jì)算資源需求預(yù)測(cè)研究中,相關(guān)學(xué)者使用了如自回歸模型(AR)[5]、模式匹配[6]、神經(jīng)網(wǎng)絡(luò)[7-8]等單項(xiàng)方法。然而,云計(jì)算資源需求負(fù)荷是受多種因素影響的復(fù)雜非線性系統(tǒng),在多因素影響的疊加下,單一模型難以準(zhǔn)確描述其復(fù)雜的內(nèi)部變化規(guī)律,不能及時(shí)反映外部環(huán)境因素發(fā)生的變化,是預(yù)測(cè)精度具有非精確性的模糊系統(tǒng),而組合預(yù)測(cè)方法能有效結(jié)合各種單項(xiàng)預(yù)測(cè)模型的優(yōu)點(diǎn),并能確保其預(yù)測(cè)誤差的方差不大于任何一個(gè)單項(xiàng)預(yù)測(cè)模型[9], 是在現(xiàn)有單項(xiàng)預(yù)測(cè)模型的基礎(chǔ)上再次提高預(yù)測(cè)精度的理想選擇。

Bates和Granger[10]于1969年首次提出組合預(yù)測(cè)的思想,它綜合利用各單項(xiàng)預(yù)測(cè)方法提供的信息,集成不同信息來(lái)源的預(yù)測(cè)結(jié)果, 從而提高預(yù)測(cè)精度,而組合預(yù)測(cè)的難點(diǎn)是最優(yōu)模型組合權(quán)重的分配。國(guó)內(nèi)學(xué)者提出了一些組合預(yù)測(cè)模型的權(quán)重確定方法,如陳華友等[11]以預(yù)測(cè)精度作為誘導(dǎo)變量值進(jìn)行有序加權(quán)幾何集成,通過(guò)預(yù)測(cè)值對(duì)數(shù)序列與實(shí)際值的對(duì)數(shù)序列之間的相關(guān)程度作為目標(biāo)函數(shù),提出一種基于相關(guān)系數(shù)的IWOGA算子最優(yōu)組合預(yù)測(cè)模型。孫李紅等[12]提出了基于相關(guān)系數(shù)加權(quán)集合平均來(lái)確定權(quán)重的組合預(yù)測(cè)方法。李美娟等[13]提出相容方法集和互補(bǔ)模型集,然后在對(duì)不同單一預(yù)測(cè)模型的漂移性和互補(bǔ)性研究的基礎(chǔ)上求各種模型權(quán)重,構(gòu)建了基于漂移度的組合預(yù)測(cè)模型,為組合預(yù)測(cè)模型研究提供一種新的思路。

然而,如Xiao Zhi等[14]所述,組合預(yù)測(cè)模型中由各單項(xiàng)模型獲得的預(yù)測(cè)值是對(duì)實(shí)際值的一個(gè)模糊描述,因此基于精確概念的傳統(tǒng)數(shù)學(xué)方法在處理此類(lèi)問(wèn)題時(shí)就有其不足之處。Molodtsov[15]于1999年提出了模糊軟集合(FSS, Fuzzy Soft Sets)理論用于處理嵌入在各類(lèi)系統(tǒng)中的具有不確定性和非精確性問(wèn)題,并在系統(tǒng)地定義了其相關(guān)法則的基礎(chǔ)上列舉了一些簡(jiǎn)單應(yīng)用。自此,模糊軟集合理論有了快速的發(fā)展,如Maji等人[16]將該理論運(yùn)用于解決決策問(wèn)題,孫智勇和劉星[17]提出了基于模糊軟集合理論的稅收收入的組合預(yù)測(cè)模型。在這些研究的基礎(chǔ)上,Majumdar和Samanta[18]拓展了模糊軟集合理論并提出了廣義模糊軟集合(GFSS, Generalized Fuzzy Soft Sets)這一概念及其基本性質(zhì),給出了廣義模糊軟集合的相似性度量方法,并用一個(gè)醫(yī)學(xué)決策實(shí)例驗(yàn)證了該方法的有效性。可以說(shuō),廣義模糊軟集合是模糊軟集合的進(jìn)一步推廣,可以更好地處理不確定性問(wèn)題[19]。

本文介紹了廣義模糊軟集合的基本概念及其性質(zhì),把廣義模糊軟集合理論引入到組合預(yù)測(cè)模型的構(gòu)建當(dāng)中去,提出了新的基于夾角余弦的廣義模糊軟集合相似性度量方法,將相似性度量與單項(xiàng)預(yù)測(cè)模型的預(yù)測(cè)精度結(jié)合,獲得組合預(yù)測(cè)模型的權(quán)重系數(shù),從而構(gòu)建基于廣義模糊軟集合的組合預(yù)測(cè)模型,并將該方法用于預(yù)測(cè)云計(jì)算環(huán)境下的動(dòng)態(tài)資源需求。在實(shí)驗(yàn)中將該組合預(yù)測(cè)模型與其它預(yù)測(cè)模型在預(yù)測(cè)性能上進(jìn)行了全面的比較,結(jié)果顯示了該組合預(yù)測(cè)模型的有效性和可靠性。

2 廣義模糊軟集合的基本概念

在本節(jié)中,首先簡(jiǎn)單介紹模糊軟集合理論,隨后給出廣義模糊軟集合的基本概念。

2.1 模糊軟集合理論

定義2.1[15]:設(shè)U是初始論域,E是參數(shù)集,P(U)是集合U上的冪集,稱(chēng)(F,E)是U上的一個(gè)軟集合,當(dāng)且僅當(dāng)F是E到U的所有子集的一個(gè)映射,即F:E→P(U)。

定義2.2[20]:設(shè)U是初始論域,E是參數(shù)集,設(shè)IU為U的所有模糊子集。令A(yù)?E,則稱(chēng)(F,E)是U上的一個(gè)模糊軟集合,當(dāng)且僅當(dāng)F滿足映射關(guān)系:F:A→IU。

2.2 廣義模糊軟集合

在了解了模糊軟集合的基本定義后,下面進(jìn)一步論述廣義模糊軟集合的定義。

定義2.3[18]:設(shè)U={x1,x2,…,xn}為初始論域,E={e1,e2,…em}為對(duì)應(yīng)的參數(shù)集,則(U,E)稱(chēng)為軟論域。令F為映射F:E→IU,μ為E的一個(gè)模糊子集且滿足μ:E→I=[0,1],其中IU為U的所有模糊子集集合。再令映射Fμ:E→IU×I,函數(shù)Fμ具有以下定義:Fμ(e)=(F(e),μ(e)),其中F(e)∈IU。那么,Fμ就成為軟論域(U,E)上的一個(gè)廣義模糊軟集合。

在此,對(duì)于任意一個(gè)給定的參數(shù)ei,Fμ(ei)=(F(ei),μ(ei))不僅用F(ei)給出了U中每一個(gè)所考慮對(duì)象在某一特定屬性下的模糊隸屬程度,而且還用μ(ei)指出了這種隸屬程度的整體可能性大小。在Majumdar等[18]研究中還給出了兩個(gè)GFSS之間的交、并和補(bǔ)等運(yùn)算,在此不加詳述。

2.3 基于夾角余弦的GFSS相似性度量

相似性度量是一個(gè)用于確定兩個(gè)對(duì)象間相似程度的重要工具。本文在以往研究的基礎(chǔ)上,針對(duì)GFSS自身特點(diǎn),提出基于夾角余弦的GFSS相似性度量算法。由第二節(jié)的討論,可得Fμ的一般矩陣表達(dá)形式:

(2.1)

(2.2)

其中λit為矩陣Fμ中的元素,且0≤λit≤1,i,j=1,2,…,n,t=1,2,…m。同樣地,可知SG(F(ei),F(ej))滿足如下性質(zhì):

(1)0≤SG(F(ei),F(ej))≤1;

(2)SG(F(ei),F(ej))=SG(F(ej),F(ei));

(3)SG(F(ei),F(ej))=μ(ei)·μ(ej)成立,當(dāng)且僅當(dāng)F(ei)=F(ej)成立。

以上性質(zhì)的證明可由(2.2)式推導(dǎo)可得??梢?jiàn),本文提出的基于夾角余弦的GFSS相似性度量方法充分考慮了GFSS中的所有有效信息,滿足相似性度量的基本原理和性質(zhì),在組合模型最優(yōu)權(quán)系數(shù)的確定過(guò)程中具有重要意義。

3 云計(jì)算環(huán)境下基于GFSS的資源需求組合預(yù)測(cè)模型

3.1 基于GFSS組合預(yù)測(cè)模型構(gòu)建

為了解決組合預(yù)測(cè)模型權(quán)重的確定問(wèn)題,本文將GFSS引入到組合模型的構(gòu)建當(dāng)中,然后利用GFSS相似性度量方法和單項(xiàng)預(yù)測(cè)模型預(yù)測(cè)精度求解組合預(yù)測(cè)模型的權(quán)重系數(shù),獲得最優(yōu)組合預(yù)測(cè)模型。而由各單項(xiàng)模型轉(zhuǎn)化到其GFSS形式的關(guān)鍵是如何準(zhǔn)確地表達(dá)預(yù)測(cè)值與實(shí)際值之間的關(guān)系,從而準(zhǔn)確反映出單項(xiàng)預(yù)測(cè)模型的預(yù)測(cè)性能,即如何通過(guò)單項(xiàng)預(yù)測(cè)值求得GFSS中的λ和μ值。其中λ值用于獲得每個(gè)預(yù)測(cè)點(diǎn)的優(yōu)劣,而μ則需要利用某個(gè)單項(xiàng)模型的所有預(yù)測(cè)值提供的信息對(duì)該模型整體的預(yù)測(cè)效果做出定量評(píng)估,本文給出以下定義。

定義3.1:令λit和μi分別為廣義模糊軟集合(F,X)中的元素,定義:

(3.1)

(3.2)

其中,λit即為第i個(gè)預(yù)測(cè)模型在t時(shí)刻的預(yù)測(cè)精度,而由基于距離概念定義的μi構(gòu)成的隸屬度向量(μ1,μ2,…,μn)用于評(píng)估第i個(gè)預(yù)測(cè)模型的總體預(yù)測(cè)性能。

由定義3.1所求得的λ和μ值能準(zhǔn)確反映單項(xiàng)模型的預(yù)測(cè)性能,又能將其合理的轉(zhuǎn)化到GFSS形式,從而可以建立個(gè)單項(xiàng)模型關(guān)于時(shí)間序列點(diǎn)的廣義模糊軟集合Fμ:

其一般的表達(dá)形式如表1所示。

由表1,利用公式(2.2)計(jì)算以上每一個(gè)Fμ(xi)與Fμ(yt)之間的相似度SG(xi,yt),在此基礎(chǔ)上可得每個(gè)單項(xiàng)預(yù)測(cè)模型在組合模型中的權(quán)重ωi:

(3.3)表1 本文構(gòu)建的GFSS表格形式

基于以上論述,給出基于廣義模糊軟集合的組合預(yù)測(cè)算法流程:

步驟2:利用公式(3.1)和(3.2)計(jì)算λit及μi,構(gòu)建廣義模糊軟集合(F,X);

步驟3:利用GFSS相似性度量公式(2.2)計(jì)算每個(gè)單項(xiàng)模型預(yù)測(cè)值與實(shí)際時(shí)間序列值的GFSS相似度SG(Fμ(xi),Fμ(yt));

步驟4:利用公式(3.3)獲得每個(gè)單項(xiàng)模型的權(quán)重ωi;

3.2 單項(xiàng)預(yù)測(cè)模型選擇及模型構(gòu)建

在云計(jì)算環(huán)境下,業(yè)務(wù)需求呈現(xiàn)多元化,海量數(shù)據(jù)存儲(chǔ)與分析、科學(xué)工程計(jì)算、互聯(lián)網(wǎng)及無(wú)線移動(dòng)終端應(yīng)用等都將是其服務(wù)的內(nèi)容。用戶(hù)把與各自業(yè)務(wù)相關(guān)的應(yīng)用程序放置在運(yùn)營(yíng)商的服務(wù)器上,每個(gè)應(yīng)用程序又由多個(gè)組件構(gòu)成,各個(gè)組件又分別運(yùn)行在不同的虛擬機(jī)上,這些因素導(dǎo)使云計(jì)算資源需求具有很強(qiáng)的非線性性和動(dòng)態(tài)性,從而給預(yù)測(cè)本身以及單項(xiàng)預(yù)測(cè)模型的合理選擇帶來(lái)了困難,因此,需要對(duì)云計(jì)算資源負(fù)荷特征有清晰的了解才能做到合理、準(zhǔn)確預(yù)測(cè)。

Benson等[22]和Tan Jian等[23]對(duì)目前云計(jì)算平臺(tái)上運(yùn)行的各類(lèi)應(yīng)用作了了分類(lèi),并對(duì)工作流特性進(jìn)行了統(tǒng)計(jì)分析,揭示了多租戶(hù)環(huán)境下CPU和內(nèi)存等虛擬化資源的需求特征。從分析可得,云計(jì)算的資源負(fù)荷時(shí)間序列具有一定的模式,主要表現(xiàn)出以下幾個(gè)特性:(1)周期性。主要表現(xiàn)在負(fù)荷曲線會(huì)依據(jù)人類(lèi)生產(chǎn)、生活規(guī)律,總體上會(huì)表現(xiàn)出相應(yīng)的周期性特點(diǎn),如日和周的循環(huán)時(shí)間效應(yīng)。(2)應(yīng)用相關(guān)性。即云計(jì)算負(fù)荷會(huì)隨著運(yùn)行在該平臺(tái)上應(yīng)用的不同而在一定時(shí)間范圍內(nèi)展現(xiàn)出特定的需求趨勢(shì),如計(jì)算密集型應(yīng)用會(huì)對(duì)CPU資源產(chǎn)生大量需求導(dǎo)致其負(fù)荷上升,數(shù)據(jù)密集型應(yīng)用(如MapReduce,搜索等)會(huì)占用大量I/O及存儲(chǔ)資源從而導(dǎo)致兩者需求的增加,而在線游戲、視頻等服務(wù)同時(shí)會(huì)對(duì)CPU和內(nèi)存提出大批資源請(qǐng)求,這些應(yīng)用會(huì)明顯地影響其負(fù)荷。(3)隨機(jī)性。目前云計(jì)算提供的計(jì)價(jià)服務(wù)主要包括兩種形式:預(yù)定(Reservation)和按需供應(yīng)(On-Demand)[24],而資源需求的隨機(jī)性不僅來(lái)自于按需供應(yīng)這一塊,預(yù)定資源同樣也會(huì)產(chǎn)生隨機(jī)性需求,當(dāng)預(yù)定的資源不足時(shí),增加的資源需求便要按需供應(yīng),這樣就更加突顯了云計(jì)算資源需求的復(fù)雜性和不確定性?;谝陨戏治隹芍x擇合適的單項(xiàng)模型對(duì)于預(yù)測(cè)性能的提升有著重要作用。

首先,針對(duì)云計(jì)算資源需求過(guò)程中出現(xiàn)的強(qiáng)非線性,高不確定性和時(shí)變特性,本文選用自適應(yīng)神經(jīng)模糊推理系統(tǒng)(Adaptive Neuro-Fuzzy Inference System,ANFIS)對(duì)資源需求進(jìn)行預(yù)測(cè)。ANFIS是一種多層前饋神經(jīng)網(wǎng)絡(luò),利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法和模糊推理規(guī)則將輸入空間映射到輸出空間。由于其能將模糊推理系統(tǒng)的語(yǔ)言處理能力有效地結(jié)合到自適應(yīng)神經(jīng)網(wǎng)絡(luò)系統(tǒng)的數(shù)值處理能力中,并允許從數(shù)值數(shù)據(jù)或?qū)<抑R(shí)的模糊性中提取規(guī)則,自適應(yīng)地構(gòu)造一個(gè)規(guī)則庫(kù),使得ANFIS具有良好的學(xué)習(xí)、模型構(gòu)建和數(shù)據(jù)分類(lèi)能力。下面將介紹本文基于ANFIS模型的預(yù)測(cè)步驟, 表2給出下文中要用到的主要標(biāo)示, 圖1給出了本文所建的ANFIS模型示意圖。

步驟1:需求負(fù)荷時(shí)間序列聚類(lèi)。在多用戶(hù)環(huán)境下不可避免的會(huì)產(chǎn)生需求的動(dòng)態(tài)變化,這種不確定性給預(yù)測(cè)帶來(lái)諸多困難,該步驟的主要目的是從大量的歷史數(shù)據(jù)集中辨識(shí)出需求負(fù)荷時(shí)間序列中隱含的主要云計(jì)算應(yīng)用類(lèi)型,反映出系統(tǒng)運(yùn)行的實(shí)際情況。因此在預(yù)測(cè)前,本文用C-means算法[24]將待預(yù)測(cè)的數(shù)據(jù)集進(jìn)行聚類(lèi)分析,使同一子類(lèi)中包含同類(lèi)型的數(shù)據(jù)。對(duì)于時(shí)間序列Y(t)={y1,y2,…,yt},定義其動(dòng)態(tài)情況表達(dá)值ΔY(t)為:

ΔY(t)={yt-yt-1,yt-1-yt-2,…,y2-y1},

(3.4)表2 符號(hào)及標(biāo)示

圖1 ANFIS預(yù)測(cè)模型

根據(jù)動(dòng)態(tài)情況表達(dá)式Δyt的值,C-means算法依據(jù)yt在某一聚類(lèi)j中的隸屬度μj將其劃撥到特定的類(lèi)中,該算法的目標(biāo)函數(shù)為:

(3.5)

其中νj為第j個(gè)聚類(lèi)的中心,J為聚類(lèi)總個(gè)數(shù)。

步驟2:聚類(lèi)間狀態(tài)轉(zhuǎn)移。對(duì)云計(jì)算資源需求時(shí)間序列進(jìn)行聚類(lèi)后,需要計(jì)算各個(gè)聚類(lèi)間的狀態(tài)轉(zhuǎn)移概率,這一步驟的目的是為了接下來(lái)在用ANFIS獲得各個(gè)聚類(lèi)的預(yù)測(cè)值后,能合理地分配各預(yù)測(cè)值的比率,最終得到理想的預(yù)測(cè)結(jié)果。在此,我們用貝葉斯推理來(lái)獲得所需的聚類(lèi)間狀態(tài)轉(zhuǎn)移概率,即:

ξj,j′(t)=P(yt∈Cj|yt-1∈Cj′)

=P(yt-1∈Cj′|yt∈Cj)×P(yt∈Cj)

(3.6)

其中先驗(yàn)概率:

(3.7)

Nt,j為t時(shí)刻時(shí)間序列中在聚類(lèi)Cj中的數(shù)據(jù)個(gè)數(shù),N為時(shí)間序列數(shù)據(jù)總數(shù)。條件概率P(yt-1∈Cj′|yt∈Cj)的值可由LaplaceCorrection法進(jìn)行估計(jì):

(3.8)

Nt-1,j′為t-1時(shí)刻聚類(lèi)Cj′中的數(shù)據(jù)個(gè)數(shù)。

步驟3:ANFIS預(yù)測(cè)。為了在保證預(yù)測(cè)準(zhǔn)確性的同時(shí)降低計(jì)算復(fù)雜度,本文構(gòu)建的基于ANFIS的云計(jì)算資源預(yù)測(cè)模型是具有四個(gè)輸入{yj(t-3),yj(t-2),yj(t-1),yj(t)}的五層結(jié)構(gòu)(當(dāng)輸入超過(guò)4個(gè)時(shí),產(chǎn)生的規(guī)則數(shù)目過(guò)多,將大大增加訓(xùn)練和預(yù)測(cè)時(shí)間并降低預(yù)測(cè)性能),產(chǎn)生RULE(24),即16條推理規(guī)則。在輸入層,根據(jù)Takagi-Sugeno模糊推理法可得:

THEN

(3.9)

在L2層,利用上一層獲得的隸屬度值,用下式計(jì)算獲得該層的輸出值:

(3.10)

在L3層,計(jì)算每個(gè)節(jié)點(diǎn)的激勵(lì)強(qiáng)度占所有節(jié)點(diǎn)總激勵(lì)強(qiáng)度的比率:

(3.11)

在L4層,將L3層每個(gè)節(jié)點(diǎn)的標(biāo)準(zhǔn)化激勵(lì)強(qiáng)度值與輸入層由Takagi-Sugeno模糊推理法得到的初始輸入值進(jìn)行線性組合,得到第j個(gè)聚類(lèi)的ANFIS預(yù)測(cè)值,公式如下:

(3.12)

在L5層,將獲得的每個(gè)聚類(lèi)的預(yù)測(cè)值用于計(jì)算全局預(yù)測(cè)值,以此來(lái)得到下一時(shí)刻的云計(jì)算資源需求值,利用由公式(3.6)求得的聚類(lèi)間狀態(tài)轉(zhuǎn)移概率,以及每個(gè)聚類(lèi)在t-1時(shí)刻的狀態(tài)先驗(yàn)概率P(St-1=j′)以獲得t時(shí)刻每個(gè)聚類(lèi)在t時(shí)刻的狀態(tài)先驗(yàn)概率:

(3.13)

最后獲得整個(gè)數(shù)據(jù)集的ANFIS預(yù)測(cè)值:

(3.14)

接下來(lái),針對(duì)云計(jì)算資源需求過(guò)程中體現(xiàn)出的周期性和趨勢(shì)性特點(diǎn),本文利用季節(jié)性ARIMA模型SARIMA來(lái)進(jìn)行預(yù)測(cè),它對(duì)于循環(huán)周期性時(shí)間序列數(shù)據(jù)具有優(yōu)良的預(yù)測(cè)性能。如Tseng等[25]中所述,季節(jié)性ARIMA模型ARIMA(p,d,q)(P,D,Q)s的表達(dá)式為:

θp(B)Θp(BS)(1-B)d(1-BS)Dyt=wq(B)WQ(BS)at

(3.15)

其中:

wq(B)=1-ψ1B-ψ2B2-…-ψqBq

(3.16)

θp(B)=1-θ1B-θ2B2-…-θpBp

(3.17)

Θp(BS)=1-Θ1BS-Θ2B2S-…-ΘPBPS

(3.18)

WQ(BS)=1-W1BS-W2B2S-…-WQBQS

(3.19)

最后,在獲得了由單項(xiàng)模型ANFIS及SARIMA預(yù)測(cè)出的未來(lái)一段時(shí)間內(nèi)云計(jì)算資源需求值之后,需要計(jì)算出基于GFSS理論單項(xiàng)預(yù)測(cè)模型權(quán)重wANFIS和wSARIMA,構(gòu)建云計(jì)算環(huán)境下的資源需求組合預(yù)測(cè)模型GFSS-ANFIS/SARIMA,流程如圖2所示。

圖2 基于GFSS-ANFIS/SARIMA的云計(jì)算資源需求組合預(yù)測(cè)流程圖

4 實(shí)驗(yàn)及結(jié)果分析

本文所用實(shí)驗(yàn)數(shù)據(jù)來(lái)自NASA和Clarknet[26],該數(shù)據(jù)詳細(xì)記錄了每秒鐘兩個(gè)數(shù)據(jù)中心接收到的服務(wù)請(qǐng)求內(nèi)容,在許多研究[8,27,28]中已被多次用于云計(jì)算需求預(yù)測(cè)及性能分析研究。為了綜合驗(yàn)證本文所建組合預(yù)測(cè)模型的性能,本文在數(shù)據(jù)預(yù)處理階段將所抽取的實(shí)驗(yàn)數(shù)據(jù)以10秒和60秒兩個(gè)不同的粒度進(jìn)行聚合,以此來(lái)生成四組數(shù)據(jù)集:NASA-10、NASA-60、Clarknet-10和Clarknet-60,每組5000個(gè)訓(xùn)練數(shù)據(jù),并預(yù)測(cè)接下來(lái)的300個(gè)數(shù)據(jù)點(diǎn),目的是檢驗(yàn)GFSS-ANFIS/SARIMA組合模型在處理短期的波動(dòng)性時(shí)間序列數(shù)據(jù)(NASA-10和Clarknet-10),以及長(zhǎng)期周期性時(shí)間序列數(shù)據(jù)(NASA-60和Clarknet-60)時(shí),是否都表現(xiàn)出穩(wěn)定的預(yù)測(cè)性能和準(zhǔn)確的預(yù)測(cè)結(jié)果。本文選擇以平均絕對(duì)百分比誤差(MAPE)和均方根誤差(RMSE)兩個(gè)指標(biāo)作為衡量預(yù)測(cè)性能是否優(yōu)良的評(píng)價(jià)指標(biāo):

(1)MAPE:

(2)RMSE:

為了驗(yàn)證GFSS-ANFIS/SARIMA組合預(yù)測(cè)模型有效性,本文選取自回歸移動(dòng)平均(ARMA)、BP神經(jīng)網(wǎng)絡(luò)及指數(shù)平滑三個(gè)模型作為對(duì)比,其中ARMA模型的自回歸項(xiàng)數(shù)p和模型的移動(dòng)平均項(xiàng)數(shù)q分別設(shè)為p=2和q=1,BP神經(jīng)網(wǎng)絡(luò)的隱含層個(gè)數(shù)設(shè)置為20,指數(shù)平滑采用二次平滑,選取前300個(gè)點(diǎn)的平均值作為平滑初值,平滑參數(shù)α經(jīng)過(guò)計(jì)算機(jī)自動(dòng)識(shí)別,確定為α=0.36,此時(shí)方差最小。圖3為本文所建組合預(yù)測(cè)模型GFSS-ANFIS/SARIMA的預(yù)測(cè)結(jié)果示意圖,圖4給出了該模型與各單項(xiàng)模型的預(yù)測(cè)精度比較結(jié)果。

圖3(a) NASA-10預(yù)測(cè)結(jié)果

圖3(b) Clarknet-10預(yù)測(cè)結(jié)果

圖3(c) NASA -60預(yù)測(cè)結(jié)果

圖3(d) Clarknet-60預(yù)測(cè)結(jié)果

圖4 與單項(xiàng)模型預(yù)測(cè)結(jié)果相對(duì)誤差的比較示意圖

從圖4可以看出,本文構(gòu)建的組合模型相對(duì)于以上幾個(gè)單項(xiàng)模型,在預(yù)測(cè)性能上有顯著地提升。同時(shí)也注意到,利用Clarknet數(shù)據(jù)獲得的預(yù)測(cè)精度要優(yōu)于NASA,原因可能是Clarknet數(shù)據(jù)比NASA數(shù)據(jù)更有規(guī)律性,相對(duì)較平穩(wěn),也易于模型把握其總體趨勢(shì)和特征,從而表現(xiàn)出更小的預(yù)測(cè)誤差。在與傳統(tǒng)的時(shí)間序列單項(xiàng)模型比較的基礎(chǔ)上,再用本文所用的三個(gè)單項(xiàng)模型,構(gòu)建陳華友[11]研究中的基于IOWGA算子的組合預(yù)測(cè)模型,以及XiaoZhi等[14]研究中所提的基于模糊軟集合理論(FSS)的組合預(yù)測(cè)模型與本文建立的組合預(yù)測(cè)模型在預(yù)測(cè)效果上進(jìn)行比較。

圖5 與組合模型預(yù)測(cè)相對(duì)誤差的比較示意圖

圖5為本文構(gòu)建的模型與以上兩個(gè)組合預(yù)測(cè)模型的預(yù)測(cè)結(jié)果比較示意圖,表3給出了總的數(shù)值比較結(jié)果。

從預(yù)測(cè)結(jié)果比較中可以看到,本文所提的組合預(yù)測(cè)模型預(yù)測(cè)值與實(shí)際值在整體上最為貼近,不僅從直觀上反映出該模型良好的預(yù)測(cè)性能,而且在各評(píng)價(jià)指標(biāo)上也體現(xiàn)出較大的優(yōu)勢(shì)。與傳統(tǒng)的單項(xiàng)時(shí)間序列預(yù)測(cè)模型相比,在預(yù)測(cè)精度和效果上都有明顯的提高,而在組合預(yù)測(cè)算法時(shí)間復(fù)雜度上,本文為O[n·(m+1)],相比于XiaoZhi等[14]研究中的O[n·m],只用了較小的代價(jià)獲就得預(yù)測(cè)精度的有效提升,而相比于陳華友[11]的時(shí)間復(fù)雜度O[n·m2],不管在預(yù)測(cè)精度上還是時(shí)間復(fù)雜度上,本文算法都優(yōu)于陳華友[11]。綜上所述,本文所構(gòu)建的組合預(yù)測(cè)模型在實(shí)際運(yùn)用過(guò)程中能準(zhǔn)確析取云計(jì)算負(fù)荷數(shù)據(jù)中所蘊(yùn)含的信息內(nèi)容,并將對(duì)數(shù)據(jù)信息內(nèi)容的理解融入到模型構(gòu)建及預(yù)測(cè)的過(guò)程中去,在提升預(yù)測(cè)精度的同時(shí)具有良好的非線性及動(dòng)態(tài)時(shí)間序列預(yù)測(cè)性能。

5 結(jié)語(yǔ)

本文首先介紹了云計(jì)算資源需求預(yù)測(cè)在實(shí)現(xiàn)云計(jì)算資源高效管理中的作用,闡述廣義模糊軟集合理論相關(guān)概念,將該理論引入到組合預(yù)測(cè)模型的構(gòu)建當(dāng)中,提出了廣義模糊軟集合的相似性度量公式,并將相似性度量結(jié)果與單項(xiàng)模型的預(yù)測(cè)精度結(jié)合獲得組合預(yù)測(cè)模型中各單項(xiàng)模型的最優(yōu)權(quán)值,構(gòu)建了基于廣義模糊軟集合理論、自適應(yīng)神經(jīng)模糊推理系統(tǒng)ANFIS及季節(jié)性ARIMA模型SARIMA的優(yōu)化組合預(yù)測(cè)模型GFSS-ANFIS/SARIMA,并將該組合預(yù)測(cè)模型用于云計(jì)算環(huán)境下的資源需求預(yù)測(cè),實(shí)驗(yàn)結(jié)果表明了該組合模型的有效性和合理性。

表3 各模型預(yù)測(cè)精度比較

[1] Bianchini R, Rajamony R. Power and energy management for server systems[J]. Computer, 2004, 37(11):68-74.

[2] Guenter B, Jain N, Williams C. Managing cost, performance, and reliability tradeoffs for energy-aware server provisioning[C].Proceedings of the 30th IEEE International Conference on Computer Communications,Shanghai,China,April 10-15,2011.

[3] Baliga J, Ayre R W A, Hinton K,et al.Green cloud computing: Balancing energy in processing, storage, and transport[J]. Proc. IEEE, 2011, 99(1):149 -167.

[4] Garg S K, Yeo C S, Anandasivam A,et al. Environment-conscious scheduling of HPC applications on distributed cloud-oriented data centers[J]. Journal of Parallel and Pistributed Computing, 2011, 71(6): 732-749.

[5] Mark C C T,Niyato D,Che-khong T. Evolutionary optimal virtual machine placement and demand forecaster for cloud computing[C].Proceedings of the 25th International Conference on Advanced Information Networking and Applications, Biopolis,Singapore,March 22-25,2011.

[6] Caron E, Desprez F, Muresan A. Forecasting for grid and cloud computing on-demand resources based on pattern matching[C]. Proceedings of the 2nd IEEE International Conference on Cloud Computing Technology and Science,Indianapolis,November 30-December 3,2010.

[7] Islam S, Keung J, Lee K, et al. Empirical prediction models for adaptive resource provisioning in the cloud[J]. Future Generation Computer Systems, 2011,28(1): 155-162.

[8] Duy T V T, Sato Y, Inoguchi, Y. Performance evaluation of a green scheduling algorithm for energy savings in cloud computing[C].Proceeding of International Symposium on Parallel Distributed Processing Workshops and Phd Forum IPDPSW,Atlanta,GA,April 19-23,2010.

[9] Dickinson J P. Some comments on the combination of forecasts[J]. Operational Research Quarterly, 1975,26(1):205-210.

[10] Bates J M, Granger C W J. The combination of forecasts[J]. Operations Research Quarterly, 1969, 20(4): 415-468.

[11] 陳華友,盛昭瀚.一類(lèi)基于IOWGA算子的組合預(yù)測(cè)新方法[J].管理工程學(xué)報(bào),2005,19(4):36-39.

[12] 孫李紅,沈繼紅.基于相關(guān)系數(shù)的加權(quán)幾何平均組合預(yù)測(cè)模型的性質(zhì)[J].系統(tǒng)工程理論與實(shí)踐,2009,(9): 84-91.

[13] 李美娟,陳國(guó)宏,林志炳.基于漂移度的組合預(yù)測(cè)方法研究[J].中國(guó)管理科學(xué),2011,19(3):111-117.

[14] Xiao Zhi, Gong Ke, Zou Yan. A combined forecasting approach based on fuzzy soft sets[J]. Journal of computational and Applied Mathematics, 2009,228(1): 326-333.

[15] Molodtsov D. Soft set theory-first results[J]. Computers & Mathematics with Application, 1999,37(4):19-31.

[16] Maji P K, Roy A R, Biswas R. An application of soft sets in a decision making problem[J]. Computers & Mathematics with Application, 2002,44(8):1077-083.

[17] 孫智勇,劉星.模糊軟集合理論在稅收組合預(yù)測(cè)中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2011,31(5): 936-943.

[18] Majumdar P, Samanta S K. Generalized fuzzy soft sets[J]. Computers & Mathematics with Application, 2010, 59 (4): 1425-1432.

[19] Xiao Zhi, Yang Xianglei,Niu Qing,et al. A new evaluation method based on D-S generalized fuzzy soft sets and its application in medical diagnosis problem[J]. Applied Mathematical Modelling,2012, 36(10): 4592-4604.

[20] Maji P K, Biswas R, Poy A R.Intuitionistic fuzzy solf sets[J]. Journal of Fuzzy Mathematics,2001, 9(3): 677-692.

[21] Bustince H, Barrenechea E, Pagola M. Image thresholding using restricted equivalence functions and maximizing the measures of similarity[J]. Fuzzy Sets and Systems, 2007, 158(5): 496-516.

[22] Benson T, Akella A, Maltz D A. Network traffic characteristics of data centers in the wild[C].Proceedings of the 10th ACM SIGCOMM conference on Internet measurement,Melbourne,Australia,November 1-3,201 1-3,2010.

[23] Tan Jian, Dube P, Meng Xiaoqiao, et al. Exploiting resource usage patterns for better utilization prediction[C].Proceedings of the 31st International Conference on Distributed Computing Systems Workshops (ICDCSW’11), Minneapolis,Minnesota,USA,June 20-24,2011.

[24] Bezdek J, Pal S. Fuzzy models for pattern recognition[M].New Jersey,USA: IEEE Press, 1992.

[25] Tseng F M, Tzeng G H. A fuzzy seasonal ARIMA model for forecasting[J]. Fuzzy Sets and Systems, 2002, 126(3): 367-376.

[26] Traces in the Internet traffic archive[DB/OL]. http://ita.ee.lbl.gov/html/traces.html.

[27] Mehta A, Menaria M,Dangi S,et al. Envergy conservation in cloud infrastructures[C]. Prceedings of 5th Annual IEEE International Systems Conference, Montreal,Canada,April, 4-11,2011.

[28] Prevost J J, Nagothu K M,Kelley B,et al. Prediction of cloud data center networks loads using stochastic and neural models[C].Proceeding of 6th International Conference on System of Systems Engineering, Albuquerque,USA,dune 27-30,2011.

Research on Generalized Fuzzy Soft Sets Theory based Combined Model for Demanded Cloud Computing Resource Prediction

XU Da-yu1,2, YANG Shan-lin2, LUO He2

(1.Zhejiang A&F University,Zhejiang Provincial Key Laboratory of Forestry Intelligent Monitoring and Information Technology Research,Hangzhou 311300,China;2.HeFei University of Technology, Key Laboratory of Process Optimization and Intelligent Decision-making,Ministry of Education, HeFei 230009, China)

In order to realize high scalability, flexibility and cost-effectiveness, cloud computing platforms need to be able to quickly plan and provision resources. To this end, it calls for mechanisms to predict demanded resource effectively. Therefore, resource prediction is a crucial issue for efficient resource utilization in dynamic cloud computing environment. In this paper, the basic concept of generalized fuzzy soft sets is introduced, and a novel angle cosine is proposed based similarity measurement of generalized fuzzy soft sets. Then the similarity measurement result and the prediction accuracy from Adaptive Neuro-Fuzzy Inference System and Seasonal ARIMA model are adopted to obtain the weights of combined prediction model. On this basis,the generalized fuzzy soft sets theory based on the combination of forecasting model GFSS-ANFIS/SARIMA is constrncted. Finally, this model is explorted to predict the demanded resource in cloud computing. The experimental results show that the proposed model can significantly improve the prediction accuracy with high prediction performance. Efficient decision support for resource scheduling and allocation in cloud computing can be provided by the proposed method.

cloud computing; generalized fuzzy soft sets; combined prediction; similarity measurement; adaptive neuro-fuzzy inference system

1003-207(2015)05-0056-09

10.16381/j.cnki.issn1003-207x.2015.05.008

2012-11-20;

2013-06-17

國(guó)家自然科學(xué)基金資助項(xiàng)目(71131002, 71071045);浙江農(nóng)林大學(xué)??蒲邪l(fā)展基金人才啟動(dòng)項(xiàng)目(2014FR082)

徐達(dá)宇(1985-),男(漢族),浙江杭州人,浙江農(nóng)林大學(xué)信息工程學(xué)院講師,研究方向:預(yù)測(cè)理論與方法、云計(jì)算.

TP391

A

猜你喜歡
計(jì)算資源相似性廣義
一類(lèi)上三角算子矩陣的相似性與酉相似性
Rn中的廣義逆Bonnesen型不等式
基于模糊規(guī)劃理論的云計(jì)算資源調(diào)度研究
淺析當(dāng)代中西方繪畫(huà)的相似性
改進(jìn)快速稀疏算法的云計(jì)算資源負(fù)載均衡
從廣義心腎不交論治慢性心力衰竭
基于Wi-Fi與Web的云計(jì)算資源調(diào)度算法研究
耦合分布式系統(tǒng)多任務(wù)動(dòng)態(tài)調(diào)度算法
有限群的廣義交換度
低滲透黏土中氯離子彌散作用離心模擬相似性
南平市| 宝山区| 建始县| 贞丰县| 桃源县| 敖汉旗| 泸州市| 克东县| 丁青县| 凉城县| 淮阳县| 内江市| 东阳市| 三门峡市| 错那县| 大竹县| 电白县| 元谋县| 德令哈市| 墨竹工卡县| 抚顺市| 孟连| 沙田区| 额敏县| 当雄县| 曲阜市| 麦盖提县| 临清市| 河北省| 监利县| 格尔木市| 巨野县| 合阳县| 斗六市| 杭州市| 河源市| 隆安县| 北碚区| 义乌市| 霍州市| 铁岭县|