周舟,袁余俊明,李方敏?
(1.湖南大學信息科學與工程學院,湖南長沙 410082;2.長沙學院計算機工程與應(yīng)用數(shù)學學院,湖南長沙 410022)
隨著云計算數(shù)據(jù)中心的大量新建,數(shù)據(jù)中心的能耗問題越來越嚴重.近期研究顯示[1-2]:全球數(shù)據(jù)中心的總數(shù)已超過300 萬個,耗電量占全球耗電量的1.1%~1.5%.我國數(shù)據(jù)中心也發(fā)展迅速,總數(shù)已達到40 萬個,年耗電量已超過500 億千瓦,占全國總耗電量的1.5%.如果以數(shù)據(jù)中心的PUE(平均電能使用效率)指數(shù)來評測,全球先進數(shù)據(jù)中心的PUE 指數(shù)為1.2,而我國的PUE 指數(shù)大于2.2.與此同時,大量的報告也顯示[3-5]:許多高性能數(shù)據(jù)中心服務(wù)器的利用率卻遠遠低于50%,其原因在于數(shù)據(jù)中心資源未得到“有效”利用.因此,節(jié)能優(yōu)化算法的提出有助于提高系統(tǒng)的資源利用率和單位能耗的效用.
能耗模型作為“節(jié)能優(yōu)化算法”的基礎(chǔ)[6-7],其準確性直接關(guān)系到優(yōu)化算法的優(yōu)劣.一個精確、通用、有效的能耗模型不僅為優(yōu)化算法提供基礎(chǔ),而且也有利于該模型的擴充.對于云資源提供者來說,構(gòu)建精確的能耗模型有助于資源提供者預(yù)測和優(yōu)化數(shù)據(jù)中心的能耗,提高單位能耗的效用.因此,對其研究具有十分重要的現(xiàn)實意義.
本文的主要工作如下:
1)基于“任務(wù)的特征”構(gòu)建能耗模型.不同于其它的能耗模型僅考慮CPU 密集型任務(wù),在本文中,基于“任務(wù)特征”的不同,任務(wù)被劃分為三類,分別為計算密集型任務(wù)、Web 事務(wù)型任務(wù)和I/O 密集型任務(wù).
2)不同于已存在的能耗模型僅考慮CPU 和內(nèi)存部件,而忽略了磁盤和網(wǎng)絡(luò)接口卡部件,本文所提出的能耗模型考慮了與能耗有關(guān)的所有部件如CPU、內(nèi)存、磁盤和網(wǎng)絡(luò)接口卡.
3)使用“主成分分析法”分析各部件參數(shù)對能耗的貢獻并選擇最具代表性的參數(shù).
4)運用大量的實驗證明了本文所提出能耗模型的精確性和有效性.
目前,對能耗模型的研究可以分為兩類,一類是基于系統(tǒng)利用率的能耗模型[8-12],另一類是基于性能計數(shù)器的能耗模型[13-17].
基于系統(tǒng)利用率的能耗模型的主要思想是利用服務(wù)器各主要部件的利用率,構(gòu)建能耗模型.文獻[8]基于服務(wù)器中資源使用情況,結(jié)合回歸方法建立了線性模型.文獻[9]結(jié)合三個參數(shù)(%Processor Time,%Memory used,%Page Faults/s)提出了一種CMP(CPU利用率,內(nèi)存利用率和Pagefaults)模型,相比較以往的能耗模型,該方法具有一定的優(yōu)勢,但該方法因選擇的參數(shù)有限且沒有考慮到負載的特征,其能耗模型的精度仍有待提高.在文獻[12]中,羅亮等人針對數(shù)據(jù)中心的單臺服務(wù)器提出了一種高精度的能耗模型,該模型分析了不同參數(shù)對服務(wù)器能耗的影響,然后結(jié)合多元線性回歸和非線性回歸的方法建立能耗模型.同樣,文獻[11]在線性模型(Linear Model)的基礎(chǔ)上提出了一種改進的能耗模型叫Cubic Model,該模型認為服務(wù)器的能耗與處理器(CPU)不應(yīng)是線性關(guān)系,而是立方關(guān)系.文獻[12]基于能耗和系統(tǒng)資源利用率的關(guān)系,提出了一種服務(wù)器能耗經(jīng)驗?zāi)P停↙inear Model).此類能耗模型的優(yōu)點是易于實現(xiàn)且能耗模型的精度較高.
基于性能計數(shù)器的能耗模型的基本思想可概括為:根據(jù)PMC 與設(shè)備能耗之間的關(guān)系,針對不同設(shè)備(包括處理器、內(nèi)存、磁盤、I/O 外部設(shè)備)篩選出最具代表性的“PMC 集合”;然后通過統(tǒng)計分析的方法,建立PMC 事件與設(shè)備功耗之間的函數(shù)關(guān)系,這種關(guān)系既可以是線性關(guān)系、也可以是非線性關(guān)系.在文獻[13]中,程華等提出了一種基于細粒度的實時能耗模型,該模型由模型設(shè)定、性能計數(shù)器參數(shù)選取、數(shù)據(jù)采集、模型求解和性能評估這五個部分組成.在此文中,作者選擇PMC 集合(包含二十多個參數(shù))建立系統(tǒng)能耗模型.文獻[14]通過運行負載,在考慮處理器和內(nèi)存等因素下,基于PMC 方法建立服務(wù)器的能耗模型.在文獻[15]中,作者在考慮CPU 和內(nèi)存兩大因素的條件下,提出了一種Ramon Model.在文獻[16]中,Singh 等使用PMC 方法構(gòu)建實時的能耗模型.在文獻[17]中,肖鵬等首先形式化資源利用率與能耗之間的關(guān)系,然后基于性能計數(shù)器提出了一種新型的能耗模型,最后基于該能耗模型提出了一種虛擬機調(diào)度算法.此類方法因采集到的事件太多,成本相對較高,模型也較為復(fù)雜,故不利于該模型擴充.
數(shù)據(jù)中心服務(wù)器的能耗建模如圖1 所示.它包含數(shù)據(jù)采樣、參數(shù)的篩選、建立模型和評估模型四個步驟.
1)數(shù)據(jù)采樣.數(shù)據(jù)采樣是數(shù)據(jù)中心能耗建模的第一步,這一步的主要工作是采集系統(tǒng)的數(shù)據(jù),采樣的基本方法有基于性能計數(shù)器或者基于系統(tǒng)資源利用率.
圖1 能耗建模的基本步驟Fig.1 Basic steps for energy modeling
2)參數(shù)的篩選.在采樣數(shù)據(jù)之后,就需要對采集到的參數(shù)進行篩選.因為采樣的參數(shù)有些是與系統(tǒng)能耗相關(guān)的,有些是不相關(guān)的.如何篩選這些參數(shù)呢?此時可以借助于“主成分分析法”或者“相關(guān)系數(shù)矩陣法”去篩選.
3)建立模型.這一步的主要工作是利用前面篩選出的參數(shù),借助于數(shù)學中的線性回歸或者非線性回歸方法(多項式回歸,冪回歸,指數(shù)回歸,支持向量機回歸)建立能耗模型.
4)評估模型.這一步的主要工作是對前面建立起來的能耗模型進行評估,比較所得到能耗預(yù)測值與真實值的差別,目的是確定該模型的準確性和有效性.
作為云計算數(shù)據(jù)中心的任何一臺服務(wù)器,哪些參數(shù)應(yīng)該被選擇去構(gòu)建能耗模型呢?如果參數(shù)選擇過少,將導致構(gòu)建出來的能耗模型精度不夠,如果參數(shù)選擇過多,將導致開銷增加且不利于該模型的擴展.因此,選擇合適的參數(shù)構(gòu)建能耗模型極其重要.對于數(shù)據(jù)中心的任何一臺服務(wù)器,其總功率主要由其處理器(CPU)、內(nèi)存、磁盤和網(wǎng)絡(luò)接口卡的功率決定.設(shè)Psystem是服務(wù)器的功率,參數(shù)PCPU、Pmemory、Pdisk和Pnetwork分別代表該服務(wù)器的處理器(CPU)、內(nèi)存、磁盤和網(wǎng)絡(luò)接口卡功率,則Psystem可以表示如下:
式中:參數(shù)σ 是除CPU、內(nèi)存、磁盤和網(wǎng)絡(luò)接口卡之外的其它部件功率,可看作常數(shù).對于處理器的功率PCPU,可用式(2)表達[18]:
式中:參數(shù)Pmax代表該部件最大的功率,Pidle代表該部件空閑時的功率,U 代表該部件的CPU 利用率.由于PCPU的值與參數(shù)U 相關(guān),所以在監(jiān)控CPU 的能耗時,參數(shù)“Processor Time”被選作處理器的代表性參數(shù).參數(shù)“Processor Time”指的是系統(tǒng)中所有處理器都處于繁忙狀態(tài)的時間百分比,即CPU 的利用率.對于Pmemory的值,可以用式(3)表達[18]:
式中:PPRE、PACT、PRD、PWR和PREF分別代表預(yù)充電(PPRE)、活動狀態(tài)(PACT)、讀狀態(tài)(PRD)、寫狀態(tài)(PWR)和刷新狀態(tài)(PREF)的功率.由于Pmemory的值與讀和寫狀態(tài)有關(guān),因此,在監(jiān)控Pmemory的能耗時,“Memory Used”和“Page Fault/Sec”被選作內(nèi)存的代表性參數(shù).“Memory Used”指的是內(nèi)存的利用率,“Page Fault/Sec”指的是處理器處理錯誤頁的綜合速率,單位是錯誤頁數(shù)/s.當處理器請求一個不在其工作集(在物理內(nèi)存中的空間)內(nèi)的代碼或數(shù)據(jù)時出現(xiàn)的頁錯誤.這個錯誤包括硬錯誤(那些需要磁盤訪問的)和軟錯誤(在物理內(nèi)存的其它地方找到的錯誤頁).對于Pdisk的值,可以用式(4)來表示[18]:
式中:參數(shù)PREAD、PWRITE和PIDLE分別代表磁盤讀、寫和空閑時的功率.在監(jiān)控磁盤的能耗時,“Disk time”和“Disk Bytes/Sec”被選作磁盤的代表性參數(shù).“Disk time”指的是磁盤驅(qū)動器忙于讀或?qū)懭胝埱蟮确?wù)所用的時間百分比,“Disk Bytes/Sec”指的是在進行寫入或讀取操作時從磁盤上傳送或傳出的字節(jié)速率.
對于Pnetwork的值,可以用式(5)計算[18]:
式中:參數(shù)C0和C1可認為是一個常數(shù),參數(shù)S 指的是文件大小,單位是MB;參數(shù)B 指的是帶寬,單位是MB/s.在監(jiān)視網(wǎng)絡(luò)接口卡的能耗時,“Bytes Total/Sec”和“Current Bandwidth”被選作網(wǎng)絡(luò)接口卡的代表性參數(shù).“Bytes Total/Sec”指的是在每個網(wǎng)絡(luò)適配器上發(fā)送和接收字節(jié)的速率,包括幀字符在內(nèi).“Current Bandwidth”指的是目前帶寬.
計算密集型任務(wù)也叫CPU 密集型任務(wù).全球標準性能評估公司SPEC 提供的CPU2006[19-20]數(shù)據(jù)集就是標準計算密集型任務(wù),該數(shù)據(jù)集包含“401.bzip2”、“403.gcc”、“429.mcf”、“453.povray”和“450.soplex”等子項.以DELL PowerEdge R720 服務(wù)器為例(服務(wù)器配置見表1),當它運行“401.bzip2”任務(wù)時,其在不同負載下的能耗和相關(guān)參數(shù)值如表2 所示.
表1 DELL R720 服務(wù)器配置Tab.1 Dell R720 server configuration
從表2 得出:當“Processor Time”=4.23%,Memory Used=4.47%,Page Fault/Sec=512.78,Disk Time=0.66,Disk Bytes/Sec=4 102.28,Bytes Total/Sec=562.00 和Current Bandwidth=9.22 ×1018時,此時的能耗為122.49 W.對于這7 個參數(shù)(Processor Time,Memory Used,Page Fault/Sec,Disk Time,Disk Bytes/Sec,Bytes Total/Sec 和Current Bandwidth),它們是如何影響能耗的呢?哪些與能耗相關(guān)?哪些與能耗不相關(guān)呢?為解決這個問題,利用SPSS 中的“主成分分析法”[21]分析每個參數(shù)的貢獻(即因子貢獻),表3 列出了每個因子的貢獻.
表2 不同負載下的參數(shù)值及能耗Tab.2 Parameter values and energy consumption under different loads
表3 計算密集型任務(wù)下因子貢獻Tab.3 Factor contribution under computation-intensive tasks
表3 表明:參數(shù)“Processor Time”對能耗的貢獻是62%,“Disk Bytes/Sec”是19%,“Disk Time”是14%,“Page Fault/Sec”是4%,“Memory Used”是1%,“Bytes Total/Sec”和“Current Bandwidth”都是0.這些數(shù)據(jù)說明,“Processor Time”對能耗的貢獻最大,而“Bytes Total/Sec”和“Current Bandwidth”對能耗沒有貢獻.因此,在下一節(jié)能耗建模中,值不為零的5 個參數(shù)“Processor Time”,“Disk Bytes/Sec”,“Disk Time”,“Page Fault/Sec”和“Memory Used”被選中用于實驗建模.
與此相似,在現(xiàn)實生活中,我們干掉高考這個BOSS以后,武功進入了一個瓶頸期,每個人的斗志也因此消磨許多。所以,我們不妨試著將這四年的大學時光,當作是一段特殊的“閉關(guān)修煉”,修身養(yǎng)性,格物致知,潛心修煉內(nèi)功和外功。在不斷提升自我的同時,抵御綁定了潛在風險的外來誘惑。
HP LoadRunner[22-23]是一種典型的Web 事務(wù)型任務(wù),以DELL PowerEdge R720 服務(wù)器為例(服務(wù)器配置見表1),當它運行“HP LoadRunner”任務(wù),在用戶數(shù)是3 000 時,采用同樣的辦法可以得到每個參數(shù)對能耗的貢獻即因子貢獻,表4 展示了這7 個參數(shù)(Processor Time,Memory Used,Page Fault/Sec,Disk Time,Disk Bytes/Sec,Bytes Total/Sec 和 Current Bandwidth)對能耗的貢獻.
表4 Web 事務(wù)型任務(wù)下因子貢獻Tab.4 Factor contribution under Web transactional tasks
從表4 可以看出,參數(shù)“Processor Time”對能耗的貢獻是63%,“Disk Bytes/Sec”是21%,“Disk Time”是11%,“Page Fault/Sec”是3%,“Memory Used”是1%,“Bytes Total/Sec”是1%,“Current Bandwidth”是0.這些數(shù)據(jù)說明,“Processor Time”對能耗的貢獻最大,而“Current Bandwidth”為0 即表示對能耗沒有貢獻.因此,在下一節(jié)能耗建模中,值不為零的6 個參數(shù)“Processor Time”,“Disk Bytes/Sec”,“Disk Time”,“Page Fault/Sec”,“Memory Used”和“Bytes Total/Sec”被選中用于實驗建模.
Iozone[24-25]是一種典型的I/O 密集型任務(wù),以DELL PowerEdge R720 服務(wù)器為例(服務(wù)器配置見表1),當它運行Iozone 數(shù)據(jù)集時,采用同樣的辦法可得到每個參數(shù)對能耗的貢獻即因子貢獻,表5 展示了這7 個參數(shù)(Processor Time,Memory Used,Page Fault/Sec,Disk Time,Disk Bytes/Sec,Bytes Total/Sec和Current Bandwidth)對能耗的貢獻.從表5 可以看出,參數(shù)“Processor Time”對能耗的貢獻是53%,“Disk Bytes/Sec”是27%,“Disk Time”是15%,“Page Fault/Sec”是3%,“Memory Used”是1%,“Bytes Total/Sec”和“Current Bandwidth”都是0.這些數(shù)據(jù)說明,“Processor Time”對能耗的貢獻最大,而“Bytes Total/Sec”和“Current Bandwidth”都為0 即表示對能耗沒有貢獻.因此,在下一節(jié)能耗建模中,值不為零的五個參數(shù)“Processor Time”,“Disk Bytes/Sec”,“Disk Time”,“Page Fault/Sec”和“Memory Used”都被選中用于實驗建模.
表5 I/O 密集型任務(wù)下因子貢獻Tab.5 Factor contribution under I/O intensive tasks
對于不同的任務(wù)類型,第二節(jié)已確定有那些參數(shù)被選中用于能耗建模.在這一節(jié)中將使用EViews 8.0[26]軟件,分別用多元線性回歸法、冪回歸法、指數(shù)回歸法和多項式回歸法建立能耗模型.對于多元線性回歸法,其包含m 個因變量的回歸模型如下:
式中:變量y 是觀測到的真實能耗;β0,β1,β2,…,βm是回歸系數(shù);ε 是隨機誤差.對于冪回歸法,其包含m個因變量的回歸模型如下:
式中:變量y 是觀測到的真實值;b0,b1,b2,…,bm是回歸系數(shù);ε 是隨機誤差.對于指數(shù)回歸法,其包含m個變量的回歸模型如下:
式中:變量y 是觀測到的真實值;β0,β1,β2,…,βm是回歸系數(shù);ε 是隨機誤差.對于多項式回歸,其包含m個變量的回歸模型如下:
式中:變量y 是觀測到的真實值;β0,β1,β2,…,βm是回歸系數(shù);ε 是隨機誤差.
為方便3.1~3.3 節(jié)中所述內(nèi)容的說明,表6 列出了常用的參數(shù)及其代表的含義.
表6 參數(shù)及其含義Tab.6 Parameters and their meanings
對于計算密集型任務(wù)CPU2006[19-20]數(shù)據(jù)集,結(jié)合2.2 節(jié)的代表性參數(shù)和EViews 8.0[26]軟件,分別用多元線性回歸法、冪回歸法、指數(shù)回歸法和多項式回歸法建立能耗模型,見公式(10)~(13):
式中:參數(shù)y,x1,x2,x3,x4,x5分別代表能耗“Processor Time”,“Disk Bytes/Sec”,“Disk Time”,“Page Fault/Sec”和“Memory Used”.
對于Web 事務(wù)型任務(wù)HP LoadRunner[22-23],在用戶數(shù)3 000 情況下,結(jié)合2.3 節(jié)的代表性參數(shù)和EViews 8.0[26]軟件,分別用多元線性回歸法、冪回歸法、指數(shù)回歸法和多項式回歸法建立能耗模型,見公式(14)~(17):
式中:參數(shù)y,x1,x2,x3,x4,x5,x6分別代表能耗“Processor Time”,“Disk Bytes/Sec”,“Disk Time”,“Page Fault/Sec”,“Memory Used”和“Bytes Total/Sec”.
對于I/O 密集型任務(wù)Iozone[24-25],結(jié)合2.4 節(jié)的代表性參數(shù)和EViews 8.0[26]軟件,分別用多元線性回歸法、冪回歸法、指數(shù)回歸法和多項式回歸法建立能耗模型,見公式(18)~(21):
式中:參數(shù)y,x1,x2,x3,x4,x5分別代表能耗“Processor Time”,“Disk Bytes/Sec”,“Disk Time”,“Page Fault/Sec”和“Memory Used”.
本文所用的服務(wù)器是DELL PowerEdge R720 服務(wù)器(見表1),CPU 頻率是2.0 GHz(2×6 核),內(nèi)存是DDR2 20 G,磁盤是2×1 TB,網(wǎng)絡(luò)接口卡是Intel quad-port Gigabit network adapter.實驗測量能耗的工具是北電儀表公司所生產(chǎn)的Power Bay-SSM.計算密集型任務(wù)使用的是“403.gcc”,“429.mcf”,“401.bzip2”,“453.povray”和“450.soplex”數(shù)據(jù)集[19-20].對于“Web 事務(wù)型任務(wù)”和“I/O 密集型任務(wù)”,則分別使用“Load-Runner”[22-23]和“Iozone”數(shù)據(jù)集[24-25],這兩個數(shù)據(jù)集每次產(chǎn)生任務(wù)都是“隨機生成”.
為評價本文所建模型的精度,采用式(22)計算每個模型的相對誤差:
式中:Powerpredict表示能耗的預(yù)測值;Powertrue表示能耗的真實值;Powererror表示能耗的相對誤差.
為評價能耗模型的好壞,選擇Linear Model[12],Cubic Model[11]和Ramon Model[15]能耗模型作對比.
利用3.1 節(jié)所建立的能耗模型,運行計算密集型任務(wù)CPU2006[19-20]數(shù)據(jù)集,得到預(yù)測值和真實值的相對誤差,如圖2 和圖3 所示.
圖2 計算密集型任務(wù)下各模型的能耗Fig.2 Energy consumption of each model under computation-intensive tasks
圖3 計算密集型任務(wù)下各模型相對誤差Fig.3 Relative error of each model under computation-intensive tasks
圖2 和圖3 分別展示了這7 種能耗模型(多元線性回歸、冪回歸、指數(shù)回歸、多項式回歸、Linear Model、Cubic Model 和Ramon Model)的能耗和相對誤差.這4 種模型(多元線性回歸、冪回歸、指數(shù)回歸和多項式回歸)優(yōu)于Ramon Model,原因在于兩方面:第一,這4 種模型在建模時考慮了處理器(CPU)、內(nèi)存、磁盤和網(wǎng)絡(luò)接口卡因素,而Ramon Model 僅考慮處理器(CPU)和內(nèi)存因素.第二,這4 種模型(多元線性回歸、冪回歸、指數(shù)回歸和多項式回歸)考慮了任務(wù)的特征并利用“主成分分析法”提高了能耗模型的精度.Ramon Model 優(yōu)于Linear Model 和Cubic Model,原因在于其考慮了處理器(CPU)和內(nèi)存兩個因素,而Linear Model 和Cubic Model 僅考慮CPU 因素.
利用3.2 節(jié)所建立的能耗模型,運行Web 事務(wù)型任務(wù)HP LoadRunner[22-23],在用戶數(shù)3 000 情況下,得到預(yù)測值和真實值的相對誤差,如圖4 和圖5 所示.
圖4 Web 事務(wù)型任務(wù)下各模型的能耗Fig.4 Energy consumption of each model under Web transactional
圖5 Web 事務(wù)型任務(wù)下各模型相對誤差Fig.5 Relative error of each model under Web transactional tasks
圖4 和圖5 分別展示了這7 種能耗模型(多元線性回歸、冪回歸、指數(shù)回歸、多項式回歸、Linear Model、Cubic Model 和Ramon Model)的能耗和相對誤差.這4 種模型(多元線性回歸、冪回歸、指數(shù)回歸和多項式回歸)相比較Ramon Model,其能耗精度提高1%以上,其原因可歸結(jié)為兩方面:第一,Web 事務(wù)型任務(wù)的特點決定了該類任務(wù)對內(nèi)存和網(wǎng)絡(luò)的訪問較為頻繁,Ramon Model 只考慮了CPU 和內(nèi)存因素,而這4 種能耗模型考慮了處理器、內(nèi)存、磁盤和網(wǎng)絡(luò)接口卡這4 個因素.第二,這4 種模型考慮了任務(wù)的特征并利用“主成分分析法”提高了能耗模型的精度.
利用3.3 節(jié)所建立的能耗模型,運行I/O 密集型任務(wù)Iozone[24-25]數(shù)據(jù)集,得到預(yù)測值和真實值的相對誤差,如圖6 和圖7 所示.
圖6 I/O 密集型任務(wù)下各模型的能耗Fig.6 Energy consumption of each model under I/O intensive tasks
圖6 和圖7 分別展示了這7 種能耗模型(多元線性回歸、冪回歸、指數(shù)回歸、多項式回歸、Linear Model、Cubic Model 和Ramon Model)的能耗和相對誤差.圖7 表明,這4 種能耗模型(多元線性回歸、冪回歸、指數(shù)回歸和多項式回歸)相比較Linear Model,Cubic Model 和Ramon Model,其能耗精度提高3%左右,其原因可歸納為以下兩個方面:第一,I/O 密集型任務(wù)的特點是對磁盤的訪問較為頻繁,因此在建模時應(yīng)該考慮處理器、內(nèi)存和磁盤多個因素.這4 種能耗模型考慮了處理器、內(nèi)存、磁盤和網(wǎng)絡(luò)接口卡這4個因素.第二,這4 種模型考慮了任務(wù)的特征并利用“主成分分析法”提高了能耗模型的精度.
圖7 I/O 密集型任務(wù)下各模型相對誤差Fig.7 Relative error of each model under I/O intensive tasks
根據(jù)4.1、4.2 和4.3 節(jié)中的實驗結(jié)果和分析,不管何種任務(wù)類型(計算密集型任務(wù)、Web 事務(wù)型任務(wù)和I/O 密集型任務(wù)),冪回歸模型精確度最高,多元線性回歸模型一般,指數(shù)回歸模型和多項式回歸模型較差.因此,在以后的能耗建模中,推薦使用冪回歸模型進行能耗建模.
針對數(shù)據(jù)中心服務(wù)器能耗模型精度低的問題,本文根據(jù)“任務(wù)的特征”結(jié)合“主成分分析法”構(gòu)建了新型的能耗模型.與其它的能耗模型對比,本文所構(gòu)建的能耗模型在精度方面提高了3%,其原因可歸結(jié)為:1)本文所構(gòu)建的能耗模型考慮了“任務(wù)的特征”;2)在能耗模型的構(gòu)建過程中,考慮了CPU、內(nèi)存、磁盤和網(wǎng)絡(luò)接口卡多個因素;3)利用“主成分分析法”篩選出了與能耗有關(guān)的部件.
本文所提出的模型有望用于云計算數(shù)據(jù)中心,為數(shù)據(jù)中心服務(wù)器能耗的“量化”提供理論和實踐依據(jù).同時,本文所提出的模型也可用于評估節(jié)能算法的優(yōu)劣,有助于資源提供者預(yù)測和優(yōu)化數(shù)據(jù)中心的能耗.