吳勁松 張少峰 徐向民 李舒濤 黃湧 廖霄
摘 要:為了準(zhǔn)確預(yù)測(cè)數(shù)據(jù)中心短期電力負(fù)荷,提出了基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的短期負(fù)荷預(yù)測(cè)模型,有效地彌補(bǔ)前饋型神經(jīng)網(wǎng)絡(luò)不能處理序列間關(guān)聯(lián)信息與傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)無法記憶久遠(yuǎn)關(guān)鍵信息的缺陷。通過分析得出電源利用效率(power usage effectiveness , PUE)值與負(fù)荷具有相關(guān)性,因此在預(yù)測(cè)模型中考慮了PUE的影響,并使用自適應(yīng)矩估計(jì)算法進(jìn)行深度學(xué)習(xí)。并通過對(duì)廣州某電力設(shè)計(jì)院數(shù)據(jù)中心機(jī)房的實(shí)際電力負(fù)荷進(jìn)行預(yù)測(cè),表明在模型中引入PUE值可以有效提高數(shù)據(jù)中心短期負(fù)荷預(yù)測(cè)的精度。
關(guān)鍵詞:負(fù)荷預(yù)測(cè);數(shù)據(jù)中心;深度學(xué)習(xí);電源利用效率;長(zhǎng)短期記憶
DOI:10.15938/j.jhust.2021.06.001
中圖分類號(hào): TP183
文獻(xiàn)標(biāo)志碼: A
文章編號(hào): 1007-2683(2021)06-0001-09
Short-term Power Load Forecasting Method of Data Center Considering PUE
WU Jin-song1,2, ZHANG Shao-feng2, XU Xiang-min1, LI Shu-tao1,2, HUANG Yong2, LIAO Xiao2
(1.South China University of Technology, Guangzhou 510640, China;
2.China Energy Engineering Group Guangdong Electric Power Design Institute Co., Ltd., Guangzhou 510663, China)
Abstract:In order to accurately predict the short-term power load of data centers, a short-term load forecasting model based on long- and short-term memory neural networks is proposed, which effectively compensates for the shortcomings of feed forward neural networks that cannot process the correlation information between sequences and traditional recurrent neural networks cannot remember long-term key information. Through analysis, it is concluded that the power usage effectiveness (PUE) value is correlated with the load. Therefore, the influence of PUE is considered in the prediction model, and the adaptive moment estimation algorithm is used for deep learning. Finally, by predicting the actual power load of the data center computer room of a certain electric power design institute in Guangzhou, introducing the PUE value into the model can effectively improve the accuracy of the short-term load forecast of the data center.
Keywords:load forecasting; data center; deep learning; power usage effectiveness; long and short-term memory
0 引 言
當(dāng)今社會(huì)的各行各業(yè)對(duì)計(jì)算、存儲(chǔ)和數(shù)據(jù)管理的需求日益增加,全球數(shù)據(jù)中心(data center,DC)的建設(shè)規(guī)模也隨之增長(zhǎng)。運(yùn)營(yíng)這些數(shù)據(jù)中心所需的服務(wù)器和支持基礎(chǔ)設(shè)施會(huì)消耗大量能源[1-3]。2017年,全球數(shù)據(jù)中心消耗了全球約7%的電力,預(yù)計(jì)到2030年這一比例將上升至13%[4]。美國(guó)自然資源保護(hù)委員會(huì)預(yù)計(jì)到 2020 年,美國(guó)數(shù)據(jù)中心的電力消耗將增加到每年約1400億kWh,每年將耗資約130億美元,并導(dǎo)致每年排放近1.5億公噸的碳污染[5]。研究表明,我國(guó)數(shù)據(jù)中心也發(fā)展迅速,其總數(shù)已達(dá)到40萬個(gè),年耗電量已超過 500億kWh,占全國(guó)總耗電量的1.5%[6]。因此,如何降低數(shù)據(jù)中心能耗是一個(gè)亟需解決的問題[7]。
隨著我國(guó)數(shù)據(jù)中心的大量建設(shè),數(shù)據(jù)中心數(shù)量將日益增長(zhǎng),從而造成快速攀升的電力資源需求[8-10]。在電能資源難以大量高效存儲(chǔ)以及負(fù)荷需求時(shí)刻發(fā)生變化的背景下,對(duì)數(shù)據(jù)中心進(jìn)行電力負(fù)荷預(yù)測(cè)是實(shí)現(xiàn)發(fā)電系統(tǒng)與負(fù)荷需求之間動(dòng)態(tài)平衡的一種有效方法。
短期負(fù)荷預(yù)測(cè)(short-term load forecasting,STLF)在改革下的能源市場(chǎng)規(guī)劃和運(yùn)營(yíng)中提出已久[11]。目前短期負(fù)荷預(yù)測(cè)的場(chǎng)景主要是住宅、工業(yè)和商業(yè)等[12]。但這些技術(shù)成熟的模型不適用于數(shù)據(jù)中心負(fù)荷預(yù)測(cè),因?yàn)閿?shù)據(jù)中心的負(fù)荷具有較高的可變性和差異性。準(zhǔn)確地預(yù)測(cè)數(shù)據(jù)中心負(fù)荷不僅可以降低其用電成本,同時(shí)還可以進(jìn)一步優(yōu)化能耗指標(biāo)。文[13]分析了數(shù)據(jù)中心能耗和天氣參數(shù)之間的相關(guān)性,開發(fā)了基于人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)的模型來預(yù)測(cè)數(shù)據(jù)中心負(fù)荷,所提出的預(yù)測(cè)模型準(zhǔn)確率達(dá)到了87.2%。文[14]首先收集了50,000多個(gè)數(shù)據(jù)樣本,其中包含144個(gè)與能耗相關(guān)的變量。然后設(shè)計(jì)了基于門控循環(huán)單元(gated recurrent unit, GRU)的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練數(shù)據(jù)預(yù)測(cè)數(shù)據(jù)中心的電源使用效率。文[15]介紹了基于深度學(xué)習(xí)的方法,旨在對(duì)各種數(shù)據(jù)中心能源/功耗相關(guān)的關(guān)鍵性能指標(biāo)進(jìn)行建模。使用在萊布尼茨超級(jí)計(jì)算中心獲得的多年運(yùn)行數(shù)據(jù)進(jìn)行驗(yàn)證。文[16]提出了一種基于均值平滑和長(zhǎng)短期記憶網(wǎng)絡(luò)的負(fù)荷預(yù)測(cè)框架,實(shí)驗(yàn)結(jié)果表明使用該模型來預(yù)測(cè)數(shù)據(jù)中心未來30 s的負(fù)荷優(yōu)于其他模型。文[17-19]簡(jiǎn)單地使用計(jì)算流體動(dòng)力學(xué)和深度學(xué)習(xí)構(gòu)建了一個(gè)功耗模擬器來預(yù)測(cè)可以具有任何設(shè)備配置的數(shù)據(jù)中心的總負(fù)荷,該方法構(gòu)建的預(yù)測(cè)模型誤差最多為8%。
上述文獻(xiàn)考慮了天氣、制冷量、溫濕度、數(shù)據(jù)中心內(nèi)外部設(shè)備等相關(guān)特征,但是卻忽視了數(shù)據(jù)中心關(guān)鍵性能指標(biāo)。為此,本文基于長(zhǎng)短期記憶(long short-term memory, LSTM)網(wǎng)絡(luò)[20]提出了一種新的數(shù)據(jù)中心機(jī)房的負(fù)荷預(yù)測(cè)方法。具體而言,通過分析得出電源利用效率(power usage effectiveness , PUE)與電力負(fù)荷具有極強(qiáng)相關(guān)性,提出了基于PUE值的短期負(fù)荷預(yù)測(cè)模型,并對(duì)是否計(jì)及PUE 值的負(fù)荷預(yù)測(cè)模型進(jìn)行了對(duì)比分析。最后,在廣州某電力設(shè)計(jì)院數(shù)據(jù)中心機(jī)房,用實(shí)際的電力負(fù)荷數(shù)據(jù)對(duì)本方法進(jìn)行了驗(yàn)證。
1 電源利用效率分析
PUE是一種常用的行業(yè)度量標(biāo)準(zhǔn),用于對(duì)數(shù)據(jù)中心電源使用的有效性進(jìn)行評(píng)估[21]。數(shù)據(jù)中心的能耗大致可以分為IT設(shè)備、制冷系統(tǒng)和電能傳輸設(shè)備三個(gè)部分,圖1更詳細(xì)地描述了DC的能耗分布和PUE值的計(jì)算方法。如圖1 所示,在數(shù)據(jù)中心基礎(chǔ)支撐中,冷卻裝置承擔(dān)了很大一部分功耗,高達(dá)40%的數(shù)據(jù)中心負(fù)荷被冷卻消耗;另外45%的數(shù)據(jù)中心負(fù)荷則被IT設(shè)備消耗。因此IT設(shè)備負(fù)荷和冷卻系統(tǒng)負(fù)荷對(duì) PUE 有顯著影響。
PUE值是數(shù)據(jù)中心總負(fù)荷與提供給計(jì)算設(shè)備負(fù)荷之比,如式(1)所示。假設(shè)PUE=2,將意味著 IT設(shè)備每消耗1 W功率來執(zhí)行所需的計(jì)算,數(shù)據(jù)中心的支持性電氣和冷卻基礎(chǔ)設(shè)施就會(huì)產(chǎn)生1 W的額外成本,因此該指標(biāo)的理想值為1。
PUE=Total Power to DCPower of IT Equipment(1)
通過對(duì)數(shù)據(jù)中心機(jī)房的負(fù)荷數(shù)據(jù)進(jìn)行相關(guān)性分析,發(fā)現(xiàn)PUE值與電力負(fù)荷存在一定的相關(guān)性。數(shù)據(jù)中心的IT設(shè)備與制冷系統(tǒng)的負(fù)荷波動(dòng)會(huì)影響PUE值的變化,在影響的過程中達(dá)到平衡。本文直接分析達(dá)到穩(wěn)態(tài)后的負(fù)荷與相同時(shí)間節(jié)點(diǎn)PUE值的相關(guān)性。圖2為數(shù)據(jù)中心機(jī)房總電度、機(jī)房IT電度和機(jī)房PUE的相關(guān)性熱圖分析。
表1給出了以數(shù)據(jù)中心機(jī)房2019年6月~12月的負(fù)荷和PUE值為樣本進(jìn)行皮爾遜和斯皮爾曼相關(guān)性分析。其中,負(fù)荷與PUE值的皮爾遜相關(guān)分析、斯皮爾曼相關(guān)分析的相關(guān)系數(shù)分別為0.896和0.793,說明負(fù)荷與PUE有著極強(qiáng)的相關(guān)程度;顯著性均為0.000,說明負(fù)荷與PUE值存在相關(guān)性。因此,在數(shù)據(jù)中心短期電力負(fù)荷預(yù)測(cè)中,應(yīng)考慮在輸入變量中加入PUE值這一影響因素。
2 基于LSTM的數(shù)據(jù)中心負(fù)荷預(yù)測(cè)模型
2.1 神經(jīng)網(wǎng)絡(luò)輸入輸出變量選擇
因?yàn)樨?fù)荷數(shù)據(jù)是時(shí)序的,所以輸入量應(yīng)包括預(yù)測(cè)日期之前連續(xù)幾個(gè)小時(shí)前的歷史負(fù)荷數(shù)據(jù),本文提出的網(wǎng)絡(luò)模型輸入輸出變量選擇如表2所示。該網(wǎng)絡(luò)模型通過在訓(xùn)練集上不斷迭代,優(yōu)化以預(yù)測(cè)誤差為目標(biāo)函數(shù)的最小值為目標(biāo),便可以實(shí)現(xiàn)LSTM網(wǎng)絡(luò)中權(quán)重的更新。由于LSTM為時(shí)間序列上的神經(jīng)網(wǎng)絡(luò),具有代表長(zhǎng)期記憶的信息流,通過對(duì)權(quán)重的調(diào)整,就可以使得關(guān)鍵信息得到保留。因此,也說明在處理時(shí)間序列數(shù)據(jù)上LSTM比循環(huán)神經(jīng)網(wǎng)絡(luò)有著更大的優(yōu)勢(shì)。
2.2 數(shù)據(jù)預(yù)處理
訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí),模型對(duì)訓(xùn)練集的大小和質(zhì)量非常敏感,會(huì)直接影響到預(yù)測(cè)的效果。由于在負(fù)荷數(shù)據(jù)采集過程中存在人為因素、設(shè)備故障和采樣精度等情況,可能會(huì)得到離群值或空數(shù)據(jù)。因此對(duì)數(shù)據(jù)進(jìn)行離群值辨別和離群值修正兩步處理,可以在一定程度上提高預(yù)測(cè)精度。
數(shù)據(jù)中心機(jī)房的用電行為主要發(fā)生在工作日,因此可將負(fù)荷樣本數(shù)據(jù)大致分為工作日和休息日兩類。這兩類日期類型同一時(shí)刻的負(fù)荷根據(jù)橫向相似法對(duì)離群值或缺失值修正[22]。因而先采用3σ原理實(shí)現(xiàn)離群值辨別,再用橫向法對(duì)異常值其進(jìn)行修正,最后再對(duì)數(shù)據(jù)進(jìn)行歸一化處理。
1) 離群值辨別
n,i=1N∑Nn=1xn,i(2)
σ2i=1N∑Nn=1(xn,i-n,i)2,i=1,2,3…(3)
|xn,i-n,i|>3σiε(4)
式中:xn,i為第n天第i時(shí)刻的負(fù)荷值;n,i、σ2i分別是該電力負(fù)荷值均值和方差;ε為設(shè)置的閾值,一般取值為1~1.5。
2) 離群值修正
x*n,1=α2∑xn±1,i+β2∑x1,2n,1+γx-n,i
α+β+γ=1(5)
式中:x*n,1為第n天的i時(shí)刻的負(fù)荷修正值;xn±1,i為同類日第n+1和n-1天的i時(shí)刻的負(fù)荷值;x1,2n,1為相似日第n+1和n-1天的i時(shí)刻的負(fù)荷值。
3) 數(shù)據(jù)歸一化
就本文數(shù)據(jù)而言,樣本的原始特征分別是電力負(fù)荷值和PUE值,這兩個(gè)特征取值的分布范圍差異很大。其中電力負(fù)荷的取值在[30,75]之間,而PUE值的取值在[1,3]之間。當(dāng)計(jì)算負(fù)荷值和PUE值之間的歐氏距離時(shí),取值范圍大的電力負(fù)荷特征會(huì)起到主導(dǎo)作用。所以對(duì)于基于相似度比較的機(jī)器學(xué)習(xí)方法來說,必須先對(duì)樣本進(jìn)行歸一化處理,將各個(gè)維度的特征歸一化到同一個(gè)取值區(qū)間。雖然神經(jīng)網(wǎng)絡(luò)可以通過參數(shù)的調(diào)整來適應(yīng)不同特征的取值范圍,但訓(xùn)練時(shí)初始損失函數(shù)值較大,從而會(huì)導(dǎo)致訓(xùn)練效率比較低。
本文使用縮放法歸一化,通過該方法將數(shù)據(jù)每個(gè)特征的值縮放到區(qū)間[0,1]或[-1,1]之間。假設(shè)有N個(gè)樣本{x(n)},對(duì)于每一維特征x。
i=xi-xminxmax-xmin(6)
式中:xi為特征x第i個(gè)值;xmin、xmax分別為特征x的最小值、最大值。
2.3 LSTM網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
LSTM網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)的改進(jìn)版本,LSTM模型的創(chuàng)新點(diǎn)在于將輸入門,輸出門和遺忘門添加到RNN中,具有“記憶”的網(wǎng)絡(luò)結(jié)構(gòu)可以有效地解決梯度爆炸或消失問題,因此LSTM網(wǎng)絡(luò)解決長(zhǎng)期依賴問題具有一定的優(yōu)勢(shì)[23]。
LSTM的存儲(chǔ)單元本質(zhì)上是狀態(tài)信息累加器,主要工作對(duì)當(dāng)前時(shí)刻和之前時(shí)刻的輸入信息進(jìn)行篩選。如LSTM的內(nèi)部結(jié)構(gòu)如圖3所示,在隱藏層的結(jié)構(gòu)中構(gòu)造了“遺忘門ft”、“輸入門it”和“輸出門ot”,有關(guān)于LSTM門結(jié)構(gòu)的計(jì)算公式如下:
ft=σ(Wf[ht-1,xt]+bf)(7)
it=σ(Wf[ht-1,xt]+bi)(8)
t=tanh(Wc[ht-1,xt]+bc)(9)
ct=ftct-1+itt(10)
oi=σ(Wo[ht-1,xt]+bo)(11)
ht=ottanh(ct)(12)
式中:Wi、Wf、Wc、Wo均表示適當(dāng)?shù)臋?quán)值矩陣系數(shù);向量bi、bf、bc、bo表示相應(yīng)的偏置向量。
本文提出了計(jì)及PUE值的LSTM負(fù)荷預(yù)測(cè)方法,訓(xùn)練過程的輸入包括預(yù)測(cè)日t-1、t-2、t-3、t-4時(shí)刻的負(fù)荷和PUE值。該模型的框架如圖4所示。為了可以靈活地調(diào)整輸入輸出序列的長(zhǎng)度,方便預(yù)測(cè)不同的時(shí)間尺度負(fù)載,我們建立了基于LSTM的架構(gòu),稱為序列到序列(S2S)。顯然,該體系結(jié)構(gòu)由兩部分組成:編碼器和解碼器。編碼器的目的是預(yù)測(cè)我們已經(jīng)知道的負(fù)載,y[M-1]和f[M]分別表示了前一小時(shí)的歷史負(fù)荷和這一小時(shí)的特征,f[M]可以表示為該小時(shí)的PUE值。
下一步的關(guān)鍵是對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行設(shè)計(jì),本文設(shè)計(jì)的LSTM模型含3個(gè)隱含層,每層神經(jīng)元個(gè)數(shù)分別為200,100,50;以及1個(gè)輸出層。因?yàn)轭A(yù)測(cè)未來24h的每小時(shí)負(fù)荷數(shù)據(jù),因此選取LSTM的時(shí)間步長(zhǎng)為24,即連續(xù)24h負(fù)荷的序列輸出作為一個(gè)樣本。具體的輸入數(shù)據(jù)格式以及網(wǎng)絡(luò)模型如圖5所示。選取均方差作為損失函數(shù);采用小批量梯度下降技術(shù),保證了訓(xùn)練速度與梯度下降方向的準(zhǔn)確性,選取batchsize=75,即75個(gè)樣本作為一個(gè)整體去計(jì)算損失函數(shù),并根據(jù)損失函數(shù)利用Adam算法對(duì)LSTM的權(quán)重系數(shù)進(jìn)行更新學(xué)習(xí)。
模型網(wǎng)絡(luò)訓(xùn)練流程如圖6所示, 具體的訓(xùn)練過程大致可以分為5個(gè)步驟:
步驟1:先對(duì)輸入數(shù)據(jù)進(jìn)行歸一化,假設(shè)訓(xùn)練樣本的總個(gè)數(shù)為n,對(duì)于每個(gè)時(shí)刻的預(yù)測(cè)輸入量為8維,且Timesteps為24,即連續(xù)預(yù)測(cè)未來24h負(fù)荷,所以輸入數(shù)據(jù)的shape為n×24×8的3D張量[Samples,Timesteps,F(xiàn)eatures]。
步驟2:將訓(xùn)練集的輸入數(shù)據(jù)x_train輸入到LSTM模型中,得出預(yù)測(cè)值y_train。
步驟3:根據(jù)預(yù)測(cè)值和真實(shí)值計(jì)算誤差。
步驟4:根據(jù)誤差再利用反向傳播算法,其中,優(yōu)化算法為Adam,對(duì)LSTM 進(jìn)行權(quán)重更新,實(shí)現(xiàn)LSTM 的監(jiān)督學(xué)習(xí)。
步驟5:將測(cè)試集輸入數(shù)據(jù)x_test輸入到訓(xùn)練好的LSTM神經(jīng)網(wǎng)絡(luò),得出預(yù)測(cè)值y_test。
2.4 模型訓(xùn)練方法
1) 均方誤差
均方誤差(mean squared error,MSE),將不斷優(yōu)化以MSE作為本網(wǎng)絡(luò)的目標(biāo)損失函數(shù),不斷減小預(yù)測(cè)值與真實(shí)值之間的差異程度。
MSE=1n∑ni=1(i-yi)2(13)
式中:i為參數(shù)的預(yù)測(cè)值;yi為參數(shù)的實(shí)際值。
2) Adam算法
選用Adam算法替代傳統(tǒng)隨機(jī)梯度下降過程,先初始化Adam算法各參數(shù)初始值,計(jì)算出目標(biāo)函數(shù)的梯度。訓(xùn)練過程采用學(xué)習(xí)速度(learning rate,Ir)呈指數(shù)規(guī)律下降的方式,實(shí)現(xiàn)訓(xùn)練后期最優(yōu)解的確定。經(jīng)過多epoch訓(xùn)練后,選取最佳優(yōu)化結(jié)果。
2.5 預(yù)測(cè)評(píng)價(jià)指標(biāo)
本文采用百分誤差(percentage error,PE)、和平均絕對(duì)值百分誤差(mean absolute percentage error,MAPE) 作為預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo),MAPE常被作為衡量預(yù)測(cè)準(zhǔn)確性的指標(biāo)。其中PE和MAPE的表達(dá)式如下:
PE=xj-jxj(14)
MAPE=1m∑mj=1xj-jxj(15)
式中:j為預(yù)測(cè)值;xj為真實(shí)值;m為數(shù)據(jù)樣本總數(shù)。
3 算例分析
3.1 算例設(shè)置
本文主要研究是LSTM模型計(jì)及PUE值對(duì)負(fù)荷預(yù)測(cè)精度的影響,因此在輸入變量中未計(jì)及天氣因素對(duì)負(fù)荷的影響。為了在不輸入天氣特征的條件下,驗(yàn)證本文所提方法的科學(xué)性和可靠性,實(shí)驗(yàn)使用廣州某電力設(shè)計(jì)院2019年06月至2019年12月每小時(shí)電力負(fù)荷數(shù)據(jù)作為數(shù)據(jù)集。在該時(shí)間段內(nèi)廣州天氣狀況較為穩(wěn)定,因此在不考慮氣象特征的條件下,也不會(huì)影響PUE值對(duì)數(shù)據(jù)中心短期負(fù)荷預(yù)測(cè)的效果。
本文所研究的負(fù)荷日期為一般日負(fù)荷預(yù)測(cè),對(duì)于節(jié)假日、工作日等特殊日的負(fù)荷預(yù)測(cè)未做特殊區(qū)分處理,因此本文方法不適合直接去預(yù)測(cè)節(jié)假日等特殊日負(fù)荷。如果直接預(yù)測(cè)節(jié)假日的負(fù)荷,其預(yù)測(cè)結(jié)果可能會(huì)不理想,需要對(duì)數(shù)據(jù)集日期類型進(jìn)行聚類處理,用處理后的數(shù)據(jù)集重新對(duì)模型訓(xùn)練。
3.2 數(shù)據(jù)修正
通過式(2)和(3)分別計(jì)算出數(shù)據(jù)的均值和方差,再利用式(4)基于3σ原理可以對(duì)離群值進(jìn)行辨別。若數(shù)據(jù)不滿足3σ原理則為正常值,保留;反之,則為離群值,進(jìn)行修正。如圖7所示,未處理的原始數(shù)據(jù)負(fù)荷主要分布在30kW~75kW之間,在電力負(fù)荷異常值分布圖中出現(xiàn)的棱形方塊為數(shù)據(jù)離群值。
修復(fù)過的數(shù)據(jù)如圖8所示,負(fù)荷依然分布在30kW~75kW之間,在電力負(fù)荷異常值分布圖中未出現(xiàn)棱形方塊異常值。
3.3 算例結(jié)果
為了驗(yàn)證本方法的預(yù)測(cè)精度,在同一個(gè)數(shù)據(jù)集下用反向傳播(back propagation, BP)、RNN和LSTM神經(jīng)網(wǎng)絡(luò)分別進(jìn)行不計(jì)PUE值和計(jì)及PUE值的負(fù)荷預(yù)測(cè),如表3所示的是最大、最小和平均百分誤差。
從表3可以看出,6種模型預(yù)測(cè)結(jié)果都取得了良好的表現(xiàn),BP和RNN神經(jīng)網(wǎng)絡(luò)未計(jì)PUE值的預(yù)測(cè)精度表現(xiàn)得更好,但是本文提出的LSTM神經(jīng)網(wǎng)絡(luò)計(jì)及PUE值的預(yù)測(cè)精度表現(xiàn)得最好。說明LSTM更適合處理短期電力負(fù)荷預(yù)測(cè)問題,且在考慮PUE情況下,加入這一影響因素有利于提高預(yù)測(cè)的準(zhǔn)確性。
如圖9(a)所示,本文繪制出真實(shí)值以及6種方法在連續(xù)24h每小時(shí)的負(fù)荷預(yù)測(cè)結(jié)果。同時(shí)圖9(b)和圖9(c)分別展示了真實(shí)值與計(jì)及PUE值和不計(jì)PUE值的3種方法的負(fù)荷預(yù)測(cè)對(duì)比結(jié)果,可以看出,基于LSTM網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果相較于實(shí)際值有一定滯后,但總體波動(dòng)趨勢(shì)與實(shí)際值相似?;贚STM神經(jīng)網(wǎng)絡(luò)的擬合程度比BP和RNN神經(jīng)網(wǎng)絡(luò)的更好。
圖10是6種方法的24h預(yù)測(cè)百分誤差棒圖,本文提出的方法在個(gè)別時(shí)刻誤差較大,但是其他時(shí)刻誤差均小于其他方法,說明該本文提出的算法在短期預(yù)測(cè)中有更出色的表現(xiàn)。
4 結(jié) 論
本文針對(duì)考慮PUE值情況下的數(shù)據(jù)中心機(jī)房短期電力負(fù)荷預(yù)測(cè)問題進(jìn)行了研究,通過對(duì)每小時(shí)的負(fù)荷與PUE值的相關(guān)性分析,發(fā)現(xiàn)兩者具有很大的相關(guān)性。因此,在進(jìn)行負(fù)荷預(yù)測(cè)時(shí)引入PUE值作為輸入量。此外,BP模型的不足之處是不能處理序列間關(guān)聯(lián)信息;RNN模型的缺陷是無法關(guān)聯(lián)長(zhǎng)久關(guān)鍵信息。為解決上述問題本文采用了LSTM進(jìn)行負(fù)荷預(yù)測(cè),算例結(jié)果表明:在考慮PUE的情況下, LSTM的預(yù)測(cè)結(jié)果更加精確。
參 考 文 獻(xiàn):
[1] 王繼業(yè), 周碧玉, 張法, 等. 數(shù)據(jù)中心能耗模型及能效算法綜述[J]. 計(jì)算機(jī)研究與發(fā)展, 2019, 56(8): 1587.
WANG Jiye, ZHOU Biyu, ZHANG Fa, et al. Data Center Energy Consumption Models and Energy Efficient Algorithms[J]. Journal of Computer Research and Development, 2019, 56(8): 1587.
[2] 宋杰, 孫宗哲, 劉慧, 等. 混合供電數(shù)據(jù)中心能耗優(yōu)化研究進(jìn)展[J]. 計(jì)算機(jī)學(xué)報(bào), 2018, 41(12): 2670.
SONG Jie, SUN Zongzhe, LIU Hui, et al. Research Advance on Energy Consumption Optimization of Hyper-powered Data Center[J]. Chinese Journal of Computers, 2018, 41(12): 2670.
[3] SMPOKOS G, ELSHATSHAT M A, LIOUMPAS A, et al. On the Energy Consumption Forecasting of Data Centers Based on Weather Conditions: Remote Sensing and Machine Learning Approach[C]// 2018 11th International Symposium on Communication Systems, Networks & Digital Signal Processing (CSNDSP), Budapest, Hungary: IEEE, 2018: 1.
[4] AVGERINOU M, BERTOLDI P, CASTELLAZZI L.Trends in Data Centreenergy Consumption under the European Code of Conduct for Data Centre Energy Efficiency[J]. Energies, 2017,10(10):1470.
[5] WHITNEY J, DELFORGE P. Data Center Efficiency Assessment[ED/OL]. The Natural Resource Defense Council, Tech. Rep., 2014.
[6] 周舟, 袁余俊明, 李方敏. 云數(shù)據(jù)中心服務(wù)器能耗建模及量化計(jì)算[J]. 湖南大學(xué)學(xué)報(bào)(自然科學(xué)版), 2021, 48(4): 36.
ZHOU Zhou, YUAN Yu Junming, LI Fangmin. Energy Consumption Modeling and Quantitative Calculation of Cloud Data Center Server[J]. Journal of Hunan University (Natural Science Edition), 2021, 48(4): 36.
[7] NI Jiacheng, BAI Xuelian, A Review of Air Conditioning Energy Performance in Data Centers[J]. Renewable and Sustainable Energy Reviews, 2017,67: 625.
[8] 王繼業(yè), 曾楠, 俞俊, 等. 數(shù)據(jù)中心能源效率與資產(chǎn)價(jià)值之間關(guān)系的研究[J]. 電力信息與通信技術(shù), 2021, 19(4): 1.
WANG Jiye, ZENG Nan, YU Jun, et al. Research on the Relationship Between Data Center Energy Efficiency and Asset Value [J]. Electric Power Information and Communication Technology, 2021, 19(4): 1.
[9] 王繼業(yè), 周碧玉, 劉萬濤, 等. 數(shù)據(jù)中心跨層效優(yōu)化研究進(jìn)展和發(fā)展趨勢(shì)[J]. 中國(guó)科學(xué): 信息科學(xué), 2020, 50(1): 1.
WANG Jiye, ZHOU Biyu, LIU Wantao, et al. Research Progress and Development Trend of Data Center Cross-layer Efficiency Optimization[J]. Science in China: Information Science, 2020, 50(1): 1.
[10]呂佳煒, 張沈習(xí), 程浩忠, 等. 集成數(shù)據(jù)中心的綜合能源系統(tǒng)能量流–數(shù)據(jù)流協(xié)同規(guī)劃綜述及展望[J]. 中國(guó)電機(jī)工程學(xué)報(bào), 2021, 41(16): 5500.
LV Jiawei, ZHANG Shenxi, CHENG Haozhong, et al. Overview and Prospects of Energy Flow-data Flow Collaborative Planning for Integrated Energy Systems in Integrated Data Centers[J]. Proceedings of the Chinese Society of Electrical Engineering, 2021, 41(16): 5500.
[11]PANDEY A S, SINGH D, SINHA S K. Intelligent Hybrid Wavelet Models for Short-term Load Forecasting[J]. IEEE Transactions on Power Systems, 2010, 25(3): 1266.
[12]李智勇, 蘇寅生, 李斌, 等. 基于MT-BSGP的電力負(fù)荷預(yù)測(cè)方法[J]. 哈爾濱理工大學(xué)學(xué)報(bào), 2021, 26(4): 46.
LI Zhiyong, SU Yinsheng, LI Bin, et al. Power Load Forecasting Method Based on MT-BSGP[J]. Harbin University of Science and Technology, 2021, 26(4): 46.
[13]TAHERI S, GOUDARZI M, YOSHIE O. Learning-based Power Prediction for Geo-distributed Data Centers: Weather Parameter Analysis[J]. Journal of Big Data, 2020, 7(1): 8.
[14]ZHAO Peng, YANG Lina, KANG Zong, et al. On Predicting the PUE with Gated Recurrent Unit in Data Centers[C]// 2019 IEEE 5th International Conference on Computer and Communications (ICCC),Chengdu,China:IEEE, 2019: 1664.
[15]SHOUKOURIAN H, KRANZLMLLER D. Forecasting Powerefficiency Related Key Performance Indicators for Modern Data Centers Using LSTMs[J].Future Generation Computer Systems, 2020, 112: 362.
[16]SHEN Ziyu, ZHANG Xusheng, LIU Binghui,et al.PCP-2LSTM: Two Stacked LSTM-based Prediction Model for Power Consumption in Data Centers[C]// 2019 Seventh International Conference on Advanced Cloud and Big Data (CBD), Suzhou, China: IEEE, 2019: 13.
[17]KUWAHARA H,HSU Y F,MATSUDA K,et al.Dynamic Power Consumption Prediction and Optimization of Data Center by Using Deep Learning and Computational Fluid Dynamics[C]// 2018 IEEE 7th International Conference on Cloud Networking (CloudNet), Tokyo, Japan: IEEE,2018: 1.
[18]郭大亮,沈峰,于楚凡,等.基于數(shù)據(jù)挖掘的電力負(fù)荷預(yù)測(cè)系統(tǒng)設(shè)計(jì)[J].電子設(shè)計(jì)工程,2021,29(23):60.
GUO Daliang,SHEN Feng,YU Chufan,et al.Design of Power Load Forecasting System Based on Data Mining[J].Electronic Design Engineering,2021,29(23):60.
[19]王天安,董雷,馬銳峰,等.基于智能優(yōu)化的電力負(fù)荷預(yù)測(cè)方法研究[J].電子設(shè)計(jì)工程,2021,29(2):129.
WANG Tianan,DONG Lei,MA Ruifeng,et al.Research on Power Load Forecasting Method Based on Intelligent Optimization[J].Electronic Design Engineering,2021,29(2):129.
[20]滿春濤, 康丹青. 考慮上下游的LSTM短時(shí)交通流量預(yù)測(cè)[J]. 哈爾濱理工大學(xué)學(xué)報(bào), 2019, 24(5): 101.
MAN Chuntao, KANG Danqing. LSTM Short-term Traffic Flow Prediction Considering Upstream and Downstream[J]. Journal of Harbin University of Science and Technology, 2019, 24(5): 101.
[21]SHI Y, XU B, WANG D. Leveraging Energy Storage to Optimize Data Center Electricity Cost in Emerging Power Markets[C]// 7th International Conference on Future Energy Systems, 2016.
[22]熊中敏, 郭懷宇, 吳月欣. 缺失數(shù)據(jù)處理方法研究綜述[J]. 計(jì)算機(jī)工程與應(yīng)用, 2021, 57(14): 27.
XIONG Zhongmin, GUO Huaiyu, WU Yuexin. Summary of Research on Missing Data Processing Methods[J]. Computer Engineering and Applications, 2021, 57(14): 27.
[23]SHERSTINSKY A. Fundamentals of Recurrent Neural Network (RNN) and Long Short-term Memory (LSTM) Network[J]. Physica D: Nonlinear Phenomena, 2020, 404: 132306.
(編輯:溫澤宇)
收稿日期: 2021-11-12
基金項(xiàng)目: 國(guó)家自然科學(xué)基金(61673142);黑龍江省杰出青年基金(61305001);廣東省重點(diǎn)領(lǐng)域研發(fā)計(jì)劃項(xiàng)目(2020B010166004).
作者簡(jiǎn)介:
張少峰(1994—),男,碩士,工程師;
徐向民(1972—),男,教授.
通信作者:
吳勁松 (1980—) ,男,博士,正高級(jí)工程師,E-mail: wujinsong@gedi.com.cn.