陳強, 朱濤(中國移動通信集團上海有限公司,上海 200233)
CHEN Qiang, ZHU Tao(China Mobile Group Shanghai Co., Ltd., Shanghai 200233, China)
?
數(shù)據(jù)機房PUE和節(jié)能的關系研究
陳強, 朱濤
(中國移動通信集團上海有限公司,上海 200233)
摘 要通過對PUE的計算公式進行分解和推導,解析論述數(shù)據(jù)機房PUE和節(jié)能之間的關系,并與數(shù)據(jù)機房實際運行的情況進行對比驗證,最后對數(shù)據(jù)機房的節(jié)能方法進行補充。
關鍵詞數(shù)據(jù)機房;PUE;節(jié)能;關系
多年來,國家對節(jié)能減排工作越來重視,對包括通信行業(yè)在內(nèi)的所有企業(yè)提出了加強資源節(jié)約和管理的要求,在“十一五”期間,各電信服務商都投入了巨大的人力和專項資金落實節(jié)能減排工作,也取得了很大的成效,單位電信業(yè)務總量綜合能耗從每萬元68.5 kg標準煤降低到51.4 kg標準煤,累計降低24.9%。
在“十二五”規(guī)劃中,國家進一步提出了電子信息行業(yè)能耗降低18%,其中一般數(shù)據(jù)中心PUE下降8%,新建大型云計算數(shù)據(jù)中心的PUE要達到1.5以下的目標。
PUE只是用電效率的一個指標,最終目的是為了節(jié)能,但是中國移動對數(shù)據(jù)中心有著節(jié)能和PUE兩方面的要求,那么我們就應該對這兩方面,特別是這兩者之間的關系進行透徹的研究,這樣才能更好的制定和完成節(jié)能減排的總體目標。
PUE(Power Usage Effectiveness, 電源使用效率)是一個綜合考量數(shù)據(jù)機房能耗運行水平的評價值[1],其最早是由TGG(The Green Grid,綠色網(wǎng)格)在2007年提出來的,同時被提出來的還有DCE(后來改為DCIE,Datacenter Efficiency)這個評價值,DCIE為PUE的倒數(shù)[2],因此不在此贅述,能耗測量點圖如圖1所示,PUE的計算公式:
PUE=總設備用電/IT設備用電 (1)
總設備用電:通信用電、空調(diào)用電和建筑基礎用電三者之和,即A點的用電計量。
IT設備用電:數(shù)據(jù)機房內(nèi)的通信設備用電,一般指服務器用電及G點的用電計量。
PUE大于2.5時,說明數(shù)據(jù)機房能效處于較差水平;PUE值在1.4~2.5時,說明數(shù)據(jù)機房能效處于一般水平;PUE值小于1.4時,說明數(shù)據(jù)機房能效處于優(yōu)秀水平。
圖1 能耗測量點圖
目前,數(shù)據(jù)機房的PUE水平大致在1.8~2.5之間,個別機房因為采用了自然冷源或者負載率比較高,PUE甚至可以做到低于1.5,而有些機房因為負載率很低,同時也沒有采用好的節(jié)能措施,其PUE甚至會大于3。
表面看目前的數(shù)據(jù)機房的PUE值還是可以接受的,但是其存在以局部PUE替代總體PUE的問題,所以PUE看上去比較小,實際上能耗還是比較大的。以上海移動怒江IDC機房為例,所有5個樓層的PUE均在1.8以下,最低的到達1.46,但是其總設備用電的測量點不是在圖1的A點位置,而是取E、C和D這3者的和,忽略了UPS設備自身的消耗電量,所以其PUE值應該比目前測量的大0.2左右。如果使用的是冷凍水或者冷卻水系統(tǒng),則還必須加上水泵和淋水塔風扇的用電量[3]。
PUE計算公式中包含通信能耗、空調(diào)能耗、建筑照明能耗以及供電設備自身的能耗等4個方面的數(shù)據(jù),因此節(jié)能可以大致分為通信主設備節(jié)能、供電設備節(jié)能、空調(diào)設備節(jié)能和建筑節(jié)能這4個方面。
PUE計算公式的分母是IT設備用電,其實也就是通信主設備用電。分子是總設備用電,即通信用電、空調(diào)用電和建筑基礎用電三者之和。其中通信用電又包含通信主設備用電、電源設備損耗和配電線路損耗三部分,因此說4個節(jié)能方面都包含在PUE計算公式中,為了便于推導它們之間的關系,對計算公式進行分解。
PUE=(IT設備用電+電源設備損耗+配電損耗+空調(diào)設備用電+建筑用電)/IT設備用電 (2)
電源設備損耗用電根據(jù)其供電效率而不同,老舊的通信電源因其負載率小于50%低時,其效率往往低于0.8,近年來隨著模塊化UPS和高壓直流設備的引入,其負載率在30%時的效率可以達到0.9以上。
綜上,設IT設備用電為變量t,則PUE計算公式套入經(jīng)驗值后變形為:合并同類項后
下面分別對通信主設備節(jié)能、供電設備節(jié)能、空調(diào)設備節(jié)能和建筑節(jié)能這4個方面與PUE的關系進行研究。
2.1通信主設備節(jié)能與PUE的關系
就是研究t變化時PUE值的變化情況,對式(4)進行求導即可,求導后得到:t2
因為式(5)恒為負值,因此隨著IT設備用電量的增大,PUE值變小,當采用云計算、虛擬化等主設備節(jié)能手段后,IT設備用電量減小了,PUE值反而增大了。
由此可見反映機房能耗效率的指標PUE,在反映通信主設備節(jié)能上,是不正確的,甚至是相反的,這是PUE這一指標的局限性,要引起特別的注意[4]。
2.2供電設備節(jié)能與PUE的關系
在主設備用電不變的情況下,在式(4)中,反映供電設備節(jié)能的是分子中的第二項的系數(shù)0.23,所謂供電設備節(jié)能,就是對此項系數(shù)的改變,當采用了高效供電設備,或者供電設備被調(diào)整到運行在比較高效的工況時,此項系數(shù)會變小,反之則變大。
因此供電設備節(jié)能會使PUE值變小,能夠正確地反映機房能效水平。
2.3空調(diào)設備節(jié)能與PUE的關系
在主設備用電不變的情況下,同供電設備節(jié)能相類似的是,在式(4)中,反映空調(diào)設備節(jié)能的是分子中的第3項的系數(shù)0.6,理論上空調(diào)設備節(jié)能,就是對此項系數(shù)的改變,當采用了高能效比的空調(diào)設備,或者空調(diào)設備被調(diào)整到運行在比較高效的工況時,此項系數(shù)會變小,反之則變大。
因此空調(diào)設備節(jié)能會使PUE值變小,能夠正確地反映機房能效水平。
2.4建筑節(jié)能與PUE的關系
建筑用電在式(4)中是分子中的常數(shù)項,不同于供電設備和空調(diào)設備,在機房和人員確定后,其基本不受主設備用電的影響,因此顯而易見,當建筑采用了節(jié)能手段后,PUE值下降,反之上升。
因此建筑節(jié)能會使PUE值變小,能夠正確地反映機房能效水平。
在上海移動十幾年的數(shù)據(jù)機房運行維護過程中,經(jīng)歷了多次的IT設備和技術升級、電源設備升級更新、空調(diào)設備升級更新,以及機房建設標準的變遷,因此可以作為對上面理論上論述的PUE和各種節(jié)能技術或手段之間的關系進行驗證。
首先說主設備的方面,當?shù)镀瑱C逐漸代替老式的服務器,或者機房從建設之初的低裝機率到后來裝機率上升到一定程度,PUE的變化是明顯的,那就是隨著通信負載的增大,PUE整體而言是呈下降趨勢。而隨著近幾年云計算和虛擬化技術的逐漸引入,某些機房的主設備用電量反而下降了,隨之PUE卻有增大的趨勢,這一現(xiàn)象說明上面論述的主設備節(jié)能和PUE之間的關系是正確的。
其次是供電設備的更新升級,隨著電力電子技術的發(fā)展成熟,數(shù)據(jù)機房供電設備也發(fā)生了很大的變化,由最早的清一色的6脈沖的UPS,發(fā)展到12脈沖UPS,再到高頻機UPS,再到模塊化UPS,直到近兩年逐漸引入的高壓直流設備,撇開設備本身的可靠性、可用性指標不談,其工作效率確實是在不斷的提高,這就使得供電設備本身消耗的電能下降了,引起了PUE值的下降,驗證了供電設備節(jié)能和PUE之間的關系。
然后是空調(diào)設備的更新升級,空調(diào)采購上,由以前的能效比2.5、3提升到了目前的4,室外工況也由以前的25℃提升到了目前的35℃,因此空調(diào)的節(jié)能效果有了很大的提升,在通信負載發(fā)熱不變的情況下,機房PUE有了很大的下降,這一點也驗證了空調(diào)設備節(jié)能和PUE之間的關系。
最后是建筑節(jié)能這塊,數(shù)據(jù)機房建設標準的變遷有些不能說是嚴格意義上的建筑節(jié)能,比如冷熱通道分離、冷通道封閉等,應該偏空調(diào)節(jié)能多一點,但是對建筑節(jié)能也有影響,完全屬于建筑節(jié)能的應該是數(shù)據(jù)機房禁止開窗,隔熱材料等,這些措施在數(shù)據(jù)機房應用較少,反而是基站應用的較多,數(shù)據(jù)機房用的較多的是減少機房日光燈的開啟數(shù)量這一管理手段,取得了很好的節(jié)能效果,當然因為建筑用電這塊在數(shù)據(jù)機房用電占比較小,所以對PUE的影響不大,但是變化趨勢是沒有問題的,驗證了建筑節(jié)能和PUE之間的關系。
這里要補充一點的是,雖然上述4個方面都驗證了節(jié)能和PUE之間的關系,但是實際運行中的變化曲線并非嚴格按照式(4)的算術關系所形成的光滑曲線,而是階梯狀的,帶有斷點的形狀,如圖2、圖3所示。
比如說一個已經(jīng)有一定裝機率的數(shù)據(jù)機房,現(xiàn)在要增加IT設備負載,按照我們上面論述的關系研究,其機房PUE應該是隨著IT設備負載的增加而逐漸下降。但是實際情況并不完全如此,當下降到一定程度時,PUE反而會在某一點上有個跳躍上升的斷點,然后再以此斷點開始新一段的下降過程。
圖2 理論關系圖
圖3 實際關系圖
造成這種情況的原因是空調(diào)因素,因為在式(4)中,空調(diào)分項是0.6 t,這是個經(jīng)驗值,是在實際運行數(shù)據(jù)的基礎上為了簡化空調(diào)因素的作用而總結(jié)的,是假設空調(diào)用電量會隨著IT設備用電量同步上升或者下降,但實際上目前數(shù)據(jù)機房使用的大多數(shù)空調(diào)不是這樣的,首先有個運行工況的概念,效率隨著工況變化,還有就是空調(diào)的開啟關閉是以臺為單位的,并不是一個以冷量為單位的平滑曲線,如果因IT設備負載增加而增加開啟的空調(diào)制冷量和新增的熱量這兩者不匹配,就會造成關系曲線斷點的形成,而這兩者在絕大多數(shù)情況下是不可能匹配的。
目前逐步引入帶EC風機的空調(diào)能使得實際關系曲線更平滑一些,但是并不能完全消除斷點。
到目前為止,PUE仍然是被業(yè)界廣泛接受的數(shù)據(jù)機房能效指標,雖然PUE在面對云計算、虛擬化等IT新技術時表現(xiàn)出了一定的局限性,而且還存在一些不合理的地方,例如清理關閉數(shù)據(jù)機房的僵尸服務器反而會使得PUE上升等。
從邏輯上來講,既然是關于數(shù)據(jù)機房的指標,必然需要和數(shù)據(jù)機房的數(shù)據(jù)流量或者服務器的計算工作量有關,才能完整反映數(shù)據(jù)機房的運行水平。但是可能這方面的統(tǒng)計比較困難,所以還沒有一個可以替代PUE,且能被業(yè)界廣泛接受的指標。所以PUE還是數(shù)據(jù)機房最重要的一個能耗指標,我們還是很有必要緊緊把握其與節(jié)能之間的關系,以指導我們更好地完成節(jié)能減排工作。
參考文獻
[1] Green grid metrics: describing datacenter power efficiency[R]. TGG,2007.
[2] Jon Haas,Jamie Froedge. pue dcie usage guidelines[R]. 2009.
[3] 傅烈虎,曹播. 全面深入解析數(shù)據(jù)中心PUE[J]. 電氣應用. 2012(3):20-23.
[4] QUANTITATIVE EFFICIENCY ANALYSIS OF POWER DISTRIBUTION CONFIGURATIONS FOR DATA CENTERS[R]. TGG, 2008.
CHEN Qiang, ZHU Tao
(China Mobile Group Shanghai Co., Ltd., Shanghai 200233, China)
Relationship of PUE and energy saving in data center
Keywordsdata center; PUE; energy saving; relationship
AbstractThe essay notes the relationship of PUE and energy saving in data center base on the decomposition and derivation of the PUE calculating formula.Verifying and complementing the relationship by the actual operation and experience in data center.
中圖分類號TN915
文獻標識碼A
文章編號1008-5599(2016)05-0081-04
收稿日期:2016-03-01