張銘蕾, 儲 君
(中國民生銀行總行信息科技部,北京 101300)
在信息技術(shù)快速發(fā)展的背景下,數(shù)據(jù)中心基礎(chǔ)設(shè)施的關(guān)鍵性日益凸顯,對于金融系統(tǒng)的數(shù)據(jù)中心而言,重要業(yè)務(wù)系統(tǒng)連續(xù)穩(wěn)定運行對基礎(chǔ)設(shè)施安全可靠性的要求更加苛刻,大型金融數(shù)據(jù)中心如遇宕機造成的業(yè)務(wù)損失、聲譽等間接損失每小時可達數(shù)億元人民幣。
為保證金融業(yè)數(shù)據(jù)中心基礎(chǔ)設(shè)施的可靠性與安全性,目前設(shè)計標準大多采用Uptime TierⅣ等級,并滿足GB 50174-2017中A級數(shù)據(jù)中心標準,本文主要從滿足TierⅣ等級的數(shù)據(jù)中心空調(diào)系統(tǒng)控制架構(gòu)展開分析。
Uptime Institute機構(gòu)發(fā)布的標準中TierⅣ等級為其最高等級,主要從設(shè)備容錯、分配路徑物理隔離、可并行維護、連續(xù)制冷等角度作出要求(表1)。
TierⅣ等級要求 表1
對于空調(diào)系統(tǒng)而言,要滿足以上要求,并同時考慮到節(jié)能的要求,目前多采用“2N”架構(gòu)的冷凍水空調(diào)系統(tǒng),如圖1所示,從冷源部分(包含冷水機組、冷凍水泵、冷卻水泵、板式換熱器、冷卻塔、蓄冷罐等)到機房專用精密空調(diào)末端設(shè)備的數(shù)量均為2N,即從設(shè)備配置上滿足容錯的要求。
同時,對每套制冷單元,從冷源到空調(diào)末端及每套制冷單元的空調(diào)水管路,均應(yīng)布置在不同的物理空間,滿足防火防水的物理隔離要求。
圖1 2N配置的空調(diào)系統(tǒng)示意圖
基于Uptime TierⅣ等級搭建的數(shù)據(jù)中心空調(diào)系統(tǒng)及機房環(huán)境溫濕度控制系統(tǒng)主要包括:設(shè)備監(jiān)控系統(tǒng)(BAS系統(tǒng))、空調(diào)末端的群控系統(tǒng)、環(huán)境監(jiān)控系統(tǒng)。
通過以上控制系統(tǒng)可以自動識別空調(diào)系統(tǒng)中故障設(shè)備或故障點,并自動隔離故障,同時另一套空調(diào)系統(tǒng)自動加載,保證機房環(huán)境溫度在15min內(nèi)的波動值不超過5℃,同時滿足空調(diào)系統(tǒng)的制冷容量一直達到“N”的要求。
(1)針對制冷單元一、二設(shè)計兩套獨立的BAS系統(tǒng),如圖2所示,每套BAS系統(tǒng)接入各自制冷單元內(nèi)的冷水機組、冷凍水泵、冷卻水泵、冷卻塔、蓄冷罐、水處理器、漏水探測器及水管路上的電動控制閥門、壓力和溫度傳感器等設(shè)施。
(2)兩套BAS系統(tǒng)的服務(wù)器和操作站放置于獨立的自控室內(nèi),兩套系統(tǒng)之間完全獨立運行。
圖2 BAS系統(tǒng)示意圖
(1)機房專用精密空調(diào)群控管理系統(tǒng)采用的是模塊化主從形式,如圖3所示,通過RS485通訊方式來實現(xiàn)聯(lián)網(wǎng)群控。選擇一臺精密空調(diào)機組當作主控機組,將精密空調(diào)機組聯(lián)網(wǎng),并將各個空調(diào)的地址分別設(shè)置在精密空調(diào)內(nèi)置智能通訊接口上。
(2)精密空調(diào)采用2N架構(gòu),因此群控①與群控②對應(yīng)的空調(diào)機組也獨立聯(lián)網(wǎng)。當任何一套精密空調(diào)系統(tǒng)出現(xiàn)故障時,另一套精密空調(diào)系統(tǒng)可正常運行,從而保證N配置的精密空調(diào)可靠運行。
圖3 群控系統(tǒng)示意圖
圖4 環(huán)境監(jiān)控系統(tǒng)示意圖
與空調(diào)系統(tǒng)相關(guān)的環(huán)境監(jiān)控主要包括IT機房模塊及配電用房內(nèi)的溫濕度采集、機房專用精密空調(diào)的狀態(tài)采集、加濕機狀態(tài)采集等。
監(jiān)控系統(tǒng)中的核心交換機、監(jiān)視主機均為2N架構(gòu),一主用一備用,分別設(shè)置于獨立的監(jiān)控室內(nèi),主備機相互檢測,雙機熱備。環(huán)境監(jiān)控系統(tǒng)示意圖如圖4。
(1)設(shè)備監(jiān)控系統(tǒng)(BAS系統(tǒng))
1)BAS系統(tǒng)中的控制器用以檢測室外濕球及干球溫度、水流量、供回水溫度、壓力等參數(shù),向制冷單元內(nèi)的各設(shè)備(冷水機組、水泵、冷卻塔、電動閥門等)發(fā)出控制命令,并接受各設(shè)備的狀態(tài)反饋信號,即同時實現(xiàn)“監(jiān)測與控制”的功能。
因Uptime TierⅣ等級要求“2N”配置的空調(diào)系統(tǒng)均需同時在線運行,當監(jiān)測到任意一套制冷單元的某個設(shè)備故障的情況下,應(yīng)能自動識別故障點并隔離故障設(shè)備,同時根據(jù)設(shè)定的控制邏輯,另外一套制冷單元中相應(yīng)的設(shè)備自動加載運行,如:某TierⅣ等級的數(shù)據(jù)中心,冷水機組數(shù)量為1+1(2N配置),在滿負荷的情況下,兩臺冷水機組運行負載率均為50%+50%,在某一臺冷水機組因制冷劑泄漏或其他故障的情況下,BAS系統(tǒng)自動識別故障的冷水機組并發(fā)出報警,按照控制邏輯自動關(guān)閉故障的冷水機組及其對應(yīng)的冷凍水泵、冷卻水泵、冷卻塔及相應(yīng)的管路電動閥;此過程中另一套制冷單元根據(jù)冷負荷的需求自動加載,直至達到100%的運行工況。
2)對于冷凍水空調(diào)系統(tǒng),冷凍水或冷卻水的泄漏對數(shù)據(jù)中心服務(wù)器等設(shè)備的危害極大,因此Uptime TierⅣ等級要求所有室內(nèi)水管路都應(yīng)探測到漏水故障,需要通過布置漏水繩及其他壓力傳感器等設(shè)施,保證任意位置的漏水探測器報警時,輔以管路中的壓力傳感器,判斷水管路是否發(fā)生局部泄漏或者爆管,控制系統(tǒng)自動關(guān)閉相應(yīng)區(qū)域的電動閥,防止出現(xiàn)持續(xù)性的漏水。
實際在設(shè)計過程中,則需根據(jù)空調(diào)系統(tǒng)冷凍水及冷卻水管路環(huán)狀/枝狀布置的不同,設(shè)定不同的控制邏輯,枝狀布置的管路可能因管路泄漏而關(guān)閉整套空調(diào)系統(tǒng)。
(2)空調(diào)末端群控系統(tǒng)
1)群控管理系統(tǒng)具有的功能包括群組內(nèi)的空調(diào)末端自動分工、順序加載、數(shù)據(jù)同步等,以及對各臺空調(diào)機組運行參數(shù)進行精準控制,當主控機組停機后,其他從機具有主控功能,會及時接管系統(tǒng),完成相應(yīng)的管理控制任務(wù)。
2)群控功能應(yīng)能保證精密空調(diào)所有機組運行的持續(xù)性,避免主控機組故障影響到其他機組,從而保證整體“N”配置的精密空調(diào)可靠運行。
(3)環(huán)境監(jiān)控系統(tǒng)
1)環(huán)境監(jiān)控系統(tǒng)主要是采集機房專用精密空調(diào)的送回風溫度和濕度測量值,送回風溫度和濕度設(shè)定值,偏移量、運行狀態(tài),風機轉(zhuǎn)速、水閥開度、供回水溫度、手/自動和故障狀態(tài)等數(shù)值,以及機房模塊、配電用房內(nèi)的溫濕度情況。
2)Uptime TierⅣ等級要求環(huán)境監(jiān)控系統(tǒng)只能進行數(shù)據(jù)及狀態(tài)采集,不能參與設(shè)備控制。
(1)對于設(shè)備監(jiān)控系統(tǒng)(BAS系統(tǒng)),不僅要滿足系統(tǒng)內(nèi)各設(shè)備容錯的要求,同時對于各自監(jiān)控系統(tǒng)的控制器、交換機、服務(wù)器、監(jiān)控器、操作站等設(shè)備及主干布線、水平布線的橋架路由等,均需布置在不同的物理空間,以保障當任何一套系統(tǒng)因火災或水管路漏水導致故障時,另外一套系統(tǒng)仍然可以工作,監(jiān)控其對應(yīng)的制冷單元,保證制冷系統(tǒng)滿足“N”容量的要求。
(2)對于空調(diào)末端群控系統(tǒng),因每個IT機房模塊內(nèi)的精密空調(diào)為2N配置,同時已經(jīng)布置在滿足物理隔離要求不同的空調(diào)間內(nèi),因此空調(diào)末端的群控系統(tǒng)已經(jīng)滿足物理隔離的要求。環(huán)境監(jiān)控系統(tǒng)“只監(jiān)不控”,則其設(shè)備及橋架路由可不要求物理隔離,但建議其核心交換機及監(jiān)視主機進行雙機熱備。
(1)任意一個控制系統(tǒng)中的控制器及交換機、通信線路故障時,均可以直接斷開該設(shè)備,其所控制的設(shè)備將繼續(xù)保持當時的運行狀態(tài),不影響正常使用。
(2)BAS系統(tǒng)應(yīng)監(jiān)測控制器的“心跳”,如果檢測到控制器故障,則應(yīng)立即報警并維持故障之前的運行模式及狀態(tài)。
(3)控制系統(tǒng)中應(yīng)有設(shè)備的手/自動控制狀態(tài)顯示,冷水機組、水泵、冷卻塔、機房專用空調(diào)等設(shè)備均需自帶手動控制模式,在設(shè)備故障時切為手動控制模式,此時控制系統(tǒng)中顯示設(shè)備手動控制狀態(tài),直至設(shè)備維修完成后切為自動控制模式。
(4)控制系統(tǒng)中的控制線連接類型需為插拔式連接頭,即支持熱插拔,保證可以在線檢修維護。
通過以上分析,可知基于Uptime TierⅣ等級的數(shù)據(jù)中心空調(diào)系統(tǒng)控制架構(gòu)與GB 50174-2017中的最高A級標準,在一些細節(jié)上,尤其設(shè)備監(jiān)控系統(tǒng)(BAS系統(tǒng)),有較大的區(qū)別。本文所分析的是基于實現(xiàn)設(shè)備及路徑的物理隔離而采用“2N”配置的架構(gòu),但其實“N+1”的配置也能實現(xiàn)相同的功能,但難度更大。同時,此架構(gòu)需要犧牲一定的建筑面積,降低了數(shù)據(jù)中心的出機柜率,整體的投資造價也相對較高,但卻可以提高數(shù)據(jù)中心的安全性與可靠性。若為了獲得Uptime Institute機構(gòu)頒發(fā)的設(shè)計認證證書,則需要通過該機構(gòu)嚴苛的審核,因此國內(nèi)通過TierⅣ認證的項目相對較少。