馮佳麗
(中國石化石油物探技術(shù)研究院 地球物理信息中心,江蘇 南京 211103)
隨著信息技術(shù)的提升和普及以及大數(shù)據(jù)的處理需求,計算機系統(tǒng)設(shè)備數(shù)量與日俱增,各大機構(gòu)、企業(yè)紛紛建成現(xiàn)代化信息機房,并配備了相應(yīng)規(guī)模的電池室與配電室等。中心機房中存放了大量的硬件、軟件以及數(shù)據(jù)資產(chǎn),采用高速網(wǎng)絡(luò)與各個辦公設(shè)備相連通。其中IT設(shè)備的運行離不開穩(wěn)定可靠的電源系統(tǒng)和良好安全的機房環(huán)境[1]。為保障機房設(shè)備的安全穩(wěn)定運行,需要確保與之配套的機房動力系統(tǒng)、環(huán)境系統(tǒng)、消防系統(tǒng)以及安保系統(tǒng)時刻穩(wěn)定協(xié)調(diào)。如果機房動力及環(huán)境設(shè)備出現(xiàn)故障,那么輕則影響業(yè)務(wù),重則造成系統(tǒng)癱瘓[2]。
傳統(tǒng)的機房維護工作主要靠工作人員值班看護,需要對機房及其配套設(shè)備間內(nèi)的各類設(shè)備進行巡查,發(fā)現(xiàn)問題后迅速報告處理。這種方式有很大的局限性,無法保證能夠第一時間發(fā)現(xiàn)機房設(shè)備工作過程中的問題,而且在人員配置方面也是一種消耗[3,4]。因此,通過技術(shù)手段實現(xiàn)365×24 h不間斷監(jiān)控與異常情況告警顯得非常必要,動力環(huán)境監(jiān)控系統(tǒng)能夠?qū)崿F(xiàn)中心機房的集中監(jiān)控、統(tǒng)一告警、集中管理,對機房動力和環(huán)境進行實時監(jiān)控,提高運維人員工作效率,及時消除設(shè)備隱患,實現(xiàn)機房的科學(xué)管理[5,6]。
數(shù)據(jù)中心機房設(shè)備往往分批次采購,涉及十幾個廠家,如艾默生、中興、華為以及英維克等。其結(jié)構(gòu)、通信協(xié)議等也各不相同,部分廠家?guī)в斜O(jiān)控工具或監(jiān)控頁面,能夠展示某批次設(shè)備的運行情況。想要了解機房整體動力環(huán)境情況,可能要逐個登錄十幾個動力環(huán)境監(jiān)控系統(tǒng)網(wǎng)管,有告警發(fā)生時,也無法及時傳遞給運維人員。各廠家監(jiān)控系統(tǒng)數(shù)據(jù)孤立,缺少關(guān)聯(lián),形成信息孤島,同類設(shè)備或同區(qū)域設(shè)備難以集中進行關(guān)聯(lián)分析與應(yīng)用,無法支持決策。
針對中心機房的動力系統(tǒng)和機房環(huán)境,需要對機房內(nèi)的供配電設(shè)備、不間斷電源(Uninterruptible Power System,UPS)、蓄電池組、母排柜等動力系統(tǒng)的運行情況以及機房的空調(diào)運行情況、溫度、濕度、煙霧、水浸等環(huán)境量實現(xiàn)遠程監(jiān)測功能[7]。動力環(huán)境監(jiān)控系統(tǒng)需要通過數(shù)據(jù)采集、傳輸、存儲、分析,實現(xiàn)多級或多區(qū)域網(wǎng)管,使無人職守成為可能。動力環(huán)境監(jiān)控系統(tǒng)還可實現(xiàn)中文圖形化人機界面的操作,實現(xiàn)對機房總體監(jiān)控及局部監(jiān)控,提高管理效率。
要建設(shè)動力環(huán)境監(jiān)控系統(tǒng)實現(xiàn)集中監(jiān)控統(tǒng)一管理,需要監(jiān)測的主要對象包括以下幾點。
(1)空調(diào)??照{(diào)作為機房必配設(shè)備,其主要功能是制冷,保持機房內(nèi)的環(huán)境溫濕度在一定的范圍內(nèi),為設(shè)備的可靠運行提供保障,包括精密空調(diào)和列間空調(diào)。所需監(jiān)控內(nèi)容包括設(shè)備的開關(guān)機狀態(tài)、出風(fēng)溫度、出風(fēng)濕度、回風(fēng)溫度、回風(fēng)濕度、壓縮機工作狀態(tài)、電壓、液管溫度、吸氣溫度、吸氣濕度、壓縮機運行狀態(tài)、電加熱功能開關(guān)狀態(tài)、告警情況以及告警閾值等。
(2)配電設(shè)備。低壓配電進線柜也稱為市電進線柜,市電(電力網(wǎng))供給機房使用的電能,其電力參數(shù)是重要的監(jiān)控對象,監(jiān)測一級、二級交流配電柜的主回路和各分回路。所需監(jiān)控內(nèi)容包括配電箱運行狀態(tài)、三相電壓、三相線電壓、三相電流、電流百分比、支路電流、負載情況、告警情況以及告警閾值等。交流電源分配列柜簡稱列頭柜,為各網(wǎng)絡(luò)機柜提供電源動力支持,集中提供電源管理。其遙測信號有主備路交流三相電壓、主備路交流三相電流、有功功率、無功功率、視在功率、電度數(shù)、支路電流以及支路功率等;遙信信號有主備路總開關(guān)狀態(tài)、支路開關(guān)告警狀態(tài)、輸出過流、輸出電壓以及防雷器故障等。
(3)UPS。UPS為機房內(nèi)重要的供配電設(shè)備,是一種含有儲能裝置的不間斷電源(連接多個電池組),主要用于給計算機、計算機網(wǎng)絡(luò)系統(tǒng)或其他電力電子設(shè)備(如電磁閥、壓力變送器等)提供穩(wěn)定、不間斷的電力供應(yīng),保證系統(tǒng)的穩(wěn)定不間斷運行,避免硬件損壞及軟件數(shù)據(jù)的丟失。當(dāng)市電輸入正常時,UPS將市電穩(wěn)壓后供應(yīng)給負載使用,此時的UPS相當(dāng)于一臺穩(wěn)壓器,同時向電池組進行充電;當(dāng)市電中斷(事故停電、維修停電)時,UPS利用電池的電能進行轉(zhuǎn)換,向負載繼續(xù)供電,從而使負載的IT設(shè)備維持正常工作并保護軟、硬件不受損壞[8]。UPS需監(jiān)控的主要數(shù)據(jù)有三相輸入電壓、直流輸入電壓、三相輸出電壓、三相輸出電流、輸出頻率、輸出功率、同步狀態(tài),供電模式以及故障告警等。
(4)蓄電池組。蓄電池組由多個電池單體組成,每個電池單體在質(zhì)量及放電使用不一致,導(dǎo)致電池組損耗與壽命長短不一。通過電池組監(jiān)控,可以對各電池單體電壓及總電壓、總電流、電池表面溫度等使用狀況進行實時監(jiān)控,一旦發(fā)現(xiàn)某個電池單體發(fā)生故障,則可以及時修復(fù)或更換,避免造成更大損失,同時節(jié)省了更換整套蓄電池組的開支。需要監(jiān)控的內(nèi)容包括蓄電池組的狀態(tài)、總電壓、總電流、電池剩余百分比、單體電池容量、單節(jié)電池電壓、單節(jié)電池內(nèi)阻以及單節(jié)電池溫度等。
(5)智能電表。需要監(jiān)控的內(nèi)容包括運行狀態(tài)、三相電壓、三相線電壓、三相電流、三相有功功率、三相視在功率、三相功率因數(shù)、平均電流、平均電壓、系統(tǒng)有功功率、系統(tǒng)視在功率、正向有功電能以及告警狀態(tài)等,并根據(jù)監(jiān)測數(shù)值計算出耗電量數(shù)據(jù)。
(6)機房環(huán)境。需要監(jiān)控的內(nèi)容包括溫度、濕度、水浸以及煙霧等。機房內(nèi)的服務(wù)器、交換機等重要數(shù)據(jù)設(shè)備和通信設(shè)備對溫濕度具有嚴格要求,超過允許的溫度范圍則可能會造成設(shè)備的不穩(wěn)定工作或數(shù)據(jù)損壞。通過安裝智能溫濕度傳感器(RS485溫濕度傳感器)能夠?qū)崿F(xiàn)對機房溫濕度的監(jiān)控。通過安裝漏水傳感器發(fā)現(xiàn),機房最容易出現(xiàn)漏水的地方為空調(diào)附近,在空調(diào)的安裝地板下面安裝線式漏水感應(yīng)傳感器,主要監(jiān)控內(nèi)容為溫濕度、浸水位置以及告警狀態(tài)等。
(7)網(wǎng)絡(luò)。中心機房中通常有多套集群、存儲、高性能服務(wù)器,這些設(shè)備采用分級的網(wǎng)絡(luò)交換機進行連接,保證辦公設(shè)備能夠使用這些計算存儲資源,因此交換機的運行情況也是監(jiān)控對象之一。監(jiān)控內(nèi)容包括交換機端口狀態(tài)、中央處理器(Central Processing Unit,CPU)利用率、內(nèi)存利用率、傳感器溫度、出口流量以及入口流量等,并形成網(wǎng)絡(luò)拓撲圖,全面了解機房主要交換機間的連接及網(wǎng)絡(luò)傳輸情況。
動力環(huán)境監(jiān)測系統(tǒng)設(shè)計遵循的原則包括可靠性、適用性、開放性以及可擴展性。系統(tǒng)建設(shè)應(yīng)采用通用技術(shù),形成一個開放、通用的系統(tǒng),適用范圍廣,支持不同廠商設(shè)備的連接,滿足第三方系統(tǒng)的數(shù)據(jù)對接。系統(tǒng)運行需要具有高可靠性,保證數(shù)據(jù)傳輸可靠,并具有連續(xù)無故障運行的能力,數(shù)據(jù)庫應(yīng)具備快速存儲和檢索能力以及良好的歷史數(shù)據(jù)存儲機制[9]。嚴格按照模塊化結(jié)構(gòu)方式開發(fā)以滿足可重用性及可擴展性,支持容量的擴展和功能的擴展等。各模塊間開發(fā)標準接口實現(xiàn)數(shù)據(jù)交換,依照標準進行注釋,系統(tǒng)功能及代碼應(yīng)易于維護、易于發(fā)現(xiàn)和定位故障。
被監(jiān)控對象按采集方式可分為智能設(shè)備和非智能設(shè)備兩大類,智能設(shè)備本身配置傳輸控制協(xié)議/網(wǎng)際協(xié)議(Transmission Control Protocol/Internet Protocol,TCP/IP)及一定的數(shù)據(jù)采集能力,并帶有智能接口,可以與上位機通信;非智能設(shè)備本身不具備數(shù)據(jù)采集和處理能力,需要增加傳感器、變送器以及采集器來完成數(shù)據(jù)采集和上報[10]。
本文根據(jù)區(qū)域配置了一體化采集裝置,通過RS232、RS485總線就近連接非智能的動力環(huán)境設(shè)備,形成小范圍的集中采集單元,再由各個采集代理將數(shù)據(jù)匯總至數(shù)據(jù)庫。所選用的一體化采集裝置有6路智能設(shè)備接口,能夠進行協(xié)議轉(zhuǎn)換,采集實時數(shù)據(jù)。智能IP設(shè)備則直接形成采集單元。研發(fā)基于通用協(xié)議數(shù)據(jù)采集代理程序,進行實時數(shù)據(jù)采樣并傳輸數(shù)據(jù)入庫;研發(fā)數(shù)據(jù)聚合轉(zhuǎn)化程序,對數(shù)據(jù)進行分析和處理,形成歷史數(shù)據(jù)與衍生數(shù)據(jù)。通過服務(wù)后端編寫接口供前端調(diào)用數(shù)據(jù),在監(jiān)控大屏上展示各類動力環(huán)境數(shù)據(jù)及重要告警信息。動力環(huán)境監(jiān)控系統(tǒng)架構(gòu)如圖1所示。
圖1 動力環(huán)境監(jiān)控系統(tǒng)架構(gòu)
本文中建設(shè)的動力環(huán)境監(jiān)測系統(tǒng)主要功能有數(shù)據(jù)采集、機房動環(huán)系統(tǒng)大屏總覽、場地監(jiān)控、設(shè)備監(jiān)測、告警以及事務(wù)處理,具體內(nèi)容如下。
(1)數(shù)據(jù)采集。一體化采集器與設(shè)備建立連接,進行解碼,采集、存儲大量的監(jiān)控數(shù)據(jù),并在后臺異步進行聚合,形成多種尺度的監(jiān)控大數(shù)據(jù)集。(2)機房動環(huán)系統(tǒng)大屏總覽。展示機房三維布局、溫場分布、溫濕度、UPS剩余電量等關(guān)鍵的實時信息以及耗電量、負載率、能耗占比等統(tǒng)計數(shù)據(jù)。(3)場地監(jiān)控。實現(xiàn)3D機房及2D機房功能,能夠了解機房整體布局、設(shè)備位置情況、溫度分布以及冷通道位置等。(4)設(shè)備監(jiān)測。包括網(wǎng)絡(luò)交換機監(jiān)測、智能電表監(jiān)測、母排監(jiān)測、UPS監(jiān)測、空調(diào)(列間空調(diào)、精密空調(diào))監(jiān)測、漏水監(jiān)測等。(5)告警。根據(jù)機房管理標準及管理需求,對告警閾值進行設(shè)置,系統(tǒng)根據(jù)設(shè)置范圍自動生成告警信息,并根據(jù)告警級別形成工單。(6)事務(wù)處理。告警形成工單,自動發(fā)送給相應(yīng)的運維管理人員,收到工單后遠程或現(xiàn)場處理問題,填寫解決方法,完成工單。
本軟件實現(xiàn)了對中心機房所需配電柜、智能電表、UPS電池組、母排柜、精密空調(diào)、列間空調(diào)、網(wǎng)絡(luò)交換機、溫濕度傳感器、水浸以及煙霧等設(shè)備的全面監(jiān)控,使得運維管理人員能夠快速了解所有動力環(huán)境設(shè)備的運行情況,并及時獲取告警信息,進行巡查處理,保障設(shè)備運行安全。減輕了機房管理人員的工作壓力,實現(xiàn)了中心機房動力設(shè)備遠程監(jiān)控功能。此外,以數(shù)據(jù)為依據(jù),可統(tǒng)計分析當(dāng)前機房各個主要部分(如空調(diào)機組用電、UPS自身用電、照明用電、集群用電等)的能耗,并且通過餅狀圖、柱狀圖、折線圖等方式顯示出來。還可輔助采購決策,優(yōu)化中心機房整體布局、通風(fēng)系統(tǒng)、電氣系統(tǒng)、布線系統(tǒng)、機柜布局,形成最優(yōu)的動力環(huán)境配置,提高能源效率,建設(shè)環(huán)保綠色低碳機房。