姜金智
(中海油信息科技有限公司,天津 300452)
隨著社會經濟的不斷發(fā)展,網絡成為每個人獲得最新信息的工具,承載網絡信息的數(shù)據(jù)中心也越來越重要,數(shù)據(jù)中心成為重要算力的關鍵基礎設施。因此,數(shù)據(jù)中心自身的環(huán)境安全成為數(shù)據(jù)中心信息安全的最基本要求。
選擇數(shù)據(jù)中心場地時,應綜合考慮影響數(shù)據(jù)中心場地的各因素,包括地理位置、自然條件、周邊環(huán)境等。首先,評估場地是否容易遭受地質災害,地質災害包括地震、火山、山體滑坡、泥石流、地面沉降等,地質災害會使數(shù)據(jù)中心受到嚴重損害。比如,地震、火山爆發(fā)導致數(shù)據(jù)中心整體坍塌,為數(shù)據(jù)中心帶來毀滅性的打擊,輕則墻體裂縫,重則整體垮塌。數(shù)據(jù)中心選址應盡量避開易發(fā)生地質災害的場所,以免受到地質災害帶來的影響,如果確實無法避開地震帶,則必須做好防護工作。例如,加固墻體,提高數(shù)據(jù)中心的抗震等級,確保數(shù)據(jù)中心的安全。其次,場地要盡量避開自然災害,數(shù)據(jù)中心的選址應避開臺風、龍卷風、極端高溫或低溫等自然災害。如果可能,數(shù)據(jù)中心應盡量建設在環(huán)境涼爽的地區(qū),便于數(shù)據(jù)中心散熱,減少空調系統(tǒng)能耗,降低數(shù)據(jù)中心運營成本。最后,需要考慮周邊環(huán)境的風險,避開一些有風險的場所,特別是易燃易爆場所[1]。
火災是數(shù)據(jù)中心運營中面臨的重大安全威脅之一,“預防為主、消防結合”是我國消防安全的工作方針?;馂牡念A防主要針對火災的發(fā)生源,根據(jù)發(fā)生源采用針對性的措施進行防護,主要分為來自內部的火災威脅和來自外部的火災威脅。內部的火災威脅主要是數(shù)據(jù)中心自身設備引起的火災,例如電線短路、UPS 電池起火、柴油發(fā)電機起火等。在數(shù)據(jù)中心建設時,應將柴油發(fā)電機和UPS 電池室遠離設備區(qū)域。來自外部的火災威脅主要是外部的易燃易爆場所起火、樹木森林起火等。在數(shù)據(jù)中心選址時,應遠離易燃易爆場所,設置防火隔離帶,遠離風險。
如果火災已經發(fā)生,及時做出撲救行動,降低火災造成的損失。數(shù)據(jù)中心檢測火災的設備有煙感探測器、溫感探測器等。煙感探測器是通過檢測火災產生的煙霧發(fā)現(xiàn)火災的發(fā)生,通過檢測煙霧中的顆粒進行告警,當煙霧中的顆粒進入煙感探測器后,會干擾傳感器的電流,達到閾值后,煙感探測器便會觸發(fā)告警信號,這是目前應用最廣的火災檢測方式。溫感探測器是通過檢測周圍溫度的急劇變化發(fā)現(xiàn)火災的發(fā)生,因為火災會使周邊溫度急劇升高,當溫感探測器的溫度探頭檢測到溫度急劇上升達到閾值后,便觸發(fā)告警信號。當數(shù)據(jù)中心發(fā)生火災后,火災檢測系統(tǒng)發(fā)現(xiàn)火災發(fā)生并產生相應的報警,消防系統(tǒng)接到火災報警后產生滅火行為。目前,數(shù)據(jù)中心推薦采用七氟丙烷進行滅火,當啟動七氟丙烷進行滅火時,人員應及時撤出現(xiàn)場,防止人員窒息而導致生命危險。七氟丙烷滅火劑是一種無色、幾乎沒有氣味的滅火劑,滅火后不留固體或液體殘余物,七氟丙烷不導電,因此不會對精密設備造成影響,不會使設備中斷運行。七氟丙烷滅火劑不含鹵代物,不會破壞大氣平流層中的臭氧層,對環(huán)境非常友好,符合環(huán)保要求。
數(shù)據(jù)中心中存在大量的精密儀器設備。精密儀器設備與水接觸后會使設備發(fā)生短路、銹蝕等風險,導致設備故障停機,甚至損壞,出現(xiàn)無法修復的故障。因此,數(shù)據(jù)中心的防水工作非常重要。數(shù)據(jù)中心產生水浸風險的來源主要有房頂漏水、管道漏水、冷凝水等。數(shù)據(jù)中心選址時,不要選擇大樓頂層、一層或者地下,防止汛期因暴雨導致漏水或者倒灌的現(xiàn)象發(fā)生。進入汛期后,要對門窗進行加固處理,提前準備防水沙袋、防水擋板、防水布、應急燈等應急物資,提前計劃應急人員值班表。大雨時增加巡檢次數(shù),盡早發(fā)現(xiàn)漏水現(xiàn)象。發(fā)現(xiàn)漏水現(xiàn)象后,及時將設備蓋上防水布,以防設備出現(xiàn)短路風險。供水管道和空調的冷凍水管道不要從數(shù)據(jù)中心設備區(qū)域通過,防止管道漏水造成設備故障。
在潮濕的夏季,空調冷凝水同樣也需要重視。濕度較大的空氣碰到低溫的冷凍水管道后,會產生較多的冷凝水,可以通過在冷凍水管道增加保溫棉的方式,減少冷凝水的產生??照{蒸發(fā)器上也會產生冷凝水,因此需要在數(shù)據(jù)中心空調下做好排水設施,通過管道將冷凝水及時排走。
在產生漏水事件后,需要采用自動化設備進行漏水告警,提醒數(shù)據(jù)中心值守人員及時處理。小型機房推薦采用水浸傳感器進行漏水告警,大型數(shù)據(jù)中心建議采用定位漏水感應線進行漏水檢測。定位漏水感應線具備響應快、準確報告漏水位置的特點,通常鋪設在數(shù)據(jù)中心地板下,當水接觸到漏水感應線時,水作為導電介質,使感應線形成通路,立即發(fā)出告警信號。定位漏水感應線通過與動力環(huán)境監(jiān)控系統(tǒng)3D 機房模塊結合,產生告警后,能夠立刻在監(jiān)控大屏準確顯示泄漏點,同時發(fā)出聲光告警信號,方便值守人員快速處理,減小漏水導致的損失。
數(shù)據(jù)中心內存放的服務器、存儲、網絡設備等對電力供應的要求很高,電力消耗也是非常大,所以數(shù)據(jù)中心內運行的設備需要可靠并且穩(wěn)定的電源供應保障[2]。一旦電源系統(tǒng)出現(xiàn)故障無法供電,輕則導致設備關機、數(shù)據(jù)丟失,重則導致業(yè)務中斷,產生的次生影響會造成嚴重的經濟損失。因此,保障數(shù)據(jù)中心的供電系統(tǒng)正常運行是非常重要的環(huán)節(jié),一般會采用雙路供電、UPS 電源、配備柴油發(fā)電機等方式,保障數(shù)據(jù)中心穩(wěn)定的電源供應。
為保障大型數(shù)據(jù)中心的電力供應,要從源頭解決問題。一般采取雙路市電的方式為數(shù)據(jù)中心提供電源,雙路市電要從不同的變電所引出,并經由不同的路徑到達數(shù)據(jù)中心,防止某個變電所出現(xiàn)設備故障或者某條電力傳輸線纜損壞導致電力中斷。進入數(shù)據(jù)中心的雙路供電采用ATS系統(tǒng)進行切換。ATS 系統(tǒng)在某路市電停電時,自動將負載切換至另外一條供電線路。但是ATS 為機械結構,進行自動切換的時間在秒級,對于數(shù)據(jù)中心服務器來說,會造成供電中斷,導致設備重啟和數(shù)據(jù)丟失,這對數(shù)據(jù)中心來說是無法接受的。因此,只使用雙路供電和ATS 進行保障是遠遠不足的,還需要使用UPS 對數(shù)據(jù)中心電力供應進行保障。
UPS 是英文“Uninterruptible Power System”的縮寫,中文名稱是不間斷電源系統(tǒng)[3]。UPS 可以提供持續(xù)、平穩(wěn)的電力供給。UPS 由電力轉換系統(tǒng)和電力儲存系統(tǒng)組成,當市電正常供應時,UPS 將輸入的交流市電通過整流器轉變?yōu)橹绷麟?,儲存在電力儲存系統(tǒng)中,電力儲存系統(tǒng)一般由鉛酸蓄電池組成。當市電供應中斷時,UPS 儲存的電力通過轉換系統(tǒng)逆變成交流電供給設備使用。在線式UPS 的切換時間為0ms,后備式UPS 的切換時間為10ms 左右。因此,UPS 可以保障數(shù)據(jù)中心的設備不受電力中斷現(xiàn)象影響,在市電中斷的情況下能夠正常運行。電力存儲系統(tǒng)的容量不同,一般UPS 可以提供10 分鐘至幾個小時的電力。
除了電力中斷外,還需要提高供電質量。市電電網中存在瞬態(tài)尖峰、浪涌、高壓脈沖、諧波污染,特別是大型電力設備如空調、電梯等有電機的設備,會產生電涌,統(tǒng)稱為電力波動。由于服務器等內部芯片對電力波動非常敏感,電力波動可能導致服務器誤碼率增加,最終造成數(shù)據(jù)錯誤、設備宕機,甚至硬件損壞。在線式UPS 無論在市電正常時還是市電中斷時,都由電力儲存系統(tǒng)向逆變器供電,能夠持續(xù)不斷輸出正弦波交流電,過濾掉市電中的尖峰、浪涌、諧波等電力波動。當電力中斷時,在線式UPS內部不用切換供電方式,能夠確保電力中斷時間為零。因此,數(shù)據(jù)中心需要安裝在線式UPS,保障數(shù)據(jù)中心內部設備穩(wěn)定運行。
為保證電力中斷時能夠順利供電,電力儲存系統(tǒng)的維護也非常重要。目前,UPS 電力儲存系統(tǒng)一般使用免維護的密封鉛酸蓄電池,運行壽命一般為4 ~5 年。對于鉛酸蓄電池來說,周邊環(huán)境的氣溫需要保持20 ~25℃,環(huán)境溫度過高或者過低都會影響電池壽命[4]。環(huán)境溫度過高,會導致鉛酸蓄電池內部電化學反應活性劇烈,從而放出更多的熱量,使電池溫度繼續(xù)上升。環(huán)境溫度過低,會導致電池內部電化學反應活性減弱,放電電流減小,達不到廠商標稱的容量,造成供電時間縮短。在很少發(fā)生停電的地區(qū),鉛酸蓄電池長期處于浮充狀態(tài),沒有充電和放電的過程,長此以往會導致鉛酸蓄電池的活性降低,容量減少,縮短鉛酸蓄電池的壽命[5]。因此,每季度應對鉛酸蓄電池做一次完整的充放電操作,用以激發(fā)鉛酸蓄電池內部離子化學反應活性,防止內部老化,延長鉛酸蓄電池工作壽命。
當市電供應中斷時,數(shù)據(jù)中心的UPS 進入放電模式,因UPS 一般只能維持幾個小時的供電,若電力中斷時間過長,例如1 ~2 天,甚至更長的時間,一般的UPS 無法提供如此長的供電時間。因此,需要柴油發(fā)電機繼續(xù)提供電力供應。當停電時間超過一定時間(一般為半小時),柴油機便開始啟動,完成電力切換并機后,由柴油發(fā)電機繼續(xù)向數(shù)據(jù)中心供電。在柴油充足的情況下,柴油發(fā)電機可以源源不斷地提供電力,當柴油不足時,直接向油箱補充柴油即可,不會造成電力中斷。一般來說,柴油發(fā)電機需要每月進行日常性維護,檢查柴油機系統(tǒng)的電氣系統(tǒng)、冷卻系統(tǒng)、燃油系統(tǒng)和外觀檢查,檢查是否有漏油、滲油、缺油等問題。柴油發(fā)電機每年至少進行一次帶載測試,測試柴油發(fā)電機及切換系統(tǒng)是否能夠正常運行。
雷電的瞬間會產生極高的電壓和電流,擊穿空氣,產生天空云層和地面之間的放電現(xiàn)象。對地面放電的過程中,會對地面上的人和建筑物產生嚴重危害。雷擊產生威脅一般分為直擊雷威脅和感應雷威脅。直擊雷是天空中產生的雷電直接擊中建筑物本體或電源線路,產生高壓高電流的沖擊,從而擊穿電子設備的電器元件,損壞設備,甚至造成人員傷亡[6]。感應雷是雷電電流產生的磁場或電場,經過金屬導體感應出來的電壓和電流形成的雷擊[7]。建筑物內的金屬導線和大型金屬都可能會受到感應雷的影響,產生數(shù)十萬伏的電壓,從而擊穿電器元件,導致設備損壞。
所有的電子設備包括服務器、交換機、臺式計算機、顯示器等在工作時會有電流通過,產生一定的電磁輻射。同時,其他設備產生的電子輻射,也可能對信息系統(tǒng)造成干擾,導致數(shù)據(jù)出錯,甚至出現(xiàn)宕機的現(xiàn)象,影響業(yè)務正常運行。
為了防止信息系統(tǒng)的產生信息泄露的危害,也防止其他電磁干擾導致信息系統(tǒng)受到影響,目前最有效的方法是電磁屏蔽。電磁屏蔽是在信息系統(tǒng)的硬件設備與外部之前使用導電的屏蔽材料進行隔離,利用“法拉第籠”原理,中斷電磁信號向外或向內傳遞,電磁屏蔽方案有屏蔽機房、屏蔽機柜、屏蔽線纜等。屏蔽效果還會受到兩個因素影響,一是屏蔽表面必須是連續(xù)的導體,二是不能有穿透屏蔽體的導體,否則都會使屏蔽的效果受到影響。在實際應用中,機柜通風口、機柜門板縫隙破壞了導體的連續(xù)性,導致屏蔽效果降低。
數(shù)據(jù)中心應定義安全邊界范圍,并且制定相應的規(guī)章制度確定安全區(qū)域。數(shù)據(jù)中心可分多個級別的安全區(qū)域,例如外來訪客區(qū)、辦公區(qū)、設備區(qū)、庫房區(qū)域等,并且為不同類別人員定義可以進入的安全區(qū)域權限。例如,外來參觀人員只能進入訪客區(qū)域,外來技術人員和公司內部員工可進入辦公區(qū)域,所有人員經過授權和登記后可以進入數(shù)據(jù)中心區(qū)域,并且只能在特定區(qū)域停留。在不同的安全區(qū)域間,需要部署門禁或者專人值守等方式,限制沒有權限的人員進入。
數(shù)據(jù)中心自身的環(huán)境安全成為數(shù)據(jù)中心信息安全的最基本的要求。數(shù)據(jù)中心的物理安全需要從多種方式和角度進行防護,以保證應用系統(tǒng)能夠正常運行。只有數(shù)據(jù)中心的基礎設施正常運行,才能為業(yè)務運行提供連續(xù)性保障。