如今云計(jì)算、大數(shù)據(jù)等新興領(lǐng)域方興未艾,作為實(shí)現(xiàn)和承載的最佳平臺(tái)的數(shù)據(jù)中心,無疑吸引了諸多的關(guān)注。事實(shí)上,數(shù)據(jù)中心已成為保障企業(yè)信息系統(tǒng)正常工作的重要基礎(chǔ)設(shè)施,如何保證數(shù)據(jù)中心的持續(xù)可靠運(yùn)行。
1 引言
如今云計(jì)算、大數(shù)據(jù)等新興領(lǐng)域方興未艾,作為實(shí)現(xiàn)和承載的最佳平臺(tái)的數(shù)據(jù)中心,無疑吸引了諸多的關(guān)注。事實(shí)上,數(shù)據(jù)中心已成為保障企業(yè)信息系統(tǒng)正常工作的重要基礎(chǔ)設(shè)施,如何保證數(shù)據(jù)中心的持續(xù)可靠運(yùn)行,如何應(yīng)對(duì)和有效化解數(shù)據(jù)集中帶來的風(fēng)險(xiǎn),已成為企業(yè)CTO們愈發(fā)關(guān)注的重要問題。
2 容備建設(shè)勢在必行
·全球在2004年因自然災(zāi)害和人為事故造成的直接損失達(dá)到1230億美元
·全球2005年共發(fā)生約400起巨災(zāi),損失超過2300億美元
·在世界范圍內(nèi)與20世紀(jì)60年代相比,到了20世紀(jì)90年代,世界上可統(tǒng)計(jì)的自然災(zāi)害發(fā)生率增長了3倍,其經(jīng)濟(jì)損失增長了9倍
·9.11事件中,美國世貿(mào)中心里數(shù)百家沒有災(zāi)難備份系統(tǒng)的公司徹底消失
·受汶川地震影響,整個(gè)銀行業(yè)凈損失約在50億~130億人民幣, 沒有災(zāi)備中心的城市商業(yè)銀行影響很大,08年銀行業(yè)凈利潤下滑0.7%
·世事無常,災(zāi)難一直如影隨行的陪伴著人類社會(huì)的發(fā)展。隨著信息化的快速發(fā)展,以政府、金融、電力、大型企業(yè)等為主的各行業(yè)逐步建立大型數(shù)據(jù)中心完成數(shù)據(jù)集中處理,數(shù)據(jù)的集中也意味著風(fēng)險(xiǎn)的加劇,對(duì)數(shù)據(jù)中心的可靠性也提出了更高的要求。企業(yè)數(shù)據(jù)中心必須能做到7×24小時(shí)不間斷的服務(wù)能力,為避免數(shù)據(jù)中心遭受災(zāi)難時(shí)造成的巨大損失,容災(zāi)備份系統(tǒng)的建設(shè)已勢在必行。
9.11之后,災(zāi)難備份被提升到前所未有的高度,國內(nèi)研究機(jī)構(gòu)、咨詢機(jī)構(gòu)、IT服務(wù)企業(yè)不斷呼吁災(zāi)難備份建設(shè)。國家信息化辦公室也在2005年發(fā)布《重要信息系統(tǒng)災(zāi)難恢復(fù)指南》,將災(zāi)備建設(shè)推到新的高度。2010年銀監(jiān)會(huì)發(fā)布的《商業(yè)銀行數(shù)據(jù)中心監(jiān)管指引》明確指出商業(yè)銀行需要建設(shè)災(zāi)備中心。
3 容備建設(shè)概念
根據(jù)國家標(biāo)準(zhǔn)《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》(GB/T 20988-2007)的定義:災(zāi)難是指由于人為或自然的原因,造成信息系統(tǒng)嚴(yán)重故障或癱瘓,使信息系統(tǒng)支持的業(yè)務(wù)功能停頓或服務(wù)水平不可接受、達(dá)到特定的時(shí)間的突發(fā)性事件。典型的災(zāi)難事件包括機(jī)房內(nèi)事件(如系統(tǒng)單點(diǎn)故障、機(jī)房電源系統(tǒng)故障、廣域網(wǎng)故障、機(jī)房漏水、空調(diào)系統(tǒng)故障、存儲(chǔ)陣列關(guān)鍵設(shè)備故障、人為破壞、軟件邏輯錯(cuò)誤、信息安全故障等)、建筑物災(zāi)難(如建筑物外部火災(zāi)、建筑物內(nèi)部火災(zāi)、機(jī)房內(nèi)部火災(zāi)、長時(shí)間停電、光纜中斷等)和區(qū)域性災(zāi)難(指機(jī)房所在區(qū)域或有緊密聯(lián)系的地區(qū)交通、電訊、能源及其它關(guān)鍵基礎(chǔ)設(shè)施遭到嚴(yán)重破壞,或大規(guī)模人口疏散的事件,如地震、大規(guī)模衛(wèi)生事件、恐怖襲擊、電網(wǎng)故障等)。
災(zāi)難備份是指為了災(zāi)難恢復(fù)而對(duì)數(shù)據(jù)、數(shù)據(jù)處理系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、基礎(chǔ)設(shè)施、專業(yè)技術(shù)支持能力和運(yùn)行管理能力進(jìn)行備份的過程;而災(zāi)難恢復(fù)是指為了將信息系統(tǒng)從災(zāi)難造成的故障或癱瘓狀態(tài)恢復(fù)到可正常運(yùn)行狀態(tài)、并將其支持的業(yè)務(wù)功能從災(zāi)難造成的不正常狀態(tài)恢復(fù)到可接受狀態(tài),而設(shè)計(jì)的活動(dòng)和流程。災(zāi)備系統(tǒng)的建設(shè)包含七要素:數(shù)據(jù)備份系統(tǒng)、備用數(shù)據(jù)處理系統(tǒng)、備用網(wǎng)絡(luò)系統(tǒng)、備用基礎(chǔ)設(shè)施、專業(yè)技術(shù)支持能力、運(yùn)行維護(hù)管理能力、災(zāi)難恢復(fù)預(yù)案。
《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》將災(zāi)難恢復(fù)能力劃分為6級(jí),災(zāi)難恢復(fù)能力等級(jí)越高,對(duì)信息系統(tǒng)的保護(hù)效果越好,但同時(shí)成本也會(huì)迅速上升。災(zāi)備等級(jí)主要從RTO(恢復(fù)時(shí)間目標(biāo))和RPO(恢復(fù)點(diǎn)目標(biāo))來考慮,RPO(恢復(fù)點(diǎn)目標(biāo))是指發(fā)生災(zāi)難前最后一次備份的時(shí)間點(diǎn)距離當(dāng)前時(shí)間差(數(shù)據(jù)丟失時(shí)間);RTO(時(shí)間恢復(fù)目標(biāo))是指發(fā)生災(zāi)難后恢復(fù)物理系統(tǒng)環(huán)境的時(shí)間。大部分的用戶關(guān)注的是數(shù)據(jù)安全性,即RPO值(RPO越小,數(shù)據(jù)丟失越少),但是用戶往往談的更多的是RTO(RTO越小,恢復(fù)生產(chǎn)越快)。
基于上述定義,災(zāi)備系統(tǒng)可以理解為以“備份”為手段,以“恢復(fù)”為目標(biāo),是一項(xiàng)周密的系統(tǒng)工程。這一工程不僅需要進(jìn)行備份中心的建設(shè)以及相關(guān)IT系統(tǒng)的購置,還需要在生產(chǎn)中心與備份中心之間搭建一張安全可靠的災(zāi)備傳送網(wǎng)絡(luò)。
4 容備網(wǎng)絡(luò)建設(shè)
絕大部分情況下,容災(zāi)系統(tǒng)需要借助廣域網(wǎng)進(jìn)行互聯(lián),由于災(zāi)備的特殊性和重要性,對(duì)廣域網(wǎng)的要求比較高:
(1)超大容量:在信息爆炸的趨勢下,存儲(chǔ)容量動(dòng)輒數(shù)十到數(shù)百G,甚至到Tbit級(jí)別,需要足夠大的網(wǎng)絡(luò)帶寬進(jìn)行傳送。
(2)高擴(kuò)展性:隨著企業(yè)數(shù)據(jù)業(yè)務(wù)量的迅速增加,存儲(chǔ)容量每年都要高速擴(kuò)展;
(3)高實(shí)時(shí)性:實(shí)時(shí)性是數(shù)據(jù)存儲(chǔ)業(yè)務(wù)的一個(gè)基本要求,舉一個(gè)我們?nèi)粘I钪械睦泳涂梢悦靼走@一點(diǎn):我們到銀行存錢的時(shí)候,都希望這筆錢能夠?qū)崟r(shí)到賬,稍有滯后我們都會(huì)無法容忍;
(4)高可靠性:對(duì)企業(yè)來說,關(guān)鍵業(yè)務(wù)數(shù)據(jù)的丟失是難以容忍的;
(5)接口多樣性:雖然目前主流的接口類型是FC(Fiber Channel),但數(shù)據(jù)存儲(chǔ)網(wǎng)絡(luò)依然存在多種協(xié)議共存的情況,導(dǎo)致網(wǎng)絡(luò)存在多種類型的接口,包括ESCON、FICON、IP等,甚至還有ATM、SDH接口類型。另外,現(xiàn)在各主流存儲(chǔ)廠商如IBM、EMC、Hitachi、HP等,提供的接口也不完全兼容。這些情況導(dǎo)致了數(shù)據(jù)存儲(chǔ)業(yè)務(wù)接口類型不統(tǒng)一、多種接口并存的狀況。
災(zāi)難類型不同,應(yīng)對(duì)的策略也不盡相同。對(duì)于機(jī)房內(nèi)事件,可以在本地?cái)?shù)據(jù)中心完成災(zāi)難恢復(fù);對(duì)于建筑物災(zāi)難,需要通過同城災(zāi)備中心完成災(zāi)難恢復(fù);而對(duì)于區(qū)域性災(zāi)難,則需要通過異地災(zāi)備系統(tǒng),對(duì)業(yè)務(wù)運(yùn)營進(jìn)行保障。比較典型的方式比如華為的“兩地三中心”方案,即設(shè)立主數(shù)據(jù)中心、同城災(zāi)備中心和異地災(zāi)備中心。
本地?cái)?shù)據(jù)中心通過雙機(jī)熱備、本地備份、CDP這些在線/近線的數(shù)據(jù)保護(hù)手段完成機(jī)房內(nèi)事件的災(zāi)備。
同城災(zāi)備中心方案顧名思義是指在同一個(gè)城市中部署的災(zāi)備中心,能實(shí)現(xiàn)數(shù)據(jù)的同城實(shí)時(shí)備份和業(yè)務(wù)的實(shí)時(shí)倒換,保證業(yè)務(wù)的連續(xù)性。同城實(shí)時(shí)備份可保證主數(shù)據(jù)中心和災(zāi)備中心的數(shù)據(jù)完全一致,達(dá)到最高的數(shù)據(jù)保護(hù)級(jí)別,尤其適合于核心和關(guān)鍵業(yè)務(wù),如要求RPO/RTO接近于零的應(yīng)用。因此,同城災(zāi)備對(duì)網(wǎng)絡(luò)的性能和穩(wěn)定性要求較高,如高帶寬和低延時(shí),目前主流的傳送網(wǎng)技術(shù)是DWDM技術(shù)。
首先,DWDM具有超大的帶寬及較強(qiáng)的擴(kuò)展能力,特別適合數(shù)據(jù)存儲(chǔ)業(yè)務(wù)帶寬需求巨大、后續(xù)帶寬擴(kuò)展頻繁的應(yīng)用場景。DWDM是一個(gè)多波長的傳送系統(tǒng),傳送帶寬巨大,并可靈活擴(kuò)展。目前,業(yè)界主流的DWDM系統(tǒng)是40/80波。如果每個(gè)波長傳送10G的帶寬,那么80個(gè)波長可傳送的帶寬將達(dá)到800G;如果每個(gè)波長傳送40G的帶寬,那么80個(gè)波長可傳送的帶寬將達(dá)到3.2T;如果每個(gè)波長傳送100G的帶寬,那么單根光纖將可實(shí)現(xiàn)8T的海量傳送帶寬。
DWDM可以根據(jù)帶寬需求的增長靈活地增加波長數(shù)。比如,目前有80G的存儲(chǔ)數(shù)據(jù)要從生產(chǎn)中心傳送到備份中心,那么DWDM系統(tǒng)只需要采用8個(gè)波長;如果后續(xù)又有40G的數(shù)據(jù)需要備份傳送,則只需在DWDM系統(tǒng)上再增加4個(gè)波長,從DWDM設(shè)備角度來說,只需增加4塊板卡即可。
其次,DWDM作為一種成熟的技術(shù)形態(tài),在網(wǎng)絡(luò)安全、可靠性方面已非常完備。DWDM不但具有光線路層面的保護(hù)措施,而且具有業(yè)務(wù)接入層面的完善保護(hù)措施,完全可以滿足數(shù)據(jù)存儲(chǔ)業(yè)務(wù)的災(zāi)備網(wǎng)絡(luò)在高安全性、高可靠性等方面的要求。
第三,經(jīng)過多年的發(fā)展,DWDM已能支持當(dāng)前所有主流的存儲(chǔ)業(yè)務(wù)接口。只要DWDM設(shè)備廠商與主流存儲(chǔ)設(shè)備廠商做過對(duì)接認(rèn)證測試,DWDM系統(tǒng)將能滿足數(shù)據(jù)災(zāi)備系統(tǒng)對(duì)接口多樣化的需求,華為是目前為止通過與主流存儲(chǔ)及服務(wù)器廠商認(rèn)證測試最多的光傳輸廠商。
異地災(zāi)備中心方案是把數(shù)據(jù)備份到相對(duì)較遠(yuǎn)的城市,跨越地質(zhì)災(zāi)害半徑,能消除地震等地質(zhì)災(zāi)害對(duì)業(yè)務(wù)數(shù)據(jù)的破壞,可采用MSTP、WDM等技術(shù)構(gòu)建異地災(zāi)備系統(tǒng)。
MSTP作為一種成熟的傳輸技術(shù),支持幾乎所有的以太網(wǎng)和存儲(chǔ)業(yè)務(wù)接口類型,完全可以滿足災(zāi)備系統(tǒng)接口多樣性的需求。
MSTP在網(wǎng)絡(luò)可靠性方面已非常成熟。異地災(zāi)備系統(tǒng)采用兩套設(shè)備和主備路由保護(hù)等物理隔離方式,可以實(shí)現(xiàn)業(yè)務(wù)網(wǎng)絡(luò)、核心單板“雙重”保護(hù),確保異地災(zāi)備網(wǎng)絡(luò)的私有性和安全性。
目前,業(yè)界主流MSTP廠商比如華為等都支持線路側(cè)采用彩光模塊,可以跟WDM設(shè)備直接連接,減少故障點(diǎn),進(jìn)一步提高網(wǎng)絡(luò)可靠性。
5 結(jié)束語
信息數(shù)據(jù)對(duì)企業(yè)發(fā)展至關(guān)重要,災(zāi)備系統(tǒng)建設(shè)是企業(yè)信息化的一個(gè)必要進(jìn)程。隨著技術(shù)的不斷發(fā)展和相應(yīng)法律的不斷完善,全球范圍內(nèi)將會(huì)掀起數(shù)據(jù)災(zāi)備傳送網(wǎng)絡(luò)的建設(shè)熱潮。