宋文功, 蔣新華
(中南大學(xué)信息中心,長沙 410083)
隨著高等院校的應(yīng)用不斷發(fā)展,其數(shù)據(jù)中心可能是個私有云架構(gòu),整個學(xué)校信息化建設(shè)對數(shù)據(jù)保護和系統(tǒng)可用性有更高的需求,建設(shè)一套高性能、高安全性、可靠性、可擴展性、可管理性的數(shù)據(jù)保護系統(tǒng)成為了高校數(shù)據(jù)中心及其重要應(yīng)用信息化建設(shè)的當務(wù)之急.
數(shù)據(jù)級容災(zāi)系統(tǒng)只保證數(shù)據(jù)的完整性、可靠性和安全性[1].衡量容災(zāi)系統(tǒng)的技術(shù)指標主要有兩個:RPO(恢復(fù)點目標)和RTO(恢復(fù)時間目標),RPO表示災(zāi)難發(fā)生時允許丟失的數(shù)據(jù)量,RTO表示系統(tǒng)的恢復(fù)時間[2].也就是對RPO有要求,對RTO基本不要求.對于數(shù)據(jù)級的應(yīng)用容災(zāi)技術(shù)主要是備份.對于有遠距離校區(qū)的高校,由于要將數(shù)據(jù)備份到遠距離的容災(zāi)中心,中間的鏈路帶寬一般是低帶寬的,當數(shù)據(jù)量較大時,要求傳輸?shù)臄?shù)據(jù)量要少.現(xiàn)在成熟的新的備份技術(shù)是重復(fù)數(shù)據(jù)刪除[3]技術(shù).該技術(shù)可以用較小的鏈路帶寬來完成遠程備份.
應(yīng)用級容災(zāi)[1]系統(tǒng)能夠提供不間斷的應(yīng)用服務(wù),讓服務(wù)請求能夠透明地繼續(xù)運行,保證數(shù)據(jù)中心提供的服務(wù)完整、可靠、安全.對于學(xué)校中的一些重要應(yīng)用,如校園網(wǎng)主頁,不僅對RPO有要求,而且還對RTO有較高要求.這樣,只做數(shù)據(jù)級備份,已經(jīng)無法滿足生產(chǎn)的要求.對于這些應(yīng)用,要做應(yīng)用級容災(zāi).應(yīng)用級容災(zāi)包含有同城容災(zāi)和異地容災(zāi)兩種.
當有的學(xué)校應(yīng)用對學(xué)校工作影響非常大,要求RPO和RTO都為零時,如校園一卡通應(yīng)用,生產(chǎn)中心和容災(zāi)中心的雙活[4]情況就應(yīng)運而生.
雙活是指生產(chǎn)中心和災(zāi)備中心之間并沒有明確的主備之分,每個中心都有生產(chǎn)、互為災(zāi)備的任務(wù).其具備以下4大優(yōu)勢.
一是實現(xiàn)最高級別的可用性.雙活中心[4]可以實現(xiàn)數(shù)據(jù)零丟失、實時切換.
二是提高設(shè)備利用率.雙活中心不再設(shè)置專用的災(zāi)備資源,不同中心的資源同時承擔生產(chǎn)和災(zāi)備.
三是保障運維資源的災(zāi)備接管能力.由于日常雙活中心的運維資源都在進行工作,當一個中心發(fā)生災(zāi)難時,其他中心所有的流程、職責、設(shè)備資源、系統(tǒng)資源都不需做大的改動即可接管,只是運維工作量有所增加.
四是雙活中心的技術(shù)要求高.傳統(tǒng)模式一般只做數(shù)據(jù)層面的同步、異步復(fù)制,在其他技術(shù)層面不需要互聯(lián)太多,而雙活中心要求在信息系統(tǒng)的各個層面都要緊密互聯(lián)、互動.還要求雙中心間的鏈路帶寬有充分保障.
實現(xiàn)數(shù)據(jù)級容災(zāi)[5]的主要技術(shù)有虛擬帶庫和重復(fù)數(shù)據(jù)刪除;虛擬帶庫是磁盤陣列硬件設(shè)備,但是在軟件功能上卻模擬磁帶備份的形式.虛擬磁帶庫主要有以下幾點優(yōu)勢.
(1)相對于機械磁帶,虛擬磁帶庫使用了兼容磁帶備份管理軟件以及傳統(tǒng)備份流程,這使得設(shè)備的可用性以及備份的可靠性得到了大幅提升;
(2)性能大幅提高,可支持接近磁盤陣列極限速度的備份以及恢復(fù)速度.而且免疫病毒,數(shù)據(jù)安全性等同普通磁帶庫;
(3)恢復(fù)工作極為簡便,如果所需數(shù)據(jù)存在VTL當中,則不會涉及任何機械工作,恢復(fù)工作就像磁盤備份的速度一樣;
(4)虛擬磁帶庫采用基于RAID保護的磁盤陣列,從而將備份的可靠性較常規(guī)磁帶備份提高了若干量級.封閉式結(jié)構(gòu)的磁盤介質(zhì)本身的MTBF(平均無故障間隔)一般為開放式結(jié)構(gòu)磁帶介質(zhì)的5倍以上;
(5)兼容性好,標準的FC、SCSI或iSCSI接口設(shè)備,兼容流行的主機設(shè)備和操作系統(tǒng);
(6)實用性好,與現(xiàn)有磁帶庫應(yīng)用方式一致,不用更改現(xiàn)有存儲應(yīng)用軟件的管理策略,保護用戶投資;
(7)虛擬磁帶庫用電子化的“機械手”和“磁帶驅(qū)動器”,代替了機械磁帶庫中裸露、易損的裝置,基于RAID保護的磁盤陣列具備降級工作能力,且具自動報警和在線熱恢復(fù)能力.
從以上虛擬磁帶庫的優(yōu)勢可以看出,虛擬磁帶庫不僅解決了傳統(tǒng)磁帶庫維護負擔高、備份失效率高以及備份恢復(fù)能力不佳的問題,而且也改變了磁盤備份容易被誤刪除或被病毒感染以及不便于在SAN環(huán)境中統(tǒng)一管理和優(yōu)化使用的劣勢.
重復(fù)數(shù)據(jù)刪除一種數(shù)據(jù)縮減技術(shù),通常用于基于磁盤的備份系統(tǒng),旨在減少存儲系統(tǒng)中使用的存儲容量.它的工作方式是在某個時間周期內(nèi)查找不同文件中不同位置的重復(fù)可變大小數(shù)據(jù)塊.重復(fù)的數(shù)據(jù)塊用指示符取代.高度冗余的數(shù)據(jù)集(例如備份數(shù)據(jù))從數(shù)據(jù)重復(fù)刪除技術(shù)的獲益極大;用戶可以實現(xiàn)10∶1至50∶1的縮減比.重復(fù)數(shù)據(jù)刪除技術(shù)可以允許用戶的不同中心之間進行高效,經(jīng)濟的備份數(shù)據(jù)復(fù)制.
實現(xiàn)應(yīng)用級容災(zāi)的主要技術(shù)有集群技術(shù)[1]和CDP(持續(xù)數(shù)據(jù)保護)[1]技術(shù).對于異地容災(zāi),采用低帶寬就能實現(xiàn)的CDP技術(shù)較為普遍.在低帶寬的環(huán)境里,精簡復(fù)制技術(shù)(Microscan)將傳輸?shù)淖钚?shù)據(jù)單元縮小到512字節(jié)(一般的軟件級別技術(shù)在1個block4 096字節(jié),硬件級別技術(shù)在block16 000字節(jié)),可以在極小的帶寬傳輸較大的數(shù)據(jù)量.CDP自動連續(xù)快照技術(shù),可以快速恢復(fù)當前及歷史數(shù)據(jù).可以大大降低系統(tǒng)恢復(fù)生產(chǎn)的時間.連續(xù)I/O記錄技術(shù)可以將數(shù)據(jù)恢復(fù)到任意歷史軌跡(秒級和I/O級均可).數(shù)據(jù)一致性保證技術(shù)在指定的快照點和復(fù)制點產(chǎn)生數(shù)據(jù)庫的校驗點刷新,從而確保數(shù)據(jù)庫日志與數(shù)據(jù)文件的一致性,實現(xiàn)快速啟動數(shù)據(jù)庫的目標.這些技術(shù)可以使遠程容災(zāi)中心可以滿足的RPO和RTO做到相對小的程度.
如果要做到RPO和RTO為零,就要采用兩中心雙活的方式.實現(xiàn)生產(chǎn)中心和容災(zāi)中心雙活,要實現(xiàn)完備的雙活架構(gòu),需要在信息系統(tǒng)的各個層面進行雙活設(shè)計.我們將數(shù)據(jù)中心的信息系統(tǒng)技術(shù)架構(gòu)分為7層:訪問接入層、Web層、應(yīng)用層、數(shù)據(jù)庫層、系統(tǒng)平臺層、存儲層、網(wǎng)絡(luò)層.
為滿足雙活中心的需求,訪問接入層必須使客戶端的請求在多個中心之間進行智能選擇,實現(xiàn)業(yè)務(wù)的連續(xù)性(性能最優(yōu)/故障切換/按需連接).實現(xiàn)站點選擇通常有兩種方式:一是傳統(tǒng)站點輪詢技術(shù);二是站點負載均衡技術(shù).
Web/應(yīng)用層雙活實現(xiàn)機制主要有3種:一是基于主機集群技術(shù);二是基于中間件軟件自身集群實現(xiàn)功能;三是基于負載均衡設(shè)備方式.
數(shù)據(jù)庫層的雙活技術(shù)主要有兩種:一是數(shù)據(jù)庫集群技術(shù);二是數(shù)據(jù)庫復(fù)制技術(shù).
操作系統(tǒng)層的雙活技術(shù)已經(jīng)較為成熟,可以采用HA和集群技術(shù)進行實現(xiàn).目前虛擬機的相關(guān)技術(shù)有比較大的發(fā)展,可以充分利用新的漂移、災(zāi)備切換等技術(shù)進行操作系統(tǒng)層的雙活部署.
存儲雙活實現(xiàn)機制主要有4種:一是基于主機卷復(fù)制技術(shù);二是基于存儲虛擬化技術(shù);三是基于存儲復(fù)制技術(shù);四是基于SAN網(wǎng)絡(luò)復(fù)制技術(shù).
雙活模式下的網(wǎng)絡(luò)互聯(lián)既需要保證IP網(wǎng)絡(luò)的高可用性,又要保證能夠滿足既定雙活要求:如果大量使用虛擬化的漂移等技術(shù),需要雙活中心間網(wǎng)絡(luò)大二層互通;對于高校,不同校區(qū)間一般是同城部署光纖通道,保證數(shù)據(jù)同步;要求實現(xiàn)IP網(wǎng)絡(luò)高速互通,保證不同數(shù)據(jù)中心間的雙活和數(shù)據(jù)復(fù)制.以下是某高校擬建的雙活數(shù)據(jù)中心的拓撲圖:
圖1 雙活數(shù)據(jù)中心容災(zāi)系統(tǒng)拓撲圖
高校數(shù)據(jù)中心容災(zāi)技術(shù)的采納,是一個需要經(jīng)過數(shù)據(jù)保護效果,和實現(xiàn)該效果的經(jīng)濟代價之間平衡的考量.當應(yīng)用需要有不間斷工作的要求時,雙活中心是考慮的重點;當有一定的RPO和RTO的要求時,應(yīng)用級容災(zāi)是考慮的重點.而數(shù)據(jù)級容災(zāi)是數(shù)據(jù)高可用的最后一道防線,它只能滿足數(shù)據(jù)丟失、數(shù)據(jù)破壞時的數(shù)據(jù)恢復(fù)目的,不能提供實時的業(yè)務(wù)接管功能.選擇適合自身發(fā)展的架構(gòu)和技術(shù)需要根據(jù)實際情況進行全面分析.此外,建設(shè)容災(zāi)數(shù)據(jù)中心,技術(shù)僅僅是其中的一個方面,在服務(wù)、管理、流程、人才培養(yǎng)等方面都需要做大量的研究和部署工作;另外一個重要方面是應(yīng)用改造,存在的困難較多,也給研究者和建設(shè)者帶來諸多挑戰(zhàn).
[1] 李春晟.數(shù)據(jù)中心災(zāi)備系統(tǒng)的分類[J].智能建筑與城市信息,2010(11):31-33.
[2] 王德軍,王麗娜.容災(zāi)系統(tǒng)研究[J].計算機工程,2005,31(6):43-45,113.
[3] 楊天明.網(wǎng)絡(luò)備份中重復(fù)數(shù)據(jù)刪除技術(shù)研究[J].華中科技大學(xué)學(xué)報,2011(7):47-49.
[4] 肖良華.云數(shù)據(jù)中心雙活技術(shù)淺析[J].金融電子化,2012(2):59-61.
[5] 黃大川.數(shù)據(jù)中心容災(zāi)架構(gòu)的兩種新方案[J].中國金融電腦,2013(10):88-88.