郭 鋰,蒙慶全,葉惠文
(華南師范大學(xué) 教育信息技術(shù)中心,廣東 廣州510631)
在社會信息化日益深入,知識增長迅速的今天,各種網(wǎng)絡(luò)教學(xué)平臺和數(shù)字化教學(xué)資源在高校教學(xué)活動(dòng)中的參與程度越來越高,各高校對教學(xué)資源建設(shè)的投入也越來越大。學(xué)校里的數(shù)據(jù)資源就相當(dāng)于商業(yè)社會中的銀行資金,一旦數(shù)據(jù)資源管理系統(tǒng)出現(xiàn)故障或?qū)W習(xí)資源被破壞,師生將無法進(jìn)行正常的教學(xué)和學(xué)習(xí)。隨著教育信息化程度的不斷推進(jìn),高校對于數(shù)據(jù)支撐系統(tǒng)的穩(wěn)定性和可靠性的要求隨之提高。同時(shí),在經(jīng)歷了信息化建設(shè)的10多年過程后,由于存儲技術(shù)的進(jìn)步、資金預(yù)算有限等眾多因素,各高校在數(shù)據(jù)存儲管理方面也普遍遭遇了一些問題和困惑,如:
目前高校絕大多數(shù)的應(yīng)用服務(wù)器采用直連式存儲,每增加一臺服務(wù)器就需要增加相應(yīng)的存儲,導(dǎo)致了存儲分布散、擴(kuò)容難、利用率不高、異構(gòu)化嚴(yán)重、不易管理等問題。
在不同的時(shí)期,各校都購置了各種各樣的存儲設(shè)備,其中多數(shù)設(shè)備是依賴當(dāng)時(shí)硬件系統(tǒng)和應(yīng)用系統(tǒng)理念來配置的,隨著時(shí)間推移應(yīng)用系統(tǒng)升級,存儲設(shè)備的性能和容量不再滿足要求,存儲設(shè)備的動(dòng)態(tài)擴(kuò)展和兼容問題以及提高舊硬件設(shè)備的再利用率的問題也隨之出現(xiàn)。
隨著各高校教學(xué)資源數(shù)據(jù)量的與日俱增,由于人為誤操作、硬件故障、系統(tǒng)錯(cuò)誤、不可抗災(zāi)難等因素引發(fā)的數(shù)據(jù)損壞丟失問題也給管理人員愈加帶來困擾,災(zāi)難備份與數(shù)據(jù)保護(hù)成為管理工作面臨的困難之一。
面對這些各高校普遍存在的代表性問題,華南師范大學(xué)在分析高校數(shù)據(jù)存儲管理新需求的基礎(chǔ)上,結(jié)合虛擬存儲和CDP等新技術(shù),構(gòu)建了一套存儲虛擬化應(yīng)用方案,實(shí)現(xiàn)了對存儲資源進(jìn)行統(tǒng)一管理和按需分配,提高了資源利用率和系統(tǒng)穩(wěn)定性,降低了系統(tǒng)的投入和維護(hù)的成本。
存儲虛擬化這個(gè)名詞正越來越受到大家的關(guān)注,其相關(guān)技術(shù)作為一種適應(yīng)當(dāng)前社會數(shù)據(jù)爆炸性增長速度并緩解企業(yè)數(shù)據(jù)管理壓力的高端解決方案,已經(jīng)為許多大型公司企業(yè)所普遍采用。隨著技術(shù)和產(chǎn)品的成熟發(fā)展,尤其是產(chǎn)品性價(jià)比的不斷提升,存儲虛擬化技術(shù)在教育行業(yè)中的應(yīng)用也變得不再遙不可及。
虛擬存儲的概念可以理解為:通過一定的技術(shù)方法將所有存儲設(shè)備集中在一個(gè)存儲池(Storage Pool)中進(jìn)行統(tǒng)一管理,并可根據(jù)服務(wù)器的需要分配存儲空間,對服務(wù)器而言就好像一個(gè)超大容量的虛擬磁盤。這種可以將多種不同的存儲物理媒介和存儲子系統(tǒng)整合起來,為使用者提供大容量、高數(shù)據(jù)傳輸性能的存儲系統(tǒng),就稱之為虛擬存儲。[1]當(dāng)前虛擬存儲的實(shí)現(xiàn)方式主要分為以下三種。
(1)基于服務(wù)器端
此種方式主要是在服務(wù)器平臺上安裝管理軟件,通過服務(wù)器端將鏡像映射到外圍存儲設(shè)備上,除了分配數(shù)據(jù)外,對外圍存儲設(shè)備沒有任何控制。由于控制軟件是運(yùn)行在主機(jī)上,占用主機(jī)的處理時(shí)間,服務(wù)器端常常產(chǎn)生性能瓶頸問題。[2]
(2)基于存儲子系統(tǒng)端
此種方式中實(shí)施虛擬的位置在于存儲設(shè)備本身。在存儲子系統(tǒng)端的虛擬存儲設(shè)備主要通過大規(guī)模的RAID子系統(tǒng)和多個(gè)I/O通道連接到服務(wù)器上,智能控制器提供LUN訪問控制、緩存和其他如數(shù)據(jù)復(fù)制等的管理功能,此技術(shù)多被傳統(tǒng)儲存設(shè)備廠商采用。
(3)基于網(wǎng)絡(luò)設(shè)備端
此種方式是通過網(wǎng)絡(luò)設(shè)備端實(shí)施虛擬存儲,將邏輯鏡像映射到外圍存儲設(shè)備,除了分配數(shù)據(jù)外,對外圍存儲設(shè)備沒有任何控制。其優(yōu)勢在于,其實(shí)施介于服務(wù)器和存儲設(shè)備兩個(gè)環(huán)境之間,可能是最“開放”的虛擬實(shí)施環(huán)境,最有可能支持任何的服務(wù)器、操作系統(tǒng)、應(yīng)用和存儲設(shè)備。
華南師范大學(xué)虛擬存儲解決方案中采用上述第三種方式(基于網(wǎng)絡(luò)設(shè)備端的虛擬存儲),主要考慮到其便于支持眾多不同類型的服務(wù)器、操作系統(tǒng)、應(yīng)用和存儲設(shè)備,擴(kuò)展性和兼容性較強(qiáng),且價(jià)格成本相對較低。存儲虛擬化軟件在設(shè)備上創(chuàng)建一個(gè)邏輯空間,在物理磁盤空間和邏輯磁盤空間之間建立映射關(guān)系的方式來管理源數(shù)據(jù),存儲硬件的增減、調(diào)換、分拆、合并對服務(wù)器層完全透明。采用這種開發(fā)式存儲架構(gòu)優(yōu)勢在于:支持常規(guī)的標(biāo)準(zhǔn)存儲協(xié)議,實(shí)現(xiàn)強(qiáng)兼容,同時(shí)可提供二次開發(fā)API接口列表,有利于實(shí)現(xiàn)與教學(xué)輔助平臺的無縫鏈接,以最高的效率、最低的成本來滿足各類不同應(yīng)用在性能和容量等方面的需求。
CDP(Continuous Data Protection,CDP)連續(xù)數(shù)據(jù)保護(hù)是當(dāng)前數(shù)據(jù)備份領(lǐng)域內(nèi)的一項(xiàng)新技術(shù),它能夠持續(xù)實(shí)時(shí)地跟蹤捕獲數(shù)據(jù)變化,并記錄到專用的存儲設(shè)備或通過網(wǎng)絡(luò)發(fā)送到專用服務(wù)器上;在故障發(fā)生時(shí),能夠?qū)⒈槐Wo(hù)的數(shù)據(jù)狀態(tài)恢復(fù)到任意時(shí)間點(diǎn)。[3]數(shù)據(jù)保護(hù)系統(tǒng)可以基于塊、文件或應(yīng)用實(shí)現(xiàn),可以為恢復(fù)對象提供足夠細(xì)的恢復(fù)粒度,將容災(zāi)指標(biāo)數(shù)據(jù)恢復(fù)點(diǎn)目標(biāo)(Recovery Point Objective,RPO)和恢復(fù)時(shí)間目標(biāo) (Recovery Time Objective,RTO)提高到一個(gè)新的臺階[4]。
華南師范大學(xué)作為教育信息化建設(shè)起步較早的“211”師范類教學(xué)科研型大學(xué),學(xué)科涉及門類眾多,多年來陸續(xù)建設(shè)有大量的精品課程、視頻資源、學(xué)習(xí)平臺、各類應(yīng)用和管理系統(tǒng),其數(shù)據(jù)存儲管理的需求在國內(nèi)高校中具備一定的代表性,可歸納總結(jié)如下。
(1)當(dāng)增加一個(gè)應(yīng)用模塊時(shí),通過系統(tǒng)能自動(dòng)或手動(dòng)虛擬一個(gè)與應(yīng)用的虛擬服務(wù)器對應(yīng)的虛擬磁盤。當(dāng)減少一個(gè)應(yīng)用模塊時(shí),系統(tǒng)能自動(dòng)或手動(dòng)刪去相應(yīng)的所虛擬的磁盤。
(2)實(shí)現(xiàn)將各種的存儲器陣列集成一個(gè)虛擬存儲器池,在物理上視為一個(gè)磁盤。根據(jù)應(yīng)用模塊隨時(shí)劃出一個(gè)存儲空間與應(yīng)用虛擬服務(wù)器對應(yīng),完成數(shù)據(jù)的存儲管理。
(3)實(shí)現(xiàn)存儲增刪的動(dòng)態(tài)管理,即,當(dāng)應(yīng)用發(fā)展的需要發(fā)現(xiàn)存儲陣列中容量不足時(shí),可隨之增加虛擬磁盤容量。
(4)具有對多種不同廠家和型號的存儲陣列的管理功能。
(5)支持應(yīng)用模塊的各種數(shù)據(jù)需求(數(shù)據(jù)類型、容量、運(yùn)行系統(tǒng)等),能夠自動(dòng)或手動(dòng)生成多個(gè)虛擬存儲空間的鏈接表,供用戶選擇合適的對應(yīng)數(shù)據(jù)存儲服務(wù)。
(6)能夠建立各種存儲陣列的參數(shù)與信息詞典,清晰描述出各個(gè)存儲器的基本參數(shù)。
(7)能夠?qū)崿F(xiàn)存儲空間預(yù)警功能。
為解決上述需求,經(jīng)過多次研究和討論,通過各種測試和實(shí)驗(yàn),華南師范大學(xué)構(gòu)建了一套存儲虛擬化應(yīng)用解決方案,本方案的目的是實(shí)現(xiàn)資源的有效利用,通過將新舊資源的重新整合,實(shí)現(xiàn)對海量教學(xué)資源及眾多的應(yīng)用系統(tǒng)進(jìn)行有效的支撐,并且根據(jù)應(yīng)用系統(tǒng)的需求動(dòng)態(tài)分配存儲資源。本方案中虛擬存儲支撐平臺的結(jié)構(gòu)如圖1所示。
圖1 虛擬存儲支撐平臺架構(gòu)示意
本方案主要采用信核數(shù)據(jù)三種 “存儲引擎、SAN引擎、虛擬化引擎”的技術(shù)實(shí)現(xiàn)。信核數(shù)據(jù)設(shè)備采用OSN(Open Storage Network)開放式存儲平臺技術(shù),通過標(biāo)準(zhǔn)的FC/IP/SAS/Infiniband等協(xié)議管理存儲設(shè)備,從而獲取存儲中的卷組信息。
(1)實(shí)現(xiàn)異構(gòu)存儲虛擬化
1)構(gòu)造虛擬系統(tǒng)平臺,支持多品牌存儲設(shè)備整合
本方案中采用的OSN(Open Storage Network)開放式存儲平臺技術(shù)能夠構(gòu)建網(wǎng)絡(luò)存儲虛擬化平臺、統(tǒng)一管理異構(gòu)設(shè)備和各種數(shù)據(jù)、整合不同類型的存儲資源,如ATDX、IBM、Dell等公司的存儲設(shè)備,其異構(gòu)結(jié)構(gòu)如圖2所示。
圖2 多品牌整合結(jié)構(gòu)
2)虛擬系統(tǒng)對多品牌組成的存儲池管理方法
虛擬存儲管理解決方案將應(yīng)用服務(wù)器與后端存儲進(jìn)行透明的分離,通過集成 CDP、SnapShot、DR、HA 等多項(xiàng)增值保護(hù)功能,建立完整的數(shù)據(jù)保護(hù)體系,以經(jīng)濟(jì)高效的方式將數(shù)據(jù)損失風(fēng)險(xiǎn)降至最低,保證在發(fā)生任意單點(diǎn)故障的情況下,業(yè)務(wù)能夠保持7×24小時(shí)的連續(xù)運(yùn)行。
(2)實(shí)現(xiàn)存儲虛擬化與前端主機(jī)虛擬化的融合
前端主機(jī)采用了Red Hat KVM主機(jī)虛擬化軟件,每個(gè)虛擬機(jī)的文件系統(tǒng)都創(chuàng)建在虛擬化存儲系統(tǒng)上。服務(wù)器平臺上運(yùn)行Red Hat GFS高性能的群集文件系統(tǒng),允許多個(gè)物理服務(wù)器安裝同時(shí)訪問同一虛擬機(jī)存儲,實(shí)現(xiàn)安裝數(shù)據(jù)庫文件、系統(tǒng)數(shù)據(jù)等。這樣建立起來的系統(tǒng),實(shí)現(xiàn)了服務(wù)器和存儲系統(tǒng)的無縫融合。
(3)數(shù)據(jù)遷移
在不改變原有數(shù)據(jù)的前提下,將數(shù)據(jù)從現(xiàn)有的存儲平滑遷移至其他存儲陣列上,對前端的業(yè)務(wù)等應(yīng)用沒有影響。
(4)虛擬存儲的動(dòng)態(tài)負(fù)載均衡
本方案中,在網(wǎng)絡(luò)層通過Block塊的技術(shù)去實(shí)現(xiàn)數(shù)據(jù)的同步寫入,不依賴主機(jī)和存儲系統(tǒng),實(shí)現(xiàn)靈活的架構(gòu)配置和管理??稍诓挥绊懍F(xiàn)有應(yīng)用的情況下,透明實(shí)現(xiàn)存儲集群,實(shí)現(xiàn)了以下幾點(diǎn):
1)支持FC SAN+IP SAN綜合網(wǎng)絡(luò)存儲架構(gòu),實(shí)現(xiàn)統(tǒng)一存儲和應(yīng)用混合使用。
2)支持 Standard、MPIO 和 Cluster,支持 Active/Active和Active/StandBy模式。
3)實(shí)現(xiàn)基于FC和IP的數(shù)據(jù)同步,對業(yè)務(wù)網(wǎng)絡(luò)不造成負(fù)擔(dān)壓力。
4)提供Cache能力,加速提升了存儲IO能力。
5)實(shí)現(xiàn)存儲故障自動(dòng)切換和存儲修復(fù)自動(dòng)切換,可提供99.99%的可用性,支持業(yè)務(wù)持續(xù)應(yīng)用。
6)提供現(xiàn)有存儲自動(dòng)遷移服務(wù),最大限度地減少業(yè)務(wù)宕機(jī)時(shí)間。
(5)CDP在線系統(tǒng)級實(shí)時(shí)保護(hù)和恢復(fù)系統(tǒng)
本方案中的CDP模塊利用數(shù)據(jù)鏡像和數(shù)據(jù)復(fù)制(同步或異步)策略,實(shí)現(xiàn)將待備服務(wù)器的待備數(shù)據(jù)納入CDP平臺的保護(hù)體系,以確保數(shù)據(jù)發(fā)生錯(cuò)誤時(shí),數(shù)據(jù)恢復(fù)到最新的時(shí)間點(diǎn)。同時(shí),采用配合數(shù)據(jù)復(fù)制卷的時(shí)間點(diǎn)快照技術(shù)(快照流),通過時(shí)間指針的方式,按增量快照的方式記錄下數(shù)據(jù)復(fù)制卷的變化,每一個(gè)快照對應(yīng)一個(gè)時(shí)間點(diǎn),記住了數(shù)據(jù)多個(gè)時(shí)刻的歷史變化過程,產(chǎn)生多個(gè)基于時(shí)間點(diǎn)數(shù)據(jù)影像 (自動(dòng)情況下精確到每十分鐘,手動(dòng)情況下精確到秒級)。這些數(shù)據(jù)影像不僅時(shí)間點(diǎn)細(xì)致精確,而且通過快照的回滾操作還可以直接使用,用戶經(jīng)過簡單的設(shè)置就可以對快照數(shù)據(jù)進(jìn)行操作,解決誤刪除、誤操作、病毒破壞等造成的數(shù)據(jù)丟失。
華南師范大學(xué)的存儲虛擬化應(yīng)用方案,經(jīng)過一年多的論證、建設(shè)和測試,實(shí)現(xiàn)了高穩(wěn)定性、易維護(hù)性、高效低成本的建設(shè)目標(biāo)。方案在利用現(xiàn)有的主機(jī)和存儲系統(tǒng)等硬件環(huán)境下,實(shí)現(xiàn)了存儲數(shù)據(jù)整合;有效的利用了閑置的、不同接口的存儲設(shè)備;提高了存儲的利用率;同時(shí)也優(yōu)化了原存儲的性能。系統(tǒng)中配置的CDP在線保護(hù)模塊確保了整合后數(shù)據(jù)的安全性和教學(xué)平臺的連續(xù)性,避免了各種不可測因素造成的數(shù)據(jù)丟失,實(shí)現(xiàn)數(shù)分鐘立即恢復(fù)教學(xué)應(yīng)用的保障效果。
目前,在新建成的虛擬存儲系統(tǒng)支持下運(yùn)行了如下7個(gè)應(yīng)用系統(tǒng):“課程中心”網(wǎng)絡(luò)資源學(xué)習(xí)平臺、移動(dòng)學(xué)習(xí)平臺、精品課程點(diǎn)播平臺、教育信息技術(shù)中心網(wǎng)站、機(jī)房管理中心、直播系統(tǒng)平臺、教學(xué)主樓教學(xué)觀摩系統(tǒng)目錄服務(wù)器,所有系統(tǒng)應(yīng)用存儲合計(jì)占用20T空間,運(yùn)行穩(wěn)定良好,具體列表1所示。[5]
系統(tǒng)經(jīng)過一年的反復(fù)實(shí)驗(yàn),證實(shí)其安全、易操作,能夠較好地緩解學(xué)校目前數(shù)據(jù)存儲和管理的壓力,并可以靈活適應(yīng)將來的擴(kuò)展需求。與舊有存儲結(jié)構(gòu)相比,其優(yōu)勢主要體現(xiàn)在以下幾點(diǎn):
(1)可以集中管理分散的不同品牌的存儲設(shè)備,可以提高存儲空間的利用率。
(2)可以通過一個(gè)統(tǒng)一的存儲管理界面平臺或界面,來管理現(xiàn)有的存儲設(shè)備。
表1 虛擬存儲系統(tǒng)支持的應(yīng)用平臺
(3)可以隨需擴(kuò)展不同的異構(gòu)存儲品牌,同時(shí)通過TVM功能遷移將原來存儲上的數(shù)據(jù),通過底層技術(shù)遷移到新的存儲上。
(4)可以實(shí)現(xiàn)在異構(gòu)的不同存儲系統(tǒng)之間進(jìn)行數(shù)據(jù)容災(zāi)或復(fù)制。
(5)可以按不同的存儲性能分層存儲,例如根據(jù)磁盤品種(SSD/FC/SAS/SATA)進(jìn)行分類。[l4]
(6)可以實(shí)現(xiàn)存儲容量的靈活分配,可以超出物理磁盤空間,隨需擴(kuò)容。
(7)使用OSN PA功能后,可以提高低端存儲系統(tǒng)的性能。
在高校教學(xué)支撐平臺中采用存儲虛擬等相關(guān)技術(shù),是解決當(dāng)前教育數(shù)據(jù)海量增長的一條新思路。華南師范大學(xué)在大數(shù)據(jù)量、多應(yīng)用、多品牌的存儲系統(tǒng)環(huán)境下探索出的基于網(wǎng)絡(luò)設(shè)備端的存儲虛擬化應(yīng)用方案,實(shí)現(xiàn)了對舊有資源的高效整合,解決了數(shù)據(jù)管理工作中的問題,為高校及教育科研單位的存儲設(shè)備的有效使用和管理找到了一條新路徑,我們將在后續(xù)的工作中繼續(xù)總結(jié)經(jīng)驗(yàn),向讀者提供更具有借鑒價(jià)值的實(shí)踐指導(dǎo)。
[1]任永堅(jiān).存儲管理和數(shù)據(jù)保護(hù).[EB/OL].http://www.infocore.cn/xzzx.aspx?ref=3.2010.6[l5]
[2]付云生.王開云.虛擬存儲技術(shù)的研究與比較[J].計(jì)算機(jī)科學(xué),2011(10):202-203,238.
[3]李紅艷.塊級連續(xù)數(shù)據(jù)保護(hù)系統(tǒng)元數(shù)據(jù)管理方法[J].計(jì)算機(jī)應(yīng)用,2012,32(8):2141-2145,2149.
[4]李珺晟.淺談CDP連續(xù)數(shù)據(jù)保護(hù)技術(shù)及其應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2011(6):191.
[5]張效嚴(yán).郭翠英.高校信息化多應(yīng)用虛擬支撐平臺的應(yīng)用研究[J].中國教育信息化,2012(2):93-96.