文/黎建輝 虞路清 張波 劉峰 吳章生
中科院科學(xué)數(shù)據(jù)云架構(gòu)探析
文/黎建輝 虞路清 張波 劉峰 吳章生
隨著云計算技術(shù)的發(fā)展,中科院“十二五”信息化發(fā)展規(guī)劃提出了建設(shè)科技云的總體思路,從高速網(wǎng)絡(luò)、超級計算、科學(xué)數(shù)據(jù)等方面著手,整合集成各類資源和服務(wù),形成信息化服務(wù)的云環(huán)境,以云服務(wù)模式為科研活動與科技創(chuàng)新提供應(yīng)用服務(wù)。
科學(xué)數(shù)據(jù)云是“十二五”中科院信息化建設(shè)科技云的重要組成內(nèi)容。科學(xué)數(shù)據(jù)云平臺的總體架構(gòu)如圖1所示。
科學(xué)數(shù)據(jù)云平臺總體架構(gòu)自下而上共分為三層:基礎(chǔ)設(shè)施層、平臺層和軟件服務(wù)層三個層次,并分別對應(yīng)相關(guān)的資源與服務(wù),基礎(chǔ)設(shè)施即服務(wù)(IaaS),數(shù)據(jù)即服務(wù)(DaaS)/平臺即服務(wù)(PaaS)和軟件即服務(wù)(SaaS)。
IaaS層在計算機服務(wù)器、網(wǎng)絡(luò)設(shè)備、存儲設(shè)備等硬件環(huán)境基礎(chǔ)上應(yīng)用虛擬化技術(shù)統(tǒng)一為基礎(chǔ)設(shè)施資源池,包括計算資源、網(wǎng)絡(luò)資源和存儲資源。依托這些資源,面向科研實際需求構(gòu)建云存儲服務(wù)、云災(zāi)備服務(wù)、云歸檔服務(wù)和云計算服務(wù)。
圖1 科學(xué)數(shù)據(jù)云平臺總體架構(gòu)
PaaS層是為用戶提供一整套開發(fā)、運行和運營應(yīng)用軟件的支撐平臺,科學(xué)數(shù)據(jù)云的重點是圍繞數(shù)據(jù)處理和數(shù)據(jù)資源開發(fā)數(shù)據(jù)處理與服務(wù)平臺(DaaS),例如在數(shù)據(jù)處理方面搭建了大數(shù)據(jù)處理和個性化地圖數(shù)據(jù)定制的平臺,在數(shù)據(jù)資源方面提供了科學(xué)數(shù)據(jù)庫建庫、管理、發(fā)現(xiàn)的服務(wù)平臺。
SaaS層是一種通過互聯(lián)網(wǎng)軟件提供資源的服務(wù)模式。重點面向終端用戶需求,在基礎(chǔ)設(shè)施層和平臺軟件層的基礎(chǔ)上,封裝成熟的數(shù)據(jù)服務(wù)為核心的應(yīng)用軟件平臺,如提供科學(xué)數(shù)據(jù)共享社區(qū)(DataPub)、地理空間數(shù)據(jù)云系統(tǒng)(GSCloud)等。
隨著“十二五”中科院信息化專項“科技數(shù)據(jù)資源整合與共享工程”實施和推進(jìn),目前,科學(xué)數(shù)據(jù)云存儲設(shè)施的總?cè)萘繌?010年6.42PB擴(kuò)展到當(dāng)前的43PB,科學(xué)數(shù)據(jù)庫資源支持了13個學(xué)科領(lǐng)域數(shù)據(jù)整合重點庫和7個研究所數(shù)據(jù)整合重點庫,以及20個專業(yè)數(shù)據(jù)庫,由全院65家單位參與數(shù)據(jù)整合建設(shè)與服務(wù),海量存儲設(shè)施和科學(xué)數(shù)據(jù)資源取得了重大進(jìn)展,為推動科學(xué)數(shù)據(jù)云服務(wù)奠定了重要的基礎(chǔ)。
面向全院科研活動需求,科學(xué)數(shù)據(jù)存儲基礎(chǔ)設(shè)施分布在中國科學(xué)院12個分院,形成統(tǒng)一管理、統(tǒng)一服務(wù)的海量數(shù)據(jù)存儲與容災(zāi)備份的云服務(wù)環(huán)境,面向全院提供科學(xué)數(shù)據(jù)中心基礎(chǔ)設(shè)施服務(wù)。
目前,科學(xué)數(shù)據(jù)云的基礎(chǔ)設(shè)施環(huán)境建成總?cè)萘?3PB,具體包括存儲環(huán)境12PB,歸檔環(huán)境(磁帶庫)30PB,災(zāi)備環(huán)境1PB。形成了布局12個分院、服務(wù)輻射全國的中科院分布式海量存儲環(huán)境系統(tǒng)架構(gòu),構(gòu)建了包括北京、長春、南京、昆明和東莞5個災(zāi)備中心的數(shù)據(jù)災(zāi)備服務(wù)網(wǎng)絡(luò)。
分布式海量存儲環(huán)境由上海、廣州、蘭州、合肥、昆明、新疆、成都、武漢、長春、南京、無錫和西安12個存儲分中心構(gòu)成,各個存儲分中心和北京總中心之間通過高速CNGI寬帶互聯(lián),提供統(tǒng)一的云存儲服務(wù),為海量數(shù)據(jù)的存儲備份、長期保存和數(shù)據(jù)密集型處理等需求提供支撐。數(shù)據(jù)災(zāi)備環(huán)境可提供達(dá)到國標(biāo)5級“同城兩中心”及“多地多中心”高等級共享災(zāi)備服務(wù)。此外,中關(guān)村機房部署了100臺服務(wù)器,全部用于云計算服務(wù)。
圖2 云存儲服務(wù)系統(tǒng)框架
中關(guān)村存儲總中心是整個海量數(shù)據(jù)環(huán)境的中心、數(shù)據(jù)備份中心和管理中心。北京懷柔數(shù)據(jù)備份中心是總歸檔備份中心,主要為數(shù)據(jù)異地備份提供安全保障。
依托海量存儲環(huán)境研發(fā)了云存儲服務(wù)系統(tǒng)。云存儲系統(tǒng)架構(gòu)包括北京中關(guān)村存儲總中心、懷柔數(shù)據(jù)備份中心和12個區(qū)域存儲分中心,各區(qū)域存儲節(jié)點通過1Gbit/s高速科技網(wǎng)絡(luò)互聯(lián),面向全院提供統(tǒng)一存儲備份服務(wù)。
云存儲服務(wù)在對存儲資源虛擬化管理基礎(chǔ)上,形成統(tǒng)一的存儲資源池,實現(xiàn)用戶1分鐘內(nèi)自助啟用存儲備份。云歸檔服務(wù)支持用戶遠(yuǎn)程數(shù)據(jù)歸檔和自主管理,將專業(yè)數(shù)據(jù)庫應(yīng)用開發(fā)轉(zhuǎn)變成按需配置的在線服務(wù),實現(xiàn)用戶1小時內(nèi)自助云端建庫和數(shù)據(jù)管理。云處理服務(wù)依托分布式海量存儲設(shè)施和處理節(jié)點,構(gòu)建數(shù)據(jù)密集型處理環(huán)境和可視化分析平臺,為高通量、高性能數(shù)據(jù)處理提供自適應(yīng)、可擴(kuò)展的處理資源適配和調(diào)度。數(shù)據(jù)云服務(wù)針對可共享的數(shù)據(jù)資源和匯集歸檔并到期釋放的數(shù)據(jù)資源,建立統(tǒng)一的科學(xué)數(shù)據(jù)發(fā)布與引用系統(tǒng)、科學(xué)數(shù)據(jù)管理與服務(wù)運行監(jiān)控環(huán)境,提供用戶穩(wěn)定的數(shù)據(jù)集成檢索、數(shù)據(jù)成果發(fā)布等服務(wù)。
在存儲資源虛擬化技術(shù)基礎(chǔ)上,云存儲將分布于12個分院的存儲節(jié)點的大量存儲設(shè)備通過分布式文件系統(tǒng)集合起來協(xié)同工作,形成統(tǒng)一的存儲資源池,實現(xiàn)用戶自助使用存儲服務(wù)。同時使用應(yīng)用軟件進(jìn)行業(yè)務(wù)管理,并通過標(biāo)準(zhǔn)的Web Service應(yīng)用接口,支持科研應(yīng)用在線數(shù)據(jù)存儲和業(yè)務(wù)訪問(如圖2所示)。
為此,科學(xué)數(shù)據(jù)云在各個分中心部署云存儲相關(guān)軟件,包括分布式存儲系統(tǒng)、應(yīng)用服務(wù)器集群、網(wǎng)絡(luò)和安全支撐平臺、云存儲業(yè)務(wù)服務(wù)與監(jiān)控運維管理平臺等,同時各軟件還支持IPv6協(xié)議。
分布式存儲系統(tǒng):分布式存儲系統(tǒng)作為云存儲環(huán)境的基礎(chǔ)組成部分,硬件平臺由位于多個分中心標(biāo)準(zhǔn)的多盤位存儲服務(wù)器構(gòu)建,存儲虛擬化平臺由全局存儲管理系統(tǒng)將把分散部署在多個分中心的分布式存儲系統(tǒng)整合為全局可見、可訪問的統(tǒng)一存儲資源池,實現(xiàn)數(shù)據(jù)異地高速分發(fā)、傳輸以及廣域單一命名空間訪問。分布式集群存儲系統(tǒng)提供符合POSIX規(guī)范的標(biāo)準(zhǔn)接口,任意應(yīng)用程序無需更改便可直接訪問分布式存儲系統(tǒng)中的相關(guān)數(shù)據(jù)。
應(yīng)用服務(wù)器集群:作為應(yīng)用服務(wù)的基礎(chǔ)平臺,考慮到用戶的不固定性帶來的應(yīng)用不固定性,服務(wù)器集群采用綠色、節(jié)能的刀片服務(wù)器與具有高可擴(kuò)展性的機架服務(wù)器組合。
網(wǎng)絡(luò)和安全支撐平臺:作為各硬件系統(tǒng)的通信橋梁,網(wǎng)絡(luò)支撐平臺包括網(wǎng)絡(luò)交換設(shè)備和網(wǎng)絡(luò)安全設(shè)備兩個部分?;诎踩?、穩(wěn)定的前提,網(wǎng)絡(luò)交換設(shè)備采用冗余配置,同時采取應(yīng)用網(wǎng)絡(luò)與存儲網(wǎng)絡(luò)分離的架構(gòu);為了最大限度地保證部署在多個分中心的安全,同時有效地把多個數(shù)據(jù)分中心整合為一個虛擬的專用網(wǎng)絡(luò),每個數(shù)據(jù)中心部署防火墻、VPN等相關(guān)設(shè)備。
云存儲服務(wù)與管理平臺:云存儲服務(wù)平臺是一個IaaS服務(wù)平臺,主要為院內(nèi)科研應(yīng)用提供基礎(chǔ)存儲服務(wù),主要是以Web Service標(biāo)準(zhǔn)接口為科研應(yīng)用服務(wù)提供使用存儲資源的途徑,科研應(yīng)用服務(wù)通過二次開發(fā)調(diào)用Web Service接口實現(xiàn)文件的在線存儲。
云存儲監(jiān)控和運維管理平臺:為系統(tǒng)運維人員提供云存儲資源管理、底層系統(tǒng)管理、用戶賬號管理、記賬管理、充值服務(wù)、資源分析等運維支持服務(wù)。監(jiān)控平臺主要包括數(shù)據(jù)采集模塊、遠(yuǎn)程控制模塊、用戶管理模塊、存儲管理模塊和開放接口等幾個部分。利用遠(yuǎn)程控制模塊可以在北京數(shù)據(jù)中心實現(xiàn)對異地數(shù)據(jù)中心的設(shè)備有效管理,提高異地數(shù)據(jù)中心設(shè)備的可維護(hù)度。云存儲監(jiān)控平臺提供標(biāo)準(zhǔn)訪問接口,可以將其它管理、監(jiān)控等多種系統(tǒng)無縫接入到該平臺中,增強該平臺的監(jiān)管力度和功能。
云存儲架構(gòu)支持在線擴(kuò)展,在擴(kuò)展的同時將保障前端應(yīng)用系統(tǒng)服務(wù)的持續(xù)性。當(dāng)擴(kuò)容完畢,新加入的存儲單元自動接受全局化調(diào)度和管理。
(作者單位為中國科學(xué)院計算機網(wǎng)絡(luò)信息中心)