劉瀚宇 賈文勝 吳家欣
(中國特種設(shè)備檢測研究院)
隨著信息技術(shù)的高速發(fā)展,智慧監(jiān)管也成為一個熱門的話題。為了實現(xiàn)智慧監(jiān)管,需以云服務(wù)平臺為“抓手”,用以提高辦公效率,保障信息安全,提升政務(wù)系統(tǒng)運行中的可靠性和安全性。因此,中國特種設(shè)備檢測研究院(以下簡稱:特檢院)需要打造一套完整且功能完備的云服務(wù)平臺,立足已有資源,滿足市場監(jiān)管總局以及行業(yè)的需求。
在事業(yè)單位信息機(jī)房建設(shè)的過程當(dāng)中,為了科研和教學(xué)的需求得到滿足,物理服務(wù)器的數(shù)量與日增多,在管理的過程中管理員發(fā)現(xiàn)以下幾個問題。
(1)服務(wù)器的利用率很低。例如,一臺服務(wù)器只部署了一個網(wǎng)站,并且是一個只有幾個頁面的普通網(wǎng)站,利用率如此低下,造成了嚴(yán)重的資源浪費。
(2)管理困難。實際需求的增加導(dǎo)致物理服務(wù)器數(shù)量的增加,管理員要清楚每個服務(wù)器上運行的具體服務(wù)項目,需要進(jìn)行記錄,且不能集中操作簡化工作,這就大大地增加了管理的難度。
(3)靈活性和安全性很難得到保障。假如某一個物理服務(wù)器的存儲設(shè)備損壞,那么這個物理服務(wù)器上的數(shù)據(jù)將會全部丟失,造成不可逆的嚴(yán)重后果。
目前,一般中大型事業(yè)單位均設(shè)有兩個信息機(jī)房。假設(shè)分別設(shè)立信息機(jī)房A和信息機(jī)房B(以下簡稱:A機(jī)房和B機(jī)房),兩個信息機(jī)房之間通過100 M點對點互聯(lián)網(wǎng)專線連接。A、B機(jī)房已經(jīng)部署虛擬化環(huán)境,服務(wù)器、存儲控制器、網(wǎng)絡(luò)存儲組成,通過Local的部署方式實現(xiàn)本站點內(nèi)的存儲保護(hù)機(jī)制。兩個機(jī)房各自都是主備模式,利用現(xiàn)有資源,搭建云服務(wù)平臺,以解決同城異地災(zāi)備問題,起到資源互聯(lián)互通的效果,支撐單位及行業(yè)發(fā)展,實現(xiàn)智慧監(jiān)管的目的。
(1)技術(shù)原則
采用成熟先進(jìn)的IT資源整合技術(shù)和復(fù)制數(shù)據(jù)的技術(shù),達(dá)到生產(chǎn)中心數(shù)據(jù)的資源整合,保證A機(jī)房與B機(jī)房數(shù)據(jù)的一致性和完整性。在云服務(wù)平臺搭建技術(shù)方案的選擇上遵循滿足先進(jìn)性、可靠性和可擴(kuò)展性的原則,先進(jìn)性以保障在不短的一段時間內(nèi)在技術(shù)上的更替及設(shè)備上的投入;同時通過高度的可靠性及靈活的可擴(kuò)展性,保障新的功能以及新的業(yè)務(wù)在原有的平臺系統(tǒng)上可以順利地增加、擴(kuò)展。
(2)等保原則
根據(jù)《重要信息系統(tǒng)災(zāi)難恢復(fù)指南》,災(zāi)難恢復(fù)有六個等級:基本支持備用場地支持、電子傳輸和部分設(shè)備支持、電子傳輸及完整設(shè)備支持、實時數(shù)據(jù)傳輸及完整設(shè)備支持、數(shù)據(jù)零丟失和遠(yuǎn)程集群支持。災(zāi)難恢復(fù)資源要素,對于不同的等級應(yīng)滿足的要求,在指南中有明確的描述。
(3)經(jīng)濟(jì)原則
云服務(wù)平臺建設(shè)應(yīng)考慮云服務(wù)平臺設(shè)備的性能價格比和云服務(wù)平臺的運營成本。充分發(fā)揮原有資產(chǎn)的價值,本著低成本、高效率的建設(shè)原則,最大限度地降低云服務(wù)平臺的建設(shè)成本。
通過調(diào)研了解,目前主要的主流云計算平臺技術(shù) 有 Google App Engine、Amazon EC2、VMCD、Eucalyptus filecoin Apache VCL、Open Stack、Mfi Amazon EC2。其中 Google App Engine、VMCD 屬于商業(yè)云平臺,并且Amazon EC2 和 Google App Engine專屬于亞馬遜和谷歌公司,用戶只能通過租用服務(wù)器的方式來運行自己的應(yīng)用,VMCD則可以用來搭建企業(yè)、學(xué)校或機(jī)關(guān)單位等內(nèi)部的云平臺。目前開源的云平臺技術(shù)有Eucalyptus filecoin Apache VCL、Open Stack,Open Stack 在業(yè)界最受歡迎也是運用最多,Eucalyptus filecoin Apache VCL 只能提供 laas 服務(wù)。所以,本著可行性和沿用原有配置的原則,最終選擇VMCD。
用戶可以使用VMCD將基礎(chǔ)性資源架構(gòu)整合成虛擬數(shù)據(jù)資源池,并讓用戶可以按需使用這些資源,從而構(gòu)建安全的私有云。特檢院用VMCD搭建的云服務(wù)平臺架構(gòu)見圖1。
圖1 VMCD搭建的云服務(wù)平臺架構(gòu)
(1)V.C Director 數(shù)據(jù)庫和 V.C 數(shù)據(jù)庫用來 VMCD管理和 V.C Server 管理,現(xiàn)在可以使用 VMCD 的數(shù)據(jù)庫有微軟的 SOL.Server 和甲骨文公司的 Oracle。
(2)提供防火墻保護(hù)的是VM vShield、流量分析及外圍的網(wǎng)絡(luò)服務(wù)用于保護(hù) vCenter Server 基礎(chǔ)虛擬架構(gòu)。V.S Manager 是vShield 的集中管理組件,使用 V.S Manager用來監(jiān)視并集中配置 V.S App、V.S Endpoint 和 V.S Edge。
圖1中的節(jié)點表示虛擬主機(jī),節(jié)點與ESXi 相連表示計算機(jī)分配給這個虛擬機(jī)所使用到的資源 (例如內(nèi)存、硬盤、CPU等)為這個 ESXi 所在計算機(jī)上的資源(例如:內(nèi)存、硬盤、CPU等)。用戶通過web 門戶來訪問 vCloud 上的資源,VMCD 服務(wù)器通過vCloud Director 數(shù)據(jù)庫來保存它所管理的 vCenter服務(wù)器的信息(IP 地址、內(nèi)存等信息)、VMCD 用戶的信息(用戶名、密碼和權(quán)限等信息)以及自身的一些信息(IP地址、域名等)。每臺 vCloud Director 服務(wù)器可以管理多臺 V.C 服務(wù)器,通過 V.S Manager 來保障 vCenter 服務(wù)器單元的安全可靠性,ESXi的信息以及 vCenter用戶的信息通過 vCenter 數(shù)據(jù)庫來保存。每一臺vCenter 服務(wù)器可以用于管理多個ESXi,這些被管理的ESXi共享使用同一個存儲設(shè)備,這臺 ESXi 的計算資源為每一臺ESXi上的虛擬機(jī)所使用的計算資源所分配,與這臺 ESXi相鏈接的存儲設(shè)備提供存儲資源。每當(dāng)在ESXi上新建一臺虛擬機(jī)時,就會自動給新建的這臺虛擬機(jī)分配所適用的計算和存儲資源,這些計算和存儲資源分別用于與這臺ESXi相鏈接的存儲設(shè)備。
企業(yè)級私有云的構(gòu)建是VMCD基于V.M vSphere和V.M vShield。其搭建的虛擬數(shù)據(jù)中心為企業(yè)內(nèi)部和員工提供服務(wù)。用戶如果需要定制資源可通過VMCD提供的web界面來請求,這些可定制的資源包括存儲空間、操作系統(tǒng)以及計算資源。當(dāng)用戶請求的定制資源生成后,定制產(chǎn)品會以虛擬主機(jī)的形式提供給用戶使用。
(1)第一階段——對A機(jī)房進(jìn)行改造升級
隨著應(yīng)用及業(yè)務(wù)系統(tǒng)數(shù)量不斷地增加,業(yè)務(wù)流量不斷地增長,面對不斷增長的存儲和吞吐需求,部分事業(yè)單位8G的SAN網(wǎng)絡(luò)已無法滿足現(xiàn)有生產(chǎn)業(yè)務(wù)的支撐,為保障業(yè)務(wù)指標(biāo)以及未來不斷增長的高性能要求。本次實施SAN網(wǎng)絡(luò)的升級擴(kuò)容及存儲控制器升級換代,將原有的2臺8G的光纖交換機(jī)替換為2臺16G的光纖交換機(jī),將原有的ESXi主機(jī)8G HBA卡替換為16G HBA卡。
(2)第二階段——對B機(jī)房進(jìn)行災(zāi)備建設(shè)
對B機(jī)房部署一套新的虛擬化環(huán)境,其中計算部分由7臺服務(wù)器組成,存儲部分由2臺48路光纖交換機(jī)、2臺網(wǎng)絡(luò)雙活(Active-Active)存儲組成,消除存儲系統(tǒng)單點故障,保障數(shù)據(jù)可靠性。
(3)第三階段——建立同城數(shù)據(jù)級異步復(fù)制災(zāi)備系統(tǒng)
目前信息機(jī)房的基礎(chǔ)設(shè)施及網(wǎng)絡(luò)資源均已部署到位,兩個信息機(jī)房的存儲設(shè)備均已實現(xiàn)雙活(Active-Active),且生產(chǎn)中心在存儲雙活(Active-Active)保障的同時還利用備份軟件做了定期策略備份。為了保障業(yè)務(wù)中斷時間降到最低,為了在災(zāi)難發(fā)生后能夠以最快速度恢復(fù)數(shù)據(jù)服務(wù),快速拉起業(yè)務(wù),第二階段采用Veeam Backup & Replication CDP(連續(xù)數(shù)據(jù)保護(hù))功能,建立A機(jī)房B機(jī)房容災(zāi)中心的連續(xù)數(shù)據(jù)保護(hù)。
事業(yè)單位云服務(wù)平臺是結(jié)合單位自身的需求條件進(jìn)行規(guī)劃搭建的,是目前云計算的應(yīng)用模式的一種資源管理系統(tǒng),規(guī)劃中主要涵蓋了對于云服務(wù)的發(fā)布、維護(hù)和應(yīng)用的管理等。云平臺的思想核心,是統(tǒng)一管理云服務(wù)所需的計算資源組成的資源池,然后根據(jù)用戶的實際需求提供計算資源。通過云平臺,用戶可以在web上訪問云平臺所提供的應(yīng)用和服務(wù),以滿足用戶的需求;與此同時,研發(fā)人員也可以將應(yīng)用軟件靈活安裝到云管理平臺上,由云平臺進(jìn)行統(tǒng)一的管理。通過云平臺,可以充分滿足網(wǎng)絡(luò)云服務(wù)的快速響應(yīng)和實時處理的需求,并且云平臺可以統(tǒng)一地對資源調(diào)度進(jìn)行管理,提升云平臺的資源利用率,減少云服務(wù)的開發(fā)和維護(hù)成本。