杜有翔 付渲理 明麗洪
[摘 要]本文根據(jù)大部分?jǐn)?shù)據(jù)中心IaaS層的建設(shè)現(xiàn)狀,分析其基礎(chǔ)資源管理存在的問題,以此提出云化需求。從計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)3個(gè)層面來分析虛擬化技術(shù)在云化IaaS層中的應(yīng)用,提出數(shù)據(jù)中心IaaS層云化架構(gòu)的設(shè)想,并在基礎(chǔ)資源虛擬化的基礎(chǔ)上,搭建云管理平臺(tái),實(shí)現(xiàn)對異構(gòu)的物理資源和虛擬化資源的統(tǒng)一規(guī)范和可視化管理,分析數(shù)據(jù)中心云化IaaS的應(yīng)用成效。
[關(guān)鍵詞]IaaS;虛擬化;云管理;智能運(yùn)維;數(shù)據(jù)備份
doi:10.3969/j.issn.1673 - 0194.2019.24.027
[中圖分類號]TP393.09[文獻(xiàn)標(biāo)識碼]A[文章編號]1673-0194(2019)24-00-03
0 ? ? 引 言
云架構(gòu)因高效的資源整合和運(yùn)維、低功耗資源管理、低成本擴(kuò)展、推動(dòng)大數(shù)據(jù)融合分析等優(yōu)勢,已成為IT架構(gòu)的整體發(fā)展趨勢。從實(shí)現(xiàn)層面上來說,通常分為3個(gè)層次,自下而上分別是基礎(chǔ)設(shè)施即服務(wù)(Infrastructure as a Service,IaaS)、平臺(tái)即服務(wù)(Platform as a Service,PaaS)、軟件即服務(wù)(Software as a Service,SaaS)。其中,IaaS層是IT架構(gòu)的基礎(chǔ)層,也是實(shí)現(xiàn)云架構(gòu)的核心所在,是PaaS和SaaS層的實(shí)際載體。本文基于目前大部分中心機(jī)房實(shí)際情況,從IaaS層分析數(shù)據(jù)中心云化的方式和應(yīng)用前景。
1 ? ? 數(shù)據(jù)中心基礎(chǔ)設(shè)施現(xiàn)狀
目前,很多單位都有自己的數(shù)據(jù)中心,但大部分只是實(shí)現(xiàn)了所有硬件設(shè)備的集中擺放和連接,將林立的“煙囪”堆在了一起。即使采用了虛擬化平臺(tái),但數(shù)據(jù)中心沒有一個(gè)統(tǒng)一的資源整合和運(yùn)維平臺(tái),易造成硬件資源浪費(fèi),難以管理。從基礎(chǔ)設(shè)施的使用來看,可以從以下兩方面分析數(shù)據(jù)中心存在的問題。
1.1 ? 非虛擬化平臺(tái)
①舊設(shè)備改造的投入成本過高,且難以徹底改造;②部分新設(shè)備性能配置高,運(yùn)行其上的業(yè)務(wù)未能充分利用設(shè)備資源,造成資源浪費(fèi);③物理設(shè)備一旦開機(jī),能耗較為穩(wěn)定(不包括制冷能耗),不會(huì)因利用率高低而產(chǎn)生較大的能耗變化,造成能源浪費(fèi);④部分業(yè)務(wù)應(yīng)用系統(tǒng)為了降低建設(shè)初期投入,沒有過多考慮高可用性和負(fù)載均衡。
1.2 ? 虛擬化平臺(tái)
①虛擬化平臺(tái)相互之間是獨(dú)立的,且應(yīng)用范圍不廣,限制了其在資源節(jié)約上的優(yōu)勢;②未建設(shè)可實(shí)現(xiàn)資源自動(dòng)按需分配的云管理平臺(tái),運(yùn)維人力成本較高。因此,數(shù)據(jù)中心IaaS層云化的目標(biāo)是最小化改造成本、提高硬件資源利用率、保證業(yè)務(wù)高可用和數(shù)據(jù)安全,實(shí)現(xiàn)資源管理自動(dòng)化和運(yùn)維智能化。
2 ? ? 虛擬化技術(shù)在數(shù)據(jù)中心的應(yīng)用
虛擬化技術(shù)是所有IT“云”的基礎(chǔ),也是目前最有效的資源整合技術(shù)。通過利用虛擬化技術(shù),在實(shí)現(xiàn)應(yīng)用高可用性的同時(shí),提高了設(shè)備的資源利用率,能以較低的建設(shè)和改造成本,降低數(shù)據(jù)中心的能耗。從功能上分,數(shù)據(jù)中心虛擬化技術(shù)主要包括3類:存儲(chǔ)虛擬化、服務(wù)器虛擬化(計(jì)算資源虛擬化)和網(wǎng)絡(luò)虛擬化。
2.1 ? 存儲(chǔ)虛擬化
存儲(chǔ)虛擬化是為了實(shí)現(xiàn)對物理存儲(chǔ)資源的抽象、隱藏和隔離,提高設(shè)備利用率和可擴(kuò)展性??梢詫⒁粋€(gè)物理存儲(chǔ)設(shè)備(卷)虛擬成多個(gè)邏輯存儲(chǔ)卷,也可以將多個(gè)物理存儲(chǔ)設(shè)備(卷)虛擬成一個(gè)邏輯存儲(chǔ)卷,供上層的應(yīng)用服務(wù)端調(diào)用,如圖1所示。
存儲(chǔ)虛擬化按實(shí)現(xiàn)位置可分為基于主機(jī)、基于存儲(chǔ)設(shè)備和基于網(wǎng)絡(luò)3類,比較結(jié)果如表1所示。
2.2 ? 服務(wù)器虛擬化
服務(wù)器虛擬化是將一臺(tái)或多臺(tái)利用率低的服務(wù)器通過虛擬化軟件整合在一起,形成一個(gè)或多個(gè)計(jì)算資源池,為多個(gè)應(yīng)用系統(tǒng)提供計(jì)算資源,又稱為計(jì)算資源虛擬化。由于各虛擬機(jī)內(nèi)部運(yùn)行環(huán)境之間是相互獨(dú)立的,且物理服務(wù)器如何為虛擬機(jī)提供計(jì)算資源,對于運(yùn)行在其上應(yīng)用系統(tǒng)來說也是完全透明的,因此,從效果上來看,各應(yīng)用系統(tǒng)仍然各自“獨(dú)占”一臺(tái)物理服務(wù)器,如圖2所示。
除了整合計(jì)算資源以外,以共享存儲(chǔ)為前提,服務(wù)器虛擬化的一個(gè)重要作用還體現(xiàn)在對于運(yùn)行其上的業(yè)務(wù)系統(tǒng)的一個(gè)連續(xù)性保護(hù),主要通過虛擬化遷移、虛擬化平臺(tái)的高可用、恢復(fù)自動(dòng)化等技術(shù)實(shí)現(xiàn)。
2.3 ? 網(wǎng)絡(luò)虛擬化
網(wǎng)絡(luò)虛擬化可描述為將網(wǎng)絡(luò)資源進(jìn)行虛擬化整合和改造,在對用戶透明的前提下,實(shí)現(xiàn)物理網(wǎng)絡(luò)虛多、多虛功能,以達(dá)到提高物理網(wǎng)絡(luò)設(shè)備利用率、簡化物理網(wǎng)絡(luò)的目的。在服務(wù)器虛擬化中,要運(yùn)用網(wǎng)絡(luò)虛擬化技術(shù)實(shí)現(xiàn)多個(gè)不同IP的虛擬機(jī)通過少量的物理網(wǎng)口對外連接,如圖3所示。
數(shù)據(jù)中心的資源整合主要有3種實(shí)現(xiàn)方式:“服務(wù)器虛擬化+共享物理存儲(chǔ)”“服務(wù)器虛擬化+存儲(chǔ)虛擬化”、超融合架構(gòu)。其中,超融合架構(gòu)是將服務(wù)器虛擬化、存儲(chǔ)虛擬化、網(wǎng)絡(luò)虛擬化等虛擬化技術(shù)融合在一起的扁平化部署架構(gòu)。但由于其存儲(chǔ)和計(jì)算資源都是在同一臺(tái)物理設(shè)備上,因此,如果要對任何一種資源進(jìn)行單獨(dú)擴(kuò)容,為了保證平臺(tái)整體性能,需要對每臺(tái)物理設(shè)備進(jìn)行同樣的擴(kuò)容改造,成本較高。因此,此架構(gòu)適用于對計(jì)算、存儲(chǔ)資源需求同步增長的應(yīng)用。通過對常用應(yīng)用系統(tǒng)(如門戶、OA)的分析可知,服務(wù)端的計(jì)算資源需求量增長遠(yuǎn)不如存儲(chǔ)資源。而特殊應(yīng)用系統(tǒng),如桌面云,計(jì)算資源需求的增長和存儲(chǔ)資源需求的增長就有較強(qiáng)的關(guān)聯(lián)性。比如,新增一個(gè)桌面云用戶,不僅要為其分配磁盤空間(存儲(chǔ)資源),還要為其分配CPU和內(nèi)存(計(jì)算資源)。因此,通過上述虛擬化技術(shù)對比分析,對于數(shù)據(jù)中心中的通用應(yīng)用系統(tǒng),應(yīng)通過重建、數(shù)據(jù)遷移、P2V等方式將其遷入“服務(wù)器虛擬化+基于網(wǎng)絡(luò)的存儲(chǔ)虛擬化”的虛擬化平臺(tái)中,并將替換下的舊設(shè)備納入虛擬化平臺(tái)管理,進(jìn)一步提高資源整合度和利用率,而對于桌面云等特殊應(yīng)用系統(tǒng)可建設(shè)在超融合架構(gòu)的虛擬化平臺(tái)中。
3 ? ? 數(shù)據(jù)中心云管理平臺(tái)的應(yīng)用構(gòu)想
在各虛擬化平臺(tái)之上構(gòu)建一個(gè)統(tǒng)一的運(yùn)維管理云平臺(tái),接管數(shù)據(jù)中心所有硬件資源及其承載的虛擬化資源的監(jiān)控、調(diào)度、分配等日常管理運(yùn)維工作,屏蔽下層復(fù)雜的運(yùn)行環(huán)境,簡化運(yùn)維人員操作,并通過可視化監(jiān)控、統(tǒng)計(jì)分析報(bào)表、告警機(jī)制等功能為運(yùn)維人員進(jìn)行決策分析提供依據(jù),完整的數(shù)據(jù)中心IaaS層云化架構(gòu),詳見圖4所示。
3.1 ? 基礎(chǔ)資源管理自動(dòng)化
對基礎(chǔ)資源的管理包括對物理資源的管理和虛擬資源的管理。
3.3.1 ? 對物理資源的管理
要對物理設(shè)備在云化架構(gòu)中的壽命進(jìn)行全生命周期管理,主要包括以下幾個(gè)方面。①設(shè)備自動(dòng)發(fā)現(xiàn):平臺(tái)通過主動(dòng)詢問機(jī)制主動(dòng)發(fā)現(xiàn)新入網(wǎng)設(shè)備,并將設(shè)備信息(如設(shè)備型號、IP地址、MAC地址)告知運(yùn)維人員,由其決定是否將其納入平臺(tái)管理。②設(shè)備狀態(tài)監(jiān)控:定期監(jiān)控設(shè)備運(yùn)行狀態(tài),如開關(guān)機(jī)情況、溫度、CPU和內(nèi)存占用等,并根據(jù)既定的監(jiān)控策略定時(shí)生成監(jiān)控報(bào)表呈現(xiàn)給運(yùn)維人員,一旦狀態(tài)有異常,立即發(fā)出告警信息,實(shí)現(xiàn)日常巡檢自動(dòng)化。③設(shè)備移除:運(yùn)維人員通過平臺(tái)可將作廢的設(shè)備移出管理范圍,不再進(jìn)行管理監(jiān)控。
3.3.2 ? 對虛擬資源的管理
除了進(jìn)行全生命周期管理,還應(yīng)具有資源自動(dòng)按需分配功能。即用戶可在線發(fā)起虛擬資源申請,由相關(guān)管理人員審批通過后,平臺(tái)自動(dòng)按照用戶需求為其分配虛擬計(jì)算、存儲(chǔ)資源供其使用,一旦用戶告知不再使用,或超過申請的使用期限,自動(dòng)回收資源。
3.2 ? 基礎(chǔ)資源運(yùn)維智能化
基礎(chǔ)資源運(yùn)維智能化主要包括虛擬資源的智能化調(diào)度和故障的智能化處理。
3.2.1 ? 虛擬資源的智能化調(diào)度
要實(shí)現(xiàn)智能化調(diào)度,需要確定不同的優(yōu)化目標(biāo)以判斷調(diào)度優(yōu)劣,比如性能(響應(yīng)速度)、服務(wù)質(zhì)量、總成本控制(能耗低)等,并據(jù)此制定出合理的調(diào)度策略。此處應(yīng)遵循以下3條資源調(diào)度原則。①確定好虛擬資源利用優(yōu)先級的劃分。在進(jìn)行資源優(yōu)化調(diào)度時(shí),平臺(tái)會(huì)優(yōu)先考慮優(yōu)先級靠前的虛擬機(jī)資源占用。一旦資源池中的資源匱乏時(shí),平臺(tái)會(huì)優(yōu)先保證重要應(yīng)用的資源占用,確保重要業(yè)務(wù)的連續(xù)性。②保持資源利用率的平衡。在虛擬化實(shí)踐中,常常會(huì)因?yàn)橘Y源利用率失衡導(dǎo)致資源不充分。如計(jì)算資源利用率很低,而存儲(chǔ)資源利用率很高,導(dǎo)致新的應(yīng)用無法遷入(存儲(chǔ)資源不夠),造成計(jì)算資源浪費(fèi),反之亦然。因此,在分配虛擬資源時(shí),要充分考慮運(yùn)行其上的應(yīng)用對資源的要求。一旦出現(xiàn)失衡,要及時(shí)調(diào)整現(xiàn)有資源分配,改進(jìn)原調(diào)度策略。如果無法通過調(diào)整實(shí)現(xiàn),則需要對利用率較高的一方進(jìn)行擴(kuò)展(增加物理資源)。③處理好能耗與計(jì)算性能的關(guān)系。如果優(yōu)化目標(biāo)設(shè)定為成本控制(能耗低),則虛擬化平臺(tái)會(huì)根據(jù)調(diào)度策略,在確保計(jì)算資源足夠的情況下,將低利用率主機(jī)上的虛擬機(jī)遷至別的主機(jī),然后休眠此主機(jī),以降低能耗。但如果優(yōu)化目標(biāo)設(shè)定為性能,在各主機(jī)計(jì)算資源性能相同的前提下,盡量平均各臺(tái)主機(jī)的資源利用率,以保證各個(gè)應(yīng)用的資源占用和負(fù)載均衡。因此,需要根據(jù)具體的應(yīng)用需求、物理主機(jī)性能、機(jī)房環(huán)境,制定合理的調(diào)度策略,控制虛擬機(jī)的遷移和資源的動(dòng)態(tài)分配。
3.2.2 ? 故障的智能化處理
快速解決故障、提高用戶體驗(yàn),一直是運(yùn)維人員面臨的難題。①建立完善的預(yù)警機(jī)制。平臺(tái)自動(dòng)進(jìn)行告警過濾、壓縮,避免海量告警,只將關(guān)鍵告警通過消息發(fā)送給責(zé)任人。②建立業(yè)務(wù)級的運(yùn)維視圖,快速呈現(xiàn)業(yè)務(wù)與硬件設(shè)備、各業(yè)務(wù)系統(tǒng)之間的邏輯關(guān)系,實(shí)現(xiàn)故障快速定位,提高故障處理效率。③建立運(yùn)維知識庫。對運(yùn)維流程進(jìn)行梳理,制定故障判斷和預(yù)處理策略。故障發(fā)生時(shí),平臺(tái)據(jù)此自動(dòng)執(zhí)行抓取故障日志,排查解決故障等操作,實(shí)現(xiàn)一般故障的自動(dòng)化處理。對于需要技術(shù)人員處理的故障,平臺(tái)自動(dòng)通過消息告知運(yùn)維技術(shù)人員。同時(shí),平臺(tái)自動(dòng)關(guān)聯(lián)知識庫,協(xié)助技術(shù)人員處理。技術(shù)人員處理結(jié)束后處理方案自動(dòng)轉(zhuǎn)入,實(shí)現(xiàn)知識累積。
3.3 ? 數(shù)據(jù)云備份
在平臺(tái)中融入災(zāi)備云管理,集中統(tǒng)一管理所有的容災(zāi)設(shè)備、數(shù)據(jù)備份恢復(fù)策略,實(shí)現(xiàn)對平臺(tái)數(shù)據(jù)的持續(xù)性保護(hù)。
3.3.1 ? 保護(hù)應(yīng)用系統(tǒng)數(shù)據(jù)
應(yīng)用系統(tǒng)數(shù)據(jù)可分為操作系統(tǒng)、虛擬機(jī)、非結(jié)構(gòu)化數(shù)據(jù)(文件)、數(shù)據(jù)庫四大類。應(yīng)根據(jù)數(shù)據(jù)類型和數(shù)據(jù)重要性的不同,制定不同的數(shù)據(jù)備份策略,確保故障發(fā)生后,數(shù)據(jù)不丟失或少丟失、業(yè)務(wù)可恢復(fù)。
3.3.2 ? 保護(hù)用戶數(shù)據(jù)
用戶可像申請?zhí)摂M計(jì)算、存儲(chǔ)資源一樣,在線申請災(zāi)備資源,并自定義災(zāi)備策略,實(shí)現(xiàn)“自己災(zāi)備數(shù)據(jù),自己管理”。
4 ? ? 結(jié) 語
在數(shù)據(jù)中心建立一套IaaS層云化架構(gòu),將所有的基礎(chǔ)資源納入統(tǒng)一的管理平臺(tái)下,可實(shí)現(xiàn)基礎(chǔ)資源的統(tǒng)一規(guī)范管理,有效提升數(shù)據(jù)中心的資源利用率和運(yùn)維效率,降低數(shù)據(jù)中心的整體能耗和運(yùn)維成本,可為數(shù)據(jù)中心的相關(guān)管理人員和部門提供足夠的決策支撐。充分體現(xiàn)該架構(gòu)的應(yīng)用價(jià)值。
主要參考文獻(xiàn)
[1][美]阿爾杰.大數(shù)據(jù)云計(jì)算時(shí)代數(shù)據(jù)中心經(jīng)典案例賞析[M].曾少寧,譯.北京:人民郵電出版社,2014.
[2]戴元順.云計(jì)算技術(shù)簡述[J].信息通信技術(shù),2010(2).
[3]鄭偉偉.IaaS云管理平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2012.
[4]李喬,鄭嘯.云計(jì)算研究現(xiàn)狀綜述[J].計(jì)算機(jī)科學(xué),2011(4).