袁敬實 陳琰 王蓓蓓
【摘要】? ? 隨著“互聯(lián)網(wǎng)+”戰(zhàn)略的推進,信息消費正在加速滲透進各行各業(yè)與千家萬戶,給社會發(fā)展與信息化建設帶來了巨大發(fā)展機遇和發(fā)展空間。在“互聯(lián)網(wǎng)+”實現(xiàn)過程中,我們將目光鎖定在大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算等熱點應用領域,這些領域與“互聯(lián)網(wǎng)+”的內(nèi)容實質(zhì)有很強相關性。也正是因為這樣,由于信息化所主導的新興業(yè)務領域才會有更好的發(fā)展空間,對“互聯(lián)網(wǎng)+”戰(zhàn)略的部署和實現(xiàn)也是一種很好的促進。本文首先對分布式存儲和分布式存儲的特點進行了簡要闡述;然后以POD方案和混合POD方案為例,對分布式存儲在大數(shù)據(jù)中心建設中的具體部署情況進行了詳細分析和描述;最后從資源利用和管理能力等六個方面出發(fā),對云數(shù)據(jù)中心建設優(yōu)勢進行了總結(jié)。
【關鍵詞】? ? 分布式存儲? ? 大數(shù)據(jù)? ? 建設策略
一、分布式存儲及其特點
1.1分布式存儲
分布式存儲的擴展性更強,其架構(gòu)能夠?qū)崿F(xiàn)跨設備數(shù)據(jù)分發(fā),同時能夠做到多個服務器間共享存儲負載。分布式存儲一般分為塊存儲、文件存儲和對象存儲。
1.1.1分布式塊存儲
在物理機與虛擬機應用中,塊存儲可作為一種長期存儲設備來使用,對軟件導出和提供本地磁盤使用很有幫助。與此同時,像備份和快照等多樣化高級服務也會被提供。
1.1.2分布式文件存儲
在“客戶端—服務器”模型的支持下,分布式文件系統(tǒng)設計更具實用性和現(xiàn)實意義。其功能在信息資源傳遞方式上表現(xiàn)出很強靈活性,比如基于物理設備進行存儲的信息資源可在網(wǎng)絡環(huán)境支持下完成虛擬化存儲,這樣便在客戶端層面極大節(jié)省了存儲空間,也降低了投入資金。
1.1.3分布式對象存儲
相比分布式塊存儲和分布式文件存儲,分布式對象存儲要更復雜些,但所實現(xiàn)的功能更多,優(yōu)點也更加明顯,比如網(wǎng)絡附加存儲優(yōu)勢、存儲區(qū)域網(wǎng)絡優(yōu)勢等,均是分布式塊存儲和分布式文件存儲無法比擬的,這些與分布式對象存儲的結(jié)構(gòu)豐富性有直接關系。除了對象和對象存儲設備外,系統(tǒng)客戶端和元數(shù)據(jù)服務器在功能和優(yōu)勢實現(xiàn)過程中也發(fā)揮了重要作用,比如高安全性和可靠性。
1.2分布式存儲產(chǎn)品的主要特點
1.2.1高彈性和擴展性
分布式存儲產(chǎn)品的高彈性和高擴展性主要體現(xiàn)在應用層面的負載均衡特性上,且每個硬件資源均具有這樣的特性。加之在多卷共享支持下,共享資源池功能也得到了最大限度發(fā)揮,使產(chǎn)品的高彈性特點得到了更好體現(xiàn)。而這一切均是在數(shù)據(jù)分片技術(shù)的支持來完成的,使數(shù)據(jù)能夠被均勻地分配到資源池中。
1.2.2高性能
分布式存儲通過動態(tài)智能分區(qū)、靜態(tài)選盤算法以及 EC 算法,采用小 IO 聚合、大 IO 直通等技術(shù),在實現(xiàn)了業(yè)務均衡分布和保證了存儲高可靠的同時,也保證了存儲的高性能。在使用 HDD 作為主存時,采用分布式 SSD Cache 加速方案,將各個 存儲節(jié)點上的 SSD 組建成為一個共享的分布式 Cache 資源池,供所有的業(yè)務共同所 用,實現(xiàn) HDD 主存的性能加速。
1.2.3高可靠性
分布式存儲采用分布式集群管理方式,系統(tǒng)全冗余部署,無單點故障。支持 多副本和 EC(Erasure Coding)兩種數(shù)據(jù)冗余保護機制,支持設置靈活的數(shù)據(jù)可靠性策略,支持DIF、后臺數(shù)據(jù)一致性校驗等數(shù)據(jù)完整性校驗功能。
二、分布式存儲在大數(shù)據(jù)中心建設中的部署方案
基于分布式存儲的大數(shù)據(jù)中心建設中的部署方案,在硬件方面需要X86和架頂交換機或大型數(shù)據(jù)中心交換機做支持,在不同網(wǎng)絡機構(gòu)、網(wǎng)絡規(guī)模,以及不同的應用需求下,對設備的應用和組網(wǎng)方法也是有所區(qū)別的。
2.1存儲獨立POD方案
POD方案是指物理基礎設施資源池,該方案一般用在物理機房無法滿足和承載數(shù)據(jù)中心建設要求的情況下,方案應用宗旨是將存儲與業(yè)務和管理服務器分開。當前我們對“物理機房無法滿足和承載數(shù)據(jù)中心建設要求”的理解是,數(shù)據(jù)中心機房的服務器要達到千臺以上規(guī)模。
POD的劃分與建設主要依據(jù)業(yè)務內(nèi)容和屬性。假如平均每一個機柜放置10臺服務器,那么1500臺服務器就需要100多個機柜,按照業(yè)務內(nèi)容來進行劃分,可能我們需要劃分出20-30個POD。圖1是具體POD組網(wǎng)結(jié)構(gòu)圖,假設數(shù)據(jù)中心的每臺服務器以2×10GE上聯(lián)一對TOR(接入交換機)上,每臺TOR以4×40GE上聯(lián)匯聚層交換機,并接入數(shù)據(jù)中心網(wǎng)絡。比如,在大數(shù)據(jù)計算節(jié)點每對接入交換機下掛載48臺服務器,那么從接入到匯聚就會采用1:3的收斂比。需要指出的是,無論是計算節(jié)點還是存儲節(jié)點,又或是管理節(jié)點,它們本身就是一個POD,有時獲取是多個POD,其主要任務是負責協(xié)調(diào)其它各個POD之間的業(yè)務互訪。
2.2采用混合POD組網(wǎng)方案
存儲獨立POD組網(wǎng)方案主要用來解決大型機房空間和資源利用率問題,而對于中小型機房來說,由于對空間和資源的要求并不是很高,所以采用存儲獨立POD方案難免會浪費掉多余的空間和資源。在這樣的情況下,我們可以采用混合POD組網(wǎng)方案。圖2為混合POD組網(wǎng)結(jié)構(gòu)圖。
混合POD組網(wǎng)方案主要分兩種,一是按業(yè)務分區(qū)部署方案,二是機架混合部署方案。
2.2.1按業(yè)務分區(qū)部署方案
在空間部署方面,匯聚層交換機一般會被安置在機房物理中心位置,這樣便于其它設備連接。至于對交換機類型的選擇,主要還看具體業(yè)務需求。一般情況下,計算接入交換機、管理接入交換機、存儲接入交換機、IPMI管理交換機都會被置于機柜上層,一般在34U-38U這段距離之間,每個機柜所盛放的服務器數(shù)量需要控制在10-14臺,并需要在同一個機柜部署相同業(yè)務的服務器。
2.2.2機架混合部署方案
前面所講,混合POD組網(wǎng)方案一般用于中小型機房建設,但每個中小型機房的具體情況還是不同的,混合POD組網(wǎng)方案下的按業(yè)務分區(qū)部署方案多用于承載服務器數(shù)量較多的機房,而對于那些服務器數(shù)量少的機房來說,需要采用另一種方案,即機架混合部署方案。該方案與前一種方案相比,最大的不同就是計算和存儲共用一個交換機來協(xié)調(diào)業(yè)務之間互訪,而不是通過匯聚交換機來實現(xiàn)協(xié)調(diào)業(yè)務之間互訪。在此方案下,一個機柜既要承載計算服務器,也要容納存儲服務器,這樣做可以節(jié)省更多的空間資源,減少走線架線纜布放。
在同一個機柜中,計算接入交換機、管理接入交換機、存儲接入交換機和IPMI管理交換機的安置位置與按業(yè)務分區(qū)部署方案下的安置位置相同,但最頂層交換機位置不可超過40U。
三、與傳統(tǒng)IDC相比,云數(shù)據(jù)中心建設的優(yōu)勢
3.1充分利用資源
云數(shù)據(jù)中心建設優(yōu)勢主要體現(xiàn)在提高了資源使用效率,縮短了信息反映時間,提升了設備運行維護質(zhì)量,簡化了信息管理流程,增強了IDC擴展靈活性,以及降低了資源擴充難度。這些內(nèi)容全部是云計算管理通過進行動態(tài)監(jiān)控、調(diào)度和部署虛擬化資源池中的各種資源來實現(xiàn)的。
3.2減少用戶初期投資與運營成本
相比重構(gòu)購買符合應用需求的硬件設備和軟件產(chǎn)品,根據(jù)用戶實際業(yè)務需求來調(diào)整租賃資源,對幫助用戶減少初期投資成本,以及運營成本是十分有效的。特別需要強調(diào)的是,用戶可根據(jù)自身使用情況進行付費,這一極具人性化的投資特征對于中小型企業(yè)及其自身發(fā)展來說無疑是十分有利的。
3.3直接滿足并實現(xiàn)了眾多IDC業(yè)務需求
云數(shù)據(jù)中心建設具有很強開放性,應用平臺可將所有實際業(yè)務需求的相關內(nèi)容整個在一起提供了用戶。同時,極具創(chuàng)新性的服務業(yè)實現(xiàn)了IDC業(yè)務服務的縱深發(fā)展。
3.4促進IDC管理水平提高
規(guī)范化和規(guī)?;窃茢?shù)據(jù)中心建設的主要特征,這一特征,或與之相關特征,對實現(xiàn)IDC自動化管理,以及具有統(tǒng)一性的流程化管理有著重要幫助,直接促進了IDC管理水平的提高。
3.5綠色成長
對云數(shù)據(jù)中心建設來說,綠色成長即指節(jié)能減排的實現(xiàn),以及對有限信息資源的高效利用。云數(shù)據(jù)中心的建設和應用,將不斷推動信息化環(huán)保事業(yè)的發(fā)展。
3.6業(yè)務多樣化的實現(xiàn)
業(yè)務多樣化只是相對而言,與傳統(tǒng)IDC相比,云計算支持下的IDC正在實現(xiàn)這一特征,這與移動終端業(yè)務的支持有直接關系。
四、結(jié)束語
應用分布式存儲技術(shù)于大數(shù)據(jù)中心建設中,需要我們能夠結(jié)合實際情、環(huán)境和需求還選擇合適的部署方案。建設空間和資源是當前我們比較關注的兩方們問題,對于如何去解決這些問題,還需要我們能靈活運用好相應的技術(shù)和方案。希望本文的建議能給大家?guī)韼椭?/p>
參? 考? 文? 獻
[1]辛宇.網(wǎng)絡安全的分布式異構(gòu)存儲網(wǎng)絡安全技術(shù)分析[J].電子世界,2021(01):170-171.
[2]張恒均.分布式存儲——數(shù)據(jù)中心建設解決策略研究[J].數(shù)碼世界,2020(10):54-55.
[3]王晶晶.分布式存儲——大數(shù)據(jù)中心建設解決方案研究[J].電腦知識與技術(shù),2017,13(11):14-16.