張華炎
摘要:全球數(shù)據(jù)的不斷海量增長給組織的存儲系統(tǒng)帶來了極大的挑戰(zhàn),同時,商務(wù)智能的興起使得數(shù)據(jù)的流通越來越頻繁,企業(yè)高管也越來越迫切需要釋放數(shù)據(jù)信息更多的價值。傳統(tǒng)的存儲系統(tǒng)或者方式已經(jīng)越來越難滿足企業(yè)對數(shù)據(jù)存儲以及釋放價值的需求,越來越的企業(yè)開始將這目光逐漸轉(zhuǎn)移到新興的云模式之上。作為云不可或缺的基礎(chǔ)設(shè)施存儲系統(tǒng)也越來越受到企業(yè)的關(guān)注,其需要綜合考量存儲設(shè)備的安全與穩(wěn)定性、靈活性、可擴(kuò)展性以及易用性等四大因素。該文旨在探析企業(yè)中如何應(yīng)用云存儲。
關(guān)鍵詞:云存儲;服務(wù);云備份
中圖分類號:TP393文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2012)15-3558-03
1安全與穩(wěn)定是基礎(chǔ),部署云必然要進(jìn)行數(shù)據(jù)遷移
隨著企業(yè)對新興業(yè)務(wù)的要求越來越高,特別是互聯(lián)網(wǎng)時代導(dǎo)致數(shù)據(jù)量大幅度提高,企業(yè)對于數(shù)據(jù)挖掘,對于人特別是屬性選擇的不同取向,使得企業(yè)IT系統(tǒng)最終形成的架構(gòu)需求不一樣,這也導(dǎo)致整個互聯(lián)網(wǎng)或者是存儲、計算都向云的方向去轉(zhuǎn)變。云存儲系統(tǒng)構(gòu)建時,安全和穩(wěn)定性是企業(yè)對存儲設(shè)備的最根本的要求,而這也是企業(yè)在考慮向云端過渡時,選購存儲設(shè)備進(jìn)行云存儲架構(gòu)設(shè)計最為關(guān)心的一點(diǎn)。
存儲是一個很“保守”的行業(yè),通常剛進(jìn)入存儲行業(yè)的新人都會被“老鳥”告誡,如果它(存儲)不出問題,那么就不要去動它。因?yàn)槠髽I(yè)的所有數(shù)據(jù)信息都存儲在里面,你必須要為企業(yè)的未來負(fù)責(zé),如果你對存儲沒有十足的把握,那么你就不要去動它,一旦某個操作出現(xiàn)問題,極有可能導(dǎo)致的后果就是企業(yè)數(shù)據(jù)丟失,而這一風(fēng)險所造成的后果是任何人都無法承擔(dān)。因此,安全與穩(wěn)定性(可靠性)是存儲系統(tǒng)的必備特點(diǎn),也是企業(yè)在考慮部署云存儲系統(tǒng)采用存儲基礎(chǔ)設(shè)施時,首要考量的因素。
但在談到企業(yè)在云端過渡時,卻又不得不“動”這些數(shù)據(jù)。當(dāng)企業(yè)一旦實(shí)施云部署后,就應(yīng)該將已有數(shù)據(jù)遷移到新的系統(tǒng)之中,這也是出于安全與穩(wěn)定性考慮。這些看起來似乎跟上面所說的有些“相?!保琁T系統(tǒng)(設(shè)備)都有生命周期,一般而言大多是3到5年,當(dāng)企業(yè)實(shí)施云之后,必然要將數(shù)據(jù)從原來的主存儲系統(tǒng)遷移到新的云存儲系統(tǒng)之中,新的主存儲系統(tǒng)盡量采用生命周期一致的設(shè)備。如果新的主存儲系統(tǒng)中包含了原有存儲系統(tǒng)的話,由于生命周期的緣故,原有系統(tǒng)中出現(xiàn)故障就會影響新存儲系統(tǒng)的性能。
在可靠性方面,存儲系統(tǒng)越簡單,其可靠性越高,如果一個業(yè)務(wù)系統(tǒng)橫跨在兩個存儲系統(tǒng)之上,其可靠性會大幅下降。如果說單個存儲系統(tǒng)的可靠性是五個9的話,那在這種情況下,其可靠性可能只能達(dá)到三個9,甚至更低。一個業(yè)務(wù)系統(tǒng)橫跨在多個存儲系統(tǒng)之上的話,整體可靠性將受到可靠性最低的存儲系統(tǒng)的局限。這一點(diǎn)很像管理學(xué)中的“短板效應(yīng)”。
當(dāng)然,這并不是說就要丟棄原有的IT設(shè)備,為了最大化保護(hù)已有投資,企業(yè)原有的存儲設(shè)備仍可作為備用存儲系統(tǒng),利用用做備份等等。而這樣的話,就必然會進(jìn)行數(shù)據(jù)遷移,關(guān)于數(shù)據(jù)遷移的風(fēng)險,對于惠普而言,并不是一個太大的問題。因?yàn)榛萜赵跀?shù)據(jù)遷移方面擁有豐富的經(jīng)驗(yàn),并有自己的一套方法論,并有一個專門的團(tuán)隊幫助用戶進(jìn)行數(shù)據(jù)遷移。
2云與傳統(tǒng)存儲的差別:可擴(kuò)展性與靈活性
現(xiàn)在很多廠商在宣傳產(chǎn)品的時候都會提到可擴(kuò)展性和靈活性,而這兩點(diǎn)恰恰也是云存儲的兩大特點(diǎn)。那么區(qū)別于云存儲和傳統(tǒng)存儲的分水嶺在哪兒呢?是應(yīng)用,即傳統(tǒng)的應(yīng)用和非傳統(tǒng)的應(yīng)用。傳統(tǒng)的應(yīng)用是在基于企業(yè)已有數(shù)據(jù)量之上,可對未來的數(shù)據(jù)增長情況進(jìn)行估量,也就是說,在三到五年內(nèi),企業(yè)數(shù)據(jù)量的增長情況是可以掌控的,數(shù)據(jù)的訪問頻率也趨于一種平緩,有規(guī)律的方式增長。
而非傳統(tǒng)應(yīng)用則與之相反,企業(yè)很難在三到五年內(nèi)找到一種規(guī)律去預(yù)估數(shù)據(jù)量的增長情況。在海量數(shù)據(jù)背景下,不管是對數(shù)據(jù)進(jìn)行挖掘分析,還是因?yàn)橛脩舻男枨螅髽I(yè)整體IT架構(gòu)可能因?yàn)楸旧順I(yè)務(wù)的需求,或者高層決策者的特點(diǎn)(保守、激進(jìn)),其必然都會要求存儲基礎(chǔ)設(shè)施具備可擴(kuò)展性和高靈活性。
可擴(kuò)展性并不僅僅指是的容量的增長,而是隨存儲容量的增長,其存儲性能也必須隨之增長以滿足企業(yè)的業(yè)務(wù)需求,而這一點(diǎn)尤其是在虛擬環(huán)境下尤為重要。云有一大特性,或者說是優(yōu)勢,就是將企業(yè)的IT資源進(jìn)行集中管理并統(tǒng)一分配,而集中管理必然就會涉及到虛擬化技術(shù)等等,部署虛擬化也被認(rèn)為是實(shí)現(xiàn)云的必要前提。如企業(yè)一項新業(yè)務(wù)剛剛上線,初始也許只需要30臺虛機(jī),但隨著業(yè)務(wù)的發(fā)展,可能一下子需要100臺甚至200臺虛機(jī)。在部署虛機(jī)時,最大的數(shù)據(jù)量實(shí)際上來源于操作系統(tǒng),操作系統(tǒng)不斷的拷貝,會占用大量的存儲空間。當(dāng)然現(xiàn)在硬盤的容量是很大,也許傳統(tǒng)存儲能夠滿足新業(yè)務(wù)對容量的需求。但性能呢?大規(guī)模部署虛機(jī)所能收獲的只是運(yùn)算能力或者說服務(wù)能力的提高,其核心數(shù)據(jù)的容量也許并不會按比例增長,對卻會對存儲性能產(chǎn)生極大的需求。如果容量增長了,但性能卻不能增長,這可能會使企業(yè)遭受更大的損失。
其實(shí)上面這個例子也體現(xiàn)出云存儲的靈活性,即能夠?qū)π略鰳I(yè)務(wù)進(jìn)行快速支持?,F(xiàn)在數(shù)據(jù)量猛增,業(yè)務(wù)部門對于新業(yè)務(wù)的預(yù)估通常是不夠準(zhǔn)備的,如果采用傳統(tǒng)存儲設(shè)備的話,必然給運(yùn)維部門帶來極大的難題。傳統(tǒng)存儲設(shè)備通常是采用預(yù)留的方式,根據(jù)業(yè)務(wù)部門提供的預(yù)估數(shù)據(jù)對存儲空間進(jìn)行預(yù)留,這種方式的低效性從去年春節(jié)的鐵道部購票網(wǎng)站即可反應(yīng)出來,最初是預(yù)售點(diǎn),然后加入電話售票,最后又開通網(wǎng)絡(luò)售票,但在開通網(wǎng)站售票之后,后端無法提供相應(yīng)的性能,最終導(dǎo)致“吃力不討好”的局面。傳統(tǒng)方式在新環(huán)境下解決新的問題存在著諸多挑戰(zhàn),而企業(yè)要部署私有云系統(tǒng)必然要考慮到這些因素。
3易用性:管理必須走向智能化、自動化
部署私有云存儲系統(tǒng)的存儲設(shè)備在滿足了可靠性(安全與穩(wěn)定性)、可擴(kuò)展與高靈活性等需求之后,其還必須具備易用性這一特點(diǎn)。企業(yè)在部署私用云之后,IT資源進(jìn)行集中管理與統(tǒng)一分配,這就必然導(dǎo)致IT部門的運(yùn)維、管理工作大幅增加,尤其是在一些大規(guī)模數(shù)據(jù)中心和超大規(guī)模數(shù)據(jù)中心之中,大量的運(yùn)維管理人員必然給企業(yè)帶來極大的人力成本。
但在傳統(tǒng)運(yùn)維管理中,企業(yè)通常采用的是“術(shù)業(yè)有專攻”的方式,如數(shù)據(jù)中心管理員、存儲管理員等等一系列職位,每個員工對于自己的“分內(nèi)之事”非常精通,但在其他領(lǐng)域就顯得“心有余而力不足”,但如果這種方式不加以改變,在云環(huán)境下,IT管理員是很難掌控企業(yè)內(nèi)部的所有業(yè)務(wù)系統(tǒng)變化的方式和特點(diǎn)。
并且,企業(yè)都是有預(yù)算限制的,也不大可能為每一個業(yè)務(wù)系統(tǒng),或者某個設(shè)備配備一個管理員?,F(xiàn)在國外的廠商通常會提到這樣一個衡量標(biāo)準(zhǔn),每個管理員能夠管理多少數(shù)據(jù)。比如說原來的傳統(tǒng)存儲,通常是說每個管理員能夠管理多少個業(yè)務(wù)系統(tǒng),但企業(yè)實(shí)際上真正關(guān)心的還是每個業(yè)務(wù)系統(tǒng)有多少數(shù)據(jù),用可管理的數(shù)據(jù)量來衡量管理員的業(yè)務(wù)熟練度。
讓IT管理員精通數(shù)據(jù)中心內(nèi)的每一種設(shè)備顯然是不太可能的,從用戶角度來看,其必然就要求廠商(IT基礎(chǔ)設(shè)施)具有簡易性。如果企業(yè)整個系統(tǒng)的復(fù)雜度降低,就必然給日常管理帶來極大的簡便性,這樣也使得每個管理員管理的數(shù)據(jù)量大幅上漲,有效降低企業(yè)的人力成本。這也是為何很多廠商在公開招標(biāo)的時候,客戶都會很看重原廠服務(wù)這一指標(biāo),因?yàn)閺S商肯定是最了解自己產(chǎn)品的。
但這樣同樣會產(chǎn)生另外一種尷尬情況,廠商雖然了解自己的產(chǎn)品,但卻并不了解客戶的系統(tǒng)。一旦出現(xiàn)問題,廠商希望能夠盡量用安全保守的方式來解決問題,而客戶希望在最快時間內(nèi)解決問題。但廠商并不了解客戶的系統(tǒng),在短時間內(nèi)無法知曉問題產(chǎn)生的根源,這就必然導(dǎo)致處理時間跟維護(hù)時間的大幅延長。
而如果存儲設(shè)施具備易用性特點(diǎn),能夠自動地智能化地查找故障并進(jìn)行自我修復(fù),IT管理員只需在控制臺通過鼠標(biāo)操作就能解決問題。而這也符合IT行業(yè)的整個發(fā)展趨勢,朝著智能化和自動化的方向發(fā)展。
4云備份:迎合移動辦公趨勢
我們認(rèn)為,數(shù)據(jù)信息已經(jīng)成為企業(yè)運(yùn)營的命脈所在,必須有多重的備份保障。某些發(fā)達(dá)國家甚至訂立法規(guī),要求一些行業(yè),如金融、保險機(jī)構(gòu)必須進(jìn)行多重數(shù)據(jù)備份,確保重要的數(shù)據(jù)受到保護(hù),例如911事件發(fā)生后,美國的股市仍能有效運(yùn)行,便是歸功于多重的數(shù)據(jù)備份方案。因此,當(dāng)今企業(yè)特別需要在總部以外的地方,建立數(shù)據(jù)備份方案,而新興的云備份就可以有效地解決這個問題,把企業(yè)數(shù)據(jù)儲存在網(wǎng)絡(luò)上,即使是在海外工作的員工,也可隨時通過隨身的智能手機(jī)、平板電腦,經(jīng)由網(wǎng)絡(luò)取得所需的企業(yè)數(shù)據(jù)。
5傳統(tǒng)備份模式各有缺點(diǎn)
云備份服務(wù)問世前,信息備份多使用磁盤、光盤、移動硬盤及網(wǎng)絡(luò)儲存等方法,各自存在一定的缺點(diǎn)。其中磁盤備份讀取速度較慢,磁粉經(jīng)長時間儲存容易流失,儲存數(shù)據(jù)容易丟失而不能恢復(fù);光盤備份的情況與磁盤備份相似,不能作為長遠(yuǎn)的備份工具。
移動硬盤的價格較便宜,但輕便易攜帶的特點(diǎn)反而成為缺點(diǎn),容易導(dǎo)致盜竊或遺失等問題。企業(yè)自行架設(shè)網(wǎng)絡(luò)儲存工具,是最為可靠的方法,然而在運(yùn)作、維護(hù)上的成本都很高,非中小企業(yè)所能負(fù)擔(dān)。
6云備份也講求安全性
從成本效益考慮,相信云備份可滿足更多用戶的需求。雖然市場上有不少免費(fèi)的在線儲存及備份軟件,但是這些公用軟件的安全問題不容忽視,不久前Hotmail便發(fā)生事障,部分用戶發(fā)現(xiàn)儲存郵件不翼而飛,這使得云備份的安全可靠性充分凸顯了出來。
我們建議企業(yè)應(yīng)選用具備高度安全技術(shù)的云備份服務(wù),為備份數(shù)據(jù)進(jìn)行加密,即使數(shù)據(jù)信息泄露給第三方,對方也無法讀取敏感信息。例如第一線云端數(shù)據(jù)庫(Cloud Data Safe)就是通過加密的互聯(lián)網(wǎng)傳送,可以非常安全地為數(shù)據(jù)庫服務(wù)器、郵件服務(wù)器、文件服務(wù)器,甚至是桌上及手提電腦提供數(shù)據(jù)備份。
7云存儲解決企業(yè)容災(zāi)備份
自從有了計算機(jī)技術(shù),便有了數(shù)據(jù),于是也就有了數(shù)據(jù)安全。但是在應(yīng)用的過程中,數(shù)據(jù)總是受到自然的或者人為的可抗以及不可抗力的影響,從而造成了很多損失,于是就有了容災(zāi)備份這個概念。關(guān)于容災(zāi)備份,眾說紛紜,無論是IT管理員,還是行業(yè)專家,各有各的說法,紛繁復(fù)雜的技術(shù)和理念,爭奇斗妍的方案和產(chǎn)品,讓人難免云里霧里。通常我們都把容災(zāi)備份連在一起,而實(shí)際上容災(zāi)和備份之間還是有區(qū)別的。
從定義上看,備份是指用戶為應(yīng)用系統(tǒng)產(chǎn)生的重要數(shù)據(jù)(或者原有的重要數(shù)據(jù)信息)制作一份或者多份拷貝,以增強(qiáng)數(shù)據(jù)的安全性。因此,備份與容災(zāi)所關(guān)注的對象有所不同,備份關(guān)系數(shù)據(jù)的安全,容災(zāi)關(guān)心業(yè)務(wù)應(yīng)用的安全,我們可以把備份稱作是“數(shù)據(jù)保護(hù)”,而容災(zāi)稱作“業(yè)務(wù)應(yīng)用保護(hù)”。備份最多表現(xiàn)為通過備份軟件使用磁帶機(jī)或者磁帶庫將數(shù)據(jù)進(jìn)行拷貝,也有用戶使用磁盤、光盤作為存儲介質(zhì);容災(zāi)則表現(xiàn)為通過高可用方案將兩個站點(diǎn)連接起來。
而對于用戶來說,真正關(guān)心的只有兩點(diǎn):首先,是否可以保證數(shù)據(jù)不丟失;其次,是否可以保證應(yīng)用不間斷。在我們的IT應(yīng)用中,也接觸到一些可能是解決這些問題的應(yīng)用,比如雙機(jī)高可用方案就是解決應(yīng)用不間斷的問題。但真正意義上的容災(zāi),必須具備同時保證數(shù)據(jù)不丟失和應(yīng)用不間斷的能力,這也是容災(zāi)的最基本的目標(biāo)。
綜上所述,備份到云端的好處顯而易見:無需備份體系架構(gòu),最小化企業(yè)對IT資源的需求,并且按需付費(fèi)的方式可以將IT變成每月企業(yè)運(yùn)營成本的一部分。不過考慮到安全性的問題和恢復(fù)上的風(fēng)險,這方面的優(yōu)勢可能會打上折扣,尤其是當(dāng)有海量數(shù)據(jù)需要從云端進(jìn)行恢復(fù)時。隨著更多的云服務(wù)應(yīng)用,基于可供選擇的云備份技術(shù)日益增多,這給于企業(yè)更多的應(yīng)用選擇。
參考文獻(xiàn):
[1] Hayes B. Cloud Computing [J]. Communications of the ACM, 2008,51(7):9-11.
[2] Ling, Dasmalchi G, Zhu J. Cloud Computing and IT as a Service: Opportunities and Challenges [C]//Proceedings of the IEEE 6th Interna tional Conference on Web Services (ICWS08), Sep 23-26, 2008, BEijing, China. Los Alamitos, CA,USA: IEEE Computer Society, 2008: 5.
[3] Namjoshi J, Gupte A. Service Oriented Architecture for Cloud Based Travel Reservation Software as a Service [C]//Proceedings of the 2009 IEEE International Conference on Cloud Computing (CLOUD09), Sep 21-25,2009, Bangalore, India. Los Alamitos, CA,USA: IEEE Computer Society , 2009:147-150
[4] Laplante P A, Zhang J, Voas J. Whats in a Name Distinguishing Between SaaS and SOA [J]. IT Professional, 2008,10(3):46-50.
[5] Campbell-kelly M. Historical Reflections on the Rise, Fall, and Resurrection of Software as a Service [J]. Communications of the ACM, 2009, 52(5): 28-30.
[6]王慶波,金,何樂,等.虛擬化與云計算[M].北京:電子工業(yè)出版社, 2009.
[7] Zhu B, Li K, Patterson H. Avoiding the Disk Bottleneck in the Data Domain Deduplication File System [C]//Proceedings of the 6th USE NIX Conference on File and Storage Technologies (FAST08), Feb 26-29, 2008, San Jose, CA, USA. Berkeley, CA, USA: USENIX Asso ciation, 2008:269-282.
[8]田敬,代亞非. P2P持久存儲研究綜述[J].軟件學(xué)報, 2007, 18(6):1379-1399.
[9] Lillibridge M, Elnikety S, Birrell A, et al. A Cooperative Internet Backup Scheme [C]//Proceedings of the 2003 USENIX Annual Techni cal Conference (USENIX 03), Jun 12-14, 2003, San Antonio, TX, USA. Berkeley, CA, USA: USENIX Association, 2003: 29-41.
[10] Pamies-juarez L, Garcia-lopez P, Sanchez-artigas M. Rewarding Stability in Peer-to-Peer Backup Systems [C]//Proceedings of 16th IEEE International Conference on Networks (ICON08), Dec 12-14, 2008, New Delhi, India. Piscataway, NJ,USA: IEEE, 2008: 6p.