崔超
摘 要:現(xiàn)階段,計(jì)算機(jī)和網(wǎng)絡(luò)正在快速發(fā)展,并在生產(chǎn)、生活中發(fā)揮著越來越重要的作用。與此同時(shí),人們對(duì)計(jì)算機(jī)和網(wǎng)絡(luò)的有關(guān)功能也提出了更高要求。在此推動(dòng)下,云計(jì)算和云數(shù)據(jù)管理應(yīng)運(yùn)而生,能夠?yàn)椴煌挠脩籼峁┫鄳?yīng)的計(jì)算服務(wù)、存儲(chǔ)服務(wù)、其他軟件服務(wù)。本文將基于云計(jì)算和云數(shù)據(jù)管理技術(shù)進(jìn)行相應(yīng)的分析,以期為同行提供一些有益的參考。
關(guān)鍵詞:云計(jì)算;云數(shù)據(jù);管理技術(shù)
1 云計(jì)算概述
1.1 工作原理
云計(jì)算工作原理如下:無需借助本地計(jì)算機(jī)(或者是遠(yuǎn)程服務(wù)器)[2],便能夠?qū)⒂?jì)算合理分布在一系列分布式計(jì)算機(jī)上,以實(shí)現(xiàn)對(duì)企業(yè)數(shù)據(jù)中心運(yùn)行的有效優(yōu)化,并和互聯(lián)網(wǎng)形成有效對(duì)接。如此一來,企業(yè)便能夠?qū)⑺栀Y源及時(shí)而準(zhǔn)確地切換到相關(guān)應(yīng)用上,然后結(jié)合實(shí)際需求對(duì)相關(guān)計(jì)算機(jī)及存儲(chǔ)系統(tǒng)進(jìn)行即時(shí)訪問。云計(jì)算屬于一項(xiàng)極具實(shí)用價(jià)值的新技術(shù),使計(jì)算能力具有商品性質(zhì),并通過網(wǎng)絡(luò)予以兜售,不僅節(jié)約了銷售成本,同時(shí)還具有實(shí)用快捷的優(yōu)點(diǎn)。
1.2 體系結(jié)構(gòu)
云計(jì)算體系結(jié)構(gòu)具有一定的復(fù)雜性,且較為龐大,以“云”網(wǎng)絡(luò)為中樞,連接一系列并發(fā)的網(wǎng)絡(luò)計(jì)算以及相關(guān)服務(wù),能夠在虛擬化技術(shù)的幫助下,對(duì)各個(gè)服務(wù)器的能力進(jìn)行擴(kuò)展,并借助云計(jì)算平臺(tái)把一系列資源有機(jī)地結(jié)合在一起,從而為用戶提供強(qiáng)大的計(jì)算能力及存儲(chǔ)能力[3]。一個(gè)相對(duì)完整的體系主要包括四大部分,一是云端用戶,二是服務(wù)目錄,三是管理系統(tǒng),四是部署工具、監(jiān)控、服務(wù)器集群。
2 云數(shù)據(jù)管理技術(shù)
2.1 特點(diǎn)
云計(jì)算中數(shù)據(jù)主要具有三大特點(diǎn),一是海量性,二是異構(gòu)性,三是非確定性。
2.2 相關(guān)技術(shù)概述
GFS技術(shù),Google文件系統(tǒng)是一個(gè)大型的分布式文件系統(tǒng);BigTable技術(shù),建立在GFS和MapReduce之上的一個(gè)大型的分布式數(shù)據(jù)庫(kù);Dynamo技術(shù),是一個(gè)高可用,專有的鍵值結(jié)構(gòu)化存儲(chǔ)系統(tǒng),或分布式存儲(chǔ)系統(tǒng);MapReduce技術(shù),即MapRedace編程模式。
2.3 云數(shù)據(jù)管理技術(shù)分析
隨著研究的不斷深入,以GFS為代表的一系列云計(jì)算數(shù)據(jù)管理技術(shù)也得以不斷完善,并圍繞云計(jì)算所涉及的海量數(shù)據(jù)計(jì)算、存儲(chǔ)以及應(yīng)用問題,提出了諸多創(chuàng)新,云數(shù)據(jù)管理技術(shù)的總體架構(gòu)如圖1所示。
云計(jì)算數(shù)據(jù)管理可被歸結(jié)為4個(gè)層次:⑴數(shù)據(jù)組織與管理。在分布式存儲(chǔ)技術(shù)的幫助下,可對(duì)大型數(shù)據(jù)予以訪問,可對(duì)分布式數(shù)據(jù)予以訪問,還可對(duì)大量數(shù)據(jù)予以訪問,以GFS技術(shù)為代表,能夠適應(yīng)于一系列相同或者類似的普通硬件上,具有強(qiáng)大的容錯(cuò)功能,從而保證了用戶對(duì)數(shù)據(jù)的訪問、獲取及存儲(chǔ)需求,不僅可靠,而且高并發(fā),還具有高性能的特點(diǎn)。⑵數(shù)據(jù)集成與管理。針對(duì)數(shù)據(jù)所具有的海量性、異構(gòu)性以及非確定性特點(diǎn),借助以Bigtabe為代表的一系列分布式數(shù)據(jù)管理技術(shù)以實(shí)現(xiàn)對(duì)大規(guī)模數(shù)據(jù)的高效分析及系統(tǒng)處理,從而為用戶提供更為及時(shí)、準(zhǔn)確、優(yōu)質(zhì)的服務(wù)。⑶分布式并行處理。在分布式環(huán)境下,為了實(shí)現(xiàn)對(duì)數(shù)據(jù)的深層次挖掘和高效處理,采用建立在云計(jì)算這一基礎(chǔ)之上的并行編程模式,以MapReduce技術(shù)為例,能夠?qū)θ蝿?wù)予以自動(dòng)劃分,使其成為多項(xiàng)子任務(wù),先后經(jīng)過映射及化簡(jiǎn)處理,便能將任務(wù)在大型化規(guī)模計(jì)算節(jié)點(diǎn)中進(jìn)行理想調(diào)度和有機(jī)分配。在此過程中,無論是后臺(tái)并行執(zhí)行,又或者是后臺(tái)任務(wù)調(diào)度,均以透明、公開的形式面向編程人員及用戶。⑷數(shù)據(jù)分析。對(duì)于云計(jì)算數(shù)據(jù)管理而言,在最后階段,需對(duì)數(shù)據(jù)展開相應(yīng)分析及深層次發(fā)掘,并為一系列應(yīng)用提供服務(wù),通常借助專業(yè)的數(shù)據(jù)挖掘引擎以實(shí)現(xiàn)對(duì)數(shù)據(jù)的綜合布局和合理調(diào)度。另外,還可借助淺(深)層語(yǔ)義分析技術(shù)以實(shí)現(xiàn)在不完全確定知識(shí)的前提下對(duì)數(shù)據(jù)展開深層次的挖掘,如此一來,便能夠從結(jié)構(gòu)化關(guān)系數(shù)據(jù)庫(kù)所包含的一系列數(shù)據(jù)、文本(有可能以半結(jié)構(gòu)化存在)、圖形及圖像信息中提取出潛在的、事先尚未獲知的、有價(jià)值的、且能夠?yàn)橛脩羲x懂的數(shù)據(jù)。
3 結(jié)束語(yǔ)
云計(jì)算由于具有海量性、異構(gòu)性以及非確定性等一系列優(yōu)點(diǎn),因而在現(xiàn)階段得到了廣泛應(yīng)用,且展現(xiàn)出了良好的應(yīng)用前景。然而云計(jì)算的云計(jì)算管理畢竟發(fā)展時(shí)間不長(zhǎng),還存在諸多不完善之處,機(jī)遇和挑戰(zhàn)共存,有鑒于此,本文提出了基于數(shù)據(jù)組織與管理、數(shù)據(jù)集成與管理、分布式并行處理、數(shù)據(jù)分析的4層次云數(shù)據(jù)管理方式,這也是未來一段時(shí)間內(nèi),云計(jì)算數(shù)據(jù)管理的一個(gè)主要發(fā)展方向。
[參考文獻(xiàn)]
[1]全快.分析云計(jì)算和云數(shù)據(jù)管理技術(shù)[J].無線互聯(lián)科技,2012,10:84.
[2]高偉.淺淡云計(jì)算和云數(shù)據(jù)管理技術(shù)[J].無線互聯(lián)科技,2013,02:29.
[3]南志海.云計(jì)算和云數(shù)據(jù)管理技術(shù)探討[J].硅谷,2013,06:7+3.