国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

云計算環(huán)境下的大規(guī)模圖數(shù)據(jù)處理技術(shù)

2015-12-01 03:31
決策與信息 2015年30期
關(guān)鍵詞:處理技術(shù)云計算

?

云計算環(huán)境下的大規(guī)模圖數(shù)據(jù)處理技術(shù)

王欣

廣州工程技術(shù)職業(yè)學(xué)院 廣東廣州 510000

[摘要]隨著不斷發(fā)展科學(xué)技術(shù),已經(jīng)逐漸進入到高科技時代,大力發(fā)展計算機技術(shù),經(jīng)過數(shù)年的發(fā)展得到了很大成果。云計算技術(shù)是完美結(jié)合互聯(lián)網(wǎng)技術(shù)和計算機技術(shù)的一種技術(shù)形式,引發(fā)IT行業(yè)的改革和進步,此外,經(jīng)過不斷深入研究生物信息網(wǎng)絡(luò)技術(shù)等,已經(jīng)能夠廣泛應(yīng)用大規(guī)模圖數(shù)據(jù)處理技術(shù),充分符合社會發(fā)展實際需求。本文主要分析了云計算環(huán)境下的大規(guī)模圖數(shù)據(jù)處理技術(shù)。

[關(guān)鍵詞]云計算;大規(guī)模圖數(shù)據(jù);處理技術(shù)

計算機技術(shù)中比較常用的抽象數(shù)據(jù)結(jié)構(gòu)就包括圖,相比較樹和線性表來說,語言以及結(jié)構(gòu)變得更復(fù)雜,存在一定表示能力,實際生活中不少領(lǐng)域都在合理應(yīng)用圖結(jié)構(gòu),到處都能發(fā)現(xiàn)與圖有關(guān)的應(yīng)用以及處理,例如傳統(tǒng)應(yīng)用,科技文獻引用、預(yù)測疾病爆發(fā)路徑、確定最合理運輸線路等。新應(yīng)用,生物信息網(wǎng)分析、分析語義Web、分析社交網(wǎng)路等。雖然已經(jīng)過很長時間的發(fā)展和應(yīng)用,但是隨著不斷發(fā)展科學(xué)技術(shù),使得出現(xiàn)更多、更大的圖規(guī)模,需要不斷完善理論基礎(chǔ),確??梢愿咝幚泶笠?guī)模圖。

一、云計算簡介

在高速發(fā)展互聯(lián)技術(shù)的基礎(chǔ)上形成了云計算技術(shù),屬于全新計算方式,主要核心就是互聯(lián)網(wǎng)。在2007年云計算被美國IBM提出,這也是第一次提出云計算,依據(jù)此,云計算主要就是用來描述一種類型或者一個系統(tǒng)平臺中的應(yīng)用程序,具備數(shù)據(jù)存儲量大、處理能力強、靈活性高以及可擴展性和通用性的優(yōu)勢和特點,目前已經(jīng)得到廣泛應(yīng)用[1]。

二、云計算環(huán)境下大規(guī)模圖數(shù)據(jù)處理技術(shù)的

圖實際上是非線性數(shù)據(jù)結(jié)構(gòu),具備一定多對多關(guān)系,在圖數(shù)據(jù)中,可以通過零個或者多個直接后繼和直接前趨構(gòu)成相關(guān)元素,相比較其他形式結(jié)構(gòu)來說,圖數(shù)據(jù)具備相對更加豐富的語義,已經(jīng)被大量運用到工程、科研等方面,因為圖數(shù)據(jù)具備非常多的數(shù)據(jù)量,因此,分析和研究對大規(guī)模圖數(shù)據(jù)處理技術(shù)已經(jīng)逐漸發(fā)展成為廣泛關(guān)注的重點。通過不斷的研究和分析,已經(jīng)具備一定水平的圖處理技術(shù),日益完善相關(guān)技術(shù)理論,為應(yīng)用大規(guī)模圖技術(shù)提供基礎(chǔ)和保障,但是由于不斷發(fā)展信息技術(shù),促使快速發(fā)展多種多樣的信息,導(dǎo)致存在越來越大規(guī)模的圖數(shù)據(jù),因此,需要適當提高研究而大規(guī)模圖數(shù)據(jù)處理技術(shù)的力度,為有效處理大規(guī)模圖數(shù)據(jù)提供平臺[2]。可以從以下幾方面進行分析:

(一)云計算環(huán)境下存儲圖數(shù)據(jù)的方式

在充分研究和分析大量資料和文獻之后得到,目前,在應(yīng)用以及管理大規(guī)模圖數(shù)據(jù)處理技術(shù)的時候,其中主要包括超圖數(shù)據(jù)模型、單圖數(shù)據(jù)模型兩種常用數(shù)據(jù)模型,上述兩種數(shù)據(jù)模型都可以在一定程度上對無向圖和有向圖進行相應(yīng)處理,但是兩種方式最根本區(qū)別就是不同的存儲格式。大規(guī)模體數(shù)據(jù)進行存儲的時候,最基本的就是云計算分布式存儲系統(tǒng),可以把云計算分布系統(tǒng)分為分布式數(shù)據(jù)庫以及分布式文件系統(tǒng)兩種形式。分布式文件系統(tǒng)中最重要就是HDFS和GFS,能夠直接存放臨接矩陣和對接表;分布式數(shù)據(jù)庫,也就是說NoSQL,其中最重要的就是Hbase和Big Tabl。分布式數(shù)據(jù)庫可以分為以下將基本數(shù)據(jù)模型:主要包括KV存儲模型、CFS列族存儲模型、DS文檔存儲模型。DS模型具備方便、靈活的優(yōu)勢,比較適合使用存儲結(jié)構(gòu)化數(shù)據(jù),此模型不適合對圖數(shù)據(jù)進行存儲。經(jīng)過大量數(shù)據(jù)分析研究表明,KV存儲模型十分適合存儲大規(guī)模圖數(shù)據(jù),KV存儲模型存在支持哈量存儲、高并發(fā)查詢以及模式結(jié)構(gòu)簡單的特點,在處理Page Rank等圖數(shù)據(jù)的時候,一般情況不會出現(xiàn)復(fù)雜操作,能夠符合數(shù)據(jù)處理的基本需求,如果是利用鄰接表的方式形成圖數(shù)據(jù),Key就是圖的源頂點,Value就是出邊信息和點的值,可以更加方便的遷移和合并數(shù)據(jù),增加空間局部性,大幅度降低處理查詢過程中讀取數(shù)據(jù)的次數(shù),可以在一定程度上提高效率[3]。

(二)云計算環(huán)境下分割圖數(shù)據(jù)

一般來說,云計算環(huán)境中處理大規(guī)模圖數(shù)據(jù),處理方式應(yīng)該是分布式并行,因為圖計算存在一定強耦合性、圖數(shù)據(jù)具備連通性,為了能夠更加高效的處理圖數(shù)據(jù),應(yīng)該適當降低子圖數(shù)據(jù)之間耦合度,圖分割是有效實現(xiàn)目標的主要方式?;玖鞒淌牵菏紫刃枰纸o具備相對比較完整邏輯結(jié)構(gòu)的大圖,然后在分布存儲系統(tǒng)節(jié)點中分別放置分割部分,進行適當處理,并且每個子圖啟動以后都需要能夠具備與之對應(yīng)的計算服務(wù),在處理完子圖以后,就達到處理大圖的目的。在上述處理過程總,分割大圖以后,能夠得到相對比較好的分割效果,但是在對大圖進行分割的時候,需要重合分析圖規(guī)模均衡性以及內(nèi)部連通性,保證能夠降低子圖連通性,增加內(nèi)部連通性,可以在一定程度上影響分布并行處理大數(shù)據(jù)機制的運行。此外,也應(yīng)該降低子圖規(guī)模均衡性,不能形成比較大的偏斜,避免由于過大時間差距影響系統(tǒng)同步性[4]。

(三)云計算環(huán)境下的圖數(shù)據(jù)計算模型

現(xiàn)階段,基于云計算基礎(chǔ)上具備兩種應(yīng)用廣泛的模型,包括BSP模型以及Map Reduce模型。

1、Map Reduce模型

Map Reduce模型主要包括由多個reduce、map共同形成的并行處理方式,可以把執(zhí)行任務(wù)階段分為兩部分,一是Reduce階段,在此過程中,Reduce任務(wù)會聚集處理接收到的數(shù)據(jù),從而得到相關(guān)輸出結(jié)果,并且能夠在分布式文件中保存數(shù)據(jù)。二是Map階段,此過程中,Map任務(wù)會合理計算分配到系統(tǒng)的數(shù)據(jù),輸出與之對應(yīng)的key值,然后在reduce任務(wù)中映射出相對應(yīng)的數(shù)據(jù)信息。

2、BSP模型

BSP模型主要就是說在并行執(zhí)行消息通信的時候,具備好、數(shù)據(jù)競爭以及免鎖死的運行特點,在云計算環(huán)境下處理大規(guī)模圖數(shù)據(jù)需要合理使用上述模型,在迭代處理的時候,相比較Map Reduce模型來說,BSP模型具備相對比較高的執(zhí)行效率。

(四)云計算環(huán)境下處理查詢圖數(shù)據(jù)

基于云計算基礎(chǔ)上,主要存在兩種能夠支持處理查詢大規(guī)模圖數(shù)據(jù)的驅(qū)動模式,也就是被動遍歷模式和主動遍歷模式。上述兩種模式具存在圖頂點是操作對象的共同特點,也就是說操作處理技術(shù)的基本關(guān)鍵就是圖頂點。第一,被動模式。上述處理模式能夠不進行調(diào)用處理函數(shù),可以適當降低處理不必要頂點,大量節(jié)約資源。第二,主動遍歷模式。上述處理模式,具備比較強實用性,但是應(yīng)用在特定情況下,會形成浪費資源的問題。

結(jié)束語

總之,依據(jù)云計算為基礎(chǔ),充分分析和研究大規(guī)模圖數(shù)據(jù)處理技術(shù),可以發(fā)現(xiàn),在處理大規(guī)模圖數(shù)據(jù)中應(yīng)用云計算技術(shù),能夠有效提高處理效率。

參考文獻

[1]于戈,谷峪,鮑玉斌等.云計算環(huán)境下的大規(guī)模圖數(shù)據(jù)處理技術(shù)[J].計算機學(xué)報,2011,34(10):1753-1767.

[2]李健,黃慶佳,劉一陽等.云計算環(huán)境下基于粒子群優(yōu)化的大規(guī)模圖處理任務(wù)調(diào)度算法[C].//2012年第三屆中國計算機學(xué)會服務(wù)計算學(xué)術(shù)會議論文集.2012:1-8..

[3]趙小換.云計算環(huán)境下的大規(guī)模圖數(shù)據(jù)處理技術(shù)分析[J].中國外資(下半月),2012(5):275.

[4]李東升.云計算環(huán)境下的大規(guī)模圖數(shù)據(jù)處理技術(shù)[J].信息與電腦,2015(8):35-35,40.

猜你喜歡
處理技術(shù)云計算
淺議大數(shù)據(jù)的產(chǎn)生與發(fā)展現(xiàn)狀
簡析常用園林生態(tài)水處理技術(shù)
淺析城市生活污水處理技術(shù)現(xiàn)狀及發(fā)展趨勢
Java千萬級別數(shù)據(jù)處理與優(yōu)化
志愿服務(wù)與“互聯(lián)網(wǎng)+”結(jié)合模式探究
云計算與虛擬化
基于云計算的移動學(xué)習(xí)平臺的設(shè)計
實驗云:理論教學(xué)與實驗教學(xué)深度融合的助推器
云計算中的存儲虛擬化技術(shù)應(yīng)用