国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種針對云計(jì)算的ETL流程創(chuàng)建及優(yōu)化方法

2012-04-29 00:44:03譚煌
電腦知識與技術(shù) 2012年16期
關(guān)鍵詞:流程優(yōu)化轉(zhuǎn)換云計(jì)算

譚煌

摘要:該文針對現(xiàn)有ETL工作流程的創(chuàng)建和執(zhí)行過程中的不足,提出了一種基于邏輯模型的ETL工作流程優(yōu)化方法,并針對云計(jì)算模式對ETL工作流程的執(zhí)行進(jìn)行進(jìn)一步優(yōu)化,通過測試這種兩階段優(yōu)化方法可以大大提高ETL工作流程的執(zhí)行效率。

關(guān)鍵詞:數(shù)據(jù)抽??;轉(zhuǎn)換;加載;云計(jì)算;MapReduce;邏輯模型;流程優(yōu)化

中圖分類號:TP393文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2012)16-3775-03

A Method of Creating and Optimizing ETL Flow being Aimd at Cloud Computing

TAN Huang

(College of Mathematics and Computer Science, Hunan Normal University, Changsha 410081, China)

Abstract: As for shortage of creating and invoking of ETL Flow , we proposal a method of creating and optimizing ETL flow based on log ic model , and Be aimed at cloud computing we optimizing the invoking of ETL flow .Through these optimization , we can improve the effectiveness of invoking ETL flow.

Key words: ETL; cloud computing; map reduce; logic model; flow optimizing

抽取、轉(zhuǎn)換、裝載(ETL)在數(shù)據(jù)倉庫的建立過程中起到了非常核心的作用,它為數(shù)據(jù)倉庫提供及時、高質(zhì)而準(zhǔn)確的數(shù)據(jù)[1]。目前對于ETL工作流程的創(chuàng)建、執(zhí)行調(diào)度及優(yōu)化主要有以下幾種方法:1)通過配置管理ETL工作流程;2)通過并行優(yōu)化ETL流程的執(zhí)行。

通過配置方式構(gòu)造ETL工作流程,定義針對特定執(zhí)行環(huán)境的ETL工作流程的元數(shù)據(jù),開發(fā)人員可以根據(jù)元數(shù)據(jù)創(chuàng)建和管理ETL工作流程。其缺點(diǎn)是:1)針對的是特定執(zhí)行環(huán)境,不具備一般性;2)沒有對ETL工作流程進(jìn)行優(yōu)化。

通過并行優(yōu)化ETL工作流程執(zhí)行,是通過將ETL工作流程中的活動分布多個線程或集群上執(zhí)行,達(dá)到提速的目的。其缺點(diǎn)是:1)使用多線程的方式并行化ETL工作流程受限于機(jī)器的計(jì)算和存儲資源;2)在集群環(huán)境中執(zhí)行ETL工作流程,雖然可以將活動并行執(zhí)行,但是沒有考慮集群環(huán)境中I/O問題,將其擴(kuò)展到云計(jì)算環(huán)境中運(yùn)行會由于I/O問題降低ETL工作流程的執(zhí)行效率。

該文針對在云計(jì)算環(huán)境下創(chuàng)建和優(yōu)化ETL工作流程,主要解決思路是,定義針對云計(jì)算環(huán)境的具有一般性的ETL工作流程邏輯模型;對ETL工作流程的邏輯模型進(jìn)行優(yōu)化;將ETL邏輯模型轉(zhuǎn)換為針對云計(jì)算環(huán)境的物理模型;對物理模型進(jìn)行優(yōu)化。

ETL工作流程的物理模型中描述了流程活動執(zhí)行需要的數(shù)據(jù)操作組件,同時也描述對流程中活動或執(zhí)行組的MapReduce程序的封裝。ETL工作流程執(zhí)行引擎根據(jù)物理模型控制ETL工作流程的執(zhí)行,并通過云計(jì)算環(huán)境客戶端將物理模型中的MapReduce任務(wù)部署到云計(jì)算環(huán)境中并行執(zhí)行。

通過對ETL工作流程進(jìn)行邏輯結(jié)構(gòu)優(yōu)化以及針對云計(jì)算模式mapreduce的優(yōu)化,我們可以大大提高ETL工作流程的執(zhí)行效率,但是在使用元數(shù)據(jù)對ETL進(jìn)行構(gòu)造的過程比較復(fù)雜,需要比較專業(yè)的人員才能完成,所以如何使得該過程簡單是我們下一步需要進(jìn)行的工作。

[1]趙華茗.搭建基于云計(jì)算的開源海量數(shù)據(jù)挖掘平臺[J].現(xiàn)代圖書情報技術(shù),2010(10):76-80.

[2] Simitsis A. Logical Optimization of ETL Workflows[EB/OL]. http://citeseerx.ist.psu.edu/viewdoc/downloaddoi=10.1.1.66.5268&rep= rep1&type=pdf.

[3] Jeffrey Dean. MapReduce: Simpli_ed Data Processing on Large Clusters. Google Inc.2004

[4]格羅斯曼.信息檢索:算法與啟發(fā)式方法[M].2版.北京:人民郵電出版社,2010.

猜你喜歡
流程優(yōu)化轉(zhuǎn)換云計(jì)算
淺談會計(jì)信息化下的財(cái)務(wù)會計(jì)流程優(yōu)化
中國市場(2016年40期)2016-11-28 04:17:53
大數(shù)據(jù)時代檔案管理模式的轉(zhuǎn)換與創(chuàng)新
資治文摘(2016年7期)2016-11-23 02:29:01
論英漢語翻譯中語內(nèi)翻譯向語際翻譯的轉(zhuǎn)換
淺談平面圖與立體圖的思維培養(yǎng)
人間(2016年28期)2016-11-10 00:10:48
基于云計(jì)算的移動學(xué)習(xí)平臺的設(shè)計(jì)
實(shí)驗(yàn)云:理論教學(xué)與實(shí)驗(yàn)教學(xué)深度融合的助推器
高中化學(xué)教學(xué)中研究性學(xué)習(xí)的應(yīng)用探究
成才之路(2016年25期)2016-10-08 10:51:36
云計(jì)算中的存儲虛擬化技術(shù)應(yīng)用
科技視界(2016年20期)2016-09-29 13:34:06
基于服務(wù)流程優(yōu)化的酒店管理專業(yè)人才培養(yǎng)
成才之路(2016年20期)2016-08-09 16:30:48
國際工程公司如何優(yōu)化外事管理模式
清丰县| 龙门县| 庆云县| 通河县| 定陶县| 登封市| 五峰| 全椒县| 阿克陶县| 龙岩市| 泰来县| 高唐县| 白玉县| 凤庆县| 博客| 大同市| 泰和县| 自贡市| 奉节县| 平泉县| 离岛区| 都江堰市| 古丈县| 嘉禾县| 定远县| 保德县| 柞水县| 靖西县| 安图县| 双柏县| 铜山县| 兰州市| 怀远县| 德江县| 航空| 福鼎市| 夹江县| 昭觉县| 越西县| 阳东县| 永顺县|