国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于云計算的柑橘市場信息預測平臺構建研究*

2016-10-14 07:03黃曉英
中國農(nóng)業(yè)信息 2016年14期
關鍵詞:柑橘數(shù)據(jù)挖掘節(jié)點

王 聰,黃曉英

(浙江農(nóng)林大學暨陽學院,紹興 311800)

基于云計算的柑橘市場信息預測平臺構建研究*

王 聰,黃曉英

(浙江農(nóng)林大學暨陽學院,紹興 311800)

文章設計了一種基于Hadoop的柑橘市場信息預測平臺,根據(jù)往年的柑橘產(chǎn)量、柑橘消費量、進出口量、庫存量等,通過Apriori算法在云計算平臺Hadoop下實現(xiàn)對影響柑橘價格的各類影響因素和柑橘市場信息之間的關聯(lián)分析,根據(jù)得出的關聯(lián)性和置信度預測柑橘價格和產(chǎn)量,以此構建柑橘市場信息預測平臺,對柑橘價格和產(chǎn)量進行預測。

云計算 數(shù)據(jù)挖掘 Hadoop 柑橘

目前,中國柑橘生產(chǎn)面積已躍居世界第一,柑橘產(chǎn)業(yè)已經(jīng)成為中國農(nóng)業(yè)生產(chǎn)的重要力量,在發(fā)展的過程中,也面臨一系列問題。由于柑橘產(chǎn)量與需求的不平衡,使得柑橘的銷售和增收困難,柑橘價格長期劇烈的波動,使得柑橘種植商的利潤波動大,當柑橘生產(chǎn)量遠遠大于供應量時,就會出現(xiàn)柑橘滯銷、價格低廉,相反就會出現(xiàn)供不應求的情況。如果通過數(shù)據(jù)挖掘技術,分析柑橘市場每年的供求關系,提前知曉柑橘未來供需缺口的變化,能夠為柑橘生產(chǎn)、消費、進出口制定相應對策提供依據(jù)的同時,保證柑橘市場的供需平衡,具有重要的意義。

1 數(shù)據(jù)挖掘與云計算

隨著數(shù)據(jù)量不斷的劇增,傳統(tǒng)的數(shù)據(jù)挖掘算法和分析工具在面臨海量數(shù)據(jù)時,出現(xiàn)挖掘效率低的問題,由于已有的數(shù)據(jù)挖掘大多基于傳統(tǒng)的單機模式,無法高效的處理海量數(shù)據(jù)。同時,擴展已有的挖掘體系,會造成人力物力成本上升,很多中小企業(yè)無法承擔如此高昂的成本,而且,數(shù)據(jù)挖掘成本高,效率低。

云計算的出現(xiàn),給數(shù)據(jù)挖掘帶來新的方向。基于云計算的數(shù)據(jù)挖掘,具有在計算能力、存儲能力、可靠性、價格低等優(yōu)點,迅速地得到廣泛應用。云計算挖掘平臺可以分為3層,包括數(shù)據(jù)挖掘云服務層、數(shù)據(jù)挖掘分析層和云計算支持平臺。云服務層通過網(wǎng)絡連接,為云用戶提供云資源例如挖掘算法服務、數(shù)據(jù)預處理服務、數(shù)據(jù)服務、調度服務等;數(shù)據(jù)挖掘能力層包括數(shù)據(jù)并行處理、調度引擎等;云計算支持平臺提供分布式存儲和計算能力,為數(shù)據(jù)挖掘提供物理支持。如圖1所示。

2 基于Hadoop的柑橘市場信息預測平臺設計

2.1 系統(tǒng)設計目標

目前,市場上柑橘種類繁多,柑橘數(shù)據(jù)來源收受域約束,分布比較分散。同時,這些數(shù)據(jù)具有時效性,在移動互聯(lián)網(wǎng)和各種物聯(lián)網(wǎng)的發(fā)展下,柑橘的數(shù)據(jù)量劇增,如果采用傳統(tǒng)數(shù)據(jù)挖掘體系,無法很好地完成挖掘功能。因此,文章采用基于云計算的Hadoop下的云計算方式進行平臺設計。

該系統(tǒng)設計基于云計算的市場信息預測平臺要滿足以下需求。

(1)存儲具有可擴展性。在存儲層,存儲節(jié)點具有可擴展性,由于柑橘數(shù)據(jù)來源多樣,且很多異構數(shù)據(jù)。因此,該文采用非關系型數(shù)據(jù)庫系統(tǒng)的存儲模式存儲數(shù)據(jù),存儲方式采用分布式,便于靈活地進行系統(tǒng)擴容和系統(tǒng)伸縮。

(2)集成化、可定制的數(shù)據(jù)挖掘能力。用戶可以根據(jù)實際添加所需要的算法,因此系統(tǒng)實現(xiàn)了可定制的數(shù)據(jù)挖掘能力。

(3)友好的用戶展示界面。能夠直觀地顯示數(shù)據(jù)挖掘結果,用戶可以輕而易舉地理解挖掘的含義。

因此,該設計基于云計算的柑橘市場信息預測平臺,具有可靠、高效、性能好、可擴展的特點。

2.2 設計思路及方案

文章設計了基于Hadoop的柑橘市場信息預測平臺,利用Hadoop的強大計算能力和存儲能力,達到以上系統(tǒng)設計目標。

其設計思路是:利用Hadoop的特性,將數(shù)據(jù)挖掘中需要大的計算能力的算法擴展到Hadoop集群的各個節(jié)點上,利用并行計算能力進行數(shù)據(jù)挖掘工作,提高挖掘效率。采用分層設計思想,存儲層使用HDFS存儲文件和數(shù)據(jù),通過Map Reduce計算模型來執(zhí)行海量數(shù)據(jù)挖掘。

根據(jù)設計思路和云計算數(shù)據(jù)挖掘模型,通過分層設計思想,自頂向下的調用下層結構,最頂層是用戶和系統(tǒng)的交互層;中間層是業(yè)務處理層,提供基礎計算框架和業(yè)務邏輯處理;最底層為存儲層,提供分布式存儲。

2.3 系統(tǒng)模塊功能

數(shù)據(jù)管理框架。數(shù)據(jù)管理層建立在Hadoop下的HDFS文件系統(tǒng)之上,提供并行數(shù)據(jù)訪問和高效、可擴展的存儲服務。當系統(tǒng)存儲能力不足時,可以在不影響已有數(shù)據(jù)情況下,添加新的存儲節(jié)點。通過多副本存儲機制保障數(shù)據(jù)安全,即使有節(jié)點出現(xiàn)存儲失效,通過副本機制將失效節(jié)點數(shù)據(jù)轉移到其他節(jié)點。

圖1 基于云計算的數(shù)據(jù)挖掘

基礎計算框架。Map Reduce為系統(tǒng)的基礎計算框架,它可以隱藏底層設計細節(jié),通過簡單的對外接口,實現(xiàn)各種并行計算能力,并且具有很好的擴展性和伸縮性,可以根據(jù)實際需求增加或者刪除節(jié)點。

算法管理。用戶通過算法管理模塊查看系統(tǒng)提供的算法,并且可以上傳自己設計的算法,實現(xiàn)可定制化的數(shù)據(jù)挖掘能力。

頁面展示。通過友好的方式展示數(shù)據(jù)挖掘結果。

數(shù)據(jù)加載塊。由于數(shù)據(jù)種類繁多,且來源不同,數(shù)據(jù)加載模塊將來源各異的數(shù)據(jù)在數(shù)據(jù)集管理模塊中進行注冊,然后存儲到HDFS文件系統(tǒng)。

數(shù)據(jù)挖掘算法模塊。提供各種并行挖掘算法,是基于算法管理模塊的擴展。

數(shù)據(jù)挖掘。是系統(tǒng)的核心模塊,通過調用業(yè)務層的Map Reduce計算框架,提供高效的數(shù)據(jù)挖掘服務。

3 基于Hadoop的柑橘市場信息預測平臺構建

3.1 Hadoop平臺搭建

平臺采用B/S架構,前臺采用JSP作為開發(fā)語言;后臺選擇java語言,采用Tomcat服務器;數(shù)據(jù)存儲采用MySQL和Hadoop的HDFS;Hadoop采用4臺PC機器作為數(shù)據(jù)節(jié)點。所有機器配置:4臺HP刀片服務器組成一個內部往來,建立一個 4個節(jié)點的Hadoop集群。其中 1個節(jié)點作為 Master,其余3 個節(jié)點作為 Slave,各個節(jié)點通過100M網(wǎng)卡進行數(shù)據(jù)訪問。Master節(jié)點服務器CPU:Inter(R)Xeon(R)E5620 2.4GHz 4*4核,Memory:6GB,Disk:500G*8。Salve節(jié) 點 服 務 器 CPU:Inter (R)Xeon(TM)3.00GHZ 4核,Memory:1GB,Disk: 146.8G*2。每臺服務器上安裝OS:64 bit CentOS6.2,Hadoop 版本1.0.3和Eclipse版本4.3.1。Hadoop默認參數(shù)配置Block為64M,備份數(shù)為3。

3.2 預測模型構建

文章采用關聯(lián)規(guī)則分析中的Apriori算法,對柑橘價格和產(chǎn)量進行分析和預測,主要通過Apriori算法,找出影響柑橘價格和產(chǎn)量之間的置信度,通過置信度構建柑橘市場分析模型,以置信度計算柑橘市場信息。

基于Apriori算法的柑橘市場價格預測模型,如圖3.1所示。整個柑橘價格是建立在2005~2015年的柑橘價格指數(shù)、生產(chǎn)量指數(shù)、世界柑橘價格指數(shù)等基層上,通過我國《中國統(tǒng)計年鑒》發(fā)布的數(shù)據(jù),導入這10年的柑橘指數(shù)作為預測模型基礎。利用這些數(shù)據(jù)構建數(shù)據(jù)挖掘模型,利用Apriori算法對這些數(shù)據(jù)進行挖掘分析,得到各種因素對柑橘價格和產(chǎn)量之間的置信度,然后通過計算模型,實現(xiàn)對柑橘價格和產(chǎn)量的預測(圖2)。

3.3 Hadoop數(shù)據(jù)預處理

影響柑橘市場的數(shù)據(jù)主要有柑橘產(chǎn)量、柑橘消費量、進出口量、庫存量等,文章主要通過這些數(shù)據(jù),構建柑橘市場預測模型。由于庫存量沒有統(tǒng)計數(shù)據(jù),因此,文章不考慮柑橘的庫存量對市場影響。

(1)柑橘產(chǎn)量。柑橘產(chǎn)量數(shù)據(jù)來源于《中國統(tǒng)計年鑒》。

(2)柑橘消費量,數(shù)據(jù)來源于《中國農(nóng)村統(tǒng)計年鑒》,根據(jù)家庭人均水果消費量,計算出柑橘中國國內消費數(shù)據(jù)。

(3)柑橘出口量,數(shù)據(jù)來源于聯(lián)合國貿(mào)易數(shù)據(jù)庫。

(4)國民消費價格指數(shù),國家統(tǒng)計局獲取。

將以上數(shù)據(jù)存儲到預測模型的數(shù)據(jù)倉庫中,在單機模式下Apriori算法執(zhí)行效率低,因此,采用云平臺方法,通過Hadoop實現(xiàn)Apriori算法。在計算過程中,首先將這些數(shù)據(jù)處理成Html格式存儲到Hadoop中,使用MapReduce對柑橘價格影響因素數(shù)據(jù)進行提取,之后將Apriori算法預測模型與Hadoop云計算框架關聯(lián)。

圖2 柑橘市場預測模型

圖3 基于Hadoop的柑橘市場預測模型

4 基于Hadoop的柑橘市場信息預測

經(jīng)過數(shù)據(jù)預處理之后,結合Hadoop云計算框架,設計基于Hadoop云計算處理的柑橘市場預測模型,如圖4.1所示,將Hadoop云計算框架部署在Linux虛擬機上,通過Hadoop框架構建整個預測系統(tǒng),然后設計Hadoop并行Apriori處理任務,將Apriori算法挖掘任務分成多個并行任務,分布到各個計算節(jié)點進行處理。同時,通過預處理模塊,從柑橘市場預測數(shù)據(jù)系統(tǒng)中,導入柑橘產(chǎn)量、柑橘消費量、進出口量、庫存量、居民消費指數(shù)到HDFS文件系統(tǒng)中,為Hadoop執(zhí)行Apriori算法提供數(shù)據(jù)支持,最大限度地提高Apriori算法的執(zhí)行效率,最后通過Apriori算法得到各個影響因素,對糧食價格和年產(chǎn)量的置信度,交給柑橘市場預測模塊,進行計算,得到柑橘年產(chǎn)量和價格預測值(圖3)。

以上述模型為依托,從而搭建基于Hadoop的柑橘市場信息預測平臺。

[1] 陳康,鄭緯民.云計算系統(tǒng)實例與研究現(xiàn)狀.軟件學報,2009,20(5):1337~1348

[2] 陳全,鄧倩妮.云計算及其關鍵技術.計算機應用,2009,29(9):2562~2567

[3] 張建勛,古志民,鄭超.云計算研究進展綜述.計算機應用研究,2010,27(2):429~433

[4] 何勁,祁春節(jié).中國柑橘生產(chǎn)成本和市場價格變動的實證研究.浙江柑橘,2009,26(1):2~7

[5] 汪曉銀.中國柑橘市場預警研究.華中農(nóng)業(yè)大學,2013

[6] Witten,F(xiàn)rank I H.Data Mining.Practical Machine Learning Tools & Techniques with Java Implementations,2011,13(4):95~97

[7] 劉永平,郭小波,胡坤倫.采用云計算對糧食價格進行分析和預測.現(xiàn)代食品,2015,(21)

[8] Azuaje F. Witten IH,F(xiàn)rank E: Data Mining: Practical Machine Learning Tools and Techniques. Biomedical Engineering Online,2006,5(1):1~2

[9] 孫吉紅,彭林,鄒秋霞.基于云計算平臺的智能預測模型研究.農(nóng)業(yè)網(wǎng)絡信息,2014,(1):43~46

[10] 徐懿瑾.基于數(shù)據(jù)挖掘的移動中高端用戶流失預警分析.上海交通大學,2010

[11] Han J,Kamber M. Data Mining: Concepts and Techniques. Data Mining Concepts Models Methods & Algorithms Second Edition,2000,5(4):1~18

[12] 李佳鍞.基于云計算和數(shù)據(jù)挖掘技術的中小企業(yè)風險預測模型研究.廈門大學,2012

[13] Chen M S,Han J,Yu P S. Data Mining: An Overview from a Database Perspective. IEEE Transactions on Knowledge & Data Engineering,1996,8(6):866~883

[14] Romero C,Ventura S,Garc í a E. Data mining in course management systems: Moodle case study and tutorial. Computers & Education,2008,51(1):368~384

[15] White T. Hadoop : the definitive guide. O’reilly Media Inc Gravenstein Highway North,2010,215(11):1 ~ 4

[16] O’Driscoll A,Daugelaite J,Sleator R D. ‘Big data’,Hadoop and cloud computing in genomics. Journal of Biomedical Informatics,2013,46(5):774~781

[17] Borthakur D,Gray J,Sarma J S,et al. Apache hadoop goes realtime at Facebook// Proceedings of the 2011 ACM SIGMOD International Conference on Management of data. ACM,2011:1071~1080

[18] Dean J,Ghemawat S. MapReduce: Simplified Data Processing on Large Clusters.. In Proceedings of Operating Systems Design and Implementation OSDI,2004,51(1):107~113

[19] Dean B J. et al .MapReduce:Simplifieddataprocessing on large clusters. Osdi’,2010,51(1):107~113

[20] 覃雄派,王會舉,杜小勇,等.大數(shù)據(jù)分析——RDBMS與MapReduce的競爭與共生. 軟件學報,2012,23(1):32~45

[21] 孫廣中,肖鋒,熊曦. MapReduce模型的調度及容錯機制研究. 微電子學與計算機,2007,24(9):178~180

[22] 孫廣中,肖鋒,熊曦. MapReduce模型的調度及容錯機制研究.全國開放式分布與并行計算機學術會議,2007:178~180

[23] 萬至臻.基于MapReduce模型的并行計算平臺的設計與實現(xiàn).浙江大學,2008

[24] 陳艷金. MapReduce模型在Hadoop平臺下實現(xiàn)作業(yè)調度算法的研究和改進.華南理工大學,2011

[25] 鐘曉,馬少平,等.數(shù)據(jù)挖掘綜述.模式識別與人工智能,2001,14(1):48~55

[26] 程苗.基于云計算的Web數(shù)據(jù)挖掘.計算機科學,2011,(Z1):146~149

[27] 王鄂,李銘.云計算下的海量數(shù)據(jù)挖掘研究.現(xiàn)代計算機:專業(yè)版,2009,(11):22~25

[28] 紀俊.一種基于云計算的數(shù)據(jù)挖掘平臺架構設計與實現(xiàn).青島大學,2009

[29] 李軍華.云計算及若干數(shù)據(jù)挖掘算法的MapReduce化研究.電子科技大學,2010

[30] 賀瑤,王文慶,薛飛.基于云計算的海量數(shù)據(jù)挖掘研究.微機發(fā)展,2013,(2):69~72

教育部人文社科基金項目(12YJA870008);浙江農(nóng)林大學暨陽學院大學生科技創(chuàng)新項目(TMKC1442)

猜你喜歡
柑橘數(shù)據(jù)挖掘節(jié)點
CM節(jié)點控制在船舶上的應用
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于AutoCAD的門窗節(jié)點圖快速構建
數(shù)據(jù)挖掘技術在打擊倒賣OBU逃費中的應用淺析
概念格的一種并行構造算法
丹江口柑橘價格“破紀錄”啦
“五及時”柑橘凍害恢復技術
2016年春黃巖區(qū)柑橘凍害調查
《浙江柑橘》(第32卷)2015年總目次
抓住人才培養(yǎng)的關鍵節(jié)點
荔波县| 漾濞| 连南| 平乡县| 西青区| 巫山县| 双城市| 武山县| 阳东县| 久治县| 杨浦区| 鹰潭市| 蒲江县| 江川县| 迁安市| 津南区| 中西区| 融水| 高尔夫| 三江| 阿克陶县| 论坛| 青龙| 罗江县| 林州市| 伊春市| 阿坝县| 林西县| 安顺市| 通州市| 香格里拉县| 横山县| 安达市| 珠海市| 同仁县| 彰武县| 如皋市| 泉州市| 唐河县| 武平县| 宁波市|