国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Hadoop的工程造價(jià)費(fèi)用估算與信息管理系統(tǒng)設(shè)計(jì)

2018-12-03 03:49:08蘭溯源

蘭溯源

(延安大學(xué)建筑工程學(xué)院,陜西 延安 716000)

隨著我國建筑業(yè)的不斷發(fā)展,工程造價(jià)行業(yè)積累了大量的數(shù)據(jù)信息,這些信息的積累,為工程造價(jià)信息共享和挖掘奠定了基礎(chǔ)。目前,工程造價(jià)行業(yè)還存在一些比較突出的問題,如信息互通困難,使得工程造價(jià)單位和管理部門數(shù)據(jù)共享不充分,存在“信息孤島”的現(xiàn)象。同時(shí)部分工程造價(jià)信息數(shù)據(jù)更新慢,沒有充分體現(xiàn)出其應(yīng)有的價(jià)值。如何對這些海量數(shù)據(jù)進(jìn)行存儲和挖掘,提高這些數(shù)據(jù)在工程領(lǐng)域的應(yīng)用效率,成為業(yè)內(nèi)思考和研究的重點(diǎn)。朱淵[1]以輸變電工程為背景,采用Web技術(shù)構(gòu)建了一個(gè)可用于輸變電工程造價(jià)管理的系統(tǒng),運(yùn)用該系統(tǒng)工作人員可對工程造價(jià)進(jìn)行預(yù)算、及時(shí)查看工程進(jìn)度等;周文瓊等[2]采用BIM/BLM構(gòu)建工程決算系統(tǒng),通過該系統(tǒng)可實(shí)現(xiàn)工程決算的可視化。但目前工程造價(jià)信息共享不足,“信息孤島”現(xiàn)象依然存在。針對數(shù)據(jù)共享以及考慮到當(dāng)前海量的造價(jià)信息存儲、分析問題,本文基于Hadoop架構(gòu)體系構(gòu)建一個(gè)可供工程造價(jià)行業(yè)查詢工程造價(jià)預(yù)算與信息管理的系統(tǒng),改變當(dāng)前信息共享差、數(shù)據(jù)利用效率低下的狀況,以此為工程造價(jià)行業(yè)提供更多有價(jià)值的信息,促進(jìn)工程造價(jià)行業(yè)的整體發(fā)展。

1 系統(tǒng)角色與需求分析

構(gòu)建工程造價(jià)費(fèi)用估算與信息管理系統(tǒng)的目的是利用云計(jì)算技術(shù)對工程造價(jià)數(shù)據(jù)進(jìn)行挖掘,提高工程造價(jià)行業(yè)的信息利用率。根據(jù)設(shè)計(jì)目的以及結(jié)合造價(jià)行業(yè)的具體業(yè)務(wù),設(shè)計(jì)7種不同的角色,這些角色在該系統(tǒng)中擁有不同的業(yè)務(wù)需求,具體如圖1所示。

圖1 不同角色的業(yè)務(wù)需求分析

從圖1可以看出,工程造價(jià)信息管理平臺是以信息的共享和利用為基礎(chǔ)的。信息管理平臺本身就促進(jìn)了整個(gè)行業(yè)信息共享的效率,因此在該系統(tǒng)的設(shè)計(jì)中,另一個(gè)要關(guān)注的問題就是如何利用系統(tǒng)中海量的工程造價(jià)信息,提供工程造價(jià)估算與預(yù)測功能,為工程管理者提供借鑒與參考。

2 系統(tǒng)整體架構(gòu)搭建

根據(jù)以上的設(shè)計(jì)目標(biāo)和業(yè)務(wù)需求,在設(shè)計(jì)中首先應(yīng)滿足基本業(yè)務(wù)需求,其次再考慮系統(tǒng)的長遠(yuǎn)發(fā)展,以便擴(kuò)展系統(tǒng)的功能。本系統(tǒng)構(gòu)建目的是實(shí)現(xiàn)工程造價(jià)行業(yè)信息的共享,促進(jìn)造價(jià)業(yè)務(wù)的協(xié)同,并通過投資預(yù)測等功能,為造價(jià)行業(yè)提供相關(guān)的決策依據(jù)。考慮到數(shù)據(jù)量龐大,采用Hadoop架構(gòu)搭建系統(tǒng),將系統(tǒng)分為數(shù)據(jù)集成層、數(shù)據(jù)存儲層、數(shù)據(jù)處理分析層、數(shù)據(jù)輸出展示層。系統(tǒng)整體架構(gòu)如圖2所示。

通過圖2看出,不同層具有不同的功能。

數(shù)據(jù)集成層是整個(gè)系統(tǒng)數(shù)據(jù)的來源,這些數(shù)據(jù)可以來自MySql數(shù)據(jù)庫,也可以來自Sql Servers數(shù)據(jù)庫,還可來自其他的數(shù)據(jù)庫。換句話說,這些數(shù)據(jù)可以是結(jié)構(gòu)型數(shù)據(jù),也可以是非結(jié)構(gòu)型數(shù)據(jù),數(shù)據(jù)的類型包括文字、圖片、音頻等。為方便對這些數(shù)據(jù)的存儲和查詢,在數(shù)據(jù)源與數(shù)據(jù)存儲層之間使用Sqoop工具,通過該工具可實(shí)現(xiàn)關(guān)系型數(shù)據(jù)庫與Hadoop間的交換。

數(shù)據(jù)存儲層采用HDFS、Hbase等組件,通過分布式文件存儲系統(tǒng)和統(tǒng)一的接口即可完成對不同節(jié)點(diǎn)下文件的訪問。Hbase主要負(fù)責(zé)對非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行存儲。

數(shù)據(jù)處理分析層采用MapReduce并行處理技術(shù)、Hive技術(shù)等,以完成對數(shù)據(jù)的計(jì)算和查詢。通過MapReduce并行技術(shù)提高運(yùn)算速率,采用Hive提高查詢效率。

數(shù)據(jù)輸出展示層則是將查詢的結(jié)果展示給用戶。

3 功能模塊設(shè)計(jì)

系統(tǒng)設(shè)置了信息分析與發(fā)布、信息采集、信息檢索、用戶注冊與登錄、數(shù)據(jù)分析、系統(tǒng)維護(hù)與管理等模塊,如圖3所示。

圖3 系統(tǒng)功能模塊

4 系統(tǒng)詳細(xì)設(shè)計(jì)

4.1 用戶登錄設(shè)計(jì)

進(jìn)入登錄頁面,用戶輸入登錄名和密碼,與后臺服務(wù)器中存儲的登錄名和密碼進(jìn)行比對,如一致則進(jìn)入到工程造價(jià)預(yù)算與信息管理系統(tǒng)主界面;如不一致,則返回重新登錄。具體流程如圖4所示。

4.2 工程造價(jià)估算模型構(gòu)建

工程造價(jià)估算模型的構(gòu)建是本系統(tǒng)的重點(diǎn)。目前,用于工程造價(jià)估算的模型很多,其建模方法包括神經(jīng)網(wǎng)絡(luò)算法、灰色關(guān)聯(lián)分析算法等。本文在總結(jié)以往方法優(yōu)缺點(diǎn)的基礎(chǔ)上,選用灰色關(guān)聯(lián)分析算法進(jìn)行工程造價(jià)估算模型的建立。該方法的基本思路是根據(jù)序列曲線幾何形狀的相似度[3],來判斷兩工程的造價(jià)之間聯(lián)系是否緊密。

圖4 系統(tǒng)登錄流程設(shè)計(jì)

如項(xiàng)目造價(jià)變化趨勢一致或者是相似,則認(rèn)為兩者之間的關(guān)聯(lián)度較高;如變化趨勢區(qū)別較大,則認(rèn)為兩者之間的關(guān)聯(lián)度低。對于工程建設(shè)項(xiàng)目來講,影響工程造價(jià)的因素很多,因此在進(jìn)行項(xiàng)目投資估算時(shí),通過工程項(xiàng)目特征相似度進(jìn)行關(guān)聯(lián)分析。具體的思路是:選取與待測項(xiàng)目特征比較接近的工程項(xiàng)目若干,然后采用灰色關(guān)聯(lián)度分析法篩選出與待測工程最為接近的n個(gè)典型工程,對這些典型工程的平均投資額進(jìn)行計(jì)算,最后得到預(yù)測工程的投資額度。

具體測算步驟為:

1)選取測算指標(biāo),包括工程結(jié)構(gòu)、內(nèi)裝形式、給排水方式等。

2)根據(jù)上述關(guān)鍵指標(biāo),篩選出同類型的工程項(xiàng)目,然后將估算工程的單方造價(jià)與類似項(xiàng)目的特征信息進(jìn)行系數(shù)賦值。本文將該系數(shù)值設(shè)定為0.5。

3)計(jì)算估算工程項(xiàng)目與典型工程的關(guān)聯(lián)度。

假設(shè)有P個(gè)典型工程,其包含8個(gè)特征參數(shù),分別為結(jié)構(gòu)形式、內(nèi)墻裝飾、外墻裝飾、給排水、暖通、強(qiáng)電、弱電、電梯等,可以得到工程的參數(shù)序列集合Xi:

(1)

①求取t。

(2)

式中:X(1)~X(8)為同類型工程各特征參數(shù)的平均數(shù);t為選定的特征參數(shù)與同類型工程特征參數(shù)平均數(shù)的差的絕對值。

②找出t中的最大差值tmax和最小差值tmin,并計(jì)算關(guān)聯(lián)度系數(shù):

(3)

式中:moi為關(guān)聯(lián)度系數(shù);q為第q個(gè)特征參數(shù)。

③計(jì)算關(guān)聯(lián)度roi:

(4)

式中:n為被比較的特征參數(shù)個(gè)數(shù)。

4.3 綜合單價(jià)預(yù)測模型構(gòu)建

除整體的工程造價(jià)估算以外,還需對某個(gè)工程的單項(xiàng)造價(jià)進(jìn)行預(yù)測。本文引入殘差自回歸預(yù)測模型對工程的綜合單價(jià)進(jìn)行預(yù)測,并采用并行計(jì)算技術(shù),以提高綜合單價(jià)預(yù)測的準(zhǔn)確性和計(jì)算效率。具體的預(yù)測流程如圖5所示。

4.4 信息聚類設(shè)計(jì)

為進(jìn)一步提高Hadoop框架下海量數(shù)據(jù)信息挖掘的效率,引入k均值聚類算法對工程造價(jià)庫中的數(shù)據(jù)進(jìn)行聚類。

圖5 綜合單價(jià)預(yù)測流程

在聚類算法中,最關(guān)鍵的是確定初始k值和中心點(diǎn)[4-5]。本文使用k均值聚類法對系統(tǒng)中的信息進(jìn)行挖掘分類時(shí),對中心點(diǎn)的選擇進(jìn)行了改進(jìn),即改變以往只選擇一個(gè)中心點(diǎn)作為聚類點(diǎn)的做法,在比較數(shù)據(jù)樣本的距離后,選擇距離盡可能遠(yuǎn)的兩個(gè)樣本作為初始的中心點(diǎn),即對于給定的數(shù)據(jù)集A={x1,x2,…,xm},xm∈Rd,選擇兩個(gè)樣本距離最長的點(diǎn)作為中心點(diǎn),然后計(jì)算每個(gè)樣本與這兩個(gè)點(diǎn)之間的距離。具體過程設(shè)計(jì)為:

1)選取樣本中距離最長的兩點(diǎn)s,t作為中心點(diǎn),即dst=dmax。

2)分別計(jì)算其他樣本與s,t中心點(diǎn)之間的距離。若樣本xi(i=1,2,…,P)與樣本xs和xt的距離存在|xi-xs|<|xi-xt|,則將xi歸入數(shù)據(jù)集As中,反之歸入數(shù)據(jù)集At中。由此得到新的兩類數(shù)據(jù)集As和At。

3)計(jì)算新數(shù)據(jù)集As和At中的樣本到xs的距離,分別用d1max和d2max表示,取兩者中的較大者,設(shè)為d3=max{d1max,d2max},對應(yīng)的數(shù)據(jù)記為xu。若d3>0.5dst,那么將該數(shù)據(jù)標(biāo)記為第三個(gè)聚類的中心點(diǎn)。

4)以此類推,直至找不到符合條件的樣本,停止分類。

在運(yùn)行上述算法的同時(shí),運(yùn)用MapReduce分布式處理技術(shù)對數(shù)據(jù)進(jìn)行分布式聚類。

4.5 在線查詢模塊設(shè)計(jì)

為提高系統(tǒng)的實(shí)用性,在系統(tǒng)中加入在線查詢功能。用戶在輸入關(guān)鍵詞后,可及時(shí)查到工程價(jià)格信息、材料成本信息、造價(jià)指數(shù)等。具體流程如圖6所示。

圖6 在線查詢實(shí)現(xiàn)流程

5 系統(tǒng)測試

5.1 測試環(huán)境搭建

為驗(yàn)證本系統(tǒng)的可行性,需對系統(tǒng)進(jìn)行測試。硬件環(huán)境:部署5臺計(jì)算機(jī),1臺為主節(jié)點(diǎn),4臺為子節(jié)點(diǎn)。計(jì)算機(jī)的CPU為四核 core i7,內(nèi)存為8GHz,硬盤為500G。

軟件環(huán)境:操作系統(tǒng)為Windows 2008 Server;開發(fā)工具為JDK 1.6.25;Hadoop 的版本為Hadoop 0.20.2。

5.2 性能測試

根據(jù)上述的節(jié)點(diǎn)部署,選擇4個(gè)子節(jié)點(diǎn)計(jì)算機(jī)對數(shù)據(jù)進(jìn)行測試,得到如圖7所示的結(jié)果。

圖7 數(shù)據(jù)處理時(shí)間

從圖可以看出,在數(shù)據(jù)相同的情況下,當(dāng)子節(jié)點(diǎn)超過3個(gè)時(shí),數(shù)據(jù)處理的速度明顯加快。說明通過分布式部署的方式,可提高大規(guī)模數(shù)據(jù)的處理效率。

5.3 功能測試

以用戶登錄、造價(jià)信息查詢?yōu)槔M(jìn)行功能測試。當(dāng)用戶輸入用戶名和密碼后,可直接進(jìn)入到系統(tǒng)主界面。登錄界面如圖8所示。

圖8 登錄界面

對不同區(qū)域的造價(jià)信息進(jìn)行查詢,如點(diǎn)擊“成都”→“建筑工程”,可以得到如圖9所示的造價(jià)信息界面。

6 結(jié)束語

本文提出的關(guān)聯(lián)度投資估算方法,在一定程度上可快速估算出工程的整體造價(jià),進(jìn)一步拓展了工程管理系統(tǒng)的功能,也促進(jìn)了工程造價(jià)行業(yè)信息的共享。本文系統(tǒng)的構(gòu)建借助了大數(shù)據(jù)框架體系,可提高系統(tǒng)運(yùn)行的效率。

圖9 行業(yè)造價(jià)信息界面

南开区| 吴旗县| 扎鲁特旗| 台安县| 吴江市| 桦川县| 顺义区| 巴东县| 福海县| 招远市| 红桥区| 平邑县| 衡水市| 新安县| 宝鸡市| 嘉荫县| 安阳市| 仙桃市| 合江县| 东兰县| 济源市| 肥东县| 望都县| 南和县| 西乌| 同仁县| 祁连县| 青河县| 象山县| 贵定县| 肇州县| 家居| 从化市| 屏边| 文昌市| 乌拉特后旗| 广水市| 娱乐| 昌吉市| 禄丰县| 望江县|