趙磊
一、建筑施工領(lǐng)域大數(shù)據(jù)研究現(xiàn)狀與前瞻
建筑業(yè)是數(shù)據(jù)量最大、業(yè)務(wù)規(guī)模最大的大數(shù)據(jù)行業(yè),但同樣是當(dāng)前數(shù)據(jù)管理最落后的行業(yè)??陀^地說,建筑業(yè)信息化、大數(shù)據(jù)始終難發(fā)展起來,與這一行業(yè)的本質(zhì)也有較大關(guān)系。建筑業(yè)生產(chǎn)的復(fù)雜性,導(dǎo)致互聯(lián)網(wǎng)充分應(yīng)用、大數(shù)據(jù)成為生產(chǎn)力的技術(shù)難度十分巨大。我國建筑行業(yè)已經(jīng)針對(duì)施工建造行為、物項(xiàng)實(shí)現(xiàn)了集成管理,并積累了海量數(shù)據(jù)。目前很多企業(yè)開展了大數(shù)據(jù)咨詢項(xiàng)目,旨在根據(jù)業(yè)務(wù)現(xiàn)狀制定出切實(shí)可行的大數(shù)據(jù)平臺(tái)方案,將新時(shí)代的科技成果與企業(yè)的業(yè)務(wù)相結(jié)合,實(shí)現(xiàn)數(shù)據(jù)挖掘和分析利用,充分發(fā)揮出建筑數(shù)據(jù)的價(jià)值。
(一)技術(shù)標(biāo)準(zhǔn)的制定與優(yōu)化的現(xiàn)狀
通過長期的建設(shè)實(shí)踐,我國建筑施工行業(yè)正在建立健全標(biāo)準(zhǔn)體系。
然而,在大數(shù)據(jù)時(shí)代下,行業(yè)標(biāo)準(zhǔn)體系、企業(yè)標(biāo)準(zhǔn)體系建設(shè)仍然有很大的改進(jìn)空間。一方面源于對(duì)該項(xiàng)工作的認(rèn)識(shí)程度所限,另一方面?zhèn)鹘y(tǒng)定額測(cè)定方法費(fèi)力、耗時(shí)?;诮?jīng)驗(yàn)數(shù)據(jù)、現(xiàn)場(chǎng)測(cè)定、工作視頻等,結(jié)合大數(shù)據(jù)的理念,針對(duì)特定群體、特定組織文化,有可能實(shí)現(xiàn)工效的真實(shí)反映乃至于實(shí)時(shí)反映。
(二)現(xiàn)場(chǎng)施工的技術(shù)服務(wù)保障中大數(shù)據(jù)的應(yīng)用前瞻
相比于國外先進(jìn)的建筑業(yè)企業(yè),我國最優(yōu)秀的技術(shù)力量、最富經(jīng)驗(yàn)的技術(shù)人才大部分沉淀在項(xiàng)目上,圖紙及規(guī)格書以外的廣義數(shù)據(jù)、處理質(zhì)量事故的經(jīng)驗(yàn)數(shù)據(jù)也都分散于項(xiàng)目之中,并隨著項(xiàng)目任務(wù)的結(jié)束而逐漸消散。
建造施工必須采用精細(xì)化管理方式,專業(yè)分工程度非常高,這種結(jié)構(gòu)已經(jīng)為數(shù)據(jù)的積累提供了天然的基礎(chǔ)。通過分析這些數(shù)據(jù),我們可以找到質(zhì)量缺陷的共模因素,通過適當(dāng)?shù)慕y(tǒng)計(jì)分析我們也可以找出影響質(zhì)量穩(wěn)定性的關(guān)鍵因素。甚至可以通過移動(dòng)終端的APP應(yīng)用,即時(shí)指導(dǎo)現(xiàn)場(chǎng)的施工作業(yè)。
在高質(zhì)量的完成工作任務(wù),需要進(jìn)一步挖潛大數(shù)據(jù)資源,發(fā)現(xiàn)并盤活信息資產(chǎn),重新定義并持續(xù)打造企業(yè)的核心競(jìng)爭力。
(三)安全文化行為大數(shù)據(jù)應(yīng)用前瞻
我國建筑施工行業(yè)擁有幾十萬人的從業(yè)大軍。這些從業(yè)人員每人每天都與互聯(lián)網(wǎng)發(fā)生關(guān)系,在互聯(lián)網(wǎng)上存儲(chǔ)了大量的公開信息。此外,通過一定途徑可以掌握從業(yè)人員的教育背景、成長環(huán)境、心理素質(zhì)、駕駛習(xí)慣、規(guī)則的遵守情況、無人監(jiān)督下的公德行為、即時(shí)通訊工具的信息統(tǒng)計(jì)等等廣義數(shù)據(jù)。這些數(shù)據(jù)通過計(jì)算機(jī)完成定量轉(zhuǎn)化,并結(jié)合有關(guān)案例進(jìn)行相關(guān)性分析后,有可能揭示質(zhì)量事故偶然性與必然性之間的聯(lián)系,可以用于實(shí)時(shí)評(píng)價(jià)個(gè)體的行為趨勢(shì),進(jìn)而做出預(yù)測(cè)和判斷。
未來,有必要建立企業(yè)核心競(jìng)爭力的直觀化、可視化評(píng)價(jià)體系,便于自我評(píng)價(jià)和改進(jìn),進(jìn)而提高客戶的滿意度,最終提升客戶的忠誠度。
二、建筑施工領(lǐng)域數(shù)據(jù)特點(diǎn)
客觀地說,建筑施工領(lǐng)域信息化發(fā)展緩慢,與行業(yè)的本質(zhì)有較大關(guān)系。建筑施工領(lǐng)域生產(chǎn)的特殊性與復(fù)雜性,導(dǎo)致其進(jìn)行信息化改造的技術(shù)、制度難度十分巨大。其數(shù)據(jù)存在以下特點(diǎn):
首先,數(shù)據(jù)維度比較復(fù)雜,數(shù)據(jù)結(jié)構(gòu)多樣,簡單來看,既有建筑類數(shù)據(jù),如建筑造價(jià)類數(shù)據(jù)、建筑結(jié)構(gòu)類數(shù)據(jù)、建筑施工工藝類數(shù)據(jù)、建筑材料類數(shù)據(jù),也有管理類數(shù)據(jù),并且不同數(shù)據(jù)的形態(tài)也不盡相同。
其次,行業(yè)鏈條多,參建方多,數(shù)據(jù)資源分散在不同單位手中,數(shù)據(jù)資源的整合存在一定困難。例如,管理類數(shù)據(jù)包括人力資源數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)、質(zhì)量數(shù)據(jù)、安全數(shù)據(jù)、項(xiàng)目數(shù)據(jù)等等,由于關(guān)注點(diǎn)及顆粒度的不同,以月報(bào)等類型分散在從總部到各成員單位以及項(xiàng)目部的各個(gè)層面。而對(duì)于業(yè)務(wù)類數(shù)據(jù)來說,主要的設(shè)計(jì)數(shù)據(jù)都存在于業(yè)主或設(shè)計(jì)單位,大量的甲供物資采購信息及供應(yīng)商信息也都在業(yè)主手中。
再次,隨著建筑信息化建設(shè)的升級(jí),其施工管理系統(tǒng)歷經(jīng)了幾代發(fā)展,各系統(tǒng)之間的數(shù)據(jù)繼承性較差。另外,還有大量的技術(shù)性文件以CAD、紙質(zhì)文檔等方式分散于各單位。
最后,隨著信息化技術(shù)的發(fā)展,“十三五”期間,移動(dòng)互聯(lián)、物聯(lián)網(wǎng)等新技術(shù)逐步應(yīng)用于建筑施工領(lǐng)域,由此帶來了數(shù)據(jù)量的爆發(fā)式增長,也為建筑施工領(lǐng)域數(shù)據(jù)的管理帶來新的考驗(yàn)。
三、建筑施工領(lǐng)域數(shù)據(jù)初步質(zhì)量分析
本文對(duì)信息系統(tǒng)涉及的施工項(xiàng)目管理數(shù)據(jù)進(jìn)行質(zhì)量分析,為建筑施工領(lǐng)域大數(shù)據(jù)平臺(tái)的設(shè)計(jì)提供參考,同時(shí)為集團(tuán)數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)的進(jìn)一步完善提供依據(jù)。
(一)數(shù)據(jù)質(zhì)量概念
數(shù)據(jù)質(zhì)量是保證數(shù)據(jù)應(yīng)用的基礎(chǔ),它的評(píng)估標(biāo)準(zhǔn)主要包括四個(gè)方面:完整性、一致性、準(zhǔn)確性、及時(shí)性。評(píng)估數(shù)據(jù)是否達(dá)到預(yù)期設(shè)定的質(zhì)量要求,就可以通過這四個(gè)方面來進(jìn)行判斷。
1. 完整性
完整性指的是數(shù)據(jù)信息是否存在缺失的狀況,數(shù)據(jù)缺失的情況可能是整個(gè)數(shù)據(jù)記錄缺失,也可能是數(shù)據(jù)中某個(gè)字段信息的記錄缺失。
2. 一致性
一致性是指數(shù)據(jù)是否遵循了統(tǒng)一的規(guī)范,數(shù)據(jù)集合是否保持了統(tǒng)一的格式。數(shù)據(jù)質(zhì)量的一致性主要體現(xiàn)在數(shù)據(jù)記錄的規(guī)范和數(shù)據(jù)是否符合邏輯。邏輯指的是,多項(xiàng)數(shù)據(jù)間存在著固定的邏輯關(guān)系。
3. 準(zhǔn)確性
準(zhǔn)確性是指數(shù)據(jù)記錄的信息是否存在異常或錯(cuò)誤。和一致性不一樣,存在準(zhǔn)確性問題的數(shù)據(jù)不僅僅只是規(guī)則上的不一致。最為常見的數(shù)據(jù)準(zhǔn)確性錯(cuò)誤就如亂碼。其次,異常的大或者小的數(shù)據(jù)也是不符合條件的數(shù)據(jù)。
4. 及時(shí)性
及時(shí)性是指數(shù)據(jù)從產(chǎn)生到可以查看的時(shí)間間隔,也叫數(shù)據(jù)的延時(shí)時(shí)長。及時(shí)性對(duì)于數(shù)據(jù)分析本身要求并不高,但如果數(shù)據(jù)分析周期加上數(shù)據(jù)建立的時(shí)間過長,就可能導(dǎo)致分析得出的結(jié)論失去了借鑒意義。
(二)分析方法介紹
本文使用RapidMinerStudio免費(fèi)版進(jìn)行建筑施工數(shù)據(jù)質(zhì)量的分析。
1. 分析工具使用方法
下圖為RapidMiner的主界面。
下圖為RapidMiner的數(shù)據(jù)加載界面,本課題將通過系統(tǒng)組裝之后的數(shù)據(jù)導(dǎo)出為CVS文件,通過本地文件加載的方式導(dǎo)入到RapidMiner中。
數(shù)據(jù)加載完成之后,通過拖動(dòng)的方式,將需要分析的數(shù)據(jù)源置入流程中,并選擇符合要求的處理算子,本課題選擇filter算子,將算子也拖入流程中,如下圖所示。
選擇算子之后,需要對(duì)算子的參數(shù)進(jìn)行設(shè)置,filter算子可以過濾出符合字段要求的數(shù)據(jù)。
算子參數(shù)設(shè)置完畢之后,點(diǎn)擊菜單欄的運(yùn)行按鈕,下圖為運(yùn)行結(jié)果。
運(yùn)算結(jié)果也可以通過可視化的方式進(jìn)行展示,如圖6所示。
2. 分析過程與結(jié)果
1)數(shù)據(jù)來源
對(duì)目前建筑施工管理系統(tǒng)的各類數(shù)據(jù)進(jìn)行質(zhì)量分析,本次分析選取其中的關(guān)鍵數(shù)據(jù)進(jìn)行分析,如下表所示。
(三) 數(shù)據(jù)質(zhì)量分析
基于數(shù)據(jù)質(zhì)量的定義,利用分析軟件及人工檢查的方式做以下項(xiàng)目的檢測(cè):
空值:數(shù)據(jù)值域?yàn)榭盏臄?shù)據(jù)
唯一性:數(shù)據(jù)本應(yīng)唯一,但卻重復(fù)出現(xiàn)的數(shù)據(jù)
1. was拆分?jǐn)?shù)據(jù)分析
根據(jù)上述指標(biāo)項(xiàng)定義,was拆分?jǐn)?shù)據(jù)存在如下問題:
存在某些指標(biāo)項(xiàng)實(shí)際錄入時(shí)漏錄或不錄的數(shù)據(jù);
存在全部為空的字段;
存在重復(fù)記錄。
主要指標(biāo)數(shù)據(jù)指標(biāo)項(xiàng)檢查,問題如下:
2. 托盤安裝進(jìn)度數(shù)據(jù)分析
根據(jù)上述指標(biāo)項(xiàng)定義,托盤安裝進(jìn)度數(shù)據(jù)存在如下問題:
存在某些指標(biāo)項(xiàng)實(shí)際錄入時(shí)漏錄或不錄的數(shù)據(jù)。
主要指標(biāo)數(shù)據(jù)指標(biāo)項(xiàng)檢查,問題如下:
3. 主地線進(jìn)度數(shù)據(jù)分析
根據(jù)上述指標(biāo)項(xiàng)定義,主地線進(jìn)度數(shù)據(jù)存在如下問題:
存在某些指標(biāo)項(xiàng)實(shí)際錄入時(shí)漏錄或不錄的數(shù)據(jù);
存在未填充數(shù)據(jù)的字段。
主要指標(biāo)數(shù)據(jù)指標(biāo)項(xiàng)檢查,問題如下:
4. 預(yù)計(jì)數(shù)據(jù)管理分析
根據(jù)上述指標(biāo)項(xiàng)定義,預(yù)計(jì)數(shù)據(jù)管理數(shù)據(jù)存在如下問題:
存在某些指標(biāo)項(xiàng)實(shí)際錄入時(shí)漏錄或不錄的數(shù)據(jù);
存在未填充數(shù)據(jù)的字段。
主要指標(biāo)數(shù)據(jù)指標(biāo)項(xiàng)檢查,問題如下:
5. 預(yù)計(jì)數(shù)據(jù)管理分析
根據(jù)上述指標(biāo)項(xiàng)定義,預(yù)計(jì)數(shù)據(jù)管理數(shù)據(jù)存在如下問題:
存在某些指標(biāo)項(xiàng)實(shí)際錄入時(shí)漏錄或不錄的數(shù)據(jù);
存在未填充數(shù)據(jù)的字段。
主要指標(biāo)數(shù)據(jù)指標(biāo)項(xiàng)檢查,問題如下:
四、結(jié)論及建議
(一)結(jié)論
通過以上的數(shù)據(jù)質(zhì)量分析,結(jié)合人工檢查中發(fā)現(xiàn)的問題,可得到如下結(jié)論:
系統(tǒng)開發(fā)人員離職造成數(shù)據(jù)文檔丟失,很多數(shù)據(jù)庫表及字段的定義、數(shù)據(jù)規(guī)則丟失,給數(shù)據(jù)理解帶來很大不便;
某些業(yè)務(wù)功能對(duì)應(yīng)的數(shù)據(jù)庫表字段結(jié)構(gòu)改變,從業(yè)務(wù)軟件組裝、導(dǎo)出數(shù)據(jù)時(shí)出錯(cuò);
數(shù)據(jù)漏錄或不錄的情況普遍;
存在重復(fù)保存的數(shù)據(jù);
某些字段的默認(rèn)數(shù)據(jù)設(shè)置規(guī)則不一致,如有的日期字段默認(rèn)為“0000-00-00”,有的則為空;
存在大量字段為空的情況,有的表中的某些字段全部為空;
數(shù)據(jù)錄入規(guī)范不一致,例如有的人員姓名字段為漢字,有的為漢字拼音。修改狀態(tài)字段,有的為漢字,有的為數(shù)字,有的則為英文編碼。
(二) 建議
數(shù)據(jù)質(zhì)量問題貫穿于項(xiàng)目的整個(gè)生命周期,對(duì)企業(yè)的實(shí)際生產(chǎn)運(yùn)行影響巨大,結(jié)合以上發(fā)現(xiàn)的問題,建筑施工領(lǐng)域信息化管理中的數(shù)據(jù)質(zhì)量控制要從技術(shù)、流程和管理三個(gè)方面進(jìn)行:
從技術(shù)層面上,建筑建設(shè)管理信息系統(tǒng)存在噪音數(shù)據(jù)、遺漏數(shù)據(jù)和不一致性數(shù)據(jù),需要進(jìn)行數(shù)據(jù)清洗,同時(shí)需要對(duì)源數(shù)據(jù)做稽核。
在流程層面上,對(duì)于源數(shù)據(jù)的抽取要遵從一定的業(yè)務(wù)規(guī)則,數(shù)據(jù)的抽取和轉(zhuǎn)換需要很多步驟來完成,這就需要將過程流程化,并且流程可通過配置來實(shí)現(xiàn)。
在管理層面上,要求生產(chǎn)系統(tǒng)報(bào)送數(shù)據(jù),按照“誰提供數(shù)據(jù),誰負(fù)責(zé)”的原則由生產(chǎn)系統(tǒng)保證源數(shù)據(jù)的完整性、準(zhǔn)確性、一致性、時(shí)效性。