陳宏偉 陳 佳
(1.武漢交通職業(yè)學院,湖北 武漢 430065;2.武漢紡織大學,湖北 武漢 430073)
為加強對建設工程竣工結(jié)算的管理,規(guī)范工程計價行為,維護建筑市場正常秩序,防止拖欠工程款、拖欠農(nóng)民工工資,根據(jù)《中華人民共和國合同法》、《中華人民共和國建筑法》,全國各?。ㄊ校?、自治區(qū)及新疆建設兵團建設行政主管部門均出臺建設工程造價備案管理辦法,要求依法必須招標的建設項目,在竣工后由建設單位申請竣工結(jié)算備案審查。以武漢市為例,該市建設工程竣工結(jié)算備案審查需提交以下資料:1.報審單位按要求進行填寫下列表格并加蓋印章:(1)《武漢市建設工程竣工結(jié)算備案表》;(2)《武漢市建設工程施工合同備案表》;(3)《武漢市建設工程價款結(jié)算支付證明表》;(4)《武漢市建設工程竣工結(jié)算審查備案指標表》;(5)《建設工程竣工結(jié)算備案審批表》;2.施工許可證;3.施工合同、補充合同、補充協(xié)議;4.招標文件及投標書;5.工程結(jié)算書(含樁基)、造價咨詢報告及《武漢市建設工程項目造價計價監(jiān)管通知書》(含電子數(shù)據(jù));6.造價工程師和造價員證。
不難看出,備案內(nèi)容中包含大量工程造價管理相關(guān)基礎(chǔ)數(shù)據(jù),隨著建設項目的不斷增加,可積累海量工程信息及造價數(shù)據(jù)。如果能借助計算機對這些數(shù)據(jù)進行合理的大規(guī)模分析和比對,可加強對建設市場工程造價的全過程控制和管理,同時為政府部門制定政策提供有力依據(jù)。
開發(fā)基于數(shù)據(jù)挖掘的竣工結(jié)算備案管理系統(tǒng)(以下簡稱“CSRMS”),結(jié)合數(shù)據(jù)挖掘技術(shù)對竣工結(jié)算備案管理系統(tǒng)中的數(shù)據(jù)進行分析,對于提高造價管理水平有非常重要的現(xiàn)實意義。
數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或“挖掘”知識。它利用分類、關(guān)聯(lián)性、序列分析、群集分析、機器自我學習及其他統(tǒng)計方法,從數(shù)據(jù)庫的龐大數(shù)據(jù)中找出隱藏的、未知的,但對經(jīng)營管理十分有用的信息。造價管理部門收集的歷史數(shù)據(jù)量很大,要分析起來相當困難,而利用數(shù)據(jù)挖掘工具,可從龐大的信息中提取有用的信息,以客觀的統(tǒng)計分析方法快速而且準確地找出有關(guān)部門需求的管理信息,得到快速、正確的造價指標分析,有助于把握市場變化趨勢和加強監(jiān)管等,以利于更好的規(guī)范建設承發(fā)包市場。
數(shù)據(jù)倉庫是一個面向主題的、集成的、不可更新的、隨時間不斷變化的數(shù)據(jù)集合,它用于支持企業(yè)或組織的決策分析處理。它是一種語義上一致的數(shù)據(jù)存儲,它充當決策支持數(shù)據(jù)模型的物理實現(xiàn),并存放企業(yè)決策所需信息。數(shù)據(jù)倉庫也常常被看作一種體系結(jié)構(gòu),通過將異種數(shù)據(jù)源中的數(shù)據(jù)集成在一起而構(gòu)造,支持結(jié)構(gòu)化和啟發(fā)式查詢、分析報告和決策制定。
聯(lián)機分析處理(OLAP)是以數(shù)據(jù)庫或數(shù)據(jù)倉庫為基礎(chǔ)的,其最終數(shù)據(jù)來源與OLTP一樣均來自底層數(shù)據(jù)庫系統(tǒng),但由于二者面對的客戶不同,OLTP面對的是操作人員和底層管理人員,OLAP面對的是決策人員和高層管理人員,因而數(shù)據(jù)的特點與處理也明顯不同。OLTP系統(tǒng)管理當前數(shù)據(jù),通常這種數(shù)據(jù)太瑣碎,難以方便地用于決策。OLAP系統(tǒng)管理大量歷史數(shù)據(jù),提供匯總和聚集機制,并在不同粒度級別上存儲和管理信息。因此,這些特點使得數(shù)據(jù)容易用于見多識廣的決策。
以數(shù)據(jù)倉庫為基礎(chǔ)的整體解決方案如圖1所示。圖中設計的DSS將數(shù)據(jù)庫、模型庫及方法有機地結(jié)合在一起,并以面向?qū)ο蟮姆绞竭M行存儲,較好地協(xié)調(diào)了數(shù)據(jù)、模型和方法三者之間的關(guān)系,使整個系統(tǒng)形成一個有機的整體,從而提高了系統(tǒng)的綜合性。整個過程從下至上開發(fā),分為底層基本信息、數(shù)據(jù)倉庫、知識庫、模型庫、方法庫、數(shù)據(jù)挖掘引擎和圖形用戶界面。
圖1 CSRMS框架
底層基本信息:從OLTP應用中獲得各種信息,并存儲在相應的信息庫中??梢栽谶@些數(shù)據(jù)上進行數(shù)據(jù)清理和集成。這里,可以從已有的聯(lián)機事務系統(tǒng)中收集各種需要的信息,即從運作系統(tǒng)中篩選數(shù)據(jù),將數(shù)據(jù)加載一個操作型數(shù)據(jù)庫。比如:工程量數(shù)據(jù)、項目基本信息、招投標信息、變更數(shù)據(jù)、合同數(shù)據(jù)等,這些數(shù)據(jù)都各自存儲加載在操作型的信息庫中。
數(shù)據(jù)倉庫:對數(shù)據(jù)庫進行清理、集成和轉(zhuǎn)換,得到PCBA數(shù)據(jù)倉庫;這里,在操作型數(shù)據(jù)庫中動態(tài)過濾和轉(zhuǎn)換數(shù)據(jù),在適當?shù)娜杭瘜哟紊蠈?shù)據(jù)倉庫加入到企業(yè)范圍內(nèi)的邏輯數(shù)據(jù)倉庫中。比如:將工程量數(shù)據(jù)、項目基本信息等中重要的信息集成,篩除不必要的信息,并建立信息之間的關(guān)聯(lián)??梢圆捎靡恍┲麖S商的產(chǎn)品,如Carleton的Passport,Prism Solutions的Enterprise/Access和ETI-EXTACT工具集。
知識庫:這是領(lǐng)域知識,用于指導搜索或評估結(jié)果模式的興趣度。這種知識可能包括概念分層,用于講屬性或?qū)傩灾到M織成不同的抽象層。用戶確信方面的知識也可以包含在內(nèi)。可以使用這種知識,根據(jù)非期望性評估模式的興趣度。領(lǐng)域知識的其它例子有興趣度限制或閾值和元數(shù)據(jù)(例如,描述來自多個異種數(shù)據(jù)源的數(shù)據(jù))。如:概念分層“年—月—日”和“專業(yè)工程造價—樁基工程—合同價”等這些領(lǐng)域知識。
模型庫:這是根據(jù)領(lǐng)域知識建立的各種模型,可以協(xié)助挖掘引擎進行挖掘。
方法庫:由方法程序庫和方法字典組成。它是存儲方法模塊的工具,由各種通用性和靈活性都比較強的,且可用來構(gòu)成各種數(shù)學模型的算法程序組成。即在造價系統(tǒng)中在不同地區(qū)或時間上工程造價的計算公式。如:專業(yè)工程造價=樁基造價+主體工程造價+……
數(shù)據(jù)挖掘引擎:這是數(shù)據(jù)挖掘系統(tǒng)基本的部分,由一組功能模塊組成,用于特征、關(guān)聯(lián)、分類、聚類分析、演變和偏差分析。用戶可以采用已有的各種工具作為數(shù)據(jù)挖掘的引擎,如:挪威的WEKA,其中包含“決策樹”等多種功能模塊。
模式評估模塊:該部分使用興趣度度量,并與挖掘模塊交互,以便將搜索聚焦在有趣的模式上。它可能使用興趣度閾值過濾發(fā)現(xiàn)的模式。模式評估模塊也可以與挖掘模塊集成在一起,這依賴于所用的數(shù)據(jù)挖掘方法的實現(xiàn)。這里將該模塊集成在挖掘模塊中,如:WEKA的關(guān)聯(lián)分析模塊集成到興趣度測量模塊。
圖形用戶界面:該模塊在用戶和挖掘系統(tǒng)之間通訊,允許用戶與系統(tǒng)交互,指定數(shù)據(jù)挖掘查詢或任務,提供信息、幫助搜索聚焦,根據(jù)數(shù)據(jù)挖掘的中間結(jié)果進行探索式數(shù)據(jù)挖掘。此外,該成分還允許用戶瀏覽數(shù)據(jù)庫和數(shù)據(jù)倉庫模式或數(shù)據(jù)結(jié)構(gòu),評估挖掘的模式,以不同的形式對模式可視化。這里,采用Excel數(shù)據(jù)透視表來進行數(shù)據(jù)分析。
CSRMS采用三層結(jié)構(gòu)利用造價備案庫進行造價控制:(1)業(yè)務層:工程造價備案發(fā)起方提出網(wǎng)上申報申請,將備案所需資料上傳,待工作人員審核通過后,對備案工程的項目名稱、工程內(nèi)容、招投標文件、工程量清單、答疑文件、竣工結(jié)算書等資料進行收集,建立造價數(shù)據(jù)庫;(2)控制層:提供數(shù)據(jù)分析和處理功能,它將工程造價數(shù)據(jù)庫中的數(shù)據(jù)進行分類、整理,并且根據(jù)不同需要構(gòu)建不同的模型,管理人員運用系統(tǒng)工具軟件即可實現(xiàn)造價數(shù)據(jù)統(tǒng)計查詢、造價指標測算分析和造價對比分析的功能;(3)決策層:掌握造價市場變化趨勢,了解變更、材料價格變化趨勢對工程結(jié)算價格的影響。
考慮到竣工結(jié)算的形成過程和所包含的項目,對原有分散的數(shù)據(jù)庫系統(tǒng)分析,確定項目造價數(shù)據(jù)庫原型的基本主題為工程造價反饋控制[1]。該主題的屬性信息包括:項目基本信息、各階段的造價文件(估算、概算、預算、結(jié)算)、變更調(diào)整、材料信息價、審核價格等。
本文針對CSRMS系統(tǒng)建立多維雪花模型(如圖2)。這里,有一個事實表“造價事實表”和多個維表。事實表包含屬性有:時間ID,專業(yè)工程造價ID,備案價ID和工程造價金額。時間ID連接到時間維表;專業(yè)工程造價ID和備案價ID分別連接到專業(yè)工程造價維表和備案價維表。而專業(yè)工程維表包含樁基工程ID和主體工程ID,因此,專業(yè)工程維表中的樁基工程ID和主體工程ID連接到樁基工程維表和主體工程維表,而這兩個維表又包含合同價ID和審核價ID,因此又分別與它們建立關(guān)聯(lián)。
圖2 多維數(shù)據(jù)立方體的雪花模型
在多維數(shù)據(jù)模型中,數(shù)據(jù)組織成多維,每維包含由概念分層定義的多個抽象層。這種組織為用戶從不同角度觀察數(shù)據(jù)提供了靈活性。有一些OLAP數(shù)據(jù)方操作用來物化這些不同視圖,允許交互查詢和分析手頭數(shù)據(jù)。因此,OLAP為交互數(shù)據(jù)分析提供了友好的環(huán)境。
上卷:上卷操作或者通過沿概念分層向上攀升,或者通過維歸約,在數(shù)據(jù)方上進行聚集。例如,沿著年度<月份<日期定義的時間維的概念分層向上,在中心數(shù)據(jù)方執(zhí)行上卷操作。
下鉆:下鉆是上卷的逆操作,它由不太詳細的數(shù)據(jù)到更詳細的數(shù)據(jù)。下鉆可以通過沿維的概念分層向下或引入新的維來實現(xiàn)。沿著日期<月份<年度定義的時間維的概念分層向下,在中心數(shù)據(jù)方執(zhí)行下鉆操作的結(jié)果。這里,下鉆由時間維的分層向下,由年度層到更詳細的月份層。結(jié)果數(shù)據(jù)方詳細地列出每月的總造價,而不是按年度求和。
切片和切塊:切片操作在給定的數(shù)據(jù)方的一個維上進行選擇,導致一個子方。對維時間的切片操作,它對中心數(shù)據(jù)方就可使用條件時間=“Q1”選擇工程造價金額數(shù)據(jù)。切塊操作則通過對兩個或多個維執(zhí)行選擇,定義子方。
轉(zhuǎn)軸:是一種目視操作,它轉(zhuǎn)動數(shù)據(jù)的視角,提供數(shù)據(jù)的替代表示。
竣工結(jié)算備案可以采集海量工程造價相關(guān)基礎(chǔ)數(shù)據(jù),通過規(guī)范數(shù)據(jù)采集過程建立數(shù)據(jù)倉庫,采用數(shù)據(jù)挖掘技術(shù)從龐大的信息中提取有用的信息,以客觀的統(tǒng)計分析方法快速而且準確地找出有關(guān)部門需求的管理信息,有助于提高造價管理水平,能更及時的發(fā)布造價市場所需要的指導信息。在竣工結(jié)算備案管理系統(tǒng)建設中應考慮的問題:(1)鑒于開發(fā)和利用信息資源是一項動態(tài)的長期工程,政府有關(guān)部門應根據(jù)目前的實際和未來的發(fā)展趨勢,進一步展開調(diào)研,提出科學合理的體系架構(gòu)。(2)堅持統(tǒng)一規(guī)劃和規(guī)范組織的建設原則,根據(jù)發(fā)展所需,及時制定適用的政策措施,以規(guī)范信息資源建設涉及到的方方面面,保障開發(fā)利用的有效性。(3)兼容市場上各大造價軟件,形成統(tǒng)一的數(shù)據(jù)采集與應用規(guī)范,建立運行分析指標體系,為常規(guī)性運行分析奠定基礎(chǔ)[2]。(4)為與造價人員、造價咨詢企業(yè)監(jiān)管系統(tǒng)對接以及同其他備案系統(tǒng)共享數(shù)據(jù)留下接口。(5)解決備案資料公布所產(chǎn)生的法律效力問題。(6)抓好隊伍建設和人員培訓,以保證實現(xiàn)開發(fā)與利用的統(tǒng)一,使系統(tǒng)能夠發(fā)揮其應有的效益。
[1]趙璐,丁烈云.基于數(shù)據(jù)挖掘的工程項目投資控制系統(tǒng)[J].施工技術(shù),2009,(5):111-114.
[2]李秋芳.關(guān)于建設工程造價成果文件備案的思考[J].廣西城鎮(zhèn)建設,2007,(8):100-101.