郭書翊
(山西交通科學(xué)研究院集團有限公司 太原市 030006)
在傳統(tǒng)的公路、水運、民航、鐵路等這幾種運輸方式中,公路運輸具有便捷、迅速、覆蓋范圍廣的特點[1]。公路工程造價預(yù)測對于工程項目建設(shè)起著決定性作用,關(guān)系著國家經(jīng)濟基礎(chǔ)的發(fā)展,一直受到政府和社會高度重視。公路工程造價的估算一直是公路建設(shè)中一項重要的造價管理與投資控制內(nèi)容;是公路工程前期規(guī)劃建設(shè)的決策依據(jù)以及造價評估的根本基礎(chǔ);對項目進行項目可行性分析和經(jīng)濟效益評價的重要指標(biāo),其影響著整個公路工程的造價[2]。近年來,隨著社會經(jīng)濟的發(fā)展,對基礎(chǔ)設(shè)施建設(shè)的投入不斷加大,全國的公路路網(wǎng)結(jié)構(gòu)也在不斷更新完善。在以往的工程建設(shè)中,對工程造價預(yù)測的方法簡單粗略,如以工程經(jīng)驗數(shù)據(jù)為基礎(chǔ)的參數(shù)法、人工學(xué)習(xí)理論包括模糊數(shù)學(xué)、神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)等的估算方法不是需要專家做主觀判斷,就是需要大量的數(shù)據(jù)做預(yù)測支撐,不符合實際工程中造價預(yù)測的真實性和可行性,這些方法都已經(jīng)不能滿足現(xiàn)代工程項目對造價預(yù)測的精確程度及效率要求?;诖?,本文結(jié)合灰色關(guān)聯(lián)度和支持向量機理論,利用支持向量機學(xué)習(xí)較強的數(shù)據(jù)記憶學(xué)習(xí)和泛推廣的能力,將低維空間的輸入數(shù)據(jù)通過特定的核函數(shù)映射到高維屬性空間從而能夠較好地處理公路造價與諸多不確定工程特征因素之間的多維非線性關(guān)系,建立工程項目的造價預(yù)測模型[3]。在實際工程規(guī)劃建設(shè)中,該模型可以準(zhǔn)確快速地預(yù)測出公路工程的造價,為工程建設(shè)投資提供科學(xué)、有效的決策方法。
公路工程特征指標(biāo)反映了公路工程的特點,同時也是公路工程建設(shè)中合理預(yù)測主要成本構(gòu)成的重要依據(jù)。如何選取具有代表性的工程特征指標(biāo)是工程造價預(yù)測工作的首要目標(biāo),必須合理而準(zhǔn)確地選擇各工程特征指標(biāo),構(gòu)建合理的造價估算特征指標(biāo)體系,才能使預(yù)測出的結(jié)果與實際值接近[4]。結(jié)合公路造價預(yù)測指標(biāo)獨立并具有代表性的特點,本文在查閱各種文獻以及參考已有研究出來的工程特征指標(biāo)的基礎(chǔ)上,合理選擇了實際工程造價預(yù)測典型指標(biāo),從而構(gòu)建了公路工程造價估算定性與定量結(jié)合的特征指標(biāo)體系[5-8],見表1。
表1 公路工程造價體系
1.2.1確定參考序列和對比序列
記公路工程參考案例n個,實例中公路工程單位里程平均造價序列為參考數(shù)列中各值,則
X0={X0(1),X0(2),…,X0(n)}
式中:X0(n)表示第n條公路工程對應(yīng)的單位里程平均造價,即每千米高速公路造價值。根據(jù)表1所確定的工程造價預(yù)測特征指標(biāo)體系,預(yù)測特征指標(biāo)共計9個,做比較序列的指標(biāo)為9個,比較序列中各值為各估算特征指標(biāo)相應(yīng)的數(shù)值。則
Xi={Xi(1),Xi(2),…,Xi(n)}
式中:Xi(n)表示第i個估算特征指標(biāo)對應(yīng)的第n條高速公路的相應(yīng)數(shù)值。
1.2.2數(shù)據(jù)標(biāo)準(zhǔn)化處理
實際工程案例中的數(shù)據(jù)量綱(單位)不統(tǒng)一,而且數(shù)據(jù)可能懸殊較大,計算機不能有效地識別和計算這類數(shù)據(jù),在進行數(shù)據(jù)分析計算之前必須對原始工程數(shù)據(jù)進行統(tǒng)一化數(shù)據(jù)處理[6]。本文對數(shù)據(jù)進行處理方法采用常用的離差標(biāo)準(zhǔn)化法,如下所示:
xi=(Xi-Xmin)/(Xmax-Xmin)
式中:Xmin、Xmax分別為相應(yīng)序列的最小值和最大值。
1.2.3灰色關(guān)聯(lián)度系數(shù)及關(guān)聯(lián)度計算
灰色關(guān)聯(lián)系數(shù)計算公式如下:
η0i(k)=
式中:|X0(k)-Xi(k)|代表參考數(shù)列和比較序列在工程特征k處的絕對差。max max|X0(k)-Xi(k)|和min min|X0(k)-Xi(k)|分別代表所有參考序列和比較序列在各工程k處絕對差中的最大值和最小值;η0i(k)代表X0和Xi在工程k處的關(guān)聯(lián)系數(shù);λ稱為分辨率,一般λ取0.5。將上式中求出的灰色關(guān)聯(lián)系數(shù)η0i(k)帶入灰色關(guān)聯(lián)度公式中,則各估算特征指標(biāo)與單位里程平均造價的關(guān)聯(lián)程度如下式:
1.2.4預(yù)測指標(biāo)權(quán)重計算
記(r1,r2,…,r9)為各估算特征指標(biāo)與單位里程平均造價的關(guān)聯(lián)程度系數(shù),將對應(yīng)數(shù)據(jù)依次代入下列公式:
1.3.1建立樣本集
合理的選取樣本集是機器學(xué)習(xí)的基礎(chǔ)。一般選取的工程樣本案例相似程度越高,其工程特征越相似,造價越接近,預(yù)測的效果越理想。根據(jù)前文灰色關(guān)聯(lián)度理論確定相似工程,本文選取灰色關(guān)聯(lián)度較高的工程作為樣本工程進行機器學(xué)習(xí),然后將典型的已建高速公路的工程特征指標(biāo)數(shù)據(jù)、工程造價資料等作為學(xué)習(xí)樣本對機器進行訓(xùn)練建立支持向量機模型。訓(xùn)練高效準(zhǔn)確的造價預(yù)測模型是機器學(xué)習(xí)的核心,公路工程造價估算特征影響因素作為支持向量機的輸入數(shù)據(jù)X=(X1,X2,…,Xi);將預(yù)測決算中相應(yīng)工程單位里程平均造價作為支持向量機的輸出結(jié)果Y,待機器充分學(xué)習(xí)記憶后便可得到合理的預(yù)測模型。
1.3.2核函數(shù)選擇及參數(shù)優(yōu)化
回歸學(xué)習(xí)的目的在于構(gòu)造回歸函數(shù)使其與目標(biāo)值的距離小于ε,同時函數(shù)VC維最小。根據(jù)核函數(shù)及其參數(shù)對SVM性能影響的理論構(gòu)造決策回歸函數(shù):
核函數(shù)的選擇對工程造價回歸預(yù)測起著決定性作用。因徑向基核函數(shù)(RBF)具有計算簡單、較好泛化能力,可以克服因樣本不連續(xù)、不平衡等因素而帶來的不良影響,本文選擇徑向基核函數(shù)對模型訓(xùn)練。
式中σ參數(shù)需要進行優(yōu)化。
1.3.3模型訓(xùn)練及預(yù)測
利用MATLAB程序建立公路工程每公里造價與特征指標(biāo)之間的非線性映射關(guān)系,選擇參數(shù),模型訓(xùn)練時將每個相似工程作為預(yù)測樣本,即輸入量X=(X1,X2,…,Xi),輸出各自對應(yīng)的單位里程平均預(yù)測單價,即輸出量Y,與單位里程平均實際單價比較,訓(xùn)練模型的估算誤差不超過10%則得到合理模型,最后輸入待估算工程樣本數(shù)據(jù)進行預(yù)測。
通過查閱資料及已建公路工程相關(guān)數(shù)據(jù),搜集了山西省內(nèi)11條高速公路造價(建安費)對應(yīng)的9個相應(yīng)預(yù)測影響指標(biāo)數(shù)據(jù),見表2。
表2 11條已建高速公路的工程數(shù)據(jù)
注:因不同地形對公路工程建安費的影響程度不同,分別取值對應(yīng)為0.8(山地)、0.5(丘陵)和0.3(平原)。
對全部數(shù)據(jù)進行規(guī)范化處理,以指標(biāo)X0為例:
其中x01代表指標(biāo)X0對應(yīng)的第一條高速公路規(guī)范化后的數(shù)據(jù);x02代表指標(biāo)X0對應(yīng)的第二條高速公路規(guī)范化后的數(shù)據(jù)。
同理,其它指標(biāo)處理后的各特征指標(biāo)數(shù)據(jù)見表3。
表3 公路工程造價影響特征指標(biāo)規(guī)范化數(shù)據(jù)
根據(jù)以上資料,擬選擇11號高速公路作為待測工程對模型進行檢驗,剩下 10 項工程數(shù)據(jù)作為候選樣本工程對模型進行訓(xùn)練。根據(jù)前文灰色關(guān)聯(lián)系數(shù)計算公式得到各樣本的灰色關(guān)聯(lián)度,從大到小依次選取前7位公路工程即10、9、2、3、6、7、1號高速公路作為15號高速公路的相似工程。采用MATLAB建模,將預(yù)測項目估算的訓(xùn)練樣本、測試樣本數(shù)據(jù)輸入程序后,對訓(xùn)練樣本進行訓(xùn)練及參數(shù)尋優(yōu)選擇, 其估算結(jié)果如表4。
表4 預(yù)測結(jié)果分析
由表4可以看出,支持向量機理論模型的估算誤差小于10%,平均估算精度達到了92.27%,這已超出了項目前期所期望的估算要求,該結(jié)果也同時驗證了徑向基核函數(shù)在本模型中的良好適配性,預(yù)測結(jié)果令人滿意。
將灰色關(guān)聯(lián)度、支持向量機回歸預(yù)測等方法應(yīng)用到公路工程投資估算預(yù)測工作,克服了公路工程造價預(yù)測影響因素多、不連續(xù)及非線性的特點,充分發(fā)揮了灰色關(guān)聯(lián)度和支持向量機理論在處理有限樣本條件下非線性回歸問題的能力,建立了基于灰色關(guān)聯(lián)度及支持向量機理論的公路建設(shè)項目造價預(yù)測新模型。該預(yù)測模型可以作為公路工程投資估算預(yù)測的一種方法。