牛衍亮,高立揚(yáng),段曉晨,趙 丹
(1.石家莊鐵道大學(xué) 經(jīng)濟(jì)管理學(xué)院,河北 石家莊 050043;2.中鐵二十局集團(tuán)第四工程有限公司,山東 青島 266061)
根據(jù)我國發(fā)展改革委2016年印發(fā)的《中長期鐵路網(wǎng)規(guī)劃》,為在最大程度上適應(yīng)大量旅客的運(yùn)輸和出行需求,從2020到2030年,高速鐵路網(wǎng)將大幅度增加影響范圍,進(jìn)一步提高鐵路運(yùn)輸?shù)暮诵淖饔谩8咚勹F路建設(shè)項(xiàng)目投資數(shù)額巨大、耗時(shí)長、結(jié)構(gòu)復(fù)雜、輻射范圍廣、技術(shù)要求高且某些地區(qū)的施工難度大,同時(shí)也受到時(shí)間、地域、市場價(jià)格、施工設(shè)計(jì)方案等復(fù)雜因素的影響。建設(shè)項(xiàng)目投資決策實(shí)際發(fā)生的費(fèi)用不足工程總造價(jià)的5%,但其對(duì)整個(gè)項(xiàng)目的總造價(jià)有15%~95%的影響[1],因此決策階段的投資估算需要精益求精,這對(duì)整個(gè)高速鐵路建設(shè)項(xiàng)目的資金配置具有重要意義。另外,工程總承包項(xiàng)目投標(biāo)額也需要精準(zhǔn)的造價(jià)估算。
目前,造價(jià)工作者大多沿用傳統(tǒng)的、簡單的線性模型(單位生產(chǎn)能力估算法、生產(chǎn)能力指數(shù)估算法、比例估算法、朗格系數(shù)法、資金周轉(zhuǎn)率法等)進(jìn)行造價(jià)估算,從而導(dǎo)致工程造價(jià)估算精度普遍較低,越來越不滿足投資決策及工程總承包項(xiàng)目投標(biāo)額確定的要求。大量高鐵項(xiàng)目出現(xiàn)大幅的“三超”現(xiàn)象,使高鐵業(yè)界與學(xué)界越來越關(guān)注投資估算的準(zhǔn)確性及其方法問題[2,3]。
BP神經(jīng)網(wǎng)絡(luò)是學(xué)界研究的熱點(diǎn),國內(nèi)外均有學(xué)者針對(duì)其算法和應(yīng)用進(jìn)行研究。Anastasiadis等[4]對(duì)傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行了網(wǎng)絡(luò)結(jié)構(gòu)的改進(jìn)。周麗萍、胡振鋒[5]主要針對(duì)建筑工程項(xiàng)目應(yīng)用BP神經(jīng)網(wǎng)絡(luò)計(jì)算出項(xiàng)目的造價(jià),經(jīng)過誤差測算,結(jié)果滿足精度要求,論證了方法的可行性。段曉晨等[6,7]立足于研究工程項(xiàng)目修建產(chǎn)生的環(huán)境成本,提出一種適用性更強(qiáng)的算法,即將BP神經(jīng)網(wǎng)絡(luò)同傳統(tǒng)的線性算法結(jié)合,構(gòu)建了非線性環(huán)境成本預(yù)測模型。
綜上,本文將顯著性成本理論與基于余弦相似度-神經(jīng)網(wǎng)絡(luò)模型的造價(jià)估算方法相結(jié)合,研究高鐵土建工程非線性投資估算。首先運(yùn)用顯著性成本理論、灰色關(guān)聯(lián)分析、專家訪談,識(shí)別影響高鐵土建工程造價(jià)的顯著性成本因子,構(gòu)建高鐵土建工程造價(jià)基礎(chǔ)數(shù)據(jù)庫。然后運(yùn)用余弦相似度方法在構(gòu)建的造價(jià)基礎(chǔ)數(shù)據(jù)庫中選取與擬建項(xiàng)目相類似的案例集。然后使用BP神經(jīng)網(wǎng)絡(luò)確定顯著性成本因子與造價(jià)的非線性關(guān)系,實(shí)現(xiàn)基于余弦相似度-神經(jīng)網(wǎng)絡(luò)模型的高鐵擬建工程項(xiàng)目的土建工程造價(jià)估算[1]。
Saket[8],Asif[9],Zakieh[10]等人在研究工程項(xiàng)目的造價(jià)構(gòu)成時(shí)發(fā)現(xiàn):18%的工程子目成本占據(jù)項(xiàng)目總成本的81%,也就是說大約有20%的項(xiàng)目子目成本構(gòu)成了80%的總造價(jià)(二八原則)。同時(shí),這些研究顯示擬建項(xiàng)目的顯著性成本因子和已完工程的顯著性成本因子有很大的相似性。
通過鐵路項(xiàng)目調(diào)研、文獻(xiàn)資料閱讀、問卷調(diào)查、網(wǎng)絡(luò)新聞報(bào)道等方式獲得數(shù)據(jù)信息;結(jié)合已完工程在其決策階段、設(shè)計(jì)階段、施工階段、竣工結(jié)算階段的基礎(chǔ)數(shù)據(jù)信息,分析得到高鐵土建工程造價(jià)影響因素集(工程特征)。按照式(1)在顯著性成本理論的基礎(chǔ)上,針對(duì)已經(jīng)建設(shè)完畢的高鐵土建工程的工程特征分類匯總后,選取影響其造價(jià)的顯著性成本因子。
(1)
式中:C為高鐵項(xiàng)目土建工程總造價(jià);N為高鐵項(xiàng)目土建工程的工程特征個(gè)數(shù);T為高鐵項(xiàng)目土建工程特征平均造價(jià)。
在已完工項(xiàng)目分部分項(xiàng)中的139個(gè)工程特征中,有34個(gè)工程特征(約占全部工程特征的20%)的造價(jià)影響高于平均值;并且對(duì)各個(gè)已完工程的34個(gè)工程特征的造價(jià)求和后,發(fā)現(xiàn)其占據(jù)整個(gè)土建工程造價(jià)的80%左右,因此將其確定為影響造價(jià)的顯著性成本因子,并且通過灰色關(guān)聯(lián)度和專家訪談方法分析確認(rèn)后,最終得出影響高鐵土建工程造價(jià)的顯著性成本因子,如表1所示。由于文章篇幅限制,通過灰色關(guān)聯(lián)分析、專家訪談方法進(jìn)行分析和驗(yàn)證的具體過程未列出,如有需要,可向作者索取。
表1 高鐵土建工程造價(jià)顯著性成本因子及文獻(xiàn)識(shí)別
基于課題組參與的高鐵項(xiàng)目數(shù)據(jù),以及專項(xiàng)業(yè)界調(diào)研收集的項(xiàng)目報(bào)價(jià)單及造價(jià)相關(guān)資料,并與期刊、《鐵路年鑒》等數(shù)據(jù)相對(duì)照,建立了包含含40個(gè)高鐵項(xiàng)目案例的數(shù)據(jù)庫(關(guān)于各高鐵項(xiàng)目34個(gè)指標(biāo)的具體信息以及指標(biāo)量化方法,由于篇幅所限,如有需要,可向作者索取)。同時(shí),由于各項(xiàng)目建設(shè)時(shí)間不同,需要對(duì)數(shù)據(jù)進(jìn)行時(shí)間調(diào)整。本文在對(duì)擬建項(xiàng)目進(jìn)行造價(jià)估算時(shí),將已完工項(xiàng)目的最終造價(jià)數(shù)據(jù)統(tǒng)一折算到2018年底。以案例高鐵項(xiàng)目竣工年為研究基年,將其造價(jià)通過歷年的通貨膨脹系數(shù)調(diào)整到2018年。由于案例庫項(xiàng)目從2008年開始,因此搜集2008~2018年的通貨膨脹系數(shù),按照式(2)計(jì)算,將其設(shè)為α。
α=(1+a1)(1+a2)(1+a3)…(1+an)
(2)
式中:a1~an為統(tǒng)計(jì)的從2008~2018年每年的通貨膨脹系數(shù)。
除此之外,還需要對(duì)不同地區(qū)的項(xiàng)目進(jìn)行調(diào)整,根據(jù)當(dāng)?shù)氐脑靸r(jià)指數(shù)可以將不同地區(qū)的項(xiàng)目調(diào)整至基準(zhǔn)地區(qū)。但由于我國高鐵項(xiàng)目的分區(qū)域造價(jià)指數(shù)還沒有公開的信息,所以此項(xiàng)工作有待于后續(xù)完善。
綜上,得到已完工高鐵項(xiàng)目造價(jià)指標(biāo)量化值示于表2。
表2 已完工高鐵建設(shè)項(xiàng)目顯著性因子量化值
余弦相似度是一種變量間的相似度測量方法,即計(jì)算各個(gè)個(gè)體間的相似程度。得出的數(shù)值越小,說明個(gè)體間相似度越小;反之說明研究的個(gè)體間的相似度越大[36]。余弦相似度具有很強(qiáng)的穩(wěn)定性和交叉性,且由于原理基于扎實(shí)的基礎(chǔ)數(shù)學(xué)理論,得到了眾多領(lǐng)域的研究與應(yīng)用。經(jīng)過前人大量的實(shí)驗(yàn)得出此方法在分析特征的相似度上有較高的準(zhǔn)確性,同時(shí)其運(yùn)算過程具有較為簡便的特點(diǎn)。在比較了多種分析已完工類似工程和擬建工程相似度的方法后,文章選取余弦相似性分析方法進(jìn)行項(xiàng)目間相似度的判別。
余弦相似度的測量是運(yùn)用兩個(gè)向量的內(nèi)積空間夾角α的余弦值來度量兩個(gè)個(gè)體間的相似性。兩個(gè)向量m與n之間的余弦相似度按照式(3)計(jì)算。
(3)
在搜索個(gè)體的顯著性成本因子的過程中,研究對(duì)象的特征由一個(gè)有權(quán)值的特征向量表示,任意兩個(gè)樣本A,B的余弦相似度按照式(4)計(jì)算。
(4)
式中:n為樣本空間項(xiàng)目總數(shù);Xi,Yi表示第i個(gè)顯著性成本因子在項(xiàng)目X,Y中分別對(duì)應(yīng)的數(shù)量。余弦相似度方法界定的個(gè)體間相似性范圍為(-1,1)。其中,-1表示兩個(gè)向量指向的方向呈現(xiàn)180°的角,表示完全沒有相似性;1表示兩個(gè)向量夾角是0°,表示相似性最高;0通常表示兩個(gè)向量之間是相互獨(dú)立的,表示兩個(gè)個(gè)體之間沒有相似的關(guān)系。
根據(jù)研究個(gè)體的實(shí)際情況來設(shè)定余弦相似度閾值,從而可以確定變量之間的相似程度[37],其閾值范圍示于表3。
表3 余弦相似度對(duì)應(yīng)變量相關(guān)性
因此,通過整合已完類似工程特征,對(duì)其進(jìn)行量化處理,將每個(gè)項(xiàng)目的工程特征當(dāng)作一個(gè)矩陣。將擬建工程項(xiàng)目工程特征進(jìn)行量化處理后與已完工項(xiàng)目兩兩比較,通過相似度公式計(jì)算得來二者的相關(guān)性。根據(jù)相似度的劃分可以得到造價(jià)預(yù)測模型的基礎(chǔ)數(shù)據(jù)。
BP(BackPropagation)神經(jīng)網(wǎng)絡(luò)是對(duì)計(jì)算出的誤差進(jìn)行一種反向訓(xùn)練傳播并糾正的神經(jīng)網(wǎng)絡(luò)的簡稱。它由輸入層、隱含層和輸出層組成,類似于人腦的傳播反饋系統(tǒng)。這些神經(jīng)元如同人的神經(jīng)細(xì)胞一樣是彼此之間互相關(guān)聯(lián)的。BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的輸入層、隱含層、輸出層分別有n個(gè)、p個(gè)、q個(gè)神經(jīng)元[38,39]。針對(duì)傳統(tǒng)的標(biāo)準(zhǔn)3層BP神經(jīng)網(wǎng)絡(luò),文章通過MATLABR2016a來實(shí)現(xiàn)預(yù)測。
(1)輸入、輸出神經(jīng)元的確定
為構(gòu)建高鐵土建工程造價(jià)非線性估算模型,BP神經(jīng)網(wǎng)絡(luò)中的輸入層為選取的影響高鐵土建造價(jià)顯著性成本因子,然后通過隱含層對(duì)輸入的數(shù)值通過計(jì)算處理傳輸?shù)捷敵鰧?,最后輸出層針?duì)計(jì)算出的結(jié)果自動(dòng)與期望的數(shù)值進(jìn)行分析對(duì)比。如果輸入值和輸出值相差較大,則開始進(jìn)行誤差的反向傳播,直到達(dá)到理想值為止。
(2)隱含層神經(jīng)元數(shù)的確定
設(shè)置適當(dāng)?shù)碾[含層個(gè)數(shù)來達(dá)到預(yù)測的精度要求,實(shí)現(xiàn)降低誤差的目的。在許多具體的實(shí)驗(yàn)測算過程中,確定隱含層個(gè)數(shù)的方法就是根據(jù)柯爾莫哥洛夫定理,因此文章也參照此方法將隱含層神經(jīng)元數(shù)量計(jì)為2r+1(其中,r表示輸入層數(shù)據(jù)的個(gè)數(shù))。
(3)初始權(quán)值確定
對(duì)于初始值,在BP神經(jīng)網(wǎng)絡(luò)運(yùn)算系統(tǒng)的過程中通過(-1,1)之間的隨機(jī)數(shù)實(shí)現(xiàn)。
(4)節(jié)點(diǎn)函數(shù)的確定
由于Sigmoid函數(shù)對(duì)任何數(shù)據(jù)的輸入都可以轉(zhuǎn)化為(0,1)之間的數(shù),故文章選取其作為節(jié)點(diǎn)輸出函數(shù)。
新建貴陽至南寧鐵路位于貴州省東南部和廣西壯族自治區(qū)西北部,本標(biāo)段的設(shè)計(jì)行車速度為350km/h,2018年1月開工,計(jì)劃2023年12月竣工。正線長度21.353km。該標(biāo)段位于貴州貴定、都勻境內(nèi),貴定地區(qū)地貌類型是高原。都勻地區(qū)的北部山地分布廣;中南部河流眾多,有大面積的盆地;該地區(qū)地貌有較廣范圍的喀斯特地貌,有大面積的侵蝕現(xiàn)象;地形類型多樣,山地、丘陵、盆地、河谷相間分布。表層的土質(zhì)為粉質(zhì)黏土,不良地質(zhì)災(zāi)害主要來自于順巖、危巖落石。
依據(jù)所建立的高速鐵路建設(shè)項(xiàng)目工程特征可以對(duì)貴陽至南寧高鐵貴州段GNZQ-2標(biāo)段進(jìn)行全面系統(tǒng)的描述,然后量化,運(yùn)用MATLABR2016a運(yùn)算結(jié)果,擬建項(xiàng)目與已完工項(xiàng)目的相似度示于表4。
表4 余弦相似度結(jié)果
文章選取與擬建項(xiàng)目相似度在0.8以上的項(xiàng)目作為類似工程樣本進(jìn)行測算,即有25個(gè)類似案例。根據(jù)輸入-輸出映射復(fù)雜程度,將其中23個(gè)項(xiàng)目作為訓(xùn)練樣本,2個(gè)項(xiàng)目作為測試樣本,用MATLABR2016a中提供的BP網(wǎng)絡(luò)函數(shù)構(gòu)建模型。
構(gòu)建BP網(wǎng)絡(luò)主要過程如下:
(1)按照式(5)將輸入向量I1~I(xiàn)34輸出向量數(shù)據(jù)標(biāo)準(zhǔn)化
(5)
式中:Xij為原向量數(shù)據(jù);X′ij為標(biāo)準(zhǔn)化后數(shù)據(jù),用X′ij代替相應(yīng)Xij,得出BP神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)數(shù)據(jù)。
(2)構(gòu)建BP網(wǎng)絡(luò)
輸入?yún)?shù)為34個(gè)輸入單元,69個(gè)隱層單元,1個(gè)輸出單元,其余為默認(rèn)值。
(3)訓(xùn)練BP網(wǎng)絡(luò)
將第1~23個(gè)工程數(shù)據(jù)作為訓(xùn)練樣本,最大迭代次數(shù)200次,容許誤差10-18,運(yùn)算過程和誤差曲線如圖1,2所示。
圖1 訓(xùn)練過程
圖2 誤差曲線
由于神經(jīng)網(wǎng)絡(luò)預(yù)測模型初始化的權(quán)值和閾值是隨機(jī)的,因此導(dǎo)致模型輸出結(jié)果不是一個(gè)定值。在這種情況下,參考前人處理經(jīng)驗(yàn),對(duì)模型進(jìn)行多次運(yùn)算來消除隨機(jī)性帶來的誤差,文章進(jìn)行了10次運(yùn)行,結(jié)果如表5所示。
根據(jù)多次運(yùn)行結(jié)果運(yùn)用不同的方法測算后,在對(duì)輸出結(jié)果采用均值法進(jìn)行處理所得到的與實(shí)際值的誤差都在5%以內(nèi)(其中,擬建項(xiàng)目造價(jià)實(shí)際值是指中標(biāo)單位的單位投標(biāo)報(bào)價(jià)),經(jīng)過學(xué)界和業(yè)界論證后此誤差范圍符合項(xiàng)目的誤差要求且精度較高。故采用訓(xùn)練后的模型對(duì)貴陽至南寧高鐵貴州段GNZQ-2標(biāo)段單位造價(jià)的預(yù)測合理可行。
通過分析表5的數(shù)據(jù)可以發(fā)現(xiàn):預(yù)測的組數(shù)據(jù)中,預(yù)測結(jié)果與實(shí)際值的絕對(duì)誤差均小于500萬元。預(yù)測樣本的相對(duì)誤差最大為3.74%,相對(duì)誤差最小的為1.31%,都在±5%以內(nèi)。因此,采用神經(jīng)網(wǎng)絡(luò)構(gòu)建的高鐵土建工程造價(jià)預(yù)測模型來進(jìn)行投資估算的預(yù)測效果很好,相對(duì)誤差較小。
表5 貴陽至南寧高鐵貴州段GNZQ-2標(biāo)段建設(shè)成本分析
本研究的主要工作包括:(1)通過大量文獻(xiàn)識(shí)別高鐵造價(jià)影響因素,并基于顯著性成本理論通過對(duì)因子進(jìn)行定量分析最終確定顯著性成本因子;(2)運(yùn)用余弦相似度方法選取案例庫中的已完工類似工程,確定相似度在0.8以上的已完工工程為造價(jià)預(yù)測的基礎(chǔ)數(shù)據(jù)庫,具有較強(qiáng)的可操作性和科學(xué)性;(3)借助MATLAB R2016a 軟件實(shí)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)造價(jià)估算,雖然BP神經(jīng)網(wǎng)絡(luò)是一種“黑箱”訓(xùn)練,擬建項(xiàng)目的造價(jià)和已完工類似工程的造價(jià)相似度具有模糊性,但是其具有反向?qū)W習(xí)、較高的容錯(cuò)性能,這也達(dá)到了快速處理數(shù)據(jù)的要求,通過多次試驗(yàn),求得預(yù)測造價(jià)值的平均值可以降低隨機(jī)性,并達(dá)到精度要求,提高了高鐵土建工程造價(jià)估算的準(zhǔn)確度。