李姣姣
(合肥城市學(xué)院 安徽合肥 230601)
隨著科技和經(jīng)濟的不斷發(fā)展,建筑工程也逐漸復(fù)雜化、大型化[1]。目前關(guān)于建筑工程造價預(yù)測的方式多集中在住宅建筑方面,同時大多通過單一的機器學(xué)習(xí)算法進行預(yù)測,這就導(dǎo)致適用性不強,精確度偏低的問題[2-4]。文章旨在通過多種算法結(jié)合支持向量機進行對比,從中選擇最優(yōu)的混合模型。
通過企業(yè)信息收集以及造價信息網(wǎng)等方式,對某市新建建筑工程信息進行收集,共收集52例項目。經(jīng)過分析以及篩選,得到39例樣本工程數(shù)據(jù),由此組成的箱型圖如圖1所示。
圖1 單方造價箱型圖
由圖1得到的數(shù)據(jù)包含兩種類型:描述型和數(shù)字型。針對描述型,工程造價在進行特征量化時按照從低到高的順序進行。如裝修標(biāo)準(zhǔn)中,毛坯房為1,簡裝為2,精裝為3,暖通方面由低到高分為1~4級,其中1級粗糙度最高;針對數(shù)字型,按照對應(yīng)的數(shù)值分析量化數(shù)據(jù)。量化后借助SPSS進行對應(yīng)的標(biāo)準(zhǔn)化,所得數(shù)據(jù)如表1所示。
表1 標(biāo)準(zhǔn)化工程造價數(shù)據(jù)節(jié)選
表1中,節(jié)選了部分標(biāo)準(zhǔn)化的數(shù)據(jù)。其中,樣本數(shù)據(jù)類型說明如表2。
表2 樣本數(shù)據(jù)類型說明
結(jié)合表2,各數(shù)據(jù)類型正則化后均在3標(biāo)準(zhǔn)差內(nèi),符合實際的數(shù)據(jù)需求。
通過對多變量向少量主成分進行轉(zhuǎn)化,由綜合的數(shù)據(jù)指標(biāo)對原始數(shù)據(jù)的特征信息反應(yīng)即主成分分析。主成分分析的方法一是可以避免不同影響因素相互的關(guān)聯(lián)性影響實際預(yù)測,而是可以避免輸入量過多產(chǎn)生的過擬合問題。對篩選所得的39例樣本工程數(shù)據(jù)進行主成分分析,通過降維進行少量主成分的等效轉(zhuǎn)化。
以標(biāo)準(zhǔn)化為基礎(chǔ),對給定指標(biāo)值構(gòu)建相應(yīng)的矩陣,如下所示:
(1)
式(1)的39×19階矩陣中,結(jié)合SPSS中矩陣的相關(guān)性理論,對變量的相關(guān)性進行Bartlett's球形檢驗以及相應(yīng)的KMO檢驗,所得結(jié)果如表3所示。
表3 相關(guān)性檢驗結(jié)果
表3中,Bartlett's檢驗所得應(yīng)小于0.001,KMO檢驗所得值應(yīng)大于0.7。Bartlett's檢驗值為0.000,KMO檢驗所得值0.717,均符合要求,也即數(shù)據(jù)輸入結(jié)構(gòu)合理,能夠記性進一步的主成分分析。
對主成分特征值以及貢獻率等進行分析,所得結(jié)果如表4所示。
表4 主成分特征值與貢獻率分析
在主成分分析中,通常要求總方差即累計貢獻率超過80%,符合主成分結(jié)束的要求。方案設(shè)計將該值設(shè)定為85%,結(jié)合表4,對前8個貢獻率較高的進行提取,其累計貢獻率為85.530,滿足總體解釋需求。同時,數(shù)據(jù)因子的提取需結(jié)合造價數(shù)據(jù)碎石,如圖2所示。
圖2 造價數(shù)據(jù)碎石圖
圖2中,在第8個數(shù)據(jù)因子中出現(xiàn)較為明顯的拐點,對前8個數(shù)據(jù)提取滿足實際分析需求。
在非線性以及多因素的分析問題中,灰色關(guān)聯(lián)的方式應(yīng)用廣泛?;疑P(guān)聯(lián)主要通過對序列曲線對應(yīng)的集合相似度來進行不同序列關(guān)聯(lián)度的判斷,序列關(guān)聯(lián)度越大,序列曲線的形狀越相似?;疑P(guān)聯(lián)是一種有序的相關(guān)性分析方式,其計算公式如公式(2)。
ξ0,1(k)=
(2)
式(2)中,分辨系數(shù)用ρ表示,對應(yīng)的參考序列用x0(k)表示,指標(biāo)個數(shù)用m表示,對象個數(shù)用n表示。其中i=1,2,…,n,k=1,2,…,m。
對應(yīng)的關(guān)聯(lián)序通過公式(3)進行計算。
(3)
通過DPS分析39個項目案例與數(shù)據(jù)因子的灰色關(guān)聯(lián),分析時分辨系數(shù)的值設(shè)定為0.5,得到的關(guān)聯(lián)度如表5所示。
表5 因子與工程造價之間的關(guān)聯(lián)度
表5中,結(jié)合工程造價中實際的重要影響因素以及關(guān)聯(lián)度排序數(shù)據(jù),從中選擇X18、X17、X15、X12、X4、X6、X5、X2、X19共9項數(shù)據(jù)因子作為預(yù)測模型的輸入集。
對預(yù)測模型性能的進一步提高,通過結(jié)合BP神經(jīng)網(wǎng)絡(luò)、SVM支持向量機以及BP神經(jīng)網(wǎng)絡(luò)完成。
BP神經(jīng)網(wǎng)絡(luò)包括輸出層、隱含層以及輸入層,實際運行時,誤差進行反向反饋。模型設(shè)置的BP神經(jīng)網(wǎng)絡(luò)為3層,對連續(xù)函數(shù)進行擬合,其經(jīng)驗公式如公式(4)。
p=1bd
(4)
其中,p應(yīng)滿足公式(5)的約束條件。
(5)
式(4)、式(5)中,隱含層對應(yīng)的節(jié)點數(shù)用p表示,輸入層對應(yīng)的節(jié)點數(shù)用d表示,輸出層對應(yīng)的節(jié)點數(shù)用f表示。a為常數(shù),a∈[1,10]。
SVM支持向量機的應(yīng)用主要針對非線性的分類與回歸。其原理主要是在高維特征空間當(dāng)中進行數(shù)據(jù)因子的非線性映射,將待求解問題進行向二次優(yōu)化的問題轉(zhuǎn)化,提高對應(yīng)的魯棒性。
算法優(yōu)化主要結(jié)合粒子群算法、遺傳算法以及交叉驗證法,從而進行參數(shù)的最小化尋優(yōu),以提高模型的精確度。粒子群算法能夠通過更少的參數(shù)實現(xiàn)結(jié)果尋優(yōu),但更新迭代僅通過內(nèi)部速度完成。遺傳算法可以結(jié)合環(huán)境進行個體適應(yīng)度的選擇,需要確定種群規(guī)模、遺傳迭代次數(shù)以及對應(yīng)的變異概率。模型在對于交叉驗證方式的選擇上,采用K-CV的方式,該種方式計算效率更高,更加適合SVM支持向量機的參數(shù)優(yōu)化。
3.1.1 BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測 BP神經(jīng)網(wǎng)絡(luò)模型中,選擇正切S性tansig函數(shù)未對應(yīng)的傳遞函數(shù),選取trainlm為對應(yīng)的訓(xùn)練函數(shù)。設(shè)定訓(xùn)練速度的值0.1,訓(xùn)練目標(biāo)的值0.01,訓(xùn)練補償?shù)闹禐?00,通過公式(4)進行隱含層的確定,不同隱含層對應(yīng)的決定系數(shù)如表6所示。
表6 隱含層數(shù)決定系數(shù)
表6中,當(dāng)隱含層數(shù)為6時,決定系數(shù)的均值最大,選擇隱含層數(shù)為6。模型預(yù)測通過GA-BP模型以及PSO-BP模型進行預(yù)測。對39組樣本數(shù)據(jù)進行隨機抽取,其中測試樣本數(shù)量為7,訓(xùn)練樣本數(shù)量為32。輸入變量為提取到的8個數(shù)據(jù)因子,輸出為對應(yīng)的建筑工程造價,各模型運行11次,以準(zhǔn)確率第6的結(jié)果為最終結(jié)果。
通過GA-BP模型預(yù)測的適應(yīng)度曲線以及預(yù)測結(jié)果如圖(3)及圖(4)所示。
圖3與圖4的GA-BP模型中,輸入層的神經(jīng)元個數(shù)為8,輸出層的神經(jīng)元個數(shù)為1,隱含層的神經(jīng)元個數(shù)為6。初始值設(shè)定上,迭代為50次,變異率為0.1,對應(yīng)的種群數(shù)為20。通過PSO-BP模型預(yù)測所得的適應(yīng)度曲線以及預(yù)測結(jié)果如圖(5)及圖(6)所示。
圖3 GA-BP適應(yīng)度曲線
圖4 GA-BP模型預(yù)測結(jié)果
圖5 PSO-BP適應(yīng)度曲線
圖6 PSO-BP模型預(yù)測結(jié)果
神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)定為8-6-1,初始化設(shè)定上,迭代為80次,學(xué)習(xí)因子均設(shè)置為2,PSO規(guī)模設(shè)定為30。
3.1.2支持向量機模型預(yù)測 通過交叉算法對支持向量機進行優(yōu)化,所得的最終預(yù)測結(jié)果圖形如圖7所示。圖7中,懲罰參數(shù)c設(shè)定為eh,核函數(shù)的參數(shù)g設(shè)定為eb?;貧w參數(shù)粗選時設(shè)定步長1,h=[-8,8]、b=[-8,8],最終懲罰參數(shù)的值為16,核函數(shù)參數(shù)的值為0.1184。由粗選結(jié)果進行精選時,設(shè)定步長為0.5,h=[-5,5]、b=[-5,5],求得的懲罰因子為4,核函數(shù)的參數(shù)為0.0625。
圖7 交叉算法優(yōu)化向量機預(yù)測結(jié)果
通過GA-BP對向量機進行優(yōu)化,得到的測試預(yù)測結(jié)果如圖8所示。
圖8 GA-BP優(yōu)化向量機預(yù)測結(jié)果
圖8中,設(shè)定種群規(guī)模120,進化代數(shù)最大為200,最終得到的懲罰因子為23.6388,核函數(shù)參數(shù)的值為20.8472。通過PSO-BP對向量機進行優(yōu)化,得到的測試結(jié)果如圖9。圖9中,設(shè)定種群規(guī)模120,進化代數(shù)最大為200,最終得到的懲罰因子為2.9405,核函數(shù)的參數(shù)為1.9617。
圖9 PSO-BP優(yōu)化向量機預(yù)測結(jié)果
通過GA-BP對灰色關(guān)聯(lián)模型優(yōu)化后的預(yù)測結(jié)果如圖10所示。
圖10 GA-BP優(yōu)化灰色關(guān)聯(lián)預(yù)測結(jié)果
圖10中,種群數(shù)初始值設(shè)定為20,迭代設(shè)定為80次,變異率設(shè)定為0.1。通過PSO-BP對灰色關(guān)聯(lián)模型優(yōu)化后的預(yù)測結(jié)果如圖11。圖11中種群規(guī)模設(shè)定為30,迭代設(shè)定為80次。通過交叉算法對灰色關(guān)聯(lián)模型進行優(yōu)化,并結(jié)合SVW支持向量機,得到的預(yù)測結(jié)果如圖12所示。
圖11 PSO-BP優(yōu)化灰色關(guān)聯(lián)預(yù)測結(jié)果
圖12 交叉算法優(yōu)化灰色關(guān)聯(lián)-SVW預(yù)測結(jié)果
圖12中,交叉算法參數(shù)設(shè)置與前文相同,求得懲罰因子的值為2,核函數(shù)參數(shù)的值為0.0442。
通過GA-BP優(yōu)化灰色關(guān)聯(lián)并結(jié)合SVW向量機的預(yù)測結(jié)果如圖13所示。圖13中,最終求得的懲罰因子數(shù)值為84.1303,核函數(shù)參數(shù)的值為35.3061。通過PSO-BP優(yōu)化灰色關(guān)聯(lián)并結(jié)合SVW向量機的預(yù)測結(jié)果如圖14所示。
圖13 GA-BP優(yōu)化灰色關(guān)聯(lián)-SVW預(yù)測結(jié)果
圖14 PSO-BP優(yōu)化灰色關(guān)聯(lián)-SVW預(yù)測結(jié)果
圖14中,最終求得的懲罰因子的值為0.9966,核函數(shù)參數(shù)的值為5.7113。
對應(yīng)預(yù)測模型所得結(jié)果進行匯總,詳見表7。
表7 預(yù)測模型結(jié)果匯總
表7中,R2為對應(yīng)的決定系數(shù),其值越高則代表由越高的精確度。通過整體對比,主成分分析(PCA)的方式進行預(yù)測的精確度要優(yōu)于灰色關(guān)聯(lián)分析(GRA)的精確度。同時,通過算法對支持向量機進行優(yōu)化相對誤差均在10%,優(yōu)于單純算法預(yù)測模型的結(jié)果。綜上,通過交叉算法(CV)優(yōu)化向量機進行主成分分析的結(jié)果最優(yōu)。通過該辦法預(yù)測后的效果對比如表8所示。
表8 交叉算法優(yōu)化向量機主成分分析結(jié)果
表8中,預(yù)測的相對誤差均在10%之內(nèi),整體預(yù)測結(jié)果接近實際數(shù)值,符合實際環(huán)境中工程造價預(yù)測需求。
傳統(tǒng)的工程造價預(yù)測模型同場存在誤差較大、適用性有效以及計算繁瑣等問題。通過交叉算法對支持向量機進行優(yōu)化,結(jié)合主成分分析的方式,進行建筑工程造價預(yù)測,能夠最大化簡化計算步驟,提高造價預(yù)測的精確度。同時,該辦法廣泛適用于各類建筑工程造價預(yù)測。經(jīng)過實驗驗證,方法切實可行,能夠應(yīng)用于實際生產(chǎn)工作中。