李書全,劉世杰
(天津財(cái)經(jīng)大學(xué)管理科學(xué)與工程學(xué)院,天津300222)
近年來,基于粒子群算法優(yōu)化的支持向量機(jī)(PSOSVM)在預(yù)測(cè)模型中得到了廣泛應(yīng)用[1,2],該模型預(yù)測(cè)誤差小,精度高,具有較快的收斂速度,實(shí)現(xiàn)方便,適用于小樣本和非線性的預(yù)測(cè)問題。建筑施工活動(dòng)具有復(fù)雜性、分散性和人員流動(dòng)性的特點(diǎn),因此該模型比較適用于建筑施工項(xiàng)目的安全預(yù)測(cè),能夠取得較好的效果。傳統(tǒng)的PSO-SVM模型在對(duì)SVM參數(shù)尋優(yōu)過程中容易陷入局部最優(yōu),進(jìn)而影響預(yù)測(cè)的精度[3]。鑒于此,本文以施工企業(yè)項(xiàng)目部為研究對(duì)象,并引入社會(huì)資本作為重要影響因素,利用粗糙集屬性約簡(jiǎn)的方法辨識(shí)影響施工項(xiàng)目安全的要素,在此基礎(chǔ)上將改進(jìn)的粒子群算法與支持向量機(jī)相結(jié)合,建立了基于改進(jìn)PSO-SVM的安全預(yù)測(cè)模型。并進(jìn)行了仿真模擬,驗(yàn)證了該模型的有效性和實(shí)用性,為施工項(xiàng)目的安全預(yù)測(cè)提供科學(xué)的理論依據(jù)。
支持向量機(jī)(SVM)是Vapnik于1995年提出來的一種計(jì)算機(jī)模型,可有效解決復(fù)雜的非線性回歸問題,其基本思想是運(yùn)用非線性映射將數(shù)據(jù)映射到高維特征空間里,然后在此高維特征空間對(duì)其進(jìn)行線性回歸[2]。粒子群(PSO)算法由Eberhart和Kenney于1995年提出的一種基于群體智能的優(yōu)化算法,它是模擬鳥群隨機(jī)搜尋食物的捕食行為,并從這種行為中得到啟示并用于解決優(yōu)化問題[1]。SVM的懲罰參數(shù)和核函數(shù)參數(shù)的選擇是非常重要的問題,直接影響SVM的精度。使用傳統(tǒng)的網(wǎng)格搜索方法選取SVM參數(shù),該方法精度低且花費(fèi)時(shí)間較長(zhǎng)。將PSO應(yīng)用于SVM的參數(shù)優(yōu)化問題,可以得到SVM的最佳懲罰參數(shù)和核函數(shù)參數(shù),進(jìn)而可以提高施工項(xiàng)目安全預(yù)測(cè)模型的訓(xùn)練速度和準(zhǔn)確度。但是傳統(tǒng)PSO算法存在全局尋優(yōu)能力較差,容易發(fā)生早熟收斂的問題[4]。為了解決這些問題,本文結(jié)合了慣性權(quán)重的自適應(yīng)調(diào)整[5]和高斯擾動(dòng)[4]的思想,對(duì)PSO算法進(jìn)行了改進(jìn),在此基礎(chǔ)上利用改進(jìn)的粒子群算法(PSO)優(yōu)化支持向量機(jī)(SVM)的參數(shù),構(gòu)建項(xiàng)目安全預(yù)測(cè)模型。改進(jìn)后的PSO-SVM模型有效解決了粒子群陷入局部最優(yōu)點(diǎn)的問題,預(yù)測(cè)精度更高,誤差更小,可用于建筑施工項(xiàng)目安全預(yù)測(cè)模型的構(gòu)建。
首先定義標(biāo)準(zhǔn)適應(yīng)度(Normalized Fitness Value,NFV)的概念[5]來引導(dǎo)粒子更快地收斂到全局最優(yōu)粒子位置。
式(1)中,fgbest為種群全局最優(yōu)適應(yīng)度;fmax為粒子個(gè)體的歷史最大適應(yīng)度;fmin為粒子個(gè)體的歷史最小適應(yīng)度。在此基礎(chǔ)上,將慣性權(quán)重w定義為:
式(2)中,wk為第k次迭代中的w值,wk-1為第k-1次迭代中的w值,wmax為w的最大值,kmax為最大迭代次數(shù)。由式(2)可知,如果在第k次迭代中的NFV優(yōu)于上一次迭代的值,表明該粒子所在區(qū)域存在優(yōu)于全局最優(yōu)值的概率較大,因此減小w的值以提高算法的局部尋優(yōu)能力;反之,為了跳出當(dāng)前區(qū)域,增加w的值以提高算法的全局搜索能力。這種根據(jù)適應(yīng)度值調(diào)整慣性權(quán)重的方法,避免了粒子陷入局部極值點(diǎn),提高了收斂速度。
在標(biāo)準(zhǔn)PSO算法中,粒子根據(jù)如下公式來更新自己的速度和位置。
式(3)中,xid(t)為第t次迭代中粒子的位置;νid(t)為第t次迭代中粒子的速度;pid(t)和pgd(t)為第t次迭代中的粒子個(gè)體最優(yōu)位置和種群全局最優(yōu)位置;w為慣性權(quán)重;c1和c2為學(xué)習(xí)因子;r1和r2為[0,1]范圍內(nèi)均勻分布的隨機(jī)數(shù)。采用高斯擾動(dòng)策略,在公式(3)中,用全部粒子的含有高斯擾動(dòng)項(xiàng)的個(gè)體最優(yōu)位置總和的平均值代替pid(t)[4]。改進(jìn)后的粒子速度更新公式如下所示:
式(5)中Gaussid(t)為在第t次迭代中的高斯擾動(dòng)項(xiàng),式(6)中Gaussian(μ,σ2)為服從高斯分布N(μ,σ2)的隨機(jī)數(shù),N為種群規(guī)模大小,r3為[0,1]范圍內(nèi)均勻分布的隨機(jī)數(shù)。這種方法可有效增強(qiáng)粒子的逃逸能力,有利于粒子之間最優(yōu)位置信息的共享,進(jìn)而提高算法收斂精度。
為了驗(yàn)證模型的可行性,本文參考已有研究成果的問卷調(diào)查數(shù)據(jù),從中選取87個(gè)有效樣本進(jìn)行模型的仿真模擬。選取前60組樣本數(shù)據(jù)作為模型的訓(xùn)練數(shù)據(jù),將該60組數(shù)據(jù)中影響施工項(xiàng)目安全績(jī)效的關(guān)鍵因素作為自變量,將項(xiàng)目安全績(jī)效評(píng)價(jià)值作為因變量。然后選取另外27組樣本數(shù)據(jù)作為測(cè)試數(shù)據(jù),并使用mapminmax函數(shù)分別對(duì)訓(xùn)練數(shù)據(jù)及測(cè)試數(shù)據(jù)進(jìn)行歸一化處理。
利用PSO參數(shù)尋優(yōu)的流程如下:
(1)設(shè)置PSO的參數(shù),包括種群數(shù)量sizepop、最大迭代次數(shù)maxgen、局部搜索能力參數(shù)c1、全局搜索能力參數(shù)c2、慣性權(quán)重w。
(2)產(chǎn)生初始粒子的位置x(i)和速度v(i)。
(3)計(jì)算初始粒子的適應(yīng)度fitness(i),適應(yīng)度取值為對(duì)訓(xùn)練集進(jìn)行交叉檢驗(yàn)時(shí)的平均均方誤差(Mean Squared Error,MSE)。
(4)根據(jù)初始粒子適應(yīng)度確定個(gè)體極值local_x和群體極值global_x。
(7)根據(jù)公式νid(t+1)=wνid(t)+Gaussid(t)+c2r2(pgd(t)-xid(t))更新粒子速度,根據(jù)公式xid(t+1)=xid(t)+νid(t+1)更新粒子位置。
(8)計(jì)算粒子的適應(yīng)度值。
(9)將粒子的當(dāng)前適應(yīng)度值和個(gè)體極值比較,更新個(gè)體極值;將粒子的個(gè)體最優(yōu)值和群體極值比較,更新群體極值。
(10)判斷是否達(dá)到算法終止條件,即是否達(dá)到最大進(jìn)化代數(shù)或小于給定精度。如果滿足終止條件,算法停止運(yùn)行并輸出最優(yōu)粒子的位置參數(shù),即SVM的最優(yōu)懲罰系數(shù)c和核函數(shù)參數(shù)g,否則轉(zhuǎn)到(5)繼續(xù)運(yùn)行。
在算法進(jìn)行初始化時(shí),設(shè)定種群數(shù)量為20,迭代次數(shù)為100次,c1=1.5,c2=1.7,w=1。核函數(shù)參數(shù)c設(shè)定的范圍為[0.1,100],參數(shù)g設(shè)定的范圍為[0.01,1000][6]。PSO參數(shù)尋優(yōu)的過程如圖1所示。
圖1 PSO尋找最佳參數(shù)的適應(yīng)度曲線
從圖1中可看出,參數(shù)尋優(yōu)后得到的最佳參數(shù)c=18.5079,最佳參數(shù)g=0.01,最佳平均MSE=0.00041968。
本文使用MATLAB2012b和LIBSVM工具箱實(shí)現(xiàn)SVM模型。SVM核函數(shù)選擇徑向基核函數(shù)(RBF),因?yàn)闊o論是小樣本還是大樣本,高維還是低維等情況,RBF核函數(shù)均適用。在確定核函數(shù)和參數(shù)c、g后,利用LIBSVM的訓(xùn)練命令svmtrain對(duì)60組樣本數(shù)據(jù)進(jìn)行訓(xùn)練,得到訓(xùn)練模型。然后利用預(yù)測(cè)命令svmpredict對(duì)27個(gè)樣本的測(cè)試數(shù)據(jù)進(jìn)行回歸預(yù)測(cè),模型原始數(shù)據(jù)和回歸預(yù)測(cè)數(shù)據(jù)對(duì)比圖、誤差圖如圖2所示。
圖2 改進(jìn)的PSO-SVM模型仿真模擬結(jié)果
結(jié)果顯示該模型預(yù)測(cè)的MSE=0.000659123,擬合相關(guān)系數(shù)=99.2974%,,絕對(duì)誤差值分布在-0.03到0.04之間。結(jié)果表明本模型具有較高的預(yù)測(cè)精度,可用于施工項(xiàng)目安全預(yù)測(cè)建模。
社會(huì)資本理論認(rèn)為,組織或個(gè)體之間存在的信任、溝通、非正式規(guī)范等對(duì)企業(yè)績(jī)效有積極的影響[7]。所以本文引入社會(huì)資本作為重要影響因素,從而針對(duì)建筑施工活動(dòng)的特殊性做出合理的安全預(yù)測(cè)。基于安全人機(jī)工程學(xué)、安全管理學(xué)和社會(huì)資本理論,本文認(rèn)為影響建筑施工安全績(jī)效的主要因素包括:社會(huì)資本、員工安全能力、安全管理、施工設(shè)備和材料和環(huán)境條件這5個(gè)因素。本文在借鑒國(guó)內(nèi)外相關(guān)文獻(xiàn)研究[8,9]的基礎(chǔ)上,通過現(xiàn)場(chǎng)訪談的形式確定了相對(duì)應(yīng)的測(cè)量量表的維度劃分。在通過專家和課題組對(duì)初始量表的討論后,形成了本文調(diào)查的最終問卷。問卷共包括三部分內(nèi)容,第一部分為項(xiàng)目的基本信息,第二部分為影響建筑施工項(xiàng)目安全績(jī)效的因素量表,第三部分為被調(diào)查者的基本信息。題項(xiàng)采用李克特量表五分法,用非常不同意(1分)到非常同意(5分)來表示。本文在北京、天津、河北、河南、四川、江蘇、山東等省份及直轄市進(jìn)行問卷調(diào)查,調(diào)查對(duì)象包括建設(shè)施工單位的項(xiàng)目經(jīng)理、副經(jīng)理、安全經(jīng)理、安全員、工長(zhǎng)。本次問卷發(fā)放數(shù)量為360份,涉及15個(gè)省共90個(gè)項(xiàng)目,對(duì)無效問卷進(jìn)行剔除后得到有效問卷300份,問卷有效率為83%。
采用Cronbach's α系數(shù)來檢驗(yàn)量表的信度,結(jié)果顯示各量表的Cronbach's α系數(shù)均高于0.8,量表整體的信度達(dá)到0.923,表明此項(xiàng)研究的量表信度值較高,具有良好的內(nèi)部一致性。問卷在編制過程和多位專家進(jìn)行了討論并對(duì)題項(xiàng)進(jìn)行了修改,可以認(rèn)為量表的內(nèi)容效度是可接受的。運(yùn)用AMOS計(jì)算各量表的收斂效度即檢驗(yàn)各潛在變量測(cè)量模型的適配度[10]。對(duì)各模型進(jìn)行檢驗(yàn)的結(jié)果顯示:各變量測(cè)量模型的測(cè)量題項(xiàng)因素負(fù)荷量的C.R.值均大于1.96,各測(cè)量模型的卡方自由度比值都小于臨界值3,RMESA值都小于臨界值0.08,GFI值都大于臨界值0.9,AGFI值都大于臨界值0.9,均達(dá)到模型適配標(biāo)準(zhǔn),表示測(cè)量模型可以與樣本數(shù)據(jù)契合,說明量表具有很好的收斂效度。
ROSETTA是一種可視化很強(qiáng)易于操作的RS工具。將回收的300份有效問卷的結(jié)果作為RS處理的基本數(shù)據(jù)。根據(jù)RS理論將數(shù)據(jù)中的屬性分為條件屬性和決策屬性,文中數(shù)據(jù)的條件屬性即影響施工項(xiàng)目安全績(jī)效的因素,共54個(gè)。決策屬性即被調(diào)查者對(duì)項(xiàng)目安全績(jī)效的總體評(píng)價(jià)值。首先使用ROSETTA軟件中最高可信度填補(bǔ)法補(bǔ)齊原始數(shù)據(jù)中缺失的屬性數(shù)據(jù),然后采用等頻率劃分算法對(duì)問卷數(shù)據(jù)進(jìn)行離散化處理,最后采用遺傳算法對(duì)條件屬性進(jìn)行屬性約簡(jiǎn),最終得到35個(gè)重要因素,具體的結(jié)果如表1所示。
為判斷安全預(yù)測(cè)模型的有效性,本文利用前面經(jīng)過RS處理過的300份樣本數(shù)據(jù),選取前200組樣本數(shù)據(jù)作為模型的訓(xùn)練數(shù)據(jù),然后選取另外100組樣本數(shù)據(jù)作為測(cè)試數(shù)據(jù),分別進(jìn)行歸一化處理。模型的參數(shù)設(shè)置如下:種群數(shù)量為20,迭代次數(shù)為200,c1=1.5,c2=1.7,w=1,核函數(shù)參數(shù)c的變化范圍為[0.1,100],懲罰參數(shù)g的變化范圍為[0.01,1000]。PSO參數(shù)尋優(yōu)的過程如下頁圖3所示。
表1 影響建筑施工項(xiàng)目安全績(jī)效的關(guān)鍵因素
圖3 PSO尋找最佳參數(shù)的適應(yīng)度曲線
從圖3中可看出,參數(shù)尋優(yōu)后得到的最佳參數(shù)c=14.6759,最佳參數(shù)g=0.01,最佳平均MSE=0.00035982。在確定核函數(shù)和參數(shù)c、g后,利用LIBSVM對(duì)200組樣本數(shù)據(jù)進(jìn)行訓(xùn)練,然后對(duì)100個(gè)樣本的測(cè)試數(shù)據(jù)進(jìn)行回歸預(yù)測(cè),模型原始數(shù)據(jù)和回歸預(yù)測(cè)數(shù)據(jù)對(duì)比圖、誤差圖如圖4所示。
結(jié)果顯示該模型預(yù)測(cè)的MSE=0.000461458,擬合相關(guān)系數(shù)=99.5853%,精度和擬合度較好。絕對(duì)誤差值大多數(shù)分布在-0.03到0.03之間,誤差很小。結(jié)果表明本模型具有很好的預(yù)測(cè)效果和泛化能力,也同時(shí)證明了關(guān)鍵因素篩選的正確性、安全預(yù)測(cè)模型的有效性和實(shí)用性。
圖4 改進(jìn)的PSO-SVM模型驗(yàn)證分析結(jié)果
(1)本文將改進(jìn)的PSO算法對(duì)SVM中的參數(shù)進(jìn)行優(yōu)化,通過引入慣性權(quán)重的自適應(yīng)調(diào)整和高斯擾動(dòng)的思想,能有效解決PSO算法陷入局部最優(yōu)的問題,能增強(qiáng)粒子的逃逸能力,可有效提高模型的訓(xùn)練速度和預(yù)測(cè)精度,使模型具有很好的非線性擬合能力,并減少預(yù)測(cè)誤差。(2)改進(jìn)的PSO-SVM模型可以有效預(yù)測(cè)建筑施工項(xiàng)目的總體安全績(jī)效。模型學(xué)習(xí)速度快、預(yù)測(cè)效果好、泛化能力強(qiáng)、參數(shù)設(shè)置簡(jiǎn)單,在項(xiàng)目安全預(yù)測(cè)方面有明顯的優(yōu)勢(shì)。實(shí)證分析的結(jié)果表明該模型具有較高的預(yù)測(cè)精度和較好的適用性,在建筑施工安全管理中有很好的應(yīng)用價(jià)值。(3)社會(huì)資本是影響施工項(xiàng)目安全績(jī)效的重要因素。通過調(diào)查訪問,利用RS篩選出關(guān)鍵要素,通過對(duì)模型的仿真模擬和驗(yàn)證分析,檢驗(yàn)了社會(huì)資本作為關(guān)鍵因素的正確性和合理性。社會(huì)資本一方面為管理者提供施工安全狀況作為預(yù)測(cè)依據(jù),另一方面為安全管理政策的執(zhí)行以及形成良好的安全文化提供了無形的途徑。
[1]肖智,李玲玲.PSO-SVM在高速公路交通量預(yù)測(cè)中的應(yīng)用[J].管理評(píng)論,2011,23(12).
[2]呂軍,王德運(yùn),魏帥.中國(guó)石油安全評(píng)價(jià)及情景預(yù)測(cè)[J].中國(guó)地質(zhì)大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2017,17(2).
[3]范振東,崔偉杰,郭芝韻等.基于改進(jìn)的PSO-SVM法的大壩安全非線性預(yù)警模型研究[J].水電能源科學(xué),2014,32(11).
[4]艾兵,董明剛.基于高斯擾動(dòng)和自然選擇的改進(jìn)粒子群優(yōu)化算法[J].計(jì)算機(jī)應(yīng)用,2016,36(3).
[5]Kumar N,Vidyarthi D P.A Model for Resource-constrained Project Scheduling Using Adaptive PSO[J].Soft Computing,2016,(20).
[6]王小川,史峰,郁磊.MATLAB神經(jīng)網(wǎng)絡(luò)43個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2013.
[7]邊燕杰,丘海雄.企業(yè)的社會(huì)資本及其功效[J].中國(guó)社會(huì)科學(xué),2000,(2).
[8]Koh T Y,Rowlinson S.Project team Social Capital,Safety Behaviors,and Performance:A Multi-level Conceptual Framework[J].Procedia Engineering,2014,(85).
[9]Cheng E W L,Ryan N,Kelly S.Exploring the Perceived Influence of Safety Management Practices on Project Performance in the Construction Industry[J].Safety Science,2012,50(2).
[10]吳明隆.結(jié)構(gòu)方程模型——AMOS的操作與應(yīng)用[M].重慶:重慶大學(xué)出版社,2010.