涂曉威,雷正保
(長(zhǎng)沙理工大學(xué) 汽車與機(jī)械工程學(xué)院,湖南 長(zhǎng)沙,410114)
公路安全護(hù)欄作為一種常用的交通基礎(chǔ)設(shè)施,能夠通過(guò)自身結(jié)構(gòu)的變形對(duì)事故車輛起一定的緩沖能力,確保碰撞最大加速度在安全范圍內(nèi)并且能夠?qū)崿F(xiàn)對(duì)車輛的重新導(dǎo)向,同時(shí)防止車輛碰撞到道路旁的固定物,如樹、電線桿等。而隨著當(dāng)今道路交通的不斷發(fā)展,也要求護(hù)欄具有更高的防護(hù)能力,因此對(duì)于護(hù)欄進(jìn)行優(yōu)化設(shè)計(jì)具有重要的意義[1]。以波形梁護(hù)欄為例,護(hù)欄設(shè)計(jì)中主要需要考慮受到?jīng)_擊后波形板、防阻塊和立柱的自身形變等,因?yàn)樽o(hù)欄各部件結(jié)構(gòu)尺寸將直接影響護(hù)欄的防護(hù)能力。而在以往的護(hù)欄優(yōu)化設(shè)計(jì)中大部分是基于設(shè)計(jì)經(jīng)驗(yàn)和真實(shí)的汽車護(hù)欄碰撞數(shù)據(jù)進(jìn)行結(jié)構(gòu)優(yōu)化[2],少有系統(tǒng)化的優(yōu)化設(shè)計(jì)方式,其主要原因在于護(hù)欄部件的幾何尺寸與各評(píng)價(jià)指標(biāo)之間的高度非線性關(guān)系。目前有限元仿真在護(hù)欄相關(guān)研究中被廣泛應(yīng)用,能極大地減少護(hù)欄設(shè)計(jì)的成本與時(shí)間,趙建等[3]利用有限元仿真與正交設(shè)計(jì)結(jié)合得到基本樣本,再將尺寸因素與性能指標(biāo)結(jié)合進(jìn)行極差、方差和貢獻(xiàn)率等參數(shù)分析,得到較優(yōu)參數(shù)組合以實(shí)現(xiàn)護(hù)欄優(yōu)化設(shè)計(jì)的目的。隨著機(jī)器學(xué)習(xí)在各個(gè)領(lǐng)域的廣泛應(yīng)用,同樣有研究者將代理模型與優(yōu)化算法相結(jié)合進(jìn)行護(hù)欄設(shè)計(jì),Yin等[4]使用徑向基函數(shù)(RBF)與多目標(biāo)遺傳算法(NSGA-II)對(duì)護(hù)欄防阻塊厚度和η型護(hù)欄的柱弓長(zhǎng)度尺寸進(jìn)行優(yōu)化,Hou等[5]利用代理模型與多島遺傳算法(MIGA)對(duì)立柱間距和波形梁板厚度進(jìn)行了尺寸優(yōu)化以提高護(hù)欄防護(hù)性能,上述研究中的一個(gè)關(guān)鍵點(diǎn)在于預(yù)測(cè)模型的準(zhǔn)確性將直接影響護(hù)欄設(shè)計(jì)的復(fù)雜性和準(zhǔn)確度,但目前對(duì)于護(hù)欄性能預(yù)測(cè)沒(méi)有具有明顯優(yōu)勢(shì)的預(yù)測(cè)模型,而人工智能模型有著強(qiáng)大的解決非線性問(wèn)題的能力,但大多數(shù)的研究中均是對(duì)單一模型進(jìn)行少量?jī)?yōu)化來(lái)增強(qiáng)模型性能以提高預(yù)測(cè)效果,而Chou等[6]對(duì)比不同人工智能模型在高性能混凝土抗壓強(qiáng)度預(yù)測(cè)上的應(yīng)用結(jié)果,發(fā)現(xiàn)復(fù)合模型預(yù)測(cè)精度和穩(wěn)定性高于單一模型。因此本文提出一種用于護(hù)欄防護(hù)性能指標(biāo)預(yù)測(cè)的高性能集成式的強(qiáng)化人工智能模型,使其能對(duì)護(hù)欄設(shè)計(jì)起指導(dǎo)作用。
本文中使用IBM SPSS modeler進(jìn)行模型的訓(xùn)練和集成,各個(gè)模型基本參數(shù)選用默認(rèn)值,并結(jié)合十折交叉驗(yàn)證方法來(lái)提高模型的可靠性,選用的單個(gè)初始模型分別為支持向量機(jī)(SVM)、廣義線性回歸(Genlin)、徑向基人工神經(jīng)網(wǎng)絡(luò)(RBFNN)、反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)和分類與回歸樹(CART)模型。對(duì)各訓(xùn)練完成后的模型使用預(yù)留數(shù)據(jù)樣本進(jìn)行預(yù)測(cè)效果對(duì)比,選用其中較優(yōu)的模型用于后續(xù)的集成模型構(gòu)建。
1.1.1 SVM
Vapnik[7]首先提出了SVM模型,該模型可應(yīng)用于分類和回歸問(wèn)題,在解決非線性問(wèn)題時(shí)可以將特征參數(shù)映射至高維空間中,再使用非線性核函數(shù)構(gòu)造并求解二次規(guī)劃問(wèn)題。
式中,ω為權(quán)重;b為常數(shù)項(xiàng);φ(·)為非線性方程,它將特征參數(shù)映射到更高維空間中, ·,·表示在Rn內(nèi)的點(diǎn)積。
SVM使用ε的不敏感損失函數(shù)來(lái)度量結(jié)構(gòu)的風(fēng)險(xiǎn),尋求風(fēng)險(xiǎn)性最小化,因此可以將其轉(zhuǎn)化為式的最小化問(wèn)題:
上述的優(yōu)化問(wèn)題可以通過(guò)拉格朗日乘數(shù)轉(zhuǎn)化為二次優(yōu)化問(wèn)題來(lái)處理,轉(zhuǎn)化為式:
1.1.2 Genlin
Nelder和Wedderburn[8]提出Genllin模型以使用連接函數(shù)來(lái)反應(yīng)線性預(yù)測(cè)值和響應(yīng)變量期望之間的關(guān)系,其較一般線性模型更為靈活,允許響應(yīng)變量存在誤差。Genlin模型中包含隨機(jī)部分、系統(tǒng)部分和連接部分,隨機(jī)部分為響應(yīng)變量Y的概率分布(如正態(tài)、泊松、伽馬、二項(xiàng)和逆高斯分布等),系統(tǒng)部分為線性組合模型,連接部分中連接函數(shù)g(·)將Y的期望值連接到預(yù)測(cè)值η。
該模型可由式定義:
式中,其中η是線性預(yù)測(cè)值;O是偏移變量;Xi是自變量;βi是斜率系數(shù);F是Y的分布。
1.1.3 BPNN
人工神經(jīng)網(wǎng)絡(luò)(ANN)是通過(guò)模擬人腦中的神經(jīng)元,多層元素交互并行連接而成,可以用于得到復(fù)雜非線性問(wèn)題中的內(nèi)部隱藏關(guān)系。反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)是其中被廣泛使用的一種,其包含輸入層、隱含層和輸出層,其通過(guò)不斷反向傳播,根據(jù)誤差項(xiàng)調(diào)整神經(jīng)元之間的連接權(quán)重來(lái)增強(qiáng)模型效果,隱含層的輸出如式所示:
式中,netk是第k個(gè)神經(jīng)元的激勵(lì)值;j為前一層神經(jīng)元目的序號(hào);wkj為第k個(gè)神經(jīng)元與前一層第j個(gè)神經(jīng)元之間的連接權(quán)重;oj為第j個(gè)神經(jīng)元的輸出;f(·)為激勵(lì)函數(shù),常用sigmoid函數(shù),如式所示:
每個(gè)周期中對(duì)于權(quán)重wkj的更新如式所示:
式中,t表示當(dāng)前周期序號(hào); Δwkj(t)表示改變量,通過(guò)式表示:
式中,η為學(xué)習(xí)速率參數(shù);δpj為傳播誤差;α為動(dòng)量參數(shù)。
1.1.4 RBFNN
RBFNN是由Broomhead和Lowe[9]提出的一種人工神經(jīng)網(wǎng)絡(luò),其與BPNN不同,其隱藏層為RBF神經(jīng)元,是一種局部逼近神經(jīng)網(wǎng)絡(luò)。其隱藏層是標(biāo)量權(quán)重和輸入向量的線型組合,這些向量通過(guò)每個(gè)節(jié)點(diǎn)中的徑向基函數(shù)進(jìn)行映射,輸出層生成向量RBFNN的輸出可表示為式:
式中,m為輸出數(shù)目;wjp為第j個(gè)基函數(shù)和第p個(gè)輸出節(jié)點(diǎn)之間的連接權(quán)重;是徑向基向量,使用高斯函數(shù)表示為式:
1.1.5 CART
CART是Breiman等[10]提出可用于回歸和分類目的的遞歸劃分方法,其為二叉樹,其中包括根節(jié)點(diǎn)、中間節(jié)點(diǎn)和終端節(jié)點(diǎn)?;貧w樹是通過(guò)遍歷變量j和對(duì)應(yīng)切分點(diǎn)s,使得式值最小從而得到最優(yōu)切分變量j和切分點(diǎn)s。
式中,R1(j,s)和R2(j,s)表示由切分點(diǎn)s得到的2個(gè)特征空間,其中c1和c2為兩個(gè)特征空間中輸出y的均值,如式所示:
最終得到回歸樹模型如式所示:
式中,M為空間劃分區(qū)域數(shù)目;Rm為拆分后的特征空間;cm為對(duì)應(yīng)特征空間的輸出;I為判別系數(shù)。
使用IBM SPSS modeler對(duì)上述單個(gè)模型進(jìn)行建模后,對(duì)數(shù)據(jù)集進(jìn)行處理,除一部分樣本作為后續(xù)的檢驗(yàn)樣本外,其余樣本根據(jù)十折交叉驗(yàn)證方法,隨機(jī)分為10組,在每次訓(xùn)練中將其中9組作為訓(xùn)練集,余下一組作為測(cè)試集,共經(jīng)過(guò)10輪次訓(xùn)練,且每次模型訓(xùn)練過(guò)程中的訓(xùn)練集和測(cè)試集都與其他輪次中不同,將其中預(yù)測(cè)效果最佳的一次模型作為最后訓(xùn)練所得模型,用于后續(xù)的模型對(duì)比和集成模型搭建。
對(duì)于使用同一個(gè)數(shù)據(jù)集訓(xùn)練得到的這些單個(gè)模型,挑選出其中最優(yōu)的3種模型進(jìn)行集成,從而得到4種集成模型,其集成方法在數(shù)學(xué)上的表示為對(duì)應(yīng)于d維預(yù)測(cè)變量X和一維響應(yīng)Y。各指定的算法均生成一個(gè)估計(jì)函數(shù)f(·),而集成函數(shù)fe(·)是通過(guò)各單個(gè)函數(shù)的線性組合獲得的,如式所示:
式中,n為估計(jì)函數(shù)個(gè)數(shù);ci為估計(jì)函數(shù)fi(·)的線性組合系數(shù)。
式中,fe(·)為集成模型,X為d維預(yù)測(cè)變量,表示護(hù)欄的幾何尺寸組合,Y為一維響應(yīng),本文中為加速度值。
綜上,集成模型的搭建流程如圖1所示。后續(xù)將使用上述預(yù)留檢驗(yàn)樣本來(lái)對(duì)所有模型進(jìn)行預(yù)測(cè)效果的探究。
圖1 集成模型搭建流程圖
現(xiàn)有法規(guī)中對(duì)于護(hù)欄的評(píng)價(jià)指標(biāo)有多個(gè)方面[11],加速度值是其中十分重要的性能指標(biāo),為了更好的進(jìn)行對(duì)比,數(shù)據(jù)集中的護(hù)欄評(píng)價(jià)指標(biāo)均為加速度。為了保證本文中的模型對(duì)比具有可靠性,本文采用的數(shù)據(jù)均來(lái)自現(xiàn)已發(fā)表的文獻(xiàn),且這些文章中所用模型的有效性均在原文中得到驗(yàn)證。
數(shù)據(jù)集1由Yin等[4]研究所得,該研究中主要以RBF模型為基礎(chǔ),以η型波形梁護(hù)欄為研究目標(biāo),使用波形板厚度t和η型立柱外伸長(zhǎng)度L兩個(gè)特征參數(shù)對(duì)護(hù)欄性能指標(biāo)進(jìn)行預(yù)測(cè)(特征參數(shù)對(duì)應(yīng)至護(hù)欄結(jié)構(gòu)的示意圖如圖2所示),該研究中將碰撞過(guò)程中車輛的質(zhì)心加速度換算得到的乘員的最大加速度值作為重要指標(biāo)。其中樣本集采用全因子設(shè)計(jì)所得。
圖2 數(shù)據(jù)集1對(duì)應(yīng)的護(hù)欄整體及特征參數(shù)
數(shù)據(jù)集2由Hou等[5]研究所得,該研究主要是對(duì)護(hù)欄立柱間距x1和波形梁板厚度x2對(duì)護(hù)欄整體性能的影響進(jìn)行了研究(特征參數(shù)對(duì)應(yīng)至護(hù)欄結(jié)構(gòu)的示意圖如圖3所示),文中使用超拉丁立方采樣方法構(gòu)建樣本集,使用RBF-MQ模型對(duì)車輛碰撞過(guò)程中的質(zhì)心加速度值進(jìn)行預(yù)測(cè)。
圖3 數(shù)據(jù)集2對(duì)應(yīng)的護(hù)欄整體及特征參數(shù)
為了評(píng)估預(yù)測(cè)模型的準(zhǔn)確性,各研究中均使用了相應(yīng)的模型預(yù)測(cè)評(píng)價(jià)指標(biāo),數(shù)據(jù)集1的對(duì)應(yīng)研究中,研究者采用最大相對(duì)誤差絕對(duì)值(MARE)和均方根誤差(RMSE)作為評(píng)價(jià)指標(biāo),可以分別通過(guò)式和得到:
式中,y為實(shí)際加速度值;y′為預(yù)測(cè)加速度值。
式中,n為樣本數(shù)目,i= 1 ,2,...,n;y為實(shí)際加速度值;y′為預(yù)測(cè)加速度值。
數(shù)據(jù)集2對(duì)應(yīng)研究中同樣使用了MARE值作為評(píng)價(jià)指標(biāo)之一,另一個(gè)評(píng)價(jià)指標(biāo)為相對(duì)平均絕對(duì)誤差(RAAE),可以通過(guò)式得到:
式中,n為樣本數(shù)目,i= 1 ,2,...,n;y為實(shí)際加速度值;y′為預(yù)測(cè)加速度值。
為了綜合多個(gè)評(píng)價(jià)指標(biāo)來(lái)反映各模型的預(yù)測(cè)準(zhǔn)確性,本文中提出使用綜合滿意度(CS)來(lái)對(duì)比在相同數(shù)據(jù)集的輸入下不同模型的預(yù)測(cè)性能,可以通過(guò)式得到:
式中,m為評(píng)價(jià)指標(biāo)數(shù)目,i= 1 ,2,...,n;Ii為某個(gè)模型的評(píng)價(jià)指標(biāo)i的值;min(Ii(x) )為所有模型評(píng)價(jià)指標(biāo)值中的最小值;max(Ii(x) )為所有模型評(píng)價(jià)指標(biāo)值中的最大值。
在后續(xù)的預(yù)測(cè)對(duì)比中,不同模型使用某一數(shù)據(jù)集進(jìn)行對(duì)比時(shí),使用與該數(shù)據(jù)集來(lái)源文獻(xiàn)中的相同評(píng)價(jià)指標(biāo)進(jìn)行對(duì)比,并增加CS值作為綜合評(píng)定指標(biāo),CS值越接近于0,表示對(duì)應(yīng)模型的預(yù)測(cè)效果越好。
在本節(jié)中,將對(duì)上述選用的5種單個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行比較,后續(xù)再將該結(jié)論與集成模型的預(yù)測(cè)效果進(jìn)行比較。
如表1所示,根據(jù)模型預(yù)測(cè)評(píng)價(jià)指標(biāo)(18)-(21)對(duì)各單個(gè)人工智能模型的預(yù)測(cè)結(jié)果進(jìn)行了對(duì)比。由表1可知,對(duì)于數(shù)據(jù)集1,BPNN模型、RBFNN模型和Genlin模型的CS值分別為0、0.399和0.553,優(yōu)于其他2種模型,因此將使用這3種模型用于后續(xù)的集成模型搭建。由表2可知,數(shù)據(jù)集1對(duì)應(yīng)的4種集成模型中性能最優(yōu)的為RBFNN+BPNN+Genlin模型,其MARE和RMSE值也優(yōu)于對(duì)應(yīng)的3種單個(gè)模型,具有更好的預(yù)測(cè)性能。而對(duì)于數(shù)據(jù)集2而言,Genlin、BPNN和RBFNN模型的綜合性能較優(yōu),CS值分別為0.011、0.023和0.490,相應(yīng)的可以得到表2中的各數(shù)據(jù),其中RBFNN+BPNN+Genlin模型的MARE值和RAAE值優(yōu)于其他集成模型和其對(duì)應(yīng)的3種單個(gè)模型。
表1 單個(gè)模型性能對(duì)比
表2 集成模型性能對(duì)比
近年來(lái),許多學(xué)者也開始使用機(jī)器學(xué)習(xí)來(lái)協(xié)助護(hù)欄設(shè)計(jì),而提高模型預(yù)測(cè)精度則是能夠有效提高開發(fā)效率的重點(diǎn),因此本文中將根據(jù)表1和表2的結(jié)果,將其與對(duì)應(yīng)數(shù)據(jù)來(lái)源文章中所提出的預(yù)測(cè)模型進(jìn)行比較。各數(shù)據(jù)集中研究者使用的最終模型的性能指標(biāo)值如表3所示,數(shù)據(jù)集1對(duì)應(yīng)的研究者使用RBF模型進(jìn)行護(hù)欄性能預(yù)測(cè),并使用MARE和RMSE作為性能指標(biāo),其結(jié)果分別為8.790和4.754,數(shù)據(jù)集2對(duì)應(yīng)的各項(xiàng)數(shù)據(jù)為研究者使用RBF-MQ模型得到,并以MARE和RAAE作為評(píng)判指標(biāo)。
表3 數(shù)據(jù)來(lái)源研究中所用的模型性能
使用各對(duì)應(yīng)數(shù)據(jù)集進(jìn)行預(yù)測(cè),原文章所使用模型、最優(yōu)單個(gè)模型和最優(yōu)集成的預(yù)測(cè)精度對(duì)比如表4所示,由表4可知,集成模型具有更高的預(yù)測(cè)精度,各項(xiàng)模型指標(biāo)值(MARE、RMSE、RAAE)降低24%~58.9%。以數(shù)據(jù)集2為例,集成模型(RBNNF+BPNN+Genlin)的MARE和RAAE值較單個(gè)模型降低58.9%和49.2%,較原文中的預(yù)測(cè)模型降低24.2%和36.9%。
表4 集合模型的性能提升比例
由表3和表4可知,集成模型具有更高的預(yù)測(cè)性能,與之前的研究不同,本研究使用了十折交叉驗(yàn)證方法來(lái)確保模型具有良好的泛化能力,因此使用決定系數(shù)R來(lái)驗(yàn)證模型的可信度[6],由式可得。
式中,n為樣本數(shù)目,i= 1 ,2,...,n;y為實(shí)際加速度值;y′為預(yù)測(cè)加速度值。
各組數(shù)據(jù)集對(duì)應(yīng)的最優(yōu)單個(gè)模型、集成模型和原文中所用模型的決定系數(shù)對(duì)比如圖4所示,集成模型的決定系數(shù)均大于0.9,且最優(yōu)集成模型的決定系數(shù)最接近1,因此表明所得的模型具有較高的可信度,并且結(jié)合上文中的結(jié)論,本文中提出的集成模型的預(yù)測(cè)準(zhǔn)確性優(yōu)于目前相關(guān)文獻(xiàn)研究中所用模型。
圖4 各數(shù)據(jù)集對(duì)應(yīng)模型決定系數(shù)對(duì)比
本文針對(duì)目前缺少一個(gè)具有明顯優(yōu)勢(shì)的高精度和高泛用性的預(yù)測(cè)模型來(lái)形成系統(tǒng)的高效護(hù)欄設(shè)計(jì)方法這一問(wèn)題,引入集成式人工智能模型來(lái)進(jìn)行護(hù)欄性能的預(yù)測(cè),高性能預(yù)測(cè)模型配合優(yōu)化算法能夠極大地減少護(hù)欄設(shè)計(jì)成本并系統(tǒng)化設(shè)計(jì)方式,具有很強(qiáng)的工程意義。在本文中主要對(duì)集成模型性能方面進(jìn)行了探究。
文中對(duì)單個(gè)模型訓(xùn)練時(shí)使用了十折交叉驗(yàn)證方法,提高了模型的泛化能力,并通過(guò)綜合滿意度對(duì)單個(gè)模型性能進(jìn)行了判斷,挑選出較優(yōu)單個(gè)模型并使用集成函數(shù)得到集成模型。通過(guò)使用現(xiàn)有研究中的數(shù)據(jù)集對(duì)集成模型在護(hù)欄性能預(yù)測(cè)方面的有效性進(jìn)行了驗(yàn)證,再通過(guò)對(duì)比單個(gè)模型、現(xiàn)有研究中的模型和集成模型,發(fā)現(xiàn)集成模型具有明顯優(yōu)勢(shì),RBFNN+BPNN+Genlin模型各項(xiàng)指標(biāo)值較現(xiàn)有研究中所使用模型提升24%-58.9%,具有更強(qiáng)的魯棒性和更高的預(yù)測(cè)精度。