張?zhí)m芳, 趙 焜
(同濟(jì)大學(xué) 道路與交通工程教育部重點(diǎn)試驗(yàn)室, 上海 201804)
公安部交通管理局的統(tǒng)計(jì)數(shù)據(jù)顯示,2016年全國(guó)發(fā)生貨車責(zé)任道路交通事故5.04萬(wàn)起,造成2.5萬(wàn)人死亡、4.68萬(wàn)人受傷,分別占汽車責(zé)任事故總量的30.5%、48.23%和27.81%,遠(yuǎn)高于貨車保有量占汽車總量的比例[1].貨車交通事故多發(fā),已成為嚴(yán)重的交通安全隱患.因此貨車對(duì)道路安全的影響研究就顯得尤為重要.鑒于貨車事故的嚴(yán)重性,如果能夠采用主動(dòng)防控技術(shù),在事故尚未發(fā)生、但有一定征兆時(shí),采取措施來(lái)避免事故的發(fā)生,對(duì)于改善交通安全具有重要意義.
在貨車對(duì)交通影響的研究中,Gazis等[2]首次提出了“移動(dòng)瓶頸(moving bottleneck)”的概念,解釋重型車輛對(duì)通行能力產(chǎn)生的影響.Middleton等[3]針對(duì)混行及小客車專用道的事故類型及比例進(jìn)行調(diào)查分析,結(jié)果表明客車專用道的事故率明顯低于混行車道事故率,且混行車道貨車與客車發(fā)生碰撞的概率極高.Vadlamani等[4]發(fā)現(xiàn)主要類型的貨車交通事故發(fā)生的概率與貨車比例、交通量、以及天氣交通狀況等因素有關(guān).Yang等[5]對(duì)小汽車和貨車的混合交通流進(jìn)行了研究,發(fā)現(xiàn)在不同的小汽車與貨車組合中,小汽車跟隨貨車的組合對(duì)于交通流穩(wěn)定性影響更大.在貨車安全方面,貨車事故嚴(yán)重程度的影響因素分析也是近年來(lái)的研究熱點(diǎn)[6-8].
近年來(lái)交通智能化發(fā)展迅速,交通流實(shí)時(shí)數(shù)據(jù)的獲取及存儲(chǔ)更加高效.越來(lái)越多學(xué)者開(kāi)始研究利用實(shí)時(shí)交通流數(shù)據(jù)進(jìn)行風(fēng)險(xiǎn)評(píng)估.Oh等[9]研究發(fā)現(xiàn)5 min間隔的速度標(biāo)準(zhǔn)差是檢測(cè)事故的最佳參數(shù),并采用非參數(shù)貝葉斯(non-parametric Bayesian)分類模型分析事故風(fēng)險(xiǎn).Abdel-Aty和Pande[10]首先將事故風(fēng)險(xiǎn)預(yù)測(cè)作為一種分類問(wèn)題進(jìn)行研究,利用基于貝葉斯判別法的概率神經(jīng)網(wǎng)絡(luò)法(Probabilistic Neutral Network),最終訓(xùn)練得到PNN 模型,可以識(shí)別70%的事故.Pande等[11-12]采用多層感知神經(jīng)網(wǎng)絡(luò)(Multi-layer Perceptron Neural Network)和正態(tài)徑向基神經(jīng)網(wǎng)絡(luò)(Normalized Radial Basis Function),分別針對(duì)追尾事故、側(cè)碰事故進(jìn)行實(shí)時(shí)事故風(fēng)險(xiǎn)預(yù)測(cè)模型建模,達(dá)到了理想的分類精度.Yu等[13]利用支持向量機(jī)(Support Vector Machine)和貝葉斯邏輯回歸(Bayesian Logistic Regression)對(duì)山區(qū)高速公路進(jìn)行實(shí)時(shí)交通流風(fēng)險(xiǎn)預(yù)測(cè),證明在數(shù)據(jù)集較小時(shí),支持向量機(jī)具有更好的預(yù)測(cè)性.孫劍等[14]應(yīng)用貝葉斯網(wǎng)絡(luò)(BN)模型對(duì)快速路實(shí)時(shí)交通流參數(shù)與事故風(fēng)險(xiǎn)進(jìn)行建模,事故預(yù)測(cè)準(zhǔn)確率達(dá)到76.94%.
綜上,在貨車對(duì)于交通的影響的研究中,國(guó)內(nèi)外學(xué)者從“移動(dòng)瓶頸”理論出發(fā),研究微觀條件下,貨車對(duì)交通流的擾動(dòng).在研究方法上,多利用仿真軟件得到交通流模擬數(shù)據(jù),而較少采用實(shí)時(shí)的交通流數(shù)據(jù).在實(shí)時(shí)交通流風(fēng)險(xiǎn)評(píng)估的研究中,使用的模型從傳統(tǒng)統(tǒng)計(jì)模型逐漸向人工智能模型方面發(fā)展.存在的問(wèn)題是,由于國(guó)外貨車比例較低,且貨車性能與小汽車差別不明顯,因此在研究中忽略了貨車對(duì)交通流風(fēng)險(xiǎn)的影響.針對(duì)國(guó)內(nèi)高速公路貨車比例及貨車事故比例較高的問(wèn)題,對(duì)貨車造成的交通流風(fēng)險(xiǎn)還需進(jìn)行量化研究.通過(guò)在特征變量中加入貨車因素,提高了高速公路短期交通流風(fēng)險(xiǎn)預(yù)測(cè)模型的預(yù)測(cè)精度,為國(guó)內(nèi)貨車交通安全研究在事故預(yù)測(cè)方面提供借鑒.
本文數(shù)據(jù)采集自沈海高速公路(G15)上海段,采集時(shí)間為2014年1月至2015年9月.交通流數(shù)據(jù)通過(guò)線圈檢測(cè)器進(jìn)行采集,可得到流量、速度、占有率等交通參數(shù).G15上海段共布設(shè)檢測(cè)器21套,平均間距為4.5km,檢測(cè)器數(shù)據(jù)采集周期為20 s.交通流數(shù)據(jù)采集周期較短會(huì)產(chǎn)生數(shù)據(jù)噪聲,因此本文按照5 min時(shí)間間隔對(duì)交通流數(shù)據(jù)進(jìn)行集計(jì)[10].提取事故發(fā)生前20 min的數(shù)據(jù),以5 min為單位時(shí)段,將數(shù)據(jù)分為事故發(fā)生前0~5 min,5~10 min,10~15 min和15~20 min 4個(gè)時(shí)間段.
共采集事故數(shù)1 220起,其中貨車相關(guān)事故占總事故比例為61%,如圖1a所示.統(tǒng)計(jì)得到事故發(fā)生時(shí)貨車比例平均為34%,即本路段貨車事故比例明顯高于貨車比例,表明貨車對(duì)于本路段的通暢與安全造成了較大的影響.事故形態(tài)分布如圖1b所示.考慮到追尾,碰擦等事故多由交通流擁擠或紊亂等造成,此類事適合使用交通流參數(shù)進(jìn)行預(yù)測(cè).并且從圖1b中可以看出追尾和碰擦兩類事故占總事故數(shù)的45%,比例較大,所以事故研究主要為追尾和碰擦事故.
a
b圖1 事故數(shù)據(jù)分類統(tǒng)計(jì)Fig.1 Classified statistics of crash data
對(duì)事故數(shù)據(jù)進(jìn)行篩選.首先將事故發(fā)生前20 min交通流數(shù)據(jù)中有異常的事故數(shù)據(jù)進(jìn)行剔除.其次由于G15布設(shè)的線圈檢測(cè)器并不均勻,當(dāng)線圈間隔較大時(shí),交通流擾動(dòng)很難檢測(cè)到,間隔較小時(shí),所篩選出事故數(shù)據(jù)樣本量較小,預(yù)測(cè)模型不能得到有效訓(xùn)練,所以篩選上下游檢測(cè)器間隔在4 km內(nèi)的事故數(shù)據(jù),可以保證交通流數(shù)據(jù)的有效性,且滿足模型樣本量要求,共篩選到86起追尾和碰擦事故.
為了對(duì)比事故發(fā)生前和正常狀態(tài)下的交通流動(dòng)態(tài)特征,交通流數(shù)據(jù)需要按配對(duì)方式選取,采用病例-對(duì)照研究方法,其中病例組為交通事故發(fā)生前的交通流動(dòng)態(tài)特征,對(duì)照組為沒(méi)有發(fā)生事故條件下的交通流動(dòng)態(tài)特征.在交通安全研究領(lǐng)域,病例和對(duì)照的比例選擇了常用的1∶4[15-16].
非事故數(shù)據(jù)選取時(shí),應(yīng)注意與事故數(shù)據(jù)在相同地點(diǎn)、相同時(shí)間、相同季節(jié)、不同日期條件下采集得到,控制道路的幾何條件、時(shí)段等對(duì)事故發(fā)生的影響.此外,在提取非事故數(shù)據(jù)時(shí),要確保取樣時(shí)段前后1 h內(nèi)沒(méi)有事故發(fā)生,以保證非事故數(shù)據(jù)能反應(yīng)正常情況的交通條件.
例如,有一個(gè)事故發(fā)生在2014年4月9日17:35,將17:15~17:35之間距離事故發(fā)生地點(diǎn)最近的檢測(cè)器數(shù)據(jù)提取出來(lái),并根據(jù)規(guī)則,提取3月26日、4月2日和4月16日及4月23日相同時(shí)刻的交通流數(shù)據(jù).17:30~17:35的數(shù)據(jù)為0~5 min組,17:25~17:30的數(shù)據(jù)為5~10 min組,17:20~17:25的數(shù)據(jù)為10~15 min組,17:15~17:20的數(shù)據(jù)為15~20 min組.
基于統(tǒng)計(jì)學(xué)習(xí)理論的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的SVM方法,將實(shí)際問(wèn)題通過(guò)非線性變換轉(zhuǎn)換到高維特征空間,在高維空間中構(gòu)造線性判別函數(shù)來(lái)實(shí)現(xiàn)原空間中的非線性判別問(wèn)題,其算法復(fù)雜度與樣本維數(shù)無(wú)關(guān)[18].并且相比于神經(jīng)網(wǎng)絡(luò),SVM不易陷入局部最優(yōu),更適合于小樣本情況.基于交通風(fēng)險(xiǎn)預(yù)測(cè)問(wèn)題的特點(diǎn),本文選用支持向量機(jī)進(jìn)行模型構(gòu)建.
設(shè)有n個(gè)樣本xk及其所屬類別yk,表示為(xk,yk),k=1,2,3…N,xk∈RN,N表示輸入空間的維度,yk∈{1,-1}.xk指的是第k個(gè)樣本的交通流參數(shù),yk是該樣本所對(duì)應(yīng)的交通狀態(tài):如果是導(dǎo)致事故發(fā)生的狀態(tài),則yk=1,如果是非事故發(fā)生狀態(tài),yk=-1.本文為非線性分類問(wèn)題,支持向量機(jī)通過(guò)核函數(shù),將數(shù)據(jù)映射到高維空間,使其變?yōu)榫€性可分問(wèn)題,并在這個(gè)特征空間中構(gòu)造最優(yōu)分類超平面.最終尋優(yōu)目標(biāo)函數(shù)為式(1),相應(yīng)的分類函數(shù)式為式(2).
αi≤C)
(1)
(2)
K(xi,xj)=exp(-g||xi-xj||2),g>0
(3)
模型預(yù)測(cè)精度評(píng)價(jià)指標(biāo)一方面是檢驗(yàn)SVM模型優(yōu)良程度的標(biāo)準(zhǔn),另一方面也是SVM模型參數(shù)交叉驗(yàn)證尋優(yōu)過(guò)程的基本依據(jù).模型分類精度采用的統(tǒng)計(jì)指標(biāo)為總體預(yù)測(cè)精度、事故預(yù)測(cè)精度和誤報(bào)率.總體預(yù)測(cè)精度是指預(yù)測(cè)正確的樣本數(shù)占樣本總數(shù)的比例,事故預(yù)測(cè)精度是指預(yù)測(cè)正確的事故樣本數(shù)占事故樣本總數(shù)的比例,誤報(bào)率是指將非事故樣本預(yù)測(cè)為事故樣本的數(shù)目占非事故樣本總數(shù)的比例.
提取歷史事故數(shù)據(jù)和交通流原始數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行集計(jì),以形成一些容易識(shí)別出高事故風(fēng)險(xiǎn)交通狀態(tài)的特征變量.在短期交通流風(fēng)險(xiǎn)預(yù)測(cè)模型的研究中,國(guó)內(nèi)外學(xué)者提出了很多特征變量,如速度標(biāo)準(zhǔn)差、速度變異系數(shù)、不同檢測(cè)器不同時(shí)間間隔的速度、流量、占有率數(shù)據(jù)[15-17].為進(jìn)一步研究貨車比例在短期交通流風(fēng)險(xiǎn)預(yù)測(cè)中的作用,在特征變量選取中考慮了貨車因素.為方便命名和編號(hào),事故上游檢測(cè)器采集到的參數(shù)在第一位用U標(biāo)明,事故下游檢測(cè)器采集到的參數(shù)在第一位用D標(biāo)明,特征變量如表1所示.
將交通流運(yùn)行風(fēng)險(xiǎn)分為可能發(fā)生事故和不會(huì)發(fā)生事故兩種狀態(tài),因此可以將交通流風(fēng)險(xiǎn)預(yù)測(cè)問(wèn)題看成一個(gè)二分類問(wèn)題,樣本數(shù)據(jù)中包含事故數(shù)據(jù)與非事故數(shù)據(jù),每個(gè)數(shù)據(jù)包含A組、B組、C組不同維度的自變量,如果發(fā)生事故則將狀態(tài)變量記為1,未發(fā)生事故則將狀態(tài)變量記為-1.將樣本數(shù)據(jù)分為訓(xùn)練樣本樣本和測(cè)試樣本,模型基于訓(xùn)練樣本數(shù)據(jù)對(duì)分類器進(jìn)行訓(xùn)練并建立模型,利用建立的模型對(duì)測(cè)試數(shù)據(jù)集進(jìn)行估計(jì),以此驗(yàn)證模型的精度.
由于事故樣本與非事故樣本不均衡,首先對(duì)樣本進(jìn)行過(guò)抽樣,可得到4個(gè)時(shí)間段,3組特征變量的12個(gè)數(shù)據(jù)組.使用MATLAB平臺(tái)Libsvm進(jìn)行SVM建模,由于懲罰參數(shù)C和RBF核函數(shù)參數(shù)g對(duì)SVM模型分類會(huì)有很大影響,因此,本文采用網(wǎng)格搜索法和遺傳算法相結(jié)合的方法對(duì)參數(shù)C和g進(jìn)行尋優(yōu).得到12個(gè)SVM分類器模型,對(duì)分類器效果進(jìn)行比較分析,可得到預(yù)測(cè)效果最佳的時(shí)間段及特征變量組.
表1 模型中所用特征變量Tab.1 Characteristic variables used in the model
注:C組綜合變量由A組變量與B組變量合并形成
在數(shù)據(jù)選取時(shí),按照病例對(duì)照的方法,事故數(shù)據(jù)與非事故數(shù)據(jù)采集的比例為1:4,會(huì)出現(xiàn)樣本不均衡的問(wèn)題.為解決非平衡類數(shù)據(jù)集帶來(lái)的誤分類問(wèn)題,本文采用SMOTE算法改變數(shù)據(jù)集的樣本分布.SMOTE算法通過(guò)人工構(gòu)造少數(shù)類樣本來(lái)增加正類樣本的數(shù)量,從而減少數(shù)據(jù)失衡程度,從而提高模型的預(yù)測(cè)精度[19].該算法的基本假設(shè)為同類別樣本在模式空間中必定互相靠近,因此在一個(gè)少數(shù)類樣本最近鄰隨機(jī)選擇一個(gè)樣本,在兩者之間的連線上隨機(jī)選一點(diǎn)作為新合成的少數(shù)類樣本.若抽樣率是m,對(duì)于每個(gè)少數(shù)類樣本xi,找出它k個(gè)少數(shù)類近鄰點(diǎn).從中任選m個(gè)近鄰點(diǎn)yij(j=1,2,…,m),具體插值方法如下:
Pj=xi+rand(0,1)(yij-xi)
(4)
選取整體交通流特征變量,提取事故前5~10 min交通流數(shù)據(jù),通過(guò)SMOTE算法將少數(shù)類樣本擴(kuò)大不同的倍數(shù),使用2組不同的懲罰因子C和核參數(shù)g,構(gòu)建SVM模型并進(jìn)行比較分析.為使用同一個(gè)分類器模型對(duì)不同倍數(shù)預(yù)測(cè)結(jié)果進(jìn)行比較,選取參數(shù)時(shí)并未使用遺傳算法優(yōu)化參數(shù).結(jié)果見(jiàn)表2.
通過(guò)表2可知,在未進(jìn)行SMOTE過(guò)抽樣時(shí),事故預(yù)測(cè)精度均為0.經(jīng)過(guò)SMOTE算法過(guò)抽樣后,盡管模型參數(shù)選擇不同,但事故預(yù)測(cè)精度均得到提升.對(duì)比將事故數(shù)據(jù)擴(kuò)大2倍和4倍的結(jié)果,擴(kuò)大4倍后,事故樣本與非事故樣本同樣多,不存在數(shù)據(jù)不均衡性問(wèn)題,誤報(bào)率有所降低,但事故預(yù)測(cè)精度有較大提高.因此,最終選擇將少數(shù)類樣本擴(kuò)大4倍,并對(duì)模型參數(shù)進(jìn)行尋優(yōu).
表2 不同擴(kuò)大倍數(shù)的預(yù)測(cè)精度Tab.2 The prediction accuracy of different multiples
采用的核函數(shù)是徑向基核函數(shù),主要的參數(shù)是懲罰因子C和核參數(shù)g.參數(shù)C表明了對(duì)誤差的寬容度,C越大,容忍出錯(cuò)的程度越??;參數(shù)g是核函數(shù)半徑,隱含地決定了數(shù)據(jù)映射到新的特征空間后的分布.提高SVM模型的分類精度就要選擇合適的方法對(duì)模型參數(shù)進(jìn)行選擇.遺傳算法屬于啟發(fā)式算法,魯棒性較強(qiáng),對(duì)函數(shù)要求不高,且不容易陷入局部最優(yōu)[20],因此,采用遺傳算法對(duì)SVM模型參數(shù)進(jìn)行選擇.在用遺傳算法對(duì)參數(shù)進(jìn)行尋優(yōu)時(shí),首先要對(duì)參數(shù)的尋優(yōu)范圍進(jìn)行設(shè)置.采用網(wǎng)格搜索法對(duì)模型參數(shù)進(jìn)行粗選,確定參數(shù)的大致范圍,再用遺傳算法對(duì)參數(shù)進(jìn)行精選.以C組變量為例,首先將參數(shù)C、g設(shè)置為默認(rèn)值,粗選結(jié)果如圖2所示.
圖2 參數(shù)C和g網(wǎng)格搜索法粗選結(jié)果Fig.2 Rough selecting results of parameters usinggrid search method
由圖2可知,預(yù)測(cè)的分類精度最高為88%左右,綜合考慮尋優(yōu)的復(fù)雜度及參數(shù)尋優(yōu)質(zhì)量,得到參數(shù)的粗選結(jié)果為C∈[2-1,25],g∈[20,26].得到參數(shù)粗選結(jié)果后,采用遺傳算法對(duì)參數(shù)進(jìn)行精選.對(duì)參數(shù)進(jìn)行二進(jìn)制編碼,并將種群初始化,為降低算法的復(fù)雜度,初始種群規(guī)模不宜太大,因此本文將種群中個(gè)體數(shù)目定為20個(gè).采用k-折交叉驗(yàn)證(k-fold cross validation)的方法來(lái)評(píng)價(jià)SVM分類模型的性能.k-折交叉驗(yàn)證將原始樣本分成k個(gè)互不相交的子集,即k-折.然后將每個(gè)子集數(shù)據(jù)分別做一次驗(yàn)證集,其余的k-1組子集數(shù)據(jù)作為訓(xùn)練集,最終,將會(huì)得到k個(gè)模型分類精度A1,A2,…,Ak.用這k個(gè)分類精度的平均數(shù)A作為k-折交叉驗(yàn)證下的性能指標(biāo),即
(5)
由于遺傳算法是隨機(jī)搜索算法,迭代終止條件并沒(méi)有統(tǒng)一的方法.一般采用達(dá)到預(yù)先設(shè)定的代數(shù)作為遺傳算法迭代終止條件,將迭代次數(shù)設(shè)為100,迭代終止后選擇最優(yōu)適應(yīng)度值作為最后的解.在運(yùn)算過(guò)程中,可能會(huì)有多組的C和g對(duì)應(yīng)于最高的驗(yàn)證分類準(zhǔn)確率,由于懲罰參數(shù)C取值過(guò)大時(shí)會(huì)造成“過(guò)學(xué)習(xí)”狀態(tài)的發(fā)生,即訓(xùn)練集分類準(zhǔn)確率很高而測(cè)試集分類準(zhǔn)確率很低,使構(gòu)建的SVM模型泛化能力降低.因此,在處理這種情況時(shí),優(yōu)先選擇參數(shù)C最小的那組C和g作為最佳參數(shù),如果參數(shù)C最小時(shí)對(duì)應(yīng)多組參數(shù)g,則選取搜索到的第1組C和g作為最佳參數(shù).
以5 min為時(shí)間間隔選擇事故發(fā)生前20 min的特征變量,用遺傳算法對(duì)模型參數(shù)進(jìn)行尋優(yōu),共建立了12個(gè)SVM分類器,進(jìn)行多次迭代,如圖3所示,為C組變量迭代的一組實(shí)例.
將遺傳算法迭代運(yùn)算后求得的參數(shù)組合對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練,可獲得較高預(yù)測(cè)精度.將模型應(yīng)用于測(cè)試集,可得到最終的分類預(yù)測(cè)結(jié)果如表3所示.
表3 各組模型參數(shù)及預(yù)測(cè)精度Tab.3 Parameters and prediction accuracy of models
首先比較不同時(shí)間段之間的預(yù)測(cè)精度.從表中看出,事故發(fā)生前15~20 min、10~15 min的總體預(yù)測(cè)精度、事故預(yù)測(cè)精度相比于0~5 min,5~10 min低,而誤報(bào)率較高,表明距離事故發(fā)生時(shí)間較早的交通流數(shù)據(jù)提供的可用于預(yù)測(cè)事故的信息量較少,對(duì)于交通流風(fēng)險(xiǎn)預(yù)測(cè)的價(jià)值較低.而本文將事故接警時(shí)間等同于事故發(fā)生時(shí)間,實(shí)際事故發(fā)生時(shí)間要更早,盡管此處的0~5 min時(shí)段具有較好的總體預(yù)測(cè)精度,但此時(shí)段可能包含事故發(fā)生后的數(shù)據(jù).另外考慮到在實(shí)際交通流風(fēng)險(xiǎn)預(yù)測(cè)的應(yīng)用中,預(yù)測(cè)時(shí)間應(yīng)保證一定的提前量,即應(yīng)當(dāng)給交通管理部門一定的反應(yīng)時(shí)間來(lái)采取措施,因此0~5 min時(shí)段不作為預(yù)測(cè)時(shí)間段.綜上,5~10 min時(shí)段的預(yù)測(cè)效果更好.
將3組特征變量事故發(fā)生前5~10 min的預(yù)測(cè)結(jié)果進(jìn)行比較,結(jié)果發(fā)現(xiàn):與A組變量相比,C組變量總體預(yù)測(cè)精度與事故預(yù)測(cè)精度均得到提高,且誤差率降低至3.076 9%,說(shuō)明加入貨車相關(guān)變量,可提高交通流風(fēng)險(xiǎn)預(yù)測(cè)精度.B組變量即僅采用貨車特征變量時(shí),總體預(yù)測(cè)精度和事故預(yù)測(cè)精度相比于C組有所提高,但誤報(bào)率有所升高.B組和C組變量均比A組變量有更好的預(yù)測(cè)效果,即本路段在進(jìn)行交通流風(fēng)險(xiǎn)預(yù)測(cè)時(shí),應(yīng)當(dāng)將貨車變量作為風(fēng)險(xiǎn)特征變量.
圖3 SVM模型參數(shù)尋優(yōu)圖Fig.3 parameter optimization of SVM models
考慮到模型中風(fēng)險(xiǎn)特征變量較多,因此采用平均影響值法(MIV法)研究在C組變量中,貨車因素對(duì)預(yù)測(cè)結(jié)果的影響程度,同時(shí)對(duì)特征變量進(jìn)行分析和篩選.MIV方法在神經(jīng)網(wǎng)絡(luò)中是非常有效的一種變量篩選方法,在模型訓(xùn)練終止后,將訓(xùn)練樣本中每一特征變量在其原值的基礎(chǔ)上分別加減10%構(gòu)成兩個(gè)新的訓(xùn)練樣本,再利用已建成的模型得到兩個(gè)新的結(jié)果,新結(jié)果之間的差值即為變動(dòng)該特征變量對(duì)預(yù)測(cè)結(jié)果產(chǎn)生的影響變化值.結(jié)合前文中對(duì)所建立的SVM預(yù)測(cè)模型的比較,選擇事故發(fā)生前5~10 min的C組特征變量的預(yù)測(cè)模型,計(jì)算各特征變量的MIV值,取絕對(duì)值后進(jìn)行排序,得到的結(jié)果如表4所示.
在30個(gè)特征變量的前10個(gè)主要影響變量中,下游占有率標(biāo)準(zhǔn)差對(duì)預(yù)測(cè)模型的影響最大,即當(dāng)下游占有率發(fā)生變化時(shí),由于交通流的傳遞性,上游交
表4 C組變量模型的MIV值統(tǒng)計(jì)表Tab.4 Statistical table of MIV values of Group C model
通流受到干擾,從而增大事故發(fā)生的可能性.MIV值排序第2的變量為下游貨車速度標(biāo)準(zhǔn)差,即下游貨車速度變化值對(duì)交通流有較大影響,此結(jié)論與Oh等學(xué)者[9]研究結(jié)論一致,只是其研究中并未對(duì)客貨車進(jìn)行區(qū)分.可以看到,在前10個(gè)主要特征變量中,有6個(gè)為貨車相關(guān)變量,而且上、下游貨車比例均在其中,表明在模型中考慮貨車相關(guān)變量可以提高預(yù)測(cè)準(zhǔn)確率.在貨車比例及貨車事故率較高路段進(jìn)行主動(dòng)安全管理時(shí),應(yīng)當(dāng)加強(qiáng)對(duì)貨車速度以及貨車比例的等因素實(shí)時(shí)監(jiān)控,從而提高預(yù)測(cè)的可靠性.
將交通流風(fēng)險(xiǎn)預(yù)測(cè)問(wèn)題看成一個(gè)二分類問(wèn)題,基于支持向量機(jī),建立了高速公路交通流風(fēng)險(xiǎn)預(yù)測(cè)模型.分別選取斷面整體交通流參數(shù)、貨車交通流參數(shù)和綜合參數(shù)作為風(fēng)險(xiǎn)特征變量,以5 min為間隔選擇事故發(fā)生前20 min的特征變量,用遺傳算法對(duì)模型參數(shù)進(jìn)行尋優(yōu).結(jié)果表明事故發(fā)生前5~10 min的模型預(yù)測(cè)精度最高,加入貨車因素的預(yù)測(cè)模型比僅考慮交通流參數(shù)的模型精度更高,因此可用貨車交通流參數(shù)作為預(yù)測(cè)模型的特征變量.在綜合變量預(yù)測(cè)模型中,采用平均影響值法進(jìn)行分析,結(jié)果表明貨車因素對(duì)于預(yù)測(cè)模型有較大影響.該模型可用來(lái)開(kāi)發(fā)交通安全預(yù)警系統(tǒng),為高速公路安全運(yùn)營(yíng)管理提供依據(jù).但由于僅為G15上海段建立了模型,接下來(lái)研究應(yīng)在搜集不同道路條件以及不同貨車比例的基礎(chǔ)上進(jìn)行模型優(yōu)化,提高模型適用性.
參考文獻(xiàn):
[1] 中華人民共和國(guó)公安部交通管理局.部分貨車車型違規(guī)生產(chǎn)問(wèn)題突出,貨車運(yùn)輸安全隱患嚴(yán)重[EB/OL]. [2017-05-03]. http://www.mps.gov.cn/n2255040/n2255043/c5609936/content.html.
Traffic Management Bureau of the Public Security Ministry of the People’s Republic of China. Some trucks have severe problems of illegal production, and the security problem of trucking is serious[EB/OL]. [2017-05-03]. http://www.mps.gov.cn/n2255040/n2255043/c5609936/content.html.
[2] GAZIS D C,HERMAN R. The moving and “phantom” bottleneck [J]. Transportation Science,1992,26(3):223.
[3] MIDDLETON D,VENGLAR S,QUIROGA C,etal. Strategies for separating trucks from passenger vehicles:final report [R]. Texas:Texas Transportation Institute, 2006.
[4] VADLAMANI S,CHEN E,AHN S,etal. Identifying large truck hot spots using crash counts and PDOEs[J]. Journal of Transportation Engineering, 2011, 137 (1) :11.
[5] YANG D,JIN P,PU Y,etal. Stability analysis of the mixed traffic flow of cars and trucks using heterogeneous optimal velocity car-following model [J]. Physica A:Statistical Mechanics and Its Applications, 2014,395(4):371.
[6] ZOU W,WANG X,ZHANG D. Truck crash severity in New York city: an investigation of the spatial and the time of day effects[J]. Accident Analysis & Prevention, 2017,99:249.
[7] NAIK B,TUNG L W,ZHAO S. Weather impacts on single-vehicle truck crash injury severity[J]. Journal of Safety Research,2016,58:57.
[8] OSMAN M,PALETI R,MISHRA S,etal. Analysis of injury severity of large truck crashes in work zones[J]. Accident Analysis & Prevention,2016,97:261.
[9] OH C,OH J S,RITCHIE S G,etal. Real-time estimation of freeway accident likelihood [C/CD]//80th Annual Meeting of the Transportation Research Board. Washington D C: Transportation Research Board, 2001.
[10] ABDEL-ATY M,PANDE A. Classification of real-time traffic speed patterns to predict crashes on freeways[C/CD]//83rd Annual Meeting of the Transportation Research Board. Washington D C:Transportation Research Board, 2004.
[11] PANDE A,ABDEL-ATY M. Comprehensive analysis of relationship between real-time traffic surveillance data and rear-end crashes on freeways [J]. Transportation Research Record:Journal of the Transportation Research Board, 2006, 1953(1):31.
[12] PANDE A,ABDEL-ATY M. Assessment of freeway traffic parameters leading to lane-change related collisions [J]. Accident Analysis & Prevention, 2006, 38(5): 936.
[13] YU R,ABDEL-ATY M. Utilizing support vector machine in real-time crash risk evaluation[J]. Accident Analysis & Prevention,2013,51(2):252.
[14] 孫劍,孫杰. 城市快速路實(shí)時(shí)交通流運(yùn)行安全主動(dòng)風(fēng)險(xiǎn)評(píng)估[J].同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,42(6):873.
SUN Jian,SUN Jie. Proactive assessment of real-time traffic flow accident risk on urban expressway[J]. Journal of Tongji University: Natural Science,2014, 42(6):873.
[15] ABDEL-ATY M, UDDIN N, PANDE A,etal. Predicting freeway crashes based on loop detector data using matched case-control logistic regression [J]. Transportation Research Record: Journal of the Transportation Research Board, 2004, 1897(1): 88.
[16] ABDEL-ATY M, UDDIN N, PANDE A. Split models for predicting multivehicle crashes during high-speed and low-speed operating conditions on freeways[J]. Transportation Research Record: Journal of the Transportation Research Board, 2005,1908(1): 51.
[17] 徐鋮鋮,劉攀,王煒,等. 惡劣天氣下高速公路實(shí)時(shí)事故風(fēng)險(xiǎn)預(yù)測(cè)模型[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2013,43(1):68.
XU Chengcheng,LIU Pan,WANG Wei,etal. Real time crash risk prediction model on freeways under nasty weather conditions[J]. Journal of Jilin University(Engineering and Technology Edition), 2013,43(1):68.
[18] VAPNIK V N. 統(tǒng)計(jì)學(xué)習(xí)理論[M]. 許建華,張學(xué)工,譯.北京:電子工業(yè)出版社,2004.
VAPNIK V N. Statistical learning theory [M]. Translated by XU Jianhua, ZHANG Xuegong. Beijing: Publishing House of Electronics Industry,2004.
[19] CHAWLA N V,BOWYER K W,HALL L O,etal. Smote:synthetic minority over-sampling technique[J]. Journal of Artificial Intelligence Research, 2011,16(1): 321.
[20] 付陽(yáng),李昆侖. 支持向量機(jī)模型參數(shù)選擇方法綜述[J]. 電腦知識(shí)與技術(shù),2010,6(28):8080.
FU Yang,LI Kunlun. A survey of model parameters selection method for support vector machines [J]. Computer Knowledge and Technology,2010,6(28):8080.