游錦明, 方守恩, 張?zhí)m芳, 折 欣
(同濟(jì)大學(xué) 道路與交通工程教育部重點(diǎn)實(shí)驗(yàn)室, 上海 201804)
隨著我國交通行業(yè)的快速發(fā)展,公眾在交通出行時(shí)對(duì)高速公路交通安全的要求越來越高,交通安全領(lǐng)域已由傳統(tǒng)的被動(dòng)安全改善向主動(dòng)安全風(fēng)險(xiǎn)防控發(fā)展.然而由于我國高速公路信息化發(fā)展遲滯,多數(shù)高速公路尚未完善配置密集的監(jiān)控檢測設(shè)備用以信息采集,使得調(diào)度管理人員無法對(duì)高速公路進(jìn)行全方位把控,部分高速公路路段處于監(jiān)控盲區(qū),從而導(dǎo)致該部分路段的實(shí)時(shí)交通運(yùn)行安全無法得到保障.與此同時(shí),我國高速公路信息化正處于高速發(fā)展階段,公安部、交通部等主管部門紛紛出臺(tái)相關(guān)規(guī)劃文件,在新型智能交通快速發(fā)展的背景下,提出了主動(dòng)風(fēng)險(xiǎn)防控的需求,各地高速公路交通管理部門也在同步進(jìn)行信息化建設(shè),逐漸加密完善監(jiān)控檢測、信息發(fā)布等設(shè)備布設(shè),提升高速公路交通安全服務(wù)水平.
為了實(shí)現(xiàn)全方位的高速公路實(shí)時(shí)事故風(fēng)險(xiǎn)研判,基于我國高速公路現(xiàn)狀信息化管理下的稀疏高清卡口交通流數(shù)據(jù),對(duì)實(shí)時(shí)事故風(fēng)險(xiǎn)研判模型進(jìn)行構(gòu)建,并開展模型的可移植性研究,從而為國內(nèi)高速公路相關(guān)交通安全管理部門在實(shí)時(shí)主動(dòng)交通安全風(fēng)險(xiǎn)分析方面提供借鑒.
在實(shí)時(shí)事故風(fēng)險(xiǎn)預(yù)測方面,國外專家開展了大量的研究,尤其以美國、歐洲、日本等發(fā)達(dá)國家為主,由于其高速公路信息化較早、信息化程度較高,許多專家學(xué)者基于其海量密集的高速公路運(yùn)營數(shù)據(jù),開展了廣泛的事故先兆研究工作.
早期高速公路交通流數(shù)據(jù)以線圈數(shù)據(jù)為主,專家學(xué)者通過采用不同的模型方法在交通流狀態(tài)參數(shù)與事故結(jié)果之間建立起因果關(guān)聯(lián),如Logistic模型[1-3]、神經(jīng)網(wǎng)絡(luò)模型[4-6]、貝葉斯方法[7-8]等.2012年隨著美國高速公路上布設(shè)了新型的自動(dòng)車輛識(shí)別系統(tǒng)(AVI),使得旅行速度的實(shí)時(shí)測度成為了可能,該指標(biāo)能夠反映車輛在某個(gè)路段的平均行駛速度.Abdel-Aty等[7]通過結(jié)合該系統(tǒng)所采集的數(shù)據(jù)和路段上的事故數(shù)據(jù)進(jìn)行建模,其Logistic回歸模型能夠鑒別69%的事故伴隨著42.01%的誤報(bào)率,同時(shí)提出了一種基于貝葉斯改進(jìn)方法的Logistic回歸模型,模型能夠提升3.5%的事故預(yù)測精度,但是誤報(bào)率也提升為45.83%.由于大量的事故誤報(bào)會(huì)影響駕駛?cè)藢?duì)管控評(píng)價(jià)系統(tǒng)的認(rèn)同度從而降低管控系統(tǒng)的有效性,因此模型還有待繼續(xù)改進(jìn).
2013年Yu等[9]采用分類回歸樹和貝葉斯Logistic回歸對(duì)指標(biāo)選取后,構(gòu)建了支持向量機(jī)模型,采用受試者曲線下面積(AUC)對(duì)不同核函數(shù)的支持向量機(jī)模型進(jìn)行評(píng)判,AUC值均大于0.7,能夠較優(yōu)地對(duì)事故風(fēng)險(xiǎn)進(jìn)行預(yù)測.同年Yu等[10]采用隨機(jī)效應(yīng)Logistic回歸模型分析工作日和周末事故數(shù)據(jù)差異、道路線形數(shù)據(jù)和遠(yuǎn)程微波交通檢測器采集的交通流數(shù)據(jù)(RTMS),結(jié)果發(fā)現(xiàn)工作日事故更易發(fā)生在擁堵區(qū)域而周末事故往往發(fā)生在自由流條件下.2013年Ahmed等[11]采用隨機(jī)梯度推理機(jī)器學(xué)習(xí)方法,結(jié)合RTMS和AVI的交通流數(shù)據(jù)對(duì)事故風(fēng)險(xiǎn)進(jìn)行建模,模型最終達(dá)到了89%的事故預(yù)測精度伴隨著6.5%的誤報(bào)率.Shi等[12]通過對(duì)未處理的AVI原始數(shù)據(jù)對(duì)事故風(fēng)險(xiǎn)進(jìn)行研究,采用多層隨機(jī)參數(shù)模型和負(fù)二項(xiàng)模型進(jìn)行建模來提升模型對(duì)于復(fù)雜數(shù)據(jù)和樣本間的非勻質(zhì)性的適應(yīng)能力,研究表明低速、高速度離散性和高流量會(huì)顯著提升事故風(fēng)險(xiǎn).這些研究均表明了采用高分辨率的交通流參數(shù)對(duì)事故預(yù)測的有效性.
國內(nèi)由于高速公路信息化程度較低,在實(shí)時(shí)事故風(fēng)險(xiǎn)預(yù)測方面的研究較少.哈爾濱工業(yè)大學(xué)趙新勇[13]結(jié)合支持向量機(jī)和決策樹提出了基于交通流參數(shù)的事故多發(fā)點(diǎn)交通安全事件風(fēng)險(xiǎn)研判模型,選取高速公路追尾事故作為分析的目標(biāo)交通安全事件,采用了支持向量機(jī)算法建立了追尾事故風(fēng)險(xiǎn)預(yù)測模型.孫劍等[14]基于上海市快速路上的線圈交通流數(shù)據(jù)和事故數(shù)據(jù),采用貝葉斯網(wǎng)絡(luò)(BN)對(duì)事故風(fēng)險(xiǎn)進(jìn)行建模,基于高斯混合模型和最大期望算法對(duì)貝葉斯網(wǎng)絡(luò)模型參數(shù)進(jìn)行估計(jì),分別對(duì)事故點(diǎn)前后2組檢測器和4個(gè)時(shí)間段的8組交通流數(shù)據(jù)進(jìn)行建模,結(jié)果表明使用事故點(diǎn)上下游各一檢測器、基于事故前5~10 min內(nèi)的交通流數(shù)據(jù)的模型效果最優(yōu),其事故預(yù)測精度達(dá)到了76.94%.次年賈豐源等[15]對(duì)模型進(jìn)行了改進(jìn),采用隨機(jī)森林對(duì)變量進(jìn)行篩選,最終篩選變量后建立的貝葉斯網(wǎng)絡(luò)模型預(yù)測效果更佳,其事故預(yù)測準(zhǔn)確率達(dá)到了82.78%.
研究表明事故風(fēng)險(xiǎn)預(yù)測模型經(jīng)過參數(shù)重訓(xùn)練后能夠應(yīng)用于其他高速公路實(shí)時(shí)交通安全評(píng)價(jià)[16],但是由于國內(nèi)外駕駛?cè)笋{駛習(xí)慣的差異性和不同區(qū)域的交通流特性不同,直接使用現(xiàn)有的模型實(shí)際上并不可取,模型的可移植性分析顯得尤為重要.Sun等[17-18]基于上海市快速路延安高架和南北高架的交通流檢測器數(shù)據(jù),翔實(shí)地研究了不同時(shí)間段、不同懲罰因子等模型參數(shù)對(duì)于實(shí)時(shí)事故風(fēng)險(xiǎn)預(yù)測模型的影響,并進(jìn)行了相互的可移植性研究,驗(yàn)證了模型的有效性和普適性.然而該部分研究依然基于間距為300~500 m的檢測器,上下游共4個(gè)檢測器,與國外研究保持一致.而國內(nèi)高速公路上檢測設(shè)備較為稀疏,不能支撐模型研判,這使得高密度的模型無法在這種條件下進(jìn)行應(yīng)用驗(yàn)證.另一方面,許多研究指出速度離散性對(duì)于事故風(fēng)險(xiǎn)有著顯著影響,但是由于現(xiàn)有交通流數(shù)據(jù)多數(shù)來自于集計(jì)的線圈數(shù)據(jù),速度離散性指標(biāo)并沒有得到充分研究[19].因此開展基于稀疏檢測器的高速公路實(shí)時(shí)事故風(fēng)險(xiǎn)研判研究,探索將已信息化高速公路路段的研判模型應(yīng)用至相鄰路段,并進(jìn)行模型可移植性研究,為新信息化路段的實(shí)時(shí)交通安全風(fēng)險(xiǎn)防控提供決策依據(jù).
建模技術(shù)路線如圖1所示.
圖1 建模技術(shù)路線
數(shù)據(jù)來源于G15沈海高速南通段,該段全長約100 km,設(shè)計(jì)速度120 km·h-1,雙向6車道,數(shù)據(jù)主要為事故數(shù)據(jù)和高清卡口過車數(shù)據(jù)兩大類.
采用的事故數(shù)據(jù)為2016年1月1日至2016年10月31日期間G15沈海高速公路南通段所登記錄入的事故數(shù)據(jù).公安部交通事故登記錄入了事故發(fā)生時(shí)間、事故地點(diǎn)、事故類型、事故形態(tài)、死傷人數(shù)等信息,記錄信息較全面,部分事故信息在記錄時(shí)缺少方向信息,因此該部分事故數(shù)據(jù)無法直接定位到高速公路路段上進(jìn)行后續(xù)分析應(yīng)用,予以剔除.整體而言,共記錄事故數(shù)據(jù)5 924起,按照事故形態(tài)劃分如圖2.
圖2 G15沈海高速南通段事故形態(tài)統(tǒng)計(jì)
從圖中可以發(fā)現(xiàn),車輛間事故(含碰撞運(yùn)動(dòng)車輛、其他車輛間事故)占了總體約88%,而碰撞運(yùn)動(dòng)車輛占了約86%,說明該路段上大部分事故均為動(dòng)態(tài)交通中的追尾碰撞事故,而對(duì)于單車事故而言由于偶然因素較多,因此著重研究車輛間事故的實(shí)時(shí)風(fēng)險(xiǎn)研判.
采用的高清卡口交通流數(shù)據(jù)為2016年1月1日至2016年10月31日期間G15沈海高速公路南通段上公安部交通管理部門所布設(shè)的高清卡口系統(tǒng)所采集的過車數(shù)據(jù).高清卡口過車數(shù)據(jù)相對(duì)于傳統(tǒng)的線圈數(shù)據(jù)而言,能夠更精準(zhǔn)地采集單獨(dú)車輛通過時(shí)的詳細(xì)數(shù)據(jù),可以準(zhǔn)確分辨車輛所處車道信息、車速信息等,為進(jìn)行速度離散性于交通安全的影響研究提供了數(shù)據(jù)支撐.該路段共布設(shè)5套高清卡口系統(tǒng),其中一套D122為單行卡口,只能記錄單側(cè)通行方向車輛過車信息.其布設(shè)點(diǎn)位信息如圖3.
圖3 G15沈海高速南通段高清卡口布設(shè)點(diǎn)位情況
由圖中可見,全長約100 km的高速公路路段只配置了5套高清卡口設(shè)備,2個(gè)高清卡口最近的距離為5 km,最遠(yuǎn)的距離長達(dá)33 km,與國外布設(shè)的線圈布設(shè)密度(0.5 mile,約800 m)相比,相差甚遠(yuǎn).目前在既有研究中,已經(jīng)證明了基于單檢測器的交通流數(shù)據(jù)用以實(shí)時(shí)事故風(fēng)險(xiǎn)研判的可靠性和有效性[20],因此,基于單個(gè)高清卡口的交通流數(shù)據(jù)對(duì)同路段的事故進(jìn)行研判研究.以高速公路出入口和立交樞紐作為節(jié)點(diǎn),將該路段劃分為8個(gè)子路段,則共有4個(gè)子路段上布設(shè)了高清卡口,因此最終該4個(gè)路段上發(fā)生的事故能夠通過時(shí)間和空間配對(duì)方法匹配到相應(yīng)的交通流數(shù)據(jù).如若事故發(fā)生在丁堰收費(fèi)站和S28互通立交之間,則匹配到子路段⑥上布設(shè)的高清卡口設(shè)備B198,根據(jù)事故發(fā)生時(shí)間確定其對(duì)應(yīng)時(shí)間前5至10 min的高清卡口過車數(shù)據(jù)作為事故發(fā)生前的交通流狀態(tài).然后將該時(shí)間片段內(nèi)的過車數(shù)據(jù)針對(duì)其時(shí)空分布抽取對(duì)應(yīng)的各車道的時(shí)間分布參數(shù)(Qn、EQn、DQn)、速度分布參數(shù)(EVn、DVn、RVn)等共18個(gè)指標(biāo),其中Qn、EQn、DQn分別代表第n車道5~10 min內(nèi)的流量、車輛時(shí)間分布均值,車輛時(shí)間分布離散度,EVn、DVn、RVn分別代表第n車道5~10 min內(nèi)的速度均值、速度方差、速度極差.
采用對(duì)照組和案例組4∶1的比例對(duì)駕駛?cè)?、車輛特性及道路環(huán)境等因素進(jìn)行控制變量研究.對(duì)照組根據(jù)事故發(fā)生的時(shí)間進(jìn)行選定,分別選取其前14 d相應(yīng)時(shí)間、前7 d相應(yīng)時(shí)間、后7 d相應(yīng)時(shí)間、后14 d相應(yīng)時(shí)間的交通流數(shù)據(jù)作為對(duì)照組,未能匹配到高清卡口過車數(shù)據(jù)的樣本及匹配到異常值過車數(shù)據(jù)的樣本在最終樣本確定時(shí)予以剔除,最終共有3個(gè)路段上的事故數(shù)據(jù)和過車數(shù)據(jù)完成配對(duì),如表1.
表1 配對(duì)后有效樣本信息
確定有效樣本后,將根據(jù)各子路段的樣本進(jìn)行分別建模,從而為后續(xù)的可移植性研究作好鋪墊.
支持向量機(jī)(SVMs)作為現(xiàn)階段最為流行的監(jiān)督式機(jī)器學(xué)習(xí)算法之一,被廣泛應(yīng)用于文本分類、圖像識(shí)別、語音識(shí)別等領(lǐng)域,在分類問題、回歸問題上均有著良好的表現(xiàn).由于傳統(tǒng)的廣義線性模型假設(shè)自變量與因變量之間有著顯著的線性關(guān)系,而當(dāng)自變量表現(xiàn)出很強(qiáng)的非線性特征時(shí),那么采用廣義線性模型去對(duì)參數(shù)進(jìn)行估計(jì)時(shí)便會(huì)產(chǎn)生顯著的偏差[21],而支持向量機(jī)在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì),因此基于當(dāng)前樣本的小樣本特點(diǎn),選取支持向量機(jī)C-SVC模型作為實(shí)時(shí)事故風(fēng)險(xiǎn)研判的模型手段.
在機(jī)器學(xué)習(xí)領(lǐng)域,樣本變量的選取決定了機(jī)器學(xué)習(xí)的效率.而隨機(jī)森林可以以自然的形式對(duì)分類回歸問題中的變量進(jìn)行排序從而篩選出影響結(jié)果的重要變量,因此為了構(gòu)建高效的機(jī)器學(xué)習(xí)模型,提升模型計(jì)算效率和避免過擬合現(xiàn)象,選用隨機(jī)森林進(jìn)行參數(shù)篩選.針對(duì)3個(gè)子路段構(gòu)建的樣本分別篩選關(guān)鍵參數(shù),用以后續(xù)的支持向量機(jī)建模.各子路段參數(shù)篩選后的參數(shù)概述信息如表2所示.
研究經(jīng)驗(yàn)表明,采用徑向基核函數(shù)作為C-SVC模型高維映射變換函數(shù)的分類預(yù)測模型的分類效果普遍優(yōu)于基于多項(xiàng)式、Sigmoid核函數(shù)的C-SVC模型,因此采用徑向基核函數(shù)作為樣本高維映射核函數(shù).在C-SVC模型的構(gòu)建時(shí),引入了常數(shù)C作為懲罰系數(shù)控制損失的大小.模型求解中C可作為調(diào)節(jié)參數(shù),用于影響訓(xùn)練模型的分類性能.此外,徑向基核函數(shù)中γ參數(shù)也是模型訓(xùn)練前需輸入的常數(shù),該參數(shù)的數(shù)值也會(huì)明顯影響模型的分類性能.所以應(yīng)用SVM方法解決分類問題還需解決SVM模型參數(shù)及核函數(shù)參數(shù)的尋優(yōu)問題,得到分類效果最佳的一組C、γ參數(shù).目前在核函數(shù)參數(shù)選取方面,機(jī)器學(xué)習(xí)領(lǐng)域尚未有統(tǒng)一規(guī)則,往往根據(jù)歷史經(jīng)驗(yàn),給定一定的參數(shù)范圍空間C∈[20,216]、γ∈[2-16,20],按照梯度,通過編程枚舉的方式對(duì)不同參數(shù)組合下的模型預(yù)測效果進(jìn)行對(duì)比,結(jié)合十重交叉驗(yàn)證法得出最優(yōu)的參數(shù)對(duì)(C,γ)并建立對(duì)應(yīng)的SVM分類器.將各路段對(duì)應(yīng)的樣本按照訓(xùn)練集與測試集的比例為70%、30%的比例分配,以訓(xùn)練集訓(xùn)練模型,最后采用測試集的預(yù)測精度(包含事故預(yù)測精度和總體預(yù)測精度,其中事故預(yù)測精度指在所有事故樣本中成功被預(yù)測的事故樣本的比例,總體預(yù)測精度指所有樣本成功被預(yù)測的樣本比例)和AUC作為支持向量機(jī)分類器的分類性能評(píng)價(jià)指標(biāo).3個(gè)子路段對(duì)應(yīng)的支持向量機(jī)分類器相關(guān)參數(shù)和分類性能如表3.
表2隨機(jī)森林參數(shù)篩選后各子路段交通流參數(shù)統(tǒng)計(jì)
Tab.2Summarystatisticsofeachsub-segmentaftertrafficparameterfilteringbasedonRandomForest
卡口編號(hào)指標(biāo)均值方差1/4分位數(shù)3/4分位數(shù)A196EQ3 59.71×10-46.26×10-458.71×10-462.67×10-4DQ34.77×10-42.45×10-42.85×10-46.68×10-4EV360.39 20.78 50.88 78.44 DV325.88 10.11 16.94 36.10 RV3110.45 26.59 98.00 124.00 B198EQ358.56×10-410.41×10-458.85×10-462.36×10-4DQ34.52×10-42.64×10-42.57×10-46.60×10-4EV363.28 21.14 56.38 78.56 DV329.53 11.19 22.48 39.69 C200EQ148.13×10-430.55×10-431.00×10-457.00×10-4EQ360.17×10-47.46×10-458.69×10-463.59×10-4DQ34.36×10-42.59×10-42.36×10-46.43×10-4EV370.55 23.14 59.48 89.39 DV327.85 12.52 16.32 40.47
表3 各子路段支持向量機(jī)分類器參數(shù)及分類性能
從表中可以看出,從事故預(yù)測精度、總體精度、AUC各指標(biāo)角度對(duì)分類器性能進(jìn)行評(píng)價(jià),都可以發(fā)現(xiàn)構(gòu)建的3個(gè)基于高清卡口的支持向量機(jī)分類器分類性能較優(yōu),同比國內(nèi)外其他研究中構(gòu)建的模型而言,模型分類精度有著較高程度的提升,這也間接地表明了采用高分辨率的交通流數(shù)據(jù)用以實(shí)時(shí)事故風(fēng)險(xiǎn)研判的可靠性,同時(shí),也為模型的可移植性拓展研究提供了數(shù)據(jù)支撐.
為提升模型的普適性,需對(duì)模型的可移植性進(jìn)行分析,從而使模型能應(yīng)用于其他路段.由于實(shí)時(shí)事故風(fēng)險(xiǎn)研判需要大量的歷史事故數(shù)據(jù)和交通流數(shù)據(jù)進(jìn)行支持,而往往對(duì)于新納入信息化發(fā)展規(guī)劃中的路段而言缺乏了歷史的交通流數(shù)據(jù)用以進(jìn)行研判支撐,通過模型可移植性分析,可以將已信息化路段構(gòu)建的研判模型轉(zhuǎn)移至周邊道路進(jìn)行應(yīng)用,使得模型具備推廣應(yīng)用能力.考慮到國內(nèi)高速公路的逐步信息化進(jìn)程,對(duì)G15上已經(jīng)能夠進(jìn)行實(shí)時(shí)事故風(fēng)險(xiǎn)研判的3個(gè)路段進(jìn)行交互性的可移植性分析,即采用某個(gè)既定路段所構(gòu)建的模型對(duì)其他相鄰路段的交通流狀態(tài)進(jìn)行判別,從而達(dá)到實(shí)時(shí)事故風(fēng)險(xiǎn)研判的目的.例如,采用A196對(duì)應(yīng)路段構(gòu)建的支持向量機(jī)模型分別對(duì)B198路段的樣本和C200路段的樣本分別進(jìn)行預(yù)測,采用事故預(yù)測精度和總體預(yù)測精度對(duì)分類器性能進(jìn)行評(píng)價(jià).各段交互預(yù)測結(jié)果如表4.
表4各路段支持向量機(jī)模型可移植性分析
Tab.4TransferabilityanalysisoftheSVMsoneachsub-segment
模型預(yù)測精度/%A196樣本B198樣本C200樣本A19683.33,97.6271.43,93.9647.92,86.77B198100.00,97.8576.47,95.9672.92,93.12C200100.00,96.0692.86,96.07100.00,91.23
注:逗號(hào)前為事故預(yù)測精度,逗號(hào)后為總體預(yù)測精度.
從表中可以看出,3個(gè)支持向量機(jī)分類器的可移植性效果都較佳,尤其以C200處建立的支持向量機(jī)分類器而言,其建立的支持向量機(jī)分類器能夠較好地對(duì)A196路段處和B198路段處的事故樣本和總體樣本進(jìn)行預(yù)測,說明其分類器的參數(shù)集合更具有普適性,可移植性更優(yōu).
針對(duì)各分類器對(duì)各樣本集的錯(cuò)誤分類的樣本進(jìn)行時(shí)間、天氣分析可以發(fā)現(xiàn):
(1) 對(duì)于A196對(duì)應(yīng)路段的樣本而言,采用B198路段構(gòu)建的SVM錯(cuò)誤地將7起正常樣本劃分為事故樣本,其中3起樣本為雨天環(huán)境下的樣本;采用C200路段構(gòu)建的SVM錯(cuò)誤地將6起正常樣本劃分為事故樣本,其中3起為雨天環(huán)境下的樣本.總體而言,錯(cuò)分類樣本中有5起正常樣本是B198-SVM和C200-SVM的錯(cuò)誤劃分,這5起樣本中有3起樣本都發(fā)生在國定假日期間.
(2) 對(duì)于B198對(duì)應(yīng)路段的樣本而言,采用A196路段構(gòu)建的SVM錯(cuò)誤地將20起樣本錯(cuò)誤劃分,其中9起樣本為雨天環(huán)境下的樣本,12起為夜間發(fā)生的事故樣本;采用C200路段構(gòu)建的SVM錯(cuò)誤將9起樣本劃分,其中4起為雨天環(huán)境下的樣本,3起為夜間發(fā)生的事故樣本.總體而言,錯(cuò)分類樣本中有8起樣本是A196-SVM、B198-SVM和C200-SVM 3個(gè)分類器的錯(cuò)誤劃分,8起中有2起樣本發(fā)生在國定假日期間.
(3) 對(duì)于C200對(duì)應(yīng)路段的樣本而言,采用A196路段構(gòu)建的SVM錯(cuò)誤地將25起樣本錯(cuò)誤劃分,其中4起樣本為雨天環(huán)境下的樣本,5起為夜間發(fā)生的事故樣本;采用B198路段構(gòu)建的SVM錯(cuò)誤將16起樣本劃分,其中4起為雨雪天環(huán)境下的樣本,4起為夜間發(fā)生的事故樣本.總體而言,錯(cuò)分類樣本中有4起樣本是A196-SVM、B198-SVM和C200-SVM 3個(gè)分類器的錯(cuò)誤劃分.
總體而言,排除掉夜間發(fā)生的樣本和雨雪天氣環(huán)境下的分類錯(cuò)誤樣本,采用鄰近路段構(gòu)建的支持向量機(jī)分類器對(duì)當(dāng)前路段進(jìn)行研判能夠非常接近當(dāng)前路段所構(gòu)建的支持向量機(jī)分類器性能,由于各個(gè)支持向量機(jī)性能也未能夠?qū)崿F(xiàn)完美地將樣本進(jìn)行分類,這也間接地表明了通過對(duì)交通流狀態(tài)的判別能夠有效地研判出多數(shù)事故高危狀態(tài),但是部分事故的發(fā)生受突發(fā)因素影響更加直接,如駕駛?cè)朔中鸟{駛疲勞等,該部分事故就目前運(yùn)營采集數(shù)據(jù)而言暫無法獲取,因此未來跟隨著汽車技術(shù)發(fā)展能夠采集到更高粒度的實(shí)時(shí)車輛級(jí)數(shù)據(jù)后,可以開展全方面的事故與交通流及駕駛?cè)恕⒌缆翻h(huán)境等因素之間的內(nèi)在關(guān)聯(lián)研究.
從錯(cuò)誤分類樣本的發(fā)生的共性角度而言,夜間視野不佳、駕駛?cè)似诘纫蛩睾陀晏斓湍芤姸群吐访鏉窕纫蛩兀鶎?duì)交通安全有著較大的影響,但往往來說,這些因素對(duì)單車事故影響較大,在流量較低情況下易導(dǎo)致單車事故發(fā)生,而在交通流參數(shù)上表征不甚明顯,為了提高模型研判精度及可移植性效果,一方面由于當(dāng)前樣本量較小,后續(xù)可以隨著樣本量的積累提取到更多的樣本信息用以構(gòu)建支持向量;另一方面為了后續(xù)對(duì)實(shí)時(shí)事故風(fēng)險(xiǎn)研判進(jìn)行更加深入的研究時(shí),可以引入高分辨率的實(shí)時(shí)氣象數(shù)據(jù)進(jìn)行綜合分析,提高模型研判精度,并達(dá)到系統(tǒng)性的事故風(fēng)險(xiǎn)研判目的.同時(shí),隨著高速公路信息化的不斷開展,可以逐步開展基于相鄰路段、基于交叉路段的可移植性研究,提升模型的可移植性.除此之外,通過對(duì)可移植性的研究,可以考慮結(jié)合多個(gè)路段對(duì)應(yīng)的分類器模型對(duì)某個(gè)路段的交通流狀態(tài)進(jìn)行綜合研判,使得研判結(jié)果更加準(zhǔn)確有效.
通過采用G15沈海高速公路南通段上的高清卡口檢測的高分辨率過車數(shù)據(jù)對(duì)實(shí)時(shí)事故風(fēng)險(xiǎn)進(jìn)行研判,結(jié)合隨機(jī)森林進(jìn)行參數(shù)篩選,采用支持向量機(jī)對(duì)事故狀態(tài)進(jìn)行實(shí)時(shí)分類預(yù)測,結(jié)果表明基于高清卡口數(shù)據(jù)構(gòu)建的實(shí)時(shí)事故風(fēng)險(xiǎn)研判模型能夠較好地對(duì)事故狀態(tài)進(jìn)行預(yù)測,有著較高的事故預(yù)測精度,模型性能較優(yōu);基于對(duì)3個(gè)子路段分別構(gòu)建的支持向量機(jī)模型進(jìn)行可移植性分析,結(jié)果表明各支持向量機(jī)模型均具有一定的可移植性,通過對(duì)模型參數(shù)標(biāo)定后可直接將模型應(yīng)用至鄰近道路對(duì)其實(shí)時(shí)事故風(fēng)險(xiǎn)狀態(tài)進(jìn)行研判,并有著相對(duì)較高的預(yù)測精度.除去夜間、雨雪天氣環(huán)境下產(chǎn)生的錯(cuò)誤判別樣本后,模型可移植性效果更優(yōu).