国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

城市道路交通安全影響因素分析

2018-07-13 21:19:42王丹胡堯吳楠商明菊
貴州大學(xué)學(xué)報(bào)(自然科學(xué)版) 2018年2期
關(guān)鍵詞:共線性交通事故關(guān)聯(lián)

王丹 胡堯 吳楠 商明菊

摘 要:隨著車輛日益增多,交通事故頻繁發(fā)生,找出影響交通事故發(fā)生的真正因素是目前交通管理部門要解決的主要問(wèn)題?;谫F陽(yáng)市交通管理部門開(kāi)放的交通事故數(shù)據(jù),采用多項(xiàng)Logistic回歸模型和Apriori算法,發(fā)現(xiàn)多項(xiàng)Logistic回歸模型能很好地?cái)M合數(shù)據(jù)且能找出影響城市交通安全的顯著性因素,Apriori算法通過(guò)識(shí)別或發(fā)現(xiàn)交通事故數(shù)據(jù)中所有的頻繁項(xiàng)集,能夠挖掘出人、車、道路、天氣因素之間的關(guān)聯(lián)對(duì)交通事故類型的影響,數(shù)據(jù)分析結(jié)果可為交通管理相關(guān)部門提供參考。

關(guān)鍵詞:交通安全;多項(xiàng)Logistic回歸模型;Apriori算法

中圖分類號(hào):O212

文獻(xiàn)標(biāo)識(shí)碼: A

道路交通安全問(wèn)題是世界上所有國(guó)家面臨的難題[1]。我國(guó)的交通安全形勢(shì)與其它國(guó)家相比更為嚴(yán)重,尤其是近年來(lái)越來(lái)越多的汽車走進(jìn)千家萬(wàn)戶,交通事故頻繁發(fā)生,

對(duì)社會(huì)造成了嚴(yán)重危害。由于每次交通事故的發(fā)生具有諸多誘因,在較長(zhǎng)時(shí)間內(nèi)一個(gè)地區(qū)發(fā)生的交通事故又具有一定的規(guī)律性,因此找出影響道路交通事故發(fā)生的因素是解決交通安全問(wèn)題的關(guān)鍵途徑。

一般認(rèn)為交通事故的發(fā)生是由人、車、道路、環(huán)境等要素組成的系統(tǒng)失去平衡造成的[2]。國(guó)內(nèi)外關(guān)于道路交通事故成因分析的理論主要經(jīng)歷了三個(gè)階段[3]即單因素理論、多因素理論和系統(tǒng)致因理論。單因素理論顧名思義即將交通事故的發(fā)生歸結(jié)為某一因素,主要偏重于人;多因素理論主要從人、車、路三因素分析;系統(tǒng)致因理論在20世紀(jì)80年代被提出,主要對(duì)多個(gè)因素及其關(guān)系進(jìn)行分析研究。近年來(lái)對(duì)交通事故成因的研究方法主要有故障樹(shù)[4]、貝葉斯網(wǎng)絡(luò)[5]等。關(guān)于交通事故成因的研究更多的是從管理的角度提出對(duì)事故的預(yù)防對(duì)策,而針對(duì)交通事故內(nèi)在致因的相關(guān)性分析則研究較少,對(duì)影響事故發(fā)生的因素與事故類型之間的聯(lián)系也沒(méi)有得到充分挖掘。

本文根據(jù)交通事故數(shù)據(jù)中9種事故類型特征建立多項(xiàng)Logistic回歸模型及采用關(guān)聯(lián)規(guī)則中Apriori算法對(duì)道路交通安全影響因素進(jìn)行研究。首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,對(duì)多種事故因素和交通事故類型建立Logistic回歸模型,探索交通事故內(nèi)在致因相關(guān)性,找到對(duì)交通事故類型有顯著性影響的因子;其次,采用關(guān)聯(lián)規(guī)則中Apriori算法挖掘人、車、道路、環(huán)境多個(gè)因素之間的關(guān)聯(lián)對(duì)交通事故類型的影響;最后,得出分析結(jié)論可為交通相關(guān)部門提供參考。

1 數(shù)據(jù)預(yù)處理

研究數(shù)據(jù)來(lái)源于2015年貴陽(yáng)市56651條交通事故數(shù)據(jù)及歷史天氣數(shù)據(jù),包含肇事類型、肇事者性別、年齡、駕齡、車輛歸屬地、違法歷史及肇事時(shí)間等多個(gè)屬性。首先對(duì)數(shù)據(jù)進(jìn)行缺失值分析,如圖1所示,由左側(cè)缺失比例可知駕齡、駕校及車輛品牌缺失較多,在15%以上,其他變量缺失較少。對(duì)于缺失數(shù)據(jù)簡(jiǎn)單采用眾數(shù)方法進(jìn)行填補(bǔ),可降低標(biāo)準(zhǔn)誤差,由于數(shù)據(jù)量較大,填補(bǔ)數(shù)據(jù)不會(huì)對(duì)分析結(jié)果造成較大影響。

對(duì)填補(bǔ)后的數(shù)據(jù)進(jìn)行整理,其中時(shí)間段劃分標(biāo)準(zhǔn)見(jiàn)表1。圖2展示了貴陽(yáng)市10個(gè)區(qū)域分別發(fā)生9種交通事故類型的數(shù)目,可知事故類型1(追尾)和事故類型7(未按規(guī)定讓行)發(fā)生次數(shù)較多,從上到下曲線分別表示云巖區(qū)、南明區(qū)和烏當(dāng)區(qū)(接近重合)、花溪區(qū)、白云區(qū),可知這幾個(gè)區(qū)發(fā)生交通事故次數(shù)較多,其他區(qū)域如開(kāi)陽(yáng)縣、修文縣等發(fā)生交通事故次數(shù)較少。

2 多項(xiàng)Logistic回歸模型

2.1 模型介紹

多項(xiàng)指分類數(shù)大于等于3的分類因變量,本研究中數(shù)據(jù)交通事故類型共9類,即因變量有9個(gè)取值且無(wú)序,而一般的線性回歸分析無(wú)法準(zhǔn)確地刻畫(huà)變量之間的因果關(guān)系,因此可對(duì)交通事故類型建立多項(xiàng)Logistic回歸模型[6-8]。

2.3 模型結(jié)果

在對(duì)9種事故類型建立多項(xiàng)Logistic回歸模型之前,首先對(duì)自變量間的多重共線性進(jìn)行檢驗(yàn),本文采用方差膨脹因子(VIF)[10]和條件索引來(lái)綜合判別多重共線性,對(duì)共線性較強(qiáng)的一些變量只保留一個(gè),如對(duì)天氣情況中風(fēng)力風(fēng)向等屬性只保留是否下雨。篩選后的變量及共線性診斷結(jié)果見(jiàn)表2。

一般認(rèn)為,當(dāng)VIF>10時(shí),認(rèn)為變量間存在較嚴(yán)重的共線性,由表2可知11個(gè)變量的方差膨脹因子均在1左右,共線性較弱。此外,條件索引在10~30之間認(rèn)為具有弱共線性,在30~100之間認(rèn)為具有中等共線性,大于100認(rèn)為具有嚴(yán)重共線性。由表2知11個(gè)變量的條件索引均小于30。綜合來(lái)看,選取的11個(gè)解釋變量均通過(guò)多重共線性檢驗(yàn),可對(duì)其進(jìn)行建模。

對(duì)肇事者事故類型建立多項(xiàng)Logistic回歸模型,顯著性0.001<0.05,模型通過(guò)檢驗(yàn),皮爾遜卡方檢驗(yàn)的擬合優(yōu)度為0.865,接近于1,說(shuō)明模型對(duì)原始數(shù)據(jù)的擬合通過(guò)檢驗(yàn)且擬合效果較好。

由表3似然比檢驗(yàn)顯著性知,肇事者年齡、性別、肇事地點(diǎn)、車輛顏色、車輛品牌、肇事者駕齡,這些變量對(duì)模型構(gòu)成均有顯著性貢獻(xiàn)。

通過(guò)對(duì)56651起交通事故數(shù)據(jù)建立多項(xiàng)Logistic回歸模型,得到道路交通安全影響因素(11種)與事故類型(9種)的回歸結(jié)果如表4所示,這里僅列舉事故類型1(追尾)和事故類型2(逆行)的部分分析結(jié)果。其中B為模型變量的回歸系數(shù),正負(fù)分別表示自變量對(duì)交通事故類型有正影響與負(fù)影響,Wald值是對(duì)偏回歸系數(shù)進(jìn)行Wald檢驗(yàn)的結(jié)果,Exp(B)為每個(gè)自變量的優(yōu)勢(shì)比。

由事故類型1的分析結(jié)果可看出對(duì)于駕駛員因素,男性發(fā)生交通事故的優(yōu)勢(shì)比大于1,表明男性比女性更易發(fā)生追尾事故。對(duì)于道路因素,開(kāi)陽(yáng)的優(yōu)勢(shì)比最大為5.383,可知危險(xiǎn)程度相對(duì)較高,與開(kāi)陽(yáng)地型地貌變化多樣,地型起伏大,易發(fā)生追尾事故有關(guān)。

.

由事故類型2,對(duì)于駕校因素,駕駛員所報(bào)考駕校如鑫鑫駕校等,對(duì)事故率有正影響,優(yōu)勢(shì)比為1.334。對(duì)于車輛因素車輛顏色為灰色的優(yōu)勢(shì)比較大,為3527,可能與灰色車辨識(shí)度較低有關(guān)。別克牌和長(zhǎng)安牌汽車對(duì)事故率有較大的正影響,優(yōu)勢(shì)比分別是4.17、4.135,可知危險(xiǎn)度相對(duì)較高,該類品牌車輛車型繁多,危險(xiǎn)性是否與車輛品牌安全性能有關(guān),有待進(jìn)一步考證;對(duì)于道路因素,修文的優(yōu)勢(shì)比最大為15.493,可能與修文奇特的地勢(shì)及駕駛員安全意識(shí)薄弱有關(guān)。

3 關(guān)聯(lián)規(guī)則

關(guān)聯(lián)規(guī)則挖掘[11]是數(shù)據(jù)挖掘中最為活躍的研究方向之一,其本質(zhì)是挖掘大量數(shù)據(jù)中項(xiàng)集之間的關(guān)聯(lián),由Agrawal[12]等人于1993年首次提出。關(guān)聯(lián)規(guī)則算法不需要對(duì)原始數(shù)據(jù)進(jìn)行訓(xùn)練,是一種無(wú)監(jiān)督的機(jī)器學(xué)習(xí)方法,可以挖掘出數(shù)據(jù)中的潛在關(guān)系。設(shè)A是一項(xiàng)集,事務(wù)T包含A當(dāng)且僅當(dāng)AT,則關(guān)聯(lián)規(guī)則是形如{A}{B}的蘊(yùn)涵式,其中AI和BI分別稱為這條規(guī)則的左手邊項(xiàng)集(Left-hand-side, LHS)和右手邊項(xiàng)集(Right-hand-side, RHS)且A∩B=。理解為“在相同的事務(wù)中,當(dāng)A中的事件發(fā)生時(shí),B中的事件也發(fā)生”。如對(duì)事故類型1關(guān)聯(lián)結(jié)果中的規(guī)則:{東北風(fēng)/東北風(fēng),男,起亞牌,青年,時(shí)間段2} =>{事故類型1},花括號(hào)中的Item集合即為項(xiàng)集,箭頭左邊為左手邊項(xiàng)集,箭頭右邊為右手邊項(xiàng)集且兩者不能有交集。

3.2 關(guān)聯(lián)結(jié)果分析

采用R語(yǔ)言中arules包以事故類型1和事故類型7為例進(jìn)行關(guān)聯(lián),其他事故類型類似。

綜合分析人、車、道路、天氣因素對(duì)交通事故的影響,根據(jù)關(guān)聯(lián)規(guī)則挖掘數(shù)據(jù)的結(jié)果,通過(guò)提升度進(jìn)行排序,在提升度最高的規(guī)則中分析可行部分。

對(duì)事故類型1挖掘出來(lái)的關(guān)聯(lián)規(guī)則以提升度lift排名前5條進(jìn)行展示,見(jiàn)表5。如第二條規(guī)則可解讀為以72%以上的置信度可確定無(wú)違法歷史的男司機(jī)在開(kāi)陽(yáng)縣發(fā)生追尾事故的情況約是其他情況的2.5倍,其他規(guī)則類似可進(jìn)行分析。

圖3為事故類型1的關(guān)聯(lián)規(guī)則特征組成圖,顏色越深表明提升度越高,關(guān)聯(lián)性越強(qiáng),可知開(kāi)陽(yáng)縣、無(wú)違法歷史、長(zhǎng)城牌、青年等特征與事故類型1關(guān)聯(lián)較強(qiáng)。

圖4為關(guān)聯(lián)規(guī)則的平行坐標(biāo)圖展示,顏色越深代表提升度越高,由圖可知具有3個(gè)及以上因素若造成交通事故則發(fā)生事故類型1的概率較大,如倒數(shù)第二條解讀為未參與駕校培訓(xùn)具有0~2年駕駛經(jīng)驗(yàn)的非貴A新手男司機(jī)在時(shí)間段2(7:00~9:00),若發(fā)生交通事故則發(fā)生“追尾”事故的情況概率較大。

對(duì)事故類型7挖掘出來(lái)的關(guān)聯(lián)規(guī)則以提升度lift排名前5條進(jìn)行展示,見(jiàn)表6。如第二條規(guī)則可解讀為以75%的置信度可確定十一培駕校的男司機(jī)駕駛長(zhǎng)安牌汽車在時(shí)間段4(12:00~14:00)有雨的天氣下發(fā)生事故類型7(未按規(guī)定讓行)約是其他情況下的2.85倍。

圖5展示了事故類型7關(guān)聯(lián)規(guī)則的分組圖,圓圈尺寸的大小表示支持度,圓圈的顏色深淺表示提升度。從圖中可清楚的看出時(shí)間、風(fēng)力、長(zhǎng)安牌汽車、非貴A等屬性與事故類型7關(guān)聯(lián)性較強(qiáng)。

4 結(jié)論

論文通過(guò)對(duì)貴陽(yáng)市交通事故數(shù)據(jù)建立多項(xiàng)Logistic回歸模型,擬合效果較好,分析了單因素對(duì)交通事故類型的影響,結(jié)合關(guān)聯(lián)規(guī)則中Apriori算法挖掘了多個(gè)因素的關(guān)聯(lián)作用對(duì)事故類型的影響,全面分析了影響道路交通安全的因素,可為交通相關(guān)部門提供管理依據(jù),部分分析結(jié)論如下:

(1)男性青年駕駛員發(fā)生追尾的事故率較高;女性若發(fā)生交通事故,依法負(fù)全責(zé)的情形較多;駕齡在5年以上、無(wú)違法歷史的中年駕駛員因逆行發(fā)生的事故率較高。

(2)開(kāi)陽(yáng)縣由于追尾發(fā)生交通事故的概率較高,修文縣由于逆行發(fā)生的交通事故概率較高。

(3)青年男司機(jī)、無(wú)違法歷史、開(kāi)陽(yáng)縣、云巖區(qū)與“追尾”事故關(guān)聯(lián)度較高;十一培駕校、風(fēng)力風(fēng)向、時(shí)間段、長(zhǎng)安牌汽車、中年司機(jī)與“未按規(guī)定讓行”的關(guān)聯(lián)度較高。

(4)車輛顏色對(duì)交通事故發(fā)生也有顯著性影響,如逆行事故中灰色車的事故率較高,推測(cè)和人的視覺(jué)有關(guān),可進(jìn)一步分析研究。

參考文獻(xiàn):

[1]劉勇. 基于貝葉斯網(wǎng)的道路交通事故分析[D].長(zhǎng)沙:長(zhǎng)沙理工大學(xué),2009.

[2]洪國(guó),周立,魯光泉.中國(guó)道路交通安全現(xiàn)狀、成因及其對(duì)策[J].中國(guó)安全科學(xué)學(xué)報(bào),2004,14(8):34-38.

[3]孫平,宋瑞,王海霞.我國(guó)道路交通事故成因分析及預(yù)防對(duì)策[J].安全與環(huán)境工程, 2007,14(2):97-100.

[4]胡藝馨,劉唐志.長(zhǎng)大下坡傷亡事故致因故障樹(shù)分析[J].科技通報(bào),2017,33(06):238-241.

[5]Mbakwe A C, Saka A A, Choi K, et al. Alternative method of highway traffic safety analysis for developing countries using Delphi technique and Bayesian network[J].Accident Analysis & Prevention,2016,93(1): 135-146.

[6]王世通,楊艷紅.基于多項(xiàng)Logistic回歸的地鐵應(yīng)急疏散行為影響因素分析[J]. 城市軌道交通研究,2014,17(05):73-76+80.

[7]Geraghty D, OMahony M. Urban Noise Analysis Using Multinomial Logistic Regression[J]. Journal of Transportation Engineering,2016, 142(6): 04016020.

[8]劉亞洲.基于方差分析與Logistic回歸模型的公路交通事故率研究[J]. 公路交通技術(shù),2016(06):144-147.

[9]孟生旺.回歸模型[M].北京:中國(guó)人民大學(xué)出版社,2015.

[10]劉鋼,宋亞倩.基于有序Logistic回歸的水庫(kù)移民住房感知實(shí)證研究[J]. 長(zhǎng)江流域資源與環(huán)境,2017,26(04):519-529.

[11]Gupta M,Solanki V K, Singh V K. A Novel Framework to Use Association Rule Mining for classification of traffic accident severity[J]. Ingeniería solidaria, 2017, 13(21):37-44.

[12]Agrawal R,Imieliński T, Swami A. Mining association rules between sets of items in large databases[C]//Acm sigmod record. ACM, 1993, 22(2): 207-216.

[13]李淵韜,張 楠,劉 峰,等.基于信息論優(yōu)化的Apriori算法在交通事故分析中的應(yīng)用[J].信息系統(tǒng)工程,2016(10):80-84.

[14]Huh J H, Kim H B, Kim J. A Method of Modeling of Basic Big Data Analysis for Korean Medical Tourism: A Machine Learning Approach Using Apriori Algorithm [C]//International Conference on Information Science and Applications. Springer Singapore, 2017:784-790.

(責(zé)任編輯:曾 晶)

猜你喜歡
共線性交通事故關(guān)聯(lián)
“苦”的關(guān)聯(lián)
銀行不良貸款額影響因素分析
不同尋常的交通事故
預(yù)防交通事故
文氏圖在計(jì)量統(tǒng)計(jì)類課程教學(xué)中的應(yīng)用
——以多重共線性內(nèi)容為例
不完全多重共線性定義存在的問(wèn)題及其修正建議
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
一起高速交通事故院前急救工作實(shí)踐與探討
診斷復(fù)共線性的特征分析法及其在GEO定軌中的應(yīng)用
丰原市| 林州市| 滦南县| 如东县| 天津市| 昭苏县| 谢通门县| 富裕县| 敖汉旗| 梁平县| 陈巴尔虎旗| 城市| 江源县| 都昌县| 陇川县| 大同县| 探索| 尚义县| 射阳县| 汉川市| 营山县| 通城县| 枣庄市| 门头沟区| 延长县| 桃源县| 罗源县| 陵川县| 石河子市| 民和| 昌宁县| 吉安市| 冀州市| 孙吴县| 西畴县| 武冈市| 桐乡市| 太康县| 精河县| 昌平区| 红原县|