魏 雯 杜雨萌 董傲然 秦 丹 朱 彤
(長(zhǎng)安大學(xué)運(yùn)輸工程學(xué)院 西安 710064)
電動(dòng)兩輪車轉(zhuǎn)向靈活,在騎行中呈現(xiàn)搖擺性、離散性,易與機(jī)動(dòng)車流產(chǎn)生沖突,影響正常交通流;相比普通自行車,電動(dòng)兩輪車質(zhì)量更大、車速更快,加之我國(guó)復(fù)雜的道路交通環(huán)境,一旦發(fā)生碰撞事故,將造成更加嚴(yán)重的后果。結(jié)合中國(guó)實(shí)際交通情況,有必要對(duì)電動(dòng)兩輪車與機(jī)動(dòng)車的碰撞事故中電動(dòng)車騎行者致傷因素進(jìn)行進(jìn)一步探究。
國(guó)內(nèi)外針對(duì)涉及電動(dòng)自行車的事故致因研究已經(jīng)取得了一定的成果。Patrizia等[1]基于足夠量的數(shù)據(jù),對(duì)電動(dòng)自行車單車碰撞的風(fēng)險(xiǎn)相關(guān)因素進(jìn)行了研究,發(fā)現(xiàn)高騎行暴露(基于電動(dòng)自行車使用時(shí)間和頻率構(gòu)建的新指標(biāo)、值越大代表使用時(shí)間和頻率越高)、男性騎行者、出行目的為上班或上學(xué)是電動(dòng)自行車交通事故高風(fēng)險(xiǎn)因素。馬國(guó)忠等[2]指出在電動(dòng)自行車交通事故中,與機(jī)動(dòng)車間的碰撞為事故的主要形式。王衛(wèi)杰等[3]發(fā)現(xiàn)大中型貨車和夜間無(wú)照明能顯著增加電動(dòng)車騎行者死亡或重傷的風(fēng)險(xiǎn)。江亮等[4]發(fā)現(xiàn)日均里程、風(fēng)險(xiǎn)駕駛行為、工作時(shí)長(zhǎng)、冒險(xiǎn)意識(shí)是影響電動(dòng)車交通事故的重要因素。李英帥等[5]認(rèn)為影響交通事故嚴(yán)重程度的最主要因素依次為車輛間事故類型、騎行者受傷部位、道路物理隔離類型等。
統(tǒng)計(jì)回歸模型是探索各種事故決定因素之間關(guān)聯(lián)的最廣泛使用和最成熟的方法,但這些傳統(tǒng)模型必須以1個(gè)有效的模型假設(shè)和適當(dāng)?shù)念A(yù)定義關(guān)系為前提。此外,大多數(shù)研究假設(shè)因變量和自變量之間線性相關(guān),忽略了變量之間的交互效應(yīng)和非線性關(guān)系。
相比之下,機(jī)器學(xué)習(xí)模型更靈活,不需要假設(shè),對(duì)大量復(fù)雜數(shù)據(jù)具有更大的適應(yīng)性和處理能力,被廣泛應(yīng)用于交通安全研究領(lǐng)域。Parsa等[6]基于天氣狀況、事故和探測(cè)器數(shù)據(jù),利用支持向量機(jī)(SVM)和概率神經(jīng)網(wǎng)絡(luò)(PNN)對(duì)芝加哥某高速公路的交通事故進(jìn)行檢測(cè)。Bao等[7]利用紐約市曼哈頓的出租車事故數(shù)據(jù)和人口、天氣等數(shù)據(jù),建立了時(shí)空卷積長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(STCL-Net)模型,用于預(yù)測(cè)事故風(fēng)險(xiǎn)。張文婧等[8]基于深度自動(dòng)編碼器(deep auto-encoder),利用2000—2015年公路事故傷亡數(shù)據(jù)構(gòu)建預(yù)測(cè)模型,對(duì)2016—2020年的數(shù)據(jù)進(jìn)行預(yù)測(cè)。柳本民等[9]基于SVM-RFE算法得到4個(gè)對(duì)追尾事故與連環(huán)追尾事故產(chǎn)生區(qū)別影響較大的因素:碰撞前首車的運(yùn)動(dòng)情況、道路限速、季節(jié)和車道數(shù)。然而,隨著樣本量和信息維度的增多,單一機(jī)器學(xué)習(xí)模型已經(jīng)無(wú)法滿足我們對(duì)模型精度的要求,于是集成學(xué)習(xí)方法被提出。集成學(xué)習(xí)將多個(gè)基學(xué)習(xí)器組合成1個(gè)強(qiáng)學(xué)習(xí)器,具有更好的預(yù)測(cè)精度和魯棒性,為我們提供了處理非線性、多維度問題的條件。Wen等[10]從7年的撞車/違規(guī)記錄中提取特征,比較了4種集成學(xué)習(xí)模型對(duì)昆山地區(qū)駕駛員的駕駛風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè)效果,其中GBDT模型的性能表現(xiàn)最佳。紀(jì)俊紅等[11]基于1953—2018年我國(guó)交通事故數(shù)據(jù)構(gòu)建樣本集,利用AdaBoost算法集成多個(gè)LightGBM模型,建立了GSK-AdaBoost-LightGBM模型,預(yù)測(cè)我國(guó)道路交通事故死傷情況。Yang等[12]基于XGBoost模型,發(fā)現(xiàn)人口特征、土地使用和路網(wǎng)密度與涉及貨車的事故高度相關(guān)。
綜合以上分析,目前對(duì)電動(dòng)兩輪車相關(guān)事故的影響因素研究較多,機(jī)器學(xué)習(xí)尤其是集成學(xué)習(xí)模型也被廣泛應(yīng)用于交通安全研究,但綜合考慮道路環(huán)境、電動(dòng)兩輪車及其騎行者、機(jī)動(dòng)車及其駕駛?cè)说榷喾矫嬉蛩氐难芯肯鄬?duì)較少,更少有關(guān)于對(duì)電動(dòng)兩輪車設(shè)計(jì)參數(shù)方面的研究。因此,筆者基于數(shù)據(jù)挖掘技術(shù)和機(jī)器學(xué)習(xí)模型,系統(tǒng)整合事故信息、道路信息、電動(dòng)兩輪車信息、電動(dòng)兩輪車騎行者信息、機(jī)動(dòng)車信息和機(jī)動(dòng)車駕駛員信息等6個(gè)方面的因素,選用隨機(jī)森林、XGBoost和LightGBM中表現(xiàn)最佳的LightGBM模型對(duì)電動(dòng)兩輪車騎行者傷害嚴(yán)重程度進(jìn)行預(yù)測(cè),并用SHAP值探索關(guān)鍵因素對(duì)電動(dòng)兩輪車騎行者死亡事件的影響,旨在為深入電動(dòng)兩輪車碰撞事故研究和完善相關(guān)安全法規(guī)、優(yōu)化電動(dòng)兩輪車安全性能提供參考。
筆者從CIDAS數(shù)據(jù)庫(kù)查詢了2014—2018年發(fā)生的2 960起電動(dòng)兩輪車與機(jī)動(dòng)車碰撞事故,其中電動(dòng)兩輪車與機(jī)動(dòng)車發(fā)生碰撞的占比最大,達(dá)到42.1%,共1 246起。使用這1 246起電動(dòng)兩輪車與機(jī)動(dòng)車發(fā)生碰撞的事故作為分析對(duì)象,統(tǒng)計(jì)了51個(gè)與電動(dòng)兩輪車騎行者受傷嚴(yán)重程度相關(guān)的因素,包括事故、道路、電動(dòng)兩輪車、電動(dòng)兩輪車騎行者、機(jī)動(dòng)車,以及機(jī)動(dòng)車駕駛員等6個(gè)方面因素,由于篇幅限制,僅列出基于受傷嚴(yán)重程度為死亡的數(shù)據(jù),SHAP值排名前20的變量,根據(jù)研究需要對(duì)其中部分連續(xù)變量進(jìn)行離散化,數(shù)據(jù)離散以等距分割、整數(shù)為界、類別量適中、占比均衡為標(biāo)準(zhǔn),具體變量信息見表1。為方便表示,文中圖表變量后的數(shù)字“1”“2”分別表示“電動(dòng)車騎行者”和“機(jī)動(dòng)車駕駛?cè)恕睂傩裕纭靶詣e1”表示電動(dòng)車騎行者性別,“性別2”表示機(jī)動(dòng)車駕駛員性別。
表1 自變量分類表Tab.1 Classification of independent variables
選取電動(dòng)兩輪車騎行者交通事故中的受傷程度為目標(biāo)變量。將電動(dòng)自行車騎行者受傷程度分為3類:僅財(cái)產(chǎn)損失事故、受傷事故、死亡事故。將原始數(shù)據(jù)集按電動(dòng)兩輪車騎行者受傷嚴(yán)重程度歸類統(tǒng)計(jì),結(jié)果見圖1。
圖1 電動(dòng)兩輪車騎行者受傷嚴(yán)重程度分布Fig.1 Injury severity distribution of electric two-wheeler riders
由上述統(tǒng)計(jì)結(jié)果可知:交通事故中電動(dòng)兩輪車騎行者受傷嚴(yán)重程度非常不平衡,這會(huì)直接影響到分類器模型的訓(xùn)練,分類結(jié)果會(huì)偏向于占比較大的類別。過(guò)采樣方法處理不平衡樣本的常見方法,本研究使用Smote算法對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行過(guò)采樣以提高模型性能,而測(cè)試數(shù)據(jù)則使用原始數(shù)據(jù)。Smote是合成過(guò)采樣算法的改進(jìn)方法,其基本思想就是對(duì)少數(shù)類別樣本進(jìn)行分析和模擬,并將人工模擬的新樣本添加到數(shù)據(jù)集中,進(jìn)而使原始數(shù)據(jù)中各類別占比達(dá)到均衡[13]。
集成學(xué)習(xí)將多個(gè)基學(xué)習(xí)器組合成1個(gè)強(qiáng)學(xué)習(xí)器,以達(dá)到減小預(yù)測(cè)方差或偏差的目的。通過(guò)并列生成多個(gè)基學(xué)習(xí)器以投票表決方式生成結(jié)果的方法稱為Bagging;通過(guò)不斷擬合之前學(xué)習(xí)器殘差來(lái)提升模型表達(dá)能力的方法稱為Boosting。
本研究采用的LightGBM(light gradient boosting machine)分類模型是基于boosting集成思想最先進(jìn)的算法之一,旨在解決GBDT和XGBoost算法應(yīng)用于高維輸入特征和大數(shù)據(jù)量問題時(shí)的效率和可伸縮性問題[14]。LightGBM選擇基于Histogram的決策樹算法和按葉子節(jié)點(diǎn)生長(zhǎng)的樹生成策略,結(jié)合2種創(chuàng)新技術(shù)解決了上述問題:基于梯度的單側(cè)采樣(GOSS)和互斥特征綁定(EFB)。首先,LightGBM使用GOSS方法來(lái)分割內(nèi)部節(jié)點(diǎn)。該方法的主要思想是采樣時(shí)保留梯度大的樣本點(diǎn),而對(duì)于梯度小的樣本點(diǎn)則按比例進(jìn)行隨機(jī)采樣。然后,EFB方法能夠?qū)⒏呔S性和稀疏性特性捆綁到1個(gè)特征包中來(lái)降低特征維度,在不影響準(zhǔn)確性的情況下加快訓(xùn)練過(guò)程[15]。
機(jī)器學(xué)習(xí)中二分類混淆矩陣見表2。采用的分類性能評(píng)價(jià)指標(biāo)及具體含義見表3。
表2 二分類混淆矩陣Tab.2 Dichotomous confusion matrix
表3 二分類問題評(píng)價(jià)指標(biāo)及含義Tab.3 Evaluation indexes and meanings of dichotomous problems
對(duì)于多分類問題,其準(zhǔn)確率定義與二分類相同,即預(yù)測(cè)正確的樣本占總樣本的比例,其他評(píng)價(jià)指標(biāo)的計(jì)算方法由二分類問題轉(zhuǎn)化而來(lái),分別為加權(quán)查準(zhǔn)率(weighted-P)、加權(quán)查全率(weighted-R)和加權(quán)F1-Score(weighted-F1),計(jì)算方法見式(1)~(3)。
式中:n為多分類問題中兩兩類別組合形成的二分類混淆矩陣個(gè)數(shù);Pi和Ri分別為二分類混淆矩陣的查準(zhǔn)率和查全率;ωi為每個(gè)類別樣本在總樣本中的占比。
將LightGBM的性能與基于Bagging思想的典型算法隨機(jī)森林[16]和另1種流行的Boosting代表算法XGBoost[17]進(jìn)行比較。為了確保公平,3種模型的訓(xùn)練及測(cè)試都基于相同的數(shù)據(jù)集,隨機(jī)選取70%的數(shù)據(jù)進(jìn)行模型訓(xùn)練,剩余30%的數(shù)據(jù)用來(lái)對(duì)模型性能進(jìn)行測(cè)試。3種分類模型性能指標(biāo)見圖2。由圖2可知:LightGBM模型表現(xiàn)最好。因此,采用LightGBM算法構(gòu)建分類模型,對(duì)模型的分類性能進(jìn)行進(jìn)一步分析并探索關(guān)鍵因素對(duì)分類結(jié)果的影響。
圖2 模型評(píng)估指標(biāo)Fig.2 Model evaluation indexs
基于上述比較結(jié)果,將網(wǎng)格搜索法結(jié)合10折交叉驗(yàn)證對(duì)LightGBM模型參數(shù)進(jìn)行優(yōu)化,結(jié)果見表4。LightGBM算法可直接利用categorical_feature參數(shù)指定自變量中的類別特征。
表4 LightGBM模型參數(shù)優(yōu)化結(jié)果Tab.4 Optimization results of LightGBMmodel parameters
圖3為測(cè)試集上LightGBM分類模型對(duì)電動(dòng)兩輪車騎行者3種受傷嚴(yán)重程度的分類結(jié)果。由圖3可知:僅財(cái)產(chǎn)損失事故、受傷事故和死亡事故預(yù)測(cè)正確樣本數(shù)分別為1,302和19,各受傷嚴(yán)重程度預(yù)測(cè)效果具體評(píng)估指標(biāo)見表5。模型總體準(zhǔn)確率為86.1%,考慮測(cè)試集數(shù)據(jù)分布的不均衡性,LightGBM模型在保證全局最優(yōu)的前提下出色地完成了預(yù)測(cè)電動(dòng)兩輪車騎行者受傷嚴(yán)重程度的任務(wù)。
圖3 三分類混淆矩陣Fig.3 Tripartite confusion matrix
表5 LightGBM分類模型預(yù)測(cè)效果Tab.5 Prediction effect of LightGBM classification model
SHAP(shapley additive explanations)是1種博弈論方法,它的核心思想是計(jì)算特征對(duì)模型輸出的邊際貢獻(xiàn),再?gòu)娜趾途植?個(gè)層面對(duì)“黑盒模型”進(jìn)行解釋。SHAP構(gòu)建1個(gè)加性的解釋模型,所有的特征都視為“貢獻(xiàn)者”。對(duì)于每個(gè)預(yù)測(cè)樣本都產(chǎn)生1個(gè)預(yù)測(cè)值,SHAP值就是該樣本中每個(gè)特征所分配到的數(shù)值。以LightGBM分類模型適配SHAP模型解釋器,根據(jù)事故特征的平均絕對(duì)SHAP值排序,取排名前20的特征進(jìn)行可視化,分別得到反映3種預(yù)測(cè)結(jié)果的柱狀圖,見圖4。由圖可知,電動(dòng)兩輪車騎行者對(duì)事故發(fā)生地的熟悉程度、電動(dòng)自行車騎行者被拋出距離、電動(dòng)兩輪車騎行者性別等是顯著的致傷、致死因素;此外,座位高度、車把寬度、車把設(shè)計(jì)形式等作為以往研究中較為少見的變量,值得進(jìn)一步研究。
圖4 SHAP值排序Fig.4 Ranking of SHAP value
上述SHAP值排序可以直觀顯示各特征對(duì)分類結(jié)果的影響程度,但只有清楚各特征對(duì)結(jié)果是如何作用的才能幫助決策者更好地制定相關(guān)措施,從而有效減少交通事故。由于研究重點(diǎn)在于對(duì)電動(dòng)兩輪車騎行者受傷嚴(yán)重程度的影響因素分析,故選取最嚴(yán)重的死亡事故進(jìn)一步分析。圖5的SHAP值匯總圖定性描述了死亡事故和事故特征之間的總體關(guān)系。按照特征重要性由大到小取前20個(gè)特征進(jìn)行可視化。圖中每個(gè)點(diǎn)代表1個(gè)樣本,樣本點(diǎn)多少可以反映出每個(gè)特征各取值的占比,好的特征應(yīng)該將樣本明顯分散開來(lái)。不同顏色代表當(dāng)前特征取值高低。橫坐標(biāo)為SHAP值,其大小代表特征對(duì)結(jié)果的影響程度,SHAP值為正代表該特征對(duì)死亡事故的發(fā)生有正向作用,SHAP值為負(fù)代表該特征對(duì)死亡事故的發(fā)生有負(fù)向作用。
圖5 死亡事故SHAP值匯總圖Fig.5 SHAPvalue summary of fatal accident
為了量化單個(gè)特征如何影響LightGBM模型的輸出,選取拋出距離這一特征繪制邊際效應(yīng)圖,觀察拋出距離對(duì)死亡事故的影響情況。結(jié)果見圖6。
圖6 拋出距離邊際效應(yīng)Fig.6 Marginal effect of throw distance
結(jié)合表1各特征變量的取值可知,拋出距離小于5 m時(shí)SHAP值為負(fù),拋出距離大于5 m時(shí)SHAP值為正,且SHAP值隨著距離的增加變大。這說(shuō)明碰撞后電動(dòng)兩輪車騎行者的被拋出距離很?。?5 m)時(shí),不易發(fā)生死亡事故,但當(dāng)電動(dòng)兩輪車騎行者被拋出距離超過(guò)5 m時(shí),死亡風(fēng)險(xiǎn)隨著拋出距離的增加而增加,故拋出距離這一特征很大程度上可以直接反映死亡事故的發(fā)生概率。選取拋出距離為交互特征繪制部分依賴圖,結(jié)果見圖7。橫軸表示特征取值,左縱軸為SHAP值,描述對(duì)應(yīng)特征對(duì)LightGBM模型輸出的貢獻(xiàn),右縱軸用來(lái)描述交互作用,說(shuō)明與所研究特征相互作用的拋出距離的取值。從事故及道路環(huán)境、電動(dòng)兩輪車、電動(dòng)兩輪車騎行者這3個(gè)方面對(duì)其中的典型特征進(jìn)行分析。
在與事故及道路環(huán)境相關(guān)的特征中,道路類型、事故地點(diǎn)、機(jī)動(dòng)車類型等因素對(duì)結(jié)果影響較為顯著。如圖7(a)所示,發(fā)生在市區(qū)內(nèi)的電動(dòng)兩輪車和機(jī)動(dòng)車碰撞事故中,電動(dòng)兩輪車騎行者死亡風(fēng)險(xiǎn)低,而發(fā)生在市區(qū)外的碰撞死亡風(fēng)險(xiǎn)升高,我們有理由認(rèn)為,這是因?yàn)榻紖^(qū)、鄉(xiāng)村等地的道路設(shè)計(jì)不規(guī)范,沒有進(jìn)行機(jī)非分離,加之基礎(chǔ)設(shè)施不完善,交通管控不嚴(yán)格,違規(guī)駕駛現(xiàn)象時(shí)有發(fā)生,增加了事故率;同時(shí)市區(qū)內(nèi)車輛與行人的高度互動(dòng)以及較大的交通量,導(dǎo)致其限速往往低于市區(qū)外,而較高的車速往往導(dǎo)致較為嚴(yán)重的交通事故,其他學(xué)者也得出了相似的研究結(jié)論[18]。圖7(b)所示的道路類型部分依賴圖顯示,公路這一道路類型明顯增加了事故的死亡風(fēng)險(xiǎn),這可能是因?yàn)楣飞蠙C(jī)動(dòng)車車速快,且有貨車等大型車輛,結(jié)合圖7(c)車輛類型對(duì)死亡風(fēng)險(xiǎn)的影響可知,載重物車輛由于其車速快、載重量大,一旦交通事故發(fā)生,其致死風(fēng)險(xiǎn)要明顯高于一般乘用車。
在與電動(dòng)兩輪車相關(guān)的特征中,圖7(d)顯示帶腳蹬的電動(dòng)兩輪車更容易發(fā)生死亡事故,雖然GB 17761—2018《電動(dòng)自行車安全技術(shù)規(guī)范》[19]新國(guó)標(biāo)中規(guī)定電動(dòng)自行車必須配備腳蹬,但結(jié)合實(shí)際情況來(lái)看,其存在一定的安全隱患。電動(dòng)兩輪車車輪比一般自行車小,利用腳蹬騎行慢且費(fèi)力,甚至不如推行;且電動(dòng)兩輪車一般用于短距離出行,用戶使用前都會(huì)提前充好電,必要時(shí)可以到就近充電樁充電。裝配腳蹬一方面無(wú)形間增加了電動(dòng)車的寬度,在通過(guò)一些比較狹小或者帶路墩的路段時(shí),很容易誤傷別人或自己;另一方面,腳蹬在用戶上下車時(shí)容易刮擦小腿,騎行中又容易卷起樹枝,塑料袋等異物,甚至將其卷入車輪中,嚴(yán)重影響騎行安全,遇到雨雪天氣還會(huì)甩起泥漿,給用戶帶來(lái)不變。所以,電動(dòng)兩輪車配備腳蹬這一規(guī)定值得進(jìn)行更深入的考慮。圖7(e)顯示座位高度大于70 cm,電動(dòng)兩輪車人騎行者在事故中的死亡風(fēng)險(xiǎn)更小,這是因?yàn)殡妱?dòng)兩輪車座位過(guò)低,騎行者大腿與小腿呈銳角,不利于下肢活動(dòng),影響了騎行者的靈敏性。圖7(f)~(g)顯示,電動(dòng)兩輪車的車把寬度為61~65 cm,車把設(shè)計(jì)形式為向后彎曲或牛角狀時(shí),對(duì)死亡事故的發(fā)生有明顯的抑制作用,這樣的設(shè)計(jì)更符合人類手部生理特征,使得騎行中手既能著力抓握操控車輛又不易產(chǎn)生疲勞。
在與電動(dòng)兩輪車騎行者相關(guān)的特征中,圖7(h)顯示男性騎行者更容易發(fā)生死亡事故,這可能是由于男性騎行者在駕駛電動(dòng)自行車時(shí)更易出現(xiàn)危險(xiǎn)駕駛行為,如超速行駛、違法改裝電動(dòng)自行車、騎車分心等[1]。圖7(i)顯示電動(dòng)兩輪車騎行者年齡在30~50歲時(shí)發(fā)生死亡事故相對(duì)較少,原因是騎行者年齡過(guò)小,經(jīng)驗(yàn)缺乏,對(duì)危險(xiǎn)認(rèn)識(shí)不足且更易沖動(dòng)[20];而騎行者年齡過(guò)大,由于視力、反應(yīng)速度、動(dòng)作靈敏度等因素限制,對(duì)外界反應(yīng)能力減弱且身體狀況不佳,導(dǎo)致其事故率較高,且事故后果更為嚴(yán)重[21]。
圖7 SHAP部分依賴圖Fig.7 SHAP dependence plots
此外,電動(dòng)兩輪車騎行者對(duì)事故發(fā)生地的熟悉程度作為對(duì)總體預(yù)測(cè)結(jié)果影響最大的因素,研究發(fā)現(xiàn)了1個(gè)有趣的現(xiàn)象見圖8:電動(dòng)兩輪車騎行者在越熟悉的地方越容易發(fā)生受傷事故,而死亡事故的發(fā)生則多在電動(dòng)兩輪車騎行者不熟悉的道路環(huán)境中。這可能是由于騎行者在熟悉環(huán)境中的警惕性不足,對(duì)周圍環(huán)境的觀察不夠細(xì)致,更容易發(fā)生交通事故。但就死亡事故來(lái)說(shuō),騎行者對(duì)環(huán)境的熟悉程度很重要,對(duì)周邊環(huán)境越熟悉,就越可以迅速做出適當(dāng)?shù)姆磻?yīng),以免產(chǎn)生更嚴(yán)重的后果。
圖8 電動(dòng)兩輪車騎行者對(duì)事故發(fā)生地的熟悉程度邊際效應(yīng)Fig.8 The marginal effect of electric two-wheelers riders'familiarity with the place where the accident occurred
1)基于CIDAS數(shù)據(jù)比較3種集成學(xué)習(xí)模型的分類性能,發(fā)現(xiàn)LightGBM分類模型在預(yù)測(cè)電動(dòng)兩輪車與機(jī)動(dòng)車碰撞事故中電動(dòng)兩輪車騎行者的受傷嚴(yán)重程度時(shí),預(yù)測(cè)準(zhǔn)確率達(dá)到86.1%,相較于隨機(jī)森林和XGBoost模型具有更好的適用性。
2)基于LightGBM分類模型,根據(jù)SHAP值排序結(jié)果得到對(duì)電動(dòng)兩輪車騎行者受傷、死亡事故影響較大的因素,如電動(dòng)兩輪車騎行者對(duì)事故發(fā)生地的熟悉程度、電動(dòng)兩輪車騎行者被拋出距離、電動(dòng)兩輪車騎行者性別等。
3)進(jìn)一步分析發(fā)現(xiàn),電動(dòng)兩輪車騎行者被拋出距離很?。?5 m)時(shí),不易發(fā)生死亡事故,但當(dāng)騎行者被拋出距離超過(guò)5 m時(shí),死亡風(fēng)險(xiǎn)隨著拋出距離的增加而增加;道路環(huán)境致死風(fēng)險(xiǎn)因素包括公路、市區(qū)外、與載重物車輛相撞等;座位高度大于70 cm、車把寬度為61~65 cm、車把設(shè)計(jì)形式為向后彎曲或牛角狀時(shí)可有效避免死亡事故的發(fā)生,同時(shí)建議充分考慮電動(dòng)兩輪車加裝腳蹬的必要性和安全性,對(duì)相關(guān)標(biāo)準(zhǔn)進(jìn)行修訂;男性電動(dòng)兩輪車騎行者相對(duì)女性而言事故風(fēng)險(xiǎn)更大,騎行者年齡在30~50歲、對(duì)事故發(fā)生地更為熟悉,都是降低死亡風(fēng)險(xiǎn)的關(guān)鍵因素。
在以后的研究中,將考慮對(duì)事故特征進(jìn)行更加合理地篩選和分類,提高數(shù)據(jù)來(lái)源的專業(yè)性和準(zhǔn)確性,同時(shí)探索更加高效的適用于事故傷害嚴(yán)重程度分類的模型。