摘" 要: 為提高交通事故模型的預測精度,更好地辨識交通事故在時間維度上的規(guī)律特性,基于CRITIC法和熵權法組合賦權,構建一種ES?ARIMA?BP神經(jīng)網(wǎng)絡組合預測模型,探究新疆地區(qū)交通事故在時間維度上的月度分布規(guī)律。首先,使用指數(shù)平滑法(ES)進行預測,可減少數(shù)據(jù)間的噪聲,并能捕捉時間序列數(shù)據(jù)中的季節(jié)性變動;其次,使用ARIMA模型進行預測,可捕捉數(shù)據(jù)中的線性部分、非季節(jié)性趨勢和周期性波動;最后,為更好地應對數(shù)據(jù)中的復雜非線性及無周期性波動,引入BP神經(jīng)網(wǎng)絡進行預測。結果表明:構建基于組合賦權優(yōu)化的ES?ARIMA?BP神經(jīng)網(wǎng)絡組合預測模型,平均絕對誤差百分比(MAPE)僅為1.869%,決定系數(shù)(R2)高達0.982,較單一模型及單一賦權法下的組合模型預測誤差率更低,擬合程度更好。組合預測模型以數(shù)據(jù)最大優(yōu)化為思想基礎,可有效克服單一模型的局限,同時采用組合賦權,使其能更好地適應不斷變化的數(shù)據(jù)和環(huán)境,從而提高預測的準確度。
關鍵詞: 交通事故預測; ES?ARIMA?BP; 神經(jīng)網(wǎng)絡; 組合模型; 預測模型; 賦權優(yōu)化
中圖分類號: TN911.23?34; U491.31" " " " " " " " " "文獻標識碼: A" " " " " " " "文章編號: 1004?373X(2024)22?0071?06
Research on traffic accident prediction by ES?ARIMA?BP neural network based on combined empowerment optimisation
Abstract: In order to improve the prediction accuracy of the traffic accident model and better identify the regular characteristics of traffic accidents in the time dimension, a combined ES?ARIMA?BP neural network prediction combination model is constructed based on the combination of CRITIC and entropy weight method to explore the monthly distribution of traffic accidents in Xinjiang in time dimension. The exponential smoothing (ES) method is used for prediction, which can reduce the noise among the data and capture the seasonal variations in the time series data. Forecasting with the ARIMA model can capture the linear component, non?seasonal trends and cyclical fluctuations in the data. In order to better deal with the complex nonlinear and non?periodic fluctuations in the data, BP neural network is introduced for prediction. The results show that the mean absolute percentage error (MAPE) and coefficient of determination (R2) of the ES?ARMI?BP neural network combination prediction model based on combinatorial weighting optimization are only 1.869% and 0.982, which is lower than the prediction error rate and better fitting degree of the combined model under the single model and the single weighting method. Based on the idea of maximum data optimization, the combinatorial forecasting model can effectively overcome the limitations of a single model, and can use combined weighting to make it better adapt to the changing data and environment, so as to improve the accuracy of prediction.
Keywords: traffic accident prediction; ES?ARIMA?BP; neural network; combination model; prediction model; weighted optimization
0" 引" 言
全球范圍內(nèi),交通安全形勢仍不容樂觀,每年約有135萬人死于交通事故[1]。交通事故或?qū)⒊蔀樯鐣l(fā)展中的主要危險因素之一。因此,為有效解決交通安全問題,探索交通事故在時間維度上的分布規(guī)律,構建具有良好預測能力的模型是至關緊要的。
眾多學者對交通事故時空模型進行了研究,主要采用時間序列法[2]和神經(jīng)網(wǎng)絡法[3]等進行預測。文獻[3]采用單一神經(jīng)網(wǎng)絡法對交通事故進行預測,文獻[4]采用單一時間序列法對交通事故進行預測,但單一模型存在一定的局限性,比如ARIMA模型不擅長處理非線性的復雜數(shù)據(jù),BP神經(jīng)網(wǎng)絡不擅長處理線性數(shù)據(jù)。為克服單一模型的局限性,目前將傳統(tǒng)方法和機器學習組合來構建模型,逐漸應用于交通事故的時空預測中。文獻[5]構建ARIMA?LSTM組合模型對交通事故進行預測,文獻[6]構建ARIMA和XGBoost組合模型對交通事故進行預測,文獻[7]基于集合經(jīng)驗模態(tài)分解降噪和優(yōu)化LSTM對交通事故進行預測。以上組合模型的預測精度優(yōu)于單一模型,且平均絕對百分比誤差降至5%~15%。但組合預測模型并不是在所有情況下都表現(xiàn)良好,且模型誤差率并未降至5%以內(nèi)。
有研究表明,指數(shù)平滑法可有效減少數(shù)據(jù)間的噪聲,并能捕捉時間序列數(shù)據(jù)中的季節(jié)性變動[8]。ARIMA模型適用于提取時間序列中的線性部分、非季節(jié)性趨勢與周期性波動[9],BP神經(jīng)網(wǎng)絡擅于捕捉數(shù)據(jù)中的復雜非線性及無周期波動[10]。為提高組合模型的預測精度,使模型能適用于不同的數(shù)據(jù)和環(huán)境,文中提出一種基于CRITIC法和熵權法組合賦權優(yōu)化的ES?ARIMA?BP神經(jīng)網(wǎng)絡組合預測方法。通過結合每種模型和數(shù)學方法的獨特優(yōu)勢,提高模型適用性,降低模型誤差率,解決事故數(shù)據(jù)常呈現(xiàn)線性、非線性、無周期性等問題。
1" 基于組合賦權優(yōu)化的ES?ARIMA?BP神經(jīng)網(wǎng)絡組合模型理論
1.1" 指數(shù)平滑法
指數(shù)平滑(Exponential Smoothing, ES)法是一種基于移動平均模型的時間序列預測方法,通過該方法預測交通事故數(shù)據(jù),可減少數(shù)據(jù)間的噪聲,并能捕捉時間序列數(shù)據(jù)中的季節(jié)性變動,使結果具有較好的可行性。預測公式[11]如下:
[y?t+1=αyt+1-αy?t] (1)
式中:[y*t+1]為第t+1期預測值;yt為第t期實際值;[y*t]為第t期預測值;[α]為指數(shù)平滑系數(shù)。
1.2" ARIMA模型
ARIMA(p,d,q)模型是一種時間序列預測方法。將預測指標隨時間推移而形成的數(shù)據(jù)看作是一個隨機序列,這組隨機變量體現(xiàn)著原始數(shù)據(jù)在時間上的延續(xù)性,它既受外部因素的影響,又有自身變動規(guī)律[12]。數(shù)學模型表達式如下:
式中:[αi]為自回歸參數(shù);[δj]為移動平均參數(shù)。
1.3" 賦權方法
1) CRITIC法
CRITIC(Criteria Importance Though Intercrieria Correlation)是客觀賦權法,其具有既突出數(shù)據(jù)間的相互關系,又體現(xiàn)數(shù)據(jù)差異性的優(yōu)點[13]。通過此方法建立組合模型,能夠全面考慮各種單一預測方法提供的數(shù)據(jù)信息,以達到客觀、準確的預測效果。
式中:[σj]為第j個指標標準差;[μj]為第j個指標期望值;[r'ij]為第i個指標與第j個指標線性相關系數(shù);Cj為第j個指標信息量;[ωj]為第j個指標權重。
2) 熵權法
式中:yij為第j指標對應的第i個對象出現(xiàn)的概率,當yij=0時,ln yij=0;[ωij]為熵權。
CRITIC法和熵權法均適用于各種類型的數(shù)據(jù)和復雜環(huán)境,有助于消除數(shù)據(jù)的不穩(wěn)定性和波動性,增強模型的魯棒性;且計算過程相對較為客觀,有助于提高權重計算的公正性和科學性。構建不同賦權方法下的ES?BP和ARIMA?BP組合模型,預測新疆地區(qū)交通事故在時間維度上的月度分布規(guī)律,公式如下:
[n1+n2=1] (9)
[Yt=n1X1t+n2X2t," t=1,2,…,m] (10)
式中:n1為基于CRITIC法或熵權法的權重;n2為原始數(shù)據(jù)的權重;[X1t]為基于指數(shù)平滑或ARIMA模型的單一預測值;[X2t]為原始交通事故數(shù)據(jù);[Yt]為基于重新賦權后的新數(shù)據(jù),該數(shù)據(jù)將輸入BP神經(jīng)網(wǎng)絡的輸入層。
1.4" 基于組合賦權優(yōu)化的ES?ARIMA?BP神經(jīng)網(wǎng)絡模型
BP神經(jīng)網(wǎng)絡有強大的自學習力,由輸入層、隱藏層、輸出層構成[16]。由于其自身所具有的特性——非線性映射、多輸入多輸出和自組織自學習等,使得BP神經(jīng)網(wǎng)絡更適合處理非線性及無周期性波動等復雜問題[17]。
式中:Xi為輸入量;Yk為輸出量;ωij(i=1,2,…,N1;j=1,2,…,N2)為輸入層與隱含層間權值;ωik(k=1,2,…,N3)為隱含層與輸出層間權值;f1和f2均為BP神經(jīng)網(wǎng)絡激活函數(shù)。
構建基于組合賦權優(yōu)化的ES?ARIMA?BP神經(jīng)網(wǎng)絡模型的基本步驟如下。
1) 構建指數(shù)平滑法時間序列單一模型,可減少數(shù)據(jù)間的噪聲,并能捕捉時間序列數(shù)據(jù)中的季節(jié)性變動,得到單一預測數(shù)據(jù)X1t1(t=1,2,…,m)。
2) 確定參數(shù)p、d、q,構建ARIMA模型,可獲取時間序列中的線性部分、季節(jié)性趨勢、非季節(jié)性趨勢與周期性波動,得到單一預測數(shù)據(jù)X1t2(t=1,2,…,m)。
3) 基于CRITIC法和熵權法分別對指數(shù)平滑法或ARIMA模型單一預測后的數(shù)據(jù)X1t1(t=1,2,…,m)或X1t2(t=1,2,…,m)與原始數(shù)據(jù)進行重新賦權,得出賦權后的指數(shù)平滑法數(shù)據(jù)Yt1(t=1,2,…,m)和ARIMA模型數(shù)據(jù)Yt2(t=1,2,…,m)。
4) 將賦權后的數(shù)據(jù)Yt1(t=1,2,…,m)或Yt2(t=1,2,…,m)輸入BP神經(jīng)網(wǎng)絡的輸入層,把真實值輸入BP神經(jīng)網(wǎng)絡的輸出層,獲取數(shù)據(jù)中的復雜非線性及無周期性波動的擬合數(shù)據(jù),得出不同賦權法下的ES?BP或ARIMA?BP組合預測值。
5) 采用誤差指標對模型的預測效果進行對比分析。
同理,將賦權后的數(shù)據(jù)Yt1(t=1,2,…,m)和Yt2(t=1,2,…,m)同時輸入BP神經(jīng)網(wǎng)絡的輸入層。重復上述步驟,即可得出賦權優(yōu)化的ES?ARIMA?BP神經(jīng)網(wǎng)絡組合預測模型,具體流程見圖1。
2" 數(shù)據(jù)來源及判別指標
文中收集了新疆地區(qū)部分2020—2022年每月交通事故數(shù)量。為驗證所提出的組合預測方法的擬合效果,采用平均絕對誤差百分比(MAPE)和決定系數(shù)(R2)統(tǒng)計學指標來評價9個模型的預測結果和模型擬合優(yōu)度。誤差指標越小,其預測精度越高;決定系數(shù)越接近于1,其模型擬合效果越好。
式中:[Yt]、[Y′t]為真實值和預測值;M為預測次數(shù)。
式中:SSE為殘差的總平方和;SST為實際值的總平方和。
3" 實證分析
3.1" 參數(shù)設置
3.1.1" 指數(shù)平滑法參數(shù)設置
1) 確定平滑系數(shù):其決定了歷史數(shù)據(jù)對預測值的影響程度,取值范圍為0~1。
2) 確定初始值:選擇使用時間序列的第一個觀測值作為初始值。
3.1.2" ARIMA模型參數(shù)設置
1) 確定差分參數(shù)(d):該模型要求數(shù)據(jù)為平穩(wěn)序列,因此建模前通過ADF對數(shù)據(jù)進行檢驗,結果顯示初始序列的P值為0.032 8lt;0.05,表明原始時間序列數(shù)據(jù)本身是平穩(wěn)的,即d=0。
2) 確定自回歸參數(shù)(p):通過觀察差分后的時間序列數(shù)據(jù)的PACF圖,找出在置信區(qū)間之外截尾的滯后階數(shù),確定AR模型的參數(shù)p,即p=1,見圖2。
3) 確定移動平均參數(shù)(q):通過觀察差分后的時間序列數(shù)據(jù)的ACF圖,找出在置信區(qū)間之外截尾的滯后階數(shù),確定MA模型的參數(shù)q,即q=1,見圖2。
故模型可以構建多種參數(shù)組合結果,通過多次嘗試后,依據(jù)R2最大及BIC最小準則篩選出最佳模型,分析比較后發(fā)現(xiàn),ARIMA(1,0,1)模型的R2最大且BIC最小,因此確定該模型為最終模型。
3.1.3" BP神經(jīng)網(wǎng)絡組合模型參數(shù)設置
1) 時間相關性設置:使用時間序列對交通事故進行預測,將指數(shù)平滑法、ARIMA模型的預測數(shù)據(jù)和原始數(shù)據(jù)重新賦權后的結果作為輸入數(shù)據(jù)。
2) 隱含層及神經(jīng)元數(shù)量設置:設置兩個隱含層,每個隱含層設置神經(jīng)元數(shù)量為10。
3) 函數(shù)設置:設置隱含層和輸出層傳輸函數(shù)為tansig,訓練函數(shù)為purelin,權重學習函數(shù)為trainglm。
4) 質(zhì)量控制參數(shù)設置:最大迭代次數(shù)為100,學習率為0.01,目標誤差為0.000 01。
3.2" 模型的構建
3.2.1" 單一模型的構建
基于指數(shù)平滑法和ARIMA構建單一模型,得出的單一模型預測結果見表1。
單一模型的構建中,兩種模型預測效果均一般。兩種單一模型對比見圖3。為結合兩種模型的優(yōu)勢,后續(xù)將構建組合預測模型。
3.2.2" 組合模型的構建
1) ES?BP與ARIMA?BP組合模型?;谥笖?shù)平滑法或ARIMA模型預測的每月事故數(shù)量和原始數(shù)據(jù),分別通過CRITIC法和熵權法計算2組數(shù)據(jù)間的權重,繼而將計算后的數(shù)據(jù)輸入BP神經(jīng)網(wǎng)絡的輸入層,得出ES?BP和ARIMA?BP組合預測的結果。模型擬合情況對比見表2?;趩我毁x權下的組合模型的預測效果明顯優(yōu)于單一模型。ES?BP與ARIMA?BP模型對比見圖4。
2) ES?ARIMA?BP模型的構建。運用Matlab構建組合賦權模型,選取不同賦權法下的ES?BP與ARIMA?BP數(shù)據(jù),輸入BP神經(jīng)網(wǎng)絡的輸入層,對數(shù)據(jù)進行更深入的挖掘和優(yōu)化,得出賦權優(yōu)化的ES?ARIMA?BP組合預測結果。模型擬合情況及對比見表3和圖5。
基于CRITIC法和熵權法的ES?ARIMA?BP組合賦權模型R2為0.982,表明模型擬合好。模型擬合度統(tǒng)計指標中MAPE值為1.869%,誤差值低,說明模型整體擬合好。相較其他8種模型預測效果最佳,組合賦權模型的MAPE值分別下降9.275%、15.601%、3.080%、2.338%、2.434%、7.497%、0.544%、1.295%,該模型誤差率最低。R2值分別提高0.281、0.406、0.041、0.041、0.042、0.232、0.001、0.006,該模型整體擬合效果最好。7種組合預測模型誤差結果見圖6。
圖6中均方誤差(Mean Squared Error, MSE)和均方根誤差(Root Mean Squared Error, RMSE)越小,表明模型的預測值與真實數(shù)據(jù)間的差異越小,即模型的擬合程度越好。
4" 結" 語
針對交通事故預測模型精度低等問題,文中以信息最大優(yōu)化為思想基礎,提出一種基于組合賦權優(yōu)化的ES?ARIMA?BP神經(jīng)網(wǎng)絡組合模型,對新疆地區(qū)交通事故時間維度中的月度變化進行預測。
從實驗數(shù)據(jù)分析發(fā)現(xiàn),基于CRITIC法和熵權法組合賦權下的ES?ARIMA?BP模型預測誤差率最低,預測效果最佳。該模型可減少因單一模型的局限性而導致的預測誤差,同時將三種預測模型和兩種賦權方法的優(yōu)勢良好的結合,可使其更好地適應不斷變化的數(shù)據(jù)和環(huán)境,構建更加全面和有效的預測模型,提高模型的魯棒性和穩(wěn)定性,更好地挖掘數(shù)據(jù)之間的關聯(lián)性。
以上研究結果可為交通管理部門在安全管理和事故預防等方面提供參考,從而提升道路安全性并降低事故發(fā)生率。
參考文獻
[1] World Health Organization. Global status report on road safety 2018 [M]. Geneva: World Health Organization, 2019.
[2] 張樹林,鳳鵬飛,許佳佳,等.基于ARIMA模型構建某市高速公路交通事故預測模型[J].安徽預防醫(yī)學雜志,2023,29(5):407?411.
[3] GORZELANCZYK P. Application of neural networks to forecast the number of road accidents in provinces in Poland [J]. Heliyon, 2023, 9(1): e12767.
[4] SUNNY C M, NITHYA S, SINSHI K S, et al. Forecasting of road accident in Kerala: a case study [C]// 2018 International Conference on Data Science and Engineering (ICDSE). [S.l.]: IEEE, 2018: 1?5.
[5] 梁乃興,閆杰,楊文臣,等.基于ARIMA?LSTM的高速公路交通安全組合預測模型研究[J].重慶交通大學學報(自然科學版),2023,42(4):131?138.
[6] 謝學斌,孔令燕.基于ARIMA和XGBoost組合模型的交通事故預測[J].安全與環(huán)境學報,2021,21(1):277?284.
[7] 劉清梅,萬明,嚴利鑫,等.基于集合經(jīng)驗模態(tài)分解降噪和優(yōu)化LSTM的道路交通事故預測[J].交通信息與安全,2023,41(5):12?23.
[8] 李守金,崔子梓,趙靜.基于Matlab自適應的動態(tài)三次指數(shù)平滑法的研究與應用:以全國道路交通事故的預測為例[J].數(shù)學的實踐與認識,2018,48(12):169?177.
[9] GETAHUN K A. Time series modeling of road traffic accidents in Amhara Region [J]. Journal of big data, 2021, 8(1): 102.
[10] 楊永紅,王醇,楊朝,等.基于BP神經(jīng)網(wǎng)絡的二級公路線形事故風險判別[J].深圳大學學報(理工版),2023,40(6):705?712.
[11] 田波,樸在林,王慧.基于時間序列建模在風力發(fā)電功率短期預測中的研究[J].電網(wǎng)與清潔能源,2016,32(3):115?119.
[12] 王燕.應用時間序列分析[M].3版.北京:中國人民大學出版社,2005.
[13] 馬潔,劉智麗,王書靈,等.軌道交通車站出入口客流預測:以北京市為例[J].吉林大學學報(工學版),2024,54(8):2197?2205.
[14] 劉潤愷,于龍,陳德明.基于AHP?熵權法的高鐵接觸網(wǎng)可信性評價研究[J].鐵道科學與工程學報,2019,16(8):1882?1889.
[15] 陳虹兵,王多宏.基于AHP?熵權?可拓云模型的城市軌道交通跨線運營效果評價[J].鐵道運輸與經(jīng)濟,2023,45(2):118?125.
[16] 王偉,王海云.基于Adam優(yōu)化BP神經(jīng)網(wǎng)絡的風機等效疲勞載荷預測[J].現(xiàn)代電子技術,2023,46(17):102?106.
[17] 陳海龍,彭偉.改進BP神經(jīng)網(wǎng)絡在交通事故預測中的研究[J].華東師范大學學報(自然科學版),2017(2):61?68.