李振國 徐建新
摘 要:為了提高傳統(tǒng)方法生成交通擁堵指數(shù)(TPI)的準確率,引入一種基于經(jīng)驗模態(tài)分解(EMD)與Elman神經(jīng)網(wǎng)絡的組合模型實現(xiàn)交通擁堵指數(shù)預測。首先,利用EMD將TPI序列分解為不同時間尺度下的IMF分量和剩余分量;然后,通過偏自相關函數(shù)(PACF)計算各分量的滯后期數(shù),以此確定各分量在Elman神經(jīng)網(wǎng)絡中的輸入和輸出變量;之后,通過上述方法計算出各分量預測值并相加;最后,計算出總預測結果。通過計算結果可知,EMD-PACF-Elman預測方法3個評價指標(平均絕對誤差、均方誤差、平均絕對百分誤差)的計算結果與單一Elman神經(jīng)網(wǎng)絡模型、EMD-Elman神經(jīng)網(wǎng)絡模型、單一BP神經(jīng)網(wǎng)絡模型、EMD-BP神經(jīng)網(wǎng)絡模型相比都為最低,分別為0.562 4、0.598 9、0.110 7。因此, EMD-PACF-Elman預測方法可以有效地預測TPI,同時也為進一步預測交通擁堵趨勢提供了依據(jù)。
關鍵詞:經(jīng)驗模態(tài)分解;偏自相關函數(shù);Elman神經(jīng)網(wǎng)絡;交通擁堵指數(shù)
DOI:10. 11907/rjdk. 201977?????????????????????????????????????? 開放科學(資源服務)標識碼(OSID):
中圖分類號:TP301 ??? 文獻標識碼:A?????? 文章編號:1672-7800(2020)011-0011-06
Prediction of TPI Based on Elman Neural Network and EMD
LI Zhen-guo1,XU Jian-xin 2
(1. Faculty of Science, Kunming University of Science and Technology, Kunming 650500, China;
2. School of Metallurgy and Energy Engineering, Kunming University of Science and Technology, Kunming 650093, China)
Abstract:In order to improve the accuracy of generating traffic performance index (TPI) by traditional methods, a combined model based on (EMD) and Elman neural network is introduced to predict the traffic performance index. First, EMD is applied to decompose the sequence of TPI into IMF component and residual component on different time scales; second, partial autocorrelation function (PACF) is used to calculate the lag period of each component and the input and output variables of each component in Elman neural network are determined; third, the predicted values of each component are obtained and the final prediction result is obtained by summing them together. According to the results, the three evaluation indexes (mean square error, mean absolute error and mean absolute percentage error) of EMD-PACF-Elman prediction method are the lowest compared with single Elman neural network model, EMD-Elman neural network model, single BP neural network model and EMD-BP neural network model, and they are 0.562 4, 0.598 9 and 0.110 7 respectively. EMD-PACF-Elman prediction method can effectively predict TPI. It also provides an effective basis for further predicting the trend of traffic congestion.
Key Words:EMD; PACF; Elman; traffic performance index
0 引言
城市交通擁堵是一個困擾全球的問題,其會導致交通效率降低、交通事故發(fā)生率提高等問題。目前,在智能交通系統(tǒng)中,交通擁堵預測在道路引導以及交通管理中都發(fā)揮著重要作用,因而受到越來越多學者的關注[1]。交通擁堵指數(shù)(Traffic Performance Index,TPI)可以直接反映當時的道路交通狀況,因此本文通過預測交通擁擠指數(shù)判斷交通狀態(tài)。
許多學者對短期交通流預測進行了研究與探索[2-4],提出了多種預測方法,如線性預測方法及非線性預測方法。其中,線性預測方法包括多元線性回歸方法[5]、狀態(tài)空間方法以及時間序列方法[6]等。但這些方法只能描述交通流基本趨勢,而不能對其進行準確預測;非線性預測方法包括灰色模型法[7-8]、貝葉斯網(wǎng)絡法、神經(jīng)網(wǎng)絡法[9]、小波模型法[10]以及RBF網(wǎng)模型法等。
國內(nèi)外學者在預測TPI序列時嘗試了多種方法,如靜態(tài)前饋神經(jīng)網(wǎng)絡[11],但該方法有一定弊端,當系統(tǒng)的階數(shù)變化或未知時,在運算過程中會導致網(wǎng)絡學習的收斂速度變得十分緩慢,此時很容易陷入局部極小值。動態(tài)回歸神經(jīng)網(wǎng)絡有效改善了這一問題,其可以非常形象、直觀地反映系統(tǒng)的動態(tài)特性,以便于觀察。Elman神經(jīng)網(wǎng)絡其實是一種非常有代表性的動態(tài)回歸神經(jīng)網(wǎng)絡[12-13],考慮到TPI數(shù)據(jù)序列的動態(tài)和非線性特性,Elman網(wǎng)絡可用于預測。但從以往的研究來看,網(wǎng)絡模型能夠很好地預測趨勢,但預測值的準確性不高。
近年來,常??吹叫〔ǚ治霰粦糜谛盘柼幚碇校鋬?yōu)點是克服了人工選擇的局限性,但在處理非線性問題時,對于小波母函數(shù)和分解層數(shù)的選擇沒有提供完善的理論支持。經(jīng)驗模態(tài)分解(EMD)的一個重要優(yōu)點就是可避免人為因素造成的較大誤差,因此是一種有效的時變信號信息提取工具,具有自適應非線性特征。同時,EMD能準確反映一些有價值的物理信息,尤其對于非平穩(wěn)信號處理具有更佳的效果。它可以將非平穩(wěn)、非線性的交通擁堵指數(shù)(TPI)序列分解成多個平穩(wěn)的線性本征模態(tài)函數(shù)(IMF)和剩余分量,然后對分解后的每個分量分別進行建模,既能準確預測TPI的趨勢,又能提高預測值的準確性。因此,對TPI的研究可以轉化為對各個分量的研究。
本文選取TPI序列檢驗其穩(wěn)定性和正態(tài)性,結果是一個非平穩(wěn)、非線性序列。將處理時頻信號的EMD與Elman神經(jīng)網(wǎng)絡相結合,可提高Elman神經(jīng)網(wǎng)絡預測TPI的準確性。首先,EMD將TPI序列分解為多個IMF分量和剩余分量;然后,分別確認各分量的滯后期數(shù),利用偏自相關函數(shù) (PACF),通過計算出的各分量滯后期數(shù)確定網(wǎng)絡的輸入和輸出變量;之后,分別對各個分量進行建模,組成EMD-PACF-Elman組合模型預測分解后的TPI序列;最后,將分解后的各分量預測值全部相加,得到最終預測值。通過對比分析可知,本文引入的模型可以很好地預測道路交通狀況,得出的結果具有較高準確性。
1 數(shù)學原理與方法
1.1 Elman神經(jīng)網(wǎng)絡
Elman神經(jīng)網(wǎng)絡在1990年被提出,是一種典型的局部回歸網(wǎng)絡。其主要框架為前饋鏈接,包含3個層次,即輸入層、隱含層和輸出層[14]。利用Elman神經(jīng)網(wǎng)絡可獲得較好的TPI預測結果。Elman神經(jīng)網(wǎng)絡表達式為:
式中,[u(k)]表示輸入向量,[x(k)]、[xc(k)]、[y(k)]表示輸出向量,k表示時刻值,下標c對應隱含層個數(shù),[w1]、[w2]、[w3]對應連接權值,f對應隱含層神經(jīng)元傳遞函數(shù),g則對應輸出神經(jīng)元傳遞函數(shù),不能忽略。
1.2 EMD原理
EMD是Huang等[15]提出的一種基于“篩選”的方法,其主要思想是將不穩(wěn)定信號分解為相對穩(wěn)定且有限個IMF分量和剩余分量。其實質是將TPI原始數(shù)據(jù)分解成多個IMF分量和剩余分量,其中每個IMF分量都包含了原始數(shù)據(jù)對應時間段的原有特征。
EMD方法實現(xiàn)步驟如下:
步驟1:需要準確找到TPI序列[xt] ([t=1, 2,? ……,? T])的局部極值點,然后根據(jù)計算得到的極值點進行三次樣條插值,從而確定計算上、下包絡序列[xmaxt,? xmint]。
步驟2:從確定的上、下包絡序列得到平均曲線序列,其數(shù)學表達式為:
步驟3:用TPI序列[x(t)]減去步驟2所得的平均曲線序列后得到一個新的時間序列。通過去除平均曲線序列,可得到數(shù)據(jù)的其余分量。即:
步驟4:對計算出的新的時間序列[h1(t)]重復以上步驟,循環(huán)依次計算,一直計算到新的時間序列滿足以下兩個特定條件:①局部極值點以及過零點數(shù)目必須等同,或最多相差一個;②每一個瞬時平均值為零,直到滿足且達到以上兩個特定條件后,則新的時間序列[h1(t)]就是第1個IMF分量[IMF1]。
步驟5:用交通擁堵指數(shù)序列[xt]減去[IMF1],得到剩余分量[r1t]。
步驟6:重復上述步驟1-5,計算剩余序列,可得到多個IMF,一直計算到滿足終止條件。
當[i=1, 2, ……n], [t=1, 2, ……, T],[T]是時間序列長度,[ i]是迭代次數(shù),[ σ]是停止閾值,[ σ]取值范圍為[0.2,0.3],重復迭代n次,直到剩余序列可以不再被分解,該剩余序列被稱為剩余分量[Rt],然后TPI序列可表示為:
步驟7:重復步驟1-6。
1.3 偏自相關函數(shù)
偏自相關函數(shù)(Partial Autocorrelation Function,PACF)是一種用來識別ARMA(p,q)中p的常用方法,p為滯后階數(shù),在運算過程中剔除中間變量的影響后,可以更加直觀地反映出時間序列中任意兩個變量之間的相關性。本文采用偏自相關函數(shù)方法確定各分量的滯后階數(shù),通過該方法確定Elman神經(jīng)網(wǎng)絡的輸入和輸出變量16]。
1.4 EMD-PACF-Elman神經(jīng)網(wǎng)絡預測模型
本文引入新的EMD-PACF-Elman預測模型,具體預測流程如圖1所示。
首先,利用EMD對交通擁堵指數(shù)數(shù)據(jù)進行處理,該處理方法可將TPI原始序列分解為多個IMF分量和剩余分量。然后,通過使用偏自相關函數(shù)(PACF)方法求出各分量的滯后階數(shù),通過計算出的滯后期數(shù)分別確定子模型中神經(jīng)網(wǎng)絡的輸入和輸出變量。之后,建立各分量EMD-PACF-Elman聯(lián)立的新組合神經(jīng)網(wǎng)絡模型,通過使用新的組合模型分別依次計算出各分量預測值。最后,將所有計算出的各子模型預測結果全部相加,所得到的和即為最終預測結果。具體步驟如下:
步驟1:設[x(t)] ([t=1,2,……])為交通擁堵指數(shù)序列,將[x(t)]序列進行EMD分解,通過分解計算得到8個[IMFj]分量([j =1, 2, ..., 8])和1個剩余分量[R(t)]。
步驟2:使用偏自相關函數(shù)方法分別確定每一個IMF分量以及剩余分量R(t)的滯后階數(shù),首先計算滯后階數(shù)的結果,進一步確定每一個子模型的輸入變量,然后通過計算與反復訓練,以此確定隱含層神經(jīng)元數(shù)量,最后確定模型的輸出變量。
步驟3:將交通擁堵指數(shù)原始數(shù)據(jù)樣本分為3個樣本集,分別為訓練集、測試集及預測集。首先,將訓練集樣本用于組合預測模型之前,目的是為了訓練參數(shù),使預測集可以達到正常的預測效果。測試集的作用是測試網(wǎng)絡預測效能,在實際運算過程中,對預測集樣本進行預測,從而得到預測模型的預測樣本。
步驟4:重復步驟2和步驟3,分別得到其它分量和剩余分量的預測結果。
步驟5:將每個IMF分量與剩余分量的預測結果相加,所得結果就是TPI的最終預測結果。
2 結果與討論
2.1 樣本數(shù)據(jù)描述與預處理
交通狀況指數(shù)(TPI記錄時間為2015年1月1日-2019年5月31日),所有數(shù)據(jù)均來自廣州交通信息網(wǎng)(http://jtj.gz.gov.cn/jtzt/jtsj/xyglsj/),共有1 145個有效樣本集作為研究對象。
本文采用Windows7系統(tǒng)平臺,TPI(2015年1月1日-2019年5月31日)的原始數(shù)據(jù)圖如圖2所示。交通擁堵指數(shù)序列呈非線性特征,同時具有較大的波動性,但也具有一定趨勢性。但是,圖2中并沒有清晰、明確地顯示出規(guī)律性,若想對其進行準確預測存在較大困難。因此,本文采用EMD-PACF-Elman方法對選取的數(shù)據(jù)進行預測,并分別與不使用EMD的Elman方法(Elman單一模型)、EMD-Elman模型、BP單一模型和EMD-BP模型進行比較。
2.2 EMD輸入模型訓練
采用EMD方法分解TPI原始序列得到的分解結果如圖3、圖4所示。從圖中可以很容易看出,經(jīng)過分解共得到8個IMF分量以及1個剩余分量[Rt]。
在網(wǎng)絡訓練與預測過程中,權值和閾值是由隨機數(shù)隨機選取的,因此權值與閾值選取也十分重要。網(wǎng)絡收斂速度自然會隨著每次運行而變化。經(jīng)過反復比較,權值初始取值范圍選?。?0.1,0.1)較優(yōu)。
在神經(jīng)網(wǎng)絡中,最關鍵的步驟之一就是模型參數(shù)設置,其在模型中起著決定性作用。參數(shù)調(diào)試中最重要的兩個量,一是輸入層的神經(jīng)元數(shù)量,二是隱含層的節(jié)點數(shù)量,模型建立是否成功的關鍵也在于此。對時間序列數(shù)據(jù)建立Elman神經(jīng)網(wǎng)絡模型時,輸入層神經(jīng)元數(shù)量通常對模型預測性能有著重要影響,模型的輸入層神經(jīng)元數(shù)目通常由時間序列的滯后期數(shù)決定。因此,計算時間序列的滯后周期是非常重要的。
目前常用于計算時間序列滯后周期的方法之一是PACF法,因此本研究使用PACF確定TPI序列的滯后周期。首先,通過EMD方法得到IMF分量和剩余分量[Rt],然后計算其滯后期,最后以滯后期數(shù)作為對應Elman神經(jīng)網(wǎng)絡子模型的輸入層神經(jīng)元數(shù)。TPI序列滯后周期計算結果如表1所示。
隱層節(jié)點數(shù)同樣是重要參數(shù),但目前還沒有具體計算標準,大多數(shù)情況下是根據(jù)經(jīng)驗設置隱含層節(jié)點個數(shù)。本文將每個模型隱含層神經(jīng)元數(shù)量范圍確定為相應輸入神經(jīng)元數(shù)量的75%~300%,并對新預測模型反復進行訓練對比,通過比較網(wǎng)絡誤差,以此確定隱層神經(jīng)元最優(yōu)數(shù)目,最終確定TPI各子模型的隱含層神經(jīng)元數(shù)量。
2.3 EMD-PACF-Elman神經(jīng)網(wǎng)絡預測效果
本文選取TPI的1 145個有效樣本集作為研究對象,選取T的1 100個數(shù)據(jù)作為訓練數(shù)據(jù),建立EMD-PACF-Elman神經(jīng)網(wǎng)絡預測模型,共使用40個TPI的有效數(shù)據(jù)作為檢驗數(shù)據(jù)進行模型檢驗。
由于每個子模型輸入變量不同,導致每個子模型輸出變量也不同。為了保證各子模型輸出變量的矢量長度相同,從而較好地獲得最終預測值,刪除子模型的部分輸出變量。
為了更準確地觀察數(shù)據(jù)處理結果,通常對以下3個誤差指標進行分析,從而判斷預測效果,分別是:均方誤差(MSE)、平均絕對誤差(MAE)以及平均絕對百分比誤差(MAPE)。利用EMD-PACF-Elman神經(jīng)網(wǎng)絡對每個IMF和剩余分量進行訓練與建模。TPI各分量預測誤差如表2所示。
3個誤差評價指標計算公式如下:
其中,[yt]代表TPI實際值,[yt]代表了TPI預測值。
本文對交通擁擠指數(shù)進行研究(周六和周日不考慮),連續(xù)5天的數(shù)據(jù)可用來對第6天進行預測,因此將Elman神經(jīng)網(wǎng)絡子模型的輸入變量設置為5。為了區(qū)分本文使用PACF確定各子模型輸入變量的方法,將該方法稱為EMD-Elman模型。為了更直觀地觀察EMD-PACF-Elman模型預測情況,把EMD-PACF-Elman模型預測結果分別與單一BP神經(jīng)網(wǎng)絡模型、單一Elman神經(jīng)網(wǎng)絡模型、EMD-BP神經(jīng)網(wǎng)絡模型和EMD-Elman神經(jīng)網(wǎng)絡模型預測結果進行對比。預測與實測TPI結果比較曲線如圖5所示。
2.4 結果分析
如圖5(e)所示,單用肉眼很難分辨出EMD-PACF-Elman神經(jīng)網(wǎng)絡模型的最高預測精度。為進一步說明EMD-PACF-Elman神經(jīng)網(wǎng)絡的性能,選取MAE、MSE和MAPE作為誤差指標進行分析判斷,如表3所示。通過EMD-PACF-Elman神經(jīng)網(wǎng)絡得到MAE、MSE和MAPE的結果分別為0.562 4、0.598 9、0.110 7,明顯低于其它4組模型的結果。該結果表明,EMD-PACF-Elman神經(jīng)網(wǎng)絡模型的預測精度較高。
通過上述比較,本文引入的神經(jīng)網(wǎng)絡模型實現(xiàn)了對TPI的準確預測,具有一定的實際應用價值。
3 結語
本研究首先通過EMD方法將TPI原始數(shù)據(jù)分解為多個平穩(wěn)、線性的IMF分量和剩余分量;然后使用PACF方法依次確定Elman神經(jīng)網(wǎng)絡的輸入與輸出變量,進而建立每個分量的EMD-PACF-Elman組合子模型;最后將每個分量子模型的預測結果相加,并將得到的預測結果分別與單一BP、單一Elman、EMD-BP和EMD-Elman神經(jīng)網(wǎng)絡模型進行比較分析。通過使用3個誤差評價指標進行分析判斷,得到EMD-PACF-Elman組合模型的TPI預測值與實際值之間的誤差分別為0.562 4、0.598 9、0.110 7。根據(jù)3個誤差指標,顯示EMD-PACF-Elman組合模型的預測精度高于其它4種方法,證明了該方法的有效性。該方法為進一步預測交通擁堵趨勢提供了有效依據(jù)。然而,該方法所得出的誤差值相對偏大,預測還存在一定偏差,此外該方法的普適性還需作進一步驗證,這些都是下一步需要解決的問題。
參考文獻:
[1] WEN F, ZHANG G, SUN L, et al. A hybrid temporal association rules mining method for traffic congestion prediction[J].? Computers & Industrial Engineering, 2019, 130: 779-787.
[2] 羅向龍,焦琴琴,牛力瑤,等. 基于深度學習的短時交通流預測[J]. 計算機應用研究,2017,34(1):91-93,97.
[3] 田瑞杰,張維石,翟華偉.? 基于時間序列與BP-ANN的短時交通流速度預測模型研究[J]. 計算機應用研究, 2019, 36(11):3262-3265,3329.
[4] 康軍,段宗濤,唐蕾,等. 一種LS-SVM在線式短時交通流預測方法[J]. 計算機應用研究, 2018, 35(10):2965-2968.
[5] 陳雨嘉,王競慧,韓越,等.? 民航飛行員安全績效的建模與預測——多元線性回歸模型與Elman神經(jīng)網(wǎng)絡模型的比較與應用[J]. 人類工效學, 2019, 25(6):56-62.
[6] 田英杰,蘇運,郭乃網(wǎng),等. 基于時間序列嵌入的電力負荷預測方法[J]. 計算機應用與軟件, 2018, 35(11):55-60,73.
[7] 史云揚,李牧,付野,等. 基于灰色-BP神經(jīng)網(wǎng)絡模型的多情景交通用地需求預測——以長江中游城市群為例[J]. 中國農(nóng)業(yè)大學學報, 2020, 25(6):142-153.
[8] 徐東星,尹勇,張秀鳳,等. 基于改進三參數(shù)灰色模型的海上交通事故預測[J]. 中國航海, 2020, 43(1):12-17.
[9] 曹潔,沈鈞珥,張紅,等. 基于小波和多維重構的BP神經(jīng)網(wǎng)絡交通流短時預測[J]. 計算機應用與軟件,2018,35(12):61-65,82.
[10] 黃曉慧,張翠芳. 布谷鳥算法優(yōu)化小波神經(jīng)網(wǎng)絡的短時交通流預測[J]. 計算機應用與軟件,2017,34(3):238-242.
[11] 曹堉,王成,王鑫,等. 基于時空節(jié)點選擇和深度學習的城市道路短時交通流預測[J/OL]. 計算機應用:1-10.[2020-05-31]. http://kns.cnki.net/kcms/detail/51.1307.TP.20191209.1313.008.html.
[12] 顧兆軍,李冰,劉濤. 基于PSO-Elman模型的網(wǎng)絡流量預測[J]. 現(xiàn)代電子技術, 2019, 42(1):82-86.
[13] 鄺先驗,周揚棟,宋二猛. 基于自適應GA-Elman神經(jīng)網(wǎng)絡的短時交通預測[J]. 計算機仿真,2018,35(7):103-107.
[14] ELMAN J L. Finding structure in time[J]. Cognitive Science, 1990, 14(2):179-211.
[15] HUANG N E, SHE Z, LONG S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].? Proceedings of the Royal Society of London. Series A: Mathematical, Physical and Engineering Sciences, 1998, 454(1971):903-995.
[16] DéGERINE S. Sample partial autocorrelation function of a multivariate time series[J]. Journal of multivariate analysis, 1994, 50(2):294-313.
(責任編輯:黃 健)
收稿日期:2020-08-14
基金項目:云南省萬人計劃項目(109720190106);云南省高層次人才項目(132510978220)
作者簡介:李振國(1994-),男,昆明理工大學理學院碩士研究生,研究方向為數(shù)據(jù)分類與神經(jīng)網(wǎng)絡;徐建新(1983-),男,博士,昆明理工大學冶金與能源工程學院教授,研究方向為數(shù)據(jù)挖掘理論與方法。本文通訊作者:徐建新。