李文勇 李俊卓 王 濤
(桂林電子科技大學建筑與交通工程學院 桂林 541004)
隨著智能交通系統(tǒng)(intelligent traffic system,ITS)的快速發(fā)展,智能交通控制與誘導系統(tǒng)成為ITS研究的熱門課題.準確的交通流量預測是實現(xiàn)智能交通控制與誘導的前提與關鍵.為了適當?shù)乜刂平煌?,需要采取有效的策略來管理交通流量,改善道路交通擁堵,減少環(huán)境污染.
ARIMA模型(auto-regression intergrated moving)對非平穩(wěn)序列的擬合有較好的適用性,但交通流量日變化特性引起的異方差性,使ARIMA模型的擬合殘差被嚴重低估,最終導致模型的擬合精度受到影響.針對這種問題,很多學者在ARIMA模型的基礎上提出改進方法,王曉全[1]提出了一種組合ARIMA-GARCH-M模型,該模型針對時間序列的條件異方差,提出的模型可以有效的消除短期自相關性的引起的條件異方差和隨機波動,但對于交通量日變化引起的長期自相關性的異方差不能有效的消除.韓超等[2]提出了基于線性最小方差預報原理Astrom預報算法與ARIMA預測結合的混合預測方法,譚滿春等[3-4]利用ARIMA與智能算法結合的方式,提出了小波降噪的ARIMA與支持向量機組合的預測方法,以及ARIMA與人工神經(jīng)網(wǎng)絡結合的交通流量預測方法.然而,由于與智能算法的結合,需要迭代計算,引起計算量大,模型解釋性較差的問題[5-6].
文中提出基于Box-Cox指數(shù)變換改進的ARIMA模型改進的交通流預測方法,改進算法針對交流流量序列的日變化引起長期自相關因素引起的異方差,推導了方差齊次轉換函數(shù),該模型具有方法簡單、計算方便、易于解釋等優(yōu)點,能有效的消除長期自相關因素引起的異方差,提高預測精度.
自回歸移動平均模型(auto-regression and moving average model,ARMA)是一種隨機時間序列模型,以最小化協(xié)方差矩陣的方式尋找最優(yōu)的預測值[7-8],相關表達式為
(1)
式中:p,q分別為AR和MA階數(shù);φi,θj為模型的自回歸系數(shù)和移動平均系數(shù);εt為隨機誤差.
由于交通流量具有明顯的日變化(季節(jié)性)不能滿足ARMA模型的平穩(wěn)條件,ARMA模型不能較好的適用于交通流量預測中[7-9].
ARIMA是差分運算與ARMA模型的組合,通過周期為步長的差分預算,可以消除交通流量的日變化趨勢,ARIMA模型為
(2)
圖1 ARIMA模型建模步驟
由于不同時段交通流量方差的不同,E(εt)為同分布的假設仍不能滿足,其模型殘差往往不能通過噪聲檢驗.因此,本文通過尋找時間序列方差齊次轉換函數(shù)使E(εt)轉化為同一分布,具體實施步驟如下.
步驟1交通流量觀察數(shù)據(jù)的預處理 錯誤數(shù)據(jù)的剔除、修復、丟失數(shù)據(jù)的補充.
步驟2尋找Box-Cox變換參數(shù)λ通過對數(shù)據(jù)的分析發(fā)現(xiàn),Box-Cox變換可以明顯地改善交通流量數(shù)據(jù)的正態(tài)性、對稱性和方差相等性,Box-Cox變換是對回歸因變量的變換,其一般形式為
(3)
這里λ是一個變換參數(shù),對不同數(shù)據(jù)要確定變換參數(shù)λ,使得y(λ)滿足
y(λ)=Xβ+e,e~N(0,σ2I)
(4)
一般采用極大似然法確定變換參數(shù),其似然函數(shù)為
(5)
式中:J為變換的Jacobi行列式.
(6)
步驟3尋找交通流量均值和方差之間函數(shù)關系 在求得Box-Cox變換參數(shù)λ后,可以建立交通流量均值與方差的線性回歸方程,為
[Var(μt)]λ=aμt+b
(7)
通過采用最小二乘估計的方法,可以求得回歸參數(shù)a,b.
步驟4尋找方差齊次變換函數(shù) 假設有一個轉化函數(shù)g(·),使轉化后g(xt)滿足方差齊次條件,即
Var[g(xt)]=σ2
(8)
式中:σ2為常數(shù).
將g(xt)在μt附近作一階泰勒展開.
g(xt)≈g(μt)+(xt-μt)g′(μt)
(9)
則有:
Var[g(xt)]≈Var[g(μt)+(xt-μt)g′(μt)]
(10)
Var[g(xt)]=[g′(μt)]2Var(xt)
(11)
Var[g(xt)]=[g(μt)]2h(μt)
(12)
(13)
步驟5將交通流量按求得公式進行方差齊次變換,再利用ARIMA模型依次進行差分、定階、預測、檢驗.
步驟6將預測結果按g-1(μt)進行還原.
為檢驗本文模型交通流量預測的精度,利用重慶市北培路東出口2600號微波檢測器2017年7月19日—8月17日的交通流量觀測數(shù)據(jù)進行驗證,傳感器以5 min為采樣周期,每天共采集288組.
在數(shù)據(jù)預處理后,要探討不同時間段觀察數(shù)據(jù)方差和均值之間的關系.利用似然法求得Box-Cox轉換參數(shù)λ=0.101 010 1,再利用最小二乘法求得線性回歸模型回歸系數(shù),得到交通流量數(shù)據(jù)的方差和均值之間的關系.
[Var(μt)]0.101 010 1=1.856 617+0.001 195μt
(14)
根據(jù)回歸分析結果繪制殘差圖,見圖2.結果顯示經(jīng)過Box-Cox轉換的觀測數(shù)據(jù)能被回歸模型較好的描述.
圖2 回歸分析殘差圖
得到回歸函數(shù)后,進行方差齊次變換,代入式(13),計算的方差齊次函數(shù)為
(15)
由于交通流量序列存在固定日周期變化趨勢,對觀測交通流量序列進行一階288步差分運算,以消除交通流量日變化對交通預測的影響.
為確定ARIMA模型自回歸階數(shù)p和移動平均階數(shù)q,繪制并觀察自相關系數(shù)和偏自相關系數(shù)圖,見圖3.
圖3 交通量序列自相關圖、變自相關圖
根據(jù)時間序列自相關圖與偏自相關圖可以判斷自相關系數(shù)2階截尾、偏自相關系數(shù)拖尾,選擇AR(2)模型對其進行擬合,計算得自相關系數(shù)AR(1)=0.201 8,AR(2)=0.114 0,預測模型為
(1-B288)(1-B)xt=
εt~N(0,0.146 5)
(16)
利用求得預測模型計算出預測交通流量,最后利用g-1(μt)還原交通流量時間序列,并繪制預測圖,見圖4.
圖4 改進ARIMA模型預測結果
利用HlotWinter模型與改進的ARIMA模型的預測結果進行對比.HoltWinter預測結果見圖5.
圖5 HoltWinter模型預測結果
為了能評價和比較仿真實驗結果,使用平均絕對百分誤差(mean absolute percentange error,MAPE)和均方根誤差(root mean square error,RMSE)預測指標:
(17)
(18)
ARIMA預測方法與HlotWinter預測方法的評價指標見表1.
表1 預測評價指標對比
通過對比MAPE和RMSE評價指標,結果表明改進的模型整體上優(yōu)于HoltWinter模型,證明本文模型在進行交通流量預測中預測精度較高.同時,由于改進的ARIMA模型考慮了不同時間段的方差的不同,在低流量時刻ARIMA模型具有更加精確的置信區(qū)間.
1) 提出的改進的ARIMA模型具有較高的預測精度,消除了交通流量序列長期自相關引起的異方差性,相比于非平穩(wěn)預測方法HoltWinter模型,其整體預測結果更加可靠.
2) 由于考慮了交通流量序列長期自相關引起的異方差性,在低流量時段改進的ARIMA模型的方差更小,能提供更準確的置信區(qū)間.
3) 提出的改進模型主要針對交通流量日變化的長期自相關引起的異方差,對于具有短期自相關性的條件異方差沒有充分考慮.對于隨機交通事件,引起的某些時段交通量波動,如何選擇更加合適的改進方式是值得進一步研究的課題.