羅中萍 寧 丹
(中設(shè)設(shè)計(jì)集團(tuán)股份有限公司 南京 210001)
近年來(lái),隨著智能交通系統(tǒng)(ITS)的快速發(fā)展,主動(dòng)式交通管理和控制逐漸成為ITS的發(fā)展核心。作為主動(dòng)式交通管理的關(guān)鍵技術(shù),短時(shí)交通流預(yù)測(cè)在交通系統(tǒng)的日常運(yùn)營(yíng)與管理中發(fā)揮著重要的作用。
短時(shí)交通流預(yù)測(cè),就是合理地根據(jù)當(dāng)前交通流變化規(guī)律,推測(cè)未來(lái)一定時(shí)間范圍內(nèi)的交通流,從而實(shí)現(xiàn)提前的主動(dòng)式交通管控。短時(shí)交通流預(yù)測(cè)的時(shí)間跨度一般認(rèn)為不超過(guò)15 min。短時(shí)交通流預(yù)測(cè)的研究從20世紀(jì)60年代開(kāi)始,到目前已發(fā)展出了眾多的預(yù)測(cè)模型,總的來(lái)說(shuō),目前常用的預(yù)測(cè)模型主要包括:歷史平均[1]、時(shí)間序列[2-3]、卡爾曼濾波[4]、神經(jīng)網(wǎng)絡(luò)[5]、支持向量機(jī)[6]、非參數(shù)回歸[7]、小波理論[8-9]等。除了單一的預(yù)測(cè)方法或模型,組合預(yù)測(cè)也是短時(shí)交通流預(yù)測(cè)的一個(gè)重要研究方向,組合預(yù)測(cè)利用多種預(yù)測(cè)方法或模型從不同的理論角度對(duì)交通流的特點(diǎn)進(jìn)行挖掘,旨在獲得較高的預(yù)測(cè)精度。
相比較單一的預(yù)測(cè)方法或模型,組合預(yù)測(cè)在短時(shí)交通流預(yù)測(cè)中的研究起步較晚,開(kāi)始于20世紀(jì)90年代。利用組合預(yù)測(cè)進(jìn)行短時(shí)交通流預(yù)測(cè),主要涉及2個(gè)問(wèn)題:①單項(xiàng)預(yù)測(cè)方法的選擇;②權(quán)重的分配。目前,大部分的文獻(xiàn)主要集中在多個(gè)預(yù)測(cè)方法或模型的權(quán)重分配。Zheng等[10]利用BP神經(jīng)和RBF神經(jīng)網(wǎng)絡(luò)構(gòu)建了組合預(yù)測(cè)模型,利用自適應(yīng)啟發(fā)式算法實(shí)現(xiàn)組合預(yù)測(cè)模型權(quán)值的分配。Stathopoulos等[11]利用卡爾曼濾波和神經(jīng)網(wǎng)絡(luò)構(gòu)建了組合預(yù)測(cè)模型,利用基于模糊規(guī)則的方法實(shí)現(xiàn)卡爾曼濾波模型和神經(jīng)網(wǎng)絡(luò)模型的非線性加權(quán)組合。Tan等[12]提出利用移動(dòng)平均、指數(shù)平滑和ARIMA對(duì)交通流時(shí)間序列進(jìn)行建模及預(yù)測(cè),并利用神經(jīng)網(wǎng)絡(luò)進(jìn)行組合預(yù)測(cè)權(quán)值的分配。陳淑燕等[13]使用3種不同的神經(jīng)網(wǎng)絡(luò)構(gòu)成集成預(yù)測(cè)模型,即將2個(gè)神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果,作為新的神經(jīng)網(wǎng)絡(luò)的輸入,從而實(shí)現(xiàn)組合預(yù)測(cè)模型權(quán)值得分。徐建閩等[14]利用灰色模型和四次多項(xiàng)式構(gòu)建組合預(yù)測(cè)模型,然后利用RBF神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)組合預(yù)測(cè)模型的權(quán)重分配??偟膩?lái)說(shuō),在短時(shí)交通流預(yù)測(cè)中,組合預(yù)測(cè)模型權(quán)值的分配幾乎都是采用機(jī)器學(xué)習(xí)算法或啟發(fā)式算法來(lái)實(shí)現(xiàn)的,這可能會(huì)導(dǎo)致分配的權(quán)值出現(xiàn)負(fù)值或大于1的情況,從組合預(yù)測(cè)的實(shí)際意義上來(lái)說(shuō)這是不符合實(shí)際情況的。
因此,本文針對(duì)短時(shí)交通流組合預(yù)測(cè),提出一個(gè)短時(shí)交通流回歸組合預(yù)測(cè)模型,在充分發(fā)揮各單項(xiàng)預(yù)測(cè)模型優(yōu)勢(shì)的前提下,保證組合預(yù)測(cè)模型分配到的權(quán)值滿足:權(quán)值之和等于1,每個(gè)權(quán)值不為負(fù)值且小于或等于1。
在短時(shí)交通流預(yù)測(cè)中,對(duì)于交通流時(shí)間序列xt(t=1,2,…,N),假設(shè)有m種單項(xiàng)預(yù)測(cè)方法,設(shè)第i種單項(xiàng)預(yù)測(cè)方法在t時(shí)刻的預(yù)測(cè)值為xit,其中:i=1,2,…,m,t=1,2,…,N,那么組合預(yù)測(cè)模型就可以表示為
(1)
(2)
(3)
在式(3)中,加權(quán)系數(shù)應(yīng)滿足
l1+l2+…+lm=1
(4)
令Y=(x1,x2,…,xN)T;E=(e1,e2,…,eN)T;L=(l1,l2,…,lm)T;R=(1,1,…,1)T,R是元素全為1的m維列向量,那么式(3)和(4)可以表示為
(5)
式(5)中,X為一個(gè)N×m維的向量,表示為
(6)
(7)
(8)
在組合預(yù)測(cè)模型權(quán)系數(shù)分配之后,若發(fā)現(xiàn)存在權(quán)系數(shù)接近于零,則需要對(duì)權(quán)系數(shù)進(jìn)行顯著性檢驗(yàn),以保證組合預(yù)測(cè)模型中的每個(gè)預(yù)測(cè)方法在一定置信水平下具有顯著意義。
構(gòu)建原假設(shè)為:H0:li=0,1≤i≤m。若接受原假設(shè)H0,表明第i種預(yù)測(cè)方法與組合預(yù)測(cè)無(wú)顯著關(guān)系,這說(shuō)明可以去掉第i種預(yù)測(cè)方法,否則表明不能去掉第i種預(yù)測(cè)方法。
(9)
(10)
當(dāng)假設(shè)H0成立時(shí),Ti服從自由度為(N-m-1)的t分布,檢驗(yàn)假設(shè)H0的拒絕域?yàn)?/p>
wα={‖t‖≥ta/2(N-m-1)}
(11)
式中:α為顯著性水平。因此,當(dāng)|Ti| BP神經(jīng)網(wǎng)絡(luò)是一個(gè)應(yīng)用廣泛的神經(jīng)網(wǎng)絡(luò)模型,在短時(shí)交通流預(yù)測(cè)中通常使用3層網(wǎng)絡(luò)結(jié)構(gòu),即1個(gè)輸入層、1個(gè)隱含層和1個(gè)輸出層[16]。BP神經(jīng)網(wǎng)絡(luò)的最大特點(diǎn)是,在3層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中信號(hào)正向傳播、誤差反向傳播,正向傳播時(shí),輸入樣本從輸入層傳入,經(jīng)過(guò)隱含層處理后傳向輸出層。若輸出層與期望的輸出不符,則將輸出誤差通過(guò)隱含層向輸入層逐層反傳,將誤差分?jǐn)偨o各層所有單元,以此作為修正各單元權(quán)值的依據(jù)。 假設(shè)輸入向量為:Xk=(x1,x2,…,xn),k=1,2,…,m。對(duì)應(yīng)輸入模式的輸出向量為Yk=(y1,y2,…,yp), 其中p為輸出層單元數(shù)。隱含層各單元的輸入為 (12) 式中:Wij為輸入層至隱層的連接權(quán)重;θj為隱層單元的閾值;q為隱含層單元的個(gè)數(shù)。轉(zhuǎn)移函數(shù)采用Sigmoid函數(shù)f(x)=1/(1+e-x),則隱含層單元的輸出為 (13) 在誤差反傳過(guò)程中,按照梯度下降原理,不斷調(diào)整權(quán)值。按推導(dǎo)出的調(diào)整量對(duì)輸出層和隱含層的權(quán)值和閾值作出調(diào)整,這樣整個(gè)模型完成一次學(xué)習(xí)。 RBF神經(jīng)網(wǎng)絡(luò)也是一種在短時(shí)交通流預(yù)測(cè)中應(yīng)用廣泛的神經(jīng)網(wǎng)絡(luò)模型,它與BP神經(jīng)網(wǎng)絡(luò)的不同之處在于,RBF神經(jīng)網(wǎng)絡(luò)在隱含層中采用徑向基函數(shù)處理連接網(wǎng)絡(luò)權(quán)值的傳遞,常用的徑向基函數(shù)是高斯函數(shù),因此,RBF神經(jīng)網(wǎng)絡(luò)的激活函數(shù)可以表示為 (14) 式中:‖xp-ci‖為歐式范數(shù);ci為高斯函數(shù)的中心;σ2為高斯函數(shù)的方差。RBF神經(jīng)網(wǎng)絡(luò)的輸出可以表示為 j=1,2,…,n (15) 式中:xp=(x1,x2,…,xm)為神經(jīng)網(wǎng)絡(luò)的輸入;p為樣本數(shù)量;ci為網(wǎng)絡(luò)隱含層節(jié)點(diǎn)的中心;wij為隱含層與輸出層的連接權(quán)值;i為隱含層節(jié)點(diǎn)數(shù);yi為輸出值。RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程、網(wǎng)絡(luò)權(quán)值計(jì)算過(guò)程與BP神經(jīng)網(wǎng)絡(luò)一致。 在短時(shí)交通流預(yù)測(cè)中,時(shí)間序列模型是一種常用的參數(shù)類(lèi)預(yù)測(cè)方法,主要包括自回歸(auto-regressive,AR)模型、移動(dòng)平均(moving-average,MA)模型和自回歸移動(dòng)平均(auto-regressive and moving-average,ARMA)模型。ARMA是一種隨機(jī)時(shí)間序列模型,以最小化協(xié)方差矩陣的方式尋找最優(yōu)的預(yù)測(cè)值。設(shè)時(shí)間序列中Xt是一個(gè)依賴相鄰數(shù)據(jù)和隨機(jī)項(xiàng)的函數(shù),相關(guān)表達(dá)式為 (16) 式中:p和q分別為AR模型和MA模型的階數(shù);φi和θj分別為模型的自回歸系數(shù)和移動(dòng)平均系數(shù);at-j為隨機(jī)誤差項(xiàng)。在時(shí)間序列分析中,ARIMA是ARMA模型的延伸,可用來(lái)預(yù)測(cè)非平穩(wěn)時(shí)間序列,ARIMA模型通常定義為ARIMA(p,d,q),如下 φ(B)dXt=θ(B)at (17) 式中:d為平穩(wěn)過(guò)程中的差分階數(shù);B為滯后算子;為差分。對(duì)于時(shí)間序列模型ARIMA(p,d,q),模型的階數(shù)由時(shí)間序列的自相關(guān)和偏相關(guān)系數(shù)確定。 為了定量的評(píng)價(jià)組合預(yù)測(cè)模型的預(yù)測(cè)精度,采用常用的誤差指標(biāo),即均方差誤差百分比(MAPE)和均方根誤差(RMSE)這2個(gè)指標(biāo)的計(jì)算方法分別見(jiàn)式(18)、(19)。 (18) (19) 本文使用的交通流數(shù)據(jù)來(lái)源于美國(guó)西雅圖高速公路上的3個(gè)線圈檢測(cè)基站(基站14015、14016和4064),以及中國(guó)南京城市道路上的3個(gè)視頻檢測(cè)基站(基站6024、6025和6057)。借鑒Edie的研究成果[17-18],把采集到的原始交通數(shù)據(jù)匯集為15 min間隔的數(shù)據(jù),在進(jìn)行原始數(shù)據(jù)匯集時(shí),利用簡(jiǎn)單插值的方法對(duì)缺失值進(jìn)行填補(bǔ)。本文所使用的實(shí)驗(yàn)數(shù)據(jù)信息見(jiàn)表1。 表1 采集的交通數(shù)據(jù)基本信息 一般來(lái)說(shuō),交通流序列具有典型的周期性,分別選擇基站14015和基站6024上連續(xù)7 d的交通流數(shù)據(jù),交通流序列變化的特點(diǎn)見(jiàn)圖1,西雅圖高速路和南京城市道路上的交通流均呈現(xiàn)出明顯的周期性,并且工作日(周一-周五)的交通流展現(xiàn)出了明顯的雙峰現(xiàn)象,周末(周六和周日)的交通流則展現(xiàn)出單峰現(xiàn)象。利用這些特性,為了構(gòu)建組合預(yù)測(cè)模型,將采集到的交通流數(shù)據(jù),劃分為3個(gè)部分(訓(xùn)練數(shù)據(jù)、標(biāo)定數(shù)據(jù)和測(cè)試數(shù)據(jù)),它們分別用于確定單一的預(yù)測(cè)模型、確定組合權(quán)重系數(shù)、測(cè)試組合預(yù)測(cè)模型的精度,具體的數(shù)據(jù)劃分情況見(jiàn)表2。 圖1 連續(xù)7 d的交通流序列示意 表2 數(shù)據(jù)劃分使用情況 根據(jù)已有的研究,時(shí)間序列的模型確定為ARIMA(2,1,2)。對(duì)于BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò),分別構(gòu)建三層的網(wǎng)絡(luò)結(jié)構(gòu),其中,輸入層的節(jié)點(diǎn)數(shù)為5,隱含層的節(jié)點(diǎn)數(shù)為12,輸出層的節(jié)點(diǎn)數(shù)為1,選擇Levernberg-Marquart作為訓(xùn)練算法,BP神經(jīng)網(wǎng)絡(luò)的傳遞函數(shù)為tansig。需要注意的是,神經(jīng)網(wǎng)絡(luò)的輸出數(shù)據(jù)為當(dāng)前時(shí)刻的交通流及前4個(gè)時(shí)刻的交通流,輸出數(shù)據(jù)為下一時(shí)刻的交通流。在此基礎(chǔ)上,根據(jù)表2劃分的數(shù)據(jù)情況,分別進(jìn)行確定單一的預(yù)測(cè)模型、確定組合權(quán)重系數(shù)、測(cè)試組合預(yù)測(cè)模型的精度。 根據(jù)式(8)和(10),進(jìn)行組合預(yù)測(cè)模型的權(quán)值分配,并對(duì)分配的權(quán)值進(jìn)行顯著性檢驗(yàn),最終組合預(yù)測(cè)模型的權(quán)系數(shù)見(jiàn)表3,由表3可見(jiàn),BP神經(jīng)網(wǎng)、RBF神經(jīng)網(wǎng)絡(luò)和ARIMA模型的系數(shù)均不為0,且權(quán)值之和為1。 表3 組合預(yù)測(cè)模型的權(quán)系數(shù) 與單項(xiàng)預(yù)測(cè)模型相比較,組合預(yù)測(cè)模型的精度見(jiàn)表4??梢钥闯?個(gè)基站上組合預(yù)測(cè)模型的精度MAPE分別為9.05%,10.56%和8.87%,9.58%,8.99%,10.06%,RMSE分別為87.54,93.25,85.45,78.80,72.01和96.68,均高于單一預(yù)測(cè)模型的預(yù)測(cè)精度。這表明本文所提出的組合預(yù)測(cè)模型的精度,高于常規(guī)的單項(xiàng)預(yù)測(cè)模型的精度,可以在一定程度上彌補(bǔ)單一預(yù)測(cè)模型的不足,提高預(yù)測(cè)精度。 表4 預(yù)測(cè)精度比較 在短時(shí)交通流量預(yù)測(cè)中,由于交通流的隨機(jī)性和高度非線性,單純利用某一種預(yù)測(cè)方法,難以自始至終滿足主動(dòng)式管理的精度要求。 本文基于最優(yōu)化理論,提出了利用BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)和時(shí)間序列,來(lái)構(gòu)建組合預(yù)測(cè)模型,并對(duì)組合預(yù)測(cè)模型的權(quán)值進(jìn)行顯著性檢驗(yàn),達(dá)到提高短時(shí)交通流預(yù)測(cè)精度的目的。通過(guò)現(xiàn)實(shí)中采集得到的交通流數(shù)據(jù),驗(yàn)證了提出組合預(yù)測(cè)模型具有普遍的有效性,其預(yù)測(cè)精度均高于單一的預(yù)測(cè)模型。1.3 BP神經(jīng)網(wǎng)絡(luò)
1.4 RBF神經(jīng)網(wǎng)絡(luò)
1.5 時(shí)間序列模型
1.6 評(píng)價(jià)指標(biāo)
2 實(shí)例分析
2.1 數(shù)據(jù)
2.2 組合預(yù)測(cè)模型權(quán)系數(shù)的確定
2.3 精度比較
3 結(jié)論