趙澤輝 康海貴 李明偉 周鵬飛 莫仁杰
(大連理工大學工程建設學部1) 大連 116024) (河南省濟邵高速公路有限公司2) 濟源 454600)
高速公路迅猛發(fā)展,以交通控制與誘導系統(tǒng)為核心的智能交通系統(tǒng)ITS[1]應運而生,而實現(xiàn)ITS的關鍵問題是實時準確的進行交通量預測[2],是進行高速公路的路況分析、事件檢測及預測和預防交通擁堵的先決條件.因此,對高速公路短時交通量的準確實時預測已成為高速公路智能化管理的一個重要環(huán)節(jié).在短時交通量預測方面,大致可以分為兩類:一類是基于確定數(shù)學模型的方法如時間序列預測模型和卡爾曼濾波模型等,另一類是基于知識的智能模型的預測方法如神經(jīng)網(wǎng)絡模型[3]、基于混沌理論的模型[4]等.支持向量回歸機(support vector regression,SVR)采用結(jié)構(gòu)風險最小化原則替代經(jīng)驗風險最小化原則,能根據(jù)有限的樣本信息,在模型的復雜性和學習能力之間尋求最佳折中[5],克服了神經(jīng)網(wǎng)絡算法存在的全局搜索能力差或易收斂于局部最小等缺陷[6],在解決實時性、波動性和非線性問題中表現(xiàn)出許多特有的優(yōu)勢,應用于短時交通量的預測取得了較好的效果[7-8].本文利用遺傳算法(GA)進行Gaussian-SVR模型參數(shù)的優(yōu)選,在預測過程中,綜合考慮了預測路段前幾個時段交通量、天氣因素和出行日期的影響,結(jié)合長濟高速公路某段西行方向的實測交通量進行仿真預測,并進行了對比分析.
設已知訓練集T={(x1,y1),…,(xl,yl)}.式中:xi∈Rd;yi∈R,i=1,2,…,l,損失函數(shù)ε為:c(xi,yi,f(xi))=|yi-f(xi)|ε,其 中:|yi-f(xi)|ε=max{0,|yi-f(xi)|-ε},此時基于ε-損失函數(shù)支持向量回歸機問題為:
式中:ω為d維列向量;C(C>0)為懲罰系數(shù);ζ(*)=(ζ1,ζ*1,…,ζl,ζ*l)為松弛變量.
引入Lagrange函數(shù)
式中:乘子a(*),η(*)≥0,為求它的極小,分別對ω,b和ζ(*)計算偏導數(shù),并同時引入核函數(shù)K(xi,yi),整理后得到問題(1)的對偶問題為
設訓練集T={(x1,y1),…,(xl,yl)}中的樣本點是由一個基本函數(shù)依賴關系ftrue和噪聲產(chǎn)生的,即
當噪聲的密度函數(shù)p(ζi)已知,則在最大似然意義下,最優(yōu)的損失函數(shù)是
證明對式xf?{(x1,y1),…,(xl,yl)}的最大似然估計是
由式(5)和上式,得到
本文采用高斯函數(shù)進行降噪處理,此時噪聲的密度函數(shù)為Gaussian函數(shù),則有
由式(5)知
此時,基于Gaussian損失函數(shù)的SVR為
式中:ω為d維列向量;C(C>0)為懲罰系數(shù);ζ(*)=(ζ1,…,ζl)為松弛變量.
基于Gaussian損失函數(shù)的SVR模型算法步驟為
步驟1設已知訓練集T={(x1,y1),…,
步驟2選擇適當正數(shù)ε和C,以及核函數(shù)K(xi,yi),本文核函數(shù)選為徑向基函數(shù).
步驟3構(gòu)造并求解最優(yōu)化問題
得到最優(yōu)解a(*)=(a1,…,ai;,…,).
步驟4構(gòu)造決策函數(shù)
式中:按下式計算,選擇位于開區(qū)間(0,C/l)中的2個分量或,若選到的是,則
若選到的是,則
考慮到Gaussian-SVR參數(shù)的選取在一定程度上影響著模型的精度,本文應用遺傳算法對Gaussian-SVR參數(shù)ε,C和δ2進行優(yōu)選.
以訓練結(jié)束后返回的回歸序列方差的倒數(shù)作為進化個體的適應值fitness
式中:n為輸入樣本個數(shù);Y1(t)為回歸序列;Y(t)為實際序列值.GA-Gaussian-SVR預測模型的計算步驟如下.
步驟1歸一化處理.對實測量數(shù)據(jù)集和Gaussian-SVR參數(shù)的初始區(qū)間按式(12)進行歸一化處理.
步驟2初始化父代群體.設種群規(guī)模為m,隨機生成父代群體y(j,i)(j=1,2,3;i=1,2,…,m),本文取m=50,其中y(j,i)為第i個父代染色體上的第j個基因.
步驟3模型訓練.以生成的每個染色體上的基因作為Gaussian-SVR參數(shù),訓練Gaussian-SVR模型,計算相應的回歸序列,并根據(jù)回歸序列按式(11)計算染色體的適應度值.
步驟4終止判斷.判斷當前種群中最優(yōu)個體是否滿足終止準則,若滿足轉(zhuǎn)入步驟7,否則轉(zhuǎn)入步驟5,進化代數(shù)g=g+1.終止準則采用最大進化代數(shù)Gmax與相鄰進化代數(shù)最優(yōu)個體適應值相對誤差E相結(jié)合.
步驟5選擇、交叉和變異.根據(jù)步驟3計算所得的染色體的適應度值,進行選擇、交叉和變異操作.
步驟6生成子代新個體.由步驟5得到的3m個子代個體,按照其適應值fitness從大到小進行排序,取排在最前面的m個子代個體作為新的父代群體.轉(zhuǎn)入步驟3進入下一輪演化過程.
步驟7模型預測.以當前種群中最優(yōu)個體的染色體基因ε,和δ作為Gaussian-SVR參數(shù)訓練模型,輸入待測樣本,輸出預測值.
計算流程見圖1.
圖1 算法流程圖
交通流具有流體的特性,在時間上的分布是連續(xù)的,某路段下一時刻的交通量與本路段前幾個時段的交通量有著必然的聯(lián)系,所以可以利用本路段前幾個時段的交通量數(shù)據(jù)預測該路段下一時段的交通量,t表示交通量觀測的當前時段,Y(t-3),Y(t-2),Y(t-1),Y(t)為預測路段前4個時段的交通量,Y(t+1)為預測路段下一時段的交通量,因此,該路段t+1時刻交通量Y(t+1)的大小受交通量Y(t-3),Y(t-2),Y(t-1),Y(t)共同作用的影響.
考慮到高速公路通行在很大程度上受到天氣變化的影響,引入第五個輸入?yún)?shù)X1(t),X1(t)其量化方法為大雪或大雨雪為1,小雪或小雨雪為0.75,大雨為0.5,小雨為0.25,晴或多云為0.同時人們出行習慣也會對高速公路交通量產(chǎn)生影響,交通量以周為周期,在每周的不同天中,可能具有不同的變化規(guī)律,特別是在周末通行量會增多.因此,將出行日期作為模型的第六個輸入?yún)?shù)X2(t).其量化方法為周一為1/7,周二為2/7,周三為3/7,周四為4/7,周五為5/7,周六為6/7,周日為7/7.至此,得到了影響預測路段下一時段交通量的6個影響因素X,作為模型的的輸入向量.
本文試驗部分采用長濟高速公路濟源市內(nèi)某路段西行方向的交通量檢測儀于2009-06-01至2010-06-07一周內(nèi)獲取交通量數(shù)據(jù),采集時段為10min,選取240組交通量數(shù)據(jù)并對其相應的天氣和獲取日期進行量化處理,組成模型訓練樣本集,選取40組數(shù)據(jù)作為測試樣本集.
利用 Matlab 7.1編制 GA-Gaussian-SVR模型程序,運行環(huán)境為:Core(TM)2CPU,1.81 MHz,2GB 內(nèi) 存 的 微 機,操 作 系 統(tǒng):WindowsXP.模 型 初 始 值:C的 取 值 范 圍 為 [1,2 000],ε的取值范圍為[0,2 000],δ的取值范圍為[0,20],最大進化代數(shù)Gmax=1 000,鄰代最優(yōu)個體適應值相對誤差E=0.000 1.應用本文提出的模型,經(jīng)過訓練得到全局參數(shù)最優(yōu)組合為C=213,ε=41和δ=0.23.將優(yōu)化后的模型用于測試樣本集的交通量預測.實際交通量與模型仿真輸出流量的對比圖和部分實際交通量與模型預測結(jié)果見圖2和表1,結(jié)果表明,預測結(jié)果曲線與實際交通量的變化曲線基本吻合,絕對誤差值基本控制在[-7,7]區(qū)間內(nèi),只有少量超出這個范圍,預測結(jié)果達到了預期的預測效果.
圖2 GA-Gaussian-SVR模型訓練效果圖
表1 部分實測流量與模型預測流量結(jié)果pcu/(10min)
為了比較GA-Gaussian-SVR模型的預測性能,本文選擇文獻[3]提出的PSO-BP神經(jīng)網(wǎng)絡模型、文獻[8]中提出的 WA-SVM預測模型和文獻[7]提出的G-SVR預測模型進行對比分析.為了使對比模型具有可比性,4個模型均在同一臺微機上進行計算,均使用matlab 7.1進行編程.考慮到尋優(yōu)次數(shù)的增加也會提高優(yōu)化效果,對比模型參數(shù)的選取應保證每個模型的最大尋優(yōu)次數(shù)相同,對PSO-BP神經(jīng)網(wǎng)絡模型優(yōu)選次數(shù)的設定,應綜合考慮PSO算法和BP神經(jīng)網(wǎng)絡的尋優(yōu)次數(shù),保證與GA算法具有相同的最大優(yōu)選次數(shù),對WA-SVM預測模型參數(shù)的選擇,進行多次交叉試算,盡可能的保證SVR參數(shù)的選擇精度.并采用以下3個評價指標進行性能對比分析
1)平均絕對相對誤差
2)最大絕對相對誤差
3)均方根誤差
設定對比模型參數(shù),結(jié)合實測交通量數(shù)據(jù)分別進行模型訓練,并對測試樣本進行預測,將預測結(jié)果分別進行誤差指標處理,處理結(jié)果如表2所列.
表2 預測誤差指標比較 %
從表2中可以看出,在逼近原始流量序列的能力方面,SVM的預測方法明顯優(yōu)于PSO-BP神經(jīng)網(wǎng)絡模型.在對基于不同損失函數(shù)的SVM比較方面,采用高斯損失函數(shù)GA-Gaussian-SVR模型的誤差指標值均優(yōu)于GA-SVR模型,說明在交通量序列中存在著成正態(tài)分布的噪聲,基于Gaussian損失函數(shù)的Gaussian-SVR模型對序列中的噪聲進行了有效的處理,提高了模型的預測精度.在對噪聲處理比較方面,本文提出的模型的預測精度略低于 WA-SVM模型,但小波分析過程復雜,不利于ITS系統(tǒng)自動操作,特別是對于實時交通量預測而言,在保證一定精度的范圍內(nèi),操作的復雜程度和時間消耗更值得關注,從這個意義上講,本文提出的模型更適用于高速公路短時交通量預測.
從上述實例對比分析中可以看出:采用結(jié)構(gòu)風險最小化原則的SVR模型克服了神經(jīng)網(wǎng)絡模型存在的全局搜索能力差或易收斂于局部最小等缺陷,取得了較好的預測效果,Gaussian損失函數(shù)的引入彌補了SVR模型無法對序列內(nèi)噪聲進行有效處理的不足,從而進一步提高了模型的預測精度.針對運行時間開銷主要取決于模型參數(shù)的尋優(yōu)階段,應用GA進行Gaussian-SVR模型參數(shù)的優(yōu)選,縮短模型尋優(yōu)階段的時間,提高尋優(yōu)效率,更適合于系統(tǒng)一定時段內(nèi),利用新的數(shù)據(jù)進行模型參數(shù)的自動更新.在預測過程中,本文綜合考慮了長濟高速公路西行方向前四個時段的交通量、天氣和出行日期6個因素的影響,為對交通量進行精確預測提供數(shù)據(jù)保障,實例分析過程中,實測流量與模型預測流量非常接近,達到了模型的預期效果,表明該模型適用于對高速公路短時交通流的預測.
[1]Mark D B.Peering into the future:peer-to-pee technology as a model for fistributed joint battlespace intelligence dissemination and operational tasking[D].Maxwell Field,Alabama,USA:PhD's Thesis of School of Advanced Airpower Studies,Air University,2001.
[2]David P J.Rationality and self-interest in peer to peer networks[A].Proceedings of the 2nd International Workshop on Peer-to-PeerSystems IPTPS'03[C]//Claremont Hotel, Berkeley, CA, USA:Springer press,2003.
[3]葉 嫣,呂智林.基于粒子群優(yōu)化的神經(jīng)網(wǎng)絡短時交通流量預測[J].計算機工程與設計,2009,30(18):4 296-4 299.
[4]郭 敏,藍金輝,肖 翔,等.基于混沌理論對北京二環(huán)路進行短時交通流量預測的研究[J].交通運輸系統(tǒng)工程與信息,2010,10(2):107-110.
[5]Vapnik V.The nature of statistical learning theory[M].New York:Springer,1995.
[6]Cao J R,Cai A N.A robust shot transition detection method based on support vector machine in compressed domain[J].Pattern Recognition Letters,2007,28(12):1 534-1 540.
[7]任其亮,謝小淞,彭其淵.城市道路交通量短時預測的GSVMR模型[J].公路交通科技,2008,2(52):135-138.
[8]朱勝雪,周 君,包 旭.基于小波分解-支持向量機的短時交通量預測[J].蘇州科技學院學報:工程技術版,2007,20(3):80-85.