趙文忠,耿立艷,梁毅剛,張占福
(1.河北曲港高速公路開發(fā)有限公司,河北保定071000;2.石家莊鐵道大學(xué)經(jīng)濟(jì)管理學(xué)院,石家莊050043;3.石家莊鐵道大學(xué)四方學(xué)院,石家莊051132)
高速公路服務(wù)水平的準(zhǔn)確、實(shí)時(shí)判別,不僅需要對(duì)交通流進(jìn)行實(shí)時(shí)預(yù)測(cè),而且要根據(jù)實(shí)際情況對(duì)道路服務(wù)水平進(jìn)行合理劃分及準(zhǔn)確判別,這既有利于出行者根據(jù)道路信息合理安排出行路線,也對(duì)后期的高速公路交通控制管理有至關(guān)重要的作用.高速公路的服務(wù)水平判別方法的關(guān)鍵是采用合適的服務(wù)水平劃分及判別方法.美國(guó)利用車流密度對(duì)高速公路的服務(wù)水平進(jìn)行劃分[1],德國(guó)將平均速度作為干線公路服務(wù)水平的評(píng)價(jià)指標(biāo),日本則將流量與通行能力的比值作為服務(wù)水平劃分的依據(jù)[2].王華榮等[3]使用灰色系統(tǒng)理論評(píng)價(jià)道路服務(wù)水平;韓斌[4]基于交通量的預(yù)測(cè)實(shí)現(xiàn)了對(duì)高速公路服務(wù)水平的分析.以上成果僅根據(jù)現(xiàn)有交通流參數(shù)的影響實(shí)現(xiàn)對(duì)高速公路服務(wù)水平的劃分及判別,得到的高速公路服務(wù)水平并不具有實(shí)時(shí)性,且并未實(shí)現(xiàn)對(duì)多種交通信息的整合,難以保證交通信息發(fā)布的時(shí)效性.高速公路服務(wù)水平的實(shí)時(shí)預(yù)測(cè)主要是預(yù)測(cè)交通流參數(shù),國(guó)內(nèi)外學(xué)者提出的不同交通流短時(shí)預(yù)測(cè)模型,均可用于高速公路交通流預(yù)測(cè).Ghosh等[5]利用自回歸移動(dòng)平均(ARIMA)模型預(yù)測(cè)公路交通流.Vlahogianni等[6]驗(yàn)證了神經(jīng)網(wǎng)絡(luò)在交通流預(yù)測(cè)方面的有效性.傅貴等[7]構(gòu)建了基于支持向量機(jī)的短時(shí)交通流量預(yù)測(cè)模型,并證明了其可行性和有效性.熊志華等[8]采用粒子群優(yōu)化的多維混沌時(shí)間序列預(yù)測(cè)道路網(wǎng)多個(gè)斷面的交通流,獲得了較好的多斷面短時(shí)交通流預(yù)測(cè)效果.
綜上所述,目前對(duì)高速公路服務(wù)水平的劃分與判別方法和交通流參數(shù)短時(shí)預(yù)測(cè)方法結(jié)合起來的研究較少,此外,現(xiàn)有研究中,大多數(shù)高速公路交通流參數(shù)預(yù)測(cè)方法僅考慮其隨時(shí)間的變化趨勢(shì),而對(duì)天氣、出行日期等不定性因素引起的變化欠考慮.本文在考慮多種影響因素的基礎(chǔ)上,構(gòu)建基于多維數(shù)據(jù)的高速公路服務(wù)水平實(shí)時(shí)判別模型,實(shí)現(xiàn)對(duì)高速公路服務(wù)水平的參數(shù)預(yù)測(cè)及實(shí)時(shí)判別,為實(shí)時(shí)交通信息的融合與處理提供理論基礎(chǔ),為基于大量數(shù)據(jù)的智能交通管理與控制提出方法依據(jù).
高速公路服務(wù)水平劃分模型利用模糊C均值(Fuzzy C-means,FCM)劃分高速公路水平.設(shè)有n個(gè)樣本的數(shù)據(jù)集X={x1,x2,…,xn},將樣本分為c類,1<c<n,對(duì)任意xi∈X,其特征向量xi=(vi,ki),vi,ki分別表示第i個(gè)樣本的速度、密度.根據(jù)目標(biāo)函數(shù)最小化獲得高速公路各類服務(wù)水平的聚類中心,以隸屬度函數(shù)定義的目標(biāo)函數(shù)為
約束條件為
式中:uij為第j個(gè)樣本對(duì)于第i類的隸屬度函數(shù),為c×n階模糊分類矩陣;為2×c階聚類中心矩陣;ah為第h個(gè)高速公路服務(wù)水平聚類中心的特征向量且;m為模糊加權(quán)指數(shù);,為第j個(gè)樣本xj到第i類ai的歐氏距離;J(U,A)為各類樣本到高速公路各類服務(wù)水平聚類中心的加權(quán)值,根據(jù)聚類準(zhǔn)則求得
以上算法的實(shí)現(xiàn)步驟如下:
Step 1設(shè)定q為迭代運(yùn)算次數(shù),給出迭代標(biāo)準(zhǔn)ε>0,隸屬度矩陣計(jì)算公式如式(8)所示.如果存在,使得,則令
Step 2設(shè)聚類中心的迭代運(yùn)算為
Step 3用1個(gè)矩陣范數(shù)||?||比較a(q+1)與a(q),若滿足式(10),則停止迭代,得到高速公路各類服務(wù)水平的聚類中心矩陣為A=[a1,…,ah,…,ac];否則,q=q+1,轉(zhuǎn)Step1.
最小二乘支持向量機(jī)(LS-SVM)是一種改進(jìn)型支持向量機(jī),它將支持向量機(jī)的二次規(guī)劃問題轉(zhuǎn)化為求解線性方程組問題,不僅提高了求解問題的速度與收斂精度,而且獲得了很好的推廣性能[9].本文的高速公路服務(wù)水平劃分由交通流速度和密度兩個(gè)因素確定,從而高速公路服務(wù)水平的預(yù)測(cè)需確定交通流速度和密度兩個(gè)參數(shù).考慮時(shí)間、天氣及出行日期等多因素,選用LS-SVM預(yù)測(cè)交通流速度和密度兩個(gè)參數(shù).以速度為例建立預(yù)測(cè)模型.
式中:φ(xi)為高維特征空間映射函數(shù),實(shí)現(xiàn)對(duì)輸入變量的變換;ω為權(quán)矢量;b為常數(shù).根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,用于函數(shù)估計(jì)的LS-SVM問題可以表示為
定義拉格朗日函數(shù)為
定義核函數(shù)K(x,xi)=φ(x)φ(xi),結(jié)合庫(kù)恩—卡特條件,將式(12)轉(zhuǎn)化為1組線性方程為
根據(jù)式(14)可求δ*=[δ1*,δ2*,…,δl*]和b*,則 LSSVM函數(shù)估計(jì)模型為
構(gòu)造LS-SVM模型時(shí),引入RBF核函數(shù),即
根據(jù)上述方法可得到速度的預(yù)測(cè)結(jié)果函數(shù),同理可得密度的預(yù)測(cè)結(jié)果.
利用高速公路服務(wù)水平劃分模型獲得各個(gè)分類聚類中心,基于高速公路服務(wù)水平判別參數(shù)預(yù)測(cè)模型,預(yù)測(cè)交通流速度和密度兩個(gè)參數(shù),并建立高速公路服務(wù)水平判別模型預(yù)測(cè)其服務(wù)水平.高速公路服務(wù)水平判別模型為
式中:xp表示第p個(gè)高速公路服務(wù)水平預(yù)測(cè)樣本數(shù);vp和kp分別表示第p個(gè)高速公路服務(wù)水平預(yù)測(cè)樣本的速度與密度;ag為第g類高速公路服務(wù)水平的聚類中心;vag和kag分別表示此類服務(wù)水平聚類中心的速度與密度;β1和β2分別表示速度與密度對(duì)服務(wù)水平分類的影響權(quán)重,且0≤β1≤1,0≤β2≤1,β1+β2=1.
河北省初步建立了全省交調(diào)數(shù)據(jù)中心,建成交通情況調(diào)查站663個(gè).交調(diào)站配備了線圈、微波、視頻等具有連續(xù)采集數(shù)據(jù)和數(shù)據(jù)遠(yuǎn)程傳輸?shù)淖詣?dòng)交調(diào)儀器,自動(dòng)實(shí)時(shí)采集道路交通量、車速等數(shù)據(jù)指標(biāo),然后通過網(wǎng)絡(luò)將數(shù)據(jù)傳輸?shù)浇y(tǒng)一的數(shù)據(jù)中心,完成調(diào)查實(shí)時(shí)數(shù)據(jù)的接收.本文從“河北省公路交通情況調(diào)查系統(tǒng)”下載得到河北省高速公路10個(gè)觀測(cè)站2016年8~10月,周期為5 min的單方向交通流數(shù)據(jù)264 960組;2016年11月1日、2016年11月6日全天,周期為5 min的單方向數(shù)據(jù)5 760組;以及2016年11月22日某一觀測(cè)站的全天,周期為5 min的單方向數(shù)據(jù)288組;共計(jì)271 008組樣本,進(jìn)行實(shí)例驗(yàn)證.設(shè)備的采集間隔為5 min,采集的速度及密度數(shù)據(jù)都是瞬時(shí)數(shù)據(jù),其中速度定義為車輛在某瞬時(shí)行駛的快慢和方向的矢量,單位為km/h;密度定義為某瞬時(shí)單位長(zhǎng)度1條車道上的車輛數(shù),單位為pcu/km.由于觀測(cè)站收集數(shù)據(jù)時(shí)會(huì)產(chǎn)生少量的錯(cuò)誤數(shù)據(jù),采用閾值分析和基本的交通流理論對(duì)數(shù)據(jù)進(jìn)行適當(dāng)?shù)暮Y選與處理,最終獲得的有效樣本的訓(xùn)練數(shù)據(jù)237 360組,預(yù)測(cè)數(shù)據(jù)6 048組.如果速度和密度的任何一個(gè)值為0時(shí),便認(rèn)為是錯(cuò)誤數(shù)據(jù),應(yīng)進(jìn)行剔除.
選取2016年10月1日的部分基礎(chǔ)數(shù)據(jù)進(jìn)行展示,如表1所示.
表1 某高速公路某觀測(cè)站樣本原始數(shù)據(jù)Table 1 The sample of raw data of an observation station of a highway
為了計(jì)算方便,對(duì)交通流速度與密度樣本進(jìn)行標(biāo)準(zhǔn)化處理,作為高速公路服務(wù)水平劃分的基礎(chǔ)樣本數(shù)據(jù).以速度為例,其標(biāo)準(zhǔn)化公式為
式中:i=1,2,…,n;n為樣本數(shù)量;vi為第i個(gè)樣本數(shù)據(jù)的速度;vmin為n個(gè)樣本中的速度最小值;vmax為n個(gè)樣本中的速度最大值.同理,可得密度的標(biāo)準(zhǔn)化樣本數(shù)據(jù).
高速公路服務(wù)水平劃分模型中,確定劃分分類數(shù)c和模糊度參數(shù)m.根據(jù)河北省高速公路交通流的歷史數(shù)據(jù)狀態(tài)特征,將高速公路服務(wù)水平劃分為4類:{優(yōu)、良、中、差},即c=4.m為模糊度參數(shù),取m=2.
以標(biāo)準(zhǔn)化后的237 360組交通流速度、密度數(shù)據(jù)作為服務(wù)水平劃分的樣本數(shù)據(jù)集,由高速公路服務(wù)水平劃分模型,得到樣本數(shù)據(jù)的服務(wù)水平聚類中心A.圖1為樣本數(shù)據(jù)及各服務(wù)水平聚類中心示意圖.矩陣A的4行分別表示優(yōu)、良、中、差4種服務(wù)水平的聚類中心,每行的2列分別表示速度與密度.將A進(jìn)行反歸一化處理,得到高速公路服務(wù)水平各分類的聚類中心矩陣A'.
圖1 基礎(chǔ)數(shù)據(jù)及高速公路服務(wù)水平聚類中心示意圖Fig.1 Basic data and schematic diagram of the cluster center of the highway service level center
利用高速公路服務(wù)水平判別參數(shù)預(yù)測(cè)模型進(jìn)行參數(shù)預(yù)測(cè)時(shí),考慮月、日、小時(shí)、分鐘、天氣、出行日期、速度和密度等多維因素.從出行日期特征及天氣角度選取2016年11月1日(工作日)、11月6日(非工作日)全天,周期為5 min的數(shù)據(jù)作為的預(yù)測(cè)數(shù)據(jù)集.每個(gè)觀測(cè)站576組數(shù)據(jù),10個(gè)觀測(cè)站共計(jì)5 760組數(shù)據(jù).表2為某高速公路某觀測(cè)站的預(yù)測(cè)數(shù)據(jù).
表2 某高速公路某觀測(cè)站預(yù)測(cè)數(shù)據(jù)Table 2 The forecasted data of an observation station of a highway
根據(jù)高速公路服務(wù)水平判別參數(shù)預(yù)測(cè)模型獲得某觀測(cè)站576組高速公路服務(wù)水平參數(shù)速度、密度預(yù)測(cè)值.選用平均絕對(duì)偏差(MAD)和平均絕對(duì)百分比誤差(MAPE)評(píng)價(jià)模型的預(yù)測(cè)性能.表3為工作日與非工作日高速公路服務(wù)水平參數(shù)預(yù)測(cè)誤差.圖2為工作日速度預(yù)測(cè)結(jié)果與實(shí)際變化趨勢(shì)圖,誤差為MAD=4.95,MAPE=7.18%;圖3為工作日密度預(yù)測(cè)結(jié)果與實(shí)際變化趨勢(shì)圖,誤差為MAD=2.55,MAPE=18.35%;圖4為非工作日速度預(yù)測(cè)結(jié)果與實(shí)際變化趨勢(shì)圖,誤差為MAD=4.68,MAPE=5.92%;圖5為非工作日密度預(yù)測(cè)結(jié)果與實(shí)際變化趨勢(shì)圖,誤差為 MAD=3.85,MAPE=20.92%.速度的平均誤差MAD=6.00,MAPE=8.83%;密度的平均誤差 MAD=1.56,MAPE=11.70%.由此,工作日和非工作日得到的速度與密度預(yù)測(cè)結(jié)果曲線均與實(shí)際變化曲線基本吻合,整體變化趨勢(shì)與實(shí)際值相符,預(yù)測(cè)效果較好,驗(yàn)證了所提出預(yù)測(cè)模型的有效性.
利用高速公路服務(wù)水平參數(shù)和高速公路服務(wù)水平各個(gè)聚類中心,根據(jù)高速公路服務(wù)水平判別模型,獲得2 880組工作日和2 880組非工作日的服務(wù)水平預(yù)測(cè)值.表4和表5分別為某高速公路某觀測(cè)站工作日和非工作日服務(wù)水平判別預(yù)測(cè)數(shù)據(jù).為了更好地展示結(jié)果的多樣性,本文在同一觀測(cè)站2016年11月22日(工作日,小雪)的全天,周期為5 min的數(shù)據(jù),共288組,進(jìn)行高速公路服務(wù)水平的預(yù)測(cè)和判別.因當(dāng)天為小雪天氣,對(duì)人們的出行質(zhì)量會(huì)產(chǎn)生一定的影響,預(yù)測(cè)的整體服務(wù)水平偏低.最終的結(jié)果展示在表6中,過程同上.
表3 工作日與非工作日高速公路服務(wù)水平參數(shù)預(yù)測(cè)誤差Table 3 The forecasted errors of service level parameters of highway on working and non-working day
圖2 工作日速度預(yù)測(cè)值與實(shí)際變化趨勢(shì)圖Fig.2 Variation tendency diagram of the forecasted and actual velocity on workday
圖3 工作日密度預(yù)測(cè)值與實(shí)際變化趨勢(shì)圖Fig.3 Variation tendency diagram of the forecasted and actual density on workday
圖4 非工作日速度預(yù)測(cè)值與實(shí)際變化趨勢(shì)圖Fig.4 Variation tendency diagram of the forecasted and actual velocity on non-workday
圖5 非工作日密度預(yù)測(cè)值與實(shí)際變化趨勢(shì)圖Fig.5 Variation tendency diagram of the forecasted and actual density on non-workday
表4 某高速公路某觀測(cè)站工作日服務(wù)水平預(yù)測(cè)數(shù)據(jù)Table 4 The forecasted data of service level of an observation station of a highway on working day
表5 某高速公路某觀測(cè)站非工作日服務(wù)水平預(yù)測(cè)數(shù)據(jù)Table 5 The forecasted data of service level of an observation station of a highway on non-working day
表6 某高速公路某觀測(cè)站11月22日服務(wù)水平預(yù)測(cè)數(shù)據(jù)Table 6 The forecasted data of service level of an observation station of a highway on Nov.22nd
基于大量交通流監(jiān)測(cè)數(shù)據(jù)的實(shí)時(shí)高效的高速公路服務(wù)水平預(yù)測(cè),對(duì)提高出行服務(wù)質(zhì)量和高效交通管理控制策略具有重要的理論價(jià)值和實(shí)踐意義.本研究基于多維交通大數(shù)據(jù),提出了高速公路服務(wù)水平劃分模型、判別參數(shù)預(yù)測(cè)模型,進(jìn)而構(gòu)建了高速公路服務(wù)水平實(shí)時(shí)判別模型.以河北省高速公路數(shù)據(jù)為例,驗(yàn)證了高速公路服務(wù)水平實(shí)時(shí)判別及預(yù)測(cè)模型的有效性.