劉宇博, 李保珠
(1 濟(jì)南市歷城第二中學(xué), 濟(jì)南 250104; 2 濟(jì)南大學(xué) 信息科學(xué)與工程學(xué)院, 濟(jì)南 250022)
隨著城市規(guī)模的不斷擴(kuò)大和城市人口持續(xù)增長(zhǎng),市內(nèi)交通出行壓力越來越大[1]。傳統(tǒng)的路徑通行時(shí)間預(yù)測(cè),往往基于當(dāng)前各路段的采集信息,通過平均通行時(shí)間進(jìn)行總體行程時(shí)間預(yù)測(cè)。然而隨著車輛的前進(jìn)和時(shí)間的推移,尤其下游路段往往路況多變[2],由此總體行程時(shí)間預(yù)測(cè)呈現(xiàn)出2個(gè)顯著問題:
(1)車輛行程中途到達(dá)后期各路段的時(shí)間未知;
(2)未來一段時(shí)間內(nèi),出行路徑的路況信息未知[3]。
針對(duì)上述問題,本文的主要貢獻(xiàn)如下:
從時(shí)間與空間相結(jié)合的角度,基于歷史典型相似路徑樣本數(shù)據(jù)。獲取以歷史時(shí)間為縱軸的各路段的通行時(shí)間。隨后根據(jù)空間車輛的行進(jìn),確定下一路段的到達(dá)時(shí)間,以到達(dá)時(shí)間為橫軸進(jìn)行歷史時(shí)間縱軸的數(shù)據(jù)截取,根據(jù)截取數(shù)據(jù)采用信息熵來判斷路況的變化。
通過對(duì)不同通行路段具體通行時(shí)間的劃分,基于采集數(shù)據(jù)計(jì)算獲取城市不同分類路段的通行時(shí)間,并得到路段通行時(shí)間待定參數(shù),從而實(shí)現(xiàn)基于實(shí)時(shí)采集數(shù)據(jù)獲取路段通行時(shí)間[4]。隨后基于信息熵實(shí)現(xiàn)路況變化狀態(tài)的判別[5],若信息熵較小,說明當(dāng)前路況穩(wěn)定,可實(shí)時(shí)采集數(shù)據(jù)實(shí)現(xiàn)路徑通行時(shí)間的預(yù)測(cè),若信息熵較大,說明在車輛通行時(shí)間過程中路況狀態(tài)變化,此時(shí)實(shí)時(shí)采集數(shù)據(jù)失效。而歷史典型相似路徑數(shù)據(jù)更能體現(xiàn)其實(shí)際通行時(shí)間,故通行時(shí)間更加依賴于歷史典型相似路徑數(shù)據(jù),從而實(shí)現(xiàn)基于路況變化的動(dòng)態(tài)路徑通行時(shí)間預(yù)測(cè)。
傳統(tǒng)的路徑通行時(shí)間的預(yù)測(cè),往往根據(jù)當(dāng)前的路況采集數(shù)據(jù),對(duì)某一路徑的通行時(shí)間進(jìn)行靜態(tài)的預(yù)測(cè)。然而隨著車輛的行進(jìn),時(shí)間不斷推移,各路段的實(shí)時(shí)交通狀態(tài)亦不斷發(fā)生變化[6],由此基于靜態(tài)預(yù)測(cè)的路徑通行時(shí)間預(yù)測(cè)與實(shí)際通行時(shí)間存在較大的差異。
本文采用基于信息熵動(dòng)態(tài)擬合的路徑通行時(shí)間預(yù)測(cè)整體流程如圖1所示。一方面基于當(dāng)前的采集數(shù)據(jù)進(jìn)行穩(wěn)定路況的通行時(shí)間預(yù)測(cè)[7];另一方面基于歷史數(shù)據(jù)對(duì)下游路段的未來通行時(shí)間進(jìn)行預(yù)測(cè),從而提高模型的整體預(yù)測(cè)精準(zhǔn)度。
圖1 時(shí)間預(yù)測(cè)整體流程圖
針對(duì)路況隨時(shí)間變化而導(dǎo)致實(shí)時(shí)采集數(shù)據(jù)失效的問題,本文采用信息熵對(duì)路況狀態(tài)進(jìn)行精細(xì)化擬合,從而提高通行時(shí)間預(yù)估的準(zhǔn)確性。
基于歷史數(shù)據(jù)采集樣本對(duì)當(dāng)前路徑的通行時(shí)間進(jìn)行預(yù)測(cè),從歷史數(shù)據(jù)和當(dāng)前采集數(shù)據(jù)2個(gè)維度進(jìn)行?;诋?dāng)前路況的當(dāng)日已采集數(shù)據(jù),采用非線性最小二乘優(yōu)化算法對(duì)歷史相似典型路徑進(jìn)行搜索,從而提高歷史樣本數(shù)據(jù)價(jià)值。
將當(dāng)前路況采集特征數(shù)據(jù)與歷史樣本采集特征數(shù)據(jù),即計(jì)算每個(gè)歷史采集樣本X′與當(dāng)前采集數(shù)據(jù)X的距離,采用非線性最小二乘優(yōu)化算法:
(1)
其中,u代表采集樣本特征個(gè)數(shù);xi為當(dāng)前采集樣本X的屬性值;xi′為歷史采集數(shù)據(jù)X′的屬性值,進(jìn)入路段的時(shí)間點(diǎn)t在采集數(shù)據(jù)時(shí)間間隔為τ時(shí)取整。
隨時(shí)間的推移,路況信息變化較大,故本文借鑒信息熵的概念,對(duì)路況的通行時(shí)間進(jìn)行客觀權(quán)重衡量。具體表現(xiàn)為,當(dāng)路況一直處于順暢狀態(tài)或擁堵狀態(tài)時(shí),路徑的通行時(shí)間均相對(duì)穩(wěn)定,而當(dāng)路況發(fā)生變化時(shí)導(dǎo)致后期各路段的通行時(shí)間變化較大,此時(shí)同類歷史交通數(shù)據(jù)的路徑通行時(shí)間的參考價(jià)值更大[8]。通過求路徑通行時(shí)間的信息熵來確定實(shí)時(shí)采集數(shù)據(jù)的路段通行數(shù)據(jù)與歷史典型相似路徑通行時(shí)間的權(quán)重。
設(shè)某樣本X有m個(gè)同類日采集樣本數(shù)據(jù),n個(gè)數(shù)據(jù)采集時(shí)間點(diǎn),用x(i, j)表示第i個(gè)樣本的第j個(gè)時(shí)刻點(diǎn)的車輛通過該路段的行駛時(shí)間,則評(píng)價(jià)指標(biāo)構(gòu)成的矩陣R為:
(2)
數(shù)據(jù)歸一化預(yù)處理得:
y(i,j)= [x(i,j)-minx(i,j)]/
[maxx(i,j)-minx(i,j)]
(3)
此時(shí),y(i,j)∈[0,1],則第j個(gè)時(shí)刻點(diǎn)的歷史車輛通過時(shí)間的熵值為:
(4)
此時(shí),熵權(quán)的大小代表著第j個(gè)時(shí)刻點(diǎn),歷史車輛通過該路段時(shí)間的變化量。若Hj較小,則說明該路段在前j個(gè)時(shí)刻點(diǎn)的通行時(shí)間變化較大,此刻路況變化較大。反之,若Hj較大,則說明該路段在前j個(gè)時(shí)刻點(diǎn)的通行時(shí)間變化較小,此刻在路況平穩(wěn)期。
因此,基于時(shí)間數(shù)據(jù)推進(jìn),進(jìn)入路段的時(shí)間點(diǎn)t在采集數(shù)據(jù)時(shí)間間隔為τ時(shí)取整,其前后通行時(shí)間變化的權(quán)重具體計(jì)算公式為:
Tt=Ta·wj+Tb(1-wj)
(5)
其中,wj表示的車輛在j時(shí)刻及其之前該路段的通行變化,Ta為歷史典型相似路徑的該路徑均值通過時(shí)間,并以(1-wj)的概率維持基于短期相似路段數(shù)據(jù)擬合的通行時(shí)間Tb,從而獲得該路段的預(yù)估通行時(shí)間Tt。
實(shí)驗(yàn)內(nèi)容主要通過2方面進(jìn)行,一方面,基于實(shí)時(shí)采集數(shù)據(jù)和歷史交通數(shù)據(jù),以信息熵動(dòng)態(tài)擬合路徑通行時(shí)間,計(jì)算其擬合數(shù)據(jù);另一方面,基于預(yù)測(cè)結(jié)果分析,說明本文方法的優(yōu)越性。
為更好地體現(xiàn)本文提出方法的預(yù)測(cè)性能,針對(duì)濟(jì)南市經(jīng)十路的不同路段進(jìn)行數(shù)據(jù)采集??傮w路徑分布為濟(jì)南東高速口附近到泉城公園附近,路徑信息如圖2所示。
圖2 濟(jì)南東高速口到泉城公園路徑示意圖
采集歷史數(shù)據(jù)為2018年3月5日到2018年9月2日26周的交通采集數(shù)據(jù),實(shí)驗(yàn)數(shù)據(jù)為2018年9月3號(hào)(周一)分別在6:30~9:30、13:30~16:30和18:00~21:00,采用線圈檢測(cè)器采集數(shù)據(jù),以5 min為一個(gè)信號(hào)檢測(cè)周期。
表1歷史短期相似路段樣本擬合部分?jǐn)?shù)據(jù)
Tab.1Historicalshort-termsimilarroadsegmentsamplefittingpartdata
潘莊路段367 m高新區(qū)路段558 m燕山立交橋路段452 m泉城公園路段579 mT/s166888116
隨后,以基于熵權(quán)法的路況動(dòng)態(tài)擬合未來路況變化。首先,根據(jù)歷史交通數(shù)據(jù)對(duì)不同路段進(jìn)行縱向的路況動(dòng)態(tài)權(quán)值計(jì)算,同樣以7:00出發(fā)的濟(jì)南東高速口到泉城公園路段的部分典型路段為例,見表2。
表3為7:00~8:10濟(jì)南東高速口到泉城公園路段的部分典型路段的縱向歷史通行時(shí)間,由于出行時(shí)間為7點(diǎn)鐘,此時(shí)各路段均為暢通狀態(tài)。通過時(shí)空外推擬合獲取到達(dá)各路段的時(shí)間點(diǎn)及對(duì)應(yīng)通行時(shí)間,表3的陰影車輛行駛時(shí)段的橫向時(shí)間截?cái)喃@取歷史數(shù)據(jù)的縱向各通行時(shí)間,采用熵權(quán)法對(duì)計(jì)算實(shí)時(shí)采集數(shù)據(jù)與歷史典型相似路徑的權(quán)重比例,由于到達(dá)潘莊路段基于歷史數(shù)據(jù)的通行時(shí)間基本無變化,故此時(shí)信息熵為0,故僅基于實(shí)時(shí)采集數(shù)據(jù)給出通行時(shí)間預(yù)測(cè),而到達(dá)高新區(qū)路段基于歷史數(shù)據(jù)的通行時(shí)間變化較大,此時(shí)信息熵為0.664 7,到達(dá)燕山立交橋路段的信息熵為0.894 2,到達(dá)泉城公園路段的信息熵為0.937 1,故隨著時(shí)間的推移,較遠(yuǎn)的路段通行時(shí)間變動(dòng)較大,此時(shí)采用基于信息熵比例的動(dòng)態(tài)數(shù)據(jù)擬合法,即高新區(qū)路段、燕山立交橋路段和泉城公園路段的通行時(shí)間分別為:
表2 同類歷史交通數(shù)據(jù)的部分典型路段通行時(shí)間
本文以信息熵度量變化路況信息,實(shí)現(xiàn)實(shí)時(shí)采集數(shù)據(jù)與歷史數(shù)據(jù)的綜合預(yù)測(cè)。
為驗(yàn)證本文所述方法的優(yōu)越性,根據(jù)實(shí)驗(yàn)采集數(shù)據(jù)分別設(shè)計(jì)以下實(shí)驗(yàn)路徑:
行程1:9月3日7:00出發(fā),從濟(jì)南東高速口到泉城公園路段;
行程2:9月3日14:00出發(fā),從濟(jì)南東高速口到泉城公園路段;
行程3:9月3日19:00出發(fā),從濟(jì)南東高速口到泉城公園路段。
對(duì)上述行程分別采用4種方法進(jìn)行預(yù)測(cè)數(shù)據(jù)對(duì)比。
基于系統(tǒng)的實(shí)際需求,并考慮到余量,本控制系統(tǒng)采用西門子的1214控制器,該控制器集成有14個(gè)數(shù)字量輸入,10個(gè)數(shù)字量輸出,另單配有1塊16入/16出數(shù)字量模塊和3塊8出數(shù)字量模塊。
(1)傳統(tǒng)方法預(yù)測(cè)(某導(dǎo)航APP實(shí)現(xiàn));
(2)基于實(shí)時(shí)采集數(shù)據(jù)的短期相似路段擬合預(yù)測(cè);
(3)基于歷史典型相似路徑的擬合預(yù)測(cè);
(4)本文預(yù)測(cè),預(yù)測(cè)時(shí)間與預(yù)測(cè)誤差見表3。
表3 實(shí)驗(yàn)數(shù)據(jù)預(yù)測(cè)值及預(yù)測(cè)誤差
其中,T為行程預(yù)測(cè)時(shí)間,e為預(yù)測(cè)誤差,由表3可以看出,在行程2時(shí)的通行路徑均處于平穩(wěn)期,即路況分別處于順暢狀態(tài),傳統(tǒng)預(yù)測(cè)方法在時(shí)間上與實(shí)際通行時(shí)間相差不大,預(yù)測(cè)誤差維持在7%左右。然而當(dāng)預(yù)測(cè)時(shí)長(zhǎng)面臨如行程1的路況進(jìn)入早高峰狀態(tài),或者行程3路況開始脫離晚高峰的狀態(tài)時(shí),傳統(tǒng)預(yù)測(cè)方法基于當(dāng)前的采集數(shù)據(jù)難以根據(jù)時(shí)間的推移對(duì)路徑通行時(shí)間進(jìn)行有效預(yù)測(cè),而本文方法結(jié)合了實(shí)時(shí)采集數(shù)據(jù)和歷史數(shù)據(jù),分別結(jié)合了實(shí)時(shí)采集數(shù)據(jù)時(shí)效性和歷史數(shù)據(jù)穩(wěn)定性的優(yōu)點(diǎn),即使路況狀態(tài)明顯變化時(shí),預(yù)測(cè)誤差仍然在2%左右,可有效實(shí)現(xiàn)對(duì)未來短期內(nèi)的城市道路通行時(shí)間的預(yù)測(cè)。綜上所示,本方法具有顯著的實(shí)用性和優(yōu)越性。
本文通過對(duì)通行路徑的定點(diǎn)檢測(cè)數(shù)據(jù)獲取不同路段的歷史交通數(shù)據(jù),并基于分類分段的城市道路計(jì)算獲取各路段不同狀態(tài)下的待定參數(shù)和歷史通行時(shí)間[9]?;谧钚《朔ǐ@取實(shí)驗(yàn)數(shù)據(jù)的歷史典型相似路徑,隨著車輛通行時(shí)間的外推,實(shí)時(shí)路況不斷發(fā)生變化,此時(shí)依賴于實(shí)時(shí)采集數(shù)據(jù)難免導(dǎo)致預(yù)測(cè)的片面性,故需結(jié)合同類樣本的歷史典型相似路徑,以信息熵度量變化路況信息,從而實(shí)現(xiàn)實(shí)時(shí)采集數(shù)據(jù)與歷史數(shù)據(jù)的綜合預(yù)測(cè),提高路徑通行時(shí)間預(yù)測(cè)的準(zhǔn)確性[10]。實(shí)驗(yàn)結(jié)果表明,本文提出的基于信息熵動(dòng)態(tài)擬合的時(shí)間預(yù)測(cè)方法可很好地?cái)M合短期內(nèi)的城市交通路況,對(duì)路徑的通行時(shí)間預(yù)測(cè)相對(duì)準(zhǔn)確,從而為出行路徑選擇提供有效的時(shí)間參考與行程規(guī)劃。