段穎超,張健欽,李明軒 ,杜明義
(1. 北京建筑大學(xué)測繪與城市空間信息學(xué)院,北京 100044;2. 現(xiàn)代城市測繪國家測繪地理信息局重點(diǎn)實(shí)驗(yàn)室,北京 100044)
?
一種公交到站時(shí)間預(yù)測方法
段穎超1,2,張健欽1,2,李明軒1,2,杜明義1,2
(1. 北京建筑大學(xué)測繪與城市空間信息學(xué)院,北京 100044;2. 現(xiàn)代城市測繪國家測繪地理信息局重點(diǎn)實(shí)驗(yàn)室,北京 100044)
基于公交GPS軌跡數(shù)據(jù)和路段在空間關(guān)系和時(shí)空分布上的分析和處理,開展了公交車輛到站時(shí)間預(yù)測的研究,提出并實(shí)現(xiàn)了基于空間關(guān)系的路段平均到站總時(shí)間與基于屬性數(shù)據(jù)修正的綜合預(yù)測方法;以北京市300路內(nèi)環(huán)公交線路為例進(jìn)行了驗(yàn)證和效果評(píng)價(jià),并對(duì)下一步工作進(jìn)行了展望。
軌跡數(shù)據(jù);空間關(guān)系;公交到站預(yù)測
隨著社會(huì)經(jīng)濟(jì)的發(fā)展,機(jī)動(dòng)車數(shù)量急劇增加,城市交通面臨著巨大的挑戰(zhàn)。優(yōu)先發(fā)展公共交通、實(shí)現(xiàn)智能公交,既是解決城市交通問題的有效途徑,也是發(fā)展智能交通系統(tǒng)的重要內(nèi)容。公交到站時(shí)間是指沿公交線路運(yùn)行的公交車輛當(dāng)前位置相距目標(biāo)站點(diǎn)的行程時(shí)間[1]。公交到站時(shí)間預(yù)測是智能公交的核心之一,它能夠?yàn)橹悄苷{(diào)度和公眾出行服務(wù)提供核心技術(shù)支持。一方面,大眾出行者對(duì)能夠有效分配出行時(shí)間有著強(qiáng)烈的需求,從主觀上急需公交到站時(shí)間預(yù)測的能力;另一方面,實(shí)現(xiàn)公交調(diào)度的精細(xì)化、智能化,提高公交管理的效率和效能,其中不可缺少的重要依據(jù)便是公交到站時(shí)間的預(yù)測能力。因此,研究和開發(fā)高性能的公交車輛到達(dá)時(shí)間預(yù)測技術(shù),對(duì)實(shí)現(xiàn)公交系統(tǒng)在管理和服務(wù)的智能化、提高城市公共交通的管理和服務(wù)水平具有重要意義[2]。
本文基于公交GPS軌跡數(shù)據(jù),通過對(duì)公交車輛GPS軌跡數(shù)據(jù)進(jìn)行空間關(guān)系和時(shí)空分布上的分析與處理,開展對(duì)公交車輛到站時(shí)間預(yù)測的研究。
公交到站時(shí)間預(yù)測模型有很多,如基于歷史數(shù)據(jù)的預(yù)測模型[3]、回歸預(yù)測模型[4-5]、基于平均速度的預(yù)測模型[2]、基于離散傅里葉變換和車輛延誤的預(yù)測模型[6]等。這里主要介紹3種較常見也較多使用的預(yù)測模型。
1. 時(shí)間序列預(yù)測模型
時(shí)間序列模型主要是利用交通流的時(shí)間變化規(guī)律獲取交通數(shù)據(jù)具有周期性和局部特性變化特征,進(jìn)而通過當(dāng)前與歷史交通狀況的對(duì)比,預(yù)測出車輛到站時(shí)間。因此,這種模型的預(yù)測精度主要取決于對(duì)比結(jié)果的相似度。相似度較高的,對(duì)應(yīng)的預(yù)測精度也相對(duì)較高;但對(duì)于對(duì)比結(jié)果存在很大差異的,預(yù)測結(jié)果會(huì)很不理想[7]。
2. 卡爾曼濾波預(yù)測模型
卡爾曼濾波預(yù)測模型是一種滾動(dòng)并實(shí)時(shí)修正的模式,既包括通過歷史狀態(tài)(通常是前一步狀態(tài))預(yù)測當(dāng)前狀態(tài),又包括利用當(dāng)前實(shí)際觀測狀態(tài)修正預(yù)測結(jié)果。因此它既考慮了歷史數(shù)據(jù)的影響,又兼顧了當(dāng)前突發(fā)事件的反饋,具有很高的實(shí)時(shí)性能和較高的預(yù)測精度。但是這種滾動(dòng)預(yù)測模式導(dǎo)致了多步預(yù)測的性能和精度的下降[6]。
3. 人工神經(jīng)網(wǎng)絡(luò)預(yù)測模型
神經(jīng)網(wǎng)絡(luò)預(yù)測模型通過神經(jīng)元網(wǎng)絡(luò)尋找交通數(shù)據(jù)與到站時(shí)間數(shù)據(jù)間的關(guān)系,具有分布式存儲(chǔ)、并行處理、自組織、自學(xué)習(xí)、非線性逼近等優(yōu)點(diǎn)[8]。目前絕大多數(shù)采用BP 算法,并以樣本的方差和作為訓(xùn)練的收斂條件。神經(jīng)網(wǎng)絡(luò)模型能很好地?cái)M合歷史數(shù)據(jù),但其精度主要取決于訓(xùn)練時(shí)間的長短,因而預(yù)測的實(shí)時(shí)性較差。
現(xiàn)有的大多公交車輛到站時(shí)間預(yù)測模型都基于海量的交通記錄,側(cè)重于在數(shù)學(xué)上建立解算和參數(shù)方程組,來預(yù)測目標(biāo)對(duì)象的到站時(shí)間等相關(guān)數(shù)據(jù)。然而,這種模式雖然具有眾多優(yōu)勢(shì),卻較少關(guān)注從公交GPS軌跡數(shù)據(jù)在空間關(guān)系和時(shí)空分布的層面上來分析和處理數(shù)據(jù)。本文即從以上層面進(jìn)行研究,進(jìn)而提高預(yù)測精度。
1. 基礎(chǔ)數(shù)據(jù)分析處理
鑒于從軌跡數(shù)據(jù)空間關(guān)系和時(shí)空分布的角度分析數(shù)據(jù)的研究目的,基礎(chǔ)數(shù)據(jù)主要分為兩個(gè)方面:軌跡數(shù)據(jù)和矢量數(shù)據(jù)。其中,軌跡數(shù)據(jù)包括上線的公交車車載GPS模塊所記錄的數(shù)據(jù),以及部分公交系統(tǒng)業(yè)務(wù)數(shù)據(jù);矢量數(shù)據(jù)包括公交站點(diǎn)、公交線路、城市路網(wǎng),以及分析和處理過程中的臨時(shí)地圖圖層等。具體內(nèi)容見表1。
表1 基礎(chǔ)數(shù)據(jù)
對(duì)基礎(chǔ)數(shù)據(jù)除了進(jìn)行常規(guī)處理,如去噪、數(shù)據(jù)融合、格式化、建表入庫、索引、關(guān)聯(lián)等,更需要從地理信息系統(tǒng)的專業(yè)角度分析數(shù)據(jù)的空間和屬性特征。
1) 去除GPS漂移點(diǎn)。軌跡數(shù)據(jù)的經(jīng)緯度坐標(biāo)是最重要的基礎(chǔ)數(shù)據(jù),但由于GPS模塊定位過程中受到大型建筑物的遮擋,以及其他事物的干擾,會(huì)出現(xiàn)很多漂移點(diǎn)。而對(duì)于嚴(yán)重偏離所屬線路的情況,會(huì)對(duì)預(yù)測精度造成重大影響,因此必須去除。但是,傳統(tǒng)的預(yù)測模型在去噪過程中的靈活度和性能相對(duì)較低。本文通過建立臨時(shí)軌跡點(diǎn)圖層,在地圖上非常直觀地表現(xiàn)出了車輛行駛軌跡偏離所屬線路的程度,從而通過設(shè)置可變的閾值,嚴(yán)格控制了軌跡數(shù)據(jù)中坐標(biāo)的精度。
2) 匹配。公交數(shù)據(jù)的路網(wǎng)匹配規(guī)則相對(duì)簡單,即主要采用最短距離法,因?yàn)槌藨?yīng)對(duì)突發(fā)事件或小規(guī)模線路調(diào)整之外,公交線路和公交站點(diǎn)非常穩(wěn)定。公交線路數(shù)據(jù)的來源或處理方式有兩種:一是通過地圖矢量化或?qū)ζ渌延袛?shù)據(jù)的格式轉(zhuǎn)換;二是通過高密度分布于線路的點(diǎn)數(shù)據(jù)自動(dòng)生成。但無論哪種方式,公交線路都要進(jìn)行坐標(biāo)系的統(tǒng)一和路網(wǎng)匹配,從而確保后續(xù)處理和空間分析,以及最終預(yù)測到站時(shí)間的精度。同樣,公交站點(diǎn)和車輛軌跡點(diǎn)也要對(duì)應(yīng)地匹配到所屬的線路上,特別是當(dāng)區(qū)分線路上行和下行的時(shí)候。
3) 線路分段。公交線路的分段方式也是反映數(shù)據(jù)處理精度的重要因素。本文主要按照公交GPS軌跡點(diǎn)與路段進(jìn)行空間關(guān)系判別的具體需求,分別采用了5種分段方式,見表2。
表2 線路分段方式
另外,在分析處理和系統(tǒng)展示時(shí),還需要對(duì)地圖數(shù)據(jù)進(jìn)行投影坐標(biāo)系和地理坐標(biāo)系的統(tǒng)一定義。
2. 空間關(guān)系和時(shí)空分布
本文基于公交軌跡數(shù)據(jù)建立了時(shí)空數(shù)據(jù)模型(如圖1所示)??紤]任何一條公交線路Route在時(shí)間范圍T內(nèi)都有N條同在這條線路上運(yùn)行的BusCount輛公交車的軌跡記錄,而每條軌跡記錄都是一個(gè)包含某車空間信息、時(shí)間信息和屬性信息的數(shù)組。首先,根據(jù)時(shí)間信息判斷它的時(shí)間歸屬并獲取時(shí)間歸屬ID,即屬于工作日(work)或休息日(rest)的哪個(gè)時(shí)段(五峰、全天)。第二,根據(jù)空間信息判斷它的路段歸屬并獲取路段歸屬ID,即屬于線路Route的哪個(gè)動(dòng)態(tài)分段區(qū)間(常用站點(diǎn)或站點(diǎn)停靠緩沖區(qū)來分段)。第三,分析它的空間關(guān)系和時(shí)空分布特征:如果與站點(diǎn)緩沖區(qū)相離,便可視為行駛點(diǎn),可以根據(jù)歷史平均總時(shí)間和距離即將到達(dá)的站點(diǎn)距離得出初步預(yù)測時(shí)間,再用相應(yīng)的路況信息等屬性信息進(jìn)行修正,得出最終預(yù)測結(jié)果,并接著分析下條記錄;如果與站點(diǎn)緩沖區(qū)相交,便可視為站點(diǎn)??看x點(diǎn)。如此滾動(dòng),便可得到一個(gè)停靠待選點(diǎn)集合,但集合中仍包含該線路車隊(duì)的m輛公交車的不同次數(shù)的軌跡點(diǎn),因而就要使用屬性信息確定相應(yīng)的歸屬,再利用空間關(guān)系找出停靠待選點(diǎn)集合中離站點(diǎn)最近,且速度符合指定閾值的軌跡點(diǎn)。路段歸屬ID屬于前后兩站的軌跡點(diǎn)時(shí)間差便是對(duì)應(yīng)路段的單車單次到站總時(shí)間,將其加入到歷史平均總時(shí)間再次平均便可實(shí)現(xiàn)歷史平均數(shù)據(jù)的更新。
預(yù)測處于行駛點(diǎn)的公交車的到站時(shí)間,以公交車的當(dāng)前位置所在的行車路段為當(dāng)前行車路段,則當(dāng)前位置到達(dá)最近的公交站點(diǎn)的預(yù)測時(shí)間T為
T=PiTi,i≤m-1
(1)
式中,Pi為當(dāng)前位置到最近的公交站點(diǎn)的距離di與當(dāng)前行車路段的總距離Di的比值;Ti為當(dāng)前行車路段的平均行程時(shí)間。再用此路段的路況信息等屬性信息進(jìn)行修正,得出最終預(yù)測結(jié)果。
圖1 時(shí)空數(shù)據(jù)模型
本文選取北京市300路內(nèi)環(huán)(簡稱300內(nèi))公交線作為研究對(duì)象,包含終點(diǎn)在內(nèi)共有34站,線路總長48.065 km。
接著選取2011年4月共2 515 783條軌跡數(shù)據(jù),結(jié)合ArcGIS Engine進(jìn)行二次開發(fā),建立了一個(gè)應(yīng)用上述處理和計(jì)算流程的系統(tǒng)。如圖2所示。
圖2 系統(tǒng)界面
在菜單“數(shù)據(jù)”中,主要進(jìn)行線路生成和分段工作,按照300內(nèi)公交站點(diǎn)對(duì)線路進(jìn)行分段。在菜單“匹配”中,主要完成300內(nèi)公交線路的路網(wǎng)匹配,以及該月所有GPS軌跡數(shù)據(jù)和公交站點(diǎn)的匹配線路工作。在菜單“計(jì)算”中,主要完成:①對(duì)所有處理過的GPS軌跡數(shù)據(jù)按照分段結(jié)果計(jì)算得出該路段平均到站總時(shí)間;②選取工作日抽樣點(diǎn),進(jìn)行到站時(shí)間預(yù)測;③選取休息日抽樣點(diǎn),進(jìn)行到站時(shí)間預(yù)測。
系統(tǒng)可以分別按日期、時(shí)段、車輛來進(jìn)行相應(yīng)設(shè)置的計(jì)算。這里對(duì)該月該車隊(duì)所有車輛的GPS軌跡數(shù)據(jù),分別計(jì)算出了300內(nèi)33個(gè)站間路段的平均到站總時(shí)間,如圖3所示。
圖3 各個(gè)站間路段平均到站總時(shí)間
最后,分別抽樣選取了工作日和休息日的公交GPS軌跡數(shù)據(jù),利用路段平均到站總時(shí)間與當(dāng)前車輛位置和速度,預(yù)測到達(dá)下一站所需要的時(shí)間。
通過分別選取2011年5月3日(星期二,49個(gè)抽樣軌跡點(diǎn))和2011年5月8日(星期日,31個(gè)抽樣軌跡點(diǎn))代表工作日和休息日進(jìn)行實(shí)例驗(yàn)證,證明了本方法可以得到穩(wěn)定且可參考的數(shù)據(jù),預(yù)測精度可以達(dá)到87.6%。這種方法對(duì)處理軌跡數(shù)據(jù)和計(jì)算路段平均到站總時(shí)間具有較好的性能和效果,而預(yù)測結(jié)果在較少出現(xiàn)突發(fā)事件的情況下也呈現(xiàn)出較高的精度。
公交到站時(shí)間作為公共交通出行者最為關(guān)注的重要信息,以及公交系統(tǒng)智能調(diào)度的核心依據(jù),其精確預(yù)測不僅能提高公交信息服務(wù)的質(zhì)量和體驗(yàn),也推動(dòng)了城市公交系統(tǒng)的智能化。
本文首先詳細(xì)討論了基于公交GPS軌跡數(shù)據(jù)進(jìn)行到站時(shí)間預(yù)測的基礎(chǔ)數(shù)據(jù)組成,以及各自在分析處理和判斷計(jì)算過程中的作用;然后從公交GPS軌跡數(shù)據(jù)與公交線路矢量數(shù)據(jù)的空間關(guān)系和時(shí)空分布的角度出發(fā),詳細(xì)論述了利用空間信息、時(shí)間信息、屬性信息的關(guān)聯(lián)性進(jìn)行公交車輛到站時(shí)間預(yù)測的過程和方法;最后對(duì)實(shí)際采集的2 515 783條公交GPS軌跡數(shù)據(jù)進(jìn)行了實(shí)例研究,并利用應(yīng)用結(jié)果對(duì)抽樣點(diǎn)數(shù)據(jù)進(jìn)行了實(shí)例驗(yàn)證,最后針對(duì)預(yù)測的性能和效果作出了評(píng)價(jià)。下一步本研究將嘗試引入卡爾曼濾波模型,在車輛實(shí)時(shí)位置和速度、到達(dá)站點(diǎn)的距離的基礎(chǔ)上,重點(diǎn)考慮車輛所處路段的路況信息、途經(jīng)路段道路類型、周邊人口密集區(qū)的權(quán)重分配,以及對(duì)預(yù)測精度的影響。
[1]陳國俊, 楊曉光, 劉好德,等. 基于動(dòng)態(tài)百分位行程時(shí)間的公交到站時(shí)間預(yù)測模型[J]. 公路交通科技, 2009(S1):102-106.
[2]羅虹. 基于GPS的公交車輛到達(dá)時(shí)間預(yù)測技術(shù)研究[D]. 重慶:重慶大學(xué), 2007.
[3]OJILI S R. A Prototype Bus Arrival Prediction System Using Automatic Vehicle Location Data[D]. State of Texas:Texas A&M University, 1999.
[4]ALFA A S, MENZIES W B, PURCHA J, et al. A Regression Model for Bus Running Times in Suburban Areas of Winnipeg[J]. Journal of Advanced Transportation, 1988, 21(3): 227-237.
[5]ABDELFATTAH A, KHAN A. Models for Predicting Bus Delays[J]. Transportation Research Record: Journal of the Transportation Research Board, 1998 (1623): 8-15.
[6]張?zhí)觅t, 郭中天. 公交車到站時(shí)間暨復(fù)合路線旅行時(shí)間預(yù)估模式的研究[J]. 土木工程學(xué)報(bào), 2005(12):115-123.
[7]CHIEN I J, DING Y, WEI C. Dynamic Bus Arrival Time Prediction with Artificial Neural Networks[J]. Journal of Transportation Engineering, 2014, 128(5):429-438.
[8]CHIEN I J, DING Y, WEI C. Dynamic Bus Arrival Time Prediction with Artificial Neural Networks[J]. Journal of Transportation Engineering, 2014, 128(5):429-438.
[9]陳圣兵, 李正茂, 王曉峰. 智能公交中基于條件映射的到站時(shí)間預(yù)測算法[J]. 計(jì)算機(jī)工程, 2012, 38(11):147-149.
[10]李福雙. 智能公交車輛到站時(shí)間預(yù)測研究[D]. 北京:北京交通大學(xué), 2009.
[11]陳鵬. 基于BP神經(jīng)網(wǎng)絡(luò)的公交智能實(shí)時(shí)調(diào)度模型研究及系統(tǒng)實(shí)現(xiàn)[D]. 北京:北京交通大學(xué), 2008.
[12]晏磊, 苗李莉, 劉岳峰. 關(guān)于GPS技術(shù)在智能交通系統(tǒng)中的應(yīng)用分析[J]. 測繪通報(bào), 2005(8):26-28.
[13]王美玲, 程林. 浮動(dòng)車地圖匹配算法研究[J]. 測繪學(xué)報(bào), 2012, 41(1):133-138.
[14]曾喆, 李清泉, 鄒海翔,等. 曲率積分約束的GPS浮動(dòng)車地圖匹配方法[J]. 測繪學(xué)報(bào), 2015,44(10):1167-1176.
[15]羅躍軍, 宋向勃, 鄭莉. 一種基于空間語義特征的浮動(dòng)車軌跡匹配技術(shù)[J]. 測繪通報(bào), 2015(3):108-110.
A Method of Bus Arrival Time Prediction
DUAN Yingchao,ZHANG Jianqin,LI Mingxuan,DU Mingyi
10.13474/j.cnki.11-2246.2016.0153.
2015-11-05
現(xiàn)代城市測繪國家測繪地理信息局重點(diǎn)實(shí)驗(yàn)室開放基金(20111216N);北京市優(yōu)秀人才培養(yǎng)資助個(gè)人項(xiàng)目(2011D005017000005)
段穎超(1990—),女,碩士生,主要研究方向?yàn)镚IS技術(shù)研發(fā)、智慧城市管理。E-mail:yc.duan@foxmail.com
P228
B
0494-0911(2016)05-0050-04
引文格式: 段穎超,張健欽,李明軒,等. 一種公交到站時(shí)間預(yù)測方法[J].測繪通報(bào),2016(5):50-53.