周 昀,丁 峰,程添亮
(1.江蘇自動(dòng)化研究所,江蘇 連云港 222006;2.日照市公安局交通警察支隊(duì),山東 日照 276826)
智能交通系統(tǒng)是解決現(xiàn)代城市交通問題的主要方法。浮動(dòng)車技術(shù)是基于GPS、GIS的獲取道路交通信息的一種新型技術(shù),相較于其他信息采集方法,浮動(dòng)車技術(shù)采集路況信息更經(jīng)濟(jì)、覆蓋范圍廣、受天氣影響較小。出租車作為城市出行中最為活躍的交通工具,其行駛軌跡密度與城市人口居住密度存在較強(qiáng)的關(guān)聯(lián)關(guān)系。通過對(duì)交通信息的定性和定量分析,能夠?yàn)楦鞣N各樣的交通應(yīng)用提供服務(wù)。根據(jù)出租車途徑路口起訖點(diǎn)的分布特征,我們可以刻畫市民出行畫像;通過預(yù)測(cè)城市特征路口過車量,能夠?yàn)榻煌Q策提供重要的參考意見。以數(shù)據(jù)為驅(qū)動(dòng)的智能交通分析需要準(zhǔn)確的行車軌跡數(shù)據(jù)和精準(zhǔn)的地圖匹配數(shù)據(jù)作為支撐,本文中軌跡數(shù)據(jù)依賴于車載GPS,地圖數(shù)據(jù)依賴于高德地圖。由于數(shù)據(jù)的可獲取性,在已取得的成果上,本次研究提出點(diǎn)到點(diǎn)匹配與車輛行駛軌跡相結(jié)合的地圖匹配方法,使用更少的地圖信息,達(dá)到更精確的地圖匹配。
根據(jù)數(shù)據(jù)來源、數(shù)據(jù)形式、分析需求的不同,目前基于軌跡的地圖匹配算法主要有幾何匹配算法、拓?fù)潢P(guān)系算法、概率統(tǒng)計(jì)算法和先進(jìn)匹配算法。在本文中則根據(jù)實(shí)際情況,我們選擇了幾何算法和拓?fù)潢P(guān)系算法相結(jié)合的算法。城市交通起訖點(diǎn)分析是監(jiān)測(cè)與管理城市交通運(yùn)行情況的重要一環(huán),掌握城市交通需求方便我們采取合理的交通管控、規(guī)劃方案。早先起訖點(diǎn)研究中的檢測(cè)數(shù)據(jù)主要來自地磁、線圈等定點(diǎn)檢測(cè)數(shù)據(jù),Bell等、Perrakis等提出了一種基于貝葉斯估計(jì)的OD矩陣估計(jì),結(jié)果表明模型估計(jì)和實(shí)際數(shù)據(jù)吻合度較高。曹喻旻等在車輛軌跡和定點(diǎn)檢測(cè)器數(shù)據(jù)的基礎(chǔ)上,提出了一種可以保證OD矩陣可靠性、計(jì)算路段流量與路段行程估計(jì)的OD估計(jì)模型。
路網(wǎng)交通流預(yù)測(cè)則從短時(shí)交通流的角度,對(duì)城市路況進(jìn)行分析。張良力(2015)等使用ARMA模型對(duì)交叉口車輛的碰撞風(fēng)險(xiǎn)進(jìn)行了評(píng)估,根據(jù)車輛進(jìn)入交叉口前的速度,預(yù)測(cè)車輛進(jìn)入交叉口后的速度,作為判斷交叉口內(nèi)車輛發(fā)生碰撞的風(fēng)險(xiǎn)依據(jù),基于ARMA模型的預(yù)測(cè)結(jié)果能夠?qū)崿F(xiàn)車速較高精度的預(yù)測(cè)。胡浩(2019)等基于ARMA和BP神經(jīng)網(wǎng)絡(luò)的組合模型,對(duì)城市路網(wǎng)中的特征路口交通流進(jìn)行了預(yù)測(cè),并驗(yàn)證了預(yù)測(cè)效果的可行性和有效性。趙曉靜(2017)等針對(duì)短時(shí)交通流的突發(fā)性、時(shí)變性和非線性等特點(diǎn),基于序列分解的思想,對(duì)信號(hào)期望數(shù)據(jù)建立ARMA模型,對(duì)噪聲數(shù)據(jù)進(jìn)行維納濾波處理再建立預(yù)測(cè)模型,通過組合模型實(shí)現(xiàn)預(yù)測(cè)結(jié)果的優(yōu)化。
本文數(shù)據(jù)主體為浮動(dòng)車軌跡數(shù)據(jù)和地圖數(shù)據(jù)。浮動(dòng)車軌跡數(shù)據(jù)來自2020年日照市五月980輛出租車GPS軌跡數(shù)據(jù),包括軌跡點(diǎn)的經(jīng)緯度、時(shí)間戳、瞬時(shí)速度、行車方向等信息;地圖數(shù)據(jù)取自高德地圖,包括路口、道路等地理位置?;谝陨蠑?shù)據(jù)我們運(yùn)用地圖匹配算法刻畫出租車的行駛軌跡,為分析城市通行分布與關(guān)鍵路口車流量預(yù)測(cè)提供數(shù)據(jù)支持。
由于受到設(shè)備硬件和信號(hào)傳播途徑的限制,我們需要對(duì)收集到的數(shù)據(jù)先進(jìn)行數(shù)據(jù)清洗和坐標(biāo)系轉(zhuǎn)換,具體步驟如下。
(1)刪除重復(fù)、時(shí)間錯(cuò)亂、缺失、漂移等軌跡數(shù)據(jù),其中20 s內(nèi)的缺失數(shù)據(jù)用均值法進(jìn)行插補(bǔ)。
(2)坐標(biāo)轉(zhuǎn)換;將浮動(dòng)車GPS裝置的WGS-84(World Geodetic System-84)坐標(biāo)轉(zhuǎn)換成GCJ-02坐標(biāo)系(火星坐標(biāo)系)。
(3)軌跡劃分;出租車在行駛過程中,會(huì)出現(xiàn)換班、休息等情況,導(dǎo)致行車軌跡出現(xiàn)間隔。在起訖點(diǎn)問題的分析中,完整的行車軌跡是關(guān)注重點(diǎn),故需要將時(shí)間間隔大、沒有關(guān)聯(lián)關(guān)系的軌跡進(jìn)行劃分,如果軌跡數(shù)據(jù)間隔超過8 h,我們認(rèn)為兩段軌跡不相關(guān)。
算法主要功能:統(tǒng)計(jì)出租車每天在不同路段的通行情況。
在起訖點(diǎn)算法中,首先要將軌跡點(diǎn)與地圖信息關(guān)聯(lián),對(duì)高架、快速路、復(fù)雜路口等情況,除了使用點(diǎn)到點(diǎn)地圖匹配法,還要考慮歷史軌跡,多條件約束下,保證路口地圖匹配地準(zhǔn)確性。其次,統(tǒng)計(jì)出租車起訖點(diǎn)通行量信息,根據(jù)統(tǒng)計(jì)數(shù)據(jù)分析日照市居民出行在時(shí)間和空間上的分布??紤]到出租車在城市交通中的特殊地位,其行車軌跡可用于刻畫城市客流分布信息和波動(dòng)規(guī)律,為進(jìn)一步提高城市公共交通服務(wù)水平、增強(qiáng)城市公共交通智能化管理提供了一種發(fā)展方向。
算法設(shè)計(jì)過程:
(1)用點(diǎn)到點(diǎn)地圖匹配算法初步獲取出租測(cè)經(jīng)過路口的信息;
(2)用點(diǎn)到線地圖匹配算法和軌跡點(diǎn)的行駛方向、與路口相對(duì)方向?qū)Φ谝徊降玫降穆房谛畔⑦M(jìn)行檢查,進(jìn)一步保證時(shí)間上相鄰的軌跡點(diǎn)在空間上也相鄰,得到最終的路口信息;
(3)針對(duì)第二步得到的結(jié)果,篩選出與路口最近軌跡點(diǎn)對(duì)應(yīng)的地圖信息,按照時(shí)間順序確定車輛途徑路口的軌跡;
(4)統(tǒng)計(jì)每輛車每條軌跡中途徑路口的路段信息,將所有路口按照時(shí)間順序兩兩匹配,得到起訖點(diǎn)路徑對(duì),其中算法只記錄起點(diǎn)和終點(diǎn)不同的路徑對(duì)。
起訖點(diǎn)算法流程如圖1所示。
圖1 起訖點(diǎn)算法流程圖
本文使用統(tǒng)計(jì)學(xué)中的K-Means聚類和ARIMA模型對(duì)日照市出租車行駛軌跡分布以及關(guān)鍵路口車流量預(yù)測(cè)進(jìn)行分析,K-Means是經(jīng)典的快速聚類法,ARIMA模型是傳統(tǒng)的時(shí)間序列分析方法。
交通流預(yù)測(cè)一直受到廣泛的關(guān)注,基于預(yù)測(cè)可以有效地了解未來時(shí)段的交通流狀態(tài)。本文通過分析特征路口車流量時(shí)間序列的內(nèi)部結(jié)構(gòu)特征,可推演出該路口出租車的行駛規(guī)律,最終實(shí)現(xiàn)路口過車輛的預(yù)測(cè)。常用的時(shí)間序列模型有ARMA(Auto-Regressive Moving Average Model,自回歸移動(dòng)平均模型), ARIMA(Autoregressive Integrated Moving Average model,求和自回歸移動(dòng)平均模型)是ARMA的擴(kuò)展,適用于分析非平穩(wěn)時(shí)間序列,其表達(dá)式為
Φ(B)xt=Θ(B)εt
E(xsεt)=0,?s (1) 式中:B為延遲算子;Φ(B)=1-φ1B-…-φpBp,是自回歸系數(shù)多項(xiàng)式;Θ(B)=1-θ1B-…-θqBq是移動(dòng)平均系數(shù)多項(xiàng)式,模型系數(shù)求解一般使用最小二乘估計(jì)或極大似然估計(jì)。若q=0,那么AEMA(p,q)就退化成AR(p)模型;若p=0,ARMA(p,q)就退化成MA(q)模型。 使用ARMA模型時(shí),需要先檢驗(yàn)序列的平穩(wěn)性,如果序列平穩(wěn),一般可以根據(jù)序列的自相關(guān)和偏自相關(guān)系數(shù)確定ARMA模型階數(shù);如果序列不平穩(wěn),需要對(duì)序列進(jìn)行差分處理,提取趨勢(shì)、周期等信息得到平穩(wěn)序列后再建立ARMA模型,就可得到ARIMA模型。 基于本次樣本數(shù)據(jù)可統(tǒng)計(jì)出日照市路口浮動(dòng)車每天車流總量和每小時(shí)的過車量,如圖2所示,日照市路口出租車每日總流量在50萬輛上下浮動(dòng)(5月18日數(shù)據(jù)缺失,視為異常值,刪除),如圖3所示序列總體呈現(xiàn)出較強(qiáng)的周期性、時(shí)變性和非線性,時(shí)間上的分布特征明顯。接下來,使用K-Means聚類法和ARIMA模型分別分析日照市每日居民出行分布和關(guān)鍵路口車流量預(yù)測(cè)。 圖2 日照市路口日流量時(shí)序圖 圖3 路口小時(shí)流量時(shí)序圖 為了充分考慮到節(jié)假日對(duì)城市出行產(chǎn)生的影響,本次研究選擇2020年5月1日和5月8日為樣本。綜合描述性統(tǒng)計(jì)分析和K-Means聚類法,可得到居民出行在時(shí)間和空間上的分布為。 (1)時(shí)間上,每日出租車出行量有3個(gè)高峰,分別為上午高峰(7時(shí)~11時(shí))、下午高峰(14時(shí)~19時(shí))和夜間高峰(21時(shí)~22時(shí)),說明城市交通流量分布和居民工作和娛樂出行密不可分。 (2)空間上,工作日車流量較大的區(qū)域集中在市政中心、商業(yè)區(qū)、日照市各大醫(yī)院附近,節(jié)假日車流量主要集中在旅游景點(diǎn)、商業(yè)區(qū)和高鐵站附近,存在一定的節(jié)假日效應(yīng)。工作日居民的出行主要以工作、就醫(yī)為主,節(jié)假日則主要以娛樂、休閑為主。 基于日照市居民節(jié)假日和工作日出行在時(shí)間和空間分布的特征,我們發(fā)現(xiàn)居民的出行存在一定的周期規(guī)律。由于區(qū)域或路口客流量的大幅增加會(huì)給道路通行帶來巨大的壓力,如果能夠合理、準(zhǔn)確地預(yù)測(cè)重要路口的過車量,為居民出行提供路況信息,可以為減緩道路通行壓力提供一定的幫助。 在對(duì)城市關(guān)鍵路口車流量的分析中以大連路和北京南路交叉口為樣本,北京南路作為日照市的重要交通樞紐,其過車量具有一定的代表性。在后面的研究中以該路口5月前30天中每小時(shí)過車量序列,預(yù)測(cè)其5月31日的每小時(shí)過車量。 圖4 大連路、北京南路交叉口過車量序列分析 圖4(a)表明該路口出租車的過車量呈現(xiàn)出明顯的趨勢(shì)性和一定的周期性,ADF平穩(wěn)性檢驗(yàn)后p值遠(yuǎn)小于顯著水平0.05,故該序列平穩(wěn)。在建模中從時(shí)間序列的隨機(jī)性分析和確定性分析兩個(gè)角度出發(fā),分別使用ARIMA季節(jié)模型和Holt-Winters三參數(shù)指數(shù)平滑模型。圖4(b)可知序列自相關(guān)拖尾并且包含明顯的周期因素,故對(duì)序列進(jìn)行一階2步差分。 圖5 大連路、北京南路交叉口過車量序列殘差分析 對(duì)序列進(jìn)行一階24步差分后,序列平穩(wěn),由于原序列的長(zhǎng)期趨勢(shì)并不明顯,但是存在一定的短期趨勢(shì)。此處我們選擇加法和乘法ARIMA季節(jié)模型、Holt-Winters三參數(shù)指數(shù)平滑模型。如圖5(a)所示自相關(guān)和偏自相關(guān)系數(shù),我們選擇ARIMA(1,(1,24),)加法季節(jié)模型和ARIMA(1,11)×ARIMA(0,11)乘法季節(jié)模型進(jìn)行擬合。在確定性分析中,也同樣選擇了加法和乘法模型,四個(gè)模型的AIC值如表1所示。 表1 擬合模型AIC值 基于AIC準(zhǔn)則,選擇ARIMA(1,11)×ARIMA(0,11)乘法季節(jié)模型描述該路口期望出租車過車量的時(shí)變性,模型如下 (2) 模型殘差序列白噪聲檢驗(yàn)顯示模型的殘差短期內(nèi)不存在相關(guān)性,模型擬合效果理想,可以接受。殘差序列的方差齊性檢驗(yàn)顯示,平方殘差序列不存在短期自相關(guān)性,根據(jù)圖6(b)可知?dú)埐罘险龖B(tài)性假設(shè)且不相關(guān),故認(rèn)為ARIMA(1,11)×ARIMA(0,11)乘法季節(jié)模型可以用來刻畫該序列并進(jìn)行預(yù)測(cè)。 由于ARMA族模型更適用于短期序列的預(yù)測(cè),如果進(jìn)行長(zhǎng)期預(yù)測(cè),預(yù)測(cè)誤差會(huì)逐漸變大,作為對(duì)比分別進(jìn)行了6期、12期、18期和24期預(yù)測(cè),預(yù)測(cè)效果如圖6(b)所示,預(yù)測(cè)精度地評(píng)價(jià)指標(biāo)如表2所示。從RMSE(均方誤差)來看,6期預(yù)測(cè)的精度更高,因?yàn)殡S著預(yù)測(cè)期數(shù)的增加,RMSE也有一定程度地增加。由于RMSE對(duì)異常值敏感,說明超過6期的預(yù)測(cè)中,有個(gè)別點(diǎn)的預(yù)測(cè)誤差較大,MAE(平均絕對(duì)誤差)也驗(yàn)證了這一點(diǎn),這與圖6(b)的預(yù)測(cè)結(jié)果是一致的。在對(duì)預(yù)測(cè)精度要求較高的情況下,我們推薦使用短期預(yù)測(cè)。 圖6 大連路、北京南路交叉口過車量序列預(yù)測(cè)結(jié)果 表2 ARIMA(1,1,1)×ARIMA(0,1,1)乘法季節(jié)模型預(yù)測(cè)精確度指標(biāo) 本文基于出租車浮動(dòng)車和地圖數(shù)據(jù),提出了一種結(jié)合點(diǎn)到點(diǎn)匹配與車輛行駛軌跡的地圖匹配算法,分析了城市居民的出行分布,預(yù)測(cè)了城市關(guān)鍵路口過車量。目前的研究成果還有很多需要進(jìn)一步深入探索的地方,例如車流量預(yù)測(cè)中只考慮了特征路口,沒有對(duì)整個(gè)城市路網(wǎng)的車流量實(shí)現(xiàn)預(yù)測(cè);ARMA族模型在非線性序列預(yù)測(cè)和長(zhǎng)期預(yù)測(cè)上有一定地劣勢(shì),可以考慮多模型組合的方法改進(jìn),在保證預(yù)測(cè)精度的基礎(chǔ)上,延長(zhǎng)預(yù)測(cè)時(shí)間。希望在未來的研究中,充分融合多學(xué)科知識(shí),為城市交通優(yōu)化提供科學(xué)的方法和支持。3 實(shí)證分析
3.1 路口起訖點(diǎn)分布
3.2 路口過車量預(yù)測(cè)
4 結(jié) 論