冉江宇,戴彥欣
(中國(guó)城市規(guī)劃設(shè)計(jì)研究院,北京100037)
基于特征子序列修正的公交刷卡滯后時(shí)間推算
冉江宇,戴彥欣
(中國(guó)城市規(guī)劃設(shè)計(jì)研究院,北京100037)
針對(duì)一票制公共交通IC卡刷卡系統(tǒng)存在的滯后時(shí)間問(wèn)題,提出基于特征子序列修正的時(shí)差匹配推算方法。依托GPS車(chē)輛到站信息序列和刷卡聚類序列,分析首末站和中途站站間運(yùn)行時(shí)間分布的差異化特征,分別從兩序列中提取大時(shí)間差和連續(xù)小時(shí)間差等特征子序列;利用兩種子序列間一對(duì)一或一對(duì)多的對(duì)應(yīng)關(guān)系分別進(jìn)行初步搜索和二次修正,兼顧匹配過(guò)程的效率和精度。將推算流程應(yīng)用于山西省大同市公共汽車(chē)系統(tǒng),結(jié)果顯示,抽樣車(chē)輛的刷卡匹配率均達(dá)到99%以上,并且針對(duì)不同類型的公共汽車(chē)線路具有較強(qiáng)的適應(yīng)性。
公共汽車(chē);GPS;IC卡;刷卡聚類;首末站;中途站;滯后時(shí)間;特征子序列;修正
公共汽車(chē)GPS(以下簡(jiǎn)稱“GPS”)和公共交通IC卡(以下簡(jiǎn)稱“IC卡”)收費(fèi)系統(tǒng)已應(yīng)用于中國(guó)很多城市。無(wú)論是擁有幾百條線路的大城市還是僅僅擁有十幾條線路的中小城市,通過(guò)安裝GPS系統(tǒng)采集車(chē)輛的實(shí)時(shí)地理位置、時(shí)間及速度等信息,可以實(shí)現(xiàn)公共汽車(chē)智能調(diào)度。超過(guò)200個(gè)城市啟動(dòng)了IC卡系統(tǒng),累積發(fā)出可用于公共交通支付的IC卡超過(guò)3億張[1]。IC卡系統(tǒng)不僅方便居民支付乘車(chē)費(fèi)用,也為將來(lái)實(shí)現(xiàn)公共交通一卡通跨地區(qū)互聯(lián)互通奠定基礎(chǔ)。
多數(shù)城市使用的一票制IC卡刷卡收費(fèi)系統(tǒng)缺少對(duì)乘客上下車(chē)車(chē)站及下車(chē)時(shí)間等內(nèi)容的記錄。有必要結(jié)合GPS系統(tǒng)數(shù)據(jù)對(duì)上述信息進(jìn)行推斷,獲取公共汽車(chē)站換乘量、公共汽車(chē)站間OD等信息[2],以便與居民出行調(diào)查數(shù)據(jù)、城市用地空間分布數(shù)據(jù)等相結(jié)合,支持公共汽車(chē)系統(tǒng)的運(yùn)營(yíng)管理、城市空間結(jié)構(gòu)的合理性判斷以及個(gè)體出行特征的分析等[3]。
文獻(xiàn)[4]基于智利圣地亞哥市的GPS和IC卡刷卡數(shù)據(jù)推算公共汽車(chē)乘客的完整出行鏈,將重點(diǎn)集中于公共汽車(chē)下車(chē)車(chē)站識(shí)別。文獻(xiàn)[5-7]基于連續(xù)性假設(shè)推斷刷卡乘客的下車(chē)車(chē)站,較少涉及公共汽車(chē)上車(chē)車(chē)站的匹配識(shí)別。
中國(guó)每輛公共汽車(chē)的IC卡收費(fèi)設(shè)備與GPS設(shè)備的時(shí)間存在不同程度的偏差,有必要在處理時(shí)逐一核對(duì)每輛車(chē)的偏差。由于工作量較大,相關(guān)數(shù)據(jù)研究人員通常將其轉(zhuǎn)化為刷卡信息序列和GPS車(chē)站信息序列的匹配問(wèn)題。文獻(xiàn)[8]基于GPS相鄰車(chē)站間運(yùn)行時(shí)間序列和相鄰刷卡聚類間時(shí)間差序列,建立約束規(guī)則進(jìn)行序列匹配,將匹配成功數(shù)據(jù)的到站時(shí)間差值平均后作為兩系統(tǒng)的調(diào)整偏差。文獻(xiàn)[1]提出以GPS系統(tǒng)時(shí)間為基準(zhǔn),在調(diào)整兩系統(tǒng)時(shí)差對(duì)刷卡數(shù)據(jù)進(jìn)行修正的過(guò)程中,將刷卡數(shù)據(jù)車(chē)站識(shí)別率達(dá)到最高時(shí)的時(shí)差作為實(shí)際時(shí)差。文獻(xiàn)[9]將基于馬爾可夫鏈的貝葉斯決策樹(shù)算法應(yīng)用到乘客上車(chē)車(chē)站的推算過(guò)程中,針對(duì)提取的首末站間相鄰刷卡聚類序列,求取條件概率乘積最大的車(chē)站序列作為匹配序列。文獻(xiàn)[10]針對(duì)南寧市IC卡刷卡時(shí)間數(shù)據(jù)和GPS時(shí)間數(shù)據(jù)精度不一致的情況,基于GPS數(shù)據(jù)的瞬時(shí)車(chē)速、刷卡時(shí)間以及車(chē)輛運(yùn)行方向等因素推算上車(chē)車(chē)站。既有方法相對(duì)復(fù)雜且耗時(shí)[3],并易受公共汽車(chē)運(yùn)行狀態(tài)、GPS數(shù)據(jù)和IC卡刷卡數(shù)據(jù)完整性的影響,也受制于搜索起點(diǎn)、搜索匹配范圍等因素。
本研究基于大同市GPS和IC卡刷卡數(shù)據(jù),以公共汽車(chē)站間運(yùn)行時(shí)間分布特征為突破口,將首末站和中途站的站間運(yùn)行時(shí)間進(jìn)行區(qū)分和融合,探索適應(yīng)性和靈活性較強(qiáng)的推算方法。
盡管中國(guó)很多城市的IC卡發(fā)行量增長(zhǎng)速度較快,但日刷卡量占公共汽車(chē)客運(yùn)量的比例通常不超過(guò)50%[10-12]。已安裝車(chē)載刷卡機(jī)具的公共汽車(chē)并非在每個(gè)公共汽車(chē)站均有乘客上車(chē),且并非每位上車(chē)乘客均刷卡,因此以相鄰刷卡記錄間的消費(fèi)時(shí)間差為依據(jù)進(jìn)行聚類,類別總數(shù)通常小于車(chē)輛運(yùn)營(yíng)期間經(jīng)過(guò)的車(chē)站總數(shù)。
GPS數(shù)據(jù)記錄了公共汽車(chē)在每個(gè)車(chē)站的進(jìn)站時(shí)間和出站時(shí)間,依據(jù)相鄰車(chē)站的進(jìn)站時(shí)間可以推算車(chē)輛的站間運(yùn)行時(shí)間。相鄰IC卡刷卡記錄間的時(shí)間差包括三種情況:1)在同一個(gè)中途站刷卡上車(chē)的乘客,彼此間的刷卡時(shí)間間隔相對(duì)較短;2)當(dāng)相鄰刷卡乘客位于不同站臺(tái)時(shí),彼此間的刷卡時(shí)間間隔相對(duì)較長(zhǎng);3)當(dāng)車(chē)輛在首末站??繒r(shí)間較長(zhǎng)時(shí),乘客間的刷卡時(shí)間間隔存在不確定性。依據(jù)前兩種情況,相鄰刷卡聚類數(shù)據(jù)間通常包含一個(gè)或多個(gè)站間運(yùn)行時(shí)間,而在第三種情況下,一個(gè)站間運(yùn)行時(shí)間可能包含0至多個(gè)刷卡記錄。如何在GPS車(chē)站信息數(shù)據(jù)和IC卡刷卡聚類數(shù)據(jù)的兩個(gè)序列中選取比選子集,是實(shí)現(xiàn)兩個(gè)數(shù)據(jù)集成功匹配的關(guān)鍵。
以GPS車(chē)站信息數(shù)據(jù)中記錄的進(jìn)站時(shí)間和IC卡刷卡聚類數(shù)據(jù)中各類別首條刷卡記錄時(shí)間為基準(zhǔn),分別計(jì)算各車(chē)輛全日GPS站間時(shí)間差和IC卡刷卡聚類時(shí)間差。圖1展示了山西省大同市某條公共汽車(chē)線路不同車(chē)輛兩種數(shù)據(jù)時(shí)間差的頻數(shù)分布情況。結(jié)果表明,超過(guò)80%的GPS站間時(shí)間差小于3 min,而刷卡聚類時(shí)間差小于3 min的比例不超過(guò)40%,其80%分位點(diǎn)大致為6 min。盡管兩組時(shí)間差序列在數(shù)量規(guī)模和分布特征上均存在差異,但兩組序列中超過(guò)15 min的大時(shí)間差不僅數(shù)量相對(duì)接近,而且一對(duì)一匹配的概率較大。這主要是由于GPS數(shù)據(jù)序列中超過(guò)15 min的大時(shí)間差通常出現(xiàn)在首末站,即車(chē)輛經(jīng)過(guò)長(zhǎng)時(shí)間停放后按照調(diào)度計(jì)劃重新投入運(yùn)營(yíng),或受高峰時(shí)段擁堵影響、站間運(yùn)行時(shí)間超出常規(guī)的中途站。無(wú)論是上述哪種情況,刷卡聚類序列中必然存在同樣數(shù)量級(jí)的大時(shí)間差,其所屬類別的首條刷卡記錄消費(fèi)時(shí)間與GPS序列中出現(xiàn)大時(shí)間差的進(jìn)站時(shí)間具有較強(qiáng)的對(duì)應(yīng)關(guān)系。因此,盡管刷卡聚類序列中還可能存在部分大時(shí)間差是由于相鄰刷卡記錄相隔多個(gè)車(chē)站所致,但以GPS站間大時(shí)間差為準(zhǔn),依據(jù)相鄰刷卡聚類間大時(shí)間差、刷卡消費(fèi)時(shí)間、GPS進(jìn)站時(shí)間等多個(gè)字段對(duì)兩序列中提取的大時(shí)間差子集進(jìn)行匹配,能夠提高準(zhǔn)確度。此外,大時(shí)間差子序列中有限的記錄數(shù)量也有利于提高匹配效率。
依據(jù)大時(shí)間差特征子序列推算的兩系統(tǒng)間時(shí)差往往受刷卡記錄出現(xiàn)時(shí)刻的隨機(jī)性影響,產(chǎn)生不同程度的偏差。尤其當(dāng)大時(shí)間差出現(xiàn)在非高峰時(shí)段的線路首末站時(shí),偏差更加明顯,有必要在初步推算基礎(chǔ)上對(duì)滯后差值進(jìn)行二次修正。修正的主要思路是從公共汽車(chē)刷卡聚類數(shù)據(jù)中選擇一段連續(xù)子序列作為目標(biāo),以該序列中首條刷卡記錄的消費(fèi)時(shí)間、上述大時(shí)間差序列推算得到的初步滯后時(shí)間和容忍閾值共同確定GPS子序列的搜索范圍,以期找到與目標(biāo)刷卡連續(xù)子序列匹配度最佳的GPS連續(xù)子序列。
目標(biāo)刷卡連續(xù)子序列的選取標(biāo)準(zhǔn)為:1)盡可能避免將公共汽車(chē)首末站長(zhǎng)時(shí)間停留期間的刷卡記錄類別納入目標(biāo)序列,使目標(biāo)序列中的刷卡聚類時(shí)間差與GPS連續(xù)子序列中的進(jìn)站時(shí)間差均為一對(duì)多關(guān)系;2)目標(biāo)序列中的刷卡聚類數(shù)盡可能多,以便充分檢驗(yàn)GPS連續(xù)子序列的匹配度。
圖2 典型車(chē)輛刷卡記錄數(shù)和刷卡聚類數(shù)比例Fig.2 Ratio of the number of IC card charging records and number of clusters
本文選取IC卡系統(tǒng)滯后時(shí)間已得到修正的4輛公共汽車(chē)為例,將其刷卡記錄數(shù)和刷卡聚類數(shù)按照修正時(shí)段進(jìn)行統(tǒng)計(jì),得到刷卡記錄數(shù)波動(dòng)圖和刷卡聚類數(shù)比例(即刷卡聚類數(shù)與經(jīng)過(guò)車(chē)站數(shù)的比值)波動(dòng)圖(見(jiàn)圖2)。結(jié)果表明,刷卡記錄數(shù)較多的時(shí)段,其刷卡聚類數(shù)比例相對(duì)較高,即高峰時(shí)段刷卡聚類數(shù)通常較多,線路上多個(gè)車(chē)站均有刷卡記錄的概率較大?;谏鲜鲈瓌t和刷卡數(shù)據(jù)分布特征,以每輛車(chē)相鄰中途站進(jìn)站時(shí)間差的95%分位數(shù)為基準(zhǔn),當(dāng)IC卡聚類序列中出現(xiàn)一連串首記錄時(shí)間差小于等于95%分位數(shù)的刷卡類別,并且各類別所對(duì)應(yīng)的刷卡數(shù)量較多時(shí),該小時(shí)間差序列即可作為目標(biāo)刷卡連續(xù)子序列。GPS站間時(shí)間差序列中所尋求的連續(xù)子序列須滿足的條件是:每條時(shí)間差記錄或相鄰時(shí)間差記錄之和與目標(biāo)刷卡連續(xù)子序列中的每條刷卡聚類時(shí)間差記錄連續(xù)對(duì)應(yīng),對(duì)應(yīng)記錄間的絕對(duì)誤差均小于一定閾值,即可認(rèn)為上述兩連續(xù)子序列匹配。
本文提出的滯后時(shí)間推算方法所基于的刷卡數(shù)據(jù)集須包含消費(fèi)時(shí)間、車(chē)輛編號(hào)等字段,GPS數(shù)據(jù)集須包括車(chē)輛編號(hào)、車(chē)站名稱、上下行方向、進(jìn)站時(shí)間等字段。按照上述推算思路,提出具體推算流程如下:
1)將IC卡數(shù)據(jù)和GPS數(shù)據(jù)按照車(chē)輛編號(hào)進(jìn)行拆分歸類,并分別按照消費(fèi)時(shí)間和進(jìn)站時(shí)間進(jìn)行排序。設(shè)第i輛車(chē)的IC卡數(shù)據(jù)序列為GPS數(shù)據(jù)序列為其中 p和q分別為第i輛車(chē)IC卡數(shù)據(jù)序列和GPS數(shù)據(jù)序列的記錄編號(hào),k和h分別為記錄編號(hào)的上限。
2)對(duì)每輛車(chē)的刷卡數(shù)據(jù)集按消費(fèi)時(shí)間差進(jìn)行聚類,依據(jù)聚類結(jié)果和相鄰類別時(shí)間差閾值為每一類別統(tǒng)計(jì)連續(xù)聚類數(shù)。設(shè)第i輛車(chē)的刷卡聚類結(jié)果為序列序列中的各記錄均包括刷卡聚類號(hào)、聚類時(shí)刻、相鄰類別時(shí)間差、刷卡數(shù)量和連續(xù)聚類數(shù)等字段,m為聚類總數(shù)(m<k,m<h)。
3)針對(duì)同一車(chē)輛號(hào)i的刷卡聚類序列和GPS序列,分別提取大時(shí)間差子序列進(jìn)行初步匹配。大時(shí)間差提取閾值γ與城市公共汽車(chē)線路的平均站間距、高峰時(shí)段運(yùn)營(yíng)車(chē)速和車(chē)輛調(diào)度計(jì)劃等相關(guān),通常可設(shè)置為15 min以上。設(shè)從序列中提取的大時(shí)間差子序列為序列中提取的大時(shí)間差子序列為兩序列分別按照相鄰類別時(shí)間差和進(jìn)站時(shí)間差大小排序,具體匹配規(guī)則如下:
②對(duì)備選集合Si中的數(shù)據(jù)按相似度進(jìn)行聚類,選取規(guī)模最大的類別中各數(shù)平均值作為初步匹配滯后時(shí)間hi。
表1 抽樣公共汽車(chē)線路現(xiàn)狀特征Tab.1 Characteristics of sampled bus lines
④遍歷備選集合Zi中的各數(shù)組。設(shè)中末尾的GPS記錄為當(dāng)將第 ( )q+g條GPS記錄作為新的末尾GPS記錄;否則,在備選集合Zi中刪除數(shù)組
⑤當(dāng)備選集合Zi中僅剩唯一數(shù)組時(shí),該數(shù)組中首個(gè)GPS記錄的進(jìn)站時(shí)刻與的差值,即為第i輛車(chē)的最終匹配滯后時(shí)間;否則,轉(zhuǎn)入步驟③。
上述流程首先將刷卡序列中的相鄰數(shù)據(jù)進(jìn)行聚類,以期能夠與GPS數(shù)據(jù)序列形成匹配對(duì)應(yīng)關(guān)系。其次,以刷卡聚類序列和GPS序列中的大時(shí)間差子序列為匹配依據(jù),選取滯后時(shí)間備選集合中出現(xiàn)頻率最高區(qū)間的平均值作為初步匹配滯后時(shí)間,以此縮小后續(xù)搜索范圍。在確定目標(biāo)刷卡連續(xù)子序列時(shí),查找最大連續(xù)聚類數(shù)的出現(xiàn)位置,更易捕捉公共汽車(chē)在高峰運(yùn)營(yíng)狀態(tài)下的連續(xù)中途站刷卡記錄,減少首末站長(zhǎng)時(shí)間停靠、高峰時(shí)間平均行駛車(chē)速較低等因素的干擾。
本文針對(duì)2014年9月18日大同市中心城區(qū)18路、22路、24路和59路4條公共汽車(chē)線路,每條線路隨機(jī)選取4輛公共汽車(chē),提取其GPS數(shù)據(jù)和IC卡數(shù)據(jù),采用基于特征子序列二次修正的推算方法對(duì)每輛車(chē)的兩組時(shí)間序列進(jìn)行匹配。4條公共汽車(chē)線路的上下行車(chē)站數(shù)、抽樣車(chē)輛刷卡總數(shù)及沿線串聯(lián)用地特征狀況如表1所示。所選對(duì)象包含上下行車(chē)站不對(duì)稱線路以及抽樣刷卡數(shù)相對(duì)較少線路,線路服務(wù)區(qū)域及沿線用地特征差別較大??梢越璐藱z驗(yàn)本文所提出的推算方法是否適用于不同情境。
表2 抽樣車(chē)輛刷卡滯后時(shí)間匹配結(jié)果Tab.2 Estimated results of IC card lag time
將16輛公共汽車(chē)的刷卡數(shù)據(jù)集按車(chē)輛號(hào)進(jìn)行拆分,分別按刷卡消費(fèi)時(shí)間進(jìn)行排序和聚類,聚類時(shí)設(shè)置的刷卡時(shí)間差閾值α=60s,為每一類別統(tǒng)計(jì)連續(xù)聚類數(shù)時(shí)設(shè)置的相鄰中途站GPS進(jìn)站時(shí)間差95%分位數(shù)βi和每輛車(chē)的刷卡聚類數(shù)見(jiàn)表2。依據(jù)出現(xiàn)在線路首末站的GPS大時(shí)間差統(tǒng)計(jì)特征,設(shè)置大時(shí)間差提取閾值γ=1 000s,大時(shí)間差匹配閾值 ε1,ε2分別設(shè)置為1 500 s和500 s,得到每輛車(chē)的初步匹配滯后時(shí)間hi如表2所示。采用逐步延伸法提取目標(biāo)刷卡連續(xù)序列的過(guò)程中,GPS初始進(jìn)站時(shí)刻控制容差值δ1設(shè)為900 s,相鄰站間的進(jìn)站時(shí)間差控制容差值δ2設(shè)為50 s,在初步匹配滯后時(shí)間的基礎(chǔ)上經(jīng)過(guò)有限次篩選,得到最終匹配滯后時(shí)間。以此修正每輛車(chē)刷卡記錄的消費(fèi)時(shí)間,與車(chē)輛所屬線路各車(chē)站的GPS進(jìn)站和出站時(shí)間進(jìn)行比對(duì),獲取每條刷卡記錄所在的公共汽車(chē)站位置。
圖3 抽樣車(chē)輛不同車(chē)站刷卡上客量分布Fig.3 Number of IC card users of boarding at each stop
表2顯示,16輛車(chē)的刷卡匹配率統(tǒng)計(jì)結(jié)果均在99%以上,匹配效果良好。按照線路匯總統(tǒng)計(jì)抽樣車(chē)輛各車(chē)站的刷卡上客量(見(jiàn)圖3),各線路的車(chē)站刷卡上客量分布狀況與線路各車(chē)站周邊主要用地特征吻合度較高,一定程度上證明該推算方法具有較強(qiáng)的適用性。此外,最終匹配滯后時(shí)間最短不小于1 min,最長(zhǎng)可超過(guò)1 h,在數(shù)量級(jí)上存在的不確定性說(shuō)明推算過(guò)程中不宜預(yù)先設(shè)置固定的搜索范圍,以適應(yīng)不同城市車(chē)載刷卡機(jī)具時(shí)間校核狀況的多樣性。最終匹配滯后時(shí)間和初步匹配滯后時(shí)間的差值為30 s~7 min 34 s??梢?jiàn),部分車(chē)輛僅依靠大時(shí)間差推算結(jié)果會(huì)產(chǎn)生較大偏差,有必要通過(guò)二次修正法對(duì)初步推算結(jié)果進(jìn)行調(diào)整。
本文依托公共汽車(chē)GPS數(shù)據(jù)序列和公交IC卡刷卡聚類序列,通過(guò)比較GPS進(jìn)站時(shí)間差和刷卡聚類時(shí)間差的分布特征,提出基于特征子序列二次修正的匹配滯后時(shí)間推算方法。該方法從原序列中提取大時(shí)間差和連續(xù)小時(shí)間差兩種特征子序列,很大程度上確保了子序列間各組數(shù)據(jù)的對(duì)應(yīng)性。同時(shí),基于大時(shí)間差子序列的推算結(jié)果有助于確定搜索區(qū)間,縮小后續(xù)環(huán)節(jié)的搜索范圍。而連續(xù)小時(shí)間差子序列所包含的時(shí)間數(shù)據(jù)相對(duì)精細(xì),兩者間的互補(bǔ)使該推算方法整體兼顧了效率和準(zhǔn)確,有利于實(shí)現(xiàn)上千輛公共汽車(chē)的批量化處理。與既有方法相比,本文所提的修正方法無(wú)須在初始階段設(shè)定匹配滯后時(shí)間的范圍,且在一定程度上能夠適應(yīng)多種不同特征的公共汽車(chē)線路。該方法涉及閾值、容差值等多個(gè)參數(shù)的設(shè)置,本次研究?jī)H選擇幾條線路的有限車(chē)輛進(jìn)行嘗試。未來(lái)在推廣應(yīng)用過(guò)程中,須進(jìn)一步探索參數(shù)設(shè)置對(duì)更多類型線路及路況的適應(yīng)性,以期實(shí)現(xiàn)參數(shù)隨線路特征進(jìn)行針對(duì)性的調(diào)整。
[1]陳學(xué)武,李海波,侯現(xiàn)耀.城市公交IC卡數(shù)據(jù)分析方法及應(yīng)用[M].北京:科學(xué)出版社,2014.
[2]周濤,翟長(zhǎng)旭,高志剛.基于公交IC卡數(shù)據(jù)的OD推算技術(shù)研究[J].城市交通,2007,5(3):48-52.Zhou Tao,Zhai Changxu,Gao Zhigang.Approaching Bus OD Matrices Based on Data Reduced from Bus IC Cards[J].Urban Transport of China,2007,5(3):48-52.
[3]龍瀛,孫立君,陶遂.基于公共交通智能卡數(shù)據(jù)的城市研究綜述[J].城市規(guī)劃學(xué)刊,2015(3):70-77.Long Ying,Sun Lijun,Tao Sui.A Review of Urban Studies Based on Transit Smart Card Data[J].Urban Planning Forum,2015(3):70-77.
[4]Munizaga M A,Palma C.Estimation of a Disaggregate Multimodal Public Transport Origin-Destination Matrix from Passive Smartcard Data from Santiago,Chile[J].Transportation Research Part C:Emerging Technologies,2012,24(9):9-18.
[5]Trepanier M,Tranchant N,Chapleau R.Individual Trip Destination Estimation in a Transit Smart Card Automated Fare Collection System[J].Journal of Intelligent Transportation Systems,2007,11(1):1-14.
[6]Zhao Jinhua,Rahbee A,Wilson N.Estimating a Rail Passenger Trip Origin-Destination Matrix Using Automatic Data Collection Systems[J].Computer-Aided Civil and Infrastructure Engineering,2007,22(5):376-387.
[7]Farzin J M.Constructing an Automated Bus Origin-Destination Matrix Using Farecard and Global Positioning System Data in Sao Paulo,Brazil[J].Transportation Research Record,2008(2072):30-37.
[8]陳紹輝,陳艷艷,賴見(jiàn)輝.基于GPS與IC卡數(shù)據(jù)的公交站點(diǎn)匹配方法[J].公路交通科技,2012,29(5):102-108.Chen Shaohui,Chen Yanyan,Lai Jianhui.An Approach on Station ID and Trade Record Match Based on GPS and IC Card Data[J].Highway and Transportation Research and Development,2012,29(5):102-108.
[9]Ma Xiaolei,Wang Yinhai,Chen Feng,Liu Jianfeng.Transit Smart Card Data Mining for Passenger Origin Information Extraction[J].Journal of Zhejiang University Science C:Computer&Electronics,2012,13(10):750-760.
[10]陳君,楊東援.基于智能調(diào)度數(shù)據(jù)的公交IC卡乘客上車(chē)站點(diǎn)判斷方法[J].交通運(yùn)輸系統(tǒng)工程與信息,2013,13(1):76-80.Chen Jun,Yang Dongyuan.Identifying Boarding Stops of Bus Passengers with Smart Cards Based on Intelligent Dispatching Data[J].Transportation Systems Engineering and Information Technology,2013,13(1):76-80.
[11]楊東援,段征宇.大數(shù)據(jù)環(huán)境下城市交通分析技術(shù)[M].上海:同濟(jì)大學(xué)出版社,2015.
[12]鄧春瑤.哈爾濱市居民公交IC卡數(shù)據(jù)分析方法研究[D].哈爾濱:東北林業(yè)大學(xué),2013.Deng Chunyao.Study on Analysis Method of Bus IC Data of Harbin City Residents[D].Harbin:Northeast Forestry University,2013.
Lag Time Estimation of IC Card Charging Records Based on Revision of Characteristic Subsequences
Ran Jiangyu,Dai Yanxin
(ChinaAcademy of Urban Planning&Design,Beijing 100037,China)
To better solve the problem of lag time of IC card charging records in flat fare system,this paper proposes an estimation method for inferring time difference of IC card based on revision of characteristic subsequences.According to the arrival time sequence of GPS records and clusters of IC card charging records,the paper firstly analyzes the variation of travel time among stops which is for extracting a serial of large time difference and a serial of small time difference respectively.And then,the paper utilizes the relations of one-to-one or one-to-multiple to implement preliminary searching and revising by constraints of estimation efficiency and accuracy.The results in Datong show that the successful match ratio reaches to above 99%for sampled buses.
bus;GPS;IC card;clustering sequences of IC card charging records;terminals;bus stops;lag time;characteristic subsequences;revision
1672-5328(2017)01-0059-07
U491.1+7
A
10.13813/j.cn11-5141/u.2017.0109
2016-03-01
冉江宇(1985—),男,江蘇揚(yáng)州人,博士,高級(jí)工程師,主要研究方向:城市交通規(guī)劃、交通需求分析。E-mail:jaredhaha@163.com