張禮平
摘 要:基于公交IC卡刷卡消費(fèi)記錄數(shù)據(jù),提出乘客上車站點(diǎn)估計(jì)模型,主要包括刷卡時(shí)間序列的聚類分析和類與站點(diǎn)的匹配模型。根據(jù)經(jīng)緯度的坐標(biāo)來計(jì)算相鄰站點(diǎn)間的距離,并在考慮交通信號(hào)燈和道路情況的前提下依次進(jìn)行公交車輛某次出行的行車時(shí)間的計(jì)算,特別針對(duì)在站點(diǎn)(除終點(diǎn)站)無人上車的情況考慮類與站點(diǎn)的匹配,最后分析公交線路站點(diǎn)處的上車客流量特征和線路滿載率。
關(guān)鍵詞:公共交通;公交客流;公交智能卡;聚類算法
中圖分類號(hào):U491.17 文獻(xiàn)標(biāo)識(shí)碼:A
0 引言
智能公交系統(tǒng)內(nèi)儲(chǔ)存的數(shù)據(jù)資料是國外學(xué)者的重點(diǎn)研究對(duì)象,Pelletier等綜合介紹了公交IC卡記錄數(shù)據(jù)在公共交通方面詳細(xì)使用情況[1];Ceder等人研究了基于公交IC據(jù)的換乘站點(diǎn)公交客流信息,對(duì)公交調(diào)度進(jìn)行了優(yōu)化[2];Jin Young Park等人將IC卡數(shù)據(jù)和GPS數(shù)據(jù)進(jìn)行融合,針對(duì)不同時(shí)間段的乘客出行規(guī)律、運(yùn)行速度進(jìn)行研究分析[3];Dessouky等利用公交刷卡數(shù)據(jù)計(jì)算道路中路段的行駛時(shí)間,從而預(yù)測(cè)公交車輛的到站時(shí)間;Koutsopouls等采用數(shù)學(xué)規(guī)劃的方法來分析乘客的刷卡數(shù)據(jù)和公交集團(tuán)的運(yùn)營(yíng)調(diào)度信息;Bagchi等利用公交IC卡中的信息,分析乘客出行行為中的乘客周轉(zhuǎn)率、乘客消費(fèi)金額[4]。國內(nèi)陳學(xué)武[5]等人使用統(tǒng)計(jì)分析的方法對(duì)公交刷卡數(shù)據(jù)展開研究,并分析乘客行為規(guī)律。李文鋒將公交刷卡數(shù)據(jù)與GPS數(shù)據(jù)進(jìn)行匹配,對(duì)公交客流建立多維度數(shù)學(xué)分析模型,分析公交客流特征[6]。公交系統(tǒng)存儲(chǔ)的數(shù)據(jù)與傳統(tǒng)的調(diào)查方式收集的數(shù)據(jù)相比,公交系統(tǒng)存儲(chǔ)的數(shù)據(jù)更具有時(shí)效性、代表性、準(zhǔn)確性更高、成本低。
1 估計(jì)乘客上車站點(diǎn)的模型
1.1 刷卡時(shí)間序列的聚類分析
由于乘客上車刷卡消費(fèi)記錄中刷卡時(shí)間具有不可逆性,分析乘客上車刷卡時(shí)間差序列,以公交車在最短相鄰倆站點(diǎn)間的行車時(shí)間作為聚類分析的最小距離[7]。記某條線路的總站點(diǎn)數(shù)為m,站點(diǎn)序列為M={1,2,3,……,m},采用經(jīng)緯度坐標(biāo)[8]的方法計(jì)算公交車由站點(diǎn)i到站點(diǎn)i+1的距離d(i,i+1),則公交車由起點(diǎn)站到終點(diǎn)站的全程距離D:
(1-1)
假定在起點(diǎn)站有乘客刷卡上車開,終點(diǎn)站時(shí)無乘客刷卡上車。一輛公交車一次出行的全程行駛時(shí)間T:
(1-2)
其中:t1——該公交車于此趟出行時(shí)所記錄的最早一個(gè)公交乘客刷卡乘車的上車時(shí)間;
tn——最晚一個(gè)公交乘客刷卡乘車的上車時(shí)間;
α——交通信號(hào)燈的影響系數(shù),0<α<1;
δ——由最后一位乘客刷卡上車時(shí)間來給出的調(diào)整系數(shù),δ>0。
公交車在某次出行中行駛的平均速度V是全程距離D與全程行車時(shí)間T之比,則聚類的最小距離Tmin為公交線路上相鄰兩個(gè)站點(diǎn)間的最小距離dmin與平均速度V之比。
1.2 類與站點(diǎn)的匹配模型
以最小距離為聚類依據(jù),將刷卡時(shí)間序列分為n類,需要考慮相鄰兩類間的行駛距離Δd(k-1,k)和相鄰站點(diǎn)間的固定距離的關(guān)系來匹配。設(shè)起點(diǎn)站與第一類匹配,終點(diǎn)站不進(jìn)行匹配,進(jìn)行第二類匹配時(shí),可供匹配的站點(diǎn)序列為{2,3,4,……,m-1},其中有m-1-n個(gè)站點(diǎn)沒有乘客上車,記為ΔS1,因此第二類的上車站點(diǎn)只能是候選站點(diǎn)序列{2,2+1,2+2,……,2+ΔS1}中的一個(gè)站點(diǎn)。計(jì)算第一類與第二類之間的行駛距離Δd(1,2),再計(jì)算起點(diǎn)站到其他站點(diǎn)的固定距離d(n1,n1+i),Δd(1,2)與d(n1,n1+i)近似時(shí),此時(shí)站點(diǎn)與第二類匹配,無乘客上車的站點(diǎn)數(shù)量為第二類上車站點(diǎn)與第一類上車站點(diǎn)間隔的站點(diǎn)數(shù)。依次估計(jì)各類的上車站點(diǎn),無乘客上車的站點(diǎn)數(shù)量滿足如式1-3的規(guī)律:
(1-3)
第nk類所對(duì)應(yīng)的上車站點(diǎn)mk的估計(jì)模型如式1-4:
(1-4)
其中:Δt(k-1,k)——最晚刷卡乘車的上車時(shí)間和緊鄰后一類中最早的上車時(shí)間之間的間隔。
2 結(jié)果分析
2.1 客流量分布特征
以金華市繁忙線路K330為實(shí)例,線路分為上行和下行兩個(gè)方向,其中上行共計(jì)21個(gè)站點(diǎn),下行共計(jì)22個(gè)站點(diǎn),發(fā)車間隔9~15分鐘。對(duì)K330一個(gè)月公交IC卡刷卡消費(fèi)數(shù)據(jù)進(jìn)行分析,其線路客流呈現(xiàn)周期性變化,七天一個(gè)周期??土髑€會(huì)出現(xiàn)“波峰”和“波谷”,周一至周五平均客流量為6.249 3萬人,變化較為平緩;周六和周日的客流量變化較大,是客流曲線上的“波峰”。K330線路客流量時(shí)間上的分布不均衡性,客流量變化曲線有規(guī)律的波動(dòng),體現(xiàn)了市區(qū)的出行需求,表明市民在周末的出行比其他時(shí)間段明顯增多。
2.2 滿載率分析
線路晚高峰時(shí)間段客流量處于相對(duì)較高的水平,最大滿載率一般都發(fā)生于早高峰時(shí)段。金華市K330路的客流高峰期出現(xiàn)在早上七點(diǎn)到九點(diǎn)之間,K330路在高峰時(shí)段的運(yùn)營(yíng)已接近飽和,高峰滿載率已經(jīng)到達(dá)70%以上。
3 結(jié)論
本文以公交IC卡刷卡數(shù)據(jù)作數(shù)據(jù)支撐,提出上車站點(diǎn)估計(jì)模型,用所提出的模型來完成客流量的統(tǒng)計(jì),分析線路客流分布特征和滿載率分析,客流量在時(shí)間分布上具有不均衡性和呈現(xiàn)周期性波動(dòng),高峰時(shí)段和非高峰時(shí)間的客流量變化特別明顯。對(duì)其高峰時(shí)段采用有限措施來緩解交通問題,更加合理地安排公交調(diào)度。
參考文獻(xiàn):
[1]Marie-Pier Pelletier,Martin Trepanier,Catherine Morency.Smart card data use in public transit: A literature review[J].Transportation Research Part C,2011(19):557-56.
[2]Ceder,A.and tal.“Timetable synchronization for buses.”Computer-aided scheduling of public transport,N.H.M.Wilson,ed,Springer,New York,1998.
[3]Jin Young Park,Dong-Jun Kim.Use of Smart Card Data to Define Public Transit Use in Seoul,South Korea[J].Transportation Research Record: Journal of the Transportation ResearchBoard.Vo1.2063,2008:3-9.
[4]M.Bagchi,P.R.White.The potential of public transport smart card data[J].Transport Policy,2005,12:464-474.
[5]李海波,陳學(xué)武.基于公交IC卡和AVL數(shù)據(jù)的換乘行為識(shí)別方法[J].交通運(yùn)輸系統(tǒng)工程與信息,2013(06):73-79.
[6]李文鋒,林艷玲,程遠(yuǎn).基于公交IC卡與GPS數(shù)據(jù)的公交客流可視化分析[J].交通科技與經(jīng)濟(jì),2018,20(05):55-59+80.
[7]胡雷芳.五種常用系統(tǒng)聚類分析方法及其比較[J].經(jīng)濟(jì)研究,2006,3(02):61-65.
[8]崔金紅,王旭.Google地圖算法研究及實(shí)現(xiàn)[J].計(jì)算機(jī)科學(xué),2008,34(11):193-195.