呂振華,吳健平,姚申君,朱麗
(華東師范大學(xué)地理信息科學(xué)教育部重點實驗室,上海200241)
基于FCD的出租車運營特征分析
——以上海市為例
呂振華,吳健平,姚申君,朱麗
(華東師范大學(xué)地理信息科學(xué)教育部重點實驗室,上海200241)
為全面掌握出租車出行規(guī)律,科學(xué)評估其運營效率,提出了一種面向出租車運營管理的大規(guī)模浮動車數(shù)據(jù)處理方法.以上海市一個月的出租車GPS數(shù)據(jù)為基礎(chǔ),通過對多項運營指標(biāo)的計算全面分析了工作日、周末及節(jié)假日上海市出租車的運營特征.結(jié)果表明,上海市日均出租車空駛率均值為39.1%,已接近合理范圍的臨界上限值,單日內(nèi)道路空駛率時空差異明顯;與工作日相比,周日和節(jié)假日的運營時間及載客時間短且運營效率不高.出租車運營效率有待改善.
浮動車;出租車;運營;上海
出租車是公共汽車、軌道交通等城市常規(guī)公共交通的重要補充,是城市客運交通的重要組成部分[1].然而由于缺乏有效管理,在北京、上海等大城市,高峰時段打不到車但出租車空駛率卻較高的現(xiàn)象普遍存在[2].全面分析與掌握出租車運營特征,可以有效提高行業(yè)整體運營效率,為出租車運營公司車輛調(diào)度、出租車行業(yè)規(guī)劃、交通管理部門政策制定提供決策支持.
傳統(tǒng)出租車運營數(shù)據(jù)采集方式有人工調(diào)查方法和基于計價器IC卡數(shù)據(jù)的方法.前者需耗費大量的人力,調(diào)查數(shù)據(jù)的可靠性低;后者無法記錄每次出行的空間地理信息,而無法獲得車輛的空間分布情況.隨著移動傳感技術(shù)的發(fā)展,浮動車技術(shù)已逐漸成為出租車信息采集的主要手段.近年來,國內(nèi)外學(xué)者已開始利用浮動車數(shù)據(jù)(Floating Car Data,FCD)開展出租車運營特征的研究.文獻(xiàn)[3-5]對出租車運營服務(wù)評價進(jìn)行了建模,并通過仿真驗證了其效用;文獻(xiàn)[6]利用100個出租車GPS數(shù)據(jù)確定出租車上下客點的位置,分析出行需求、出行距離和出行時長3項指標(biāo);文獻(xiàn)[7]設(shè)計開發(fā)了出租車運營狀況分析系統(tǒng);文獻(xiàn)[8]以北京為例提出了基于浮動車數(shù)據(jù)的出租車運營管理指標(biāo)計算模型,計算了每日運營里程、每日運營時間等6個指標(biāo);文獻(xiàn)[9]以廣州市為例,選取5個典型工作日的出租車GPS數(shù)據(jù),分析了廣州市出租車運營的出行需求分布、里程空載率、時間空載率等6個指標(biāo),提取了廣州市出租車運營管理水平的重要特征參數(shù);文獻(xiàn)[10]提出面向出租汽車運營特征分析的數(shù)據(jù)處理流程,選取一個典型工作日,針對空駛率、運營速度、載客運營時長等方面,分析了深圳市出租汽車行業(yè)運營現(xiàn)狀與特點;文獻(xiàn)[11]設(shè)計了空駛率的計算方法;文獻(xiàn)[12]利用葡萄牙里斯本的出租車數(shù)據(jù)討論了出租車的運營策略;文獻(xiàn)[13]采用了時空觀測模型分析了北京市出租車的各項指標(biāo).然而,過往研究或未對浮動車數(shù)據(jù)源及數(shù)據(jù)處理方面進(jìn)行探討[3-5],目前也尚未有論文全面研究面向出租車管理的數(shù)據(jù)處理方法;或樣本過小,指標(biāo)過少[6,13];或?qū)\營狀況缺乏具體的分析,忽略了周末及節(jié)假日的運營情況[7-13];尤其對空間分析略顯不足[3-10].
為全面掌握出租車出行規(guī)律,科學(xué)評估其運營效率,本研究提出了一種面向于大規(guī)模出租車運營管理的數(shù)據(jù)處理方法.以上海市一個月的出租車GPS數(shù)據(jù)為基礎(chǔ),通過對多項運營指標(biāo)的計算全面分析工作日、周末及節(jié)假日上海市出租車的運營特點.
1.1 原始數(shù)據(jù)描述
1.1.1 出租車軌跡數(shù)據(jù)
研究使用的FCD來源于上海市強生出租車公司管理的出租車行駛軌跡數(shù)據(jù)集.強生出租車公司是上海乃至中國最大的出租汽車經(jīng)營商,有出租車近14 000輛,約占上海市出租汽車總量的25%.出租車以一定周期(平均10 s)回傳數(shù)據(jù),記錄行駛狀態(tài)(如位置坐標(biāo)、航向、速度等)及營運狀態(tài)(如空駛、載客等)信息.在強生公司提供的數(shù)據(jù)集中,包含約13 700輛出租車在2015年4月份共30日的軌跡點采樣數(shù)據(jù).軌跡點采樣數(shù)據(jù)按照行記錄的方式存儲在文本文件中,每一行記錄一個軌跡點的信息,每日歸檔一個文本文件.每日歸檔文件的大小約10 GB,包含近1.2億行采樣記錄.每一條記錄包含13個字段,分別表示車輛編號、GPS設(shè)備的報警標(biāo)志、是否空駛狀態(tài)、車頂指示燈的狀態(tài)、是否行駛在高架上、是否剎車、數(shù)據(jù)中心接受數(shù)據(jù)的時間、GPS設(shè)備測定的時間、采樣點的經(jīng)度坐標(biāo)、采樣點的緯度坐標(biāo)、采樣時刻的即時速度、車輛移動方向與指北針的夾角、用于定位的衛(wèi)星個數(shù).
1.1.2 路網(wǎng)數(shù)據(jù)
論文研究所用的路網(wǎng)數(shù)據(jù)來源于OpenStreetMap[14].OpenStreetMap數(shù)據(jù)的優(yōu)點是數(shù)據(jù)可以免費獲得,缺點是數(shù)據(jù)質(zhì)量不能嚴(yán)格保證.為此,對下載的數(shù)據(jù)利用2015年上海市航空遙感數(shù)據(jù)進(jìn)行了編輯,修正原有數(shù)據(jù)中存在的錯誤.
1.2 數(shù)據(jù)處理流程
面向出租車運營管理的大規(guī)模FCD處理流程包括數(shù)據(jù)預(yù)處理、地圖匹配、軌跡切分3個主要階段.整個數(shù)據(jù)處理過程依賴基于ESRI ArcGIS Engine 10.1的GIS二次開發(fā).使用C#.NET及Visual Studio 2010作為開發(fā)語言和工具;微軟SQL Server 2012作為存放軌跡及中間數(shù)據(jù)的數(shù)據(jù)庫管理系統(tǒng);DevExpress XPO(eXpress Persistent Objects)作為對象持久化模型,以簡化對數(shù)據(jù)庫的操作.
1.2.1 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理階段主要包括去噪處理、數(shù)據(jù)缺失檢測及軌跡壓縮三個步驟.
(1)去噪處理根據(jù)軌跡點的速度和時間字段剔除速度過大或時間記錄有誤的點(異常點).例如由于管控限制,行程速度一般不會超過80 km/h(限速),故速度大于80 km/h的點將會被剔除.本研究去除的異常點約占總數(shù)的0.3%.
(2)數(shù)據(jù)缺失檢測根據(jù)軌跡點的時間字段檢測數(shù)據(jù)缺失的軌跡.設(shè)定最長時間間隔閾值,如相鄰兩個軌跡點時間間隔大于閾值,則認(rèn)為兩點之間有數(shù)據(jù)缺失,兩邊的軌跡不應(yīng)相連,而應(yīng)作為兩段子軌跡分別對待.本研究的樣本采樣間隔由1 s到240 s不等,55%左右穩(wěn)定在10 s,絕大多數(shù)在120 s之內(nèi)(99.9%).由樣本計算出租車的平均速度約為18 km/h,若缺失120 s,則連續(xù)兩個回傳數(shù)據(jù)的軌跡點間距過長,將大大影響地圖匹配及路徑重現(xiàn)的精度.故本研究將采用120 s作為時間間隔閾值.
(3)軌跡壓縮去除冗余數(shù)據(jù).根據(jù)軌跡點坐標(biāo)字段計算相鄰兩點距離,如后一個點與前一個點的距離小于閾值,則認(rèn)為這兩個點處于同一位置,后一個點是冗余的點,可以去除.本研究選擇的距離閾值為10 m(與GPS的定位誤差相近).本研究的數(shù)據(jù)壓縮比(壓縮之后的軌跡點數(shù)與壓縮之前的軌跡點數(shù)之比)約為50%.
1.2.2 地圖匹配
地圖匹配的目的是要將車輛與當(dāng)前行駛的道路進(jìn)行關(guān)聯(lián).為了能從整體上保證軌跡點的地圖匹配精度,研究采用了基于點序列的地圖匹配方法,每次同時對一個序列中的點進(jìn)行地圖匹配,以保證匹配后前后點是路徑連接的.具體方法是∶每次從軌跡數(shù)據(jù)中讀取一個點序列;對序列中的每個點根據(jù)距離閾值查找候選匹配路段,根據(jù)路網(wǎng)數(shù)據(jù)中路段的連接關(guān)系和方向確定拓?fù)溥B通的所有組合路段(如候選匹配路段沒有拓?fù)溥B通則從路網(wǎng)數(shù)據(jù)中提取所有可能經(jīng)過的路段);從所有組合路段中確定最佳的組合路段,可選擇采用最佳路徑(距離最短或速度最快)作為確定最佳的組合路段.本研究采用的是最短路徑的方法.
1.2.3 軌跡切分
出租車的狀態(tài)首先可分為行駛和停車.前者包括載客行駛和空車行駛;后者包括停車下班、停車吃飯、停車加油、停車修車、停車等客等實際停留情況(不包括由于堵車、等紅綠燈等引起的行駛過程中的停留,行駛過程中的停留作為行駛狀態(tài)).為了全面掌握出租車的運營狀態(tài),按停留/移動對軌跡進(jìn)行分割;對停留軌跡按停留的持續(xù)時間、所處的時段時間以及與地標(biāo)點的位置關(guān)系作進(jìn)一步的劃分;對行駛軌跡,按照是否載客進(jìn)一步分割為載客軌跡和空車軌跡.
本文改進(jìn)了傳統(tǒng)的DBSCAN(Density-Based Spatial Clustering of Applications with Noise)方法,尋找軌跡線上被高速移動軌跡隔開的低速(包括靜止)移動軌跡作為停留. DBSCAN是在數(shù)據(jù)集中尋找對象高密度聚集的區(qū)域,將每個獨立的高密度區(qū)域標(biāo)注為類簇.與其他聚類方法相比,DBSCAN在噪聲處理、聚類速度和分組有效性方面都有很多的優(yōu)點.然而傳統(tǒng)的DBSCAN方法是基于歐氏平面,關(guān)注的密度為單位面積中點的個數(shù),閾值根據(jù)點的個數(shù)來定義;而停留檢測是基于道路網(wǎng)絡(luò),密度為單位距離的持續(xù)時間,閾值根據(jù)停留的持續(xù)時間來決定.針對停留檢測的特點,本研究對DBSCAN方法進(jìn)行了改進(jìn),包括∶在搜索中,按照時間順序查找前后相鄰點;在確定鄰域點時,以速度閾值代替距離閾值;以及在確定是否為核心點時,以最短時間間隔閾值代替最少點數(shù)閾值,即在鄰域內(nèi)持續(xù)停留的時間必須大于某個閾值.另外由于在低速移動的軌跡中,偶爾也會有速度較快的點(如采樣時間間隔很小情況下,定位誤差造成的位置偏移也會使計算出的速度有較大的值),如果按照每個點的即時速度進(jìn)行判斷,就會造成有些停留不能檢測到或一個停留會分割成多個停留.針對這種情況,本研究在確定鄰域點時,采用兩個速度閾值∶即時速度閾值和平均速度閾值.平均速度是指通過鄰域內(nèi)所有點的平均速度(鄰域內(nèi)首末點的路徑距離與時間差之比),即時速度閾值稍高于平均速度閾值,以保證速度稍高的點也能進(jìn)入鄰域;平均速度閾值用于保證鄰域內(nèi)所有點整體上是一個慢速移動過程.本研究中,平均速度閾值為5 km/h,最大瞬時速度閾值為20 km/h,持續(xù)時間閾值為10 min(600 s).
根據(jù)檢測出的停留對軌跡進(jìn)行分割,并進(jìn)一步區(qū)分載客軌跡和空車軌跡.對停留軌跡根據(jù)停留的持續(xù)時間、停留的間隔時間等進(jìn)行綜合評判,分成休息停留軌跡和工作停留軌跡.休息停留的判斷方法為∶①若持續(xù)時間超過1 h,則判斷出租車司機(jī)下班,出租車停運;②若持續(xù)時間15 min到1 h,之前的3 h內(nèi)沒有停車吃飯事件,則判斷出租車司機(jī)停車吃飯,停留軌跡為休息停留軌跡.本研究出租車“運營”指的是行車軌跡以及除停車下班和休息以外的所有停留軌跡.
本研究基于2015年4月1—30日的出租車軌跡數(shù)據(jù),對影響出租車運營水平的多項指標(biāo)進(jìn)行計算,分析上海地區(qū)出租車基本運營特征.
2.1 運營時間和運營里程
日均運營時間(里程)指該日運營出租車的運營時間(里程)總和與該日運營的出租車總數(shù)之比,反映出租車的使用率以及出租車司機(jī)的工作強度.圖1是日均運營時間及運營里程30 d變化圖.表1為日均運營時間和運營里程按每個工作日、周末以及清明節(jié)分別計算的平均值和標(biāo)準(zhǔn)差.
出租車的日均運營時間在12—16 h之間波動,30 d的平均日均運營時間為14.8 h.翁劍成等基于2008年7月20—26日北京市中心區(qū)的出租車軌跡數(shù)據(jù)計算出單班出租車的日均運營時間為9.59 h,雙班為15.16 h;不考慮單雙班,日均運營時間為11.82 h[8].由該數(shù)據(jù)可得,上海市出租車的日均運營時間要高于北京市.由周一至周日的變異系數(shù)可知日均運營時間的周差異較小.與周日相比,周一至周六運營時間較長,尤以周五為最.清明節(jié)的日均運營時間明顯低于平日.出租車運營時間的變化可能與以下兩個原因有關(guān):一方面節(jié)假日出行的人相對較少,出租車需求量較平時有所下降;另一方面與出租車司機(jī)的休息行為有關(guān),選擇節(jié)假日休息的出租車司機(jī)較平日多.工作日中,周一的運營時間也相對較短(平均約為14.64 h),原因可能是周一往往交通擁堵情況比較嚴(yán)重,出租車司機(jī)可能會減少運營時間.
圖1 日均運營時間和運營里程統(tǒng)計表Fig.1 Daily average operation time and mileage
表1 參數(shù)估計模擬結(jié)果Tab.2 Statistics on daily average operation time and mileage
在30 d里,出租車日均運營里程在350~480 km之間,30 d的平均值為422 km.在出租車運行速度保持一致的情況下,日均運營里程和運營時間的30 d變化情況應(yīng)該相近,但對比兩條曲線及表1的數(shù)值,變化并不一致,日均運營里程在節(jié)假日與工作日的差別并不似運營時間那般明顯,且周波動較大.例如清明節(jié)日均運營時間為12.90 h,遠(yuǎn)低于平日,而運營里程為431.48 km,與平日相仿,主要原因可能是節(jié)假日往往道路交通狀況較好,車輛通行順暢.
2.2 載客分析
載客情況包括載客時間、載客里程等指標(biāo),反映出租車的收益情況.
2.2.1 日均載客時間和日均載客里程
日均載客時間(里程)指該日運營出租車的載客總時間(里程)與該日運營的出租車總數(shù)之比.上海日均載客時間多數(shù)處在8~10 h范圍內(nèi),總平均值約為8.8 h;而日均載客里程一般在220~280 km之間,總平均值為250 km.
日均載客時間(里程)比率是指出租車一天的載客時間(里程)與運營時間(里程)的比例,反映駕駛員工作的有效性.圖2為日均載客時間與載客里程比率圖.表2為日均載客時間以及日均載客里程比率按每個工作日、周末以及清明節(jié)分別計算的平均值和標(biāo)準(zhǔn)差.平均載客利用率一般在56%~63%之間.清明節(jié)假期載客時間比率遠(yuǎn)低于其他時間,但載客里程比率的差距不明顯,這也說明清明節(jié)的路況可能好于平時.而周五的載客時間比率要高于其他時間,但這種差異在載客里程比率中不明顯,可能是周五的交通狀況較差導(dǎo)致出租車行駛不暢所致.
圖2 日均載客時間和載客里程比率Fig.2 Daily average ratio of time and mileage of trips with passengers
表2 日均載客時間和載客里程比率統(tǒng)計表Tab.2 Statistics on daily average ratio of time and mileage of trips with passengers
2.2.2 日均單次載客時間與日均單次載客里程
日均單次載客時間(里程)是指一天中平均每次載客的時間(里程),即所有出租車一天的載客時間(里程)總和與載客次數(shù)總和的比例.圖3為4月份30 d單次載客時間及載客里程曲線圖.表3為單次載客時間及載客里程統(tǒng)計表.與工作日相比,周末單次載客時間及單次載客里程低于工作日,一方面周末市民能有更多的選擇空間規(guī)劃最優(yōu)出行路線;另一方面周末市民更可能選擇就近活動.工作日可能受嚴(yán)格約定的工作時間限制,選擇長距離坐出租車以保證時間的人會比較多.由于清明假期期間長距離出行的可能性比較大,故清明節(jié)單次載客里程最遠(yuǎn)(約為9.14 km),而由于路況原因,花費的時間最少(單次載客時間均值約為15 min).
為進(jìn)一步分析載客時間情況,將載客時間分成10個時間段,統(tǒng)計不同載客時間的頻率.圖4為各個載客時間段的比例及累計比例圖.上海的單次載客時間主要分布在30 min以內(nèi),所占比例高達(dá)86%.作為地鐵的轉(zhuǎn)乘交通工具之一,單次短時間載客的比例非常高.載客時間小于5 min的次數(shù)占10%以上,小于10 min的載客占比高達(dá)四分之一.這主要歸因于上海相對發(fā)達(dá)的城市軌道交通網(wǎng)絡(luò),多數(shù)人會優(yōu)先選擇軌道交通出行.對于軌道交通不能直接到達(dá)的地方,則傾向于選擇先到離目的地最近的軌道交通站,然后再轉(zhuǎn)乘出租車,既經(jīng)濟(jì)又能保證出行時間.
圖3 日均單次載客時間和載客里程Fig.3 Daily average travelling time and mileage per trip with passengers
表3 日均單次載客時間和載客里程統(tǒng)計表Tab.3 Statistics on daily average travelling time and mileage per trip with passengers
圖4 單次載客時間比例和累積比例Fig.4 Percentages and accumulative percentages of time on trips with passengers
為進(jìn)一步分析載客里程情況,將載客里程分成10個不同等級,統(tǒng)計不同載客里程的頻率.圖5為各等級載客里程的比例及累積比例圖.上海出租汽車載客出行距離在3 km(起步里程)范圍內(nèi)約占四分之一,6 km以內(nèi)占比超過一半,10 km以上比例約為25.6%,15 km以上比例約為12.8%.以上數(shù)據(jù)充分反映2015年10月上海將出租車加價里程由10 km提高到15 km的政策[15]是有必要的、與時俱進(jìn)的.
圖5 載客里程比例和載客里程累積比例Fig.5 Percentages and accumulative percentages of mileage on trips with passengers
2.3 空駛分析
對空駛時間與里程的分析亦可反映出租車運營的效益,對合理分配資源有著極其重要的意義.
2.3.1 空駛時間和空駛里程
日均空駛時間是指該日運營出租車的空駛總時間與該日運營的出租車總數(shù)之比.而日均空駛時間比例,也稱為日均時間空駛率,是指出租車一天的空駛時間與運營時間的比例.30 d均空駛時間在5.4~6 h之間變動,變化幅度很小.空駛時間比率在35%~40%之間變化,總的變化趨勢與載客時間比率的變化趨勢(見圖2)相反,即波峰點出現(xiàn)在周日和清明節(jié),而波谷出現(xiàn)在周五.出租車空駛率的合理區(qū)間目前還沒有統(tǒng)一標(biāo)準(zhǔn).借鑒發(fā)達(dá)國家和國內(nèi)先進(jìn)城市的經(jīng)驗,城市出租車空駛率大致為30%~40%較為合理[11].關(guān)金平等人利用深圳市2008年11月至2009年2月的出租車軌跡數(shù)據(jù)計算出深圳市空駛率為30.1%[16];翁劍成等基于2008年7月20—26日北京市中心區(qū)的出租車軌跡數(shù)據(jù)計算出單、雙班車空駛時間占運行時間的比例分別為41.19%和43.47%[8].上海市的日均時間空駛率為39.1%,高于深圳市,低于北京市,已近警戒值.
為進(jìn)一步分析不同時段的空駛情況,以1 h為分析單位,計算出租車在24個不同時段內(nèi)的每小時空駛時間比例,了解周一至周日不同時段出租車的使用情況.表4為空駛比例過高(大于40%)或者過低(低于30%)的時段在工作日、周末及清明節(jié)的統(tǒng)計情況.周一到周四的空駛時間分布比較相似,空駛比例高的時間段一般在夜間23點至第2天早上7點(空駛時間比例在40%以上),出租車載客繁忙的時段主要為通勤時段,值得注意的是從下午1點開始直至晚高峰出租車空駛比率都在30%以下,可能的原因是午飯過后上午外出工作結(jié)束的業(yè)務(wù)員回單位用車需求以及下午外出工作的業(yè)務(wù)員的用車需求.與其他工作日相比,周五23—24點的空駛比例比其他工作日低,可能的原因是由于朋友聚會或者周末前加班.此外,由于雙休日市民出行時間不如工作日那樣集中,工作日比較繁忙的上午8—9點時段在周日、節(jié)假日卻是空駛率較高的時段.一般周日市民出行晚,但歸家較早,故周日晚22—23點出租車的空駛比例就已經(jīng)達(dá)到40%以上.
日均空駛里程是指該日運營出租車的空駛總里程與該日運營的出租車總數(shù)之比.而日均空駛里程比例,也稱為日均空間空駛率,是指出租車一天的空駛里程與運營里程的比例.上海日均空駛里程變化范圍在130~210 km之間,平均值約為172 km,變化幅度比較大.空駛里程比例一般在35%~45%之間,沒有明顯的周期變化,平均值為40.5%,高于空駛時間比例1.4%,說明空駛速度稍高于載客速度(載客時間比例與載客里程比例相當(dāng),見2.2節(jié)).
表4 高(或低)空駛比例時段統(tǒng)計表Tab.4 Time slots of high(or low)rate of empty cruise
2.3.2 道路空駛比例
圖6 日均道路空駛比例空間分布圖Fig.6 Spatial distribution of daily average idle taxi ratio
道路空駛比例指一段時間內(nèi)經(jīng)過該路段的出租車中空車的比例,能從空間維度分析運營空駛情況.研究選擇一個典型工作日周一(4月20日)和周日(4月26日),計算一天中每個路段的日均空駛比例,將其分為6個等級(每隔20%分為一級).圖6為周一和周日道路空駛比例空間分布圖(外環(huán)線以內(nèi)地區(qū)).無論工作日還是周日,外環(huán)-中環(huán)之間東部與北部以及中環(huán)和內(nèi)環(huán)之間位于浦東新區(qū)東南部地區(qū)的路段空駛率較高,而靠近內(nèi)環(huán)空車越少.工作日和周日相比較,周日整體空駛比例要高于工作日,尤其在內(nèi)環(huán)區(qū)域中表現(xiàn)明顯.這與上海職住分布對應(yīng)(工作地點在內(nèi)環(huán)區(qū)域而居住地在內(nèi)環(huán)外的市民占比較大).
為了進(jìn)一步分析道路空駛率的空間分布,將研究區(qū)域劃分為500 m×500 m的網(wǎng)格,分析網(wǎng)格中的平均空駛率與感興趣點以及人口的關(guān)系.具體步驟如下∶①計算每個網(wǎng)格的平均空駛率,計算公式為
②計算每個網(wǎng)格的人口總數(shù)與感興趣點總數(shù);③分別計算空駛率與人口總數(shù)及感興趣點總數(shù)的相關(guān)系數(shù).其中人口數(shù)據(jù)為上海門牌人口數(shù),來自公安局人口數(shù)據(jù)庫統(tǒng)計數(shù)據(jù);感興趣點為2014年上??蒲?、購物、娛樂、旅游、住宿等興趣點數(shù)據(jù),通過百度API獲取.結(jié)果如表5所示.由表可知,人口和感興趣點皆與空駛率相關(guān),人口多、感興趣點多的地方,空駛率較低的可能性更大;人口稀疏、感興趣點少的地方(比如上文提到的外環(huán)和中環(huán)之間東部和北部的某些區(qū)域),空駛率普遍比較高.相比人口,空駛率與感興趣點的相關(guān)性更大.而周日與工作日相比,周日的空駛率與人口和感興趣點的關(guān)聯(lián)度更大.可能的原因是工作日乘坐出租車是工作需要,而周日出行的目的地是友人居所或者商鋪、旅游景點等感興趣點.
表5 相關(guān)性檢驗結(jié)果Tab.5 Results of the correlation
對于工作日,結(jié)合2.3.1節(jié)分析結(jié)果,選取上午8—9點(早高峰)以及17—18點(晚高峰)兩個典型低谷時段計算道路空駛比例,其網(wǎng)格平均空駛率如圖7所示.早晚高峰差別較大,早高峰時期內(nèi)環(huán)內(nèi)多數(shù)道路空駛比例低于20%,內(nèi)環(huán)外中環(huán)內(nèi)大多數(shù)道路的空駛比例也較低,這說明上班高峰是乘坐出租車的高峰期.而晚高峰內(nèi)環(huán)、中環(huán)道路空駛比例遠(yuǎn)高于早高峰,原因可能在于晚高峰時期市民有充足時間,可以選乘其他較為廉價的交通工具返回居住地.
對于周日,結(jié)合2.3.1節(jié)分析結(jié)果,選取低谷17—18點作為重點分析時段,結(jié)果如圖8所示.與工作日晚高峰時期(見圖7b)相比,內(nèi)環(huán)中心城區(qū)的出租車載客的概率更高.主要原因在于中心城區(qū)是傳統(tǒng)的商業(yè)區(qū),盡管上海在向多中心城市發(fā)展,但周末前往傳統(tǒng)商業(yè)區(qū)購物會友的市民依然比較多,尤其在靜安寺、人民廣場等商業(yè)區(qū),沿路候車的人較多,大大降低了空駛的概率.而西部及西南部空駛率也比較低,可能與周日晚離滬人員搭乘出租車前往虹橋機(jī)場或高鐵站有關(guān).
圖7 工作日典型時段網(wǎng)格平均空駛率Fig.7Averageidle taxi ratio by grid on typical time intervals in a normal weekday
圖8 周日典型時段道路空駛比例空間分布圖Fig.8 Averageidle taxi ratio by grid on typical time intervals on Sunday
基于上海市出租車GPS數(shù)據(jù),本文提出了數(shù)據(jù)處理的基本流程,尤其設(shè)計了基于改進(jìn)的DBSCAN的軌跡切分方法,提取了上海市出租車整體運營、載客和空駛3個方面的指標(biāo),分析了上海市出租車的運營特征.結(jié)果表明∶與工作日相比,周日和節(jié)假日的運營時間及載客時間短,且運營效率不高;單次載客時間在10 min以內(nèi)占四分之一,30 min以內(nèi)占86%;單次載客里程在起步里程3 km范圍內(nèi)占四分之一,在10 km以上比例為25.6%,15 km以上比例為12.8%;空駛比例均值為39.1%,接近合理范圍的臨界上限值;空駛速度略大于載客速度.空駛率空間分布差異明顯,與周邊人口和感興趣點的關(guān)系密切.
總體來說,上海市日均出租車空駛比例雖在合理區(qū)間之內(nèi),但仍略為偏高,道路空駛率時空差異明顯;與工作日相比,周日和節(jié)假日的運營效率不高,需要有關(guān)部門作出相應(yīng)調(diào)整.
需要指出的是,本研究僅利用了強生公司開放的一個月的數(shù)據(jù),因受數(shù)據(jù)限制,并不能更進(jìn)一步分析月、季差異.如果今后可以獲得更完備的數(shù)據(jù),可以對本研究所得的結(jié)論進(jìn)一步驗證和補充.本文采用空間分析的方法探討了空駛率的空間分布,發(fā)現(xiàn)了空駛率受周邊環(huán)境影響.今后可繼續(xù)挖掘空間因素的影響程度,例如從時間和空間維度上深入研究各項環(huán)境因素(如各類感興趣點)對載客的影響,為決策者提供更多有用的信息.
[1]陸建,王煒.城市出租車擁有量確定方法[J].交通運輸工程學(xué)報,2004,4(1):92-95.
[2]陳盛,陸建.出租車交通調(diào)查分析及對策[J].交通標(biāo)準(zhǔn)化,2003(5):41-44.
[3]DENG C C,ONG H L,ANG B W,et al.A modelling study of a taxi service operation[J].International Journal of Operations&Production Management,1992,12(11):65-78.
[4]KIM H,OH J S,JAYAKRISHNAN R.Ef f ect of taxi information system on efficiency and quality of taxi services [J].Transportation Research Record Journal of the Transportation Research Board,2005,1903(1):96-104.
[5]XU J,WONG S C,TONG C O,et al.Modeling level of urban taxi services using neural network[J].Journal of Transportation Engineering,1999,125(3):216-223.
[6]胡小文,馮均佳.基于GPS數(shù)據(jù)采集的出租汽車交通運行特點研究[J].城市交通,2007,5(2):91-95.
[7]扈中偉,于泉,邵長橋,等.北京市出租車運營狀況分析系統(tǒng)開發(fā)[J].道路交通與安全,2007(4):45-47.
[8]翁劍成,劉文韜,陳智宏,等.基于浮動車數(shù)據(jù)的出租車運營管理研究[J].北京工業(yè)大學(xué)學(xué)報,2010,36(6):779-784.
[9]莊立堅,韋清波,何兆成,等.基于浮動車數(shù)據(jù)的出租車運營管理特性建模與分析[J].重慶交通大學(xué)學(xué)報(自然科學(xué)版),2014, 33(4):122-127.
[10]莊立堅,宋家驊,段仲淵,等.基于浮動車數(shù)據(jù)挖掘的出租汽車運營特征研究[J].城市交通,2016,14(1):59-64.
[11]康留旺.基于FCD的城市出租車空駛率及擁有量的計算[J].數(shù)字技術(shù)與應(yīng)用,2010(7):81-82.
[12]VELOSO M,PHITHAKKITNUKOON S,BENTO C,et al.Exploratory study of urban flow using taxi traces [C]//Proceedings ofthe First Workshop on Pervasive Urban Applications(PURBA’11),in conjunction with PERVASIVE’11,2011.
[13]ZHANG J,QIU P,DUAN Y,et al.A space-time visualization analysis method for taxi operation in Beijing[J]. Journal of Visual Languages&Computing,2015,31:1-8.
[14]OSMF.OpenStreetMap[CP/DK].[2016-04-23].https://download.geofabrik.de/asia/china.html.
[15]搖號網(wǎng).2015年上海出租車調(diào)價最新通知[EB/OL].(2015-10-08)[2016-3-24].http://www.bitenews.cn/zixun/6547.html.
[16]關(guān)金平,朱竑.基于FCD的出租車空駛時空特性及成因研究——以深圳國貿(mào)CBD為例[J].中山大學(xué)學(xué)報(自然科學(xué)版), 2010,49(s1):29-36.
(責(zé)任編輯:李萬會)
FCD-based analysis of taxi operation characteristics:A case of Shanghai
LYU Zhen-hua,WU Jian-ping,YAO Shen-jun,ZHU Li
(Key Laboratory of Geographic Information Science,Ministry of Education, East China Normal University,Shanghai200241,China)
In order to better understand the travel behavior of taxies and evaluate taxi operation efficiency,this paper proposed a taxi-operation-and-management-oriented work flow for processing big f l oating car data(FCD);calculated a set of taxi operation indicators;and analysed taxi operation characteristics on weekdays,weekends as well as public holidays based on GPS data during one month collected by taxies in Shanghai.It is found that daily average idle taxi ratio reaches 39.1%,close to the upper bound of the critical interval.The idle taxi ratio varies signif i cantly across space and time within one day.When compared with a normal weekday,sunday and public holiday are characterized by relatively low operation time and travelling time with passengers,and hence relatively low taxi operation efficiency.More countermeasures should be conducted to improve thecapability of taxi management.
f l oating car;taxi;operation;Shanghai
K909
A
10.3969/j.issn.1000-5641.2017.03.015
1000-5641(2017)03-0133-12
2016-04-26
國家自然科學(xué)基金(41301423);閔行區(qū)中小企業(yè)技術(shù)創(chuàng)新計劃項目(2014MH011)
呂振華,男,博士研究生,研究方向為地理信息系統(tǒng)開發(fā)與應(yīng)用. E-mail:zhlv@mlight.com.cn.
吳健平,男,教授,博士生導(dǎo)師,研究方向為地理信息系統(tǒng)開發(fā)與遙感應(yīng)用.
E-mail:jpwu@geo.ecnu.edu.cn.
華東師范大學(xué)學(xué)報(自然科學(xué)版)2017年3期