莊立堅(jiān),宋家驊,段仲淵,丘建棟
(深圳市城市交通規(guī)劃設(shè)計(jì)研究中心有限公司,深圳市交通信息與交通工程重點(diǎn)實(shí)驗(yàn)室,廣東深圳518021)
基于浮動車數(shù)據(jù)挖掘的出租汽車運(yùn)營特征研究
莊立堅(jiān),宋家驊,段仲淵,丘建棟
(深圳市城市交通規(guī)劃設(shè)計(jì)研究中心有限公司,深圳市交通信息與交通工程重點(diǎn)實(shí)驗(yàn)室,廣東深圳518021)
為支持出租汽車運(yùn)營評價(jià)和行業(yè)規(guī)劃,科學(xué)掌握其運(yùn)營現(xiàn)狀與特點(diǎn),以深圳市一個(gè)典型工作日為例,研究浮動車數(shù)據(jù)挖掘在出租汽車運(yùn)營特征研究中的應(yīng)用。依托對浮動車數(shù)據(jù)的特征解析,提出面向出租汽車運(yùn)營特征分析的數(shù)據(jù)處理流程,針對空駛率、運(yùn)營速度、載客運(yùn)營時(shí)長、出行需求的時(shí)空差異等方面分析深圳市出租汽車行業(yè)運(yùn)營現(xiàn)狀與特點(diǎn)。該研究可為出租汽車運(yùn)營評價(jià)提供新視角,從對既有數(shù)據(jù)深度挖掘的角度提升行業(yè)效益。
智能交通系統(tǒng);道路交通;浮動車數(shù)據(jù);數(shù)據(jù)挖掘;出租汽車;運(yùn)營特征
中國大城市普遍存在出租汽車空駛率高卻又經(jīng)常打不到車的現(xiàn)象,行業(yè)整體運(yùn)營效率不高,亟須實(shí)時(shí)掌握出租汽車的時(shí)空運(yùn)營特性,用以支持車輛調(diào)度、行業(yè)規(guī)劃、政策研究等[1-2]。
常規(guī)出租汽車運(yùn)營數(shù)據(jù)采集方式包括人工調(diào)查和計(jì)價(jià)器記錄,存在成本高、信息少、可靠性差、時(shí)效性低等缺點(diǎn)。浮動車是伴隨智能交通應(yīng)用發(fā)展起來的新型交通信息采集手段,指安裝GPS定位模塊和無線通信模塊的車輛,能實(shí)現(xiàn)較高精度的衛(wèi)星定位并實(shí)時(shí)將位置信息傳送到服務(wù)器數(shù)據(jù)中心。由于具備運(yùn)營時(shí)間長、道路覆蓋面廣、便于集中管理等顯著優(yōu)點(diǎn),國內(nèi)外出租汽車已普遍安裝GPS定位模塊。在中國,浮動車數(shù)據(jù)通常指出租汽車GPS數(shù)據(jù),因此除用于對路網(wǎng)交通狀態(tài)的感知,在對出租汽車本身的運(yùn)營分析方面也具有極大的潛力[3]。
中國現(xiàn)有研究成果不夠全面。文獻(xiàn)[4-6]僅從空駛率的角度分析深圳市出租汽車的運(yùn)營特點(diǎn),全面性不足;文獻(xiàn)[7]以100輛出租汽車的GPS數(shù)據(jù)為基礎(chǔ),分析出行需求空間分布、出行時(shí)長、出行距離等三項(xiàng)指標(biāo),由于樣本量過小,難以準(zhǔn)確反映實(shí)際運(yùn)營狀況;文獻(xiàn)[8-10]對出租汽車的運(yùn)營管理指標(biāo)進(jìn)行分類建模,分析空駛率、速度、出行時(shí)長、出行距離等多項(xiàng)指標(biāo),但在出行需求角度未做深入挖掘探討。
為支持出租汽車運(yùn)營評價(jià)和行業(yè)規(guī)劃,科學(xué)掌握運(yùn)營現(xiàn)狀與特點(diǎn),本文以深圳市一個(gè)典型工作日為例,針對空駛率、運(yùn)營速度、載客運(yùn)營時(shí)長、出行需求的時(shí)空差異等方面進(jìn)行分析,探討浮動車數(shù)據(jù)挖掘在出租汽車運(yùn)營評價(jià)中的應(yīng)用。
本文以深圳市所有安裝車載GPS模塊的出租汽車為研究對象,故所提及的浮動車特指出租汽車,浮動車數(shù)據(jù)特指出租汽車GPS數(shù)據(jù)。根據(jù)預(yù)設(shè)定,GPS模塊會以一定的時(shí)間間隔向深圳市交通運(yùn)輸委員會GPS監(jiān)管平臺實(shí)時(shí)發(fā)送出租汽車位置信息。服務(wù)器接收端實(shí)時(shí)接收回傳的GPS數(shù)據(jù),并以5 min間隔依次生成txt文本包(全天共288個(gè))。浮動車數(shù)據(jù)屬性包括定位時(shí)間、車牌號碼、所屬公司代碼、經(jīng)緯度坐標(biāo)、速度、方向角、運(yùn)營狀態(tài)、數(shù)據(jù)可用性等(見表1)。
選取深圳市一個(gè)典型工作日(2014年11月20日00:00—24:00,星期四)的浮動車數(shù)據(jù),基礎(chǔ)統(tǒng)計(jì)分析結(jié)果如下:
1)全天24 h回傳的數(shù)據(jù)記錄56 860 640條,包含15 560輛出租汽車,文本數(shù)據(jù)包總大小約為3.2 GB。
2)深圳市浮動車數(shù)據(jù)在時(shí)間上的差異很小,每5 min的數(shù)據(jù)均在20萬條左右,但在空間上存在明顯的不均勻分布。定義點(diǎn)密度用以表征空間分布特征:
式中:Di為第i個(gè)小區(qū)的點(diǎn)密度,Ni為落在第i個(gè)小區(qū)內(nèi)的GPS點(diǎn)數(shù)量,Si為第i個(gè)小區(qū)的面積。選取任意5 min的數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn),出租汽車密集分布于中心城區(qū)、龍崗中心城、寶安機(jī)場、深圳北站、科技園等區(qū)域,在其他區(qū)域分布非常稀疏(見圖1)。
3)圖2顯示了不同運(yùn)營狀態(tài)下的速度分布情況,其中縱坐標(biāo)做了對數(shù)化處理。在全部數(shù)據(jù)中,速度為0的記錄為25 670 824條,占總數(shù)據(jù)量的45%;在空車狀態(tài)的數(shù)據(jù)中,速度大于35 km·h-1的數(shù)據(jù)量呈顯著下降趨勢;在重車狀態(tài)的數(shù)據(jù)中,速度大于80 km·h-1的數(shù)據(jù)量呈顯著下降趨勢。所有出租汽車數(shù)據(jù)的速度平均值為18.84 km·h-1,重車狀態(tài)下為28.28 km·h-1,空車狀態(tài)下為12.43 km·h-1??哲嚑顟B(tài)下出租汽車或?qū)ふ铱驮椿蚨虝r(shí)休息,傾向于低速行駛甚至停車等待;重車狀態(tài)下出租汽車是有目的的點(diǎn)到點(diǎn)出行,因此會提速以便盡快將乘客送達(dá)目的地,以獲取下一次載客機(jī)會。
4)由于定位失敗或無線傳輸數(shù)據(jù)丟失等因素,浮動車數(shù)據(jù)的采樣時(shí)間間隔普遍較長且不固定,絕大部分在120 s以內(nèi)。如圖3所示(縱坐標(biāo)做了對數(shù)化處理),在10 s,15 s,20 s,30 s,60 s,90 s等位置產(chǎn)生峰值,合計(jì)占總數(shù)據(jù)量的比例為65%;其中采樣間隔15 s的數(shù)據(jù)量最多,為24%;采樣間隔超過120 s的數(shù)據(jù)僅為1.4%。對于采樣間隔超過120 s的數(shù)據(jù),若以上文所述出租汽車重車狀態(tài)下的平均速度(28.28 km·h-1)進(jìn)行計(jì)算,則連續(xù)兩個(gè)回傳數(shù)據(jù)的GPS點(diǎn)間距將接近甚至超過1 km,這將大大影響后期的路徑重現(xiàn)與地圖匹配精度。
表1 浮動車數(shù)據(jù)屬性Tab.1 Attributes of FCD
面向出租汽車運(yùn)營特征分析的浮動車數(shù)據(jù)處理流程包括四個(gè)步驟(見圖4)。1)數(shù)據(jù)預(yù)處理:預(yù)先剔除重復(fù)、漂移的GPS點(diǎn)。2)軌跡切分:以車牌號碼為索引進(jìn)行遍歷,分別讀取每個(gè)車牌號碼的GPS數(shù)據(jù),并按照時(shí)間順序排列;在運(yùn)營狀態(tài)的切換位置,將每輛出租汽車全天的GPS運(yùn)行軌跡打斷成若干段空車軌跡和載客軌跡。3)邏輯糾錯:在實(shí)際提取到的切分軌跡中存在部分行程時(shí)間過小或過大的情況,因此剔除單次載客時(shí)長小于1 min或大于4 h的情況;另外,在城市路網(wǎng)中,由于交叉口紅燈、車速限制等管控措施,單次載客的行程速度不會超過100 km·h-1,因此剔除超過100 km·h-1的情況;4)小區(qū)匹配與路徑重現(xiàn):利用空間運(yùn)算技術(shù),將每一次載客軌跡的起終點(diǎn)匹配到對應(yīng)的交通小區(qū)中,并利用地圖匹配技術(shù)將軌跡映射到對應(yīng)的路段上,重現(xiàn)行駛路徑。
調(diào)查顯示出租汽車日均行駛里程494.4km,日均載客里程326.3 km,全天平均里程空駛率為34%。調(diào)查出租汽車總出行次數(shù)757 772次,運(yùn)營出租汽車總數(shù)15 560輛,每輛車平均載客48.7次。由于出租汽車GPS數(shù)據(jù)定位和傳輸過程存在失敗的可能,而且數(shù)據(jù)處理過程也可能造成過度清洗,因此理論上計(jì)算得到的平均載客次數(shù)與實(shí)際值相比偏小。
空駛率表征出租汽車的無效行駛里程比率,計(jì)算方式為
式中:E表示空駛率,分子表示所有出租汽車的空駛總里程,分母表示所有出租汽車的行駛總里程;k為路徑狀態(tài),k=0表示空駛,k=1表示載客;表示第i輛車、第j條路徑的行駛里程。
圖1 浮動車數(shù)據(jù)的空間不均勻分布Fig.1 Spatial heterogeneity of FCD
圖2 不同運(yùn)營狀態(tài)下的速度分布Fig.2 Speed distribution under different operation statuses
圖3 采樣時(shí)間間隔分布Fig.3 Distribution of sample intervals
圖4 數(shù)據(jù)處理流程Fig.4 Data mining procedures
圖5顯示了深圳市2014年11月20日(星期四)空駛率的時(shí)變趨勢。空駛率峰值發(fā)生在3:00,約60%的行駛里程為無效里程;8:00—22:00空駛率約為30%,波動不大;22:00后空駛率呈明顯上升趨勢。深圳市全天每小時(shí)運(yùn)營的出租汽車數(shù)量均在1.5萬輛以上,波動極小,但在1:00—5:00平均空駛率已超過50%,此時(shí)大量出租汽車處于無效運(yùn)營狀態(tài),這是對出租汽車資源的極大浪費(fèi)。因此,需根據(jù)空駛率對出租汽車的運(yùn)營時(shí)段進(jìn)行適當(dāng)調(diào)整,對1:00—5:00運(yùn)營的出租汽車進(jìn)行適當(dāng)調(diào)休或者補(bǔ)貼。
圖5 空駛率與出租汽車數(shù)量時(shí)變曲線Fig.5 Relationship between empty loaded rate and amount of taxies by time
圖6 載客狀態(tài)下的平均速度時(shí)變曲線Fig.6 Average speed under loaded status by time
圖7 載客運(yùn)營時(shí)長分布Fig.7 In-taxi time distribution under loaded status
圖6顯示了載客狀態(tài)下的平均速度時(shí)變情況。平均速度谷值出現(xiàn)在早晚高峰時(shí)段(8:00—9:00,18:00—19:00),尤其是晚高峰平均速度不到20 km·h-1。平均速度峰值出現(xiàn)在6:00—7:00和23:00—24:00,平均速度超過35 km·h-1。
圖7顯示了深圳市出租汽車載客出行的時(shí)長分布。10 min以內(nèi)的出行量占總出行量的48%;20 min以內(nèi)的出行量比例高達(dá)82%,是出租汽車重點(diǎn)服務(wù)的時(shí)域范圍;運(yùn)營時(shí)長超過30 min的出行量僅為7%?;谏鲜龇治?,出租汽車主要面向中短時(shí)間的出行。取上文所述出租汽車載客狀態(tài)下的平均速度(28.28 km·h-1)進(jìn)行計(jì)算,20 min的平均出行距離為9.4 km,即出租汽車重點(diǎn)服務(wù)的空域半徑約為10 km。以深圳市現(xiàn)行打表計(jì)價(jià)費(fèi)用計(jì)算,起步價(jià)(2 km以內(nèi))10元,之后為2.4元·km-1,則10 km的計(jì)價(jià)費(fèi)用約為30元(不包括燃油附加費(fèi))。
出租汽車出行量全天呈現(xiàn)明顯的波浪式起伏變化(見圖8)。峰值分別出現(xiàn)在9:00—10:00、14:00—15:00、17:00—18:00和22:00—23:00,最大峰值發(fā)生在22:00—23:00而非早晚高峰時(shí)段,此時(shí)出租汽車出行量超過4.5萬次·h-1,平均每輛出租汽車在1 h內(nèi)產(chǎn)生2.9次載客行為。22:00后,出租汽車出行量不斷下降,低谷出現(xiàn)在3:00—5:00,全市出租汽車出行總量僅為1萬次·h-1,約1/3的出租汽車處于全時(shí)間空車狀態(tài),2/3的出租汽車至少一半時(shí)間處于空車狀態(tài),空駛率達(dá)到全天最大。6:00后,出租汽車出行量呈明顯上升趨勢,之后一直保持在3萬次·h-1以上。
1)出發(fā)量與到達(dá)量分布。
將深圳市域范圍劃分為542個(gè)交通小區(qū),數(shù)據(jù)顯示,出發(fā)量和到達(dá)量在空間分布上基本一致,出發(fā)量多的區(qū)域到達(dá)量也多;但出發(fā)量或到達(dá)量本身的空間分布存在較大差異,主要密集分布于福田區(qū)、羅湖區(qū)、深圳北站、寶安國際機(jī)場、布吉街道、龍崗中心城等區(qū)域(見圖9)。
2)OD分布。
為直觀展現(xiàn)出租汽車出行OD分布,依據(jù)行政區(qū)域?qū)⑸钲谑袆澐譃?2個(gè)交通大區(qū)。出租汽車出行的OD分布集中在中心城區(qū)內(nèi)部,以羅湖區(qū)與福田區(qū)之間的出租汽車出行OD分布最為密集,全天的單向出行量接近4萬次;其次為福田區(qū)與南山區(qū)之間,全天的單向出行量接近2萬次;再次為南山區(qū)與寶安區(qū)(機(jī)場)之間;原特區(qū)內(nèi)與特區(qū)外交互的出租汽車出行OD主要分布在深圳北站、坂田街道、布吉街道等區(qū)域(見圖10)。
本文選取深圳市一個(gè)典型工作日,基于對浮動車數(shù)據(jù)的處理與挖掘,分析了深圳市出租汽車的運(yùn)營現(xiàn)狀和特點(diǎn)。結(jié)果表明:1)深圳市出租汽車全天平均里程空駛率為34%,在凌晨甚至接近60%,無效運(yùn)營里程較長,行業(yè)效益仍有大幅提升空間;2)全天平均載客運(yùn)營速度約為28 km·h-1,且存在明顯的早晚高峰現(xiàn)象;3)出租汽車重點(diǎn)服務(wù)于20 min和10 km以內(nèi)的中短時(shí)間和中短距離出行;4)出租汽車出行量在時(shí)間和空間上均存在一定差異性;5)出租汽車出行量全天呈現(xiàn)明顯的波浪式起伏變化,在3:00—5:00達(dá)到谷值,在22:00達(dá)到峰值;6)出租汽車出行出發(fā)量、到達(dá)量和OD分布集中于中心城區(qū),尤其是羅湖區(qū)和福田區(qū)。分析結(jié)果與實(shí)際情況相吻合,研究可為出租汽車行業(yè)評價(jià)、治理和規(guī)劃提供全面新穎的數(shù)據(jù)采集和現(xiàn)狀分析方式,減少由于不完全抽樣造成的誤差,減少多余的人力成本支出,從對既有數(shù)據(jù)深度挖掘的角度提升出租汽車行業(yè)效益。
圖8 出租汽車出行量時(shí)變曲線Fig.8 Taxi-trip distribution by time
圖9 深圳市24小時(shí)出租汽車出行量空間分布Fig.9 Taxi-trip distribution within 24 hours in Shenzhen
圖10 深圳市24小時(shí)出租汽車出行OD分布Fig.10 Taxi-OD distribution within 24 hours in Shenzhen
[1]辛飛飛,陳小鴻,林航飛.浮動車數(shù)據(jù)路網(wǎng)時(shí)空分布特征研究[J].中國公路學(xué)報(bào),2008,21(4):105-110.Xin Feifei,Chen Xiaohong,Lin Hangfei.Research on Time Space Distribution Character-istics of Floating Car Data in Road Network[J].China Journal of Highway and Transport,2008,21(4):105-110.
[2]Song L,Zhang D,Chen J,Ju A N,Yin S U.Analysis of Taxi Operation Characteristics with Traffic Control[J].Journal of Transportation Systems Engineering&Information Technology,2008,8(6):127-131.
[3]陳煉紅.基于GPS浮動車采集數(shù)據(jù)的出租汽車運(yùn)行特點(diǎn)研究[D].上海:同濟(jì)大學(xué),2008.Chen Lianhong.Study of Taxi Operation Trait BasedonGPSFloatData[D].Shanghai:Tongji University,2008.
[4]李道勇,戴劍軍.基于FCD的深圳市出租汽車空駛率特點(diǎn)研究[C]//第三屆中國智能交通年會論文集.南京:東南大學(xué)出版社,2007:145-149.Li Daoyong,Dai Jianjun.Research of Characteristics Shenzhen Taxi Unloaded Ratio Based on FCD[C]//Proceedings of 3rdChinese Conference on Intelligent Transportation Systems.Nanjing:Southeast University Press,2007:145-149.
[5]康留旺.基于FCD的城市出租汽車空駛率及擁有量的計(jì)算[J].數(shù)字技術(shù)與應(yīng)用,2010(7):81-82.Kang Liuwang.Calculation of Unloaded Ratio and Volume of Urban Taxi Based on FCD[J].Digital Technology and Application,2010(7):81-82.
[6]傅常倫,董德存,謝峰,林本江.基于GPS的出租汽車空駛現(xiàn)象研究[C]//第三屆中國智能交通年會論文集.南京:東南大學(xué)出版社,2007:150-154.Fu Changlun,Dong Decun,Xie Feng,Lin Benjiang.GPS-based Research of Empty-Taxi Phenomenon[C]//Proceedings of 3rdChinese Conference on Intelligent Transportation Systems.Nanjing:Southeast University Press,2007:150-154.
[7]胡小文,馮均佳.基于GPS數(shù)據(jù)采集的出租汽車交通運(yùn)行特點(diǎn)研究[J].城市交通,2007,5(2):91-95.Hu Xiaowen,Feng Junjia.Research on Characteristics of Taxi Traffic Based on GPS Data[J].Urban Transport of China,2007,5(2):91-95.
[8]莊立堅(jiān),韋清波,何兆成,楊文臣,孫文博.基于浮動車數(shù)據(jù)的出租汽車運(yùn)營管理特性建模與分析[J].重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版),2014(4):122-127.Zhuang Lijian,Wei Qingbo,He Zhaocheng,Yang Wenchen,Sun Wenbo.Taxi Operation and Management Characteristics Based on Floating Car Data[J].Journal of Chongqing Jiaotong University(Natural Science),2014(4):122-127.
[9]翁劍成,劉文韜,陳智宏,榮建.基于浮動車數(shù)據(jù)的出租汽車運(yùn)營管理研究[J].北京工業(yè)大學(xué)學(xué)報(bào),2010(6):779-784.Weng Jiancheng,Liu Wentao,Chen Zhihong,Rong Jian.Research on Floating Car Data Based Taxi Operation and Management[J].Journal of Beijing University of Technology,2010(6):779-784.
[10]王剛,陳智宏,吳東東.基于浮動車技術(shù)的出租汽車運(yùn)營特點(diǎn)研究[C]//第四屆中國智能交通年會論文集.北京:人民交通出版社,2008:841-846.Wang Gang,Chen Zhihong,Wu Dongdong.Study on TaxiOperation Characteristics Based on Floating Car Technology[C]//Proceedings of 4thChinese Conference on Intelligent Transportation Systems.Beijing:China Communications Press,2008:841-846.
A Floating Car Data Mining-based Taxi Operation Characteristics
Zhuang Lijian,Song Jiahua,Duan Zhongyuan,Qiu Jiandong
(Shenzhen Urban Transport Planning Center Co.,Ltd.,Shenzhen's Key Laboratory of Traffic Information and Traffic Engineering,Shenzhen Guangdong 518021,China)
To improve the efficiency of taxi operation and planning,this paper aims to apply floating car data(FCD)mining technology in studying taxi's operational characteristics as well as evaluating its operational performance for Shenzhen city.Based on features mined from FCD,a detailed working procedures of analyzing taxi operational characteristics is developed.With developed method,taxi unloaded rate,operational speed and time,temporal/spatial differences of travel demands are able to extract and better understand the performance of Shenzhen taxi system.The proposed method offers a new technology of FCD mining in taxi data exploration which could be used to evaluate taxi operational performance as well as improving its operational efficiency.
intelligent transportation systems;road traffic;floating car data(FCD);data mining;taxi;operational characteristics
1672-5328(2016)01-0059-06
U491.1
A
10.13813/j.cn11-5141/u.2016.0109
2015-01-10
莊立堅(jiān)(1989—),男,廣東汕頭人,碩士研究生,助理工程師,主要研究方向:交通信息化。E-mail:838370494@qq.com