唐雋玉, 朱 祎, 黃一哲
(上海交通大學(xué) 船舶海洋與建筑工程學(xué)院,上海 200240)
出租車是日常生活中不可或缺的交通工具,為人們提供便捷的門到門運輸服務(wù)。出租車供需的隨機性,導(dǎo)致了出租車空車率水平的不合理問題??哲嚶蔬^高會增加司機的工作成本,造成時間和燃料的浪費。而空車率過低會延長乘客的等待時間。此外,過多的空車將會加劇交通擁堵,并造成空氣污染,如在臺灣,空車每年會造成9 000萬L汽油的浪費[1]。為緩解上述問題,一些學(xué)者對出租車空車時長/空車率進行了一系列相關(guān)研究。關(guān)金平等[2]分析了出租車空駛的時空特性,并且從人文地理、城市規(guī)劃角度分析了成因。鞠煒奇等[3]以深圳為例對出租車空車率的時空分布特征及影響因素進行了分析。但上述兩項關(guān)于出租車影響因素的研究僅停留在定性分析階段。量化空車率和影響因素之間的關(guān)系,可為調(diào)節(jié)空車率至合理水平提供科學(xué)依據(jù)。提取空車率影響因素是量化二者關(guān)系的第一步,現(xiàn)有研究表明以下因素與出租車的空車率有密切關(guān)聯(lián):尋/送客時長、距離[4],司機尋客策略[5],上車次數(shù)[6]等。然而,目前尚缺少將這些因素綜合起來進行研究的文獻。
Logit模型作為一種數(shù)學(xué)工具被廣泛應(yīng)用于城市交通研究中[7],本文基于廣義多水平定序Logit模型(GMOL模型),旨在從駕駛員行為分析角度,建立一個全面且定量化的方法來挖掘出租車空車率的影響因素,從而尋求影響因素與空車率之間的量化關(guān)系,以合理化調(diào)節(jié)空車率水平,達到優(yōu)化出租車運行效率及乘客滿意度的目的。
GPS數(shù)據(jù)由上海強生出租車公司采集,涵蓋10 000輛以上的出租車運行信息,平均每10 s記錄一次。每條記錄包括出租車ID 號(唯一標記)、載客狀態(tài)(1表示空車,0表示重車)、GPS信息接收時間、當(dāng)前位置的經(jīng)、緯度以及瞬時速度。
由于GPS信號遮擋、設(shè)備故障等原因,需要進行數(shù)據(jù)清洗。將經(jīng)緯度在[120.852°E,121.925°E],[30.693°N,31.511°N]之外、瞬時速度在0,120 km/h之外的數(shù)據(jù)進行剔除,刪除了占原始數(shù)據(jù)0.007%的異常數(shù)據(jù)。
對于空間劃分,本文的研究區(qū)域為除去崇明島的上海市主干區(qū)域,并將研究區(qū)域網(wǎng)格化,即將上海主干區(qū)域劃分為一系列約為500 m×400 m 大小相同的網(wǎng)格,總量為22 814個。
對于時間劃分,由于周五相較于其它4個工作日呈現(xiàn)出不同的出租車駕駛模式,同時為了減少計算復(fù)雜度,選擇2016年3月21日—2016年3月24日(周一至周四)作為計算原始數(shù)據(jù)。此外,還需對研究時段進行劃分。
如圖1所示,載客車速度作為篩選研究時段的第一個指標,如果速度過低,說明當(dāng)前路況擁擠,司機不能自主地采取策略進行運營。而且,為保證足夠的樣本量,運營車數(shù)量作為第二個篩選時間段的指標。最后,還需要排除司機用餐時間的影響,Qin et al[8]對上海市出租車司機的用餐時間進行調(diào)研,發(fā)現(xiàn)用餐時間靈活地分布在11:00~14:00以及16:00~19:30之間。綜上,選取14:00~16:00作為研究時間段。
圖1 載客車速度、運營車數(shù)量在一天中的變化
視出租車的時間空車率為空車率的衡量標準,因為出租車的機會成本是通過空車時間測算而非空車運營距離測算[9]。司機i的空車率VRi的計算如下
式中,t0i,j為司機i的第j 次重車行程的運營時間;t1i,j為司機i的第j 次空車行程的運營時間。
為了更為直觀以及減低隨機性的影響,將空車率分為3種水平:高、中、低。分類標準為:將出租車空車率的標準差進行升序排列,視標準差在前50%的司機為穩(wěn)定司機,刪去標準差值處于后50%的司機空車率數(shù)值。之后,將空車率的數(shù)值從小到大排列,取0~20%、40%~60%以及80%~100%作為低、中、高3種空車率水平的判定標準。對應(yīng)的空車率總體分布見圖2,3 種空車率水平的分布如圖3 所示。觀察可得,上海市的出租車空車率大部分分布在中等水平,并且中等空車率水平的標準差最低,最為穩(wěn)定。
圖2 14:00~16:00時間段內(nèi)出租車空車率的分布
圖3 14:00~16:00時間段內(nèi)3種空車率水平的分布
2.3.1 尋客策略
(1)尋客距離。尋客距離Ds是指出租車在上一個乘客的下車事件與緊接著的下一個上車事件之間的空車運行時間,計算如下
式中,ED[(lonj,latj),(lonj+1,latj+1)為出租車空車行程中第j條記錄和它下一條記錄之間的歐氏距離,可由經(jīng)緯度信息計算得到[4]。
(2)上車強度。上車強度Ip定義為空車經(jīng)過沿路一系列網(wǎng)格對應(yīng)的上車次數(shù)的加權(quán)平均數(shù),計算如下
式中,pTx,y為在時間T 內(nèi)網(wǎng)格(x,y)中的上車次數(shù);ETTx,y為在網(wǎng)格(x,y)中的第j條記錄和它上一條記錄之間經(jīng)歷的時間。
(3)運行/等待。借鑒Li et al[5]的研究,用下列計算來區(qū)分司機的運行/等待策略,從而判斷司機更傾向于沿路尋客,還是就地等客。定義在上車事件發(fā)生前3 min的空車運行距離為Dp,則等待策略對應(yīng)著指標Dp低于一定的閾值τp,而運行策略則對應(yīng)著指標Dp高于該閾值τp,公式表示為
從而建立對應(yīng)的運行/等待指標Iw,這是一個布爾變量,當(dāng)值為1時表示司機采用就地等客策略(等待);當(dāng)值為0時,表示司機采用沿路尋客策略(運行),即
2.3.2 送客策略
當(dāng)司機載有乘客時,有的司機偏向于選擇保證較高運行速度但較為迂回的道路,有的司機則偏好選擇最短路,這些選擇最終會通過改變重車時間的占比來影響對應(yīng)的出租車空車率。
(1)送客迂回程度。送客迂回程度Cd通過一次重車行程的實際運行距離和起訖點之間的歐式距離的比值衡量,計算如下
式中,ED[(lono,lato),(lond,latd)]為起訖點之間的歐氏距離;Dd為一次重車行程的實際運行距離,由相鄰兩記錄之間的歐氏距離累加得
(2)送客速度。為減少GPS數(shù)據(jù)采集間隔的非均質(zhì)性,送客速度vd為加入時間考慮的速度加權(quán)平均值,計算如下式中,ETj為一次重車行程中第j 條記錄和它上一條記錄之間經(jīng)歷的時間。
視3種空車率水平為定序的離散因變量yi(1=高,2=中,3=低),在前文中提取出的5個因素作為自變量Xi=(xi1,xi2,…,xi5),構(gòu)建GMOL模型,那么因變量對應(yīng)的概率計算如下
則廣義線性形式的模型可表示為
式中,β(1)為服從平行線假設(shè)的自變量對應(yīng)的系數(shù),也就是對于任意的空車率水平j(luò),對應(yīng)的系數(shù)均為β(1);β(2)為違反平行線假設(shè)的自變量對應(yīng)的系數(shù),它們的值隨著不同的空車率水平而產(chǎn)生變動。上述系數(shù)的值可以通過最小二乘法估計得到。
多重共線性是指多元回歸模型中2個或2個以上獨立變量高度相關(guān)的現(xiàn)象。方差膨脹因子(VIF)是一種檢驗多重共線性的方法。當(dāng)VIF 等于1時,意味著沒有多重共線性存在;當(dāng)VIF 超過4時,則需要進一步進行討論;而當(dāng)VIF 超過10時,則意味著存在嚴重的多重共線性問題。對可能影響空車率的因素進行多重共線性檢驗,結(jié)果如表1所示。變量對應(yīng)的VIF 值變動范圍為[1,1.84],所有的值均小于4。因此,可認為提取出的5個變量之間不存在明顯的多重共線性問題。
表1 變量的多重共線性結(jié)果和平行線假設(shè)檢驗結(jié)果
平行線假設(shè)檢驗用來分析在不同的空車率水平下,因素對空車率水平造成的影響是否發(fā)生改變。由表1可知,只有送客迂回程度(Cd)以及送客速度(vd)在0.05水平不顯著,服從平行線假設(shè),也就是說這2個變量的系數(shù)將在不同的空車率水平下分別保持恒定。而其它3個變量違反了平行線假設(shè),在不同的空車率水平下,這3個變量產(chǎn)生的影響將發(fā)生變化??赡艿慕忉屖撬涂陀鼗爻潭?、送客速度因素對于不同的空車率水平造成了同等的影響,而其它3 個變量則會對多樣化空車率水平產(chǎn)生顯著的影響。因為GMOL模型不需要嚴格遵循平行線假設(shè),故而上述結(jié)果亦證明了建立GMOL模型的必要性。
借助Stata 14.0軟件中的gologit2,求得對應(yīng)的GMOL 結(jié)果如表2所示。由于空車率水平有3種,因此,P(yi≤3)=1,表2中僅給出了P(yi≤1)和P(yi≤2)的結(jié)果。送客迂回程度、送客速度的系數(shù)在不同空車率水平下恒為0.115 8,-0.098 8。其它因素的系數(shù)的正負性保持一致,說明這些因素對于空車率水平變化方向的影響恒定。
表2 不同空車率水平下的GMOL模型結(jié)果
對于尋客策略,增加尋客距離將會增加高空車率水平出現(xiàn)的概率,對于那些傾向于在距離上一個乘客下車點更遠的地方搜尋下一個乘客的司機而言,他們更容易出現(xiàn)高空車率的情況,應(yīng)盡量縮短尋客距離。增加上車強度,會減少高空車率水平出現(xiàn)的概率,這表明高空車率水平的司機需要在那些熱門區(qū)域?qū)ふ蚁乱晃簧宪嚦丝汀τ谶\行/等待而言,選擇就地等待策略的司機會擁有更高的空車率水平,那么高空車率司機就需要多采取沿路開車尋客的運行策略來降低他們的空車率。
對于送客策略而言,減少送客的迂回程度、提高送客速度則會增加高空車率水平出現(xiàn)的概率。那么對于那些想提高送客效率的空車率水平較低的司機而言,他們需要采取合理的送客路徑規(guī)劃,或者選擇最短路徑去送客,或者選擇雖然路徑更為迂回但能夠保證良好的送客速度的道路,比如高架快速路。
結(jié)合上述計算結(jié)果,對于每一個空車率水平的概率的數(shù)學(xué)表達形式如下
從駕駛員行為角度入手,在司機的送客策略、尋客策略兩方面挖掘出了可能影響出租車空車率的5個因素,并基于GMOL模型,提出一種探究空車率及其影響因素之間關(guān)系的量化方法,得到結(jié)論如下。
(1)空車率的分布近似于正態(tài)分布??哲嚶实姆植硷@示大部分的上海市出租車空車率分布在中等水平,意味著上海市的總體空車率水平良好。
(2)不同的運行策略會導(dǎo)致不同的空車率水平。高空車率水平的司機偏好遠距離尋找乘客、不在熱門區(qū)域搜尋乘客、傾向于就地等待乘客、或者路徑選擇不好,選擇了又繞又堵的路徑送客。
(3)高、低空車率水平的司機需采取不同的運行策略來平衡出租車運行效率和乘客滿意度之間的矛盾。對于想降低空車率水平的司機而言,可采取以下策略:縮短尋客距離、采用運行尋客策略、在需求熱門區(qū)域?qū)ふ页丝?。而對于想提高送客效率、增加空車率水平的司機而言,則需要通過路徑選擇來減少重車時間占比。