吳靜嫻,唐桂孔,李文翔*
(上海理工大學(xué),a.管理學(xué)院;b.智慧應(yīng)急管理學(xué)院,上海 200093)
共享單車是一種靈活快捷的出行方式,其推廣不僅能促進(jìn)城市公共交通發(fā)展、緩解城市交通擁堵和環(huán)境污染等問題,還能有效提升人們的身心健康[1]。然而,隨著我國城市共享單車的大規(guī)模投入和使用,多區(qū)域在高峰時段出現(xiàn)共享單車淤積、一車難求或亂停亂放等潮汐性問題,嚴(yán)重影響了人們的騎行體驗(yàn)和出行效率。因此,有必要針對共享單車使用進(jìn)行分時段研究。
現(xiàn)有關(guān)于共享單車的研究主要集中在對單車騎行時空特征、空間調(diào)度以及騎行特征影響因素的分析。在騎行時空特征方面,孫啟鵬等[2]發(fā)現(xiàn),工作日內(nèi)北京市共享單車的騎行時空分布規(guī)律與通勤行為密切相關(guān)。高楹等[3]指出共享單車在工作日、周末以及工作日早晚高峰時段的騎行空間分布特征差異顯著。呂雄鷹等[4]表示摩拜單車在工作日早晚高峰時段的供需矛盾主要集中于住宅小區(qū)和軌道站點(diǎn)周邊。在影響因素方面,曹新宇[5]表示建成環(huán)境是供人類活動需求的重要空間,對人類騎行等交通行為有重要影響。孫超等[6]基于改進(jìn)的空間滯后和殘差模型,識別出酒店、餐飲、醫(yī)療等POI對北京市共享單車出行具有正向驅(qū)動作用。Wang等[7]利用廣義結(jié)構(gòu)方程分析建成環(huán)境特征對共享單車使用的影響,研究發(fā)現(xiàn),公交站點(diǎn)、自行車道等交通設(shè)施特征與共享單車使用顯著正相關(guān),地鐵分布密度、交叉口密度與之顯著負(fù)相關(guān)。Guo等[8]基于負(fù)二項(xiàng)回歸模型分析發(fā)現(xiàn),深圳的土地混合度、人口密度、路網(wǎng)密度等建成環(huán)境對共享單車在地鐵接駁中的使用有顯著作用。王振報等[9]利用多尺度地理加權(quán)回歸模型分析發(fā)現(xiàn),不同尺度城市建成環(huán)境指標(biāo)對還車的影響差異顯著。上述研究多為基于線性模型的共享單車日騎行量與建成環(huán)境關(guān)系分析,極少能關(guān)注建成環(huán)境在不同時段對共享單車使用影響的差異以及非線性作用。事實(shí)上,建成環(huán)境對城市共享單車不同時段借還車量的作用并非均一不變,且會隨城市不同地理環(huán)境變化而變化。
基于此,本文擬基于上海市摩拜單車、網(wǎng)絡(luò)公開數(shù)據(jù),利用梯度提升決策樹模型,探究建成環(huán)境指標(biāo)對不同時段下共享單車借還車量的非線性作用。研究成果可為城市管理者制定共享單車推廣計劃和優(yōu)化共享單車資源配置提供一定的參考。
本文所用數(shù)據(jù)主要包括共享單車數(shù)據(jù)和建成環(huán)境數(shù)據(jù)兩類。共享單車數(shù)據(jù)為上海市2016 年8 月摩拜單車騎行訂單數(shù)據(jù),覆蓋上海浦西外環(huán)以內(nèi)和黃浦江沿線浦東新區(qū)的156 個街道。訂單數(shù)據(jù)主要包括用戶、訂單和單車編號,借車和還車時間,以及騎行起終點(diǎn)和途經(jīng)軌跡經(jīng)緯度坐標(biāo)信息。圖1 為共享單車在工作日和非工作日的全天騎行量分布。在工作日內(nèi),共享單車騎行存在明顯的早高峰(7:00-9:00)和晚高峰(17:00-20:00),晚高峰單位小時的騎行量(3100次·h-1)高于早高峰(2750次·h-1)。非工作日內(nèi)的單車騎行高峰小時特征則不明顯,在6:00-20:00 時段呈穩(wěn)定增長趨勢。此外,鑒于共享單車在工作日,非工作日,工作日早、晚高峰4個時段的空間集聚特征差異顯著,擬將訂單分為工作日,非工作日,工作日早、晚高峰騎行借還車量進(jìn)行分組分析。
圖1 共享單車工作日和非工作日全天騎行分布Fig.1 Temporal distribution of bike-sharing usage on weekday and weekend
建成環(huán)境數(shù)據(jù)包括百度地圖興趣點(diǎn)數(shù)據(jù)、Open Street Map 路網(wǎng)數(shù)據(jù)和上海市第六次人口普查三類數(shù)據(jù)。參照文獻(xiàn)[10],建成環(huán)境指標(biāo)構(gòu)建選取以街道為單元的密度、設(shè)計、多樣性、目的地可達(dá)性和公交可達(dá)性五維指標(biāo)。其中,街道人口密度、住宅POI密度、就業(yè)POI密度和社交娛樂密度用于指代密度;路網(wǎng)密度和非機(jī)動車道占比來測度設(shè)計;土地利用混合熵、至市中心距離和公家密度則分別指代多樣性、目的地可達(dá)性和公交可達(dá)性。土地利用混合熵是利用居住、商業(yè)、工業(yè)、公共服務(wù)設(shè)施、交通設(shè)施、公園綠地這6 類興趣點(diǎn)數(shù)據(jù)計算而成的指標(biāo),具體計算公式為
式中:pi為第i類興趣點(diǎn)數(shù)量占比;n為興趣點(diǎn)類型數(shù)。表1 為具體建成環(huán)境和單車騎行變量描述與統(tǒng)計。
表1 變量描述與統(tǒng)計Table 1 Variable description and statistics
梯度提升決策樹(Gradient Boosting Decision Trees,GBDT)是一種以前后決策樹殘差最小化為目標(biāo)的連續(xù)迭代集成方法,通過累加決策樹預(yù)測值實(shí)現(xiàn)模型預(yù)測[11]。與隨機(jī)森林、支持向量機(jī)等其他機(jī)器學(xué)習(xí)模型相比,梯度決策樹因調(diào)整學(xué)習(xí)率、樹數(shù)量和樹深度等參數(shù)降低了模型的計算速率,但有效防止了過擬合,提高了模型的預(yù)測精度,且具備較強(qiáng)泛化能力,能有效處理數(shù)據(jù)異常值等問題。同時,該模型在建模和運(yùn)行階段可解釋性強(qiáng),模型輸出的變量相對重要度和非線性依賴圖可以有效解釋自變量對因變量的影響效應(yīng)。因此,本文擬利用梯度提升決策樹,進(jìn)行建成環(huán)境對共享單車借還車量影響分析。為避免多重共線性影響,研究選取方差膨脹性因子值低于10的建成環(huán)境指標(biāo)為共享單車騎行量的自變量。
已知{(x1,y1),…,(xN,yN)}為具有N個樣本的共享單車數(shù)據(jù)集,利用梯度提升決策樹,學(xué)習(xí)共享單車借還車模型,具體步驟如下。
Step 1 初始化共享單車借還車模型F0(x)。
式中:xi和yi分別為第i個樣本的自變量向量和因變量的觀測值;x為N組自變量向量的觀測值;L(yi,β)為損失函數(shù),用于計算觀測值與模型預(yù)測值的平方誤差;β為使損失函數(shù)L(yi,β)最小化的常數(shù)。
Step 2 利用最速下降法確定M次迭代的最優(yōu)步長和決策樹,以第m次迭代為例。(1)計算各樣本損失函數(shù)負(fù)梯度。
式中:rim為樣本i在當(dāng)前模型F(x)的損失函數(shù)負(fù)梯度值;Fm-1(x)為經(jīng)m-1迭代后的模型函數(shù)。
(2) 利用數(shù)據(jù)集{(x1,r1m),…,(xN,rNm)},生成決策樹t(x;am),計算梯度下降的最優(yōu)步長βm為
式中:am為第m棵樹選擇的最佳分裂節(jié)點(diǎn)。
Step 3 引入學(xué)習(xí)率ξ控制每棵樹對模型的貢獻(xiàn),降低模型過擬合的可能性,更新模型函數(shù)為
此外,GBDT模型可有效量化自變量對因變量的影響程度,評估自變量的相對重要度。評估方法為
為確保模型精度,在建立共享單車騎行借還車模型前,需對各時段模型的學(xué)習(xí)率、最佳樹數(shù)和樹深度參數(shù)進(jìn)行調(diào)參。其中,學(xué)習(xí)率按照經(jīng)驗(yàn)建議值設(shè)為0.001,最佳樹和樹深度值則由網(wǎng)格搜索下的均方根誤差(Root Mean Square Error,RMSE)值來確定。同時,為避免過擬合問題,采用5 折交叉法進(jìn)行模型檢驗(yàn),并結(jié)合可決系數(shù)R2評估各模型擬合優(yōu)劣。表2 為共享單車工作日,非工作日,工作日早、晚高峰這4個時段借還車量模型的參數(shù)學(xué)習(xí)和擬合結(jié)果。表2中,各非線性模型擬合結(jié)果明顯優(yōu)于線性回歸模型,表明建成環(huán)境變量與共享單車借還車量之間存在潛在的非線性關(guān)系。
表2 模型參數(shù)與擬合結(jié)果Table 2 Model parameters and result
表3 為各時段共享單車借還車模型的建成環(huán)境變量相對重要度,即各建成環(huán)境變量對共享單車借還車量的影響程度。其中,每個模型所有變量的相對重要度累計值為100%。表3中,在工作日,非工作日以及工作日早、晚高峰這4 個時間段,至市中心距離、路網(wǎng)密度、非機(jī)動車道占比和人口密度對共享單車借還車量的貢獻(xiàn)最為突出,相對重要度高于11%,排名穩(wěn)居前4;社交娛樂設(shè)施密度、住宅POI 密度也在各時段的重要度穩(wěn)定適中,處于6.75%~10.86%之間;就業(yè)POI 密度、土地利用混合熵和公交站密度的作用最弱,重要度處于3.00%~5.50%之間。此外,人口密度、路網(wǎng)密度、非機(jī)動車道占比總體重要度高,但在4個時段的作用波動較大。人口密度在非工作日、工作日晚高峰的作用明顯大于其他時段,重要度在18.00%和15.00%以上;路網(wǎng)密度對工作日早高峰時段的借車作用顯著,重要度高達(dá)24.78%;非機(jī)動車道占比僅在工作日早高峰對還車量影響較高,相對重要度達(dá)17.92%。足見,部分建成環(huán)境指標(biāo)在不同時段對共享單車的借還車量影響差異明顯。
表3 建成環(huán)境影響程度Table 3 Relative importance of built environment
圖2 為工作日,非工作日以及工作日早、晚高峰街區(qū)中心鄰近度與共享單車使用的非線性關(guān)系。市中心鄰近度與4 個時段的單車使用總體呈倒U 型關(guān)系。在市中心(0,15]km 的區(qū)域,街區(qū)中心鄰近度與單車使用總體正相關(guān),至市中心距離約15 km 共享單車借還車量達(dá)到最大閾值,靠近市中心的街道共享單車使用得更加頻繁,這與路慶昌等[12]的研究結(jié)果相似。在(15,20] km 區(qū)域,其與4 個時段的單車使用明顯負(fù)相關(guān),當(dāng)區(qū)域臨近度達(dá)20 km以上時,兩者關(guān)系趨于平緩,對比同時段該因素對借還車量的作用,其在高峰時段的影響差異更為顯著,主要作用于鄰近度18 km 以內(nèi)的區(qū)域,對早高峰借車和晚高峰還車的影響程度更高。在鄰近度為15 km 的區(qū)域,該指標(biāo)的閾值效應(yīng)最為顯著,早高峰借車和晚高峰還車達(dá)到峰值,分別為23 次·h-1和27 次·h-1,高于早高峰還車和晚高峰借車峰值,這與工作日內(nèi)早高峰借車和晚高峰還車多發(fā)于市中心臨近區(qū)的特征相關(guān)。綜上,中心鄰近度18 km以內(nèi)的區(qū)域是共享單車全天騎行發(fā)生的主要區(qū)域,也是高峰時段單車供求失衡的多發(fā)區(qū),而閾值點(diǎn)所在區(qū)更是單車運(yùn)維部門高峰時段重點(diǎn)關(guān)注的區(qū)域。
圖2 至市中心距離對共享單車訂單的非線性影響Fig.2 Non-linear impact of distance to CBD on bike sharing
圖3 為路網(wǎng)密度對共享單車借還車量的非線性影響。圖中,路網(wǎng)密度與4個時段共享單車借還車量總體負(fù)相關(guān)。當(dāng)路網(wǎng)密度在(0,16]km·km-2增加時,共享單車借還車量緩慢減?。划?dāng)路網(wǎng)密度在(16,20]km·km-2時,共享單車借還車量急劇減??;隨后,共享單車借還車量減小趨勢放緩。這種負(fù)相關(guān)與Chen等[13]在成都案例中的研究結(jié)果存在差異,這種負(fù)向作用可能與上海市非機(jī)動車道占比總體較低以及高密度路網(wǎng)街區(qū)尺寸上明顯小于周邊區(qū)域,進(jìn)而導(dǎo)致小街區(qū)累計車輛騎行數(shù)相對較小有關(guān)。此外,在高峰時段16 km·km-2以內(nèi)的低密度路網(wǎng)街道存在明顯的借還車供需失衡問題,即應(yīng)重點(diǎn)關(guān)注該部分街道早高峰借車難和晚高峰停車淤積問題。
圖3 路網(wǎng)密度對共享單車借還車量的非線性影響Fig.3 Non-linear impact of road density on bike sharing
圖4 為區(qū)域非機(jī)動車道占比對共享單車借還車量的非線性影響。從圖中可以發(fā)現(xiàn),路網(wǎng)中非機(jī)動車道占比越大越有利于共享單車騎行,該結(jié)論與Yang等[14]的研究結(jié)果一致。當(dāng)非機(jī)動車道占比在(0.10,0.35]內(nèi)增加時,各時段共享單車借還車量有小幅提升;當(dāng)指標(biāo)增加至(0.35,0.38]時,非工作日外的其他時段共享單車借還車量會出現(xiàn)急劇提升;指標(biāo)增加至0.40 后,4 個時段的騎行量漸趨平緩。這表示對于非機(jī)動車道占比在0.38以內(nèi)的街道,適當(dāng)增設(shè)非機(jī)動車道對促進(jìn)共享單車的騎行有積極作用。此外,對比非機(jī)動車道占比在同時段下對借還車的作用發(fā)現(xiàn),其對工作日早高峰還車、晚高峰借車的影響更甚,其在0.38閾值點(diǎn)處早高峰還車和晚高峰借車分別為27 次·h-1和28 次·h-1,高于早高峰借車量和晚高峰還車量,側(cè)面反映在出行末端就業(yè)端增設(shè)非機(jī)動車道或?qū)S玫缆访驿佈b對高峰時段人們是否選擇單車通勤有重要影響。
圖4 非機(jī)動車道占比對共享單車訂單的非線性影響Fig.4 Non-linear impact of cycle-way ratio on bike sharing
圖5 為人口密度對共享單車借還車量的復(fù)雜非線性影響。圖中,人口密度在不同時段下與單車使用總體呈S 型關(guān)系。當(dāng)街道人口密度在1.9 萬人·km-2以內(nèi)時,小幅人口密度增加對所有時段共享單車的使用有積極作用,其作用在1.9 萬人·km-2處達(dá)到峰值,此處非工作日借還車量閾值比工作日借還車量閾值高30 次,而工作日早高峰還車量和晚高峰借車量分別達(dá)22 次·h-1和26 次·h-1,高于早高峰借車量和晚高峰還車量。當(dāng)人口增至(1.9,2.5]萬人·km-2時,各時段單車使用量有明顯下滑。這與Li等[15]的研究認(rèn)為高人口密度能吸引更多共享單車騎行存在差異,這可能與嘉定、寶山、閔行等偏郊區(qū)人口密度為(2.0,2.5]萬人·km-2的街道附近投入共享單車較少有關(guān)。當(dāng)人口密度增加至2.5萬人·km-2以上時,各時段的單車使用會有不同程度的提升??傮w而言,人口密度對同時段借還車的影響在工作日早、晚高峰時的借還車量影響差異最為顯著。隨著區(qū)域人口密度的增加,早高峰的借車量和晚高峰的還車量所受的正面影響程度更高??梢?,企業(yè)在工作日早晚高峰應(yīng)重點(diǎn)關(guān)注1.9 萬人·km-2左右區(qū)域的共享單車投放和調(diào)度問題,而3.0萬人·km-2以上的區(qū)域則須及時關(guān)注早高峰時段的供不應(yīng)求和晚高峰時段車輛淤積的清運(yùn)問題,減少高峰時段共享單車潮汐性交通問題。
圖5 人口密度對共享單車訂單的非線性影響Fig.5 Non-linear impact of population density on bike-sharing
圖6為住宅POI密度對共享單車借還車量的非線性影響。圖中,住宅POI密度與共享單車借還車量總體正相關(guān),這與路慶昌等[12]的研究結(jié)果相似。當(dāng)街道住宅POI 密度在[10,80]個·km-2內(nèi)增加時,不同時段共享單車借還車量均顯著增加;住宅POI密度為(80,160]個·km-2時,共享單車借還車量緩慢增加后維持穩(wěn)定,可能原因是住宅POI密度高的街道鄰里可達(dá)性高,步行較方便。對比同時段下住宅POI密度對借還車的影響,工作日和非工作日下該指標(biāo)作用幾乎同步,而在工作日早、晚高峰下其對借還車量影響略有差異。尤其在指標(biāo)達(dá)到40個·km-2后,其對晚高峰借車的影響程度更高,這與工作日晚高峰居住端潛在的休閑娛樂出行有一定關(guān)聯(lián)??梢姵ㄇ谕?,晚高峰期間休閑娛樂活動也會提高共享單車的需求。
圖6 住宅POI密度對共享單車訂單的非線性影響Fig.6 Non-linear impact of residence POI density on bike sharing
圖7 為就業(yè)POI 密度對共享單車借還車量的非線性作用。圖中,當(dāng)街道就業(yè)POI 密度低于30 個·km-2時,其增長對4 個時段的共享單車使用均有積極作用;當(dāng)密度高于30個·km-2時,其對工作日全天騎行有輕微促進(jìn)作用,對其他時段騎行有一定負(fù)作用??傮w上,就業(yè)密度在高峰時段與單車騎行呈倒U型關(guān)系,該閾值說明不同街道的就業(yè)密度控制在[30,100]個·km-2為宜,因?yàn)楦呔蜆I(yè)POI密度的街道可能在CBD 和高發(fā)達(dá)地區(qū),共享單車需求較少,這與Yang等[14]的觀點(diǎn)相似。對比同時段借還車影響,就業(yè)POI 密度對工作日早、晚高峰借還車量影響略有差異。在指標(biāo)達(dá)到30 個·km-2后,早高峰還車和晚高峰借車量影響略大,這預(yù)示了關(guān)注城市就業(yè)集聚地高峰時段單車疏導(dǎo)及調(diào)度工作的必要性。
圖7 就業(yè)POI密度對共享單車訂單的非線性影響Fig.7 Non-linear impact of job POI density on bike sharing
圖8 為工作日早高峰時段非機(jī)動車道占比和就業(yè)POI 密度對共享單車借還車的聯(lián)合作用結(jié)果。隨著區(qū)域就業(yè)POI密度的增大,早高峰時段共享單車借還車量在區(qū)域非機(jī)動車道占比為0.38 處(單指標(biāo)閾值點(diǎn))達(dá)到最峰值,分別為24 次·h-1和28 次·h-1,均高于非機(jī)動車占比(早高峰借車22次·h-1,還車27次·h-1)和就業(yè)POI點(diǎn)(早高峰借車19 次·h-1,還車19 次·h-1)的單指標(biāo)閾值效益。這說明非機(jī)動車道占比、就業(yè)POI密度對早高峰小時單車騎行量有積極的協(xié)作正效應(yīng)。此外,對比雙變量作用下早高峰借還車量閾值發(fā)現(xiàn),該時段單車還車所受影響更高。這與早高峰時段單車騎行以通勤為主的特征相關(guān),因此,該時段騎行還車量受通勤吸引點(diǎn)影響更高。
圖8 非機(jī)動車道占比與就業(yè)POI密度對工作日早高峰共享單車訂單的聯(lián)合影響Fig.8 Synergy impact of cycle-way ratio and job POI density on bike sharing during morning peak hour
圖9 為工作日晚高峰時段至市中心距離和非機(jī)動車道占比對共享單車的聯(lián)合作用。圖中,在市中心鄰近度為0~18 km 且非機(jī)動占比0.38 及以上的區(qū)域,晚高峰時段的共享單車借車量達(dá)到峰值,即33次·h-1。同時,在中心鄰近度為10~18 km且非機(jī)動占比0.38以上的區(qū)域,晚高峰還車量達(dá)到閾值33次·h-1。這一聯(lián)合指標(biāo)作用峰值均高于市中心鄰近度(晚高峰借車25次·h-1,還車27次·h-1)和非機(jī)動占比(晚高峰借車28次·h-1,還車26次·h-1)的單項(xiàng)指標(biāo)作用閾值。該協(xié)同作用說明,在區(qū)位優(yōu)越街道配備完善的非機(jī)動騎行設(shè)施,可顯著提高城市居民晚高峰時段共享單車的騎行意愿。此外,市中心鄰近度10 km 內(nèi),非機(jī)動車道占比0.38 以上,晚高峰借車量明顯高于還車量,說明晚高峰通勤期間,更多的共享單車騎行發(fā)生于非機(jī)動車設(shè)施完善且臨近市中心的就業(yè)POI。
圖9 至市中心距離與非機(jī)動車道占比對工作日晚高峰共享單車訂單的聯(lián)合影響Fig.9 Synergy impact of distance to CBD and cycle-way ratio on bike sharing during evening peak hour
考慮城市共享單車在不同時段的使用特征差異,本文利用GBDT 分別建立工作日,非工作日以及工作日早、晚高峰時段共享單車借還車量模型,對比分析建成環(huán)境對各時段共享單車借還車量的非線性作用。研究結(jié)果顯示:
(1)本文建立的GBDT共享單車模型較傳統(tǒng)線性模型的擬合度有明顯提升,且有效捕捉了部分建成環(huán)境指標(biāo)對共享單車借還的非線性作用和閾值效應(yīng)。
(2)依據(jù)相對重要度水平,判斷出對4個時段共享單車借還車影響起主要作用的關(guān)鍵因素,即街道至市中心距離、路網(wǎng)密度、人口密度、非機(jī)動車道占比。其中,市中心鄰近度、非機(jī)動車道占比、人口密度以及就業(yè)密度與共享單車使用有明顯的非線性關(guān)系,依據(jù)閾值給出了促進(jìn)共享單車充分使用的正面因素最佳取值。
(3)在高峰時段,街道中心鄰近度、人口密度、非機(jī)動車道占比對單車借、還車作用存在明顯差異,且非機(jī)動車道占比與街道中心鄰近度、就業(yè)POI 密度對高峰時段單車騎行作用有明顯的協(xié)作性作用。揭示了街道社區(qū)建成環(huán)境優(yōu)化對高峰時段的共享單車供求失衡的影響機(jī)理。為避免高峰時段一車難求或單車車輛淤積等潮汐性問題,要調(diào)整社區(qū)非機(jī)動基礎(chǔ)設(shè)施配置或制定微環(huán)境優(yōu)化政策,并協(xié)同單車運(yùn)維部門做好分時段單車調(diào)度和高峰時段投放。