左 微,凌世壽,黃 犀
(1.柳州職業(yè)技術(shù)學(xué)院,廣西 柳州 545006;2.柳州鐵道職業(yè)技術(shù)學(xué)院,廣西 柳州 545616)
受幾千年傳統(tǒng)風(fēng)俗習(xí)慣及地區(qū)經(jīng)濟(jì)發(fā)展不平衡影響,我國(guó)產(chǎn)生了春運(yùn)時(shí)期的全國(guó)人口大遷徙現(xiàn)象,并由此帶來(lái)交通秩序混亂及交通安全問(wèn)題[1],引發(fā)學(xué)者與決策者的高度重視。隨著高鐵網(wǎng)絡(luò)的不斷完善,有效緩解了春運(yùn)鐵路運(yùn)能不足等問(wèn)題,但由于不同旅客群體的出行行為模式差異顯著,公路客運(yùn)組織仍面臨嚴(yán)峻考驗(yàn)。統(tǒng)計(jì)數(shù)據(jù)顯示,2016—2018年春運(yùn)期間,公路旅客發(fā)送量占全國(guó)旅客發(fā)送總量的比例均高達(dá)80%以上,是我國(guó)春運(yùn)發(fā)送旅客的主力。由于公路班線客運(yùn)覆蓋范圍廣、可達(dá)性高、運(yùn)輸組織靈活,且能為高鐵集疏客流,在春運(yùn)中有著不可替代的地位。因此,亟須探索春運(yùn)時(shí)期公路旅客群體的出行模式及其異質(zhì)性,為大規(guī)??土鹘M織與應(yīng)急管理提供理論依據(jù)。
隨著大數(shù)據(jù)的應(yīng)用,春運(yùn)問(wèn)題再度成為研究熱點(diǎn),春運(yùn)大數(shù)據(jù)的使用能夠保證研究的宏觀性和科學(xué)性[2-3],當(dāng)前相關(guān)研究主要集中在旅客運(yùn)輸組織、城市間客流流動(dòng)特征與空間格局兩方面。如柳樹國(guó)[4]基于抽樣調(diào)查數(shù)據(jù)對(duì)春運(yùn)高峰期鐵路客運(yùn)站的運(yùn)輸組織進(jìn)行分析,包括車站能力與設(shè)施能力的協(xié)調(diào)、票務(wù)管理及安全管理等;LAI等[5]發(fā)現(xiàn)春運(yùn)期間中國(guó)城市客流集散中心主要集中于京津冀、長(zhǎng)三角、珠三角及成渝四大城市群,且客流流動(dòng)規(guī)模與城市等級(jí)有較強(qiáng)的一致性;魏冶等[6]通過(guò)春運(yùn)人口流動(dòng)透視中國(guó)城市網(wǎng)絡(luò)結(jié)構(gòu),指出應(yīng)加強(qiáng)核心城市的對(duì)外疏散功能以緩解城市發(fā)展受限問(wèn)題;趙梓渝等[7]基于百度遷徙大數(shù)據(jù),發(fā)現(xiàn)節(jié)后返工流與節(jié)前返鄉(xiāng)流的各省客流凈流入規(guī)模排序恰好相反,這一現(xiàn)象與該省流動(dòng)人口的職業(yè)構(gòu)成密切相關(guān);然而,馮章獻(xiàn)等[8]發(fā)現(xiàn),相關(guān)大數(shù)據(jù)研究在較好地表征春運(yùn)時(shí)期客流集散規(guī)律的同時(shí),也存在缺乏個(gè)體屬性的固有缺陷,如無(wú)法獲知個(gè)體的移動(dòng)目的和逗留時(shí)間,無(wú)法界定旅游、商務(wù)、通勤等行為模式等;隨著相關(guān)研究的不斷深入,CHENG、戢曉峰等[9-10]發(fā)現(xiàn)出行者存在顯著的異質(zhì)性,不能將所有旅客當(dāng)作同一類群體進(jìn)行分析,亟須針對(duì)旅客群體出行模式及其異質(zhì)性開展更為細(xì)致的研究。
顯然,現(xiàn)有研究多從宏觀視角對(duì)春運(yùn)時(shí)期的客流集散規(guī)律進(jìn)行探討,在一定程度上為大范圍內(nèi)春運(yùn)高峰期旅客運(yùn)輸組織奠定了理論基礎(chǔ)。相關(guān)數(shù)據(jù)由傳統(tǒng)的靜態(tài)統(tǒng)計(jì)數(shù)據(jù),如抽樣調(diào)查數(shù)據(jù)過(guò)渡到含有位置信息的社交網(wǎng)絡(luò)數(shù)據(jù)、移動(dòng)通信數(shù)據(jù),對(duì)應(yīng)研究從靜態(tài)空間跨越到“流空間”。同時(shí),這些地理行為大數(shù)據(jù)由于具有規(guī)模大、時(shí)間序列長(zhǎng)、時(shí)空精細(xì)度高等特點(diǎn),能很好地彌補(bǔ)常規(guī)調(diào)查手段(如問(wèn)卷、抽樣、普查等)的缺陷[11]。然而,春運(yùn)人口的大規(guī)模遷移不僅是地理過(guò)程之一,還是重要的出行過(guò)程之一[12],還需廣泛融合聯(lián)網(wǎng)購(gòu)票數(shù)據(jù)、公交刷卡數(shù)據(jù)、地鐵刷卡數(shù)據(jù)等更為精細(xì)的旅客出行行為大數(shù)據(jù),實(shí)現(xiàn)春運(yùn)宏觀客流規(guī)律向微觀出行模式的研究范式轉(zhuǎn)變。
根據(jù)以上分析,本文通過(guò)采集2018年云南省春運(yùn)公路客運(yùn)聯(lián)網(wǎng)購(gòu)票全樣本數(shù)據(jù),識(shí)別春運(yùn)高峰期大規(guī)模務(wù)工出行群體和日常通勤出行群體,獲取群體出行模式異質(zhì)性特征,以期為春運(yùn)時(shí)期大規(guī)模組織及應(yīng)急管理提供依據(jù)。
本文通過(guò)云南省某公路客運(yùn)聯(lián)網(wǎng)購(gòu)票系統(tǒng)采集了2018年春運(yùn)期間(2-1—3-12)旅客出行數(shù)據(jù)。數(shù)據(jù)經(jīng)清洗后共計(jì)212 018條,其中,節(jié)前數(shù)據(jù)為53 227條,平均每日出行3 549人次;節(jié)后數(shù)據(jù)為158 791條,平均每日出行6 617人次。根據(jù)兩類群體出行特征,篩選出出行次數(shù)≥2次的旅客共計(jì)8.14萬(wàn)人次(約4.62萬(wàn)名旅客),作為潛在的公路通勤和務(wù)工出行旅客數(shù)據(jù),用于群體出行模式識(shí)別分析。數(shù)據(jù)主要字段如表1所示。
表1 公路客運(yùn)數(shù)據(jù)字段信息表
為重點(diǎn)針對(duì)春運(yùn)時(shí)期外出務(wù)工群體及本地通勤群體進(jìn)行出行模式異質(zhì)性分析,基于務(wù)工、通勤旅客數(shù)據(jù),采用K-means聚類算法首先識(shí)別通勤出行和務(wù)工出行兩類典型群體。
2.1.1 K-means聚類算法
聚類算法可分為層析聚類算法、劃分聚類算法、密度聚類算法、模型聚類算法等[13],其中K-means聚類算法為應(yīng)用最廣泛的一種迭代求解聚類分析算法。
K-means采用距離作為相似性的評(píng)價(jià)指標(biāo),該模型假設(shè)數(shù)據(jù)之間的相似度與其歐式距離成反比[14]。算法實(shí)現(xiàn)步驟如下:
步驟1:對(duì)于給定的待聚類數(shù)據(jù)集X=[x1,x2,…,xF]∈RD×F,隨機(jī)選取M個(gè)對(duì)象作為初始聚類中心C=[c1,c2,…,cM]∈RD×M,其中D為數(shù)據(jù)的特征維度。
步驟2:計(jì)算xa(a=1,2,…,F(xiàn))與M個(gè)聚類中心cb(b=1,2,…,M)的距離dab,如式(1)所示:
(1)
并把xa分配至距離其最小的聚類中心,形成一個(gè)聚類。每分配一個(gè)樣本,聚類中心cb根據(jù)該聚類現(xiàn)有對(duì)象被重新計(jì)算,如式(2)所示:
(2)
式中:W——所有標(biāo)記為聚類中心cb的數(shù)據(jù)之和。
步驟3:不斷迭代步驟1、步驟2直至xa分配完畢或聚類中心不再發(fā)生變化[15]。假設(shè)聚類后每個(gè)數(shù)據(jù)所屬類別為vq(vq=b),則損失函數(shù)L的值最小,如式(3)所示:
(3)
2.1.2 聚類變量
采用公路客運(yùn)通勤出行的旅客具有與城市居民通勤相類似的出行行為特征,主要包括3種類型:(1)出行地點(diǎn)相對(duì)穩(wěn)定,均為跨縣(區(qū))出行;(2)春運(yùn)期間出行總次數(shù)較多,基本每天都有出行;(3)節(jié)前、春節(jié)期間、節(jié)后出行的次數(shù)較為穩(wěn)定。外出務(wù)工出行旅客主要包括3種類型:(1)出行地點(diǎn)穩(wěn)定性差;(2)春運(yùn)期間出行強(qiáng)度低,但節(jié)前和節(jié)后均有出行;(3)首次出行和末次出行的時(shí)間跨度大。
結(jié)合通勤、務(wù)工的出行特征與公路客運(yùn)購(gòu)票數(shù)據(jù)分析,提出識(shí)別春運(yùn)時(shí)期公路旅客群體出行模式的特征變量,如表2所示。
表2 春運(yùn)時(shí)期公路旅客群體出行模式聚類特征變量表
對(duì)每一位潛在的公路客運(yùn)通勤和務(wù)工出行旅客(春運(yùn)時(shí)期公路出行次數(shù)超過(guò)2次,即X1≥2)生成相應(yīng)的特征向量Ft=[X1,X2,X3,X4,X5,X6],采用K-means聚類算法對(duì)潛在旅客的特征矩陣進(jìn)行聚類分析。根據(jù)Calinski-Harabasz(CH)指標(biāo)評(píng)估類內(nèi)離差矩陣緊密度及類內(nèi)離差矩陣分離度(如圖1所示)。結(jié)果顯示,當(dāng)聚類中心數(shù)K=6時(shí),類簇自身最緊密,并且類與類之間最分散,即聚類效果最優(yōu)。為了將聚類結(jié)果進(jìn)行可視化,采用t-SNE(t-Distributed Stochastic Neighbor Embedding)機(jī)器學(xué)習(xí)算法進(jìn)行降維處理,聚類中心和聚類特征分布如下頁(yè)表3和圖2所示。
圖1 K-means聚類有效性判定曲線圖
表3 K-means聚類中心與聚類結(jié)果表
圖2 六類旅客的X1、X3、X6特征值箱線圖
(1)春運(yùn)時(shí)期公路旅客中存在高頻通勤出行群體和低頻通勤出行群體,分別占樣本旅客總數(shù)的0.65%和48.87%。
從圖2和表3可以看出,在第3類旅客中,所有旅客的X1(春運(yùn)出行強(qiáng)度)均>90次,其中有75%的旅客春運(yùn)期間出行總次數(shù)>125.5次;75%旅客的X3(出行時(shí)間跨度)均>37.5 d,并且旅客以最常出行路線平均出行次數(shù)達(dá)76次,出行地點(diǎn)形成穩(wěn)定規(guī)律性。上述特征表明,第3類旅客具有明顯的通勤特征,約占樣本總數(shù)的0.07%。此外,在第4類旅客中,所有旅客的X1均>15次,其中有75%的旅客出行總次數(shù)>28次;75%的旅客X3>28 d,并且最常出行路線出行次數(shù)達(dá)18次。此類旅客也呈現(xiàn)一定的通勤出行特征,約占樣本總數(shù)的0.58%。相比之下,第5類旅客的X1均>2 d,75%的旅客X3僅>1 d,旅客最常出行路線平均出行次數(shù)為1.5次。相比于第3類、第4類旅客,第5類旅客呈現(xiàn)不常使用公路客運(yùn)通勤出行的特征,該類旅客約占樣本總數(shù)的48.87%。
(2)春運(yùn)時(shí)期務(wù)工出行群體約占樣本旅客總數(shù)的50.48%。
由圖2和表3可知,88.15%的第1類旅客、75%的第2類旅客以及82.57%的第6類旅客在春運(yùn)期間的出行總次數(shù)≤3次,并且無(wú)穩(wěn)定的出行線路特征。從出行時(shí)間跨度上看,有75%的第1類旅客末次出行與首次出行的時(shí)間間隔為9 d,有75%的第2類旅客出行時(shí)間跨度為29 d,有75%的第6類旅客出行時(shí)間跨度為19 d。這三類旅客具有極強(qiáng)的務(wù)工往返公路客運(yùn)出行特征,分別占公路出行總量的22.67%、11.89%、15.92%。
(1)春運(yùn)時(shí)期,務(wù)工出行群體總體上呈現(xiàn)節(jié)前客流分散,節(jié)后客流集中的規(guī)律。
從各類務(wù)工出行群體每日出行量分布來(lái)看(圖3),節(jié)前務(wù)工出行群體客流較小,節(jié)后出行量較為集中。從客流產(chǎn)生的具體時(shí)間分布上看,主要有3種差異顯著的出行群體類型,即“節(jié)后高度集中型”“節(jié)后前緊后松型”“節(jié)后前松后緊型”。第1類務(wù)工出行旅客客流在春節(jié)后迅速增加,在正月初六和正月十六達(dá)到最高峰,為節(jié)后高度集中的出行群體;第6類務(wù)工出行旅客在正月初一至正月初十的客流較為集中,正月十一及以后出行客流平緩并逐漸下降,為節(jié)后“前緊后松”的出行群體;相比之下,第2類務(wù)工出行旅客在春節(jié)后至元宵節(jié)的客流較為平緩,正月十六的出行量明顯增長(zhǎng),為春節(jié)后“前松后緊”的出行群體。
(2)春運(yùn)時(shí)期,高頻通勤出行旅客較為穩(wěn)定,低頻通勤出行旅客在節(jié)后出行量劇增。
由圖3可以發(fā)現(xiàn),頻繁使用公路客運(yùn)通勤出行的旅客占比極小,節(jié)前出行量無(wú)明顯變化,節(jié)后出現(xiàn)小幅增長(zhǎng),但總體較為穩(wěn)定。相比之下,將公路客運(yùn)作為通勤方式之一的低頻通勤出行旅客占比更大,與節(jié)前出行量相比,節(jié)后低頻通勤出行旅客出行量顯著增長(zhǎng),尤為活躍。
圖3 春運(yùn)時(shí)期六類旅客每日出行量分布曲線圖
由于出行屬性不同,使用公路客運(yùn)通勤的旅客以中短途出行為主,約70.4%的通勤旅客出行里程<200 km;公路客運(yùn)務(wù)工出行的旅客以中長(zhǎng)途出行為主,約75.95%的務(wù)工出行旅客出行里程>100 km。如圖4所示。
對(duì)識(shí)別出的務(wù)工出行群體和通勤出行群體在春運(yùn)時(shí)期客流的空間流動(dòng)性進(jìn)行統(tǒng)計(jì)分析,如圖5所示。
經(jīng)對(duì)比分析發(fā)現(xiàn),通勤出行在春運(yùn)時(shí)期具有明顯的時(shí)間均衡性,節(jié)前和節(jié)后出行差別不大,具有較強(qiáng)的穩(wěn)定性;相比之下,務(wù)工出行受春運(yùn)的影響較大,出行集中與分散性規(guī)律明顯。臘月二十二開始出現(xiàn)務(wù)工人員集中返鄉(xiāng)現(xiàn)象,至臘月二十四達(dá)返鄉(xiāng)高潮,此后隨著春節(jié)來(lái)臨,返鄉(xiāng)量逐漸降低至臘月二十八再次出現(xiàn)小高潮。春節(jié)過(guò)后,正月初三開始出現(xiàn)務(wù)工人員返工出行活動(dòng),至正月初六、正月初九和正月初十達(dá)返工出行高潮,有60.9%的務(wù)工人員完成返工,正月十六左右再次出現(xiàn)返工小高潮,有84.1%的務(wù)工人員完成返工,之后返工流逐漸降至最低。
(a) 通勤旅客
(b) 務(wù)工旅客
(a) 節(jié)前
(b) 節(jié)后
由于務(wù)工出行群體在春運(yùn)時(shí)期具有顯著的時(shí)間不均衡性,造成特殊時(shí)期客流空間高度集中,對(duì)群體出行效率、出行體驗(yàn)和幸福感帶來(lái)嚴(yán)重負(fù)面效應(yīng)。為客觀評(píng)價(jià)春運(yùn)時(shí)期務(wù)工出行旅客的出行效率,采用候車時(shí)間指數(shù)、中轉(zhuǎn)時(shí)間指數(shù)及出行時(shí)間指數(shù)作為評(píng)估區(qū)域公路客運(yùn)運(yùn)營(yíng)效率的關(guān)鍵指標(biāo)。各指標(biāo)計(jì)算公式如式(4)~(6)所示。
(4)
式中:BIWait——旅客候車時(shí)間指數(shù),表示候車時(shí)長(zhǎng)(取票至發(fā)車時(shí)間長(zhǎng)度)占總出行時(shí)長(zhǎng)的比例;
T發(fā)j——第j程發(fā)車時(shí)間;
T取j——第j程旅客取票時(shí)間(j=1,…,k);
i——統(tǒng)計(jì)旅客人數(shù)(i=1,2,…n)。
(5)
式中:BITransit——旅客中轉(zhuǎn)時(shí)間指數(shù),表示旅客行程中總中轉(zhuǎn)時(shí)長(zhǎng)占總出行時(shí)長(zhǎng)的比例;
T到(j-1)——第(j-1)程到站時(shí)間(j=2,…,k)。
(6)
式中:BITravel——旅客出行時(shí)間指數(shù),表示旅客單位里程的出行時(shí)間;
T到k——第k程(即最后一程)的到站時(shí)間;
T發(fā)1——第1程發(fā)車時(shí)間;
SCoach——旅客公路出行總里程。
根據(jù)上述外出務(wù)工群體的出行量及出行時(shí)間分布特征,將春運(yùn)時(shí)期外出務(wù)工旅客的出行時(shí)段分為返鄉(xiāng)平緩期(臘月十六至臘月廿一)、返鄉(xiāng)上升期(臘月廿二至臘月廿三)、返鄉(xiāng)高峰期(臘月廿四)、返鄉(xiāng)下降期(臘月廿五至臘月廿九)、返工上升期(正月初三至正月初五)、返工高峰期(正月初九至正月初十)、返工次高峰期(正月十六至正月十七)及返工下降期(正月十八至正月廿五),分別計(jì)算各時(shí)段旅客的出行效率指標(biāo),得到如下頁(yè)表4所示結(jié)果。
公路旅客出行時(shí)間是指出行者通過(guò)網(wǎng)絡(luò)或到站購(gòu)票,從到達(dá)車站取票開始至最后一程車輛到站時(shí)止所歷經(jīng)的總時(shí)長(zhǎng),其中候車、中轉(zhuǎn)的時(shí)間過(guò)長(zhǎng)會(huì)給旅客出行帶來(lái)負(fù)效用[16-17]。
由表4可以發(fā)現(xiàn),在返鄉(xiāng)、返工高峰時(shí)期,務(wù)工出行旅客的候車時(shí)長(zhǎng)占出行時(shí)長(zhǎng)的比例明顯升高;節(jié)前中轉(zhuǎn)時(shí)長(zhǎng)占比及單位里程出行時(shí)間與旅客出行需求呈正相關(guān),節(jié)后則出現(xiàn)大幅度降低現(xiàn)象,總體呈現(xiàn)節(jié)前“短時(shí)候車長(zhǎng)時(shí)中轉(zhuǎn)”、節(jié)后“長(zhǎng)時(shí)候車短時(shí)中轉(zhuǎn)”的出行規(guī)律。
表4 春運(yùn)不同時(shí)段外出務(wù)工群體出行效率指標(biāo)計(jì)算結(jié)果表
(1)受春運(yùn)高峰客流影響,務(wù)工出行旅客主觀候車時(shí)長(zhǎng)增加,且節(jié)后返程比節(jié)前返鄉(xiāng)候車時(shí)間更長(zhǎng)。返鄉(xiāng)高峰時(shí)段,務(wù)工出行旅客候車時(shí)長(zhǎng)占總出行時(shí)長(zhǎng)的18%,返工高峰時(shí)段及次高峰時(shí)段候車時(shí)長(zhǎng)占比分別升至22%、29%,旅客出行時(shí)間提前,一定程度上反映出春運(yùn)時(shí)期區(qū)域交通擁擠、出行效率整體偏低的現(xiàn)象。
(2)受客觀交通狀況及客運(yùn)站運(yùn)營(yíng)組織影響,務(wù)工出行旅客中轉(zhuǎn)時(shí)長(zhǎng)及單位里程出行時(shí)間呈現(xiàn)節(jié)前占比高、節(jié)后大幅下降的趨勢(shì)。返鄉(xiāng)高峰時(shí)段,務(wù)工出行旅客中轉(zhuǎn)時(shí)長(zhǎng)占總出行時(shí)長(zhǎng)的23%,每公里出行時(shí)間約為3.15 min;返工高峰時(shí)段及次高峰時(shí)段中轉(zhuǎn)時(shí)長(zhǎng)占比均降至9%,每公里出行時(shí)間分別降至1.82 min、2.10 min,旅客出行換乘更高效,反映出運(yùn)輸組織的優(yōu)化對(duì)提升春運(yùn)客運(yùn)運(yùn)行效率的重要性。
本文基于公路客運(yùn)聯(lián)網(wǎng)售票大數(shù)據(jù),實(shí)現(xiàn)了春運(yùn)時(shí)期外出務(wù)工出行群體和本地通勤出行群體的識(shí)別及出行模式異質(zhì)性研究,結(jié)果表明:
(1)春運(yùn)出行群體中,存在超過(guò)50%的外出務(wù)工出行群體,與本地通勤出行旅客相比,該群體出行時(shí)間具有不均衡的復(fù)雜性,可分為“節(jié)后高度集中型”“節(jié)后前緊后松型”及“節(jié)后前松后緊型”三種出行類型,是春運(yùn)時(shí)期公路旅客的特殊群體及重點(diǎn)關(guān)注對(duì)象。
(2)臘月二十二務(wù)工返鄉(xiāng)客流集聚,至臘月二十四出現(xiàn)節(jié)前客流集聚最高峰,期間客流中轉(zhuǎn)滯留時(shí)間較長(zhǎng),約占出行總時(shí)長(zhǎng)的23%,旅客出行滯留的安全風(fēng)險(xiǎn)加大;節(jié)后正月初六返程客流迅速集聚,旅客主觀候車時(shí)長(zhǎng)大幅度上升,客運(yùn)站擁堵進(jìn)一步加劇,此時(shí)應(yīng)重點(diǎn)把握人群集聚特點(diǎn),進(jìn)一步完善客運(yùn)站應(yīng)急預(yù)案。
(3)針對(duì)春運(yùn)時(shí)期開展公路出行旅客群體識(shí)別及出行模式研究,能夠拓展我國(guó)春運(yùn)時(shí)空流動(dòng)性的地理研究?jī)?nèi)涵,今后還需結(jié)合公交、高鐵等綜合客運(yùn)聯(lián)網(wǎng)數(shù)據(jù),開展更大范圍、更深入的研究。