李淑慶,劉耀鴻,邱豪基
(重慶交通大學(xué) 交通運(yùn)輸學(xué)院,重慶 400074)
通勤出行是城市交通的主體,通勤出行特征是城市交通規(guī)劃和交通設(shè)施配置的重要依據(jù)。與傳統(tǒng)的調(diào)查問卷方法相比,利用大數(shù)據(jù)技術(shù)更能全面、真實(shí)、準(zhǔn)確分析通勤出行特征,獲取通勤客流規(guī)律?;诠籌C卡與GPS數(shù)據(jù),深入剖析公交通勤乘客的出行特征,不僅能為城市公交系統(tǒng)規(guī)劃與優(yōu)化、定制公交線路與站點(diǎn)的設(shè)置提供基礎(chǔ)數(shù)據(jù),也能為科學(xué)引導(dǎo)通勤客流使用公交系統(tǒng)出行、進(jìn)行線路優(yōu)化與運(yùn)營(yíng)管理、緩解城市交通擁堵提供數(shù)據(jù)支撐。
國(guó)內(nèi)外學(xué)者基于IC卡與GPS數(shù)據(jù)對(duì)公交通勤出行特征研究已取得一定的成果。S.FOELL等[1]分析了葡萄牙里斯本公共交通系統(tǒng)中乘客刷卡的時(shí)空分布特征和個(gè)別公交車的使用情況。LI Guangxia等[2]分析了新加坡兩票制公交系統(tǒng)IC卡數(shù)據(jù),通過時(shí)空聚類法篩選上下車頻率靠前的公交站點(diǎn),利用頻譜分析與啟發(fā)式方法判斷乘客的居住點(diǎn)。;王月玥[3]提出了公交通勤出行鏈提取的“四階段”法,即出行鏈結(jié)構(gòu)提取、通勤出行行為判別、出行階段起訖點(diǎn)時(shí)空信息匹配、出行階段行程距離和時(shí)間匹配,以北京市為例,分析了公交通勤出行特征;李瑩[4]利用公交IC卡和GPS數(shù)據(jù)對(duì)公交出行乘客進(jìn)行分類,并就各類乘客在時(shí)空、換乘等方面的出行特征進(jìn)行分析;羅霞等[5]基于AVL和IC卡數(shù)據(jù),利用乘車頻次統(tǒng)計(jì)法和空間聚類法推導(dǎo)了通勤OD,并對(duì)通勤乘客進(jìn)行了分析;文婧等[6]在千余份調(diào)查問卷的基礎(chǔ)上,對(duì)北京市4個(gè)不同就業(yè)空間結(jié)構(gòu)樣本進(jìn)行了不同的通勤距離、時(shí)間、效率特征比較,推導(dǎo)出通勤特征的內(nèi)在規(guī)律;梁泉等[7]基于個(gè)體出行圖譜構(gòu)建,提取了出行天數(shù)、出行次數(shù)、OD分類數(shù)、出行往返性、集中出發(fā)時(shí)間、路徑唯一性與出行空間均衡性7個(gè)指標(biāo);曹晨等[8]基于調(diào)查問卷構(gòu)建結(jié)構(gòu)方程模型,分析就業(yè)者通勤距離、通勤時(shí)間及通勤模式三者的關(guān)系及其對(duì)心理健康、身體健康以及健康行為的影響;翁小雄等[9]建立了機(jī)器學(xué)習(xí)算法通勤識(shí)別模型,制定調(diào)查問卷獲取訓(xùn)練數(shù)據(jù),利用GBDT算法訓(xùn)練分類模型,完成通勤識(shí)別。
目前國(guó)內(nèi)外基于IC卡與GPS數(shù)據(jù),對(duì)公交通勤出行特征主要針對(duì)“車”進(jìn)行的碎片化研究,而將乘客“人”作為研究對(duì)象,對(duì)公交出行鏈特征、區(qū)間客流不均衡特征、職住平衡水平及線路黏性等的出行特征研究較少,提取的特征參數(shù)不完整。因此,筆者基于公交IC卡與GPS數(shù)據(jù),從“人”的視角,分析研究較完整的通勤特征參數(shù)提取方法。
目前城市公共交通系統(tǒng)一般能收集IC卡數(shù)據(jù)與GPS數(shù)據(jù)。由于數(shù)據(jù)采集設(shè)備的不穩(wěn)定性及周圍環(huán)境的復(fù)雜性影響,所收集到的數(shù)據(jù)存在著異常數(shù)據(jù)、數(shù)據(jù)丟失、數(shù)據(jù)重復(fù)等問題。因此,在進(jìn)行數(shù)據(jù)融合和應(yīng)用之前,需要進(jìn)行數(shù)據(jù)預(yù)處理。
數(shù)據(jù)異常是指數(shù)據(jù)中某些屬性值明顯超出正常范圍或者數(shù)據(jù)中存在某些格式不正確的屬性值。如IC卡數(shù)據(jù)中的刷卡時(shí)間超出了公交運(yùn)營(yíng)時(shí)間或者刷卡時(shí)間出現(xiàn)亂碼。一般這類數(shù)據(jù)量較少,可直接將其刪除。
數(shù)據(jù)丟失是指數(shù)據(jù)采集或保存的失敗造成的數(shù)據(jù)丟失現(xiàn)象,這類字段的缺失影響后續(xù)的分析過程。如GPS數(shù)據(jù)中的公交車速數(shù)據(jù)丟失,公交車GPS數(shù)據(jù)每條信息的時(shí)間間隔一般為10 s,可以近似地將公交運(yùn)行看作勻變速運(yùn)動(dòng),采用時(shí)間序列插值補(bǔ)缺。其他特征可采用均值插值補(bǔ)缺。
數(shù)據(jù)重復(fù)是指數(shù)據(jù)中某條字段重復(fù)出行的現(xiàn)象。如在公交IC卡數(shù)據(jù)中,出現(xiàn)極短時(shí)間內(nèi),甚至一分鐘內(nèi),同一卡號(hào)多次刷卡的現(xiàn)象,則僅保留第1條數(shù)據(jù),其他則剔除。
公交IC卡與GPS數(shù)據(jù)預(yù)處理具體過程可參考文獻(xiàn)[10-11]。
公交通勤出行鏈(public transport trip chain)是指通勤出行者乘坐公交從出行起點(diǎn)到達(dá)終點(diǎn)的一個(gè)完整的過程。該出行過程由若干個(gè)出行階段構(gòu)成,每一出行階段代表出行者使用一次公共交通工具[3]。
公交IC卡數(shù)據(jù)記錄了乘客上車刷卡信息和乘坐車輛信息,但不能記錄出行位置信息。目前大多數(shù)城市的公交系統(tǒng)采用 “一票制”收費(fèi)方式,乘客只在上車時(shí)刷卡,下車不刷卡,因此無法獲取乘客的下車信息。參考文獻(xiàn)[3,9],基于公交IC卡與GPS數(shù)據(jù)的預(yù)處理結(jié)果,利用GPS數(shù)據(jù)推算出公交車輛的到站時(shí)間、上車站點(diǎn)匹配、下車站點(diǎn)匹配和換乘站點(diǎn)位置;應(yīng)用通勤出行行為判別法識(shí)別出通勤乘客,完成公交通勤出行鏈的構(gòu)建,構(gòu)建流程如圖1。
圖1 公交通勤出行鏈構(gòu)建流程Fig. 1 Construction flow chart of bus commuting travel chain
從公交出行鏈特征、區(qū)間客流不均衡系數(shù)、職住平衡水平與線路黏性系數(shù)4個(gè)維度分析計(jì)算公交通勤特征參數(shù)。
公交出行鏈特征主要包括出行鏈階段數(shù)、出行鏈個(gè)數(shù)和出行鏈換乘次數(shù)。
3.1.1 公交出行鏈階段數(shù)
公交出行鏈階段數(shù)指一天各閉合出行鏈中乘坐公交的階段數(shù)之和,單位為個(gè)/日,即乘客從居住地出發(fā),下班后最終回到居住地,乘坐公交出行的階段總個(gè)數(shù)。出行鏈階段數(shù)一定程度反映通勤者在工作日中是否存在除通勤之外的其他活動(dòng),反映通勤者的生活多樣化。
3.1.2 公交出行鏈個(gè)數(shù)
公交出行鏈個(gè)數(shù)指通勤者在當(dāng)天活動(dòng)中存在的完整出行鏈個(gè)數(shù),單位為個(gè)/日。通勤者從居住地出發(fā)到就職地上班后,一般情況是下班后再回到居住地,即只有一條閉合出行鏈,若通勤者的出行鏈次數(shù)大于1,則該通勤者的居住地可能與就職地較近,有兩次及以上的返家現(xiàn)象。
3.1.3 公交出行鏈換乘次數(shù)
公交出行換乘次數(shù)是指一次閉合公交出行鏈中所有出行階段產(chǎn)生的換乘次數(shù)的總和,單位為次/個(gè)。 換乘次數(shù)的大小一定程度上反映了公交出行者乘車出行的直達(dá)性。
參考文獻(xiàn)[12],定義線路長(zhǎng)度超過15 km的線路為長(zhǎng)線公交,不足15 km的線路為常規(guī)線公交。
不同時(shí)段或路段的公交客流量大小通常有明顯的差異,即客流不均勻性。
假設(shè)一條公交線路在某行駛方向上共有n個(gè)站點(diǎn),則該線路在該行駛方向上共有n-1個(gè)運(yùn)行區(qū)間。若在該行駛方向上共有m個(gè)班次,途徑n-1個(gè)運(yùn)行區(qū)間,定義所有運(yùn)行區(qū)間實(shí)際載客量矩陣P為:
(1)
式中:Pij為在第i[1,m]班次公交車輛在第j[1,n-1]個(gè)運(yùn)行區(qū)間中的實(shí)際載客量,計(jì)算公式為:
(2)
式中:Uk和Dk分別為第i班次公交車輛在k[1,n]站點(diǎn)上車人數(shù)和下車人數(shù)。
區(qū)間客流不均衡系數(shù)L為當(dāng)天該線路全部區(qū)間實(shí)際載客量最大值與載客量均值的比值。該指標(biāo)反映線路在當(dāng)天的載客量穩(wěn)定程度,數(shù)值越大則說明該線路的客流在各區(qū)間上分布越不均衡,計(jì)算公式為:
(3)
隨著城市機(jī)動(dòng)化水平的不斷提高,城市職住分離現(xiàn)象越來越嚴(yán)重[13]。參考ZHOU Xingang[14]的測(cè)度職住平衡度方法,基于區(qū)域內(nèi)的居住人數(shù)、就業(yè)人數(shù)、外出通勤率、外來通勤率,用區(qū)域通勤規(guī)模和區(qū)域獨(dú)立系數(shù)指標(biāo)來衡量區(qū)域的職住平衡水平。
3.3.1 區(qū)域通勤規(guī)模
區(qū)域通勤規(guī)模CCIAB反映區(qū)域之間通勤聯(lián)系程度的大小,數(shù)值等于往返兩個(gè)區(qū)域之間的通勤人數(shù)之和,計(jì)算公式為:
CCIAB=QAB+QBA
(4)
式中:QAB為居住在A區(qū)而在B區(qū)就職的通勤人數(shù);QBA為居住在B區(qū)而在A區(qū)就職的人數(shù)。
3.3.2 區(qū)域獨(dú)立系數(shù)
區(qū)域獨(dú)立系數(shù)RIA可量化該區(qū)域的通勤獨(dú)立程度,數(shù)值等于該區(qū)域的外來通勤率ECRA與外出通勤率OCRA之和的倒數(shù),計(jì)算公式為:
(5)
(6)
(7)
式中:DA為在A區(qū)域就職的人數(shù);OA為在A區(qū)域居住的就職人數(shù);QAA為在A區(qū)域居住且就職的人數(shù)。
公交通勤乘客出行一般有多條公交線路可選擇,但往往會(huì)“偏好”某條線路[15],筆者給出線路黏性系數(shù)來量化這種“偏好”程度,黏性系數(shù)大的乘客在通勤出行時(shí)傾向選擇同一條線路,而黏性系數(shù)小的乘客在通勤出行時(shí)的線路選擇往往更加多樣化。
利用生物學(xué)量化生態(tài)系統(tǒng)物種多樣性的辛普森多樣系數(shù)(diversity index),來研究乘客選擇公交的多樣性。假設(shè)研究時(shí)間段內(nèi)共有p名通勤乘客,共選擇了q條不同線路,則所有乘客遍歷選擇公交線路的矩陣X為:
(8)
(9)
從式(9)可以看出,若乘客g只選擇一條公交線路,則DIg的值為0;若乘客g均勻地選擇乘坐q條線路(即:ng1=ng2=…=ngq),則DIg的值為1-1/q。選擇的線路越多、選擇線路分布越均勻,則該值越大,反之亦然。
顯然,黏性系數(shù)是反應(yīng)乘客選擇公交線路的“偏好”性。一般說,乘客選擇公交線路多樣性越強(qiáng),則黏性系數(shù)越小。當(dāng)乘客僅選擇一條公交線路時(shí)具有更高的黏性。然而,多樣性同時(shí)考慮了選擇線路的豐富度與均勻度,黏性與豐富度關(guān)系較弱。線路黏性系數(shù)SIg的定義如式(10):
(10)
從式(10)可知,當(dāng)通勤者均勻地選擇所有可能線路時(shí),SIg的值為0,代表沒有黏性。當(dāng)乘客只乘坐一條線路時(shí),SIg的值為1,即SIg取值范圍為0 (11) (12) 以重慶市主城區(qū)2019年1月21日至25日,連續(xù)5個(gè)工作日650條公交線路中的47條代表性線路的公交IC卡與GPS數(shù)據(jù)進(jìn)行通勤特征應(yīng)用分析。 對(duì)重慶市主城區(qū)連續(xù)5個(gè)工作日47條代表性線路的公交基礎(chǔ)數(shù)據(jù)進(jìn)行預(yù)處理,識(shí)別出261 284位通勤人員,構(gòu)建通勤出行鏈,得到了乘客的通勤出行鏈數(shù)據(jù),包括卡號(hào)、線路號(hào)、上車站點(diǎn)、上車時(shí)間、下車站點(diǎn)、下車時(shí)間、換乘站點(diǎn)和換乘時(shí)間,如表1。 表1 乘客出行鏈數(shù)據(jù)表示例(部分)Table 1 Data table of passenger trip chain (partial) 對(duì)構(gòu)建的公交通勤出行鏈進(jìn)行分析,得到出行鏈階段數(shù)、出行鏈個(gè)數(shù)和出行鏈換乘次數(shù)如圖2~圖4。 圖4 通勤換乘次數(shù)分布Fig. 4 Distribution of commuting and transfering times 由圖2可知:大部分通勤者的出行鏈階段數(shù)為2,即只有居住地—工作地—居住地這種出行模式;而階段數(shù)為3的占比不足10%,這類人在工作之余還可以中午返回居住地。計(jì)算樣本整體的出行鏈階段數(shù)均值為2.06,表明該城市通勤者生活節(jié)奏快,基本上只在居住地與工作地之間往返。 圖2 通勤出行鏈階段數(shù)分布Fig. 2 Distribution of phases in commuter travel chain 由圖3可知:出行鏈個(gè)數(shù)為一次的通勤人群占比49.95%、個(gè)數(shù)為2的占比36.50%,這符合通勤者把一天的通勤安排在一次閉合出行的現(xiàn)實(shí)規(guī)律。 圖3 通勤出行鏈個(gè)數(shù)分布Fig. 3 Distribution of the number of commute travel chain 由圖4可知:早高峰通勤者一次換乘占15.5%,2次換乘占6.9%;晚高峰通勤者一次換乘占16.6%,2次換乘占4.2%;通勤出行中,早晚高峰中沒有換乘的比例分別為76.9%和78.6%??傮w來看,早晚高峰中沒有換乘或僅有一次換乘占比為93.8%,表明多數(shù)公交通勤者出行換乘次數(shù)較少。 在構(gòu)建的所有公交線路公交通勤出行鏈中隨機(jī)選取兩條常規(guī)線(線路長(zhǎng)度小于15 km):475路和809路,3條長(zhǎng)線(線路長(zhǎng)度大于15 km):872路、819路和319路。 根據(jù)式(2),計(jì)算出5條線路在各區(qū)間的實(shí)際載客量總和,其中線路475和線路872的客流量分布情況如圖5、圖6。 ③目標(biāo)的確立。從醫(yī)院未來發(fā)展考慮,從兩方面入手,一方面為院內(nèi)宣傳環(huán)境,另一方面為院外宣傳環(huán)境。樹立人人是標(biāo)桿人人要發(fā)聲的主人翁意識(shí)陣地意識(shí)。在標(biāo)識(shí)管理上,加強(qiáng)可視性物體醫(yī)院文化元素的植入應(yīng)用,打造溫馨、安全、方便、和諧的就醫(yī)環(huán)境。加強(qiáng)培訓(xùn)和管理,建立有效考核機(jī)制,增強(qiáng)主動(dòng)參與意識(shí)。與院外媒體積極溝通協(xié)調(diào),加強(qiáng)主流媒體發(fā)聲,擴(kuò)大醫(yī)院正能量宣傳范圍和力度,了解輿情動(dòng)態(tài),提高負(fù)面輿情的主動(dòng)處置能力和應(yīng)對(duì)水平。對(duì)全院的工作人員進(jìn)行引導(dǎo),確保思想統(tǒng)一,從而為患者展現(xiàn)良好形象。 圖5 475路公交各區(qū)間客流分布Fig. 5 Passenger flow distribution of 475 bus in different sections 圖6 872路公交各區(qū)間客流分布Fig. 6 Passenger flow distribution of 872 bus in different sections 根據(jù)式(3),計(jì)算出5條線路早晚高峰及兩個(gè)行駛方向的區(qū)間客流不均衡系數(shù),如表2。 表2 5條線路的區(qū)間客流不均衡系數(shù)Table 2 Section passenger flow imbalance coefficient of 5 lines 由圖5、圖6和表2分析可得:兩條常規(guī)公交線路長(zhǎng)度和站點(diǎn)數(shù)量合適,站點(diǎn)客流量分布較為均衡;而3條長(zhǎng)線公交的線路較長(zhǎng),站點(diǎn)數(shù)量多,分布為“單峰型”形態(tài)。 參考文獻(xiàn)[16],大城市通勤線路的區(qū)間不均衡系數(shù)L取值一般應(yīng)低于1.5。分析表2可知,重慶市常規(guī)通勤線路滿足L值小于1.5,長(zhǎng)線公交則高于1.5。這說明山地城市重慶的長(zhǎng)線公交乘客需求較大,總體運(yùn)力不足,可采取增加發(fā)車頻次、增加定制公交等方式,保持線路各站點(diǎn)間運(yùn)力與運(yùn)量的平衡。 重慶市主城區(qū)由渝中區(qū)、沙坪壩區(qū)、九龍坡區(qū)、大渡口區(qū)、渝北區(qū)、江北區(qū)、南岸區(qū)、巴南區(qū)、北碚區(qū)組成,基于公交IC卡及GPS數(shù)據(jù),分析各區(qū)的職住平衡水平。 筆者假定通勤者在一天中的最后一次出行鏈的下車站點(diǎn)為通勤者的居住地,第一次出行鏈的下車站點(diǎn)為通勤者的就職地。根據(jù)式(4)~式(7),計(jì)算出各區(qū)的通勤規(guī)模與區(qū)域獨(dú)立系數(shù)如表3、表4。 表3 重慶市主城區(qū)不同城區(qū)的通勤規(guī)模Table 3 CCI values in different urban areas of Chongqing 表4 重慶市主城區(qū)不同城區(qū)的獨(dú)立系數(shù)Table 4 RI values in different urban areas of Chongqing 分析表3、表4得出:不論是核心城區(qū)還是外圍城區(qū),在本地居住且就職的人數(shù)均大于外出到其他各區(qū)的就業(yè)人數(shù),因此城區(qū)內(nèi)部的CCI指標(biāo)普遍大于城區(qū)外部的CCI值,這充分表明了重慶主團(tuán)城市布局的特性;其中,大渡口和巴南兩個(gè)城區(qū)的內(nèi)部通勤規(guī)模最大。 從就業(yè)和居住方面來看,重慶市主城各區(qū)居住與就業(yè)近一半通勤者均在同一城區(qū)。外圍城區(qū)的平均外出通勤率和外來通勤率分別為51.23%和51.15%。核心城區(qū)的平均外出通勤率和外來通勤率分別為42.11%和55.30%。居住在核心城區(qū)通勤者約58%是在本城區(qū)就業(yè),僅有42%的通勤者外出就業(yè),因此核心城區(qū)的獨(dú)立系數(shù)普遍比外圍城區(qū)更大。 根據(jù)式(9)~式(12),計(jì)算出通勤人群中的線路黏性系數(shù)(SI)及其均值、標(biāo)準(zhǔn)差,如圖7、表5。 圖7 黏性系數(shù)頻率分布Fig. 7 Frequency distribution of viscosity coefficient 表5 線路黏性系數(shù)總體情況Table 5 General situation of line viscosity coefficient 由圖7和表5可知:黏性系數(shù)頻率分布圖整體呈現(xiàn)左偏趨勢(shì),總體樣本的SI均值與標(biāo)準(zhǔn)差分別為0.385 2和0.203 1,線路黏性系數(shù)為0.5以下的占73.9%,0.5以上的占26.1%,說明有26.1%的通勤者在選擇通勤線路時(shí)具有較強(qiáng)黏性,而73.9%的通勤者在選擇通勤線路時(shí)沒有特別“依賴”某條線路。 由于公交線路的多樣性,通勤者在等待公交時(shí),會(huì)優(yōu)先選擇先到達(dá)公交站點(diǎn)的公交線路;地面公交不同于地鐵輕軌,通勤者選擇地鐵軌道的線路相較公交線路固定單一,而公交線路比較豐富多樣,使得通勤者出行時(shí)選擇的線路具有多樣化、均等化。 基于公交IC卡與GPS數(shù)據(jù)對(duì)通勤乘客的出行特征進(jìn)行研究,創(chuàng)新性提出了較完整反映公交通勤客流特征4個(gè)維度指標(biāo)參數(shù),包括公交出行鏈特征、區(qū)間客流不均衡系數(shù)、職住平衡水平及線路黏性系數(shù)的計(jì)算方法。以重慶市主城區(qū)連續(xù)5個(gè)工作日47條典型公交線路的公交IC卡及GPS數(shù)據(jù)為實(shí)例,進(jìn)行重慶市主城區(qū)通勤出行特征分析,主要結(jié)論為: 1)大部分通勤者的出行鏈階段數(shù)為“2”;出行鏈個(gè)數(shù)為“1”的通勤人群占比49.95%,為“2”的占比36.50%;多數(shù)公交通勤者出行換乘次數(shù)較少。 2)常規(guī)線路的區(qū)間客流不均衡系數(shù)滿足小于1.5的特性;但長(zhǎng)線公交不滿足這一特性,這反映了重慶主城區(qū)公交長(zhǎng)距離出行需求較大的山地城市交通特征。 3)本地居住且就職的人數(shù)均大于外出到其他各區(qū)的就業(yè)人數(shù);居住在核心城區(qū)通勤者約58%是在本城區(qū)就業(yè),僅有42%的通勤者外出就業(yè),核心城區(qū)的獨(dú)立系數(shù)普遍比外圍城區(qū)大。說明重慶市主城區(qū)職住平衡水平較高。 4)26.1%的通勤者在選擇通勤線路時(shí)具有較強(qiáng)黏性,73.9%通勤者在出行的線路選擇沒有特別“依賴”某條線路,往往具有多樣化和均等化。4 實(shí)例應(yīng)用分析
4.1 出行鏈特征
4.2 區(qū)間客流不均衡系數(shù)
4.3 職住平衡水平
4.4 線路黏性系數(shù)
5 結(jié) 論