孫凱 鄭長(zhǎng)江
摘 要:公交客流數(shù)據(jù)是公交組織調(diào)度、線網(wǎng)優(yōu)化和場(chǎng)站規(guī)劃的基礎(chǔ)性數(shù)據(jù),隨著計(jì)算機(jī)信息技術(shù)的發(fā)展,通過(guò)對(duì)公交刷卡數(shù)據(jù)進(jìn)行分析處理即可得到全面準(zhǔn)確的公交客流信息。以桂林市公交系統(tǒng)數(shù)據(jù)為例,首先,對(duì)公交IC卡刷卡數(shù)據(jù)和定位數(shù)據(jù)結(jié)構(gòu)進(jìn)行分析并對(duì)刷卡數(shù)據(jù)進(jìn)行預(yù)處理,篩選出客流推算所需數(shù)據(jù)并剔除異常數(shù)據(jù);其次,融合刷卡數(shù)據(jù)與定位數(shù)據(jù)匹配乘客上車站點(diǎn);再次,根據(jù)站點(diǎn)吸引強(qiáng)度和乘客出行站數(shù)規(guī)律計(jì)算各站點(diǎn)下車概率,推算站點(diǎn)下車人數(shù)和線路OD(origin-destination)矩陣,其中吸引強(qiáng)度結(jié)合了站點(diǎn)上車人數(shù)和站點(diǎn)周邊土地利用規(guī)劃;最后,對(duì)計(jì)算結(jié)果與實(shí)際調(diào)查值的各項(xiàng)誤差指標(biāo)進(jìn)行分析,表明研究結(jié)果的合理與準(zhǔn)確性。
關(guān)鍵詞:公交客流預(yù)測(cè);OD推算;公交IC卡;土地利用
中圖分類號(hào):U491.1;C811 ?文獻(xiàn)標(biāo)志碼:A
公交客流信息是公交運(yùn)營(yíng)調(diào)度、組織優(yōu)化的基本依據(jù),隨著城市規(guī)模逐漸擴(kuò)大,公交站點(diǎn)與線路的數(shù)量都在不斷增加與變化,傳統(tǒng)的人工調(diào)查方法獲取公交客流數(shù)據(jù)變得愈發(fā)困難。隨著公交移動(dòng)刷卡支付使用普及和互聯(lián)網(wǎng)技術(shù)的發(fā)展,能夠獲取乘客每一次的刷卡信息以及車輛實(shí)時(shí)的定位信息,而這些數(shù)據(jù)無(wú)法直觀反映公交線路站點(diǎn)客流情況,需通過(guò)計(jì)算機(jī)信息技術(shù)手段對(duì)數(shù)據(jù)進(jìn)行挖掘,便能得到全面準(zhǔn)確直觀可靠的公交客流信息?!冻鞘泄步煌ā笆濉卑l(fā)展綱要》提出:將信息技術(shù)與公交系統(tǒng)相結(jié)合,建設(shè)智能化的交通系統(tǒng),廣泛應(yīng)用公交大數(shù)據(jù),提高公交服務(wù)信息化水平。因此,針對(duì)公交刷卡數(shù)據(jù)進(jìn)行深度挖掘,獲取居民出行需求,優(yōu)化城市公交,提供決策信息,具有重要的研究?jī)r(jià)值。
公交OD推算是獲取公交客流信息的基礎(chǔ)性數(shù)據(jù),主要側(cè)重于通過(guò)計(jì)算機(jī)的數(shù)據(jù)挖掘技術(shù)對(duì)海量公交刷卡數(shù)據(jù)以及車輛GPS信息進(jìn)行分析處理,獲得各站點(diǎn)的上下車人數(shù)與線路OD。目前國(guó)內(nèi)外已有學(xué)者對(duì)基于公交刷卡數(shù)據(jù)的公交站點(diǎn)客流推算方法進(jìn)行研究。戴霄[1]結(jié)合公交的調(diào)度信息,采用聚類分析對(duì)上車站點(diǎn)進(jìn)行判斷,提出基于單個(gè)乘客刷卡數(shù)據(jù)與基于站點(diǎn)吸引兩種判斷上車站點(diǎn)方法。王周全[2]通過(guò)乘客刷卡時(shí)間與公交車輛到達(dá)和離開站點(diǎn)時(shí)間相匹配,識(shí)別公交乘客刷卡的上車站點(diǎn)位置,以乘客出行距離和公交站點(diǎn)的吸引特征作為影響乘客下車概率的主要因素,建立乘客下車概率模型。涂一霜[3]基于公交到站數(shù)據(jù)與刷卡數(shù)據(jù)融合計(jì)算刷卡時(shí)間與公交到站時(shí)間差來(lái)匹配上車站點(diǎn),基于出行鏈、規(guī)律出行和概率計(jì)算3種方法計(jì)算下車站點(diǎn)。梅珊[4]基于出行鏈的估計(jì)方法推算乘客的下車站點(diǎn),并結(jié)合公交站點(diǎn)停靠時(shí)間得到下車時(shí)間。楊萬(wàn)波等[5]結(jié)合居民公交出行規(guī)律推算交通小區(qū)的公交OD矩陣。LI等[6]基于每個(gè)站點(diǎn)上下車人數(shù)估算每一站下車的概率及公交OD矩陣。竇慧麗等[7]基于站點(diǎn)上下車人數(shù)和線路客流量推算各站點(diǎn)乘客下車概率,提出單條公交線路客流OD矩陣推算方法。劉穎杰等[8]結(jié)合站點(diǎn)吸引率,提出了單條公交線路站點(diǎn)間OD反推的結(jié)構(gòu)化算法。NAVICK等[9]運(yùn)用小樣本OD推算完整OD矩陣。崔紫薇等[10]基于歷史出行記錄擴(kuò)充方法推算下車站點(diǎn)。NASSIR等[11]通過(guò)數(shù)據(jù)檢測(cè)乘客出行鏈中的實(shí)際活動(dòng)軌跡來(lái)確定下車站點(diǎn)。
這些方法各有適用范圍和局限性,確定線路客流的影響因素較為單一,受單個(gè)因素影響較大,存在高數(shù)據(jù)敏感性的問(wèn)題,不能全面反映線路客流情況。基于出行鏈的方法理論上能夠準(zhǔn)確推算公交客流數(shù)據(jù),需要結(jié)合全市所有公交數(shù)據(jù)進(jìn)行分析,但實(shí)際情況是公交換乘人數(shù)占公交出行總?cè)藬?shù)的比例很小,而時(shí)間與經(jīng)濟(jì)成本呈指數(shù)級(jí)增加,從經(jīng)濟(jì)效益來(lái)說(shuō)并不適用。因此,本文從單條公交線路出發(fā),考慮竇慧麗[7]和劉穎杰[8]等展望中提及的引入土地利用性質(zhì),綜合站點(diǎn)上車人數(shù)來(lái)確定公交站點(diǎn)吸引強(qiáng)度,并結(jié)合乘客出行距離建立下車概率矩陣,推算線路OD矩陣,進(jìn)行公交客流數(shù)據(jù)統(tǒng)計(jì)分析。
1 公交系統(tǒng)基礎(chǔ)數(shù)據(jù)與預(yù)處理
1.1 公交系統(tǒng)基礎(chǔ)數(shù)據(jù)
1.1.1 公交IC卡刷卡數(shù)據(jù)
公交刷卡數(shù)據(jù)記錄了每位乘客每次刷卡時(shí)的詳細(xì)數(shù)據(jù)。不同城市的刷卡系統(tǒng)對(duì)應(yīng)的刷卡記錄數(shù)據(jù)結(jié)構(gòu)可能不完全相同,對(duì)于上下車都需要刷卡的公交系統(tǒng),刷卡數(shù)據(jù)結(jié)構(gòu)中含有上車站點(diǎn)和下車站點(diǎn)字段,而目前桂林市公交采用單次刷卡形式,刷卡數(shù)據(jù)結(jié)構(gòu)中不含有上下車站點(diǎn)字段。公交刷卡記錄里包含線路、車牌號(hào)、卡號(hào)、交易時(shí)間等信息。部分?jǐn)?shù)據(jù)如表1所示。
1.1.2 公交GPS定位數(shù)據(jù)
公交GPS定位系統(tǒng)記錄了車輛的實(shí)時(shí)運(yùn)行信息。對(duì)于車輛位置,主要利用經(jīng)緯度坐標(biāo)進(jìn)行定位與站點(diǎn)相匹配,利用其他參考坐標(biāo)點(diǎn)進(jìn)行車輛位置信息的核查,得到公交實(shí)時(shí)位置附近所在的站點(diǎn)。公交GPS定位數(shù)據(jù)主要包括線路名、車牌號(hào)、服務(wù)器時(shí)間、方向、當(dāng)前站點(diǎn)編號(hào)、當(dāng)前站點(diǎn)名稱等信息。部分?jǐn)?shù)據(jù)如表2所示。
1.2 刷卡數(shù)據(jù)預(yù)處理
公交客流研究中需要用到的刷卡數(shù)據(jù)未必完全準(zhǔn)確,存在部分問(wèn)題數(shù)據(jù),這些問(wèn)題會(huì)在數(shù)據(jù)融合時(shí)使程序出錯(cuò)。因此需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,剔除錯(cuò)誤數(shù)據(jù),控制數(shù)據(jù)質(zhì)量,保證研究數(shù)據(jù)的準(zhǔn)確性[12]。
1)選擇分析時(shí)段
公交都按照公交調(diào)度計(jì)劃運(yùn)行,乘客出行特點(diǎn)具有一定的周期性和時(shí)段性。一般來(lái)說(shuō),根據(jù)乘客出行特點(diǎn),大部分乘客在一周工作日期間的出行特征有較大的相似性,可以日、周、月作為公交客流出行特征的基本分析單位。
2)選取數(shù)據(jù)字段
公交刷卡系統(tǒng)一天內(nèi)記錄了上萬(wàn)次乘客刷卡記錄,而在進(jìn)行公交客流出行特征分析的過(guò)程中,有大量字段對(duì)于分析沒(méi)有實(shí)質(zhì)的意義,因此在數(shù)據(jù)預(yù)處理階段可以剔除這些對(duì)于分析沒(méi)有實(shí)質(zhì)意義的數(shù)據(jù)字段,這樣可以減少計(jì)算機(jī)運(yùn)行負(fù)荷,加快計(jì)算機(jī)處理速度,提高數(shù)據(jù)處理效率。主要選取的刷卡數(shù)據(jù)字段有線路、車牌號(hào)、交易時(shí)間。
3)剔除錯(cuò)誤數(shù)據(jù)
在刷卡系統(tǒng)的工作過(guò)程中,可能會(huì)出現(xiàn)公交車輛收費(fèi)機(jī)故障或系統(tǒng)網(wǎng)絡(luò)傳輸中斷等問(wèn)題,因此原始刷卡數(shù)據(jù)中往往存在錯(cuò)誤數(shù)據(jù)。刷卡數(shù)據(jù)中,缺失車牌號(hào)、線路、交易時(shí)間數(shù)據(jù)等部分字段是典型的錯(cuò)誤數(shù)據(jù)。因此,剔除這些錯(cuò)誤數(shù)據(jù)是保證公交客流出行特征分析質(zhì)量的有效手段。
下面分析刷卡錯(cuò)誤數(shù)據(jù)的特征及剔除方法。
公交刷卡數(shù)據(jù)主要存在以下幾個(gè)方面問(wèn)題:部分字段缺失、數(shù)據(jù)重復(fù)與數(shù)據(jù)串流。
1)部分字段缺失。例如部分?jǐn)?shù)據(jù)為空(即NULL)。此類數(shù)據(jù)占總數(shù)據(jù)的比例約為1%。對(duì)于缺失字段數(shù)據(jù),其占總數(shù)據(jù)比例最小,可直接刪除缺失字段數(shù)據(jù)。
2)數(shù)據(jù)重復(fù)。例如刷卡數(shù)據(jù)中,存在部分完全重復(fù)的數(shù)據(jù),為系統(tǒng)多次記錄,此類數(shù)據(jù)占總數(shù)據(jù)的比例約為3%。對(duì)于重復(fù)數(shù)據(jù),直接刪除并保留每條唯一的刷卡記錄即可。
3)數(shù)據(jù)串流。例如刷卡數(shù)據(jù)中的某些車牌號(hào)出現(xiàn)次數(shù)較少,且在發(fā)車計(jì)劃中并不存在。此類數(shù)據(jù)不為該線路數(shù)據(jù),占總數(shù)據(jù)的比例小于0.1%。如圖1所示,一天中刷卡數(shù)據(jù)數(shù)據(jù)串流車輛數(shù)約為3輛,且串流車輛刷卡數(shù)據(jù)不超過(guò)20次,非串流數(shù)據(jù)刷卡數(shù)據(jù)皆大于100次,并且發(fā)車計(jì)劃中的車輛在刷卡數(shù)據(jù)中都能找到對(duì)應(yīng),因此可以通過(guò)以下幾種方法刪除:①刪除刷卡數(shù)據(jù)中按車牌分組后刷卡數(shù)據(jù)不超過(guò)20組的數(shù)據(jù);②通過(guò)與發(fā)車計(jì)劃車輛數(shù)據(jù)關(guān)聯(lián),刪除刷卡數(shù)據(jù)中車輛不在發(fā)車計(jì)劃中的數(shù)據(jù)。在研究中發(fā)現(xiàn),兩種方法所得到的結(jié)果相同,而第一種方法算法較為簡(jiǎn)單通俗,能夠減少處理時(shí)間,提高運(yùn)行效率,故本研究采取第一種方法。
2 線路客流數(shù)據(jù)統(tǒng)計(jì)分析
2.1 站點(diǎn)上車人數(shù)匹配
桂林市公交為單次刷卡,刷卡數(shù)據(jù)單單記錄了所在線路、所乘車輛、刷卡時(shí)間等信息,沒(méi)有記錄乘客的上車站點(diǎn)位置,而車輛所在站點(diǎn)位置信息記錄在了GPS定位數(shù)據(jù)中。GPS定位數(shù)據(jù)每3 s記錄一次公交車輛的位置,通過(guò)經(jīng)緯度和離車輛最近的站點(diǎn)位置信息來(lái)表示。因此,匹配乘客刷卡數(shù)據(jù)與公交GPS定位數(shù)據(jù),可以推算乘客的上車站點(diǎn),關(guān)聯(lián)這兩個(gè)數(shù)據(jù)集的基本規(guī)則如下[13]:①線路相同;②車牌號(hào)相同;③刷卡時(shí)間大于對(duì)應(yīng)車輛的GPS服務(wù)器時(shí)間,且時(shí)間差在3 s之內(nèi)。如圖2所示。
2.2 站點(diǎn)下車人數(shù)推算
根據(jù)刷卡數(shù)據(jù)不能直接獲取各站點(diǎn)下車人數(shù),但可以采取根據(jù)線路運(yùn)行規(guī)律進(jìn)行推算的辦法來(lái)確定下車站點(diǎn)。
居民使用不同交通工具出行的時(shí)間消耗通常集中在一定范圍內(nèi)。公交的使用時(shí)間消耗一般與中長(zhǎng)途旅行相對(duì)應(yīng)。耗時(shí)太久或太短的出行,居民很少使用公交。因此,居民公交距離的分布呈現(xiàn)一定的規(guī)律。此外,用地性質(zhì)也會(huì)影響到公交站點(diǎn)吸引強(qiáng)度的分布。附近有大型餐飲、購(gòu)物、休閑、娛樂(lè)設(shè)施的站點(diǎn),其吸引半徑要大于一般車站,而這些站點(diǎn)往往是重要的交通客流節(jié)點(diǎn),上下車人數(shù)較多。因此,乘客在站點(diǎn)下車的概率與站點(diǎn)之間的距離和站點(diǎn)的吸引強(qiáng)度有關(guān)。
1)建立下車概率矩陣
一般來(lái)說(shuō),客流量是相對(duì)恒定的,也就是說(shuō),乘客從某站點(diǎn)上車到某站點(diǎn)下車的概率也是相對(duì)恒定的。若某線路有n個(gè)停靠站(包括首末站),用pij表示乘客在i站上車并在j站下車的概率,建立下車概率矩陣:
P=[Pij]n×n。
2)確定站點(diǎn)吸引強(qiáng)度
(1)依據(jù)相反方向?qū)?yīng)站點(diǎn)上車人數(shù)
站點(diǎn)吸引率反映了站點(diǎn)對(duì)乘客的吸引強(qiáng)度。站點(diǎn)的上車人數(shù)越多,吸引強(qiáng)度就越大;反之亦然。根據(jù)戴霄等[14]研究發(fā)現(xiàn),上下行方向客流具有對(duì)稱性,即上行各站點(diǎn)上車人數(shù)占總上車人數(shù)的比值與下行對(duì)應(yīng)站點(diǎn)下車人數(shù)占總下車人數(shù)的比值相近,這種對(duì)稱性在工作日表現(xiàn)尤為明顯。根據(jù)上節(jié)對(duì)站點(diǎn)上車人數(shù)的判斷,可進(jìn)而推算站點(diǎn)的吸引強(qiáng)度:
Ai=Si∑nk=1Sk。
式中:Ai為第i站的吸引率;Si為相反方向?qū)?yīng)第i站的上車人數(shù)。
(2)依據(jù)站點(diǎn)周邊土地利用規(guī)劃
站點(diǎn)周邊用地類型,即土地利用性質(zhì)也反映了對(duì)乘客的吸引強(qiáng)度。附近有大型餐飲、購(gòu)物、休閑、娛樂(lè)設(shè)施的站點(diǎn),吸引強(qiáng)度較一般站點(diǎn)大。公交站點(diǎn)間距離一般在500~600 m之間,取上限值的一半,即300 m作為計(jì)算依據(jù)。根據(jù)各站點(diǎn)周邊300 m的土地利用規(guī)劃,基于不同性質(zhì)用地的出行吸引率預(yù)測(cè)各站點(diǎn)的吸引率:
G*i=∑Likαik。
式中:G*i為第i站的吸引率; Lik為第i站周邊300 m第k類用地的建筑面積占總面積比例; αik為第i站周邊300 m第k類用地單位面積的出行吸引率。
再對(duì)線路各站點(diǎn)吸引率進(jìn)行歸一化處理:
Gi=G*i∑nk=1G*i。
式中:Gi為歸一化處理后的第i站的吸引率。
結(jié)合相反方向?qū)?yīng)站點(diǎn)上車人數(shù)確定的站點(diǎn)吸引率Ai,與站點(diǎn)周邊不同土地性質(zhì)吸引率Gi,計(jì)算出站點(diǎn)總吸引強(qiáng)度Li:
Li=β1Ai+β2Gi∑nk=1β1Ak+β2Gk。
式中:β1為根據(jù)站點(diǎn)上車人數(shù)確定的吸引強(qiáng)度所占權(quán)重;β2為根據(jù)站點(diǎn)周邊300 m土地利用規(guī)劃確定的吸引強(qiáng)度所占權(quán)重。其中,β1+β2=1,取β1=β2=0.5。
3)確定乘車站距分布
根據(jù)竇慧麗等[7]研究發(fā)現(xiàn),乘客出行乘坐的公交站點(diǎn)數(shù)量主要集中在一定范圍內(nèi)。當(dāng)乘坐的站點(diǎn)數(shù)量達(dá)到一定時(shí),該站點(diǎn)的下車人數(shù)最多,即下車概率最大;當(dāng)乘坐站點(diǎn)數(shù)量過(guò)多或過(guò)少時(shí),下車概率相對(duì)較小,其通常遵循一定的分布規(guī)律。統(tǒng)計(jì)檢驗(yàn)表明,在給定的行駛方向下,乘客乘坐的公交站點(diǎn)數(shù)量服從泊松分布:
P(k)=λke-λk!。
式中:P(k)為乘客乘坐k站的概率;λ為平均乘車站數(shù)。
乘客乘坐站數(shù)至少為1站,至多為首站至末站,即為n,需要對(duì)上述概率進(jìn)行歸一化處理:
P*(k)=λke-λk!/∑nk=1λke-λk!。
式中:P*(k)為歸一化處理后的乘客乘坐k站的概率。
假設(shè)從i站上車并在j站下車為乘坐k站,即j-i=k,概率分布可表示為
Wij =λj-ie-λ(j-i)!/∑j-1i = 1λj-ie-λ(j-i)!。
式中:Wij為從i站上車并在j站下車的概率;λ為平均乘車站數(shù),當(dāng)i站以后的站點(diǎn)數(shù)目小于平均乘車站點(diǎn)數(shù)時(shí),取λ=n-i。
4)確定下車概率
下車概率Pij與站點(diǎn)吸引強(qiáng)度和乘車站距分布有關(guān),即Pij∝Li,Pij∝Wij,由此構(gòu)成公交某一行駛方向,乘客從i站上車并在j站下車的概率為:
Pij=Li×Wij∑nk=i+1Lk×Wiki 0i≥j。 5)推算線路OD及下車人數(shù) 公交線路OD反映了某條線路站點(diǎn)至站點(diǎn)的OD量,對(duì)單條公交線路的站點(diǎn)優(yōu)化、運(yùn)營(yíng)評(píng)價(jià)和運(yùn)力配置有著關(guān)鍵作用[15]。 以特定的某一公交線路的數(shù)據(jù)分析為例,用Oi表示乘客在站點(diǎn)i的上車人數(shù),用Dj表示乘客在站點(diǎn)j的下車人數(shù)。線路OD可表示為從i站上車人數(shù)與從i站上車并在j下車概率之積,具體公式如下: Nij=Oi×Pij。 式中:Nij為從i站上車并在j站下車的人數(shù);Oi為第i站的上車人數(shù)。 上式計(jì)算得線路各站點(diǎn)OD量,累加后即能推導(dǎo)出各站點(diǎn)下車人數(shù)Dj,則: 起始站點(diǎn)沒(méi)有下車乘客,因此,D1=0; 第2個(gè)站點(diǎn)下車人數(shù)來(lái)自起始站點(diǎn)上車人數(shù),因此,D2=O1×P12; 第3個(gè)站點(diǎn)下車人數(shù)來(lái)自起始站點(diǎn)上車人數(shù)和第2個(gè)站點(diǎn)上車人數(shù),D3=O1×P13+O2×P23; 以此類推,第j個(gè)站點(diǎn)下車人數(shù)來(lái)自于前j-1個(gè)站點(diǎn)上車人數(shù),由數(shù)學(xué)歸納法可得任意一個(gè)站點(diǎn)下車人數(shù)為: Dj=∑j-1i=1(Oi×Pij)=∑j-1i=1Nij。 3 實(shí)例分析 以桂林市24路公交為例,該公交線路共有17個(gè)站點(diǎn), 2020年4月1日共有1 022條公交刷卡數(shù)據(jù),約20萬(wàn)條公交GPS定位數(shù)據(jù),兩者匹配得上下行方向各站點(diǎn)的上車人數(shù)如表3所示。 上下行平均站點(diǎn)客流為30左右,上行方向客流量較大的站點(diǎn)有航天工業(yè)學(xué)院南、航天工業(yè)學(xué)院北、電子科大東區(qū)、金雞路口;下行方向客流量較大的站點(diǎn)有十字街解放東路、解放橋、七星公園、東環(huán)車場(chǎng)、金雞路口。這些站點(diǎn)可為區(qū)間車以及大站快車等調(diào)度提供參考。 24路公交周邊土地利用規(guī)劃圖如圖3所示,不同用地性質(zhì)交通吸發(fā)率如表4所示。 上行方向各站點(diǎn)吸引強(qiáng)度根據(jù)下行方向的站點(diǎn)上車人數(shù)以及站點(diǎn)周邊土地利用規(guī)劃來(lái)確定,上行方向各站點(diǎn)總吸引強(qiáng)度如表5所示。 根據(jù)2020年4月1日跟車調(diào)查結(jié)果,共獲得485條上行方向數(shù)據(jù),初步估計(jì)乘車站數(shù)分布概率服從泊松分布,對(duì)其進(jìn)行擬合優(yōu)度卡方檢驗(yàn),得到觀測(cè)值與期望值如圖4所示。 乘客的乘車站數(shù)集中在一定的區(qū)域內(nèi),乘坐站點(diǎn)數(shù)較少或較多的乘客所占比例低。通過(guò)分布概率計(jì)算,得乘客乘車站數(shù)的泊松均值為7.438,取泊松分布參數(shù)λ=7,計(jì)算得到歸一化處理后的泊松分布矩陣。擬合優(yōu)度檢驗(yàn)計(jì)算得P值小于0.01,意味著接受原假設(shè)(原假設(shè):數(shù)據(jù)泊松分布)。 根據(jù)站點(diǎn)吸引強(qiáng)度以及乘車站距,得到下車概率矩陣,即可得到線路OD矩陣及各站點(diǎn)下車人數(shù),如表6所示。 由表6可得,前幾站的下車人數(shù)較少,后幾站的上車人數(shù)較少,這使得前后幾站的通過(guò)量較低,這主要是因?yàn)槠渖舷滦蟹较虺丝偷钠骄塑囌揪酁?站左右。解放橋、十字街解放東路等站點(diǎn)下車人數(shù)較多,因?yàn)槠錇檩^大規(guī)模的休閑活動(dòng)區(qū),可購(gòu)物、吃飯、觀景,附近住宅區(qū)較多,通勤需求較大,公交線路密集,公交需求大。對(duì)于站點(diǎn)上下車較多的站點(diǎn),可增加區(qū)間車,保持供給平衡。 為評(píng)價(jià)公交線路OD算法的合理及有效性,將公交線路OD調(diào)查值與計(jì)算值相對(duì)比,采用的評(píng)價(jià)指標(biāo)有最大可能相對(duì)誤差、相對(duì)誤差、相關(guān)系數(shù)和誤差指數(shù)[15]。通過(guò)多種誤差指標(biāo)對(duì)比判斷線路OD矩陣的準(zhǔn)確性。線路OD調(diào)查值與計(jì)算值誤差結(jié)果如表7所示。 從計(jì)算結(jié)果可看出,最大可能相對(duì)誤差、相對(duì)誤差均控制在10%以下,相較于未考慮土地利用性質(zhì)的竇慧麗[7]和劉穎杰[8]等OD推算所得的相對(duì)誤差,分別為7.61%和9.3%,有了一定程度的降低。相關(guān)系數(shù)為0.87,誤差指數(shù)為0.85,該值表示計(jì)算值與實(shí)測(cè)值間的擬合度,位于0到1之間,越大表示擬合效果越好。總體而言,計(jì)算所得線路OD計(jì)算值較好地與線路OD實(shí)際值相擬合,所提出的方法具有適用性。 4 結(jié)語(yǔ) 本文分析了桂林市公交刷卡數(shù)據(jù)結(jié)構(gòu)及異常數(shù)據(jù)特征,針對(duì)異常數(shù)據(jù)進(jìn)行數(shù)據(jù)清理,為特征研究提供了良好的環(huán)境。在現(xiàn)有數(shù)據(jù)條件下,提出乘客上下車站點(diǎn)判斷方法。匹配刷卡數(shù)據(jù)與定位數(shù)據(jù)得到各站點(diǎn)上車人數(shù),通過(guò)站點(diǎn)上車人數(shù)和土地利用規(guī)劃判斷站點(diǎn)吸引強(qiáng)度,并結(jié)合乘客乘車分布規(guī)律推算各站點(diǎn)下車人數(shù)和公交線路OD矩陣。將計(jì)算所得線路OD矩陣與調(diào)查實(shí)際值對(duì)比,驗(yàn)證了假設(shè)和算法的合理性。 公交刷卡數(shù)據(jù)研究是一個(gè)非常復(fù)雜的問(wèn)題,本文只是針對(duì)單條公交線路站點(diǎn)客流推算進(jìn)行了研究,未來(lái)可進(jìn)行多條線路融合,由線路OD分配至小區(qū)OD,為公交決策者提供更深層次的數(shù)據(jù)。參考文獻(xiàn): [1] 戴霄. 基于公交IC信息的公交數(shù)據(jù)分析方法研究[D].南京:東南大學(xué),2006. [2] 王周全. 基于IC卡數(shù)據(jù)與GPS數(shù)據(jù)的公交客流時(shí)空分布研究[D].成都:西南交通大學(xué),2016. [3] 涂一霜.基于IC和GPS數(shù)據(jù)的公交客流分析及預(yù)測(cè)算法研究[D].武漢:武漢理工大學(xué),2017. [4] 梅珊.基于數(shù)據(jù)挖掘的城市公共交通客流分析及應(yīng)用研究[D].武漢:武漢郵電科學(xué)研究院,2017. [5] 楊萬(wàn)波,王昊,葉曉飛,等.基于GPS和IC卡數(shù)據(jù)的公交出行OD推算方法[J].重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,34(3):117-121. [6] LI Y W, MICHAEL J C. A generalized and efficient algorithm for estimating transit route ODs from passenger counts[J]. Transportation Research Part B-Methodological, 2007,41(1):114-125. [7] 竇慧麗,劉好德,楊曉光.基于站點(diǎn)上下客人數(shù)的公交客流OD反推方法研究[J].交通與計(jì)算機(jī),2007,25(2):79-82. [8] 劉穎杰,靳文舟,康凱.基于IC信息和概率理論的公交OD反推方法[J].公路與汽運(yùn),2010,28(3):31-33. [9] NAVICK D S, FURTH P G. Distance-based model for estimating a bus route origin-destination matrix[J]. Transportation Research Record, 1994(1433): 16-23. [10]崔紫薇,王成,陳德蕾,等.基于歷史出行記錄擴(kuò)充的公交乘客下車站點(diǎn)推算方法[J].南京大學(xué)學(xué)報(bào)(自然科學(xué)),2020,56(2):227-235. [11]NASSIR N, HICKMAN M, MA Z L. Activity detection and transfer identification for public transit fare card data[J]. Transportation,2015,42(4):683-705. [12]劉德平. 北京公交車輛IC卡數(shù)據(jù)分析及應(yīng)用[D].北京:北京理工大學(xué),2016. [13]黃捷. 基于公交IC卡數(shù)據(jù)和GPS數(shù)據(jù)推斷出行活動(dòng)類型研究[D]. 成都:西南交通大學(xué),2016. [14]戴霄,陳學(xué)武.單條公交線路的IC卡數(shù)據(jù)分析處理方法[J].城市交通,2005(4):77-80. [15]章玉. 基于數(shù)據(jù)挖掘的動(dòng)態(tài)公交客流OD獲取方法研究[D].北京:北京交通大學(xué),2010. (責(zé)任編輯:曾 晶) Abstract: Bus passenger flow data is the basic data of bus organization and scheduling, line network optimization and station planning. With the development of information technology, comprehensive and accurate bus passenger flow data can be obtained by analyzing and processing bus card data. Taking the bus system data of Guilin as an example, the card data and bus positioning data structure is analyzed firstly. The IC card data is preprocessed to screen out the data needed for passenger flow calculation and the abnormal data is eliminated.Secondly, the card data and positioning data are combined to match the passenger boarding station.Then, the probability of alighting at each station is calculated according to the law of station attraction intensity and passenger travel station number, and the number of people alighting at each station and the line OD matrix are calculated. The attraction intensity is combined with the number of people boarding at the station and the use planning of land around the station. Finally, the error indexes of the calculated results and the actual survey values are analyzed, which shows that the research results are reasonable and accurate. Key words: bus passenger flow forecast; OD calculation; bus IC card; land use