摘要:在城市軌道交通運(yùn)營管理工作中,客流預(yù)測一直是其中非常重要的一部分,因?yàn)闇?zhǔn)確的客流預(yù)測可以讓交通運(yùn)營管理中心提前部署運(yùn)輸資源,能夠優(yōu)化列車的開行方案,并且還可以減小客流壓力,這些工作都可以節(jié)約運(yùn)輸資源,避免資源浪費(fèi)的同時(shí)還能讓交通運(yùn)輸行業(yè)產(chǎn)生更大的經(jīng)濟(jì)效益。信息技術(shù)的發(fā)展讓交通客流的預(yù)測更為準(zhǔn)確,特別是大數(shù)據(jù)時(shí)代的到來,更有利于預(yù)測人們個(gè)性化、多樣化的初心行為,交通運(yùn)營管理部門可以根據(jù)預(yù)測的結(jié)果開展工作,合理部署資源。
關(guān)鍵詞:大數(shù)據(jù) 軌道交通 客流預(yù)測 信息技術(shù)
中圖分類號:C37 ? 文獻(xiàn)標(biāo)識碼:A ? ? ? 文章編號:1672-3791(2021)10(c)-0000-00
Analysis ofUrban Rail Transit Passenger Flow Prediction
Method Based on Big Data
HE Xudong
(Guiyang Vocational and Technical College, Guiyang,Guizhou Province, 550081 China)
Abstract: Passenger flow prediction has always been a very important part in the operation and management of urban rail transit. Because accurate passenger flow prediction can enable the transportation operation management center to deploy transportation resources in advance, optimize the train operation scheme, and reduce the passenger flow pressure, all of which can save transportation resources. These works can save transportation resources, avoid resource waste, and make the transportation industry produce greater economic benefits. The development of information technology makes the prediction of traffic flow more accurate, especially the arrival of the big data era, which is more conducive to predicting people's personalized and diversified initial behavior. The traffic operation management department can work according to the prediction results and reasonably deploy resources.
Key Words: Big data;Rail transit;Passenger flow prediction;Information technology
準(zhǔn)確的客流預(yù)測可以幫助交通運(yùn)營管理部門進(jìn)行決策,由于人們的出行不規(guī)律,有時(shí)候軌道交通運(yùn)輸部門會承受非常大的出行壓力,有時(shí)卻又沒有人愿意出行,如果人們的出行行為不被預(yù)測到,那么對于軌道交通運(yùn)輸部門來說,出行旺季時(shí)他們可能會出現(xiàn)車次不足的情況或者候車大廳擁堵的情況,如果出行淡季時(shí)人們的出行行為不被預(yù)測,那么如果地鐵班次安排過多,就會造成較大的資源浪費(fèi)。大數(shù)據(jù)時(shí)代的到來讓人們的行為可以得到更準(zhǔn)確的預(yù)測,就有利于交通運(yùn)輸部門開展工作。
1大數(shù)據(jù)及大數(shù)據(jù)的技術(shù)特點(diǎn)
大數(shù)據(jù)是一種數(shù)據(jù)集合,因?yàn)榇髷?shù)據(jù)所蘊(yùn)含的信息量巨大,所以其定義為:無法使用常規(guī)軟件在有限時(shí)間內(nèi)進(jìn)行完全捕捉、管理以及處理的數(shù)據(jù)集合。即使時(shí)代發(fā)展到今天,其蘊(yùn)含的龐大信息量依舊無法完美地進(jìn)行分析,不過由于大數(shù)據(jù)中蘊(yùn)含的海量信息有著巨大的價(jià)值,即使我們現(xiàn)在依舊不能完美利用大數(shù)據(jù),但是它依舊可以帶給我們無法估量的價(jià)值[1]。
大數(shù)據(jù)有4個(gè)層面的技術(shù)特點(diǎn),具體敘述如下。
第一,數(shù)據(jù)體量十分巨大,一般的大型數(shù)據(jù)集合與之相比僅僅為它的千分之一,甚至有的大數(shù)據(jù)還是一般大型數(shù)據(jù)集合的一百萬倍。
第二,數(shù)據(jù)種類繁多。例如:地理位置信息、運(yùn)動軌跡、視頻、音頻等都可以在一個(gè)大數(shù)據(jù)集合里存在。
第三,處理速度快。雖然大數(shù)據(jù)集合中蘊(yùn)含的數(shù)據(jù)種類非常多,但是對這些數(shù)據(jù)進(jìn)行處理能夠快速獲得其中蘊(yùn)含的高價(jià)值。
第四,價(jià)值回報(bào)高,只要對大數(shù)據(jù)集合進(jìn)行合理地分析,那么勢必可以獲得極高的價(jià)值回報(bào)。
2城市軌道交通客流預(yù)測的重要性
軌道交通的目的是運(yùn)輸乘客,減少城市中的擁堵現(xiàn)象,所以它的建設(shè)要根據(jù)城市的大小,人口的規(guī)模進(jìn)行,有的城市到現(xiàn)在依舊沒有軌道交通,是因?yàn)檫@些城市人口規(guī)模小,沒有特別嚴(yán)重的擁堵現(xiàn)象,軌道交通的建設(shè)要消耗很多資源,在人口規(guī)模小的城市進(jìn)行軌道交通建設(shè)會造成很大的資源浪費(fèi),所以要怎樣規(guī)模的城市才可以建設(shè)軌道交通,這樣的決策需要數(shù)據(jù)支持。
另一方面,每日的出行乘客數(shù)量,以及個(gè)別站點(diǎn)會同一時(shí)間涌入大量乘客,需要多長的車廂,每日需要多少班次才能將這些客流量消化,這些問題都需要數(shù)據(jù)進(jìn)行支撐,而這些數(shù)據(jù)就是客流量,準(zhǔn)確的客流量預(yù)測就能夠保證在節(jié)約資源的前提下實(shí)現(xiàn)最優(yōu)化的乘客出行方式,減少擁堵,合理設(shè)計(jì)票價(jià),同時(shí),客流量大的站點(diǎn)還需要聘用更多的管理人員,這些都需要提前考慮,都可以通過對客流量的分析獲得[2]。
3城市軌道交通客流預(yù)測方法
3.1城市軌道交通客流數(shù)據(jù)分析
城市軌道交通的客流數(shù)據(jù)主要有兩種:一種是乘客進(jìn)出車站時(shí)刷乘車卡時(shí)被機(jī)器統(tǒng)計(jì)到的數(shù)據(jù),稱之為站內(nèi)數(shù)據(jù);另外一種是除了站內(nèi)數(shù)據(jù)之外,乘客在進(jìn)入站點(diǎn)時(shí),需要進(jìn)行安檢,安檢區(qū)也會得到一份客流數(shù)據(jù),除刷卡數(shù)據(jù)之外的安檢數(shù)據(jù)、檢票數(shù)據(jù)等都屬于站外數(shù)據(jù)。由于這些數(shù)據(jù)的來源多樣,有刷乘車卡時(shí)被采集的數(shù)據(jù),也有來自手機(jī)的數(shù)據(jù),還有個(gè)人的位置信息,同時(shí),軌道交通站點(diǎn)的客流密度大,其產(chǎn)生的客流數(shù)據(jù)體量龐大,并且還具有時(shí)效性,符合大數(shù)據(jù)的特點(diǎn),所以城市軌道交通客流數(shù)據(jù)屬于大數(shù)據(jù)的一種[3]。
3.2城市軌道交通客流預(yù)測方法分析
目前,國內(nèi)外對軌道交通客流預(yù)測的方法主要分為兩個(gè)類別。
3.2.1基于統(tǒng)計(jì)學(xué)理論的客流預(yù)測方法
這種方法是根據(jù)歷史數(shù)據(jù)的特點(diǎn)建立相應(yīng)的數(shù)學(xué)模型,這類數(shù)學(xué)模型可以外推未來數(shù)據(jù)的發(fā)展變化情況,假設(shè)客流數(shù)據(jù)的發(fā)展變化也跟隨這一趨勢,有了趨勢之后就可以通過數(shù)學(xué)模型進(jìn)行軌道交通客流數(shù)據(jù)的預(yù)測。
這類預(yù)測方法主要有3種,即非參數(shù)回歸、時(shí)間序列、貝葉斯網(wǎng)絡(luò)。
非參數(shù)回歸的預(yù)測方法需要大量的歷史數(shù)據(jù)作為支撐,這樣才能提高這種預(yù)測方法的精度,其優(yōu)點(diǎn)是能夠較為精確地預(yù)測到短時(shí)交通客流量。
時(shí)間序列是運(yùn)用比較廣泛的預(yù)測方法。這種方法也有著比較好的預(yù)測精度,在進(jìn)行預(yù)測時(shí),需要通過對歷史數(shù)據(jù)的分析,然后推測事物之后的發(fā)展,所以這種預(yù)測方法容易受到突變因素的影響,例如:天氣突變等情況,在突變因素的影響下,其預(yù)測精度就會下降。
在處理具有不確定性的信息或者不完整的信息時(shí),貝葉斯網(wǎng)絡(luò)是非常好的一種工具。貝葉斯網(wǎng)絡(luò)可以將數(shù)據(jù)庫中各數(shù)據(jù)間的概率關(guān)系反映出來,即使數(shù)據(jù)庫中有某些變量缺少,也可以通過貝葉斯網(wǎng)絡(luò)構(gòu)建這樣的精確模型,但是貝葉斯網(wǎng)絡(luò)模型的計(jì)算方式比較復(fù)雜,這是這種模型的缺點(diǎn)。
3.2.2基于神經(jīng)網(wǎng)絡(luò)的客流預(yù)測方法
這不僅是一種新型預(yù)測算法,這種模型可以根據(jù)外部信息來進(jìn)行自身的改變,還是一種具有自適應(yīng)能力的算法模型,它通過對生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)以及功能進(jìn)行模擬,來對信息進(jìn)行分析。這種預(yù)測算法的穩(wěn)定性非常高,擁有著很強(qiáng)的容錯(cuò)能力以及抗干擾能力,對于客流數(shù)據(jù)中那些不確定性的預(yù)測有著更好的效果。它的缺點(diǎn)也很明顯,就是學(xué)習(xí)速度低,容易陷入局部最小,同時(shí)收斂速度也不快。
3.2.3基于多模型組合的客流預(yù)測方法
由于軌道交通客流量變化呈現(xiàn)一定的時(shí)序性特點(diǎn),即客流量的變化有周期性,一般以周、月或者年為變化周期,不同時(shí)序內(nèi)客流量有著明顯的變化。除了時(shí)序性之外,客流量還受到天氣的影響,天氣會影響到乘客的出行,自然軌道交通的客流量會隨著天氣的變化而變化,此外,還有其他的一些因素也會影響到客流量,例如:突發(fā)事件,或者活動等,所以客流量的變化雖然呈現(xiàn)一定的周期性,但是在不同周期內(nèi)也會有這較大差別,僅僅使用一種預(yù)測模型很難準(zhǔn)確預(yù)測復(fù)雜多變的客流量,有學(xué)者就提出多模型組合的預(yù)測方法,即結(jié)合各種模型的優(yōu)點(diǎn),建立組合模型,這樣的模型有著更強(qiáng)的穩(wěn)定性以及精確性,由于彌補(bǔ)了單一模型的不足,這樣的模型往往具有更高的價(jià)值[4]。
4大數(shù)據(jù)背景下城市軌道交通客流預(yù)測方法分析
傳統(tǒng)的軌道交通客流預(yù)測模型雖然已經(jīng)有著較高的精確性,但是在大數(shù)據(jù)時(shí)代的背景下看來,這些預(yù)測方法依舊存在著各種各樣的問題,對于大數(shù)據(jù)的數(shù)據(jù)利用也不夠充分。
4.1缺少動態(tài)預(yù)測
由于軌道交通的客流量會受到外部環(huán)境的影響,所以預(yù)測者在進(jìn)行客流量預(yù)測工作時(shí)就必須將外部環(huán)境的因素考慮進(jìn)去,這樣才能綜合利用大數(shù)據(jù)提供給我們的海量信息,將這些信息的價(jià)值充分挖掘出來,但是無論是傳統(tǒng)的預(yù)測方法還是相關(guān)的預(yù)測研究中,都幾乎沒有考慮到天氣或者大型活動等外部環(huán)境對軌道交通客流量造成的影響,這既是傳統(tǒng)預(yù)測方法的缺陷,同時(shí)也是以往研究的缺陷,在大數(shù)據(jù)時(shí)代的背景下,以往的預(yù)測方法已經(jīng)不足以充分利用大數(shù)據(jù)中蘊(yùn)含的價(jià)值[5]。
4.2樣本小且類型單一
傳統(tǒng)的客流量預(yù)測時(shí),所采用的數(shù)據(jù)多為檢票數(shù)據(jù)等小樣本數(shù)據(jù),沒有借助大數(shù)據(jù)技術(shù)。在信息技術(shù)發(fā)展下的今天,大數(shù)據(jù)的采集工作已經(jīng)能夠完成,即使軌道交通站點(diǎn)的數(shù)據(jù)信息復(fù)雜,現(xiàn)如今的技術(shù)也能夠支持我們進(jìn)行樣本數(shù)據(jù)的采集工作,而龐大的信息處理起來更為麻煩,傳統(tǒng)的預(yù)測方式已經(jīng)不足以預(yù)測如此龐大且復(fù)雜的數(shù)據(jù),雖然現(xiàn)在的預(yù)測模型可以在某些單一方向進(jìn)行比較精準(zhǔn)的預(yù)測,但是依舊沒有一個(gè)可以將各種不同類別數(shù)據(jù)融合在一起的模型。
4.3現(xiàn)有模型無法分析到數(shù)據(jù)的本質(zhì)
在現(xiàn)有的數(shù)據(jù)模型中,所有的分析角度都是建立在統(tǒng)計(jì)分析模型的基礎(chǔ)上或者機(jī)器學(xué)習(xí)模型的基礎(chǔ)上,分析的目的也僅僅只是客流的變化規(guī)律,沒有一個(gè)模型考慮出行的需求,乘客出行的需求才是影響其選擇交通工具的重要因素,以往的研究中都忽略了這個(gè)重要的因素,這就決定了這些研究無法從數(shù)據(jù)的本質(zhì)上分析到其中蘊(yùn)含的規(guī)律,或許也有一定的原因在于數(shù)據(jù)采集方面,現(xiàn)在依托大數(shù)據(jù)技術(shù),已經(jīng)能夠收集到盡可能多種類的數(shù)據(jù),進(jìn)行預(yù)測分析時(shí),更需要綜合考量各類數(shù)據(jù)所代表的意義[6]。
4.4客流量靈敏度難以定量
在現(xiàn)有的研究中,研究者在研究某一因素對客流量的影響時(shí),往往從定性的角度進(jìn)行分析,而這類因素在出現(xiàn)變化時(shí)對客流量影響產(chǎn)生的邊際效應(yīng)無法反映出來,即客流量的靈敏度難以定量,大數(shù)據(jù)時(shí)代,要對多種類型的數(shù)據(jù)進(jìn)行綜合分析,并且流量數(shù)據(jù)會隨著很多綜合因素變化,如果在進(jìn)行研究時(shí),無法預(yù)測到數(shù)據(jù)的變化而帶來的流量變化,也會大大地削弱大數(shù)據(jù)所帶來的價(jià)值。
5結(jié)語
對城市軌道交通的客流量進(jìn)行預(yù)測的研究十分重要,這類研究可以幫助相關(guān)部門的領(lǐng)導(dǎo)者下達(dá)決策,不過,由于以往收集信息的局限性,所建立的研究模型還有著各種方面的缺陷,在外部環(huán)境產(chǎn)生變化時(shí),就很難進(jìn)行精準(zhǔn)的預(yù)測,大數(shù)據(jù)時(shí)代的到來意味著我們已經(jīng)有能力收集到足夠的信息,對這些信息進(jìn)行分析,能夠幫助我們準(zhǔn)確地進(jìn)行城市軌道交通的客流量預(yù)測,并且,由于大數(shù)據(jù)所涵蓋的信息面非常廣,涉及到軌道交通出行的方方面面,這樣的數(shù)據(jù)更能夠說明問題,以往的研究方法需要做出改進(jìn),才能滿足大數(shù)據(jù)時(shí)代的研究需求。
參考文獻(xiàn)
[1] 王興川,姚恩建,劉莎莎.基于AFC數(shù)據(jù)的大型活動期間城市軌道交通客流預(yù)測[J].北京交通大學(xué)學(xué)報(bào),2018,42(1):87-93.
[2] 賈拴航,盧劍鴻,劉明明.基于城市軌道交通換乘客流管控的量化方法研究[J].都市快軌交通,2021,34(5):74-78.
[3] 梁強(qiáng)升,許心越,劉利強(qiáng).面向數(shù)據(jù)驅(qū)動的城市軌道交通短時(shí)客流預(yù)測模型[J].中國鐵道科學(xué),2020,41(4):153-162.
[4] 傅晨琳,黃敏,沙志仁.基于EEMD-BP方法的城市軌道交通進(jìn)站客流短期預(yù)測[J].鐵道運(yùn)輸與經(jīng)濟(jì),2020,42(3):105-111.
[5] 袁堅(jiān),王鵬,王鉞,等.基于時(shí)空特征的城市軌道交通客流量預(yù)測方法[J].北京交通大學(xué)學(xué)報(bào),2017,41(6):42-48.
[6] 白麗.城市軌道交通常態(tài)與非常態(tài)短期客流預(yù)測方法研究[J].交通運(yùn)輸系統(tǒng)工程與信息,2017,17(1):127-135.
作者簡介:何旭東(1983—),男,碩士,副教授,研究方向?yàn)殍F道機(jī)車、城市軌道交通車輛技術(shù)。