国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

鐵路客運(yùn)需求分析與短期客流預(yù)測

2022-04-06 14:00:26肖堯劉斌楊浩
科學(xué)技術(shù)與工程 2022年9期
關(guān)鍵詞:客流向量鐵路

肖堯, 劉斌*, 楊浩

(1.蘭州交通大學(xué)交通運(yùn)輸學(xué)院,蘭州 730070;2.中鐵第一勘察設(shè)計(jì)院集團(tuán)有限公司, 西安 710043)

隨著中國高速鐵路網(wǎng)絡(luò)的逐漸完善以及運(yùn)輸市場競爭的日益激烈,掌握客運(yùn)需求規(guī)律、科學(xué)優(yōu)化資源配置對于鐵路企業(yè)進(jìn)行精細(xì)化的運(yùn)營管理極為重要。列車開行方案優(yōu)化、客車票額合理分配、客票收益管理研究等都需要鐵路企業(yè)對自身客流的歷史需求規(guī)律進(jìn)行合理剖析和對未來需求做到準(zhǔn)確把握。為此,鐵路企業(yè)亟須科學(xué)準(zhǔn)確的客運(yùn)需求分析與短期客流量預(yù)測的方法,以充分利用客票系統(tǒng)積累的海量數(shù)據(jù),對客運(yùn)市場變化及客流波動快速做出反應(yīng)。

當(dāng)下國內(nèi)外對于鐵路客運(yùn)需求分析的研究主要圍繞宏觀上分析區(qū)域內(nèi)影響客運(yùn)需求的主要因素展開[1],這一類研究可以為鐵路企業(yè)掌握整個(gè)客運(yùn)市場的體量作為參考,但對既有鐵路精確到日常的生產(chǎn)而言很難發(fā)揮指導(dǎo)作用。由于現(xiàn)今城際列車每日的高頻開行以及鐵路票價(jià)的常年穩(wěn)定,旅客對于鐵路客運(yùn)的需求也處于相對穩(wěn)定的狀態(tài)且具有一定規(guī)律,因此對于各個(gè)區(qū)間客運(yùn)需求的分析完全可以通過挖掘歷史數(shù)據(jù)得知。為此,尋找一個(gè)可以有效處理客流歷史數(shù)據(jù),從而在復(fù)雜龐大的數(shù)據(jù)中分析各時(shí)間區(qū)段下客運(yùn)需求規(guī)律的方法是一個(gè)策要的研究目標(biāo)。

鐵路短期客流預(yù)測是一種典型的時(shí)間序列預(yù)測。傳統(tǒng)時(shí)序預(yù)測方法主要是以灰色預(yù)測模型,自回歸滑動平均模型(autoregressive moving average model,ARMA)[2],差分整合移動平均自回歸模型(autoregressive integrated moving average model,ARIMA)[3]及這些模型的變體[4]等為代表的以統(tǒng)計(jì)學(xué)理論為基礎(chǔ)的參數(shù)模型,這類傳統(tǒng)方法能夠在一定范圍內(nèi)刻畫時(shí)序數(shù)據(jù)的周期性與季節(jié)性的變化,在處理平穩(wěn)的、非白噪聲的時(shí)間序列數(shù)據(jù)上表現(xiàn)良好,然而在處理鐵路客流量這種隨日期具有很大波動的數(shù)據(jù)時(shí)往往預(yù)測效果欠佳。隨著機(jī)器學(xué)習(xí)的快速發(fā)展,非參數(shù)類方法可以較為出色地解決鐵路客流數(shù)據(jù)這種非穩(wěn)態(tài)時(shí)序數(shù)據(jù)分析的難題。這些方法主要包括傳統(tǒng)機(jī)器學(xué)習(xí),如支持向量機(jī)[5-6]、貝葉斯網(wǎng)絡(luò)[7]和各種基于引導(dǎo)聚集(bootstrap aggregating,bagging)算法[8]、boosting[9]的集成算法及在這些模型基礎(chǔ)上的優(yōu)化改進(jìn)等,還包括深度學(xué)習(xí),如傳統(tǒng)的反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)[10-12]、長短期記憶網(wǎng)絡(luò)[13-15]、門控循環(huán)單元[16]、遷移學(xué)習(xí)[17]等。在處理鐵路短期客流預(yù)測的問題時(shí),這類算法需要將時(shí)間序列數(shù)據(jù)處理成監(jiān)督學(xué)習(xí)數(shù)據(jù),這樣操作通常會造成模型只能獲取相對固定的、較短的上下文依賴,因此模型算法能否充分?jǐn)M合鐵路客流數(shù)據(jù)的特點(diǎn)就顯得尤為重要。

基于此,現(xiàn)將從數(shù)據(jù)驅(qū)動的角度出發(fā),針對切合鐵路客流特點(diǎn)的客運(yùn)需求量分析模型和短期預(yù)測模型展開研究,旨在為鐵路企業(yè)進(jìn)行精細(xì)化的運(yùn)營管理提供決策依據(jù)。

1 基于Prophet模型的鐵路客運(yùn)量需求分析

1.1 Prophet模型

隨著中國高速鐵路的成網(wǎng)運(yùn)營及人們出行需求的日益穩(wěn)定,鐵路客流需求在時(shí)間上的分布特征逐漸呈現(xiàn)出規(guī)律。鐵路客流依據(jù)不同的時(shí)間尺度可分為年、月、周客流。其中,年客流隨著鐵路的發(fā)展逐年呈現(xiàn)一定趨勢,月客流隨季節(jié)淡旺規(guī)律明顯,周客流有明顯固定的高低峰日。同時(shí),不同類型的節(jié)假日還會引起客流呈現(xiàn)出不同程度的驟增驟減。

Prophet是由Taylor等[18]提出的一種基于加法模型的時(shí)間序列分解模型,模型整體將時(shí)間序列拆解成趨勢項(xiàng)、季節(jié)項(xiàng)、節(jié)假日項(xiàng)以及誤差項(xiàng)4個(gè)部分進(jìn)行擬合,表達(dá)式為

y(t)=g(t)+s(t)+h(t)+εt

(1)

式(1)中:趨勢項(xiàng)g(t)、季節(jié)項(xiàng)s(t)分別對時(shí)間序列數(shù)據(jù)的非周期性變化部分與周期性變化部分進(jìn)行了建模;節(jié)假日項(xiàng)h(t)對數(shù)據(jù)在節(jié)假日期間的異常突變進(jìn)行了量化;誤差項(xiàng)εt表示任何不適應(yīng)模型的特有變化。

Prophet模型非常適用于鐵路客流這種具有強(qiáng)烈季節(jié)性影響與節(jié)假日影響的時(shí)間序列,它的趨勢項(xiàng)、季節(jié)項(xiàng)與節(jié)假日項(xiàng)可以很好地在大數(shù)據(jù)的環(huán)境下對鐵路的年客流、月周客流與節(jié)假日客流特征進(jìn)行建模量化,有助于鐵路企業(yè)利用海量歷史售票數(shù)據(jù)提取分析各區(qū)間的旅客在不同時(shí)間內(nèi)的出行需求以及進(jìn)行短期客流預(yù)測,從而進(jìn)一步提升鐵路旅客運(yùn)輸組織的效率。

1.2 基于Prophet模型的鐵路客流時(shí)間分布特征分析

綜上所述,鐵路客流的時(shí)間分布類型[19]與Prophet模型分解項(xiàng)之間的對應(yīng)關(guān)系如表1所示。

表1 客流時(shí)間分布類型與Prophet模型對應(yīng)關(guān)系

Prophet在趨勢項(xiàng)上提供了兩種模型,分別是基于邏輯回歸的飽和增長模型和線性分段模型,即

(2)

g(t)=[k+a(t)Tδ]t+m+a(t)Tγ

(3)

(4)

(5)

式中:C(t)為t日某區(qū)間的最大運(yùn)能;k為曲線增長率;m為曲線偏移量;Sj為增長率發(fā)生變化時(shí)對應(yīng)的點(diǎn);a(t)為由aj(t)組成的列向量;aj(t)為t日時(shí)某個(gè)變點(diǎn)Sj是否已經(jīng)發(fā)生;δ為增長率變化量組成的列向量;γ為修正因子組成的列向量,用作變點(diǎn)處的平滑處理以保證曲線的連續(xù)可微性。

Prophet在季節(jié)項(xiàng)上使用傅里葉級數(shù)模擬時(shí)間序列的周期性,表達(dá)式為

(6)

式(6)中:N為總輸入天數(shù);P為周期天數(shù);an、bn為平滑參數(shù),假設(shè)an、bn的先驗(yàn)分布服從正態(tài)分布。

Prophet在節(jié)假日項(xiàng)的計(jì)算上使用一個(gè)用戶預(yù)設(shè)的節(jié)假日列表,并假設(shè)每種類型節(jié)假日的影響在該時(shí)間區(qū)段內(nèi)是一個(gè)定值。

h(t)=Z(t)κ

(7)

式(7)中:Z(t)為t日在其所對應(yīng)類型的節(jié)假日集合中所處的位置矢量;κ為此類型假期集合中每日對應(yīng)的影響參數(shù)所組成的列向量,假設(shè)κ的先驗(yàn)分布服從正態(tài)分布。

2 基于Seq2Seq-Prophet非線性組合模型的短期客流預(yù)測

2.1 Seq2Seq-Attention網(wǎng)絡(luò)

鐵路日客流以星期為單位的周期波動是其最顯著的特征之一,以星期的倍數(shù)作為模型的輸入輸出長度并使模型進(jìn)一步捕捉到輸入輸出數(shù)據(jù)間的軟連接,可以使模型更易抓住數(shù)據(jù)周期波動這一信息。傳統(tǒng)機(jī)器學(xué)習(xí)和長短期記憶網(wǎng)絡(luò)在進(jìn)行客流預(yù)測時(shí)都存在只能輸出固定長度序列數(shù)據(jù)的限制,故使用可自定義輸入輸出長度的Seq2Seq網(wǎng)絡(luò)[20]進(jìn)行預(yù)測。

圖1為Seq2Seq網(wǎng)絡(luò)的基本網(wǎng)絡(luò)結(jié)構(gòu),這種結(jié)構(gòu)又稱Encoder-Decoder模型,Encoder將輸入序列編碼成一個(gè)固定長度的語義向量C,Decoder將向量解碼成指定長度的序列進(jìn)行輸出,從而達(dá)到靈活輸出序列長度的目的。使用善于處理時(shí)間序列數(shù)據(jù)的LSTM網(wǎng)絡(luò)構(gòu)建編-解碼器。

xt、yt分別為模型的輸入與輸出;A為神經(jīng)網(wǎng)絡(luò)的一個(gè)單元;C為語義向量

LSTM網(wǎng)絡(luò)是RNN網(wǎng)絡(luò)的變體,其改善了RNN中存在的無法解決數(shù)據(jù)長期依賴的問題。圖2為LSTM單元的結(jié)構(gòu),LSTM的單元內(nèi)存在4個(gè)不同的全連接層,全連接層的每一個(gè)結(jié)點(diǎn)都與上一層的所有結(jié)點(diǎn)相連,其主要用途是把模型提取到的特征綜合起來。主層是輸出為gt的層,它的基本作用是分析當(dāng)前輸入xt和前一個(gè)隱狀態(tài)ht-1。其他3個(gè)層是門限控制器,分別是:由ft控制的忘記門限,控制著哪些記憶狀態(tài)應(yīng)該被丟棄;由it控制的輸入門限,控制著gt的哪些部分會被加入記憶狀態(tài);由ot控制的輸出門限,控制著哪些記憶狀態(tài)應(yīng)該在這個(gè)時(shí)間迭代被讀取和輸出。隨著記憶狀態(tài)ct-1從左到右貫穿網(wǎng)絡(luò),它首先經(jīng)過一個(gè)忘記門限丟棄一些記憶,然后通過輸入門限選擇添加一些新的記憶。所以,在每個(gè)時(shí)間迭代中,一些記憶被丟棄,同時(shí)一些記憶被增加。此外,經(jīng)過額外操作,記憶狀態(tài)被復(fù)制并傳入tanh函數(shù),然后其結(jié)果被輸出門限過濾,從而產(chǎn)生了新的隱狀態(tài)ht。LSTM就是在這樣的循環(huán)之下,學(xué)習(xí)哪些記憶需要儲存,哪些記憶需要丟棄,以及從哪些記憶中去讀取,從而結(jié)合輸入變量去預(yù)測輸出變量的。其中it、ft、ot、gt、ht、ct的計(jì)算表達(dá)式為

xt、ct、ht分別為模型的輸入向量、記憶狀態(tài)和隱層狀態(tài);gt為模型主層結(jié)構(gòu);ft、it、ot分別為模型的忘記、輸入和輸出門限;σ、tanh為sigmoid與tanh函數(shù)

(8)

(9)

(10)

(11)

ct=ftct-1+itgt

(12)

ht=ottanh(ct)

(13)

式中:σ為sigmoid函數(shù);Wxi、Wxf、Wxo、Wxg為每一層連接到輸入向量xt的權(quán)重矩陣;Whi、Whf、Who、Whg為每一層連接到前一個(gè)隱狀態(tài)ht-1的權(quán)重矩陣;bi、bf、bo、bg為每一層的偏置項(xiàng)。

然而,簡單的Seq2Seq網(wǎng)絡(luò)在進(jìn)行預(yù)測時(shí)也存在一些問題。在編碼輸入序列時(shí),模型需要壓縮所有的信息在一個(gè)固定長度的向量中,這就會使該模型在面對長序列時(shí)會產(chǎn)生信息超載的問題,隨著序列的增長,序列前面的信息就可能會發(fā)生丟失;同時(shí),解碼器每次的輸出僅與上一個(gè)輸出元素以及當(dāng)前的隱狀態(tài)有關(guān),輸入序列元素與輸出序列元素之間沒有關(guān)聯(lián)。對于鐵路客流來說,學(xué)習(xí)輸入序列和輸出序列之間的軟連接有助于提高模型對于客流周期性的運(yùn)用,從而進(jìn)一步提高預(yù)測精度。為此在Seq2Seq的基礎(chǔ)上引入注意力(Attention)機(jī)制[21],Attention可以利用有限的注意力資源從大量信息中快速關(guān)注重點(diǎn)目標(biāo)區(qū)域,這種機(jī)制有助于模型關(guān)注序列中隱藏的關(guān)鍵聯(lián)系。構(gòu)建Attention的流程如下。

步驟1選擇使用雙向長短時(shí)記憶網(wǎng)絡(luò)(bi-directional long short-term memory,Bi-LSTM)構(gòu)建編碼器部分,使其每個(gè)單元的隱狀態(tài)包括正向與逆向輸入的兩部分,這可以使模型對輸入序列有更好的表達(dá),不易丟失數(shù)據(jù)。

(14)

步驟2將編碼器的所有隱狀態(tài)加權(quán)編碼進(jìn)向量,生成動態(tài)向量Ci。

(15)

(16)

eij=D(si,hj)

(17)

式中:aij為權(quán)重參數(shù);hi為編碼器第i個(gè)單元的隱狀態(tài)向量;si為解碼器第i個(gè)單元的隱狀態(tài)向量;n為編解碼器隱狀態(tài)的數(shù)量;D()用于計(jì)算兩向量的相關(guān)性。

步驟3使解碼器每一步的輸出依賴于上一個(gè)單元的隱狀態(tài)si以及該步對應(yīng)權(quán)重下的動態(tài)向量Ci。

si+1=LSTM(si,Ci)

(18)

綜上所述,選擇使用一個(gè)Bi-LSTM構(gòu)建Encoder模型,使用LSTM構(gòu)建Decoder模型,引入Attention機(jī)制進(jìn)行動態(tài)向量的計(jì)算并參與最終輸出,整體示意圖如圖3所示。

hi為編碼器第i個(gè)單元的隱狀態(tài)向量;si為解碼器第i個(gè)單元的隱狀態(tài)向量;Ci為動態(tài)向量;每個(gè)LSTM表示LSTM網(wǎng)絡(luò)的一個(gè)單元

2.2 基于BP神經(jīng)網(wǎng)絡(luò)的Seq2Seq-Prophet組合預(yù)測模型

不同的時(shí)序預(yù)測模型對于數(shù)據(jù)信息的利用角度不同,將不同的模型合理組合起來有助于不同模型間的優(yōu)勢互補(bǔ),從而避免單一模型的固有缺點(diǎn),充分挖掘數(shù)據(jù)各方面信息,以達(dá)到進(jìn)一步提升預(yù)測精度的目的。從模型特點(diǎn)上來看,Prophet模型的預(yù)測基于全局?jǐn)?shù)據(jù),在數(shù)據(jù)特征穩(wěn)定時(shí)即便數(shù)據(jù)規(guī)模不大,預(yù)測效果也會很穩(wěn)定,但鐵路客流往往會由于政策、自然環(huán)境等因素發(fā)生脫離其原有特征的突變,Prophet模型的機(jī)制使其無法適應(yīng)這種情況,甚至?xí)斐蓪φw趨勢與周期的誤判;Seq2Seq-Attention模型由于其龐大的參數(shù)數(shù)量使得模型極其靈活,可以很好適應(yīng)數(shù)據(jù)的變化,但當(dāng)數(shù)據(jù)規(guī)模不夠時(shí),模型將無法得到充分訓(xùn)練。組合這兩種本就切合鐵路特點(diǎn)的模型,可以進(jìn)一步互補(bǔ)雙方優(yōu)勢,提升預(yù)測的精度。

傳統(tǒng)的賦權(quán)組合模型通常是根據(jù)單模型的預(yù)測精度按比例給單模型一個(gè)固定的權(quán)重進(jìn)行加權(quán)預(yù)測。然而,隨著數(shù)據(jù)集的規(guī)模、復(fù)雜度、噪聲的不同,固定的賦權(quán)方式無法使組合模型很好地適應(yīng)不同特征的數(shù)據(jù),同時(shí)線性相加的賦權(quán)模型往往對于復(fù)雜環(huán)境的動態(tài)變化反應(yīng)不夠及時(shí)。因此選擇使用BP神經(jīng)網(wǎng)絡(luò)將Seq2Seq網(wǎng)絡(luò)與Prophet模型非線性組合起來,根據(jù)兩個(gè)模型在當(dāng)前數(shù)據(jù)上的擬合情況訓(xùn)練權(quán)值參數(shù),使得模型盡可能地在不同的數(shù)據(jù)上發(fā)揮各自優(yōu)勢。使用該組合模型進(jìn)行客流預(yù)測的過程如下。

步驟1將客票歷史數(shù)據(jù)進(jìn)行預(yù)處理,提取出需要進(jìn)行預(yù)測的時(shí)間序列并進(jìn)行數(shù)據(jù)清洗。

步驟2將數(shù)據(jù)分為訓(xùn)練集和驗(yàn)證集,使用處理好的訓(xùn)練集分別訓(xùn)練Prophet模型和Seq2Seq-Attention網(wǎng)絡(luò),并通過驗(yàn)證集在優(yōu)化模型超參數(shù)同時(shí)防止過擬合。

步驟3將整個(gè)數(shù)據(jù)集輸入訓(xùn)練好的兩模型,輸出模型在數(shù)據(jù)集上的擬合結(jié)果以及模型在目標(biāo)天數(shù)內(nèi)的預(yù)測值。將Prophet模型的擬合序列P和原始客流的時(shí)間序列Y重新組織成與Seq2Seq擬合矩陣S相同維度的n列數(shù)據(jù)矩陣,合并構(gòu)建新的監(jiān)督學(xué)習(xí)矩陣[P1,P2,…,Pn,S1,S2,…,Sn,Y1,Y2,…,Yn],并劃分訓(xùn)練集和驗(yàn)證集。

步驟4使用訓(xùn)練集訓(xùn)練一個(gè)深度神經(jīng)網(wǎng)絡(luò),通過模型在訓(xùn)練集和驗(yàn)證集的擬合情況確定網(wǎng)絡(luò)層數(shù)并優(yōu)化模型超參數(shù),訓(xùn)練完成后將兩個(gè)單模型的預(yù)測結(jié)果按同樣方法組合起來輸入這個(gè)訓(xùn)練好的模型預(yù)測未來多日客流量。

3 算例分析

3.1 數(shù)據(jù)分析及預(yù)處理

數(shù)據(jù)包含某條客運(yùn)專線上的某個(gè)區(qū)段(ZD111站—ZD190站)2015年1月1日—2016年3月20日,共計(jì)445 d內(nèi)每天在此區(qū)段下行方向上運(yùn)行過的所有列車的旅客列車梯形密度表。每張表中的數(shù)據(jù)包含某趟單列車當(dāng)日的停站方案、客座率以及各起訖點(diǎn)(origin and destination,OD)區(qū)間的旅客數(shù)量。以G01次列車在2015年1月1日的列車梯形密度表為例,G01次列車于8:05由始發(fā)站出發(fā),于19:05到達(dá)終到站,途經(jīng)19個(gè)車站,共計(jì)包含210個(gè)OD區(qū)間,其示意圖如表2所示。

表2 旅客列車梯形密度表

提取每日由ZD111站出發(fā)至ZD190站的旅客人數(shù)并進(jìn)行簡單數(shù)據(jù)清洗。根據(jù)統(tǒng)計(jì)得出,該OD區(qū)間的乘車人數(shù)于2016年2月26日達(dá)到峰值,但行駛于兩站的直達(dá)列車中仍存在客座率低于60%的列車,故認(rèn)為該區(qū)段的運(yùn)力完全滿足該區(qū)段旅客的日出行需求,區(qū)段里每日的乘車人數(shù)可以大致表示當(dāng)日人們對該區(qū)段鐵路運(yùn)輸?shù)娜啃枨蟆⒆詈?4 d的客流作為未知量來對客流預(yù)測結(jié)果進(jìn)行評價(jià)。

3.2 鐵路客運(yùn)需求分析

使用Facebook的fbprophet框架進(jìn)行模型構(gòu)建,首先將數(shù)據(jù)包含時(shí)間段內(nèi)的所有節(jié)假日進(jìn)行整合分類并設(shè)置節(jié)假日時(shí)間窗,如表3所示。

表3 數(shù)據(jù)包含節(jié)假日時(shí)間窗

將節(jié)假日大致歸為春節(jié)、勞動節(jié)、國慶節(jié)以及普通節(jié)日四類,由于兩年春節(jié)客流變化差異較大,且沒有第三年做對照組,因此將兩年的春節(jié)分為兩類進(jìn)行處理。使用網(wǎng)絡(luò)搜索進(jìn)行超參數(shù)優(yōu)化,最終選擇線性模型進(jìn)行趨勢擬合,將seasonality_mode設(shè)置additive,即將周期性變化表現(xiàn)成加法模型,這樣有助于鐵路企業(yè)根據(jù)直觀的客流數(shù)據(jù)變化優(yōu)化旅客運(yùn)輸組織。

圖4為模型擬合客流與真實(shí)客流的對比圖,其中藍(lán)線為真實(shí)客流,綠線為模型擬合的客流。模型在整個(gè)數(shù)據(jù)上的擬合平均誤差為271.69,平均相對誤差為6.68%,擬合精度良好。紅線為模型訓(xùn)練后得到的趨勢項(xiàng),可見該OD間的年客流量隨時(shí)間呈微弱下降的趨勢。

圖4 Prophet模型擬合曲線與趨勢項(xiàng)

圖5、圖6分別為該OD間的月周客流。在一年當(dāng)中,12月底至次年2月初屬于運(yùn)輸?shù)?,此時(shí)該OD間的日客流量要在整體客流趨勢的基礎(chǔ)上少1 000多人次;客流量從7月中旬至9月初達(dá)到全年的最高峰,每日客流要在整體客流趨勢上多1 100~1 200人次。在一周當(dāng)中,該OD客流在周五達(dá)到周中峰值,在周一達(dá)到周中客流的最低值。

圖5 Prophet模型擬合月客流量

圖6 Prophet模型擬合周客流量

圖7為節(jié)假日效應(yīng)下的客流突變,可以看出,該OD間的客流在除春節(jié)以外的各種節(jié)假日下都發(fā)生了不同程度的驟增,其中在國慶期間驟增最為明顯,但在兩年的春節(jié)前后客流都發(fā)生驟減。

圖7 Prophet模型擬合節(jié)假日項(xiàng)

由以上結(jié)果可以說明,該區(qū)段的客流主要以商務(wù)客流和旅游客流為主,因此客流需求在普通節(jié)假日期間呈現(xiàn)上升趨勢,在春運(yùn)期間呈現(xiàn)下降趨勢。由此鐵路企業(yè)可以根據(jù)不同季度的客流情況合理削減部分列車開行方案,甚至可以根據(jù)周客流的波動情況開展“一日一圖”的動態(tài)開行方案。鐵路企業(yè)還可以根據(jù)分析出的客流組成情況調(diào)整管內(nèi)列車發(fā)車時(shí)間、優(yōu)化列車不同等級席位的占比,從而最大化地合理使用運(yùn)能,同時(shí)增加鐵路對旅客的吸引力,最終達(dá)到提升鐵路旅客運(yùn)輸收益的目的。

3.3 短期客流預(yù)測

選擇使用前431 d的客流數(shù)據(jù)訓(xùn)練模型,預(yù)測后14 d的客流量并與真實(shí)數(shù)據(jù)做對比評價(jià)模型性能。使用均方根誤差(root mean squared error,RMSE)以及平均絕對百分比誤差(mean absolute percentage error,MAPE)作為評價(jià)模型表現(xiàn)的指標(biāo)。

(19)

(20)

首先,使用訓(xùn)練好的Prophet模型直接計(jì)算后14 d的客流量,同時(shí)將模型在整個(gè)數(shù)據(jù)集上的擬合結(jié)果重新組織成供神經(jīng)網(wǎng)絡(luò)監(jiān)督學(xué)習(xí)的數(shù)據(jù)矩陣并進(jìn)行輸出。

其次,使用Keras構(gòu)建Seq2Seq-Attention的模型。先將時(shí)間序列數(shù)據(jù)歸一化處理并轉(zhuǎn)化成供模型監(jiān)督學(xué)習(xí)矩陣,然后使用網(wǎng)絡(luò)搜索進(jìn)行參數(shù)優(yōu)化。最終確定模型的最佳輸入序列長度為28,輸出序列長度為14,即使用過去28 d的客流量預(yù)測未來14 d的客流量,hidden_dim為16,Encoder和Decoder的深度均設(shè)置為1。確定損失函數(shù)為MAPE,使用自適應(yīng)性矩估計(jì)算法(adaptive moment estimation, Adam)作為模型優(yōu)化器,batch size為16,epoch為500。由于Seq2Seq的輸出長度覆蓋了實(shí)例要求計(jì)算的全部未來天數(shù),因此直接將最后28 d的客流序列輸入網(wǎng)絡(luò)得到預(yù)測結(jié)果。將模型在整個(gè)數(shù)據(jù)上的擬合結(jié)果和預(yù)測結(jié)果進(jìn)行反歸一化還原后輸出。

最后,使用Tensoflow構(gòu)建BP神經(jīng)網(wǎng)絡(luò),選擇relu作為激活函數(shù),經(jīng)過調(diào)參后確定最終構(gòu)建一個(gè)四層神經(jīng)網(wǎng)絡(luò),batch size為1,epoch為50。同時(shí)嘗試使用了隨機(jī)森林(random forest,RF)、梯度下降樹(gradient descent decision tree,GBDT)、LSTM進(jìn)行預(yù)測作為參照,預(yù)測結(jié)果評價(jià)如表4所示。

表4 各算法在實(shí)例數(shù)據(jù)預(yù)測上的表現(xiàn)

評價(jià)結(jié)果表明,Seq2Seq-Prophet模型在此數(shù)據(jù)集上的預(yù)測誤差均低于其他模型。在與既有方法的比較中,該組合模型與表現(xiàn)最佳的GBDT模型相比預(yù)測誤差降低了3.434%;在與單獨(dú)使用Prophet模型和Seq2Seq-Attention網(wǎng)絡(luò)相比,組合模型在此數(shù)據(jù)集上的預(yù)測誤差分別降低了3.465%和0.617%。結(jié)果表明,Seq2Seq與Prophet模型都在鐵路客流數(shù)據(jù)的預(yù)測上擁有更好的精度和泛化能力,且其組合模型也可以進(jìn)一步的提升模型預(yù)測精度。

整合提取該區(qū)段內(nèi)的鐵路客運(yùn)需求總量,使用引入Attention機(jī)制的Seq2Seq-Prophet模型對最后14 d的客流需求進(jìn)行預(yù)測,再次驗(yàn)證模型精度。預(yù)測結(jié)果與實(shí)際客流對比如圖8所示。

圖8 區(qū)段內(nèi)的路客運(yùn)需求總量預(yù)測

結(jié)果表明,引入Attention機(jī)制的Seq2Seq-Prophet模型在此次預(yù)測中的平均相對誤差為9.55%,與上文OD區(qū)間的預(yù)測評價(jià)結(jié)果相似,證明模型擁有很穩(wěn)定的預(yù)測效果。同時(shí)模型很好地預(yù)測了兩周內(nèi)的實(shí)際客流走勢,具有很好的預(yù)測精度。

4 結(jié)論

首先,對Prophet模型的分解項(xiàng)與不同時(shí)間分布類型的鐵路客流之間的聯(lián)系進(jìn)行了分析,提出了使用Prophet模型從客流的時(shí)間序列數(shù)據(jù)中計(jì)算并分別提取年、月、周客流量以及節(jié)假日效應(yīng)下的客流變化,通過實(shí)例驗(yàn)證表明,該方法可以很好地在多年數(shù)據(jù)中擬合量化以上類型的客流,對于鐵路企業(yè)分析客流需求的時(shí)間分布特征、優(yōu)化旅客運(yùn)輸組織有著重要意義。

其次,分析了Seq2Seq-Attention網(wǎng)絡(luò)和Prophet模型在鐵路客流需求預(yù)測上的優(yōu)越性,指出了兩個(gè)模型在不同規(guī)模數(shù)據(jù)上存在優(yōu)劣互補(bǔ),因此提出使用深度神經(jīng)網(wǎng)絡(luò)將Prophet模型與Seq2Seq-Attention網(wǎng)絡(luò)非線性組合起來以進(jìn)一步增加模型對于數(shù)據(jù)的信息利用以及泛化能力。最后,通過實(shí)例證明了該組合模型相比其他模型在數(shù)據(jù)上具有更好的精度,同時(shí)對比單模型取得了更好的表現(xiàn),其預(yù)測精度對于鐵路企業(yè)開展精細(xì)化的運(yùn)營管理有一定的實(shí)用價(jià)值。

猜你喜歡
客流向量鐵路
客流增多
向量的分解
聚焦“向量與三角”創(chuàng)新題
沿著中老鐵路一路向南
鐵路通信線路維護(hù)體制改革探索與實(shí)踐
向量垂直在解析幾何中的應(yīng)用
無人機(jī)在鐵路工程建設(shè)中的應(yīng)用與思考
GSM-R在鐵路通信中的應(yīng)用
基于自學(xué)習(xí)補(bǔ)償?shù)氖覂?nèi)定位及在客流分析中的應(yīng)用
向量五種“變身” 玩轉(zhuǎn)圓錐曲線
文山县| 宁蒗| 阜康市| 扶余县| 应用必备| 金川县| 徐汇区| 芒康县| 高淳县| 九寨沟县| 乌审旗| 南召县| 贵州省| 朝阳县| 衡阳市| 凤山县| 收藏| 喀什市| 万荣县| 朝阳县| 兴安盟| 通道| 和林格尔县| 鞍山市| 德阳市| 河南省| 文水县| 九龙坡区| 铜鼓县| 故城县| 黄石市| 宜兴市| 桐柏县| 霍城县| 永安市| 绵竹市| 和硕县| 和田县| 崇州市| 宁南县| 湄潭县|