胡雨欣, 彭其淵,2, 魯工圓,2, 李 力,2
基于初始晚點和冗余時間的列車晚點恢復(fù)時間預(yù)測模型
胡雨欣1, 彭其淵1,2, 魯工圓1,2, 李 力1,2
(1. 西南交通大學(xué)交通, 交通運輸與物流學(xué)院, 成都 611756; 2. 綜合交通運輸智能化國家地方聯(lián)合工程實驗室, 成都 611756)
列車初始晚點嚴(yán)重程度和運行圖冗余時間配置是列車晚點恢復(fù)時間長短的重要影響因素。本文基于高速鐵路列車運行實績數(shù)據(jù), 以初始晚點時間、站停冗余時間和區(qū)間冗余時間為變量, 使用多層感知器(MLP)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)建立了列車晚點恢復(fù)時間預(yù)測模型, 并采用基于運行圖歷史數(shù)據(jù)的冗余時間近似統(tǒng)計方法來提高統(tǒng)計精度, 降低了運行圖參數(shù)數(shù)據(jù)采集的工作量成本?;趶V深港鐵路12個月列車運行實績數(shù)據(jù)進行了列車晚點恢復(fù)時間預(yù)測試驗, 結(jié)果表明允許誤差為1 min時, MLP模型預(yù)測精度為91.6%; 允許誤差為3 min時, RNN模型表現(xiàn)更好, 預(yù)測精度在95%以上。
高速鐵路; 晚點恢復(fù); MLP; RNN
近年來,我國高速鐵路飛速發(fā)展。截止2017年底,高速鐵路年客運量達17.52億人次,占鐵路總客運量的56.8%,較2016年提升43.47%。吸引旅客選擇高速鐵路的主要優(yōu)勢之一就是準(zhǔn)點率,而這也是鐵路運營者追求的重要指標(biāo)[1]。
當(dāng)列車由于天氣惡劣、設(shè)備故障等因素的影響出現(xiàn)實際運行情況與計劃運行圖有偏差的現(xiàn)象時,需要列車調(diào)度員根據(jù)具體情況進行列車晚點恢復(fù)。晚點恢復(fù)不及時可能會導(dǎo)致連帶晚點情況發(fā)生,甚至?xí)?dǎo)致線路短時間癱瘓,嚴(yán)重影響高速鐵路服務(wù)質(zhì)量與運行效率[2]。其中,晚點恢復(fù)時間的不確定性影響著調(diào)度員的行車調(diào)整策略[3],通過對列車晚點恢復(fù)時間的預(yù)測,有助于調(diào)度員準(zhǔn)確把握列車到站時間,以保障列車到站正點率。
既有研究主要圍繞晚點情況的恢復(fù)或緩解,而對列車晚點時間進行預(yù)測的研究較少。王勇等[4]基于TDCS數(shù)據(jù)進行數(shù)據(jù)統(tǒng)計分析,研究在非圖定狀況出現(xiàn)的情況下列車趕點和越行調(diào)度策略;柏赟等[5]針對運行線交叉區(qū)域列車提出一種啟發(fā)式算法用于計算被干擾列車最優(yōu)接近速度控制方案,有利于盡快恢復(fù)被干擾列車的正常運行,減少列車晚點;鄧念等[6]構(gòu)建列車運行調(diào)整混合整數(shù)線性規(guī)劃模型對區(qū)間能力全失效情況下的列車運行圖調(diào)整問題進行研究。
在晚點時間預(yù)測方面,Kecman等[7]基于大量動態(tài)的軌道占用數(shù)據(jù)預(yù)測列車通過各個信號機的時間以及各個站點出發(fā)和到達時間等。但目前缺乏如此精確的運行數(shù)據(jù)以支持晚點的實時適應(yīng)性預(yù)測。Büker等[8]等將晚點到站時間看作服從某種分布函數(shù)的隨機變量,建立列車到站時間預(yù)測模型,并用活動圖表示晚點時間的傳播情況。但事實上,列車晚點時間是多種因素造成的結(jié)果,使用分布函數(shù)表示并不符合實際運行情況。孫略添[9]等針對技術(shù)站貨物列車,基于不同種類的晚點影響因素建立混合灰色預(yù)測模型和徑向基神經(jīng)網(wǎng)絡(luò)模型對列車晚點時間進行預(yù)測,分析比較了兩種預(yù)測方法的優(yōu)劣并分別指出了預(yù)測方法的適用范圍;袁志明等[10]在列車事件建模的基礎(chǔ)上提出基于隨機森林的列車到站時間預(yù)測模型,并證明該方法能夠有效提高預(yù)測列車到站時間的準(zhǔn)確性,其中,列車到站時間預(yù)測模型中的屬性特征選取來自既有經(jīng)驗,而沒有對其進行驗證。
列車運行實績數(shù)據(jù)反映了列車計劃運行軌跡和實際運行情況,文獻[11]發(fā)現(xiàn),通過分析列車運行實績數(shù)據(jù)可以清晰直觀地得到列車的晚點分布情況,對合理分配冗余時間,優(yōu)化列車運行圖的編制以及提高鐵路運輸服務(wù)的可靠性具有重要意義。黃平等[12]基于列車運行實績數(shù)據(jù)提出隨機森林模型對晚點恢復(fù)時間進行研究,在誤差為1 min時預(yù)測精度達79.1%;莊河等[13]基于廣鐵集團高速列車運行實績數(shù)據(jù),研究不同致因情況下初始晚點時長的分布模型。但基于列車運行實績數(shù)據(jù)的研究還是非常缺乏。
為了彌補上述不足,本文基于廣深港高速鐵路(廣州南—深圳北區(qū)段)列車運行實績數(shù)據(jù),對影響列車晚點恢復(fù)的影響因素進行分析,并提出基于多層感知器和循環(huán)神經(jīng)網(wǎng)絡(luò)的列車晚點恢復(fù)預(yù)測模型,并將12個月的歷史數(shù)據(jù)按6:2:2的比例分為訓(xùn)練集、驗證集與測試集,以校驗本方法的預(yù)測精度。
列車晚點恢復(fù)是一個由多重因素影響的復(fù)雜過程,目前大部分文獻是從定性分析的角度來分析影響晚點恢復(fù)過程的特征因素。本文使用廣深港線(廣州南至深圳北區(qū)段,簡稱廣深段)12個月的列車運行實績數(shù)據(jù)進行統(tǒng)計分析,定量地分析列車晚點恢復(fù)模型的主要變量。該數(shù)據(jù)共計834 098條,涉及5個車站、505 032輛列車。
既有文獻多選取晚點成因、列車運行時間等作為模型研究因素[9, 10, 13],而列車晚點程度、晚點能否恢復(fù)在很大程度上受到冗余時間分布的影響,基于此本文采用了初始晚點和冗余時間為模型輸入變量研究晚點恢復(fù)時間預(yù)測方法。
(1)初始晚點時間
初始站的晚點時間,即初始晚點時間,直接決定了列車晚點恢復(fù)的執(zhí)行難度,影響最終的晚點恢復(fù)時間。對同一次列車,初始晚點時間越小,進行運行調(diào)整時列車與列車之間的沖突關(guān)系就越少,更容易恢復(fù)正點運行。
對廣深港線列車運行實績數(shù)據(jù)進行晚點恢復(fù)率(由終到站恢復(fù)正點運行的列車數(shù)與初始站晚點列車數(shù)的比值得出)統(tǒng)計,如圖1所示。初始晚點時間較大的列車恢復(fù)正點運行的列車比例明顯低于初始晚點時間小的列車。結(jié)果表明,初始晚點時間影響著列車最終晚點恢復(fù)情況,因此,將初始晚點時間作為模型第一個自變量。
圖1 晚點恢復(fù)率統(tǒng)計
(2)冗余時間
冗余時間包括車站站停冗余時間、區(qū)間運行冗余時間、追蹤運行冗余時間以及接續(xù)作業(yè)冗余時間等[14]。其中,車站站停冗余時間和區(qū)間運行冗余時間主要控制受延誤列車初始晚點的強度和提高受延誤列車發(fā)生晚點時的晚點恢復(fù)能力[15]。文獻[12]指出總站停冗余時間可由各車站的停站時間之和求出,但列車在停站時需要完成到達、出發(fā)作業(yè)以及旅客乘降等工作,因此站停時間不能完全等價于站停冗余時間;其次,對于不同車型的列車,其牽引特性、制動性能以及速度等級等都有不同標(biāo)準(zhǔn),即使在同一條線路上運行,列車在車站的站停情況和區(qū)間運行情況也是不同的。
為減少變量數(shù)據(jù)采集與統(tǒng)計工作量成本,本文采用了基于列車運行圖實績歷史數(shù)據(jù)的方法來近似計算車站站停冗余時間:
同理,區(qū)間運行冗余時間可由下式計算:
以站停冗余時間為例,通過對列車運行實績數(shù)據(jù)統(tǒng)計,驗證冗余時間對列車晚點恢復(fù)的影響情況。表1和表2是對廣深線各個車站不同站停冗余時間下的列車數(shù)量以及不同站停冗余時間下的晚點恢復(fù)率的統(tǒng)計情況。如表2所示,站停冗余時間越大的列車普遍更易恢復(fù)正點,站停冗余時間在一定程度上影響著列車晚點恢復(fù)情況。
表1 車站站停冗余時間頻數(shù)統(tǒng)計
Tab.1 Station stop redundancy time frequency statistics
表2 不同站停冗余時間的晚點恢復(fù)率統(tǒng)計
Tab.2 Late recovery rate statistics of different station stop redundancy times
多層感知器(Multi-Layer Perceptron, 簡稱MLP)是一種前饋神經(jīng)網(wǎng)絡(luò)模型,由輸入層、輸出層和隱藏層組成,可以作為多分類模型。如圖2所示,每一層神經(jīng)元與下一層神經(jīng)元全部連接,同一層神經(jīng)元之間沒有連接。
圖2 MLP結(jié)構(gòu)示意圖
對于輸入序列(1,2, …,x-1,x, …)得到第2層輸出序列,并將其轉(zhuǎn)變?yōu)榫仃嚤磉_式為:
可將該過程推廣至神經(jīng)網(wǎng)絡(luò)的任意一層,得到第層最終輸出:
MLP晚點恢復(fù)時間預(yù)測模型具體建立步驟如下:
(1)確定模型實驗數(shù)據(jù),根據(jù)上文變量分析結(jié)果,生成由初始晚點時間、站停冗余時間、區(qū)間運行冗余時間組成的列晚點列車的輸入序列和相對應(yīng)的輸出序列。
(2)對輸入序列進行one-hot編碼,將類別進行二進制化,便于對其類別特征進行訓(xùn)練。
(3)建立層多層感知器模型,包括輸入層、隱藏層和輸出層,確定各層節(jié)點數(shù)。
(4)設(shè)置訓(xùn)練參數(shù)對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,在驗證集上進行驗證,直至找到最優(yōu)參數(shù)。
(5)將測試集輸入通過反復(fù)訓(xùn)練得到的最優(yōu)神經(jīng)網(wǎng)絡(luò)模型,得到最終預(yù)測值。
路網(wǎng)上的列車可看作按次序發(fā)出的動態(tài)過程,且由于相鄰列車之間的耦合性,此列車的晚點情況與上一列車有一定程度的關(guān)聯(lián),也很可能會影響下一列車的晚點情況。除此之外,晚點狀態(tài)改變需要的時間依賴于外部客觀因素和列車的自身狀態(tài),也就是說這一次的晚點恢復(fù)過程可以在歷史的晚點恢復(fù)過程中找到相似的特征。在此基礎(chǔ)上,考慮引入循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡稱RNN),RNN與一般的神經(jīng)網(wǎng)絡(luò)相比,區(qū)別在于RNN不僅在層與層之間建立了連接,在層之間的神經(jīng)元之間也建立了連接。如圖3所示(右圖是按時間軸展開的狀態(tài)),使神經(jīng)網(wǎng)絡(luò)能夠動態(tài)記憶歷史信息,在學(xué)習(xí)新信息的同時保持歷史信息的留存,能夠在預(yù)測過程中保持更高的適應(yīng)性。
圖3 RNN網(wǎng)絡(luò)結(jié)構(gòu)
假設(shè)輸入序列為(1,2,…,x-1,x,…),對于時刻的隱藏層狀態(tài):
則時刻輸出為:
RNN晚點恢復(fù)時間預(yù)測模型具體建立步驟如下:
(1)確定模型實驗數(shù)據(jù),生成由初始晚點時間、站停冗余時間、區(qū)間運行冗余時間組成的列晚點列車的基于時間順序的輸入序列和輸出序列;
(2)將輸入序列轉(zhuǎn)化為3維張量,得到新的輸入序列;
(3)建立層RNN模型,包括輸入層、隱藏層和輸出層,確定各層節(jié)點數(shù);
(4)設(shè)置訓(xùn)練參數(shù)對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,在驗證集上根據(jù)評價指標(biāo)對其進行驗證,直至找到最優(yōu)參數(shù);
(5)將測試集輸入通過反復(fù)訓(xùn)練得到的最優(yōu)神經(jīng)網(wǎng)絡(luò)模型,得到最終預(yù)測值。
以列車晚點恢復(fù)時間為研究對象,本文測試數(shù)據(jù)集來源于廣州鐵路集團高速鐵路調(diào)度所廣深港線上廣州南至深圳北共計5個車站的列車運行實績數(shù)據(jù),數(shù)據(jù)采集范圍為2015年11月1日至2016年10月31日,線路全長115km。
由于研究的是晚點時間恢復(fù)預(yù)測問題,本文僅對在初始站晚點的列車進行分析,并剔除到達終到站時晚點恢復(fù)時間為0的車次,對晚點列車在終到站,即深圳北站的晚點恢復(fù)時間進行預(yù)測。初始晚點時間過小時,可能在晚點發(fā)生的車站或者臨近區(qū)間直接被緩沖時間吸收,晚點持續(xù)過程較短[12]。本文選擇初始晚點時間大于3 min的數(shù)據(jù)進行實驗,最后得到符合實驗要求的數(shù)據(jù)共1 918條。將其中60%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為驗證集,20%的數(shù)據(jù)作為測試集。
初始晚點時間(CSSJ)、站停冗余時間(ZTSJ)、區(qū)間運行冗余時間(QJSJ)和晚點恢復(fù)時間(HFSJ)頻數(shù)分布如圖4所示,表3是各變量的Pearson相關(guān)性分析。由圖4和表3可知,各變量分布狀態(tài)不同,且除ZTSJ和HFSJ相關(guān)系數(shù)相對較高外,其余變量相關(guān)性較弱。變量之間關(guān)系復(fù)雜,難以用傳統(tǒng)回歸模型進行擬合,使用MLP和RNN模型進行實驗驗證。
圖4 變量頻數(shù)分布圖
表3 Pearson相關(guān)性分析
Tab.3 Pearson correlation analysis
將CSSJ、ZTSJ、QJSJ作為模型的輸入,輸出為HFSJ。如圖5所示,對HFSJ以1 min為間隔進行頻數(shù)統(tǒng)計,被分為31類。因此,輸入層設(shè)置為3個節(jié)點,輸出層設(shè)為31個節(jié)點;隱藏層設(shè)為2層,每層包含128個節(jié)點。由于本模型為多分類模型,將損失函數(shù)設(shè)為交叉熵?fù)p失函數(shù)并采用Adam優(yōu)化算法。將數(shù)據(jù)按6∶2∶2劃分為訓(xùn)練集、驗證集和測試集進行實驗。
圖5 不同批量下?lián)p失變化情況
圖5展示了不同訓(xùn)練批量和迭代次數(shù)下的訓(xùn)練損失和驗證損失變化情況(為了更清楚地顯示出數(shù)據(jù)走勢,從第10次迭代開始繪制)。由圖5可知,批量為16時,訓(xùn)練損失收斂最快并且較為穩(wěn)定,其對應(yīng)的驗證損失也在迭代次數(shù)為100時達到了各個驗證損失中的最低點。最終確定批量為16,迭代次數(shù)為100。
CSSJ、ZTSJ和QJSJ為模型的輸入數(shù)據(jù),HFSJ為模型的輸出。因此將RNN模型的輸入層設(shè)置為3個節(jié)點,輸出層設(shè)為1個節(jié)點;隱藏層設(shè)為2層,每層包含128個節(jié)點。采用Adam作為優(yōu)化算法,損失函數(shù)為均方誤差(MSE)。將數(shù)據(jù)按6:2:2劃分為訓(xùn)練集、驗證集和測試集進行實驗。訓(xùn)練中批量大小影響著損失下降的方向和訓(xùn)練速度,將批量設(shè)為16、32、64和128,在同樣的模型結(jié)構(gòu)下分別迭代1000次。結(jié)果如圖6所示(為了更清楚地顯示出數(shù)據(jù)走勢,從第30次迭代開始繪制),批量越小,損失下降得越快,但與此同時,損失振蕩增大,需要更多的迭代次數(shù)才能收斂。綜合考慮各因素,將批量設(shè)為32,并對模型進行500次迭代。如圖7所示,當(dāng)?shù)螖?shù)達到50次左右時,驗證損失達到其最小值;隨著迭代次數(shù)繼續(xù)增大,訓(xùn)練損失減小并逐漸趨于平緩,驗證損失反而呈上升趨勢,呈現(xiàn)出過擬合現(xiàn)象。最終確定RNN預(yù)測模型批量設(shè)為32,迭代次數(shù)為50。
圖6 不同批量下的訓(xùn)練損失變化情況
圖7 批量=32時訓(xùn)練損失和驗證損失變化情況
多元線性回歸(MLR)是一種廣泛應(yīng)用于預(yù)測任務(wù)的多因素分析方法[16]。為了更形象地評估模型預(yù)測效果,本文建立了MLR模型,與RNN模型、MLP模型性能相對比,MLR模型的變量、參數(shù)、訓(xùn)練集和測試集與RNN、MLP模型一致。
將初始晚點時間、站停冗余時間、區(qū)間運行冗余時間作為模型的預(yù)測變量,利用MLR、RNN、MLP三種模型進行對晚點時間進行預(yù)測。三種模型在測試集上的預(yù)測結(jié)果如圖8所示,RNN模型和MLP模型預(yù)測值與真實值變化趨勢基本吻合,偏差值較?。欢鳰LR模型預(yù)測值和真實值的偏差較大,預(yù)測結(jié)果不理想。
圖8 三類模型預(yù)測結(jié)果比較
為了驗證冗余時間變量對模型預(yù)測效果的影響,將初始晚點時間設(shè)為模型唯一預(yù)測變量,冗余時間不作為預(yù)測變量,分別使用MLP模型和RNN模型進行晚點恢復(fù)時間預(yù)測(模型各參數(shù)、訓(xùn)練集和測試集不變),預(yù)測結(jié)果如圖9、10所示。
圖9 無冗余時間變量的RNN模型預(yù)測結(jié)果
圖10 無冗余時間變量的MLP模型預(yù)測結(jié)果
由上圖可知,不使用冗余時間而僅用初始晚點時間預(yù)測最終晚點時間時,預(yù)測值與真實值的偏差較大。
為了統(tǒng)一對模型進行評估,分別對5種模型允許誤差為1 min、3 min和5 min的精度進行計算(取十次實驗結(jié)果的平均值),如表4所示,結(jié)果表明MLP模型和RNN模型預(yù)測效果均遠好于MLR模型。其中,MLP模型在誤差精度為1min時表現(xiàn)最為優(yōu)異,對于預(yù)測精度要求較高時MLP模型更為適用。RNN模型在誤差精度達3min和5min時預(yù)測更為準(zhǔn)確。在晚點初始時間預(yù)測的基礎(chǔ)上,加入冗余時間共同作為預(yù)測變量時,RNN模型預(yù)測結(jié)果平均提高7.2%,MLP模型預(yù)測結(jié)果平均提高2.7%。
表4 五種模型不同允許誤差情況下的精度比較
Tab.4 Accuracy comparison of five models with different allowable errors
本文基于列車運行實績數(shù)據(jù),確定了初始晚點時間、站停冗余時間和區(qū)間運行冗余時間作為列車晚點恢復(fù)模型的輸入變量,并采用了冗余時間近似統(tǒng)計的方法降低了輸入數(shù)據(jù)參數(shù)采集與處理成本。相比于以往對冗余時間的統(tǒng)計,本近似統(tǒng)計方法統(tǒng)計結(jié)果更加精確。在此基礎(chǔ)上,本文提出了基于多層感知器(MLP)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的列車晚點恢復(fù)時間預(yù)測模型,將其與傳統(tǒng)多元線性模型(MLR)進行對比,模型預(yù)測結(jié)果表明:
(1)相較于MLR模型,MLP模型和RNN模型能對數(shù)據(jù)更好地進行擬合,展現(xiàn)出更優(yōu)的預(yù)測精度。
(2)相比于僅使用初始晚點時間為變量的模型,加入冗余時間共同作為預(yù)測變量時模型的預(yù)測精度更高。
(3)在允許誤差為1 min時,MLP模型預(yù)測精度為91.6%;允許誤差為3 min時,RNN模型精度超過95%。
[1] 彭其淵, 李建光, 楊宇翔, 等. 高速鐵路建設(shè)對我國鐵路運輸?shù)挠绊慬J]. 西南交通大學(xué)學(xué)報, 2016, 51(3): 525-533.
[2] 閆迪. 基于晚點恢復(fù)的高速鐵路行車調(diào)度工作質(zhì)量評價方法[D]. 成都: 西南交通大學(xué), 2018.
[3] CORMAN F, MENG L Y. A review of online dynamic models and algorithms for railway traffic management[J]. IEEE Transactions on Intelligent Transportation Systems, 2015, 16(3): 1274-1284
[4] 王勇, 陳軍華, 于劍. 基于數(shù)據(jù)監(jiān)測的列車趕點與越行調(diào)度策略研究[J]. 物流技術(shù), 2014, 33(9): 166-169.
[5] 柏赟, 何天健, 毛保華. 一種交叉線干擾情形下列車晚點恢復(fù)運行控制方法[J]. 交通運輸系統(tǒng)工程與信息, 2011, 11(5): 114-122.
[6] 鄧念, 彭其淵, 占曙光. 干擾條件下高速鐵路列車運行實時調(diào)整問題研究[J]. 交通運輸系統(tǒng)工程與信息, 2017, 17(4): 118-123.
[7] KECMAN P, GOVERDE R M P. Online data-driven adaptive prediction of train event times[J]. IEEE Transactions on Intelligent Transportation Systems, 2015, 16(1): 465-474.
[8] BUKER T, SEYBOLD B. Stochastic modelling of delay propagation in large networks[J]. Journal of Rail Transport Planning & Management, 2012, 2(1): 34-50.
[9] 孫略添, 宋瑞, 何世偉, 等. 技術(shù)站列車晚點時間預(yù)測方法[J]. 北京交通大學(xué)學(xué)報, 2018, 42(1): 94-98, 126.
[10] 袁志明, 張琦, 黃康, 等. 基于隨機森林的列車到站時間預(yù)測方法[J]. 鐵道運輸與經(jīng)濟, 2016, 38(5): 60-63, 79.
[11] 劉巖, 郭競文, 羅常津, 等. 列車運行實績大數(shù)據(jù)分析及應(yīng)用前景展望[J]. 中國鐵路, 2015(6): 70-73.
[12] 黃平, 彭其淵, 文超, 等. 武廣高速鐵路列車晚點恢復(fù)時間預(yù)測的隨機森林模型[J]. 鐵道學(xué)報, 2018, 40(7): 1-9.
[13] 莊河, 文超, 李忠燦, 等. 基于高速列車運行實績的致因-初始晚點時長分布模型[J]. 鐵道學(xué)報, 2017, 39(9): 25-31.
[14] 孟令云, 冉鋒, 王志強. 高速鐵路列車運行圖冗余時間優(yōu)化布局系統(tǒng)研究[J]. 鐵路計算機應(yīng)用, 2012, 21(6): 28-30, 34.
[15] 寧驥龍. 城際客運專線列車運行圖冗余時間布局優(yōu)化研究[D]. 成都: 西南交通大學(xué), 2013.
[16] 李梅, 李靜, 魏子健, 等. 基于深度學(xué)習(xí)長短期記憶網(wǎng)絡(luò)結(jié)構(gòu)的地鐵站短時客流量預(yù)測[J]. 城市軌道交通研究, 2018, 21(11): 42-46, 7.
Train Delay Recovery Time Prediction Model Based on Initial Late Point and Redundant Time
HU Yu-xin1,PENG Qi-yuan1, 2,LU Gong-yuan1, 2,LI Li1, 2
(1. School of Transportation and Logistics, Southwest Jiaotong University, Chengdu 611756, China; 2. National United Engineering Laboratory of Integrated and Intelligent Transportation, Chengdu 611756, China)
Initial train delay and redundant operation map configuration are two important factors affecting the length of the train recovery time. This study investigates the influencing factors of the train delayrecovery based on high-speed railway train operation records. The initial late time, station stop redundancy time, and interval redundancy time are three important factors affecting the train delay recovery. Based on the high-speed railway train operation data, this study uses multi-layer perceptron (MLP) and a cyclic neural network (RNN) to establish a train delay recovery time prediction model with the initial late time, station stop redundancy time, and interval redundancy time as the variables. The redundant time approximation statistical method based on the historical data of a running graph is adopted to improve the statistical precision and reduce the workload cost of the data collection of the running graph parameters. The train delay recovery time prediction test is performed based on the 12 months train operation datas of the Guangzhou-Shenzhen-HongKong railway. The results show that the prediction accuracy of the MLP model is 91.6% when the allowable error is 1 min.The RNN model is more accurate when the allowable error is 3 min. In conclusion, the prediction accuracy is above 95%.
high-speed railway; delay recovery; MLP; RNN
1672-4747(2020)02-0093-10
U292.4
A
10.3969/j.issn.1672-4747.2020.02.011
2019-05-21
國家重點研發(fā)計劃(2017YFB1200701),國家自然科學(xué)基金項目(U1834209)
胡雨欣(1994—),女,漢族,四川成都人,碩士研究生,E-mail:yuxin@my.swjtu.edu.cn
魯工圓(1983—),男,漢族,四川射洪人,副教授,E-mail:lugongyuan@swjtu.edu.cn
胡雨欣, 彭其淵, 魯工圓,等. 基于初始晚點和冗余時間的列車晚點恢復(fù)時間預(yù)測模型[J]. 交通運輸工程與信息學(xué)報, 2020, 18(2):93-102.
(責(zé)任編輯:李愈)