国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于LSTM的短時交通流預(yù)測研究

2018-10-22 01:48:38曹博高茂庭
現(xiàn)代計算機 2018年25期
關(guān)鍵詞:交通流預(yù)測值神經(jīng)網(wǎng)絡(luò)

曹博,高茂庭

(上海海事大學(xué)信息工程學(xué)院,上海 201306)

0 引言

交通流預(yù)測主要是對交通量的相關(guān)參數(shù)進(jìn)行預(yù)測。交通量也叫做交通流量,是指在指定時間段內(nèi),通過道路某一地點、某一斷面或某一車道的交通實體數(shù)[1]。在智能交通系統(tǒng)(Intelligent Transportation Systems,ITS)領(lǐng)域[2],交通控制與誘導(dǎo)系統(tǒng)是ITS研究的熱門核心課題,而實現(xiàn)交通誘導(dǎo)的關(guān)鍵是實時準(zhǔn)確地預(yù)測交通流。即利用現(xiàn)有道路的實時和歷史交通流數(shù)據(jù),通過建立適合的模型對下一個時段的交通流進(jìn)行預(yù)測。交通流預(yù)測分為短期預(yù)測、中期預(yù)測和長期預(yù)測,分別服務(wù)于不同的研究領(lǐng)域。而短時交通流預(yù)測能預(yù)測未來較短時間內(nèi)交通流狀態(tài)信息,可滿足城市交通控制系統(tǒng)對實時性及準(zhǔn)確性的要求,從而得出正確的控制策略,緩解交通堵塞,減少機動車廢氣排放,降低交通事故發(fā)生率。

在短時交通流預(yù)測研究中,有兩類不同的數(shù)據(jù)驅(qū)動預(yù)測方法被頻繁使用:一類是基于傳統(tǒng)統(tǒng)計理論的方法,另一類是基于神經(jīng)網(wǎng)絡(luò)的方法[3]?;诮y(tǒng)計的方法主要有卡爾曼濾波模型[4]、時間序列模型[5]、貝葉斯網(wǎng)絡(luò)[6]和馬爾可夫鏈[7]。它們假設(shè)未來預(yù)測的數(shù)據(jù)與過去的數(shù)據(jù)有相同的特性。,其方法理論簡單、容易理解。但是,基于統(tǒng)計的方法大部分是基于線性的,而交通流變化具有隨機性和非線性的特點,這使得模型的性能變差。隨著深度學(xué)習(xí)在語音、圖像和自然語言處理等研究領(lǐng)域的廣泛應(yīng)用,基于神經(jīng)網(wǎng)絡(luò)的方法在交通大數(shù)據(jù)挖掘方面體現(xiàn)出越來越強大的應(yīng)用價值。Huang等人(2014)[8]和 Lv等人(2015)[9]分別使用了深度信念網(wǎng)絡(luò)(Deep Belief Networks,DBN)和堆棧式自編碼器(Stacked Auto-Encoder,SAE)來預(yù)測短時交通流。但是,以上方法都需要預(yù)定義歷史輸入數(shù)據(jù)的長度,不能自動決定最優(yōu)的時間間隔,而且由于全連接神經(jīng)網(wǎng)絡(luò)里的每一個神經(jīng)元都與它上一層的神經(jīng)元連接,其計算代價高昂。

為了獲得更高的短時交通流預(yù)測精度,本文提出一種叫做LSTM的短時交通流預(yù)測模型。LSTM不僅能更有效地處理交通流的非線性和隨機性,而且在解決時間序列預(yù)測的長時間依賴問題中展示了優(yōu)越的能力。LSTM能“記住”距當(dāng)前時間點較遠(yuǎn)的歷史信息,而且能自動決定時間序列數(shù)據(jù)的最優(yōu)時間間隔。實驗結(jié)果表明,LSTM模型在短時交通流預(yù)測中取得了更高的精確度。

1 基于LSTM的短時交通流預(yù)測模型

在眾多短時交通流預(yù)測方法中,神經(jīng)網(wǎng)絡(luò)因其處理高維數(shù)據(jù)的優(yōu)勢,靈活的模型結(jié)構(gòu),強大的學(xué)習(xí)和泛化能力受到越來越多的關(guān)注。一般,神經(jīng)網(wǎng)絡(luò)可分為兩種類型,分別為前饋神經(jīng)網(wǎng)絡(luò)(Feed Forward Neural Network,F(xiàn)FNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Net?work,RNN)。兩者都能應(yīng)用到短時交通流預(yù)測中,其精確度主要受到交通流時間序列數(shù)據(jù)的歷史輸入的長度的影響。對于傳統(tǒng)的FFNN來說,其沒有時間序列觀念,不能記憶早期歷史輸入信息,也不能決定輸入的最優(yōu)時間跨度。當(dāng)把FFNN應(yīng)用到短時交通流預(yù)測上時,需要手動確定輸入的時間長度。而RNN是時間序列建模的有力工具之一。RNN之所以稱為循環(huán)神經(jīng)網(wǎng)絡(luò),是因為一個序列當(dāng)前的輸出與前面的輸出也有關(guān)聯(lián),具體表現(xiàn)形式為網(wǎng)絡(luò)會對前面的信息進(jìn)行記憶并應(yīng)用于當(dāng)前輸出的計算中,即隱藏層之間的節(jié)點不再無連接而是有連接的,并且隱藏層的輸入不僅包括輸入層的輸出,還包括上一時刻隱藏層的輸出[10]。RNN構(gòu)建的網(wǎng)絡(luò)會對歷史時間點的信息進(jìn)行記憶,并將記憶留下的信息應(yīng)用到當(dāng)前神經(jīng)元的輸出計算中。

對于短時交通流數(shù)據(jù)而言,同一路段的車流量在時間關(guān)系上并不是完全無關(guān)的。交通流量有復(fù)雜的歷史依賴性,此刻的交通流狀態(tài)與上一時刻的歷史交通流狀態(tài)有一定程度的關(guān)聯(lián),且可能導(dǎo)致下一時刻的交通流狀態(tài)產(chǎn)生變化。因交通流時間序列呈現(xiàn)的這個特點,采用循環(huán)神經(jīng)網(wǎng)絡(luò)則是非常合適的選擇。RNNs采用BPTT算法[11]作為訓(xùn)練算法,對于一般的RNN結(jié)構(gòu)而言,其循環(huán)結(jié)構(gòu)的特點容易造成梯度消失或梯度爆炸[12],從而使RNN喪失學(xué)習(xí)連接較遠(yuǎn)信息的能力。為了解決這個問題,Hochreiter和Schmidhuber提出了LSTM網(wǎng)絡(luò)結(jié)構(gòu)[13]。

LSTM RNN被認(rèn)為是一種特殊形式的RNN,其結(jié)構(gòu)由一個輸入層、數(shù)個隱藏層和一個輸出層組成。LSTM的關(guān)鍵在于記憶單元(memory cell),它能克服傳統(tǒng)RNNs面臨的梯度消失或梯度爆炸問題。如圖1所示,LSTM主要包含三個門:一個輸入門(input gate),一個遺忘門(forget gate),一個輸出門(output gate),這三個門在激活函數(shù)的作用下,會產(chǎn)生0到1之間的數(shù),用于把控門的開關(guān)。輸入門決定了輸入層信息如何傳遞到隱藏層的記憶模塊;遺忘門決定了如何對當(dāng)前時刻該記憶模塊的歷史信息進(jìn)行保留;輸出門決定了記憶模塊的信息如何傳遞出去。鑒于交通流狀態(tài)具有隨著時間動態(tài)變化的特點,結(jié)合LSTMs在處理長期依賴方面的優(yōu)勢,可用LSTMs提取交通流里的時間模式信息。

圖1 LSTM NN結(jié)構(gòu)圖

交通流歷史輸入序列可表示為X=(X1,X2…,XT)。對于q時刻,各站點的交通流則表示為其中,l1,…,ln代表一條高速公路上的n個站點。代表第n個站點在時刻q的交通流。本文中,交通流預(yù)測的目標(biāo)就是根據(jù)[1,T]時間段內(nèi)的歷史流量信息來預(yù)測T+a時刻各站點的交通流,a為某個常數(shù)。X被作為LSTMs的輸入,LSTMs的輸出則表示為H=(H1,H2,…,HT),σ(?)是sigmoid函數(shù),σh(?)是tanh函數(shù)。交通流的時間特征通過式(1)-式(6)迭代計算得出:

式(5)、式(6)中,“°”代表向量之間的 Hadamard product。得到LSTMs的輸出后,下一步是預(yù)測未來時刻的交通狀態(tài)。HT被作為一個全連接層的輸入。交通流的預(yù)測值可用式(7)計算,W2和b2分別代表LST?Ms的輸出層和全連接層之間的權(quán)重和偏置,YT+a就是整個模型的輸出,也即預(yù)測值。全連接層的目標(biāo)函數(shù)是預(yù)測值和實際值之間均方誤差的和。實驗對整個模型進(jìn)行端到端的訓(xùn)練。

式(7)中,YT+a代表T+a時刻的交通流預(yù)測值,a是一個常數(shù),代表時刻T之后的某個時間點。

2 實驗

2.1數(shù)據(jù)集

本文數(shù)據(jù)集來自美國加利福利亞州交通管理局的Caltrans Performance Measurement System(PeMS)。路段Route 16664:101S Downtown SF to Millbrae的交通流數(shù)據(jù)將被用來進(jìn)行試驗。該路段沿途共33個觀測站點,起止日期從01/01/2017到07/15/2017。交通流數(shù)據(jù)每隔30秒采集一次,最后聚合成時間間隔為5分鐘的聚合數(shù)據(jù)。根據(jù)先前的研究結(jié)果[14],5分鐘的交通流數(shù)據(jù)更適合用來預(yù)測未來時刻的交通流,因為缺失數(shù)據(jù)只占整個數(shù)據(jù)集的一小部分。

對于缺失數(shù)據(jù),本文采用相鄰數(shù)據(jù)平均法來填補數(shù)據(jù)集中的缺失值,即以缺失數(shù)據(jù)的相鄰數(shù)據(jù)的算術(shù)平均數(shù)代替。根據(jù)實際情況,交通流數(shù)據(jù)的最小值必定是0,而不可能是負(fù)數(shù)。觀察歷史數(shù)據(jù),最大值不超過900。也就是說,正常情況下的短時交通流數(shù)據(jù)處于最小值和最大值之間,偏離這個區(qū)間的數(shù)據(jù)被稱為非常規(guī)數(shù)據(jù)。對于非常規(guī)數(shù)據(jù),可把它視作缺失值,仍然采用相鄰數(shù)據(jù)平均法處理。

交通流數(shù)據(jù)隨時間變化的幅度較大,某些時段比如凌晨的車流量為0,而某些時段比如早晨和傍晚的車流量能達(dá)到幾百。為了消除數(shù)據(jù)大小差異給預(yù)測精度帶來的影響,一般用歸一化的方法對數(shù)據(jù)進(jìn)行變換。本文用min-max標(biāo)準(zhǔn)化的方法對原始數(shù)據(jù)進(jìn)行線性變換。經(jīng)過歸一化處理后,數(shù)據(jù)序列的相對大小并未改變,整體變化趨勢也保持一致。應(yīng)用歸一化后的數(shù)據(jù)進(jìn)行交通流預(yù)測,得到結(jié)果后采用反歸一化再對預(yù)測值進(jìn)行還原,最后得到最初量級的交通流數(shù)據(jù)。

本文數(shù)據(jù)被分為兩個子集:前5個月的數(shù)據(jù)作為訓(xùn)練集,其他的數(shù)據(jù)作為測試集。

2.2建立實驗

本文設(shè)置歷史交通流信息的時間長度為8,預(yù)測范圍為5分鐘,即式(7)中T的大小為8,a為1。所以,本文的預(yù)測目標(biāo)是根據(jù)前40分鐘的歷史交通流信息預(yù)測接下來5分鐘內(nèi)的車流量。

設(shè)置LSTM網(wǎng)絡(luò)結(jié)構(gòu)為1個輸入層、2個隱藏層、1個輸出層。在此基礎(chǔ)上進(jìn)行其他超參數(shù)的選擇。隱藏層中,設(shè)置H=(H1,H2,…,HT)在第一個LSTM層中每個時間點的特征維度為64,而在第二個LSTM層中其每個時間點的特征維度為512。具體的模型參數(shù)如表1所示。

表1 LSTM模型參數(shù)

LSTM的訓(xùn)練基于RMSprop優(yōu)化器[15],因其在RNN模型的訓(xùn)練中表現(xiàn)良好[16]。tanh作為激活函數(shù)被用在狀態(tài)和輸出上,目標(biāo)函數(shù)為均方誤差(MSE)。批處理數(shù)量(Batch Size)設(shè)置為64,迭代次數(shù)設(shè)置為20。Dropout層和早停法(Early Stopping)被用來防止過擬合。Dropout是深度學(xué)習(xí)模型中的正則化方法,它的原理是在訓(xùn)練過程中隨機丟掉某些神經(jīng)元,減少神經(jīng)元之間的協(xié)同作用,提高模型的泛化能力。本文設(shè)置Dropout丟失率為50%。LSTM模型使用Keras深度學(xué)習(xí)框架構(gòu)建,callback參數(shù)被用來實時保存模型結(jié)構(gòu)、訓(xùn)練出來的權(quán)重及優(yōu)化器狀態(tài)。實驗隨機選取10%的訓(xùn)練數(shù)據(jù)作為驗證集。

2.3結(jié)果和比較分析

實驗中,選擇SAEs[9]模型與LSTM模型作比較,并且兩種模型都分別選取表現(xiàn)最好的一組。平均絕對誤差(Mean Absolute Error,MAE)能很好地反映預(yù)測值誤差的實際情況,均方根誤差(Root Mean Squared Error,RMSE)可以評價數(shù)據(jù)與預(yù)測模型適應(yīng)性,故實驗采用MAE和RMSE比較交通流預(yù)測模型的性能:

式(8)、式(9)中,Zst表示s站點在第t個時間間隔內(nèi)的交通流的預(yù)測值,Nst代表相應(yīng)的實際交通流,np是預(yù)測值的個數(shù)。LSTMs,SAEs模型的預(yù)測結(jié)果與真實值的比較分別如圖2、3所示。

圖2 LSTMs交通流預(yù)測結(jié)果

圖3 SAEs交通流預(yù)測結(jié)果

從測試集中隨機選取日期07/06/2017,并選擇第17個站點在這一天中所有交通流數(shù)據(jù)從而得到圖2、3的結(jié)果。從圖2、3中可看出,LSTMs和SAEs模型都能正確反映交通流變化的大體趨勢。兩種模型在交通流處于低峰期時與真實情況吻合得較好,但在交通流高峰期時,兩者與真實值相比都有一定差距。LSTMs與SAEs預(yù)測結(jié)果的比較如圖4所示。

圖4 LSTMs和SAEs預(yù)測結(jié)果比較

圖 4 給出了 LSTMs、SAEs在 10:00 到 14:00 時間段內(nèi)預(yù)測值與真實值的比較。從圖4可看出,LSTMs和SAEs與真實值之間都有一定間隔,而兩者預(yù)測值之間的間隔不大,說明LSTMs和SAEs的預(yù)測精度比較接近,在交通流高峰期11:00到12:00時間段內(nèi),LSTMs的表現(xiàn)比SAEs稍好。為了更準(zhǔn)確反映LSTMs和SAEs預(yù)測結(jié)果的差異程度,表2給出了兩種模型的結(jié)果比較。

表2 兩種模型的MAE和RMSE

從表2可看出,LSTMs的MAE為27.38,RMSE為39.15,而 SAEs的 MAE 為 27.99,RMSE 為 39.37,LST?Ms比 SAEs表現(xiàn)稍好。說明LSTMs和SAEs這種state-of-the-art方法一樣,在短時交通流預(yù)測方面有不錯的表現(xiàn)。而LSTMs模型處理時序數(shù)據(jù)時在一定程度上優(yōu)于SAEs。

3 結(jié)語

本文提出了一種基于LSTM的短時交通流預(yù)測模型。LSTM模型考慮了交通流數(shù)據(jù)的時序特點,能記住輸入數(shù)據(jù)的長期歷史信息,并自動決定輸入的最優(yōu)的時間間隔,在短時交通流預(yù)測方面表現(xiàn)出了不錯的預(yù)測能力。與SAEs在同一個數(shù)據(jù)集上進(jìn)行的對比實驗表明,LSTM取得了更好的預(yù)測效果。這表明LSTM模型在交通流預(yù)測應(yīng)用的有效性。

但LSTM模型還有很多需要完善的地方。短時交通流數(shù)據(jù)蘊含時間特征,也包含空間特征。在空間層面,一條高速公路上的某個觀測站點的交通流不僅受到其上下游交通流狀況的影響,還受到相鄰高速公路的交通流狀況的影響。在短時交通流預(yù)測中,不能忽視交通流的空間依賴。另外,天氣、交通事故、交通管制等因素也對短時交通流有重要影響。在未來的研究中,將進(jìn)一步考慮這些因素,從而更準(zhǔn)確地預(yù)測短時交通流。

猜你喜歡
交通流預(yù)測值神經(jīng)網(wǎng)絡(luò)
IMF上調(diào)今年全球經(jīng)濟(jì)增長預(yù)期
企業(yè)界(2024年8期)2024-07-05 10:59:04
加拿大農(nóng)業(yè)部下調(diào)2021/22年度油菜籽和小麥產(chǎn)量預(yù)測值
±800kV直流輸電工程合成電場夏季實測值與預(yù)測值比對分析
法電再次修訂2020年核發(fā)電量預(yù)測值
國外核新聞(2020年8期)2020-03-14 02:09:19
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
交通流隨機行為的研究進(jìn)展
基于神經(jīng)網(wǎng)絡(luò)的拉矯機控制模型建立
重型機械(2016年1期)2016-03-01 03:42:04
路內(nèi)停車對交通流延誤影響的定量分析
復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
基于支持向量機回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
怀柔区| 平陆县| 北川| 瓮安县| 宁都县| 阿克陶县| 江孜县| 庆安县| 龙陵县| 高邑县| 子长县| 泗洪县| 宝应县| 麻城市| 融水| 永登县| 安徽省| 台山市| 衡阳市| 枣庄市| 宁明县| 綦江县| 获嘉县| 怀远县| 左权县| 搜索| 错那县| 汤原县| 买车| 新宁县| 漳平市| 黄龙县| 扎鲁特旗| 砚山县| 辽源市| 陆河县| 五家渠市| 大同市| 濉溪县| 盖州市| 阿拉善左旗|