任建華,朱 堯,孟祥福,張霄雁
(遼寧工程技術(shù)大學(xué) 電子與信息工程學(xué)院,遼寧 葫蘆島 125105)
隨著城市智能交通的飛速發(fā)展,交通流量預(yù)測(cè)對(duì)交通管理和公共安全越來(lái)越重要.準(zhǔn)確的交通流量預(yù)測(cè)可以幫助政府規(guī)劃城市交通的運(yùn)行路線(xiàn)和運(yùn)行時(shí)間,實(shí)現(xiàn)人群分流以防止交通堵塞,同時(shí)也能提升城市交通的運(yùn)行效率;乘客也可以根據(jù)預(yù)測(cè)的交通信息規(guī)避高峰期人群擁擠,選擇更好的出行方式和路線(xiàn).因此,準(zhǔn)確的交通預(yù)測(cè)有助于人們綠色出行,節(jié)省時(shí)間成本.
城區(qū)流量預(yù)測(cè)是根據(jù)城市區(qū)域過(guò)去一段時(shí)間的交通流量信息來(lái)預(yù)測(cè)未來(lái)一段時(shí)間的交通流量信息.近年來(lái),深度學(xué)習(xí)被證明具有良好的預(yù)測(cè)精度,研究人員嘗試使用深度學(xué)習(xí)模型對(duì)交通流量進(jìn)行預(yù)測(cè).基于深度學(xué)習(xí)的預(yù)測(cè)模型可以歸納為兩類(lèi):一類(lèi)是基于遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的模型,Fu等人[1]在2016年首次提出使用門(mén)控遞歸單元(GRU)進(jìn)行交通流量預(yù)測(cè).Yang等人[2]提出了一種基于長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)的增強(qiáng)模型,用于交通客流量預(yù)測(cè).另一類(lèi)是基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的模型,Zhang等人[3]提出了一種深度時(shí)空殘差網(wǎng)絡(luò)(ST-ResNet)來(lái)捕獲空間相關(guān)性,預(yù)測(cè)城市區(qū)域人流量的變化.
然而,現(xiàn)有的城市區(qū)域流量預(yù)測(cè)仍然存在以下兩個(gè)問(wèn)題:
1)區(qū)域流量預(yù)測(cè)是一個(gè)復(fù)雜的時(shí)空問(wèn)題,包含局部(近距離)和全局(遠(yuǎn)距離)區(qū)域的時(shí)空相關(guān)性.由于區(qū)域流量會(huì)受到附近區(qū)域的流入影響,同時(shí)周?chē)鷧^(qū)域也會(huì)受到此區(qū)域的流出影響,因此鄰近區(qū)域的流量通常有很強(qiáng)的空間相關(guān)性.同一個(gè)區(qū)域的流量也會(huì)受到近期或周期規(guī)律的影響.例如,某商業(yè)區(qū)流量如圖1所示,區(qū)域流量會(huì)因?yàn)槿藗內(nèi)粘I畹挠绊懗尸F(xiàn)出周期性的規(guī)律.這種近距離區(qū)域影響和長(zhǎng)短期時(shí)間相關(guān)性可以看作局部區(qū)域時(shí)空相關(guān)性.區(qū)域流量變化還存在遠(yuǎn)距離時(shí)空依賴(lài)性.如圖2所示,人們可以乘坐地鐵或出租車(chē)在短時(shí)間內(nèi)到達(dá)任何地點(diǎn).例如,在國(guó)定假日期間,人們一般會(huì)去距離居住地很遠(yuǎn)的動(dòng)物園或者景點(diǎn)游玩,同時(shí),其它地區(qū)的游客也會(huì)乘坐輕軌或動(dòng)車(chē)到城市觀光.本文把遠(yuǎn)距離的時(shí)空相關(guān)性稱(chēng)為全局區(qū)域時(shí)空相關(guān)性.由此可見(jiàn),對(duì)城市區(qū)域局部和全局相關(guān)性同時(shí)進(jìn)行建模,對(duì)精準(zhǔn)預(yù)測(cè)區(qū)域交通流量非常重要.
圖1 商業(yè)區(qū)交通流量Fig.1 Traffic flow in business district
圖2 遠(yuǎn)距離移動(dòng)Fig.2 Distant movement
2)在交通領(lǐng)域,市區(qū)交通流量在時(shí)間序列上的變化是不平穩(wěn)的,而捕捉這種城市交通流量的動(dòng)態(tài)變化規(guī)律是一個(gè)困難的任務(wù).其次,一些周期性的規(guī)律會(huì)因?yàn)橥话l(fā)事故或者自然災(zāi)害受到影響,從而增加了從過(guò)往城市流量信息中學(xué)習(xí)有用信息的難度.最后,城市交通流量還會(huì)受到現(xiàn)實(shí)中地理位置的影響.
為了解決上述問(wèn)題,本文提出了一種基于深度學(xué)習(xí)的時(shí)空動(dòng)態(tài)特征網(wǎng)絡(luò)ST-3DGN(SpatioTe-mporal 3D Convolution Global Depth Residual Network),該模型使用時(shí)空數(shù)據(jù)作為輸入,對(duì)交通數(shù)據(jù)的遠(yuǎn)近區(qū)域時(shí)空相關(guān)性和區(qū)域流量動(dòng)態(tài)性同時(shí)進(jìn)行建模,進(jìn)而預(yù)測(cè)城市未來(lái)所有區(qū)域的流量變化.
本文的主要貢獻(xiàn)有4個(gè)方面:
1)提出了時(shí)空動(dòng)態(tài)相關(guān)性模型,將多層三維卷積引入交通流量預(yù)測(cè),以便從時(shí)間和空間兩個(gè)維度提取高層次時(shí)空特征,捕獲交通流量的流動(dòng)規(guī)律.
2)設(shè)計(jì)了遠(yuǎn)距離區(qū)域影響模型,能夠同時(shí)捕獲局部和偏遠(yuǎn)地區(qū)交通流量對(duì)某個(gè)特定區(qū)域的流量影響,并考慮了地理位置對(duì)城市區(qū)域流量變化的影響.
3)考慮了交通流量數(shù)據(jù)的短期時(shí)間依賴(lài)和長(zhǎng)期時(shí)間依賴(lài),使用早期融合機(jī)制,提高了模型的預(yù)測(cè)精度和穩(wěn)定性.
4)在兩個(gè)真實(shí)數(shù)據(jù)集上進(jìn)行大量實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明本文模型在不同區(qū)域流量預(yù)測(cè)效果優(yōu)于現(xiàn)有相關(guān)預(yù)測(cè)方法.
由于城市區(qū)域流量分析在城市交通管理和公共安全領(lǐng)域的廣泛應(yīng)用,城市區(qū)域交通流量預(yù)測(cè)最近引起了廣泛的研究興趣.研究方法主要分為3大類(lèi):經(jīng)典時(shí)間序列方法、傳統(tǒng)機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法.經(jīng)典時(shí)間序列方法有歷史均值法、整合移動(dòng)平均自回歸模型(ARIMA)[4]及其變體模型SARIMA[5]等.然而,經(jīng)典時(shí)間序列方法是根據(jù)理想的假定來(lái)預(yù)設(shè)的,復(fù)雜的交通數(shù)據(jù)無(wú)法滿(mǎn)足這些假設(shè).因此,時(shí)間序列方法在實(shí)際場(chǎng)景下的應(yīng)用效果通常不夠理想.
SVR[6]和SVM[7]等傳統(tǒng)機(jī)器學(xué)習(xí)方法為交通預(yù)測(cè)提供了更靈活的選擇,采用核函數(shù)將低維非線(xiàn)性交通數(shù)據(jù)映射到高維空間描述交通數(shù)據(jù)的非平穩(wěn)變化,核函數(shù)的選擇對(duì)預(yù)測(cè)結(jié)果有很大的影響.城市區(qū)域交通流量預(yù)測(cè)還采用了貝葉斯方法[8]和KNN[9].然而,傳統(tǒng)的機(jī)器學(xué)習(xí)方法在處理高度非線(xiàn)性的流量數(shù)據(jù)[10]時(shí),需要良好的特征選取才能做出準(zhǔn)確的預(yù)測(cè),同時(shí)也無(wú)法有效考慮城市區(qū)域交通流量的時(shí)空相關(guān)性.
受到深度學(xué)習(xí)在各種任務(wù)上取得重大進(jìn)展的啟發(fā)[11,12],許多研究者也開(kāi)始嘗試使用深度神經(jīng)網(wǎng)絡(luò)模型處理城市區(qū)域流量預(yù)測(cè)這一任務(wù).卷積神經(jīng)網(wǎng)絡(luò)(CNN)通過(guò)卷積運(yùn)算自動(dòng)分層捕獲空間結(jié)構(gòu)信息,可以很好地捕獲城市區(qū)域流量的空間相關(guān)性.Zhang等[3]設(shè)計(jì)了基于卷積神經(jīng)網(wǎng)絡(luò)的深度時(shí)空殘差網(wǎng)絡(luò)(ST-ResNet)對(duì)未來(lái)一段時(shí)間城市區(qū)域流量進(jìn)行預(yù)測(cè).Dai等人[13]提出了一個(gè)簡(jiǎn)化的深度殘差網(wǎng)絡(luò)對(duì)區(qū)域交通流量進(jìn)行預(yù)測(cè).然而,這類(lèi)模型將相鄰時(shí)間間隔的信息簡(jiǎn)單地視為多個(gè)通道,因此經(jīng)過(guò)一次卷積后就會(huì)丟失時(shí)間維度信息.深度學(xué)習(xí)的另一種經(jīng)典類(lèi)型是遞歸神經(jīng)網(wǎng)絡(luò)(RNNs),通常用于時(shí)間信息建模.為了解決遞歸神經(jīng)網(wǎng)絡(luò)的梯度消失問(wèn)題,長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTMs)和門(mén)控遞歸單元網(wǎng)絡(luò)(GRUs)被開(kāi)發(fā)出來(lái)學(xué)習(xí)長(zhǎng)時(shí)間跨度的時(shí)間依賴(lài).George[14]和Cai[15]采用基于LSTM的網(wǎng)絡(luò)預(yù)測(cè)短期交通速度和交通流量,但是這些模型不能自動(dòng)捕捉空間信息.此外,這些基于LSTM的網(wǎng)絡(luò)不能有效地捕獲長(zhǎng)期的時(shí)間相關(guān)性,如交通數(shù)據(jù)中的周期和趨勢(shì)模式,這在區(qū)域流量預(yù)測(cè)中很重要.
本文提出的融合流動(dòng)性和時(shí)空特性的市區(qū)交通流量預(yù)測(cè)模型(ST-3DGN),融合了城市局部區(qū)域的流動(dòng)性和全局區(qū)域交通流量的時(shí)空相關(guān)性,還考慮了地理位置對(duì)城市交通流量的影響,模型的預(yù)測(cè)能力得到進(jìn)一步提升.
定義1.區(qū)域:將城市劃分為m×n個(gè)網(wǎng)格,其中,每個(gè)網(wǎng)格代表一個(gè)固定區(qū)域,M和N分別代表網(wǎng)格的行數(shù)和列數(shù),(m,n)代表城市中的第m行第n列的區(qū)域,所有區(qū)域組成一個(gè)集合:
R={r1,1,…,ri,j,…,rm,n}
(1)
定義2.軌跡:軌跡數(shù)據(jù)是記錄移動(dòng)物體位置的三元組(x,y,τ)序列,其中(x,y)表示物體在時(shí)間τ的位置.對(duì)于單個(gè)移動(dòng)物體r,其運(yùn)動(dòng)軌跡Tr可按照時(shí)間順序表示為地點(diǎn)序列:
Tr:P1→P2→…→Pk→…→Pl
(2)
軌跡的總長(zhǎng)度Tr可表示為l,Pk∈(xk,yk)表示第k個(gè)軌跡點(diǎn)Pk位于網(wǎng)格的(xk,yk)位置.
(3)
(4)
定義5.周期依賴(lài):城市區(qū)域車(chē)流在某一時(shí)刻的流入流出可以看作圖片的兩通道張量,從中提取出體現(xiàn)近期依賴(lài)和遠(yuǎn)期依賴(lài)特性的子序列.lc是短時(shí)依賴(lài)序列的長(zhǎng)度,近期依賴(lài)子序列表示為:[xt-lc,xt-(lc-1),…,xt-1]∈Rc,m,n,lc.lr是長(zhǎng)期依賴(lài)序列的長(zhǎng)度,p為固定的一周時(shí)間,遠(yuǎn)期依賴(lài)子序列表示為:[xt-lr·p,xt-(lr-1)·p,…,xt-p]∈Rc,m,n,lr.近期依賴(lài)數(shù)據(jù)集表示為A(t)=(c,t,m,n),周期依賴(lài)數(shù)據(jù)集表示為B(t)=(c,w,m,n),其中c代表進(jìn)出車(chē)流,t和w代表時(shí)間長(zhǎng)度,m和n代表城市區(qū)域網(wǎng)格的長(zhǎng)和寬.
問(wèn)題定義.城市流量預(yù)測(cè):給定歷史時(shí)空交通網(wǎng)格流量數(shù)據(jù)(x1,x2,x3,…,xT-1),本文目標(biāo)是準(zhǔn)確預(yù)測(cè)出下一個(gè)時(shí)間段T的城市所有區(qū)域進(jìn)出的交通流量.例如,某個(gè)區(qū)域舉辦大型活動(dòng)(如集會(huì)等),已知前T段時(shí)刻的某區(qū)域內(nèi)的交通流量,預(yù)測(cè)接下來(lái)T+H時(shí)段內(nèi)區(qū)域的交通流量,H表示預(yù)測(cè)時(shí)間間隔.
本文提出的ST-3DGN模型框架如圖3所示,主要由3個(gè)組件構(gòu)成,分別是流輸入、局部動(dòng)態(tài)時(shí)空相關(guān)性模塊、全局流動(dòng)時(shí)空相關(guān)性模塊.其中,流輸入包括近期依賴(lài)和周周期依賴(lài),以每半個(gè)小時(shí)或一個(gè)小時(shí)統(tǒng)計(jì)一次區(qū)域的交通流量,形成具有時(shí)間信息的網(wǎng)格流量圖,將這些網(wǎng)格流量圖加權(quán).然后,局部動(dòng)態(tài)時(shí)空相關(guān)性模塊使用多層三維卷積建模城市交通流量的局部時(shí)空相關(guān)性和流動(dòng)性.最后,全局流動(dòng)時(shí)空相關(guān)性模塊模擬城市中交通流量的遠(yuǎn)距離空間依賴(lài)性,捕獲遠(yuǎn)距離城市間交通流量的影響.
圖3 ST-3DGN模型架構(gòu)Fig.3 Architecture of ST-3DGN
下面分別介紹模型的流輸入、局部動(dòng)態(tài)時(shí)空相關(guān)性模塊、全局流動(dòng)時(shí)空相關(guān)性模塊.
將城市按經(jīng)度和緯度進(jìn)行分區(qū),地理網(wǎng)格的一個(gè)單元代表城市的一個(gè)區(qū)域,每個(gè)區(qū)域的大小完全相同.分區(qū)效果如圖4所示.
圖4 北京市網(wǎng)格劃分圖Fig.4 Grid division of Beijing
每隔一小時(shí)或半小時(shí)對(duì)每個(gè)區(qū)域的流入和流出量統(tǒng)計(jì)一次,形成具有時(shí)間屬性的交通流量圖,將這些流量值歸一化到[-1,1]范圍內(nèi).本文使用定義1和定義4中提出的方法,將每個(gè)時(shí)間間隔內(nèi)城市的流入和流出轉(zhuǎn)化為二通道圖像矩陣.
城市區(qū)域交通流量在時(shí)間維度上還存在近期和周期規(guī)律影響.一個(gè)區(qū)域不僅會(huì)受到前幾個(gè)時(shí)刻的周?chē)鷧^(qū)域的交通流量影響,還可能和一周前同一段時(shí)間該區(qū)域的交通流量變化具有相似性,即存在短期和長(zhǎng)期的時(shí)間相關(guān)性.
為了獲取城市區(qū)域交通流量在時(shí)間上的長(zhǎng)短期之間的影響.首先,按時(shí)間軸將區(qū)域交通流量圖劃分為兩個(gè)時(shí)間段,一個(gè)片段選用將要預(yù)測(cè)時(shí)段的前幾個(gè)時(shí)間片段,另一個(gè)片段選用前幾周相同時(shí)刻的城市區(qū)域交通流量圖,分別表示近期城市交通流量變化和周周期城市交通流量變化.然后,對(duì)每個(gè)時(shí)間片段的區(qū)域流量圖進(jìn)行二維卷積操作,捕捉城市鄰近區(qū)域之間車(chē)輛流動(dòng)的影響.最后,將卷積之后的城市流量圖按時(shí)間順序重新堆砌,保留城市區(qū)域流量圖的時(shí)間信息屬性.
該模塊將具有時(shí)間屬性的城市區(qū)域流量圖作為輸入,使用三維卷積神經(jīng)網(wǎng)絡(luò)對(duì)鄰近區(qū)域的時(shí)空動(dòng)態(tài)相關(guān)性進(jìn)行建模.
在交通數(shù)據(jù)中,相鄰的時(shí)間間隔和地理位置的車(chē)流具有較強(qiáng)關(guān)聯(lián)性.以北京早高峰為例,早上八點(diǎn)半時(shí),車(chē)流常覆蓋一個(gè)連續(xù)的區(qū)域.隨著時(shí)間的推移,車(chē)流會(huì)向前移動(dòng),鄰近區(qū)域也可能出現(xiàn)車(chē)道堵塞的情況.在交通數(shù)據(jù)分析中,捕獲多個(gè)鄰近區(qū)域連續(xù)時(shí)間段的運(yùn)動(dòng)信息至關(guān)重要.在現(xiàn)實(shí)問(wèn)題中,只對(duì)鄰近區(qū)域之間的流量相互影響進(jìn)行建模還不夠全面.三維卷積神經(jīng)網(wǎng)絡(luò)在視頻分析問(wèn)題中已經(jīng)被證明可以從時(shí)間和空間兩個(gè)維度有效地捕獲運(yùn)動(dòng)信息[16],因此本文使用三維卷積神經(jīng)網(wǎng)絡(luò)來(lái)捕獲城市區(qū)域車(chē)流局部動(dòng)態(tài)時(shí)空相關(guān)性.
城市在某一時(shí)刻下切分成的所有流量圖都可以看成是一個(gè)靜態(tài)圖像,以往的研究直接使用CNN進(jìn)行多次卷積時(shí)會(huì)在第一次融合時(shí)丟失時(shí)間信息.三維卷積是通過(guò)堆疊多個(gè)連續(xù)的幀(也就是按時(shí)間序列連成的多個(gè)區(qū)域流量圖)組成一個(gè)立方體,然后在立方體中運(yùn)用三維卷積操作可以捕獲鄰近區(qū)域的時(shí)空動(dòng)態(tài)相關(guān)性.在這個(gè)結(jié)構(gòu)中,卷積層中每一個(gè)特征都會(huì)與上一層中多個(gè)鄰近的連續(xù)幀相連,據(jù)此捕捉運(yùn)動(dòng)信息.運(yùn)動(dòng)信息的3D模型可表示為:
(5)
全局流動(dòng)時(shí)空相關(guān)性模塊用來(lái)捕獲相距較遠(yuǎn)的城市區(qū)域之間交通流量的時(shí)空相關(guān)性.該模塊結(jié)合殘差和二維卷積神經(jīng)網(wǎng)絡(luò)模擬遠(yuǎn)距離城市區(qū)域交通流量關(guān)系.
單個(gè)區(qū)域不僅具有鄰近區(qū)域依賴(lài)性,還與一些遙遠(yuǎn)區(qū)域存在遠(yuǎn)距離空間依賴(lài)關(guān)系.由于現(xiàn)代城市的先進(jìn)交通系統(tǒng),人們?cè)诙虝r(shí)間內(nèi)可以乘坐地鐵、電車(chē)去很遠(yuǎn)的地方.因此,區(qū)域間流量的遠(yuǎn)程空間依賴(lài)在城市交通中越來(lái)越重要.普通卷積難以有效捕獲單個(gè)區(qū)域與遠(yuǎn)距離區(qū)域的關(guān)聯(lián)關(guān)系,Lin等人[17]基于ST-ResNet提出了ResPlus單元捕捉遠(yuǎn)距離之間交通流量影響.如圖5所示,ResPlus單元包含ConvPlus和普通卷積,ConvPlus模塊有兩個(gè)通道,一個(gè)通道是卷積核大小與網(wǎng)格尺寸大小相同的全局卷積神經(jīng)網(wǎng)絡(luò),這個(gè)完全連接的層被用來(lái)捕獲遠(yuǎn)距離交通流量影響,用來(lái)學(xué)習(xí)每一個(gè)區(qū)域的全局空間依賴(lài).另一個(gè)是卷積核為3×3的普通卷積,用于獲取周?chē)鷧^(qū)域?qū)ζ鋮^(qū)域的影響,然后將兩個(gè)通道合并成一個(gè)通道,ConvPlus的輸出與正常卷積輸出具有相同的維度,可以用作下一個(gè)卷積的輸入,最后和原始輸入做殘差操作.卷積層每個(gè)通道對(duì)應(yīng)一個(gè)核,卷積使用這些核計(jì)算和映射空間的相互關(guān)系.卷積操作可定義為:
圖5 ResPlus模型架構(gòu)Fig.5 Architecture of ResPlus
(6)
在現(xiàn)實(shí)交通場(chǎng)景中,互相影響的兩個(gè)區(qū)域可能具有地理位置相關(guān)性,例如住宅區(qū)和景點(diǎn)在節(jié)假日會(huì)有強(qiáng)聯(lián)系.而ConvPlus結(jié)構(gòu)是僅考慮城市每個(gè)區(qū)域兩兩之間的聯(lián)系,忽視了遠(yuǎn)距離區(qū)域間交通流量因?yàn)榈乩硇畔⒍嬖诘膹?qiáng)弱聯(lián)系關(guān)系.受注意力模型CBAM模型的啟發(fā)[18],本文使用空間注意力機(jī)制動(dòng)態(tài)捕捉區(qū)域間因地理信息影響的交通流量強(qiáng)弱聯(lián)系.空間注意力使用平均池化層和最大池化層對(duì)輸入的特征圖進(jìn)行通道層面的壓縮操作,最大池化的作用是在通道上提取最大值,平均池化是在通道上提取平均值,提取的次數(shù)都是高乘以寬,最后合并成一個(gè)二通道的特征圖,具體操作如下所示:
(7)
其中,σ為Sigmoid激活函數(shù),3×3表示卷積核的大小,AvgPool代表平均池化,Maxpool代表最大池化.
為了考慮遠(yuǎn)距離依賴(lài)和現(xiàn)實(shí)地理位置的影響,提出了一種改進(jìn)的ResPlus模型(如圖6所示),將空間注意力機(jī)制和ResPlus模型結(jié)合,并對(duì)原始的ResPlus模型使用雙層殘差操作,并加入歸一化和激活函數(shù)等一系列優(yōu)化,從而解決梯度消失和過(guò)擬合問(wèn)題.其中,“Conv”表示卷積層,“BN”表示歸一化層,“ReLU”表示激活層,“SAM”表示空間注意力.
圖6 改進(jìn)ResPlus模型架構(gòu)Fig.6 Architecture of the improved ResPlus
城市交通流量預(yù)測(cè)在近期和遠(yuǎn)期的歷史交通流量上存在時(shí)間相關(guān)性,本文使用早期融合代替末尾融合機(jī)制.早期融合機(jī)制可以減少參數(shù)和簡(jiǎn)化網(wǎng)絡(luò),同時(shí)還能解決無(wú)法收斂的問(wèn)題.同時(shí),考慮到不同層的特征具有不同的功能,在網(wǎng)絡(luò)末端設(shè)置了多尺度融合機(jī)制,在此基礎(chǔ)上整個(gè)網(wǎng)絡(luò)定義如下:
(8)
本文提出的ST-3DGN模型是通過(guò)最小化損失函數(shù)進(jìn)行訓(xùn)練,損失函數(shù)定義為城市區(qū)域真實(shí)交通流量值和預(yù)測(cè)值之間的均方誤差:
(9)
其中θ是ST-3DGN可學(xué)習(xí)的參數(shù).
已知的城市區(qū)域交通流量預(yù)測(cè)采用網(wǎng)格化的方法,一般會(huì)使用均方根誤差RMSE和平均絕對(duì)誤差MAE度量方式來(lái)衡量預(yù)測(cè)模型的性能.本文同樣采用準(zhǔn)確率的兩個(gè)指標(biāo)對(duì)模型的效果進(jìn)行評(píng)價(jià),均方根誤差的度量方法如下:
(10)
平均絕對(duì)誤差度量方法如下:
(11)
數(shù)據(jù)集:實(shí)驗(yàn)使用表1中介紹的兩個(gè)公開(kāi)數(shù)據(jù)集TaxiBJ和BikeNYC來(lái)驗(yàn)證ST-3DGN模型的有效性.BikeNYC是紐約的用戶(hù)租賃自行車(chē)行駛軌道數(shù)據(jù),紐約自行車(chē)數(shù)據(jù)主要由包含用戶(hù)行程持續(xù)時(shí)間、起止站ID、起止時(shí)間的時(shí)空數(shù)據(jù)組成.TaxiBJ是北京出租車(chē)GPS數(shù)據(jù)生成的軌跡數(shù)據(jù),記錄了北京出租車(chē)2013年7月1號(hào)~2013年10月30號(hào),2014年3月1號(hào)~2014年6月30號(hào),2015年3月1號(hào)~2015年6月30號(hào),2015年11月1號(hào)~2016年4月10號(hào)的行駛數(shù)據(jù).兩個(gè)數(shù)據(jù)集都以最后10天為測(cè)試集,剩下的數(shù)據(jù)為訓(xùn)練集.
表1 數(shù)據(jù)集統(tǒng)計(jì)信息Table 1 Statistics of datasets
參數(shù)設(shè)置:實(shí)驗(yàn)中,使用BikeNYC數(shù)據(jù)集時(shí)將紐約市劃分為16×8個(gè)區(qū)域,每個(gè)區(qū)域規(guī)模約為1km×1km,每個(gè)時(shí)間間隔設(shè)置為一小時(shí),區(qū)域的數(shù)值代表車(chē)輛在一個(gè)小時(shí)內(nèi)的流入流出量.使用TaxiBJ數(shù)據(jù)集將北京市6環(huán)以?xún)?nèi)劃分為32×32個(gè)區(qū)域,每個(gè)網(wǎng)格的長(zhǎng)和寬大約為1.8km,每個(gè)時(shí)間間隔設(shè)置為半小時(shí).兩個(gè)數(shù)據(jù)集都使用歸一化方法將交通流量數(shù)據(jù)壓縮到[-1,1]的范圍內(nèi).
實(shí)驗(yàn)采用Keras框架實(shí)現(xiàn)ST-3DGN模型.近期依賴(lài)序列長(zhǎng)度設(shè)置為6和遠(yuǎn)期依賴(lài)序列長(zhǎng)度設(shè)置為4;3D卷積為4層,每層有64個(gè)濾波器,第1層三維卷積核大小為10×3×3,其余的三維卷積核都為3×3×3.改進(jìn)ResPlus單元數(shù)目為4,每個(gè)ResPlus包含Conv和ConvPlus單元,Conv和ConvPlus的通道數(shù)量都為64個(gè),卷積核大小為3×3,ConvPlus中包含全局卷積神經(jīng)網(wǎng)絡(luò)和普通卷積神經(jīng)網(wǎng)絡(luò),全局卷積神經(jīng)網(wǎng)絡(luò)的通道數(shù)為8,卷積核大小與網(wǎng)格大小相同.空間注意力機(jī)制的卷積核大小為3*3.
對(duì)比模型:本文將ST-3DGN模型和下面7種基線(xiàn)算法比較.基線(xiàn)算法中參數(shù)的設(shè)置為原文中使用的數(shù)值,實(shí)驗(yàn)結(jié)果是使用早停機(jī)制的最優(yōu)結(jié)果.
HA:通過(guò)相應(yīng)時(shí)期的歷史流入和流出的平均值來(lái)預(yù)測(cè)人群的流入和流出.
ARIMA[19]:是時(shí)間序列預(yù)測(cè)分析方法之一,全稱(chēng)叫做自回歸差分移動(dòng)平均模型.
LSTM[2]:循環(huán)神經(jīng)網(wǎng)絡(luò),一種特殊的RNN.LSTM單元由輸入門(mén)、輸出門(mén)和遺忘門(mén)組成,可用于序列系列類(lèi)型的數(shù)據(jù)處理.
GRU[1]:遞歸神經(jīng)網(wǎng)絡(luò),只有兩個(gè)門(mén),一個(gè)復(fù)位門(mén)和一個(gè)更新門(mén),擅長(zhǎng)處理序列類(lèi)型的數(shù)據(jù).
ConvLSTM[20]:一種擅長(zhǎng)捕捉時(shí)空特性的LSTM,可以對(duì)城市區(qū)域人流的時(shí)間和空間相關(guān)性同時(shí)建模.
ST-ResNet[3]:一種基于殘差學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型,可以有效捕捉時(shí)空特性和解決梯度爆炸問(wèn)題.
DeepSTN+[17]:一個(gè)基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)超大城市的區(qū)域人流量,通過(guò)對(duì)城市交通流量的大范圍的空間依賴(lài)關(guān)系建模,同時(shí)使用融合POI分布和時(shí)間因素的方式引入城市區(qū)域人群流量的流動(dòng)性先驗(yàn)知識(shí),最后通過(guò)融合機(jī)制可穩(wěn)定并提升預(yù)測(cè)性能.
ST-MetaNet[21]:一個(gè)基于深度元學(xué)習(xí)的模型,擅長(zhǎng)處理時(shí)空數(shù)據(jù),通過(guò)使用編碼器學(xué)習(xí)歷史信息,同時(shí)使用解碼器逐步進(jìn)行預(yù)測(cè),能夠有效捕獲交通流量的時(shí)空相關(guān)性,因此該網(wǎng)絡(luò)在交通流量預(yù)測(cè)方面具有優(yōu)秀的性能.
ST-3DGN-P:該模型使用3D模型和使用未改進(jìn)ResPlus模塊.
ST-3DGN:本文提出的模型,在ResPlus模塊中加入空間注意力并進(jìn)行優(yōu)化,結(jié)合3D模型使其能夠?qū)煌髁康牧鲃?dòng)性和周期性規(guī)律影響進(jìn)行建模,有效預(yù)測(cè)城市區(qū)域車(chē)流變化.
實(shí)驗(yàn)結(jié)果:分別在BikeNYC和TaxiBJ數(shù)據(jù)集上驗(yàn)證了ST-3DGN模型預(yù)測(cè)下一個(gè)時(shí)刻區(qū)域進(jìn)出流量的效果.實(shí)驗(yàn)采用均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)作為評(píng)價(jià)指標(biāo)對(duì)模型進(jìn)行評(píng)價(jià).如表2和圖7所示,本文模型預(yù)測(cè)效果明顯優(yōu)于其它方法.
實(shí)驗(yàn)結(jié)果分析:從表2和圖7中可以看出,其中HA、ARIMA、LSTM和GRU在實(shí)驗(yàn)中效果相對(duì)較差,因?yàn)樗鼈冎豢紤]了城市交通流量變化中的時(shí)間相關(guān)性,卻忽視了城市區(qū)域交通流量的空間相關(guān)性.HA算法只捕捉流量數(shù)據(jù)的周期性模式,而忽略了最近的時(shí)間相關(guān)性,而ARIMA只考慮了時(shí)間相關(guān)性忽視了流量數(shù)據(jù)的周期性.從實(shí)驗(yàn)結(jié)果可以看出,ARIMA模型預(yù)測(cè)效果明顯比HA好,這可能是因?yàn)槎唐诔鞘袇^(qū)域未來(lái)交通流量流量很大程度上取決于近期城市區(qū)域間的交通流量.
圖7 模型性能對(duì)比Fig.7 Model performance comparison
表2 不同方法在兩個(gè)數(shù)據(jù)集上的預(yù)測(cè)性能比較Table 2 Performance comparison of different methods on the two datasets
其次,LSTM和GRU都是基于循環(huán)神經(jīng)網(wǎng)絡(luò)的模型.LSTM是一種為了解決存在于RNN結(jié)構(gòu)無(wú)法解決的長(zhǎng)期依賴(lài)問(wèn)題而被設(shè)計(jì)出來(lái)的結(jié)構(gòu),由于其獨(dú)特的重復(fù)神經(jīng)網(wǎng)絡(luò)的鏈?zhǔn)叫问?LSTM適合處理和預(yù)測(cè)時(shí)間序列問(wèn)題.GRU是LSTM的一種變體,它的結(jié)構(gòu)比LSTM更加簡(jiǎn)單,它同樣也能處理長(zhǎng)期依賴(lài)問(wèn)題.從實(shí)驗(yàn)結(jié)果看,二者效果相似.LSTM和GRU都只模擬時(shí)間特征,沒(méi)有考慮空間信息.盡管LSTM和GRU在理論上可以捕獲長(zhǎng)期依賴(lài)關(guān)系,但是在實(shí)驗(yàn)中,當(dāng)輸入序列過(guò)長(zhǎng)且多余時(shí),很難進(jìn)行有效的訓(xùn)練,訓(xùn)練時(shí)長(zhǎng)也會(huì)比卷積神經(jīng)網(wǎng)絡(luò)長(zhǎng).
ConvLSTM和ST-ResNet可以捕獲時(shí)間和空間相關(guān)性.然而,ConvLSTM沒(méi)有考慮到城市區(qū)域車(chē)流具有流動(dòng)性,也沒(méi)有對(duì)周期性和趨勢(shì)信息進(jìn)行建模.ST-ResNet使用基于卷積神經(jīng)網(wǎng)絡(luò)的殘差結(jié)構(gòu)分3個(gè)通道,對(duì)長(zhǎng)短時(shí)間依賴(lài)和遠(yuǎn)近城市區(qū)域之間的依賴(lài)進(jìn)行建模.但是ST-ResNet對(duì)遠(yuǎn)距離空間依賴(lài)性建模是通過(guò)加深網(wǎng)絡(luò)層數(shù)的方法,因此深層網(wǎng)絡(luò)結(jié)構(gòu)會(huì)導(dǎo)致訓(xùn)練困難和遠(yuǎn)距離空間依賴(lài)捕獲不完全.DeepSTN+考慮了城市交通流量的遠(yuǎn)距離依賴(lài)關(guān)系,ST-MetaNet使用seq2seq的架構(gòu)捕獲城市交通流量的時(shí)空相關(guān)性,但這些模型都沒(méi)有考慮到城市交通是一個(gè)動(dòng)態(tài)的過(guò)程.從實(shí)驗(yàn)結(jié)果中可以發(fā)現(xiàn),對(duì)時(shí)空建模預(yù)測(cè)效果明顯優(yōu)于比只對(duì)時(shí)間建模的效果.
與這些基線(xiàn)方法相比,ST-3DGN和ST-3DGN-p明顯優(yōu)于其它算法,因?yàn)檫@兩個(gè)算法不僅考慮了城市區(qū)域車(chē)流是一個(gè)動(dòng)態(tài)的過(guò)程,還考慮了局部時(shí)空動(dòng)態(tài)相關(guān)性和全局時(shí)空相關(guān)性.在時(shí)間維度,模型還考慮了車(chē)流的周期規(guī)律和近期依賴(lài)影響.ST-3DGN使用3D卷積代替二維卷積對(duì)城市局部區(qū)域時(shí)空相關(guān)性進(jìn)行建模,有效提升了預(yù)測(cè)性能,說(shuō)明了考慮城市區(qū)域車(chē)流流動(dòng)性的重要性.ST-3DGN比ST-3DGN-p稍有提升,ST-3DGN-p中對(duì)全局時(shí)空相關(guān)性建模使用的是原始ResPlus單元,雖然相對(duì)于ST-ResNet能夠更好的捕獲遠(yuǎn)距離空間依賴(lài)性,但是卻忽視了地理信息因素的重要性.
ST-3DGN對(duì)ResPlus單元進(jìn)行了改進(jìn),考慮了現(xiàn)實(shí)中地理位置對(duì)交通流量的影響,在全局流動(dòng)時(shí)空相關(guān)性模塊中加入空間注意力機(jī)制,能夠更好地對(duì)遠(yuǎn)距離區(qū)域交通流量空間依賴(lài)性進(jìn)行建模.ST-3DGN使用了早期融合機(jī)制,參數(shù)量比ST-ResNet少,能夠更好地避免梯度爆炸問(wèn)題.該模型在兩個(gè)真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)性能提高了9%~14%,表明了本文提出的模型的優(yōu)越性.
為了充分驗(yàn)證模型的魯棒性,本實(shí)驗(yàn)將TaxiBJ數(shù)據(jù)分為4個(gè)部分:2013年7月1日~2013年10月30日、2014年3月1日~2014年6月30日、2015年3月1日~2015年6月30日、2015年11月1日~2016年4月10日.本實(shí)驗(yàn)將測(cè)試集都設(shè)置為10天,大部分超參數(shù)與前面測(cè)試相同.實(shí)驗(yàn)結(jié)果如表3和圖8所示.從圖表中可以看出,ST-3DGN在每個(gè)數(shù)據(jù)集上都優(yōu)于效果最好的ST-ResNet模型.結(jié)果表明,對(duì)于短期交通流量預(yù)測(cè)問(wèn)題,ST-3DGN具有較高的魯棒性.
表3 ST-ResNet和ST-3DGN在TaxiBJ數(shù)據(jù)集上的效果Table 3 RMSE results of ST-ResNet and ST-3DGN on TaxiBJ data set
圖8 不同年份的模型性能對(duì)比Fig.8 Model performance comparison under different years
本文提出了一種融合時(shí)空動(dòng)態(tài)相關(guān)性和遠(yuǎn)距離區(qū)域交通流量影響的城市區(qū)域車(chē)流預(yù)測(cè)的新穎模型ST-3DGN,該模型以時(shí)空數(shù)據(jù)為輸入,能同時(shí)建模交通流量的動(dòng)態(tài)相關(guān)性和遠(yuǎn)距離地區(qū)間的車(chē)流影響,并能很好地融合不同功能.使用兩種不同的真實(shí)數(shù)據(jù)集驗(yàn)證ST-3DGN的性能,將本文的模型與其它經(jīng)典的方法進(jìn)行比較.結(jié)果表明,該模型在不同的數(shù)據(jù)集上表現(xiàn)得非常穩(wěn)定.本文提出的模型還可以用在城市交通擁堵預(yù)測(cè)和交通干道的車(chē)量流速上,在這些領(lǐng)域有著良好的應(yīng)用前景.在交通流量預(yù)測(cè)中,天氣變化和突發(fā)事故是城市交通流量變化的重要影響因素.將這些外部影響因素有效地融合到模型中,提升模型的預(yù)測(cè)精度是下一步要考慮的工作.