楊建喜,郁超順,李韌*,杜利芳,蔣仕新,王笛
(重慶交通大學(xué),a.信息科學(xué)與工程學(xué)院;b.交通運(yùn)輸學(xué)院,重慶400074)
隨著感應(yīng)線圈、測(cè)速雷達(dá)等智能感知終端快速部署應(yīng)用,當(dāng)前路網(wǎng)環(huán)境中已積累海量的交通感知數(shù)據(jù),并呈現(xiàn)多源異構(gòu)及高速增長(zhǎng)等大數(shù)據(jù)特性。近年來,以上述路網(wǎng)交通感知數(shù)據(jù)為基礎(chǔ),結(jié)合大數(shù)據(jù)、人工智能等新興技術(shù),深度賦能路網(wǎng)交通狀態(tài)智能化分析與預(yù)測(cè)已成為大數(shù)據(jù)時(shí)代智能交通領(lǐng)域研究的迫切任務(wù)[1]。
目前,國(guó)內(nèi)外學(xué)者圍繞智能交通感知獲取的交通流量、密度和通行速度三大宏觀交通狀態(tài)指標(biāo),結(jié)合以卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)為代表的神經(jīng)網(wǎng)絡(luò)理論方法已成為路網(wǎng)交通狀態(tài)預(yù)測(cè)方向當(dāng)前的發(fā)展趨勢(shì),并開展了較多研究[2]。在交通流量預(yù)測(cè)方面:劉小明等[3]考慮交通流量時(shí)延特性,利用長(zhǎng)短時(shí)記憶(Long Short-Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)進(jìn)行多斷面短時(shí)交通流預(yù)測(cè);Liu等[4]聯(lián)合卷積模塊與長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò),提出Conv-LSTM 模塊提取交通流的時(shí)空特征,并利用雙向LSTM 提取時(shí)序特征,從而預(yù)測(cè)交通流的未來趨勢(shì);馮寧等[5]提出了面向高速公路交通流預(yù)測(cè)的融合周、日和近期多組件時(shí)空?qǐng)D卷積神經(jīng)網(wǎng)絡(luò)(Multi-component Spatial-temporal Graph Convolution Networks,MSTGCN);Guo等[6]在MSTGCN基礎(chǔ)上引入注意力機(jī)制來捕獲交通網(wǎng)絡(luò)的動(dòng)態(tài)時(shí)空相關(guān)性,提出多組件時(shí)空注意力圖卷積神經(jīng)網(wǎng)絡(luò)(Attention based Spatial-Temporal Graph Convolutional Networks,ASTGCN)。上述深度神經(jīng)網(wǎng)絡(luò)模型在交通流量預(yù)測(cè)任務(wù)方面取得了較好性能。
另一方面,通行速度作為交通狀態(tài)評(píng)價(jià)的重要指標(biāo)[7],更能反映路網(wǎng)交通擁堵狀況。國(guó)內(nèi)外研究人員在深度神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)的路網(wǎng)通行速度預(yù)測(cè)任務(wù)方面同樣開展了一定有益探索。Ma 等[8]將LSTM網(wǎng)絡(luò)應(yīng)用于交通路網(wǎng)通行速度預(yù)測(cè)中,以實(shí)現(xiàn)交通感知數(shù)據(jù)的時(shí)序特征建模。將通行速度轉(zhuǎn)化為圖像,利用CNN 以類圖像學(xué)習(xí)的方式[9],具有較好的空間特征提取能力。但上述通行速度預(yù)測(cè)方法僅涉及時(shí)序或空間信息相關(guān)性,未考慮時(shí)空雙維度特征的同時(shí)提取。為彌補(bǔ)其不足,Liu 等[10]聯(lián)合CNN-LSTM構(gòu)建了面向路網(wǎng)交通通行速度預(yù)測(cè)的神經(jīng)網(wǎng)絡(luò)模型,其中卷積層提取的交通數(shù)據(jù)空間特征,以供LSTM 捕獲長(zhǎng)時(shí)依賴關(guān)系;但因池化操作主動(dòng)丟棄大量特征,造成空間節(jié)點(diǎn)關(guān)聯(lián)信息丟失。Zhao 等[11]聯(lián)合圖卷積(Graph Convolutional Networks,GCN)和門控循環(huán)單元(Gated Recurrent Unit,GRU)預(yù)測(cè)路網(wǎng)交通通行速度。以圖結(jié)構(gòu)的形式學(xué)習(xí)路網(wǎng)空間相關(guān)性避免了空間信息的丟失,且加強(qiáng)了復(fù)雜路網(wǎng)的空間相關(guān)性學(xué)習(xí)能力。但基于圖神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型,對(duì)訓(xùn)練與推理時(shí)間、計(jì)算資源提出較高的要求,且前期大規(guī)模復(fù)雜路網(wǎng)鄰接矩陣的構(gòu)建是一項(xiàng)繁瑣且費(fèi)時(shí)費(fèi)力的工作。此外,上述工作在歷史交通狀態(tài)周期性建模、中長(zhǎng)時(shí)多步預(yù)測(cè)的準(zhǔn)確性與穩(wěn)定性有待進(jìn)一步提升。
綜上所述,以時(shí)空神經(jīng)網(wǎng)絡(luò)為主干的大規(guī)模路網(wǎng)交通通行速度預(yù)測(cè)具有重要意義和應(yīng)用前景。本文針對(duì)交通流動(dòng)態(tài)變化、多因素非線性的時(shí)空關(guān)聯(lián)性,開展空間節(jié)點(diǎn)相關(guān)性自適應(yīng)捕獲、周期性長(zhǎng)時(shí)依賴提取的中長(zhǎng)時(shí)多步路網(wǎng)通行速度預(yù)測(cè)方法研究,主要貢獻(xiàn)包括4個(gè)方面:
(1)提出一種面向大規(guī)模路網(wǎng)通行速度預(yù)測(cè)任務(wù)的端到端深度神經(jīng)網(wǎng)絡(luò)模型,對(duì)時(shí)空三維交通數(shù)據(jù)矩陣的時(shí)空特征雙維度挖掘。依次通過卷積層和GRU層將輸入數(shù)據(jù)編碼為深度時(shí)空上下文特征矩陣,再將預(yù)測(cè)卷積層代替?zhèn)鹘y(tǒng)全連接層,進(jìn)行高效預(yù)測(cè)。
(2)引入僅包含多尺度卷積層的交通數(shù)據(jù)空間特征提取單元,避免空間節(jié)點(diǎn)關(guān)聯(lián)信息丟失與前期路網(wǎng)鄰接矩陣構(gòu)建的繁瑣工作,自適應(yīng)捕獲路網(wǎng)不同空間視角下的交通路網(wǎng)上下游節(jié)點(diǎn)通行速度空間相關(guān)性特征與多變量交通時(shí)空序列數(shù)據(jù)相互關(guān)聯(lián)。
(3)聯(lián)合交通狀態(tài)周期建模與GRU的長(zhǎng)時(shí)特征提取方法,GRU學(xué)習(xí)單周期組件內(nèi)時(shí)序信息,再以多周期組件的權(quán)重自適應(yīng)融合預(yù)測(cè)。該方法避免了長(zhǎng)時(shí)間序列的數(shù)據(jù)冗余,同時(shí)具有長(zhǎng)時(shí)依賴關(guān)系的提取能力。
(4)基于兩個(gè)真實(shí)的路網(wǎng)交通數(shù)據(jù)集開展方法驗(yàn)證,本文提出的模型在大規(guī)模交通路網(wǎng)場(chǎng)景下具有較好的預(yù)測(cè)性能和中長(zhǎng)時(shí)預(yù)測(cè)穩(wěn)定性,且優(yōu)于其他基準(zhǔn)模型。
在數(shù)據(jù)及問題特性方面,正如文獻(xiàn)[5]分析,路網(wǎng)環(huán)境下獲取的交通量、通行速度等感知數(shù)據(jù)具有近期、日和周等不同時(shí)間粒度的周期性。例如,前一周對(duì)應(yīng)時(shí)段的交通數(shù)據(jù)、前一天對(duì)應(yīng)時(shí)段的交通數(shù)據(jù)與所需預(yù)測(cè)時(shí)間段內(nèi)的真實(shí)交通數(shù)據(jù)之間存在高度的時(shí)間趨勢(shì)相關(guān)性,同時(shí)近期的周期數(shù)據(jù)對(duì)于預(yù)測(cè)數(shù)據(jù)同樣具有較強(qiáng)的時(shí)間依賴。
基于此,本文將路網(wǎng)感知數(shù)據(jù)作為輸入,將其規(guī)約為時(shí)間-空間-特征的三維時(shí)空矩陣X∈RT×N×F,其中,T為時(shí)間序列的長(zhǎng)度,N為布設(shè)于路網(wǎng)中的傳感器數(shù)量,F(xiàn)為每個(gè)傳感器的數(shù)據(jù)維數(shù)。與文獻(xiàn)[5]不同的是,本文沒有顯示地定義路網(wǎng)中各傳感器的拓?fù)浣Y(jié)構(gòu)關(guān)系。具體而言,采用xf,i,t∈R 表示t時(shí)刻在傳感器節(jié)點(diǎn)i處第f維的數(shù)據(jù)值,xi,t∈RF表示t時(shí)刻在傳感器節(jié)點(diǎn)i處所有維度的數(shù)據(jù)值。用χt=(x1,t,x2,t,…,xN,t)∈RN×F表示t時(shí)刻路網(wǎng)中所有傳感器節(jié)點(diǎn)所有維度數(shù)據(jù)值。在此基礎(chǔ)上,定義三維矩陣X=(χ1,χ2,…,χT)∈RT×N×F表示時(shí)間序列T內(nèi)所有傳感器節(jié)點(diǎn)所有維度的數(shù)據(jù)值。設(shè)yi,t=xf,i,t∈R 為所需預(yù)測(cè)的未來時(shí)刻t路網(wǎng)節(jié)點(diǎn)i處的通行速度,yi=(yi,t+1,yi,t+2,…,yi,t+Tp)∈RTp表示所需預(yù)測(cè)的未來時(shí)間序列Tp內(nèi)路網(wǎng)節(jié)點(diǎn)i的通行速度。本文定義路網(wǎng)交通通行速度預(yù)測(cè)任務(wù)為:基于已知?dú)v史時(shí)間段T內(nèi)路網(wǎng)上所有節(jié)點(diǎn)所有維度的三維時(shí)空矩陣X,預(yù)測(cè)未來時(shí)間窗口長(zhǎng)度Tp內(nèi)路網(wǎng)中所有節(jié)點(diǎn)的通行速度矩陣Yp=(y1,y2,…,yN)∈RN×Tp。
基于上述問題定義,提出一種聯(lián)合全卷積(Full Convolutional,FConv)和門控循環(huán)單元(GRU)的多周期組件時(shí)空神經(jīng)網(wǎng)絡(luò)(Multi-periodiccomponents Spatial-Temporal Neural Network via Full Convolutional and Gated Recurrent Unit,MSTNN-FConv-GRU)。如圖1所示,該網(wǎng)絡(luò)模型整體架構(gòu)包含3個(gè)共享相同網(wǎng)絡(luò)結(jié)構(gòu)的周、日和近期的周期組件。將歷史交通數(shù)據(jù)X劃分為周數(shù)據(jù)Xw、日數(shù)據(jù)Xd、近期數(shù)據(jù)Xr分別作為3 個(gè)組件的數(shù)據(jù)輸入,每個(gè)組件都由空間維FConv層和時(shí)間維GRU層組成。其中,F(xiàn)Conv層采用多尺度策略捕獲路網(wǎng)不同視角下的通行速度空間特征,GRU 層對(duì)相鄰時(shí)間片之間的時(shí)間依賴關(guān)系進(jìn)行建模。為防止網(wǎng)絡(luò)退化,優(yōu)化訓(xùn)練效率,每部分周期組件引入殘差學(xué)習(xí)框架[12]。最后,將3 部分組件預(yù)測(cè)的周結(jié)果、日結(jié)果和近期結(jié)果融合預(yù)測(cè)未來特定時(shí)間窗口Tp下的路網(wǎng)通行速度。
圖1 MSTNN-FConv-GRU網(wǎng)絡(luò)模型架構(gòu)Fig.1 Architecture of proposed MSTNN-FConv-GRU model
通行速度等感知數(shù)據(jù)的空間特征主要體現(xiàn)在各傳感器所部署的空間地理位置相關(guān)性,即各節(jié)點(diǎn)獲取的感知信息往往會(huì)受相鄰節(jié)點(diǎn)的交通狀態(tài)相互影響。鑒于此,采用CNN 模型的卷積算子進(jìn)行空間特征提取。
為進(jìn)一步減輕網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度、避免空間節(jié)點(diǎn)關(guān)聯(lián)信息的丟失,在負(fù)責(zé)特征提取的FConv模塊中,僅使用L=3 個(gè)不同大小卷積核的卷積層來獲取空間相關(guān)性。如第1節(jié)所述,將路網(wǎng)中N個(gè)傳感器獲取到F個(gè)采樣頻率一致的時(shí)間序列長(zhǎng)度為T的時(shí)空數(shù)據(jù)視作時(shí)間-空間-特征三維時(shí)空矩陣X∈RT×N×F,即每個(gè)傳感器節(jié)點(diǎn)的每個(gè)采樣時(shí)間點(diǎn)會(huì)采集到一個(gè)長(zhǎng)度為F的特征向量,每個(gè)采樣時(shí)間點(diǎn)則會(huì)生成一個(gè)N×F的空間特征時(shí)間片矩陣。遍歷空間特征時(shí)間片矩陣,分別對(duì)每個(gè)時(shí)間片矩陣采用L=3 個(gè)不同大小的卷積核捕獲不同空間視角下空間相關(guān)性特征與多變量非線性相關(guān)性,將提取出的交通特征進(jìn)一步組合成多空間維度的交通特征。本文采用的空間維多尺度FConv 模塊結(jié)構(gòu)如圖2所示。
圖2 空間維多尺度FConv模塊Fig.2 Multi-scale convolution in spatial dimension
圖2中,以t時(shí)刻空間特征時(shí)間片矩陣χt為例,空間卷積模塊中每個(gè)卷積核大小為K×F,步長(zhǎng)為1。通過卷積操作提取長(zhǎng)度為N的空間特征向量ml進(jìn)行水平拼接,構(gòu)建尺寸大小為N×L的空間特征矩陣M=[m1,m2,…,mL]。再使用S×S卷積核對(duì)空間特征矩陣M融合不同空間視角下特征,其輸出長(zhǎng)度為N的t時(shí)刻融合特征向量vt為
式中:W和Wl分別為融合卷積層的卷積核和特征提取卷積層中第l個(gè)卷積核的權(quán)重;b和bl分別為相應(yīng)偏置;*為卷積操作。
最后,對(duì)不同時(shí)刻的融合特征向量水平拼接,并使用激活函數(shù)Re LU(x)=max(0,x)非線性映射,使得空間維卷積模塊可以擬合復(fù)雜交通數(shù)據(jù)的非線性關(guān)系,構(gòu)建N×T的特征矩陣。
通行速度數(shù)據(jù)也具有明顯的時(shí)間相關(guān)特征,且呈現(xiàn)出較強(qiáng)短時(shí)相關(guān)性與長(zhǎng)時(shí)依賴性。針對(duì)通行速度數(shù)據(jù)的時(shí)間特征挖掘,應(yīng)同時(shí)考慮長(zhǎng)期依賴性。
作為一種改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型,GRU 善于發(fā)現(xiàn)時(shí)序數(shù)據(jù)的長(zhǎng)期復(fù)雜性規(guī)律,適宜處理長(zhǎng)期時(shí)序數(shù)據(jù)。另外,相較于LSTM 模型,GRU的網(wǎng)絡(luò)結(jié)構(gòu)更為簡(jiǎn)單高效。GRU中存在一個(gè)記憶狀態(tài)單元以及重置門、更新門兩個(gè)門控機(jī)制[13]。通過門控機(jī)制對(duì)信息進(jìn)行選擇性丟棄或更新,實(shí)現(xiàn)有效的時(shí)序數(shù)據(jù)特征提取。本文采用的GRU模塊網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 GRU神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Architecture of GRU model
在聯(lián)合模型中,通過空間卷積模塊提取后的空間特征二維矩陣為V=(v′1,v′2,…,v′T),將其輸入到GRU 中,從而提取數(shù)據(jù)的時(shí)序特征。具體計(jì)算公式為
式中:Rt為重置門;Zt為更新門;為當(dāng)前時(shí)刻輸入狀態(tài);Ht-1為t-1 時(shí)刻隱藏層輸出狀態(tài);為候選隱藏狀態(tài);Ht為當(dāng)前時(shí)刻隱藏狀態(tài);Wr、Wz、Wh?分別表示更新門、重置門、候選隱藏狀態(tài)學(xué)習(xí)的權(quán)重參數(shù);br、bz和bh為偏置;⊙為對(duì)應(yīng)元素乘積的哈達(dá)馬積;sigmoid(x)=、tanh(x)=分別為將變量映射到(0,1)和(-1,1)之間的激活函數(shù)。
圖4 聯(lián)合FConv-GRU時(shí)空神經(jīng)網(wǎng)絡(luò)架構(gòu)Fig.4 Architecture of FConv-GRU model
在上述聯(lián)合FConv-GRU的時(shí)空特征提取組件基礎(chǔ)上,針對(duì)交通數(shù)據(jù)進(jìn)行周期性建模。構(gòu)建3個(gè)基于FConv-GRU模型的相同網(wǎng)絡(luò)結(jié)構(gòu):周、日和近期周期組件,分別提取不同時(shí)間粒度的特征。
設(shè)采樣頻率為每天q次,沿時(shí)間軸分別截取時(shí)間序列長(zhǎng)度為Tw、Td和Tr的周時(shí)間片矩陣序列作為輸入,各個(gè)時(shí)間片矩陣為
由于不同路網(wǎng)節(jié)點(diǎn)受時(shí)間周期的影響程度不同,自適應(yīng)學(xué)習(xí)周、日、近期3 部分組件的權(quán)重系數(shù),捕獲不同時(shí)間周期對(duì)預(yù)測(cè)時(shí)段交通狀態(tài)的影響程度。
式中:θw、θd和θr分別為周、日和近期組件的權(quán)重參數(shù);、和為周、日和近期組件的預(yù)測(cè)結(jié)果;為融合各周期組件預(yù)測(cè)的路網(wǎng)通行速度。
為驗(yàn)證所提出MSTNN-FConv-GRU 模型的路網(wǎng)通行速度預(yù)測(cè)性能,分別選取滴滴蓋亞計(jì)劃成都市交通指數(shù)數(shù)據(jù)[14]和美國(guó)加利福尼亞州高速公路PeMSD08 交通數(shù)據(jù)[15]作為實(shí)驗(yàn)數(shù)據(jù)集。每個(gè)數(shù)據(jù)集按6∶2∶2劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集。
成都市交通指數(shù)數(shù)據(jù)(Travel Time Index of Chengdu,TTIC),采樣頻率為10 min·次-1,基于浮動(dòng)車軌跡的城市交通指數(shù)計(jì)算服務(wù)所得道路級(jí)交通指數(shù)數(shù)據(jù)和平均行駛速度這2 個(gè)維度的交通數(shù)據(jù)。選取2018年3月1日-4月30日,成都市三環(huán)內(nèi)196條路段具有城市交通特征的交通數(shù)據(jù)。
PeMSD08 高速公路的交通數(shù)據(jù),具有路網(wǎng)拓?fù)浣Y(jié)構(gòu),采樣頻率為30 s·次-1,8 條高速公路上的1979 個(gè)檢測(cè)器包含車流量、平均車速、平均車道占用率這3 個(gè)維度的交通數(shù)據(jù)。剔除了過近的檢測(cè)器節(jié)點(diǎn)和時(shí)間節(jié)點(diǎn)的數(shù)據(jù),選取2016年7月1日-8月31日的數(shù)據(jù)作為模型驗(yàn)證數(shù)據(jù),并匯總成以5 min為時(shí)間間隔,8 條路段上170 個(gè)節(jié)點(diǎn)具有高速公路交通特征的交通數(shù)據(jù)。
將上述兩個(gè)數(shù)據(jù)集構(gòu)造成維度為T×N×F的時(shí)空三維矩陣作為網(wǎng)絡(luò)模型的輸入。為避免數(shù)據(jù)之間量綱不同帶來的誤差,對(duì)數(shù)據(jù)z-score標(biāo)準(zhǔn)化預(yù)處理。
式中:mean和std 分別為求均值和標(biāo)準(zhǔn)偏差的操作。
通過實(shí)驗(yàn)調(diào)參選定最佳超參數(shù),將L和S設(shè)置為3,因TTIC 與PeMSD08 數(shù)據(jù)集的維度和采樣頻率不同,分別將F設(shè)置為2和3,Tw、Td和Tr設(shè)置為1,1,3 h,Tstep設(shè)置為6和12。在空間維卷積層使用3個(gè)通道數(shù)為64、卷積核尺寸分別為3×F、5×F和7×F的卷積核,其中,F(xiàn)為數(shù)據(jù)維度。再使用1個(gè)通道數(shù)為64,卷積核尺寸為3×3的卷積核對(duì)空間特征矩陣進(jìn)行特征融合。在時(shí)間維特征提取模塊,設(shè)置GRU 層數(shù)為3,隱藏層層數(shù)為時(shí)間步長(zhǎng)Tstep。在預(yù)測(cè)卷積層確定通道數(shù)為Tstep,卷積核尺寸為1×64的卷積進(jìn)行預(yù)測(cè)。為優(yōu)化預(yù)測(cè)值與真實(shí)值的差異程度,損失函數(shù)采用均方誤差損失。具體如圖5所示。
圖5 MSTNN-FConv-GRU網(wǎng)絡(luò)模型超參數(shù)Fig.5 Hyper-parameters of MSTNN-FConv-GRU model
針對(duì)TTIC 數(shù)據(jù)集,將MSTNN-FConv-GRU 與LSTM[8]、CNN[9]、GRU[13]和Conv-LSTM[4]這4種經(jīng)典的深度神經(jīng)網(wǎng)絡(luò)與所提出的MSTNN-FConv-GRU模型進(jìn)行比較實(shí)驗(yàn)。此外,在具有路網(wǎng)拓?fù)浣Y(jié)構(gòu)的PeMSD08 數(shù)據(jù)集上,添加MSTGCN[5]和ASTGCN[6]這2 種基于圖卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比。采用平均絕對(duì)誤差EMAE、平均平方誤差ERMSE和平均絕對(duì)百分比誤差EMAPE作為評(píng)價(jià)指標(biāo),未來1 h路網(wǎng)通行速度的預(yù)測(cè)效果分別如表1和表2所示。
表1 不同模型在TTIC數(shù)據(jù)集上的性能比較Table 1 Performance comparison of different approaches on TTIC dataset
表2 不同模型在PeMSD08數(shù)據(jù)集上的性能比較Table 2 Performance comparison of different approaches on PeMSD08 dataset
MSTNN-FConv-GRU在評(píng)價(jià)指標(biāo)中,面向城市路網(wǎng)與高速公路路網(wǎng)通行速度預(yù)測(cè)均取得最佳的精度性能,并且模型推理訓(xùn)練時(shí)間適中。針對(duì)城市路網(wǎng),由于城市交通狀況多變、拓?fù)浣Y(jié)構(gòu)復(fù)雜等特點(diǎn),相較于時(shí)間序列預(yù)測(cè)的模型,空間特征提取的網(wǎng)絡(luò)模型建模能力有限,預(yù)測(cè)效果不佳。同時(shí),LSTM與GRU 具有相當(dāng)?shù)念A(yù)測(cè)性能,但由于GRU 簡(jiǎn)化的網(wǎng)絡(luò)結(jié)構(gòu),模型推理訓(xùn)練速度稍快于LSTM。針對(duì)高速公路路網(wǎng),相較于城市交通狀態(tài)而言,高速公路路網(wǎng)空間拓?fù)浣Y(jié)構(gòu)較為簡(jiǎn)單,標(biāo)準(zhǔn)卷積與圖卷積均能較好地捕獲交通數(shù)據(jù)的空間特征。與需構(gòu)建路網(wǎng)鄰接矩陣的圖卷積相比,MSTNN-FConv-GRU速度更快。此外,考慮周期性特征的多組件時(shí)空神經(jīng)網(wǎng)絡(luò)使得循環(huán)神經(jīng)網(wǎng)絡(luò)更好提取時(shí)序特征,預(yù)測(cè)性能優(yōu)于一般深度學(xué)習(xí)模型。
同時(shí)在TTIC和PeMSD08 數(shù)據(jù)集上分別以10 min和5 min 為時(shí)間間隔增長(zhǎng),使預(yù)測(cè)時(shí)長(zhǎng)增長(zhǎng)至1 h,對(duì)比各個(gè)網(wǎng)絡(luò)模型隨著預(yù)測(cè)時(shí)長(zhǎng)增長(zhǎng)的性能變化情況,實(shí)驗(yàn)結(jié)果如圖6所示。
圖6 不同模型隨預(yù)測(cè)時(shí)長(zhǎng)的性能變化Fig.6 Performance changes of different methods along with forecasting duration
隨著預(yù)測(cè)時(shí)長(zhǎng)的增長(zhǎng),基于循環(huán)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法變化趨勢(shì)平穩(wěn),但預(yù)測(cè)精度有待提高。大多數(shù)網(wǎng)絡(luò)模型的整體誤差隨著預(yù)測(cè)時(shí)長(zhǎng)的增長(zhǎng)逐漸增大。MSTNN-FConv-GRU 模型在短時(shí)與中長(zhǎng)時(shí)路網(wǎng)交通速度精度均優(yōu)于其他基準(zhǔn)方法,并且誤差增長(zhǎng)趨勢(shì)平緩,未發(fā)生激增突變。
本文提出聯(lián)合全卷積和門控循環(huán)單元的多周期組件時(shí)空神經(jīng)網(wǎng)絡(luò),在兩個(gè)公開交通數(shù)據(jù)集上實(shí)驗(yàn)驗(yàn)證,得到如下結(jié)論:
(1)在空間維特征提取方面,多尺度卷積模塊能夠以類圖像學(xué)習(xí)的形式自適應(yīng)學(xué)習(xí)交通時(shí)空矩陣中大規(guī)模路網(wǎng)不同空間視角下的交通狀態(tài)空間特征與交通時(shí)空序列數(shù)據(jù)多參數(shù)關(guān)聯(lián)性。
(2)在時(shí)間維特征提取方面,聯(lián)合交通數(shù)據(jù)周期建模與GRU的長(zhǎng)時(shí)特征提取方式,能夠較好地捕獲路網(wǎng)交通數(shù)據(jù)之間的周期特征與長(zhǎng)時(shí)期依賴關(guān)系,進(jìn)而提升模型中長(zhǎng)時(shí)多步預(yù)測(cè)的性能。
(3)在模型推理時(shí)效性方面,以全卷積模塊代替圖神經(jīng)網(wǎng)絡(luò)、預(yù)測(cè)卷積層代替?zhèn)鹘y(tǒng)全連接層等高效簡(jiǎn)潔的神經(jīng)網(wǎng)絡(luò)模塊,在保證預(yù)測(cè)精度的前提下,提升網(wǎng)絡(luò)模型計(jì)算速度。
在空間特征提取方面,卷積模塊以類似圖像的學(xué)習(xí)方式捕獲大規(guī)模路網(wǎng)空間特征,但仍由卷積操作提取的局部特征組合而成;在時(shí)間維特征提取方面,對(duì)于交通數(shù)據(jù)不同時(shí)間粒度融合精細(xì)化程度有待進(jìn)一步提高。后續(xù)擬繼續(xù)研究如何自適應(yīng)學(xué)習(xí)路網(wǎng)中各傳感器的拓?fù)浣Y(jié)構(gòu)關(guān)系,提取全局路網(wǎng)時(shí)空特征以及不同時(shí)間粒度精細(xì)化融合方式。