張永凱,武志昊,3,林友芳,3,趙苡積*
(1.北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院,北京 100044;2.交通數(shù)據(jù)分析與挖掘北京市重點(diǎn)實(shí)驗(yàn)室(北京交通大學(xué)),北京 100044;3.中國(guó)民用航空局民航旅客服務(wù)智能化應(yīng)用技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 100105)
(?通信作者電子郵箱yijizhao@bjtu.edu.cn)
交通流量預(yù)測(cè)是智能交通系統(tǒng)[1]中重要的研究課題之一,準(zhǔn)確地預(yù)測(cè)交通流量對(duì)城市智能交通管理有著重大的意義[2]。例如,交通管理部門(mén)可以基于預(yù)測(cè)結(jié)果提前進(jìn)行交通管控,疏導(dǎo)擁堵車(chē)流,降低安全隱患。
準(zhǔn)確地預(yù)測(cè)交通流量是富有挑戰(zhàn)性的,主要原因在于一個(gè)站點(diǎn)的當(dāng)前狀態(tài)會(huì)同時(shí)影響到自身及其鄰居的未來(lái)狀態(tài)。如圖1(a)所示,當(dāng)位置A在t1時(shí)間步發(fā)生交通擁堵或事故時(shí),其交通狀態(tài)可能直接影響到自身及其鄰近位置B、C、D、E在t2時(shí)間步的狀態(tài)。該影響可以被表示為圖1(b)中At1(即位置A在t1時(shí)間步的狀態(tài),下同)與At2、Bt2、Ct2、Dt2、Et2之間存在的跨時(shí)空維度的直接關(guān)聯(lián)性(圖中虛線(xiàn)所示)。此外,位置A、B、C、D、E之間還存在空間關(guān)聯(lián)性(圖中實(shí)線(xiàn)所示),即它們因地理位置鄰近而在單個(gè)時(shí)間步內(nèi)可能呈現(xiàn)相似的交通狀態(tài)。上述現(xiàn)象說(shuō)明At1、At2、Bt2、Ct2、Dt2、Et2彼此之間都存在著緊密的關(guān)聯(lián)。這些關(guān)聯(lián)通常同時(shí)存在,共同組成了一種復(fù)雜的局部時(shí)空關(guān)系。
圖1 交通流量數(shù)據(jù)的復(fù)雜關(guān)系與建模方案Fig.1 Complex relationships and modeling schemes of traffic flow data
為了建模上述關(guān)系,近期的一些工作通過(guò)將流量預(yù)測(cè)問(wèn)題轉(zhuǎn)化為時(shí)空?qǐng)D預(yù)測(cè)問(wèn)題取得了較大的進(jìn)展。一種代表性的方案是從復(fù)雜的局部時(shí)空關(guān)系中抽取部分易于被現(xiàn)有模型所捕獲的關(guān)系,并構(gòu)造深度學(xué)習(xí)模型來(lái)捕獲它們。如圖1(c)所示,大多數(shù)現(xiàn)有的模型遵循STGCN(Spatio-Temporal Graph Convolutional Network)[3]和DCRNN(Diffusion Convolutional Recurrent Neural Network)[4]的設(shè)計(jì)范式,采用空間組件(如圖卷積網(wǎng)絡(luò)(Graph Convolutional Network,GCN)[5]來(lái)捕獲空間維度上的相關(guān)性(圖中實(shí)線(xiàn)所示),并結(jié)合時(shí)間組件(如循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)[6-7]或一維卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)[8])來(lái)捕獲時(shí)間維度上的相關(guān)性(圖中虛線(xiàn)所示)。由于空間組件和時(shí)間組件分離,這些模型無(wú)法建模時(shí)間維度和空間維度之間的相互作用。最近,Song 等[9]將時(shí)間維度和空間維度上的關(guān)系視為是同步的(即一個(gè)整體),并構(gòu)造了一種時(shí)空同步圖卷積網(wǎng)絡(luò)STSGCN(Spatial-Temporal Synchronous Graph Convolutional Network)預(yù)測(cè)模型來(lái)同時(shí)捕獲兩個(gè)維度上的關(guān)系。盡管上述模型都取得了不錯(cuò)的效果,但是它們只捕獲了局部時(shí)空關(guān)系中易于建模的一部分關(guān)系,大量的跨時(shí)空維度的直接關(guān)聯(lián)性在上述模型中沒(méi)有被顯式建模。雖然上述模型可以通過(guò)大量組件迭代來(lái)間接地將At1的信息傳遞給Dt2以模擬跨時(shí)空關(guān)聯(lián),但是傳遞過(guò)程中的信息損耗導(dǎo)致這種模擬的關(guān)系存在誤差,隨著組件增多,迭代誤差會(huì)逐漸累積,因此上述方法不能準(zhǔn)確且全面地建模復(fù)雜的局部時(shí)空關(guān)系。
為了解決上述問(wèn)題,本文提出使用超圖[10]來(lái)對(duì)復(fù)雜的局部時(shí)空關(guān)系進(jìn)行建模。具體而言,如圖1(d)所示,將t1時(shí)間步的At1節(jié)點(diǎn)和它在下一時(shí)間步t2的自身At2、周?chē)欢臻g范圍內(nèi)的鄰居Bt2、Ct2、Dt2和Et2組成一條超邊來(lái)建模這些關(guān)系。由于這條超邊同時(shí)連接著跨空間和時(shí)間維度的多個(gè)節(jié)點(diǎn),本文稱(chēng)之為時(shí)空超關(guān)系。在此基礎(chǔ)上,構(gòu)造了一個(gè)新的時(shí)空超關(guān)系圖卷積網(wǎng)絡(luò)預(yù)測(cè)模型來(lái)捕獲這種關(guān)系用于交通流量預(yù)測(cè)。本文的工作主要有:
1)提出一種新穎的時(shí)空超圖建模方案,構(gòu)造了一種時(shí)空超關(guān)系來(lái)全面地建模復(fù)雜的局部時(shí)空關(guān)系;
2)提出一種新穎的時(shí)空超關(guān)系圖卷積網(wǎng)絡(luò)(Spatio-Temporal Hyper-Relationship Graph Convolutional Network,STHGCN)預(yù)測(cè)模型用于交通流量預(yù)測(cè);
3)在四個(gè)真實(shí)的公開(kāi)數(shù)據(jù)集上進(jìn)行了大量的實(shí)驗(yàn),驗(yàn)證了本文模型的預(yù)測(cè)能力優(yōu)于現(xiàn)有同類(lèi)預(yù)測(cè)模型。
交通流量預(yù)測(cè)是時(shí)空數(shù)據(jù)挖掘領(lǐng)域中的一個(gè)重要研究課題。早期的研究將它看作一個(gè)時(shí)間序列預(yù)測(cè)問(wèn)題,常見(jiàn)的有統(tǒng)計(jì)學(xué)和傳統(tǒng)機(jī)器學(xué)習(xí)模型,如歷史均值(Historical Average,HA)法、向量自回歸(Vector Auto-Regression,VAR)[11]、自回歸綜合移動(dòng)平均(AutoRegressive Integrated Moving Average,ARIMA)[12]、支持向量回歸(Support Vector Regression,SVR)[13]、梯度提升決策樹(shù)(Gradient Boosting Decision Tree,GBDT)[14]等。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,RNN 被廣泛應(yīng)用于時(shí)間序列預(yù)測(cè)任務(wù)中。RNN 雖然能夠捕獲序列在時(shí)間維度上的相關(guān)性,但是無(wú)法考慮節(jié)點(diǎn)在空間維度上的相關(guān)性。ST-ResNet(Spatio-Temporal Residual Network)[15]、ST-3DNet(Spatial-Temporal 3D Convolutional Neural Network)[16]和ConvLSTM(Convolutional LSTM)[17]能夠通過(guò)CNN 來(lái)捕獲空間信息,但是這類(lèi)模型的輸入被限制為標(biāo)準(zhǔn)的網(wǎng)格數(shù)據(jù),無(wú)法用于圖結(jié)構(gòu)(如高速路網(wǎng))的交通預(yù)測(cè)問(wèn)題。
近年來(lái),學(xué)者們開(kāi)始利用GCN 來(lái)建模圖結(jié)構(gòu)數(shù)據(jù)里空間維度上的相關(guān)性。例如,STGCN[3]、DCRNN[4]、多組件時(shí)空?qǐng)D卷積網(wǎng)絡(luò)(Multi-Component Spatial-Temporal Graph Convolution Network,MCSTGCN)[18]均使用GCN 來(lái)捕獲空間維度上的相關(guān)性,并結(jié)合RNN或CNN來(lái)捕獲時(shí)間維度上的相關(guān) 性。ASTGCN(Attention based Spatial-Temporal Graph Convolutional Network)[19]、Graph WaveNet(Graph WaveNet for deep spatial-temporal graph modeling)[20]、MTGNN(Multivariate Time series forecasting with Graph Neural Network)[21]等考慮到預(yù)定義的圖結(jié)構(gòu)是不精確的,于是通過(guò)注意力機(jī)制或者自適應(yīng)參數(shù)學(xué)習(xí)的方式來(lái)動(dòng)態(tài)地優(yōu)化圖結(jié)構(gòu)。Zhang 等[22]提出的SLCNN(Structure Learning Convolution Neural Network)則是直接以數(shù)據(jù)驅(qū)動(dòng)的方式自適應(yīng)地學(xué)習(xí)局部圖和全局圖兩種空間圖結(jié)構(gòu),以捕獲不同層面下空間維度上的相關(guān)性。這些模型雖然不同程度地改進(jìn)了對(duì)空間維度上相關(guān)性建模的方案,但本質(zhì)上都還是構(gòu)造一個(gè)由不同組件組成的混合模型來(lái)分別捕獲時(shí)間維度和空間維度的關(guān)系,無(wú)法建模這兩種維度之間的相互作用。為了使模型更符合流量數(shù)據(jù)的演化規(guī)律,Song等[9]從時(shí)空同步的角度出發(fā)重構(gòu)了鄰接矩陣,提出了一種新的時(shí)空同步圖卷積網(wǎng)絡(luò)預(yù)測(cè)模型STSGCN,采用一個(gè)組件同時(shí)捕獲在空間和時(shí)間維度上的相關(guān)性;Li 等[23]在此基礎(chǔ)上提出一個(gè)變種STFGNN(Spatial-Temporal Fusion Graph Neural Network),通過(guò)建模站點(diǎn)間流量相似性來(lái)補(bǔ)充空間維度上的關(guān)聯(lián)。這兩種模型雖然均取得了不錯(cuò)的效果,但是仍然沒(méi)有顯式地建??鐣r(shí)空維度的直接關(guān)聯(lián)性,只是捕獲了局部時(shí)空關(guān)系中易于建模的一部分關(guān)系。
近期的部分研究表明,超圖能夠建模圖數(shù)據(jù)中的復(fù)雜關(guān)系。Feng 等[10]提出了超圖神經(jīng)網(wǎng)絡(luò)(Hypergraph Neural Network,HGNN)框架,模型中能夠使用超圖結(jié)構(gòu)來(lái)編碼多個(gè)節(jié)點(diǎn)間的數(shù)據(jù)相關(guān)性。Dong 等[24]提出的HNHN(Hypergraph Networks with Hyperedge Neuron)設(shè)計(jì)了一種標(biāo)準(zhǔn)化方法來(lái)調(diào)整超邊和節(jié)點(diǎn)的重要性,并定義了由兩層非線(xiàn)性單元組成的超圖卷積模型,模型在分類(lèi)任務(wù)上的精度和運(yùn)行效率方面都有較大提升。目前超圖的工作集中于節(jié)點(diǎn)分類(lèi)和圖分割任務(wù),本文提出的STHGCN 使用超圖直接建模交通數(shù)據(jù)中存在的復(fù)雜局部時(shí)空關(guān)系,實(shí)驗(yàn)結(jié)果證實(shí)了模型的有效性。
空間交通路網(wǎng)被定義為一個(gè)無(wú)向圖G=(V,E,A),其中:V為節(jié)點(diǎn)的集合,||V=N為節(jié)點(diǎn)個(gè)數(shù);E為節(jié)點(diǎn)間連邊的集合;A∈RN×N為空間交通路網(wǎng)的鄰接矩陣,表示節(jié)點(diǎn)之間的相鄰關(guān)系。
將第t個(gè)時(shí)間步下在空間交通路網(wǎng)G上觀(guān)測(cè)到的交通流量值定義為圖信號(hào)矩陣X(t) ∈RN×F,其中F是指每個(gè)節(jié)點(diǎn)所采集的特征數(shù)量。本文的預(yù)測(cè)任務(wù)是根據(jù)各節(jié)點(diǎn)若干個(gè)歷史時(shí)間步的流量觀(guān)測(cè)值,預(yù)測(cè)各節(jié)點(diǎn)在未來(lái)若干個(gè)時(shí)間步內(nèi)的流量值。定義T個(gè)歷史時(shí)間步的觀(guān)測(cè)值所組成的X=(X(t-T+1),X(t-T+2),…,X(t))∈RT×N×F為輸入的圖信號(hào)矩陣,P個(gè)未來(lái)時(shí)間步的觀(guān)測(cè)值所組成的Y=(X(t+1),X(t+2),…,X(t+P))∈RP×N×F為待預(yù)測(cè)的圖信號(hào)矩陣。本文的目標(biāo)則是學(xué)習(xí)一種如式(1)所示的函數(shù)映射關(guān)系f(?)。
本文提出的STHGCN 架構(gòu)如圖2 所示。首先使用輸入層將原始輸入的流量特征映射到高維空間,同時(shí)基于交通路網(wǎng)構(gòu)造超圖;然后,堆疊多個(gè)帶有殘差連接的時(shí)空超關(guān)系圖卷積層來(lái)捕獲復(fù)雜的局部時(shí)空關(guān)系;最后,使用一個(gè)預(yù)測(cè)器預(yù)測(cè)未來(lái)一段時(shí)間的流量特征。
圖2 STHGCN示意圖Fig.2 Schematic diagram of STHGCN
本文引入超圖來(lái)建模復(fù)雜的局部時(shí)空關(guān)系。具體而言,如圖1(d)所示,將前一時(shí)間步中的任意一個(gè)節(jié)點(diǎn)、該節(jié)點(diǎn)在下一時(shí)間步的自身以及它的前K(K為可選擇的超參數(shù))階鄰居建模在一起,組成一條超邊。如此,兩個(gè)連續(xù)時(shí)間步的時(shí)空節(jié)點(diǎn)一共能夠組成N條超邊。用H∈R2N×N來(lái)定義由兩個(gè)連續(xù)時(shí)間步的時(shí)空節(jié)點(diǎn)所組成的超圖關(guān)聯(lián)矩陣。H標(biāo)識(shí)了節(jié)點(diǎn)和超邊的隸屬關(guān)系(如果節(jié)點(diǎn)i是超邊j所包含的節(jié)點(diǎn),則Hij=1)。H的符號(hào)化定義如下:
其中:i為節(jié)點(diǎn)的編號(hào)(兩個(gè)時(shí)間步的節(jié)點(diǎn)分別依次編號(hào)為0~N-1,N~2N-1);j為超邊的編號(hào),依次為0~N-1;N jk是編號(hào)為j的節(jié)點(diǎn)的前k階鄰居節(jié)點(diǎn)組成的編號(hào)集合。
在使用超圖建模了局部時(shí)空關(guān)系后,受HNHN[24]的啟發(fā),本文進(jìn)一步構(gòu)建了超圖卷積(Hypergraph Graph Convolutional Network,HGCN)方法來(lái)有效捕獲時(shí)空特征。如圖3 所示,該方法的本質(zhì)是基于超圖結(jié)構(gòu)進(jìn)行一個(gè)兩階段的信息聚合與分發(fā)過(guò)程。方法的第一階段是捕獲局部時(shí)空范圍內(nèi)特定的流量模式,例如在突發(fā)的暴雨天氣狀況下,整個(gè)局部區(qū)域的交通流量值都會(huì)驟減。超邊的表示即表征了局部區(qū)域內(nèi)站點(diǎn)的流量變化趨勢(shì)。在第二階段將超邊的信息分發(fā)到各個(gè)站點(diǎn)上,能夠輔助站點(diǎn)感知周?chē)h(huán)境的變化,進(jìn)而得到更好的節(jié)點(diǎn)表示。具體的符號(hào)化定義如下。
圖3 超圖卷積示意圖Fig.3 Schematic diagram of hypergraph convolution
在超圖卷積方法中,超圖關(guān)聯(lián)矩陣直接決定了信息聚合與分發(fā)過(guò)程的權(quán)重。前面的定義中,關(guān)聯(lián)矩陣只標(biāo)識(shí)了節(jié)點(diǎn)與超邊的隸屬關(guān)系,即取值為0或1。這種關(guān)聯(lián)矩陣會(huì)限制聚合效果,無(wú)法應(yīng)對(duì)以下兩種情況:
1)不能較好地應(yīng)對(duì)異常情況。例如,由于采集設(shè)備故障,在某段時(shí)間內(nèi),一個(gè)站點(diǎn)的流量值缺失,那么即使這個(gè)站點(diǎn)屬于對(duì)應(yīng)的超邊,通常也希望不聚合或者少聚合它的信息,因此可以考慮減小該點(diǎn)對(duì)應(yīng)的聚合權(quán)重。
2)無(wú)法區(qū)分不同站點(diǎn)的重要性。每個(gè)節(jié)點(diǎn)對(duì)它局部區(qū)域?qū)W習(xí)的影響程度應(yīng)當(dāng)不同。例如一個(gè)中轉(zhuǎn)站點(diǎn)或者交叉路口往往承載著更大的流量,它的交通狀況通常能夠影響更多的鄰居站點(diǎn),有著更大的影響力,此時(shí)可以適當(dāng)增大該點(diǎn)對(duì)應(yīng)的聚合權(quán)重。
上述兩種情況的存在往往限制了超圖卷積的效果,為了解決這一問(wèn)題,本文考慮在每一個(gè)時(shí)空超關(guān)系圖卷積層STHGCL 中引入一個(gè)與關(guān)聯(lián)矩陣H形狀相同且可訓(xùn)練學(xué)習(xí)的參數(shù)矩陣Wmask∈R2N×N,并如式(6)所示,使用哈達(dá)瑪積運(yùn)算將它作用在H上以動(dòng)態(tài)的調(diào)整聚合權(quán)重,得到更合理的信息聚合方式。
STHGCN 模型的輸入為T(mén)個(gè)歷史時(shí)間步的觀(guān)測(cè)值所組成的圖信號(hào)矩陣,而超圖僅僅定義了相鄰兩個(gè)時(shí)間步的局部時(shí)空關(guān)系,因此本文使用如圖2(b)所示的滑動(dòng)窗口的方式來(lái)對(duì)輸入的圖信號(hào)進(jìn)行切割,其中滑動(dòng)窗口的大小為2,滑動(dòng)步長(zhǎng)1。滑動(dòng)過(guò)程中,每?jī)蓚€(gè)相鄰的時(shí)間步都會(huì)進(jìn)行超圖卷積操作,因此除第一個(gè)時(shí)間步與最后一個(gè)時(shí)間步之外,所有的時(shí)間步均會(huì)與它前后的時(shí)間步拼接,并分別進(jìn)行一次超圖卷積操作,進(jìn)而得到兩組節(jié)點(diǎn)表示。本文使用SUM 聚合融合了兩組節(jié)點(diǎn)表示,以全面捕獲時(shí)空信息。具體的融合過(guò)程即是基于某一層(如第l層)中由超圖卷積得到的初始節(jié)點(diǎn)表示集合將同一時(shí)間步的表示進(jìn)行SUM聚合,即
在使用超圖建模局部時(shí)空關(guān)系時(shí),相鄰兩個(gè)時(shí)間步的節(jié)點(diǎn)被壓縮到一個(gè)圖中,這些節(jié)點(diǎn)混合在一起會(huì)模糊每個(gè)節(jié)點(diǎn)所處的時(shí)間位置和空間位置。受STSGCN[9]啟發(fā),本文創(chuàng)建了參數(shù)化的時(shí)間嵌入矩陣Temb∈RC×T和空間位置嵌入矩陣Semb∈RN×C來(lái)標(biāo)識(shí)必要的時(shí)間和空間位置信息,以輔助模型更有效地捕獲時(shí)空特征。
具體而言,本文是使用如式(8)中廣播的形式將兩種嵌入信息加到初始的時(shí)空?qǐng)D信號(hào)M中。
如圖2(b)所示,時(shí)空超關(guān)系圖卷積層STHGCL 包含了滑動(dòng)切割、超圖卷積和滑動(dòng)窗信息融合三個(gè)步驟。通常而言,卷積層數(shù)的增加會(huì)導(dǎo)致深度神經(jīng)網(wǎng)絡(luò)的退化,因此本文進(jìn)一步使用了殘差網(wǎng)絡(luò)來(lái)解決這一問(wèn)題,并在每一層中添加層歸一化(Layer Normal)操作以標(biāo)準(zhǔn)化數(shù)據(jù)分布。
其中:Ml∈RT×N×C為第l層的輸入表示。
輸入層為一個(gè)全連接層,將輸入的圖信號(hào)矩陣X=(X(t-T+1),X(t-T+2),…,X(t))∈RT×N×F映射到高維空間,如式(10)所示。
預(yù)測(cè)器是一個(gè)兩層的全連接網(wǎng)絡(luò),它的輸入是最后一層STHGCL 的輸出表示經(jīng)重塑形狀得到的,具體的運(yùn)算過(guò)程如式(11)所示。
Yo再經(jīng)過(guò)重塑形狀得到最終的預(yù)測(cè)結(jié)果。其中:是可訓(xùn)練學(xué)習(xí)的參數(shù),C'為預(yù)測(cè)器中第一個(gè)全連接層高維空間的維度。
本文使用對(duì)回歸問(wèn)題具有較強(qiáng)魯棒性的Huber Loss 作為損失函數(shù),該函數(shù)的定義如式(12)所示。
其中:Y為真實(shí)值,為預(yù)測(cè)值,δ是控制選擇兩種損失的閾值超參數(shù)(取默認(rèn)值1)。
基于STSGCN[9]的4 個(gè)公開(kāi)的交通數(shù)據(jù)集展開(kāi)實(shí)驗(yàn),數(shù)據(jù)采集自美國(guó)加利福尼亞州的4 個(gè)不同區(qū)域的高速公路。按照5 min、10 min、15 min 的時(shí)間粒度進(jìn)行聚合分別得到了3 種不同時(shí)間步粒度的數(shù)據(jù)集,詳細(xì)介紹如表1所示。
表1 數(shù)據(jù)集詳細(xì)信息Tab.1 Details of datasets
數(shù)據(jù)集全部以6∶2∶2 的比率被拆分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,并使用如式(13)所示的Z-Score 方法進(jìn)行標(biāo)準(zhǔn)化,其中Mean(Xtrain)和Std(Xtrain)分別是訓(xùn)練集的均值和標(biāo)準(zhǔn)差。實(shí)驗(yàn)均使用前12 個(gè)時(shí)間步的流量值來(lái)預(yù)測(cè)后12 個(gè)時(shí)間步的流量值。高維空間的維度C、C'分別被設(shè)置為64、256。模型使用MXNet 實(shí)現(xiàn),并通過(guò)Adam 優(yōu)化器進(jìn)行訓(xùn)練,學(xué)習(xí)率被設(shè)置為0.001。實(shí)驗(yàn)結(jié)果為5次實(shí)驗(yàn)的平均值。
本文對(duì)比的基準(zhǔn)方法包括:1)統(tǒng)計(jì)學(xué)和傳統(tǒng)機(jī)器學(xué)習(xí)方法VAR[11]、SVR[13]。2)深度學(xué)習(xí)方法:GRU(Gated Recurrent Unit)[7]、STGCN[3]、DCRNN[4]、ASTGCN[19]、STSGCN[9]。實(shí)驗(yàn)采用了交通流量預(yù)測(cè)領(lǐng)域中大多數(shù)工作經(jīng)常使用的均方根誤差(Root Mean Square Error,RMSE)、平均絕對(duì)誤差(Mean Absolute Error,MAE)和平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)三個(gè)評(píng)價(jià)指標(biāo)來(lái)評(píng)估所有模型的預(yù)測(cè)效果。
表2顯示了不同模型在不同數(shù)據(jù)集上預(yù)測(cè)未來(lái)12個(gè)時(shí)間步的交通流量的整體預(yù)測(cè)性能。其中最優(yōu)的結(jié)果用粗體標(biāo)出,次優(yōu)的結(jié)果用下劃線(xiàn)標(biāo)出。三個(gè)評(píng)價(jià)指標(biāo)值越低,代表模型性能越好。不難看出,傳統(tǒng)方法VAR 和SVR 由于缺乏非線(xiàn)性表達(dá)能力,所以預(yù)測(cè)性能往往不是特別理想。深度學(xué)習(xí)方法憑借著較強(qiáng)的非線(xiàn)性表達(dá)能力展現(xiàn)出很大的優(yōu)勢(shì),其中GRU 由于只能捕獲時(shí)間維度上的相關(guān)性,在深度方法中表現(xiàn)相對(duì)較差;同時(shí)考慮到空間和時(shí)間維度的深度模型DCRNN、STGCN、ASTGCN、STSGCN 和STHGCN 取得了更好的預(yù)測(cè)效果。近期較先進(jìn)的模型STSGCN 通過(guò)同步建模時(shí)間、空間維度的相關(guān)性在基準(zhǔn)方法中取得了較大的優(yōu)勢(shì)。而本文模型STHGCN 通過(guò)構(gòu)造超圖來(lái)全面地建模復(fù)雜的局部時(shí)空關(guān)系,在除PEMS03-5 外的所有數(shù)據(jù)集上均獲得了最佳性能。實(shí)驗(yàn)效果展示了超圖建模局部時(shí)空關(guān)系的優(yōu)勢(shì)。
表2 八種交通流量預(yù)測(cè)模型在不同數(shù)據(jù)集上的性能比較Tab.2 Performance comparison of 8 traffic flow forecasting models on different datasets
此外,還分別在5 min、10 min、15 min 的時(shí)間步粒度下進(jìn)行了對(duì)比實(shí)驗(yàn)。由于在預(yù)測(cè)步長(zhǎng)固定為12 的情況下,隨著時(shí)間步粒度的增大,待預(yù)測(cè)的時(shí)間范圍也會(huì)相應(yīng)增加,因此在不同時(shí)間步粒度上的對(duì)比實(shí)驗(yàn)?zāi)軌驒z驗(yàn)?zāi)P偷拈L(zhǎng)期預(yù)測(cè)能力。從表2 可以發(fā)現(xiàn)隨著時(shí)間步粒度的增大,所有模型的預(yù)測(cè)性能均會(huì)下降。性能下降一方面是因?yàn)樵跁r(shí)間步粒度更大的數(shù)據(jù)集中,流量特征的均值和方差也會(huì)更大,導(dǎo)致預(yù)測(cè)誤差也隨之增大;另一方面是因?yàn)闀r(shí)間步粒度的增大,會(huì)使得站點(diǎn)在一個(gè)時(shí)間步內(nèi)能夠影響到處于更遠(yuǎn)空間范圍內(nèi)的其他站點(diǎn),導(dǎo)致模型訓(xùn)練學(xué)習(xí)的難度增加。實(shí)驗(yàn)結(jié)果顯示了STHGCN 相對(duì)于基準(zhǔn)方法性能下降更為緩慢,取得了更加穩(wěn)定的效果。例如,在PEMS08 數(shù)據(jù)集的三個(gè)時(shí)間粒度上與STSGCN 相比,RMSE 指標(biāo)的提升比分別是4.63%,6.19%,10.62%。這表明STHGCN 具有更強(qiáng)的長(zhǎng)期預(yù)測(cè)能力,這種優(yōu)勢(shì)主要是因?yàn)镾THGCN 構(gòu)建的超圖建模了處于更遠(yuǎn)時(shí)空范圍內(nèi)的鄰居信息(前K階鄰居),能夠更全面地捕獲局部時(shí)空關(guān)系。
為了研究模型超參數(shù)對(duì)模型效果的影響,本文分別在1~5和1~4范圍內(nèi)對(duì)K和STHGCL 堆疊的層數(shù)L兩個(gè)參數(shù)進(jìn)行了網(wǎng)格搜索,結(jié)果如圖4 所示??梢钥闯鲭S著兩個(gè)參數(shù)值的增大,模型STHGCN 的性能開(kāi)始會(huì)快速增長(zhǎng),隨后增長(zhǎng)速度逐漸放緩;隨著數(shù)據(jù)集時(shí)間步粒度的增加,最優(yōu)參數(shù)的取值也相對(duì)變大。例如在PEMS03數(shù)據(jù)集的三種時(shí)間步粒度上,最優(yōu)的K取值均為5,而最優(yōu)的L取值分別為1、2、3,這是因?yàn)檫@兩個(gè)參數(shù)直接決定了模型能夠捕獲的時(shí)空范圍。當(dāng)數(shù)據(jù)集時(shí)間步的粒度變大時(shí),站點(diǎn)在每個(gè)時(shí)間步往往能夠影響到更遠(yuǎn)的鄰居站點(diǎn),此時(shí)這兩個(gè)參數(shù)的取值會(huì)相應(yīng)增大以捕獲更遠(yuǎn)距離的時(shí)空信息。
圖4 不同參數(shù)組合的模型效果Fig.4 Model effect of different parameter combinations
表3 給出了不同模型在相同條件下的運(yùn)行時(shí)間成本(僅模型部分,不包含數(shù)據(jù)處理)。
表3 部分?jǐn)?shù)據(jù)集上的訓(xùn)練時(shí)間和推理時(shí)間對(duì)比 單位:sTab.3 Comparison of training time and inference time on some datasets unit:s
本文為所有模型使用相同的Minibatch,同一計(jì)算平臺(tái),并選取3 個(gè)不同規(guī)模的數(shù)據(jù)集進(jìn)行比較。其中DCRNN 由于使用了循環(huán)預(yù)測(cè)多步的方式,運(yùn)行速度與其他直接預(yù)測(cè)多步的方法相比較慢;STSGCN 為區(qū)分不同時(shí)間步的信息,模型中堆疊了大量的不共享圖卷積模塊,導(dǎo)致計(jì)算量較大,運(yùn)行效率相對(duì)較低;本文模型在不同的時(shí)間步共享超圖結(jié)構(gòu),并使用超圖卷積來(lái)捕獲局部時(shí)空關(guān)系,其中卷積模塊里不包含大規(guī)模的復(fù)雜運(yùn)算,計(jì)算量相對(duì)較小。從結(jié)果可以看出本文的模型無(wú)論是訓(xùn)練還是推理都花費(fèi)了最少的時(shí)間,有著較高的運(yùn)行效率。
本文針對(duì)交通流量預(yù)測(cè)問(wèn)題提出了一種時(shí)空超關(guān)系圖卷積網(wǎng)絡(luò)(STHGCN)預(yù)測(cè)模型,在模型中使用超圖來(lái)建模交通流量數(shù)據(jù)中存在的復(fù)雜局部時(shí)空關(guān)系,并通過(guò)超圖卷積和滑動(dòng)窗信息融合機(jī)制以有效捕獲時(shí)空特征。在不同公開(kāi)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,本文模型具有較好的預(yù)測(cè)性能,實(shí)際上該模型也適用于其他基于圖結(jié)構(gòu)的時(shí)空預(yù)測(cè)問(wèn)題,例如交通速度預(yù)測(cè)、空氣質(zhì)量預(yù)測(cè)等。在下一步的研究工作中,將考慮從構(gòu)建動(dòng)態(tài)超圖的角度來(lái)優(yōu)化模型架構(gòu),進(jìn)一步提升模型的預(yù)測(cè)性能。