国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Inception卷積神經(jīng)網(wǎng)絡(luò)的城市快速路行程速度短時預(yù)測

2021-04-01 01:57:24唐克雙陳思曲曹喻旻張鋒鑫
關(guān)鍵詞:時空卷積交通

唐克雙,陳思曲,曹喻旻,張鋒鑫

(1.同濟大學(xué)道路與交通工程教育部重點實驗室,上海201804;2.連云港杰瑞電子有限公司智能交通事業(yè)部,江蘇連云港222061)

近年來,伴隨城市化進程的加速推進和經(jīng)濟社會的高速發(fā)展,我國機動車保有量和駕駛?cè)藬?shù)量持續(xù)增加,城市交通擁堵問題日益嚴(yán)重。根據(jù)高德地圖發(fā)布的《2019中國主要城市交通分析報告》,2019年全國360個主要城市高峰時段總體處于擁堵和緩行狀態(tài)的比例超過60%[1]??焖俾纷鳛槌鞘械缆肪W(wǎng)絡(luò)的主骨架,承擔(dān)大量的通勤和過境交通需求,其拓?fù)浣Y(jié)構(gòu)復(fù)雜且交通擁堵,具有頻率高、范圍廣、模式多等特點。因此,快速路對于城市道路網(wǎng)絡(luò)整體運行效率具有重要的影響,也是交通擁堵治理的主要對象。行程速度是我國絕大部分城市計算交通指數(shù)和判別交通狀態(tài)時采用的核心指標(biāo)。短時行程速度可以反映實時交通運行狀態(tài),幫助交通管理者及時采取管控措施以緩解交通擁堵,并為出行者路徑選擇提供參考。因此,準(zhǔn)確可靠的短時行程速度預(yù)測對于提高城市交通主動管控能力和出行信息服務(wù)質(zhì)量,具有重要的意義。

目前,交通狀態(tài)預(yù)測模型基本上可以分為兩大類:統(tǒng)計學(xué)模型和神經(jīng)網(wǎng)絡(luò)模型[2]。經(jīng)典的統(tǒng)計學(xué)模型包括歷史平均模型[3]、差分整合移動平均自回歸模型(autoregressive integrated moving average model,ARIMA)[4-5]和卡爾曼濾波模型[6]等。上述模型算法較為簡單,適用于數(shù)據(jù)量充足且數(shù)據(jù)擾動較小的場景,但是模型的泛化能力較差,針對隨機性強、平穩(wěn)性差的短時交通流預(yù)測任務(wù)效果不理想[3](短時預(yù)測通常指預(yù)測時間步長小于30 min的情況)。為了增強模型對于不同類型數(shù)據(jù)的適用性,一些非參數(shù)統(tǒng)計學(xué)模型被逐漸應(yīng)用于交通狀態(tài)預(yù)測領(lǐng)域,例 如K-最 鄰 近 算 法(K-nearest neighbor,KNN)[7]、支 持 向 量 機(support vector machine,SVM)[8]、支持向量回歸(support vector regression,SVR)[9]等。非參數(shù)模型在處理動態(tài)、非線性以及具有時空關(guān)聯(lián)特征的交通狀態(tài)預(yù)測任務(wù)上,相對于傳統(tǒng)的時間序列統(tǒng)計學(xué)模型具有一定的優(yōu)勢,而且可以在模型中融合環(huán)境氣象等其他關(guān)聯(lián)因素。但是,該類淺層結(jié)構(gòu)的非參數(shù)模型對于高維交通數(shù)據(jù)和復(fù)雜交通模式的時空特征提取能力仍顯不足[10]。

神經(jīng)網(wǎng)絡(luò)模型支持高維輸入數(shù)據(jù),優(yōu)勢在于可提取多維非線性特征,從而獲得更高的模型預(yù)測精度與魯棒性[11]。多層前饋神經(jīng)網(wǎng)絡(luò)(multilayer feedforward neural networks,MFNN)基于淺層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可以學(xué)習(xí)數(shù)據(jù)中的非線性關(guān)聯(lián)特征,雖然其預(yù)測精度優(yōu)于上述統(tǒng)計學(xué)模型[12-13],但是僅能提取交通數(shù)據(jù)中基本的關(guān)聯(lián)特征。為進一步探究更深層、更復(fù)雜的交通流時空關(guān)聯(lián)特征和演化規(guī)律,近年來深度神經(jīng)網(wǎng)絡(luò)開始被逐漸應(yīng)用于交通流預(yù)測領(lǐng)域。深度置信網(wǎng)絡(luò)(deep belief networks,DBN)[14-15]、堆棧自編碼器(stacked auto encoder,SAE)[16]和生成式對抗網(wǎng)絡(luò)(generative adversarial network,GAN)[17-18]作為代表性的無監(jiān)督深度學(xué)習(xí)模型,以及循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)[19-21]、圖 網(wǎng) 絡(luò)(graph neural networks,GNN)[22-23]等在交通流預(yù)測方面均取得了較好的效果。其中,DBN適用于小規(guī)模交通網(wǎng)絡(luò)預(yù)測問題,無法充分提取多路段之間的關(guān)聯(lián)性以及交通狀態(tài)的長期特征[24];SAE與GAN是一類無監(jiān)督的神經(jīng)網(wǎng)絡(luò),模型通常表示為編碼-解碼結(jié)構(gòu),通過對輸入數(shù)據(jù)特征的重構(gòu)學(xué)習(xí)提高魯棒性與精度[25];RNN在交通數(shù)據(jù)的時間序列特征學(xué)習(xí)上具有一定的優(yōu)勢[26],為進一步提高模型提取輸入交通狀態(tài)參數(shù)間依賴關(guān)系的能力,并避免傳統(tǒng)RNN在訓(xùn)練過程中所產(chǎn)生的梯度爆炸問題,長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)[19-21]等結(jié)構(gòu)改善的RNN模型也被應(yīng)用于交通流預(yù)測。GNN中的圖注意力網(wǎng)絡(luò)(graph attention network,GAN)可結(jié)合道路拓?fù)浣Y(jié)構(gòu)以及交通狀態(tài)時間、空間上的權(quán)重關(guān)系進行分析,在近兩年得到越來越多的研究。同時,也有學(xué)者對上述模型進行組合,研究混合模型在該領(lǐng)域的適應(yīng)性[27]。

卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)可通過局部連接、權(quán)值共享與下采樣等方法,盡可能保留重要的參數(shù),舍去大量非關(guān)鍵參數(shù),在圖像識別任務(wù)上具有優(yōu)勢。因此,近年來CNN被廣泛應(yīng)用于圖像識別、目標(biāo)檢測等領(lǐng)域[28],包括交通領(lǐng)域的路面病害識別[29]和車輛檢測[30]等。在交通狀態(tài)預(yù)測方面,Ma等[31]將交通狀態(tài)轉(zhuǎn)為灰度圖像,首次利用CNN模型預(yù)測短時行程速度。Zang等[32]提出采用圖像的不同通道對參數(shù)進行表示,對交通流量、速度和占有率同時進行預(yù)測,其中速度預(yù)測誤差為3 km·h-1。之后,Zang等[33]又提出基于非對稱卷積核的CNN模型,通過設(shè)置不同的重要性來體現(xiàn)交通數(shù)據(jù)的時空特征差異,模型的平均相對誤差為10%。上述研究將交通網(wǎng)絡(luò)和交通狀態(tài)構(gòu)成的高維數(shù)組作為輸入,CNN可以有效地提取數(shù)據(jù)中的關(guān)聯(lián)特征。然而,CNN模型的缺點是無法充分考慮交通狀態(tài)的時序關(guān)聯(lián)特征。因此,部分學(xué)者基于CNN構(gòu)建了混合CNN模型以提升預(yù)測性能。其中,將適用于處理時序數(shù)據(jù)的RNN與CNN結(jié)合是研究的一大熱點,例如,采用門控循環(huán)單元(gated recurrent unit,GRU)或LSTM來增強模型的時序特征提取能力[34-35]。此外,部分混合CNN模型的研究中考慮了無監(jiān)督網(wǎng)絡(luò)、GNN的融合。Ge等[36]基于圖卷積網(wǎng)絡(luò)(graph convolutional networks,GCN)建立模型提取交通時空特征,并考慮天氣、工作日等相關(guān)社會因素提高速度預(yù)測的精確性。Yu等[37]將GCN與編碼-解碼結(jié)構(gòu)相結(jié)合建立深度學(xué)習(xí)模型進行實時預(yù)測,模型平均絕對百分比誤差為7.3%。

上述混合CNN模型雖然可以通過同時考慮交通狀態(tài)的時間序列特征和空間關(guān)聯(lián)特征,提升傳統(tǒng)CNN模型的預(yù)測性能,但是在CNN模型的計算部分依然采用固定的卷積核尺寸,大大限制了其對多尺度(交通擁堵的時間和空間范圍動態(tài)變化)交通流特征的學(xué)習(xí)能力。此外,為提取多粒度條件下的特征,通常需要對輸入數(shù)據(jù)進行集計與調(diào)整并構(gòu)建多個子網(wǎng)絡(luò)??紤]到高峰時段城市快速路的交通狀態(tài)不僅受到路網(wǎng)拓?fù)浣Y(jié)構(gòu)和地面道路交通狀態(tài)的影響,而且受到駕駛員動態(tài)路徑選擇行為和突發(fā)交通事件的影響,因此城市快速路交通擁堵模式復(fù)雜且擁堵的時空粒度范圍多變。針對這樣的預(yù)測任務(wù),上述混合CNN模型存在一定局限性。

因此,本研究提出一種更加有效并能適應(yīng)城市快速路復(fù)雜交通擁堵模式的行程速度短時預(yù)測模型——Inception-CNN模型。Inception-CNN模型將多粒度特征提取問題結(jié)合至模型中而非依賴于輸入數(shù)據(jù),使其更具有高效性、適應(yīng)性,并更易于應(yīng)用在如流量、占有率等其他交通流參數(shù)的預(yù)測任務(wù)中。其中,Inception模塊是GoogleNet在2014年的ImageNet挑戰(zhàn)賽中獲勝的核心模塊[38]。目前,已有學(xué)者將Inception模塊引入交通領(lǐng)域的部分研究方向,如交通標(biāo)志檢測與汽車試驗場外物入侵識別等[39-40]。它將CNN中的卷積核分解為更小的卷積核或非對稱卷積核,并通過不同的串行與并行組合實現(xiàn)了高效的多尺度特征提取。該模塊的加入不僅加速了網(wǎng)絡(luò)訓(xùn)練過程,同時也增強了網(wǎng)絡(luò)的特征表達能力[38]。

本研究以上海市高架快速路為研究對象,首先將線圈采集的行程速度數(shù)據(jù)組織為時空二維矩陣,并采用閾值法將數(shù)據(jù)矩陣轉(zhuǎn)化為圖像,以發(fā)揮CNN模型在圖像識別上的優(yōu)勢;同時,在CNN的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計中融入Inception模塊,構(gòu)建了一種新的混合CNN模型框架,并通過系統(tǒng)的訓(xùn)練和測試,確定了最優(yōu)結(jié)構(gòu)參數(shù)和超參數(shù)。目前基于圖像學(xué)習(xí)的交通流預(yù)測模型,大多仍采用傳統(tǒng)的評價指標(biāo)進行分析。為了更加科學(xué)準(zhǔn)確地定義Inception-CNN模型對行程速度時間序列特征和時空演化特征的捕捉能力,本研究還引入了梯度幅度相似性偏差(gradient magnitude similarity deviation,GMSD)[41]指標(biāo),結(jié)合圖形可視化的方法,系統(tǒng)、可靠地對比分析了Inception-CNN模型與ARIMA模型、淺層神經(jīng)網(wǎng)絡(luò)模型、CNN模型和RNN模型的預(yù)測性能。

1 研究地點和數(shù)據(jù)描述

1.1 研究對象

本研究以2011年全年上海市延安高架快速路的線圈檢測器數(shù)據(jù)為數(shù)據(jù)源。研究范圍包括延安高架快速路從四川中路到外環(huán)滬青平公路之間的路段,全長約14.3 km,含2個立體交叉以及14個上下匝道,如圖1所示。研究路段沿主線布設(shè)35個檢測斷面(斷面編號為0~34),分車道共113個線圈檢測器(主線為3車道,部分上下匝道處車道數(shù)變化)。原始線圈數(shù)據(jù)的采樣間隔為20 s,包括流量、速度和時間占有率三個參數(shù)。在本研究中,基于行程速度的短時預(yù)測時間步長的考慮,將原始車道級線圈數(shù)據(jù)根據(jù)流量加權(quán)平均集計成為5 min間隔的斷面級檢測數(shù)據(jù)。同時,由于凌晨0點至5點半常為維修時段,存在大量數(shù)據(jù)缺失的現(xiàn)象,故在本研究進行了刪除。針對剩余數(shù)據(jù)中的異常值,部分采用基于時間序列的線性插值修復(fù),即采用前后時段或相鄰周同一天的數(shù)據(jù)進行處理;另一部分則基于相鄰線圈檢測器數(shù)據(jù)從空間維度進行修復(fù),即采用經(jīng)過時間推演的前后斷面數(shù)據(jù)。經(jīng)處理后的行程速度分布均值為61.77 km·h-1,標(biāo) 準(zhǔn) 差 為16.58 km·h-1,偏 度為-0.92。

圖1 研究路段區(qū)位Fig.1 Location of the studied site

1.2 行程速度時空圖像生成方法

本研究首先將原始線圈檢測數(shù)據(jù)處理為行程速度時空圖像,作為模型的輸入。以x軸為時間段,y軸為檢測器布設(shè)段,得到行程速度時空矩陣S的表達式如下:式中:n為時間段總數(shù);m為檢測斷面總數(shù);vm,n為檢測器斷面m在第n個時間段的行程速度,km·h-1。未進行數(shù)據(jù)預(yù)處理前,本研究的時間段總數(shù)n為288,檢測斷面總數(shù)m為35?;谛谐趟俣葧r空矩陣,通過一定的映射方法可得到能反映交通狀態(tài)時空變化特征的行程速度時空圖像,見圖2。其中,顏色的映射標(biāo)準(zhǔn)參照上海市交通狀態(tài)指數(shù)劃分標(biāo)準(zhǔn)[42]。

圖2 行程速度時空圖像Fig.2 Time-space travelling speed image

2 模型構(gòu)建及訓(xùn)練

2.1 CNN模型基本原理

CNN主要由卷積層、池化層與全連接層組成,卷積層可有效提取目標(biāo)特征,同時具有稀疏連接、參數(shù)共享的特點,其計算原理如下:

式中:N為所在網(wǎng)絡(luò)層的位置;ziN為位于N位置卷積層的第i個卷積值;wijpq為卷積核i第j通道在(p,q)位置處的參數(shù)值;xpq為當(dāng)前卷積核或池化算子在滑動計算時視野范圍內(nèi)在(p,q)位置處的上一網(wǎng)絡(luò)層輸入值;bij為偏置系數(shù)。卷積層所輸出的特征圖是基于卷積結(jié)果,通過非線性激活函數(shù)的變換所得:

式中:g(x)為非線性激活函數(shù);y為輸出的特征圖。本研究選取Sigmoid、tanh與ReLU(rectified linear unit)三種不同的激活函數(shù)進行模型的對比分析與結(jié)構(gòu)優(yōu)化[43]。池化層對輸入的特征圖進行下采樣操作,可在減少模型待訓(xùn)練參數(shù)數(shù)量的同時提高所提取與識別特征的泛化能力,以最大池化為例:

式中:max(x)為求最大元素值函數(shù)。最后將特征圖展平為一維張量,并連接若干全連接層,輸出預(yù)測結(jié)果,其基本結(jié)構(gòu)見圖3。圖中,例如,“卷積層6,28×28”表示得到6張?zhí)卣鲌D,其中每張?zhí)卣鲌D像素大小為28×28。本研究在訓(xùn)練時以平均絕對誤差(mean absolute error,MAE)為目標(biāo)函數(shù),即fMAE;同時結(jié)合平均絕對百分比誤差(mean absolute percentage error,MAPE)指標(biāo),即fMAPE,對模型結(jié)果進行評價分析。

式中:u為真實值;u?為預(yù)測值;n為樣本量。

2.2 Inception-CNN模型

在基本的CNN中,為提取不同粒度的特征,通常需要輸入對應(yīng)尺寸(規(guī)模)的圖像(行程速度時空圖像),即不易直接有效學(xué)習(xí)不同規(guī)模的交通時空特征。此外,在設(shè)計基本CNN模型的卷積、池化算子的尺寸時,大多通過實驗者較為主觀地確定最佳搜索范圍,并通過網(wǎng)格搜索或是隨機搜索方式來確定最優(yōu)的選擇??紤]到交通演變規(guī)律的不確定性,即交通事件或交通擁堵影響范圍的不確定性,在CNN的每個卷積層或池化層中采用一致的算子尺寸并非合適。因此,本研究將基于CNN,結(jié)合Inception模塊建立更適應(yīng)于城市快速路行程速度短時預(yù)測的深度學(xué)習(xí)模型(Inception-CNN模型)以解決上述問題。

圖3 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(LeNet-5[44])Fig.3 Structure of CNN(LeNet-5)

Inception模塊可將卷積核分解為尺寸更小的對稱或非對稱的卷積核,并通過一系列串行或并行的組合,保持每個模塊輸出特征圖的尺寸一致。例如,圖4展示了5×5像素范圍內(nèi)的卷積核由2個3×3的卷積核串行組合替代的過程,同時3×3的卷積核還可由1個1×3與1個3×1的非對稱卷積核串行組合替代。此外,在Inception-CNN模型中,還可將池化算子與卷積進行混合,并行組合各項操作,如圖4所示。

圖4 將5×5卷積核替換為2個3×3卷積核的Inception模塊[38]Fig.4 Inception modules where each 5×5 convolution is replaced by two 3×3 convolution

通過結(jié)合Inception模塊,本研究搭建的模型可更準(zhǔn)確地提取交通數(shù)據(jù)不同尺度的時序特征、空間特征以及時空特征。如圖5所示,行程速度時空圖像的橫軸表示空間關(guān)聯(lián),縱軸表示時間關(guān)聯(lián),以此表征交通狀態(tài)。那么,連續(xù)兩次q×q的卷積則可作為2q-1粒度下的時空特征提取器;連續(xù)的1×p、p×1卷積則是經(jīng)過非線性增強的p粒度下的空間、時序特征提取器;而先進行r×r池化再進行o×o卷積的過程則可作為r+o-1粒度下更加魯棒的關(guān)聯(lián)特征。特征圖的拼接操作對不同通道的信息進行組合,增強不同粒度特征間的交互性。在一個Inception模塊中,可以串行或并行組合各種不同尺寸的卷積與池化算子,以提高模型非線性特征的表達能力,即進一步學(xué)習(xí)交通數(shù)據(jù)的高維時間、空間與時空關(guān)聯(lián)特征。同時,非對稱卷積核的加入也使得模型能以不同的重要性提取不同場景下的時間或空間維度特征。

圖5 Inception-CNN模型中的卷積核設(shè)計及其計算過程Fig.5 Design and computing process of convolutional kernels in Inception-CNN

總結(jié)而言,Inception-CNN模型對城市快速路的行程速度短時預(yù)測問題具有較好的適應(yīng)性,其基本結(jié)構(gòu)見圖6。由于單層的Inception模塊已具有較強的非線性表達能力,故本研究僅考慮單層或雙層的Inception模塊組合,使得模型更加輕量化并避免過擬合現(xiàn)象。

圖6 Inception-CNN模型基本結(jié)構(gòu)Fig.6 Basic structure of Inception-CNN

2.3 模型設(shè)計與優(yōu)化思路

在本研究中,首先設(shè)計模型的結(jié)構(gòu)參數(shù),如神經(jīng)網(wǎng)絡(luò)層數(shù),各層神經(jīng)元數(shù)量等。其次,對模型的優(yōu)化參數(shù)進行比選,包括:初始學(xué)習(xí)率與學(xué)習(xí)率變動計劃、批處理大小、激活函數(shù)以及各類算子的尺寸與步長等。不同結(jié)構(gòu)參數(shù)與優(yōu)化參數(shù)的組合見表1。

其中,數(shù)據(jù)集的大小為75 300組,選自上海市2011年349 d的延安高架快速路的線圈檢測器數(shù)據(jù)。以訓(xùn)練集、驗證集、測試集的比例為0.8:0.1:0.1劃分?jǐn)?shù)據(jù)集,即約選取60 300組作為訓(xùn)練集,7 500組作為驗證集,7 500組作為測試集對模型進行訓(xùn)練。

2.4 模型訓(xùn)練結(jié)果

本研究工作環(huán)境是內(nèi)存為16 GB,GPU為Tesla P100的服務(wù)器,采用Tensorflow深度學(xué)習(xí)框架。所得到的最優(yōu)Inception-CNN示意圖見圖7(基于輸入時間步長為30 min,下同),共包含831.3萬個待訓(xùn)練權(quán)值參數(shù),訓(xùn)練時長為771 s。圖中,CONV1~CONV12表 示 卷 積 層,Avgpool 1~Avgpool2表示平均池化層,Maxpool1表示最大池化層,F(xiàn)C1~FC2表示全連接層,Y為預(yù)測結(jié)果。

表1 結(jié)構(gòu)結(jié)構(gòu)參數(shù)與優(yōu)化參數(shù)Tab.1 Structural parameters and optimization parameters

圖7 最優(yōu)Inception-CNN結(jié)構(gòu)Fig.7 Optimum structure of Inception-CNN

模型參數(shù)信息見表2,輸入的圖像大小為35×6×1,其中35代表35個斷面,6代表6個時間步長,1代表單通道。通過實驗,批處理大小設(shè)置為256,激活函數(shù)為ReLU,初始學(xué)習(xí)率為0.001。在第一個Inception模塊中,共包含4種卷積或池化算子的組合:2個卷積層,分別有64個大小為3×3的卷積核;1個卷積層,包含96個大小為3×3的卷積核;1個卷積層,包含64個大小為1×1的卷積核;1個卷積層與1個池化層,分別有64個大小為1×1的卷積核與大小為3×3的平均池化算子。在第二個Inception模塊中,共包含3種卷積或池化算子的組合:4個卷積層,分別有128個大小為1×3與3×1的卷積核;2個卷積層,分別有192個大小為1×3與3×1的卷積核;1個卷積層與1個池化層,分別有大小為2×2的平均池化算子與64個大小為3×3的卷積核。綜上,Inception-CNN模型所學(xué)習(xí)得到的交通狀態(tài)時空關(guān)聯(lián)特征將具有復(fù)雜性、多樣性。

表2 Inception-CNN模型參數(shù)信息Tab.2 Parameter configuration of Inception-CNN

3 模型評價

本研究選取了經(jīng)典的統(tǒng)計學(xué)模型與淺層、深層神經(jīng)網(wǎng)絡(luò)對模型結(jié)果進行綜合評價,包括不同輸入時間步長下模型的穩(wěn)定性,模型精度,以及模型時序、時空特征學(xué)習(xí)能力的分析。涉及的模型有:針對時間序列問題應(yīng)用廣泛的數(shù)理統(tǒng)計學(xué)模型ARIMA;一定深度的人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN),具有3個隱藏層,各層神經(jīng)元數(shù)量分別為512、512、256,共包含51.1萬個待訓(xùn)練參數(shù);對于序列數(shù)據(jù)有較好適應(yīng)性的神經(jīng)網(wǎng)絡(luò)RNN,具有2個隱藏層(LSTM結(jié)構(gòu)),各層神經(jīng)元數(shù)量均為128,共包含135.7萬個待訓(xùn)練參數(shù);以及不包含Inception模塊的基本CNN,具有兩個卷積層、池化層與全連接層,各層神經(jīng)元數(shù)量分別為:256、512、1 024、512,共包含1 011.5萬個待訓(xùn)練參數(shù)。其中,各神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)見圖8。

圖8 對比模型結(jié)構(gòu)Fig.8 Architecture of comparison model

3.1 預(yù)測穩(wěn)定性與精度評價

由于輸入時間步長會影響到模型的預(yù)測精度與預(yù)測結(jié)果的穩(wěn)定性[31]。故,首先根據(jù)2.3中設(shè)定的30、45、60 min不同的輸入時間步長進行模型對比分析,各個神經(jīng)網(wǎng)絡(luò)模型以不同的初始值與不同的訓(xùn)練集劃分方式(隨機選?。┻M行訓(xùn)練,記錄多次訓(xùn)練中預(yù)測結(jié)果的平均值與方差,見圖9。其中,填充區(qū)域表示標(biāo)準(zhǔn)差。可以得到,當(dāng)輸入30 min歷史數(shù)據(jù)時,各個神經(jīng)網(wǎng)絡(luò)模型的預(yù)測MAE與多次訓(xùn)練中的標(biāo)準(zhǔn)差均最低。即,在該場景下,模型的預(yù)測表現(xiàn)與預(yù)測結(jié)果穩(wěn)定性均較優(yōu)。說明交通狀態(tài)的演變具有時效性,30 min的歷史數(shù)據(jù)中包含了足夠的有效特征,當(dāng)輸入數(shù)據(jù)的時間跨度繼續(xù)增大時,將引入無效的信息。故下文的對比分析都基于該場景。

模型預(yù)測精度分析結(jié)果如表3所示。Inception-CNN模型預(yù)測誤差最小,較傳統(tǒng)數(shù)理統(tǒng)計模型下降了31.37%,其預(yù)測精度也有1.83%的提升。ARIMA模型由于進行單點預(yù)測,耗時遠高于其他模型;ANN、RNN、CNN模型的訓(xùn)練時間花費分別為75、1 660以及343 s,結(jié)合模型待訓(xùn)練參數(shù)數(shù)量進行考量,Inception-CNN模型的訓(xùn)練效率僅略次于CNN模型。

表3模型預(yù)測MAE與MAPETab.3 MAEs and MAPEs of the model predictions

為進一步分析模型的精度,本文將數(shù)據(jù)集劃分為工作日、非工作日以及所有時間三類。在此基礎(chǔ)上,對模型進行訓(xùn)練并取得最優(yōu)結(jié)構(gòu),結(jié)果見圖10。分析發(fā)現(xiàn),在三個場景下,模型預(yù)測得到的MAE值具有相同的的變化趨勢:(1)非工作日<所有時間<工作日;(2)Inception-CNN<RNN<CNN<ANN<ARIMA。其中,第一個結(jié)論是由于非工作日的交通事件較少,而工作日的常發(fā)性與偶發(fā)性交通事件都有所上升,增加了預(yù)測任務(wù)的難度。從第二個結(jié)論以及圖9可以看出,Inception-CNN可對不同場景下多尺度復(fù)雜的交通模式進行更為有效的特征提取,在交通擁堵常發(fā)性與偶發(fā)性特性表現(xiàn)不一致的工作日與非工作日,以及包含不同程度信息量的不同輸入時間步長條件下均有較好的預(yù)測精度。

圖10 不同數(shù)據(jù)集下模型結(jié)果Fig.10 Model results in different dataset

3.2 時序特征學(xué)習(xí)能力評價

由于交通數(shù)據(jù)具有較強的時序特征,故本小節(jié)對各個模型在該方面的提取能力進行分析。首先利用線性回歸方法計算模型對每個線圈的預(yù)測值與真實值之間的差異,隨后對35個線圈的計算值進行平均,見表4。其中,k為斜率,b為y軸上的截距,R2為線性回歸決定系數(shù)??梢钥闯?,Inception-CNN模型的回歸效果最優(yōu),R2為0.920 3。此結(jié)論反映出Inception-CNN模型對于時序特征的學(xué)習(xí)能力較強,甚至優(yōu)于對于時序數(shù)據(jù)有較強適應(yīng)性的RNN模型,其原因可能在于Inception-CNN中存在多個尺度不一的交通狀態(tài)時序特征提取器,同時混合多維度特征的分析預(yù)測也有利于單維度特征提取任務(wù)。

表4 模型回歸分析結(jié)果Tab.4 Regression analysis of models

為進一步說明上述結(jié)論,選取2011年1月3日的數(shù)據(jù)進行可視化展示,見圖11。ANN模型的行程速度預(yù)測時變曲線與真實曲線的相近程度優(yōu)于ARIMA模型;ARIMA模型的預(yù)測曲線有波動異常的現(xiàn)象,同時與真實曲線存在著變化趨勢相反或延遲的區(qū)段。而深度神經(jīng)網(wǎng)絡(luò)模型,如RNN、CNN以及本文提出的Inception-CNN模型的預(yù)測結(jié)果均較好,可選取早高峰時段再進行細部比較。

根據(jù)圖12,可以看出,RNN與CNN模型均具備反映行程速度時變基本特征與趨勢的能力;而Inception-CNN模型在此基礎(chǔ)上,可得到與真實行程速度距離更小的時變曲線。即在時序特征學(xué)習(xí)方面,Inception-CNN模型可通過提取不同粒度下的關(guān)聯(lián)性,準(zhǔn)確預(yù)測每個線圈(斷面)時段內(nèi)的速度變化趨勢與大小。

圖11 行程速度預(yù)測時變曲線Fig.11 Time-varying curve of travelling speed prediction

圖12 行程速度預(yù)測時變曲線(早高峰時段)Fig.12 Time-varying curve of travelling speed prediction(morning rush hour)

3.3 時空特征學(xué)習(xí)能力評價

根據(jù)圖2可以看出,行程速度時空圖像通過描繪交通事件的輪廓表征交通狀態(tài)的演變過程,其中不同顏色交界的邊緣(交通事件的影響范圍)框定了不同的交通狀態(tài),是交通管理與控制中較為重要的組成部分。本研究為進一步得到模型時空特征學(xué)習(xí)能力,將會從圖像分析的角度對行程速度預(yù)測結(jié)果再深入分析。而傳統(tǒng)的誤差檢測方法,如MAE與MAPE指標(biāo)并無法有效地對其評估,故本研究引入了一種圖像質(zhì)量的評估方法對真實圖像與預(yù)測圖像的差異進行分析。該方法借助的指標(biāo)為GMSD,可借助梯度幅值反映結(jié)構(gòu)信息,基于局部質(zhì)量退化在圖像全局上的變化反映圖像的質(zhì)量,對圖像邊緣特征的變化較為敏感。本研究中選擇的卷積算子為Prewitt算子[41],利用上述算子對圖像進行卷積操作,即可得到圖像在水平與垂直方向上的梯度幅值,進而計算圖像的各個局部梯度場rGMS(i),最后求得梯度場的偏差GMSD值rGMSD,其計算公式如下:

式(7)計算結(jié)果如圖13所示。

圖13模型GMSD計算結(jié)果Fig.13 GMSD of models

行程速度時空圖像與計算GMSD過程中得到的卷積特征圖如圖14所示,包含真實值與Inception-CNN模型預(yù)測值。其中,GMSD的計算值越低,代表預(yù)測圖像與真實圖像之間的一致性越強。根據(jù)圖13與圖14可以得到,ARIMA的GMSD最高,該模型預(yù)測所得的行程速度時空圖像可能存在一定的噪聲;由ANN至RNN至CNN,模型生成的圖像質(zhì)量逐漸提升;而Inception-CNN模型所得到的行程速度時空圖像與真實圖像的一致性最強,GMSD達到0.126 8,遠低于其他模型。較低的GMSD指標(biāo)說明基于Inception-CNN模型預(yù)測結(jié)果生成的行程速度時空圖像可以更加準(zhǔn)確地描述各個交通擁堵的時間與空間邊緣(交通狀態(tài)產(chǎn)生較大變化),即在準(zhǔn)確定位交通擁堵時空位置的基礎(chǔ)上,能較為清晰有效地體現(xiàn)交通擁堵發(fā)生、延續(xù)和消散的動態(tài)過程。故Inception-CNN模型可通過串行或并行組合尺寸不一的卷積及池化算子,對行程速度時空圖像中影響范圍、持續(xù)時間、嚴(yán)重程度不同的多粒度的交通事件(不同顏色框定的區(qū)域)進行較為準(zhǔn)確的識別與特征提取,進而充分學(xué)習(xí)交通狀態(tài)的時空特征。同時還可得到,相較于表3,在圖13中Inception-CNN模型的性能遠勝于其他模型,即GMSD指標(biāo)對于評估基于圖像的交通流預(yù)測方法有更好的適用性,可提供更具參考價值的結(jié)果。

圖14 行程速度時空圖像對比Fig.14 Comparison of time-space travelling speed images

4 結(jié)論

(1)提出了一種新的針對城市快速路行程速度短時預(yù)測的混合CNN模型——Inception-CNN模型。該模型以交通數(shù)據(jù)生成的行程速度時空圖像為特征學(xué)習(xí)對象,自動學(xué)習(xí)復(fù)雜交通擁堵模式及其演化特征,對時空等高維關(guān)聯(lián)性進行多粒度特征提取,行程速度預(yù)測誤差僅為2.45 km·h-1,預(yù)測精度超過95%。

(2)針對基于圖像學(xué)習(xí)的交通流預(yù)測方法,引入了GMSD指標(biāo)并結(jié)合回歸分析方法定量評價了模型學(xué)習(xí)交通流時間序列特征和時空關(guān)聯(lián)特征的能力,彌補了傳統(tǒng)評價指標(biāo)的不足,豐富了該類模型在交通流預(yù)測方面的評價方法。結(jié)果表明,Inception-CNN模型能有效提取交通數(shù)據(jù)的時間序列和時空關(guān)聯(lián)特征,預(yù)測結(jié)果所生成的行程速度時空圖像可準(zhǔn)確反映交通擁堵在時空層面產(chǎn)生、延續(xù)、消散的過程。

(3)對比分析了不同輸入時間步長和預(yù)測場景下的模型預(yù)測性能。此外,本研究針對行程速度短時預(yù)測任務(wù)所建立的Inception-CNN模型和指標(biāo)評價體系可應(yīng)用于其他交通參數(shù)如流量、占有率的短時預(yù)測任務(wù)與定量結(jié)果分析中。

(4)本研究的數(shù)據(jù)源單一且研究范圍有限,后續(xù)研究可進一步結(jié)合交通事件和氣象檢測數(shù)據(jù),并將研究范圍擴大至拓?fù)浣Y(jié)構(gòu)更復(fù)雜的區(qū)域城市快速路網(wǎng),以測試本研究所提出的Inception-CNN模型的有效性。

作者貢獻申明:

唐克雙:提出研究思路、撰寫和修改文稿;

陳思曲:處理實證數(shù)據(jù)、構(gòu)建模型算法、撰寫文稿;

曹喻旻:設(shè)計模型實驗、修改文稿;

張鋒鑫:提出模型框架、分析實驗結(jié)果、修改文稿。

猜你喜歡
時空卷積交通
跨越時空的相遇
基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
繁忙的交通
童話世界(2020年32期)2020-12-25 02:59:14
鏡中的時空穿梭
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
玩一次時空大“穿越”
小小交通勸導(dǎo)員
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
時空之門
一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識別方法
定远县| 望谟县| 常州市| 富民县| 呼和浩特市| 台东市| 东平县| 北流市| 洛宁县| 昌黎县| 大冶市| 福贡县| 全州县| 定西市| 虎林市| 当涂县| 荔浦县| 精河县| 凤城市| 盐边县| 马关县| 筠连县| 荔浦县| 南澳县| 城口县| 平阳县| 永昌县| 孝昌县| 黎城县| 子洲县| 古田县| 德令哈市| 寿宁县| 广州市| 彩票| 南漳县| 锡林郭勒盟| 宁阳县| 平远县| 雷山县| 筠连县|