金尚柱 郁 昇 趙 彥 武 宸
(重慶科技學(xué)院 智能技術(shù)與工程學(xué)院, 重慶 401331)
我國(guó)交通領(lǐng)域的碳排放量占碳排放總量的10%左右,通過(guò)交通流量預(yù)測(cè)可提升交通能效,是構(gòu)建低碳交通的重要途徑。交通流量預(yù)測(cè)的方法主要包括統(tǒng)計(jì)方法模型、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)。李建森等人通過(guò)BP神經(jīng)網(wǎng)絡(luò)模型和自回歸求和滑動(dòng)平均(ARIMA)模型,對(duì)非線性和線性結(jié)構(gòu)進(jìn)行組合,量化了影響交通的因素[1]。文獻(xiàn)[2]中基于卡曼濾波理論構(gòu)建了交通流量預(yù)測(cè)模型,但該模型的靈活性較低,運(yùn)算過(guò)程較復(fù)雜。隨著機(jī)器學(xué)習(xí)方法的發(fā)展,構(gòu)建靈活度高、參數(shù)依賴(lài)性低的模型是交通流量預(yù)測(cè)的新方向。文獻(xiàn)[3]中提出了基于支持向量機(jī)的高速公路短時(shí)交通流量預(yù)測(cè)模型,提升了檢測(cè)的魯棒性,取得了較好的效果。文獻(xiàn)[4]中提出了基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)、卷積殘差網(wǎng)絡(luò)和注意力機(jī)制的融合模型,實(shí)驗(yàn)結(jié)果表明該模型對(duì)多步交通流量預(yù)測(cè)有較好的效果。
近年來(lái),圖卷積神經(jīng)網(wǎng)絡(luò)快速發(fā)展,在深度學(xué)習(xí)領(lǐng)域引起了廣泛的關(guān)注,T-GCN、MCSTGCN、STSGCN等相繼被提出[5-7]。圖卷積神經(jīng)網(wǎng)絡(luò)首先對(duì)拓?fù)鋱D數(shù)據(jù)的相關(guān)信息進(jìn)行提取合并,然后轉(zhuǎn)換為頻域信息,最后利用獲取的圖特征信息對(duì)圖數(shù)據(jù)進(jìn)行預(yù)測(cè)分析。交通數(shù)據(jù)具有拓?fù)浣Y(jié)構(gòu),傳統(tǒng)的交通流量預(yù)測(cè)方法難以對(duì)其進(jìn)行挖掘使用,本次研究采用ChebNet[8-9]模型對(duì)拓?fù)浣Y(jié)構(gòu)中的信息進(jìn)行挖掘,對(duì)交通數(shù)據(jù)進(jìn)行預(yù)測(cè)分析。
圖卷積過(guò)程主要包括圖數(shù)據(jù)輸入、卷積層特征提取、全連接層分類(lèi)、輸出結(jié)果等4部分,圖卷積過(guò)程如圖1所示?;镜念l域卷積網(wǎng)絡(luò)主要通過(guò)圖傅里葉變換來(lái)實(shí)現(xiàn)[9],通過(guò)對(duì)圖中拉普拉斯矩陣進(jìn)行特征分解,求得所有的特征值及特征向量。原始頻譜卷積網(wǎng)絡(luò)中參數(shù)較多,且計(jì)算較復(fù)雜,Michaёl Defferrard等學(xué)者提出了ChebNet網(wǎng)絡(luò),用切比雪夫多項(xiàng)式替換圖卷積的卷積核,加速特征矩陣的求解。
圖1 圖卷積過(guò)程
頻域卷積網(wǎng)絡(luò)可以對(duì)圖的結(jié)點(diǎn)、結(jié)構(gòu)和邊等信息進(jìn)行融合,并轉(zhuǎn)換為頻域中的信息,具體操作如下:
(1) 信息融合。利用拉普拉斯矩陣L對(duì)圖的信息進(jìn)行融合。
(2) 特征分解。將拉普拉斯矩陣L進(jìn)行特征分解,得到特征值及特征向量,如式(1)所示:
(1)
(3) 歸一化。對(duì)拉普拉斯矩陣L算子的特征向量進(jìn)行歸一化處理,將圖的信息由空域轉(zhuǎn)換為頻域。
(4) 圖卷積。圖f與卷積核gθ的卷積如式(2)所示:
f*gθ=U((UTgθ)⊙(UTf))
(2)
式中:*表示圖卷積運(yùn)算;⊙表示哈德曼乘積。
ChebNet網(wǎng)絡(luò)利用切比雪夫多項(xiàng)式來(lái)構(gòu)建切比雪夫卷積核,將全局卷積轉(zhuǎn)換為局部卷積,切比雪夫多項(xiàng)式如式(3)所示[10]。與原始頻譜卷積網(wǎng)絡(luò)相比,ChebNet網(wǎng)絡(luò)的參數(shù)量大幅度減少,時(shí)間復(fù)雜度較低,ChebNet圖卷積的運(yùn)算如式(4)所示:
Tn+1(x)=2xTn(x)-Tn-1(x)
(3)
(4)
式中:M為卷積核的感受野半徑;θk為切比雪夫多項(xiàng)式的系數(shù);Lk為對(duì)應(yīng)的拉普拉斯矩陣;x為輸入特征。
切比雪夫卷積核的計(jì)算如式(5)所示:
(5)
式中:βk為訓(xùn)練過(guò)程中的參數(shù);Tk為k階切比雪夫多項(xiàng)式;λmax為拉普拉斯矩陣L的最大值;Λ為n個(gè)特征值構(gòu)成的對(duì)角矩陣。
本次研究采用PeMs04數(shù)據(jù)集,PeMs04數(shù)據(jù)集由307個(gè)傳感器每4 min采集聚合一次、連續(xù)采集59 d的交通流量數(shù)據(jù)組成。交通流量數(shù)據(jù)包含車(chē)流量、平均車(chē)速度、車(chē)道占用率等3個(gè)維度。在PeMs04數(shù)據(jù)集中,203號(hào)傳感器3個(gè)維度的可視化展示如圖2所示。車(chē)流量數(shù)據(jù)變化較大,而平均車(chē)速度和車(chē)道占用率數(shù)據(jù)相對(duì)比較穩(wěn)定,因此本次研究?jī)H對(duì)車(chē)流量數(shù)據(jù)進(jìn)行訓(xùn)練和預(yù)測(cè)。
圖2 203號(hào)傳感器3個(gè)維度的可視化展示
對(duì)模型參數(shù)進(jìn)行設(shè)置:每次訓(xùn)練批量為64,訓(xùn)練次數(shù)為30,使用的優(yōu)化器為Adam,學(xué)習(xí)率為0.001,切比雪夫多項(xiàng)式的階為2。
損失函數(shù)常被用于計(jì)算輸出預(yù)測(cè)值和真實(shí)值的損失,得到的損失值用于反向傳播,從而達(dá)到更新模型參數(shù)的目的。本次研究選用的是均方損失函數(shù),其公式如式(6)所示:
(6)
ChebNet網(wǎng)絡(luò)模型訓(xùn)練階段的損失如圖3所示。經(jīng)過(guò)30次的迭代訓(xùn)練,損失值趨于穩(wěn)定,這表示網(wǎng)絡(luò)模型收斂性較好,預(yù)測(cè)準(zhǔn)確性較高。
圖3 ChebNet訓(xùn)練階段的損失
本次研究采用平均絕對(duì)誤差(AME)、均方根誤差(RMSE)、決定系數(shù)(R2)等3個(gè)評(píng)價(jià)指標(biāo)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)價(jià)。各指標(biāo)公式如式(7) — 式(9)所示:
(7)
(8)
(9)
本次研究采用ChebNet與GAT、GCN等3種網(wǎng)絡(luò)模型對(duì)交通流量數(shù)據(jù)集進(jìn)行預(yù)測(cè)[11-12],并對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià),結(jié)果如表1所示。
表1 不同網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果評(píng)價(jià)
這3個(gè)模型在AME、RMSE、R2指標(biāo)評(píng)價(jià)上都有不錯(cuò)的表現(xiàn),其中ChebNet優(yōu)于其他2個(gè)模型,這表明ChebNet對(duì)交通流量預(yù)測(cè)效果更好。ChebNet、GCN、GAT預(yù)測(cè)值和真實(shí)值的對(duì)比如圖4所示??梢悦黠@地看出,ChebNet網(wǎng)絡(luò)模型的預(yù)測(cè)值和真實(shí)值最接近,精度更高。因此,采用ChebNet進(jìn)行交通預(yù)測(cè),能提高公路交通管理效率,避免汽車(chē)擁堵現(xiàn)象,從而減少碳排放。
圖4 ChebNet、GCN、GAT網(wǎng)絡(luò)模型的預(yù)測(cè)值和真實(shí)值的對(duì)比
本次研究采用ChebNet網(wǎng)絡(luò)模型對(duì)交通流量進(jìn)行了預(yù)測(cè),試圖通過(guò)人工智能算法對(duì)交通流量進(jìn)行預(yù)測(cè),以達(dá)到減少碳排放的目的。首先,將交通信息轉(zhuǎn)化為圖數(shù)據(jù),然后,整合結(jié)點(diǎn)特征信息和結(jié)構(gòu)信息,融合局部結(jié)構(gòu)信息,最后,根據(jù)實(shí)驗(yàn)?zāi)P妥儞Q輸出結(jié)果。實(shí)驗(yàn)結(jié)果證明, ChebNet模型對(duì)交通流量預(yù)測(cè)的準(zhǔn)確度較高,采用ChebNet對(duì)交通流量進(jìn)行預(yù)測(cè),有助于提高公路交通的管理效率,減少汽車(chē)擁堵現(xiàn)象的發(fā)生,從而降低碳排放量。