王海程 馬紀(jì)穎 張?jiān)锋? 楊紹祖
摘 要:為解決出租車行業(yè)中的高空駛率和不均衡的需求分布問(wèn)題,通過(guò)對(duì)出租車出行的區(qū)域進(jìn)行深入研究,提出了一個(gè)融合時(shí)序關(guān)聯(lián)動(dòng)態(tài)圖與常微分方程的需求預(yù)測(cè)模型TCG-ODE(temporal correlation graphs-ordinary differential equations)。首先,模型使用ODE(ordinary differential equation)對(duì)圖卷積神經(jīng)網(wǎng)絡(luò)(graph convolutional network,GCN)進(jìn)行微分方程建模,將堆疊局部特征信息抽象為動(dòng)態(tài)圖,以節(jié)點(diǎn)的時(shí)序特性來(lái)推進(jìn)局部節(jié)點(diǎn)狀態(tài);然后,設(shè)計(jì)了一種基于注意力分?jǐn)?shù)調(diào)整采樣策略的蒸餾方案,提高對(duì)多層稀疏圖的適應(yīng)效果,以更穩(wěn)定地表征復(fù)雜時(shí)空特征,最終實(shí)現(xiàn)對(duì)區(qū)域間出租車需求量的預(yù)測(cè)。在真實(shí)的出租車訂單數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),研究結(jié)果表明,TCG-ODE模型的預(yù)測(cè)效果均優(yōu)于對(duì)照模型和改進(jìn)前的模型。通過(guò)精準(zhǔn)預(yù)測(cè)不同區(qū)域之間的出租車需求量,可以為出租車司機(jī)和乘客出行提供決策支持信息,從而優(yōu)化供需關(guān)系。
關(guān)鍵詞:需求預(yù)測(cè); 圖卷積神經(jīng)網(wǎng)絡(luò); 常微分方程; 蒸餾方案
中圖分類號(hào):TP183?? 文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2024)03-021-0794-05
doi:10.19734/j.issn.1001-3695.2023.06.0317
Inter-regional taxi demand forecasting based on time series correlationdynamic graph and ordinary differential equation
Wang Haicheng1,2, Ma Jiying1,2, Zhang Yuanyuan1,2, Yang Shaozu1,2
(1. School of Computer Science & Technology, Shenyang University of Chemical Technology, Shenyang 110142, China; 2. Liaoning Provincial Key Laboratory of Intelligent Technology of Chemical Process Industry, Shenyang 110142, China)
Abstract:In order to solve the problem of high vacancy rate and unbalanced demand distribution in the taxi industry, through in-depth research on the taxi travel region, this paper proposed a demand forecasting model combining temporal correlation dynamic graphs and ordinary differential equations,called TCG-ODE. Firstly, the model used ODE to model the differential equations of GCN, and abstracted the stacked local feature information into a dynamic graph. It advanced the local node state based on the timing characteristics of nodes. Then, it designed a distillation scheme based on the attention score adjustment sampling strategy to improve the adaptation effect to the multi-layer sparse graph, so as to more stably represent the complex spatio-temporal characteristics, and finally realized the prediction of inter-regional taxi demand. Experimental results conducted on real taxi order datasets demonstrate that the TCG-ODE model outperforms both benchmark models and the pre-improvement model in terms of demand prediction accuracy. By accurately forecasting taxi demand among different regions, this model provides decision support information for taxi drivers and passengers, thereby optimizing the supply-demand relationship.
Key words:demand forecasting; graph convolutional network(GCN); ordinary differential equation(ODE); distillation scheme
0 引言
出租車在城市交通中扮演著重要的角色,它們作為城市間交通連接的橋梁,發(fā)揮著重要的作用。然而,由于出租車與乘客間不均衡的供需分布,導(dǎo)致出租車空駛率高與乘客打車難的矛盾,進(jìn)而可能造成交通擁堵,給整體交通流暢性帶來(lái)負(fù)面影響。隨著人們對(duì)于出租車的需求不斷增加,這種問(wèn)題會(huì)被不斷放大。某些區(qū)域或時(shí)間段出租車供應(yīng)過(guò)剩,導(dǎo)致出租車空駛率高,司機(jī)的收入受到影響;同時(shí),其他區(qū)域或時(shí)間段出租車供應(yīng)不足,乘客面臨打車難的問(wèn)題,出行效率降低,影響了乘客的工作生活安排。為有效解決上述問(wèn)題,需要對(duì)區(qū)域間出租車需求量進(jìn)行精確的預(yù)測(cè),從而為出租車司機(jī)和乘客提供合理的出行方案,進(jìn)而提高司機(jī)收入、改善乘客乘車體驗(yàn)以及增強(qiáng)交通系統(tǒng)的可靠性。
區(qū)域間出租車需求量預(yù)測(cè)問(wèn)題作為交通流量預(yù)測(cè)的一種,是指在特定城市或地區(qū)內(nèi)的不同區(qū)域之間,通過(guò)挖掘歷史軌跡數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)某個(gè)時(shí)間段內(nèi)(如小時(shí)、天等)的出租車需求數(shù)量。現(xiàn)有的交通流量預(yù)測(cè)方法主要分為統(tǒng)計(jì)方法模型、傳統(tǒng)機(jī)器學(xué)習(xí)模型以及深度學(xué)習(xí)模型。早期的預(yù)測(cè)主要以統(tǒng)計(jì)方法為主,包括移動(dòng)平均法、指數(shù)平滑法、線性回歸模型(linear regression)和自回歸積分移動(dòng)平均模型(autoregressive integrated moving average,ARIMA)[1]等。然而,這些方法受限于歷史數(shù)據(jù)中的模式和趨勢(shì)的建模能力,并且難以處理復(fù)雜的非線性關(guān)系。為了克服這些限制,機(jī)器學(xué)習(xí)方法,如支持向量機(jī)[2]、人工神經(jīng)網(wǎng)絡(luò)[3]和決策樹(shù)[4]等被引入到交通流量預(yù)測(cè)中。這些方法能夠利用大量的歷史數(shù)據(jù)來(lái)學(xué)習(xí)交通流量的模式和關(guān)系,并且在一定程度上捕捉非線性關(guān)系和復(fù)雜模式,但通常需要大量數(shù)據(jù)和計(jì)算資源,且模型的解釋性較差。
近年來(lái),基于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的方法在交通流量預(yù)測(cè)領(lǐng)域得到了廣泛應(yīng)用。Ku等人[5]和呂開(kāi)云等人[6]分別采用循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)和長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(long short term memory,LSTM)進(jìn)行預(yù)測(cè),但RNN和LSTM僅僅考慮時(shí)間依賴關(guān)系,忽略了空間結(jié)構(gòu)對(duì)預(yù)測(cè)結(jié)果的影響。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[7]同時(shí)考慮了時(shí)間和空間兩個(gè)因素并且取得了較好的結(jié)果,但是其空間依賴關(guān)系提取方法太過(guò)簡(jiǎn)單,在非規(guī)則圖結(jié)構(gòu)上的表現(xiàn)較弱;此外,CNN在處理圖數(shù)據(jù)時(shí)受限于卷積核大小和層數(shù),難以實(shí)現(xiàn)深層特征學(xué)習(xí)。為此,部分學(xué)者提出了GNN的預(yù)測(cè)方法,使用GNN對(duì)圖結(jié)構(gòu)數(shù)據(jù)進(jìn)行有效學(xué)習(xí)。例如:陳柘等人[8]使用GCN對(duì)城市路網(wǎng)內(nèi)路段的空間關(guān)系特征進(jìn)行挖掘以提升預(yù)測(cè)效果;Xiao等人[9]利用一種新的時(shí)空?qǐng)D卷積網(wǎng)絡(luò)(space-time graph convolutional network,STGCN),通過(guò)挖掘多視角數(shù)據(jù)中的潛在信息來(lái)進(jìn)行預(yù)測(cè)并返回需求;Guo等人[10]使用基于注意力機(jī)制的時(shí)空?qǐng)D卷積網(wǎng)絡(luò)(attention-based spatial-temporal graph convolutional network,ASTGCN),利用GCN的結(jié)構(gòu),結(jié)合注意力機(jī)制對(duì)時(shí)空?qǐng)D數(shù)據(jù)進(jìn)行建模和分析。實(shí)驗(yàn)結(jié)果表明,上述模型在需求預(yù)測(cè)任務(wù)方面取得了不錯(cuò)的效果。
盡管GNN在處理圖結(jié)構(gòu)數(shù)據(jù)方面具有優(yōu)勢(shì),但是隨著模型具有更深的層次結(jié)構(gòu)或者訓(xùn)練輪數(shù)的增加,往往會(huì)出現(xiàn)過(guò)度平滑的現(xiàn)象[11].,導(dǎo)致模型難以區(qū)分不同節(jié)點(diǎn)并學(xué)習(xí)到相似的節(jié)點(diǎn)表示。為了驗(yàn)證本文實(shí)驗(yàn)中是否存在過(guò)度平滑現(xiàn)象,使用了基于GCN和歷史數(shù)據(jù)的建模和預(yù)測(cè)方法,得到了如圖1所示的結(jié)果。實(shí)驗(yàn)結(jié)果顯示,隨著模型層數(shù)的增加,預(yù)測(cè)效果不再理想;而隨著訓(xùn)練輪數(shù)的增加,預(yù)測(cè)結(jié)果逐漸趨于穩(wěn)定。這種平滑化現(xiàn)象可能會(huì)導(dǎo)致模型損失對(duì)節(jié)點(diǎn)間細(xì)微差異的感知能力,使得節(jié)點(diǎn)的表示趨向于聚集在相似的空間區(qū)域中。為了緩解過(guò)度平滑問(wèn)題,研究人員提出了一些方法。其中,NODE是一種基于常微分方程理論的神經(jīng)網(wǎng)絡(luò)模型[12],它提供了更靈活和表現(xiàn)力更強(qiáng)的模型架構(gòu)來(lái)捕捉節(jié)點(diǎn)之間的時(shí)間關(guān)系。另外,Zheng等人[13]基于GNN提出了時(shí)空?qǐng)D常微分方程網(wǎng)絡(luò)(STGODE),通過(guò)利用基于張量的常微分方程(ODE)來(lái)捕捉時(shí)空動(dòng)態(tài),構(gòu)建了更深層的網(wǎng)絡(luò)結(jié)構(gòu),從而進(jìn)一步提高了交通流量預(yù)測(cè)的效果。
雖然現(xiàn)有的研究[1~12]能夠?qū)崿F(xiàn)不錯(cuò)的交通流量預(yù)測(cè)效果,但是仍存在以下問(wèn)題:
a)多網(wǎng)絡(luò)層堆疊過(guò)程可能會(huì)導(dǎo)致訓(xùn)練結(jié)果過(guò)平滑。這種過(guò)度平滑化可能導(dǎo)致節(jié)點(diǎn)之間的差異性減小,降低網(wǎng)絡(luò)對(duì)于復(fù)雜模式和圖結(jié)構(gòu)的表達(dá)能力,導(dǎo)致無(wú)法有效地區(qū)分不同類別或圖中的細(xì)節(jié)信息。
b)對(duì)于空間臨近性關(guān)注度不夠。在GCN當(dāng)中,通過(guò)聚合節(jié)點(diǎn)的鄰居特征來(lái)更新節(jié)點(diǎn)的表示,如果忽視了空間臨近性,可能會(huì)導(dǎo)致特征聚合過(guò)程中的失衡,距離較遠(yuǎn)的節(jié)點(diǎn)可能被不合理地聚合,而忽略了距離較近的節(jié)點(diǎn)的重要信息,從而影響模型的特征表達(dá)和預(yù)測(cè)能力。
c)現(xiàn)有的神經(jīng)常微分方程對(duì)于動(dòng)態(tài)圖的構(gòu)建是以構(gòu)建動(dòng)態(tài)鄰接矩陣為主,而缺少以時(shí)序序列為特征關(guān)系的構(gòu)建方案。
d)時(shí)空特性引起的稀疏性對(duì)模型的適應(yīng)能力較差,在處理復(fù)雜的時(shí)空關(guān)系時(shí)面臨較高的計(jì)算復(fù)雜度。
為解決上述問(wèn)題,本文提出了一種基于TCG-ODE的需求預(yù)測(cè)方法。模型通過(guò)神經(jīng)常微分方程(neural ordinary differential equation,NODE)和多注意力機(jī)制來(lái)實(shí)現(xiàn)精準(zhǔn)的需求量預(yù)測(cè),主要的工作如下:
a)在多網(wǎng)絡(luò)層堆疊過(guò)程中,將GCN模型的靜態(tài)圖卷積操作替換為動(dòng)態(tài)的節(jié)點(diǎn)(NODE)表示,將節(jié)點(diǎn)表示的更新過(guò)程從離散的靜態(tài)操作轉(zhuǎn)換為連續(xù)的動(dòng)態(tài)過(guò)程。通過(guò)利用NODE的動(dòng)力學(xué)性質(zhì),捕捉節(jié)點(diǎn)表達(dá)中更復(fù)雜的模式和非線性關(guān)系。
b)構(gòu)建以時(shí)序序列關(guān)系為基礎(chǔ)的動(dòng)態(tài)圖方案,通過(guò)堆疊多個(gè)動(dòng)態(tài)節(jié)點(diǎn)表示的網(wǎng)絡(luò)層,以節(jié)點(diǎn)的時(shí)序特性來(lái)逐步推進(jìn)節(jié)點(diǎn)狀態(tài)。
c)設(shè)計(jì)了一種基于注意力分?jǐn)?shù)調(diào)整采樣策略的蒸餾方案,根據(jù)當(dāng)前各節(jié)點(diǎn)的注意力分?jǐn)?shù)計(jì)算當(dāng)前狀態(tài)下的采樣數(shù)量,實(shí)時(shí)地調(diào)整采樣策略。
3 實(shí)驗(yàn)
3.1 數(shù)據(jù)集
本文所使用的實(shí)驗(yàn)數(shù)據(jù)是基于紐約市出租車和豪華轎車委員會(huì)(TLC)的行程記錄數(shù)據(jù),其中特定選取了黃色出租車的訂單數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)源。提取其中的車流量數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)集,將各時(shí)刻的原始訂單數(shù)據(jù)劃分成時(shí)間間隔5 min的數(shù)據(jù)樣本,即每個(gè)區(qū)域每小時(shí)收集12個(gè)樣本數(shù)據(jù)。數(shù)據(jù)集描述如表1所示。
為了確保分析和建模的準(zhǔn)確性和效率,對(duì)使用的數(shù)據(jù)進(jìn)行了預(yù)處理,包括異常值檢測(cè)和數(shù)據(jù)轉(zhuǎn)換。在訂單數(shù)據(jù)記錄過(guò)程中,可能會(huì)受到設(shè)備故障、障礙物干擾等因素影響,導(dǎo)致出現(xiàn)記錄異常的情況,因此剔除異常或者缺失的數(shù)據(jù)。另外,為了滿足模型訓(xùn)練的需求,將現(xiàn)有的訂單數(shù)據(jù)記錄轉(zhuǎn)換為統(tǒng)計(jì)數(shù)據(jù),得到符合實(shí)驗(yàn)要求的數(shù)據(jù)形式。預(yù)處理后,對(duì)數(shù)據(jù)按照小時(shí)進(jìn)行周期處理并標(biāo)準(zhǔn)化處理。為了找到最佳的模型參數(shù)并更準(zhǔn)確地評(píng)估模型性能,將數(shù)據(jù)集按照3∶1∶1的比例劃分為訓(xùn)練集、測(cè)試集和驗(yàn)證集。
3.2 實(shí)驗(yàn)設(shè)置
為了有效評(píng)估本文模型的預(yù)測(cè)性能,分別采用平均絕對(duì)誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)以及平均絕對(duì)百分比誤差(mean absolute percen-tage error,MAPE)作為實(shí)驗(yàn)的評(píng)價(jià)指標(biāo),其公式如式(10)~(12)所示,數(shù)值越小表示預(yù)測(cè)效果越好。
其中:N表示時(shí)間序列長(zhǎng)度;Yi表示預(yù)測(cè)區(qū)域i在預(yù)測(cè)時(shí)間間隔內(nèi)的真實(shí)值;Y^i表示預(yù)測(cè)區(qū)域i在預(yù)測(cè)時(shí)間間隔內(nèi)的預(yù)測(cè)值。實(shí)驗(yàn)使用Python編程語(yǔ)言,模型的搭建基于PyTorch深度學(xué)習(xí)框架。具體的實(shí)驗(yàn)環(huán)境描述如表2所示。實(shí)驗(yàn)中,每次迭代訓(xùn)練中用于更新模型權(quán)重的樣本數(shù)量(batch_size)設(shè)置為32,優(yōu)化器采用Adam,損失函數(shù)為MSE。模型訓(xùn)練200個(gè)輪次,初始學(xué)習(xí)率為0.001。
3.3 實(shí)驗(yàn)與結(jié)果分析
3.3.1 不同模型對(duì)比實(shí)驗(yàn)
為了驗(yàn)證TCG-ODE模型的性能選擇,采用以下基線模型進(jìn)行對(duì)比:
a)ARIMA[1]是一種經(jīng)典的時(shí)間序列分析方法,結(jié)合自回歸、差分和移動(dòng)平均技術(shù),用于預(yù)測(cè)具有一定趨勢(shì)和季節(jié)性特征的數(shù)據(jù)。
b)SVR(support vector regression)[2]是一種機(jī)器學(xué)習(xí)回歸方法,利用支持向量機(jī)技術(shù),適用于非線性關(guān)系的數(shù)據(jù)預(yù)測(cè)與建模。
c)LSTM[6]是一種循環(huán)神經(jīng)網(wǎng)絡(luò),通過(guò)門控機(jī)制來(lái)捕獲長(zhǎng)期依賴關(guān)系,用于處理時(shí)間序列數(shù)據(jù),可捕捉長(zhǎng)期依賴關(guān)系。
d)STGCN[9]是一種深度學(xué)習(xí)模型,結(jié)合圖卷積和時(shí)空信息,用于處理時(shí)空數(shù)據(jù)。
e)ASTGCN[10]結(jié)合圖卷積和注意力機(jī)制,用于處理時(shí)空數(shù)據(jù),強(qiáng)調(diào)關(guān)鍵節(jié)點(diǎn)和時(shí)序信息。
f)STTN[15,16]利用自注意力機(jī)制整合時(shí)空特征,用于時(shí)序數(shù)據(jù)建模,強(qiáng)調(diào)節(jié)點(diǎn)間復(fù)雜依賴關(guān)系。
將TCG-ODE模型與以上各基線模型在Taxi NYC上進(jìn)行未來(lái)3小時(shí)的預(yù)測(cè)性能對(duì)比,實(shí)驗(yàn)結(jié)果如表3所示。根據(jù)評(píng)價(jià)指標(biāo)可知,TCG-ODE模型的預(yù)測(cè)效果優(yōu)于其他模型。
其中ARIMA、SVR和LSTM模型的效果最差,這是由于它們?nèi)狈?duì)于空間特征的建模;STGCN雖然從時(shí)空角度進(jìn)行建模,卻難以捕獲復(fù)雜的時(shí)空依賴關(guān)系;STTN基于Transformer架構(gòu),能夠利用自注意力機(jī)制有效地建模時(shí)空關(guān)系,實(shí)現(xiàn)對(duì)復(fù)雜時(shí)空序列數(shù)據(jù)的建模和預(yù)測(cè);ASTGCN在STGCN的基礎(chǔ)上引入注意力機(jī)制,能夠有效捕捉時(shí)空?qǐng)D數(shù)據(jù)中的關(guān)聯(lián)性和時(shí)序特征,從而提高時(shí)空序列數(shù)據(jù)的建模和預(yù)測(cè)能力,因此,STTN和ASTGCN都取得了不錯(cuò)的效果。然而,上述模型都是以離散圖結(jié)構(gòu)進(jìn)行建模的,在堆疊多層圖結(jié)構(gòu)的過(guò)程中會(huì)產(chǎn)生平滑的現(xiàn)象,導(dǎo)致預(yù)測(cè)結(jié)果不理想。相比之下,TCG-ODE模型以時(shí)序序列為特征關(guān)系,構(gòu)建動(dòng)態(tài)圖的神經(jīng)常微分方程模型,并著重關(guān)注區(qū)域臨近性,因此取得了更好的預(yù)測(cè)效果。
3.3.2 優(yōu)化過(guò)程消融實(shí)驗(yàn)
本文提出的預(yù)測(cè)模型是在STTN的基礎(chǔ)上引入TCG-ODE層和自適應(yīng)注意力層。為了驗(yàn)證上述兩點(diǎn)對(duì)于模型性能的影響,消融實(shí)驗(yàn)分別在Exp1、Exp2、Exp3和Exp4模型上進(jìn)行建模預(yù)測(cè)。其中:Exp1表示沒(méi)有引入TCG-ODE層和自適應(yīng)注意力層的模型;Exp2表示引入TCG-ODE層但沒(méi)有自適應(yīng)注意力層的模型;Exp3表示同時(shí)引入TCG-ODE層和自適應(yīng)注意力層的模型,即TCG-ODE模型;Exp4表示引入TCG-ODE層中的TCG(temporal correlation graphs)模塊和自適應(yīng)注意力層的模型,它意味著對(duì)于多層圖結(jié)構(gòu)的離散建模過(guò)程。將上述模型進(jìn)行消融實(shí)驗(yàn),結(jié)果如表4所示。由表4可知,僅對(duì)于TCG-ODE層優(yōu)化并不一定可以取得理想的效果,可能是由于模型對(duì)該數(shù)據(jù)的適應(yīng)性不夠好,在完成對(duì)自適應(yīng)注意力層的優(yōu)化后,提高了模型的泛化能力和對(duì)數(shù)據(jù)集的適應(yīng)能力,所以預(yù)測(cè)效果均優(yōu)于Exp1和Exp2模型;Exp4模型在預(yù)測(cè)過(guò)程中也取得不錯(cuò)的預(yù)測(cè)效果,但隨著模型訓(xùn)練輪數(shù)增加,過(guò)平滑現(xiàn)象的出現(xiàn)導(dǎo)致了其預(yù)測(cè)效果不如Exp3模型。
為了進(jìn)一步評(píng)估模型的預(yù)測(cè)性能,將預(yù)測(cè)未來(lái)3 h(36個(gè)時(shí)間間隔)的數(shù)據(jù)進(jìn)一步可視化,為呈現(xiàn)全局預(yù)測(cè)趨勢(shì),繪制不同指標(biāo)下的各模型對(duì)比圖,如圖8所示,分別展示了不同模型隨著預(yù)測(cè)間隔增加,預(yù)測(cè)性能的變化。由圖8可知,對(duì)于任一指標(biāo),Exp3(TCG-ODE)模型隨著預(yù)測(cè)間隔的增加,預(yù)測(cè)性能均優(yōu)于其他模型,而且變化相對(duì)穩(wěn)定,這意味著相較于其他模型,Exp3在長(zhǎng)時(shí)間跨度內(nèi)可以保持可靠的預(yù)測(cè)性能。
3.3.3 真實(shí)值與預(yù)測(cè)值對(duì)比實(shí)驗(yàn)
為直觀地評(píng)估TCG-ODE模型的預(yù)測(cè)準(zhǔn)確性和性能,將各區(qū)域間出租車數(shù)量預(yù)測(cè)值與真實(shí)值進(jìn)行對(duì)比,以此量化模型在不同時(shí)間點(diǎn)的預(yù)測(cè)偏差,從而判斷模型是否能夠準(zhǔn)確捕捉時(shí)間序列的變化趨勢(shì)和波動(dòng)。圖9為不同區(qū)域在不同時(shí)序下的預(yù)測(cè)值和真實(shí)值比對(duì)的可視化結(jié)果。
從空間特征考慮,為體現(xiàn)比對(duì)實(shí)驗(yàn)的價(jià)值,從區(qū)域的多樣性、挑戰(zhàn)性和代表性出發(fā),選擇了編號(hào)為48、79、132和230的區(qū)域,這四個(gè)區(qū)域?yàn)榧~約市不同區(qū)有代表性的區(qū)域;從時(shí)間特征考慮,為了較好地反映變化趨勢(shì),選擇2023年3月1日一整天的時(shí)間進(jìn)行預(yù)測(cè)對(duì)比。
通過(guò)對(duì)圖9的觀察可知,各個(gè)區(qū)域在時(shí)間內(nèi)呈現(xiàn)出相似的趨勢(shì)和波動(dòng),表明模型在捕捉時(shí)間變化方面相對(duì)準(zhǔn)確。然而,在高峰或低谷時(shí)段的切換過(guò)程中,模型的預(yù)測(cè)值與真實(shí)值可能存在一些偏差,例如在早晨或下午的時(shí)間段,如圖(a)和(b)在2~8點(diǎn)、圖(c)在5~8點(diǎn)以及圖(d)在8~17點(diǎn),這種偏差可能源自于不同區(qū)域的交通、人流等因素差異,以及模型在不同時(shí)段的適應(yīng)性表現(xiàn)。進(jìn)一步觀察,局部峰值的預(yù)測(cè)也可能存在一定程度的偏差,如圖(a)和(b)在1~2點(diǎn)、圖(c)在14~17點(diǎn)以及圖(d)在16~18點(diǎn),這可能是因?yàn)樵谶@些時(shí)間點(diǎn)內(nèi),真實(shí)值受到特殊事件或外部因素的影響。雖然從時(shí)間角度來(lái)說(shuō),曲線變化的趨勢(shì)和波動(dòng)相似,但是不同區(qū)域之間的偏差變化是不同的,這暗示了每個(gè)區(qū)域的特定特征和模型的應(yīng)對(duì)能力。在空間特征分析中,不同區(qū)域之間的差異引發(fā)了預(yù)測(cè)值與真實(shí)值的偏差變化,這反映了每個(gè)區(qū)域在不同時(shí)間段的特點(diǎn)和影響因素不同。綜上所述,模型在預(yù)測(cè)時(shí)空特征方面取得了不錯(cuò)的效果,但是受外部因素、數(shù)據(jù)分布以及模型自身的限制影響,使得預(yù)測(cè)結(jié)果出現(xiàn)了一定的偏差。為了進(jìn)一步提升預(yù)測(cè)精度,可以針對(duì)特殊時(shí)段和區(qū)域的特征進(jìn)行更深入的分析,優(yōu)化模型的參數(shù)和結(jié)構(gòu),并考慮引入更多外部數(shù)據(jù)來(lái)彌補(bǔ)預(yù)測(cè)誤差。
s
4 結(jié)束語(yǔ)
本文提出了一種融合時(shí)序關(guān)聯(lián)動(dòng)態(tài)圖與常微分方程的需求預(yù)測(cè)模型TCG-ODE,該模型以時(shí)序序列為特征關(guān)系,通過(guò)ODE對(duì)GCN進(jìn)行微分方程建模,同時(shí)引入自適應(yīng)注意力層,完成對(duì)區(qū)域間出租車需求量的預(yù)測(cè)。在真實(shí)的出租車數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果表明本文模型取得了不錯(cuò)的預(yù)測(cè)效果。然而,本文研究還存在一些局限性。首先,模型依賴于可靠的出租車訂單數(shù)據(jù),因此對(duì)數(shù)據(jù)質(zhì)量和可用性有一定要求;其次,模型仍有進(jìn)一步改進(jìn)的空間,例如可考慮在更多的時(shí)空特征方面進(jìn)行擴(kuò)展;最后,受外部因素、數(shù)據(jù)分布以及模型自身的限制影響,預(yù)測(cè)準(zhǔn)確度仍存在可以提升的可能。為減少局限性的影響,可以選擇更高質(zhì)量的數(shù)據(jù)進(jìn)行實(shí)驗(yàn),也可以針對(duì)特殊時(shí)段和區(qū)域的特征進(jìn)行深入分析,以便更好地應(yīng)對(duì)不同情況下的交通流量預(yù)測(cè)問(wèn)題。綜上,TCG-ODE模型在解決出租車行業(yè)中的空駛率高和需求不均衡問(wèn)題方面表現(xiàn)出良好的預(yù)測(cè)效果,能為出租車行業(yè)的可持續(xù)發(fā)展和交通出行的優(yōu)化提供參考和指導(dǎo)。
參考文獻(xiàn):
[1]劉學(xué)剛, 張騰飛, 韓印. 基于ARIMA模型的短時(shí)交通流預(yù)測(cè)研究[J]. 物流科技, 2019,42(12): 91-94,102. (Liu Xuegang, Zhang Tengfei, Han Yin. Research on short-term traffic flow forecast based on ARIMA model[J]. Logistics Sci-Tech, 2019,42(12):91-94,102.)
[2]曹來(lái)成, 梁浩, 韓薇, 等. 基于SVR對(duì)交通流中線性關(guān)聯(lián)關(guān)系的分析與研究[J]. 計(jì)算機(jī)應(yīng)用研究, 2015,32(2): 419-422. (Cao Laicheng, Liang Hao, Han Wei, et al. Analysis and research of linear correlation relationship in traffic flow based on SVR[J]. Application Research of Computers, 2015,32(2): 419-422.)
[3]田瑞杰, 張維石, 翟華偉. 基于時(shí)間序列與BP-ANN的短時(shí)交通流速度預(yù)測(cè)模型研究[J]. 計(jì)算機(jī)應(yīng)用研究, 2019,36(11): 3262-3265,3329. (Tian Ruijie, Zhang Weishi, Zhai Huawei. Short-term traffic flow velocity prediction model based on time series and BP-ANN[J]. Application Research of Computers, 2019,36(11): 3262-3265,3329.)
[4]楊勝, 李莉, 胡福喬, 等. 基于決策樹(shù)的城市短時(shí)交通流預(yù)測(cè)[J]. 計(jì)算機(jī)工程, 2005(8): 35-36. (Yang Sheng, Li Li, Hu Fuqiao, et al. Urban short-term traffic flow forecasting based on decision tree[J]. Computer Engineering, 2005(8):35-36.)
[5]Ku D G, Na S Y, Kim J Y, et al. Real-time taxi demand prediction using recurrent neural network[J]. Proceedings of the Institution of Civil Engineers-Municipal Engineer, 2021,174(2): 75-87.
[6]呂開(kāi)云, 邱萬(wàn)錦, 龔循強(qiáng), 等. 基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的城市交通速度預(yù)測(cè)[J]. 東華理工大學(xué)學(xué)報(bào): 自然科學(xué)版, 2023,46(1): 77-84. (Lyu Kaiyun, Qiu Wanjin, Gong Xunqiang, et al. Urban traffic speed prediction based on long short-term memory neural network[J].Journal of Donghua University of Technology:Natural Science Edition, 2023,46(1): 77-84.)
[7]Ranjan N, Bhandari S, Zhao Hongping, et al. City-wide traffic congestion prediction based on CNN, LSTM and transpose CNN[J]. IEEE Access, 2020,8: 81606-81620.
[8]陳柘, 劉嘉華, 趙斌, 等. 基于GCN和TCN的多因素城市路網(wǎng)出租車需求預(yù)測(cè)[J]. 控制與決策, 2023,38(4): 1031-1038. (Chen Zhe, Liu Jiahua, Zhao Bin, et al. Taxi demand prediction of multi-factor urban road network based on GCN and TCN[J]. Control and Decision, 2023,38(4): 1031-1038.)
[9]Xiao Guangnian, Wang Ruinan, Zhang Chunqin, et al. Demand prediction for a public bike sharing program based on spatio-temporal graph convolutional networks[J]. Multimedia Tools and Applications, 2020,80(15): 22907-22925.
[10]Guo Shengnan, Lin Youfang, Feng Ning, et al. Attention based spatial temporal graph convolutional networks for traffic flow forecasting[C]//Proc of AAAI Conference on Artificial Intelligence. Palo Alto,CA: AAAI Press, 2019: 922-929.
[11]Chen Deli, Lin Yankai, Li Wei, et al. Measuring and relieving the over-smoothing problem for graph neural networks from the topological view[C]//Proc of AAAI Conference on Artificial Intelligence. Palo Alto,CA: AAAI Press, 2020: 3438-3445.
[12]Jin Ming, Zheng Yu, Li Y F, et al. Multivariate time series forecasting with dynamic graph neural ODEs[J]. IEEE Trans on Know-ledge and Data Engineering, 2022,35(9): 9168-9180.
[13]Zheng Fang, Long Qingqing, Song Guojie, et al. Spatial-temporal graph ODE networks for traffic flow forecasting[C]//Proc of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. New York: ACM Press, 2021: 364-373.
[14]Zhou Haoyi, Zhang Shanghang, Peng Jieqi, et al. Informer: beyond efficient transformer for long sequence time-series forecasting[C]//Proc of the 35th Association for Advancement of Artificial Intel-ligence. Palo Alto,CA: AAAI Press, 2021: 11106-11115.
[15]Pu Bin,Liu Jiansong,Kang Yan,et al. MVSTT: a multiview spatial-temporal transformer network for traffic-flow forecasting.[J/OL]. IEEE Trans on Cybernetics.(2022-12-13). http://doi.org/10.1109/tcyb.2022.3223918.
[16]高榕, 萬(wàn)以亮, 邵雄凱, 等. 面向改進(jìn)的時(shí)空Transformer的交通流量預(yù)測(cè)模型[J]. 計(jì)算機(jī)工程與應(yīng)用, 2023,59(7): 250-260. (Gao Rong, Wan Yiliang, Shao Xiongkai, et al. Traffic flow prediction model for improved spatio-temporal Transformer[J]. Computer Engineering and Application, 2023,59(7): 250-260.)