国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于K-means聚類與PLS回歸模型的交通速度短時預(yù)測

2023-06-23 04:37:36賈秀燕孫秋霞李勍
關(guān)鍵詞:城市交通

賈秀燕 孫秋霞 李勍

摘要:為實現(xiàn)對交通流局部特征的有效提取,提高交通速度預(yù)測模型的可解釋性,提出基于K-means聚類與偏最小二乘(Partial Least Squares,PLS)回歸的交通速度短時預(yù)測模型。模型采用時空相關(guān)矩陣挖掘路網(wǎng)中相鄰路段交通速度之間的關(guān)聯(lián)性,利用K-means聚類算法劃分歷史數(shù)據(jù)集,并選取實測出租車GPS數(shù)據(jù)驗證模型對交通速度短時預(yù)測的準(zhǔn)確性。實驗結(jié)果表明,與ARIMA、PLS回歸和LSTM模型相比,該模型的預(yù)測誤差減少了約30%。

關(guān)鍵詞:城市交通;速度短時預(yù)測;K-means聚類;偏最小二乘回歸;時空相關(guān)矩陣

中圖分類號:U121 文獻標(biāo)志碼:A

隨著中國機動化進程不斷加快,高峰出行困難成為大中城市所普遍面臨的難題。作為智能交通運輸系統(tǒng)的一項重要功能,交通控制與誘導(dǎo)調(diào)控策略的制定主要依賴于交通速度預(yù)測的結(jié)果。交通速度預(yù)測按照預(yù)測時間窗的長度通常劃分為長時預(yù)測和短時預(yù)測,長時預(yù)測的時間步長通常以日、月或年計算,短時預(yù)測更傾向于對交通狀態(tài)的微觀描述,觀測時間通常小于15min[1-2]。預(yù)測短時交通速度,實時評價交通狀況,能夠起到疏導(dǎo)交通擁堵、減少環(huán)境污染和駕乘人員等待時間、提高交通參與者的安全、為駕駛?cè)颂峁┯行С鲂行畔⒎?wù)的作用。國內(nèi)外學(xué)者利用各學(xué)科領(lǐng)域內(nèi)的知識開發(fā)了各種用于短時交通速度預(yù)測的方法,這些方法大致分為兩大類:經(jīng)典方法和基于深度學(xué)習(xí)的方法。經(jīng)典預(yù)測方法包括統(tǒng)計方法和傳統(tǒng)的機器學(xué)習(xí)方法[3]。統(tǒng)計方法假設(shè)未來數(shù)據(jù)與歷史數(shù)據(jù)具有相似性,通過建立數(shù)據(jù)驅(qū)動的統(tǒng)計模型對交通速度分析預(yù)測,而交通速度數(shù)據(jù)具有復(fù)雜的非線性特征,往往不滿足統(tǒng)計方法的假設(shè),且這些方法多適用于小數(shù)據(jù)集[4-5]。傳統(tǒng)的機器學(xué)習(xí)模型整體的非線性有限,預(yù)測效果并不是最佳的[6-8]。深度學(xué)習(xí)的出現(xiàn)使人工智能在交通速度預(yù)測的潛能得到進一步開發(fā)[9-14]。在數(shù)據(jù)集有限的應(yīng)用情景下,深度學(xué)習(xí)模型難以有效的挖掘數(shù)據(jù)的規(guī)律,同時具有計算復(fù)雜度高、可解釋性差的缺點。為了實現(xiàn)交通流量、交通速度、行程時間的短時預(yù)測,將多個模型組合以提升模型預(yù)測性能[15-17]。模型的組合方式、權(quán)重參數(shù)的確定以及訓(xùn)練數(shù)據(jù)集的平衡問題是組合模型研究中的難點[18-19]。為了克服傳統(tǒng)模型無法有效提取交通速度數(shù)據(jù)非線性特征這一缺點,本文聚焦路網(wǎng)交通速度之間關(guān)聯(lián)性的挖掘,建立時空相關(guān)矩陣,利用K-means聚類算法把相似狀態(tài)的交通速度聚類進行建模分析,放大數(shù)據(jù)的局部特征,更準(zhǔn)確地把握交通速度的變化趨勢。綜合考慮模型的預(yù)測精度與計算時間復(fù)雜度,使模型具有更高的解釋性,選擇偏最小二乘回歸模型作為最終的預(yù)測模型。

1 研究方法

1.1 路網(wǎng)時空相關(guān)性的挖掘

為分析相關(guān)路段交通流對目標(biāo)路段交通流的影響程度,估計交通流之間的相關(guān)性,而不是直接對交通流本身進行聚類。若城市道路網(wǎng)絡(luò)中某一區(qū)域內(nèi)含有P節(jié)路段,且每一路段上都裝有環(huán)路檢測器(傳感器)以采集實時的交通速度數(shù)據(jù),可以得到P條路段的歷史交通速度數(shù)據(jù)所組成的時間序列數(shù)據(jù)V=(V1,V2,…,VP),

2 實證分析

2.1 研究區(qū)域概況

為驗證提出模型的有效性,選取青島市西海岸新區(qū)長江中路作為主要的研究區(qū)域。青島市西海岸新區(qū)長江路是一條東西走向的主干道,沿線串聯(lián)了新區(qū)的行政、商務(wù)、教育、餐飲、居住功能區(qū),路口較多,交通流密集,尤其是上下班的早晚高峰時段,人車交織,導(dǎo)致通車效率不高、交通事故頻發(fā),長江中路路段尤為嚴(yán)重。作為新區(qū)核心位置的主干道,長江中路的交通服務(wù)品質(zhì)難以滿足日益增長的社會需求,成為新區(qū)主要的道路“瓶頸”。

將青島市西海岸新區(qū)長江中路作為目標(biāo)道路,為清晰、直觀地觀察各條路段的地理位置,從OpenStreetMap官網(wǎng)下載路網(wǎng)矢量數(shù)據(jù),如圖1所示。研究地點具有典型拓?fù)浣Y(jié)構(gòu),展示了交通流之間不同程度的時空相關(guān)性,這七條道路雖位于不同的方向,但間接相連,每條道路對應(yīng)不同的道路名稱,具體對應(yīng)關(guān)系見表1。

2.2 數(shù)據(jù)預(yù)處理

研究數(shù)據(jù)為青島市西海岸新區(qū)長江中路2017年8月7日至2017年8月20日出租車GPS軌跡數(shù)據(jù),利用Python軟件對其預(yù)處理,獲得有效數(shù)據(jù)1 752 694條,出租車GPS原始軌跡數(shù)據(jù)示例見表2。

其中,v(k)為當(dāng)前路段在時間間隔k內(nèi)的平均速度,vi,n為第n輛出租車在第i個GPS點處的速度值,i為當(dāng)前路段內(nèi)GPS點的編號,I為當(dāng)前路段內(nèi)所有GPS點的數(shù)量,n是當(dāng)前路段內(nèi)出租車的編號,N為當(dāng)前路段上所有出租車的數(shù)量,Nk是時間間隔k內(nèi)經(jīng)過當(dāng)前路段的車輛數(shù)。

為了解西海岸新區(qū)長江中路交通速度的宏觀特征,基于預(yù)處理后的數(shù)據(jù),利用Python軟件繪制2017年8月7日至8月20日交通速度熱力圖(圖2),交通速度存在明顯的周期性和日相似特征,即不同天的同一時間段的速度值有著相類似的趨勢規(guī)律,而同一天的不同時間段存在著較大的差異。圖2中顏色的深淺代表了交通速度值的大小,顏色越深,速度就越小,代表道路越擁堵,長江中路8月7日至8月20日的交通流速度數(shù)據(jù)存在明顯的雙峰現(xiàn)象,且出行的早高峰集中于07∶00~08∶30時間段,晚高峰集中17∶00~19∶00時間段。

2.3 構(gòu)建時空相關(guān)矩陣

根據(jù)長江中路早晚高峰時段的分布狀況,利用式(2)分別計算長江中路2017年8月19日8∶30的早高峰時空相關(guān)矩陣與2017年8月19日19∶00的晚高峰時空相關(guān)矩陣,時間延遲d分別設(shè)置為18與24個時間間隔,每個時間間隔為5 min,相應(yīng)的時空相關(guān)矩陣熱力圖如圖3所示。

圖中顏色的深淺代表了目標(biāo)路段R3的交通速度與其他路段交通速度之間相關(guān)性的大小,顏色越深代表相關(guān)性越強。結(jié)果分析發(fā)現(xiàn),早高峰時段,當(dāng)時間延遲為0時,路段R3與路段R1、路段R4、路段R5以及路段R7的相關(guān)系數(shù)均為正值,且大于0.5。晚高峰時段,在時間延遲為0時,路段R3與路段R1、路段R2以及路段R4(相關(guān)系數(shù)的絕對值大于0.5。7條路段在不同時間延遲下相關(guān)系數(shù)的變化趨勢相似,但在同一時間延遲下路段之間交通速度的相關(guān)性強度有較大差異。這說明選擇的路段之間存在較強的相關(guān)性,可以通過時空相關(guān)矩陣的聚類來捕獲交通流之間的時空相關(guān)的異質(zhì)性。

2.4 K-means聚類結(jié)果

為了確定聚類數(shù)目m值,采用方差比準(zhǔn)則(Calinski-Harabaz Index,CHI)評價聚類效果,CHI基于數(shù)據(jù)集特性評估聚類效果,值越大代表聚類的效果越好[16]。CHI值隨m值的變化趨勢如圖4所示??芍?,m=2時CHI值取得最大值,說明兩種情況均在劃分為兩簇時聚類效果最佳,因此將訓(xùn)練數(shù)據(jù)集分為兩簇。

K-means聚類結(jié)果見表3。可以看出,早、晚高峰時段的數(shù)據(jù)雖均被劃分為兩簇,但兩簇之間并不完全相同。如路段R1、R3始終在同一簇中,說明路段R3與路段R1的交通狀態(tài)最為相似;而路段R6缺少辦公樓、商場、醫(yī)院等因素吸引人車流入,始終在數(shù)量少的一簇內(nèi)。在不同的高峰時段,路段R4與路段R5被劃分到了不同的簇中,這可能與路段所處的地理位置、交通流流向以及周邊的興趣點(Point of Interest,POI)屬性相關(guān)。路段R4為城市主干道,西鄰富春江路小學(xué),東鄰青島西海岸新區(qū)中心醫(yī)院,早高峰時段與相鄰路段的車流來往密切,而路段R5穿過居民區(qū),在晚高峰時段與相鄰路段的車流關(guān)系密切,說明同一天不同時間段的交通速度之間存在差異性。

2.5 基于偏最小二乘算法的短時交通速度預(yù)測

利用K-means聚類算法得到與目標(biāo)路段R3在早晚高峰時段最相關(guān)的路段,篩選出與目標(biāo)路段的交通速度具有高相關(guān)性的歷史數(shù)據(jù)集,使用更新后的數(shù)據(jù)集構(gòu)建基于偏最小二乘算法的短時交通速度預(yù)測模型。由偏最小二乘算法的建模過程可知,只需選取前r個主成分建立回歸方程就可以達(dá)到較好的預(yù)測精度,r個成分的選擇提取可通過進行交叉有效性檢驗來確認(rèn)[20]。交叉有效性檢驗結(jié)果見表4。

由表4可知,前4個主成分的交叉有效性均大于0.097 5,但第5個主成分交叉有效性小于0.097 5,不滿足交叉有效性提取條件,表明該成分不能明顯改善模型的擬合能力,因此,模型只提取前4個主成分,得到標(biāo)準(zhǔn)化偏最小二乘回歸方程為

其中,y*zao、y*wan分別為長江中路在早高峰時段和晚高峰時段的預(yù)測模型。最終預(yù)測的效果如圖5所示。

對比圖5(a)與(b),早高峰時段交通速度的預(yù)測值更接近于真實值,晚高峰時段的預(yù)測值誤差略大,說明該模型對高頻率波動的數(shù)據(jù)預(yù)測精度相對較差,但預(yù)測值與真實值的總體變化趨勢是一致的。長江中路交通速度整體較為平緩,早高峰時段集中在15~25 km/h,晚高峰時段集中在10~20 km/h,晚高峰速度值低于早高峰,因為長江中路位于經(jīng)濟開發(fā)區(qū)中心,商場較多,晚間時段人口集中,車流密度大。

2.6 模型評價

其中,yi為交通速度的真實值;i為模型預(yù)測值;N為測試樣本集的個數(shù)。對比結(jié)果見表5、表6。

添加“周”周期并采取對歷史數(shù)據(jù)集先聚類后預(yù)測的方法,模型的預(yù)測精度有了較明顯的改善。與經(jīng)典模型相比,本文提出的基于K-means聚類與PLS回歸預(yù)測模型的預(yù)測精度最佳。這說明通過構(gòu)建時空相關(guān)矩陣并對其進行聚類,篩選出與目標(biāo)路段相關(guān)性最強的路段,更新訓(xùn)練數(shù)據(jù)集,可以提高模型的預(yù)測精度。相比于LSTM模型,PLS回歸模型具有更高的預(yù)測精度,且模型的訓(xùn)練時間更少。這說明PLS回歸模型不僅能夠以量化的方式給出模型提高精度過程,具有更強的解釋性,且模型的計算復(fù)雜度更低。

3 結(jié)論

本文的交通速度短時預(yù)測模型通過計算時空相關(guān)矩陣挖掘路網(wǎng)中相鄰路段之間交通速度的關(guān)聯(lián)性,利用K-means聚類更新數(shù)據(jù)集,結(jié)合PLS回歸模型預(yù)測交通速度。本文模型相比于傳統(tǒng)方法具有更高的預(yù)測精度,模型的預(yù)測速度和可解釋性也有較大的提升,是一種可行的交通速度短時預(yù)測方法。后續(xù)研究中,將考慮組合模型的方式,在模型訓(xùn)練過程中選擇添加其他時段的交通速度數(shù)據(jù),以增強模型的適用性。

參考文獻

[1]VLAHOGIANNI E I, KARLAFTIS M G, GOLIAS J C. Short-term traffic forecasting: Where we are and where we′re going[J]. Transportation Research Part C-Emerging Technologies, 2014, 43(1): 3-19.

[2]袁健, 范炳全. 交通流短時預(yù)測研究進展[J]. 城市交通, 2012,10(6):73-79.

[3]周輝宇, 李瑞敏, 黃安強, 等. 基于時空關(guān)聯(lián)規(guī)則挖掘的城市交通擁堵傳導(dǎo)預(yù)測[J]. 系統(tǒng)工程理論與實踐,2022, 42(8): 2210-2224.

[4]張國赟, 金輝. 基于改進ARIMA模型的城市軌道交通短時客流預(yù)測研究[J]. 計算機應(yīng)用與軟件, 2022, 39(1): 339-344.

[5]LI W, WANG J X, FAN R, et al. Short-term traffic state prediction from latent structures: Accuracy vs. efficiency[J]. Transportation Research Part C-Emerging Technologies, 2020, 111: 72-90.

[6]CHEN R, LIANG C Y, HONG W C, et al. Forecasting holiday daily tourist flow based on seasonal support vector regression with adaptive genetic algorithm[J]. Applied Soft Computing, 2015, 26: 435-443.

[7]LI Y F, JIANG X, ZHU H, et al. Multiple measures-based chaotic time series for traffic flow prediction based on Bayesian theory[J]. Nonlinear Dynamics, 2016, 85(1):179-194.

[8]PRIAMBODO B, AHMAD A, KADIR R A. Spatio-temporal K-NN prediction of traffic state based on statistical features in neighboring roads[J]. Journal of Intelligent and Fuzzy Systems, 2021, 40(5): 9059-9072.

[9]RUMELHART D E, HINTON G E, WILLIAMS R J. Learning representations by back-propagating errors[J]. Nature, 1986, 323: 533-536.

[10]? SUN Z Y, HU Y J, LI W, et al. Prediction model for short-term traffic flow based on a K-means-gated recurrent unit combination[J]. IET Intelligent Transport Systems, 2022, 16(5): 675-690.

[11] KANG C L, ZHANG Z Y. Application of LSTM in short-term traffic flow prediction[C]// 2020 IEEE 5th International Conference on Intelligent Transportation Engineering (ICITE). Beijing, 2020: 98-101.

[12] LI Z Y, GE H X, CHENG R J. Traffic flow prediction based on BILSTM model and data denoising scheme[J]. Chinese Physics B, 2022,31(4):214-223.

[13] BRUNA J, ZAREMBA W, SZLAM A, et al. Spectral networks and locally connected networks on graphs[DB/OL].[2022-08-30]. https://arxiv.org/pdf/1312.6203.pdf.

[14] SHEN G J, HAN X, CHIN K, et al. An attention-based digraph convolution network enabled framework for congestion recognition in three-dimensional road networks[J]. IEEE Transactions on Intelligent Transportation Systems, 2021,23(9): 14413-14426.

[15] CHENG Z Y, WANG W, LU J, et al. Classifying the traffic state of urban expressways: A machine-learning approach[J]. Transportation Research Part A-Policy and Practice, 2020, 137: 411-428.

[16] 王旭鵬, 王夢靈. 基于相似性聚類的交通流概率組合預(yù)測模型[J]. 華東理工大學(xué)學(xué)報(自然科學(xué)版), 2022, 48(3): 381-387.

[17] ZHANG Z H, WANG Y P, CHEN P, et al. Probe data-driven travel time forecasting for urban expressways by matching similar spatiotemporal traffic patterns[J]. Transportation Research Part C-Emerging Technologies, 2017, 85: 476-493.

[18] GUO Y N, YANG H, CHEN M Y, et al. Ensemble prediction-based dynamic robust multi-objective optimization methods[J]. Swarm and Evolutionary Computation, 2019, 48: 156-171.

[19] YANG L K, GUO Y N, CHENG J, et al. Manifold distance-based over-sampling technique for class imbalance learning[C]// 33rd AAAI Conference on Artificial Intelligence/31st Innovative Applications of Artificial Intelligence Conference/ 9th AAAI Symposium on Educational Advances in Artificial Intelligence. Hawaii, 2019: 10071-10072.

[20] 王德政, 張益農(nóng), 楊帆. 基于MapReduce的并行PLS過程監(jiān)控算法實現(xiàn)[J]. 計算機工程與應(yīng)用, 2018, 54(24): 61-65+175.

Short-term Prediction of Traffic Speed Based on K-means Clustering and PLS Regression Model

JIA Xiu-yan, SUN Qiu-xia, LI Qing

(College of Mathematics and Systems Science, Shandong University of Science and Technology, Qingdao 266590, China)

Abstract: To achieve effective extraction of local features of traffic flow and to improve the interpretability of traffic prediction models, a K-means clustering and PLS regression model was proposed to predict short-time traffic speed. The Spatio-temporal correlation matrix was calculated to explore the correlation between the traffic speeds of adjacent road sections in the road network. The K-means clustering algorithm was used to divide the historical data set. The PLS regression model was used to make the predictions. To verify the accuracy of the model for short-time traffic speed prediction, the GPS data of taxis was selected for validation. The experimental results show that the models prediction error is reduced by about 30% compared with the ARIMA, PLS regression, and LSTM models.

Keywords: urban transportation; short-term speed prediction; K-means clustering; partial least squares regression; spatio-temporal correlation matrix

收稿日期:2022-09-09

基金項目:山東省自然科學(xué)基金面上項目(批準(zhǔn)號:ZR2021MF113)資助。

通信作者:孫秋霞,女,博士,副教授,主要研究方向為交通大數(shù)據(jù)分析與建模。E-mail:qiuxiasun@sdust.edu.cn。

猜你喜歡
城市交通
新形勢下我國城市交通發(fā)展戰(zhàn)略思考
老齡化背景下關(guān)于城市交通適老化對策的思考
共享單車對城市交通的影響
智富時代(2019年2期)2019-04-18 07:44:42
基于城市總體規(guī)劃的城市交通組織優(yōu)化設(shè)計與實施研究
智能城市(2018年8期)2018-07-06 01:12:10
上海城市交通大數(shù)據(jù)研究與實踐
上海公路(2018年1期)2018-06-26 08:37:40
基于多源異構(gòu)數(shù)據(jù)的城市交通綜合分析與交通病診斷
中國公路(2017年11期)2017-07-31 17:56:25
基于車聯(lián)網(wǎng)技術(shù)的城市交通優(yōu)化研究
圍繞城市交通出行,博世打造兼具軟件和服務(wù)的數(shù)字化企業(yè)
基于城市交通網(wǎng)絡(luò)的歷史街區(qū)單向交通組織優(yōu)化
契合城市交通需求 推進單軌交通發(fā)展
泸定县| 古浪县| 于田县| 唐海县| 西宁市| 方城县| 克什克腾旗| 青冈县| 清新县| 山西省| 周宁县| 化州市| 铜梁县| 大厂| 宜都市| 晴隆县| 万山特区| 会宁县| 西藏| 富宁县| 三穗县| 晴隆县| 新津县| 德化县| 石家庄市| 岐山县| 罗定市| 翁牛特旗| 吉隆县| 东海县| 泸州市| 泽州县| 澜沧| 石门县| 寻甸| 新闻| 长子县| 嫩江县| 石景山区| 绵竹市| 义马市|