国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于ARIMA的公交行程時間預(yù)測研究

2024-05-29 18:48:25閻瑜婷
交通科技與管理 2024年9期
關(guān)鍵詞:ARIMA模型時間序列

收稿日期:2024-03-11

作者簡介:閻瑜婷(1999—),女,碩士研究生,研究方向:公交優(yōu)先。

摘要 文章在小汽車產(chǎn)業(yè)迅速發(fā)展、私家車保有量逐年增加、交通問題突出的背景下,通過研究預(yù)測公交車在站點(diǎn)間的運(yùn)行時間,為出行者決策以及公交的運(yùn)營管理提供數(shù)據(jù)基礎(chǔ),進(jìn)而提高公共交通的分擔(dān)率,緩解存在的交通問題。首先,對數(shù)據(jù)做預(yù)處理和可視化操作,利用單位根檢驗和白噪聲檢驗數(shù)據(jù)的可用性;其次,確定模型階數(shù)并建立模型,用自相關(guān)和偏自相關(guān)函數(shù),通過殘差檢驗?zāi)P妥C明了模型的可用性;最后,將建好的模型用以預(yù)測西海岸東1路公交車從卓亭廣場站到崇明島路小學(xué)站的行程時間。

關(guān)鍵詞 時間序列;ARIMA模型;公交GPS數(shù)據(jù);行程時間

中圖分類號 U491.17文獻(xiàn)標(biāo)識碼 A文章編號 2096-8949(2024)09-0011-04

0 引言

隨著經(jīng)濟(jì)的發(fā)展,私人小汽車的數(shù)量快速增長,造成了許多問題。不僅是交通擁擠,隨之而來的還有交通污染、交通事故頻繁、公路秩序混亂等一些嚴(yán)重的問題。公共交通能夠很大程度地解決上述存在的問題,大幅節(jié)約能耗,是解決擁堵、污染、秩序混亂等問題的有力支撐。但公交車沿確定路線行駛,路上實時的車輛行駛狀態(tài)影響公交車到站時間,進(jìn)而影響出行者乘車體驗。如果能夠進(jìn)一步提高公交服務(wù)質(zhì)量和水平,此舉對發(fā)展公共交通有重要作用。

2002年,周雪梅等[1]對公交車的行駛特點(diǎn)進(jìn)行了分析,建立了公交車輛行程時間的預(yù)測模型,并且獲得了相關(guān)模型的預(yù)測結(jié)果。2007年,陳巳康等[2]通過車載GPS設(shè)備獲取了公交車運(yùn)行的實時數(shù)據(jù),并且建立了公交道路網(wǎng)模型,預(yù)測了公交車的到站時間。2014年,胡繼華等[3]通過分析大量公交GPS數(shù)據(jù),構(gòu)造了馬爾科夫狀態(tài)轉(zhuǎn)移矩陣。2015年,Kumar B A等[4]采用基于模型的卡爾曼濾波算法對公交出行時間進(jìn)行了預(yù)測。2016年,Amita J等[5]建立了一種基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的GPS數(shù)據(jù)預(yù)測公交出行時間的模型。2017年,黃明芳、鄭娜英[6]對影響公交車行程時間的動靜態(tài)影響因素進(jìn)行了綜合性分析,構(gòu)建了RBF-BP協(xié)作神經(jīng)網(wǎng)絡(luò)的預(yù)測公交車行程時間的模型。

1 ARIMA模型

ARIMA模型是自回歸移動平均模型,用于對時間序列進(jìn)行建模和預(yù)測。模型包含三個部分:自回歸(AR)、差分(I)和移動平均(MA)。AR表示自回歸,即當(dāng)前觀測值與之前若干個觀測值之間的線性關(guān)系。I表示差分,用于將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列,使得序列的均值和方差在不同時間點(diǎn)上保持不變。MA表示移動平均,即當(dāng)前觀測值與之前若干個隨機(jī)誤差項之間的線性關(guān)系。ARIMA模型記作ARIMA(p, d, q),其中p是自回歸項數(shù),q是滑動平均項數(shù),d是差分次數(shù)。差分是ARIMA模型中的關(guān)鍵步驟,通過對非平穩(wěn)時間序列進(jìn)行差分,可以將其轉(zhuǎn)化為平穩(wěn)的時間序列,使得可以應(yīng)用ARIMA模型進(jìn)行建模和預(yù)測。

2 實例分析

選取青島市開發(fā)區(qū)東1路公交線路,始發(fā)站為啤酒城公交站、終點(diǎn)站為黃島輪渡公交站,總里程為22.6 km,途經(jīng)站點(diǎn)41站。東1路途經(jīng)青島理工大學(xué)、青島職業(yè)技術(shù)學(xué)院、青島濱海學(xué)院等大學(xué)以及卓亭廣場住宅區(qū)和中心醫(yī)院、崇明島路小學(xué)等流量聚集處,這些區(qū)域在出行高峰期給周圍交通帶來極大壓力。該文研究從卓亭廣場住宅區(qū)到崇明島路小學(xué)在不同時間段公交車的運(yùn)行時間,并做出預(yù)測,為周圍出行者的出行決策以及換乘提供宏觀的信息支撐。

2.1 數(shù)據(jù)說明

對青島市西海岸新區(qū)公交車GPS數(shù)據(jù)進(jìn)行初步處理,去掉經(jīng)緯度以及GPS速度列,數(shù)據(jù)內(nèi)容包括線路號、站點(diǎn)、車站號、運(yùn)營類型、GPS產(chǎn)生時間、瞬時速度、車牌號等,原數(shù)據(jù)共有452 461條,線路包含65條線路,從中篩選出東1路數(shù)據(jù)27 495條,再將站點(diǎn)、運(yùn)營類型、到站和離站進(jìn)行篩選后,得到東1路經(jīng)過卓亭廣場站點(diǎn),且為下行離站的數(shù)據(jù)共186條,同理得到東1路經(jīng)過崇明島路小學(xué)站點(diǎn),且為下行到站的數(shù)據(jù)有190條。

上述得出的數(shù)據(jù)存在一定問題:由于數(shù)據(jù)受到車載設(shè)備以及傳輸情況的影響,導(dǎo)致行駛線路一致,到達(dá)站點(diǎn)的車輛數(shù)不一致的現(xiàn)象,對應(yīng)車牌號出現(xiàn)缺失;并且還存在重復(fù)數(shù)據(jù),可能由于在短時間內(nèi)公交車重復(fù)進(jìn)站,GPS重復(fù)采集了數(shù)據(jù);當(dāng)不同車牌號公交車同時刻在相同站點(diǎn)發(fā)車,但運(yùn)行時間不一致時,同一時刻就會對應(yīng)多個運(yùn)行時間。為避免對預(yù)測造成影響,不對缺失的車輛牌信息進(jìn)行補(bǔ)充,對缺失行進(jìn)行整行刪除,同樣刪除重復(fù)信息,實現(xiàn)一個發(fā)車時刻對應(yīng)一個運(yùn)行時間,采取求平均值的方法將數(shù)據(jù)實現(xiàn)一一對應(yīng)。最后根據(jù)車牌號對應(yīng)原則,將卓亭廣場下行離站時間和崇明島路小學(xué)車站下行到站時間進(jìn)行相減,得出站間運(yùn)行時間,將提取的到站時間和運(yùn)行時間兩列數(shù)據(jù)作為預(yù)測研究的對象,具體見表1所示。

2.2 模型建立

模型建立過程中用到的Python庫有:NumPy、Pandas、Matplotlib、Seaborn、Statsmodels等。其中,NumPy提供了大量的數(shù)學(xué)函數(shù)庫可以進(jìn)行復(fù)雜的數(shù)組運(yùn)算;Pandas是基于NumPy工作,對于處理大數(shù)據(jù)有很好的效果,并且包含很多的數(shù)據(jù)結(jié)構(gòu),如DataFrame、Series等;Seaborn是Python的可視化庫,通過可視化庫理解并展示數(shù)據(jù),其與Matplotlib主要不同是Seaborn的色彩搭配更鮮明、繪圖風(fēng)格更優(yōu)美;Statsmodels可以擬合多種統(tǒng)計模型,可以進(jìn)行數(shù)據(jù)探索、統(tǒng)計測試以及可視化,Statsmodels中的模型可用于時間序列分析,以及對模型進(jìn)行評估。

2.2.1 數(shù)據(jù)處理

將上述經(jīng)過篩選的數(shù)據(jù)導(dǎo)入,用Matplotlib將處理的數(shù)據(jù)進(jìn)行成圖展示,如圖1所示,可以直觀地看出不同時段公交車行程時間的變化。由圖1可見,在7:00和17:00左右,公交車的行程時間比平峰時期長2~3 min,這是受到早晚高峰車流的影響。

圖1 站間運(yùn)行時間圖

2.2.2 ADF檢驗和白噪聲檢驗

進(jìn)行平穩(wěn)性檢驗,再根據(jù)檢驗結(jié)果確定是否需要進(jìn)行差分。平穩(wěn)性檢驗采取單位根檢驗(ADF)的方法,看序列是否存在單位根。如果不存在單位根那么序列平穩(wěn)就不需要進(jìn)行差分;如果存在單位根序列,那么序列不平穩(wěn)則需要進(jìn)一步確定差分階數(shù)。經(jīng)過檢驗得到ADF的結(jié)果為0.112 47,由于大于0.05所以序列不平穩(wěn)需要進(jìn)行差分。為了使時間序列平穩(wěn),需要對序列在一階差分的基礎(chǔ)上進(jìn)行二階差分(如圖2所示)。由圖2可以看出,時序圖圍繞常數(shù)進(jìn)行波動,一階差分基本滿足平穩(wěn)性,可使序列平穩(wěn)。

圖2 差分結(jié)果圖

ADF檢驗后需要進(jìn)行白噪聲檢驗,也叫純隨機(jī)性檢驗。白噪聲序列相互之間沒有關(guān)聯(lián),是無法預(yù)測的歷史數(shù)據(jù)且無法影響未來的數(shù)值,所以要進(jìn)行預(yù)測就需要保證序列具有規(guī)律性,通過程序計算出統(tǒng)計量為3.03754254e-7,由于小于0.05所以序列不是白噪聲,可以繼續(xù)預(yù)測。

2.2.3 時間序列定階

ACF和PACF定階,用Matplotlib中的subplot函數(shù)畫出ACF圖和PACF圖。如圖3所示為ACF圖,橫坐標(biāo)為滯后階數(shù),縱坐標(biāo)為ACF值,可以看出圖3中的1階后震蕩衰減趨于零。如圖4所示為PACF圖,橫軸為滯后階數(shù),縱軸為PACF值,圖4中的1階后震蕩衰減趨于零。根據(jù)表2所示的定階原則,確定出p=1、q=1。

圖3 ACF圖

圖4 PACF圖

表2 定階原則表

模型 ACF PACF

AR(p) 衰減趨于零

(幾何型或震蕩型) p階后截尾

MA(q) q階后截尾 衰減趨于零

(幾何型或震蕩型)

ARMA(p,q) q階后衰減趨于零

(幾何型或震蕩型) p階后衰減趨于零

(幾何型或震蕩型)

3 模型評估

通過殘差檢驗對建立的模型進(jìn)行評估,殘差是模型擬合值和觀測值之間的差值。好的模型殘差為正態(tài)分布,方差固定,均值為0,沒有自相關(guān)性。通過將殘差的數(shù)據(jù)表現(xiàn)成圖,檢驗其相關(guān)性,如圖5所示,縱坐標(biāo)為殘差,橫坐標(biāo)為樣本數(shù),隨著樣本數(shù)的增加,殘差不會顯示任何明顯的季節(jié)性,均值接近0。圖6所示為殘差QQ圖,QQ圖的計算原理是將數(shù)據(jù)由小到大排列,并按1到n進(jìn)行標(biāo)號,計算分位數(shù)。計算公式為:

(i?0.5)/n (1)

式中,i——第i個數(shù)據(jù)的標(biāo)號。

橫軸為正態(tài)分布的理論分位數(shù),縱軸為殘差的分位數(shù),做y=x的直線,QQ圖趨近落在y=x直線上,說明兩分布相似。上述檢驗都說明建立的模型近似正態(tài)分布,滿足要求。

圖5 標(biāo)準(zhǔn)化殘差圖

圖6 殘差QQ圖

4 模型預(yù)測

建立的模型確定了階數(shù),并且對其進(jìn)行了評估,充分證明了模型的可用性,最后就可以用確定的模型進(jìn)行預(yù)測。對處理后的公交車輛站間運(yùn)行時間的歷史數(shù)據(jù)進(jìn)行劃分,并利用所建立的模型進(jìn)行預(yù)測,如圖7所示為預(yù)測結(jié)果。橫坐標(biāo)為樣本數(shù),縱坐標(biāo)為運(yùn)行時間,藍(lán)色實線為歷史數(shù)據(jù)、紅色虛線為預(yù)測的行程時間。從圖7中可以看出,預(yù)測部分的誤差在2 min以內(nèi),表明該模型在預(yù)測公交運(yùn)行時間上的可行性,通過增加數(shù)據(jù)量,可以預(yù)測出任意兩站點(diǎn)之間在不同時段的運(yùn)行時間。

5 結(jié)語

該文闡述了公交站間行程時間的研究方法,分析了相關(guān)模型原理。并且基于ARIMA模型,對西海岸新區(qū)公交車GPS數(shù)據(jù)進(jìn)行了處理,選出所用線路、站點(diǎn)的數(shù)據(jù),對數(shù)進(jìn)行預(yù)處理。以東1路卓亭廣場站至崇明島路小學(xué)站的下行路線為例,建立模型并進(jìn)行預(yù)測,其間使用了Python語言進(jìn)行處理數(shù)據(jù)、展示數(shù)據(jù)、可視化、模型建立,以及檢驗過程用到了很多的Python庫,如Numpy、Pandas、Matplotlib、Statsmodels等。構(gòu)建ARIMA模型時,首先可視化展示數(shù)據(jù)并對數(shù)據(jù)初步觀察,對數(shù)據(jù)進(jìn)行平穩(wěn)性和白噪聲檢驗,使用ACF、PACF定階,再通過殘差檢驗?zāi)P?,用Matplotlib展示殘差的QQ圖,最后通過檢驗后,劃分訓(xùn)練集和測試集,得出模型的預(yù)測值。

參考文獻(xiàn)

[1]周雪梅, 楊曉光, 王磊, 等. 公交車輛行程時間預(yù)測方法研究[J]. 交通與計算機(jī), 2002(6): 12-14.

[2]陳巳康, 詹成初, 陳良貴. 基于路段行程時間的公交到站預(yù)測方法[J]. 計算機(jī)工程, 2007(21): 281-282.

[3]胡繼華, 李國源, 程智鋒. 基于馬爾科夫鏈的公交站間行程時間預(yù)測算法[J]. 交通信息與安全, 2014(2): 17-22.

[4]Kumar B A, Mothukuri S, Vanajakshi L, et al. Analytical approach to identify the optimum inputs for a bus travel time prediction method[J]. Transportation Research Record, 2015(1): 25-34.

[5]Amita J, Jain S S, Garg P K. Prediction of bus travel time using ANN: a case study in Delhi[J]. Transportation Research Procedia, 2016(17): 263-272.

[6]黃明芳, 鄭娜英. 基于RBF-BP協(xié)作神經(jīng)網(wǎng)絡(luò)的公交行程時間預(yù)測[J]. 閩江學(xué)院學(xué)報, 2017(5): 100-107.

猜你喜歡
ARIMA模型時間序列
基于時間序列模型的中國出口總額分析及預(yù)測
基于R軟件的金融時間序列的預(yù)測分析
基于Eviews上證綜合指數(shù)預(yù)測
時代金融(2016年29期)2016-12-05 16:12:09
上證綜指收益率的影響因素分析
時代金融(2016年27期)2016-11-25 17:21:02
基于指數(shù)平滑的電站設(shè)備故障時間序列預(yù)測研究
基于時間序列的我國人均GDP分析與預(yù)測
商(2016年32期)2016-11-24 16:20:57
基于線性散列索引的時間序列查詢方法研究
軟件工程(2016年8期)2016-10-25 15:43:57
基于ARIMA模型的滬銅期貨價格預(yù)測研究
商(2016年27期)2016-10-17 06:06:02
對我國進(jìn)出口總額的預(yù)測
商(2016年22期)2016-07-08 14:41:15
組合預(yù)測法在我國糧食產(chǎn)量預(yù)測中的應(yīng)用
商(2016年19期)2016-06-27 14:21:53
江津市| 孟村| 昔阳县| 高唐县| 高尔夫| 龙口市| 阳城县| 沅江市| 准格尔旗| 龙陵县| 湟中县| 天祝| 栾城县| 葫芦岛市| 麻城市| 新建县| 连城县| 巩义市| 安吉县| 大宁县| 长治市| 林芝县| 茶陵县| 莒南县| 黑龙江省| 黄浦区| 桓仁| 连平县| 安仁县| 山西省| 蓝山县| 磴口县| 滕州市| 东丽区| 望江县| 汝城县| 嘉黎县| 武清区| 延安市| 都兰县| 任丘市|