楊凱茜 劉瑋蔚
摘 要:隨著社會(huì)的進(jìn)步道路交通狀況越來越擁擠,交通擁堵幾乎成為了所有發(fā)達(dá)城市所面臨的問題。因此改善交通狀況變得尤為重要。文章旨在從數(shù)據(jù)的角度建立模型,來進(jìn)行交通流預(yù)測。在閱讀了大量文獻(xiàn)的基礎(chǔ)上,首先對數(shù)據(jù)挖掘技術(shù)的國內(nèi)外研究情況進(jìn)行基本了解,對所有數(shù)據(jù)進(jìn)行預(yù)處理。然后通過線性回歸分析,分別研究了單一因素和多因素對交通流預(yù)測的影響,得到各因素的影響因子,建立了模型。并進(jìn)行了實(shí)例分析,結(jié)果擬合良好,驗(yàn)證了模型的準(zhǔn)確性。最后,對本次模擬進(jìn)行了總結(jié),為今后的改進(jìn)方向提供了思路。
關(guān)鍵詞:交通流預(yù)測;線性回歸分析;單一因素分析;多因素分析中圖分類號:U4691.1+12 ?文獻(xiàn)標(biāo)識碼:B ?文章編號:1671-7988(2020)11-87-03
Abstract:?Along with the progress of the society, the traffic situation is getting more and more crowded, the traffic jam has become the problem that all developed cities have to face. Crossroads is important in urban transportation network nodes, the accurate prediction of intersection traffic flow can help to improve the intersection cluttered traffic, urban traffic congestion problem solving, optimize the urban road network operation, also in the field of intelligent transportation research, applica?-tion, implementation and promote the urban healthy, harmonious and stable has important significance. This paper aims to build a model from the perspective of data to predict traffic flow. On the basis of ·reading a large number of literature, first of all, we have a basic understanding of the research situation of data mining technology and preprocess all the data. Existing prediction methods analysis include: based on neural network prediction method, based on the statistical theory, based on the method of multiple linear regression model, based on the prediction method of wavelet model method and new technology. This paper used linear regression analysis. Through linear regression analysis, the influence of single factor and multi factor on traffic flow prediction is studied, and the influencing factors of each factor are obtained, and the model is established. This paper also gave an example to verify the accuracy of the model. Finally, the simulation is summarized, which provides ideas for future improvement.
Keywords: Traffic flow prediction; Single factor analysis;?Multi factor analysisCLC NO.:?U4691.1+12 ?Document Code: B ?Article ID: 1671-7988(2020)11-87-03
引言
基于數(shù)據(jù)挖掘的交通流預(yù)測系統(tǒng)研究就是將大量的數(shù)據(jù)運(yùn)用到交通流預(yù)測模型中,為決策者提供幫助來引導(dǎo)交通系統(tǒng)的暢通。從近幾年國內(nèi)交通治理的情況來看,單純增加交通道路及路面硬化的方法已經(jīng)不可能從根源上解決交通壓力[1]。交通流數(shù)據(jù)采集系統(tǒng)在很長一段時(shí)間內(nèi)通過人工和自動(dòng)數(shù)據(jù)收集、積累了大量數(shù)據(jù),使用數(shù)據(jù)挖掘技術(shù)人們不僅可以存儲歷史數(shù)據(jù),還可以為決策系統(tǒng)和導(dǎo)航系統(tǒng)提供數(shù)據(jù)等等?,F(xiàn)在已經(jīng)有模型應(yīng)用于交通流預(yù)測中。為了提高預(yù)測的精度和可靠性,應(yīng)結(jié)合其他可靠的方法和模型來研究適合我國的交通流預(yù)測模型。智能交通系統(tǒng)研究的目的是使人、車、路與環(huán)境和諧共處[2]。將數(shù)據(jù)挖掘技術(shù)運(yùn)用到交通流預(yù)測對交通系統(tǒng)的擁堵、交通事故都會(huì)有很大的改善。
1 方案設(shè)計(jì)
1.1 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘中一個(gè)非常重要的步驟。這個(gè)過程可以剔除異常數(shù)據(jù),使得數(shù)據(jù)挖掘的結(jié)果更加準(zhǔn)確。預(yù)處理方法一般包含有數(shù)據(jù)清洗、數(shù)據(jù)變換和數(shù)據(jù)規(guī)約等。它們各自有優(yōu)點(diǎn)和缺點(diǎn)[3]。
1.2 程序設(shè)計(jì)及計(jì)算
交通是一個(gè)大工程,影響它的因素有許多種。因此,需要從單一因素及多因素分別研究對交通流的影響。
1.2.1 單一因素對交通流的影響
一個(gè)地區(qū)如果要進(jìn)行土地開發(fā)利用,交通必將是先導(dǎo);反過來一個(gè)地區(qū)的交通便捷程度也決定著這個(gè)地區(qū)的土地利用率的大小[4]。土地利用是對交通影響最重要的因素之一。因此,本文首先選擇土地利用率作為單一因素,對交通流的影響進(jìn)行研究。
土地利用率與交通流的關(guān)系如下表1所示:
先做散點(diǎn)圖以確定回歸函數(shù)的類型:用Matlab編程得出散點(diǎn)圖,如圖1所示:
由圖1知其模擬結(jié)果符合線性回歸,運(yùn)用回歸分析在Matlab中實(shí)現(xiàn)。其殘差圖中存在數(shù)據(jù)對應(yīng)的殘差圖不過0線,因此去掉第16個(gè)數(shù)據(jù)后繼續(xù)做回歸。直至所有殘差圖過零線。如圖2。
從圖2可知,數(shù)據(jù)可以使用。以此為數(shù)據(jù)庫進(jìn)行模擬,得到仿真結(jié)果為y=13.8986+78.1208X。其中X為土地利用率。
1.2.2 其它多因素對交通流的影響
眾所周知交通系統(tǒng)是一個(gè)復(fù)雜的系統(tǒng),影響交通流的因素非常之多,道路的寬敞程度、周圍商圈的繁華程度等等。它都影響著交通流,并對經(jīng)濟(jì)也有一定的促進(jìn)作用。交通是一個(gè)城市的基本骨架,它伴隨著城市的發(fā)展不斷地演化、擴(kuò)大;也是社會(huì)活動(dòng)的一個(gè)載體,影響著經(jīng)濟(jì)的發(fā)展。居民收入也是影響交通流的一個(gè)主要因素,經(jīng)濟(jì)情況的好轉(zhuǎn),對車輛的購買欲增強(qiáng),也就是增加了交通流。交通流的影響因素如下表2所示:
數(shù)據(jù)殘差圖如圖3所示。
由圖3知所有的殘差圖均過0線,且顯著性概率為0,因此,回歸效果顯著。仿真結(jié)果為:
y=22.4680+5.3205X1+ 3.9334X2-0.0092X3
其中,X1為車道數(shù),X2為當(dāng)?shù)鼐用袷杖耄琗3為交通流量。
2 實(shí)例分析
2.1 單一因素驗(yàn)證
下表是臨泉縣濱河大道近幾年土地利用與交通流之間的關(guān)系,通過上一章所得出的方程來進(jìn)行數(shù)據(jù)驗(yàn)證,以此來驗(yàn)證方程的準(zhǔn)確性。如表3所示:
將該表中的數(shù)據(jù)帶入上一章的一元線性回歸模型y= 13.8986+78.1208X中進(jìn)行驗(yàn)證,得到驗(yàn)證結(jié)果。并且對于單一因素對交通流影響的預(yù)測值要進(jìn)行偏移率的計(jì)算來測定該方程的合理性及預(yù)測的準(zhǔn)確性,所以驗(yàn)證結(jié)果和偏移率如下表4所示:
在此實(shí)驗(yàn)中,是一元線性回歸模型通過模擬出的散點(diǎn)圖可知道土地利用率與交通流呈線性關(guān)系,通過編程模擬出其殘差圖,根據(jù)結(jié)果繼續(xù)模擬,直到其數(shù)據(jù)都過0線為止,最后得到其回歸方程。通過數(shù)據(jù)驗(yàn)證及偏移率數(shù)值分析,其符合結(jié)果。
2.2 多因素驗(yàn)證
下表是濱河大道多種因素與交通流之間的關(guān)系,如表5所示:
將該表中的數(shù)據(jù)代入上一章的多元線性回歸模型y= 22.4680+5.3205?X1+3.9334?X2-0.0092?X3驗(yàn)證結(jié)果。并且對于多因素對交通流影響的預(yù)測值要進(jìn)行偏移率的計(jì)算來測定該方程的合理性及預(yù)測的準(zhǔn)確性,所以驗(yàn)證結(jié)果和偏移率如下表6所示。
在此實(shí)驗(yàn)中,是驗(yàn)證以上三種影響因素對交通流的影響,通過上一章的統(tǒng)計(jì)分析及編程得到模擬結(jié)果,并得到其多元線性回歸方程。通過數(shù)據(jù)驗(yàn)證和偏移率的數(shù)值分析,其符合結(jié)果。
3 總結(jié)展望
數(shù)據(jù)挖掘已經(jīng)成為決策支持、道路交通、金融等行業(yè)的主要研究方向。在這個(gè)到處都是大數(shù)據(jù)的現(xiàn)代社會(huì)中,每年都會(huì)產(chǎn)生新的技術(shù)及方法,也由于人們對它的廣泛應(yīng)用和深入研究,算短了技術(shù)換代的時(shí)間,促進(jìn)了挖掘技術(shù)的快速發(fā)展。但是數(shù)據(jù)挖掘技術(shù)仍存在許多問題,如數(shù)據(jù)挖掘方法的效率有待提高,尤其是超大規(guī)模數(shù)據(jù)挖掘的效率。本文從數(shù)據(jù)挖掘的角度出發(fā),深入研究了數(shù)據(jù)挖掘中數(shù)據(jù)預(yù)處理技術(shù)及一元和多元線性回歸模型在交通流預(yù)測系統(tǒng)中的應(yīng)用,并對它們進(jìn)行了分析對比。
本文是基于數(shù)據(jù)挖掘的交通流預(yù)測并且得到一定的研究成果,但是由于時(shí)間及各種原因造成不能更進(jìn)一步的深入研究,況且交通系統(tǒng)本身就是一個(gè)巨大且復(fù)雜的系統(tǒng),所以還有很多地方需要完善和改進(jìn)。
(1)交通流數(shù)據(jù)本身有其內(nèi)在的關(guān)系,速度、流量和占有率是最重要的三個(gè)屬性,它們之間是相互聯(lián)系、相互作用的,本文僅對流量的影響因素進(jìn)行分析,今后可以對三者之間的影響關(guān)系進(jìn)行分析預(yù)測,并通過交通流預(yù)測模型為交通系統(tǒng)提供決策支持,同時(shí)它將更加的合理和準(zhǔn)確。
(2)本文僅使用了線性回歸模型,可以考慮將多種模型混合使用,提高預(yù)測結(jié)果的準(zhǔn)確性。
(3)今后還應(yīng)對不同路段、路面的種類因素等進(jìn)行分析研究。同時(shí)惡劣天氣、交通事故等因素也是未來需要進(jìn)一步研究的方向。
參考文獻(xiàn)
[1] 高雅.短時(shí)交通流預(yù)測模型及預(yù)測方法的研究[D].上海:華東師范大學(xué),2011.4.
[2] 許兆霞.基于數(shù)據(jù)挖掘技術(shù)的交通流數(shù)據(jù)分析研究[J].淮海:淮海工學(xué)院,2009.3.
[3] 郭敏.道路交通流短時(shí)預(yù)測方法綜述[A].北京:北京科技大學(xué),2009.2.
[4] 李明江.數(shù)據(jù)挖掘技術(shù)及應(yīng)用[A].都勻:黔南民族師范學(xué)院,2010.
[5] 國家統(tǒng)計(jì)局.中國統(tǒng)計(jì)年鑒[J].北京:中國統(tǒng)計(jì)出版社,2010.
[6] 國家統(tǒng)計(jì)局.中國統(tǒng)計(jì)年鑒[J].北京:中國統(tǒng)計(jì)出版社,2007.