劉中飛,張 軍,邱荷婷
(首都經(jīng)濟(jì)貿(mào)易大學(xué)管理工程學(xué)院,北京100070)
隨著社會(huì)的發(fā)展以及國(guó)家政策的傾斜,人口的急速增長(zhǎng),越來(lái)越多的人都聚集在城市中,導(dǎo)致了城市交通的擁堵,特別是在大規(guī)模人群的城鄉(xiāng)結(jié)合部的區(qū)域。為了更好地控制城鄉(xiāng)結(jié)合部的交通,減少不必要的擁堵,用傳統(tǒng)的交通控制與疏散的方式在一定程度上是行不通的。所以,智慧交通應(yīng)用而生。智慧交通的出現(xiàn),帶來(lái)了許多現(xiàn)代化的管理方式,并減少了大量人力物力的浪費(fèi),使得城市的交通變得更加的流暢,減少了城鄉(xiāng)結(jié)合部區(qū)域大量的擁堵問(wèn)題。在智能交通中,數(shù)據(jù)挖掘有著無(wú)比關(guān)鍵的地位,是智能交通中最重要的一面??梢哉f(shuō),沒(méi)有數(shù)據(jù)挖掘技術(shù)的應(yīng)用,就沒(méi)有智慧交通光明的未來(lái)。如果要想在城鄉(xiāng)結(jié)合部大幅度減少交通擁堵問(wèn)題,就必須更加深入地理解數(shù)據(jù)挖掘技術(shù)。
數(shù)據(jù)挖掘是一個(gè)過(guò)程,主要是對(duì)大量的有噪聲的信息進(jìn)行有效的提取,從中可以得到一個(gè)自己想要的數(shù)據(jù)[2]。在社會(huì)快速發(fā)展的今天,大量的數(shù)據(jù)在各行各業(yè)都急速的增長(zhǎng),廣泛可用的數(shù)據(jù)使得當(dāng)今社會(huì)進(jìn)入了數(shù)據(jù)時(shí)代,但是有許多的數(shù)據(jù)是無(wú)效的,要想從“數(shù)據(jù)海洋“中得到想要的數(shù)據(jù)是極其困難的一件事情,數(shù)據(jù)挖掘的重要性就凸顯出來(lái)了,數(shù)據(jù)挖掘的實(shí)際應(yīng)用解決了這個(gè)問(wèn)題,數(shù)據(jù)庫(kù)技術(shù)用于存儲(chǔ)和管理數(shù)據(jù),機(jī)器學(xué)習(xí)方法用于分析存儲(chǔ)的數(shù)據(jù),從而揭示了隱藏在海量數(shù)據(jù)中的大量“知識(shí)”。數(shù)據(jù)挖掘的技術(shù)可以挖掘以下幾種類型的模式:相關(guān)分析、聚類分析、離散點(diǎn)分析、關(guān)聯(lián)分析等。
相關(guān)分析:需要在分類和回歸之前繼續(xù)進(jìn)行,可以分析、識(shí)別、分類、回歸相關(guān)的屬性,并忽略其他無(wú)關(guān)的屬性。
聚類分析:相似度很高的對(duì)象可以聚集在一起。這些對(duì)象中可以根據(jù)類內(nèi)相似度最大化和類內(nèi)相似度最小化的原理進(jìn)行聚類或者進(jìn)行分組。
離散點(diǎn)分析:在數(shù)據(jù)集中包含了許多對(duì)象,這些對(duì)象與數(shù)據(jù)集中其他對(duì)象的一般行為有不一致的地方,這些點(diǎn)就是離散點(diǎn)。因?yàn)橐话愕臄?shù)據(jù)挖掘技術(shù)把離散點(diǎn)給剔除了,但是有些稀有事物比正常事物更有趣,更能吸引人們的注意力。因此,離散點(diǎn)數(shù)據(jù)分析被稱為離散點(diǎn)分析。
關(guān)聯(lián)分析:又稱為關(guān)聯(lián)規(guī)則。如果兩個(gè)或者多個(gè)事物之間存在某種關(guān)系,可以通過(guò)一個(gè)事物聯(lián)系到其他的事物,并可以對(duì)其他的事物進(jìn)行預(yù)測(cè)。主要是挖掘兩者之間存在的隱藏的關(guān)系。其中,關(guān)聯(lián)分析又可以被進(jìn)一步分為單維關(guān)聯(lián)規(guī)則和多維關(guān)聯(lián)規(guī)則這兩種類型。
這就是為什么數(shù)據(jù)挖掘技術(shù)在城鄉(xiāng)結(jié)合部區(qū)域的發(fā)展中起著關(guān)鍵性作用的原因,接下來(lái)需要對(duì)數(shù)據(jù)挖掘的技術(shù)進(jìn)行深一步的分析,并將其應(yīng)用于城鄉(xiāng)結(jié)合部的交通問(wèn)題中。
近幾年以來(lái),中國(guó)交通發(fā)展越來(lái)越好,交通環(huán)境得到了很好的改善,但是,交通安全方面的措施卻沒(méi)有得到很大的改變,中國(guó)道路環(huán)境沒(méi)有得到改變的根本原因是道路設(shè)計(jì)不規(guī)范、混合交通環(huán)境比較差以及一些安全措施不足等,這些問(wèn)題在城鄉(xiāng)結(jié)合部尤為明顯。
隨著國(guó)家政策的傾斜,政府對(duì)城鄉(xiāng)結(jié)合部的關(guān)注越來(lái)越多。城鄉(xiāng)結(jié)合部是中國(guó)快速發(fā)展過(guò)程中的一個(gè)特色區(qū)域,是最活躍的區(qū)域。城鄉(xiāng)結(jié)合部具有距離市區(qū)較近、生活方便、信息流動(dòng)速度快等多種優(yōu)勢(shì),同時(shí)具有城市和農(nóng)村的優(yōu)勢(shì),成為城市向外延展的重要窗口。但是,由于城鄉(xiāng)結(jié)合部人口眾多,人們的交通意識(shí)比較淡薄,人流量巨大,導(dǎo)致了大量交通事故的發(fā)生。
其中,在城鄉(xiāng)結(jié)合部地區(qū)道路設(shè)計(jì)不規(guī)范,人員眾多,且社會(huì)關(guān)系構(gòu)成較為復(fù)雜。在城鄉(xiāng)結(jié)合部,主要的交通工具有電動(dòng)車、摩托車,不良習(xí)慣有無(wú)證駕駛、超速行駛、違章停車以及不系安全帶等具有安全隱患的問(wèn)題[3],并且在城鄉(xiāng)結(jié)合部,社會(huì)管理較為滯后,經(jīng)濟(jì)管理混亂以及規(guī)劃管理無(wú)序。
針對(duì)城鄉(xiāng)結(jié)合部的種種難題,基于目前智能交通的大背景,將以大數(shù)據(jù)Hadoop技術(shù)的MapReduce計(jì)算中心和分布式數(shù)據(jù)庫(kù)HBase存儲(chǔ)融入到交通數(shù)據(jù)處理仿真平臺(tái)。
4.1.1 區(qū)域交通系統(tǒng)數(shù)據(jù)挖掘
將選取具有強(qiáng)大并行能力的Hadoop平臺(tái),通過(guò)進(jìn)行海量交通數(shù)據(jù)的分析,部署Hadoop集群,可以基于道路導(dǎo)航,使資源進(jìn)行合理的分配,以此來(lái)改善有關(guān)道路的平衡問(wèn)題。傳統(tǒng)的單機(jī)方法無(wú)法解決這樣的問(wèn)題,未來(lái)解決這一類問(wèn)題,可以借助Hadoop平臺(tái),因?yàn)檫@個(gè)平臺(tái)具有強(qiáng)大的并行計(jì)算的能力,用此平臺(tái)可以對(duì)道路的情況進(jìn)行各種判斷,此平臺(tái)也可以提供高效的存儲(chǔ)能力。
4.1.2 區(qū)域交通管理仿真平臺(tái)
將通過(guò)虛擬化技術(shù)構(gòu)建的服務(wù)器集群,為平臺(tái)的搭建提供基本的硬件資源。在此基礎(chǔ)上構(gòu)建以Cloud Foundry為基礎(chǔ)的PaaS平臺(tái),可以通過(guò)使用Cloud Foundry的框架和通信機(jī)制來(lái)完成集成的任務(wù),這其中包括了有關(guān)交通的海量數(shù)據(jù),可以將Hadoop的功能通過(guò)與Cloud Foundry平臺(tái)相結(jié)合,建立一個(gè)集中大數(shù)據(jù)存儲(chǔ)和處理的一個(gè)平臺(tái),這個(gè)平臺(tái)可以滿足當(dāng)前的數(shù)據(jù)訪問(wèn)量以及業(yè)務(wù)計(jì)算的需求,這樣就為大數(shù)據(jù)構(gòu)建一個(gè)全新的交通仿真的平臺(tái)。
區(qū)域交通系統(tǒng)數(shù)據(jù)挖掘技術(shù)和區(qū)域交通管理仿真平臺(tái)擬解決城鄉(xiāng)結(jié)合部交通網(wǎng)絡(luò)的復(fù)雜性和動(dòng)態(tài)性的問(wèn)題、制約因素的輸入輸出機(jī)制問(wèn)題以及數(shù)據(jù)計(jì)算瓶頸問(wèn)題。
4.2.1 城鄉(xiāng)結(jié)合部交通網(wǎng)絡(luò)的復(fù)雜性和動(dòng)態(tài)性問(wèn)題
城鄉(xiāng)結(jié)合部的外部像“城”,內(nèi)部像“村”的復(fù)合型決定了區(qū)域交通網(wǎng)絡(luò)的復(fù)雜性,通過(guò)探索城鄉(xiāng)運(yùn)輸網(wǎng)絡(luò)中各種瓶頸的產(chǎn)生及其傳播過(guò)程,并且找到交通擁堵的根本原因就是一個(gè)中心問(wèn)題。
4.2.2 制約因素的輸入輸出機(jī)制問(wèn)題
交通承載力包括了多種的力量:交通環(huán)境污染承載力、交通自然資源承載力以及交通心理承載力等,如何確定模型輸入輸出的變量是一個(gè)關(guān)鍵性問(wèn)題,其中,合理的資源分配是重中之重,必須在交通擁堵和資源閑置之間找到一個(gè)平衡點(diǎn)。
4.2.3 數(shù)據(jù)計(jì)算瓶頸問(wèn)題
隨著計(jì)算機(jī)網(wǎng)絡(luò)的快速發(fā)展以及在交通運(yùn)輸領(lǐng)域的應(yīng)用,日常需要處理的交通數(shù)據(jù)已經(jīng)呈現(xiàn)出大數(shù)據(jù)的許多特征。采用傳統(tǒng)的數(shù)據(jù)信息處理方式已經(jīng)遇到了計(jì)算分析的性能瓶頸。一方面,集中化的數(shù)據(jù)庫(kù)成為整個(gè)系統(tǒng)的突破口,數(shù)據(jù)的遞增,無(wú)疑給數(shù)據(jù)庫(kù)帶來(lái)了嚴(yán)峻的考驗(yàn);另一方面,隨著數(shù)據(jù)的遞增,數(shù)據(jù)計(jì)算的時(shí)長(zhǎng)在急速地增加,越來(lái)越不適應(yīng)海量數(shù)據(jù)對(duì)時(shí)間的要求。
隨著社會(huì)的發(fā)展,城鄉(xiāng)結(jié)合部是國(guó)家關(guān)注的重點(diǎn),城鄉(xiāng)道路交通是城市管理最重要方面之一。加強(qiáng)城鄉(xiāng)交通狀況管理,維護(hù)城鄉(xiāng)交通秩序,是極其重要的一個(gè)點(diǎn)[4],且有利于推動(dòng)城鄉(xiāng)結(jié)合部的發(fā)展,而城鄉(xiāng)結(jié)合部的發(fā)展符合國(guó)家政策的制定。但是發(fā)展不能急于求成,應(yīng)結(jié)合中國(guó)的實(shí)際情況,并借鑒國(guó)外結(jié)合部發(fā)展的模式,以此來(lái)構(gòu)建中國(guó)城鄉(xiāng)結(jié)合部交通的發(fā)展[5]。