国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于GPS大數(shù)據(jù)的租車人群出行行為分析

2020-08-26 07:46:55劉康陳智勇黃慶鵬張逸泓
電腦知識(shí)與技術(shù) 2020年20期
關(guān)鍵詞:數(shù)據(jù)采集

劉康 陳智勇 黃慶鵬 張逸泓

摘要:本文利用GPS所采集到的數(shù)據(jù),把租車群體的外出行為進(jìn)行深入分析。通過(guò)對(duì)大數(shù)據(jù)進(jìn)行預(yù)先處理,然后建立數(shù)據(jù)處理模型,分析租車人群的出行規(guī)律,推測(cè)租車人群的需求,從時(shí)問(wèn)和空間上研究城市租車人群的分布,為城市交通運(yùn)輸提供科學(xué)依據(jù)和理論支持。

關(guān)鍵詞:GPS;出行行為;租車人群;數(shù)據(jù)采集

中國(guó)分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2020)20-0048-03

如今,城市人口密集,道路交通擁擠,能源消耗,環(huán)境污染成為出行所面臨的一個(gè)巨大問(wèn)題。人們的出行行為分析已經(jīng)成為城市進(jìn)行交通道路建設(shè)及城市規(guī)劃的一項(xiàng)重要參考。由于GPS技術(shù)具有實(shí)時(shí)、客觀以及數(shù)據(jù)量大等特點(diǎn),GPS移動(dòng)軌跡數(shù)據(jù)的挖掘和分析為解決城市擁堵和用戶出行提供新思路方法,可以很好地描述和分析用車人群出行行為特征,特征,蘊(yùn)含著巨大的價(jià)值,挖掘移動(dòng)軌跡數(shù)據(jù)背后隱藏的有用信息,可改善出行交通流,實(shí)行交通預(yù)測(cè)預(yù)警。隨著當(dāng)代生活節(jié)拍和都市住民生活多元化的加快,住民外出的調(diào)查的難度也日益提高。出租車作為一種不同于公交車的交通器材,其營(yíng)運(yùn)具有隨機(jī)性、全天候行駛以及即停即走等特征,其運(yùn)營(yíng)規(guī)律能夠很好地反映搭客出行特征。此次調(diào)查主要面向的對(duì)象是針對(duì)人流量較大的租車人群,實(shí)施的范圍是我國(guó)人口密度較大的省份和城市。通過(guò)出行行為分析,也對(duì)租車行業(yè)車輛調(diào)度,提取租車人群用戶畫(huà)像標(biāo)簽信息發(fā)現(xiàn)商業(yè)圈,熱點(diǎn)旅游區(qū)、采摘季山區(qū)路況及農(nóng)戶出行行為等,具有一定的研究意義和價(jià)值。

1問(wèn)題分析

擬解決問(wèn)題一:如何對(duì)數(shù)據(jù)來(lái)源采集與提取。隨著人們生活質(zhì)量越來(lái)越好,車輛逐漸變成每家每戶的必備工具之一。這為我們的對(duì)人們出行研究提供了基礎(chǔ)保障,傳統(tǒng)方式的數(shù)據(jù)采集必須通過(guò)對(duì)租車人群進(jìn)行走訪調(diào)查,或者是通過(guò)租車戶登記等信息來(lái)進(jìn)行數(shù)據(jù)收集與分析,其不規(guī)律性和采集信息的困難度很大。這樣處理起來(lái)的誤差會(huì)比較嚴(yán)重。而隨著科學(xué)技術(shù)地不斷發(fā)展,GPS的引入為采集用戶出行信息提供了強(qiáng)有力的保障??赡苤恍枰┰S設(shè)備,或者調(diào)用第三方已經(jīng)處理好的工具。那么我們就可以實(shí)時(shí)地獲取到相對(duì)傳統(tǒng)方式更加可靠且精細(xì)的數(shù)據(jù)來(lái)源,便于我們能夠根據(jù)租車人群的移動(dòng)軌跡,能夠更好地對(duì)風(fēng)險(xiǎn)駕駛、道路規(guī)劃、出行時(shí)間和空間上進(jìn)行深維度的分析,從而對(duì)駕駛行為、租車人群時(shí)間和空間上的分布都可以對(duì)其指定策略。

擬解決問(wèn)題二:租車人群軌跡數(shù)據(jù)分析,在已經(jīng)通過(guò)GPS的方式收集到可靠數(shù)據(jù)的前提下,那么就可以根據(jù)定位實(shí)時(shí)位置,來(lái)獲取到經(jīng)緯度信息。之后在地圖上進(jìn)行詳細(xì)的標(biāo)注,并且按照路段不同情況下車輛的加速度,減速,轉(zhuǎn)彎根據(jù)特定的算法對(duì)車輛的軌跡在地圖上進(jìn)行描述與展現(xiàn)。這樣計(jì)算下來(lái)的一條軌跡即是一名租車人群出行軌跡圖。那么之后我們就可以通過(guò)對(duì)各種不同路段進(jìn)行采集,加大采集數(shù)據(jù)量。以大數(shù)據(jù)的統(tǒng)計(jì)方式來(lái)減小誤差的產(chǎn)生。有了一定的數(shù)據(jù)基礎(chǔ)后,我們便可以對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗并進(jìn)一步地優(yōu)化軌跡與總結(jié)。

擬解決問(wèn)題三:數(shù)據(jù)人群時(shí)間和空間上分析。除了對(duì)軌跡處理之外,根據(jù)不同的城市,時(shí)間和空間上的分析也是必不可少的。時(shí)間上我們采用與法定工作日的時(shí)間,對(duì)數(shù)據(jù)進(jìn)行日常的采集,然后我們會(huì)將一日時(shí)間劃分為四個(gè)階段,分別是第一階段凌晨零點(diǎn)至凌晨六點(diǎn),第二階段為凌晨六點(diǎn)至午時(shí)十二點(diǎn),第三階段為午時(shí)十點(diǎn)至下午十八點(diǎn),第四階段為下午十八點(diǎn)至凌晨零點(diǎn)。然后分析人們?cè)诓煌A段的出行情況。繪制成統(tǒng)計(jì)圖。這樣就能直觀地表述人們?cè)谝惶熘胁煌瑫r(shí)候的外出情況。一周多次采集求取均值,以縮小誤差產(chǎn)生。再將一周作為一個(gè)梯度,重復(fù)采集3-4周,以減小因各種原因產(chǎn)生的周誤差。這樣提取的數(shù)據(jù)就會(huì)變得更加的精確。在空間上的分析就根據(jù)一線都市車輛與普通二三線都市進(jìn)行比較。但因一線城市交通方式更多種多樣,各種不確定性較多。而且在一線城市不同的地段,在繪制圖形時(shí)可能會(huì)出現(xiàn)不同的峰值情況。這時(shí)候就采用去掉峰值與最低值,再對(duì)數(shù)據(jù)進(jìn)行處理來(lái)減小空間上分布不均勻造成的誤差。

2實(shí)施方案

2.1建立數(shù)據(jù)處理模型

首先需要把出租車GPS大數(shù)據(jù)集放到Hadoop平臺(tái)上,將其存儲(chǔ)在Node2的HBase數(shù)據(jù)庫(kù)中,接下來(lái)對(duì)受天氣、環(huán)境及操作誤差影響較大的數(shù)據(jù)進(jìn)行預(yù)處理,如果不對(duì)這些大數(shù)據(jù)進(jìn)行預(yù)先處理,將會(huì)有很大的可能產(chǎn)生非常大的誤差,在使用這些數(shù)據(jù)之前進(jìn)行預(yù)先處理,可以使得最終的結(jié)果更為準(zhǔn)確,實(shí)行預(yù)處理后首先使用DBSCAN算法把預(yù)處理后的所得的數(shù)據(jù)進(jìn)行處理得到合適的K值,然后把K值作為K-means算法的初始簇心對(duì)數(shù)據(jù)進(jìn)行最終處理。

在收集數(shù)據(jù)之前,先根據(jù)經(jīng)緯度對(duì)區(qū)域進(jìn)行劃分,在區(qū)域內(nèi)的數(shù)據(jù)進(jìn)行收集和處理,區(qū)域外的則進(jìn)行剔除。劃分區(qū)域后對(duì)產(chǎn)生的無(wú)效數(shù)據(jù)進(jìn)行排除,當(dāng)GPS終端收到車輛的經(jīng)緯度數(shù)據(jù)長(zhǎng)時(shí)間沒(méi)有發(fā)生改變時(shí),表示車輛速度為0,處于靜止?fàn)顟B(tài),這樣的數(shù)據(jù)需要對(duì)其進(jìn)行剔除?;蛘呓邮盏慕?jīng)緯度數(shù)據(jù)在短時(shí)間內(nèi)發(fā)生極大的改變,這樣所得到的數(shù)據(jù)不能真實(shí)地反映車輛情況,也屬于無(wú)效數(shù)據(jù)。

2.2數(shù)據(jù)分析

2.2.1租車人群時(shí)間和空間上分析

一般而言,租車人員的出行特征會(huì)有一定的地域性,不同的租車人員,有著完全不同的出行特征,根據(jù)租車人員的起始地和目標(biāo)地,得出租車人員的外出時(shí)間,外出距離和外出高峰期,這里首先分析研究出租車輛工作日和非工作日的GPS數(shù)據(jù)然后把工作日和非工作日的研究數(shù)據(jù)分開(kāi)研究,然后在DB-SCANS算法得出K值后,用K-means算法進(jìn)行處理,聚類分析不時(shí)間段的狀態(tài),從而分析出某一天的租車人員行為特征,對(duì)比7天的數(shù)據(jù)處理結(jié)果,得出某城市中一天大概的租車信息。

給定一個(gè)數(shù)據(jù)集X={X1,X2,…,Xn}假?zèng)]K個(gè)簇的簇類中心為P={P1,P2,……Pk},那么有概率聚類的目標(biāo)函數(shù)形式如下:

F(n,p)=

其中Q(Xk)表示Pi和Xk的聯(lián)合概率分布Q(Pi|Xk)代表樣本數(shù)據(jù)點(diǎn),Xk屬于第i個(gè)聚點(diǎn)的條件概率,由此可得出以下圖像。

2.2.2租車人群軌跡數(shù)據(jù)分析

由GPS巾包含的信息中可以根據(jù)經(jīng)緯度和時(shí)間得出車輛的位置信息和運(yùn)動(dòng)軌跡,分析研究7天中出租車的GPS數(shù)據(jù),得出租車人群的主要活動(dòng)地點(diǎn)和運(yùn)動(dòng)軌跡,對(duì)活動(dòng)路線實(shí)行聚類分析得到整體活動(dòng)熱點(diǎn),再根據(jù)經(jīng)緯度坐標(biāo)上的距離和車輛運(yùn)行的時(shí)間分析m租車輛的平均速度,大致地預(yù)估某城市的交通路況,從而能夠更好地規(guī)劃行駛路線、出行時(shí)間以及降低駕駛風(fēng)險(xiǎn)。

出租車輛駕駛節(jié)點(diǎn)A,B的位置坐標(biāo)的經(jīng)緯度分別是(Lo-nA,LatA)及(LonB,LatB),在t時(shí)刻速度為Vt,下一時(shí)刻速度為Vt+1,時(shí)間變化量為At。平均速度為V,兩點(diǎn)間的距離為Dis-tance。

C=sin(LatA*II/180)*sin(LatB*II/180)+cos(LatA*'IT/180)*cos(LatB*'TT/180)*

cos((MLonA-MLonB)*'1T/180)

DistanCe=R*Arccos(C)*'IT/180[2]

V=DistanCe/At

2.2.3對(duì)數(shù)據(jù)進(jìn)行利用

得到處理后的數(shù)據(jù)后,可以建立起租車人員的用戶畫(huà)像,根據(jù)用戶畫(huà)像,推測(cè)出租車人群的行為和需求,了解其出行規(guī)律。從而在活動(dòng)范圍熱點(diǎn)在其附近設(shè)立商圈對(duì)出行人群精準(zhǔn)營(yíng)銷,并對(duì)城市通行路況進(jìn)行解析,經(jīng)過(guò)交通預(yù)警緩解城市的交通擁堵。

3結(jié)論

最終得出的結(jié)論有一定的參考價(jià)值但不能完全表現(xiàn)出所有的時(shí)間所有的地點(diǎn)乘客出行的時(shí)間特征和空間熱度區(qū)域。通過(guò)對(duì)乘客出行的時(shí)間特征和空間熱度的分析可以城市更有效地安排公共的交通具的設(shè)置地點(diǎn),這樣即環(huán)保又能為乘客供應(yīng)快捷的服務(wù),促使和諧社會(huì)更好更快的發(fā)展。此外,通過(guò)客流量的空間熱點(diǎn)區(qū)域的分析,可以在熱點(diǎn)區(qū)域設(shè)置休閑娛樂(lè)場(chǎng)所為商人提供商機(jī),不僅促進(jìn)的經(jīng)濟(jì)的發(fā)展,也使人們生活變得更加愜意。此外,大數(shù)據(jù)分析研究了租車人群出行行為數(shù)據(jù),對(duì)租車人群出行行為在不同時(shí)間、空間、距離等方面數(shù)據(jù)進(jìn)行了深入剖析,提取出了租車出行行為特征,可以建立起租車人員的用戶畫(huà)像,根據(jù)用戶畫(huà)像,推測(cè)出租車人群的行為和需求,了解其出行規(guī)律,可以對(duì)城市交通路況進(jìn)行分析,通過(guò)交通預(yù)警緩解城市的交通擁堵,也可調(diào)度為出行人群提供精準(zhǔn)服務(wù)等。

參考文獻(xiàn):

[1]劉惠宇,劉鵬,張婷.基于出租車GPS數(shù)據(jù)的城市人群出行模式研究[J].江蘇科技信息,2019(17):49-50.

[2]郭艷君.基于GPS軌跡數(shù)據(jù)實(shí)現(xiàn)營(yíng)運(yùn)客車風(fēng)險(xiǎn)駕駛行為分析.[J】.教育教學(xué)論壇,2017(3):76-77.

[3]魏祥.基于大數(shù)據(jù)挖掘的出租車行為檢測(cè)方法研究[D].西南石油大學(xué),2015.

[4]盛勇.基于GPS軌跡數(shù)據(jù)的居民出行行為特征分析[D].江西理工大學(xué),2018.

[5]劉敬帥.基于出租車GPS數(shù)據(jù)的居民出行分析[D].蘭州理工大學(xué),2017.

[6]何賢國(guó),孫國(guó)道,高家全,等.出租車CPS大數(shù)據(jù)的道路行車可視分析[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2014,26(12):2164-2170.

[7]張亞茹.基于車聯(lián)網(wǎng)大數(shù)據(jù)分析的實(shí)時(shí)路況信息系統(tǒng)關(guān)鍵技術(shù)研究[D].南京郵電大學(xué),2017.

【通聯(lián)編輯:梁書(shū)】

收稿日期:2020-04-15

基金項(xiàng)目:教育部產(chǎn)學(xué)合作協(xié)同育人項(xiàng)目;項(xiàng)目名稱:面向大數(shù)據(jù)技術(shù)的創(chuàng)新創(chuàng)業(yè)教育改革;項(xiàng)目(基金)號(hào):201802130075;廠東省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練項(xiàng)目(粵教高函[2019]40號(hào))

作者簡(jiǎn)介:劉康(1998-),男,廣東河源人,本科,研究方向:軟件工程;陳智勇(1996-),男,廣東普寧人,本科,研究方向:軟件工程;黃慶鵬(1997-),男,廣東梅州人,本科,研究方向:軟件工程;張逸泓(1999-),男,廣東汕頭人,本科,研究方向:物聯(lián)網(wǎng)工程。

猜你喜歡
數(shù)據(jù)采集
Web網(wǎng)絡(luò)大數(shù)據(jù)分類系統(tǒng)的設(shè)計(jì)與改進(jìn)
CAN總線通信技術(shù)在電梯監(jiān)控系統(tǒng)中的應(yīng)用
基于大型嵌入式系統(tǒng)的污水檢測(cè)系統(tǒng)設(shè)計(jì)
社會(huì)保障一卡通數(shù)據(jù)采集與整理技巧
基于AVR單片機(jī)的SPI接口設(shè)計(jì)與實(shí)現(xiàn)
CS5463在植栽用電子鎮(zhèn)流器老化監(jiān)控系統(tǒng)中的應(yīng)用
大數(shù)據(jù)時(shí)代高校數(shù)據(jù)管理的思考
科技視界(2016年18期)2016-11-03 22:51:40
鐵路客流時(shí)空分布研究綜述
基于廣播模式的數(shù)據(jù)實(shí)時(shí)采集與處理系統(tǒng)
軟件工程(2016年8期)2016-10-25 15:54:18
通用Web表單數(shù)據(jù)采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
軟件工程(2016年8期)2016-10-25 15:52:53
辽源市| 阿拉尔市| 岑溪市| 怀仁县| 黑水县| 新河县| 五大连池市| 额尔古纳市| 贵南县| 文山县| 容城县| 孝感市| 平江县| 开化县| 涟水县| 和硕县| 合川市| 同江市| 霍城县| 于都县| 河池市| 武夷山市| 兴和县| 通城县| 中西区| 元朗区| 眉山市| 白玉县| 丹江口市| 周口市| 京山县| 资溪县| 古交市| 亚东县| 镇巴县| 汶川县| 正镶白旗| 郓城县| 五常市| 义马市| 凤庆县|