国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于網(wǎng)絡(luò)核密度的網(wǎng)約車上下客熱點(diǎn)識別

2021-06-29 07:05龍雪琴周萌趙歡張學(xué)宇
關(guān)鍵詞:密度估計(jì)工作日網(wǎng)約

龍雪琴,周萌,趙歡,張學(xué)宇

(長安大學(xué),a.生態(tài)安全屏障區(qū)交通網(wǎng)設(shè)施管控級循環(huán)修復(fù)技術(shù)交通運(yùn)輸行業(yè)重點(diǎn)實(shí)驗(yàn)室;b.運(yùn)輸工程學(xué)院,西安710064)

0 引言

網(wǎng)約車的便捷預(yù)訂服務(wù)和高可達(dá)性服務(wù)使其成為城市中必不可少的交通方式。網(wǎng)約車訂單數(shù)據(jù)通常用于出行需求的熱點(diǎn)分析,其數(shù)據(jù)特征在一定程度上可反映交通流的時空分布特征,且其空間異質(zhì)性與城市土地利用緊密相關(guān)。

熱點(diǎn)識別研究大多采取空間聚類法,包括Getis-Ord(Gi*)統(tǒng)計(jì)、核密度估計(jì)(KDE)、最近鄰方法、K-means聚類等。核密度估計(jì)在大規(guī)??臻g點(diǎn)數(shù)據(jù)集下被證明聚類效果良好,如出租車載客熱點(diǎn)區(qū)域評估[1],分析出租車的時空分布模式[2],識別高速公路事故聚集路段并對其嚴(yán)重性進(jìn)行分級[3]等。點(diǎn)聚類方法在熱點(diǎn)識別方面也有較多研究,如挖掘出租車上下客熱點(diǎn)區(qū)域[4],從結(jié)果中發(fā)現(xiàn)通勤分布特征[5]及土地利用規(guī)律[6],挖掘出租車熱點(diǎn)載客路徑[7]等。然而,上下客事件是嚴(yán)格發(fā)生在道路上的網(wǎng)絡(luò)約束事件,根據(jù)Okabe等提出的網(wǎng)絡(luò)約束點(diǎn)事件研究思路,忽略道路網(wǎng)絡(luò)的影響直接用歐氏距離無法準(zhǔn)確體現(xiàn)事件在道路網(wǎng)絡(luò)環(huán)境下的空間自相關(guān)特性[8]。隨著GIS 技術(shù)的發(fā)展,對于網(wǎng)絡(luò)約束下點(diǎn)事件的研究已取得一定成果,但缺少對城市道路網(wǎng)絡(luò)系統(tǒng)約束下的上下客熱點(diǎn)識別研究。

基于上述分析,本文采用網(wǎng)絡(luò)核密度估計(jì)法對網(wǎng)約車上下客點(diǎn)進(jìn)行聚類分析,考慮到核密度計(jì)算結(jié)果中可能存在的零膨脹和過度離勢現(xiàn)象,構(gòu)建零膨脹負(fù)二項(xiàng)回歸模型處理估計(jì)結(jié)果,識別網(wǎng)約車上下客熱點(diǎn)路段。

1 研究區(qū)域與數(shù)據(jù)處理

1.1 研究區(qū)域及數(shù)據(jù)概況

本文基于滴滴公司在蓋亞數(shù)據(jù)開放計(jì)劃中提供的脫敏數(shù)據(jù),以成都市局部區(qū)域2016年11月1日-30日的訂單數(shù)據(jù)為支撐進(jìn)行研究。數(shù)據(jù)起訖點(diǎn)經(jīng)過綁路處理,保證數(shù)據(jù)能夠?qū)?yīng)到實(shí)際的道路信息。數(shù)據(jù)平臺提供的數(shù)據(jù)范圍為:[30.727818,104.043333],[30.726490,104.129076],[30.655191,104.129591],[30.652828,104.042102]。基本數(shù)據(jù)結(jié)構(gòu)描述如表1所示。

表1 滴滴快車訂單數(shù)據(jù)基本結(jié)構(gòu)Table 1 Basic structure of Didi Express order data

類似于道路交通流量的運(yùn)行規(guī)律,網(wǎng)約車出行也具有一定的周期性,故選取1 周(2016年11月14日-20日)工作日早晚高峰(7:00-9:00、17:00-19:00)出行數(shù)據(jù)和非工作日全天出行數(shù)據(jù),對3個階段的網(wǎng)約車熱點(diǎn)時空分布特性進(jìn)行對比分析。研究區(qū)域截取部分?jǐn)?shù)據(jù)覆蓋區(qū)域,其經(jīng)緯度范圍為經(jīng)度[104.06405,104.10638],緯度[30.66990,30.69702],包括金牛區(qū)、成華區(qū)、青陽區(qū),如圖1所示。青羊區(qū)位于成都市西部,城市用地以商業(yè)用地和住宅用地為主,路網(wǎng)相對密集,公共交通設(shè)施較為發(fā)達(dá);金牛區(qū)位于成都西北部,是西南地區(qū)最大的綜合交通樞紐——成都北站;成華區(qū)位于東部地區(qū),大部分在二環(huán)路外,路網(wǎng)密度和公共交通設(shè)施數(shù)量相對稀少。

圖1 研究范圍Fig.1 Area of research

1.2 地圖信息匹配

借助網(wǎng)絡(luò)電子地圖數(shù)據(jù)獲取底圖,包含空間信息和屬性信息兩部分。將滴滴快車訂單數(shù)據(jù)與電子地圖進(jìn)行匹配,實(shí)現(xiàn)車輛數(shù)據(jù)空間屬性與實(shí)際地理信息的對應(yīng),找到車輛上下客點(diǎn)所對應(yīng)道路。地圖匹配后的結(jié)果如圖2所示??梢钥闯觯丝蜕舷驴忘c(diǎn)在不同的道路上具有較大差異性。

圖2 上下客點(diǎn)分布Fig.2 Distribution of pick-up and drop-off points

2 上下客熱點(diǎn)識別方法

2.1 網(wǎng)絡(luò)核密度估計(jì)

核密度估計(jì)(Kernel Density Estimation,KDE)是一種重要的非參數(shù)檢驗(yàn)方法,通過在研究區(qū)域內(nèi)生成平滑的密度表面來體現(xiàn)點(diǎn)事件的空間聚集特征,以找出事件的高發(fā)區(qū)域,在經(jīng)濟(jì)[9]和影像分類處理[10]中得到了廣泛的應(yīng)用。核密度估計(jì)方法,根據(jù)其原理不同,分為平面核密度估計(jì)和網(wǎng)絡(luò)核密度估計(jì)兩種方法。其中平面核密度估計(jì)的研究基礎(chǔ)為均質(zhì)空間,對于非均質(zhì)空間的研究可采用網(wǎng)絡(luò)核密度估計(jì)方法。圖3為平面核密度估計(jì)與網(wǎng)絡(luò)核密度估計(jì)的原理對比圖。

圖3 平面核密度與網(wǎng)絡(luò)核密度估計(jì)原理對比Fig.3 Comparison of planar and network KDE

網(wǎng)絡(luò)核密度估計(jì)在平面核密度估計(jì)的基礎(chǔ)上有以下兩方面改進(jìn):

(1)在核密度延展方向和衰減效應(yīng)方面,各向同性二維均質(zhì)空間延展和平面距離衰減效應(yīng)改進(jìn)為非均質(zhì)網(wǎng)絡(luò)方向延展和網(wǎng)絡(luò)距離衰減效應(yīng)。基于歐式距離的核密度估計(jì)會導(dǎo)致很多不在實(shí)際窗寬范圍內(nèi)的事件點(diǎn)被計(jì)算,也可能會過度計(jì)算交叉口處的上下客數(shù)量,從而令估計(jì)結(jié)果偏大,圖4為基于歐式距離與基于網(wǎng)絡(luò)距離的事件搜索情況對比。

從圖4中可以看出,基于歐式距離進(jìn)行事件搜索時,有4 起事件被計(jì)算,而基于網(wǎng)絡(luò)距離搜索時只有2起事件在搜索范圍內(nèi)。

圖4 基于歐式距離與基于網(wǎng)絡(luò)距離的事件搜索情況對比Fig.4 Comparison of event search based on euclidean distance and network distance

(2)在密度計(jì)算方面,交叉口處相交道路在幾何特性和交通流特性上發(fā)生急劇變化,網(wǎng)絡(luò)核密度估計(jì)考慮了要素在節(jié)點(diǎn)處密度計(jì)算的特殊情況,保證節(jié)點(diǎn)密度估計(jì)的無偏性。

在實(shí)際的路網(wǎng)空間中,網(wǎng)約車上下客事件的發(fā)生和分布受路網(wǎng)空間格局的影響,體現(xiàn)出非勻質(zhì)性特征,故采用以網(wǎng)絡(luò)距離為度量的網(wǎng)絡(luò)核密度估計(jì)來識別上下客熱點(diǎn)。

城市路網(wǎng)道路基本段的網(wǎng)絡(luò)核密度估計(jì)函數(shù)為

式中:K(q) 為點(diǎn)q處的網(wǎng)絡(luò)核密度值;n為事件點(diǎn)個數(shù);h為搜索半徑(或窗寬);wi為點(diǎn)事件,i=1,2,3,…,n;d(q,wi)為點(diǎn)事件wi到核中心q的距離;k(?)為核函數(shù)。

路段網(wǎng)絡(luò)核密度值經(jīng)過交叉口后會出現(xiàn)衰減,衰減系數(shù)的取值與交叉口節(jié)點(diǎn)處的節(jié)點(diǎn)數(shù)有關(guān)[3]。本文定義衰減系數(shù)ns為交叉口節(jié)點(diǎn)的節(jié)點(diǎn)數(shù)。圖5為交叉口區(qū)域網(wǎng)絡(luò)核密度函數(shù)。

圖5 交叉口區(qū)域網(wǎng)絡(luò)核密度函數(shù)圖Fig.5 Network kernel density function diagram of intersection area

圖5中,點(diǎn)q為核中心,l1,l2,l3為3條不同路段,v為交叉口節(jié)點(diǎn),交叉口區(qū)域的網(wǎng)絡(luò)核密度估計(jì)函數(shù)為

2.2 基于零膨脹負(fù)二項(xiàng)回歸模型的熱點(diǎn)路段識別

網(wǎng)絡(luò)核密度估計(jì)采用的高斯核函數(shù)計(jì)算結(jié)果的跳躍性會產(chǎn)生一部分零值,其數(shù)量超過用于擬合數(shù)據(jù)的離散分布隨機(jī)產(chǎn)生的個數(shù),會發(fā)生零膨脹現(xiàn)象。同時,若數(shù)據(jù)的方差大于期望的二項(xiàng)分布方差,會導(dǎo)致奇異的標(biāo)準(zhǔn)誤差檢驗(yàn)和不精確的顯著性檢驗(yàn),造成過度離勢。如果不考慮核密度計(jì)算結(jié)果中存在的零膨脹和過度離勢現(xiàn)象,其擬合結(jié)果將整體向零值靠攏,這會喪失大量的熱點(diǎn)路段。因此,構(gòu)建零膨脹負(fù)二項(xiàng)回歸模型(Zero-inflated Negative Binomial,ZINB)擬合網(wǎng)絡(luò)核密度估計(jì)結(jié)果。

ZINB可以看作一個由零分布和負(fù)二項(xiàng)分布各占一定比例組合而成的混合分布,分布模型為

式中:Y為隨機(jī)變量;y代表變量Y的觀測值;p為零膨脹模型參數(shù),0

式中:λi為負(fù)二項(xiàng)回歸分布的期望;xi和zi分別為一定尺度的特征向量,在此表示第i個協(xié)變量;β和γ為回歸方程協(xié)相關(guān)系數(shù)的特征向量。ZINB對數(shù)似然值的計(jì)算式為

式中:X=(x1,…,xn),Z=(z1,…,zn)。

3 實(shí)證分析

3.1 上下客熱點(diǎn)空間分析

采用SANET 軟件,對研究區(qū)域上下客點(diǎn)進(jìn)行網(wǎng)絡(luò)核密度估計(jì),并在ESRI ArcGIS 中可視化網(wǎng)絡(luò)核密度計(jì)算結(jié)果。本文核函數(shù)采用高斯核函數(shù),根據(jù)其積分均方誤差達(dá)到最小原則求取最優(yōu)帶寬,最優(yōu)帶寬計(jì)算公式為

式中:hopt為最優(yōu)帶寬;σ為高斯核函數(shù)的標(biāo)準(zhǔn)差。本文σ為上(下)客點(diǎn)數(shù)據(jù)的網(wǎng)絡(luò)距離標(biāo)準(zhǔn)差,n為上(下)客點(diǎn)數(shù)據(jù)的總量。計(jì)算得到,上客點(diǎn)最優(yōu)空間窗寬為187.8 m,下客點(diǎn)最優(yōu)窗寬為221.2 m,為便于研究取200 m作為統(tǒng)一帶寬,根據(jù)經(jīng)驗(yàn)[8],線形單元長度取最優(yōu)帶寬的1/10,即20 m。

可視化結(jié)果如圖6~圖8所示,不僅體現(xiàn)了細(xì)節(jié)上的變化,顯示效果也較直觀。

圖6 工作日早高峰網(wǎng)約車上下客點(diǎn)網(wǎng)絡(luò)核密度估計(jì)結(jié)果Fig.6 Network KDE results of online car-hailing pick-up and drop-off points in morning peak on weekdays

早高峰時段,居民上班及上學(xué)的剛性需求較大,網(wǎng)約車出行需求高。圖6中,工作日早高峰的網(wǎng)約車上客點(diǎn)主要分布在怡福社區(qū)(住宅區(qū))臨近的府青路二段,中房·藍(lán)水灣與中鐵二局·瑪塞城(住宅區(qū))中間的府青路三段,以及成都醫(yī)學(xué)院第二附屬醫(yī)院(醫(yī)療區(qū))附近的二環(huán)高架路。下客點(diǎn)除了位于北門客運(yùn)站附近的一環(huán)路北四段和成都醫(yī)學(xué)院第二附屬醫(yī)院(醫(yī)療區(qū))附近的二環(huán)高架路網(wǎng)絡(luò)核密度值較高外,其余道路核密度值分布相對均勻。

圖7中,工作日晚高峰網(wǎng)約車上客點(diǎn)除金牛萬達(dá)廣場、大成市場(娛樂購物區(qū))周圍道路,以及北門客運(yùn)站附近路段網(wǎng)絡(luò)核密度值較高外,其余道路核密度值分布相對均勻。下客點(diǎn)主要形成4 個熱點(diǎn)區(qū)域,分別位于金牛萬達(dá)廣場附近的一環(huán)路北三段,北門客運(yùn)站附近的一環(huán)路北四段,財(cái)富又一城附近的華油路以及高地中心(娛樂購物區(qū))臨近的建設(shè)路與建設(shè)巷交叉口附近道路。

圖7 工作日晚高峰網(wǎng)約車上下客點(diǎn)網(wǎng)絡(luò)核密度估計(jì)結(jié)果Fig.7 Network KDE results of online car-hailing pick-up and drop-off points in evening peak on weekdays

圖8中,非工作日上客點(diǎn)的熱點(diǎn)區(qū)域主要分布于娛樂購物區(qū)和住宅區(qū),下客點(diǎn)主要形成4個熱點(diǎn)區(qū)域分別是金牛萬達(dá)廣場附近的一環(huán)路北三段,北門客運(yùn)站附近的一環(huán)路北四段,財(cái)富又一城附近的華油路以及太陽公元(娛樂購物區(qū))附近的建設(shè)北路二段??傮w來說,非工作日下客點(diǎn)分布比上客點(diǎn)更為集中。

從圖6~圖8可以看出,在不同特征時段,研究區(qū)域內(nèi)上下客點(diǎn)熱點(diǎn)分布對應(yīng)的城市建成環(huán)境也有一定差異,工作日早高峰上客點(diǎn)主要集中在住宅區(qū),晚高峰下客點(diǎn)主要集中娛樂購物區(qū),非工作日上下客點(diǎn)分布較為均衡。

圖8 非工作日網(wǎng)約車上下客點(diǎn)網(wǎng)絡(luò)核密度估計(jì)結(jié)果Fig.8 Network KDE results of online car-hailing pick-up and drop-off points on weekends

3.2 熱點(diǎn)路段識別

上下客點(diǎn)網(wǎng)絡(luò)核密度估計(jì)值的零膨脹負(fù)二項(xiàng)擬合結(jié)果及累積概率分布曲線如圖9所示。

從圖9中可以看出,未作擬合的累積概率起始點(diǎn)位于20%附近,擬合后的累積概率分布曲線從0開始,并且上升階段比擬合前光滑。采用累積頻率作為熱點(diǎn)路段的劃分標(biāo)準(zhǔn),結(jié)合研究區(qū)域網(wǎng)約車調(diào)度實(shí)際情況,將累積概率分布曲線達(dá)到90%時的核密度估計(jì)值作為一級熱點(diǎn)路段的閾值,即將有約10%的子路段作為一級熱點(diǎn)路段;同理,將曲線達(dá)到80%和70%時的核密度估計(jì)值分別作為二級、三級熱點(diǎn)路段的閾值,擬合前后的累積概率閾值變化的差異均在10%以上,不可忽略。表2為基于零膨脹負(fù)二項(xiàng)回歸模型得到的累積概率分別為90%、80%和70%對應(yīng)的網(wǎng)絡(luò)核密度值。

圖9 零膨脹負(fù)二項(xiàng)回歸擬合前后的累積概率分布Fig.9 Cumulative probability distribution before and after zero expansion negative binomial regression fitting

表2 熱點(diǎn)路段劃分的核密度閾值Table 2 Threshold of kernel density for hot road sections

熱點(diǎn)路段等級劃分可視化結(jié)果如圖10所示,將道路劃分為一級、二級和三級熱點(diǎn)路段及非熱點(diǎn)路段。

從圖10可以看出,工作日和非工作日的上客熱點(diǎn)呈現(xiàn)出較大的相似性,下客熱點(diǎn)分布則表現(xiàn)出明顯的差異,說明工作日和非工作日的出行量、出行目的均呈現(xiàn)異質(zhì)性。此外,工作日早高峰的上客熱點(diǎn)與晚高峰的下客熱點(diǎn)較為一致,而早高峰下客熱點(diǎn)則與晚高峰上客熱點(diǎn)一致,體現(xiàn)了一日內(nèi)出行閉環(huán)的特性。

圖10 熱點(diǎn)路段識別結(jié)果Fig.10 Hot road sections identification results

3.3 平面核密度和網(wǎng)絡(luò)核密度熱點(diǎn)識別結(jié)果對比分析

進(jìn)一步采用平面核密度方法,選擇工作日早高峰時段上客點(diǎn)進(jìn)行對比分析,兩種方法的識別結(jié)果如圖11所示。

從圖11可以看出,平面核密度法計(jì)算整個平面的密度分布,以二維歐氏距離度量事件的發(fā)生和影響范圍,沒有考慮路網(wǎng)的非均質(zhì)空間特性,部分公園、居民區(qū)和湖泊等沒有道路的區(qū)域也成為載客熱點(diǎn)。此外,平面核密度法沒有將上下客熱點(diǎn)匹配到對應(yīng)的路段上,部分熱點(diǎn)路段并沒有識別出來,例如淺水半島小區(qū)臨近的府青路三段和成都醫(yī)學(xué)院第二附屬醫(yī)院附近的二環(huán)高架路。而網(wǎng)絡(luò)核密度法將密度分布限制于城市道路網(wǎng)絡(luò)空間內(nèi),更加符合交通需求與實(shí)際道路網(wǎng)絡(luò)的對應(yīng)關(guān)系,且密度值在同一道路上分布連續(xù),在不同等級道路上分布較均衡,密度分布具有差異性但不存在突變情況,可以如實(shí)地反映上下客事件在路網(wǎng)中的分布特征。

圖11 平面核密度和網(wǎng)絡(luò)核密度熱點(diǎn)識別結(jié)果對比Fig.11 Comparison of hot spots identification results of planar KDE and network KDE

4 結(jié)論

本文以成都市部分區(qū)域內(nèi)滴滴快車1 周訂單數(shù)據(jù)為基礎(chǔ),采用基于路網(wǎng)距離的網(wǎng)絡(luò)核密度估計(jì)方法分析了工作日及非工作日網(wǎng)約車上下客事件的空間分布情況,并采用零膨脹負(fù)二項(xiàng)回歸模型對核密度值進(jìn)行分級處理,識別出網(wǎng)約車上下客的熱點(diǎn)路段。具體結(jié)論如下:

(1)網(wǎng)約車上下客熱點(diǎn)具有明顯區(qū)域分布特性,且下客熱點(diǎn)分布更為集中,具有較高開發(fā)強(qiáng)度的商業(yè)綜合區(qū)是最大的上下客熱點(diǎn)。

(2)采用零膨脹負(fù)二項(xiàng)回歸模型能夠更好地?cái)M合擁有零膨脹和過度離勢現(xiàn)象的網(wǎng)絡(luò)核密度計(jì)算結(jié)果,從而識別出研究區(qū)域各特征時段內(nèi)一級、二級和三級熱點(diǎn)路段。

(3)與平面核密度方法相比,網(wǎng)絡(luò)核密度法能更加合理地表征熱點(diǎn)在路段和交叉口區(qū)域的分布,對于熱點(diǎn)識別更具有合理性和實(shí)際應(yīng)用價值。

本文從時空尺度上研究乘客上下客熱點(diǎn),能有效指導(dǎo)城市網(wǎng)約車調(diào)度,通過交通誘導(dǎo)和調(diào)度,向網(wǎng)約車司機(jī)推薦高收益的載客路線,能有效提高網(wǎng)約車的巡航效率,減小居民出行的等待時間。但是,本文對快車數(shù)據(jù)的研究沒有考慮拼車模式的影響,僅考慮了滴滴網(wǎng)約車這種單一模式,對于網(wǎng)約車熱點(diǎn)路線規(guī)劃缺乏代表性,未來將在考慮多源數(shù)據(jù)的基礎(chǔ)上建立熱點(diǎn)與空間單元的關(guān)聯(lián)性。

猜你喜歡
密度估計(jì)工作日網(wǎng)約
網(wǎng)約車平臺責(zé)任條款的識別方法——基于解釋進(jìn)路的正當(dāng)規(guī)制
面向魚眼圖像的人群密度估計(jì)
基于MATLAB 的核密度估計(jì)研究
一種基于改進(jìn)Unet的蝦苗密度估計(jì)方法
網(wǎng)約車侵權(quán)責(zé)任在司法實(shí)踐中的認(rèn)定
網(wǎng)約車問題研究及對策
網(wǎng)約車安全性提高研究
NSD樣本最近鄰密度估計(jì)的強(qiáng)相合性
關(guān)于休閑的量的問題的考察
對《資本論》中工作日問題的哲學(xué)思考