国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于手機(jī)導(dǎo)航軌跡數(shù)據(jù)的城市大規(guī)模人群出行模式分析

2023-08-02 11:10:18吳杭彬陳茜茜靳慧玲傅琛黃煒劉春
關(guān)鍵詞:冪律工作日步行

吳杭彬, 陳茜茜, 靳慧玲, 傅琛, 黃煒, 劉春

(1.同濟(jì)大學(xué) 測(cè)繪與地理信息學(xué)院,上海 200092;2.自然資源部超大城市自然資源時(shí)空大數(shù)據(jù)分析應(yīng)用重點(diǎn)實(shí)驗(yàn)室,上海 200063;3.北京大學(xué) 地球與空間科學(xué)學(xué)院, 北京 100871)

大規(guī)模人群出行可以揭示人類活動(dòng)規(guī)律,在人類日?;顒?dòng)性研究、交通狀況預(yù)測(cè)、城市規(guī)劃等方面具有廣闊的應(yīng)用前景。目前國(guó)內(nèi)外研究學(xué)者已經(jīng)開展了大量研究,根據(jù)數(shù)據(jù)源,相關(guān)工作可分為基于單一數(shù)據(jù)源的人群出行模式分析以及基于多源數(shù)據(jù)的出行模式分析。

基于單一數(shù)據(jù)源的大規(guī)模人群出行模式研究所使用的數(shù)據(jù)一般包括手機(jī)信令數(shù)據(jù)、出租車軌跡數(shù)據(jù)、網(wǎng)約車訂單數(shù)據(jù)等。例如,丁亮等[1]利用手機(jī)信令數(shù)據(jù)識(shí)別上海市內(nèi)手機(jī)用戶的居住地和工作地,在此基礎(chǔ)上提取用戶的通勤信息,并研究了中心城區(qū)的就業(yè)中心的能級(jí)、腹地和勢(shì)力范圍。Wu等[2]分析了上海市長(zhǎng)距離出租車軌跡的時(shí)空模式,探索了地鐵對(duì)長(zhǎng)距離出行出租車客流的分流效應(yīng)以及程度。Tang等[3]將城市中出租車軌跡的OD矩陣轉(zhuǎn)換為網(wǎng)絡(luò)模型,利用網(wǎng)絡(luò)分析的方式研究城市中的人類活動(dòng)性,并且使用社區(qū)發(fā)現(xiàn)算法劃分了交通區(qū)域。Liu等[4]使用上海市出租車軌跡研究了城市內(nèi)的人類活動(dòng)性,在傳統(tǒng)Lévyflight模型的基礎(chǔ)上引入了人口分布以體現(xiàn)地理空間異質(zhì)性,實(shí)驗(yàn)結(jié)果與真實(shí)出租車軌跡模式相符,驗(yàn)證了模型的有效性。Liu等[5]基于開放的GPS軌跡數(shù)據(jù),使用馬爾科夫鏈和聚類分析了游客微觀運(yùn)動(dòng)時(shí)空行為模式。Liu等[6]使用社交媒體簽到數(shù)據(jù)研究城市間的人類活動(dòng)性,發(fā)現(xiàn)距離衰減服從冪律分布的重力模型可以很好地?cái)M合城市之間的交互強(qiáng)度,并用社區(qū)發(fā)現(xiàn)算法對(duì)城市群進(jìn)行劃分,得到了與省級(jí)行政邊界接近的結(jié)果。

單一的數(shù)據(jù)源通常只能代表部分群體的行為,而多源數(shù)據(jù)融合能更全面地反映整體的活動(dòng)模式,增強(qiáng)分析結(jié)果的代表性。Ma等[7]使用北京公交和地鐵數(shù)據(jù),基于DBSCAN聚類檢測(cè)出行模式,并結(jié)合K-means聚類分析出行模式規(guī)律。Liu等[8]使用GPS數(shù)據(jù)、公交和地鐵卡數(shù)據(jù),探索了居民日常出行模式,并基于聚類分析了不同地點(diǎn)之間的關(guān)系以及出行與社會(huì)經(jīng)濟(jì)、土地類型之間的關(guān)系。Tang等[9]使用GPS軌跡和網(wǎng)絡(luò)數(shù)據(jù)來(lái)研究時(shí)空行為,提出了一個(gè)基于信息素的融合模型,模擬線上和線下的娛樂(lè)活動(dòng)模式,基于現(xiàn)實(shí)世界和網(wǎng)絡(luò)上的過(guò)去行為對(duì)未來(lái)行為進(jìn)行預(yù)測(cè)。Xia等[10]基于地鐵卡數(shù)據(jù)和GPS軌跡數(shù)據(jù),利用行程位移、行程持續(xù)時(shí)間和行程間隔3個(gè)指標(biāo)定性和定量地分析2種數(shù)據(jù)集,最后使用最大似然估計(jì)和貝葉斯信息準(zhǔn)則,定量地探索了周末和工作日人類活動(dòng)模式。岳夢(mèng)雪[11]利用深圳市出租車軌跡、公交車及地鐵刷卡數(shù)據(jù),通過(guò)基于鄰接關(guān)系的時(shí)空譜聚類方法挖掘出行模式,并分別從交通方式、社會(huì)背景和出行移動(dòng)方面對(duì)居民的出行模式進(jìn)行分析。

綜上所述,使用單一來(lái)源數(shù)據(jù)或多源數(shù)據(jù)都可以滿足一定場(chǎng)景下的大規(guī)模人群出行模式分析,但前者存在時(shí)空分辨率低、交通方式單一、用戶群體組成單一、采集成本高、樣本量小等問(wèn)題[12];后者可以得到多種交通方式下的人群出行模式,但數(shù)據(jù)獲取和融合難度較大。為此,本文研究采用具備多出行模式的手機(jī)導(dǎo)航數(shù)據(jù),利用LGBM(Light Gradient Boosting Machine)分類方法和時(shí)空出行模式分析方法,以上海市為例,分析大規(guī)模人群的出行模式,比較不同模式下的城市人群出行特征。

1 實(shí)驗(yàn)區(qū)及數(shù)據(jù)

使用的上海GIS數(shù)據(jù)來(lái)源于OpenStreetMap網(wǎng)站。上海市位于長(zhǎng)江入???,常住人口2 489.43萬(wàn)人,行政區(qū)劃面積6 340.5km2,下轄16個(gè)區(qū)(縣)。

所用的手機(jī)導(dǎo)航數(shù)據(jù)時(shí)間范圍為2017年9月16日(周六)至2017年9月19日(周二),原始數(shù)據(jù)格式如表1所示。數(shù)據(jù)采樣間隔為1s,4天的總數(shù)據(jù)量約400G,共54.9億個(gè)GPS點(diǎn),日活躍用戶約145至169萬(wàn)人,如表2所示。

表1 導(dǎo)航軌跡原始數(shù)據(jù)Tab.1 Raw navigation trajectory data

表2 導(dǎo)航用戶分布統(tǒng)計(jì)Tab.2 Distribution statistics of navigation users

表1中日期為包含年、月、日的8位字符串;時(shí)間為包含時(shí)、分、秒的6位字符串;用戶ID為加密后的16位字符串,可用于對(duì)用戶進(jìn)行識(shí)別;經(jīng)度、緯度為GCJ02坐標(biāo)系下的點(diǎn)坐標(biāo);速度為坐標(biāo)點(diǎn)的瞬時(shí)速度;方位角為點(diǎn)的前進(jìn)方向,以正北為參考方向。

2 基于手機(jī)導(dǎo)航數(shù)據(jù)的城市大規(guī)模人群出行分析方法

2.1 導(dǎo)航數(shù)據(jù)預(yù)處理

原始導(dǎo)航數(shù)據(jù)中存在臟數(shù)據(jù)、軌跡未分割等問(wèn)題,因此需要進(jìn)行預(yù)處理。具體包括:

(1)冗余數(shù)據(jù)清洗:主要包括同一用戶在同一時(shí)刻記錄的多個(gè)不同或相同坐標(biāo)點(diǎn)。記錄時(shí)間不在合理范圍內(nèi)的坐標(biāo)點(diǎn)。

(2)軌跡分割:采用時(shí)間間隔分割法,提取單一用戶的所有導(dǎo)航數(shù)據(jù)并按時(shí)間排序,若前后兩數(shù)據(jù)點(diǎn)時(shí)間間隔超過(guò)時(shí)間間隔閾值,則在中斷點(diǎn)上將原始軌跡劃分為2條軌跡。手機(jī)導(dǎo)航軌跡采樣間隔為1s,但城市環(huán)境中存在高樓、高架橋、隧道等遮擋,可能導(dǎo)致定位中斷一段時(shí)間,因此時(shí)間間隔閾值設(shè)置為5min。

(3)異常軌跡清洗:冗余數(shù)據(jù)清洗僅針對(duì)數(shù)據(jù)點(diǎn)層面的異常,但有些異常或無(wú)效點(diǎn)無(wú)法根據(jù)單個(gè)點(diǎn)識(shí)別,因此在完成軌跡分割后再進(jìn)行軌跡清洗。包括兩方面:①誤觸數(shù)據(jù)清洗,對(duì)于持續(xù)時(shí)間不足10s、位移不足10m的軌跡,認(rèn)為是用戶誤觸產(chǎn)生,刪除整條誤觸軌跡。②定位漂移數(shù)據(jù)清洗,部分軌跡中出現(xiàn)時(shí)間相鄰的點(diǎn)在2個(gè)相距較遠(yuǎn)的位置來(lái)回跳動(dòng)的情況,影響了導(dǎo)航軌跡長(zhǎng)度的計(jì)算,這種情況認(rèn)為出現(xiàn)了定位漂移,需刪除整條軌跡。

2.2 基于LGBM的導(dǎo)航數(shù)據(jù)模式分類

經(jīng)過(guò)預(yù)處理的導(dǎo)航數(shù)據(jù)無(wú)交通方式標(biāo)注,還無(wú)法直接用于人群的出行模式分析,需要進(jìn)行交通方式分類。本文采用輕量級(jí)梯度提升機(jī)模型(LightGBM)識(shí)別導(dǎo)航軌跡數(shù)據(jù)的步行、非機(jī)動(dòng)車和機(jī)動(dòng)車3種交通方式[13]。LightGBM是由微軟亞洲研究院開發(fā)的一種基于決策樹算法的梯度提升框架,支持并行學(xué)習(xí),采用直方圖算法,節(jié)點(diǎn)分類不需要遍歷數(shù)據(jù),提高了速度;采用分裂增益最大的葉節(jié)點(diǎn)的方式(leaf-wise)而非基于層的增長(zhǎng)方式(levelwise),減少了不必要的分裂,降低了計(jì)算量,同時(shí)使用最大深度限制防止過(guò)擬合[14]。

交通方式識(shí)別模型中使用60個(gè)特征:5%~95%每5分位數(shù)的速度特征(19個(gè))、5%~95%每5分位數(shù)的加速度特征(19個(gè))、5%~95%每5分位數(shù)的角度轉(zhuǎn)變量(19個(gè))、停留率、速度轉(zhuǎn)變率、角度轉(zhuǎn)變率[15],各特征計(jì)算式如表3所示。

表3 交通方式特征計(jì)算公式Tab.3 Calculation formula for characteristics of transportation mode

GeoLife是微軟亞洲研究院提供的開源GNSS(Global Navigation Satellite System)軌跡數(shù)據(jù)集,收錄了2007年4月至2012年8月期間182位志愿者的移動(dòng)軌跡,其中65人標(biāo)注了各段軌跡的交通方式,包括步行、自行車、公交車、汽車、火車、地鐵、飛機(jī)等[16]。使用GeoLife數(shù)據(jù)集訓(xùn)練和評(píng)價(jià)LightGBM交通方式識(shí)別模型,并對(duì)訓(xùn)練好的LightGBM模型進(jìn)行5折交叉驗(yàn)證[17]來(lái)避免模型過(guò)擬合。

2.3 人群出行模式

2.3.1 出行時(shí)間模式

利用不同交通模式下的導(dǎo)航時(shí)間序列來(lái)分析導(dǎo)航人群的出行時(shí)間模式。以30min為間隔,分步行、非機(jī)動(dòng)車和機(jī)動(dòng)車3種交通方式,統(tǒng)計(jì)每個(gè)時(shí)間段內(nèi)總的導(dǎo)航軌跡數(shù)量,得到的時(shí)間序列代表導(dǎo)航出行時(shí)間模式。通過(guò)分析時(shí)間序列的峰值等特征時(shí)間,按照不同的交通方式分析周末和工作日的人群出行時(shí)間模式。

2.3.2 出行空間模式

利用不同交通模式下導(dǎo)航終點(diǎn)在城市空間中的熱點(diǎn)來(lái)分析導(dǎo)航人群的出行空間模式,使用核密度分析法來(lái)計(jì)算熱點(diǎn)。通過(guò)核密度分析法分析周末和工作日不同交通方式導(dǎo)航軌跡的空間模式,并結(jié)合高架路中心線、地鐵站出入口等輔助數(shù)據(jù)對(duì)熱點(diǎn)地區(qū)進(jìn)行識(shí)別??臻g模式分析流程如圖1所示。

圖1 導(dǎo)航軌跡空間模式分析流程Fig.1 Flowchart for analysis of navigation trajectory spatial pattern

2.3.3 出行距離模式

人群出行距離的分布反映了人群的活動(dòng)性,截?cái)鄡缏煞植际且环N概率分布模型,可以模擬導(dǎo)航軌跡的出行距離模式。

冪律分布屬于重尾分布(heavy-tail),其概率密度函數(shù)尾部的衰減比指數(shù)函數(shù)慢,在雙對(duì)數(shù)坐標(biāo)系下呈現(xiàn)為一條直線,被廣泛用于對(duì)人群活動(dòng)性建模。對(duì)于人類活動(dòng)性而言,雖然大部分人的活動(dòng)集中在小范圍內(nèi),但仍有一部分人會(huì)進(jìn)行長(zhǎng)距離的出行,例如去離家較遠(yuǎn)的機(jī)場(chǎng)、火車站、旅游景點(diǎn)等。對(duì)于城市內(nèi)部的活動(dòng)而言,人群的移動(dòng)受到出行時(shí)間、城市邊界的限制,移動(dòng)的距離不是無(wú)限的,而是在長(zhǎng)距離區(qū)間有更快的衰減速度[18],截?cái)鄡缏煞植己芎玫伢w現(xiàn)了這一特性。以往的研究使用指數(shù)截?cái)鄡缏煞植寄P驮谑謾C(jī)信令數(shù)據(jù)[19]、出租車軌跡數(shù)據(jù)上[20]擬合了這一現(xiàn)象,但區(qū)分交通方式的研究較少見。本文使用截?cái)鄡缏煞植及凑詹煌慕煌ǚ绞綄?duì)手機(jī)導(dǎo)航軌跡長(zhǎng)度d進(jìn)行擬合,如式(1):

式中:p為軌跡數(shù)據(jù)長(zhǎng)度服從的概率分布;d為軌跡數(shù)據(jù)長(zhǎng)度;α為截?cái)鄡缏煞植嫉南禂?shù);β為冪律分布的指數(shù)(形狀參數(shù));λ為指數(shù)衰減因子。

導(dǎo)航距離模式分析的流程如圖2所示。以100m為間隔,分別統(tǒng)計(jì)機(jī)動(dòng)車、步行、非機(jī)動(dòng)車軌跡長(zhǎng)度在各區(qū)間的比例,作為出行距離等于區(qū)間中點(diǎn)時(shí)的概率。對(duì)長(zhǎng)度超過(guò)1km的導(dǎo)航軌跡,分別用截?cái)鄡缏煞植嫉母怕拭芏群瘮?shù)進(jìn)行擬合。

圖2 導(dǎo)航距離模式分析流程Fig.2 Flowchart for analysis of navigation distance pattern

3 實(shí)驗(yàn)結(jié)果與討論

3.1 出行模式分類結(jié)果

使用GeoLife數(shù)據(jù)集訓(xùn)練LightGBM交通方式識(shí)別模型,并進(jìn)行5折交叉驗(yàn)證,模型在測(cè)試集上的平均準(zhǔn)確率為0.944±0.001。用調(diào)參后的模型對(duì)測(cè)試集進(jìn)行預(yù)測(cè),得到的混淆矩陣如表4所示。

表4 測(cè)試集預(yù)測(cè)結(jié)果Tab.4 Prediction results of test set

將訓(xùn)練好的模型應(yīng)用于實(shí)驗(yàn)導(dǎo)航數(shù)據(jù),并將識(shí)別出的交通方式附加到軌跡數(shù)據(jù)庫(kù)中的相應(yīng)軌跡上。以導(dǎo)航終止時(shí)間為標(biāo)準(zhǔn)進(jìn)行統(tǒng)計(jì),4天的軌跡總體情況如表5所示,總計(jì)軌跡數(shù)837萬(wàn)條,其中機(jī)動(dòng)車軌跡數(shù)417萬(wàn)條,步行軌跡數(shù)374萬(wàn)條,非機(jī)動(dòng)車軌跡數(shù)46萬(wàn)條。因?yàn)椴糠钟脩粼谝惶熘卸啻问褂脤?dǎo)航,從而導(dǎo)致軌跡總數(shù)顯著大于表2中的不同ID數(shù)。

3.2 上海市導(dǎo)航人群出行模式

3.2.1 出行時(shí)間模式

分機(jī)動(dòng)車、步行和非機(jī)動(dòng)車3種交通方式分析導(dǎo)航軌跡的時(shí)間模式,結(jié)果如圖3所示,圖中虛線代表的峰值等特征時(shí)間如表6所示,以11:00代表區(qū)間11:00—11:30,以此類推。

圖3 不同交通方式導(dǎo)航軌跡時(shí)間模式Fig.3 Navigation trajectory time pattern of different traffic modes

表6 導(dǎo)航特征時(shí)刻Tab.6 Feature time of navigation

3種導(dǎo)航方式的導(dǎo)航時(shí)間模式均呈現(xiàn)明顯的早高峰—午高峰——晚高峰周期性,峰值時(shí)間基本一致,但峰值的強(qiáng)弱存在明顯差異:機(jī)動(dòng)車工作日午高峰較強(qiáng),而步行、非機(jī)動(dòng)車早晚高峰較強(qiáng)。周末(9月16日、9月17日)與工作日(9月18日、9月19日)的峰值持續(xù)時(shí)間和峰值時(shí)間也有所不同。周末高峰持續(xù)時(shí)間為11:00到17:30,工作日高峰持續(xù)時(shí)間為8:30到18:00,周末高峰持續(xù)時(shí)間比工作日減少3h。周末第一峰值時(shí)間比工作日推遲約2.5h,可以看出周末導(dǎo)航用戶的生活節(jié)奏較為悠閑,上午出行高峰在11:00左右,而工作日則表現(xiàn)出通勤的特征,第一峰值時(shí)間在8:30左右。第二峰值在周末和工作日基本相同,分別出現(xiàn)在13:30到14:00,對(duì)應(yīng)午休結(jié)束后的出行量回升。第3峰值在周末和工作日也基本相同,分別出現(xiàn)在17:30到18:00,對(duì)應(yīng)外出就餐或通勤。轉(zhuǎn)折點(diǎn)出現(xiàn)在20:00左右,導(dǎo)航數(shù)量下降速度放緩,這一點(diǎn)在周末尤其明顯,可能與外出休閑娛樂(lè)有關(guān)。

3.2.2 出行空間分布模式

分步行、非機(jī)動(dòng)車和機(jī)動(dòng)車3種交通方式分析導(dǎo)航軌跡的出行空間分布模式。

3.2.2.1 機(jī)動(dòng)車軌跡空間模式

周末和工作日機(jī)動(dòng)車軌跡終點(diǎn)的核密度圖如圖4所示,圖中清晰呈現(xiàn)了路網(wǎng)的形狀,其熱點(diǎn)地區(qū)主要分為3種情況:

圖4 機(jī)動(dòng)車軌跡終點(diǎn)核密度Fig.4 Endpoint nuclear density map of motor vehicle trajectory

(1)高架道路。圖4的右下方小圖標(biāo)示了上海市區(qū)4條主要高架路(內(nèi)環(huán)高架、南北高架、延安高架、滬閔高架),與核密度圖中密度在2 000點(diǎn)·km-2以上的高密度帶狀區(qū)域重合。這一現(xiàn)象表明高架區(qū)域車流量大,路網(wǎng)較復(fù)雜,而引導(dǎo)標(biāo)志還不夠充足,有較多的用戶進(jìn)入高架區(qū)域后需要借助導(dǎo)航駕駛,或通過(guò)了高架區(qū)域的復(fù)雜路段后隨即關(guān)閉導(dǎo)航。除了高架區(qū)域以外,一些地面主要道路的交匯處也形成了熱點(diǎn)地區(qū),如圖中A5對(duì)應(yīng)的五角場(chǎng)區(qū)域是5條道路的交匯點(diǎn),A6、A7各對(duì)應(yīng)世紀(jì)大道—張楊路—東方路、衡山路—虹橋路—肇嘉浜路3條道路的交叉點(diǎn)。這些路口附近有眾多商業(yè)、商務(wù)場(chǎng)所,車流量大、空間構(gòu)造復(fù)雜,在此開啟導(dǎo)航和以此為目的地進(jìn)行導(dǎo)航的軌跡多。

(2)交通樞紐。圖4中B1、B2、B3分別對(duì)應(yīng)虹橋樞紐、浦東國(guó)際機(jī)場(chǎng)、上?;疖囌荆渲泻鐦驑屑~和浦東機(jī)場(chǎng)都在外環(huán)以外,離中心城區(qū)較遠(yuǎn),雖設(shè)有地鐵站,但駕車或乘出租車前往仍是一種主要的交通方式,因此軌跡終點(diǎn)密度高。

(3)隧道的出入口。圖4中C1、C2、C3分別對(duì)應(yīng)外灘隧道(3.3km,位于外灘地下)、延安東路隧道(2.3km,連通浦東和浦西)、上海長(zhǎng)江隧道(9.0km,連通浦東新區(qū)和崇明島)的一個(gè)出入口。這些隧道長(zhǎng)度較長(zhǎng)且車流量大,穿越隧道需要的時(shí)間超過(guò)軌跡分割的時(shí)間閾值,GNSS定位在車輛進(jìn)入隧道后中斷,導(dǎo)致駛?cè)胨淼狼暗淖詈笠粋€(gè)點(diǎn)被錯(cuò)誤地識(shí)別為軌跡終點(diǎn),并在隧道出入口處形成偽熱點(diǎn)區(qū)域。

相比周末熱點(diǎn),工作日熱點(diǎn)地區(qū)不包括A5五角場(chǎng),這是因?yàn)楣ぷ魅涨巴褰菆?chǎng)商圈娛樂(lè)的人相對(duì)減少。

3.2.2.2 步行軌跡空間模式

周末和工作日步行軌跡終點(diǎn)的空間分布如圖5所示。除五角場(chǎng)—江灣體育場(chǎng)站以外,密度超過(guò)10 000點(diǎn)·km-2的熱點(diǎn)地區(qū)都分布在內(nèi)環(huán)以內(nèi),比機(jī)動(dòng)車軌跡的熱點(diǎn)地區(qū)更加集中。外環(huán)以內(nèi)的熱點(diǎn)地區(qū)、外環(huán)以外密度相對(duì)較高的區(qū)域與地鐵站的分布吻合,這些地鐵站分別對(duì)應(yīng)交通樞紐(虹橋樞紐、上海火車站、上海南站)、旅游景點(diǎn)(七寶站)和熱門商圈(南京東路、靜安寺、徐家匯等),反映了大量用戶以這些地鐵站為目的地進(jìn)行導(dǎo)航,或在出了地鐵站后使用導(dǎo)航尋找附近場(chǎng)所的行為。

圖5 步行軌跡終點(diǎn)核密度Fig.5 Endpoint kernel density map of walking trajectory

這一現(xiàn)象表明地鐵是上海市交通系統(tǒng)的重要組成部分,大量用戶通過(guò)地鐵出行,地鐵站周圍形成了人流密集區(qū)域,在如圖5所示的15個(gè)熱點(diǎn)地鐵站出入口內(nèi)部的醒目位置需要增加指示牌和地圖,標(biāo)注附近主要設(shè)施(例如商場(chǎng)、景點(diǎn))的位置以及應(yīng)從哪個(gè)出站口出站;在上述地鐵站出入口附近的地面道路上、主要設(shè)施內(nèi)部也需要增加醒目的指示牌和地圖,便于需要乘地鐵的人群找到地鐵站出入口的位置。

工作日跨省外出、景區(qū)游玩和到市區(qū)娛樂(lè)的人減少,因此工作日虹橋樞紐(圖5中數(shù)字2)、上海南站(數(shù)字3)、蓮花路站(數(shù)字13,蓮花路站是閔行區(qū)連接市區(qū)的第一樞紐)和七寶站(數(shù)字15,七寶站是商圈站)等區(qū)域的熱度顯著低于周末。

3.2.2.3 非機(jī)動(dòng)車軌跡空間模式

周末和工作日非機(jī)動(dòng)車軌跡終點(diǎn)的空間分布與步行軌跡類似,集中在內(nèi)環(huán)以內(nèi)的地鐵站附近和商務(wù)樓宇密布的地區(qū),如圖6所示。這一結(jié)果表明,圖中14個(gè)熱點(diǎn)地鐵站是很多非機(jī)動(dòng)車用戶的目的地,因此地鐵站出入口附近需要增加非機(jī)動(dòng)車停放位;同時(shí)由上面對(duì)非機(jī)動(dòng)車軌跡時(shí)間模式的分析可知,工作日的高峰期出現(xiàn)在早晚通勤時(shí)段,因此上述地鐵站在通勤時(shí)段需要加強(qiáng)共享單車的調(diào)度管理。

圖6 非機(jī)動(dòng)車軌跡終點(diǎn)核密度Fig.6 Endpoint kernel density map of non-motor vehicle trajectory

相比周末,工作日熱點(diǎn)地區(qū)不包括五角場(chǎng)站(圖6中數(shù)字10)—江灣體育場(chǎng)站和金沙江路站(數(shù)字13,金沙江路站是商圈站點(diǎn)),這是因?yàn)楣ぷ魅涨巴倘Φ娜讼鄬?duì)減少。

3.2.3 出行距離模式

使用截?cái)鄡缏煞植紨M合3種交通方式的導(dǎo)航軌跡,軌跡長(zhǎng)度的概率密度分布散點(diǎn)圖和擬合結(jié)果如圖7、表7所示,R2均超過(guò)0.998,擬合效果較好。機(jī)動(dòng)車軌跡超過(guò)30km和步行軌跡超過(guò)10km的部分概率密度分布的衰減速度變大,表現(xiàn)出指數(shù)衰減的特征。

圖7 軌跡長(zhǎng)度的概率密度分布散點(diǎn)圖與擬合效果Fig.7 Scatter plots of probability density distribution of trajectory lengths with fitting effects

表7 各類軌跡長(zhǎng)度分布的截?cái)鄡缏煞植紨M合參數(shù)Tab.7 Truncated power-law distribution fitting parameters for each type of trajectory length distribution

4 結(jié)論

首先基于LightGBM模型構(gòu)建了軌跡數(shù)據(jù)的交通方式分類模型,并在GeoLife測(cè)試集上取得了0.944±0.001的準(zhǔn)確率。隨后,該模型被應(yīng)用到上海市數(shù)百萬(wàn)人口的手機(jī)導(dǎo)航軌跡數(shù)據(jù)上,實(shí)現(xiàn)了機(jī)動(dòng)車、非機(jī)動(dòng)車和步行的導(dǎo)航軌跡分類。最后,進(jìn)一步分析了不同交通方式的導(dǎo)航軌跡數(shù)據(jù)在時(shí)間、空間和距離上的分布,并得到了以下結(jié)論:

(1)機(jī)動(dòng)車、步行、非機(jī)動(dòng)車3種交通方式的時(shí)間模式均表現(xiàn)出早高峰—午高峰—晚高峰周期性,出行方式主要以機(jī)動(dòng)車和步行為主,并且周末出行高峰持續(xù)時(shí)間比工作日少3h,且周末的早高峰較工作日要晚2.5h,體現(xiàn)出周末導(dǎo)航出行高峰與工作日相比存在一定的滯后性。

(2)在出行空間模式方面,相比工作日,周末熱點(diǎn)地區(qū)核密度更高、熱點(diǎn)區(qū)域更多。機(jī)動(dòng)車軌跡熱點(diǎn)的分布與步行、非機(jī)動(dòng)車軌跡有較大差異,機(jī)動(dòng)車軌跡受路網(wǎng)的影響更大,熱點(diǎn)地區(qū)出現(xiàn)在主要道路、交通樞紐、隧道出口;步行軌跡熱點(diǎn)地區(qū)與地鐵站吻合;非機(jī)動(dòng)車熱點(diǎn)地區(qū)與步行的分布類似。導(dǎo)航軌跡終點(diǎn)的空間熱點(diǎn)提取結(jié)果可以為城市規(guī)劃提供理論依據(jù),熱點(diǎn)高架區(qū)域需要增加引導(dǎo)標(biāo)志和路網(wǎng)示意圖,熱點(diǎn)地鐵站出入口內(nèi)外需要在醒目處增加周邊主要設(shè)施位置和地鐵出入口位置的指示牌,出入口附近的地面上需要增加非機(jī)動(dòng)車停放位并且在早晚通勤時(shí)段加強(qiáng)共享單車的調(diào)度和管理。

(3)3種交通方式的軌跡都可以用截?cái)鄡缏煞植驾^好地?cái)M合,導(dǎo)航出行以中短距離為主,概率密度函數(shù)按照近似于冪函數(shù)的速度衰減,同時(shí)有一部分用戶會(huì)進(jìn)行長(zhǎng)距離的導(dǎo)航,但在長(zhǎng)距離出行區(qū)間概率密度函數(shù)衰減更快,近似于指數(shù)函數(shù)。

作者貢獻(xiàn)聲明:

吳杭彬:提出研究思路、設(shè)計(jì)研究方案、論文結(jié)構(gòu)把控及修改。

陳茜茜:實(shí)驗(yàn)分析、論文撰寫。

靳慧玲:數(shù)據(jù)預(yù)處理、協(xié)助實(shí)驗(yàn)。

傅 ?。簲?shù)據(jù)預(yù)處理、協(xié)助實(shí)驗(yàn)。

黃 煒:實(shí)驗(yàn)與論文撰寫指導(dǎo)。

劉 春:實(shí)驗(yàn)與論文撰寫指導(dǎo)。

猜你喜歡
冪律工作日步行
步行回家
攀山擅離步行道自拍,不幸墜落身亡誰(shuí)擔(dān)責(zé)?
從步行到奔跑
四川地區(qū)降水冪律指數(shù)研究
冪律流底泥的質(zhì)量輸移和流場(chǎng)
對(duì)抗冪律
以前的交通工具和未來(lái)的交通工具
大灰狼(2013年1期)2013-03-01 07:19:14
對(duì)《資本論》中工作日問(wèn)題的哲學(xué)思考
商(2012年14期)2013-01-07 07:46:16
基于Fibonacci法求冪律模式流變參數(shù)最優(yōu)值
斷塊油氣田(2012年6期)2012-03-25 09:53:59
鄭州局辦理業(yè)務(wù)全程提速
社旗县| 肃南| 襄樊市| 东兰县| 韶山市| 湘潭市| 塘沽区| 资兴市| 措勤县| 突泉县| 遂宁市| 岳普湖县| 黔西县| 盘山县| 四平市| 柘荣县| 稻城县| 深泽县| 高尔夫| 临洮县| 连山| 宽城| 永昌县| 阳泉市| 长阳| 汉川市| 锡林郭勒盟| 漳平市| 高雄县| 临夏市| 分宜县| 买车| 建瓯市| 大英县| 阿图什市| 洛宁县| 河津市| 新余市| 周宁县| 卢湾区| 葫芦岛市|