国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于美團(tuán)外賣POI的城市餐飲業(yè)的空間熱點(diǎn)分析
——以南昌市為例

2020-03-13 04:07楊舒波張忠海
江西科學(xué) 2020年1期
關(guān)鍵詞:爬蟲南昌市店鋪

夏 宇,楊舒波,張忠海

(1.江西師范大學(xué)地理與環(huán)境學(xué)院,330022,南昌;2.江西師范大學(xué)鄱陽湖濕地與流域研究教育部重點(diǎn)實(shí)驗(yàn)室,330022,南昌)

0 引言

興趣點(diǎn)(Point of Interest POI)數(shù)據(jù)是一種包含了空間信息和屬性信息的空間數(shù)據(jù)源。POI數(shù)據(jù)由于與生活密切相關(guān),通過研究POI的分布特征可以反映出城市人口、商業(yè)等的布局特征。吳康敏[1]等利用廣州市核心區(qū)域不同類型的POI數(shù)據(jù),利用核密度分析、統(tǒng)計(jì)分析、最近鄰距離分析方法來識(shí)別不同類型的商業(yè)中心的邊界,并探索商業(yè)空間結(jié)構(gòu)和模式。許澤寧[2]利用電子地圖興趣點(diǎn)來提取城市建成區(qū),高曉路[3]等利用POI的核密度等值線來提取城市群邊界。段亞明[4]等利用POI數(shù)據(jù)來識(shí)別重慶城區(qū)的多個(gè)中心。這些研究表明POI數(shù)據(jù)對(duì)研究城市空間特征有重要意義。外賣店鋪?zhàn)鳛橐活愔匾腜OI數(shù)據(jù),伴隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展而成長(zhǎng)。目前,我國(guó)在線餐飲外賣用戶規(guī)模突破3億。其中21-35歲年齡段的人最多,占了73.04%,年輕人是網(wǎng)絡(luò)訂餐的主力消費(fèi)人群。文獻(xiàn)[5]指出研究餐飲業(yè)店鋪分布可以發(fā)現(xiàn)城市人口的分布特征與經(jīng)濟(jì)重心,餐飲業(yè)的合理化布局對(duì)發(fā)展城市經(jīng)濟(jì)、滿足居民需求發(fā)揮著重要作用。研究外賣行業(yè)的布局特征有重要研究意義。

POI數(shù)據(jù)的獲取方式分為3類,第1類是利用地圖服務(wù)商提供的接口獲取指定區(qū)域的POI數(shù)據(jù),如曾璇[6]等利用高德地圖開放的API爬取并篩選2015年海珠區(qū)POI數(shù)據(jù),戚榮昊[7]等通過百度地圖獲取POI數(shù)據(jù)。第2類是使用社交媒體的位置簽到數(shù)據(jù)來獲取POI數(shù)據(jù),丁娟[8]等利用照片中的地理位置坐標(biāo)信息,采用DBScan聚類分析方法,計(jì)算中國(guó)入境游客地理興趣點(diǎn)(POI),胡慶武[9]等通過微博簽到數(shù)據(jù)來探索城市熱點(diǎn)與商圈,并指出眾源地理數(shù)據(jù)為空間數(shù)據(jù)挖掘提供了一個(gè)新的研究方向。第3類是O2O上的POI數(shù)據(jù),文獻(xiàn)[10]利用爬蟲采集了北京大上地區(qū)大眾點(diǎn)評(píng)數(shù)據(jù)來研究城市商業(yè)服務(wù)設(shè)施的發(fā)展規(guī)律。并指出傳統(tǒng)由工商部門或商業(yè)采集的POI數(shù)據(jù)受采集周期的影響,存在樣本量不足的、實(shí)效性差等缺點(diǎn)。第2、第3類作為眾包地理數(shù)據(jù)源,具有更新快、數(shù)據(jù)量大、實(shí)效性高的優(yōu)點(diǎn)。

美團(tuán)外賣的店鋪數(shù)據(jù)相對(duì)于大眾點(diǎn)評(píng)的POI數(shù)據(jù)具有銷量、價(jià)格等經(jīng)濟(jì)屬性,由于使用量大,店鋪POI信息更新速度相對(duì)更快,對(duì)研究餐飲行業(yè)的布局特征和發(fā)展?fàn)顩r有重要意義,本文利用網(wǎng)絡(luò)爬蟲獲取美團(tuán)外賣在南昌市的店鋪POI數(shù)據(jù),并利用核密度方法和統(tǒng)計(jì)方法來研究外賣店鋪POI的布局特征??梢詾椴惋嬓袠I(yè)的商業(yè)選址提供指導(dǎo)意義,同時(shí)為從業(yè)人員提供銷量分布特征,為相關(guān)決策提供參考。

1 外賣店鋪POI的獲取和預(yù)處理

1.1 研究范圍

南昌市是長(zhǎng)江中游城市群中心城市之一、環(huán)鄱陽湖城市群核心城市,經(jīng)濟(jì)發(fā)展處在全國(guó)前列,有較強(qiáng)的代表性。2018年常住人口541.74萬,城市建成區(qū)358.90 km2。本文將南昌市繞城高速所包圍的區(qū)域作為主要的研究區(qū)域,主要包含東湖、西湖、青云譜、灣里、青山湖、新建區(qū)等部分區(qū)域,涵蓋南昌市主要建成區(qū)范圍(圖1)。

圖1 南昌市繞城高速行政區(qū)劃

1.2 面向網(wǎng)絡(luò)接口的網(wǎng)絡(luò)爬蟲

網(wǎng)絡(luò)爬蟲是一種自動(dòng)抓取網(wǎng)頁內(nèi)容的程序,傳統(tǒng)的網(wǎng)絡(luò)爬蟲通過解析html文檔[11],將有用的數(shù)據(jù)提取出來。隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,產(chǎn)生了一些超級(jí)應(yīng)用,這些應(yīng)用成了一個(gè)個(gè)信息孤島,這些應(yīng)用的數(shù)據(jù)無法通過搜索引擎來獲取,也無法通過解析html的方式爬取數(shù)據(jù),但這些應(yīng)用也是通過http和后臺(tái)交互,通過獲取關(guān)鍵接口,構(gòu)造請(qǐng)求參數(shù),模擬應(yīng)用請(qǐng)求,也可以持續(xù)不斷地將特定的數(shù)據(jù)抓取下來[12-13]。當(dāng)前的數(shù)據(jù)格式主要為JSON,JSON(JavaScript Object Notation)是一種輕量級(jí)的數(shù)據(jù)交換格式。它基于ECMAScript的一個(gè)子集,采用完全獨(dú)立于編程語言的文本格式來存儲(chǔ)和表示數(shù)據(jù)。在JS語言中,一切都是對(duì)象。因此,任何支持的類型都可以通過JSON來表示,例如字符串、數(shù)字、對(duì)象、數(shù)組等。但是對(duì)象和數(shù)組是比較特殊且常用的2種類型:對(duì)象表示為鍵值對(duì)、數(shù)據(jù)由逗號(hào)分隔、花括號(hào)保存對(duì)象、方括號(hào)保存數(shù)組。

本文爬蟲的過程如圖2所示,通過瀏覽器訪問美團(tuán)外賣(http://h5.waimai.meituan.com/waimai/min dex/home),并打開調(diào)試工具,通過加載數(shù)據(jù)來獲取店鋪列表的接口(http://i.waimai.meituan.com/openh5/homepag e/poilist),并讀取cookie和header數(shù)據(jù)記錄下來,通過模擬請(qǐng)求的方式來獲取接口的數(shù)據(jù)。本文將南昌市0.1度×0.1度的格網(wǎng),在每個(gè)節(jié)點(diǎn)最多請(qǐng)求10次接口,每次間隔20 s,以防止ip地址被封閉,將請(qǐng)求到的json數(shù)據(jù)(圖3)解析并存放到數(shù)據(jù)庫中,由于美團(tuán)對(duì)數(shù)字進(jìn)行了加密,且同一個(gè)數(shù)字對(duì)應(yīng)的字符串相同,通過目視解密,在存進(jìn)數(shù)據(jù)庫前,將加密字符替換成對(duì)應(yīng)的值。

圖2 爬蟲處理流程圖

圖3 接口返回?cái)?shù)據(jù)

由于這個(gè)接口沒用帶經(jīng)緯度數(shù)據(jù),本文通過高德地圖web服務(wù)和百度地圖web服務(wù)將文字地址轉(zhuǎn)換成經(jīng)緯度,再將坐標(biāo)系統(tǒng)一轉(zhuǎn)換成wgs84坐標(biāo)系,并分別制作核密度圖(圖4),從圖4中可以看出百度地圖文字轉(zhuǎn)經(jīng)緯度的核密度圖存在2個(gè)密度值非常高的點(diǎn),導(dǎo)致這2個(gè)點(diǎn)的周圍的密度呈圓圈分別,造成這種現(xiàn)象的原因是百度地圖將多個(gè)不同的地址解析在一個(gè)經(jīng)緯度上,而高德地圖解析出來的經(jīng)緯度則不存在這個(gè)規(guī)矩的形狀,通過以上判斷可以說明高德地圖的地址解析更好,所以最終本文采用高德web服務(wù)。

圖4 不同地址解析結(jié)果核密度估計(jì)值圖

2 基于核密度估計(jì)的餐飲外賣分布熱點(diǎn)

核密度估計(jì)方法是一種適合于連續(xù)性現(xiàn)象的密度估計(jì)方法,如城市設(shè)施服務(wù)影響,交通路段風(fēng)險(xiǎn)評(píng)估等[14]。核密度的計(jì)算公式如下:

式中:f(s)為位置s處的核密度計(jì)算函數(shù);h為距離閾值;n為到位置s的距離小于或等于h的店鋪數(shù)量;k函數(shù)則表示權(quán)重函數(shù)。這一公式表明密度值在每個(gè)店鋪ci處最大,與ci相距h時(shí)密度值為零。核密度函數(shù)存在權(quán)重函數(shù)k與距離閾值h 2個(gè)關(guān)鍵參量。常用的權(quán)重計(jì)算函數(shù)有高斯方程、四次方程、副指數(shù)方程、最小方差方程等。研究表明權(quán)重函數(shù)的選擇對(duì)結(jié)果的影響不大,距離閾值的選擇對(duì)結(jié)果的影響較大。根據(jù)實(shí)際經(jīng)驗(yàn),h值越大,密度表面越光滑,熱點(diǎn)區(qū)域越容易被覆蓋;h值越小,得到的密度表面變化越突兀,局部的特征會(huì)更明顯,而整體關(guān)聯(lián)性減弱,使得熱點(diǎn)區(qū)域過于分散。本文選擇500 m、1 000 m、1 500 m、2 000 m為搜索帶寬進(jìn)行實(shí)驗(yàn),結(jié)果如圖5所示??梢钥闯?,隨著帶寬的增加熱點(diǎn)區(qū)域的個(gè)數(shù)在減小,熱點(diǎn)區(qū)域越來越集中,且密度表面越來越趨向于光滑,在4種帶寬中h=1 000效果比較理想,在反映餐飲分布的整體趨勢(shì)的同時(shí),也能夠較好地呈現(xiàn)局部的熱點(diǎn)區(qū)域信息。因此本文選用帶寬為1 000 m為核密度估計(jì)的搜索帶寬。

3 結(jié)果與分析

3.1 外賣熱點(diǎn)分布特征

圖5 不同帶寬下的核密度估計(jì)結(jié)果

本文通過爬蟲爬取到4 363條數(shù)據(jù),這些店鋪分布如圖6所示。這些店鋪整體分布還是比較均勻,適合用來分析南昌市外賣POI布局特征,其核密度如圖7所示。從圖7中可以看出,外賣餐飲的分布特征在整體上呈現(xiàn)由中心向外圍密度逐漸減小的趨勢(shì);從局部熱點(diǎn)來看,其熱點(diǎn)區(qū)域主要分布在老福山、八一廣場(chǎng)、西湖區(qū)、孺子路、萬達(dá)廣場(chǎng)、紅谷灘、瑤湖等,其中老福山、八一廣場(chǎng)、孺子路、萬達(dá)廣場(chǎng)、紅谷灘等作為城市的商業(yè)中心,人流量大,年輕人多,年輕人作為外賣的主力軍,導(dǎo)致這些區(qū)域的店鋪密度特別高,而瑤湖周邊有若干所大學(xué)分布,大量的學(xué)生對(duì)外賣的需求也比較大,所以瑤湖的店鋪密度也特別高,這說明餐飲行業(yè)作為基礎(chǔ)服務(wù)設(shè)施,它的熱點(diǎn)區(qū)域分布與人口分布有很大的重合性,人口越密集的地方對(duì)食品的需求越大,同時(shí)年輕人多的地方,店鋪的分布也比較密集。

圖6 外賣店鋪分布范圍

圖7 外賣店鋪的核密度估計(jì)結(jié)果

3.2 外賣銷量的分布特征

本文按照月銷量0~199、200~999、1 000~3 999、4 000~9 999分為低、較低、較高、高4類,其分布如圖8所示,數(shù)量如圖9所示,月銷量小于200份的店鋪占了一半以上,這可以說明對(duì)大部分店鋪而言,外賣只是增加了一種他們的銷售方式,無法依靠外賣獨(dú)立經(jīng)營(yíng),他們更多的還是依賴傳統(tǒng)的銷售方式生存。從不同銷量的店鋪分布圖來看,外賣銷量的分布特征為銷量從低到高的店鋪分布越來越集中,銷量大于4 000的店鋪大部分都分布在核密度為深色的區(qū)域,在這些區(qū)域周邊存在著大量的店鋪,競(jìng)爭(zhēng)大,同時(shí)這些區(qū)域人流密集,需求旺盛,回報(bào)也大。外賣店鋪的分布密度對(duì)店鋪選址等有著重要的指導(dǎo)意義。

圖8 不同銷量類別的店鋪分布結(jié)果

3.3 外賣銷量與核密度估計(jì)值的相關(guān)性

利用arcgis的空間分析值提取到點(diǎn)工具將核密度估計(jì)值提取到店鋪上,本文按銷量每個(gè)1 000將銷量分為9種類型,并計(jì)算平均核密度值,結(jié)果如圖10所示。從圖10中可以看出,不同銷量的核密度平均值呈現(xiàn)出先升后降再上升的趨勢(shì),當(dāng)銷量低于4 000時(shí),店鋪的銷量越高,店鋪所在的地方核密度值越高,銷量在4 000~8 000,隨著銷量的增加,店鋪所在地方的核密度值先持平后稍微下降一段,當(dāng)銷量高于8 000核密度值又變大了。這表明當(dāng)銷量較低時(shí)周圍店鋪越多越有利于店鋪的銷售,這個(gè)時(shí)候這里的競(jìng)爭(zhēng)還不充分,當(dāng)銷量達(dá)到中等銷量的時(shí)候周圍店鋪的存在反而會(huì)降低自己的銷量,此時(shí)這個(gè)地方存在過度競(jìng)爭(zhēng)的趨勢(shì)。而對(duì)于銷量最好的商家而言,周圍店鋪越多自身的銷量越好,表明這些店鋪對(duì)周圍店鋪具有競(jìng)爭(zhēng)優(yōu)勢(shì)。

圖9 店鋪類別數(shù)量和占比

圖10 不同銷量的店鋪平均核密度值

4 結(jié)論

本文通過爬蟲爬取美團(tuán)外賣在南昌市的店鋪POI數(shù)據(jù)4 363條數(shù)據(jù),外賣店鋪數(shù)據(jù)具有實(shí)時(shí)更新,具有經(jīng)濟(jì)屬性等特點(diǎn),利用核密度方法研究了南昌市外賣店鋪POI在南昌市的集聚特征,得到如下主要結(jié)論。

1)外賣店鋪在南昌市的分布呈現(xiàn)出由市中心向周邊逐漸減小的趨勢(shì),外賣店鋪分布熱點(diǎn)主要分布在老福山、八一廣場(chǎng)、西湖區(qū)、孺子路、萬達(dá)廣場(chǎng)、紅谷灘、瑤湖等商業(yè)中心或大學(xué)城附近。這對(duì)餐飲行業(yè)的商業(yè)選址具有指導(dǎo)意義。

2)南昌市外賣店鋪60%店鋪月銷量低于200,大部分店鋪無法依賴外賣平臺(tái)生存下來,銷量高于4 000的店鋪大部分都分布在店鋪密集區(qū)域。這表明南昌市的外賣行業(yè)還有很大的發(fā)展?jié)撡|(zhì)。

3)對(duì)低銷量和高銷量的店鋪而言周圍的店鋪越多,越有利于提高銷量;而對(duì)于中等銷量的店鋪而言,周圍店鋪的增多對(duì)銷量起著抑制的作用。這對(duì)外賣從業(yè)人員提高銷量提供了一個(gè)選擇的思路。

猜你喜歡
爬蟲南昌市店鋪
利用網(wǎng)絡(luò)爬蟲技術(shù)驗(yàn)證房地產(chǎn)灰犀牛之說
模擬成真
老店鋪雜事
江西南昌市1169個(gè)建制村實(shí)現(xiàn)通客車
基于Python的網(wǎng)絡(luò)爬蟲和反爬蟲技術(shù)研究
考了個(gè)大的
蘇軾的店鋪
吃兩個(gè)
大數(shù)據(jù)背景下校園輿情的爬蟲應(yīng)用研究
大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲技術(shù)