国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

結(jié)合微博數(shù)據(jù)挖掘的城市群時(shí)空特征

2017-11-09 11:50董飛
電子技術(shù)與軟件工程 2017年19期
關(guān)鍵詞:斷裂點(diǎn)新浪微博

董飛

摘 要結(jié)合新浪微博數(shù)據(jù),利用重力模型,以珠三角城市群為例,獲取 2009年以及2013年珠三角城市群各城市之間的微博數(shù)據(jù)進(jìn)行挖掘,測(cè)算兩個(gè)年份珠三角城市群城市之間的聯(lián)系強(qiáng)度,結(jié)果表明,隨著時(shí)間的演進(jìn),珠三角城市群各個(gè)城市之間的聯(lián)系在加強(qiáng)。

【關(guān)鍵詞】新浪微博 重力模型 聯(lián)系強(qiáng)度 斷裂點(diǎn)

1 緒論

當(dāng)前,我國(guó)進(jìn)入了快速城鎮(zhèn)化的時(shí)期,從而形成了多個(gè)城市群,城市群是指在城市化過(guò)程中,特定地域范圍內(nèi),若干不同類(lèi)型和等級(jí)規(guī)模的城市基于區(qū)域經(jīng)濟(jì)發(fā)展和市場(chǎng)聯(lián)系而形成的城市網(wǎng)絡(luò)群體。以往的城市群網(wǎng)絡(luò)研究主要基于傳統(tǒng)數(shù)據(jù)展開(kāi),如路旭等通過(guò)對(duì)高級(jí)生產(chǎn)者服務(wù)業(yè)布局研究珠三角城市網(wǎng)絡(luò)的空間格局,唐子來(lái)等從交通等基礎(chǔ)設(shè)施流角度切入研究長(zhǎng)三角的城市體系演化,這些研究多基于統(tǒng)計(jì)數(shù)據(jù),往往存在時(shí)間滯后或統(tǒng)計(jì)口徑不一等缺陷,本研究借助海量社交網(wǎng)絡(luò)數(shù)據(jù),采用重力模型,以珠三角城市群為例,測(cè)算2009年及2013年內(nèi)部城市之間的聯(lián)系強(qiáng)度,分析時(shí)序變化反映的城市群演進(jìn)趨勢(shì),并計(jì)算2013年廣州同其他珠三角城市的斷裂點(diǎn),從而驗(yàn)證微博數(shù)據(jù)的合理性和其具有豐富的內(nèi)涵。

2 數(shù)據(jù)獲取

微博是社交網(wǎng)絡(luò)的典型應(yīng)用,本研究所使用的數(shù)據(jù)是通過(guò)新浪微博開(kāi)放平臺(tái)獲得的,首先進(jìn)入平臺(tái)進(jìn)行微博開(kāi)發(fā)者注冊(cè),接著向新浪微博提交成為開(kāi)發(fā)者申請(qǐng),待申請(qǐng)通過(guò)后會(huì)得到一個(gè)密鑰。數(shù)據(jù)的獲取是基于申請(qǐng)成功得到的密鑰以及調(diào)用新浪微博開(kāi)發(fā)平臺(tái)提供的API接口。由于API接口返回的是json結(jié)果,所以還需對(duì)結(jié)果進(jìn)行抽取并進(jìn)行數(shù)據(jù)清洗,形成可用的數(shù)據(jù)結(jié)果。

3 重力模型及阻尼系數(shù)

重力模型最初來(lái)源于物理學(xué)萬(wàn)有引力定律在空間相互作用理論研究中的應(yīng)用,反映了地理學(xué)的第一定律,即地理事物以及其屬性在空間位置關(guān)系上是有聯(lián)系的,并且這種聯(lián)系隨著距離的增加會(huì)衰減。很多地理學(xué)家將重力模型應(yīng)用在地理實(shí)體空間關(guān)系的研究中,實(shí)體空間關(guān)系的研究中,重力模型的理論認(rèn)為:地理實(shí)體是具有質(zhì)量的,地理實(shí)體之間也存在相互的作用力,地理實(shí)體間質(zhì)量乘積越大,空間距離越小,相互的吸引力也就越大,其中質(zhì)量是地理實(shí)體自身實(shí)力的體現(xiàn)。

重力模型的一個(gè)重要應(yīng)用是計(jì)算最適阻尼系數(shù),β取從0到1范圍內(nèi)多個(gè)值,通過(guò)線性函數(shù)相關(guān)系數(shù)R2的大小得到最適的β。

4 珠三角城市群最適阻尼系數(shù)測(cè)算

利用新浪微博獲取的數(shù)據(jù),借助重力模型,以城市總的社交入向通量作為城市質(zhì)量,兩個(gè)城市之間的總社交通量作為實(shí)際的相互吸引力,β分別取0、0.2、0.4、0.6、0.8、1,分別計(jì)算2009年以及2013年兩個(gè)年份珠三角城市群最適阻尼系數(shù),得到圖1。

從圖1中可以直觀地看到,2009年當(dāng)β=0.6時(shí),重力模型線性擬合的相關(guān)系數(shù)最大,2013年當(dāng)β=0時(shí),重力模型線性擬合的相關(guān)系數(shù)最大。從β值的變化可以看出2009年到2013年珠三角城市群城市之間的聯(lián)系越來(lái)越多,城市群的發(fā)展速度也越來(lái)越快。

5 結(jié)論與討論

本文利用微博數(shù)據(jù),結(jié)合重力模型,分別測(cè)算2009年及2013年兩個(gè)年份珠三角城市群的城市聯(lián)系強(qiáng)度,結(jié)果表明,隨著時(shí)間的演進(jìn),珠三角城市群城市之間的聯(lián)系在加強(qiáng)。

由于微博數(shù)據(jù)本身數(shù)據(jù)量很大,并且存在很多不真實(shí)的數(shù)據(jù),從技術(shù)角度講,比較難完全過(guò)濾掉噪音數(shù)據(jù)以及不真實(shí)數(shù)據(jù),這也是微博數(shù)據(jù)利用面臨的一個(gè)比較大的問(wèn)題,所以獲取到的微博數(shù)據(jù)會(huì)包含不真實(shí)的數(shù)據(jù)以及雜質(zhì)信息,基于微博數(shù)據(jù)挖掘會(huì)有一定的誤差。隨著網(wǎng)絡(luò)數(shù)據(jù)獲取技術(shù)的提高,未來(lái)能夠獲得更準(zhǔn)確的數(shù)據(jù)。那么挖掘、分析的結(jié)果會(huì)更加理想。

參考文獻(xiàn)

[1]Kwan,M.P.(2007)."Mobile Communications, Social Networks, and Urban Travel: Hypertext as a New Metaphor for Conceptualizing Spatial Interaction *."Professional Geographer ,2007,59(04):434-446.

[2]Libennowell, D., et al. (2005). "Geographic routing in social networks.(COMPUTER SCIENCES: SOCIAL SCIENCES)(Author Abstract).",2005.

[3]Cui,A.X.,et al.(2012)."Emergence of Scale-Free Close-Knit Friendship Structure in Online Social Networks." Plos One 7(07):e50702,2012.

[4]Camagni,R.P.(1993).From City Hierarchy to City Network:Reflections about an Emerging Paradigm,Springer Berlin Heidelberg,1993.

作者單位

廣州海洋地質(zhì)調(diào)查局 廣東省廣州市 510760

猜你喜歡
斷裂點(diǎn)新浪微博
染色體平衡易位斷裂點(diǎn)與男性不育關(guān)系探討
某三代核電廠電氣廠房外側(cè)至常規(guī)島主蒸汽及主給水管道斷裂防護(hù)設(shè)計(jì)研究
基于斷裂點(diǎn)理論對(duì)武漢城市圈中心城市影響范圍的測(cè)算
社交媒體平臺(tái)醫(yī)患關(guān)系報(bào)道特點(diǎn)研究
斷裂點(diǎn)位置對(duì)GIS中無(wú)拓?fù)溟]曲線簡(jiǎn)化的影響
基于斷裂點(diǎn)模型的可持續(xù)發(fā)展輻射效應(yīng)研究