董飛
摘 要結(jié)合新浪微博數(shù)據(jù),利用重力模型,以珠三角城市群為例,獲取 2009年以及2013年珠三角城市群各城市之間的微博數(shù)據(jù)進(jìn)行挖掘,測(cè)算兩個(gè)年份珠三角城市群城市之間的聯(lián)系強(qiáng)度,結(jié)果表明,隨著時(shí)間的演進(jìn),珠三角城市群各個(gè)城市之間的聯(lián)系在加強(qiáng)。
【關(guān)鍵詞】新浪微博 重力模型 聯(lián)系強(qiáng)度 斷裂點(diǎn)
1 緒論
當(dāng)前,我國(guó)進(jìn)入了快速城鎮(zhèn)化的時(shí)期,從而形成了多個(gè)城市群,城市群是指在城市化過(guò)程中,特定地域范圍內(nèi),若干不同類(lèi)型和等級(jí)規(guī)模的城市基于區(qū)域經(jīng)濟(jì)發(fā)展和市場(chǎng)聯(lián)系而形成的城市網(wǎng)絡(luò)群體。以往的城市群網(wǎng)絡(luò)研究主要基于傳統(tǒng)數(shù)據(jù)展開(kāi),如路旭等通過(guò)對(duì)高級(jí)生產(chǎn)者服務(wù)業(yè)布局研究珠三角城市網(wǎng)絡(luò)的空間格局,唐子來(lái)等從交通等基礎(chǔ)設(shè)施流角度切入研究長(zhǎng)三角的城市體系演化,這些研究多基于統(tǒng)計(jì)數(shù)據(jù),往往存在時(shí)間滯后或統(tǒng)計(jì)口徑不一等缺陷,本研究借助海量社交網(wǎng)絡(luò)數(shù)據(jù),采用重力模型,以珠三角城市群為例,測(cè)算2009年及2013年內(nèi)部城市之間的聯(lián)系強(qiáng)度,分析時(shí)序變化反映的城市群演進(jìn)趨勢(shì),并計(jì)算2013年廣州同其他珠三角城市的斷裂點(diǎn),從而驗(yàn)證微博數(shù)據(jù)的合理性和其具有豐富的內(nèi)涵。
2 數(shù)據(jù)獲取
微博是社交網(wǎng)絡(luò)的典型應(yīng)用,本研究所使用的數(shù)據(jù)是通過(guò)新浪微博開(kāi)放平臺(tái)獲得的,首先進(jìn)入平臺(tái)進(jìn)行微博開(kāi)發(fā)者注冊(cè),接著向新浪微博提交成為開(kāi)發(fā)者申請(qǐng),待申請(qǐng)通過(guò)后會(huì)得到一個(gè)密鑰。數(shù)據(jù)的獲取是基于申請(qǐng)成功得到的密鑰以及調(diào)用新浪微博開(kāi)發(fā)平臺(tái)提供的API接口。由于API接口返回的是json結(jié)果,所以還需對(duì)結(jié)果進(jìn)行抽取并進(jìn)行數(shù)據(jù)清洗,形成可用的數(shù)據(jù)結(jié)果。
3 重力模型及阻尼系數(shù)
重力模型最初來(lái)源于物理學(xué)萬(wàn)有引力定律在空間相互作用理論研究中的應(yīng)用,反映了地理學(xué)的第一定律,即地理事物以及其屬性在空間位置關(guān)系上是有聯(lián)系的,并且這種聯(lián)系隨著距離的增加會(huì)衰減。很多地理學(xué)家將重力模型應(yīng)用在地理實(shí)體空間關(guān)系的研究中,實(shí)體空間關(guān)系的研究中,重力模型的理論認(rèn)為:地理實(shí)體是具有質(zhì)量的,地理實(shí)體之間也存在相互的作用力,地理實(shí)體間質(zhì)量乘積越大,空間距離越小,相互的吸引力也就越大,其中質(zhì)量是地理實(shí)體自身實(shí)力的體現(xiàn)。
重力模型的一個(gè)重要應(yīng)用是計(jì)算最適阻尼系數(shù),β取從0到1范圍內(nèi)多個(gè)值,通過(guò)線性函數(shù)相關(guān)系數(shù)R2的大小得到最適的β。
4 珠三角城市群最適阻尼系數(shù)測(cè)算
利用新浪微博獲取的數(shù)據(jù),借助重力模型,以城市總的社交入向通量作為城市質(zhì)量,兩個(gè)城市之間的總社交通量作為實(shí)際的相互吸引力,β分別取0、0.2、0.4、0.6、0.8、1,分別計(jì)算2009年以及2013年兩個(gè)年份珠三角城市群最適阻尼系數(shù),得到圖1。
從圖1中可以直觀地看到,2009年當(dāng)β=0.6時(shí),重力模型線性擬合的相關(guān)系數(shù)最大,2013年當(dāng)β=0時(shí),重力模型線性擬合的相關(guān)系數(shù)最大。從β值的變化可以看出2009年到2013年珠三角城市群城市之間的聯(lián)系越來(lái)越多,城市群的發(fā)展速度也越來(lái)越快。
5 結(jié)論與討論
本文利用微博數(shù)據(jù),結(jié)合重力模型,分別測(cè)算2009年及2013年兩個(gè)年份珠三角城市群的城市聯(lián)系強(qiáng)度,結(jié)果表明,隨著時(shí)間的演進(jìn),珠三角城市群城市之間的聯(lián)系在加強(qiáng)。
由于微博數(shù)據(jù)本身數(shù)據(jù)量很大,并且存在很多不真實(shí)的數(shù)據(jù),從技術(shù)角度講,比較難完全過(guò)濾掉噪音數(shù)據(jù)以及不真實(shí)數(shù)據(jù),這也是微博數(shù)據(jù)利用面臨的一個(gè)比較大的問(wèn)題,所以獲取到的微博數(shù)據(jù)會(huì)包含不真實(shí)的數(shù)據(jù)以及雜質(zhì)信息,基于微博數(shù)據(jù)挖掘會(huì)有一定的誤差。隨著網(wǎng)絡(luò)數(shù)據(jù)獲取技術(shù)的提高,未來(lái)能夠獲得更準(zhǔn)確的數(shù)據(jù)。那么挖掘、分析的結(jié)果會(huì)更加理想。
參考文獻(xiàn)
[1]Kwan,M.P.(2007)."Mobile Communications, Social Networks, and Urban Travel: Hypertext as a New Metaphor for Conceptualizing Spatial Interaction *."Professional Geographer ,2007,59(04):434-446.
[2]Libennowell, D., et al. (2005). "Geographic routing in social networks.(COMPUTER SCIENCES: SOCIAL SCIENCES)(Author Abstract).",2005.
[3]Cui,A.X.,et al.(2012)."Emergence of Scale-Free Close-Knit Friendship Structure in Online Social Networks." Plos One 7(07):e50702,2012.
[4]Camagni,R.P.(1993).From City Hierarchy to City Network:Reflections about an Emerging Paradigm,Springer Berlin Heidelberg,1993.
作者單位
廣州海洋地質(zhì)調(diào)查局 廣東省廣州市 510760