代艷華+張棟棟+鄭曉康+秦秋莉
摘 要 本次研究中選定人人網(wǎng)為研究對象,使用社會網(wǎng)絡(luò)分析的方式探索社交世界的交流模式。社會網(wǎng)絡(luò)分析在我國是一門剛剛引入的新鮮學(xué)科,本文采用這一先進技術(shù),用社會網(wǎng)絡(luò)分析法和統(tǒng)計學(xué)方法對社交網(wǎng)絡(luò)進行科學(xué)描述,主要探究人人網(wǎng)內(nèi)部連接情況、找到位于社群中心位置的用戶、并分析用戶的中心位置與活躍度是否存在內(nèi)在關(guān)系,最后使用可視化技術(shù)將研究結(jié)果呈現(xiàn)。
關(guān)鍵詞 人人網(wǎng);社會網(wǎng)絡(luò)分析法;統(tǒng)計學(xué)方法;可視化技術(shù)
中圖分類號:TP392 文獻標(biāo)識碼:A 文章編號:1671-7597(2014)04-0035-02
1 人人網(wǎng)數(shù)據(jù)的采集及處理
采用滾雪球抽樣的方法抽取樣本,選定初始的三個人人網(wǎng)用戶,使用火車頭數(shù)據(jù)采集器采集對應(yīng)的好友網(wǎng)址,采集結(jié)果直接保存在本地數(shù)據(jù)庫中。編寫C語言程序在三個起始用戶的人人好友中隨機抽取12個二級用戶,繼續(xù)采集12個人人用戶的好友,最后獲取了2059個樣本數(shù)據(jù)。利用createpajek軟件將樣本數(shù)據(jù)文件轉(zhuǎn)化為.net的格式,方便后續(xù)分析軟件的使用。處理結(jié)果使每個用戶對應(yīng)不同的編號,并用對應(yīng)關(guān)系表示好友關(guān)系的存在。
2 社會網(wǎng)絡(luò)分析
利用社會網(wǎng)絡(luò)分析法的四項指標(biāo)對采集的人人網(wǎng)數(shù)據(jù)進行分析,分別是網(wǎng)絡(luò)密度、可達性、點度中心度和圖的點度中心勢指數(shù)。將采集數(shù)據(jù)導(dǎo)入pajek軟件中,進行分析。
2.1 網(wǎng)絡(luò)密度分析
抽象地說,一個圖的密度就是對這個圖的完備性的一種測度。網(wǎng)絡(luò)密度在一定程度上象征著這個網(wǎng)絡(luò)中關(guān)系的數(shù)量與復(fù)雜程度。密度為1,則每個個體都與其他所有個體產(chǎn)生關(guān)系。
利用pajek軟件實現(xiàn)對人人網(wǎng)網(wǎng)絡(luò)密度的測量,具體的步驟是在PAJEK中選“Info-Network-General”項目。結(jié)果顯示,在所有2059個樣本組成的網(wǎng)絡(luò)中,該網(wǎng)絡(luò)的平均網(wǎng)絡(luò)密度僅為0.03,考慮到可能是圖的規(guī)模使得結(jié)果偏小,為了使結(jié)果更加準(zhǔn)確我們采用樣本密度估計總體密度的辦法,隨機抽取3個30人的樣本,結(jié)果分別為0.08,0.10,0.11,取平均值0.097,有研究指出在實際網(wǎng)絡(luò)中能夠發(fā)現(xiàn)的最大密度是0.5,可見人人網(wǎng)的網(wǎng)絡(luò)密度值偏小。
2.2 可達性分析
可達性考察一個網(wǎng)絡(luò)的連通性(connectivity),它的意義是:圖中所有個體在多大程度上通過有限個步驟相互聯(lián)絡(luò)在一起。測量可達性的指標(biāo)是直徑(diameter)。直徑表示圖中任意可連通的兩點之間的最大距離。直徑短,表示可以通過很少的步驟訪問完整個網(wǎng)絡(luò)/最大關(guān)聯(lián)圖。
利用pajek軟件實現(xiàn)對采集數(shù)據(jù)的diameter測量,具體的步驟是“Net—Paths between 2 vertices—Diameter”。軟件處理的結(jié)果表明,直徑為5,根據(jù)“六度分隔”理論的內(nèi)容,在現(xiàn)實社會中表明人人網(wǎng)用戶之間的可達性較強。最大關(guān)聯(lián)圖規(guī)模較強,基本實現(xiàn)了互聯(lián)。
2.3 點度中心度分析
形象地說,度數(shù)就是某個點引出來的線的條數(shù)。反映在數(shù)據(jù)上,某個個體的度數(shù)就是鄰接陣中這個個體所對應(yīng)的行的行和或者列的列和(考慮到對稱性)。點度中心度(point centrality)是社會網(wǎng)絡(luò)分析的重點之一。如果一個點與其他許多點直接相連,就說該點具有較高的點度中心度。該點所對應(yīng)的行動者也是中心人物,擁有最大權(quán)力。這里的權(quán)力是指網(wǎng)絡(luò)中行動者之間存在的一種互動模式。
在進行點度中心度和圖的點度中心勢指數(shù)分析時,根據(jù)統(tǒng)計學(xué)分析中參數(shù)估計的原理,隨機抽取樣本總體中20個人人用戶,并查找他們之間的好友關(guān)系。將用戶之間的好友關(guān)系用一個鄰接矩陣的形式表達出來,矩陣中“1”表示好友關(guān)系存在,“0”表示不存在。
通過UCINET軟件進行點度中心度的測量結(jié)果和點度中心勢的測量結(jié)果分別如圖1、圖2所示。
圖1 點度中心度的測量結(jié)果
圖2 點度中心勢的測量結(jié)果
從圖1來看,不同的用戶表現(xiàn)出不同的中心度,中心度最高的用戶,即他的好友數(shù)量最多,如20號用戶中心度為9,1號和2號用戶中心度為8,說明他們在人人網(wǎng)信息傳播中擁有較大的權(quán)利,他們發(fā)布的消息為更多人所注意。但是其內(nèi)中心度最大值為9,平均值僅為3.1,可見,是過大的外中心度干擾了中心度的測量,造成了它們“位于網(wǎng)絡(luò)中心”的表象。
2.4 圖的點度中心勢指數(shù)分析
點度中心勢指數(shù)(centralization of a graph),指的就是網(wǎng)絡(luò)中點的集中趨勢,不同結(jié)構(gòu)的圖中心趨勢存在很大差異,從另一個角度來說,如果一個網(wǎng)絡(luò)中“點的點度中心度差異很大”,則該網(wǎng)絡(luò)的向心趨勢就較為明顯,反之,則中心勢較小。
圖2中結(jié)果樣本的整個網(wǎng)絡(luò)標(biāo)準(zhǔn)化中心勢為4.05%。中心勢越接近1,說明網(wǎng)絡(luò)越具有集中趨勢(centralization)。抽取的樣本中集中化中心勢為11.50%,說明有較強集中趨勢,但不十分明顯。
3 統(tǒng)計學(xué)定量交叉分析
在測量點度中心度抽取的20個人人用戶中,采集20個用戶的最近訪客數(shù)量、近三個月內(nèi)的月狀態(tài)平均更新數(shù)量、以及每條狀態(tài)的平均回復(fù)數(shù)量。由于人人網(wǎng)的權(quán)限設(shè)置以及采集的時間等問題,對一些不合格樣本進行了剔除。并利用spss軟件定量分析樣本的點度中心度和更新頻率、點擊率、回復(fù)數(shù)之間的相關(guān)關(guān)系。
進行點度中心勢和更新頻率、點擊率、平均回復(fù)數(shù)之間的相關(guān)性測量結(jié)果如圖3所示。
圖3 點度中心度和活躍度相關(guān)性測量
從圖3可以看出,點度中心勢和更新頻率、點擊率、平均回復(fù)數(shù)之間的相關(guān)系數(shù)分別是0.325,0.543,0.298,點度中心度和更新頻率、點擊率、平均回復(fù)數(shù)之間的顯著性P均大于0.01,所以點度中心勢和三者之間都不存在明顯的相關(guān)關(guān)系,統(tǒng)計結(jié)果不顯著。有較高點擊率、經(jīng)常更新狀態(tài)并且能夠得到較高回復(fù)數(shù)的人人用戶不一定位于社交網(wǎng)絡(luò)人人網(wǎng)群落的中心。endprint
4 可視化實現(xiàn)
利用pajek軟件繪制3D化處理的社群圖如圖4所示。
圖4 3D化處理社群圖
從圖4中可以很明顯的看出,抽取的樣本中存在很明顯的子群分割,人人網(wǎng)的好友關(guān)系一般都是真實關(guān)系的反應(yīng),與此同時我們揣測,作為真實關(guān)系的線上反應(yīng),人人用戶間的網(wǎng)絡(luò)關(guān)系是呈現(xiàn)出一定的自動分割的。
這些結(jié)群點稱作社團結(jié)構(gòu),同一個社團結(jié)構(gòu)相互之間有著比較大的相似性,而與網(wǎng)絡(luò)中的其他節(jié)點有著較少的聯(lián)系。而這樣的社團結(jié)構(gòu)在社交網(wǎng)絡(luò)中往往是一些有著某種或某幾種共同特性的“圈子”,這對于一些商品和信息的推薦有非常重要的意義。
5 結(jié)論與啟示
1)抽取的樣本具有明顯的代表性,可以依據(jù)樣本的特性來推測總體數(shù)據(jù),得出目前人人網(wǎng)的網(wǎng)絡(luò)密度一般,各個人人用戶之間的可達性一般,基本實現(xiàn)了互聯(lián),但是人人網(wǎng)并不具備較強的集中趨勢。
2)人人網(wǎng)在活躍性方面高于全國平均水平,但較高的活躍性并沒有帶來網(wǎng)絡(luò)連接的高緊密度。研究數(shù)據(jù)顯示,人人網(wǎng)網(wǎng)絡(luò)的連接密度相對與美國比較低,連接強度一般,網(wǎng)絡(luò)可達性不高,網(wǎng)絡(luò)整體聚類規(guī)模小,目前大多數(shù)人使用人人網(wǎng)只是為了和好友保持聯(lián)系,對于一些話題的參與度并不高。但是未來的社交網(wǎng)絡(luò)必然是深關(guān)系化的發(fā)展,必然要從淡出的交流分享衍生為獲取專業(yè)信息、解決待定問題為主的信息分析、整合。
3)調(diào)查顯示,目前人人好友的推薦機制主要是共同好友的數(shù)量,很多時候,兩個人雖然擁有比較多的共同好友,但在現(xiàn)實中彼此并不相識,也不會選擇成為對方好友。人人網(wǎng)可以通過對用戶主頁的文本和行為挖掘,實現(xiàn)超越真實線下關(guān)系的推薦,使更多人找到和自己志趣相投的朋友,增強網(wǎng)絡(luò)的連接密度。
4)統(tǒng)計學(xué)定量分析的結(jié)果顯示,活躍度高的人人用戶不一定位于社交網(wǎng)絡(luò)人人網(wǎng)群落的中心。點度中心度高的用戶往往具有更高的“權(quán)力”,而信息及資源的傳遞往往受“權(quán)力”大小的影響,權(quán)力大的被稱為“意見領(lǐng)袖”,他們在網(wǎng)絡(luò)輿情傳播中起著重要的作用。
5)同一個社團結(jié)構(gòu)的成員對彼此有更高的信任度,所以信息在社團內(nèi)部的推廣性遠遠高于整個網(wǎng)絡(luò),所以利用社團進行信息傳播是一個非常大的商機。
參考文獻
[1]李林容.社交網(wǎng)絡(luò)的特性及其發(fā)展趨勢[J].新聞界,2010(5).
[2]湯匯道.社會網(wǎng)絡(luò)分析法評述[J].學(xué)術(shù)界,2009(3).
[3]SNS新型社交網(wǎng)絡(luò)的傳播解讀與思考[J].今傳媒(學(xué)術(shù)版),2009(11).
[4]蘇雪皎.SNS社區(qū)網(wǎng)絡(luò)探析——以校內(nèi)網(wǎng)和同學(xué)網(wǎng)為例[J].青年記者,2009(23).
[5]竇炳林,張世永.基于結(jié)構(gòu)的社會網(wǎng)絡(luò)分析[J].計算機學(xué)報,2012(4).
[6]曾繁旭,黃廣生.網(wǎng)絡(luò)意見領(lǐng)袖社區(qū)的構(gòu)成、聯(lián)動及其政策影響:以微博為例[J].傳播與網(wǎng)絡(luò),2012(4).
[7]楊媛媛.應(yīng)用自我中心法分析社會網(wǎng)絡(luò)[J].實踐與經(jīng)營,2009(9).
[8]平亮,宗利永.基于社會網(wǎng)絡(luò)中心性分析的微博信息傳播研究[J].情報、信息與共享,2010(6).
[9]徐媛媛,朱慶華.社會網(wǎng)絡(luò)分析法在引文分析中的實證研究[J].理論與探索,2008(2).
[10]Yang ZHANG, Wanyang LING, A comparative study of information diffusion in weblogs and microblogs based on social network analysis[J]. Chinese Journal of Library and Information Science, 2012.04.
[11]A Social Network Analysis Methods based on Ontology, 2010 Third International Symposium on Knowledge Acquisition and Modeling[C]. wuhan hubei,2010.10.endprint
4 可視化實現(xiàn)
利用pajek軟件繪制3D化處理的社群圖如圖4所示。
圖4 3D化處理社群圖
從圖4中可以很明顯的看出,抽取的樣本中存在很明顯的子群分割,人人網(wǎng)的好友關(guān)系一般都是真實關(guān)系的反應(yīng),與此同時我們揣測,作為真實關(guān)系的線上反應(yīng),人人用戶間的網(wǎng)絡(luò)關(guān)系是呈現(xiàn)出一定的自動分割的。
這些結(jié)群點稱作社團結(jié)構(gòu),同一個社團結(jié)構(gòu)相互之間有著比較大的相似性,而與網(wǎng)絡(luò)中的其他節(jié)點有著較少的聯(lián)系。而這樣的社團結(jié)構(gòu)在社交網(wǎng)絡(luò)中往往是一些有著某種或某幾種共同特性的“圈子”,這對于一些商品和信息的推薦有非常重要的意義。
5 結(jié)論與啟示
1)抽取的樣本具有明顯的代表性,可以依據(jù)樣本的特性來推測總體數(shù)據(jù),得出目前人人網(wǎng)的網(wǎng)絡(luò)密度一般,各個人人用戶之間的可達性一般,基本實現(xiàn)了互聯(lián),但是人人網(wǎng)并不具備較強的集中趨勢。
2)人人網(wǎng)在活躍性方面高于全國平均水平,但較高的活躍性并沒有帶來網(wǎng)絡(luò)連接的高緊密度。研究數(shù)據(jù)顯示,人人網(wǎng)網(wǎng)絡(luò)的連接密度相對與美國比較低,連接強度一般,網(wǎng)絡(luò)可達性不高,網(wǎng)絡(luò)整體聚類規(guī)模小,目前大多數(shù)人使用人人網(wǎng)只是為了和好友保持聯(lián)系,對于一些話題的參與度并不高。但是未來的社交網(wǎng)絡(luò)必然是深關(guān)系化的發(fā)展,必然要從淡出的交流分享衍生為獲取專業(yè)信息、解決待定問題為主的信息分析、整合。
3)調(diào)查顯示,目前人人好友的推薦機制主要是共同好友的數(shù)量,很多時候,兩個人雖然擁有比較多的共同好友,但在現(xiàn)實中彼此并不相識,也不會選擇成為對方好友。人人網(wǎng)可以通過對用戶主頁的文本和行為挖掘,實現(xiàn)超越真實線下關(guān)系的推薦,使更多人找到和自己志趣相投的朋友,增強網(wǎng)絡(luò)的連接密度。
4)統(tǒng)計學(xué)定量分析的結(jié)果顯示,活躍度高的人人用戶不一定位于社交網(wǎng)絡(luò)人人網(wǎng)群落的中心。點度中心度高的用戶往往具有更高的“權(quán)力”,而信息及資源的傳遞往往受“權(quán)力”大小的影響,權(quán)力大的被稱為“意見領(lǐng)袖”,他們在網(wǎng)絡(luò)輿情傳播中起著重要的作用。
5)同一個社團結(jié)構(gòu)的成員對彼此有更高的信任度,所以信息在社團內(nèi)部的推廣性遠遠高于整個網(wǎng)絡(luò),所以利用社團進行信息傳播是一個非常大的商機。
參考文獻
[1]李林容.社交網(wǎng)絡(luò)的特性及其發(fā)展趨勢[J].新聞界,2010(5).
[2]湯匯道.社會網(wǎng)絡(luò)分析法評述[J].學(xué)術(shù)界,2009(3).
[3]SNS新型社交網(wǎng)絡(luò)的傳播解讀與思考[J].今傳媒(學(xué)術(shù)版),2009(11).
[4]蘇雪皎.SNS社區(qū)網(wǎng)絡(luò)探析——以校內(nèi)網(wǎng)和同學(xué)網(wǎng)為例[J].青年記者,2009(23).
[5]竇炳林,張世永.基于結(jié)構(gòu)的社會網(wǎng)絡(luò)分析[J].計算機學(xué)報,2012(4).
[6]曾繁旭,黃廣生.網(wǎng)絡(luò)意見領(lǐng)袖社區(qū)的構(gòu)成、聯(lián)動及其政策影響:以微博為例[J].傳播與網(wǎng)絡(luò),2012(4).
[7]楊媛媛.應(yīng)用自我中心法分析社會網(wǎng)絡(luò)[J].實踐與經(jīng)營,2009(9).
[8]平亮,宗利永.基于社會網(wǎng)絡(luò)中心性分析的微博信息傳播研究[J].情報、信息與共享,2010(6).
[9]徐媛媛,朱慶華.社會網(wǎng)絡(luò)分析法在引文分析中的實證研究[J].理論與探索,2008(2).
[10]Yang ZHANG, Wanyang LING, A comparative study of information diffusion in weblogs and microblogs based on social network analysis[J]. Chinese Journal of Library and Information Science, 2012.04.
[11]A Social Network Analysis Methods based on Ontology, 2010 Third International Symposium on Knowledge Acquisition and Modeling[C]. wuhan hubei,2010.10.endprint
4 可視化實現(xiàn)
利用pajek軟件繪制3D化處理的社群圖如圖4所示。
圖4 3D化處理社群圖
從圖4中可以很明顯的看出,抽取的樣本中存在很明顯的子群分割,人人網(wǎng)的好友關(guān)系一般都是真實關(guān)系的反應(yīng),與此同時我們揣測,作為真實關(guān)系的線上反應(yīng),人人用戶間的網(wǎng)絡(luò)關(guān)系是呈現(xiàn)出一定的自動分割的。
這些結(jié)群點稱作社團結(jié)構(gòu),同一個社團結(jié)構(gòu)相互之間有著比較大的相似性,而與網(wǎng)絡(luò)中的其他節(jié)點有著較少的聯(lián)系。而這樣的社團結(jié)構(gòu)在社交網(wǎng)絡(luò)中往往是一些有著某種或某幾種共同特性的“圈子”,這對于一些商品和信息的推薦有非常重要的意義。
5 結(jié)論與啟示
1)抽取的樣本具有明顯的代表性,可以依據(jù)樣本的特性來推測總體數(shù)據(jù),得出目前人人網(wǎng)的網(wǎng)絡(luò)密度一般,各個人人用戶之間的可達性一般,基本實現(xiàn)了互聯(lián),但是人人網(wǎng)并不具備較強的集中趨勢。
2)人人網(wǎng)在活躍性方面高于全國平均水平,但較高的活躍性并沒有帶來網(wǎng)絡(luò)連接的高緊密度。研究數(shù)據(jù)顯示,人人網(wǎng)網(wǎng)絡(luò)的連接密度相對與美國比較低,連接強度一般,網(wǎng)絡(luò)可達性不高,網(wǎng)絡(luò)整體聚類規(guī)模小,目前大多數(shù)人使用人人網(wǎng)只是為了和好友保持聯(lián)系,對于一些話題的參與度并不高。但是未來的社交網(wǎng)絡(luò)必然是深關(guān)系化的發(fā)展,必然要從淡出的交流分享衍生為獲取專業(yè)信息、解決待定問題為主的信息分析、整合。
3)調(diào)查顯示,目前人人好友的推薦機制主要是共同好友的數(shù)量,很多時候,兩個人雖然擁有比較多的共同好友,但在現(xiàn)實中彼此并不相識,也不會選擇成為對方好友。人人網(wǎng)可以通過對用戶主頁的文本和行為挖掘,實現(xiàn)超越真實線下關(guān)系的推薦,使更多人找到和自己志趣相投的朋友,增強網(wǎng)絡(luò)的連接密度。
4)統(tǒng)計學(xué)定量分析的結(jié)果顯示,活躍度高的人人用戶不一定位于社交網(wǎng)絡(luò)人人網(wǎng)群落的中心。點度中心度高的用戶往往具有更高的“權(quán)力”,而信息及資源的傳遞往往受“權(quán)力”大小的影響,權(quán)力大的被稱為“意見領(lǐng)袖”,他們在網(wǎng)絡(luò)輿情傳播中起著重要的作用。
5)同一個社團結(jié)構(gòu)的成員對彼此有更高的信任度,所以信息在社團內(nèi)部的推廣性遠遠高于整個網(wǎng)絡(luò),所以利用社團進行信息傳播是一個非常大的商機。
參考文獻
[1]李林容.社交網(wǎng)絡(luò)的特性及其發(fā)展趨勢[J].新聞界,2010(5).
[2]湯匯道.社會網(wǎng)絡(luò)分析法評述[J].學(xué)術(shù)界,2009(3).
[3]SNS新型社交網(wǎng)絡(luò)的傳播解讀與思考[J].今傳媒(學(xué)術(shù)版),2009(11).
[4]蘇雪皎.SNS社區(qū)網(wǎng)絡(luò)探析——以校內(nèi)網(wǎng)和同學(xué)網(wǎng)為例[J].青年記者,2009(23).
[5]竇炳林,張世永.基于結(jié)構(gòu)的社會網(wǎng)絡(luò)分析[J].計算機學(xué)報,2012(4).
[6]曾繁旭,黃廣生.網(wǎng)絡(luò)意見領(lǐng)袖社區(qū)的構(gòu)成、聯(lián)動及其政策影響:以微博為例[J].傳播與網(wǎng)絡(luò),2012(4).
[7]楊媛媛.應(yīng)用自我中心法分析社會網(wǎng)絡(luò)[J].實踐與經(jīng)營,2009(9).
[8]平亮,宗利永.基于社會網(wǎng)絡(luò)中心性分析的微博信息傳播研究[J].情報、信息與共享,2010(6).
[9]徐媛媛,朱慶華.社會網(wǎng)絡(luò)分析法在引文分析中的實證研究[J].理論與探索,2008(2).
[10]Yang ZHANG, Wanyang LING, A comparative study of information diffusion in weblogs and microblogs based on social network analysis[J]. Chinese Journal of Library and Information Science, 2012.04.
[11]A Social Network Analysis Methods based on Ontology, 2010 Third International Symposium on Knowledge Acquisition and Modeling[C]. wuhan hubei,2010.10.endprint