徐人鳳,李粵平,聶 哲,溫曉軍,肖正興
(深圳職業(yè)技術(shù)學(xué)院計(jì)算機(jī)工程學(xué)院,廣東深圳518055)
微博網(wǎng)絡(luò)互感知研究綜述*
徐人鳳,李粵平,聶 哲,溫曉軍,肖正興
(深圳職業(yè)技術(shù)學(xué)院計(jì)算機(jī)工程學(xué)院,廣東深圳518055)
針對微博的特有信息傳播方式,本文綜述了有關(guān)微博網(wǎng)絡(luò)互感知性質(zhì)的研究方法和成果.同時利用微博網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)對互感知性質(zhì)的重要性進(jìn)行實(shí)驗(yàn)驗(yàn)證.實(shí)驗(yàn)證明,微博網(wǎng)絡(luò)考慮了互感知性質(zhì)的社區(qū)發(fā)現(xiàn),在2個主流評價指標(biāo)上比未考慮互感知的社區(qū)發(fā)現(xiàn)有明顯的優(yōu)勢:傳遞性指標(biāo)僅為后者的10.81%,而興趣指數(shù)為后者的2.135倍.
微博;互感知;社區(qū)發(fā)現(xiàn)
微博是微博客(MicroBlog)的簡稱,是一個基于用戶關(guān)系信息分享、傳播以及獲取平臺,用戶可以通過各種客戶端發(fā)送140字左右的文字信息,實(shí)現(xiàn)即時分享.2006年美國的Twitter最早提供微博服務(wù),開通至今注冊用戶已經(jīng)超過5億.國內(nèi)具有代表性的新浪微博和騰訊微博,在開通的一年內(nèi)均突破1億用戶[1].微博融合了即時通訊、博客和社交網(wǎng)站的功能,使得信息流通在速度和廣度層面都有大幅度的提升.
微博的出現(xiàn)和迅速發(fā)展引起了學(xué)術(shù)界和產(chǎn)業(yè)界的廣泛關(guān)注,涌現(xiàn)了許多研究成果.本文圍繞微博網(wǎng)絡(luò)的特點(diǎn)——互感知性對國內(nèi)外微博研究的代表性成果進(jìn)行梳理,指出互感知特點(diǎn)的影響及其解決方法,為對微博的研究和實(shí)踐提供參考.
微博誕生初期學(xué)者Gaonkar、Li和Choudhury等學(xué)者從技術(shù)層面給出了微博的定義:一種集合了手機(jī)傳感器、無線網(wǎng)絡(luò)、信息處理和空間可視這四要素的多媒體博客[2].在2010年學(xué)者Kaplan和Haenlein提出了較為廣泛接受的定義:“微博是一種基于互聯(lián)網(wǎng)的交換工具,允許用戶之間交換短篇內(nèi)容,例如句子、圖像和鏈接等”[3].
由于微博的信息傳播機(jī)制與即時消息通訊、論壇和博客有著一定差異,從而導(dǎo)致微博網(wǎng)絡(luò)的節(jié)點(diǎn)種類更為多樣,節(jié)點(diǎn)之間的關(guān)系更為復(fù)雜[4].下面先介紹微博的信息傳播方式,再對微博網(wǎng)絡(luò)的結(jié)構(gòu)和特點(diǎn)進(jìn)行分析.
微博的信息傳播是通過用戶發(fā)布、轉(zhuǎn)發(fā)、評論及回復(fù)的功能,同時配合跟隨機(jī)制、搜索機(jī)制、鏈接機(jī)制和提醒機(jī)制完成的.
微博用戶在其主頁上發(fā)布一條博文,記為A,可能通過3種方式進(jìn)行傳播:第一種被其他用戶轉(zhuǎn)發(fā),記為F;第二種被其他用戶評論,記為C;第三種被其他用戶轉(zhuǎn)發(fā)同時也進(jìn)行了評論,記為F+C.其中評論C可以僅發(fā)布在被評論博文的下方,也可以發(fā)布到評論者自己的微博主頁上.此外,微博用戶可以對評論進(jìn)行回復(fù),記為R.類似地,回復(fù)可以發(fā)布在被回復(fù)博文或評論的下方,也可以發(fā)布在回復(fù)者自己的微博主頁,如圖1所示.上述發(fā)布到微博主頁的評論或者回復(fù)等同于發(fā)布一條新的博文,可以進(jìn)一步被轉(zhuǎn)發(fā)、評論和回復(fù).
1)層次聚類算法性能的優(yōu)劣很大程度上取決于相似度矩陣的計(jì)算是否合理.此性質(zhì)非常適合用于評價相似度矩陣的刻畫質(zhì)量;
2)層次聚類算法相對其他社區(qū)發(fā)現(xiàn)算法精度較好,效率也高.
實(shí)驗(yàn)的數(shù)據(jù)集通過本文資助項(xiàng)目開發(fā)的軟件《微博輿情信息處理平臺》(軟著登字第553340號)對騰訊微博數(shù)據(jù)進(jìn)行爬取.?dāng)?shù)據(jù)集情況為:博主130個,博文(包括轉(zhuǎn)發(fā)和評論)4013條,時間跨度30天.
實(shí)驗(yàn)步驟如下: 1)計(jì)算互信息矩陣;2)分別利用鄰接矩陣和互信息矩陣進(jìn)行社區(qū)發(fā)現(xiàn);3)對社區(qū)發(fā)現(xiàn)結(jié)構(gòu)基于鄰接矩陣和基于互信息矩陣進(jìn)行驗(yàn)證.
實(shí)驗(yàn)步驟流程示意圖,如圖3所示.
基于鄰接情況的社區(qū)結(jié)構(gòu)驗(yàn)證結(jié)果見圖4.從結(jié)果看出,基于鄰接情況的社區(qū)結(jié)構(gòu)在兩種驗(yàn)證下的質(zhì)量相差不大.需要注意的是在傳遞性和興趣指數(shù)這兩個評價指標(biāo)上的效果并不理想,說明基于鄰接情況進(jìn)行社區(qū)發(fā)現(xiàn),并不適用于微博網(wǎng)絡(luò).
基于互信息的社區(qū)結(jié)構(gòu)驗(yàn)證結(jié)果見圖5.從結(jié)果看出,基于互信息的社區(qū)結(jié)構(gòu)在兩種驗(yàn)證下的質(zhì)量相差顯著.特別是在傳遞性和興趣指數(shù)這2個評價指標(biāo)上的效果遠(yuǎn)優(yōu)于基于鄰接情況的社區(qū)結(jié)構(gòu),說明基于互信息進(jìn)行社區(qū)發(fā)現(xiàn),更適用于微博網(wǎng)絡(luò).互信息對微博網(wǎng)絡(luò)的刻畫更貼近現(xiàn)實(shí).
圖3 實(shí)驗(yàn)流程
圖4 基于鄰接情況社區(qū)結(jié)構(gòu)的驗(yàn)證結(jié)果
圖5 基于互信息社區(qū)結(jié)構(gòu)的驗(yàn)證結(jié)果
實(shí)驗(yàn)結(jié)果表明,微博網(wǎng)絡(luò)考慮了互感知性質(zhì)的社區(qū)發(fā)現(xiàn)在兩個主流評價“傳遞性”和“興趣指數(shù)”指標(biāo)上比未考慮互感知的社區(qū)發(fā)現(xiàn)有明顯的優(yōu)勢:傳遞性指標(biāo)前者是后者的10.81%,興趣指標(biāo)前者是后者的2.125倍.如今,社會化媒體的規(guī)模比以往任何時期都要龐大,媒體的形式也更為多樣.微博是社會化媒體的一個代表,微博的互感知性在其他社會化媒體中也不同程度的存在.本文探討的互感知的相關(guān)成果可以推廣到其他社會化媒體中[11].
[1]閆幸,常亞平.微博研究綜述[J].情報(bào)雜志,2011,30(9):61-65.
[2] Shravan Gaonkar, Romit Roy Choudhury. Micro-blog: map-casting from mobile phones to virtual sensor maps[Z].2007.
[3]Andreas M. Kaplan, Michael Haenlein. The early bird catches the news: Nine things you should know about micro-blogging[J].Business Horizons,2011,54(2):105-113.
[4]陳克寒,韓盼盼,吳健.基于用戶聚類的異構(gòu)社交網(wǎng)絡(luò)推薦算法[J].計(jì)算機(jī)學(xué)報(bào),2013,36(2):349-359.
[5]Howard Rheingold. The Virtual Community: Homesteading on the Electronic Frontier[M].MIT Press Cambridge, MA, USA, 2000.
[6]Steven G. Jones. CyberSociety: Computer-Mediated Communication and Community[M].SAGE Publications, 1995.
[7]Yu-ru Lin, Hari Sundaram,Yun Chi, Jun Tatemura, Belle Tseng. Discovery of blog communities based on mutual awareness[C]// Proceedings of the WWW06 Workshop on Web Intelligence,2006.
[8]Brin S, Page L. The anatomy of a large-scale hypertexttual Web search engine[J].Computer Networks and ISDN Systems, 1998,30(1-7):107-117.
[9]Brandes U, Gaertler M, Wagner D. Experiments on Graph Clustering Algorithms[C]//Proceedings of the 11th Annual European Symposium on Algorithms - ESA, Springer, 2003:568-579.
[10]Santo Fortunato. Community detection in graphs[J].Physics Reports,2010,486(3-5):75-174.
[11]蔣盛益,麥智凱,龐觀松,吳美玲,王連喜.微博信息挖掘技術(shù)研究綜述[J].圖書情報(bào)工作,2012,56(17):136-142.
A Survey on Mutual Awareness of Weibo Network
XU Renfeng, LI Yueping, NIE Zhe, WEN Xiaojun, XIAO Zhengxing
(School of Computer Engineering, Shenzhen Polytechnic, Shenzhen, Guangdong 518055, China)
Taking into the unique feature of weibo into consideration, this paper surveys research methods and results about mutual awareness of weibo network. The impact of network community discovery on mutual awareness is verified by experiments. The results show that the community discovery network with mutual awareness has a distinct advantage over that without. Conductivity index of the former is only 10.81% of the latter, while the interest index is 2.135 times of the latter.
weibo; mutual awareness; community discovery
TP368.1
A
1672-0318(2014)01-0032-05
2013-10-09
*項(xiàng)目來源:深圳職業(yè)技術(shù)學(xué)院科技基金重點(diǎn)資助項(xiàng)目(編號2212K3190005)
徐人鳳(1961-),吉林人,高級工程師,主要研究方向?yàn)閿?shù)據(jù)庫應(yīng)用、數(shù)據(jù)挖掘;李粵平(1980-),講師,主要研究方向?yàn)榫W(wǎng)絡(luò)計(jì)算;聶哲(1970-),教授,主要研究方向?yàn)榫W(wǎng)絡(luò)輿情;溫曉軍(1971-),教授,主要研究方向?yàn)榱孔用艽a;肖正興(1976-),講師,主要研究方向?yàn)槿斯ぶ悄埽?/p>