国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

版主發(fā)帖行為實(shí)證與聚類研究

2016-05-14 02:09:51王永忠徐姍姍魚靜
中國管理信息化 2016年5期
關(guān)鍵詞:版主發(fā)帖實(shí)證研究

王永忠 徐姍姍 魚靜

[摘 要] 為揭示論壇版主發(fā)帖的行為模式,編寫了網(wǎng)絡(luò)爬蟲軟件,獲取了天涯論壇92名版主發(fā)帖相關(guān)數(shù)據(jù),并對(duì)版主進(jìn)行了聚類研究。對(duì)相關(guān)參數(shù),采用極大似然估計(jì)法和Kolmogorov-Smirnov檢驗(yàn)法進(jìn)行了分析。結(jié)果表明:版主發(fā)帖的時(shí)間間隔分布符合冪律分布;版主冪律指數(shù)、陣發(fā)性符合Burr分布,xmin、活躍度符合指數(shù)分布;版主聚類為三個(gè)類別時(shí),數(shù)據(jù)蘊(yùn)含著分形的特征。

[關(guān)鍵詞] 論壇;版主;發(fā)帖;冪律分布;實(shí)證研究;分形

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2016 . 05. 093

[中圖分類號(hào)] TP391 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2016)05- 0175- 03

1 前 言

研究個(gè)體輿論傳播的基本特征是建立群體輿論傳播模型的重要基礎(chǔ)。從最早的PC互聯(lián)網(wǎng)時(shí)代到當(dāng)今的移動(dòng)互聯(lián)網(wǎng)時(shí)代,論壇一直都是輿論傳播的重要陣地。由于論壇形成歷史時(shí)間長,在不同領(lǐng)域中,都已經(jīng)形成了一定數(shù)量的知名論壇。這些知名論壇擁有巨大的用戶群,同時(shí)也積累了用戶發(fā)帖相關(guān)的大量數(shù)據(jù)。挖掘這些數(shù)據(jù)的內(nèi)在規(guī)律,對(duì)于認(rèn)識(shí)用戶信息傳播特征、建立輿論傳播模型具有重要意義。

關(guān)于人類信息傳播行為、論壇輿論傳播的研究目前已經(jīng)有較多成果。最早以Barabási對(duì)人類信件的時(shí)間間隔分析為起點(diǎn),研究發(fā)現(xiàn),人類的信息溝通的時(shí)間間隔服從冪律分布,并由此創(chuàng)立了人類動(dòng)力學(xué)這門新學(xué)科。Vázquez以Barabási的假設(shè)為前提,通過嚴(yán)格的數(shù)學(xué)證明,認(rèn)為人類動(dòng)力學(xué)中存在著兩個(gè)普適類,即冪律分布的指數(shù)為1或1.5。從此,引發(fā)眾多的研究者對(duì)于人類行為模式進(jìn)行實(shí)證研究。

對(duì)于論壇的研究,Yu等對(duì)論壇的回帖進(jìn)行了實(shí)證研究。趙永亮等以天涯論壇帖子為對(duì)象重點(diǎn)分析了每天發(fā)帖量的分布。Qiang等研究了微博社區(qū)的興趣驅(qū)動(dòng)問題。以上這些研究豐富了論壇領(lǐng)域的人類動(dòng)力學(xué)研究。然而,專門對(duì)論壇版主研究的文獻(xiàn)并不多。

版主是論壇中重要的用戶群體。從輿論傳播的角度來說,版主往往起到意見領(lǐng)袖的作用。版主通過發(fā)布主帖,表達(dá)意見,以達(dá)到影響輿論、引導(dǎo)輿論的目的。本文利用自己編寫的網(wǎng)絡(luò)爬蟲收集了天涯論壇92名版主發(fā)帖的相關(guān)數(shù)據(jù)。通過數(shù)據(jù)分析發(fā)現(xiàn),個(gè)體層面:版主發(fā)帖的時(shí)間間隔符合冪律分布,驗(yàn)證了人類動(dòng)力學(xué)的預(yù)測;群體層面:版主冪律指數(shù)、陣發(fā)性符合burr分布,、活躍度符合指數(shù)分布。采用質(zhì)心距離法對(duì)版主聚類分為三類時(shí),數(shù)據(jù)具有明顯的分形特征。

2 數(shù)據(jù)來源與說明

本文采用的數(shù)據(jù)是利用自己編寫的網(wǎng)絡(luò)爬蟲,定向收集獲取的。收集對(duì)象是天涯論壇中92名版主發(fā)布的主帖數(shù)據(jù)。時(shí)間跨度為2004年1月1日到2015年6月30日,數(shù)據(jù)量達(dá)到6 500 MB。數(shù)據(jù)精度為分鐘。

天涯論壇于1999年3月1日創(chuàng)立,到現(xiàn)在已經(jīng)超過16年,注冊(cè)用戶9 000萬,每月瀏覽用戶超過2億。選擇天涯論壇版主作為研究對(duì)象主要基于以下三點(diǎn)思考:一是版主的責(zé)任心強(qiáng),他們主動(dòng)發(fā)帖的概率高于普通用戶,發(fā)帖數(shù)量大,為統(tǒng)計(jì)研究提供了數(shù)量的保障;二是版主的自律性高,違反規(guī)定發(fā)帖的可能性小,因此被刪除的概率小,統(tǒng)計(jì)的數(shù)據(jù)完整性高于普通用戶;三是版主往往是本版的意見領(lǐng)袖,研究版主的特質(zhì),對(duì)于研究輿論傳播中的意見領(lǐng)袖具有重要作用。

3 論壇版主發(fā)帖模式分析

首先通過利用上述的數(shù)學(xué)方法,采用Matlab 2015a編程,分析每名版主的基本特征,而后再探究版主的群體特征,并對(duì)版主群體進(jìn)行分類研究。計(jì)算結(jié)果皆滿足上述的假設(shè)檢驗(yàn)。

3.1 論壇版主發(fā)帖個(gè)體行為實(shí)證分析

通過對(duì)92名版主的發(fā)帖時(shí)間間隔的累積分布進(jìn)行擬合,發(fā)現(xiàn)個(gè)體行為均滿足冪律分布。當(dāng)x≥xmin時(shí),在雙對(duì)數(shù)坐標(biāo)下α近似為一條直線。圖1為天涯社區(qū)了望天涯版塊的版主“枕著永遠(yuǎn)入眠”的發(fā)帖時(shí)間間隔累積分布。其他91名版主具有同樣類似的圖形。

由此推斷版主論壇發(fā)帖的行為,符合冪律分布的特征,驗(yàn)證了Barabási推斷,說明版主發(fā)帖的模式具有人類動(dòng)力學(xué)的特性,即長時(shí)間的靜默與短時(shí)間內(nèi)的高頻率爆發(fā)相結(jié)合的特征。

3.2 論壇版主發(fā)帖群體特征的實(shí)證分析

通過前面分析可知,論壇版主個(gè)體發(fā)帖的時(shí)間間隔,是由α、xmin決定的,采用蒙特卡洛法可對(duì)版主個(gè)體進(jìn)行仿真。下面探討版主群體的α、xmin、活躍度、陣發(fā)性的分布,為版主群體的仿真提供基礎(chǔ)。

3.2.1 α的分布情況

通過計(jì)算,版主α指數(shù)介于1.5~2.75之間,這與Vázquez的預(yù)測不同。做直方圖,發(fā)現(xiàn)數(shù)據(jù)版主群體α具有明顯的右偏,不符合正態(tài)分布,通過極大似然擬合,發(fā)現(xiàn)α更符合Burr分布,如圖2所示。

版主冪律指數(shù)在之間數(shù)量最多,并且向左右呈現(xiàn)階梯狀的變化,說明了版主冪律指數(shù)不會(huì)出現(xiàn)忽大忽小變化,即不會(huì)出現(xiàn)極端值。這種情形的出現(xiàn),可能是版主本身工作的性質(zhì)決定的,他們不可能長時(shí)間潛水,也不可能在論壇上“一言堂”,工作本身要求每名版主都要適時(shí)地發(fā)布一些有價(jià)值的帖子,以達(dá)到活躍氣氛、引導(dǎo)用戶、完成工作的目的。

3.2.2 xmin的分布情況

經(jīng)過計(jì)算,xmin介于536~50 424之間。 統(tǒng)計(jì)表明,xmin在5 000以內(nèi)的數(shù)量最多,達(dá)到31名版主。

版主群體xmin符合指數(shù)分布:

通過極大似然估計(jì),得到:

這一規(guī)律的得出,結(jié)合α的分布,為版主群體特征的仿真提供了定量的依據(jù)。

3.2.3 活躍度的分布情況

版主活躍度是指版主在一段時(shí)間內(nèi)發(fā)表帖子的數(shù)量與時(shí)間的比值。符合指數(shù)分布,同公式(2)。通過極大似然估計(jì),得到:

3.2.4 陣發(fā)性的分布情況

陣發(fā)性是刻畫用戶短時(shí)期內(nèi)密集活動(dòng)和長時(shí)間靜默的程度。陣發(fā)性的公式為:

σx為時(shí)間間隔的標(biāo)準(zhǔn)差,mx為時(shí)間間隔的均值。計(jì)算表明,陣發(fā)性介于[0.17,0.86]之間。版主的陣發(fā)生符合Burr分布,同公式(1)。通過極大似然估計(jì),得到Burr的3個(gè)參數(shù):

版主群體的陣發(fā)性相對(duì)于普通瀏覽用戶的陣發(fā)性相對(duì)要弱。這主要是因?yàn)?,這和前人的研究結(jié)論不一致。主要原因是前人研究的是瀏覽論壇的用戶,而版主群體是一類特殊的用戶,即,版主既是用戶也是管理者。

3.3 版主聚類分析

通過實(shí)證分析,獲得了版主的相關(guān)數(shù)據(jù),即冪律指數(shù)、xmin、活躍度和陣發(fā)性四個(gè)指標(biāo)。通過質(zhì)心法和歐式距離法,對(duì)版主獲取數(shù)據(jù)進(jìn)行聚類分析。得到譜系圖如圖3所示。

計(jì)算表明,主成分為版主的xmin、活躍度、陣發(fā)性。說明在版主分類中,起主要作用的是xmin、活躍度、陣發(fā)性。冪律的大小對(duì)于版主的分類的影響作用很弱。從前面的實(shí)證分析得知,其中的原因可能是,每名版主的發(fā)帖皆滿足冪律分布,冪律分布屬于大同小異一類,而其他的指標(biāo)則會(huì)成為主要因素。這與定性分析相一致。

4 結(jié) 語

本文通過網(wǎng)絡(luò)爬蟲獲取了92名天涯版主發(fā)帖的數(shù)據(jù)。通過極大似然估計(jì)和Kolmogorov-Smirnov檢驗(yàn)法進(jìn)行了分析。結(jié)果表明,版主發(fā)帖的時(shí)間間隔分布符合冪律分布,冪律指數(shù)在1.5~2.75之間;xmin介于536~50 424之間;版主冪律指數(shù)、陣發(fā)性符合Burr分布;xmin、活躍度符合指數(shù)分布。

通過實(shí)證數(shù)據(jù)發(fā)現(xiàn),描述版主的指標(biāo)數(shù)據(jù)具有一定的分形特征。如何采用分形的理論,對(duì)于大數(shù)據(jù)時(shí)代的版主數(shù)據(jù)進(jìn)行簡化研究,可能是未來研究的重點(diǎn)。

主要參考文獻(xiàn)

[1]Barabási A L.The Origin of Bursts and Heavy Tails in Human Dynamics [J].Nature,2005(435):207-211.

[2]A Vázquez,J G Oliveira,Z Dezso,K-I Goh, I Kondor,A-L Barabási.Modeling Bursts and Heavy-Tails in Human Dynamics [J],Phys. Rev. E,2006,73 (3):80-98.

[3]Yu J,Hu Y,Yu M, et al.Analyzing Netizens View and Reply Behaviors on the Forum[J]. Physica A: Statistical Mechanics & its Applications,2010, 389(16):3267–3273.

[4]趙永亮,唐錫晉.基于天涯論壇的BBS在線行為分析[J]. 系統(tǒng)科學(xué)與數(shù)學(xué), 2015,35(2):129-141.

[5]Qiang Yan, Lanli Yi,Lianren Wu.Human Dynamic Model Co-Driven by Interest and Social Identity in Microblog Community[J]. Fuel & Energy Abstracts,2012,391(4):1540-1545.

猜你喜歡
版主發(fā)帖實(shí)證研究
英議會(huì)掏錢讓議員學(xué)如何發(fā)帖
玉雕專業(yè)學(xué)生專業(yè)認(rèn)同的實(shí)證研究
人間(2016年26期)2016-11-03 18:10:25
溫州小微企業(yè)融資環(huán)境及能力分析
認(rèn)知語言視角下英語詞匯多義習(xí)得的實(shí)證研究
科技視界(2016年21期)2016-10-17 19:05:25
實(shí)證分析會(huì)計(jì)信息對(duì)股價(jià)的影響
商(2016年27期)2016-10-17 05:39:59
十二星座版主照鏡子
利用學(xué)校網(wǎng)絡(luò)平臺(tái),培養(yǎng)學(xué)生寫作興趣
十二星座版主照鏡子
是“呼”還是“應(yīng)”
甘肅教育(2014年3期)2014-03-20 16:09:59
“斑竹”,憑什么刪我的帖?
蒙自县| 晋州市| 兴国县| 阿拉善盟| 霍林郭勒市| 邢台市| 河间市| 遂平县| 神农架林区| 西平县| 疏附县| 达孜县| 长岭县| 河池市| 和硕县| 玉树县| 永康市| 商丘市| 布拖县| 大姚县| 惠水县| 台东县| 库车县| 阿图什市| 手机| 榆中县| 湟中县| 陆河县| 汝州市| 布尔津县| 长乐市| 延庆县| 铁力市| 会理县| 柯坪县| 大同县| 青阳县| 铜鼓县| 凭祥市| 上林县| 民权县|