国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

低活躍度背景下的微博社區(qū)信息傳播模型研究

2015-08-05 06:46方冠豪張玉旺
關(guān)鍵詞:人群節(jié)點(diǎn)社區(qū)

王 博,方冠豪,邵 力,張玉旺

(哈爾濱工業(yè)大學(xué)人文與社會(huì)科學(xué)學(xué)院,哈爾濱150001)

自2010年以來,人們的社會(huì)交往方式進(jìn)入了社會(huì)媒體時(shí)代,微博作為一種最重要的社會(huì)媒體之一得以迅速發(fā)展,并在人們的日常生活中扮演著越來越重要的角色,其對社會(huì)輿論的導(dǎo)向也發(fā)揮著至關(guān)重要的作用.但微博在其自身發(fā)展中,始終面臨一個(gè)活躍用戶數(shù)偏低的問題,尤其在2013年以后,受其他新型社會(huì)媒體的沖擊以及微博社區(qū)自身的用戶偏好轉(zhuǎn)移等因素影響,微博的注冊用戶數(shù)停止大幅度增長,用戶活躍度進(jìn)一步下降.此外,謠言與不實(shí)信息的傳播造成的可信度下降也成為促使微博用戶活躍度下降的一個(gè)重要因素,用戶是否接受并傳播一條信息取決于用戶間的親密程度、信息發(fā)布者的知名度、影響力以及發(fā)布的信息種類和信息發(fā)布者專業(yè)領(lǐng)域的匹配度等因素,而這些因素都可以歸結(jié)為信息發(fā)布者與信息受眾間的可信度要素.因此,研究在新時(shí)期低活躍度背景下微博社區(qū)信息傳播的規(guī)律、機(jī)理與可信度要素成為面臨的新問題.

學(xué)術(shù)界關(guān)于信息傳播模型的研究方法主要集中在獨(dú)立瀑布模型、線性閾值模型、博弈論模型和傳染病模型上.在這四種方法中,通常認(rèn)為信息傳播與傳染病傳播有極大的相似性,傳染病在人際網(wǎng)絡(luò)中的擴(kuò)散可以類比為信息在社交網(wǎng)絡(luò)中的擴(kuò)散,因此傳染病模型被廣泛的應(yīng)用于信息傳播研究中.而在傳染病模型中以SIR模型[1]的研究最為廣泛、深入,學(xué)者們還考慮了不同的傳播環(huán)境以及網(wǎng)絡(luò)結(jié)構(gòu)等因素.Zanette[2-3]在小世界網(wǎng)絡(luò)上建立了SIR信息傳播模型,研究了不實(shí)信息在小世界網(wǎng)絡(luò)中的傳播狀況;李可嘉等[4]在SIR模型的基礎(chǔ)上引入了熱傳播節(jié)點(diǎn),認(rèn)為在不加控制的情況下網(wǎng)絡(luò)信息會(huì)傳播給特定網(wǎng)絡(luò)中的大多數(shù)節(jié)點(diǎn);May等[5]通過研究無標(biāo)度網(wǎng)絡(luò)上的SIR模型得出了當(dāng)網(wǎng)絡(luò)規(guī)模無窮大時(shí),信息傳播的閾值將會(huì)下降到零的結(jié)論;Moreno等[6]構(gòu)建了具有借鑒意義的非均勻隨機(jī)網(wǎng)絡(luò)中的謠言傳播方程;周濤等[7]通過對SIR模型的分析,得出了謠言對節(jié)點(diǎn)會(huì)產(chǎn)生一種與歷史有關(guān)的積累效應(yīng)的結(jié)論;王超等[8]在SIR模型的基礎(chǔ)上考慮了信息傳播過程中的遏制機(jī)制和遺忘機(jī)制,證明了平衡點(diǎn)具有漸進(jìn)穩(wěn)定性的特性,等等.

基于上述基礎(chǔ)研究,SIR傳染病模型在信息傳播領(lǐng)域的應(yīng)用逐漸成熟,在以微博為代表的社會(huì)媒體興起后,學(xué)者們進(jìn)一步發(fā)現(xiàn),由于虛擬網(wǎng)絡(luò)來源于現(xiàn)實(shí)網(wǎng)絡(luò)并與現(xiàn)實(shí)網(wǎng)絡(luò)有相似之處,因此改進(jìn)優(yōu)化后的SIR傳染病模型也適用于微博社區(qū)信息傳播的研究.Yan Gang等[9]以傳染病模型為基礎(chǔ),考慮網(wǎng)絡(luò)權(quán)重對于傳播率的影響,重新定義了傳播率,對本研究有一定借鑒意義;許曉東等[10]在考慮微博社區(qū)信息傳播特征的基礎(chǔ)上利用SIR模型描述了不實(shí)信息傳播過程,同時(shí)應(yīng)用計(jì)算機(jī)仿真分析了網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)以及傳播率對不實(shí)信息擴(kuò)散規(guī)模的影響;郭海霞等[11]在傳統(tǒng)的SIR模型的基礎(chǔ)上考慮了記憶效益、社會(huì)性加固、關(guān)系之間的非冗余性等有關(guān)微博信息傳播的特性,研究了微博的覆蓋率和相關(guān)因素的關(guān)系;劉丹等[12]在SIR模型的基礎(chǔ)上通過將微博用戶分為未轉(zhuǎn)發(fā)用戶、已轉(zhuǎn)發(fā)用戶和已淹沒用戶三種類型,對微博用戶的轉(zhuǎn)發(fā)行為進(jìn)行模擬,并發(fā)現(xiàn)了微博轉(zhuǎn)發(fā)周期以及轉(zhuǎn)發(fā)上下拐點(diǎn)等規(guī)律;丁鑫等[13]在考慮微博網(wǎng)絡(luò)社區(qū)的直接免疫特征后提出了改進(jìn)的SIR模型,認(rèn)為該模型能更好的反映信息的傳播特性,等.

從已有研究分析來看,當(dāng)前對信息傳播模型的研究已經(jīng)比較成熟,在微博社區(qū)中的應(yīng)用也進(jìn)行了眾多有益的嘗試,可以對本研究形成基礎(chǔ)性支撐.但對于微博社區(qū)中出現(xiàn)的低活躍度特征和可信度方面的研究以及模型中的參數(shù)計(jì)算,學(xué)者們還鮮有關(guān)注.因此,本文將基于SIR模型,系統(tǒng)性地借助信息傳播率與免疫率等多參數(shù)對微博社區(qū)的活躍度進(jìn)行計(jì)算和表達(dá),并引入可信度函數(shù),構(gòu)建低活躍度背景下的微博社區(qū)信息傳播模型,提出各個(gè)參數(shù)的計(jì)算方法,進(jìn)一步分析新形勢下微博社區(qū)信息傳播的內(nèi)在機(jī)理以及傳播規(guī)律,并在采集數(shù)據(jù)后利用優(yōu)化模型對微博社區(qū)信息傳播過程進(jìn)行仿真和預(yù)測,為政策引導(dǎo)研究提供理論基礎(chǔ)和現(xiàn)實(shí)依據(jù).

1 SIR模型的適用性分析

經(jīng)典傳染病模型主要包括SI模型、SIS模型和SIR模型三種.三種模型中,SI模型是最基礎(chǔ)的傳染病模型,其與SIS模型只包含傳染人群S態(tài)、已感染疾病并將繼續(xù)傳播的感染人群I態(tài)兩種人群;但SIS模型考慮到易感染疾病可以被治愈,并在治愈后依然會(huì)再次感染并傳播病毒.SIR模型中,學(xué)者將人群區(qū)分為可向外傳染病毒的傳染人群(S態(tài))、易感人群(I態(tài))和已接受免疫或死亡而不在傳播的免疫人群(R態(tài)).SI模型與SIS模型的假設(shè)和傳播機(jī)制與信息傳播的一般規(guī)律不符,而SIR模型因?yàn)榭梢院芎糜成湫畔鞑ジ髦黧w狀態(tài)和過程而被學(xué)者青睞.

SIR傳染病模型假設(shè)傳染病的傳染率為λ,感染人群中的免疫率為μ.那么傳染病的傳染過程可以具體表述為:當(dāng)人群中出現(xiàn)傳染病病源S態(tài)時(shí),傳染人群會(huì)以λ的概率將病毒傳染給易感人群I態(tài),易感人群在感染疾病后,一部分會(huì)變成傳染人群,繼續(xù)以λ的概率傳播病毒給其他易感人群,而另一部分則會(huì)以μ的概率成為免疫人群或者死亡而不會(huì)再傳播病毒給易感人群的R態(tài).

如果用s(t)、i(t)、r(t)表示某時(shí)刻人群中分別處于S態(tài)、I態(tài)和R態(tài)的比率,則SIR模型可以用以下微分方程組表示:

以上模型描述了疾病傳播的基本動(dòng)力學(xué)過程.

信息在人際中傳播的方式與傳染病的傳播的方式十分相似:在信息傳播過程中,信息的發(fā)布源類似于傳染病的傳染源,從未接受過該信息的人群類似于傳染病模型中的易感人群,會(huì)以一定的概率接受信息,并會(huì)繼續(xù)傳播該信息或者最終會(huì)和另一部分沒有接受該信息的人群一樣成為免疫人群,因此將SIR模型的三態(tài)賦予新的意義,就形成了復(fù)雜網(wǎng)絡(luò)中研究信息傳播的基礎(chǔ)模型.在該模型中,S態(tài)表示信息傳播者,即信息發(fā)布源頭;I態(tài)表示沒有接受過信息的人群,即所謂的易感人群;R態(tài)表示接收到信息但不相信或者不再傳播的人,即所謂的免疫人群.在接下來的信息傳播模型的表述中,我們將繼續(xù)使用s(t)、i(t)、r(t)表示某時(shí)刻人群中分別處于S態(tài)、I態(tài)和R態(tài)的比率.

這樣,我們就可以將其傳播過程定義為:處于S態(tài)的人群為微博社區(qū)中微博的發(fā)布者或者初始傳播者,在初始狀態(tài)下只有少量人群處于這種狀態(tài);處于I態(tài)的人群為未接受過該消息的節(jié)點(diǎn),在初始狀態(tài)數(shù)量最多,他們以λ的概率接受消息,I態(tài)在微博社區(qū)網(wǎng)絡(luò)中一般體現(xiàn)為發(fā)起人的粉絲或者n階粉絲,對信息起到傳播作用則表現(xiàn)為對該微博的轉(zhuǎn)發(fā)、評論和點(diǎn)贊行為;處于R態(tài)的人群為以α的概率拒絕該消息或不再傳播的人,在初始狀態(tài)數(shù)量為0.

經(jīng)過上述分析,SIR模型經(jīng)過重新定義后,可以被用來進(jìn)行微博社區(qū)的信息傳播研究,但這一模型基于理想狀態(tài)下的均勻無權(quán)網(wǎng)絡(luò)得出,沒有考慮到現(xiàn)實(shí)中微博社區(qū)的網(wǎng)絡(luò)特性、低活躍度特性及用戶的可信度差別問題,因此需要對模型做出進(jìn)一步優(yōu)化.

2 活躍度要素的引入與表達(dá)

我們將微博社區(qū)用戶的活躍度定義為:在單位時(shí)間內(nèi)使用微博賬號的用戶占全部注冊用戶的比例,為了更能體現(xiàn)活躍度對微博社區(qū)的影響,采用日活躍用戶數(shù)(DAU)指標(biāo)來對活躍度進(jìn)行計(jì)量.通過采集微博發(fā)展黃金時(shí)期的最具代表性的新浪微博2012年第一季度至2013年第一季度的數(shù)據(jù)我們發(fā)現(xiàn),其活躍度一直維持在較低的水平,DAU僅占全部注冊用戶的1/10左右.見表1.

表1 2012.Q1-2013.Q1新浪微博注冊用戶數(shù)和日活躍用戶數(shù)(單位:萬)

因此在進(jìn)行模型研究時(shí),必須將微博社區(qū)的低活躍度因素引入模型,以使模型能夠更接近于現(xiàn)實(shí)狀況.在模型各個(gè)參數(shù)當(dāng)中,活躍度要素首先表現(xiàn)在信息傳播率以及信息免疫率的計(jì)算上.具體來說,計(jì)算微博社區(qū)用戶節(jié)點(diǎn)傳播信息的傳播率和免疫率時(shí),需要在該微博社區(qū)用戶的基數(shù)中剔除長期不使用微博的不活躍用戶或者僵尸用戶的影響,在此基礎(chǔ)上,計(jì)算該用戶節(jié)點(diǎn)發(fā)布的信息在該社區(qū)網(wǎng)絡(luò)中的傳播率或者免疫率.基于此,首先提出信息傳播率的如下定義與算法:

不同的信息在不同的社區(qū)里和不同的時(shí)刻其信息傳播率都是不同的,因此本研究認(rèn)為,模型研究所用的信息傳播率不能通過賦值來獲取,必須來源于現(xiàn)實(shí)研究對象,即特定微博社區(qū)中的某條或者某幾條信息的傳播率.而且在某條或者某幾條信息傳播的過程中,其在不同時(shí)間步的信息傳播率肯定是不同的,取決于時(shí)間步長度的設(shè)定與三態(tài)人群比例的變化.基于上述定義,我們用λt來表示某個(gè)時(shí)間步的特定信息傳播率,即信息傳播效果的度量.信息傳播率λt越高則表明該信息在微博社區(qū)中的傳播效果越好,時(shí)間步長度通過從微博信息發(fā)出后到第一個(gè)時(shí)間步的長度來設(shè)定.微博信息的傳播在社區(qū)中能夠被記錄和度量的只有三種行為:轉(zhuǎn)發(fā)、評論和點(diǎn)贊.其中,轉(zhuǎn)發(fā)為直接傳播行為,集中表現(xiàn)在用戶節(jié)點(diǎn)的粉絲或者n階粉絲對微博信息的轉(zhuǎn)發(fā),該行為可以使微博信息進(jìn)行二次甚至多次傳播,對信息的傳播效果將產(chǎn)生顯著影響.微博信息的評論和點(diǎn)贊的行為則屬于間接傳播,當(dāng)用戶節(jié)點(diǎn)的信息被評論或點(diǎn)贊后,該行為會(huì)對其他用戶在傳播信息時(shí)產(chǎn)生接受或者拒絕的間接影響,形成間接傳播效果.因此,基本的信息傳播率的算法如下:

其中fi表示用戶節(jié)點(diǎn)的粉絲數(shù),即社區(qū)中總的用戶數(shù).但是考慮到微博社區(qū)的用戶低活躍度要素,我們將其中的用戶節(jié)點(diǎn)的粉絲數(shù)優(yōu)化為處于活躍狀態(tài)的粉絲數(shù),按前述數(shù)據(jù),將此因素考慮在內(nèi)之后的λt算法改進(jìn)如下:

在式(3)中,Xt,Yt,Zt分別代表t時(shí)刻三種微博信息的傳播行為次數(shù),即評論、轉(zhuǎn)發(fā)和點(diǎn)贊,參數(shù)a、b、c分別代表他們的權(quán)重.三種行為中,轉(zhuǎn)發(fā)行為可以將微博信息進(jìn)行二次傳播甚至多次傳播,擴(kuò)大了信息的受眾面,其傳播效果影響最大;評論則直接的顯示了受眾對于微博信息的觀點(diǎn)態(tài)度,在一定程度對微博信息進(jìn)行了一定的強(qiáng)化,而點(diǎn)贊僅僅能表明信息受眾閱讀并在一定程度上贊同該信息,因此,評論的影響力強(qiáng)于點(diǎn)贊的影響力但不及轉(zhuǎn)發(fā)行為.所以,在參數(shù)設(shè)置上我們將a、b、c分別設(shè)置為 2、3、1.

用戶對微博信息的免疫程度近似于信息免疫率α,反應(yīng)了信息受眾對于某信息沒有接受并繼續(xù)傳播的意愿,即不會(huì)產(chǎn)生轉(zhuǎn)發(fā)、評論和點(diǎn)贊行為的平均概率.t時(shí)刻的計(jì)算方法應(yīng)是社區(qū)中總的用戶數(shù)減去參與信息傳播的用戶數(shù)后與社區(qū)中總的微博用戶數(shù)的比例,具體算法為:

同樣引入活躍度要素后,α的算法優(yōu)化為:

式(5)中,fi表示用戶節(jié)點(diǎn)的粉絲數(shù),即社區(qū)中總的用戶數(shù).Xt,Yt,Zt分別代表評論、轉(zhuǎn)發(fā)和點(diǎn)贊三種傳播行為的發(fā)生次數(shù).

同理,在本文后續(xù)模型研究中所涉及的參數(shù)計(jì)算,包括可信度函數(shù)、節(jié)點(diǎn)間的連接概率以及連接度等參數(shù),都需要考慮低活躍度因素對其的影響.

3 可信度函數(shù)的引入

在微博社區(qū)信息傳播研究中,除了上述引入的活躍度要素外,還有一個(gè)需要引入的要素就是可信度要素,它是用戶低活躍度特征的最重要影響因素,是用戶間的親密程度、信息發(fā)布者的知名度、影響力以及發(fā)布的信息種類和信息發(fā)布者專業(yè)領(lǐng)域的匹配度等各因素綜合作用的結(jié)果.可信度要素在微博社區(qū)信息傳播中的作用非常重要,例如在某些突發(fā)事件中,即使一個(gè)新加入的節(jié)點(diǎn),或是舊有的普通節(jié)點(diǎn),由于高的可信度,都可能在短時(shí)間內(nèi)成為意見領(lǐng)袖.所以,首先引入微博社區(qū)網(wǎng)絡(luò)中的邊權(quán)ωij,將其理解為節(jié)點(diǎn)間的綜合親密度,本研究中假設(shè)邊權(quán)為相似權(quán),兩節(jié)點(diǎn)之間的權(quán)值越大,則關(guān)系就越親密.因此權(quán)重ωij越大,微博信息被接受的概率也就越大.ωij表示為:

式(6)中,θi為給每一個(gè)節(jié)點(diǎn)賦予的隨機(jī)參數(shù),這一參數(shù)能夠考慮到網(wǎng)絡(luò)中的隨機(jī)沖擊因素來完善網(wǎng)絡(luò)的擇優(yōu)連接特性,同時(shí)也考慮了其他有可能影響連接規(guī)則的因素.在計(jì)算時(shí),采用(0,1)的隨機(jī)數(shù)值,fi為用戶i的粉絲數(shù),ωij在計(jì)算時(shí)應(yīng)考慮低活躍度要素.

基于邊權(quán)的計(jì)算,進(jìn)一步引入可信度函數(shù)φ(k):

φ(k)表示信息在加權(quán)網(wǎng)絡(luò)中的可信度,考慮了權(quán)重對傳播過程的影響.式(7)中,ωij為節(jié)點(diǎn)的邊權(quán),ωM為網(wǎng)絡(luò)中邊權(quán)的最大值,αt為免疫概率.由于微博社區(qū)網(wǎng)絡(luò)結(jié)構(gòu)的無標(biāo)度特性,φ(k)本身服從冪律分布.同時(shí),信息免疫率和可信度之間存在反方向變化的規(guī)律,即信息的可信度越低,信息免疫率會(huì)越高,而 ωij/ωM的取值范圍在0~1之間,因此以t時(shí)刻信息免疫力αt作為可信度φ(k)所服從冪律分布的參數(shù),可以很好的描述這一現(xiàn)象.

此外,可信度在微博社區(qū)中的影響還可以由用戶發(fā)布的信息是否原創(chuàng)和用戶本身是否經(jīng)過實(shí)名認(rèn)證表現(xiàn)出來,因此,可以將φ(k)進(jìn)一步優(yōu)化為:

式(8)中,Di,F(xiàn)i為虛擬變量,當(dāng)用戶為實(shí)名認(rèn)證用戶時(shí)Di=1,當(dāng)用戶為普通用戶時(shí) Di=0.同理,當(dāng)信息為原創(chuàng)信息時(shí)Fi=1,當(dāng)信息非原創(chuàng)時(shí)Fi=0.y為實(shí)名認(rèn)證參數(shù),z為原創(chuàng)參數(shù),這兩個(gè)參數(shù)主要是通過觀察爬取數(shù)據(jù)中加V用戶和普通用戶以及是否原創(chuàng)信息的不同影響效果進(jìn)行計(jì)算.

至此,我們將前文描述的低活躍度要素和可信度函數(shù)引入信息傳播模型,并借鑒非均勻網(wǎng)絡(luò)特征描述后,確定將微博社區(qū)信息傳播的動(dòng)態(tài)微分方程表示為:

式(9)中,λ為信息接受率,α為信息免疫率,sk(t)、ik(t)、rk(t)和 sk’(t)、ik’(t)、rk’(t)分別表示度為k和k'的人群中處于S、I、R三種狀態(tài)的比例,<k>為網(wǎng)絡(luò)的平均度,t為時(shí)間步.

P(k'│k)代表一個(gè)度為k的點(diǎn)與度為k'的點(diǎn)的連接概率,采用包含初始吸引度的DMS的計(jì)算方法.新加入網(wǎng)絡(luò)的用戶在選擇連接節(jié)點(diǎn)時(shí)存在明顯的偏好,其會(huì)優(yōu)先關(guān)注與其生活圈相關(guān)的好友,或是自己感興趣的明星用戶.這種用戶行為就是擇優(yōu)連接行為,而連接的依據(jù)可以理解為被連接節(jié)點(diǎn)的初始吸引度.因此引入含有初始吸引度的DMS算法,來更好的解釋擇優(yōu)連接節(jié)點(diǎn)的概率:

式(10)中μi是根據(jù)實(shí)驗(yàn)選取對象的網(wǎng)絡(luò)規(guī)模所設(shè)置的隨機(jī)變量,表示節(jié)點(diǎn)的初始吸引度.式(9)中的<k>為網(wǎng)絡(luò)的平均度,可衡量網(wǎng)絡(luò)信息中用戶節(jié)點(diǎn)的平均連接度,其算法為:

式(11)中,M和 N分別表示微博社區(qū)網(wǎng)絡(luò)中的邊數(shù)和節(jié)點(diǎn)數(shù),2M是由于每對相鄰節(jié)點(diǎn)之間存在互相連接現(xiàn)象所致.

在t=0的初始時(shí)刻,s(0)>0,i(0)=1-s(0),r(0)=0.

4 信息傳播模型的仿真與預(yù)測

通過引入微博社區(qū)信息傳播的低活躍度要素,并在此背景下引入可信度函數(shù),進(jìn)一步完善和優(yōu)化了微博社區(qū)的信息傳播模型.本部分將對構(gòu)建的模型進(jìn)行驗(yàn)證和仿真分析,并利用仿真結(jié)果進(jìn)行信息傳播趨勢預(yù)測.關(guān)于參數(shù)y和z,考慮到其應(yīng)該通過擴(kuò)大實(shí)驗(yàn)中的網(wǎng)絡(luò)規(guī)模和縮短時(shí)間步間隔來實(shí)現(xiàn),將在后續(xù)研究中予以計(jì)算.在本研究中將通過數(shù)據(jù)采集的樣本體現(xiàn)出兩個(gè)參數(shù)對于信息傳播的影響,因此暫設(shè)置它們?yōu)?.

4.1 數(shù)據(jù)的采集

當(dāng)前國內(nèi)主流的微博媒體都在一定程度上開放了平臺(tái),提供了微博數(shù)據(jù)訪問的API接口.本研究利用新浪微博的API接口,通過python語言編程制作爬蟲程序.爬取的具體流程為首先獲取數(shù)據(jù)用戶的user_id,利用https://api.weibo.com/獲取對應(yīng)user_id下的相應(yīng)需求數(shù)據(jù)的json文本.解析json文本內(nèi)容,從中提取所需的key對應(yīng)的內(nèi)容.由于微博社區(qū)用戶大多數(shù)為普通用戶,所以,本研究在選取研究對象時(shí)也以普通用戶為主,剔除粉絲數(shù)量較大或者較小可能對研究造成的小概率事件,但同時(shí)也必須考慮認(rèn)證用戶等可信度要素在社區(qū)中的影響.故本實(shí)驗(yàn)在選取用戶時(shí),將用戶粉絲數(shù)分布控制在1 000~5 000之間,每相隔1 000個(gè)粉絲為一個(gè)用戶階梯,一共分為4個(gè)階梯,1 000~2 000粉絲的用戶選取10個(gè)用戶,2 000~3 000粉絲的用戶選取10個(gè)用戶,以此類推,每個(gè)階梯選取10個(gè)用戶,5個(gè)實(shí)名認(rèn)證用戶,5個(gè)非實(shí)名認(rèn)證的普通用戶.在數(shù)據(jù)采集過程中,以6天為數(shù)據(jù)采集時(shí)間長度,以每24 h為一個(gè)時(shí)間步作為采集單位,從2014年10月26日凌晨至2014年11月1日凌晨一共采集6 d的數(shù)據(jù),得到6個(gè)時(shí)間步的數(shù)據(jù).采集的數(shù)據(jù)包括用戶的粉絲數(shù),微博數(shù)以及微博的評論數(shù),轉(zhuǎn)發(fā)數(shù),點(diǎn)贊數(shù),微博數(shù)據(jù)包含原創(chuàng)與非原創(chuàng)信息.將初步爬取搜集的數(shù)據(jù)加以整理歸類,并且刪除一些僵尸低質(zhì)用戶后,一共獲得19個(gè)用戶組成網(wǎng)絡(luò)的有效數(shù)據(jù),并通過計(jì)算提取出在傳播模型中需要的各個(gè)參數(shù),為下一步研究提供基礎(chǔ).

為保證用戶隱私,在此隱去用戶昵稱與ID,只用代號表示.見表2~4.實(shí)驗(yàn)搜集數(shù)據(jù)經(jīng)過整理之后,我們發(fā)現(xiàn)數(shù)據(jù)在前三天變化明顯,而后三天變化微小,由于受篇幅所限,僅列出前三天數(shù)據(jù):

表2 第1天微博數(shù)據(jù)

表3 第2天微博數(shù)據(jù)

表4 第3天微博數(shù)據(jù)

4.2 模型的驗(yàn)證與仿真

在提取基礎(chǔ)數(shù)據(jù)之后,首先需要對數(shù)據(jù)進(jìn)行處理,并計(jì)算參數(shù).將搜集的基礎(chǔ)數(shù)據(jù)利用Excel將其歸類計(jì)算,得到每個(gè)用戶在首日固定時(shí)間范圍內(nèi)發(fā)布的微博數(shù)以及在接下來的實(shí)驗(yàn)觀察周期里(本實(shí)驗(yàn)設(shè)置為6 d)的評論數(shù),轉(zhuǎn)發(fā)數(shù),點(diǎn)贊數(shù)的加總與變化.在此基礎(chǔ)上,通過Excel利用前文所述式進(jìn)行初步運(yùn)算,在爬取的M和N的基礎(chǔ)上求出<k>;利用粉絲數(shù)、評論數(shù)、轉(zhuǎn)發(fā)數(shù)和點(diǎn)贊數(shù)求出λ和α.由于在低活度特征下,各態(tài)變化幅度較小,而且在小規(guī)模社區(qū)中各時(shí)間步的信息傳播率相對穩(wěn)定,為有利于信息傳播趨勢的預(yù)測,在仿真中我們假設(shè)λ和α在各個(gè)時(shí)間步不變.在后續(xù)短時(shí)間步和大規(guī)模社區(qū)研究中可通過仿真先對各個(gè)時(shí)間步的λ和α求解后再進(jìn)行模型研究.接下來,計(jì)算考慮到現(xiàn)實(shí)微博社區(qū)中低活躍度特點(diǎn)的φ(k)和P(k’│k),完成參數(shù)計(jì)算.其次,將計(jì)算后的參數(shù)輸入模型,對方程組求解,求解的主要過程是先對方程組進(jìn)行編程,然后利用Matlab軟件進(jìn)行計(jì)算,求出S態(tài),I態(tài),R態(tài)在每個(gè)時(shí)間步的值,最后將S態(tài),I態(tài),R態(tài)三態(tài)在不同時(shí)間步上值的變化趨勢作圖.關(guān)于初始值的設(shè)定,由于經(jīng)計(jì)算求得的信息傳播率均值為0.118 285,所以我們?nèi)?.12作為S態(tài)的初始值;信息開始傳播時(shí)無免疫態(tài),R態(tài)初始值為0;相應(yīng)的I態(tài)的初始值為0.88.在經(jīng)過上述整合與計(jì)算之后,我們利用Matlab軟件得出S態(tài),I態(tài),R態(tài)的變化趨勢圖如下:

通過對S態(tài),I態(tài),R態(tài)的三態(tài)走勢觀察并結(jié)合實(shí)際情況,可以得出如下分析:

在圖1中,I態(tài)主要變化趨勢為穩(wěn)定下降的趨勢,說明兩點(diǎn)問題.第一,隨著時(shí)間步的增加,易感者群體中接受信息的比例逐漸增加,發(fā)布的信息逐漸擴(kuò)散.第二,由于下降的趨勢相對穩(wěn)定,表明隨著時(shí)間的增加,信息擴(kuò)散趨勢無大幅度變化,易感者所占比例逐漸降低,但是下降幅度有限,約為0.1.總的來說,這一趨勢是與微博社區(qū)現(xiàn)狀基本吻合的.由于微博社區(qū)中的大量節(jié)點(diǎn)為廣大普通用戶,目前其參與度有限,對于在社區(qū)中發(fā)表自身意見表現(xiàn)不積極,只瀏覽不參與是一個(gè)突出特點(diǎn);同時(shí),普通用戶擁有的粉絲數(shù)較少,權(quán)威度性低,信息傳播能力有限.這在一定程度上表明,微博社區(qū)中的明星節(jié)點(diǎn)效應(yīng)可以對信息傳播產(chǎn)生巨大影響,進(jìn)而使得I態(tài)在微博社區(qū)中所占比例迅速變化.

圖1 I態(tài)、S態(tài)和R態(tài)所占比例的變化趨勢圖

S態(tài)主要呈現(xiàn)出在第一時(shí)間傳播后的下降態(tài)勢,但在不同的時(shí)間步下降趨勢不同.S態(tài)在前兩個(gè)時(shí)間步里下降的速度較為平緩,即信息傳播率在前兩個(gè)時(shí)間步內(nèi)維持一個(gè)比較高的水平,隨后便開始迅速下降,但是轉(zhuǎn)折性并不顯著,在數(shù)值上逐漸趨于0.出現(xiàn)這種趨勢主要由于微博信息作為一種短壽命周期的信息,其特點(diǎn)是在短時(shí)間內(nèi)高效迅速傳播,隨后由于信息過載的影響,用戶開始關(guān)注更新的信息,而原有微博信息迅速結(jié)束傳播壽命.在我們的實(shí)驗(yàn)中,一個(gè)時(shí)間步為24 h,微博信息傳播的大幅度趨勢變化和轉(zhuǎn)折被平均包含于前兩個(gè)時(shí)間步當(dāng)中,因而雖然有變化的傾向但是并沒有充分體現(xiàn).基于此,本研究將在今后的試驗(yàn)中通過縮短時(shí)間步間隔來對結(jié)果進(jìn)行優(yōu)化.

R態(tài)所占比例呈現(xiàn)逐漸上升的趨勢.這一趨勢表明在微博社區(qū)信息的傳播過程中,不再傳播信息的受眾逐漸增多,信息的傳播力度和影響力度逐漸下降.這也在一定程度上印證了微博信息的短壽命周期,即信息傳播能力隨著時(shí)間的增加而減少直至消失,且如果一條微博信息沒有在壽命周期早期被大范圍直接或間接傳播,其就喪失了大范圍傳播的基本條件,并逐漸淹沒在微博社區(qū)的海量信息碎片之中.R態(tài)主要由接受并傳播信息的I態(tài)和傳播信息的S態(tài)兩部分轉(zhuǎn)變而來,R態(tài)上升的上限必然不能超過S態(tài)的初始值和I態(tài)變動(dòng)的最大幅度之和,所以表現(xiàn)在實(shí)驗(yàn)中最大值出現(xiàn)在0.17左右.

通過對仿真圖的趨勢分析,并與微博社區(qū)傳播現(xiàn)實(shí)情況相印證,可以發(fā)現(xiàn)經(jīng)過優(yōu)化后的信息傳播模型較好的反映了目前低活躍度背景下的微博社區(qū)信息傳播規(guī)律,同時(shí),我們也可以利用采集的6個(gè)時(shí)間步真實(shí)數(shù)據(jù)對仿真結(jié)果進(jìn)行對比驗(yàn)證,以S態(tài)為參照組,利用爬取數(shù)據(jù)計(jì)算出目標(biāo)微博社區(qū)中的信息傳播效果,再將該圖與模型仿真作出對比.信息傳播效果的計(jì)算方法為:

式(12)中,a=2,b=3,c=1,ΔXt、ΔYt和 ΔZt分別表示微博信息每個(gè)時(shí)間步的評論數(shù)、轉(zhuǎn)發(fā)數(shù)和點(diǎn)贊數(shù)的變動(dòng)量.

圖2是利用微博真實(shí)數(shù)據(jù)整理出的信息傳播效果變動(dòng)情況,微博信息傳播的周期(即微博信息從發(fā)出到淹沒的整個(gè)過程)約為6 d,在微博信息傳播過程中,由于因其壽命周期短暫而將信息傳播的轉(zhuǎn)折點(diǎn)包含在第一個(gè)時(shí)間步內(nèi),所以信息傳播率從第一個(gè)時(shí)間步便開始出現(xiàn)了突然下降的現(xiàn)象,在第3個(gè)時(shí)間步開始變緩并且最終逐漸趨近于零,這一趨勢與模型仿真趨勢是基本吻合的.模型在經(jīng)過驗(yàn)證有效后,可以利用優(yōu)化后的模型對信息傳播的趨勢進(jìn)行應(yīng)用,以下是利用Matlab對6個(gè)時(shí)間步之后傳播趨勢進(jìn)行預(yù)測的結(jié)果:

圖2 信息傳播效果變動(dòng)趨勢

圖3 I態(tài)、S態(tài)和R態(tài)所占比例的趨勢預(yù)測

圖3顯示,6個(gè)時(shí)間步以后,S態(tài)人群繼續(xù)快速降低,至第15個(gè)時(shí)間步時(shí),下降速度開始減緩并不斷趨近于零;I態(tài)下降的速度開始減緩,至第15個(gè)時(shí)間步時(shí),基本停止下降,并保持在0.75左右的水平;R態(tài)繼續(xù)上升,至第15個(gè)時(shí)間步時(shí),上升趨勢趨于平緩,并穩(wěn)定在0.25左右.R態(tài)是由I態(tài)和S態(tài)中的各一部分轉(zhuǎn)變而來的,所以R態(tài)上升的最大值不會(huì)超過S態(tài)的初始值和I態(tài)變動(dòng)的最大幅度值之和,反映在上圖中就是R態(tài)在0.25左右開始成為一條漸進(jìn)平行于橫軸的趨勢.

至此,我們完成了模型的優(yōu)化、構(gòu)建、驗(yàn)證與應(yīng)用工作.

5 結(jié)語

本研究基于SIR傳染病模型,結(jié)合微博社區(qū)信息傳播的低活躍度特征,提出信息傳播率與免疫率等參數(shù)的算法,引入可信度函數(shù),構(gòu)建了微博社區(qū)信息傳播模型.利用新浪微博API端口獲取原始數(shù)據(jù),依據(jù)本研究提出的算法對信息傳播率、免疫率、可信度和平均度等參數(shù)進(jìn)行了計(jì)算,并利用Matlab軟件對方程進(jìn)行了求解和仿真,得出S態(tài),I態(tài),R態(tài)的三態(tài)比例變化趨勢圖.經(jīng)過與微博社區(qū)實(shí)際情況的對比分析和與真實(shí)數(shù)據(jù)的對比擬合驗(yàn)證,發(fā)現(xiàn)本研究構(gòu)建的模型是有效的,可以實(shí)現(xiàn)對特定微博社區(qū)信息傳播趨勢進(jìn)行預(yù)測,并且在后續(xù)研究中可通過進(jìn)一步縮短時(shí)間步周期和擴(kuò)大微博社區(qū)規(guī)模來增強(qiáng)信息傳播模型對于信息傳播趨勢的刻畫性.

[1]MURRAY J D.Mathematical biology[M].Berlin:Springer-Verlag,1993.

[2]ZANETTE D H.Critical behavior of propagation on small-world networks[J].Phys.Rev.E,2001,64:050901.

[3]ZANETTE D H.Dynamics of rumor propagation on small-world networks[J].Phys.Rev.E,2002,65:041908.

[4]李可嘉,王義康.改進(jìn)SIR模型在社交網(wǎng)絡(luò)信息傳播中的應(yīng)用[J].電子科技,2013,26(8):168-171.

[5]MAY R M,LLOYD A L.Infection dynamics on scale free networks[J].Phys.Rev.E,2001,64(6):066112.

[6]MORENO Y,NEKOVEE M,PACHECO A F.Dynamics of rumor spreading in complex networks[J].Phys.Rev.E,2004,69:066130.

[7]周 濤,汪秉宏,韓筱璞,等.社會(huì)網(wǎng)絡(luò)分析及其在輿情和疫情防控中的應(yīng)用[J].系統(tǒng)工程學(xué)報(bào),2010,25(6):742-754.

[8]王 超,劉騁遠(yuǎn),胡元萍,等.社交網(wǎng)絡(luò)中信息傳播的穩(wěn)定性研究[J].物理學(xué)報(bào),2014,63(18):180501.

[9]YAN G,ZHOU T,WANG JIE,et al.Epidemic Spread in Weighted Scale-free Networks [J].Chinese Phys.Lett.,2005,22(2):510-513.

[10]許曉東,肖銀濤,朱士瑞.微博社區(qū)的謠言傳播仿真研究[J].計(jì)算機(jī)工程,2011,37(10):272-274.

[11]郭海霞.基于小世界網(wǎng)絡(luò)的微博信息影響力研究[J].情報(bào)科學(xué),2014,32(9):60-63.

[12]劉 丹,殷亞文,宋 明.基于SIR模型的微博信息擴(kuò)散規(guī)律仿真分析[J].北京郵電大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2014,16(3):28-33.

[13]丁 鑫,劉其成,張 偉.一種改進(jìn)的微博網(wǎng)絡(luò)信息傳播與預(yù)測模型[J].中國科學(xué)技術(shù)大學(xué)學(xué)報(bào),2014,44(7):582-589.

猜你喜歡
人群節(jié)點(diǎn)社區(qū)
CM節(jié)點(diǎn)控制在船舶上的應(yīng)用
社區(qū)大作戰(zhàn)
基于AutoCAD的門窗節(jié)點(diǎn)圖快速構(gòu)建
糖尿病早預(yù)防、早控制
概念格的一種并行構(gòu)造算法
3D打印社區(qū)
在社區(qū)推行“互助式”治理
我走進(jìn)人群
財(cái)富焦慮人群
抓住人才培養(yǎng)的關(guān)鍵節(jié)點(diǎn)
合作市| 义乌市| 济阳县| 和林格尔县| 微山县| 昌江| 新邵县| 乌海市| 井研县| 大名县| 隆昌县| 青海省| 盐山县| 朝阳市| 贵溪市| 灵宝市| 武夷山市| 信宜市| 宁阳县| 中西区| 碌曲县| 江永县| 江西省| 绍兴市| 阳城县| 西畴县| 洛宁县| 龙井市| 乡宁县| 小金县| 康平县| 阿图什市| 澄迈县| 乾安县| 涟源市| 科尔| 绥化市| 永泰县| 汾阳市| 略阳县| 岳普湖县|