徐沛東 馬 力 李 培
(西安郵電大學(xué)計(jì)算機(jī)學(xué)院 西安 710061)
情感是人類智能或認(rèn)知的重要標(biāo)志,是驅(qū)動人類行為發(fā)生的一種內(nèi)在的心理動因,它影響著人們的決策、學(xué)習(xí)和交流,并在人們的決策行為中起重要甚至決定性作用,它使人類在解決問題時更富有創(chuàng)造性和靈活性。認(rèn)知心理學(xué)研究表明:人們的信息交流行為是受情感影響的。真實(shí)社會中人們的情感隨其行為表達(dá)出來,并通過社會關(guān)系鏈而傳遞。
在線社交網(wǎng)絡(luò)上人們的情感隨其的網(wǎng)上操作行為表達(dá)出來,并通過不同類別的好友圈的互動而傳播,進(jìn)而影響整個朋友圈。正向的情感有助于傳播正能量,給人們帶來愉快、滿足和幸福的感覺,促進(jìn)社會和諧與進(jìn)步。而負(fù)向的情感則使人們產(chǎn)生不快、憤怒和恐怖的感覺,形成社會不穩(wěn)定情緒的蔓延,甚至帶來社會的動蕩。因此,研究社交網(wǎng)絡(luò)應(yīng)用中群體情感形成與涌現(xiàn)的原因,分析群體網(wǎng)絡(luò)行為與情感產(chǎn)生和傳播之間的影響關(guān)系,研究群體的情感發(fā)現(xiàn)、情感計(jì)算方法、情感傳播機(jī)理與情感演化動力學(xué)模型,對于輿情監(jiān)控,產(chǎn)品營銷,公共事件評論等公共媒體關(guān)注事件有著基礎(chǔ)性的作用。
大量的用戶使用使得每一天都會產(chǎn)生高達(dá)上億的信息,這些海量的信息包含了用戶的各種觀點(diǎn)與情感信息,個人和組織越來越多地把網(wǎng)絡(luò)情感觀點(diǎn)信息用于決策,所以研究這些文本信息對于觀察分析人們對于社會各種現(xiàn)象的不同觀點(diǎn)立場有著非常重要的現(xiàn)實(shí)意義。目前大部分在線社交網(wǎng)絡(luò)情感研究都著重研究文本的情感分析,而忽視了情感在網(wǎng)絡(luò)的傳播分析,隨著情感分析的不斷深入研究和延伸,情感傳播這一研究課題在近些年來開始展開。情感傳播研究是一個涉及了文本分析、復(fù)雜網(wǎng)絡(luò)、信息檢索、傳播學(xué)、心理學(xué)等多個領(lǐng)域的研究課題。本文基于傳統(tǒng)的病毒傳播模型SIR對于構(gòu)建情感網(wǎng)絡(luò)的傳播這一問題進(jìn)行分析。
自然科學(xué)、社會科學(xué)、工程技術(shù)和管理科學(xué)等領(lǐng)域能夠很好地描述互相關(guān)聯(lián)的復(fù)雜模型。以計(jì)算機(jī)、數(shù)學(xué)、統(tǒng)計(jì)物理學(xué)等科學(xué)為分析工具,把復(fù)雜的系統(tǒng)作為研究目標(biāo)。復(fù)雜網(wǎng)絡(luò)簡單地說就是高度復(fù)雜的網(wǎng)絡(luò),沒有一個嚴(yán)格上的定義,目前普遍采用錢學(xué)森給出過的一個描述性的定義:具有自組織、自相似、吸引力、小世界、無標(biāo)度中部分或者全部性質(zhì)的網(wǎng)絡(luò)稱之為復(fù)雜網(wǎng)絡(luò)[1]。
復(fù)雜網(wǎng)絡(luò)一般描述為圖(graph)。用圖結(jié)構(gòu)表示一個復(fù)雜網(wǎng)絡(luò)圖G=(V,E)是一種含有“節(jié)點(diǎn)”(nodes或者 vertices)的集合 V和“邊”(links或者edges)的集合E的數(shù)學(xué)結(jié)構(gòu)。其中集合E的元素為不同節(jié)點(diǎn)的無序組合{u,v},表示節(jié)點(diǎn)之間的關(guān)系(其中 u,v∈V)。如果不區(qū)分 edges(u,v)和 edges(u,v)的兩者關(guān)系,則稱該網(wǎng)絡(luò)圖為無向網(wǎng)絡(luò)圖,否則就成為有向網(wǎng)絡(luò)圖。
輿情傳播的的動力學(xué)模型符合經(jīng)典的SIR病毒傳播模型[2],一般網(wǎng)絡(luò)上的節(jié)點(diǎn)被劃分成了三種狀態(tài):
1)S狀態(tài)為沒有接受過消息的節(jié)點(diǎn)(Igorants),類似于病毒傳播的易感染節(jié)點(diǎn)(Sueceptile),表示不知道消息的個體。
2)I狀態(tài)為消息傳播節(jié)點(diǎn)(Spreaders),類似于病毒傳播的易感染節(jié)點(diǎn)(Infected),表示知道消息并且可以傳播的個體。
圖1 經(jīng)典SIR輿情傳播圖
3)R狀態(tài)為接受消息但不傳播的節(jié)點(diǎn)(Sti?flers),類似于病毒傳播的免疫節(jié)點(diǎn)(Remove),對應(yīng)知道消息但已失去傳播能力或者興趣的個體。
假設(shè)網(wǎng)絡(luò)有N個節(jié)點(diǎn),每一個節(jié)點(diǎn)就代表一個可以傳播信息的個體,節(jié)點(diǎn)之間傳播信息的方式有如下方式[3]:如果一個節(jié)點(diǎn)得到一則消息并且該節(jié)點(diǎn)有興趣傳播給其他節(jié)點(diǎn)(I狀態(tài)),傳播過程該節(jié)點(diǎn)隨機(jī)地從相鄰節(jié)點(diǎn)選取節(jié)點(diǎn)進(jìn)行消息傳遞,如果該相鄰節(jié)點(diǎn)并未知曉該消息(S狀態(tài)),則該節(jié)點(diǎn)就接收到消息(I狀態(tài)),并進(jìn)行下一次傳播。如果該節(jié)點(diǎn)事先知道該一消息并且沒有興趣繼續(xù)傳遞則變成不傳播狀態(tài)(R狀態(tài))。不同個體之間的傳播概率存在差異,不同拓?fù)浣Y(jié)構(gòu)的社會網(wǎng)絡(luò)傳播規(guī)律也不相同。
基于上文介紹社交網(wǎng)絡(luò)復(fù)雜網(wǎng)絡(luò)理論,采用圖的概念來構(gòu)建情感網(wǎng)絡(luò)。定義情感網(wǎng)絡(luò)圖結(jié)構(gòu):用圖結(jié)構(gòu)表示,一個情感網(wǎng)絡(luò)圖G=(V,E,P),其中V表示情感網(wǎng)絡(luò)中所有節(jié)點(diǎn)的結(jié)合(nodes),E表示為情感網(wǎng)絡(luò)中所有節(jié)點(diǎn)之間連接關(guān)系的集合(edg?es),而P則用來表示情感網(wǎng)絡(luò)中每個節(jié)點(diǎn)情感的屬性(emotion)。
定義情感網(wǎng)絡(luò)個體情感屬性類別:在情感網(wǎng)絡(luò)圖G=(V,E,P)中,P表達(dá)的屬性分為三種情感可能正向情感(Positive emotion)、負(fù)向情感(negative emotion)、中性情感(neutral emotions)。即在一個情感網(wǎng)絡(luò)中某一個節(jié)點(diǎn)的情感屬性只能是上述定義的三種情感之一[4]。
基于上文介紹的SIR輿情傳播模型基礎(chǔ)上提出基于SIR的情感傳播模型[5],重新定義S狀態(tài)、I狀態(tài)、R狀態(tài)在情感傳播中意義如下:
1)S狀態(tài)為沒有有任何情感的特征,默認(rèn)的設(shè)定為節(jié)點(diǎn)的情感處于中性情感狀態(tài)。
2)I狀態(tài)為個體受到情感刺激具有了情感情緒,此時節(jié)點(diǎn)的情感呈現(xiàn)正向情感狀態(tài)或者負(fù)向情感狀態(tài)之一,并且節(jié)點(diǎn)的情感狀態(tài)具有傳播給下一節(jié)點(diǎn)的可能。
3)R狀態(tài)為接受到其他節(jié)點(diǎn)的情感傳遞,但情感的屬性在該節(jié)點(diǎn)發(fā)生了反向轉(zhuǎn)變,從接受的正向情感轉(zhuǎn)換為了負(fù)向情感或者負(fù)向情感轉(zhuǎn)換為了正向情感,并且節(jié)點(diǎn)的情感狀態(tài)具有傳播給下一節(jié)點(diǎn)的可能。
情感網(wǎng)絡(luò)中初始S狀態(tài)有若干個體受到情感刺激轉(zhuǎn)變?yōu)镮狀態(tài),記α為I狀態(tài)向相鄰S狀態(tài)個體刺激并使之變?yōu)镮狀態(tài)的概率,β為I狀態(tài)向相鄰S狀態(tài)個體刺激并使之變?yōu)镽狀態(tài)的概率,λ為R狀態(tài)向相鄰S狀態(tài)個體刺激并使之變?yōu)镽狀態(tài)的概率,其中α?β。
因此情感網(wǎng)絡(luò)的傳播模型可以使用如下圖的不同節(jié)點(diǎn)之間的狀態(tài)轉(zhuǎn)移圖表示。
圖2 情感網(wǎng)絡(luò)傳播模型圖
針對上述所提出的轉(zhuǎn)移狀態(tài)模型,令s(t),i(t),r(t)分別代表著t時刻S態(tài)、I態(tài)、R態(tài)節(jié)點(diǎn)在情感網(wǎng)絡(luò)中的個體密度,N為系統(tǒng)個體總數(shù),則情感網(wǎng)絡(luò)中I態(tài)的個體密度隨時間的變化率為[6]
情感網(wǎng)絡(luò)中R態(tài)的個體密度隨時間的變化率為
由于s(t)+i(t)+r(t)=1,情感網(wǎng)絡(luò)中S態(tài)的個體密度隨時間的變化率為
推出基于SIR情感網(wǎng)絡(luò)傳播的動力學(xué)行為可以用如下微分方程描述:
在上式中,第一個方程式表示了S狀態(tài)中性情感節(jié)點(diǎn)的變化率;第二個式子則表示了受到情感刺激I狀態(tài)情感節(jié)點(diǎn)的變化率;最后的第三個式子表示了情感傳播過程情感發(fā)生反向轉(zhuǎn)移的R狀態(tài)節(jié)點(diǎn)變化率。
在上文所建立的情感網(wǎng)絡(luò)傳播模型當(dāng)中,引入了三個概率參數(shù),α為中性情感受到刺激變?yōu)橹饕楦蓄愋偷膫鞑ジ怕剩聻楣?jié)點(diǎn)發(fā)生反向情感轉(zhuǎn)移概率,λ為反向情感發(fā)生持續(xù)傳播概率。下面將給出基于基于SIR的情感網(wǎng)絡(luò)傳播模型的仿真結(jié)果[7~8],分析不同類型節(jié)點(diǎn)在傳播過程當(dāng)中節(jié)點(diǎn)密度的變化規(guī)律。
圖3 情感網(wǎng)絡(luò)傳播模型仿真結(jié)果
上圖給出了分別代表著t時刻S態(tài)、I態(tài)、R態(tài)節(jié)點(diǎn)在情感網(wǎng)絡(luò)中的個體密度的s(t),i(t)和r(t)隨時間t變化的曲線。在仿真時給定了s(0)=0.98和i(0)=0.02的初始值,令α=0.3,β=0.02,λ=0.2。在情感網(wǎng)絡(luò)中所有節(jié)點(diǎn)最后都會被感染成為具有情感傾向的節(jié)點(diǎn),有圖可以看出S狀態(tài)節(jié)點(diǎn)的密度會呈現(xiàn)由慢到快咱變慢的速率逐步下降受到感染轉(zhuǎn)變?yōu)槠渌麪顟B(tài),I與R狀態(tài)節(jié)點(diǎn)密度與S狀態(tài)節(jié)點(diǎn)成相反趨勢,而I狀態(tài)節(jié)點(diǎn)密度會大幅度增大,R狀態(tài)節(jié)點(diǎn)密度感染概率所占比例非常的小,最大幅度的狀態(tài)轉(zhuǎn)移在t為15左右的時間段發(fā)生,大約在t大于30之后三種狀態(tài)節(jié)點(diǎn)的密度區(qū)域穩(wěn)定不在發(fā)生轉(zhuǎn)移。
選取目前我國應(yīng)用最為廣泛的社交網(wǎng)絡(luò)新浪微博240名用戶關(guān)系數(shù)據(jù)作為模擬數(shù)據(jù)[9],把微博注冊用戶看作為情感網(wǎng)絡(luò)節(jié)點(diǎn),用戶之間的好友關(guān)系表示為連接節(jié)點(diǎn)的邊,用戶對于同一事件的情感態(tài)度作為節(jié)點(diǎn)的情感屬性,從而構(gòu)建了具有現(xiàn)實(shí)參考的情感傳播網(wǎng)絡(luò)圖G=(V,E,P)。如圖4(a)利用R語言模擬出所有用戶的可視化關(guān)系網(wǎng)絡(luò)圖,圖4(b)表示保留主要用戶關(guān)系利用Kamada-Kawai算法生成出的可視化主要關(guān)系網(wǎng)絡(luò)圖[10]。
圖4 微博用戶關(guān)系網(wǎng)絡(luò)圖(a)與主要關(guān)系圖(b)
利用上文提出的情感傳播模型在社交網(wǎng)絡(luò)進(jìn)行情感傳播模擬仿真,選用在仿真時給定了s(0)=0.98和i(0)=0.02的初始值,令α=0.3,β=0.02,λ=0.2。所以給定初始隨機(jī)有5個節(jié)點(diǎn)受到了正性的情感刺激(深色),其余節(jié)點(diǎn)都是中性情感節(jié)點(diǎn)(淺色),所以如圖5(a)在t=0時,有5個節(jié)點(diǎn)受到刺激;圖5(b)表示在t=10時,正性情感的節(jié)點(diǎn)開始大范圍增多,并且有反向負(fù)性情感出現(xiàn)(黑色)[11]。
圖5 情感傳播可視化圖t=0(a)與t=10(b)
圖6(a)表示在t=20時,正向情感基本已經(jīng)完成傳播傳播過程,中性情感剩下的節(jié)點(diǎn)已經(jīng)不多,負(fù)向情感節(jié)點(diǎn)也有一定程度增長;圖6(b)表示在t=30時,傳播基本已經(jīng)完成,中性情感節(jié)點(diǎn)基本沒有,正負(fù)向情感按照大比例在網(wǎng)絡(luò)節(jié)點(diǎn)中分布。
圖6 情感傳播可視化圖t=20(a)與t=30(b)
該微博社交網(wǎng)絡(luò)用戶的模擬情感傳播過程基本符合了情感網(wǎng)絡(luò)傳播的仿真趨勢,說明了在現(xiàn)實(shí)的情感傳播過程中主要情感在傳播過程中占到主導(dǎo)地位,清楚地表示了情感網(wǎng)絡(luò)在情感傳播中的個體情感變化過程。
本文基于復(fù)雜網(wǎng)絡(luò)的一般描述圖論提出了情感網(wǎng)絡(luò)圖的概念,基于SIR輿情傳播模型改進(jìn)提出了基于SIR的情感傳播模型,并對模型進(jìn)行了動力學(xué)方程描述仿真,說明了情感在網(wǎng)絡(luò)傳播過程的狀態(tài)的變化過程,最后基于現(xiàn)實(shí)微博用戶數(shù)據(jù)進(jìn)行傳播過程驗(yàn)證。但對于有向網(wǎng)絡(luò)的情感網(wǎng)絡(luò)傳播研究不夠,未來擬對于具有方向性的傳播過程進(jìn)行更深入研究。
[1]Zhou Tao,F(xiàn)u Zhongqian,Niu Yongwei,etc.On the com?plex network transmission dynamics research review[J].Progress in natural science,2005,15(5):513-518.
[2]丁兆云,賈焰,周斌,等.社交網(wǎng)絡(luò)影響力研究綜述[J].計(jì)算機(jī)科學(xué),2014,41(1):48-53.DING Zhaoyun,JIA Yan,ZHOU Bing,et al.Survey of In?fluence Analysis for Social Networks[J].Computer Sci?ence,2014,41(1):48-53.
[3] Barrat A,Barthlemy M,Vespignani A.Dynamical pro?cesses on complex networks[J].2008(3).
[4]馬力,宮玉龍.文本情感分析研究綜述[J].電子科技,2014,27(11):180.MA Li,GONG Yulong.Research on the Text Sentiment Analysis[J].Electronic Sci.&Tech,2014,27(11):180.
[5]An Analysis of Knowledge Chain Based on Social Network Theory[J].Journal of Information,2007.
[6]Earn D J D.Mathematical epidemiology of infectious dis?eases[J].Mathematical Biology,2009:153-186.
[7]Jeong B H,Mason.SP,Barabasi AL,Oltvai ZN.2001.Lethality and centrality in protein networks.Nature 411:41-42[J].2015.
[8]Wu F,Huberman B A,Adamic L A,et al.Information flow in social groups[J].Physica A Statistical Mechanics&Its Applications,2003,337(1-2):327-335.
[9]曹玖新,吳江林,石偉,等.新浪微博網(wǎng)信息傳播分析與預(yù)測[J].計(jì)算機(jī)學(xué)報(bào),2014(4):779-790.CAO Jiuxin,WU Jianglin,SHI Wei,et al.Sina Microblog Information Diffusion Analysis and Prediction[J].Chinese Journal of Computers,2014(4):779-790.
[10]Kamada T,Kawai S.An algorithm for drawing general undirected graphs[J].Information Processing Letters,1989,31(1):7-15.
[11]Krivitsky P N,Handcock M S.A Separable Model for Dy?namic Networks.[J].Journal of the Royal Statistical Soci?ety,2014,76(1):29-46.