(江蘇財(cái)會(huì)職業(yè)學(xué)院,江蘇 連云港 222061)
隨著“互聯(lián)網(wǎng)+”時(shí)代的到來(lái),網(wǎng)絡(luò)信息量與日俱增,微博自2006誕生以來(lái),以其獨(dú)樹一幟的簡(jiǎn)短性、開放性、動(dòng)態(tài)性信息傳播風(fēng)格,極大地促進(jìn)了信息傳播與共享,尤其在發(fā)生一個(gè)重大事件或者熱點(diǎn)話題后,便會(huì)出現(xiàn)與這一事件相關(guān)聯(lián)話題跟蹤討論,使得信息在各用戶之間傳遞,因此,微博平臺(tái)已逐漸成為人們獲取信息的主要來(lái)源。
微博文本語(yǔ)言不超過(guò)140個(gè)字,從語(yǔ)法、語(yǔ)義顯示出獨(dú)特的網(wǎng)絡(luò)結(jié)構(gòu),從而形成對(duì)話題事件產(chǎn)生各種情緒、觀點(diǎn)及意見(jiàn),微博作為一種新興的交流媒體,一方面大大促進(jìn)了人們之間的交流,催生了基于微博平臺(tái)的營(yíng)銷手段;另外一方面,微博平臺(tái)已成為許多不良謠言、誹謗等網(wǎng)絡(luò)暴力的陣地,帶來(lái)了諸多不良的社會(huì)負(fù)面影響。
微博用戶在線上交流過(guò)程中明顯表現(xiàn)出強(qiáng)烈的社會(huì)特征,各用戶在微博網(wǎng)絡(luò)中的互相關(guān)注、交流評(píng)價(jià)等行為與網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)間存在相互影響[1],微博話題在各用戶之間傳遞影響著微博網(wǎng)絡(luò)整體發(fā)展和形態(tài);反過(guò)來(lái),微博的網(wǎng)絡(luò)演化也影響著用戶的個(gè)體行為。在信息迅速傳播的年代,非常有必要對(duì)微博進(jìn)行深入的研究。
目前,國(guó)內(nèi)外對(duì)微博數(shù)據(jù)的分析主要分為以下幾個(gè)方面:①對(duì)微博用戶的研究。②對(duì)微博文本語(yǔ)義的研究。③對(duì)微博信息傳播網(wǎng)絡(luò)的研究。目前這幾個(gè)方面,在各個(gè)維度和深度上都取得了一定進(jìn)展,通過(guò)對(duì)微博數(shù)據(jù)進(jìn)行輿論引導(dǎo)、用戶興趣關(guān)聯(lián)推薦等綜合應(yīng)用,從而凸顯出微博的媒體價(jià)值,由于微博環(huán)境的開放性,為網(wǎng)民輿論自由提供了條件,但也有少數(shù)不法分子會(huì)在平臺(tái)上散布煽動(dòng)性言論,因此,運(yùn)用復(fù)雜網(wǎng)絡(luò)方法挖掘微博話題特征具有一定的實(shí)際應(yīng)用價(jià)值。
目前復(fù)雜網(wǎng)絡(luò)由學(xué)者錢學(xué)森給出最為嚴(yán)密的定義:復(fù)雜網(wǎng)絡(luò)即是包含組織、自相似、吸引子、小世界、無(wú)標(biāo)度中部分或全部性質(zhì)的網(wǎng)絡(luò)[2]。它被理解為是一種研究復(fù)雜系統(tǒng)的手段和方法,已廣泛地應(yīng)用到眾多學(xué)科之中,解決各系統(tǒng)中的復(fù)雜現(xiàn)象問(wèn)題,無(wú)論在理論價(jià)值上還是工程應(yīng)用方面都具有重要的意義。
自然界的大量復(fù)雜系統(tǒng)如醫(yī)學(xué)、社會(huì)科學(xué)、經(jīng)濟(jì)學(xué)、物流等都可以用網(wǎng)絡(luò)來(lái)描述,復(fù)雜網(wǎng)絡(luò)的復(fù)雜性主要體現(xiàn)在網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜、網(wǎng)絡(luò)動(dòng)態(tài)進(jìn)化、邊多樣性、動(dòng)力學(xué)復(fù)雜性、節(jié)點(diǎn)多樣性等特點(diǎn)。
復(fù)雜網(wǎng)絡(luò)研究的第一步往往是研究復(fù)雜網(wǎng)絡(luò)性質(zhì),由圖來(lái)表示網(wǎng)絡(luò)性質(zhì),抽象的復(fù)雜網(wǎng)絡(luò)是由點(diǎn)集V和邊集E組成的圖G=(V,E)[3],點(diǎn)集V代表著節(jié)點(diǎn)的數(shù)量,邊集E代表著網(wǎng)絡(luò)邊數(shù)的數(shù) ,復(fù)雜網(wǎng)絡(luò)經(jīng)過(guò)多年的發(fā)展,在計(jì)算機(jī)領(lǐng)域得到了關(guān)注,根據(jù)實(shí)際的網(wǎng)絡(luò)情況,可以將圖分為4種類型:加權(quán)有向圖、加權(quán)無(wú)向圖、無(wú)權(quán)有向圖和無(wú)權(quán)無(wú)向圖[4],為了更客觀反映網(wǎng)絡(luò)結(jié)構(gòu),從多角度描述復(fù)雜網(wǎng)絡(luò)拓?fù)涮匦裕饕卸确植?、平均路徑長(zhǎng)度、聚類系數(shù)等。
劉冰瑤等人[6]通過(guò)一種特征降維方法解決微博語(yǔ)義中存在的高維性和稀疏性;李坤[7]在傳統(tǒng)的FF模型上,提出基于多維特片的用戶決策模型,建立話題傳播模型,并分析用戶變化對(duì)話題傳播的影響。田占偉[8]從節(jié)點(diǎn)拓?fù)浣Y(jié)構(gòu)差異、群落結(jié)構(gòu)兩個(gè)度,分析了微博中信息中傳播的規(guī)律,構(gòu)建了微博信息傳播過(guò)程模型。
復(fù)雜網(wǎng)絡(luò)分析方法無(wú)論是在微博文本上還是話題傳播方面是都是可行的,在復(fù)雜網(wǎng)絡(luò)的相關(guān)參數(shù),如度分布、聚類系數(shù)、平均最短路徑等方面反映了微博語(yǔ)言的語(yǔ)體特征。該研究不僅拓展了復(fù)雜網(wǎng)絡(luò)方法在語(yǔ)言學(xué)領(lǐng)域的應(yīng)用,而且為基于復(fù)雜網(wǎng)絡(luò)的微博內(nèi)容挖掘提供了可行途徑。
與傳統(tǒng)的新聞媒體相比,微博在傳播的速度和深度上遠(yuǎn)比傳統(tǒng)媒體來(lái)得深遠(yuǎn),一些重大新聞事件將微博作為首發(fā)源頭,對(duì)于微博用戶來(lái)說(shuō),了解信息可以選擇感興趣的用戶,也可選擇感興趣的微博,由于微博具有發(fā)布功能、轉(zhuǎn)發(fā)功能、關(guān)注功能和評(píng)價(jià)功能,信息可以通過(guò)多種傳播途徑在用戶之間實(shí)現(xiàn)消息的互通。
微博的傳播特征呈現(xiàn)裂變性、自媒體性、多維特征等性質(zhì),一則話題發(fā)布后,當(dāng)轉(zhuǎn)發(fā)的用戶累積到某個(gè)點(diǎn)時(shí)候,尤其經(jīng)過(guò)大V及公眾人物的發(fā)布之后,信息將會(huì)達(dá)到裂變式傳播,從而使傳播效率大大提高,因此微博具有裂變性;微博的傳播具有自媒體性,信息的分享改變了自上而下的廣播模式,以用戶節(jié)點(diǎn)為核心,實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)的傳播模式,這種自發(fā)傳播性決定了每個(gè)用戶都是消息的傳播者和產(chǎn)生者;微博具有多維特性,話題不僅包含語(yǔ)義類信息,更含有發(fā)布者的個(gè)人情感傾向,有正面評(píng)價(jià)、負(fù)面評(píng)價(jià),也有中立觀點(diǎn),正是由于所持觀點(diǎn)及情感的不同,才會(huì)使話題熱度不斷升高。
“互聯(lián)網(wǎng)+”時(shí)代,隨著社交網(wǎng)絡(luò)的蓬勃發(fā)展,為學(xué)者研究話題傳播提供了海量的實(shí)際數(shù)據(jù),經(jīng)過(guò)多年的成果積淀,研究者們?cè)谠掝}信息傳播模型上取得了突破性的成果,主要有基于網(wǎng)絡(luò)結(jié)構(gòu)的傳播模型、傳染病傳播模型等。
棚寬8~10m、棚長(zhǎng)40~60m、棚高2.3~2.5m。棚架主體寬6~8 cm,可選用竹片或塑鋼材料,根據(jù)氣候條件可做兩三層內(nèi)膜支架,內(nèi)膜支架間距為15~18 cm。
基于網(wǎng)絡(luò)結(jié)構(gòu)的傳播模型,是指經(jīng)過(guò)信息傳播的網(wǎng)絡(luò)結(jié)構(gòu)與鄰居節(jié)點(diǎn)之間的交互關(guān)系對(duì)信息傳播過(guò)程進(jìn)行建模[9]。此類模型中根據(jù)節(jié)點(diǎn)的活動(dòng)狀態(tài)又可分為線性閥值模型、獨(dú)立級(jí)聯(lián)模型,以及在此基礎(chǔ)上產(chǎn)生的擴(kuò)散模型?;诰W(wǎng)絡(luò)結(jié)構(gòu)的傳播模型應(yīng)用在信息影響力擴(kuò)散、個(gè)性化推薦等方面,有著獨(dú)特的優(yōu)勢(shì),但是在研究過(guò)程中缺乏時(shí)效性,未能將網(wǎng)絡(luò)之外的因素考慮在內(nèi)。
基于傳染病傳播模型,復(fù)雜網(wǎng)絡(luò)傳播動(dòng)力學(xué)中研究最廣泛的是流行病傳播,因?yàn)閭魅静〉膫鞑ミ^(guò)程與信息傳播過(guò)程有很大的相似之處,均伴隨著一個(gè)起始、傳播、爆發(fā)和消亡/平息的全過(guò)程,在傳染病模型中,根據(jù)個(gè)體所呈現(xiàn)的受感染狀態(tài)的不同,可分為容易被感染的易感染狀態(tài),具有傳播性的感染態(tài)等,從以上狀態(tài)的不同,提出不同的傳播模型,最經(jīng)典的概率傳播模型有SIR模型和SIS模型,SIR模型適合描述可能再次感染的疾病中,SEIR模型存在一個(gè)潛伏特性的E態(tài)特征,經(jīng)過(guò)潛伏后,才會(huì)出現(xiàn)傳染性。傳染病模型與消息傳播有相通性,但是傳染病模型對(duì)節(jié)點(diǎn)之間的重視不夠,然而微博中的傳播節(jié)點(diǎn)是至關(guān)重要的。
微博環(huán)境下的用戶轉(zhuǎn)發(fā)、點(diǎn)贊、評(píng)論等信息傳播行業(yè)產(chǎn)生了大量的數(shù)據(jù),為信息傳播特征分析提供了良好數(shù)據(jù)支撐[10]。微博中用戶關(guān)系存在3種情況,一是關(guān)注,二是被關(guān)注,三是相互關(guān)注,彼此之間的關(guān)注可以計(jì)算出用戶的出度和入度。
2.3.1 數(shù)據(jù)選取與收集
由于新浪微博對(duì)第三平臺(tái)提供開放的API端口,可以對(duì)其網(wǎng)絡(luò)中的數(shù)據(jù)進(jìn)行操作,包括獲取用戶信息獲取接口,微博文本數(shù)據(jù)獲取等。2019年國(guó)慶節(jié)期間,多部?jī)?yōu)秀的影視作品上映,本研究以2019年10月1日~10月7日之間,“中國(guó)機(jī)長(zhǎng)”話題下的點(diǎn)贊數(shù)大于1 000的微博節(jié)點(diǎn)及節(jié)點(diǎn)間關(guān)系為研究對(duì)象,獲取的數(shù)據(jù)包括用戶ID、用戶名稱、關(guān)注對(duì)象、被關(guān)注對(duì)象、微博文本、點(diǎn)贊數(shù)等,最終獲得數(shù)據(jù)有9 205 100條。
在獲得的數(shù)據(jù)中,共包含了2 001名用戶,存在2 041 020條關(guān)注關(guān)系,以2 001個(gè)用戶作為節(jié)點(diǎn),并以他們之間的互相關(guān)注為連邊,構(gòu)建了微博話題傳播過(guò)程中的復(fù)雜網(wǎng)絡(luò)。
2.3.2 微博話題網(wǎng)絡(luò)分析2.3.2.1 度分析
度是描述單個(gè)節(jié)點(diǎn)屬性的最簡(jiǎn)單又是最重要的概念之一,節(jié)點(diǎn)i的度ki可理解為與節(jié)點(diǎn)i直接相連的邊的數(shù)目,在有向網(wǎng)絡(luò)中,度又可分為出度和入度。
作為網(wǎng)絡(luò)節(jié)點(diǎn)中的微博用戶,其度是指與本節(jié)點(diǎn)直接相連的節(jié)點(diǎn)個(gè)數(shù),節(jié)點(diǎn)的度可以記為:
(1)
通常微博用戶節(jié)點(diǎn)度值的大小反映了該用戶節(jié)點(diǎn)在整個(gè)網(wǎng)絡(luò)中的重要性,圖1描述了該話題中用戶節(jié)點(diǎn)度值的概率分布,反映出節(jié)點(diǎn)度值整體上呈冪律分布。度值大于500的用戶節(jié)點(diǎn),占的份額并不是很多,說(shuō)明這些節(jié)點(diǎn)比其他度低的節(jié)點(diǎn)傳播中占有更大的優(yōu)秀。
圖1 節(jié)點(diǎn)的度
通過(guò)對(duì)較大度的節(jié)點(diǎn)進(jìn)行分析,繪制出微博的入度和出度分布圖,如圖2、圖3所示。
圖2 各節(jié)點(diǎn)出度分布圖
圖3 各節(jié)點(diǎn)入度分布圖
從圖2和圖3中看出,入度最高的前5個(gè)節(jié)點(diǎn)分別是:張涵予、歐豪、杜江、袁泉、張?zhí)鞇?ài)、李沁,說(shuō)明影片因這些明星加快了傳播速度,因?yàn)樗麄兙哂袕?qiáng)大的粉絲,能夠產(chǎn)生口碑效應(yīng)。出度分布隨著度數(shù)增加而人數(shù)降低的分布規(guī)律,與泊松分布較為類似,這些出度較高的用戶表現(xiàn)出于他人較強(qiáng)的交流意愿。
2.3.2.2 聚類系數(shù)分析
Watts和Strogatz將聚類系數(shù)定義為某個(gè)節(jié)點(diǎn)所在鄰居節(jié)點(diǎn)之間連邊的數(shù)據(jù)占可能的最大連邊數(shù)的比例[5],可表示為:
(2)
當(dāng)C取1時(shí)從中獲知網(wǎng)絡(luò)中所有節(jié)點(diǎn)是相連的,本微博話題用戶樣本所得的聚類系數(shù)為0.432,說(shuō)明此網(wǎng)絡(luò)的集聚性較好。集聚系數(shù)越大說(shuō)明了網(wǎng)絡(luò)節(jié)點(diǎn)中任意用戶之間獲得某種關(guān)聯(lián)的可能性也就越大。
2.3.2.3 平均路徑長(zhǎng)度分析
網(wǎng)絡(luò)中平均路徑長(zhǎng)度L可定義為任意兩個(gè)節(jié)點(diǎn)之間的平均值,其公式為:
(3)
通過(guò)軟件計(jì)算出微博關(guān)注網(wǎng)絡(luò)的網(wǎng)絡(luò)直徑為8.733,平均路徑長(zhǎng)度為2.159,說(shuō)明微博在任意2個(gè)用戶間進(jìn)行信息傳播,通過(guò)2.159個(gè)用戶關(guān)聯(lián)即可實(shí)現(xiàn)信息傳播,由此可見(jiàn),微博用戶網(wǎng)絡(luò)結(jié)構(gòu)在一定程序上利于話題在用戶之間共享和傳遞。
通過(guò)引入復(fù)雜網(wǎng)絡(luò)分析方法對(duì)微博話題的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行分析,從度分布、聚類系數(shù)和平均路徑長(zhǎng)度3個(gè)指標(biāo)分析了“中國(guó)機(jī)長(zhǎng)”話題下形成的網(wǎng)絡(luò)結(jié)構(gòu)特點(diǎn),從結(jié)論中可以看出微博用戶具有集群性,話題傳播路徑與用戶的信息分享行為緊密相關(guān),因此需要嚴(yán)格把控關(guān)鍵節(jié)點(diǎn)的控制,嚴(yán)禁負(fù)面言論的產(chǎn)生,引導(dǎo)網(wǎng)絡(luò)中的意見(jiàn)領(lǐng)袖來(lái)提升話題的熱度,在技術(shù)層面上,需要從信息源、內(nèi)容、傳播路徑進(jìn)行監(jiān)管,對(duì)不同節(jié)點(diǎn)發(fā)布信息進(jìn)行限制。在制度上,提高微博中大節(jié)點(diǎn)用戶自律行為,起到規(guī)范和引導(dǎo)的作用。