楊瀟坤 周書環(huán) 劉 庸
(1.蘭州大學(xué)易班發(fā)展中心大數(shù)據(jù)中心 蘭州 730030;2.蘭州大學(xué)西北少數(shù)民族研究中心 蘭州 730030;3.中山大學(xué)傳播與設(shè)計(jì)學(xué)院 廣州 510220;4.中山大學(xué)國家治理研究院 廣州 510220)
2003年“非典”疫情發(fā)生時(shí),全國網(wǎng)民僅有6 800 萬[1],而在新冠肺炎疫情爆發(fā)的當(dāng)下,網(wǎng)民數(shù)量增至8.54 億,互聯(lián)網(wǎng)普及率為61.2%[2]。隨著社交網(wǎng)絡(luò)服務(wù)(Social Networking Services,SNS)的飛速發(fā)展和即時(shí)通訊軟件的廣泛普及,突發(fā)事件引發(fā)的社會(huì)輿論不只是再依靠手機(jī)短信、人際溝通等“點(diǎn)對(duì)點(diǎn)”的形式傳播,而更多地是通過微博、貼吧等社交媒體進(jìn)行病毒式、指數(shù)式、爆炸式的群體化傳播。新冠肺炎疫情發(fā)生后,人們?cè)诟鞔笊缃黄脚_(tái)上圍繞疫情相關(guān)話題展開了激烈討論,推動(dòng)著信息的聚集和情緒的疊加,迅速形成了輿論熱點(diǎn)。作為輿論學(xué)研究的重點(diǎn)關(guān)注領(lǐng)域,情緒被視為一種輿論形式:潛在輿論是意見的萌芽或潛伏狀態(tài),情緒則是其唯一外部形態(tài)[3]。在互聯(lián)網(wǎng)時(shí)代,網(wǎng)絡(luò)情緒作為人們藉由網(wǎng)絡(luò)互動(dòng)和媒介傳播產(chǎn)生的相對(duì)穩(wěn)定的普遍情緒體驗(yàn),更成為網(wǎng)絡(luò)輿情的主要構(gòu)成內(nèi)容[4]。網(wǎng)絡(luò)情緒通過網(wǎng)絡(luò)動(dòng)員機(jī)制影響網(wǎng)絡(luò)輿情朝特定方向發(fā)展,在輿情的生成擴(kuò)散中發(fā)揮著關(guān)鍵作用[5]。由于新冠肺炎疫情與人們有著重大利害關(guān)系,因此易滋生恐慌、焦慮等情緒。一旦任由這類負(fù)面情緒通過社交媒體傳播彌漫,極有可能導(dǎo)致偏激、片面、非理性的“情緒型輿論”充斥網(wǎng)絡(luò)空間,進(jìn)而誘發(fā)輿情風(fēng)險(xiǎn)和次生危機(jī)。對(duì)應(yīng)的,倘若及時(shí)疏導(dǎo)網(wǎng)絡(luò)輿情中的消極情緒、提升積極情緒,則有助于正確引導(dǎo)網(wǎng)絡(luò)輿論走向,形成情理交融的“意見自由市場”。
盡管既有研究文獻(xiàn)對(duì)于各類突發(fā)事件輿情中的網(wǎng)絡(luò)情緒有所考察,也取得了一定的成果,但是較為缺少專門針對(duì)重大突發(fā)傳染病事件的網(wǎng)絡(luò)情緒研究,加之以往研究關(guān)于突發(fā)事件輿情中網(wǎng)絡(luò)情緒的傳播效果問題仍存在爭議,因此值得進(jìn)一步展開討論。新浪微博在國內(nèi)擁有數(shù)量龐大的用戶群體和廣泛的影響力。與百度貼吧、微信等社交媒體相比,新浪微博具有互動(dòng)功能強(qiáng)、用戶主體類型多元、信息開放式傳播等突出特點(diǎn),是當(dāng)前國內(nèi)網(wǎng)絡(luò)輿情研究的主要陣地,也是網(wǎng)絡(luò)情緒顯現(xiàn)的重要社交平臺(tái)之一。鑒于此,本文基于對(duì)新浪微博平臺(tái)的輿情數(shù)據(jù)挖掘,分析新冠肺炎疫情期間網(wǎng)絡(luò)情緒的類型傾向、演化過程及傳播效果,以期為重大突發(fā)傳染病事件發(fā)生后政府相關(guān)部門的網(wǎng)絡(luò)輿情治理和情緒引導(dǎo)工作提供切實(shí)的參考。
網(wǎng)絡(luò)情緒不僅是諸多交叉學(xué)科關(guān)注的熱點(diǎn),也是輿情研究必然涉及的對(duì)象[6]。迄今為止,國內(nèi)外針對(duì)突發(fā)事件輿情中的網(wǎng)絡(luò)情緒問題已經(jīng)開展了大量研究工作,積累了相當(dāng)數(shù)量的研究成果。以往研究重點(diǎn)討論的課題歸納起來主要集中在網(wǎng)絡(luò)情緒的類型、演化和傳播效果三個(gè)方面。
從海量輿情數(shù)據(jù)中識(shí)別主觀的文本信息,將發(fā)言者對(duì)突發(fā)事件的情感態(tài)度分門別類是網(wǎng)絡(luò)情緒研究的主要目的之一。根據(jù)方法取向的不同,大體上可將相關(guān)研究分為理論分類和技術(shù)分類兩種。依賴于理論歸納和傳統(tǒng)方法,前者通過現(xiàn)象分析或測量工具對(duì)網(wǎng)絡(luò)情緒予以分類。如孫立明基于網(wǎng)絡(luò)現(xiàn)象理論劃分出網(wǎng)絡(luò)情緒的5 種表現(xiàn)[4];Bollen 等人使用心理量表提取出Twitter平臺(tái)上常見的6 種網(wǎng)絡(luò)情緒[7]。隨著大數(shù)據(jù)時(shí)代用戶生成的數(shù)據(jù)空前增長,理論分類已經(jīng)無法滿足研究需求,學(xué)者們開始運(yùn)用自然語言處理技術(shù)識(shí)別網(wǎng)絡(luò)情緒類型。此類研究以情緒傾向性分析為主,將突發(fā)事件輿情中的網(wǎng)絡(luò)情緒傾向分為正面、中性和負(fù)面三種或者積極和消極兩種[8-10]。然而,網(wǎng)絡(luò)情緒的復(fù)雜性往往無法以單純的正中負(fù)等傾向加以概括,如何通過技術(shù)手段識(shí)別更細(xì)粒度的情緒類型愈發(fā)引起研究者的重視。盡管不同情緒之間的黏合性和關(guān)聯(lián)性使得多情緒分類被視為一項(xiàng)復(fù)雜的工作,仍有學(xué)者在這一方面作出了積極的嘗試[11-12]。
在網(wǎng)絡(luò)情緒的多分類或傾向性分析的基礎(chǔ)上,動(dòng)態(tài)地考察網(wǎng)絡(luò)情緒的演化過程有助于研究者研判輿情形勢、把握輿情規(guī)律。相關(guān)研究或從多個(gè)情感維度分析高校輿情事件中微博情緒的變化趨勢[13],或根據(jù)網(wǎng)絡(luò)情緒熱度總結(jié)災(zāi)難事故發(fā)生后網(wǎng)絡(luò)輿情的演化態(tài)勢[14],或結(jié)合輿情生命周期描畫網(wǎng)絡(luò)情緒的演進(jìn)過程[15]。總體來看,大部分研究均表明,突發(fā)事件輿情中的網(wǎng)絡(luò)情緒呈現(xiàn)出由消極向積極演化的特點(diǎn)。例如,姜金貴等人以“紅黃藍(lán)虐童事件”為例,發(fā)現(xiàn)事件初期微博輿情中消極情緒比例較高,隨著時(shí)間的推移,積極情緒占比逐漸增加[16];Nagy 和Stamberger分析2010年9月加州天然氣爆炸事故發(fā)生后24 小時(shí)內(nèi)Twitter 平臺(tái)上的用戶情緒發(fā)現(xiàn),事故發(fā)生后的前12 個(gè)小時(shí)負(fù)面情緒占比遠(yuǎn)大于正面情緒,隨后正面情緒比例逐漸上升并超過負(fù)面情緒[17];Vo 和Collier 針對(duì)日本地震期間Twitter用戶情緒的研究也發(fā)現(xiàn),在地震發(fā)生后的短時(shí)間內(nèi),Twitter 發(fā)文的內(nèi)容以消極情緒為主,而在經(jīng)歷了地震帶來的恐懼和焦慮后,表達(dá)積極情緒的內(nèi)容數(shù)量逐漸增加[18]。
相較于情報(bào)學(xué)視閾下輿情研究對(duì)于網(wǎng)絡(luò)情緒類型及演化問題的關(guān)注,傳播學(xué)領(lǐng)域的研究者更加感興趣于網(wǎng)絡(luò)輿論中的情緒傳播問題。情緒傳播是指個(gè)體或群體的情緒及與其伴隨信息的表達(dá)、感染和分享的行為[19]。網(wǎng)絡(luò)輿論中的情緒主要通過網(wǎng)民發(fā)布的包含情緒因素或由情緒因素引發(fā)的言論傳播。情緒社會(huì)分享理論(Social Sharing of Emotion)指出,情緒事件發(fā)生后,個(gè)體傾向于自愿同他者分享自己的情緒體驗(yàn),情緒的分享又將誘發(fā)次級(jí)的分享行為,而置身于情緒分享環(huán)境中的個(gè)體所受到的情緒誘導(dǎo)強(qiáng)度愈高,其分享意愿便愈強(qiáng)烈[20]。這一理論為研究者解釋突發(fā)事件輿情中網(wǎng)絡(luò)情緒傳播的機(jī)制提供了思路。然而,以往研究在不同情緒傾向的網(wǎng)絡(luò)輿論的傳播效果問題上卻并未達(dá)成一致。一種觀點(diǎn)認(rèn)為,突發(fā)事件輿情中相較于正面情緒和負(fù)面情緒,表達(dá)中性情緒的輿論更易于傳播。例如,Neppalli等人分析2012年颶風(fēng)“桑迪”(Hurricane Sandy)事件的Twitter 輿情發(fā)現(xiàn),情緒傾向性明顯的輿論通常是個(gè)人觀點(diǎn)和情感的宣泄,所包含的信息量較小,而表達(dá)中性情緒的輿論更加客觀,信息量也更大,因此更容易被傳播[21];Chen 等人則分析了颶風(fēng)“哈維”(Hurricane Harvey)事件中網(wǎng)民在Twitter 上的情緒反應(yīng),也發(fā)現(xiàn)表達(dá)中性情緒的輿論轉(zhuǎn)發(fā)量最大,正面情緒次之,而負(fù)面情緒輿論的傳播效果最差[22]。另一種觀點(diǎn)則認(rèn)為,突發(fā)事件輿情中具有明顯情緒傾向的輿論更易于傳播,特別是表達(dá)負(fù)面情緒的輿論[23-24]。劉叢等人針對(duì)2013年24 起輿情事件的微博情緒研究也得出了類似結(jié)論,即新浪微博上關(guān)注度高的輿情事件以負(fù)面事件為主,網(wǎng)民主要將微博作為消極情緒的宣泄口,所以負(fù)面情緒更容易在微博上廣泛傳播,而正面情緒與微博轉(zhuǎn)發(fā)量之間并無顯著的相關(guān)性[25]。
盡管既有研究成果頗為豐碩,但大部分是以單一事件或自然災(zāi)害、事故災(zāi)難等突發(fā)事件為切入點(diǎn),關(guān)于突發(fā)公共衛(wèi)生事件特別是重大突發(fā)傳染病事件背景下的網(wǎng)絡(luò)情緒研究較少。不同于其他突發(fā)事件,傳染病事件具有易擴(kuò)散、易反復(fù)、持續(xù)時(shí)間較長、涉事人群眾多等性質(zhì)。新冠肺炎疫情被認(rèn)為是新中國成立以來蔓延速度最快、感染范圍最廣、防控難度最大的重大突發(fā)傳染病事件[26],因而疫情期間的輿情情緒具有一定的研究價(jià)值。更重要的是,通過考察重大突發(fā)傳染病事件中網(wǎng)絡(luò)情緒的傳播效果,本文嘗試對(duì)以往研究在這一問題上存在的爭議作出回應(yīng)及補(bǔ)充。綜上所述,提出的研究問題如下:
研究問題一:疫情期間微博輿情中的網(wǎng)絡(luò)情緒分為哪些類型?
研究問題二:疫情期間微博輿情中的網(wǎng)絡(luò)情緒如何演化,呈現(xiàn)出何種特點(diǎn)?
研究問題三:疫情期間不同情緒傾向的微博輿論在傳播效果上有何差異?
本文的總體研究流程框架包括數(shù)據(jù)獲取、數(shù)據(jù)處理和數(shù)據(jù)分析三個(gè)部分(見圖1)。第一部分,通過Python 編寫網(wǎng)絡(luò)爬蟲程序獲取疫情期間新浪微博上的輿情數(shù)據(jù);第二部分,對(duì)所采集原始數(shù)據(jù)進(jìn)行去重、刪失、過濾停用詞、中文分詞等預(yù)處理工作;第三部分,利用情緒詞典、樸素貝葉斯模型和Kruskal-Wallis 檢驗(yàn)的方法分析疫情期間微博輿情中的網(wǎng)絡(luò)情緒。
圖1 研究流程框架圖
由于在新浪微博網(wǎng)頁端(weibo.com)上檢索出的信息存在顯示數(shù)量限制,本文選擇新浪微博移動(dòng)端(m.weibo.cn)作為數(shù)據(jù)源。利用Python 3.7.0 及其自動(dòng)化Web 應(yīng)用程序測試類庫Selenuim 3.6.0 編寫網(wǎng)絡(luò)爬蟲程序,程序?qū)⒆詣?dòng)調(diào)用瀏覽器模擬人為登陸并爬取數(shù)據(jù)。在新浪微博上以“新冠肺炎”和“肺炎疫情”等關(guān)鍵詞進(jìn)行檢索,采集自2019年12月31日至2020年3月4日間的微博用戶發(fā)文及發(fā)布時(shí)間、轉(zhuǎn)發(fā)量等信息。剔除所采集原始數(shù)據(jù)中重復(fù)、缺失、無效或與疫情無關(guān)的數(shù)據(jù)后,獲取有效微博數(shù)據(jù)41612條。需要說明的是,之所以將3月初作為數(shù)據(jù)采集截止時(shí)間,原因在于至3月4日,國內(nèi)疫情頂峰已過[27],且當(dāng)日全國21 個(gè)省份下調(diào)疫情防控應(yīng)急響應(yīng)級(jí)別[28],可以認(rèn)為此時(shí)國內(nèi)疫情形勢已基本穩(wěn)定,對(duì)疫情過程中網(wǎng)絡(luò)情緒的分析已能夠得出較為完整的結(jié)論。
利用Python 的正則表達(dá)式(Regular Expression)及自然語言處理類庫Jieba 0.42.1對(duì)微博文本進(jìn)行分析之前的預(yù)處理工作,具體步驟包括:①清除微博文本中的圖片或視頻鏈接、@其他用戶的內(nèi)容及表情符號(hào);②根據(jù)哈工大停用詞表和常用中文停用詞表過濾微博文本中的停用詞,避免冗余詞匯對(duì)情緒分析的干擾;③基于隱馬爾科夫模型(Hidden Markov Model;HMM)將微博文本切分為若干有意義的詞匯構(gòu)成的詞序列,并將結(jié)果儲(chǔ)存為向量化的詞袋(Bag of Words)形式。本文初步分詞后發(fā)現(xiàn),盡管采用Viterbi 算法的HMM 模型在分詞時(shí)具有發(fā)現(xiàn)新詞的能力,但是對(duì)于“新型冠狀病毒”、“瑞德西韋”、“鐘南山”等術(shù)語人名并不能準(zhǔn)確地識(shí)別。為此,本文將與此次新冠肺炎疫情相關(guān)的專業(yè)術(shù)語或特定詞匯人名整理后添加至自定義詞典并導(dǎo)入分詞系統(tǒng),以優(yōu)化分詞效果。
大數(shù)據(jù)技術(shù)的不斷發(fā)展為研究者捕獲數(shù)量級(jí)空前增長的輿情數(shù)據(jù),并從中萃取有價(jià)值的情緒信息提供了方法支撐。目前應(yīng)用于網(wǎng)絡(luò)情緒分析的主流方法可分為基于詞典的方法和基于機(jī)器學(xué)習(xí)的方法兩大類[29]。前者依托情緒詞典,將輿情文本與詞典中表達(dá)情緒的關(guān)鍵詞加以匹配,通過所提取的情緒關(guān)鍵詞進(jìn)行情緒類型的劃分或情緒傾向的計(jì)算;后者主要采用有監(jiān)督學(xué)習(xí)(Supervised Learning)算法,訓(xùn)練機(jī)器學(xué)習(xí)模型來測定輿情文本的情緒類型或情緒傾向。兩類方法各有利弊,基于詞典的方法更能夠體現(xiàn)文本的非結(jié)構(gòu)化特點(diǎn),易于理解與解釋,但卻嚴(yán)重依賴于情緒詞典的容量與質(zhì)量,詞典中情緒詞的覆蓋率和標(biāo)注準(zhǔn)確率將直接影響分析效果,而基于機(jī)器學(xué)習(xí)的方法雖然在性能上更勝一籌,但是需要人工對(duì)訓(xùn)練語料集進(jìn)行標(biāo)注,耗費(fèi)人力成本和時(shí)間成本。根據(jù)研究問題的不同,本文綜合運(yùn)用兩類方法進(jìn)行網(wǎng)絡(luò)情緒分析,同時(shí)通過統(tǒng)計(jì)檢驗(yàn)的手段比較不同網(wǎng)絡(luò)情緒的傳播效果差異。
2.4.1 情緒詞典匹配
利用基于詞典的方法識(shí)別疫情期間微博輿情中的網(wǎng)絡(luò)情緒類型。將大連理工大學(xué)信息檢索研究室構(gòu)建的情感詞匯本體庫與所采集微博文本進(jìn)行匹配,提取文本中的情緒關(guān)鍵詞。情感詞匯本體庫涵蓋27 466 個(gè)情感詞,所有詞匯被劃分為7 大類21 小類,分別為:好,包括贊揚(yáng)、喜愛和祝愿等褒義情緒;樂,包括快樂、安心等正面情緒;怒,指憤怒等喚醒度較高的負(fù)面情緒;哀,指悲傷、失望、愧疚等喚醒度較低的消極情緒;懼,包括恐懼、慌亂等貶義情緒;惡,指憎惡、貶責(zé)、懷疑、妒忌等負(fù)面情緒;驚,包括驚奇、驚訝等情緒[30]。
2.4.2 樸素貝葉斯模型
借助Python 3.7.0 及其機(jī)器學(xué)習(xí)類庫Scikitlearn 0.21.2 構(gòu)建基于樸素貝葉斯(Naive Bayes)算法的機(jī)器學(xué)習(xí)模型測定微博文本的情緒傾向,并以天為時(shí)間粒度考察疫情期間網(wǎng)絡(luò)情緒的演化趨勢。作為經(jīng)典的生成模型(Generative Model),樸素貝葉斯算法具有易于實(shí)現(xiàn)、學(xué)習(xí)和預(yù)測效率較高的優(yōu)點(diǎn)[31]47。模型先通過訓(xùn)練數(shù)據(jù)學(xué)習(xí)特征(Feature)與標(biāo)簽(Label)的聯(lián)合概率分布,然后計(jì)算后驗(yàn)概率分布,依據(jù)期望風(fēng)險(xiǎn)最小化原則預(yù)測給定特征時(shí)的標(biāo)簽[32]。根據(jù)貝葉斯準(zhǔn)則和條件獨(dú)立性假設(shè)進(jìn)行推導(dǎo)[31]52-53,下式給出了微博文本情緒屬于正向的概率:
公式(1)中,h(·)為樸素貝葉斯模型的假設(shè)函數(shù),S 為表示正向情緒的標(biāo)簽,w 為向量化的文本特征。公式(1)計(jì)算得到的概率即文本的情緒傾向值,用于反映文本情緒趨近于正面的程度。作為概率,情緒傾向值介于0~1 之間,愈接近1 說明微博文本的情緒愈積極,愈接近0 則情緒愈消極。
2.4.3 Kruskal-Wallis 檢驗(yàn)
根據(jù)樸素貝葉斯模型測定的情緒傾向值將疫情期間的微博情緒分為負(fù)面(情緒傾向值介于0 ~0.3 之間)、中性(情緒傾向值介于0.3 ~0.6之間)和正面(情緒傾向值介于0.6 ~1 之間)三類,同時(shí)以微博轉(zhuǎn)發(fā)量作為衡量傳播效果的表征指標(biāo),采用Kruskal-Wallis 檢驗(yàn)的方法比較疫情期間表達(dá)不同情緒的微博輿論在傳播效果上的差異。Kruskal-Wallis 檢驗(yàn)屬于單因素方差分析中的一種非參數(shù)方法,基本原理是將連續(xù)尺度的數(shù)據(jù)轉(zhuǎn)化為秩(Rank),從而擺脫總體分布對(duì)統(tǒng)計(jì)檢驗(yàn)的限制[33]。如果數(shù)據(jù)不滿足單因素方差分析的正態(tài)性假設(shè)或方差齊性假設(shè),則可以選擇Kruskal-Wallis 檢驗(yàn)作為一種替代的統(tǒng)計(jì)檢驗(yàn)方法。Kruskal-Wallis 檢驗(yàn)構(gòu)造的H 統(tǒng)計(jì)量根據(jù)下式計(jì)算[34]:
公式(2)中,k 為獨(dú)立樣本組數(shù),本文中即3 組微博情緒類別,ni 為第i 組樣本數(shù),N 為樣本總數(shù),為第i 組樣本秩和的均值,為全部樣本秩和的均值??梢宰C明,在大樣本條件下,H統(tǒng)計(jì)量近似服從于自由度為k-1 的卡方分布[34]。
將所采集微博文本與情感詞匯本體庫進(jìn)行匹配,提取到情緒關(guān)鍵詞6 221 個(gè)。情緒關(guān)鍵詞作為疫情期間微博上網(wǎng)絡(luò)情緒的高度概括,在一定程度上反映了微博輿情的主導(dǎo)情緒類型。詞頻數(shù)排名前20 的情緒關(guān)鍵詞見表1。正面情緒關(guān)鍵詞有14 個(gè),表達(dá)了祝愿、贊揚(yáng)、安心、尊敬、相信和喜愛6 種情緒類型,其中傳達(dá)祝愿含義的“希望”一詞出現(xiàn)次數(shù)最多,達(dá)到3 501 次;負(fù)面情緒關(guān)鍵詞有6 個(gè),對(duì)應(yīng)了恐懼、貶責(zé)、煩悶和慌亂4 種情緒類型,其中具有恐懼含義的“害怕”一詞出現(xiàn)次數(shù)最多,為1 242 次。進(jìn)一步地,對(duì)所提取的6 221 個(gè)情緒關(guān)鍵詞進(jìn)行分類統(tǒng)計(jì),橫坐標(biāo)為情緒類型大類,縱坐標(biāo)為情緒大類對(duì)應(yīng)的詞頻總數(shù)(見圖2)??梢钥闯觯昂谩笔且咔槠陂g網(wǎng)民在微博上傳達(dá)的最主要情緒類型,該類型的詞頻總數(shù)達(dá)到89 185 次;其次是“惡”和“樂”2 種情緒,情緒關(guān)鍵詞分別出現(xiàn)了28 713 次和20 272 次;剩下的情緒類型中,“懼”和“哀”的情緒表達(dá)較為突出,詞頻總數(shù)均超過10 000 次,而“怒”和“驚”的情緒詞出現(xiàn)頻次較低。正面情緒(好、樂)關(guān)鍵詞總共出現(xiàn)109 457 次,占總詞頻數(shù)的67.1%;負(fù)面情緒(惡、懼、哀、怒)關(guān)鍵詞共計(jì)出現(xiàn)52 631次,占32.3%。上述結(jié)果表明,疫情期間“好”和“樂”是微博輿情中的主導(dǎo)情緒,具體包括祝愿、贊揚(yáng)、安心等情緒類型;“惡”、“懼”、“哀”等負(fù)面情緒中則以恐懼、貶責(zé)、煩悶和慌亂為主。由此可知,盡管新冠肺炎疫情造成了一定的負(fù)面影響,但正面情緒在微博輿情中占據(jù)著主流地位,網(wǎng)民總體上保持著積極的情緒狀態(tài)。
表1 詞頻數(shù)排名前20 的情緒關(guān)鍵詞統(tǒng)計(jì)
圖2 疫情期間網(wǎng)絡(luò)情緒類型條形圖(基于7 大類)
隨機(jī)選取所采集數(shù)據(jù)中表達(dá)正面情緒與負(fù)面情緒的微博文本各300 條,人工標(biāo)注情緒傾向的正負(fù)作為訓(xùn)練語料。訓(xùn)練樸素貝葉斯模型并測定微博文本的情緒傾向值,部分結(jié)果見表2。可見傳達(dá)敬意和美好期愿的微博情緒傾向值較高,表述客觀內(nèi)容的微博情緒傾向值中等,表達(dá)抑郁憂懼的微博情緒傾向值較低,說明模型預(yù)測結(jié)果符合經(jīng)驗(yàn)認(rèn)知。
表2 樸素貝葉斯模型預(yù)測結(jié)果示例
根據(jù)情緒傾向值繪制疫情期間網(wǎng)絡(luò)情緒趨勢曲線圖,考察各天微博文本平均情緒傾向值隨時(shí)間的變化過程(見圖3)。將微博文本的情緒傾向分為負(fù)面(情緒傾向值介于0 ~0.3 之間)、中性(情緒傾向值介于0.3 ~0.6 之間)和正面(情緒傾向值介于0.6 ~1 之間)三類,考察不同情緒分布的時(shí)序變化(見圖4)。分析發(fā)現(xiàn),盡管存在波動(dòng),疫情期間網(wǎng)絡(luò)情緒總體呈提升趨勢。在疫情初期,網(wǎng)絡(luò)情緒較為消極,情緒傾向值較低,負(fù)面情緒所占比重較高;隨著時(shí)間的推移,網(wǎng)絡(luò)情緒開始朝積極的方向演化,情緒傾向值逐漸上升,正面情緒占比也逐漸超過負(fù)面情緒并持續(xù)增加。此外,中性情緒變化相對(duì)平穩(wěn),所占比重基本保持在10%~20%之間。這主要是由于此類微博多為通報(bào)疫情進(jìn)展或普及防疫知識(shí),內(nèi)容不具有明顯的情緒性。下面根據(jù)圖3 和圖4 從微觀層面對(duì)疫情期間網(wǎng)絡(luò)情緒的主要變化時(shí)段加以分析。
圖3 2019年12月31日~2020年3月4日微博情緒趨勢曲線圖
圖4 2019年12月31日~2020年3月4日微博情緒分布時(shí)序變化圖
2019年12月31日至2020年1月4日,情緒傾向值最低跌落至0.1 以下,負(fù)面情緒所占比重也一度超過80%,微博輿情中的網(wǎng)絡(luò)情緒較為消極。這主要是由于在疫情初始階段形勢不明朗、信息不充分的情況下,各種關(guān)于疫情的猜測和謠言在網(wǎng)絡(luò)上傳播,引起了網(wǎng)民的疑慮。不過此時(shí)人們對(duì)疫情尚未產(chǎn)生高度的關(guān)注,隨著武漢市政府及時(shí)發(fā)布情況通報(bào)、采取必要措施,1月5日之后網(wǎng)民的消極情緒有所緩解,情緒傾向值暫時(shí)回升。1月中旬,情緒傾向值驟然降低,負(fù)面情緒占比高于正面情緒,微博輿情整體上處于以消極情緒為主導(dǎo)的狀態(tài)。究其緣由,主要是因?yàn)橐咔殚_始向全國范圍及海外蔓延,其嚴(yán)重性和危害性充分顯露。如國內(nèi)首次在武漢以外的地區(qū)出現(xiàn)確診病例,日本、泰國等其他國家也相繼確診有患者感染新冠肺炎,加之春運(yùn)帶來的大量人口流動(dòng),導(dǎo)致網(wǎng)民對(duì)疫情蔓延的恐慌和憂懼情緒彌漫。1月下旬開始,情緒傾向值基本呈增長趨勢,特別是1月23日之后,微博輿情中的正面情緒所占比重始終大于負(fù)面情緒,網(wǎng)絡(luò)情緒從之前消極為主的狀態(tài)轉(zhuǎn)變成積極為主的狀態(tài)。這一時(shí)期,在政府、醫(yī)院、社會(huì)組織及廣大人民群眾的共同努力下,國內(nèi)疫情形勢逐漸得到控制,全國新增確診病例數(shù)量持續(xù)走低,生產(chǎn)生活逐步恢復(fù)正常。人們不再談“疫”色變,網(wǎng)絡(luò)情緒也愈加高漲,2月中旬以后,情緒傾向值基本維持在0.7以上。
負(fù)面、中性和正面三組情緒的微博轉(zhuǎn)發(fā)量描述統(tǒng)計(jì)指標(biāo)、正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn)結(jié)果見表3。無論是偏度(Skewness)還是峰度(Kurtosis),三組數(shù)據(jù)的分布均表現(xiàn)出顯著的非正態(tài);Levene 檢驗(yàn)結(jié)果顯著(P=0.006),表明三組數(shù)據(jù)的方差不相等。
表3 描述統(tǒng)計(jì)、正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn)結(jié)果
由于數(shù)據(jù)不滿足單因素方差分析的正態(tài)性假設(shè)和方差齊性假設(shè),本文采用Kruskal-Wallis檢驗(yàn)的方法比較三種微博情緒的傳播效果之間是否存在差異,結(jié)果見表4。負(fù)面情緒的微博轉(zhuǎn)發(fā)量平均秩值為21 029.524,中性情緒的微博轉(zhuǎn)發(fā)量平均秩值為19 709.640,正面情緒的微博轉(zhuǎn)發(fā)量平均秩值為22 519.328,三組情緒的微博轉(zhuǎn)發(fā)量之間具有統(tǒng)計(jì)學(xué)意義上的顯著差異(H=591.150,P=0.001)。通過Bonferroni 法調(diào)整顯著性水平的多重比較發(fā)現(xiàn),微博轉(zhuǎn)發(fā)量在正面情緒和負(fù)面情緒之間存在顯著差異(P=0.001),平均秩值之差為1 489.804,表明正面情緒較之負(fù)面情緒更易于在微博上傳播;微博轉(zhuǎn)發(fā)量在正面情緒和中性情緒之間存在顯著差異(P=0.001),平均秩值之差為2 809.688,表明正面情緒較之中性情緒更易于在微博上傳播;微博轉(zhuǎn)發(fā)量在負(fù)面情緒和中性情緒之間存在顯著差異(P=0.001),平均秩值之差為1 319.884,表明負(fù)面情緒較之中性情緒更易于在微博上傳播。
表4 Kruskal-Wallis 檢驗(yàn)及多重比較結(jié)果(N=41612)
在突發(fā)事件輿情中網(wǎng)絡(luò)情緒的傳播效果問題上,此前學(xué)者持有兩種觀點(diǎn)。一種認(rèn)為中性情緒相較于具有明顯傾向性的情緒更易于傳播;另一種則認(rèn)為負(fù)面情緒更易于在網(wǎng)絡(luò)輿論中傳播。然而,不同于以往研究,本文發(fā)現(xiàn)較之負(fù)面情緒和中性情緒,新冠肺炎疫情期間傳達(dá)正面情緒的微博輿論傳播效果最為突出。如前文所述,根據(jù)情緒社會(huì)分享理論,個(gè)體的情緒分享意愿與其所受到的情緒誘導(dǎo)強(qiáng)度呈正相關(guān)。相關(guān)實(shí)驗(yàn)也發(fā)現(xiàn),情緒喚醒度愈高的信息愈有可能激發(fā)人們的分享行為[35]。既然如此,為何同樣具有高喚醒度和強(qiáng)刺激性,疫情期間微博輿情中正面情緒的傳播效果卻優(yōu)于負(fù)面情緒呢?本文認(rèn)為,最有可能的原因是事件性質(zhì)的差異。以往研究多關(guān)注單一事件或自然災(zāi)害、事故災(zāi)難等突發(fā)事件輿情中的網(wǎng)絡(luò)情緒,而本文則以新冠肺炎疫情這一重大突發(fā)傳染病事件為背景。新冠肺炎疫情屬于“天災(zāi)”,而非人為因素引發(fā)的“人禍”,其蔓延速度之快、感染范圍之廣,威脅到每個(gè)人的生命安全和身體健康,嚴(yán)重性和危害性遠(yuǎn)甚于之前研究關(guān)注的事件,因此人們更加需要正面情緒的鼓舞以提升抗擊疫情的信心和斗志。況且,人類表達(dá)中本就存在著“積極偏見(Positive Bias)”,即人們?cè)谡務(wù)撁篮檬挛飼r(shí)的心理感覺更好,因而傾向于回避消極話題、討論積極話題[36]。由于此次疫情持續(xù)時(shí)間長、各類主體參與范圍廣,積極偏見容易在網(wǎng)絡(luò)輿情中顯現(xiàn),從而使得正面情緒得以更持久地傳播。
與既有研究發(fā)現(xiàn)一致,疫情期間網(wǎng)絡(luò)情緒也呈現(xiàn)出由消極向積極演化的特點(diǎn)。轉(zhuǎn)變的關(guān)鍵拐點(diǎn)出現(xiàn)在1月23日,結(jié)合該時(shí)間點(diǎn)前后的相關(guān)事件進(jìn)行分析,本文認(rèn)為政府舉措和媒體報(bào)道是促成網(wǎng)絡(luò)情緒轉(zhuǎn)變的主要原因。一方面,政府采取的一系列干預(yù)舉措有效安撫了網(wǎng)民因疫情蔓延產(chǎn)生的消極情緒。例如武漢全市暫時(shí)關(guān)閉離漢通道、湖北省啟動(dòng)重大突發(fā)公共衛(wèi)生事件一級(jí)響應(yīng)、中央部委協(xié)同各地方政府開展全國疫情聯(lián)防聯(lián)控工作等。這表明,政府相關(guān)部門應(yīng)對(duì)突發(fā)重大傳染病事件的態(tài)度、時(shí)效和舉措在很大程度上影響著網(wǎng)絡(luò)情緒走向。另一方面,各大媒體配合政府實(shí)時(shí)報(bào)道全國疫情最新動(dòng)態(tài)、派駐記者赴疫情一線實(shí)地采訪,在滿足疫情期間人們信息需求的同時(shí),通過報(bào)道戰(zhàn)“疫”中的人物事跡振奮人心。焦點(diǎn)事件理論(Focusing Events)認(rèn)為,公共安全危機(jī)中媒體的議程設(shè)置(Agenda Setting)將吸引公眾的注意力[37]。因此,從1月下旬開始,媒體的報(bào)道議程在一定程度上推動(dòng)了微博輿情朝正能量的方向發(fā)展,起到了寬緩消極網(wǎng)絡(luò)情緒的作用。
網(wǎng)絡(luò)情緒作為研究網(wǎng)絡(luò)輿情的重要依據(jù),一定程度上就是網(wǎng)絡(luò)輿情的主要表現(xiàn)形態(tài)。本文通過Python 編寫網(wǎng)絡(luò)爬蟲程序獲取新浪微博上的輿情數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗及預(yù)處理后,運(yùn)用情緒詞典、樸素貝葉斯模型、Kruskal-Wallis 檢驗(yàn)的方法,從類型傾向、演化過程和傳播效果三個(gè)方面分析了新冠肺炎疫情期間的網(wǎng)絡(luò)情緒。研究主要得到如下結(jié)論:①正面情緒是疫情期間微博輿情中的主導(dǎo)情緒,而負(fù)面情緒則以恐懼、貶責(zé)、煩悶和慌亂為主;②疫情期間網(wǎng)絡(luò)情緒經(jīng)歷了由消極為主向積極為主的演化過程,總體呈提升趨勢;③不同網(wǎng)絡(luò)情緒的傳播效果之間存在顯著差異,正面情緒較之負(fù)面情緒和中性情緒更易于傳播。
結(jié)合分析結(jié)果,本文對(duì)重大突發(fā)傳染病事件發(fā)生后政府相關(guān)部門的網(wǎng)絡(luò)輿情治理和情緒引導(dǎo)工作提出幾點(diǎn)參考建議。①及時(shí)回應(yīng)訴求,防范次生輿情。所謂“次生輿情”,即輿情過程中出現(xiàn)新的刺激性因素引發(fā)的針對(duì)輿情主體或其他主體的新的輿情事件[38],其生成發(fā)酵的重要原因是負(fù)面情緒的激發(fā)推動(dòng),根本原因則是民眾訴求無法得到及時(shí)滿足[39]。此次新冠肺炎疫情過程中次生輿情事件時(shí)有發(fā)生,“主體輿情”與“次生輿情”之間的“變焦轉(zhuǎn)換”使得網(wǎng)絡(luò)情緒間或波動(dòng),圖3 中1月下旬以后情緒傾向值出現(xiàn)數(shù)次回落便與之有關(guān)。研究表明,情緒累積效應(yīng)在突發(fā)公共事件中對(duì)于輿情走向具有重要影響[40]。因此,政府相關(guān)部門在重大突發(fā)傳染病事件中應(yīng)實(shí)時(shí)關(guān)注輿情動(dòng)向、及時(shí)回應(yīng)民眾訴求,特別是需要加強(qiáng)與醫(yī)院、慈善機(jī)構(gòu)、公益組織等多元社會(huì)主體的聯(lián)動(dòng)協(xié)作,相互配合與監(jiān)督,防范次生輿情事件導(dǎo)致的負(fù)面網(wǎng)絡(luò)情緒累積,從而穩(wěn)定網(wǎng)絡(luò)輿情。②強(qiáng)化信息公開,警惕信息疫情?!靶畔で螅↖nformation Seeking)”是人們?cè)诠参C(jī)中的本能反應(yīng)[41],權(quán)威信息缺失或模糊易使人們對(duì)不實(shí)消息的辨識(shí)能力下降[42],助長網(wǎng)絡(luò)謠言滋生,引起恐慌、不安或疑懼情緒。從“謠言”一詞頻繁出現(xiàn)在微博用戶發(fā)文中可窺知(見表1),新冠肺炎疫情期間,網(wǎng)絡(luò)謠言是網(wǎng)民負(fù)面情緒的誘發(fā)性來源之一。這說明,重大突發(fā)傳染病事件中政府相關(guān)部門應(yīng)時(shí)刻警惕“信息疫情(Infodemic)”,充分貫徹信息發(fā)布的透明性和及時(shí)性原則,第一時(shí)間將事件的起因進(jìn)展等信息公之于眾,并配合媒體科普預(yù)防知識(shí)、辟謠虛假信息。③多措并舉,提升正面情緒。本文發(fā)現(xiàn)重大突發(fā)傳染病事件下正面情緒更易于在網(wǎng)絡(luò)輿情中傳播,這啟示政府相關(guān)部門應(yīng)通過采取加大正面宣傳報(bào)道力度、選用培育網(wǎng)絡(luò)意見領(lǐng)袖、疏通情緒宣泄渠道、構(gòu)建利益表達(dá)機(jī)制等多種舉措提升網(wǎng)民的正面情緒,促進(jìn)網(wǎng)絡(luò)輿情朝積極方向發(fā)展。