摘要:突發(fā)事件背景下不同層級的評論可以細(xì)粒度地揭示用戶觀點變化,對捕捉輿論矛盾和網(wǎng)絡(luò)輿情治理有重要意義。以突發(fā)事件的微博評論為研究對象,利用基于TF-IDF算法的LDA模型、情感傾向分析和Kruskal-Wallis差異性檢驗,從用戶關(guān)注焦點和情感異同兩個方面對比不同層級評論的用戶觀點變化。研究發(fā)現(xiàn):就用戶關(guān)注焦點而言,隨著評論層級的增加,用戶關(guān)注焦點發(fā)生變化,討論話題逐漸延伸,一級評論對于事件的針對性、關(guān)聯(lián)性最強,二級評論則更關(guān)注事件的發(fā)展與處理進(jìn)程,三級評論中用戶間矛盾沖突最為突顯;就情感而言,評論均表現(xiàn)出強烈的消極傾向,但各層級評論的用戶情感存在顯著差異,且評論層級越深,情感越消極,三級評論比一級、二級評論帶有更多隱性消極情感用詞,符合認(rèn)知負(fù)荷理論。研究為社交媒體用戶信息行為和網(wǎng)絡(luò)輿情分析提供了更加細(xì)粒度的視角。
關(guān)鍵詞:突發(fā)事件;社交媒體;多層級評論;用戶觀點;認(rèn)知負(fù)荷理論
中圖分類號:G206 DOI:10.3772/j.issn.1673-2286.2024.08.004
引文格式:胡媛,廖文濤,艾欣怡,等. 突發(fā)事件社交媒體用戶觀點變化研究:基于多層級微博評論視角[J]. 數(shù)字圖書館論壇,2024,20(8):29-38.
*本研究得到國家社會科學(xué)基金青年項目“突發(fā)公共事件中的網(wǎng)絡(luò)社會心態(tài)演化及調(diào)節(jié)機制研究”(編號:22CTQ022)、江西省高校人文社科項目“突發(fā)事件社交媒體用戶負(fù)面情感早期識別與風(fēng)險預(yù)警機制研究”(編號:TQ22201)資助。
全媒體時代,社交媒體作為公眾意見的重要交流平臺,在突發(fā)事件中發(fā)揮著日益強大的影響力[1]。然而,隨著互聯(lián)網(wǎng)的快速發(fā)展,社交媒體輿論生成和輿論引導(dǎo)力量之間的非對稱態(tài)勢與日俱增[2],網(wǎng)絡(luò)空間治理面臨的問題日益突出。尤其是突然發(fā)生,造成或者可能造成嚴(yán)重社會危害,需要應(yīng)急處置措施予以應(yīng)對的自然災(zāi)害、事故災(zāi)難、公共衛(wèi)生事件和社會安全事件等突發(fā)事件[3]發(fā)生后,用戶通過評論或回復(fù)評論來參與事件討論,增加討論層級和子節(jié)點,不僅擴展了用戶交互網(wǎng)絡(luò),還將加速輿論傳播,很容易造成輿情危機。其中,主要話題可能與話題討論中層級較深的評論沒有密切關(guān)系,但必然與直接回復(fù)的評論有關(guān)聯(lián)[4]。隨著討論層級的加深,用戶需要閱讀的評論內(nèi)容增多,其認(rèn)知負(fù)荷逐漸加大,從而影響后續(xù)評論的觀點表達(dá),進(jìn)而影響輿情走向。因此,評論往往會不同程度偏離原主題,從而引發(fā)新的問題。用戶情緒會影響他們的認(rèn)知,進(jìn)而引發(fā)話題的變化[5]。目前學(xué)界對不同層級評論關(guān)系的關(guān)注較少,未能捕捉評論和子評論之間的微妙關(guān)系和其在突發(fā)事件輿論傳播中的不同作用。
本文聚焦突發(fā)事件下社交媒體的用戶評論,結(jié)合認(rèn)知負(fù)荷理論,以多層級評論視角,細(xì)粒度地探索用戶討論主題和情感的變化,以期精準(zhǔn)定位突發(fā)事件中的輿論矛盾點,為政府部門精準(zhǔn)回應(yīng)公眾關(guān)注焦點、化解輿論矛盾提供參考依據(jù)。
1 研究綜述
1.1 社交媒體用戶觀點研究
目前對社交媒體用戶觀點的挖掘通常從用戶生成內(nèi)容出發(fā)。評論行為(包括直接評論和回復(fù)評論)作為用戶在社交媒體中依據(jù)個人認(rèn)知對瀏覽到的內(nèi)容的反饋行為,是用戶觀點挖掘的數(shù)據(jù)來源之一[6]。國內(nèi)外學(xué)者已從各角度對社交媒體評論的主題和情感展開研究。在用戶觀點主題挖掘方面,Oyebode等[7]針對健康問題,從社交媒體評論數(shù)據(jù)中分析了流行病流行期間用戶的觀點;劉偉等[8]通過對高校圖書館的在線評論進(jìn)行主題分析,得到用戶關(guān)注的5類主題。在用戶觀點情感挖掘方面,鄧春林等[9]對負(fù)面公共安全事件微博評論進(jìn)行分析,探索微博用戶消極情感傾向的影響因素;劉昊[10]對突發(fā)事件微博的評論、轉(zhuǎn)發(fā)進(jìn)行了三級細(xì)粒度情感分析,發(fā)現(xiàn)用戶轉(zhuǎn)發(fā)和評論存在明顯的情感相關(guān)性;Kohout等[11]研究了用戶評論中的負(fù)面情緒可能對注意力和信息處理產(chǎn)生的影響;孫二冬等[12]、蔣翠清等[13]均基于評論數(shù)據(jù)對社交媒體用戶情感展開分析。此外,部分研究從文本內(nèi)容出發(fā)建立評論內(nèi)容與情感之間的聯(lián)系:Topal等[5]從英文社交媒體評論的角度研究了情感和話題領(lǐng)域?qū)ι缃幻襟w評論話題轉(zhuǎn)移的影響;李佳軒等[14]基于彈幕對用戶關(guān)注度和情感進(jìn)行聯(lián)合分析,挖掘用戶觀點。
1.2 社交媒體中突發(fā)事件輿情研究
社交媒體改變了突發(fā)事件背景下的信息傳播途徑,評論等用戶參與行為是輿情研究的一個重要分支[15]。社交媒體是實時交流渠道,其中的評論主題和情感變化可以宏觀地反映輿情的演化,因此輿情研究常以社交媒體中的用戶評論為基礎(chǔ)。李紫薇等[16]通過信息傳播模型對輿情演化階段進(jìn)行劃分。任中杰等[17]對突發(fā)事件中的評論進(jìn)行情感分析,研究輿情演變過程和時空規(guī)律。賴勝強等[18]研究了輿情在微博評論區(qū)的呈現(xiàn)規(guī)律,以及不同評論傾向性對用戶評論的影響。Chen等[19]通過推文比例和積極情感比例來檢驗公眾輿情的強度和方向,定量分析了輿情趨勢。Yarchi等[20]將主題模型和情感檢測相結(jié)合,探究互動極化、立場極化和情感極化[20]。劉雅姝等[21]則構(gòu)建重大突發(fā)事件的抽象事理圖譜,結(jié)合系統(tǒng)動力學(xué)模型展開事件演變仿真模擬。
綜上所述,社交媒體中用戶關(guān)注焦點、評論情感的研究和輿情研究密不可分?,F(xiàn)有研究往往不加區(qū)別地對評論進(jìn)行主題或者情感分析,缺乏對社交媒體評論關(guān)系的解析,忽略了子評論對后續(xù)評論乃至事件演化的影響,這將導(dǎo)致對評論情感特征、輿情的研究丟失大量關(guān)于用戶關(guān)注焦點和情感變化的有效信息。針對不同層級評論展開分析,能更加具體、有效地定位輿情發(fā)展、引導(dǎo)并治理網(wǎng)絡(luò)輿情。
基于此,本文將從多層級視角探索突發(fā)事件背景下社交媒體評論中的用戶關(guān)注焦點和情感特征,并以此細(xì)粒度探討網(wǎng)絡(luò)輿情治理。
2 研究設(shè)計
2.1 多層級評論研究邏輯框架
社交媒體中,用戶通過在話題或推文下方的評論區(qū)進(jìn)行評論和相互回復(fù),形成不同層級的評論[5]。當(dāng)前,社交媒體評論區(qū)通常根據(jù)熱度、時間順序、回復(fù)層次等多個因素設(shè)計分類,且對較深層級的評論自動添加“回復(fù)”字段。因此,根據(jù)回復(fù)層次,將評論層級劃分為3級。①一級評論:直接在推文下發(fā)表的評論;②二級評論:對一級評論的回復(fù),即一級評論下的無“回復(fù)”字段的子評論;③三級評論:對二級評論的回復(fù),即二級評論下的有“回復(fù)”字段的子評論。
多層級評論研究邏輯框架如圖1所示。界定不同層級評論后,引入用戶觀點分析框架,主要包括用戶關(guān)注焦點與情感分析。基于主題分類和情感傾向分析,探索不同層級評論的用戶觀點變化,揭示社交媒體多層級評論特征,為網(wǎng)絡(luò)輿情治理提供細(xì)粒度指導(dǎo)。研究過程分為5個步驟。①評論數(shù)據(jù)采集:以新浪微博為社交媒體評論數(shù)據(jù)來源,利用Python程序獲取突發(fā)事件推文的評論數(shù)據(jù)。②數(shù)據(jù)處理:去除評論數(shù)據(jù)中的網(wǎng)站鏈接、可拓展標(biāo)記語言、表情符號和空白評論及相同ID的重復(fù)評論,利用jieba工具對清洗后的評論內(nèi)容進(jìn)行分詞。③用戶觀點識別:從用戶關(guān)注焦點和情感傾向兩個方面對多層級評論中的用戶觀點變化特征進(jìn)行分析。④綜合分析:對比分析突發(fā)事件的不同層級評論,并進(jìn)行差異性檢驗。⑤歸納演繹:通過上述分析揭示多層級評論中的用戶關(guān)注焦點和情感特征,并據(jù)此探討如何實現(xiàn)對突發(fā)事件輿情的精準(zhǔn)回應(yīng)。
2.2 數(shù)據(jù)獲取與預(yù)處理
選取貨拉拉跳車事件和唐山打人事件兩個突發(fā)事件中的微博評論為數(shù)據(jù)來源。兩起突發(fā)事件均引發(fā)較大的社會輿論反響,激起大量用戶討論,微博話題總閱讀量均突破20億次。運用Python程序分別獲取微博平臺上兩個事件話題下的評論數(shù)據(jù),時間限定為關(guān)于事件的第一條推文發(fā)布至2022年12月15日。表1所示為部分評論數(shù)據(jù),評論數(shù)據(jù)帶有ID作為唯一標(biāo)識,子評論會帶有其父評論的ID,一級評論的父評論ID空白,據(jù)此區(qū)別不同層級評論數(shù)據(jù)。去除圖片、鏈接以及表情符號等無效評論。為反映不同層級評論的特定特征,對于ID不同但內(nèi)容一致的評論內(nèi)容不作去重。預(yù)處理后貨拉拉跳車事件話題中一級評論、二級評論、三級評論數(shù)量分別為1 703、3 090、8 078條;唐山打人事件話題中一級評論、二級評論、三級評論數(shù)量分別為4 274、7 039、10 692條。
3 不同層級評論用戶關(guān)注焦點分析
3.1 研究方法與過程
本研究通過基于TF-IDF算法的LDA模型對不同層級的評論進(jìn)行主題提取以分析用戶關(guān)注焦點。TF-IDF算法用于評估詞語對文本的重要程度[22],通過構(gòu)建詞頻矩陣解決LDA模型中詞袋模型的問題,從而更準(zhǔn)確地提取主題[23]。同時,基于TF-IDF算法的LDA模型能夠保留評論中的高頻情感詞,有助于分析用戶的情感傾向。本研究著重對比多層級評論的不同特征,通過一致性得分情況輔助確定主題數(shù)量。將預(yù)處理后的3個層級的評論分別利用Python程序進(jìn)行LDA主題建模,通過建模結(jié)果可以得知不同層級評論的大致討論主題,并以此分析用戶關(guān)注焦點。
為確定合適的主題數(shù)量,分別對兩事件3個層級評論的主題使用Python gensim庫中的CoherenceModel方法進(jìn)行一致性得分的計算。兩事件各層級評論主題數(shù)量為5、8、10個時一致性得分較高,綜合實際情況,為便于后續(xù)分析,選擇LDA模型主題數(shù)量為5個。
3.2 研究結(jié)果分析
3.2.1 貨拉拉跳車事件用戶關(guān)注焦點分析
結(jié)合表2所示的多層級評論LDA主題分類結(jié)果,對貨拉拉跳車事件不同層級評論中的用戶關(guān)注焦點進(jìn)行分析。
(1)一級評論用戶關(guān)注焦點分析。LDA主題分類結(jié)果顯示,Topic1中包括“司機”“乘客”“跳車”等高頻主題詞,討論內(nèi)容大多圍繞女乘客跳車事故的基本事實。Topic2討論了司機行駛途中的加速行為。Topic3討論了微博中轉(zhuǎn)發(fā)等輿論參與行為對事件的影響,涉及具體案例的討論,還包括對辦案程序和公正性的質(zhì)疑。Topic4中的“保重”“政審”“污點”,Topic5中的“點贊”“真慘”“判決書”等說明用戶在事件發(fā)生后第一時間關(guān)注事件真相,并分別對司機責(zé)任、乘客責(zé)任、事件影響和判決合理性等方面展開討論。
(2)二級評論用戶關(guān)注焦點分析。結(jié)合表2可知,該層級的討論中,用戶關(guān)注焦點圍繞事件多角度分散。LDA主題分類結(jié)果顯示,Topic1中包括“司機”“跳車”“倒霉”“偏航”“認(rèn)罪”等高頻主題詞,說明討論內(nèi)容由事件本身延伸到對事故發(fā)生原因、后續(xù)處理等方面的探討。Topic2的討論從對司機的同情轉(zhuǎn)移到對女生的保護(hù),Topic3討論了對司機的部分批評是否過于嚴(yán)苛,Topic4的討論從事件本身偏移到男女問題,Topic5則為一級評論Topic5的延續(xù),部分話題已經(jīng)與事件無關(guān)。二級評論中,用戶在事件真相的基礎(chǔ)上,進(jìn)一步對乘客傷亡情況、法律責(zé)任和公眾輿論等方面展開探討,并對相關(guān)社會問題進(jìn)行初步聯(lián)想。
(3)三級評論用戶關(guān)注焦點分析。如表2所示,在此層級評論中,不同用戶群體的觀點相互碰撞,激發(fā)大量矛盾,出現(xiàn)“經(jīng)典”“反思”“重開”“三觀”“杠精”等詞匯。這同時表明該層級評論中,公眾矛盾已被顯著激化,公眾關(guān)注焦點亦延伸至與事件相關(guān)的社會問題,如安全隱患、平臺監(jiān)管等方面。隨著層級的加深,用戶之間意見交流增加,從而引發(fā)公眾對事件背后深層次社會問題的思考。
3.2.2 唐山打人事件用戶關(guān)注焦點分析
結(jié)合表3所示的多層級評論LDA主題分類結(jié)果,分析唐山打人事件不同層級評論中的用戶關(guān)注焦點。
(1)一級評論用戶關(guān)注焦點分析。唐山打人事件一級評論的用戶關(guān)注焦點集中在事件本身。Topic1中的“視頻”“幾個女孩”“唐山”等主題詞表明用戶針對網(wǎng)絡(luò)曝光的視頻進(jìn)行討論。Topic2~Topic5均較為理性地討論事件性質(zhì)及人物,主要表達(dá)事件的基本事實和個人立場,在對被打女性表示同情的同時也呼吁從嚴(yán)判決打人者。Topic3的“輕傷”“二級”表示被打者傷級定級過低,Topic4的“嚴(yán)懲不貸”“關(guān)注”表明用戶關(guān)注事件的處理進(jìn)程,同時反映出用戶對政府部門公正處理的訴求。
(2)二級評論用戶關(guān)注焦點分析。二級評論中主題詞較為分散,用戶關(guān)注焦點開始向不同主題轉(zhuǎn)移。隨著層級加深,評論主題更加多元化,除了圍繞事件本身的討論,還涉及與事件相關(guān)的社會問題,如公共秩序、法律適用、社會責(zé)任等方面。Topic2的討論認(rèn)為事件有涉黑問題,Topic3、Topic4的討論認(rèn)為需要中央介入,總體與事件關(guān)聯(lián)性較大。
(3)三級評論用戶關(guān)注焦點分析。三級評論中出現(xiàn)較多延伸話題,用戶關(guān)注焦點逐漸轉(zhuǎn)移至與其他用戶的交流甚至是人身攻擊上,如Topic2~Topic5中的“殺人”“腦子”“網(wǎng)暴”“可怕”等主題詞顯示用戶之間對事件處理結(jié)果存在大量分歧,用戶對政府公信力表現(xiàn)出強于一、二級評論的失望態(tài)度,大量用戶通過評論交流情感觀點。
綜上,從宏觀的評論層級來看,兩個案例中用戶關(guān)注焦點均圍繞事件展開,但不同層級的關(guān)注側(cè)重點有所變化,呈現(xiàn)出按層級產(chǎn)生大量衍生話題的趨勢。整體來說,一級評論的關(guān)注焦點主要集中于事件的基本事實,而二、三級評論的關(guān)注焦點逐漸脫離事件本身,延伸為與事件相關(guān)的其他話題或用戶間的相互攻擊。首因效應(yīng)表明,人們在面對各類繁雜信息時,傾向于接受最先輸入的信息[24]。因此,在一級評論發(fā)布時,用戶接受到的第一信息通常為推文的原文內(nèi)容,其對事件的認(rèn)識還處于認(rèn)知負(fù)荷的合理范圍內(nèi),用戶發(fā)表的一級評論大多圍繞事件的基本事實展開。隨著各種信息的擴散,個體的觀點會受到群體討論的影響[25]而發(fā)生變化,在評論的同時用戶需要閱讀評論區(qū)更深層次的評論,認(rèn)知負(fù)荷不斷增加,導(dǎo)致評論主題偏移。用戶閱覽評論的數(shù)量越多,認(rèn)知負(fù)荷也就越大,其就越容易受到已發(fā)布評論的影響,導(dǎo)致評論主題的偏移,因此二、三級評論衍生出更多話題,這進(jìn)一步說明了認(rèn)知負(fù)荷增加會對信息理解產(chǎn)生負(fù)面影響[26]。此外,用戶觀點矛盾在三級評論中最為突顯,主題詞中出現(xiàn)更多含有情感偏向的表達(dá)。如在唐山打人事件中,三級評論的主題詞有“殺人”“網(wǎng)暴”“可怕”等,帶有強烈的感情色彩。其原因可能是隨著用戶閱覽評論數(shù)量的增多,當(dāng)用戶自身認(rèn)知負(fù)荷超過極限時,用戶容易變得暴躁、憤怒,從而導(dǎo)致情感的爆發(fā)[27],用戶之間的矛盾也更加突出。
4 不同層級評論情感分析
4.1 研究方法與過程
百度AI開放平臺的情感傾向分析功能能夠自動迭代更新和深度學(xué)習(xí)訓(xùn)練,具備較高的準(zhǔn)確度和泛化能力[28]。其能夠返回情感極性分類的結(jié)果和positive_ prob值及相應(yīng)的置信度,其中分類結(jié)果0表示評論內(nèi)容為負(fù)向,1為中性,2為正向。將返回的結(jié)果輸出到Excel文檔中,取置信度大于等于0.9的數(shù)據(jù)作為有效評論進(jìn)行進(jìn)一步的研究。將返回的所有語句positive_prob值作為總情感傾向強度,以負(fù)向評論、正向評論positive_ prob值為兩類評論的情感傾向強度(值越接近1則越積極,越接近0則越消極),最終取其均值。通過對比不同層級評論的主題和情感傾向,可以挖掘用戶的觀點并感知不同層級評論的情感傾向差異。這種方法結(jié)合了主題和情感分析兩個角度,有助于更全面地了解用戶觀點。
4.2 研究結(jié)果分析
圖2、圖3所示為兩個突發(fā)事件各層級評論的總情感傾向強度和分層級的強度結(jié)果。結(jié)合分類結(jié)果和LDA主題詞對兩個突發(fā)事件的不同層級評論進(jìn)行情感分析。
4.2.1 貨拉拉跳車事件情感分析
不同層級的絕大多數(shù)評論處于消極狀態(tài),消極情感傾向的評論占比逐級遞增。貨拉拉跳車事件情感傾向分類結(jié)果中,一級評論中負(fù)向評論占比為90%,二級評論中負(fù)向評論占比為91%,三級評論中負(fù)向評論占比為96%;一級、二級、三級評論中正向評論占比分別為9%、9%、4%;中性評論占比幾乎為零。
從圖2可以看出,各層級評論總情感傾向強度逐級下降,一級到二級評論的下降幅度小于二級到三級評論的下降幅度,由一級評論的0.102、二級評論的0.094下降到三級評論的0.047,累計下降54%。從圖3可以看出,貨拉拉跳車事件一級、三級評論的消極傾向高于二級評論,但積極傾向基本一致。
結(jié)合表2主題分類結(jié)果可知,評論層級越深,其表達(dá)的情感也越消極。如一級評論直接使用“倒霉”“活該”“惡臭”“不服”等詞語,情感流露直接,而三級評論Topic2中的“哈哈哈”“污蔑”“好笑”,Topic3中的“謝謝”“偷換概念”,Topic4中的“大病”“杠精”,Topic5中“放屁”等詞情感更加強烈。雖然“哈哈哈”等詞語一般用于表達(dá)積極情感,但在該事件中暗示了用戶對于其他用戶觀點的不認(rèn)可和嘲諷等消極情感。
4.2.2 唐山打人事件情感分析
和貨拉拉跳車事件的情感傾向類似,唐山打人事件的各層級評論大部分也處于消極狀態(tài),且消極情感傾向的評論占比逐級遞增。唐山打人事件中,一級、二級、三級評論中負(fù)向評論占比分別為81%、83%、91%,正向評論占比分別為15%、16%、9%,中性評論占比分別為4%、1%、0%。
從圖2可以看出,各層級評論總情感傾向強度隨評論層級加深而下降,其中一級、二級、三級評論總情感傾向強度分別為0.189、0.170和0.090,一級評論到二級評論下降0.019,二級評論到三級評論下降0.080,3個層級累計下降52%。從圖3可以看出,唐山打人事件一級、三級評論的消極傾向更強,二級評論的積極傾向更強。
結(jié)合表3主題分類結(jié)果可知,一級、二級、三級評論中情感詞的數(shù)量逐漸增多,且二級、三級評論中消極情感詞的情緒更強烈。相較于一級評論中Topic2“保護(hù)”、Topic3“活該”、Topic4“嚴(yán)懲不貸”等詞匯,二級評論中Topic2“無語”、Topic4“晦氣”,以及三級評論中Topic2“哈哈哈”、Topic4“法盲”的情感流露更為隱蔽,但失望情感更加強烈。
從宏觀評論層級來看,兩個事件中各層級評論均以消極情感為主,且隨著評論層級的增加,消極情感的情感強度也在不斷增強。在社交媒體信息傳播的過程中,用戶情緒通過社交網(wǎng)絡(luò)互動被大規(guī)模感染,不同觀點相互影響[29],最終極化[30]。大規(guī)模社會事件往往受到廣泛關(guān)注和媒體報道,信息的過度曝光和負(fù)面情緒的傳播會影響人們的情緒狀態(tài)[31]。隨著評論層級的遞增,可能會出現(xiàn)意見分歧、沖突和對立,這些因素會加劇消極情感的表達(dá)和強化。在認(rèn)知負(fù)荷不斷增加的情況下,用戶更容易產(chǎn)生消極、偏激的心理狀態(tài)[32]。三級評論還反映出用戶對于其他用戶觀點的不認(rèn)可和嘲諷,如在貨拉拉跳車事件中,用戶評論用詞從“可怕”“弱者”逐漸演變?yōu)椤案芫钡瘸爸S謾罵的詞語,這可能是用戶的認(rèn)知負(fù)荷達(dá)到極限之后情感爆發(fā)所帶來的負(fù)面反應(yīng)。
5 多層級評論中的情感差異性檢驗與分析
多獨立樣本Kruskal-Wallis(K-W)檢驗用于檢驗多個總體的分布是否存在顯著差異[33]。以百度AI開放平臺情感傾向分析功能返回的positive_prob值為情感得分,取置信度大于等于0.9的數(shù)據(jù)作自然對數(shù)處理,并從中隨機抽取一級、二級、三級評論中各1 000、2 000、4 000條數(shù)據(jù)進(jìn)行K-W檢驗,對比分析各事件各層級評論中的用戶情感是否存在統(tǒng)計學(xué)意義上的顯著差異。各層級評論之間的統(tǒng)計量W如式(1)所示。
如果每組樣本中的樣本量至少有5個,那么樣本統(tǒng)計量WC非常接近自由度為k–1的卡方分布。因此,用卡方分布來決定WC統(tǒng)計量的檢驗方式。
兩突發(fā)事件數(shù)據(jù)正態(tài)性檢驗和K-W檢驗結(jié)果如表4所示。對貨拉拉跳車事件情感得分樣本、唐山打人事件情感得分樣本(n≥5 000)采用KolmogorovSmirnov(K-S)檢驗,P<0.001,呈現(xiàn)顯著性,拒絕原假設(shè),因此數(shù)據(jù)不滿足正態(tài)分布,可以進(jìn)行多獨立樣本K-W檢驗。同時,兩事件的檢驗結(jié)果P<0.001,說明不同事件在情感傾向水平上存在顯著差異。
不同層級評論的K-W檢驗結(jié)果如表5所示,貨拉拉跳車事件情感得分的檢驗結(jié)果P<0.001,統(tǒng)計結(jié)果顯著,說明不同層級評論在貨拉拉跳車事件情感得分上存在顯著差異。唐山打人事件情感得分的檢驗結(jié)果P<0.001,統(tǒng)計結(jié)果顯著,說明不同層級評論在唐山打人事件情感得分上存在顯著差異。即兩個事件的不同層級評論的情感傾向水平均存在顯著差異。通過兩事件事后多重分析可以得知各層級評論間情感的具體差異程度,結(jié)果如表6所示。
(1)貨拉拉跳車事件。一級評論、二級評論檢驗結(jié)果P<0.001,統(tǒng)計結(jié)果顯著,一級、二級評論情感得分存在顯著差異,差異幅度Cohen’s d為0.386。一級評論、三級評論檢驗結(jié)果P<0.001,統(tǒng)計結(jié)果顯著,兩者存在顯著差異,差異幅度Cohen’s d為0.633。二級評論、三級評論檢驗結(jié)果P<0.001,統(tǒng)計結(jié)果顯著,兩者存在顯著差異,差異幅度Cohen’s d為0.234。3個層級評論間均有顯著差異,其中各層級評論的差異逐漸增加。一級和三級評論間的差異最大,二級和三級間的差異最小。
(2)唐山打人事件。一級評論、二級評論檢驗結(jié)果P=0.037,統(tǒng)計結(jié)果顯著,一級評論、二級評論間存在顯著差異,差異幅度Cohen’s d為0.107。一級評論、三級評論檢驗結(jié)果P<0.001,統(tǒng)計結(jié)果顯著,兩者存在顯著差異,差異幅度Cohen’s d為0.528。二級評論、三級評論檢驗結(jié)果P<0.001,統(tǒng)計結(jié)果顯著,兩者存在顯著差異,差異幅度Cohen’s d為0.407。因此,在唐山打人事件中,各層級評論的情感得分差異隨層級逐漸增加。一級評論和三級評論的差異最大,一級評論和二級評論的差異最小。
綜上所述,突發(fā)事件中社交媒體用戶評論的消極程度存在顯著差異,且差異程度逐級增加。兩事件中一級、三級評論的情感差異最大,這進(jìn)一步反映社交媒體中,過多的信息可能導(dǎo)致用戶的注意力分散,引發(fā)信息的錯誤傳遞[32],且社交媒體的反饋功能以及干擾信息會通過增加認(rèn)知負(fù)荷,強化用戶對信息的負(fù)面印象[26]。隨著評論層級的遞增,回復(fù)二級評論形成三級評論時,用戶需要查看的信息增多,認(rèn)知負(fù)荷加大,超負(fù)荷的信息可能加重用戶對信息的負(fù)面印象,因此,認(rèn)知超負(fù)荷及過多的錯誤信息可能是用戶關(guān)注焦點發(fā)散、情感更加消極的原因之一。
6 結(jié)論與啟示
6.1 研究結(jié)論
本文通過劃分社交媒體中不同層級的評論,并利用基于TF-IDF算法的LDA模型、情感傾向分析和差異性檢驗,分析了突發(fā)事件下3個不同層級評論在討論主題與情感上的特征差異,得出如下研究結(jié)論:①突發(fā)事件中用戶關(guān)注焦點隨著評論層級的遞增而延伸,其中一級評論對于事件的針對性、關(guān)聯(lián)性最強,二級評論則更關(guān)注事件的發(fā)展與處理進(jìn)程,三級評論內(nèi)容矛盾最為突顯;②突發(fā)事件中用戶均表現(xiàn)出強烈的消極情感傾向,且消極程度呈逐級增長趨勢,其中三級評論比一級、二級評論帶有更多消極情感用詞;③社交媒體評論是網(wǎng)絡(luò)輿情的具體體現(xiàn)和重要治理依據(jù),基于不同層級評論的主題特征,可快速識別輿論矛盾爆發(fā)節(jié)點,挖掘深層評論的隱藏情感特征,及時掌控用戶情緒的發(fā)展動向,以此實現(xiàn)突發(fā)事件中網(wǎng)絡(luò)輿情的高效治理。
本文嘗試從社交媒體評論的回復(fù)關(guān)系出發(fā)劃分評論層級,通過分析挖掘不同層級評論的用戶觀點變化特征,為社交媒體中用戶信息行為和網(wǎng)絡(luò)輿情的研究提供更加細(xì)粒度的視角。同時,探索突發(fā)事件中社交媒體用戶關(guān)注內(nèi)容與情感的變化,進(jìn)一步從不同層級評論中用戶間的意見交互與情感傳遞的角度解析網(wǎng)絡(luò)輿情的演化,在一定程度上推動網(wǎng)絡(luò)輿情研究的縱向發(fā)展。此外,聚焦不同層級評論中用戶關(guān)注焦點與情感特征,能有效幫助政府部門和社交服務(wù)平臺進(jìn)行網(wǎng)絡(luò)輿情監(jiān)測與引導(dǎo),以實現(xiàn)精準(zhǔn)有效的網(wǎng)絡(luò)輿情治理。
本文從評論本身宏觀分析了不同層級評論的特點,暫未考慮時間和評論上下文的影響,且依據(jù)回復(fù)關(guān)系仍可進(jìn)一步細(xì)化層級。因此,后續(xù)的研究可以根據(jù)回復(fù)關(guān)系進(jìn)一步劃分層級,或結(jié)合一級評論下子評論間的上下文語境,探究更加復(fù)雜的主題與情感。同時,也可結(jié)合輿情發(fā)展,將時間概念引入層級分析,進(jìn)一步分析不同層級評論與輿情演化的關(guān)系。
6.2 研究啟示
在突發(fā)事件發(fā)生后,面對不斷累積的用戶發(fā)言,要積極發(fā)揮引導(dǎo)作用,凝聚社會共識,既要避免社交媒體上用戶的情感失控,也要鼓勵更多用戶積極參與社會公共事務(wù)[34]。具體而言,用戶發(fā)布的一級評論相對可控,應(yīng)當(dāng)鼓勵更多用戶以正當(dāng)途徑為事件建言發(fā)聲,維護(hù)各方合法權(quán)益;同時,及時介入回應(yīng)一級評論,引導(dǎo)用戶通過回復(fù)評論發(fā)表合法合規(guī)的觀點,避免陷入極端情緒與相互攻擊的漩渦,必要時開啟精選評論功能,降低用戶認(rèn)知負(fù)荷。此外,二級、三級評論用詞的反諷用法可能導(dǎo)致常規(guī)情感詞典的分析精確度下降,無法準(zhǔn)確地識別情感態(tài)度甚至產(chǎn)生情感誤判。實際的處理過程中,應(yīng)該注重深層評論的隱匿情感特征挖掘,針對不同層級評論特征更新情感詞典語料庫,結(jié)合評論文本語境,提高用戶情感分析精準(zhǔn)度,及時掌控網(wǎng)民情緒發(fā)展動向。
為促進(jìn)網(wǎng)絡(luò)空間清朗,國家相關(guān)部門、地方政府、社交媒體平臺和用戶主體要積極構(gòu)建和平、安全、開放、合作、有序的網(wǎng)絡(luò)空間命運共同體[35]。國家相關(guān)部門作為政策制定者,可以根據(jù)社交媒體平臺周期性的監(jiān)控數(shù)據(jù),定期更新、細(xì)化網(wǎng)絡(luò)空間有關(guān)規(guī)定,優(yōu)化頂層設(shè)計,并引導(dǎo)相關(guān)主體規(guī)范執(zhí)行規(guī)定,為構(gòu)建網(wǎng)絡(luò)空間健康生態(tài)提供指南,為地方政府應(yīng)對網(wǎng)絡(luò)輿情制定合理的規(guī)章制度。地方政府在應(yīng)對突發(fā)事件輿情時,應(yīng)依托社交媒體平臺建立數(shù)據(jù)共享機制,從不同層級評論中快速提取群眾意見與相關(guān)輿論矛盾,更有針對性地對群眾關(guān)注重點進(jìn)行回應(yīng)、澄清,有效處理事件,防止事態(tài)進(jìn)一步惡化,承擔(dān)監(jiān)督管理的職責(zé)。社交媒體平臺應(yīng)履行網(wǎng)絡(luò)信息內(nèi)容管理主體責(zé)任,加強平臺網(wǎng)絡(luò)生態(tài)治理,培育積極健康、向上向善的網(wǎng)絡(luò)文化。此外,平臺方應(yīng)依托技術(shù)優(yōu)勢不斷迭代語言檢測模型,周期性監(jiān)控詞語新用法和多層級評論表現(xiàn)的新特征,定期向有關(guān)部門反饋以為其提供數(shù)據(jù)支持。用戶作為評論的主體,同時是網(wǎng)絡(luò)空間信息的生產(chǎn)者與使用者,應(yīng)在充分提升自身數(shù)字素養(yǎng)的基礎(chǔ)上文明互動、理性表達(dá)。各主體應(yīng)從自身的職責(zé)和角色出發(fā),基于對不同層級評論的細(xì)粒度分析,厘清事件輿論主題矛盾及情感演化,形成宏觀、中觀、微觀層面全面的協(xié)同合作機制,從而更加精確、高效地進(jìn)行網(wǎng)絡(luò)輿情治理,共同維護(hù)網(wǎng)絡(luò)生態(tài)。
參考文獻(xiàn)
[1] 彭國超,程曉. 熱點事件中社交媒體群體極化形成機理研究[J].信息資源管理學(xué)報,2023,13(2):42-52.
[2] 夏雨禾. 突發(fā)事件中的微博輿論:基于新浪微博的實證研究[J].新聞與傳播研究,2011,18(5):43-51,110-111.
[3] 中國政府網(wǎng). 中華人民共和國突發(fā)事件應(yīng)對法[EB/OL].[2024-08-24]. https://www.gov.cn/yaowen/liebiao/202406/ content_6960130.htm.
[4] LIU M M,RONG L L. An online multi-dimensional opinion dynamic model with misinformation diffusion in emergency events[J]. Journal of Information Science,2022,48(5):640-659.
[5] TOPAL K,KOYUTüRK M,?ZSOYO?LU G. Effects of emotion and topic area on topic shifts in social media discussions[J]. Social Network Analysis and Mining,2017,7(46):1-17.
[6] 孫悅,黃微. 社交媒體平臺用戶參與的行為譜與行為層級模型構(gòu)建[J]. 圖書情報工作,2022,66(9):40-52.
[7] OYEBODE O,NDULUE C,ADIB A,et al. Health,psychosocial,and social issues emanating from the COVID-19 pandemic based on social media comments:text mining and thematic analysis approach[J]. JMIR Medical Informatics,2021,9(4):e22734.
[8] 劉偉,李秀霞. 基于Word2Vec與K-means的高校圖書館在線評論主題分析[J]. 圖書館學(xué)刊,2022,44(10):88-94.
[9] 鄧春林,周舒陽,楊柳. 大數(shù)據(jù)環(huán)境下公共安全突發(fā)事件微博用戶評論的歸因分析[J]. 情報科學(xué),2021,39(1):48-55,80.
[10] 劉昊. 社交媒體輿論事件的情感趨同研究:基于細(xì)粒度情感的實證分析[J]. 中國傳媒大學(xué)學(xué)報(自然科學(xué)版),2022,29(1):37-44.
[11] KOHOUT S,KRUIKEMEIER S,BAKKER B N. May I have your attention,please?an eye tracking study on emotional social media comments[J]. Computers in Human Behavior,2023,139:107495.
[12] 孫二冬,王剛. 面向醫(yī)療社交媒體的用戶評論情感分析研究[J].鄭州航空工業(yè)管理學(xué)院學(xué)報,2016,34(6):63-70.
[13] 蔣翠清,郭軼博,劉堯. 基于中文社交媒體文本的領(lǐng)域情感詞典構(gòu)建方法研究[J]. 數(shù)據(jù)分析與知識發(fā)現(xiàn),2019,3(2):98-107.
[14] 李佳軒,儲節(jié)旺. 基于彈幕評論的在線知識社區(qū)用戶關(guān)注度與情感度聯(lián)合分析[J]. 數(shù)字圖書館論壇,2023(8):68-76.
[15] 陳茜,陳思菁,毛進(jìn),等. 突發(fā)事件背景下內(nèi)容添加型轉(zhuǎn)發(fā)微博的情緒與認(rèn)知變化研究[J]. 情報科學(xué),2021,39(11):51-59.
[16] 李紫薇,邢云菲. 新媒體環(huán)境下突發(fā)事件網(wǎng)絡(luò)輿情話題演進(jìn)規(guī)律研究:以新浪微博“九寨溝地震”話題為例[J]. 情報科學(xué),2017,35(12):39-44,167.
[17] 任中杰,張鵬,李思成,等. 基于微博數(shù)據(jù)挖掘的突發(fā)事件情感態(tài)勢演化分析:以天津8·12事故為例[J]. 情報雜志,2019,38(2):140-148.
[18] 賴勝強,唐雪梅. 輿情事件中網(wǎng)民評論的社會影響研究[J]. 情報雜志,2020,39(2):103-107,115.
[19] CHEN Y D,LI Y,WANG Z F,et al. Rapid perception of public opinion in emergency events through social media[J]. Natural Hazards Review,2022,23(2):04021066.
[20] YARCHI M,BADEN C,KLIGLER-VILENCHIK N. Political polarization on the digital sphere:a cross-platform,over-time analysis of interactional,positional,and affective polarization on social media[J]. Political Communication,2021,38(1/2):98-139.
[21] 劉雅姝,欒宇,周紅磊,等. 基于事理圖譜的重大突發(fā)事件動態(tài)演變研究[J]. 圖書情報工作,2022,66(10):143-151.
[22] 黃承慧,印鑒,侯昉. 一種結(jié)合詞項語義信息和TF-IDF方法的文本相似度量方法[J]. 計算機學(xué)報,2011,34(5):856-864.
[23] 胡勇軍,江嘉欣,常會友. 基于LDA高頻詞擴展的中文短文本分類[J]. 現(xiàn)代圖書情報技術(shù),2013(6):42-48.
[24] 張冬,魏俊斌. 情感驅(qū)動下主流媒體疫情信息數(shù)據(jù)分析與話語引導(dǎo)策略[J]. 圖書情報工作,2021,65(14):101-108.
[25] 王成軍. 尋找公眾注意力爆發(fā)的起源:以YouTube視頻擴散為例[J]. 東岳論叢,2021,42(2):142-153.
[26] XU Y,XIE J Q,WANG F X,et al. The impact of weibo features on user’s information comprehension:the mediating role of cognitive load[J]. Social Science Computer Review,2023,41(6):2010-2028.
[27] ZENG D,CHEN H,LUSCH R,et al. Social media analytics and intelligence[J]. IEEE Intelligent Systems,2010,25(6):13-16.
[28] 百度AI開放平臺. 情感傾向分析[EB/OL]. [2024-08-24]. https:// ai.baidu.com/tech/nlp_apply/sentiment_classify.
[29] YAN Z,ZHOU X,REN J,et al. Identifying underlying influential factors in information diffusion process on social media platform:a hybrid approach of data mining and time series regression[J]. Information Processing Management,2023,60(5):103438.
[30] 王晰巍,賈若男,孫玉姣. 數(shù)據(jù)驅(qū)動的社交網(wǎng)絡(luò)輿情極化群體畫像構(gòu)建研究[J]. 情報資料工作,2021,42(6):21-30.
[31] LAATO S,ISLAM A K M N,ISLAM M N,et al. What drives unverified information sharing and cyberchondria during the COVID-19 pandemic?[J]. European Journal of Information Systems,2020,29(3):288-305.
[32] SAMSON K,KOSTYSZYN P. Effects of cognitive load on trusting behavior:an experiment using the trust game[J]. PLoS One,2015,10(5):e0127680.
[33] 蒲虎. Kruskal-Wallis檢驗原理介紹及其應(yīng)用[J]. 興義民族師范學(xué)院學(xué)報,2019(4):108-111.
[34] 謝新洲,林彥君. 用戶評論形式變遷對輿論形成的影響研究[J].新聞與寫作,2023(3):54-62.
[35] 中華人民共和國國務(wù)院新聞辦公室. 政府白皮書《攜手構(gòu)建網(wǎng)絡(luò)空間命運共同體》[EB/OL]. [2024-08-24]. https://www.gov. cn/yaowen/liebiao/202406/content_6960130.htm.
作者簡介
胡媛,女,博士,教授,碩士生導(dǎo)師,研究方向:信息用戶與服務(wù)、網(wǎng)絡(luò)輿情與危機應(yīng)對。
廖文濤,男,本科生,研究方向:社交媒體大數(shù)據(jù)分析。
艾欣怡,女,碩士研究生,研究方向:社交媒體大數(shù)據(jù)分析。
劉婷,女,博士,講師,通信作者,研究方向:用戶信息行為,E-mail:liuting828@ncu.edu.cn。
Changing User Perspectives on Social Media During Sudden Events: Based on Multilevel Weibo Comments
HU Yuan1,2 LIAO WenTao1 AI XinYi1 LIU Ting1,2
(1. School of Public Policy and Administration, Nanchang University, Nanchang 330031, P. R. China; 2. Digital Literacy and Skills Enhancement Center, Jiangxi Key Research Base of Philosophy and Social Sciences, Nanchang 330031, P. R. China)
Abstract: In the context of sudden events, comments at different levels can reveal the nuanced changes in user perspectives, which is of significant importance for capturing the contradictions in public opinion and managing online sentiments. This study focuses on Weibo comments related to sudden events and employs a TF-IDF-based LDA model, sentiment analysis, and Kruskal-Wallis variance testing to compare the changes in user perspectives across different comment levels, considering both user focal points and emotional variations. The research findings indicate that, in terms of user focus, as the level of comments increases, the focal points of users change and the topics of discussion evolve. First-level comments exhibit the strongest relevance and specificity regarding the events, and second-level comments pay more attention to the development and management process of the events, while third-level comments highlight the conflicts and contradictions among users. Emotionally, all levels of comments express a strong negative tendency, but significant differences in emotional expressions exist across the levels: deeper levels exhibit increasingly negative sentiments, with third-level comments containing more implicit negative emotional language than first-level and second-level comments, aligning with cognitive load theory. This study provides a more specific research perspective on the information behavior of social media users and online sentiments.
Keywords: Sudden Event; Social Media; Multilevel Comment; User Perspective; Cognitive Load Theory
(責(zé)任編輯:王瑋)