孫宗緣 馬秀峰 李奇
摘要:文章以“貴州安順公交車墜湖”事件為案例,從文本挖掘與情感分析兩個(gè)視角對(duì)突發(fā)公共安全事件網(wǎng)絡(luò)輿情進(jìn)行演化研究,較為全面地了解輿情事件進(jìn)展及走向,并在此基礎(chǔ)上,提出了針對(duì)突發(fā)公共安全事件的輿情治理對(duì)策與建議,以期為政府或相關(guān)部門預(yù)測(cè)、調(diào)控、治理輿情,維護(hù)網(wǎng)絡(luò)環(huán)境及社會(huì)治安的穩(wěn)定提供一定的參考與借鑒。
關(guān)鍵詞:網(wǎng)絡(luò)輿情;情感分析;文本挖掘;演化
中圖分類號(hào):C912.63;G206文獻(xiàn)標(biāo)識(shí)碼:A
DOI:10.13897/j.cnki.hbkjty.2021.0083
0引言
當(dāng)前,以微博為首的網(wǎng)絡(luò)平臺(tái)已成為網(wǎng)絡(luò)輿情產(chǎn)生、演化的主陣地[1]。因微博具有便捷性、互動(dòng)性、匿名性、網(wǎng)狀性等特點(diǎn),使得網(wǎng)民的觀點(diǎn)、情感與態(tài)度具有不同以往的傳播深度、廣度與速度,無疑加深了網(wǎng)絡(luò)輿情演變的復(fù)雜程度。尤其是在突發(fā)公共安全事件的背景下,倘若不能及時(shí)了解網(wǎng)民所談?wù)摰脑掝}與情緒態(tài)度變化,那么有可能會(huì)引發(fā)更為嚴(yán)重的網(wǎng)絡(luò)輿情危機(jī)。因此,及時(shí)、有效地分析突發(fā)公共安全事件網(wǎng)絡(luò)輿情下網(wǎng)民的關(guān)注點(diǎn)與情感態(tài)度,成為了把控輿情演化、引導(dǎo)輿情發(fā)展、維護(hù)社會(huì)穩(wěn)定的重要參考手段,對(duì)政府或相關(guān)部門合理引導(dǎo)、適時(shí)控制突發(fā)公共安全事件網(wǎng)絡(luò)輿情具有一定的現(xiàn)實(shí)意義。
現(xiàn)如今,已有學(xué)者展開相關(guān)探索。一是有關(guān)網(wǎng)絡(luò)輿情主題的研究。Frey[2]基于主題監(jiān)測(cè)與演示系統(tǒng),通過Kmeans將新聞報(bào)道組織成為各代表主題的集群,通過時(shí)間的變化,發(fā)現(xiàn)網(wǎng)絡(luò)輿情中的主題熱點(diǎn),便于對(duì)其進(jìn)行分析與追蹤。錢愛兵[3]通過分析網(wǎng)絡(luò)輿情的基本問題,設(shè)計(jì)了基于主題的網(wǎng)絡(luò)輿情分析模型。Emma[4]通過分析在線用戶對(duì)媒體報(bào)道的評(píng)論,發(fā)現(xiàn)網(wǎng)民關(guān)注的重點(diǎn),以此提高政府對(duì)于網(wǎng)民干預(yù)措施的可接受性及有效性。王晰魏[5]對(duì)社交網(wǎng)絡(luò)輿情主題進(jìn)行了可視化圖譜研究,對(duì)于輿情監(jiān)控平臺(tái)的使用具有重要的理論及現(xiàn)實(shí)指導(dǎo)意義。二是關(guān)于網(wǎng)絡(luò)輿情情感的研究。Turney[6]認(rèn)為文本是攜帶情感的關(guān)鍵,副詞和形容詞是判斷輿情情感傾向的重要依據(jù)。周立柱[7]重點(diǎn)梳理了基于情感詞和基于頻繁模式挖掘這兩類處理思路,總結(jié)了情感分析的成就、不足以及面臨的挑戰(zhàn)。Chen P[8]等通過對(duì)微博情感極性的研究,構(gòu)建出微博情感詞典,并用SVM對(duì)其進(jìn)行情感極性的識(shí)別,推動(dòng)了該領(lǐng)域的發(fā)展。王英[9]基于情感維內(nèi)容,分析了“南昌大學(xué)自主保潔微博輿情事件”的情感維度狀況,以實(shí)現(xiàn)網(wǎng)絡(luò)輿情事件的輿情預(yù)警研判。王蘭成、張?chǎng)蝃1011]對(duì)我國(guó)網(wǎng)絡(luò)輿情情感研究進(jìn)行了綜述,為未來研究和實(shí)踐工作提供了一定的參考借鑒。在上述研究的基礎(chǔ)上,本文嘗試以輿情生命周期為橫向維度,從主題挖掘與情感分析兩個(gè)視角對(duì)網(wǎng)絡(luò)輿情進(jìn)行縱向演化研究,使得分析結(jié)果更具有針對(duì)性、全面性;并針對(duì)網(wǎng)民情緒做出了細(xì)?;治觯瑸榍楦蟹治鎏峁┮粋€(gè)較新的切入視角;另外,本研究構(gòu)建了“貴州安順公交車墜湖”事件領(lǐng)域情感詞典,能夠?qū)Ξ?dāng)下情感詞典做出一定程度的補(bǔ)充。
1研究方法
1.1突發(fā)公共安全事件網(wǎng)絡(luò)輿情主題識(shí)別
LDA模型是一個(gè)具有三級(jí)層次結(jié)構(gòu)的貝葉斯模型[12]。它可以通過計(jì)算主題概率分布與詞語(yǔ)概率分布來識(shí)別大規(guī)模語(yǔ)料庫(kù)中的潛在主題信息,其對(duì)于文本長(zhǎng)度沒有嚴(yán)格的限制,廣泛應(yīng)用于主題識(shí)別研究,且具有不錯(cuò)的主題聚類效果[13]。因此,本文利用LDA解析不同階段內(nèi)用戶評(píng)論所產(chǎn)生的語(yǔ)義關(guān)聯(lián),以得到隱藏在文字背后的輿論主題。
1.2突發(fā)公共安全事件網(wǎng)絡(luò)輿情情感分析方法
1.2.1情感傾向分析
Word2vec是一個(gè)三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),它不會(huì)因語(yǔ)料庫(kù)的數(shù)量過高而產(chǎn)生維度爆炸問題,且能夠考慮詞匯的語(yǔ)義特征,借助上下文語(yǔ)境將詞語(yǔ)映射到K維向量。另外,研究證實(shí),Word2vec更擅長(zhǎng)處理規(guī)模較大的語(yǔ)料數(shù)據(jù)庫(kù)[14],適用于本次的大規(guī)模預(yù)料集。Word2vec包括Skip-gram和CBOW兩種模型,前者是通過輸入當(dāng)前詞去預(yù)測(cè)輸出該詞上下文出現(xiàn)的概率,后者相反,且兩種模型均實(shí)現(xiàn)了分層Softmax或負(fù)采樣的優(yōu)化機(jī)制??紤]到微博文本語(yǔ)料庫(kù)中不免出現(xiàn)新興詞語(yǔ),而分層Softmax優(yōu)化機(jī)制是使用Huffman樹進(jìn)行映射,若碰到這些詞語(yǔ),則Huffman樹的路徑往往越走越長(zhǎng),無疑會(huì)降低訓(xùn)練效率。綜合研究情況,本文應(yīng)用Word2vec中的Skip-Gram模型,并借助負(fù)采樣優(yōu)化機(jī)制處理詞語(yǔ),通過劃分訓(xùn)練集與測(cè)試集來測(cè)試最優(yōu)維度,以得到情感模型的輸入。長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM,Long Short-Term Memory)是一種時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò),它是在循環(huán)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上改進(jìn)而來,因“門”方法的出現(xiàn),克服了循環(huán)神經(jīng)網(wǎng)絡(luò)在處理數(shù)據(jù)時(shí)出現(xiàn)的梯度消失缺陷,確保了前后神經(jīng)單元具有較好的感知能力,其強(qiáng)大的文本分類功能受到了學(xué)者的一致肯定[15]。因此,本文基于Word2vecLSTM構(gòu)造本次研究的情感傾向分類預(yù)測(cè)模型。
1.2.2情感強(qiáng)度計(jì)算規(guī)則
一條文本的情感會(huì)因程度詞、否定詞、句型等而表現(xiàn)不同強(qiáng)度,因此,本文考慮分句的情感極性、程度詞、否定詞和句型計(jì)算評(píng)論文本的情感得分。首先,本文基于文獻(xiàn)《基于情感分析的移動(dòng)圖書館用戶生成內(nèi)容評(píng)價(jià)效果研究》構(gòu)建的4層程度副詞權(quán)重詞表[16],按照知網(wǎng)程度級(jí)別詞典進(jìn)行增補(bǔ),分別將“欠”“稍”“較”“很”“超”“最”所對(duì)應(yīng)的程度副詞賦權(quán)0.5、0.8、1.0、1.25、1.75、2,詳見表1。
其次,結(jié)合否定詞詞典、知網(wǎng)程度級(jí)別詞與大連理工情感詞匯本體詞典,計(jì)算微博評(píng)論文本中的句子情感強(qiáng)度值F(S)??紤]到句型不同,情感詞所表達(dá)的情感強(qiáng)度也不一致,如:“祝愿平安?!迸c“祝愿平安!”,后者明顯帶有更為強(qiáng)烈的情感色彩。因此,文本對(duì)不同句型采取不同的情感強(qiáng)度計(jì)算規(guī)則(表2),得到最終情感強(qiáng)度分值F(S)[17]。
其邏輯是:首先,依據(jù)jieba進(jìn)行切詞,將一句話拆分為由詞語(yǔ)組合成的List列表。其次,依據(jù)構(gòu)建好的情感詞典查詢句中詞語(yǔ)是否為情感詞,若在詞典中查詢到該情感詞,則提取該情感詞在大連理工情感詞匯本體中的情感極性與情感強(qiáng)度。同時(shí),以該情感詞為基準(zhǔn),向前掃描并獲取該情感詞前是否含有否定詞及其個(gè)數(shù)、程度副詞及其應(yīng)權(quán)重等。針對(duì)否定詞來說,否定詞個(gè)數(shù)為單數(shù)則乘-1,為雙數(shù)則乘1;針對(duì)程度副詞來說,若發(fā)現(xiàn)程度副詞則乘以相對(duì)應(yīng)的權(quán)重,得到該句子的情感強(qiáng)度值F(S)。若一個(gè)評(píng)論文本有多個(gè)子句,那么將子句情感分值累加并做四舍五入處理。最后,判定評(píng)論文本的句型,做相應(yīng)的規(guī)則計(jì)算,得到最終的情感強(qiáng)度F(S)。
1.2.3具體情緒類別分析
本文從“詞語(yǔ)級(jí)別”將網(wǎng)民情緒細(xì)?;>唧w而言,以大連理工情感詞匯本體(7大類,21小類)為目標(biāo)詞典,將各階段詞匯映射到目標(biāo)詞典中進(jìn)行匹配;其次,由于不同情感大類中包含的情感詞數(shù)量各有所異,因此,為清晰的展現(xiàn)網(wǎng)民的具體情緒變化,本文以各生命周期階段的始末時(shí)間為基準(zhǔn),分類整理各階段情感詞匯,并將具體情緒類別歸屬到相應(yīng)大類當(dāng)中。
2研究過程
2.1案例回顧
“貴州安順公交車墜湖事件”,事發(fā)于2020年7月7日,貴州安順市西秀區(qū)一輛公交車在行駛過程中沖出路邊護(hù)欄,墜入虹山湖中,造成重大人員傷亡的事件。經(jīng)安順市公安機(jī)關(guān)調(diào)查取證,被判定為針對(duì)不特定人群實(shí)施的危害公共安全的個(gè)人極端犯罪,是一場(chǎng)極度惡劣的突發(fā)性報(bào)復(fù)社會(huì)事件,屬于典型的突發(fā)公共安全事件。該事件一經(jīng)發(fā)生,便引起了微博用戶的廣泛關(guān)注,產(chǎn)生了心理健康、社會(huì)壓力、性別歧視等多個(gè)社會(huì)焦點(diǎn)話題,用戶討論維度較廣。這些輿論話題能夠高度概括一定的社會(huì)關(guān)系和矛盾沖突,說明該事件具有較好的分析價(jià)值。同時(shí),據(jù)知微數(shù)據(jù)網(wǎng)站統(tǒng)計(jì),共計(jì)有人民網(wǎng)、人民日?qǐng)?bào)、央視新聞等168家重要媒體參與報(bào)道,該事件影響力高于98%的社會(huì)類事件,是非常具有代表性的突發(fā)公共社會(huì)安全事件。另外,通過知網(wǎng)檢索并未發(fā)現(xiàn)有關(guān)該案例的演化研究,針對(duì)該案例的研究有待填補(bǔ)。
2.2數(shù)據(jù)來源及處理
首先,通過知微數(shù)據(jù)研究網(wǎng)站獲取有關(guān)“貴州安順公交車墜湖”事件的所有原文鏈接,形成微博地址鏈接庫(kù);其次,利用Python爬取評(píng)論文本,共計(jì)106 546條,刪除重復(fù)、空白、表情、特殊符號(hào)、圖片、網(wǎng)址、廣告、其他事件信息等無效或無關(guān)文本后得到94 928條數(shù)據(jù)樣本。
2.3Word2vecLSTM模型構(gòu)建與測(cè)試
為確保預(yù)訓(xùn)練的數(shù)據(jù)樣本具有一定代表性,本文按照評(píng)論量的1/3實(shí)施等差抽?。ú铑~為3),并將抽取到的31 642條文本進(jìn)行人工情感標(biāo)注。其中負(fù)向文本占40.2%,中性文本占25.1%,正向文本占34.7%。因Word2vec的準(zhǔn)確率受維度影響[18],為得到最優(yōu)準(zhǔn)確率,本文測(cè)試不同維度下Word2vec的模型效果。同時(shí),為防止LSTM模型過度擬合,本文將Size設(shè)置為256,Dropout設(shè)置為0.2,Dense設(shè)置為3。按8:2比例將已標(biāo)注數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集,發(fā)現(xiàn)Word2vecLSTM模型在110維度下準(zhǔn)確率較高,混淆矩陣測(cè)試結(jié)果如表3所示。
以召回率(Recall)、精確率(Precision)、F1(F1-Score)、準(zhǔn)確率(Accuracy)驗(yàn)證該模型的有效性。從表4中可以看出,訓(xùn)練集召回率平均值為0.839,精確率平均值為0.842,F(xiàn)1值的平均值為0.84,整體準(zhǔn)確率達(dá)到了0.854;測(cè)試集召回率平均值為0.848,精確率平均值為0.852,F(xiàn)1值的平均值為0.849,整體準(zhǔn)確率達(dá)到了0.866。因此,本文認(rèn)為該模型能夠適用于此案例的情感傾向分析。
2.4領(lǐng)域情感詞典構(gòu)建
微博評(píng)論中包含有較多的新潮詞語(yǔ),如何有效、全面地識(shí)別出其情感極性,構(gòu)建一個(gè)較為全面的情感詞典就顯得極其重要。因此,本文在前述分詞、過濾停用詞的基礎(chǔ)上,構(gòu)建突發(fā)公共安全事件領(lǐng)域情感詞典[19]。首先,計(jì)算詞語(yǔ)頻次,剔除出現(xiàn)頻次較低的詞語(yǔ),形成中文評(píng)論詞集Word group1。其次,將知網(wǎng)(Hownet)情感詞典、清華大學(xué)情感詞典、臺(tái)灣大學(xué)情感詞典、大連理工情感詞典、BosonNLP情感詞典以及網(wǎng)絡(luò)情感詞典中的情感詞合并構(gòu)建成評(píng)論詞集Word group2。匯總Word group1與Word group2得到突發(fā)公共安全事件領(lǐng)域情感詞典Word group。然后,選取帶有強(qiáng)烈情感且出現(xiàn)頻次較多的詞語(yǔ)作為種子詞語(yǔ),通過SO-PMI程序得到正負(fù)向情感詞。最后,以大連理工情感詞匯本體庫(kù)為參照,人工篩選、判斷與標(biāo)注情感詞。經(jīng)過多次人工篩查,將構(gòu)建好的擴(kuò)展情感詞典作為補(bǔ)充放入大連理工情感詞典中,得到包含31 012個(gè)詞語(yǔ)的突發(fā)公共安全事件領(lǐng)域情感詞典。
2.5生命周期劃分
本文依據(jù)日均討論量和生命周期理論,將該事件劃分為四個(gè)階段,如圖1所示。橫軸代表生命周期四個(gè)階段,縱軸代表評(píng)論量。7日-8日為爆發(fā)期,貴州安順公交車墜湖事件一經(jīng)發(fā)生,便引起廣大網(wǎng)民的廣泛關(guān)注與討論;9日-11日為冷卻期,網(wǎng)絡(luò)輿論數(shù)量相較于前一階段急劇減少,但仍處于發(fā)酵周期內(nèi);12日-13日為二次爆發(fā)期,經(jīng)警方調(diào)查該事件系司機(jī)蓄意報(bào)復(fù)社會(huì),引起了網(wǎng)民的激憤;14日-15日為消退期,該事件網(wǎng)絡(luò)輿情發(fā)酵結(jié)束。
2.6突發(fā)公共安全事件網(wǎng)絡(luò)輿情文本挖掘分析
2.6.1基于頻次的關(guān)鍵詞分析
在剔除連詞、介詞、表達(dá)模糊詞語(yǔ)后,得到27 776個(gè)詞語(yǔ),總計(jì)出現(xiàn)494 567次。其中,出現(xiàn)頻次在100以上的詞語(yǔ)共計(jì)700個(gè),僅占詞匯總量的2.5%,但其總頻次高達(dá)339 475,占總頻次的68.6%。而出現(xiàn)頻次在10以下的詞語(yǔ)總數(shù)有23 766個(gè),占詞匯總量的85.6%,這些詞匯出現(xiàn)總頻次為55 199,僅占總頻次的11.1%。為直觀展示詞語(yǔ)的分布特征,本文將f定義為關(guān)鍵詞C所對(duì)應(yīng)的詞頻數(shù),將n設(shè)為出現(xiàn)頻次為f的關(guān)鍵詞總數(shù)量。分別對(duì)f、n取對(duì)數(shù),則此時(shí)橫坐標(biāo)為log(f),縱坐標(biāo)為log(n),并對(duì)生成的散點(diǎn)圖進(jìn)行線性擬合,如圖2所示。
由線性擬合方程可以看出,R2等于0.753,擬合度較高,較為符合齊普夫分布定律。依據(jù)普萊斯定律確定出現(xiàn)頻次在130、17、43、8以上的關(guān)鍵詞分別為爆發(fā)期、冷卻期、二次爆發(fā)期、消退期的高頻關(guān)鍵詞,依據(jù)自身研究?jī)?nèi)容所需并結(jié)合學(xué)科經(jīng)驗(yàn)將出現(xiàn)頻次在5以下的詞語(yǔ)設(shè)置為低頻關(guān)鍵詞[20]。在此基礎(chǔ)上構(gòu)建高、低頻詞云圖,見圖3、圖4。
由圖3、圖4可知,不同階段內(nèi)高、低頻詞云圖存在差異,且關(guān)鍵詞數(shù)量也各有不同,在一定程度上表明網(wǎng)民關(guān)注的熱點(diǎn)及情感轉(zhuǎn)移趨勢(shì)。如爆發(fā)期內(nèi)正向關(guān)鍵詞數(shù)量最多,說明了網(wǎng)民對(duì)該突發(fā)事故的祈禱、關(guān)切心情;而冷卻期內(nèi)主要映射出網(wǎng)民渴求真相的情緒態(tài)度;二次爆發(fā)期及消退期內(nèi)網(wǎng)民強(qiáng)烈激憤與理性訴求共振。具體來看,四個(gè)高頻詞云圖既相互聯(lián)系又相互獨(dú)立,即“司機(jī)”“原因”“希望”“生命”等關(guān)鍵詞貫穿事件始終;爆發(fā)期內(nèi)的“平安”、冷卻期內(nèi)的“真相”、二次爆發(fā)期內(nèi)的“報(bào)復(fù)”、消退期內(nèi)的“社會(huì)”等詞表明不同時(shí)期的網(wǎng)民關(guān)注重點(diǎn)。四個(gè)低頻詞云圖關(guān)聯(lián)性較低,在一定程度上展示輿情主題的外延,為相關(guān)部門控制輿情的擴(kuò)散與傳播提供參考。
2.6.2基于LDA的主題識(shí)別分析
為防止主題模型過度擬合,本文用困惑度輔以肘部法則判斷最優(yōu)主題數(shù),不同階段的困惑度曲線,如圖5所示。由肘部法則可以看出,該事件各階段最優(yōu)主題數(shù)分別為10、6、10、8。通過對(duì)比不同階段主題特征詞發(fā)現(xiàn),當(dāng)主題數(shù)目為4時(shí),能夠展現(xiàn)該輿情事件在各個(gè)階段的主要研究主題[21]。為更深層次的分析輿論主題與網(wǎng)民情感的聯(lián)結(jié)關(guān)系,本文緊接計(jì)算各主題情感得分,即將各階段評(píng)論文本根據(jù)其內(nèi)容所包含的關(guān)鍵詞匹配到相應(yīng)主題后,計(jì)算從屬同一主題評(píng)論文本的情感強(qiáng)度均值,如表5所示。
在爆發(fā)期,僅有Topic1情感為正,其他主題情感均為負(fù)。結(jié)合評(píng)論文本將Topic1總結(jié)為“祈禱公交車內(nèi)人員平安”、Topic2為“車內(nèi)載有未成年,不要讓悲劇發(fā)生”、Topic3是“質(zhì)疑與猜測(cè)肆起,官方需盡快查證真相”、Topic4為“對(duì)遇難乘客深表哀痛”??梢姡W(wǎng)民高度關(guān)注車內(nèi)情況,且隨著救援結(jié)果的公布,網(wǎng)民們的悲痛之情逐漸增多。在冷卻期,僅有Topic3攜有正向情感,結(jié)合主題特征詞可將其總結(jié)為“致敬救人英雄,盼望早日康復(fù)”,Topic1為“媒體的委婉話語(yǔ)引起網(wǎng)民的極度不滿”、Topic2為“司機(jī)是否應(yīng)該承擔(dān)責(zé)任”、Topic4為“調(diào)查事件原因,發(fā)布真相公告”。此時(shí),網(wǎng)民期待真相的焦慮心情發(fā)生了偏移與突變,部分網(wǎng)民將負(fù)面情緒發(fā)泄在媒體之上,并催促相關(guān)部門盡快調(diào)查事實(shí)真相。因不明原由,“司機(jī)惡意所為”“司機(jī)突發(fā)疾病”等多種觀點(diǎn)導(dǎo)致事故責(zé)任界定成為熱議話題。二次爆發(fā)期階段,真相的發(fā)布使該事件重新掀起評(píng)論熱潮,各主題情感得分再度下降。相較于前兩個(gè)階段,該階段的主題特征詞呈現(xiàn)出顯著的不同,負(fù)向情感占據(jù)了較大空間,網(wǎng)民情緒不再穩(wěn)定??蓪opic1總結(jié)為“蓄意報(bào)復(fù)社會(huì)的人就是惡魔”、Topic2為“做好公交車司機(jī)的健康審查工作極為必要”、Topic3為“解決社會(huì)不公、做好矛盾處理”、Topic4為“網(wǎng)民對(duì)于本不該喪命的乘客深表悲痛”。在消退期,網(wǎng)民評(píng)論量急劇下降,而網(wǎng)民負(fù)向情感強(qiáng)度依舊強(qiáng)烈。因此,該階段的4個(gè)主題負(fù)向情感數(shù)值在這一階段達(dá)到了最低谷。此時(shí),可以將該階段主題歸結(jié)為:Topic1“政府應(yīng)加強(qiáng)社會(huì)管理工作,預(yù)防過激事件發(fā)生”、Topic2“人性的扭曲,惡意的報(bào)復(fù),致使無辜的乘客遇難”、Topic3“司機(jī)惡行不容社會(huì)寬恕”、Topic4“關(guān)注社會(huì)不公,弱者也會(huì)反抗”。同時(shí),也有一部分網(wǎng)民在表達(dá)對(duì)遇害者及其家庭的惋惜與遺憾之情、對(duì)司機(jī)惡行的痛惡同時(shí),也呼吁政府及相關(guān)部門關(guān)注弱勢(shì)群體,落實(shí)切實(shí)可行的政策,解決社會(huì)矛盾。
2.7突發(fā)公共安全事件網(wǎng)絡(luò)輿情情感傾向分析
2.7.1評(píng)論文本情感傾向演化分析
圖6中橫坐標(biāo)代表“貴州安順公交車墜湖”事件的生命周期階段;縱坐標(biāo)是情感傾向數(shù)量的刻度,以此展示不同情感在其所屬階段的比重。
在爆發(fā)期內(nèi),正向情感比重較高(達(dá)49%),負(fù)向情感居于第二位,所占比重為33%,中性情感占比最少,僅為18%。其次,從數(shù)量上看,中性情感、正向情感、負(fù)向情感數(shù)量刻度的最高值也均在爆發(fā)期出現(xiàn),且該階段的網(wǎng)民評(píng)論總數(shù)量約為其余階段總和的3倍之多,呈現(xiàn)出較大的不平衡性。在冷卻期內(nèi),評(píng)論數(shù)量大幅下滑,其中,正向情感數(shù)量下降最多,從整體上說明了網(wǎng)民對(duì)于該公共安全突發(fā)事件的關(guān)注度急劇下降。從各種情感傾向比例上來看,負(fù)向情感占比最大,達(dá)到了47%;中性情感占比為44%;正向情感占比最少,僅為9%。二次爆發(fā)期內(nèi)各類情感傾向數(shù)量均大幅度增長(zhǎng),中性情感數(shù)量達(dá)到5 169,增幅近乎3.7倍;正向情感數(shù)量達(dá)到980,增長(zhǎng)約3.3倍;負(fù)向情感數(shù)量增長(zhǎng)最為劇烈,其數(shù)值高達(dá)12 845,是前一階段的8倍之多。可以看出網(wǎng)民在該階段大多持負(fù)向情感,致使情感傾向分布極不均勻,正向情感與負(fù)向情感之間的不平衡性再度拉大。從各類情感傾向占比上來看,負(fù)向情感傾向占比最大,高達(dá)68%,是該階段的主導(dǎo)情感傾向;中性情感傾向的文本占比27%;正向情感的文本占比最少,僅為5%。在網(wǎng)絡(luò)輿情的冷卻期內(nèi),僅有少量網(wǎng)民參與評(píng)論,不論是中性情感、正向情感還是負(fù)向情感,其數(shù)量刻度均在該階段進(jìn)入最低點(diǎn)。中性情感的文本共計(jì)178條;正向情感的文本數(shù)量最低,僅為13條;負(fù)向情感的文本數(shù)量在此階段最多,為408條。
2.7.2評(píng)論文本情感強(qiáng)度演化分析
根據(jù)情感強(qiáng)度計(jì)算規(guī)則,得到該事件的用戶情感強(qiáng)度時(shí)序變化圖。同時(shí)根據(jù)不同情感強(qiáng)度值的大小將情感強(qiáng)度細(xì)分為輕度正向(0,5)、一般正向[5,10)、中度正向[10,15)、高度正向[15,20)、極度正向[20,+∞)與輕度負(fù)向(0,-5)、一般負(fù)向[-5,-10)、中度負(fù)向[-10,-15)、高度負(fù)向[-15,-20)、極度負(fù)向[-20,-∞)10個(gè)維度[22],得到不同類別情感強(qiáng)度柱狀圖,如圖7所示。
結(jié)合兩類圖可以看出,爆發(fā)期內(nèi)網(wǎng)民的正面情感強(qiáng)度波動(dòng)幅度大于負(fù)面情感強(qiáng)度波動(dòng)幅度,且情緒較為平穩(wěn),多以一般正向情感類別為主,輿情始發(fā)1小時(shí)后,正面情感強(qiáng)度攀升至頂峰,高達(dá)81 931。自7日18時(shí)到8日23時(shí),正向情感總體趨于平緩。負(fù)面情感強(qiáng)度時(shí)序曲線在7日16時(shí)達(dá)到最低,為-10017,且在7日19時(shí)、23時(shí),7月8日9時(shí)多次落入谷底。直至8日12時(shí),負(fù)面情感強(qiáng)度曲線才逐漸平緩。相較于爆發(fā)期,冷卻期的負(fù)向情感強(qiáng)度曲線波動(dòng)幅度略勝于正向情感強(qiáng)度曲線波動(dòng)幅度,且不同類別的負(fù)向情感數(shù)量均高于正向情感的數(shù)量,說明該階段以負(fù)向情感為主。值得注意的是,不論正向情感強(qiáng)度曲線還是負(fù)向情感強(qiáng)度曲線,其峰值都出現(xiàn)在9日11時(shí),且通過觀察9日4時(shí)-9日18時(shí)兩條曲線可知,其發(fā)展態(tài)勢(shì)大致相似,在一定程度上反映出,此刻出現(xiàn)了網(wǎng)民觀點(diǎn)對(duì)峙的現(xiàn)象。二次爆發(fā)期內(nèi),網(wǎng)民的情感出現(xiàn)大的拐點(diǎn),在12日17時(shí)負(fù)向情感陡然升高,其波動(dòng)程度遠(yuǎn)大于正向情感強(qiáng)度曲線,且“極度”負(fù)向情感達(dá)到最高值(為1 349),約是“極度”正向情感的10.5倍。這時(shí)網(wǎng)民形成了對(duì)“司機(jī)報(bào)復(fù)社會(huì)行為”強(qiáng)烈譴責(zé)的輿論共識(shí),極端負(fù)向情緒制造出了更多的輿論壓力。在輿情末期,負(fù)向情感強(qiáng)度波動(dòng)幅度依舊大于正向情感波動(dòng)幅度。
縱觀該事件生命周期內(nèi)的情感強(qiáng)度演變情況發(fā)現(xiàn),爆發(fā)期內(nèi)正向情感強(qiáng)度數(shù)量最多,數(shù)值最大。隨著事件的推進(jìn),正向情感強(qiáng)度的數(shù)量和數(shù)值均呈下降趨勢(shì),尤其是在冷卻期,正向情感所剩無幾。而負(fù)向情感則恰恰相反,自爆發(fā)期之后,其數(shù)量和數(shù)值不斷增加,并在二次爆發(fā)期時(shí)達(dá)到頂峰。雖然在輿情冷卻期,負(fù)向情感數(shù)量大幅減少,但仍使情感天平嚴(yán)重失衡,整體情感強(qiáng)度分布極為不均,網(wǎng)民有明顯的情感偏向行為,與該事件輿情發(fā)展趨勢(shì)大致相符。
2.7.3具體情緒類別演化分析
通過對(duì)各生命周期內(nèi)具體情緒類別進(jìn)行數(shù)理統(tǒng)計(jì),得到圖8。其中橫坐標(biāo)代表具體情感類別及其所屬大類,縱坐標(biāo)代表具體情感類別的數(shù)量,數(shù)據(jù)標(biāo)簽代表該具體情緒在相應(yīng)生命周期階段所占的比例。
爆發(fā)期內(nèi),樂、好、哀、惡所占比重較大,PE高達(dá)26.3%,“平安”“安全”是該情感大類中的高頻詞。事故一經(jīng)發(fā)布,瞬間成為極受關(guān)注的重大突發(fā)事件,網(wǎng)民紛紛表達(dá)祈愿平安的情感傾向,該傾向貫穿于事件始終。冷卻期內(nèi),樂、好、哀、惡四種情緒所占比重最高,其中PH、NN、NE所占比重較大,分別為19.6%、17%、14.4%。該階段內(nèi)情緒類別頻次遠(yuǎn)遠(yuǎn)低于爆發(fā)期,但是不同情緒類別比重和爆發(fā)期情緒類別比重類似。二次爆發(fā)期內(nèi),樂、好、哀、懼、惡情感大類的比重最高,該階段內(nèi)情緒數(shù)量相較于前一階段有了較大提升,高權(quán)重情緒種類也隨之增加。但是總體來看,該階段輿情熱度不如事發(fā)之時(shí)來的強(qiáng)烈。在消退期內(nèi),樂、好、哀、惡情感大類的比重最高,而整體數(shù)量都呈下降趨勢(shì),且情感類別數(shù)量最少。從網(wǎng)民整體演化情緒來看,該事件中一直伴有哀傷、祈愿、敬佩、憎惡、害怕的情感,爆發(fā)期以哀傷、祈愿為主,冷卻期以悲傷、贊揚(yáng)為主,二次爆發(fā)期以憎惡、貶責(zé)、恐懼為主,消退期以同情為主。結(jié)合事件發(fā)展來看,網(wǎng)民的情緒隨著事件的推進(jìn)不斷變化,且與熱度走勢(shì)基本相一致,統(tǒng)一中也存在著特殊性。相較而言,司機(jī)蓄意報(bào)復(fù)社會(huì)的惡劣行徑更加刺激著網(wǎng)民負(fù)面情緒爆發(fā),但是在輿論漩渦中仍有理智觀點(diǎn)。
3對(duì)策建議
突發(fā)公共安全事件網(wǎng)絡(luò)輿情具有突發(fā)性、長(zhǎng)期潛伏性、災(zāi)難性和廣泛性等特性,為避免應(yīng)對(duì)策略的空泛性,本文基于已有研究結(jié)論和輿情生命周期,提出輿情應(yīng)對(duì)策略,包括干預(yù)時(shí)機(jī)、處理方式、解決辦法等。
(1)根據(jù)輿情事件性質(zhì)選擇策略。突發(fā)公共安全事件分為自然災(zāi)害、事故災(zāi)難、公共衛(wèi)生事件、社會(huì)安全事件四類,事故災(zāi)難在四類當(dāng)中發(fā)生較為頻繁?!百F州安順公交車墜湖”事件屬于報(bào)復(fù)公共社會(huì)性事故災(zāi)難,因此相關(guān)部門首先要采取“公布、疏導(dǎo)”的辦法,在事件發(fā)生后,及時(shí)跟進(jìn)事件進(jìn)展,實(shí)時(shí)傳播真相,同時(shí)要傾聽群眾意見。一方面,可避免謠言傳播而導(dǎo)致的輿情擴(kuò)散,另一方面,有助于撫慰民心,維護(hù)社會(huì)穩(wěn)定。
(2)監(jiān)測(cè)網(wǎng)民評(píng)論內(nèi)容,把握網(wǎng)民談?wù)撝黝}。政府或相關(guān)部門應(yīng)該建立網(wǎng)絡(luò)輿情主題監(jiān)測(cè)與跟進(jìn)系統(tǒng),對(duì)隱藏在文字背后的深層次語(yǔ)義主題快速研判,觀察網(wǎng)民言論聚焦在哪幾個(gè)輿論主題上,梳理這些不同輿論主題之間的連接脈絡(luò)。與此同時(shí),要結(jié)合情感分析技術(shù),考慮每一個(gè)主題的情感正負(fù)及情感強(qiáng)度,以采取不同的治理對(duì)策。若發(fā)現(xiàn)某個(gè)輿論主題情感為負(fù),那么應(yīng)優(yōu)先對(duì)其合理化引導(dǎo),通過解析話題矛盾,主動(dòng)回應(yīng)網(wǎng)民訴求等措施。待到其情感波動(dòng)降到可控范圍之后,便可任之自由發(fā)展走向消散;倘若發(fā)現(xiàn)某一輿論話題為正向情感,那么應(yīng)利用好正面話題,擴(kuò)大正面話題的影響力,以平衡整體輿論環(huán)境。
(3)關(guān)注情感傾向轉(zhuǎn)折點(diǎn)及情感強(qiáng)度突變時(shí)刻,把握輿情發(fā)展趨勢(shì)適時(shí)引導(dǎo)。已有研究表明[23],政府干預(yù)的過早反而會(huì)吸引更多的網(wǎng)民參與到事件討論中,進(jìn)而傳播輿情,而在潛伏階段進(jìn)行干預(yù)則會(huì)產(chǎn)生較好的效果。就突發(fā)公共安全事件來說,及時(shí)發(fā)布救援信息,披露事實(shí)真相會(huì)穩(wěn)定網(wǎng)民情緒,但是干預(yù)方式不當(dāng)反而會(huì)激發(fā)大眾負(fù)面情緒。本案例中民眾得知司機(jī)惡意報(bào)復(fù)社會(huì)后,反而群情激憤,引發(fā)輿論的二次爆發(fā)。因此,政府應(yīng)時(shí)刻關(guān)注輿情動(dòng)態(tài)變化,找準(zhǔn)情感傾向轉(zhuǎn)折點(diǎn)與情感強(qiáng)度突變時(shí)刻,以靈活、適當(dāng)?shù)姆绞浇槿?,既有利于弱化關(guān)鍵階段的傳播負(fù)面影響力,也有利于收集輿情數(shù)據(jù),針對(duì)性地做出應(yīng)對(duì)措施。
(4)依據(jù)網(wǎng)民具體情緒色彩變化,側(cè)重優(yōu)化輿情干預(yù)效果。在網(wǎng)民參與輿情時(shí),情緒結(jié)構(gòu)較為復(fù)雜,導(dǎo)致輿情風(fēng)險(xiǎn)就越高。網(wǎng)民情緒得不到確切安撫,網(wǎng)民就越渴求政府的介入。因此,相關(guān)部門應(yīng)以網(wǎng)民情緒為著腳點(diǎn),公開表達(dá)政府態(tài)度和立場(chǎng),及時(shí)處理輿情矛盾,以此擴(kuò)大正面情緒的影響力,遏制謠言傳播,降低輿情風(fēng)險(xiǎn)。
4結(jié)論與展望
本文從文本挖掘與情感分析兩個(gè)視角對(duì)突發(fā)公共安全事件網(wǎng)絡(luò)輿情做出演化研究,具體如下:以“貴州安順公交車墜湖事件”為例,將輿情生命周期劃分為為爆發(fā)期、冷卻期、二次爆發(fā)期、消退期四個(gè)階段。在文本挖掘方面,以詞頻分析、主題分析兩個(gè)方面勘探網(wǎng)民關(guān)注的內(nèi)容;在情感分析方面,以情感傾向、情感強(qiáng)度、具體情緒對(duì)網(wǎng)民評(píng)論進(jìn)行剖析。綜合以上分析發(fā)現(xiàn),網(wǎng)民關(guān)注點(diǎn)大體經(jīng)歷了如下轉(zhuǎn)變,從“祈愿乘客平安”到“要求查明事故真相”到“司機(jī)惡意報(bào)復(fù)社會(huì)”再到“填補(bǔ)社會(huì)漏洞,加強(qiáng)矛盾處理”。在這一轉(zhuǎn)變過程中,網(wǎng)民情緒逐步由正轉(zhuǎn)負(fù),這其中一直伴隨著網(wǎng)民的非理性言論,在謠言的沖擊下,整個(gè)輿論環(huán)境變得更為復(fù)雜。尤其是網(wǎng)民在得知事故真相時(shí),其負(fù)向情緒全面爆發(fā),負(fù)向情感強(qiáng)度達(dá)到最低谷,具體情緒以憤怒為主,直至該輿情生命周期結(jié)束,該輿論場(chǎng)的情感天平才得以平衡。在此基礎(chǔ)上,政府或相關(guān)部門應(yīng)注重突發(fā)公共安全事件網(wǎng)絡(luò)輿情的“公布、疏導(dǎo)”,既要監(jiān)測(cè)網(wǎng)民評(píng)論內(nèi)容,把握網(wǎng)民談?wù)撝黝},也應(yīng)關(guān)注情感傾向轉(zhuǎn)折點(diǎn)以及情感強(qiáng)度突變時(shí)刻,依據(jù)網(wǎng)民情緒色彩的變化進(jìn)行輿情的引導(dǎo)、調(diào)控與治理。同時(shí),及時(shí)公布輿情信息、聽取民意,提升自身對(duì)于突發(fā)公共安全事件的應(yīng)急處理能力也是必不可少的方面。
由于網(wǎng)民評(píng)論屬于匿名性的,因此不排除部分網(wǎng)民根據(jù)自己的偏向做出不符合實(shí)際情況的評(píng)價(jià),而且本研究情感分析結(jié)果的準(zhǔn)確度在一定程度上取決于深度學(xué)習(xí)模型的準(zhǔn)確性和情感詞典的質(zhì)量,后續(xù)將選用準(zhǔn)確率更高的文本分析方法提升情感分類的準(zhǔn)確性,并從更多平臺(tái)豐富數(shù)據(jù)量,增加對(duì)研究問題的分析角度,以期能夠?yàn)樵擃I(lǐng)域做出一些貢獻(xiàn)。
參考文獻(xiàn)
[1]陳娟,劉燕平,鄧勝利.政務(wù)微博辟謠信息傳播效果的影響因素研究[J].情報(bào)科學(xué),2018 (1):91-95,117.
[2]Frey Allan J.Monitoring the news:A TDT demonstration systems[C].In the Proceeding of HLT2001.San Diego,CA,2001:18-21.
[3]錢愛兵.基于主題的網(wǎng)絡(luò)輿情分析模型及其實(shí)現(xiàn)[J].現(xiàn)代圖書情報(bào)技術(shù),2008(4):49-55.
[4]Emma,Louise,Giles,et al.Capturing Public Opinion on Public Health Topics:A Comparison of Experiences from a Systematic Review,F(xiàn)ocus Group Study,and Analysis of Online,User-Generated Content[J].Frontiers in Public Health,2015,3:200.
[5]王晰巍,賈若男,韋雅楠,等.社交網(wǎng)絡(luò)輿情事件主題圖譜構(gòu)建及可視化研究——以校園突發(fā)事件話題為例[J].情報(bào)理論與實(shí)踐,2020 (3):17-23.
[6]Turney P D.Thumbs up or Thumbs down?:Semantic Orientation Applied to Unsupervised Cl assification of Reviews[C]//Meeting on Association for Computational Linguistics.Association for Computational Linguistics,2002:417-424.
[7]周立柱,賀宇凱,王建勇.情感分析研究綜述[J].計(jì)算機(jī)應(yīng)用,2008(11):2725-2728.
[8]Chen P,F(xiàn)u X,Teng S,et al.Research on Micro-blog Sentiment Polarity Classification Based on SVM[J].2014,8944:392-404.
[9]王英,龔花萍.基于情感維度的大數(shù)據(jù)網(wǎng)絡(luò)輿情情感傾向性分析研究——以“南昌大學(xué)自主保潔”微博輿情事件為例[J].情報(bào)科學(xué),2017 (4):37-42.
[10]王蘭成,陳立富.國(guó)內(nèi)外網(wǎng)絡(luò)輿情演化、預(yù)警和應(yīng)對(duì)理論研究綜述[J].圖書館雜 志,2018 (12):4-13.
[11]張?chǎng)?,劉鑫雅,張雅?我國(guó)網(wǎng)絡(luò)輿情識(shí)別的研究脈絡(luò)、核心主題與發(fā)展趨勢(shì)分析[J].河北科技圖苑,2021 (3):90-96,89.
[12]馬秀峰,郭順利,宋凱.基于LDA主題模型的“內(nèi)容-方法”共現(xiàn)分析研究——以情報(bào)學(xué)領(lǐng)域?yàn)槔齕J].情報(bào)科學(xué),2018 (4):69-74.
[13]王洪偉,高松,陸頲.基于LDA和SNA的在線新聞熱點(diǎn)識(shí)別研究[J].情報(bào)學(xué)報(bào),2016 (10):1022-1037.
[14]曾潤(rùn)喜,徐曉林.網(wǎng)絡(luò)輿情突發(fā)事件預(yù)警系統(tǒng)、指標(biāo)與機(jī)制[J].情報(bào)雜志,2009 (11):52-54,51.
[15]Zhang X,Zhao J,Lecun Y.Character-Level ConvoLutional Networks forText classification[C] //Neural lnformation Processing Systems.MIT Press,2015 (6):649-657.
[16]王晰巍,楊夢(mèng)晴,韋雅楠,等.基于情感分析的移動(dòng)圖書館用戶生成內(nèi)容評(píng)價(jià)效果研究[J].圖書情報(bào)工作,2018 (18):16-23.
[17]李勇,蔡夢(mèng)思,鄒凱,等.社交網(wǎng)絡(luò)用戶線上線下情感傳播差異及影響因素分析——以“成都女司機(jī)被打”事件為例[J].情報(bào)雜志,2016 (6):80-85.
[18]熊富林,鄧怡豪,唐曉晟.Word2vec的核心架構(gòu)及其應(yīng)用[J].南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版),2015(1):43-48.
[19]郭順利,張向先.面向中文圖書評(píng)論的情感詞典構(gòu)建方法研究[J].現(xiàn)代圖書情報(bào)技 術(shù),2016(2):67-74.
[20]虞秋雨,徐躍權(quán).共詞分析中高頻詞閾值確定方法的實(shí)證研究——以新冠肺炎文獻(xiàn)高頻詞選取為例[J].情報(bào)科學(xué),2020 (9):90-95.
[21]李秀霞,宋凱,趙思喆,等.國(guó)內(nèi)外教育大數(shù)據(jù)研究現(xiàn)狀對(duì)比分析[J].現(xiàn)代情報(bào),2017 (11):125-129.
[22]蔣知義,馬王榮,鄒凱,等.基于情感傾向性分析的網(wǎng)絡(luò)輿情情感演化特征研究[J].現(xiàn)代情報(bào),2018 (4):50-57.
[23]馮蘭萍,錢春琳,龐慶華,等.基于三方博弈模型的突發(fā)事件網(wǎng)絡(luò)輿情政府干預(yù)時(shí)機(jī)分析[J/OL].情報(bào)理論與實(shí)踐:1-14[2021-06-25].http://kns.cnki.net/kcms/detail/11.1762.g3.202104 02.1132.002.html.
作者簡(jiǎn)介:孫宗緣(1996),男,曲阜師范大學(xué)傳媒學(xué)院圖書館學(xué)碩士研究生在讀。研究方向:網(wǎng)絡(luò)輿情、信息計(jì)量。
馬秀峰(1963),男,曲阜師范大學(xué)繼續(xù)教育學(xué)院教授。研究方向:信息咨詢與科學(xué)計(jì)量。
李奇(1997),女,曲阜師范大學(xué)傳媒學(xué)院圖書館學(xué)碩士研究生在讀。研究方向:信息計(jì)量。
(收稿日期:20170708責(zé)任編輯:馬玉娟)
Analysis on the Evolution of Network Public Opinion on Public Security
EmergenciesBased on Text Mining and Sentiment Analysis
Sun ZongyuanMa XiufengLi Qi
Abstract:Taking the case of “Bus fell into lake in Anshun Guizhou” as an example, this paper studies the evolution of online public opinions on public security emergencies from two perspectives of text mining and sentiment analysis. Aiming to comprehensively understand the progress and trend of public opinion events, the paper puts forward countermeasures and suggestions for public opinion management of public security events, so as to help the government or relevant departments to predict, regulate and manage public opinions, which is of certain significance to maintain the stability of network environment and social order.
Keywords:Online Public Opinion; Emotion Analysis; Text Mining; Evolution