仲兆滿,李 恒
(1.江蘇海洋大學(xué) 計(jì)算機(jī)工程學(xué)院,江蘇 連云港 222005; 2.江蘇省海洋資源開(kāi)發(fā)研究院,江蘇 連云港 222005)
突發(fā)事件發(fā)生后,民眾生命財(cái)產(chǎn)安全和國(guó)家安全、社會(huì)安定都會(huì)不同程度地受到威脅。在以微博、新聞客戶端、微信等為代表的移動(dòng)社交媒體興起的新媒體背景下,地域不再是限制突發(fā)事件影響力的因素,導(dǎo)致突發(fā)事件影響的深度、廣度急劇擴(kuò)大。加強(qiáng)對(duì)突發(fā)事件暴發(fā)后社交網(wǎng)絡(luò)輿情的分析、監(jiān)督與控制,能有效遏制突發(fā)事件輿情擴(kuò)散,消除突發(fā)事件衍生的負(fù)面影響。
本文圍繞新媒體環(huán)境下突發(fā)事件信息識(shí)別及分析這一主題,全面調(diào)研分析了新媒體環(huán)境下突發(fā)事件識(shí)別及檢測(cè)、謠言識(shí)別及處理、關(guān)鍵節(jié)點(diǎn)識(shí)別、輿情演變趨勢(shì)分析、傳播路徑分析、網(wǎng)民情感分析等內(nèi)容,闡明了當(dāng)前新媒體環(huán)境下對(duì)突發(fā)事件信息處理的不足及未來(lái)的研究方向。
現(xiàn)有新媒體環(huán)境下突發(fā)事件信息識(shí)別的研究主要包括突發(fā)事件本身的識(shí)別及檢測(cè)、突發(fā)事件謠言識(shí)別、突發(fā)事件關(guān)鍵節(jié)點(diǎn)識(shí)別等。對(duì)突發(fā)事件相關(guān)信息的識(shí)別,可以把控突發(fā)事件的發(fā)展趨勢(shì),為突發(fā)事件的管控奠定基礎(chǔ),提高突發(fā)事件的管控效率。
近年來(lái),頻發(fā)的各類突發(fā)事件,對(duì)受難地和受難人造成難以估量的損失,因此,在突發(fā)事件暴發(fā)后采取相應(yīng)的措施進(jìn)行及時(shí)的網(wǎng)絡(luò)監(jiān)測(cè)和輿論引導(dǎo)有著重要意義。
現(xiàn)有關(guān)于新媒體環(huán)境下突發(fā)事件識(shí)別及檢測(cè)的研究主要包括基于詞特征和基于地域標(biāo)簽的突發(fā)事件識(shí)別及檢測(cè)。
從突發(fā)詞特征角度出發(fā),童薇等[1]基于微博數(shù)據(jù)的文本特征、語(yǔ)義特征、時(shí)序特性和社交關(guān)系特性,提出了一種基于微博數(shù)據(jù)的突發(fā)事件檢測(cè)算法。Guzman等[2]提出了一種突發(fā)關(guān)鍵詞的檢測(cè)方法,設(shè)計(jì)了基于歸一化個(gè)體頻率信號(hào)的可擴(kuò)展的在線檢測(cè)話題算法。Goto等[3]結(jié)合字符的雙向長(zhǎng)短期記憶模型和注意力機(jī)制提出了以文本突發(fā)詞為中心的突發(fā)事件檢測(cè)模型。Kalden[4]結(jié)合數(shù)據(jù)分析、風(fēng)險(xiǎn)映射、社交網(wǎng)絡(luò)分析和異常檢測(cè)提出了以突發(fā)特征詞為中心的突發(fā)事件檢測(cè)模型。張仰森等[5]提出了一種基于多詞特征的微博突發(fā)事件檢測(cè)模型,即對(duì)相同間隔時(shí)間窗口內(nèi)數(shù)據(jù)進(jìn)行切片,獲取詞頻、話題標(biāo)簽和詞頻增長(zhǎng)率等特征,以此構(gòu)建耦合度矩陣,生成以突發(fā)詞為葉子節(jié)點(diǎn)的二叉樹(shù)。該模型對(duì)基于突發(fā)詞特征檢測(cè)突發(fā)事件有一定的參考價(jià)值,其流程如圖1所示。王雪穎等[6]提出一種融合文本情感過(guò)濾和用戶影響力的多特征微博突發(fā)事件檢測(cè)算法。該算法首先通過(guò)噪聲過(guò)濾和情感過(guò)濾獲得文本,再采用用戶影響力計(jì)算方法結(jié)合突發(fā)詞提取算法提取突發(fā)詞特征,最后引入凝聚式層次聚類算法對(duì)突發(fā)詞集進(jìn)行聚類,實(shí)現(xiàn)突發(fā)事件的檢測(cè)。蔣偉進(jìn)等[7]提出了一種基于詞相關(guān)性特征的突發(fā)事件檢測(cè)方法,利用了詞頻增長(zhǎng)率特征、用戶影響力及詞權(quán)重三類指標(biāo)。武國(guó)亮等[8]提出了一種基于命名實(shí)體識(shí)別的突發(fā)事件抽取方法。該方法首先將Lattice機(jī)制融合雙向長(zhǎng)短期記憶模型(Bi-LSTM)作為共享層,獲取句子中的詞語(yǔ)語(yǔ)義特征,再提取實(shí)體對(duì)應(yīng)的分詞結(jié)果作為L(zhǎng)attice機(jī)制的輸入,并進(jìn)一步強(qiáng)化實(shí)體語(yǔ)義特征的提取,提高了突發(fā)事件關(guān)鍵詞的識(shí)別準(zhǔn)確率。申云鳳等[9]根據(jù)突發(fā)詞涵蓋的組織、人物、態(tài)度等特征,利用NLPIR相關(guān)工具結(jié)合Bi-LISM+CRF模型對(duì)突發(fā)事件的關(guān)鍵詞進(jìn)行識(shí)別和抽取。李東昊等[10]以用戶及微博影響力為主要影響因子選取時(shí)間窗口內(nèi)的微博,將選取的微博內(nèi)容與歷史數(shù)據(jù)相結(jié)合計(jì)算突發(fā)詞, 通過(guò)聚類算法利用計(jì)算所得的突發(fā)詞構(gòu)建潛在事件數(shù)據(jù)集,實(shí)現(xiàn)突發(fā)事件的檢測(cè)。幾種突發(fā)事件檢測(cè)方法的評(píng)價(jià)標(biāo)準(zhǔn)及精準(zhǔn)率對(duì)比見(jiàn)表1。
表1 突發(fā)事件檢測(cè)方法評(píng)價(jià)標(biāo)準(zhǔn)及精準(zhǔn)率對(duì)比
圖1 基于突發(fā)詞的事件檢測(cè)模型流程[5]
從地域標(biāo)簽角度出發(fā),張雄寶等[11]提出一種基于突發(fā)詞地域分析的微博突發(fā)事件檢測(cè)方法,該方法從突發(fā)詞的地域和情感屬性兩個(gè)維度識(shí)別微博突發(fā)事件:首先通過(guò)情感計(jì)算過(guò)濾非負(fù)值文檔,然后根據(jù)特征詞的地域擴(kuò)散程度對(duì)剩余文檔進(jìn)行突發(fā)詞檢測(cè),實(shí)現(xiàn)微博突發(fā)事件的檢測(cè)。Cecaj等[12]提出以局部地域標(biāo)簽特征為中心檢測(cè)突發(fā)事件。針對(duì)在線社交網(wǎng)絡(luò)由于文本內(nèi)容不夠長(zhǎng)、消息交換率過(guò)高而不容易檢測(cè)新話題的問(wèn)題,仲兆滿等[13]根據(jù)微博的時(shí)空特點(diǎn),將詞出現(xiàn)頻率、關(guān)聯(lián)用戶、分布地域和社交行為作為指標(biāo),提出了微博網(wǎng)絡(luò)詞突發(fā)值計(jì)算模型,并提出了將突發(fā)詞的地域、頻率、關(guān)聯(lián)博文、關(guān)聯(lián)博文產(chǎn)生的影響力以及關(guān)聯(lián)用戶作為指標(biāo)的突發(fā)事件熱度計(jì)算方法。
綜上所述,現(xiàn)有的突發(fā)事件識(shí)別及檢測(cè)研究多側(cè)重于文本信息的特征提取,大都利用不同模型結(jié)合提取的文本特征以識(shí)別和檢測(cè)突發(fā)事件。但突發(fā)事件的信息顯然不止文本信息,圖像、聲音、視頻等也是突發(fā)事件信息不可忽略的形式,多模態(tài)的信息特征對(duì)突發(fā)事件識(shí)別和檢測(cè)效果的影響值得學(xué)者們進(jìn)一步探究。
重大突發(fā)事件發(fā)生后,熱點(diǎn)輿情將很快在網(wǎng)絡(luò)環(huán)境中形成。大量輿情信息在高交換率的作用下開(kāi)始逐漸異化,在此過(guò)程中,輿情信息極易演變?yōu)椴煌姹镜木W(wǎng)絡(luò)謠言。而謠言的產(chǎn)生無(wú)疑會(huì)增加突發(fā)事件的管控難度,如果能及時(shí)準(zhǔn)確地對(duì)新媒體環(huán)境下突發(fā)事件的謠言進(jìn)行識(shí)別和處理,則可以更高效地實(shí)現(xiàn)突發(fā)事件的管控。
現(xiàn)有新媒體環(huán)境下突發(fā)事件謠言識(shí)別及處理的研究,基本是從謠言話題傳播和謠言自身特征角度并結(jié)合不同的算法展開(kāi)。
近年來(lái),從傳播學(xué)角度對(duì)突發(fā)事件謠言識(shí)別的相關(guān)研究,已經(jīng)不再局限于基于傳染病模型的謠言傳播機(jī)制,更多學(xué)者將深度學(xué)習(xí)相關(guān)模型應(yīng)用于展示謠言的傳播情況,并以此作為謠言識(shí)別的突破口。從謠言話題傳播角度出發(fā),程亮等[14]提出基于BP神經(jīng)網(wǎng)絡(luò)模型的謠言檢測(cè)方法,改進(jìn)其激發(fā)函數(shù),同時(shí)引入沖量項(xiàng),實(shí)現(xiàn)了微博突發(fā)事件謠言的檢測(cè)。王征等[15]提出了基于復(fù)雜網(wǎng)絡(luò)理論的微博謠言識(shí)別與預(yù)警算法,以動(dòng)態(tài)節(jié)點(diǎn)管理為基礎(chǔ),實(shí)現(xiàn)謠言散布節(jié)點(diǎn)的早期預(yù)警,再以復(fù)雜網(wǎng)絡(luò)關(guān)系發(fā)展理論為基礎(chǔ),對(duì)謠言與真實(shí)信息進(jìn)行軌跡聚類和隔離,實(shí)現(xiàn)謠言預(yù)測(cè)和識(shí)別。王杏[16]根據(jù)突發(fā)事件中網(wǎng)絡(luò)謠言傳播中傳播主體的匿名性、傳播機(jī)制的復(fù)雜性、傳播結(jié)果的危害性等特點(diǎn),提出了新媒體環(huán)境下突發(fā)事件謠言處理策略。
從謠言自身特征角度出發(fā),傳統(tǒng)的謠言檢測(cè)方法都是基于詞頻統(tǒng)計(jì)、相似度計(jì)算等,其根本是概率方法,而基于深度學(xué)習(xí)的方法構(gòu)建不同的網(wǎng)絡(luò),提取更深層特征的謠言識(shí)別方法則是新的研究熱點(diǎn)。Castillo等[17]以Twitter中的謠言數(shù)據(jù)為數(shù)據(jù)集,結(jié)合所抽取謠言數(shù)據(jù)的內(nèi)容、用戶、主題和傳播等四類特征提高謠言識(shí)別效率。張會(huì)平等[18]結(jié)合計(jì)劃行為理論、風(fēng)險(xiǎn)感知理論、社會(huì)資本理論和威懾理論,依據(jù)謠言信息特征構(gòu)建突發(fā)事件中網(wǎng)絡(luò)謠言識(shí)別行為意向影響因素的概念模型,有效地識(shí)別突發(fā)事件的謠言。張鵬等[19]利用遺傳算法對(duì)BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行優(yōu)化,剖析網(wǎng)絡(luò)謠言的熱度、異化度、變化趨勢(shì)等特征,建立相應(yīng)的預(yù)警指標(biāo)體系,構(gòu)建了網(wǎng)絡(luò)謠言危機(jī)的預(yù)警模型,實(shí)現(xiàn)了突發(fā)事件中網(wǎng)絡(luò)謠言的監(jiān)控、預(yù)警以及風(fēng)險(xiǎn)的量化評(píng)估。向青平等[20]根據(jù)新冠肺炎網(wǎng)絡(luò)謠言的傳播能力、傳播形式、產(chǎn)生依據(jù)等特征對(duì)謠言進(jìn)行識(shí)別和分類,并根據(jù)謠言的異化程度提出相應(yīng)辟謠機(jī)制。Ding等[21]整合了計(jì)劃行為和威懾理論,對(duì)突發(fā)事件中影響社交媒體用戶謠言識(shí)別行為的因素進(jìn)行評(píng)估。該模型從謠言態(tài)度、主觀規(guī)范和感知行為等特征討論模型對(duì)謠言識(shí)別的影響,還結(jié)合威懾理論探討了懲罰機(jī)制等社會(huì)因素對(duì)主觀規(guī)范和社交媒體用戶謠言識(shí)別行為的影響。
根據(jù)以上學(xué)者對(duì)基于新媒體的突發(fā)事件謠言識(shí)別與處理的相關(guān)研究,將其使用的相關(guān)技術(shù)和研究成果進(jìn)行對(duì)比,結(jié)果見(jiàn)表2。
表2 基于新媒體的突發(fā)事件謠言識(shí)別與處理相關(guān)研究
突發(fā)事件通過(guò)互聯(lián)網(wǎng)平臺(tái)進(jìn)入公眾視野,并迅速成為網(wǎng)絡(luò)輿情傳播和熱議的焦點(diǎn),而準(zhǔn)確識(shí)別出突發(fā)事件的關(guān)鍵節(jié)點(diǎn),可以顯著提高突發(fā)事件的管控效率,降低突發(fā)事件的影響。
通過(guò)對(duì)新媒體環(huán)境下突發(fā)事件關(guān)鍵節(jié)點(diǎn)的識(shí)別,可以實(shí)現(xiàn)突發(fā)事件的要點(diǎn)把控,掌握突發(fā)事件的關(guān)鍵演變信息。根據(jù)突發(fā)事件關(guān)鍵信息制定不同處理策略,現(xiàn)有新媒體環(huán)境下突發(fā)事件關(guān)鍵事件節(jié)點(diǎn)識(shí)別的研究主要從突發(fā)事件相關(guān)信息活躍度和信息傳播的角度進(jìn)行分析。
從突發(fā)事件相關(guān)信息活躍度出發(fā),張曉霞等[22]以突發(fā)事件“招遠(yuǎn)麥當(dāng)勞命案”為例,依據(jù)節(jié)點(diǎn)在網(wǎng)絡(luò)中的活躍度和其對(duì)信息流控制作用,挖掘影響突發(fā)事件信息傳播的關(guān)鍵節(jié)點(diǎn),再結(jié)合情感計(jì)算分析關(guān)鍵用戶節(jié)點(diǎn)所發(fā)布的微博,實(shí)現(xiàn)突發(fā)事件關(guān)鍵節(jié)點(diǎn)的標(biāo)識(shí)。陳思菁等[23]提出一種考慮用戶行為特征、網(wǎng)絡(luò)全局信息以及影響力衰退機(jī)制的關(guān)鍵節(jié)點(diǎn)動(dòng)態(tài)識(shí)別方法,并與信息活躍生命周期相結(jié)合。利用Spearman相關(guān)分析和SIR傳播模型對(duì)方法的合理性進(jìn)行驗(yàn)證,根據(jù)不同演化階段關(guān)鍵節(jié)點(diǎn)特征的對(duì)比分析,提出針對(duì)不同階段突發(fā)事件信息傳播的輿情治理策略。
從信息傳播角度出發(fā),康偉[24]以2011年的重大突發(fā)事件“7·23動(dòng)車事故”為研究對(duì)象,生成信息傳播網(wǎng)絡(luò)拓?fù)鋱D;根據(jù)鄰接矩陣數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)密度、可達(dá)性、聚類系數(shù)和中心性的測(cè)度,依據(jù)測(cè)度結(jié)果和傳播位置對(duì)突發(fā)事件進(jìn)行關(guān)鍵節(jié)點(diǎn)分層與識(shí)別。劉樑等[25]提出基于復(fù)雜網(wǎng)絡(luò)模型的突發(fā)事件關(guān)鍵在線信息挖掘模型,研究了突發(fā)事件關(guān)鍵節(jié)點(diǎn)信息的演化路徑,能有效識(shí)別突發(fā)事件在線信息的傳播演化規(guī)律中的關(guān)鍵節(jié)點(diǎn)或關(guān)鍵在線信息,為有效預(yù)警非常規(guī)突發(fā)事件提供了借鑒與指導(dǎo)。曹學(xué)艷等[26]將LeaderRank算法與數(shù)據(jù)挖掘方法相結(jié)合,對(duì)論壇中突發(fā)事件網(wǎng)絡(luò)輿情的實(shí)時(shí)傳播數(shù)據(jù)進(jìn)行測(cè)算,利用公式(1)將LeaderRank算法應(yīng)用于節(jié)點(diǎn)影響力的計(jì)算,簡(jiǎn)明扼要地展現(xiàn)節(jié)點(diǎn)出度和節(jié)點(diǎn)影響力的關(guān)聯(lián),其中aij為第i和j個(gè)節(jié)點(diǎn)的回復(fù)關(guān)系,koutj為k時(shí)刻的第i個(gè)節(jié)點(diǎn)的出度。趙蓉英等[27]采用社會(huì)網(wǎng)絡(luò)分析方法,結(jié)合大賢村遭遇洪災(zāi)的突發(fā)事件,對(duì)突發(fā)事件網(wǎng)絡(luò)輿情傳播進(jìn)行了網(wǎng)絡(luò)社群圖、k-叢和接近中心性三種定量化的測(cè)度分析,識(shí)別出突發(fā)事件關(guān)鍵節(jié)點(diǎn),并闡明了其內(nèi)在的結(jié)構(gòu)特征與演變規(guī)律。
(1)
學(xué)者從不同的角度對(duì)網(wǎng)絡(luò)中關(guān)鍵節(jié)點(diǎn)進(jìn)行了挖掘和分析,研究不再僅僅局限于對(duì)關(guān)鍵節(jié)點(diǎn)的分類, 更注重對(duì)關(guān)鍵節(jié)點(diǎn)的挖掘,使關(guān)鍵節(jié)點(diǎn)的識(shí)別具有動(dòng)態(tài)性,準(zhǔn)確率也進(jìn)一步得到提升。
在突發(fā)事件網(wǎng)絡(luò)輿情中,將相關(guān)用戶看作一個(gè)個(gè)不同的節(jié)點(diǎn),可以更直觀展現(xiàn)不同用戶之間的關(guān)系,而關(guān)鍵用戶節(jié)點(diǎn)表示對(duì)其他用戶節(jié)點(diǎn)影響力較大的用戶,是突發(fā)事件和大眾的“紐帶”,影響網(wǎng)民的觀點(diǎn)行為和事件的發(fā)展。識(shí)別出關(guān)鍵用戶成為突發(fā)事件管控的一個(gè)重要方面。
基于新媒體的突發(fā)事件關(guān)鍵用戶節(jié)點(diǎn)的識(shí)別,現(xiàn)有研究主要從用戶活躍度和用戶影響力角度并結(jié)合不同的算法和模型實(shí)現(xiàn)。
從用戶活躍度出發(fā),謝天保等[28]通過(guò)實(shí)驗(yàn)得到重要用戶節(jié)點(diǎn)關(guān)聯(lián)用戶量、發(fā)布信息量、粉絲增長(zhǎng)率等活躍度指標(biāo),以此為基礎(chǔ)提出貝葉斯-PageRank算法篩選關(guān)鍵用戶節(jié)點(diǎn)。王巍等[29]通過(guò)研究病毒傳染、消息傳播和話題傳播模型,提出了基于微博粉絲關(guān)系、用戶活躍度和影響力的話題傳播模型;基于用戶群規(guī)模,提出了基于用戶和節(jié)點(diǎn)規(guī)模的話題傳播預(yù)測(cè)算法,可以有效地檢測(cè)關(guān)鍵用戶節(jié)點(diǎn)。陳智等[30]提出了一種綜合考慮用戶活躍度和用戶粉絲重要性的微博關(guān)鍵用戶發(fā)現(xiàn)算法。該算法基于實(shí)際的微博用戶數(shù)據(jù),研究微博用戶網(wǎng)絡(luò)節(jié)點(diǎn)的度分布,分析影響微博用戶節(jié)點(diǎn)關(guān)鍵程度的因素,考慮了微博高時(shí)效性的特點(diǎn),能夠從不斷變化的微博用戶網(wǎng)絡(luò)中快速發(fā)現(xiàn)微博的關(guān)鍵用戶。
從用戶影響力角度出發(fā),王佳敏等[31]提出結(jié)合意見(jiàn)領(lǐng)袖識(shí)別和層次分析法的意見(jiàn)領(lǐng)袖識(shí)別模型,結(jié)合“柴靜事件”的微博數(shù)據(jù)進(jìn)行實(shí)證研究,運(yùn)用意見(jiàn)領(lǐng)袖識(shí)別模型對(duì)意見(jiàn)領(lǐng)袖進(jìn)行識(shí)別并分析其影響力。張賢坤等[32]基于貝葉斯模型構(gòu)建了一種微博用戶影響力的計(jì)算方法。該方法利用微博社會(huì)網(wǎng)絡(luò)中用戶行為模式分析結(jié)果,獲取用戶節(jié)點(diǎn)屬性的先驗(yàn)概率,并學(xué)習(xí)高概率的屬性值,以此獲得微博網(wǎng)絡(luò)用戶節(jié)點(diǎn)重要性的排序。Cao等[33]結(jié)合輿情傳播中源節(jié)點(diǎn)和消息傳輸節(jié)點(diǎn),首先向鄰居節(jié)點(diǎn)傳輸及遵循廣度優(yōu)先獲取用戶權(quán)重的特性,基于博弈論建立了節(jié)點(diǎn)選擇模型和節(jié)點(diǎn)搜索算法,提高了關(guān)鍵用戶節(jié)點(diǎn)識(shí)別準(zhǔn)確率。Li等[34]通過(guò)社會(huì)網(wǎng)絡(luò)理論和類比模擬分析,利用微博數(shù)據(jù),從空間上分析突發(fā)事件中網(wǎng)絡(luò)中關(guān)鍵節(jié)點(diǎn)和重要行為者的特征,實(shí)現(xiàn)了對(duì)用戶中心性的分析和識(shí)別。
根據(jù)以上學(xué)者對(duì)基于新媒體的突發(fā)事件關(guān)鍵用戶節(jié)點(diǎn)的相關(guān)研究,將其使用的相關(guān)技術(shù)和研究成果進(jìn)行對(duì)比,結(jié)果見(jiàn)表3。
表3 新媒體關(guān)鍵用戶節(jié)點(diǎn)識(shí)別的相關(guān)研究
現(xiàn)有新媒體環(huán)境下突發(fā)事件信息分析的研究主要從突發(fā)事件輿情演變趨勢(shì)、傳播路徑及網(wǎng)民情感等三方面展開(kāi)。
在當(dāng)前的新媒體環(huán)境下,輿情的形成與擴(kuò)散是多方力量共同作用的結(jié)果,因此,突發(fā)事件社交網(wǎng)絡(luò)輿情擴(kuò)散的形式都比較復(fù)雜,控制相對(duì)困難,所產(chǎn)生的影響較傳統(tǒng)傳播環(huán)境也更為嚴(yán)重。一般來(lái)說(shuō),突發(fā)事件的生命周期包括了潛伏期、爆發(fā)期、蔓延期及消退期四個(gè)階段,突發(fā)事件的生命周期演變過(guò)程如圖2所示。通過(guò)對(duì)輿情擴(kuò)散的關(guān)鍵要素及要素間的交互方式和推動(dòng)擴(kuò)散的源動(dòng)力分析,可以掌握輿情的擴(kuò)散機(jī)制。
圖2 突發(fā)事件輿情生命周期
從輿情傳播規(guī)律和輿情信息自身特征的角度,結(jié)合不同的算法分析新媒體環(huán)境下突發(fā)事件輿情傳播趨勢(shì)是當(dāng)前主流的研究方法。
從輿情傳播情況及規(guī)律的角度出發(fā),Teevan等[35]將突發(fā)事件網(wǎng)絡(luò)輿情傳播過(guò)程中的話題詞頻、轉(zhuǎn)發(fā)數(shù)、發(fā)布時(shí)間、粉絲量等因素作為加權(quán)依據(jù)并結(jié)合PageRank算法,計(jì)算微博突發(fā)事件輿情趨勢(shì)。Keith等[36]根據(jù)突發(fā)事件發(fā)生后的網(wǎng)絡(luò)輿情用戶特征、地域位置等規(guī)律,建立了一個(gè)包含警源在內(nèi)的三類要素指標(biāo)體系,對(duì)網(wǎng)絡(luò)輿情發(fā)展趨勢(shì)進(jìn)行分析。Baek等[37]將輿情擴(kuò)散程度、聚焦熱度等作為重大輿情事件監(jiān)測(cè)的一級(jí)指標(biāo)分析輿情演變趨勢(shì)。覃伊蕾等[38]從時(shí)間、關(guān)注度、討論度三個(gè)角度出發(fā),把突發(fā)事件輿情生命周期分成四個(gè)不同階段,以此推演突發(fā)事件輿情的演變路徑。張斯昱[39]以新冠肺炎疫情為例,探討該事件的網(wǎng)絡(luò)輿情演進(jìn)規(guī)律,將事件分為爆發(fā)、持續(xù)發(fā)酵、關(guān)鍵期三個(gè)階段。袁國(guó)棟[40]根據(jù)輿情傳播特征將其劃分為萌發(fā)、擴(kuò)散、爆發(fā)、消退等四個(gè)不同階段,再利用不同階段的屬性關(guān)系構(gòu)建輿情演化方程,最后計(jì)算輿情不同階段演化的內(nèi)在條件,分析輿情趨勢(shì)。
從輿情信息自身特征角度出發(fā),田野[41]提出了一種基于微博平臺(tái)的事件趨勢(shì)分析和預(yù)測(cè)算法,首先篩選不同條件的回歸模型的決定系數(shù),通過(guò)最佳擬合函數(shù)模擬突發(fā)事件的發(fā)展趨勢(shì),根據(jù)差值斜率的融合結(jié)果計(jì)算預(yù)測(cè)點(diǎn)的斜率值,作為事件趨勢(shì)變化方向和變化強(qiáng)度的預(yù)測(cè)結(jié)果。Beuker[42]根據(jù)文章提取的輿情信息的內(nèi)容、事態(tài)擴(kuò)散情況和網(wǎng)民反應(yīng)三個(gè)特征,構(gòu)建網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)評(píng)估體系,對(duì)輿情趨勢(shì)進(jìn)行預(yù)測(cè)和分析。祁凱等[43]運(yùn)用演化博弈理論結(jié)合輿情信息傳播熱度、危害性、周期性等特征構(gòu)建了網(wǎng)絡(luò)媒體與地方政府雙方演化博弈模型,證明突發(fā)危機(jī)事件網(wǎng)絡(luò)輿情傳播熱度與網(wǎng)絡(luò)媒體和地方政府雙方的策略選擇有著直接關(guān)系。趙耀等[44]根據(jù)新冠肺炎疫情的發(fā)展態(tài)勢(shì)和網(wǎng)絡(luò)輿情的發(fā)展走勢(shì),將疫情的網(wǎng)絡(luò)輿情分為從刺激到觸發(fā)的潛伏期、從聚合到擴(kuò)散的爆發(fā)期、從變異到應(yīng)激的波動(dòng)期和從失焦到回落的消解期四大階段。安璐等[45]將構(gòu)建的突發(fā)事件嚴(yán)重性評(píng)估指標(biāo)與突發(fā)事件各傳播階段特征相結(jié)合,建立突發(fā)事件輿情傳播預(yù)警機(jī)制,有效監(jiān)測(cè)突發(fā)事件輿情演變情況。
根據(jù)以上基于新媒體環(huán)境下突發(fā)事件輿情擴(kuò)散趨勢(shì)的研究成果,對(duì)相關(guān)的研究技術(shù)方法和研究成果及不足進(jìn)行總結(jié)、對(duì)比,結(jié)果見(jiàn)表4。
表4 新媒體環(huán)境下突發(fā)事件輿情擴(kuò)散趨勢(shì)的相關(guān)研究
新媒體用戶對(duì)突發(fā)事件的情感表達(dá)能夠迅速感染其他用戶的情緒,導(dǎo)致輿論的爆發(fā)。若能在突發(fā)事件中提前預(yù)測(cè)到新媒體用戶情感傾向,則可以提前把握輿情管控關(guān)口,更好地防范輿情風(fēng)險(xiǎn),有效管控突發(fā)事件。
現(xiàn)有對(duì)于突發(fā)事件中網(wǎng)民情感分析的相關(guān)研究,多集中于情感分析工具的優(yōu)化,結(jié)合不同的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型,實(shí)現(xiàn)網(wǎng)民情感的挖掘和分析。本文將新媒體用戶的情感傾向分析相關(guān)研究分為輿情變化情況、用戶的社會(huì)關(guān)系和輿情信息特征三個(gè)方面。
從突發(fā)事件輿情變化角度出發(fā),王努努等[46]提出了一種結(jié)合ARIMA和BP神經(jīng)網(wǎng)絡(luò)的輿情情感預(yù)測(cè)方法,首先運(yùn)用ARIMA模型描述歷史輿情情感數(shù)據(jù)的線性關(guān)系,然后運(yùn)用BP神經(jīng)網(wǎng)絡(luò)模擬輿情演變過(guò)程中由各種干擾因素產(chǎn)生的非線性規(guī)律,實(shí)現(xiàn)對(duì)輿情的情感預(yù)測(cè)。任中杰等[47]提出一種突發(fā)事件情感預(yù)測(cè)模型,先通過(guò)爬蟲(chóng)技術(shù)建立用戶畫像,再通過(guò)貝葉斯分類器對(duì)評(píng)論文本進(jìn)行情感分析,并對(duì)情感傾向的影響因素作相關(guān)性分析,最后結(jié)合輿情高熱期、持續(xù)期、反復(fù)出現(xiàn)期及消退期四個(gè)發(fā)展階段的不同參數(shù)對(duì)用戶不同階段情感傾向?qū)崿F(xiàn)分析。Singh等[48]以拉斯維加斯槍擊事件數(shù)據(jù)為例,研究輿情不同階段用戶情緒感染力強(qiáng)弱情況,將改進(jìn)的情感分析技術(shù)和變化點(diǎn)檢測(cè)技術(shù)處理相結(jié)合,預(yù)測(cè)用戶的時(shí)空情感變化情況。
從用戶社會(huì)關(guān)系角度出發(fā),安璐等[49]依據(jù)微博轉(zhuǎn)發(fā)關(guān)系構(gòu)建用戶社會(huì)關(guān)系網(wǎng)絡(luò),以“魏則西事件”為例標(biāo)識(shí)出利益相關(guān)者類型,根據(jù)用戶情感類型和情感強(qiáng)度結(jié)合構(gòu)建的社會(huì)關(guān)系網(wǎng)絡(luò)得到社會(huì)網(wǎng)絡(luò)情感圖譜。魯艷霞等[50]以“天津港爆炸事件”為研究對(duì)象,利用爬蟲(chóng)工具收集微博相關(guān)信息,然后使用文本挖掘軟件進(jìn)行中文詞頻分析,最后通過(guò)SPSS統(tǒng)計(jì)微博用戶的情感,并從社交網(wǎng)絡(luò)角度對(duì)網(wǎng)民群體情緒進(jìn)行分析,發(fā)現(xiàn)網(wǎng)民群體情緒的不穩(wěn)定性會(huì)導(dǎo)致行動(dòng)的不確定性。Zou等[51]提出了一種協(xié)同的微博情感分析方法,構(gòu)造了挖掘用戶共享情感的微博情感分析模型和提取社交網(wǎng)絡(luò)用戶情感演變情況的社區(qū)微博情感分析模型。
從突發(fā)事件輿情信息特征角度出發(fā),王佳敏等[52]構(gòu)建了基于SVM分類器的中文微博情感傾向性模型,把情感、句式、詞性和句間特征作為識(shí)別情感傾向性的特征。模型將SVM和識(shí)別情感的特征有效結(jié)合,對(duì)研究情感傾向問(wèn)題具有一定的參考價(jià)值,其流程如圖3所示。張鵬等[53]采用基于情感詞典的情感分析方法,并且結(jié)合扎根理論的質(zhì)性特點(diǎn)分析突發(fā)事件網(wǎng)絡(luò)輿的情感極性。周紅磊等[54]依據(jù)態(tài)勢(shì)感知理論,結(jié)合定義的態(tài)勢(shì)要素、態(tài)勢(shì)理解、態(tài)勢(shì)投射三個(gè)輿情信息特征構(gòu)建突發(fā)公共衛(wèi)生事件話題情感演化的理論模型,以微博平臺(tái)數(shù)據(jù)為樣本,探究新冠肺炎疫情話題背后的網(wǎng)民情感演變。張翼鵬等[55]從輿情誤導(dǎo)性特征出發(fā),對(duì)相關(guān)微博評(píng)論分類判別,獲取相應(yīng)主題信息,使用t檢驗(yàn)分別對(duì)受眾情感不同的誤導(dǎo)信息進(jìn)行比較。在誤導(dǎo)信息中,相較正面情感信息,負(fù)面情感信息的受眾參與程度更高。
圖3 情感傾向性分析流程
突發(fā)事件輿情信息多通過(guò)新媒體進(jìn)行傳播,輿情傳播路徑的研究可以幫助相關(guān)人員進(jìn)一步掌控突發(fā)事件輿情的傳播情況,有效控制突發(fā)事件輿情發(fā)展?,F(xiàn)有的關(guān)于輿情傳播路徑分析研究的重點(diǎn)不再局限于對(duì)輿情傳播模型的簡(jiǎn)單研究,更側(cè)重于傳播過(guò)程的動(dòng)態(tài)變化情況,主要從傳播節(jié)點(diǎn)和突發(fā)事件輿情傳播階段角度出發(fā)。
基于傳播節(jié)點(diǎn)角度,袁毅[56]以新浪微博客為研究平臺(tái),采集事件傳播路徑中的用戶屬性及行為數(shù)據(jù),利用社會(huì)網(wǎng)絡(luò)分析軟件繪制信息傳播網(wǎng)絡(luò)圖,并對(duì)傳播網(wǎng)絡(luò)的結(jié)構(gòu)、路徑及其影響因素進(jìn)行分析,發(fā)現(xiàn)傳播網(wǎng)絡(luò)的形態(tài)與用戶影響力、節(jié)點(diǎn)布局及外部干擾因素有關(guān)。王莉等[57]以“天津?yàn)I海爆炸”事件為例,研究微博轉(zhuǎn)發(fā)中的中心式傳播模型和鏈?zhǔn)絺鞑ツP偷鹊湫湍P偷穆窂窖葑冞^(guò)程,分析微博信息傳播過(guò)程中的關(guān)鍵節(jié)點(diǎn),發(fā)現(xiàn)微博信息傳播中大規(guī)模信息傳播模型是由不同作用的多個(gè)關(guān)鍵結(jié)點(diǎn)組成的。王晰巍等[58]基于社會(huì)網(wǎng)絡(luò)分析方法對(duì)新媒體環(huán)境下自然災(zāi)害網(wǎng)絡(luò)輿情的傳播路徑及網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行分析,揭示了新媒體環(huán)境下移動(dòng)端的微博輿情傳播路徑以中心節(jié)點(diǎn)間的多級(jí)傳播路徑為主。
基于傳播階段角度,袁媛[59]以“3·1昆明火車站暴力恐怖”突發(fā)事件為切入點(diǎn),將新媒體信息傳播路徑劃分為以零散化、碎片化的信息為主的網(wǎng)友爆料,地方媒體發(fā)布消息的媒體介入,官媒發(fā)布信息的官方回應(yīng), 引起全民關(guān)注的輿論演變及社交平臺(tái)報(bào)道熱議等五個(gè)階段。
新媒體對(duì)于真實(shí)世界發(fā)生的突發(fā)事件的管控有很大支撐作用,能夠有效遏制突發(fā)事件輿情擴(kuò)散,防止突發(fā)事件衍生,減弱突發(fā)事件引起的負(fù)面影響??偨Y(jié)現(xiàn)有新媒體環(huán)境下突發(fā)事件相關(guān)研究面臨的挑戰(zhàn)及發(fā)展趨勢(shì),主要涵蓋以下三方面內(nèi)容。
深度學(xué)習(xí)是當(dāng)前最熱門的研究之一。將深度學(xué)習(xí)相關(guān)模型運(yùn)用到突發(fā)事件的研究中,利用不同深度學(xué)習(xí)模型的特點(diǎn),結(jié)合不同的研究場(chǎng)景,最大程度發(fā)揮各種深度學(xué)習(xí)模型的優(yōu)勢(shì),提高相關(guān)研究的效率,是本領(lǐng)域研究的重要方向之一。
(1) 利用聚類算法改進(jìn)徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)突發(fā)事件話題的預(yù)測(cè)。突發(fā)事件由于它本身存在無(wú)規(guī)則、隨機(jī)發(fā)生、非線性等特點(diǎn),因而具有一定的混沌特性。而RBF神經(jīng)網(wǎng)絡(luò)是非線性多層前向網(wǎng)絡(luò),隱層單元數(shù)可以根據(jù)研究的具體問(wèn)題,在訓(xùn)練階段自適應(yīng)地調(diào)整,學(xué)習(xí)速度快。為了提高預(yù)測(cè)精度,可以對(duì)RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),通過(guò)聚類算法獲取RBF網(wǎng)絡(luò)參數(shù),利用基于聚類算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)用于突發(fā)事件話題預(yù)測(cè)。
(2) 將卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)應(yīng)用到文本分類任務(wù)中實(shí)現(xiàn)關(guān)鍵節(jié)點(diǎn)識(shí)別。CNN可處理具有類似網(wǎng)格結(jié)構(gòu)的數(shù)據(jù)神經(jīng)網(wǎng)絡(luò),主要包含卷積層、池化層和全連接層。其基本原理為先定義多個(gè)一維卷積核,對(duì)輸入分別做卷積計(jì)算,對(duì)輸出的所有通道分別作時(shí)序最大池化,再將這些通道的池化輸出值連結(jié)送入全連接層,最后通過(guò)全連接層將連結(jié)后的向量變換為各類別的輸出。在對(duì)關(guān)鍵節(jié)點(diǎn)進(jìn)行識(shí)別時(shí),可將文本當(dāng)作一維圖像,使用一維卷積層和時(shí)序最大池化層獲得詞語(yǔ)之間的關(guān)聯(lián),進(jìn)行關(guān)鍵節(jié)點(diǎn)的識(shí)別。
(3) 使用深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)用戶情感分類。對(duì)于情感分析的研究,已有的研究多將文本表示成向量形式結(jié)合分類器對(duì)文本分類處理。從深度學(xué)習(xí)出發(fā),可以在卷積神經(jīng)網(wǎng)絡(luò)上融合注意力機(jī)制,進(jìn)而構(gòu)建包括輸入層、卷積層、注意力機(jī)制以及輸出層的情感分類模型。
當(dāng)前新媒體環(huán)境下,各種移動(dòng)端社交媒體迅速興起,突發(fā)事件相關(guān)信息分布在多異構(gòu)媒體上。實(shí)現(xiàn)多異構(gòu)媒體突發(fā)事件相關(guān)信息的采集、用戶關(guān)聯(lián)、內(nèi)容關(guān)聯(lián)及各種應(yīng)用分析,可以更全面地把控突發(fā)事件的走向。對(duì)多異構(gòu)媒體信息整合處理必將成為未來(lái)突發(fā)事件相關(guān)熱點(diǎn)研究之一。
(1) 多異構(gòu)媒體突發(fā)事件信息全面采集和分析??梢圆捎肨F-IDF模型和尺度不變特征變換方法,實(shí)現(xiàn)突發(fā)事件文本、圖片和視頻信息的特征提取。通過(guò)歐式距離或余弦距離實(shí)現(xiàn)特征相似度計(jì)算,聚類相似度高的多異構(gòu)媒體突發(fā)事件信息。利用樸素貝葉斯分類器過(guò)濾重復(fù)信息,分析異構(gòu)媒體對(duì)突發(fā)事件報(bào)道的側(cè)重點(diǎn),以便對(duì)不同異構(gòu)媒體實(shí)施不同的處理策略。
(2) 對(duì)齊異構(gòu)媒體上相同用戶注冊(cè)的賬號(hào)。同一用戶往往會(huì)在不同社交媒體上注冊(cè)多個(gè)賬戶,根據(jù)用戶行為特征分析的結(jié)果,將同一用戶注冊(cè)的不同異構(gòu)媒體上的賬號(hào)進(jìn)行對(duì)齊關(guān)聯(lián),為面向用戶的輿情管控打下基礎(chǔ)。采用主成分分析法提取用戶行為重要特征,通過(guò)均值、標(biāo)準(zhǔn)差、眾數(shù)等方法實(shí)現(xiàn)時(shí)域特征的計(jì)算,利用快速傅里葉變換實(shí)現(xiàn)頻域特征的計(jì)算,對(duì)齊用戶賬號(hào)。
新媒體環(huán)境下突發(fā)事件信息往往是文本、圖像、語(yǔ)音等多種模態(tài)混合形成的。為提高信息分析的精度,應(yīng)開(kāi)展多模態(tài)信息的分析與融合研究,針對(duì)不同模態(tài)的信息采取不同的處理方式,這樣可以更高效地處理突發(fā)事件信息,提升突發(fā)事件管控的精準(zhǔn)性。
(1) 單模態(tài)圖像信息處理。利用圖像分割簡(jiǎn)化圖像特征的提取是現(xiàn)有研究的常用方法??刹捎肨ensorFlow框架結(jié)合BP(back propagation)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像信息的處理,探究其對(duì)現(xiàn)有圖像分割技術(shù)提取圖片信息特征的優(yōu)化效果。TensorFlow使用簡(jiǎn)單,只需要輸入訓(xùn)練數(shù)據(jù)位置,設(shè)定參數(shù)和優(yōu)化方法,即可給出優(yōu)化結(jié)果。BP神經(jīng)網(wǎng)絡(luò)前向傳播是對(duì)線性結(jié)果的非線性轉(zhuǎn)化,獲得映射關(guān)系,反向傳播依據(jù)各種類型的梯度下降算法更新梯度,使得前向傳播的結(jié)果更接近真實(shí)值。TensorFlow的邏輯回歸算法與BP神經(jīng)網(wǎng)絡(luò)的傳播機(jī)制的結(jié)合,將提升圖片識(shí)別效率和精準(zhǔn)性。
(2) 單模態(tài)語(yǔ)音信息處理。目前聲音特征提取主要分為基于語(yǔ)音信號(hào)和基于非平穩(wěn)信號(hào)兩種方法??梢岳镁矸e神經(jīng)網(wǎng)絡(luò)(CNN)卷積的不變性克服語(yǔ)音信號(hào)本身的多樣性,探究CNN對(duì)現(xiàn)有的兩種提取聲音特征方法的改進(jìn)效果。CNN對(duì)圖片分類能夠取得很高的準(zhǔn)確率,而語(yǔ)音信號(hào)經(jīng)過(guò)傅里葉變換或者其他變換能夠得到時(shí)間—頻率圖,可以將整個(gè)語(yǔ)音信號(hào)分析得到的時(shí)頻譜當(dāng)作圖像處理,實(shí)現(xiàn)對(duì)突發(fā)事件中語(yǔ)音信息的處理。
(3) 多模態(tài)信息融合處理。在單獨(dú)處理不同模態(tài)信息的基礎(chǔ)上,使用貝葉斯分類器等技術(shù)實(shí)現(xiàn)多模態(tài)信息的融合,最終得到多模態(tài)信息的綜合分析結(jié)果。