劉 繼 武夢嬌
(新疆財經(jīng)大學(xué)統(tǒng)計與數(shù)據(jù)科學(xué)學(xué)院 烏魯木齊 830012)
Assessment and Analysis of Network Public Opinion Situation Based on Bayesian Network:COVID-19 as an Example
Liu Ji Wu Mengjiao
(Institute of Statistics and Data Science, Xinjiang University of Finance and Economics, Urumqi 830012)
Abstract:[Purpose/Significance]Major emergencies put forward new requirements for improving national social governance capacity, and improving the ability of network public opinion situation assessment has become an important content of innovative social governance.[Method/Process]This paper constructs network public opinion situation assessment index from the aspects of the characteristics of Internet public opinion events, the degree of concern, the degree of diffusion and the tendency of Internet users' opinions. A novel coronavirus pneumonia network epidemic situation assessment model is constructed by Bayesian network, and the situation of Internet public opinion is evaluated and analyzed with the case of COVID-19.[Result/Conclusion]The COVID-19 has been tested on the Internet public opinion event. The proposed method has better public opinion situation assessment performance, and suggestions are put forward for the COVID-19 related network public opinion governance.
Keywords:internet public opinion; Bayesian network; situation assessment; COVID-19
隨著互聯(lián)網(wǎng)的高速發(fā)展,我國網(wǎng)民的規(guī)模逐漸擴大。據(jù)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的第45次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》顯示,截至2020年3月,我國網(wǎng)民規(guī)模為9.04億,互聯(lián)網(wǎng)普及率達65.5%?;ヂ?lián)網(wǎng)大規(guī)模的普及使得網(wǎng)民在獲取信息的過程中可以跨越時間和空間的限制,當(dāng)大量的民眾在網(wǎng)絡(luò)上對社會問題或現(xiàn)象表達其意見、態(tài)度、情緒時,便可能會形成網(wǎng)絡(luò)輿情。若負面、極端等消極信息成為網(wǎng)絡(luò)輿情的主流,則會產(chǎn)生網(wǎng)絡(luò)輿情危機風(fēng)險。2020年的“新冠肺炎疫情”揭示了我國公共安全社會治理能力亟待提升,如何提高網(wǎng)絡(luò)輿情態(tài)勢評估能力是當(dāng)前亟待解決的問題。
在網(wǎng)絡(luò)態(tài)勢分析的研究中,學(xué)者們主要從社會科學(xué)的角度對網(wǎng)絡(luò)輿情的指標體系構(gòu)建、趨勢發(fā)展及治理方式等方面進行分析,但隨著網(wǎng)絡(luò)數(shù)據(jù)呈指數(shù)型增長,單一的宏觀定性分析已不能滿足研究者對網(wǎng)絡(luò)輿情的情景感知、傳播機制、態(tài)勢預(yù)測等方面的深入探究。隨著人工智能、機器學(xué)習(xí)等理論的不斷進步,為輿情分析提供了更豐富的定量分析方法。由于網(wǎng)絡(luò)輿情發(fā)展過程是復(fù)雜的又是多成分的,馬捷等[1]基于利用時間、預(yù)案準備情況、社會影響程度及關(guān)注人群數(shù)量四個維度構(gòu)建網(wǎng)絡(luò)輿情危機等級評價模型,通過對兩個真實事件的危機等級判定,證明了該模型是合理的。Gu等[2]則是基于節(jié)點間的交互關(guān)系構(gòu)建了輿情態(tài)勢評估模型,但該模型只能針對某些特定事件進行評估,具有一定的局限性。為了避免在輿情事件劃分等級時過于主觀,有學(xué)者通過分析引發(fā)網(wǎng)絡(luò)輿情危機的影響因素,建立相應(yīng)的輿情預(yù)警評價體系,利用灰色關(guān)聯(lián)理論和聚類算法對輿情事件的危機等級進行了評估分級[3]。王寧等[4]基于EGM模型對輿情事件預(yù)測結(jié)果的基礎(chǔ)上,利用灰色系統(tǒng)理論對輿情事件等級進行進一步評價,通過對不同輿情事件的輿情等級進行預(yù)測評估,驗證了構(gòu)建的預(yù)測及評價體系模型具有實際意義。還有學(xué)者則是通過建立模糊綜合評價模型對網(wǎng)絡(luò)輿情事件等級進行劃分[5-6]。李文杰等[7]在構(gòu)建了網(wǎng)絡(luò)輿情綜合評估指標體系的基礎(chǔ)上,通過利用層次分析法明確不同級指標間權(quán)重的排序,利用多級模糊綜合評價法建立了網(wǎng)絡(luò)輿情等級評價模型。武慧娟[8]等基于生命周期理論建立網(wǎng)絡(luò)輿情綜合評估指標體系,為了減少確定指標權(quán)重的主觀性,提出熵權(quán)法來計算指標權(quán)重,構(gòu)建網(wǎng)絡(luò)輿情模糊綜合評價模型。楊靛青等[9]則是構(gòu)建了網(wǎng)絡(luò)輿情態(tài)勢等級三級指標評估體系,并基于有序比值方法給出指標權(quán)重,最后建立了基于TOPSIS模糊多指標綜合評價模型,通過輿情事件的測試,驗證了該模型具有有效性和普適性,也為不同等級的輿情事件提供了相應(yīng)的應(yīng)對策略。
隨著近年突發(fā)事件的頻發(fā),特別是諸如“新冠肺炎疫情”重大公共突發(fā)事件引發(fā)的網(wǎng)絡(luò)輿情呈現(xiàn)更強的復(fù)雜性和不確定性,雖然利用機器學(xué)習(xí)提高了輿情特征提取和熱點發(fā)現(xiàn)計算能力,但如何將機器學(xué)習(xí)和輿情專業(yè)知識背景下的輿情推理能力結(jié)合起來成為當(dāng)前輿情態(tài)勢評估新的研究路徑。在人工智能領(lǐng)域中,貝葉斯網(wǎng)絡(luò)在不確定性表達以及因果推理方面有較大的優(yōu)勢,已有學(xué)者利用貝葉斯網(wǎng)絡(luò)模型對網(wǎng)絡(luò)輿情的危機節(jié)點診斷[10]、危機態(tài)勢預(yù)測[11-12]等方面進行了研究,并取得了一定的研究成果。本文試圖通過引入貝葉斯網(wǎng)絡(luò)模型將輿情領(lǐng)域的專家知識和輿情客觀數(shù)據(jù)結(jié)合起來,構(gòu)建網(wǎng)絡(luò)輿情態(tài)勢評估指標,對網(wǎng)絡(luò)輿情態(tài)勢進行判定,為政府有效進行輿情數(shù)據(jù)治理提供新的智力支持。
網(wǎng)絡(luò)輿情態(tài)勢發(fā)展是一個較為復(fù)雜的過程,它受到許多因素的影響,構(gòu)建網(wǎng)絡(luò)輿情態(tài)勢評估指標體系是其中關(guān)鍵的環(huán)節(jié)。陳震[11]在準則層從話題的內(nèi)容、發(fā)布者、傳播媒體和網(wǎng)民四個方面對網(wǎng)絡(luò)輿情態(tài)勢進行判定。楊靜[13]將網(wǎng)絡(luò)輿情危機等級預(yù)測指標體系分為目標層、準則層和指標層,指標層又分為一級指標和二級指標,通過指標層量化準則層的客體屬性、媒體效力和主體結(jié)構(gòu)。曾潤喜[14]則將網(wǎng)絡(luò)輿情突發(fā)事件的預(yù)警指標分為了三類,分別為警源、警兆、警情,其中這三個指標下還包括30個二級指標。董堅峰[15]等人針對旅游突發(fā)事件的網(wǎng)絡(luò)輿情構(gòu)建了以輿情主體、輿情客體和輿情本體為一級指標的指標體系,其中包含9個二級指標、34個三級指標,對旅游網(wǎng)絡(luò)輿情進行了更為全面綜合的評價??偟膩碚f,在目前網(wǎng)絡(luò)輿情的研究中,學(xué)術(shù)界還未能出現(xiàn)統(tǒng)一的確定性指標體系,由于網(wǎng)絡(luò)輿情是網(wǎng)絡(luò)事件、網(wǎng)民、媒體等多個主體動態(tài)交互的復(fù)雜演化過程,因此在指標選取中,本文充分考慮了輿情態(tài)勢評估的特定屬性和輿情數(shù)據(jù)的可獲取性,將網(wǎng)絡(luò)輿情的評價指標體系構(gòu)建為目標變量、一級指標和二級指標。
表1 網(wǎng)絡(luò)輿情態(tài)勢評估指標體系結(jié)構(gòu)
a.目標變量:即網(wǎng)絡(luò)輿情態(tài)勢等級。國家通過考慮突發(fā)事件所造成的損失情況、影響力大小等因素對事件劃分了級別,分別為特別重大、重大、較大、一般4個級別,并將其標注為特別重大(R)、重大(O)、較大(Y)、一般(B)。
b.一級指標:即對網(wǎng)絡(luò)輿情態(tài)勢的細分,包括輿情事件特征、輿情關(guān)注度、輿情傳播擴散度及網(wǎng)民觀點傾向四個層面。
c.二級指標:是對一級指標的細分,一共有10個指標,并通過抓取的數(shù)據(jù)進行量化。同時,該指標也是貝葉斯網(wǎng)絡(luò)模型中的證據(jù)變量。
一級指標中的輿情事件特征表示該輿情事件所具有的屬性及特點,其中包括該事件類別屬性、事件敏感度及事件公共危害度3個指標。事件類別屬性指標是將事件分為自然災(zāi)害類、公共安全類以及系列事件類,根據(jù)專家評價對輿情事件進行分類標注。事件敏感度則表示事件包含某些敏感因素,該事件會產(chǎn)生較大影響力,該指標分為高、中、低三個等級。事件公共危害度表示該輿情事件的影響面和網(wǎng)民安全利益的相關(guān)程度。當(dāng)事件公共危害的程度越高,那么它對社會的影響力也就越大,該指標分為高、中、低三個等級。
輿情關(guān)注度表示在輿情事件發(fā)生后,社會各界對其的關(guān)注程度,對輿情事件受關(guān)注度的考量主要從網(wǎng)民關(guān)注度和媒體關(guān)注度兩個指標進行分析。網(wǎng)絡(luò)輿情的主體網(wǎng)民會在網(wǎng)絡(luò)空間上發(fā)布表達其情緒、意見、態(tài)度的言論。通過輿情事件微博話題的閱讀量和討論量加權(quán)平均可以表示網(wǎng)民關(guān)注度,并將其標注為高、中、低三個等級。媒體關(guān)注度主要指在微博平臺上的官方媒體與自媒體對輿情事件的關(guān)注程度。對該指標的量化主要是統(tǒng)計官方媒體和自媒體對輿情事件所發(fā)布微博數(shù)的總量。
輿情傳播擴散度表示該輿情自產(chǎn)生以來在網(wǎng)絡(luò)空間傳播的程度。該指標的考量主要關(guān)注時間跨度與單位時間轉(zhuǎn)發(fā)率兩個因素。時間跨度表示該輿情事件從產(chǎn)生到結(jié)束的時間長度,時間跨度越大,說明該事件擴散的就越廣。因此定義1天以內(nèi)的輿情事件為短期輿情事件,并標識為低級;在1~3天之間的事件標記為中期輿情事件,標度為中級;3天以上標記為長期輿情事件,標記為高級。單位時間轉(zhuǎn)發(fā)率則是指統(tǒng)計關(guān)于該輿情事件的新聞信息,并計算在單位時間段內(nèi)該事件信息平均被轉(zhuǎn)發(fā)的速率,將其標識為高、中、低等級。
網(wǎng)民觀點傾向表示用戶群體對該輿情事件的自我主觀態(tài)度。通過微博評論數(shù)、情感極化程度來測度,微博評論數(shù)指標來源于數(shù)據(jù)統(tǒng)計,它反映了網(wǎng)民意見的規(guī)模,因此將其標注為高、中、低等級。網(wǎng)民的情感傾向是利用SNOWNLP對網(wǎng)民針對輿情事件在社交平臺上發(fā)布帶有自我主觀情感傾向的文本進行量化,通過建立相應(yīng)的情感詞典來提高量化的準確度。網(wǎng)民的情感傾向可以分為正面情感傾向(P)和負面情感傾向(N);情感極化程度又可以分為正面情感極化和負面情感極化,其中負面情感極化是指大量網(wǎng)民的意見出現(xiàn)了負面一致性,該性質(zhì)較大程度上影響了網(wǎng)絡(luò)輿情事件的態(tài)勢等級。由于SNOWNLP劃分的情感值在(0,1)區(qū)間內(nèi),因此,本文將情感值小于0.3或大于0.7的評論標記為極端情感文本,統(tǒng)計該類評論文本數(shù)量在總評論數(shù)的占比,若超過0.5則標注為T,即該事件存在情感極化現(xiàn)象,反之標注為F。
在以貝葉斯網(wǎng)絡(luò)為基礎(chǔ)模型的研究中,首先需要確定各網(wǎng)絡(luò)節(jié)點間的關(guān)系,然后將存在依賴關(guān)系的各個節(jié)點相連接,得到一個有向無環(huán)圖。本文通過不同因素之間的關(guān)系及專業(yè)知識來構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu),然后利用參數(shù)學(xué)習(xí)將客觀數(shù)據(jù)和網(wǎng)絡(luò)結(jié)構(gòu)相結(jié)合,構(gòu)建具有網(wǎng)絡(luò)輿情態(tài)勢評估功能的貝葉斯網(wǎng)絡(luò)模型,并將各節(jié)點間的關(guān)系直觀地展現(xiàn)出來,便于對變量之間的邏輯因果關(guān)系進行推理以及對網(wǎng)絡(luò)輿情態(tài)勢等級的判定。
2.1貝葉斯網(wǎng)絡(luò)理論貝葉斯網(wǎng)絡(luò)是一種利用有向無環(huán)圖描述變量間概率關(guān)系的理論,它通常被應(yīng)用于受多種因素影響的概率性問題,并利用概率處理各變量間因條件相關(guān)性而產(chǎn)生的不確定性,從而從不確定性知識和信息中做出相應(yīng)的推理。貝葉斯網(wǎng)絡(luò)是由有向圖和條件概率表組成,有向圖表示模型的結(jié)構(gòu)屬性,其中的節(jié)點對應(yīng)于模型中的變量,有向邊表示變量間的條件依賴關(guān)系;條件概率表則表示為模型中每個節(jié)點的條件概率。具體表示為:B=
(1)
由馬爾可夫理論可知,在給定其父節(jié)點集的條件下,任意節(jié)點都獨立于其所有非后繼節(jié)點,即:
P(Xi|X1,X2,…,Xi-1)=P(Xi|π(Xi))
(2)
根據(jù)公式1和2,便可得到如下公式:
(3)
其中,π(Xi)表示節(jié)點Xi的父節(jié)點集。
貝葉斯網(wǎng)絡(luò)由于各個隨機變量的條件獨立性,簡化了聯(lián)合概率的計算過程,這也使得在處理相關(guān)問題時,降低了計算復(fù)雜度。另外,該模型以嚴格概率推導(dǎo)的條件概率表將隨機變量之間抽象的因果關(guān)系用數(shù)學(xué)形式表達出來,便于對最后的目標節(jié)點進行判定。
參數(shù)學(xué)習(xí)也是貝葉斯網(wǎng)絡(luò)學(xué)習(xí)中的一個重要內(nèi)容,當(dāng)網(wǎng)絡(luò)的節(jié)點少、結(jié)構(gòu)較為簡單時,可以結(jié)合專家意見及實例數(shù)據(jù)得到網(wǎng)絡(luò)結(jié)構(gòu)的條件概率表。但當(dāng)網(wǎng)絡(luò)結(jié)構(gòu)比較復(fù)雜時,該方法不再適用。目前常采用的EM算法是一種具有較好魯棒性的數(shù)值計算法,該算法可以對各節(jié)點的條件概率進行計算推理。在網(wǎng)絡(luò)輿情的樣本數(shù)據(jù)中,已知Z為觀測數(shù)據(jù),Y為未知數(shù)據(jù)集,全部訓(xùn)練數(shù)據(jù)集為T,Qi表示數(shù)據(jù)集Y的概率分布。EM算法是由E步(Expection-step)和M步(Maximization-step)交替完成。
(4)
貝葉斯網(wǎng)絡(luò)模型結(jié)合了網(wǎng)絡(luò)結(jié)構(gòu)與參數(shù),當(dāng)構(gòu)建好網(wǎng)絡(luò)結(jié)構(gòu)以及訓(xùn)練得到各節(jié)點的條件概率時,便可以通過輸入證據(jù)變量的狀態(tài)對目標變量的狀態(tài)進行評判。另外,該模型可以根據(jù)不同的應(yīng)用背景融合相關(guān)領(lǐng)域的專業(yè)知識,提高模型的適用范圍。
圖1 貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)
2.2貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的構(gòu)建貝葉斯網(wǎng)絡(luò)模型的建立主要由貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的建立和各個節(jié)點條件概率的計算這兩個部分組成,其中結(jié)構(gòu)學(xué)習(xí)是重點也是難點,網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建是否合理對最后模型的結(jié)果有重要影響。目前,貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)的算法主要是基于條件獨立性測試的算法、基于評分搜索的算法以及混合學(xué)習(xí)算法。這些算法雖然可以從數(shù)據(jù)中學(xué)習(xí)得到
貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),但是需要大量的數(shù)據(jù)進行訓(xùn)練才能得到較優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)。本文在構(gòu)建網(wǎng)絡(luò)輿情態(tài)勢評估模型的結(jié)構(gòu)時,利用變量之間的因果關(guān)系和輿情專業(yè)知識來建立網(wǎng)絡(luò)結(jié)構(gòu)。其中,貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)中的節(jié)點為網(wǎng)絡(luò)輿情指標體系中的各個指標。
在貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建過程中,網(wǎng)絡(luò)節(jié)點確定后,便需要確定節(jié)點與節(jié)點間的弧和弧的方向。節(jié)點間的關(guān)系如圖1所示,一級指標中的四個節(jié)點與網(wǎng)絡(luò)輿情態(tài)勢存在因果關(guān)系,這四個節(jié)點直接決定了網(wǎng)絡(luò)輿情態(tài)勢的發(fā)展趨勢;在一級指標中,輿情關(guān)注度又與輿情傳播擴散度存在因果關(guān)系;指標層中的節(jié)點分別與一級指標中的節(jié)點存在因果關(guān)系,事件類別屬性、事件敏感度及事件公共危害度是輿情事件特征的決定因素,網(wǎng)民關(guān)注度、媒體關(guān)注度是輿情關(guān)注度的決定因素,時間跨度、單位時間轉(zhuǎn)發(fā)率是輿情傳播擴散度的決定因素,微博評論數(shù)、網(wǎng)民情感傾向以及情感極化程度是網(wǎng)民觀點傾向的決定因素,同時事件公共危害度對情感極化程度也有影響。
3.1數(shù)據(jù)描述本文通過網(wǎng)絡(luò)爬蟲抓取了2020年2月1日至2020年4月26日這期間的100件輿情事件數(shù)據(jù)作為網(wǎng)絡(luò)輿情態(tài)勢評估模型的訓(xùn)練與測試,并利用數(shù)據(jù)計算貝葉斯網(wǎng)絡(luò)的條件概率,得到最終的網(wǎng)絡(luò)輿情態(tài)勢評估模型。為了簡化貝葉斯網(wǎng)絡(luò)的概率推理,所有節(jié)點所對應(yīng)的數(shù)據(jù)都是離散的,若采集的數(shù)據(jù)為連續(xù)型數(shù)據(jù),還需對其進行離散化處理。在網(wǎng)絡(luò)結(jié)構(gòu)中共有14個節(jié)點,其中網(wǎng)絡(luò)輿情態(tài)勢、網(wǎng)絡(luò)事件特征、輿情關(guān)注度、輿情傳播擴散度、網(wǎng)民觀點傾向根據(jù)專家打分及評議離散化為特別重大(R)、重大(O)、較大(Y)、一般(B)。事件敏感度、事件公共危害度、網(wǎng)民關(guān)注度、媒體關(guān)注度、時間跨度、單位時間轉(zhuǎn)發(fā)率、微博評論數(shù)指標離散化為H(高)、M(中)、L(低),事件類別屬性則根據(jù)劃分的類別定義為X(系列事件)、Z(自然災(zāi)害)、G(公共安全),網(wǎng)民評論情感值則通過算法劃分為P(積極)、N(消極),情感極化程度通過算法劃分為T、F。由于上述指標都為連續(xù)型數(shù)據(jù),本文對其先進行Z-score標準化處理,然后根據(jù)標準化后的數(shù)據(jù)劃分相應(yīng)的區(qū)間,通過區(qū)間來劃分不同等級。具體離散化標準如表2所示,離散化后的部分樣本數(shù)據(jù)如表3所示。
表2 數(shù)據(jù)量化標準
表3 樣本數(shù)據(jù)的離散化
3.2模型測試本文采用Netica軟件進行貝葉斯網(wǎng)絡(luò)仿真,利用EM算法進行參數(shù)學(xué)習(xí),為了解決小規(guī)模數(shù)據(jù)集的訓(xùn)練不充分、模型出現(xiàn)過擬合的問題,本文采用10折交叉驗證法來對模型進行訓(xùn)練與測試。首先設(shè)定訓(xùn)練集中樣本量為90%,測試集的樣本量為10%,如第一組測試集為事件1到事件10,其他事件則為訓(xùn)練集,以此類推,樣本數(shù)據(jù)集訓(xùn)練后的貝葉斯網(wǎng)絡(luò)如圖2。
圖2 訓(xùn)練后的貝葉斯網(wǎng)絡(luò)圖
根據(jù)訓(xùn)練后的貝葉斯網(wǎng)絡(luò)模型,將測試集中每一個事件的樣本數(shù)據(jù)I1,I2,…,I10作為證據(jù)變量輸入到訓(xùn)練好的模型中,然后判定該事件的網(wǎng)絡(luò)輿情態(tài)勢等級(C)。由于篇幅有限,本文只展示部分測試集的測試結(jié)果,如表4所示。
表4 網(wǎng)絡(luò)輿情事件評估結(jié)果和實際結(jié)果對比
以往的研究中,往往是根據(jù)貝葉斯網(wǎng)絡(luò)模型推理得到的目標變量概率最大隸屬于哪一類來決定網(wǎng)絡(luò)輿情態(tài)勢的評估等級,該方法可以適用于各個等級的概率之間具有較大差距的情況,但是當(dāng)?shù)燃壐怕手g的差距較小甚至相等時,該方式可能會導(dǎo)致最后的判定結(jié)果出現(xiàn)偏差。因此,為了避免結(jié)果出現(xiàn)較大的誤差,本文將樣本根據(jù)實際網(wǎng)絡(luò)輿情態(tài)勢等級劃分為R、O、Y和B四類,并利用訓(xùn)練后的模型得到每一種等級的概率最小值,最后以此值作為進一步評價網(wǎng)絡(luò)輿情態(tài)勢等級的判定條件,其中R、O、Y和B等級的最小概率值分別為38.43%、31.2%、30.2%、32.5%。
由表4可以發(fā)現(xiàn),除了事件42和事件95的測試結(jié)果與實際不相符外,其余事件的態(tài)勢評估等級與實際等級一致。在對測試集進行推理的過程中,以最小值作為判定條件得到的態(tài)勢等級基本準確,但還是會存在極端情況導(dǎo)致網(wǎng)絡(luò)輿情事件的等級出現(xiàn)誤差,例如事件31,由表4可以發(fā)現(xiàn),該事件的等級R與等級O的概率分別為39.7%和39.5%,兩種等級之間的概率十分接近,并且二者都大于該等級的最小值,因此,為了減少誤差,當(dāng)出現(xiàn)這種情況時,本文用下四分位數(shù)來進一步判定網(wǎng)絡(luò)輿情態(tài)勢的等級。由于等級R與等級O的下四分位數(shù)為44.25%和38.5%,而事件31的等級R概率小于其下四分位數(shù),所以最后該事件的態(tài)勢等級為O,與真實的網(wǎng)絡(luò)輿情態(tài)勢等級一致。
通過10次的交叉驗證,其中有2次判定結(jié)果與實際值不符,分別是事件42和事件95。因此本文構(gòu)造的貝葉斯網(wǎng)絡(luò)評估模型在判定網(wǎng)絡(luò)輿情事件態(tài)勢等級的準確率達到了98%。由此證明了本模型在網(wǎng)絡(luò)輿情態(tài)勢等級評價應(yīng)用中的有效性,說明本文通過網(wǎng)絡(luò)輿情評價指標體系構(gòu)建的網(wǎng)絡(luò)結(jié)構(gòu)以及各節(jié)點間的因果關(guān)系是合理的。由于貝葉斯網(wǎng)絡(luò)模型中各節(jié)點的依賴關(guān)系及條件概率是清晰直觀的,因此當(dāng)輿情事件發(fā)生時,通過對指標數(shù)據(jù)的收集,不僅可以對網(wǎng)絡(luò)輿情事件的發(fā)展態(tài)勢進行評估,還能將指標間的因果關(guān)系及條件概率表結(jié)合起來,對不同態(tài)勢等級的輿情事件提供相應(yīng)的決策支持。
3.3“新冠肺炎疫情”事件分析“新冠肺炎疫情”事件是自2019年底突然爆發(fā)以來一直持續(xù)至今的一個重大公共衛(wèi)生安全事件。該事件自發(fā)生初期就受到人們關(guān)注,同時以該事件為背景,又衍生出一系列相關(guān)事件,同樣都受到了廣泛的關(guān)注。本文選取“新型冠狀病毒”“COVID-19”等為關(guān)鍵詞,通過爬蟲軟件從微博上抓取了相應(yīng)的數(shù)據(jù)信息作為案例分析數(shù)據(jù),其中網(wǎng)民評論41 500條。
“新冠肺炎疫情” 事件是一個突發(fā)的公共衛(wèi)生安全事件,本文通過利用網(wǎng)絡(luò)抓取以及專家評價獲得指標I1,I2,…,I10的樣本數(shù)據(jù),然后對該樣本數(shù)據(jù)進行清洗及離散化,并將其作為證據(jù)變量帶入到圖2中的貝葉斯網(wǎng)絡(luò)模型中,最后得到如圖3所示的“新冠肺炎疫情”事件的貝葉斯網(wǎng)絡(luò)模型。由圖3的貝葉斯網(wǎng)絡(luò)模型可以發(fā)現(xiàn),當(dāng)把證據(jù)變量的狀態(tài)等級帶入到模型后,得到的目標變量等級概率為79.3%、3.6%、5.84%和11.3%,由此可以判定“新冠肺炎疫情”事件的網(wǎng)絡(luò)輿情態(tài)勢等級是一件特別重大事件。通過該事件的現(xiàn)實輿論影響力驗證了“新冠肺炎疫情”事件是一個特別重大事件,也證明該模型具有較高的適用性。
圖3 新冠肺炎疫情事件的貝葉斯網(wǎng)絡(luò)
由于該事件是一個高敏感度、高公共危害度的事件,因此對其的輿情引導(dǎo)與治理具有較大的挑戰(zhàn),如果在輿情應(yīng)對過程中處理不當(dāng)便會造成網(wǎng)絡(luò)輿情危機。在該模型中,當(dāng)網(wǎng)民關(guān)注度與媒體關(guān)注度都處于高水平狀態(tài)情況下,輿情關(guān)注度有72.7%的概率為“特別重大”等級,意味著在如此高關(guān)注度的背景下,政府的觀點以及對輿情治理的措施都會影響該輿情事件的發(fā)展走向。在收集的數(shù)據(jù)中,與“新冠肺炎疫情”相關(guān)話題的微博數(shù)量、評論數(shù)量、討論次數(shù)、轉(zhuǎn)發(fā)數(shù)量都較高,單位時間內(nèi)的轉(zhuǎn)發(fā)率也很高,反映了網(wǎng)絡(luò)輿情傳播速度之快、傳播范圍之廣。在模型中輿情傳播擴散度有97.5%的概率為“特別重大”,而高等級的傳播擴散度也會加速信息的蔓延,對輿情治理增加一定的難度。隨著政府快速做出防疫決策及治理方案,同時全國各地醫(yī)院援助武漢,一系列的正面事件使得網(wǎng)民的負面情緒得到逐步平復(fù),阻止了負面極端情緒的擴散。網(wǎng)民觀點傾向有81.2%的概率為“特別重大”等級,表示還需要對用戶群體進行一定的心理與行為上有效引導(dǎo),避免轉(zhuǎn)變高危態(tài)勢。當(dāng)媒體關(guān)注度為高等級時,輿情關(guān)注度發(fā)展為“特別重大”等級的概率由46.8%上升至67.8%,當(dāng)網(wǎng)民關(guān)注度為高等級時,則上升為52.1%。因此主流媒體要強化正面報道,及時緩解人們的負面情緒積累,并在出現(xiàn)負面事件初期主動發(fā)聲,在第一時間進行報道,充分發(fā)揮輿論監(jiān)督的作用,給公眾提供可信度高的信息,將謠言扼殺于搖籃之中,最大程度上避免網(wǎng)絡(luò)輿情危機。
在全面媒體時代下,提高對輿情事件的應(yīng)對能力是治理能力現(xiàn)代化的重要內(nèi)容。因此在輿情治理過程中,一方面要防范網(wǎng)民出現(xiàn)極端負面情緒,另一方面要防止負面情緒的規(guī)?;?。極端負面情緒會增加人們有意或無意傳謠的概率,甚至?xí)⒇撁媲榫w轉(zhuǎn)化為線下行為,而規(guī)模化的負面情緒積累會影響輿情社會影響面,增加輿情有效引導(dǎo)的難度。因此,在輿情治理過程中,需加強主流媒體對輿論的及時正面引導(dǎo),重點關(guān)注對主體情感傾向的干預(yù),及時解決群眾的擔(dān)憂與疑問,充分利用視頻、現(xiàn)場直播等方式傳遞真實有效的信息,有效平復(fù)民眾的負面情緒,防止負面情緒記憶積累,進而降低網(wǎng)絡(luò)輿情危機發(fā)生的概率。
本文通過構(gòu)建貝葉斯網(wǎng)絡(luò)對網(wǎng)絡(luò)輿情態(tài)勢等級進行分析,首先構(gòu)建網(wǎng)絡(luò)輿情態(tài)勢評價指標體系,并確定各指標值之間的依賴關(guān)系,然后結(jié)合專家知識和已知數(shù)據(jù)構(gòu)建貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),利用EM算法計算網(wǎng)絡(luò)結(jié)構(gòu)中各節(jié)點的條件概率,最后通過測試集驗證了該模型的有效性?!靶鹿诜窝滓咔椤笔峭话l(fā)公共衛(wèi)生事件,本文通過收集的實例數(shù)據(jù)利用貝葉斯網(wǎng)絡(luò)模型對該事件的輿情態(tài)勢進行了評估分析,結(jié)合變量的依賴關(guān)系和條件概率提出了一定的輿情治理建議。本文還存在一定的不足,在未來進一步的研究中,一是要增加樣本量,利用算法對網(wǎng)絡(luò)輿情結(jié)構(gòu)進行學(xué)習(xí),更客觀地探尋各節(jié)點間的依賴關(guān)系;二是加入時間片,通過動態(tài)貝葉斯網(wǎng)絡(luò)來預(yù)測網(wǎng)絡(luò)輿情事件的發(fā)展態(tài)勢。