魏 玲,郭新朋
(哈爾濱理工大學(xué) 管理學(xué)院,哈爾濱 150000)
近年來(lái)貝葉斯理論在我國(guó)的概率統(tǒng)計(jì)領(lǐng)域中快速發(fā)展,影響著各行各業(yè)的學(xué)術(shù)研究發(fā)展步伐,基于貝葉斯公式而形成的圖形化網(wǎng)絡(luò)——貝葉斯網(wǎng)絡(luò)(Bayesian Network,BN),利用概率推理方式對(duì)一些變量信息進(jìn)行處理,從而獲取概率數(shù)據(jù),不僅可以解決不確定性和不完整性的問(wèn)題,還能夠通過(guò)概率來(lái)推理出相關(guān)影響因素之間的潛在關(guān)系[1]。依據(jù)經(jīng)驗(yàn)推斷結(jié)合貝葉斯公式產(chǎn)生的先驗(yàn)概率結(jié)果,通常情況下被視為主觀概率,而這種概率結(jié)果所產(chǎn)生的結(jié)論也具有一定的主觀色彩,在網(wǎng)絡(luò)輿論危機(jī)的識(shí)別過(guò)程中,客觀性、系統(tǒng)性等特性是必然要求,所以利用貝葉斯理論中的后驗(yàn)概率進(jìn)行影響因素發(fā)生質(zhì)變的概率統(tǒng)計(jì)具有客觀性,其主要特性是對(duì)先驗(yàn)概率的修正,從而為網(wǎng)絡(luò)輿論風(fēng)險(xiǎn)分析提供概率統(tǒng)計(jì)基礎(chǔ)[2]。
本文提出了基于貝葉斯后驗(yàn)的網(wǎng)絡(luò)輿論三角模糊數(shù)型危機(jī)識(shí)別方法。在三角模糊數(shù)型網(wǎng)絡(luò)輿論危機(jī)識(shí)別過(guò)程中,應(yīng)用貝葉斯網(wǎng)絡(luò)的概率推理技術(shù)結(jié)合貝葉斯理論中的后驗(yàn)概率確定主要網(wǎng)絡(luò)輿論危機(jī)產(chǎn)生的影響因素,利用三角模糊數(shù)描述各專(zhuān)家對(duì)輿論危機(jī)產(chǎn)生影響因素評(píng)分的模糊性,文獻(xiàn)[3]利用貝葉斯網(wǎng)絡(luò)與三角模糊數(shù)相結(jié)合,分析了故障模式屬性與危害度之間的關(guān)系,但沒(méi)有進(jìn)行去模糊處理,存在結(jié)果模糊的問(wèn)題。根據(jù)貝葉斯網(wǎng)絡(luò)中的概率推理及信息數(shù)據(jù)處理規(guī)則對(duì)統(tǒng)計(jì)的概率進(jìn)行均值化、去模糊化與歸一化,從而確定網(wǎng)絡(luò)輿論影響因素的危險(xiǎn)指數(shù),并對(duì)比危險(xiǎn)等級(jí)劃分表確定各影響因素的危險(xiǎn)等級(jí)。利用模糊綜合評(píng)價(jià)理論中的評(píng)語(yǔ)集給出對(duì)應(yīng)影響因素的三角模糊數(shù)評(píng)語(yǔ)值,對(duì)危機(jī)影響因素進(jìn)行加權(quán)處理,從而確定網(wǎng)絡(luò)輿論危機(jī)發(fā)生等級(jí)。
貝葉斯網(wǎng)絡(luò)的概率推理技術(shù)最先由Pearl[4]提出,用有向無(wú)環(huán)圖(DAG)表示,能夠解決不確定性的、復(fù)雜的問(wèn)題,且貝葉斯公式是該概率網(wǎng)絡(luò)的理論基礎(chǔ)[5],具體定義如下:
定義1:條件概率。假設(shè)A、B為一個(gè)隨機(jī)試驗(yàn)中的兩個(gè)事件,將事件A在事件B發(fā)生的條件下的概率稱(chēng)之為條件概率,表示如下:
定義2:全概率公式。若Aj,j=1,…,m,其中m表示m個(gè)互不相容的事件,且P(Aj)〉0,j=1,…,m。
定義3:貝葉斯公式。將全概率公式(2)帶入條件概率公式(1)中,即可得到貝葉斯公式:
式中,B表示隨機(jī)試驗(yàn)的結(jié)果,P(Ai)為先驗(yàn)概率,P(Ai|B)為后驗(yàn)概率。
由貝葉斯公式可知,后驗(yàn)概率公式獲得情況如下描述,假設(shè)D是訓(xùn)練對(duì)象的集合,且每個(gè)訓(xùn)練對(duì)象用n維屬性向量,基于n維屬性向量共劃分為m個(gè)類(lèi),由此得到后驗(yàn)概率計(jì)算公式[6]為:
根據(jù)貝葉斯理論中的聯(lián)合概率分布可知,貝葉斯網(wǎng)絡(luò)中的每個(gè)變量(屬性)之間存在著一定的關(guān)聯(lián)性,因此可得到如下公式進(jìn)行條件獨(dú)立假設(shè):
由公式(5)可知,網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)則對(duì)應(yīng)一個(gè)變量(屬性),當(dāng)P(Bi|j)P(Aj)>P(Bi|k)P(Ak),1≤k≤m,1≤j≤m,j≠i且j≠k成立時(shí),B屬于Aj。
貝葉斯網(wǎng)絡(luò)存在兩種結(jié)構(gòu),一種是用有向無(wú)環(huán)圖進(jìn)行表示的結(jié)構(gòu),其中每個(gè)節(jié)點(diǎn)表示一種變量(屬性),且每個(gè)變量之間的弧表示變量(屬性)之間存在的因果關(guān)系,如圖1給出簡(jiǎn)單貝葉斯網(wǎng)絡(luò)有向無(wú)環(huán)圖結(jié)構(gòu)。另一種則是條件概率表(Conditional Probability Table,CPT),可用該表表示每個(gè)節(jié)點(diǎn)變量對(duì)父節(jié)點(diǎn)變量的所有可能性。
圖1 簡(jiǎn)單貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)
貝葉斯網(wǎng)絡(luò)概率推理技術(shù)不僅包含將靜態(tài)和動(dòng)態(tài)結(jié)合分析,有效辨析專(zhuān)家經(jīng)驗(yàn)和問(wèn)題變化情況的正向推理,還包含后驗(yàn)概率統(tǒng)計(jì)得出的結(jié)構(gòu)逆向獲取信息的推理方式,找到事件發(fā)展變化的原因。由于網(wǎng)絡(luò)輿論演化過(guò)程中的影響因素之間形成的條件概率數(shù)據(jù)有所缺失,故需將獲取的專(zhuān)家評(píng)分的先驗(yàn)概率作為研究基礎(chǔ),結(jié)合貝葉斯的概率推理技術(shù)進(jìn)一步研究[7]。
(1)正向推理。正向推理是貝葉斯網(wǎng)絡(luò)概率推理技術(shù)中的因果推理,即通過(guò)對(duì)網(wǎng)絡(luò)輿論中危機(jī)風(fēng)險(xiǎn)影響因素發(fā)生的條件概率進(jìn)行統(tǒng)計(jì),從而對(duì)網(wǎng)絡(luò)輿論危機(jī)發(fā)生進(jìn)行預(yù)測(cè)。
(2)逆向推理。逆向推理在貝葉斯網(wǎng)絡(luò)概率推理中也是診斷推理,通常指對(duì)已知的危機(jī)結(jié)果,利用逆向推理進(jìn)行運(yùn)算,即在計(jì)算出先驗(yàn)概率的情況下,得出該變量(屬性)的后驗(yàn)概率。
(3)雙向推理。雙向推理則利用部分正向推理的結(jié)果,在逆向推理過(guò)程中,對(duì)導(dǎo)致危機(jī)結(jié)果的原因進(jìn)行逆向推理,從而實(shí)現(xiàn)對(duì)原因與結(jié)果的解釋。
在網(wǎng)絡(luò)輿論危機(jī)產(chǎn)生過(guò)程中,每個(gè)階段都是不同的狀態(tài),通常表現(xiàn)為多階段與多影響因素。在多階段中主要包含了網(wǎng)絡(luò)輿論危機(jī)潛伏期、過(guò)渡期、爆發(fā)期,每個(gè)時(shí)期相關(guān)聯(lián)的影響因素也是不同的,例如潛伏期中有潛在輿論驅(qū)動(dòng)群體、隱性利益。而網(wǎng)絡(luò)輿論危機(jī)形成的整個(gè)周期有著共同的影響因素,政府公信力降低、媒體輿論信息傳播失真、網(wǎng)民關(guān)注度偏移等。貝葉斯網(wǎng)絡(luò)的多狀態(tài)離散處理系統(tǒng)可以將不同的狀態(tài)進(jìn)行關(guān)聯(lián)分析,即將每個(gè)影響因素之間的界限進(jìn)行模糊化處理,從而提高分析各影響因素發(fā)生概率的準(zhǔn)確值。
1.2.1 三角模糊數(shù)定義
根據(jù)傳統(tǒng)的三角模糊數(shù)理論可知,一個(gè)三角模糊數(shù)中包含三個(gè)可能值,即較低可能值、可能值、較高可能值,按照概率分布函數(shù)確定三角模糊數(shù)的隸屬函數(shù),給定一個(gè)隨機(jī)三角模糊數(shù),且已知 0≤Al≤Am≤Au,則變量b屬于?的隸屬度公式為:
1.2.2 三角模糊數(shù)運(yùn)算法則[8]
(1)加法交換律
(4)除法運(yùn)算
(5)數(shù)乘運(yùn)算(給定任意實(shí)數(shù)β)
式(9)中,Aj(j=l,m,u)與Bi(i=l,m,u)中至少有一個(gè)大于零;式(10)中,Bi(i=l,m,u)大于零。
三角模糊數(shù)理論應(yīng)用于網(wǎng)絡(luò)輿論危機(jī)識(shí)別過(guò)程,由于網(wǎng)絡(luò)輿論危機(jī)的表現(xiàn)極具模糊化,且依據(jù)其三個(gè)發(fā)展階段可以看出,影響輿論變質(zhì)化的因素體現(xiàn)在網(wǎng)民、事件、政府、媒體等類(lèi)別,因此針對(duì)某一個(gè)公共事件的網(wǎng)絡(luò)輿論危機(jī)識(shí)別的過(guò)程中必須依照專(zhuān)家的經(jīng)驗(yàn)進(jìn)行初步判斷,才能確定貝葉斯網(wǎng)絡(luò)的危機(jī)評(píng)定的基礎(chǔ)。
由貝葉斯網(wǎng)絡(luò)的先驗(yàn)概率公式與專(zhuān)家經(jīng)驗(yàn)結(jié)合計(jì)算可得,三角模糊數(shù)均值化公式如下:
基于上述三角模糊運(yùn)算法則,給定任意一個(gè)正整數(shù)η和三角模糊數(shù),則將該三角模糊數(shù)去模糊化的公式如下:
給定M位專(zhuān)家的評(píng)語(yǔ),按照下頁(yè)表1給出的三角模糊數(shù)評(píng)語(yǔ)值進(jìn)行如下計(jì)算,第i個(gè)變量(屬性)B的三角模糊數(shù)概率矩陣可用,其中j=1,2,…,m。三角模糊數(shù)歸一化公式如下:
在式(13)與式(14)的聯(lián)合基礎(chǔ)上進(jìn)行危機(jī)等級(jí)公式處理,如式(15):
表1 變量危機(jī)程度評(píng)語(yǔ)及其對(duì)應(yīng)的三角模糊數(shù)[9]
網(wǎng)絡(luò)輿論在不同的網(wǎng)絡(luò)平臺(tái)中已經(jīng)成為了人們進(jìn)行及時(shí)獲取、交流與傳遞信息的一種方式。本文主要以2016年上半年發(fā)生的重大醫(yī)療事故事件——“魏則西事件”作為依據(jù)進(jìn)行分析。該事件發(fā)生后不僅引起了政府對(duì)醫(yī)療的關(guān)注,還引起了一場(chǎng)網(wǎng)絡(luò)輿論浪潮,針對(duì)醫(yī)療機(jī)構(gòu)與百度搜索排名相關(guān)討論大幅度增加,造成的輿論導(dǎo)向群體極化現(xiàn)象也是比較嚴(yán)重的,因此對(duì)此事件應(yīng)用貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)下的三角模糊數(shù)進(jìn)行網(wǎng)絡(luò)輿論危機(jī)識(shí)別是有必要的。
研究過(guò)程中向?qū)<胰后w征求意見(jiàn),按照專(zhuān)家經(jīng)驗(yàn)總結(jié)分析,并對(duì)收集回來(lái)的問(wèn)卷進(jìn)行模糊化處理,得到具體的評(píng)估值,應(yīng)用于貝葉斯網(wǎng)絡(luò)后驗(yàn)概率的計(jì)算和三角模糊數(shù)的確定。問(wèn)卷獲取來(lái)源的各個(gè)專(zhuān)家群體主要包含醫(yī)學(xué)領(lǐng)域的各大高校教授、互聯(lián)網(wǎng)競(jìng)價(jià)排名領(lǐng)域的專(zhuān)家、高??蒲泄芾聿块T(mén)主管以及政府相關(guān)處理部門(mén)的領(lǐng)導(dǎo)的意見(jiàn),共發(fā)放了150份,回收有效問(wèn)卷數(shù)量為138份。具體的危機(jī)識(shí)別過(guò)程如下:
貝葉斯網(wǎng)絡(luò)的構(gòu)建過(guò)程中首先需要確定網(wǎng)絡(luò)中的根節(jié)點(diǎn)和葉節(jié)點(diǎn),其次是確定連接變量之間的有向關(guān)聯(lián)弧,因此通過(guò)對(duì)專(zhuān)家進(jìn)行調(diào)查訪問(wèn)得到表2的網(wǎng)絡(luò)輿論中主要影響因素及類(lèi)別,并給出如圖2所示的網(wǎng)絡(luò)結(jié)構(gòu)圖。
從圖2中可以看出,貝葉斯網(wǎng)絡(luò)中有5個(gè)根節(jié)點(diǎn),其余均為葉節(jié)點(diǎn),且其中包含4個(gè)類(lèi)別節(jié)點(diǎn)。其中根節(jié)點(diǎn)集合為{b1,b2,b6,b12,b14},葉節(jié)點(diǎn)為“網(wǎng)絡(luò)輿論”,而其余均為中間節(jié)點(diǎn)。
圖2 網(wǎng)絡(luò)輿論貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)
表2 網(wǎng)絡(luò)輿論貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)指標(biāo)說(shuō)明
依據(jù)動(dòng)態(tài)分析理論,確定模糊概率需要將同一影響因素在不同的時(shí)間段內(nèi)產(chǎn)生的不同結(jié)果進(jìn)行統(tǒng)計(jì),以每個(gè)影響因素的數(shù)值對(duì)比率作為變量后驗(yàn)概率驗(yàn)算基礎(chǔ)。依據(jù)式(4)確定每個(gè)變量的后驗(yàn)概率,并根據(jù)專(zhuān)家對(duì)每個(gè)影響因素可能存在發(fā)生給出其先驗(yàn)概率,應(yīng)用式(3)的條件概率進(jìn)行計(jì)算。在問(wèn)卷調(diào)查的專(zhuān)家中具有權(quán)威性的專(zhuān)家人數(shù)為5人,因此根據(jù)表1中給出的模糊語(yǔ)義值表述對(duì)問(wèn)卷調(diào)查中這5位專(zhuān)家對(duì)影響因素的評(píng)價(jià)進(jìn)行整合,給出根節(jié)點(diǎn)和中間節(jié)點(diǎn)的三角模糊數(shù)值矩陣,如下所示:
同理,根據(jù)專(zhuān)家對(duì)每個(gè)變量的觀點(diǎn),如“還行”、“差不多”、“很可能”等模糊詞進(jìn)行三角模糊處理,并利用式(12)、式(13)、式(14)對(duì)其進(jìn)行操作。當(dāng)η=2時(shí),有如下結(jié)果。
利用式(12)對(duì)每個(gè)變量的在貝葉斯網(wǎng)絡(luò)中的概率進(jìn)行三角模糊數(shù)均值化處理如下頁(yè)表3所示。
按照式(13)進(jìn)行去模糊化操作,實(shí)現(xiàn)將概率值精準(zhǔn)化,使其變?yōu)閷?shí)數(shù),此時(shí)根據(jù)專(zhuān)家數(shù)可以確定η的取值為3,可得結(jié)果如下頁(yè)表4所示。
表3 三角模糊數(shù)均值化處理結(jié)果
表4 三角模糊數(shù)去模糊化處理結(jié)果
歸一化作為一種無(wú)量綱處理手段,不僅可以消除無(wú)關(guān)影響因素,還能進(jìn)一步精確變量的概率準(zhǔn)確度,利用式(3)和式(14)對(duì)各根節(jié)點(diǎn)和中間節(jié)點(diǎn)進(jìn)行處理,從而得到歸一化的處理結(jié)果,如表5所示。
表5 無(wú)量綱歸一化處理結(jié)果
當(dāng)專(zhuān)家數(shù)量M確定為5時(shí),依據(jù)式(15)計(jì)算各個(gè)影響因素的危險(xiǎn)指數(shù),計(jì)算結(jié)果如表6所示。
表6 變量危險(xiǎn)指數(shù)
根據(jù)網(wǎng)絡(luò)輿情專(zhuān)家系統(tǒng)中給出的危險(xiǎn)級(jí)別的劃分,如表7所示,可以將上述變量進(jìn)行危險(xiǎn)定級(jí)。
表7 危險(xiǎn)級(jí)別劃分
根據(jù)式(6)的隸屬度公式對(duì)均值化后的三角模糊數(shù)進(jìn)行操作,確定每個(gè)變量屬于哪一具體類(lèi)別,為網(wǎng)絡(luò)輿論危機(jī)等級(jí)確定的結(jié)果提供類(lèi)別劃分依據(jù),使得分析的結(jié)果更具有簡(jiǎn)單性。
例如,計(jì)算變量b1~b5的隸屬度,確定其是否屬于圖1給出的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)中的類(lèi)別,計(jì)算結(jié)果如表8所示。
表8 變量b1~b5隸屬度
當(dāng)隸屬度值大于零時(shí)才能說(shuō)明該變量屬于對(duì)應(yīng)的類(lèi)別,具有的風(fēng)險(xiǎn)類(lèi)型接近于實(shí)際情況,而隸屬度值等于零則表明該變量有非常大的可能不屬于該類(lèi)別,或說(shuō)與該類(lèi)別的貼近度較低,因此一定程度上加大了該變量轉(zhuǎn)化成危機(jī)因素的風(fēng)險(xiǎn),即在原有風(fēng)險(xiǎn)等級(jí)上增加10%的可能度[10]。
本文提出的網(wǎng)絡(luò)輿論危機(jī)識(shí)別方法,不僅可以實(shí)現(xiàn)對(duì)公眾輿論的影響因素分析,還能利用貝葉斯網(wǎng)絡(luò)的概率推理技術(shù)對(duì)每個(gè)影響因素的發(fā)生概率及危險(xiǎn)化程度進(jìn)行計(jì)算,將定性變量以定量的方式進(jìn)行表示,從而提高三角模糊數(shù)與貝葉斯網(wǎng)絡(luò)的有效利用率,充分地分析突發(fā)事件的網(wǎng)絡(luò)輿論演化成危機(jī)的主體影響因素。為了進(jìn)一步提高網(wǎng)絡(luò)危機(jī)識(shí)別速度,在未來(lái)的學(xué)術(shù)研究工作中將應(yīng)用分布式處理方式與快速檢索算法聯(lián)合處理,彌補(bǔ)本文在危機(jī)識(shí)別速度上存在的局限性。
參考文獻(xiàn):
[1]Jensen F V,Nielsen T D.Bayesian Networks and Decision Graphs[J].Springer Berlin,2015,50(3).
[2]相麗玲,王晴.信息公開(kāi)背景下網(wǎng)絡(luò)輿情危機(jī)演化特征及治理機(jī)制研究[J].情報(bào)科學(xué),2014,(4).
[3]翟勝,師五喜,修春波.基于模糊貝葉斯網(wǎng)的危害性分析方法[J].計(jì)算機(jī)應(yīng)用,2014,34(12).
[4]胡玉勝,涂序彥,崔曉瑜等.基于貝葉斯網(wǎng)絡(luò)的不確定性知識(shí)的推理方法[J].計(jì)算機(jī)集成制造系統(tǒng),2001,7(12).
[5]岳超源.決策理論與方法[M].北京:科學(xué)出版社,2003.
[6]馬賓,殷立峰.一種基于Hadoop平臺(tái)的并行樸素貝葉斯網(wǎng)絡(luò)輿情快速分類(lèi)算法[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2015,(2).
[7]韓磊,吳樹(shù)芳,王子賢.貝葉斯網(wǎng)絡(luò)[J].電腦知識(shí)與技術(shù),2009,5(21).
[8]江文奇.基于FVIKOR的三角模糊數(shù)型多準(zhǔn)則決策方法[J].控制與決策,2016,31(7).
[9]王君,樊治平.知識(shí)管理者能力的一種模糊多指標(biāo)評(píng)價(jià)方法[J].系統(tǒng)管理學(xué)報(bào),2003,12(3).
[10]黃智力,羅鍵.三角模糊數(shù)型不確定多指標(biāo)決策的可能度關(guān)系法[J].控制與決策,2015,30(8).