国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)時(shí)代公安網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)識(shí)別研究

2022-05-15 02:50靳會(huì)峰
關(guān)鍵詞:遺傳算法輿情網(wǎng)格

劉 通,靳會(huì)峰

中國(guó)人民警察大學(xué) 宣傳處,河北 廊坊 065000

0 引言

網(wǎng)絡(luò)輿情是社會(huì)輿論的一種表現(xiàn)形式,是公眾在互聯(lián)網(wǎng)空間內(nèi)對(duì)熱點(diǎn)事件、話題發(fā)表的言論與觀點(diǎn)[1-2]。而大數(shù)據(jù)輿情監(jiān)測(cè)是為適應(yīng)大數(shù)據(jù)時(shí)代輿情新特征而發(fā)展起來的,基于大數(shù)據(jù)分析技術(shù)的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)識(shí)別,可以有效地從海量網(wǎng)絡(luò)信息中識(shí)別危機(jī)事件與社會(huì)風(fēng)險(xiǎn)的信息源頭,分析公眾輿論觀點(diǎn)和情感傾向,并通過匹配數(shù)據(jù)庫(kù)中已有的相似事件進(jìn)行風(fēng)險(xiǎn)評(píng)估和策略優(yōu)化選擇[3]。發(fā)現(xiàn)并識(shí)別網(wǎng)絡(luò)輿情隱性風(fēng)險(xiǎn)、分析其演變發(fā)展規(guī)律,是及時(shí)應(yīng)對(duì)輿情危機(jī)的前提[4-5]。

國(guó)外學(xué)者從網(wǎng)絡(luò)輿情預(yù)測(cè)分析角度開展了大量研究。Salehan等利用大數(shù)據(jù)技術(shù)建立了一個(gè)在線消費(fèi)者評(píng)論預(yù)測(cè)模型,通過分析讀者感情傾向得出:具有積極情緒的標(biāo)題更容易引起讀者關(guān)注[6]。Poria等提出一種基于深度學(xué)習(xí)的觀點(diǎn)提取方法,使用7層深度卷積神經(jīng)網(wǎng)絡(luò)標(biāo)注了輿情信息中用于情感分析的關(guān)鍵詞,極大提高了輿情信息數(shù)據(jù)識(shí)別的準(zhǔn)確度[7]。Hardy等人在輿情信息數(shù)據(jù)公開度方面進(jìn)行了相關(guān)研究,探討了將政府?dāng)?shù)據(jù)公開發(fā)布的好處及潛在輿情風(fēng)險(xiǎn)[8]。國(guó)內(nèi)學(xué)者多以網(wǎng)絡(luò)輿情的演變與傳播規(guī)律、輿情風(fēng)險(xiǎn)的識(shí)別等為對(duì)象開展相關(guān)研究。黃微等研究了大數(shù)據(jù)環(huán)境下多媒體網(wǎng)絡(luò)輿情信息傳播要素和運(yùn)行機(jī)理,構(gòu)建了傳播機(jī)理的總體關(guān)系架構(gòu),為政府部門開展網(wǎng)絡(luò)輿情信息監(jiān)管工作提供重要支持[9]。徐江虹深刻分析了高校網(wǎng)絡(luò)輿情在內(nèi)容、主體、傳播媒介、傳播方式等方面的新變化,并在輿情識(shí)別、研判、處理等方面提出了新的治理方案[10]。高歌等從系統(tǒng)動(dòng)力學(xué)角度剖析了大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)輿情演化機(jī)理,闡釋了網(wǎng)絡(luò)輿情演化階段和要素[11]。王政構(gòu)建了以主題為引導(dǎo)的輿情風(fēng)險(xiǎn)識(shí)別平臺(tái),能夠更加準(zhǔn)確迅速地了解和掌握網(wǎng)絡(luò)輿情發(fā)展現(xiàn)狀與變化規(guī)律,并對(duì)信息采集模型中的元搜索算法進(jìn)行改進(jìn),加大了對(duì)各類輿情信息數(shù)據(jù)收集的深度與廣度[12]。

筆者基于大數(shù)據(jù)分析和網(wǎng)格建模思想初步建立了一種遺傳算法優(yōu)化的動(dòng)態(tài)網(wǎng)格輿情風(fēng)險(xiǎn)識(shí)別系統(tǒng),可從大數(shù)據(jù)平臺(tái)獲取的海量輿情信息中篩選關(guān)鍵信息,有效預(yù)測(cè)并評(píng)估輿情風(fēng)險(xiǎn)。

1 大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)輿情的新特點(diǎn)

伴隨著網(wǎng)絡(luò)信息技術(shù)的普及,社會(huì)輿論表達(dá)逐步實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)媒體平臺(tái)的全覆蓋[13]。網(wǎng)絡(luò)輿情正以其特有的方式反作用于現(xiàn)實(shí)社會(huì),造成積極或負(fù)面的影響[14]。在大數(shù)據(jù)時(shí)代背景下,網(wǎng)絡(luò)輿情呈現(xiàn)出許多新特點(diǎn)和新變化:(1)規(guī)模大。據(jù)國(guó)際數(shù)據(jù)公司(IDC)研究報(bào)告,到2020年,全球數(shù)據(jù)使用量達(dá)到35.2 ZB,2021年非結(jié)構(gòu)化數(shù)據(jù)占有比例將達(dá)到互聯(lián)網(wǎng)整個(gè)數(shù)據(jù)量的75%以上。(2)傳播快。與傳統(tǒng)輿情不同,基于互聯(lián)網(wǎng)媒介的網(wǎng)絡(luò)輿情傳播速度更快、受眾更廣。其主要原因是互聯(lián)網(wǎng)的開放性拓寬了網(wǎng)絡(luò)用戶的社交空間,尚不健全的信息發(fā)布審核機(jī)制也加快了網(wǎng)絡(luò)信息的自由傳播。(3)種類多。大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)輿情信息復(fù)雜多樣、種類繁多。來自社會(huì)不同領(lǐng)域和階層的網(wǎng)民廣泛參與輿情信息的發(fā)布和傳播,構(gòu)成了具有多元性、全民性、交互性、實(shí)時(shí)性的輿情信息網(wǎng)絡(luò)。

總之,網(wǎng)絡(luò)輿情的大數(shù)據(jù)特征使得公安網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)識(shí)別、監(jiān)管和引導(dǎo)工作增加了復(fù)雜性和不確定性。

2 大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)的數(shù)據(jù)采集

大數(shù)據(jù)時(shí)代背景下的網(wǎng)絡(luò)輿情新特點(diǎn)擴(kuò)大了普通民眾的話語權(quán),也對(duì)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)識(shí)別提出了新的挑戰(zhàn)。海量的網(wǎng)絡(luò)輿情信息數(shù)據(jù)離不開平臺(tái)技術(shù)的支持[15-16],通過大數(shù)據(jù)分析處理和輿情結(jié)構(gòu)建模,可以對(duì)輿情發(fā)展態(tài)勢(shì)和影響進(jìn)行研判。應(yīng)當(dāng)充分發(fā)揮大數(shù)據(jù)前瞻預(yù)測(cè)和數(shù)據(jù)比對(duì)兩大技術(shù)優(yōu)勢(shì):前瞻性趨勢(shì)預(yù)測(cè),即對(duì)趨勢(shì)作出正確判斷,是大數(shù)據(jù)時(shí)代輿情管理的核心;數(shù)據(jù)比對(duì)分析,即充分利用多樣化數(shù)據(jù),將不同領(lǐng)域的數(shù)據(jù)關(guān)聯(lián)起來進(jìn)行分析。對(duì)輿情發(fā)展趨勢(shì)的預(yù)測(cè)分析是網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)識(shí)別的重要技術(shù)內(nèi)容,通過對(duì)重點(diǎn)主題進(jìn)行密切跟蹤與監(jiān)測(cè),同時(shí)做好數(shù)據(jù)采集、分析,結(jié)合歷史上的類似事件進(jìn)行趨勢(shì)預(yù)測(cè),提出應(yīng)對(duì)和防范措施,可最終達(dá)到風(fēng)險(xiǎn)規(guī)避目的。另外,許多網(wǎng)絡(luò)輿情信息都存在潛在關(guān)聯(lián),相互關(guān)聯(lián)的網(wǎng)絡(luò)信息編織成巨大的輿情信息網(wǎng)絡(luò),挖掘輿情信息數(shù)據(jù)中的內(nèi)在聯(lián)系,建立信息數(shù)據(jù)關(guān)聯(lián)度評(píng)級(jí)機(jī)制,有助于風(fēng)險(xiǎn)識(shí)別與防范。

本文利用大數(shù)據(jù)平臺(tái)的全端數(shù)據(jù)采集獲取輿情風(fēng)險(xiǎn)樣本數(shù)據(jù)集,以具備應(yīng)用程序接口的新浪微博為例,采用爬取工具收集網(wǎng)絡(luò)用戶輿情信息關(guān)鍵詞儲(chǔ)存于元數(shù)據(jù)庫(kù)中,以供輿情風(fēng)險(xiǎn)檢測(cè)模型進(jìn)行訓(xùn)練及算法優(yōu)化。輿情信息樣本數(shù)據(jù)的采集應(yīng)遵循隨機(jī)原則,輿情個(gè)體之間保持相對(duì)獨(dú)立。大數(shù)據(jù)平臺(tái)的全端數(shù)據(jù)采集主要包含涉及Android、iOS、Web、macOS、C++的前端采集,涉及Node、C、PHP、Java、Python的后端采集。

2.1 基于規(guī)則網(wǎng)格的網(wǎng)絡(luò)輿情建模

基于規(guī)則網(wǎng)格的大數(shù)據(jù)網(wǎng)絡(luò)輿情結(jié)構(gòu)建模是對(duì)復(fù)雜網(wǎng)絡(luò)進(jìn)行抽象建模的一種方法。具體來說,它涉及由頂點(diǎn)、邊、面、多邊形和元素組成的網(wǎng)格結(jié)構(gòu)。數(shù)據(jù)網(wǎng)格化是將空間分布不均勻的數(shù)據(jù)按照某種方法轉(zhuǎn)換成有代表性的值的過程。

規(guī)則網(wǎng)格結(jié)構(gòu)建模的基本思想:規(guī)則網(wǎng)格通常由規(guī)則形狀組成,如正方形、三角形和矩形。規(guī)則網(wǎng)格中的每個(gè)網(wǎng)格單元都對(duì)應(yīng)一個(gè)數(shù)值矩陣,在空間相鄰的網(wǎng)格單元之間存在輿情信息的相互作用。通過常規(guī)的基于網(wǎng)格的結(jié)構(gòu)建模和交互計(jì)算,可將網(wǎng)絡(luò)輿情信息資源進(jìn)行整合[17]。

基于網(wǎng)格的輿情結(jié)構(gòu)建模規(guī)則:以網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)識(shí)別系統(tǒng)為代表的復(fù)雜多組分系統(tǒng)的基本組成部分不是粒子,而是能夠思考的普通公眾成員。在這樣的系統(tǒng)中,每個(gè)人與有限數(shù)量的同伴互動(dòng),而不是與其他所有人互動(dòng)。因此,可以采用基于規(guī)則網(wǎng)格的建模方法,對(duì)輿情系統(tǒng)中涉及的復(fù)雜交互進(jìn)行結(jié)構(gòu)建模。在這樣的模型系統(tǒng)中,每個(gè)人的基本運(yùn)動(dòng)方程通常是未知的,很難使用傳統(tǒng)的統(tǒng)計(jì)分析來評(píng)估。將現(xiàn)代物理學(xué)中的量子力學(xué)與常規(guī)的基于網(wǎng)格的建模方法相結(jié)合,可以有效描述微觀粒子的結(jié)構(gòu)、性質(zhì)和運(yùn)動(dòng)。因此,可以嘗試用描述物質(zhì)世界的網(wǎng)格方法來描述社會(huì)系統(tǒng),即認(rèn)為“人類像粒子一樣移動(dòng)”,從微觀的角度,利用隨機(jī)性和無序性來解釋宏觀的社會(huì)現(xiàn)象。

2.2 基于規(guī)則網(wǎng)格的輿情模型優(yōu)化

規(guī)則網(wǎng)格提供了復(fù)雜網(wǎng)絡(luò)的抽象表示,基于規(guī)則網(wǎng)格的輿情建模與仿真是結(jié)構(gòu)復(fù)雜的輿情建模的重要組成部分。在常規(guī)的基于網(wǎng)格的輿情結(jié)構(gòu)建模中,可以采用如圖1所示的四鄰域、八鄰域或拓展鄰域空間關(guān)聯(lián)來模擬大數(shù)據(jù)時(shí)代輿情形成與演變過程中的互動(dòng)[18-19]。基于輿情網(wǎng)格化結(jié)構(gòu)建模規(guī)則,將理性的輿情互動(dòng)轉(zhuǎn)化為簡(jiǎn)單的空間鄰域關(guān)系。

圖1 空間鄰域關(guān)系圖

復(fù)雜動(dòng)態(tài)網(wǎng)格輿情風(fēng)險(xiǎn)識(shí)別系統(tǒng)是一種由節(jié)點(diǎn)和邊組成的系統(tǒng),節(jié)點(diǎn)之間相互連接。對(duì)節(jié)點(diǎn)進(jìn)行分析,統(tǒng)計(jì)節(jié)點(diǎn)之間的數(shù)據(jù)關(guān)聯(lián)度,對(duì)于研究網(wǎng)絡(luò)輿情的拓?fù)浣Y(jié)構(gòu)具有重要意義[20]。各個(gè)節(jié)點(diǎn)所擁有的相鄰節(jié)點(diǎn)數(shù)量稱為節(jié)點(diǎn)度。如果已知網(wǎng)絡(luò)內(nèi)各節(jié)點(diǎn)的度,就能知道網(wǎng)絡(luò)的節(jié)點(diǎn)度序列及其分布,這是任何復(fù)雜網(wǎng)絡(luò)最基本的拓?fù)涮卣鳌Mㄟ^多次實(shí)驗(yàn)可以得出網(wǎng)絡(luò)輿情的度分布特征,結(jié)果表明大多網(wǎng)絡(luò)輿情的節(jié)點(diǎn)度主要服從冪分布、泊松分布和指數(shù)分布。在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中,兩個(gè)節(jié)點(diǎn)之間的距離,即一對(duì)節(jié)點(diǎn)之間的最短路徑,定義為連接兩個(gè)節(jié)點(diǎn)的最小邊數(shù)或最小權(quán)值之和。相關(guān)研究案例中的輿情互動(dòng)網(wǎng)絡(luò)表明,網(wǎng)絡(luò)輿情互動(dòng)節(jié)點(diǎn)度呈現(xiàn)出較為清晰的冪分布,平均路徑較短。這一特征對(duì)于研究網(wǎng)絡(luò)結(jié)構(gòu)和輿情傳播效率具有重要意義。

在復(fù)雜系統(tǒng)中,節(jié)點(diǎn)可以用來表示不同的個(gè)體,而邊可以用來表示不同的個(gè)體抽象聯(lián)系,通常適用于描述系統(tǒng)中個(gè)體之間的關(guān)系和他們的集體行為。許多現(xiàn)存的復(fù)雜系統(tǒng)可以被描述為輿情網(wǎng)絡(luò)[21]。

3 大數(shù)據(jù)時(shí)代公安網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)識(shí)別方法

網(wǎng)絡(luò)輿情作為互聯(lián)網(wǎng)時(shí)代公民言論的全新表現(xiàn)形式,成為了公民言論自由從現(xiàn)實(shí)向虛擬延伸的重要載體[22]。網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)是負(fù)面輿論所引發(fā)的危機(jī)事件,會(huì)對(duì)公眾個(gè)體造成不同程度的損傷[23]。網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)有別于現(xiàn)實(shí)社會(huì)風(fēng)險(xiǎn)之處在于其隱性特征。最常見的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)表現(xiàn)為輿情主體情感的失控,包括主觀焦慮的強(qiáng)化和放大、集體情緒宣泄和個(gè)人理性的迷失。網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)的識(shí)別分析有賴于大數(shù)據(jù)分析技術(shù),而基于海量數(shù)據(jù)的數(shù)學(xué)建模和風(fēng)險(xiǎn)識(shí)別系統(tǒng)設(shè)計(jì)是當(dāng)前的兩大重要研究方向。

3.1 大數(shù)據(jù)時(shí)代公安網(wǎng)絡(luò)輿情演化及風(fēng)險(xiǎn)識(shí)別的數(shù)學(xué)建模

近年來,各種各樣的模型和模擬技術(shù)被用于輿情演化傳播研究,其起初主要基于傳染病模型,如SIS、SIR和SEIR模型等。也有一些研究者提出了動(dòng)態(tài)觀點(diǎn)模型等,他們認(rèn)為人們的觀點(diǎn)會(huì)隨著時(shí)間和周圍環(huán)境的變化而變化,從而影響信息的傳播。

網(wǎng)絡(luò)輿情涉及多個(gè)學(xué)科,來自不同學(xué)科背景的學(xué)者對(duì)網(wǎng)絡(luò)輿情演變的研究視角不同。目前常見的數(shù)學(xué)建模思想有:基于元胞自動(dòng)機(jī)建模思想、基于Agent建模思想、基于社會(huì)網(wǎng)絡(luò)的建模思想、基于博弈論思想。常見的風(fēng)險(xiǎn)演化模型有:基于多數(shù)原則的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型、基于有限信任的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型以及基于Sznajd的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型。

眾多的建模思想和演化模型有著不同的建模標(biāo)準(zhǔn),且大多具有單一、非系統(tǒng)的缺陷[24]。規(guī)則網(wǎng)格模型可有效實(shí)現(xiàn)輿情風(fēng)險(xiǎn)模型從非理性到理性、從單一到多維、從非系統(tǒng)性到系統(tǒng)性的轉(zhuǎn)變。但基于規(guī)則網(wǎng)格模型的輿情演化模型也存在一定的局限性,只考慮了輿情信息發(fā)布者與被調(diào)查者之間的關(guān)系,公眾觀點(diǎn)、網(wǎng)民心理等輿情要素在規(guī)則網(wǎng)格模型中沒有體現(xiàn)。因此,本文在規(guī)則網(wǎng)格輿情模型的基礎(chǔ)上提出了基于大數(shù)據(jù)信息采集的動(dòng)態(tài)網(wǎng)格輿情風(fēng)險(xiǎn)模型,并借助遺傳算法進(jìn)行了模型優(yōu)化。

3.2 借助遺傳算法優(yōu)化的動(dòng)態(tài)公安網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)模型

3.2.1 引入概率關(guān)系

不同于傳統(tǒng)的規(guī)則網(wǎng)格輿情模型,本文建立的基于遺傳算法優(yōu)化的動(dòng)態(tài)網(wǎng)格模型強(qiáng)調(diào)連接關(guān)系在一定程度上具有概率性??紤]到各種輿情因素的影響是有概率性的,因此輿情網(wǎng)絡(luò)中的節(jié)點(diǎn)邊緣連接也應(yīng)該具有一定程度的概率性。復(fù)雜動(dòng)態(tài)網(wǎng)格模型可以有效評(píng)估邊緣概率和動(dòng)態(tài)網(wǎng)絡(luò)分析中隨時(shí)間的變化。

復(fù)雜動(dòng)態(tài)網(wǎng)格模型分析是基于輿情監(jiān)測(cè)平臺(tái)收集到的相關(guān)輿情數(shù)據(jù)而建立的,要想對(duì)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化模型進(jìn)行構(gòu)建,首要的任務(wù)就是對(duì)網(wǎng)絡(luò)輿情信息進(jìn)行獲取[25]。由于網(wǎng)絡(luò)輿情信息中包含大量的高頻關(guān)鍵詞,因此需要將相似的關(guān)鍵詞進(jìn)行整合并且引入概率關(guān)系。

在引入概率關(guān)系的復(fù)雜動(dòng)態(tài)網(wǎng)格輿情模型中,以反映某一具體輿情事件中公共個(gè)體觀點(diǎn)和態(tài)度的關(guān)鍵詞為節(jié)點(diǎn),而邊則表示在同一輿情信息中出現(xiàn)了兩個(gè)關(guān)鍵詞節(jié)點(diǎn)。Pi是模型中個(gè)體輿情觀點(diǎn)態(tài)度的屬性值,由積極關(guān)鍵詞在輿情信息中所占的比例決定,如公式(1)所示:

式中,Hi表示輿情個(gè)體i發(fā)布的網(wǎng)絡(luò)信息中包含的關(guān)鍵詞總數(shù);hi表示輿情個(gè)體i發(fā)布的網(wǎng)絡(luò)信息中積極關(guān)鍵詞的數(shù)量。

3.2.2 考慮輿情因素之間的驅(qū)動(dòng)關(guān)系

網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)作為一種復(fù)雜的社會(huì)現(xiàn)象,其形成和演變也涉及網(wǎng)絡(luò)輿情各驅(qū)動(dòng)因素之間的相互作用。復(fù)雜動(dòng)態(tài)網(wǎng)格輿情模型可以很好地描述某一特定輿情危機(jī)發(fā)展過程中各要素之間的相互關(guān)系,一定程度上反映控制輿情演變內(nèi)部驅(qū)動(dòng)因素作用的機(jī)制。

在網(wǎng)絡(luò)輿情中,輿情事件類型是節(jié)點(diǎn),類型之間的轉(zhuǎn)化是邊緣。Pn代表動(dòng)態(tài)網(wǎng)格模型中個(gè)體的屬性值,其值由輿情事件的類型和特征決定,且該變量的值在[0,1]范圍內(nèi)。本文根據(jù)網(wǎng)絡(luò)輿情事件的風(fēng)險(xiǎn)程度,將其分為九個(gè)類別,類別1到類別9分別賦值為0.1到0.9來體現(xiàn)由低到高的風(fēng)險(xiǎn)程度。通過計(jì)算不同類型輿情的驅(qū)動(dòng)因子,可以確定復(fù)雜動(dòng)態(tài)網(wǎng)格輿情模型中公共主體的屬性值Pm,如公式(2)所示:

(2)

式中,n表示環(huán)境子網(wǎng)中分為9類的網(wǎng)絡(luò)輿情事件的參考屬性值;Pmn表示動(dòng)態(tài)網(wǎng)格輿情風(fēng)險(xiǎn)模型中第m個(gè)輿情信息主體發(fā)出的信息屬于第n個(gè)事件類型的概率。

3.2.3 遺傳算法優(yōu)化

鑒于大數(shù)據(jù)時(shí)代海量輿情信息挖掘和識(shí)別的并行化、非線性化要求,本文采用并行搜索性能較強(qiáng)的遺傳算法進(jìn)行風(fēng)險(xiǎn)模型優(yōu)化。遺傳算法是一種基于自然演化原理的搜索優(yōu)化機(jī)制,其具有很好的全局搜索能力,能在搜索過程中獲取和收集搜索域內(nèi)的有效數(shù)據(jù)以供尋優(yōu)求解[26-27]。在大數(shù)據(jù)平臺(tái)下充分利用遺傳算法的優(yōu)勢(shì)可以更好地完善網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)網(wǎng)格模型、提高模型的收斂效果,更好地預(yù)測(cè)和識(shí)別輿情風(fēng)險(xiǎn)。遺傳算法流程如圖2所示。

圖2 遺傳算法流程圖

3.2.3.1 設(shè)置樣本變量。借助大數(shù)據(jù)平臺(tái)進(jìn)行海量信息采集,將關(guān)鍵詞的事件相關(guān)度R作為必要約束條件設(shè)置樣本量范圍。編碼方法直接影響到交叉、變異等遺傳算子的計(jì)算效率,本文采用二進(jìn)制編碼方法進(jìn)行輿情數(shù)據(jù)樣本的數(shù)字化編碼,編碼原則依照上文提出的引入概率關(guān)系的輿情個(gè)體屬性值Pi與考慮各因素間驅(qū)動(dòng)關(guān)系的輿情主體屬性值Pm。類比染色體基因中AGCT4中堿基對(duì)的隨機(jī)排列,將屬性值Pi與Pm映射為隨機(jī)排列的二進(jìn)制編碼串。

3.2.3.2 構(gòu)造初始化函數(shù)。遺傳算法中的每一條染色體對(duì)應(yīng)一個(gè)解決方案,常用適用度函數(shù)衡量解決方案的優(yōu)劣[28-30]。本文基于元數(shù)據(jù)庫(kù)中采集的關(guān)鍵詞語義Si、觀點(diǎn)Oi、情感傾向Ei來構(gòu)建適應(yīng)度函數(shù)。適應(yīng)度函數(shù)F定義為以上3個(gè)風(fēng)險(xiǎn)屬性參量的加權(quán)和,如公式(3)所示:

F=ζ1Si+ζ2Oi+ζ3Ei

(3)

式中,ζ1、ζ2、ζ3分別為參量Si、Oi、Ei的加權(quán)系數(shù)。且三個(gè)參量的可能值為-1,0,1,分別代表積極、中性、消極的詞義屬性。加權(quán)值之和越大意味著適應(yīng)度越大,進(jìn)而輿情風(fēng)險(xiǎn)程度越高。輿情信息樣本的適應(yīng)度評(píng)估結(jié)果如圖3所示。

圖3 輿情信息樣本的適應(yīng)度評(píng)估結(jié)果

3.2.3.3 選擇。利用遺傳算法中的選擇操作可以篩選風(fēng)險(xiǎn)等級(jí)更高的輿情信息關(guān)鍵詞,選擇機(jī)制是影響遺傳算法性能的主要因素。本文采用“輪盤賭”選擇方法進(jìn)行輿情事件特征類型選擇,輿情個(gè)體被篩選進(jìn)入下一代的概率等于其適應(yīng)度與種群中所有個(gè)體適應(yīng)度之和的比值,相應(yīng)的MATLAB程序代碼如下:

fitvalue=[3 2 1 0 -1 -2 -3]; %輿情信息對(duì)應(yīng)的適應(yīng)度值

totalf=sum(fitvalue); %適應(yīng)值之和

p=fitvalue./totalf; %單個(gè)輿情個(gè)體被選中的概率

q=cumsum(p); %輿情個(gè)體的累積概率

c1=c2=c3=c4=c5=c6=c7=c8=c9=0 %9類輿情事件的次數(shù)初值

while c1+c2+c3+c4+c5+c6+c7+c8+c9<=1997

fitin=1;

newin=1;

m=sort(rand(4,1)); %生成一組從小到大排列的隨機(jī)數(shù)組

while newin<=4

if q(fitin)>m(newin)

s(newin)=fitin;

switch s(newin)

case 1

c1=c1+1;

case 2

c2=c2+1;

case 3

c3=c3+1;

case 4

c4=c4+1;

case 5

c5=c5+1;

case 6

c6=c6+1;

case 7

c7=c7+1;

case 8

c8=c8+1;

case 9

c9=c9+1;

end

newin=newin+1;

else

fitin=fitin+1;

end

end

end

3.2.3.4 交叉。本文采用單點(diǎn)交叉,在大數(shù)據(jù)采集的輿情關(guān)鍵詞樣本編碼中隨機(jī)設(shè)置一個(gè)交叉點(diǎn),然后在該點(diǎn)交換兩個(gè)輿情個(gè)體的部分編碼。單點(diǎn)交叉過程示意圖如圖4所示。

圖4 單點(diǎn)交叉過程示意圖

3.2.3.5 變異。遺傳算法采用概率的變遷規(guī)則來指導(dǎo)搜索方向,變異概率的大小影響著大數(shù)據(jù)采集樣本的多樣性與風(fēng)險(xiǎn)識(shí)別算法的優(yōu)化精度。變異運(yùn)算的主要內(nèi)容是按照式(2)的概率將編碼串中某些部分的基因值進(jìn)行替換,即對(duì)輿情主體的某個(gè)或某些個(gè)體屬性值進(jìn)行改變。優(yōu)化算法的終止條件是輿情個(gè)體適應(yīng)度達(dá)到給定閾值,或者輿情個(gè)體風(fēng)險(xiǎn)等級(jí)達(dá)到預(yù)設(shè)峰值。最后比較每個(gè)輿情個(gè)體的適應(yīng)度,適應(yīng)度較低的被視為高風(fēng)險(xiǎn)等級(jí)輿情個(gè)體篩選出來,并針對(duì)相應(yīng)的輿情事件指定應(yīng)對(duì)措施。

3.3 大數(shù)據(jù)時(shí)代下公安網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)識(shí)別系統(tǒng)可靠性分析

網(wǎng)絡(luò)輿情以網(wǎng)絡(luò)為載體,極大地改變了輿情的傳播方式、傳播速度、傳播內(nèi)容與參與時(shí)效。公安機(jī)關(guān)可以充分利用復(fù)雜網(wǎng)格輿情建模思想和大數(shù)據(jù)分析,發(fā)揮大數(shù)據(jù)分析的優(yōu)勢(shì),以提高網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)識(shí)別的能力和效率,更好地發(fā)揮網(wǎng)絡(luò)輿情的積極作用,促進(jìn)社會(huì)的公平正義和發(fā)展進(jìn)步。

然而,目前有關(guān)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)識(shí)別系統(tǒng)的研究仍然相對(duì)較少,尤其是對(duì)其可行性和可靠性的論證分析。其在大數(shù)據(jù)環(huán)境下與現(xiàn)實(shí)網(wǎng)絡(luò)輿情的交互性應(yīng)用中,離不開系統(tǒng)可靠性分析。應(yīng)當(dāng)充分利用真值表法(狀態(tài)枚舉法)、全概率公式法(分解法)、系統(tǒng)邏輯圖法等對(duì)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)識(shí)別系統(tǒng)進(jìn)行系統(tǒng)可靠性的分析評(píng)估。系統(tǒng)的可靠性預(yù)計(jì)是一個(gè)自下而上、從局部到整體、由小到大的系統(tǒng)綜合過程,目的在于發(fā)現(xiàn)薄弱環(huán)節(jié)、提出改進(jìn)措施、進(jìn)行方案比較,以提高網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)識(shí)別系統(tǒng)的可行性、可靠性與高效性。

4 結(jié)語

目前,眾多學(xué)者從多角度對(duì)網(wǎng)絡(luò)輿情進(jìn)行了深入研究,本文提出基于遺傳算法優(yōu)化的動(dòng)態(tài)網(wǎng)格輿情建模方法,可為公安機(jī)關(guān)應(yīng)對(duì)大數(shù)據(jù)時(shí)代的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)提供重要參考。

基于大數(shù)據(jù)分析,初步探索了網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)的復(fù)雜內(nèi)在機(jī)制和相關(guān)規(guī)律。結(jié)合大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)輿情多層次、多維度、多屬性特征以及驅(qū)動(dòng)關(guān)系,系統(tǒng)建立了輿情動(dòng)態(tài)網(wǎng)格結(jié)構(gòu)模型。

從網(wǎng)絡(luò)輿情發(fā)展演變的角度,綜述了大數(shù)據(jù)時(shí)代基于復(fù)雜結(jié)構(gòu)的動(dòng)態(tài)網(wǎng)格輿情建模研究。考慮復(fù)雜動(dòng)態(tài)網(wǎng)格輿情模型分類標(biāo)準(zhǔn)及對(duì)大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)多維結(jié)構(gòu)的表征能力,利用規(guī)則網(wǎng)格上的粒子相互作用模型,對(duì)網(wǎng)絡(luò)輿情進(jìn)行動(dòng)態(tài)建模?;诰W(wǎng)絡(luò)關(guān)鍵詞語義、觀點(diǎn)、情感的屬性分析,設(shè)計(jì)了包含大數(shù)據(jù)樣本采集、輿情風(fēng)險(xiǎn)適應(yīng)度函數(shù)、風(fēng)險(xiǎn)源識(shí)別選擇、交叉變異的遺傳優(yōu)化算法。

猜你喜歡
遺傳算法輿情網(wǎng)格
基于遺傳算法的高精度事故重建與損傷分析
基于遺傳算法的模糊控制在過熱汽溫控制系統(tǒng)優(yōu)化中的應(yīng)用
追逐
基于遺傳算法的智能交通燈控制研究
重疊網(wǎng)格裝配中的一種改進(jìn)ADT搜索方法
數(shù)字輿情
數(shù)字輿情
消費(fèi)輿情
基于改進(jìn)多島遺傳算法的動(dòng)力總成懸置系統(tǒng)優(yōu)化設(shè)計(jì)