申 晨,程冬玲,張 倩
(1.河北金融學(xué)院 金融科技學(xué)院,河北 保定 071000;2.河北金融學(xué)院 信息工程與計算機學(xué)院,河北 保定 071000;3.河北軟件職業(yè)技術(shù)學(xué)院 互聯(lián)網(wǎng)商務(wù)系,河北 保定 071000)
截至2020年3月,我國網(wǎng)民數(shù)量已達9.04億,網(wǎng)絡(luò)成為公眾抒發(fā)情感、表達立場的重要渠道,也逐漸成為輿情產(chǎn)生、發(fā)展和演化的重要場所。網(wǎng)絡(luò)中的信息傳播具有實時、便捷和互動性強的特點。面對傳染性疾病、食品安全等重大突發(fā)公共事件,網(wǎng)民的情緒和觀點會在網(wǎng)絡(luò)中迅速傳播和感染他人,并可能導(dǎo)致輿情的迅速爆發(fā)。如果不能對輿情進行準(zhǔn)確的研判和及時有效地引導(dǎo),可能會產(chǎn)生輿情危機并導(dǎo)致嚴(yán)重的社會問題。
通過網(wǎng)絡(luò)爬蟲和分詞等技術(shù)對網(wǎng)民的觀點進行信息提取,并通過情緒感知技術(shù)進行輿情感知,最后對網(wǎng)絡(luò)輿情的演化趨勢進行建模和預(yù)測,可以及時有效地掌握網(wǎng)絡(luò)輿情的現(xiàn)狀和發(fā)展態(tài)勢。這對于把握輿情的特點和演變規(guī)律,并進一步進行有效的引導(dǎo)具有重要意義。
綜合搜索引擎、新聞媒體和社交網(wǎng)絡(luò)3類數(shù)據(jù)作為信息來源,以文本信息為主要數(shù)據(jù)源。一定時間范圍內(nèi),某些關(guān)鍵詞的搜索次數(shù)表明了網(wǎng)民對某一熱點人物或事件的關(guān)注程度。采用百度搜索引擎內(nèi)置的“百度指數(shù)”可以方便地統(tǒng)計網(wǎng)民的搜索情況;新聞媒體的一些文章和觀點體現(xiàn)了社會主流輿論;以微博為代表的社交媒體則代表了網(wǎng)民的情緒和觀點表達。當(dāng)研究某一領(lǐng)域的特定問題時,還可以加入與此領(lǐng)域高度相關(guān)的專業(yè)媒體和社交平臺數(shù)據(jù)。如對于突發(fā)公共衛(wèi)生事件,可以加入丁香園論壇等專業(yè)醫(yī)療平臺作為社交網(wǎng)絡(luò)數(shù)據(jù)。對于新聞媒體和社交網(wǎng)絡(luò),可以使用Python語言結(jié)合Beautiful Soup庫進行信息的爬取,并通過Jieba庫進行分詞;然后利用得到的分詞,根據(jù)情緒極性詞典,對其中的情緒極性詞進行提取和計算,進而獲得對應(yīng)來源的情緒極性和程度的分布情況[1]。最后,通過主成分分析法等手段,綜合一定時間范圍內(nèi)上述3種來源的信息,即可得到該時間范圍內(nèi)某一特定主題的網(wǎng)民情緒極性和程度的分布情況。
構(gòu)建輿情演化模型對于研究輿情的發(fā)展變化趨勢并進一步對輿情進行正向引導(dǎo)具有重要意義。朱毅華等[2]根據(jù)輿情傳播的一般過程,將網(wǎng)絡(luò)輿情的演化過程劃分為3個階段,即爆發(fā)期、持續(xù)關(guān)注期和消退期。在此,引入元胞自動機(Cellular Automata,CA)以更準(zhǔn)確地對輿情演化過程進行建模。
首先,初始化元胞空間。利用元胞代表網(wǎng)絡(luò)空間中的個體。通常的做法是,假定元胞極性(cell-polarity)服從二項分布,元胞情感強度(cell-strength)服從均勻分布,這種假定可能與實際情況并不完全吻合。因此,本研究使用上一節(jié)得到的輿情感知數(shù)據(jù)替代原有假設(shè),使元胞的極性和情感強度的分布與所得真實數(shù)據(jù)一致。元胞個數(shù)、元胞知識素養(yǎng)(cell-knowledge)和權(quán)威值參數(shù)等參考實際數(shù)據(jù)設(shè)定。元胞免疫力、傳播可能性服從0到1的均勻分布。設(shè)定元胞初始接觸次數(shù)為0、傳播范圍為4、初始傳播次數(shù)為0。
然后,進入元胞演化傳播階段。此時,在T0時刻隨機選擇某一元胞N0作為輿情發(fā)出個體,將其情感強度設(shè)置為1,極性設(shè)置為-1,接觸次數(shù)設(shè)置為1。自T1時刻起,挑選接觸次數(shù)大于0的元胞向其范圍內(nèi)的其他元胞施加影響直到系統(tǒng)到達穩(wěn)定狀態(tài)。
以2020年長江中下游汛情這一公共事件為例,指定7月1日0至24時作為時間范圍,選取百度搜索引擎、新浪新聞和微博作為數(shù)據(jù)來源,使用上述流程對網(wǎng)絡(luò)輿情進行信息提取和輿情感知,得到網(wǎng)民情緒的極性和程度分布情況。然后使用元胞自動機模型進行建模,得到輿情規(guī)模與時間變化關(guān)系如圖1所示。從圖中可以看出。與一般熱點事件相比,突發(fā)公共事件具有傳播迅速、規(guī)模廣、持續(xù)期長的特點。且從中可以明顯分辨出爆發(fā)期、持續(xù)關(guān)注期和消退期的演化趨勢。這與輿情演化的一般理論相符合。
圖1 輿情規(guī)模與時間變化
上述方法利用網(wǎng)絡(luò)爬蟲、分詞和情緒感知等技術(shù),并結(jié)合元胞自動機模型對網(wǎng)絡(luò)輿情的演化進行建模,可以有效地掌握網(wǎng)絡(luò)輿情的現(xiàn)狀并預(yù)測其發(fā)展態(tài)勢,這對于有效地引導(dǎo)突發(fā)公共事件導(dǎo)致的網(wǎng)絡(luò)輿情,并做好輿情預(yù)警[3],具有重要意義。
以上方法仍然存在一些不足,一是對于元胞自動機的一些初始參數(shù)設(shè)置,可以根據(jù)突發(fā)公共事件背景下網(wǎng)絡(luò)輿情的特點進行進一步有效調(diào)整;二是上述方法在初始化元胞空間時,默認(rèn)網(wǎng)絡(luò)輿情的傳播處于初始階段。對于實踐中,已經(jīng)處于爆發(fā)期或其他階段的網(wǎng)絡(luò)輿情可能并不適用,這也是今后改進的方向。
突發(fā)公共事件背景下的網(wǎng)絡(luò)輿情受眾廣泛、傳播迅速、持續(xù)期長,一些擔(dān)憂和恐慌等負(fù)面情緒極易迅速放大。因此,相關(guān)部門一定要充分利用好網(wǎng)絡(luò)空間傳播迅速的優(yōu)勢,及時公開真實信息,充分滿足公眾知情權(quán),傳播正能量,做好輿情引導(dǎo)工作,力爭在輿情爆發(fā)期完成輿情引導(dǎo)工作,把握主動權(quán)。