王曉卉 孫玉林
山東商務(wù)職業(yè)學院
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,進一步暢通了信息的傳播渠道,消融了信息之間交流的物理隔閡,各種新的互聯(lián)網(wǎng)應用工具層出不窮的出現(xiàn),豐富了信息的傳播路徑和手段,提升了信息有效傳播效率,網(wǎng)絡(luò)空間已經(jīng)成為不同年齡階段、不同學歷層次、不同專業(yè)背景、不同社會階層的網(wǎng)民思想交流、交匯和碰撞的新平臺。
面對紛繁的信息獲取路徑,在為大眾豐富自己獲取信息渠道的同時,也極易構(gòu)成次生網(wǎng)絡(luò)輿情風險。由于互聯(lián)網(wǎng)開放性、去中心化和匿名性的特點,各種信息真假混雜,各種勢力暗流涌動,突發(fā)社會事件極易被炒作和利用,從而在各級政府處理突發(fā)社會事件之機制造混亂和障礙,不利于突發(fā)社會事件的有效解決和社會秩序恢復。例如2020年伊始的新型冠狀肺炎疫情所引發(fā)的網(wǎng)絡(luò)輿情中,早期就出現(xiàn)了諸多歪曲事實、制造恐慌和混亂、干擾疫情防控的現(xiàn)象。各種各樣的信息混雜,各種似是而非的文章在互聯(lián)網(wǎng)上廣泛傳播,引發(fā)一波又一波的公眾輿論,嚴重擾亂疫情防控,對各級政府的領(lǐng)導能力和治理能力提出了嚴峻的挑戰(zhàn)。
突發(fā)社會事件發(fā)生后,受到生命財產(chǎn)損失的公眾常常處于恐慌、焦慮、亟待幫扶和救助等復雜心理情緒中,對輿情的發(fā)展格外敏感和焦慮,極易影響這些公眾的社會情感安全,進而進一步激發(fā)輿情的爆點和不可控。因此各級政府必須要高度重視突發(fā)社會事件的輿情監(jiān)測、輿情處置和輿情應對,盡快提升政府輿情管控及處理水平。
新一代信息技術(shù),特別是大數(shù)據(jù)技術(shù)的有效應用,不但對傳統(tǒng)行業(yè)和產(chǎn)業(yè)能夠有效賦能、提質(zhì)增效,對網(wǎng)絡(luò)輿情治理方面,更能發(fā)揮其獨特的數(shù)據(jù)挖掘、精準分析、研判輔助等方面的作用。
基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情治理,就是充分運用大數(shù)據(jù)技術(shù),在充分進行往期網(wǎng)絡(luò)輿情基礎(chǔ)海量數(shù)據(jù)的分析和處理的基礎(chǔ)上,精準的進行輿情監(jiān)測和輿情處置,提升輿情應對效果,有效推動各級政府在進行突發(fā)社會公共事件處置時的科學化,提升其應急管理能力,防范和化解各領(lǐng)域重大風險,促進國家治理體系和治理能力現(xiàn)代化。
圖1 基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情治理模型
隨著計算機技術(shù)的不斷發(fā)展,對海量的數(shù)據(jù)進行采集、清洗、挖掘和分析的技術(shù)日趨成熟,計算的實時性顯著提升,為各級政府應用大數(shù)據(jù)技術(shù)分析網(wǎng)絡(luò)輿情、提高網(wǎng)絡(luò)輿情的治理能力提供了技術(shù)支撐。通過對互聯(lián)網(wǎng)上海量的往期輿情信息進行挖掘和處理,可以為突發(fā)的社會事件輿情發(fā)展走向進行預測,為網(wǎng)絡(luò)輿情用戶群體進行畫像和預警,為輿情治理提供決策支撐。
1.收集輿情支撐數(shù)據(jù)
運用大數(shù)據(jù)技術(shù)進行輿情治理的基礎(chǔ)是獲取海量的往期輿情數(shù)據(jù)。目前最常用的方式是對主流的輿情監(jiān)測平臺,如新浪微博、抖音平臺等各類社交平臺和媒體平臺進行數(shù)據(jù)的爬取,建立往期輿情大數(shù)據(jù)資源庫。在遴選數(shù)據(jù)源時,需要建立數(shù)據(jù)源排名動態(tài)調(diào)整機制,根據(jù)目標平臺的用戶數(shù)量、熱度、影響力、擴散力等指標,設(shè)定平臺權(quán)重。平臺權(quán)重將直接關(guān)聯(lián)數(shù)據(jù)源的爬取頻率、爬取粒度、爬取類型,對后續(xù)的數(shù)據(jù)爬取規(guī)模起到重要影響。
2.對爬取的數(shù)據(jù)進行清洗和特征提取
由于爬取的平臺不同,其獲取的數(shù)據(jù)格式也不盡相同,需要逐一為各平臺的數(shù)據(jù)設(shè)定不同的數(shù)據(jù)清洗規(guī)則,進行數(shù)據(jù)清洗,并進行結(jié)構(gòu)化的存儲。獲取大數(shù)據(jù)的同時,海量的噪音數(shù)據(jù)也摻雜其中,對獲得精準的分析結(jié)果產(chǎn)生了嚴重的干擾,為了能有效利用大數(shù)據(jù)技術(shù)做好數(shù)據(jù)挖掘、數(shù)據(jù)清洗和數(shù)據(jù)分析,進而實時、科學、準確的提供決策支持,需要對清洗后的結(jié)構(gòu)化數(shù)據(jù)精準的進行特征提取,使處理后的數(shù)據(jù)在語義上能夠表征完整,在維度上能夠豐富全面,在結(jié)構(gòu)上能夠穩(wěn)定內(nèi)聚。在確定輿情數(shù)據(jù)的特征時,可以從以事件特征和以用戶特征為主導的兩個方面多維度進行設(shè)定時間特征、空間特征和內(nèi)容特征的關(guān)系。即不同的突發(fā)事件的主流觀點和不同社會群體對同一突發(fā)事件的不同觀點兩個方面進行設(shè)定。在進行用戶特征設(shè)定時,應盡量詳盡的設(shè)定如用戶性別、用戶年齡、用戶學歷層次、當前職業(yè)等信息。并根據(jù)網(wǎng)絡(luò)輿情所處的不同階段,打上時間標簽,全貌展示網(wǎng)絡(luò)輿情從產(chǎn)生到消退的發(fā)展路徑和生命周期。
3.輿情數(shù)據(jù)標簽化分類
對輿情數(shù)據(jù)的標簽化分類將對后期的突發(fā)社會事件輿情處置和決策支撐提供重要依據(jù),在標簽化分類時應遵循分類準確、標準一致、粒度一致的原則。為提高標簽的精確性,可以采用基于機器學習的核極限學習機相關(guān)技術(shù),對輿情數(shù)據(jù)自動進行標簽化分類。
隨著爬取自互聯(lián)網(wǎng)的基礎(chǔ)數(shù)據(jù)不斷積累,經(jīng)過數(shù)據(jù)清洗和特征提取后,其數(shù)據(jù)價值將被充分挖掘,并應用于輿情的預測與風險防范,借助大數(shù)據(jù)可視化工具,可以更直觀的體現(xiàn)數(shù)據(jù)背后的關(guān)聯(lián),更好的提供決策支持。例如百度地圖、高德地圖、淘寶、美團、蘇寧易購、攜程等地圖平臺或電商平臺的大數(shù)據(jù)可視化分析,可以展示出反映當前社會經(jīng)濟情況與大眾流動軌跡、消費偏好、購買能力等;而微信、QQ、微博等交互平臺,可以展示當前社會熱點問題、大眾價值取向等。通過對典型領(lǐng)域互聯(lián)網(wǎng)平臺產(chǎn)生的大數(shù)據(jù)進行數(shù)據(jù)挖掘,可以為輿情預測與風險防范提供數(shù)據(jù)支撐。
輿情數(shù)據(jù)處理、輿情預測的最終目的是為了輿論引導與干預,有效把握輿情引導的主動權(quán),防范負面輿情的影響,提高輿情治理能力。在進行輿情引導時,利用大數(shù)據(jù)技術(shù)挖掘往期相似的突發(fā)社會事件輿情處理支撐數(shù)據(jù),分析往期突發(fā)公共事件網(wǎng)絡(luò)輿情主體、輿情特征和輿情走勢,繪制出敏感群體用戶畫像、敏感媒體重點監(jiān)控平臺,分析用戶的特征與偏好,進而有針對性地引導。在進行網(wǎng)絡(luò)輿情干預時,需要根據(jù)網(wǎng)絡(luò)輿情生命周期演化的特點,盡可能早的對輿情進行干預,正面引導輿情發(fā)展走向,避免輿情失控和反復。信息不對稱是造成輿情二次爆發(fā)的重要因素,從網(wǎng)絡(luò)輿情發(fā)展的生命周期來看,輿情產(chǎn)生初期,由于社會突發(fā)事件的偶發(fā)性、單一性,其造成網(wǎng)絡(luò)輿情的附加信息量是較少的,社會公眾關(guān)注的重點是社會突發(fā)事件本身,如果能在輿情發(fā)生的初期,就能夠?qū)⑸鐣话l(fā)事件的相關(guān)信息予以公開,能大幅減少輿情的二次爆發(fā)的可能,從而在第一時間干預輿情的發(fā)展走勢,阻止或者減少負面輿情的傳播和影響,使網(wǎng)絡(luò)輿情直接進入到消退期。
突發(fā)社會事件引發(fā)的網(wǎng)絡(luò)輿情的治理工作極大地考驗各級政府部門的治理能力,是新時代各級政府必須應對,且必須有效應對的新課題,網(wǎng)絡(luò)輿情安全不僅是民生安全要求,也是社會安全要求,更是政治安全要求。突發(fā)社會事件和網(wǎng)絡(luò)輿情相互影響、相互作用,網(wǎng)絡(luò)輿情治理得當必將極大促進突發(fā)社會事件的治理效率。充分運用大數(shù)據(jù)技術(shù)在處理突發(fā)社會事件中的作用,是各級政府治理能力提升的重要體現(xiàn),也是社會不斷發(fā)展的必然要求。