劉姝 王思宇 王夢可
摘 要:隨著食品安全事件在網絡上的不斷曝光,食品安全已是網絡媒體關注的熱點問題。為了彌補傳統(tǒng)網絡輿情分析的不足,本文基于微博對復雜網絡環(huán)境下的食品安全輿情進行分析和研究,實現通過復雜網絡相關計算來識別微博上傳播食品安全相關輿情的意見領袖,并驗證意見領袖是否是輿情傳播的關鍵節(jié)點,實現對輿情傳播的跟蹤、管控。
關鍵詞:食品安全;復雜網絡;意見領袖識別;輿情傳播管控
Abstract:With the continuous exposure of food safety incidents on the Internet, food safety has become a hot issue for online media. In order to make up for the shortcomings of traditional online public opinion analysis, this article analyzes and researches food safety public opinion in a complex network environment based on Weibo, and realizes complex network-related calculations to identify opinion leaders who spread food safety-related public opinion on Weibo. This paper also verifies that opinion leader is the key node of public opinion, and realizes the tracking and control of public opinion communication.
Key words:Food safety; Complex networks; Identification of opinion leaders; Control of public opinion dissemination
中圖分類號:G206
1 有關食品安全復雜網絡輿情的概述
在信息和話語權充分開放的新媒體時代,食品安全網絡輿情應運而生,網絡已成為食品安全信息傳播的載體以及民眾對食品安全事件表達觀點和情感的主要平臺。由于食品安全網絡輿情的形成速度快、傳播迅速、影響范圍大,互聯(lián)網在為食品安全輿情提供平臺的同時也帶來了更多不可控的因素[1]。如果與食品安全相關的監(jiān)管和執(zhí)法部門不能及時發(fā)現當前的熱點輿情,并進行相應的監(jiān)控和及時的引導,當前的食品產業(yè)鏈很容易受到不良影響,并可能會危害社會經濟的穩(wěn)定及健康發(fā)展。雖然國內外一些學者對食品藥品安全網絡輿情方面已做一些研究,但很大一部分研究只是停留在網絡輿情的效應方面[2],對輿情傳播控制方面的研究相對較少[3]。
本文較以往研究,從網絡輿情的傳播控制入手,構建合理的輿情傳播控制模型,以此來分析輿情的發(fā)展特點和傳播規(guī)律。通過“極少量意見領袖控制絕大部分重要傳播”的社交傳播規(guī)律特性,將輿情關注從傳統(tǒng)的監(jiān)管“事件”轉為監(jiān)管“人”,用復雜網絡分析技術來計算和評價社交傳播節(jié)點的重要程度,以實現輿情的有效監(jiān)管。
2 重大輿情的定義及原始數據的獲取
2.1 原始數據的獲取及信息統(tǒng)計
基于500個重要的食品安全相關字段,查找距離數據抽取時間最近的前69 691條微博,這69 691條微博出現的時間跨度為2014年1月1日 10:01:02到2017年4月27日 21:14:05。其中有78 456個用戶參與了這期間微博的發(fā)布和轉發(fā)。平均每個用戶發(fā)布或轉發(fā)了1.313條微博,每條微博被1.478個用戶發(fā)布或轉發(fā)過。
針對每條微博,構建以用戶為節(jié)點的微博轉發(fā)樹。69 691條微博對應于69 691棵微博轉發(fā)樹,其中節(jié)點為微博用戶,如果用戶a從用戶b處轉發(fā)了目標微博,則兩者之間形成一條轉發(fā)連邊。圖1展示了用戶或微博的分布特性。圖1(a)為用戶的轉發(fā)量分布;圖(b)為每條微博被參與用戶的轉發(fā)次數分布;圖(c)為轉發(fā)樹中用戶節(jié)點的度分布;圖(d)為轉發(fā)數中的樹規(guī)模分布。圖(a)(b)與圖(c)(d)的區(qū)別在于,前者中每個用戶可能會多次轉發(fā)特定微博,因此用戶的轉發(fā)量,以及微博的被參與用戶數目會有重復計數。由圖1可知,這4種分布皆呈現常見的冪律分布形式,此處選擇具有Top-N轉發(fā)量的微博作為重大輿情。圖2展示特定微博轉發(fā)量的時間分布特性。從圖2來看各個微博在不同時間的轉發(fā)量分布比較均勻,且每個時期都有轉發(fā)量特別大的特定微博。
2.2 數據集劃分
為了預測在未來一段時間,哪些用戶會大概率轉發(fā)重大輿情,將69 691條微博根據時間信息劃分為訓練集和測試集。以2016年12月31日 22:50:25為分界點,在之前出現的微博及轉發(fā)行為作為訓練集,在之后出現的微博及轉發(fā)行為即為測試集,注意,由于微博在任何時間段都會不斷發(fā)生轉發(fā)行為,訓練集和測試集中的微博會出現重疊現象。本文的目標是基于訓練集識別重要的意見領袖,并利用這些意見領袖預測其在測試集時間區(qū)間內參與的重大輿情的比例。
訓練集數據覆蓋了33 638條微博,有37 472個用戶參與到這些微博的發(fā)布或轉發(fā)行為中。平均每個用戶參與1.418條微博,每條微博有1.581個用戶參與。測試集數據覆蓋了36 140個用戶,有43 065個用戶參與到這些微博的發(fā)布和轉發(fā)行為中。平均每個用戶參與了1.158條微博,每條微博有1.370個用戶參與。
2.3 模型構建及驗證
利用訓練集數據,通過不同的模型策略計算用戶的重要性值并對其進行排序,獲取前Top-r的用戶作為意見領袖,計算這部分用戶能夠覆蓋測試集中重大輿情的比例s。本實驗中選被轉發(fā)總量在前20%的微博為重大輿情。本文構建以下3個模型。
(1)Model1。用戶在訓練集中的粉絲量fa(選取訓練集中用戶最新時刻i的粉絲狀態(tài))用戶I 的重要性可根據公式(1)計算。
(2)Model2。用戶參與的所有微博的被轉發(fā)量f,被評論量c,被點贊量的總和a,用戶參與程度為α,則用戶I的重要性可根據公式(2)計算。
(3)Model3。Model1和Model2的混合可得出(3)。
圖3給出了Model1和Model2的實驗結果。隨著選取意見領袖比例r的變化,Model2明顯優(yōu)于Model1。作為對比,同時給出了一個基準對比,即選取訓練集中所有重大輿情的參與用戶(這些用戶占訓練集用戶9.97%)在測試集時間中所能覆蓋的重大輿情的比例(baseline線圖)。而如果用訓練集的所有用戶做預測,可以覆蓋測試集中重大輿情的72.3%。也就是說,在本數據集中,利用監(jiān)管用戶,監(jiān)測重大輿情的預測上限為72.3%。可以看到,利用歷史中參與重大輿情的所有用戶,預測的重大輿情的效果要低于Model1和Model2指標。圖4進一步給出了Model3的預測效果。預測最優(yōu)值略高于Model2。
的實驗結果。由圖4可知,最好的模型可以用10%的意見領袖覆蓋到測試集中64.3%的重大輿情。同時可知利用Model1,也就是利用用戶粉絲數獲取意見領袖要弱于利用Model2,即用戶參與微博被轉發(fā)量、點贊量和評論量。而之前的思路,即從參與重大輿情的用戶中進行細粒度篩選的策略失效,如圖3相關數據所示,利用所有參與重大輿情的用戶作為意見領袖來覆蓋重大輿情,覆蓋率要遠遠低于其他兩種模型,而這部分用戶占比為9.97%。根據對比分析,可以用10%的用戶(指參與的微博具有過被轉發(fā)行為的用戶總數的10%)覆蓋64.3%的重大輿情,即能力范圍之內所能覆蓋到的重大輿情的88.9%(64.3%/72.3%)。
以上表明,可以通過意見領袖來實現對輿情傳播的跟蹤、監(jiān)控。意見領袖作為輿情傳播的關鍵節(jié)點,往往是對某一事件發(fā)表態(tài)度的活躍者,其言論或信息是其他用戶評論和轉發(fā)的焦點,具有重大影響力。
3 結語
本文通過對食品安全網絡輿情的形成、特點進行研究,從中查找出了食品安全輿情的關鍵控制點,分析了復雜網絡輿情的傳播路徑和方式,有助于實現對食品安全網絡輿情事件的實時監(jiān)測和實時分析,對改善食品安全監(jiān)督、彌補食品安全監(jiān)管具有推動作用。
參考文獻:
[1]董凱欣,傅熒,孫曉峰,等.基于社會網絡分析的企業(yè)網絡輿情預警機制研究——以食品安全網絡輿情為例[J].電子商務,2015(8):54-55,57.
[2]吳林海,呂煜昕,吳治海.基于網絡輿情視角的我國轉基因食品安全問題分析[J].情報雜志,2015,34(4):85-90.
[3]陳靜靜,劉升.基于大數據挖掘的食品安全管理研究[J].中國物價,2020(7):86-88.