安 寧,安 璐,2
(1.武漢大學信息管理學院,武漢 430072;2.武漢大學信息資源研究中心,武漢 430072)
群體智慧(collective intelligence),是指群體所具有的優(yōu)于個體或個體總和的智慧與能力,是群體本身所固有的資產[1-2]。現(xiàn)代科學對復雜性的研究表明,動物常常會利用群體智慧進行集體狩獵、相互掩護和躲避捕食者等活動[3]。在人類社會中,最優(yōu)決策事實上通常也是基于群體智慧形成的[4]。社交媒體的發(fā)展不僅豐富了信息交流的模式,也為群體的互動和知識的構建開辟了新的途徑[5],尤其是在危機情境下,社交媒體成為公眾表達觀點與情感的重要渠道,同時促進了網絡輿情環(huán)境的形成。從某種程度上來說,網絡輿情是群體智慧涌現(xiàn)的一種表現(xiàn)形式,承載了公眾對突發(fā)事件的認知與理解,甚至具有對事件演化的前瞻性,在突發(fā)事件的應急響應工作中具有重要意義[5]。因此,本研究將突發(fā)公共衛(wèi)生事件輿情環(huán)境下的群體智慧涌現(xiàn)概述為公眾在圍繞突發(fā)公共衛(wèi)生事件進行觀點的傳遞、碰撞與發(fā)酵的過程中,通過自組織活動而呈現(xiàn)出優(yōu)于個體的智慧與能力的復雜現(xiàn)象。
社交媒體中的信息往往具有標題化、碎片化、語言簡潔等特點,那么在這看似雜亂無章的輿情信息環(huán)境下如何表征群體智慧?群體智慧的涌現(xiàn)是否存在某種規(guī)律?圍繞這些問題,本研究提出一種從突發(fā)公共衛(wèi)生事件的輿情信息中提取群體智慧的方法,即從輿情信息中提取知識三元組集合來表征公眾的知識,探究微博、評論中三元組數(shù)量的分布情況以及知識密度的動態(tài)變化,實現(xiàn)對突發(fā)公共衛(wèi)生事件輿情環(huán)境中群體智慧的結構化表示及量化分析。同時,本研究引入復雜網絡的思想構建輿情知識網絡,通過網絡結構關系的時序變化反映和揭示突發(fā)公共衛(wèi)生事件輿情環(huán)境下公眾知識涌現(xiàn)的規(guī)律與模式,以期為管理部門在對突發(fā)公共衛(wèi)生事件網絡輿情進行引導與決策時提供參考。
近年來,世界各地的自然災害、事故災害等多種危機事件逐漸呈現(xiàn)出日益高發(fā)、規(guī)模擴大、危害程度加深等態(tài)勢[6]。不同于其他情境,突發(fā)公共衛(wèi)生事件等危機情境將嚴重威脅人類生活與社會秩序,通常還伴隨不確定性、破壞性、聚焦性等特征[7]。在此情境下,社交媒體毋庸置疑成為公眾信息交流、情感表達和維持社會化關系的重要渠道[8]。突發(fā)事件暴發(fā)后,用戶在社交媒體平臺上通過生成、評論和轉發(fā)等多種形式,傳遞著與事件、新聞、思想以及情感等相關的近乎瞬時信息,形成與突發(fā)事件相關的網絡輿情。然而,社交媒體雖然為信息交流帶來了便捷,但也存在著不可忽視的“回音室”現(xiàn)象。社交媒體的“回音室”具有封閉且高度同質化的特征,即公眾在“回音室效應”下常常會固守在符合自己偏好的信息圈子里,過濾與自己意見相左的觀點或情感,而相近的意見與觀點將被反復傳播,極易造成輿情群體極化現(xiàn)象[9]。
網絡輿情的演變關乎著社會的穩(wěn)定和發(fā)展,而危機事件通常易造成公眾情緒波動,產生悲傷、憤怒以及恐慌等負面情緒,進而危害社會秩序穩(wěn)定[10]。因此,國內外學者逐漸開始關注突發(fā)事件網絡輿情信息的相關研究,主要聚焦于網絡輿情的主題和情感的分析與挖掘[11]。在輿情主題方面,現(xiàn)有研究多基于LDA(latent Dirichlet allocation)主題模型[12]進行主題識別,探索突發(fā)公共衛(wèi)生事件輿情主題的演變模式和時間特征[13]。在輿情情感方面,學者們通?;谇楦性~典和機器學習等相關方法進行研究。前者需要利用已標注好的情感詞典,如大連理工大學情感詞典、How Net情感詞典等分析用戶的情感強度與情感傾向[14];后者則需要大量人工標注的語料作為訓練集,提取文本特征,構建分類器以實現(xiàn)情感分類[15]。
群體智慧是在個體交流、協(xié)作、競爭、頭腦風暴等過程中產生的,常出現(xiàn)在如公共決策、投票活動、社交網絡和眾包等領域中[16]。在早期,“群體智慧”概念曾遭到大多數(shù)學者的抨擊,例如,MacKay[17]直接表示群體所產生的智慧遠不如單獨個體所擁有的智慧,甚至認為群體的匯聚是愚蠢的。直至1907年,Galton[18]在《自然》(Nature)雜志上發(fā)表了一篇文章,證明了群體在某些情況下可以超越專家的智慧,這標志著群體智慧得到了科學家們的廣泛認可。群體智慧是群體內自下而上和自上而下過程相互作用所產生的新特征[19],與群體內交流的公平性和群體的社會感知之間有密切關聯(lián)[2]。Web 2.0打破了傳統(tǒng)門戶網站單向傳輸?shù)哪J?,充分發(fā)掘了個體的智慧和力量,極大地提升了互聯(lián)網的整體創(chuàng)造力[20],例如,Yuan等[21]從Web 2.0視角構建了互聯(lián)網上群體智慧新框架,分析了群體智慧在互聯(lián)網上的演化機制,指出互聯(lián)網中的群體智慧是一種由集體行為所產生的涌現(xiàn)現(xiàn)象。易明等[22]認為,協(xié)同標注信息行為是一個基于群體智慧涌現(xiàn)的分類知識產生過程,這種群體智慧的涌現(xiàn)是一個從量變到質變的過程。
重大突發(fā)事件的應急管理是國家治理體系現(xiàn)代化的重要組成部分,如何聚力情報智慧、科學應對重大突發(fā)事件,儼然成為總體國家安全觀下亟待研究的關鍵問題[23]。突發(fā)事件中的輿情信息不僅是重要情報資源,更是群體智慧在危機情景下的一種具體表現(xiàn),反映了群體對事件態(tài)勢的認知與研判,是感知、理解和預測民眾關于突發(fā)事件的群體決策與應對行為的重要渠道。因此,挖掘與分析社交媒體上的輿情信息,有助于探究群體智慧的形成與演化機理,對突發(fā)公共衛(wèi)生事件的應急管理具有重要意義[5]。社交媒體不僅是公眾信息交流的重要渠道,也是了解公眾態(tài)度與行為的重要數(shù)據(jù)來源[24]。在應急管理工作實踐中,已有研究將在線社交媒體信息用于開發(fā)基于GIS(geographic information system)的實時地圖[25]、龍卷風預警系統(tǒng)[26]和網絡故障檢測系統(tǒng)[27]等,充分發(fā)揮了信息資源的選擇與決策功能[28]。輿情信息作為群體智慧的一種具體表現(xiàn)形式,能夠指導相關部門和機構科學應對各類突發(fā)事件,降低不確定性,減小風險與損失,容災減災,提升群體的凝聚力[29-30]。
綜上所述,群體智慧得到了國內外學者的廣泛認可?,F(xiàn)有研究成果主要是探究Web 2.0模式下群體智慧框架、用戶協(xié)同標注行為等,鮮有研究挖掘突發(fā)事件輿情環(huán)境下的群體智慧涌現(xiàn)的規(guī)律與模式。因此,本研究基于特定突發(fā)公共衛(wèi)生事件下的網絡輿情信息,利用依存句法分析提取輿情信息中的知識三元組,以結構化表示突發(fā)公共衛(wèi)生事件輿情環(huán)境下公眾的知識條目,基于輿情知識網絡的拓撲結構,揭示突發(fā)公共衛(wèi)生事件網絡輿情環(huán)境中群體智慧涌現(xiàn)的規(guī)律與模式。
突發(fā)事件的出現(xiàn)通常會促進公眾之間的信息共享、討論和交流,形成特定的輿情環(huán)境。在此環(huán)境下,公眾在圍繞突發(fā)事件進行觀點的傳遞、碰撞與發(fā)酵的過程中,通過自組織活動將呈現(xiàn)出優(yōu)于個體的群體智慧。三元組作為知識圖譜常用的知識表示方法,可以描述真實世界中存在的各種實體或概念及其復雜聯(lián)系。因此,本研究利用三元組表示突發(fā)事件輿情信息中所包含的公眾的知識條目,即以所提取的知識三元組集合來表征突發(fā)公共衛(wèi)生事件輿情環(huán)境下公眾的群體智慧,進而展開研究。首先,本研究將所獲得的微博、評論等文本內容切割成句,形成語料庫;其次,利用自然語言處理工具HanLP(Han language processing)對語料庫進行分詞、詞性標注、命名實體識別和依存句法分析;最后,基于李明耀等[31]提出的基于依存分析的開放式中文實體關系抽取方法REDP(relation extraction with dependency parsing),從語料庫中抽取實體關系,從而得到<head,relation,tail>形式的知識三元組。
根據(jù)REDP方法,中文實體關系可以表述為“狀語*動詞+補語?賓語?”。其中,“*”表示出現(xiàn)0次或任意多次;“+”表示出現(xiàn)1次或任意多次;“?”表示出現(xiàn)0次或1次。其依存句法關系結構如圖1所示。
圖1 依存句法關系結構
實驗結果[31]表明,REDP方法在中文實體關系抽取方面性能良好,其F值比基于卷積樹核的無監(jiān)督層次聚類方法提高了16.68%,在準確率和召回率上都有較大幅度的提高,能夠保證本研究的準確性。
最后,對初步抽取到的知識三元組進行清洗。首先,剔除有缺失的無效三元組,因為這些有缺失的三元組無法完整、準確地表達出一條知識內容;其次,根據(jù)“哈工大停用詞表”,剔除head或tail中含有停用詞的三元組,進一步保證所獲三元組更具知識含義;最后,得到突發(fā)公共衛(wèi)生事件輿情環(huán)境中公眾的知識三元組集合。
基于突發(fā)公共衛(wèi)生事件輿情信息提取的知識三元組集合,蘊含了公眾在突發(fā)公共衛(wèi)生事件情景下所產生的群體智慧。隨著網絡思維引入圖書情報學領域,基于復雜網絡的思想對知識和知識關聯(lián)關系進行研究已經得到了學術界的普遍認可。因此,本研究將三元組的head與tail實體作為知識單元,將relation看作兩個知識單元之間的關聯(lián)關系,以知識單元為節(jié)點,以關聯(lián)關系為邊,構建輿情知識網絡。在構建輿情知識網絡的過程中發(fā)現(xiàn),輿情知識網絡中存在自環(huán),即一條邊的兩個節(jié)點為同一知識單元。鑒于該拓撲結構無法揭示知識單元之間的關聯(lián)信息,因此去除輿情知識網絡中的自環(huán),形成輿情知識網絡的簡單圖。
網絡科學領域的著名學者Newman[32]曾指出,許多實際的大規(guī)模復雜網絡都是非連通的,往往會存在一個包含整個網絡中相當比例節(jié)點的最大分支(又稱巨分支),如圖2所示。其中,虛線圓圈中的節(jié)點和邊構成該網絡的巨分支。對于大規(guī)模網絡而言,網絡的連通性較為脆弱,單個節(jié)點或者相當少部分的節(jié)點的行為都可能破壞該性質,因此,往往基于巨分支探究網絡的拓撲結構[33]。鑒于在突發(fā)公共衛(wèi)生事件的發(fā)展過程中,大眾群體所表達出的知識內容較為分散、無序,同時,知識單元及其關聯(lián)關系也會發(fā)生興衰更迭的變化,這些因素促使輿情知識網絡包含不連通的小分支群落。因此,本研究基于網絡的連通性,提取輿情知識網絡中規(guī)模最大且連通的分支,即保留其中的節(jié)點、邊等拓撲結構要素,形成輿情知識網絡的巨分支。本研究以巨分支內包含的知識單元及知識關系表示公眾知識的主流方向,進而探索突發(fā)公共衛(wèi)生事件輿情環(huán)境中群體知識的演變模式與規(guī)律。
圖2 網絡結構中的巨分支
知識網絡是一種具有層次結構的復雜網絡[34],本研究基于k-核理論對輿情知識網絡的巨分支結構進行分解,探索輿情知識網絡巨分支的“核心-邊緣”結構,以洞悉突發(fā)公共衛(wèi)生事件輿情環(huán)境中群體所涌現(xiàn)出的知識結構。k-核是網絡節(jié)點的一個最大子集,在該子集中的每個節(jié)點至少與子集中其他k個節(jié)點直接相連,是探索網絡層次結構的代表性方法。從本質上來看,k-核的分解過程是根據(jù)節(jié)點的度值來劃分網絡層次結構,從外層向內層延伸式擴展進行的。圖3所示為一個簡單網絡的k-核分解示意圖。
圖3 網絡的k-核分解
在對輿情知識網絡巨分支進行k-核分解時,首先,去除網絡中度值小于1的節(jié)點,由剩下的節(jié)點和邊構成網絡1-核。需要說明的是,本研究以輿情知識網絡的巨分支為研究對象,而巨分支是網絡的最大連通子圖,因此,1-核網絡即輿情知識網絡的巨分支。其次,去除巨分支中度值小于2的節(jié)點,剩下的節(jié)點和邊構成巨分支的2-核網絡結構。再次,去除度值小于3的節(jié)點,剩下的構成3-核網絡。以此類推,重復這種去除操作,最后實現(xiàn)對巨分支的k-核分解,即去除輿情知識網絡連通的巨分支中度值小于k的所有節(jié)點及其連邊,直至網絡中剩下的節(jié)點的度值都不小于k。對輿情知識網絡巨分支進行k-核分解,能有效地識別出知識的核心區(qū)域,即最大k-核節(jié)點位于巨分支的最內層,是輿情知識網絡巨分支中核心、稠密的區(qū)域。
突發(fā)公共衛(wèi)生事件爆發(fā)后,微博平臺中的用戶會在相關話題下發(fā)表微博帖子,每篇微博又會被不同用戶進行評論,形成“話題-微博-評論”的結構,如圖4所示。在新冠疫情的社會背景下,本研究以新浪微博為基礎數(shù)據(jù)源,于2020年7月1日以“群體免疫”為檢索詞,獲取新浪微博平臺上“#群體免疫#”“#世衛(wèi)組織質疑英國群體免疫方法#”“#李蘭娟談群體免疫#”等相關的145個話題,以及各話題所包含的9992條微博和75905條評論數(shù)據(jù)。經過清洗、去重等預處理后,最終得到共計8798條微博、62729條評論信息,時間跨度為2020年3月13日至2020年6月30日。
圖4 話題-微博-評論結構
發(fā)表微博和評論是公眾參與突發(fā)公共衛(wèi)生事件輿情討論的主要形式,探究微博與評論之間的關系,有助于掌握公眾在突發(fā)公共衛(wèi)生事件輿情環(huán)境下的行為模式,為探索群體智慧涌現(xiàn)的規(guī)律與模式提供依據(jù)。因此,令g={p1,p2,…,pn}表示評論的概率分布,其中,p n為一條微博評論數(shù)量為n的概率,對突發(fā)公共衛(wèi)生事件情景下的微博評論數(shù)量的概率分布進行統(tǒng)計,在對數(shù)坐標系下的相關結果如圖5所示。
在圖5中,橫坐標表示一條微博的評論次數(shù);縱坐標表示概率,是一條微博能夠產生對應數(shù)量的評論的概率??梢园l(fā)現(xiàn),微博不被評論(即具有0條評論)的概率為71.15%,具有1條評論的概率為8.14%,而微博中所含評論數(shù)量不多于7條的概率已高達90.61%,評論的期望值約為7.13??梢猿醪降贸鼋Y論,在突發(fā)公共衛(wèi)生事件輿情環(huán)境中,公眾發(fā)表的微博評論概率分布在總體上趨近于冪律分布,具有無標度特性,即大多數(shù)的微博會被少量用戶評論,僅有少量微博會擁有大量評論。
圖5 一條微博下評論數(shù)量的概率分布
根據(jù)第3.1節(jié)的方法將微博、評論的文本內容切割成句,其中從微博文本中共切割出87343句,從評論內容中切割出144216句。基于所切割出的句子提取知識三元組,共47426個,部分節(jié)選如表1所示。本研究以三元組的形式將突發(fā)公共衛(wèi)生事件輿情環(huán)境下的群體智慧結構化,即一個輿情知識三元組表示了突發(fā)事件輿情信息中公眾的知識條目。為判斷突發(fā)事件的演變,以及輿情熱度和群體智慧涌現(xiàn)的關系與特征,本研究分析了時間-微博評論數(shù)-知識三元組之間的數(shù)量關系,如圖6所示。
圖6 時間-微博評論數(shù)-知識三元組之間的數(shù)量關系
表1 突發(fā)公共衛(wèi)生事件輿情環(huán)境下的三元組(節(jié)選)
群體智慧涌現(xiàn)與突發(fā)公共衛(wèi)生事件和網絡輿情的演變過程存在顯著關聯(lián)。通過分析時間、微博評論與知識三元組之間的數(shù)量關系,能夠對群體智慧涌現(xiàn)、突發(fā)公共衛(wèi)生事件和網絡輿情三者之間的關系以及群體智慧涌現(xiàn)的模式特征作出直觀的判斷。由于微博評論與知識三元組在量綱和取值范圍方面存在差異,因此,需要根據(jù)公式對數(shù)據(jù)進行Z-score標準化處理。其中,μ是平均值;σ為標準差;x是觀測值。
在圖6中,x軸表示時間,其刻度為“日”;y軸表示微博評論數(shù)量的Z-score標準化;z軸表示知識三元組數(shù)量的Z-score標準化。圖6中的數(shù)據(jù)散點分別表示每日新增與每日累計兩種。觀察每日新增的變化趨勢可以發(fā)現(xiàn),微博數(shù)量和知識三元組數(shù)量在初期呈現(xiàn)爆發(fā)式增長,此后趨于平緩,但仍然會出現(xiàn)短暫爆發(fā)的現(xiàn)象。這說明群體智慧在經歷初期的爆炸增長后,仍會在新熱點的激發(fā)下再次被激活。群體智慧涌現(xiàn)的現(xiàn)象貫穿于突發(fā)公共衛(wèi)生事件與網絡輿情演變的全周期。
每日累計數(shù)據(jù)在初期經歷了同樣的爆發(fā)式增長后,表現(xiàn)出明顯的階梯式上升特征,表明累計的知識三元組數(shù)量并不是平穩(wěn)線性增加的。在較長時間的平緩且微量的增長后,會突現(xiàn)一次短暫的大幅度跳躍式增長。這與每日新增數(shù)據(jù)是相對應的,說明在突發(fā)公共衛(wèi)生事件中的群體智慧涌現(xiàn)是一種臨界現(xiàn)象。群體智慧涌現(xiàn)不僅貫穿于突發(fā)公共衛(wèi)生事件與網絡輿情演變的全周期,其對于群體智慧的表達與演變的貢獻也要高于長期的知識積累。
為探究公眾基于微博、評論等不同形式產生知識的特征,以一條微博(或評論)中的三元組數(shù)量為橫坐標,以一條微博(或評論)中能夠產生的三元組數(shù)量的概率為縱坐標,對三元組數(shù)量的概率分布進行統(tǒng)計,如圖7所示??梢园l(fā)現(xiàn),圖7中明顯存在重尾現(xiàn)象,即大多微博(或評論)含有較少的知識三元組,從少量微博(或評論)可以提取出較多的知識三元組。為探究微博、評論中各自的知識貢獻度,本研究對每日三元組的新增總數(shù)Tall、在新增微博中提取的三元組Tw以及在新增評論中提取的三元組的數(shù)量Tc進行統(tǒng)計,如圖8a所示。為消除規(guī)模差異的影響,本研究根據(jù)新增微博中提取的三元組Tw與微博的新增數(shù)量W之比Tw/W、新增評論中提取的三元組的數(shù)量Tc與評論的新增數(shù)量C之比Tc/C,來考察微博、評論中對知識三元組的貢獻情況,如圖8b所示。
圖7 一條微博(或評論)中三元組數(shù)量的概率分布
由圖8a可知,在3月14日至3月18日,從評論中提取出的知識三元組數(shù)量多于從微博中提取的知識三元組數(shù)量。但結合圖5可以發(fā)現(xiàn),在這幾個時間窗口中,公眾發(fā)表評論的新增數(shù)量C同樣也高于微博新增數(shù)量W。因此,需結合圖8b中的Tw/W和Tc/C兩個比值考察微博、評論中對知識三元組的貢獻情況,消除微博和評論的數(shù)量差異的影響。在3月14日窗口中,一條新增微博可以提取出0.944個知識三元組,而一條新增評論僅可提取出0.311個知識三元組。隨著時間窗口的滑動,在3月21日、4月11日、5月6日等窗口下,從一條微博中提取出的知識三元組數(shù)量明顯高于從一條評論內容中提取的知識三元組數(shù)量。在6月8日窗口下,一條新增微博可以提取出高達9個知識三元組,而一條新增評論僅提取出0.485個知識三元組。這一現(xiàn)象反映出,在突發(fā)公共衛(wèi)生事件輿情環(huán)境中,評論信息數(shù)量雖然遠高于微博數(shù)量,但群體智慧涌現(xiàn)出的知識條目主要集中于微博,而非評論信息。換句話說,在突發(fā)公共衛(wèi)生事件輿情環(huán)境下,公眾所發(fā)表的微博內容更具知識性,與評論內容相比,所含的知識密度更大。
圖8 每日新增微博、評論中提取的知識三元組數(shù)量及比值
4.3.1 輿情知識網絡及巨分支的統(tǒng)計分析
為更好地反映群體智慧的涌現(xiàn)特性,本研究根據(jù)第3.2節(jié)中所涉及的方法理論,以1天為時間切片,基于累計值構建輿情知識網絡,并提取其巨分支結構以表示突發(fā)公共衛(wèi)生事件輿情環(huán)境中大眾群體的主流知識方向。將2020年3月13日至2020年6月30日劃分成110個時間窗口,即t1時間窗口含有3月13日出現(xiàn)的知識單元,t2時間窗口包含3月13日至3月14日知識單元的累計數(shù)據(jù),依此類推。此外,對t1~t110各時間窗口下輿情知識網絡節(jié)點數(shù)量、邊數(shù)量以及巨分支的基本指標特征進行測度與統(tǒng)計,以期通過網絡巨分支拓撲結構的時序變化反映和揭示突發(fā)公共衛(wèi)生事件輿情環(huán)境下群體智慧演變的規(guī)律與模式。部分節(jié)選如表2所示。
由表2可知,與領域知識網絡[35]有所不同,突發(fā)事件輿情環(huán)境下的輿情知識網絡在各個時間窗口下的巨分支結構平均來看,僅涵蓋了整體網絡約50%的知識節(jié)點,囊括了約69%的知識單元之間的關聯(lián)關系。這表明輿情知識網絡的連通性較弱,在突發(fā)事件的網絡輿情環(huán)境下,公眾產生的知識具有分散性,知識單元一般形成了規(guī)模較小且互不關聯(lián)的分支群落。表2中,在t1時間窗口下僅有2個知識節(jié)點,知識關聯(lián)關系為1,說明突發(fā)公共衛(wèi)生事件輿情環(huán)境初始狀態(tài)之下,群體智慧涌現(xiàn)的知識并不多,知識關聯(lián)關系也較為簡單。隨著時間窗口滑動,突發(fā)事件的輿情環(huán)境不斷發(fā)展,逐漸涌現(xiàn)出大量知識單元以及知識關聯(lián)關系,使得輿情知識網絡巨分支的規(guī)模逐漸增大。輿情知識網絡巨分支時間序列的密度在總體趨勢上持續(xù)降低,說明盡管巨分支在整體上處于增長狀態(tài),但仍然是一個較為稀疏的網絡結構。
表2 每日累計的輿情知識網絡及巨分支的統(tǒng)計特征(節(jié)選)
為進一步探究輿情知識網絡中知識單元的群聚程度,本研究構建了同等規(guī)模(即節(jié)點數(shù)量、連數(shù)量相同)的隨機網絡以作比較,發(fā)現(xiàn)輿情知識網絡巨分支的聚類系數(shù)高于同等規(guī)模的隨機網絡,但整體上低于領域知識網絡[35]。聚類系數(shù)是對網絡拓撲結構中閉合三元組的測量,輿情知識網絡巨分支的低聚類系數(shù)表明,在突發(fā)公共衛(wèi)生事件的輿情討論中所涌現(xiàn)的知識單元之間的傳遞性并不高,即知識較為松散且聚集程度不高。在時間序列下,輿情知識網絡巨分支的平均路徑為4.72跳,表明在大多情況下輿情知識網絡中的各知識單元經較短的路徑就可以相互連接。因此,與同等規(guī)模的隨機網絡相比,在突發(fā)公共衛(wèi)生事件情景下的輿情知識網絡巨分支具有較高聚類系數(shù)、較短特征路徑長度的小世界特性。
4.3.2 輿情知識網絡巨分支的k-核分析
經過上述研究發(fā)現(xiàn),突發(fā)公共衛(wèi)生事件輿情環(huán)境下的知識網絡的巨分支雖然整體上處于連通狀態(tài),但仍是較為稀疏、松散的網絡拓撲結構。因此,根據(jù)第3.3節(jié)中提及的k-核分解方法,觀察輿情知識網絡核心知識單元以及其關聯(lián)關系。本研究對終態(tài)網絡(即t110時間窗口)的巨分支結構進行k-核分解,獲取輿情知識網絡巨分支的核心-邊緣知識單元的層級結構,如圖9所示。
圖9 輿情知識網絡巨分支的k-核分解
經過k-核分解后,輿情知識網絡巨分支中最高核為7-核,包含了48個知識單元節(jié)點,這些知識單元之間的關聯(lián)緊密,即每個知識單元至少與子群中其他7個知識單元具有直接關聯(lián)關系。在知識單元數(shù)量上,7-核中包含的知識節(jié)點數(shù)量僅占巨分支中節(jié)點數(shù)量的0.43%,說明在輿情知識網絡中的核心知識數(shù)量并不多,也進一步證明了輿情知識網絡中的知識較為松散,聚集程度不高。當k=7時,所劃分形成的子群是輿情知識網絡巨分支的核心部分,其中,“英國”“美國”“中國”“瑞典”等知識單元節(jié)點的度值較大,說明在重大突發(fā)公共衛(wèi)生背景下,公眾通過社交媒體交流所涌現(xiàn)出的核心知識多與國家層面相關,多涉及疫苗研發(fā)、隔離措施等與各國政府的角色直接相關。在k=1時出現(xiàn)如“購物”“BBC報道”“學校”“交通”等知識單元,涌現(xiàn)的群體智慧更多的是涵蓋了貼近人們的日常生活信息。
由圖9可知,各個節(jié)點之間連邊的粗細可以反映兩個知識單元之間的關聯(lián)關系的緊密程度,如“群體免疫”與“疫苗”兩個節(jié)點之間的連邊較粗,表明這兩個知識單元之間的關聯(lián)關系較為緊密:在新冠疫情重大突發(fā)公共衛(wèi)生事件背景下,英國政府提出的群體免疫引發(fā)了很大爭議,社交媒體上的言論表明了公眾對英國采取不需要醫(yī)療部門參與的群體免疫政策主要持批判性態(tài)度,認為這將是一場不負責任的“屠殺”,在突發(fā)公共衛(wèi)生事件輿情環(huán)境下涌現(xiàn)出的群體智慧認為,通過疫苗的研發(fā)與科學的治療才能實現(xiàn)群體免疫。又如,“病毒”與“變異”兩個節(jié)點之間連邊權重為34(即這兩個知識單元共同出現(xiàn)的頻次為34),為了進一步動態(tài)跟蹤突發(fā)公共衛(wèi)生事件輿情環(huán)境中大眾對這兩個知識單元的認知過程,本研究結合第3.1節(jié)提取出的三元組集合來追蹤“病毒”與“變異”兩個知識單元之間的具體關聯(lián)關系,如表3所示。研究結果發(fā)現(xiàn),在突發(fā)公共衛(wèi)生事件輿情討論環(huán)境下公眾的知識條目并不是固定不變的,公眾的認知在事件的發(fā)展和公眾的交流過程中存在轉變,甚至是完全否定的變化過程。如在輿情討論初期,t2和t3時間窗口下,公眾所涌現(xiàn)出的知識條目認為新冠病毒不會發(fā)生變異;隨著時間窗口的滑動,在t24時間窗口下,公眾對所涌現(xiàn)出的“病毒不會變異”的知識條目產生了質疑;在后期,公眾的認知發(fā)生轉變認為該病毒會發(fā)生變異,甚至病毒變異速度將加快。
表3 時間序列下“病毒”與“變異”知識單元關聯(lián)關系變化
三元組作為知識圖譜常用的知識表示方法,可以描述真實世界中存在的各種實體或概念及其復雜聯(lián)系。因此,在探究“如何表征突發(fā)公共衛(wèi)生事件的輿情環(huán)境下的群體智慧”問題時,本研究利用三元組表示突發(fā)事件輿情信息中所包含的公眾的知識條目,即以所提取的知識三元組集合來表征突發(fā)公共衛(wèi)生事件輿情環(huán)境下公眾的群體智慧,進而展開研究?;谳浨橹R三元組、網絡拓撲結構來分析群體智慧的涌現(xiàn)是否存在某種規(guī)律,本研究得出以下突發(fā)公共衛(wèi)生事件輿情環(huán)境下的群體智慧涌現(xiàn)的規(guī)律特征。
(1)群體智慧涌現(xiàn)不僅貫穿于突發(fā)公共衛(wèi)生事件與網絡輿情演變的全周期,而且其對于群體智慧的表達與演變的貢獻也要高于長期的知識積累。隨著突發(fā)公共衛(wèi)生事件的演變,群體智慧在較長時間的平緩且微量的積累后,會突現(xiàn)短暫的大幅增長。在突發(fā)事件輿情環(huán)境下群體智慧的分布明顯存在重尾現(xiàn)象,即大多微博(或評論)含有較少的知識三元組,從少量微博(或評論)可以提取出較多的知識三元組。公眾在突發(fā)事件輿情形成的過程中,傾向于參加評論形式下的討論,但其所含知識密度較低,群體智慧的涌現(xiàn)主要集中在微博內容中。
(2)突發(fā)事件輿情環(huán)境下的群體智慧涌現(xiàn)過程中具有小世界性和稀疏性的特征。相對于同等規(guī)模的隨機網絡,輿情知識網絡的巨分支具有較高聚類系數(shù)、較短特征路徑長度的小世界性。輿情知識網絡的巨分支涵蓋知識節(jié)點以及知識關聯(lián)關系的數(shù)量比例遠小于領域知識網絡,核心知識單元的數(shù)量以及比重并不多,這說明在突發(fā)公共衛(wèi)生事件的輿情環(huán)境中,大眾通過社交媒體進行交流、討論,在一定程度上促進了群體智慧的涌現(xiàn),但是所涌現(xiàn)的知識較為分散、稀疏,體現(xiàn)了大數(shù)據(jù)低價值密度的特點。
(3)在突發(fā)事件輿情環(huán)境下的群體智慧涌現(xiàn)過程中,知識條目具有動態(tài)屬性,知識單元存在核心-邊緣結構。隨著突發(fā)公共衛(wèi)生事件的發(fā)展,公眾在討論過程中所涌現(xiàn)的知識條目會存在被質疑、被否定的情況,即群體認知會發(fā)生轉變。輿情知識網絡的巨分支具有層次結構,知識單元存在核心與邊緣之分,處于核心地位的知識單元至少與網絡子群中其他7個核心知識單元存在直接關聯(lián)。
本研究所得出的分析結論,不僅豐富了對突發(fā)公共事件輿情環(huán)境下大眾行為研究的理論與方法,而且也有助于應急管理部門及時了解并引導輿情未來發(fā)展,防止事態(tài)蔓延與升級。另外,本研究工作也存在有待完善的方面,所選擇的數(shù)據(jù)源尚不能窮盡所有類型的突發(fā)事件。因此,在未來的研究中將進一步采集更加全面豐富的數(shù)據(jù)資源,從多個角度對突發(fā)事件情景下的群體智慧涌現(xiàn)問題進行深入研究與探索。
致謝感謝圖書情報國家級實驗教學示范中心為本研究提供的實驗支持!