国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

新型冠狀病毒肺炎期間公眾情感的時空演化分析

2022-04-06 02:10高鑫月宋沛林薛潤生
北京測繪 2022年3期
關(guān)鍵詞:病例公眾社交

高鑫月 宋沛林 薛潤生

(山東科技大學(xué) 測繪與空間信息學(xué)院, 山東 青島 266590)

0 引言

新型冠狀病毒肺炎(corona virus disease 2019,COVID-19)的爆發(fā)與蔓延,嚴(yán)重危害了人民的生命和財產(chǎn)安全,成為社會關(guān)注的焦點。自疫情暴發(fā)以來,我國采取了前所未有的努力[1],從不同方面展開應(yīng)對,試圖阻止疫情的蔓延。

疫情期間,相關(guān)研究多從地理學(xué)視角入手,探究包括疫情的時空分布[2-3]、擴(kuò)散特征[4]及風(fēng)險走向[5-6]等,并據(jù)此制定防疫策略[7]和系統(tǒng)方案[8],以有效阻止疫情的傳播與蔓延。隨著社交媒體的普及,公眾更傾向于通過社交媒體軟件(如微博)獲取疫情發(fā)展的最新動態(tài)并發(fā)表自己的看法,極大地促進(jìn)了人們之間的交流。因此,利用社交媒體數(shù)據(jù)參與疫情分析受到了不少學(xué)者的關(guān)注。有學(xué)者試圖從公眾輿情角度出發(fā),研究社交距離與疫情傳播之間的關(guān)系[9],同時,社交媒體為公眾對熱點事件的表達(dá)和分享提供了便捷,逐漸應(yīng)用于公眾輿情分析[10-12]、熱點事件的情感分析[13-14]和公眾關(guān)注的熱點話題[15-16]等層面。

然而這些研究沒有考慮病例位置與公眾情感信息之間的關(guān)系,而病例位置和公眾情感在城市疫情防控的過程中起著至關(guān)重要的作用。因此,本文提出一種基于病例位置及公眾情感分布的時空演化挖掘框架,構(gòu)建了病例位置與公眾情感之間的關(guān)系,對疫情期間公眾情感做了細(xì)致分析,有利于相關(guān)部門制定適合當(dāng)?shù)氐囊咔榉揽夭呗浴?/p>

1 研究數(shù)據(jù)與方法

1.1 研究數(shù)據(jù)

(1)COVID-19數(shù)據(jù)。本研究基于青島市衛(wèi)生健康委員會發(fā)布的疫情通告,收集了2020年1月21日至2020年2月20日59例新型冠狀病毒肺炎確診病例的詳細(xì)信息,提取確診時間、區(qū)域名稱、經(jīng)度以及緯度等相關(guān)信息,如表1所示。

表1 COVID-19疫情示例數(shù)據(jù)

(2)社交媒體數(shù)據(jù)。采用2020年1月21日至2020年2月20日的新浪微博數(shù)據(jù),對采集到的文本進(jìn)行數(shù)據(jù)清洗等預(yù)處理,提取時間、文本、經(jīng)度以及緯度等相關(guān)信息,最終得到5 414條社交媒體數(shù)據(jù),形成了適用于分析的數(shù)據(jù)集,表2顯示了處理后的部分?jǐn)?shù)據(jù)。

表2 社交媒體示例數(shù)據(jù)

1.2 研究方法

(1)皮爾遜(Pearson)相關(guān)性分析。Pearson相關(guān)系數(shù)是最常用的一種相關(guān)系數(shù),主要用來衡量兩個變量X和Y的線性相關(guān)程度,其數(shù)值介于-1到1之間,且絕對值越大相關(guān)性越強(qiáng),如式(1)所示:

(1)

式中,ρX,Y為變量X與Y的相關(guān)系數(shù);cov(X,Y)為X與Y的協(xié)方差;σX、σY分別是X、Y的標(biāo)準(zhǔn)差;E(XY)為X與Y乘積的數(shù)學(xué)期望;E(X)、E(Y)分別為X、Y的數(shù)學(xué)期望;E(X2)、E(Y2)分別為量X2、Y2的數(shù)學(xué)期望。

本文采用Pearson相關(guān)系數(shù)探究新增確診病例和社交媒體數(shù)據(jù)的時間分布關(guān)系,為探究疫情期間的公眾情感提供數(shù)據(jù)支持。

(2)核密度分析。核密度分析旨在計算要素在其周圍鄰域中的單位密度,可直觀反映離散測量值在連續(xù)區(qū)域內(nèi)的分布情況。本文選用核密度分析研究青島市社交媒體數(shù)據(jù)的分布規(guī)律,并探究社交媒體數(shù)據(jù)與確診病例位置之間的空間關(guān)系。

(3)百度人工智能(artificial intelligence,AI)情感分析。百度 AI 開放平臺(https:∥ai. baidu.com/)是全球領(lǐng)先的人工智能服務(wù)平臺,其中情感傾向分析模塊可對包含主觀信息的文本進(jìn)行情感傾向判斷,為輿情分析提供幫助。鑒于此,本文運用百度AI情感傾向分析探究COVID-19疫情期間的公眾情感特征,探究疫情期間確診病例位置與公眾情感空間分布的關(guān)系,以期幫助相關(guān)部門對公眾可能產(chǎn)生的行為做出評估,有效控制疫情的擴(kuò)散。

(4)基于社交媒體的關(guān)鍵詞抽取。疫情期間,大量用戶通過社交媒體平臺發(fā)布自己的觀點來表達(dá)情感,因此,基于社交媒體的關(guān)鍵詞提取可反映公眾產(chǎn)生不同情感的原因。關(guān)鍵詞抽取的算法有很多,如詞頻-逆文檔頻率算法(term frequency-inverse document frequency,TF-IDF)、TextRank及LDA(latent dirichlet allocation)等。

在本文中,我們采取了TF-IDF,TF是詞語在文本中出現(xiàn)的頻率式中用F表示,IDF是文檔頻率的倒數(shù),式中用FID表示,計算公式如式(2)所示:

(2)

式中,Ni表示詞i在該文檔中出現(xiàn)的次數(shù);N表示所有文檔中全部詞的總數(shù);|D|是語料庫中的文檔總數(shù);Di是包含詞i的文檔總數(shù)。

從社交媒體數(shù)據(jù)中提取關(guān)鍵詞信息,可為探究疫情期間公眾關(guān)注的重點話題提供數(shù)據(jù)基礎(chǔ)。

2 結(jié)果分析

2.1 病例的時間演變

2020年1月21日,青島市首次通報確診病例,之后確診人數(shù)逐漸增長。截至2月20日,共有確診病例59例,死亡病例1例。圖1顯示了該階段內(nèi)確診病例的時間演變,大致可以分為3個階段。

圖1 青島市確診病例的時間分布

低速發(fā)展期(1月21日—1月25日)。這一階段確診病例呈小幅度變化趨勢,但新增確診病例不超過2例,增速較緩。

高速增長期(1月26日—2月14日)。在此期間,疫情在全國范圍內(nèi)大規(guī)模爆發(fā),青島市確診人數(shù)呈高速增長趨勢,日新增病例達(dá)7例,增速較快。

緩慢下降期(2月15日—2月20日)。該階段新增確診病例最高為1例,其中有3天出現(xiàn)“零新增”,COVID-19基本得到控制。

2.2 社交媒體數(shù)據(jù)的時間演變

在疫情發(fā)展過程中,以社交媒體為代表的信息傳媒媒介表現(xiàn)異?;钴S,大量與其相關(guān)的信息在社交媒體上傳播,并受到公眾的廣泛關(guān)注。新浪微博用戶覆蓋范圍廣,可實時獲取所需數(shù)據(jù),因此具有很大的研究價值。

2.2.1 時間演變

本文收集了從1月21日至2月20日的5414條微博數(shù)據(jù)作為社交媒體數(shù)據(jù),用于研究社交媒體數(shù)據(jù)與疫情發(fā)展變化之間的關(guān)系,新增病例與社交媒體數(shù)據(jù)的時間分布如圖2所示。

圖2 新增病例和社交媒體數(shù)據(jù)的時間分布

2.2.2 相關(guān)性分析

由圖2可知,新增病例與社交媒體數(shù)據(jù)的時間分布呈現(xiàn)出相似的規(guī)律,其散點圖分布如圖3所示。

圖3 新增病例及社交媒體數(shù)據(jù)的散點圖分布

采用SPSS 26.0統(tǒng)計學(xué)軟件中的Pearson相關(guān)性分析探究兩個變量之間的關(guān)系,評估了從1月21日至2月20日的新增確診病例與社交媒體數(shù)據(jù)之間的關(guān)聯(lián)性,檢驗結(jié)果如表3所示。

表3 新增確診病例和社交媒體數(shù)據(jù)的相關(guān)性

在相關(guān)性分析中,新增確診病例與社交媒體數(shù)據(jù)呈現(xiàn)出顯著的正相關(guān)性。因此,選擇社交媒體數(shù)據(jù)研究疫情的演變過程具有重要的參考意義,可為政府決策部門提供數(shù)據(jù)支持,更好地服務(wù)于人民。

2.3 社交媒體數(shù)據(jù)與公眾情感的時空分布

2.3.1 數(shù)據(jù)的時空演變

將疫情期間的社交媒體數(shù)據(jù)進(jìn)行空間地址匹配,為了增強(qiáng)可視化的效果,圖4采用核密度分析方法探究社交媒體數(shù)據(jù)的分布。

由圖4可知,社交媒體數(shù)據(jù)主要集中在確診病例的附近區(qū)域。低速發(fā)展期,新增病例較少,還未引起人們的重視,此時人們對于疫情的關(guān)注度較少;高速增長期,疫情不斷擴(kuò)散與蔓延,新增確診病例增長迅速,引起了人們的高度重視,公眾對于疫情的關(guān)注度極高;緩慢下降期,新增確診病例增速明顯減緩,人們對疫情的關(guān)注度顯著降低,疫情基本得到控制。這得益于青島市政府對疫情的高度關(guān)注,在一定程度上對疫情的防控起到了積極的促進(jìn)作用。

(a)低速發(fā)展期 (b)高速增長期 (c)緩慢下降期注:審圖號為魯SG (2020)019號圖4 社交媒體數(shù)據(jù)的空間分布

2.3.2 公眾情感分布

社交媒體數(shù)據(jù)中包含了許多用戶的主觀情感內(nèi)容,為基于用戶情感分析的輿情演化研究提供了實時全面的文本數(shù)據(jù),對于疫情的研究至關(guān)重要。為了分析疫情期間公眾的情感傾向特征,文章融合COVID-19官方病例數(shù)據(jù)以及相關(guān)的社交媒體數(shù)據(jù),探究確診病例位置與公眾情感分布之間的關(guān)系。

本文應(yīng)用百度AI自然語言處理的情感分析模塊,隨機(jī)選取正向情感和負(fù)向情感各500條作為訓(xùn)練樣本,對社交媒體數(shù)據(jù)進(jìn)行情感預(yù)測。將用戶的情感傾向劃分為積極情感、中性情感以及消極情感三種類型。積極情感表達(dá)人們戰(zhàn)勝疫情的信心,中性情感是對疫情的客觀描述,消極情感代表著人們對疫情擴(kuò)散的擔(dān)憂。得到如圖5所示公眾情感的空間分布。

(a)低速發(fā)展期 (b)高速增長期 (c)緩慢下降期注:審圖號為魯SG (2020)019號圖5 公眾情感的空間分布

結(jié)合圖4、圖5可知:疫情期間青島市公眾情感整體表現(xiàn)為消極傾向,人們對于疫情的關(guān)注大多集中于確診病例所在位置附近,確診病例越集中的地區(qū)公眾情感分布越密集。在低速發(fā)展期,公眾關(guān)注度較低,呈現(xiàn)出微弱的消極情感傾向,除了區(qū)域A,其他地區(qū)幾乎沒有消極情感,這是因為前幾個病例均發(fā)生在A區(qū)域,引起了人們的擔(dān)憂;在高速增長期,公眾對于疫情的關(guān)注度急劇增加且情感最為消極。與之前的情感分布相比,區(qū)域A的情感更加消極。在緩慢下降期,公眾關(guān)注度逐漸降低,區(qū)域A的消極情感有所減少但一直持續(xù),其他地區(qū)消極情感呈零星式分布,公眾對疫情防控工作充滿信心,疫情基本結(jié)束。因此,A地區(qū)是潛在的高風(fēng)險區(qū)域,政府應(yīng)該制定相應(yīng)的措施,加強(qiáng)對疫情的管控力度。

2.3.3 公眾關(guān)注的熱點話題

公眾在疫情不同時期表達(dá)不同情感,為進(jìn)一步探索該現(xiàn)象的成因,我們通過挖掘社交媒體的文本數(shù)據(jù)來探究原因。采取TF-IDF關(guān)鍵詞抽取方法抽取關(guān)鍵詞信息,將社交媒體數(shù)據(jù)按照疫情發(fā)展的3個階段劃分為3個文本集合,并統(tǒng)計各關(guān)鍵詞在文本集合中出現(xiàn)的次數(shù),以此繪制3個集合的“詞云”并得到公眾關(guān)注的熱點話題,如圖6所示。

圖6 疫情不同階段公眾關(guān)注的熱點的時間演變

由圖6可知,公眾對于COVID-19疫情的認(rèn)知具有明顯的時間差異性。在疫情初期,公眾消極情感大多源于對COVID-19疫情認(rèn)識的不足;在高速增長期,病例增長迅速,而此階段口罩供不應(yīng)求,因此“口罩”成為公眾關(guān)注的重點;隨著時間推移,武漢疫情防控工作取得積極進(jìn)展,復(fù)工復(fù)產(chǎn)相繼開始,增加了人民戰(zhàn)勝疫情的信心,疫情防控工作取得階段性勝利,“復(fù)工”“加油”成為公眾關(guān)注的熱點。

圖6大致呈現(xiàn)了每個階段公眾關(guān)注的熱點話題,為對其做細(xì)粒度的探究,我們研究了A區(qū)域在高速增長期公眾關(guān)注熱點的時間演變過程,如圖7所示。

圖7 A區(qū)域高速增長期公眾關(guān)注熱點的時間演變

結(jié)合圖7和相應(yīng)的社交媒體數(shù)據(jù)可知:1月31日晚,有謠言稱雙黃連口服液可以抑制病毒,2月1日,“雙黃連”“抑制”成為公眾關(guān)注的熱點,公眾出現(xiàn)了盲從“心理”,嚴(yán)重影響疫情防控工作的開展,防疫部門應(yīng)盡快向社會澄清事實,減少盲目恐慌帶來的危害。隨著時間的推移,多數(shù)企業(yè)宣布復(fù)工,公眾情感態(tài)度逐漸轉(zhuǎn)好,表達(dá)了對疫情即將結(jié)束的渴望。在較長的時間內(nèi),“復(fù)工”“加油”逐步成為重點話題,公眾對于疫情的認(rèn)知逐漸趨于平穩(wěn),此時公司應(yīng)制定完善的復(fù)工復(fù)產(chǎn)制度,以確保員工健康,防止疫情的二次爆發(fā)。

3 結(jié)束語

本文提出一種基于病例位置及公眾情感分布的時空演化挖掘框架,并將其應(yīng)用到青島市,構(gòu)建了病例位置與公眾情感之間的相關(guān)關(guān)系,對疫情期間公眾情感做了細(xì)致分析,具有較高的可行性和參考價值,可應(yīng)用于相關(guān)傳染病的研究中。但也有一定的局限性:本文所采用的數(shù)據(jù)以網(wǎng)民分享為主,用戶覆蓋范圍不全面,在青少年的分布較為普及,但中老年的用戶較少。針對上述問題,下一步的工作重點是,融合更多來源的數(shù)據(jù),如社交媒體數(shù)據(jù)、百度遷徙數(shù)據(jù)以及手機(jī)信令數(shù)據(jù)等,基于多源數(shù)據(jù)更加全面準(zhǔn)確地探究COVID-19疫情期間病例位置與公眾情感的時空分布規(guī)律。

猜你喜歡
病例公眾社交
社交牛人癥該怎么治
微信公眾號
聰明人 往往很少社交
公眾號3月熱榜
公眾號9月熱榜
公眾號5月熱榜
“病例”和“病歷”
本土現(xiàn)有確診病例降至10例以下
社交距離
你回避社交,真不是因為內(nèi)向