米國偉 先祖權(quán) 王琳 呂端士
關(guān)鍵詞:社會化問答社區(qū);新冠肺炎疫情;心理健康;信息需求;聚類;主題模型
隨著國內(nèi)外新冠肺炎疫情防控形勢的常態(tài)化,公眾心理健康成為值得關(guān)注的焦點。2020年2月,中國政府網(wǎng)發(fā)文指出疫情期間心理健康問題不容忽視。2020年8月,世界衛(wèi)生組織總干事譚德塞表示,疫情期間缺乏社交會對公眾心理健康產(chǎn)生深遠(yuǎn)影響,造成公眾焦慮和恐懼等心理問題,擾亂心理衛(wèi)生服務(wù)??梢?,疫情期間公眾心理健康問題值得關(guān)注。
在數(shù)字化網(wǎng)絡(luò)時代.人們已經(jīng)由傳統(tǒng)的向?qū)I(yè)人員咨詢轉(zhuǎn)變?yōu)橹鲃拥赝ㄟ^各種渠道來獲取健康信息。第45次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示,截至2020年3月,我國網(wǎng)民規(guī)模達(dá)到9.04億,較2018年底新增網(wǎng)民7508萬。疫情期間居家隔離導(dǎo)致社交減少,公眾對心理健康信息需求的表達(dá)更多地轉(zhuǎn)向線上平臺。而隨著社會化問答平臺不斷發(fā)展,以“知乎”為代表的平臺用戶數(shù)不斷增加,用戶通過在“知乎”平臺上提出問題來反映其信息需求,其中心理健康話題下的提問數(shù)據(jù)已經(jīng)累計達(dá)到16萬余條,而現(xiàn)有文獻(xiàn)幾乎沒有涉及該話題下的信息需求研究。以往對問答平臺中信息需求的研究大部分采用問卷調(diào)查或者訪談的方式進(jìn)行實證研究,研究所涉及的數(shù)據(jù)量較少。少部分研究通過人工標(biāo)注或者K-means聚類算法對采集到的數(shù)據(jù)進(jìn)行挖掘,但沒有涉及心理健康信息需求方面的研究。本文通過K-means聚類算法和LDA主題模型挖掘“知乎”平臺下心理健康話題中的公眾心理健康信息需求提問數(shù)據(jù),并對這些數(shù)據(jù)進(jìn)行分析和研究。
本文研究的主要目標(biāo)首先是構(gòu)建出新冠肺炎疫情期間“知乎”平臺下公眾的心理健康信息需求框架,接著探究出公眾心理健康信息需求分布(主題分布、時間分布、時期分布等)的特征,最后研究出疫情期間不同社會群體的心理問題分布。通過對這些問題的研究,可以有效把握疫情期間公眾心理健康方面的信息需求規(guī)律和特點.為政府有關(guān)部門及相關(guān)社會化問答平臺更好地服務(wù)公眾提供參考。
1國內(nèi)外研究現(xiàn)狀
1.1社會化問答平臺信息需求研究
國內(nèi)外對社會化問答平臺的信息需求研究主要是分析特定領(lǐng)域的信息需求。黃達(dá)安等通過內(nèi)容分析研究知乎社區(qū)有關(guān)HPV疫苗的提問記錄,將HPV疫苗信息需求分成疫苗的有效性、副作用、接種知識和接種渠道等方面的信息需求。金碧漪等通過參考現(xiàn)有糖尿病信息需求類目并結(jié)合提問數(shù)據(jù)內(nèi)容分析結(jié)果來探究糖尿病信息需求主題特征,得出消費者對于糖尿病健康信息需求量最大的方面是日常疾病管理、疾病確診和治療的結(jié)論。趙安琪等結(jié)合威爾遜的信息模型,通過實證研究得出抑郁癥健康信息需求主題規(guī)律,分析出健康信息消費者的認(rèn)知需求最廣泛,社會角色對健康信息需求的干擾較多。此外,還有一些學(xué)者使用數(shù)據(jù)挖掘的方法來分析特定領(lǐng)域的信息需求。Oh S等以Yahoo!Answers問答平臺上與癌癥有關(guān)的提問數(shù)據(jù)作為研究對象,通過文本挖掘的方法得出人口學(xué)、認(rèn)知、情感、社會、情景和技術(shù)信息這6大癌癥信息需求類目及各類目數(shù)據(jù)占比。陸泉等通過潛在語義索引(ISI)模型和MapReduce分布式聚類方法對求醫(yī)網(wǎng)腫瘤板塊中24305條提問數(shù)據(jù)進(jìn)行需求挖掘,得出信息需求框架和需求占比情況,分別為治療(43.3%)、病理及病因(34.5%)、檢查(12.1%)、術(shù)后(7.0%)、預(yù)防(3.1%)。張霽月通過K-means聚類和MapReduce分布式聚類的方法挖掘求醫(yī)網(wǎng)健康社區(qū)中的提問數(shù)據(jù),分析腫瘤患者信息需求類目,主要為病理及病因、預(yù)防、檢查、治療和術(shù)后這5大類目體系。上述這些研究基于社會化問答平臺某一特定領(lǐng)域,但鮮有涉及心理健康信息需求這方面的研究。
1.2公眾心理健康研究
國內(nèi)外對公眾心理健康方面的研究,主要以傳統(tǒng)的研究方法為主,但近年來逐漸開始關(guān)注網(wǎng)絡(luò)環(huán)境的研究。Aref-Adib G等通過半結(jié)構(gòu)化訪談的方式對精神障礙患者線上心理健康信息搜尋行為進(jìn)行研究,發(fā)現(xiàn)精神疾病患者會利用互聯(lián)網(wǎng)獲取精神與健康有關(guān)的信息,有助于輔助決策和治療。KimJ等基于深度學(xué)習(xí)模型挖掘健康社區(qū)中用戶的帖子信息(Posting Information),能夠自動診斷出用戶是否存在抑郁、焦慮、邊緣性人格障礙、精神分裂癥和自閉癥等心理問題。Pian W等通過文獻(xiàn)調(diào)研的方式對216篇文獻(xiàn)進(jìn)行分析,發(fā)現(xiàn)很少的文章對消費者健康信息需求給出了明確的定義。Mei.ko M等通過內(nèi)容分析的方法探究2017年心理健康宣傳周期間在Twitter上轉(zhuǎn)載的討論文本,將文本分成了意識和倡導(dǎo)、污名化、個人心理健康/疾病體驗這3類中心話語。
此外,一些學(xué)者研究了新冠肺炎疫情期間的公眾心理健康問題。Barzilay R等對疫情期間公眾心理健康問題進(jìn)行了有益探索,通過網(wǎng)絡(luò)調(diào)查的方式對疫情期間公眾心理問題水平和復(fù)原力進(jìn)行測度和評價,發(fā)現(xiàn)復(fù)原力有助于緩解公眾的焦慮和抑郁等心理問題。王暢等通過問卷的方式對217位醫(yī)務(wù)人員進(jìn)行調(diào)查,分析了醫(yī)務(wù)工作者的心理健康狀況.發(fā)現(xiàn)新型冠狀病毒肺炎流行期間醫(yī)務(wù)人員心理健康狀況有待改善,應(yīng)重點關(guān)注未婚、文化程度為碩士及以上人群。吳怡等通過焦慮自評量表和自制問卷對1196名大學(xué)生進(jìn)行網(wǎng)絡(luò)調(diào)查.得出疫情期間大學(xué)生焦慮癥狀比例較高的結(jié)論。對現(xiàn)有文獻(xiàn)的調(diào)查中,暫無對疫情期間公眾心理健康信息需求方面的研究。
2基于文本挖掘的心理健康信息需求分析框架
本文基于文本挖掘方法對中文問答平臺下公眾心理健康信息需求提問數(shù)據(jù)進(jìn)行分析,具體分析框架如圖1所示。本分析框架包括5個步驟,首先是數(shù)據(jù)采集,并對爬取到的數(shù)據(jù)進(jìn)行檢查,之后進(jìn)行數(shù)據(jù)處理.將原始數(shù)據(jù)轉(zhuǎn)化成計算機(jī)可以識別處理的文檔詞條矩陣(DTM)的形式,再分別通過K-means聚類和LDA主題模型對DTM進(jìn)行分析.對兩者生成的結(jié)果進(jìn)行綜合,最后進(jìn)行公眾心理健康信息需求的識別。
2.1數(shù)據(jù)采集與處理
1)數(shù)據(jù)來源與采集
中文問答平臺相比于普通搜索引擎,其檢索到的答案能得到其他用戶的反饋和評價,越來越受到大眾的青睞?!爸酢弊鳛樯鐣瘑柎鹌脚_的代表,截至2020年7月,其用戶數(shù)已超3億。本文以疫情期間“知乎”平臺下的公眾心理健康信息需求提問數(shù)據(jù)作為研究對象,數(shù)據(jù)源確定為2019年11月10日-2020年8月12日該平臺心理健康話題下全部共計14168條公眾心理健康信息需求提問數(shù)據(jù)及其回答數(shù)、關(guān)注數(shù)和提問時間。筆者通過“八爪魚”采集器V8版本(https://www.bazhuayu.com)進(jìn)行數(shù)據(jù)爬取并進(jìn)行去重檢查,最后將數(shù)據(jù)保存至CSV文件中。
2)數(shù)據(jù)處理
數(shù)據(jù)處理部分首先需要對數(shù)據(jù)、專業(yè)詞庫和停用詞表進(jìn)行導(dǎo)人。本研究通過R語言進(jìn)行編程,使用RSTUDIO編譯環(huán)境,通過read.esv()方法導(dǎo)人數(shù)據(jù)。專業(yè)詞庫采用的是百度心理學(xué)專業(yè)詞庫(https://shurufa.baidu,com/dict_list?cid=233),詞條數(shù)目為4 068。停用詞(Stop Words)指的是一些無實際意義的詞語,例如助詞、介詞、連詞、語氣詞等,本研究采用的是哈工大停用詞庫(https://github.com/got0456/stopwords/blob/master/hit-stop-words.txt),停用詞數(shù)共計676個。之后對提問數(shù)據(jù)進(jìn)行分詞,中文分詞包括基于詞典的分詞方法和基于統(tǒng)計切分的分詞方法_1引.本研究采用基于詞典的分詞方法,基于R語言開發(fā)的JiebaR包實現(xiàn)分詞。在分詞過程中,需要將停用詞去除,確保后續(xù)文本特征準(zhǔn)確提取。接著將分詞之后的數(shù)據(jù)類型轉(zhuǎn)變?yōu)檎Z料(Corpus)的形式,通過DocumentTerm.Matrix()方法將語料構(gòu)造成文檔詞條矩陣(DTM)。DTM是一個二維矩陣,第一行代表語料中的全部特征詞,第一列代表用戶提問文檔數(shù)據(jù)序號,矩陣的值代表特征詞在各文檔中共現(xiàn)頻次。初步生成的DTM維數(shù)眾多,為了提高后續(xù)算法運(yùn)行速度和聚類精度,需要對初始DTM進(jìn)行特征篩選和提取,常見的方法有主成分分析(PCA)、奇異值分解(sVD)和人工篩選特征等。本研究通過對DTM中詞頻數(shù)和詞長設(shè)置閾值來篩選特征,保留詞頻數(shù)高于10且詞長大于1的共計949個特征詞。
2.2 K-means聚類
聚類算法是研究對事物如何進(jìn)行分類的一種無監(jiān)督學(xué)習(xí)算法,包括K-means聚類算法、基于密度的聚類算法、層次聚類算法、期望最大化聚類算法等。K-means聚類算法是一種廣泛使用的基于劃分的聚類算法,它通過計算數(shù)據(jù)間的相似度來將原數(shù)據(jù)劃分成不同的簇群.使得不同簇群之間的數(shù)據(jù)相異,而簇內(nèi)數(shù)據(jù)相似。本文所爬取的公眾心理健康信息需求文本數(shù)據(jù)通過K-means算法能夠有效地將其進(jìn)行聚類,將文本數(shù)據(jù)劃分成合適的簇群,為后續(xù)公眾心理健康信息需求框架的構(gòu)建提供依據(jù)。
K-means聚類算法的簇數(shù)的確定和算法結(jié)果的評估是兩個值得關(guān)注的重點。肘部法則是常見的簇數(shù)確定的方法,根據(jù)式(1)繪制不同k值下的成本函數(shù)曲線,隨著k值的增大,函數(shù)曲線肘部(下降幅度最大的位置處)對應(yīng)的k值則為最佳簇數(shù)。公式中u;是第k個類的中心坐標(biāo)。
本研究對算法結(jié)果的評估主要采用輪廓系數(shù)(SC)法,它是一種常用的聚類算法評價的內(nèi)部標(biāo)準(zhǔn),具體如式(2)所示。a(d)代表樣本d所屬簇的凝聚度,6(d)代表樣本d與其他簇的分離度,SC表示輪廓系數(shù)。
2.3 LDA主題模型
潛在狄利克雷分布(LDA)主題模型是在潛在語義分析(PISA)模型的基礎(chǔ)上提出的,本質(zhì)也是聚類算法。不同于K-means聚類,LDA是一種基于概率的算法,它是三層貝葉斯模型,包括文檔、主題和詞項3層結(jié)構(gòu)。LDA是文本分析領(lǐng)域最受關(guān)注的模型之一.在文本挖掘領(lǐng)域有著廣泛的應(yīng)用。首先,它可以作為一種降維的工具。由于LDA模型訓(xùn)練完成之后,能夠得到一個文檔在主題空間的表示,在詞項空間中進(jìn)行的一些文檔處理可以通過LDA模型在主題空間中完成。此外,利用主題模型的參數(shù)估計值,還可以完成協(xié)同過濾、單詞或文檔相似度計算、文本分段等任務(wù)。本研究使用LDA主題模型來對公眾心理健康信息需求文本數(shù)據(jù)進(jìn)行分析.能很好地進(jìn)行主題發(fā)現(xiàn),LDA假設(shè)文檔生成過程首先對每個主題生成“主題一詞項”分布參數(shù):接著對每個文檔生成“文檔一主題”分布參數(shù):再對當(dāng)前文檔的位置生成其所屬主題:,并根據(jù)當(dāng)前位置的主題.生成當(dāng)前位置對應(yīng)的詞項:LDA主題模型概率圖如圖2所示,圖2中的參數(shù)解釋如表1所示。
2.4需求識別
K-means聚類和LDA主題模型所得到的結(jié)果需要進(jìn)行心理健康信息需求識別。這一階段需要綜合分析結(jié)果并參考現(xiàn)有類目框架,從而得出本文的公眾心理健康信息需求類目,統(tǒng)計出公眾心理健康信息需求在每個類目中的分布情況。接著通過TF-IDF方法對每個類目下的特征詞提取出主題關(guān)鍵詞,TF(Term Frequency)指的是詞頻,需要計算詞語在心理健康信息需求聚類后的文檔中出現(xiàn)的頻積,詳見式(5)。之后對抽取出的關(guān)鍵詞進(jìn)行詞云分析,繪制出詞云圖。此外,本階段還需要進(jìn)行公眾心理健康信息需求規(guī)律統(tǒng)計和分析,繪制出條形圖和詞云圖,將結(jié)果可視化。
3公眾心理健康信息需求結(jié)果分析
3.1數(shù)據(jù)基本情況
本文通過對“知乎”中文問答平臺心理健康話題的數(shù)據(jù)爬取和檢查,共采集到14168條公眾心理健康信息需求數(shù)據(jù)及其回答數(shù)、關(guān)注數(shù)和提問時間,對數(shù)據(jù)基本特征進(jìn)行了統(tǒng)計,如表2所示。
通過對數(shù)據(jù)的統(tǒng)計,發(fā)現(xiàn)公眾心理健康信息需求數(shù)據(jù)的回答數(shù)和關(guān)注數(shù)標(biāo)準(zhǔn)差較大,這反映了公眾對不同類型的信息需求興趣相差較大,為了研究疫情期間公眾心理健康信息需求所關(guān)注的焦點,本研究對提問數(shù)據(jù)的關(guān)注數(shù)和回答數(shù)設(shè)置一個閾值10,抽取出超過10個回答和關(guān)注的數(shù)據(jù).并對這些數(shù)據(jù)進(jìn)行詞云分析得到高關(guān)注、高回答數(shù)據(jù)的主題詞云圖.詞云圖中包含前100個主題關(guān)鍵詞,如圖3所示。從圖中可看出“心理”“問題”是公眾重點關(guān)注的主題,“抑郁”“痛苦”“害怕”是公眾重點關(guān)注的心理問題。此外,還存在“學(xué)生”“高三”“高中”等與學(xué)校有關(guān)的關(guān)鍵詞,這說明疫情期間公眾也比較關(guān)注學(xué)生復(fù)學(xué)可能出現(xiàn)的心理健康信息需求。
此外.本研究將數(shù)據(jù)按照疫情發(fā)展的時間節(jié)點劃分成疫情暴發(fā)前時期(2019.11.10-2020.01.22)、疫情時期(2020.01.23-2020.04.08)和后疫情時期(2020.04.09-2020.08.12),疫情暴發(fā)前時期至疫情暴發(fā)時期的劃分以武漢封城為標(biāo)志,疫情時期和后疫情時期的劃分以武漢解封為標(biāo)志,各時期公眾日均提問數(shù)據(jù)量如圖4所示。從圖4中可發(fā)現(xiàn)疫情暴發(fā)前時期公眾心理健康方面的信息需求較少.而疫情時期公眾心理健康方面的信息需求顯著增加,達(dá)到日均77.23條。而后疫情時期公眾心理健康信息需求水平有所下降.但仍比暴發(fā)前時期的需求水平要高,這說明隨著我國疫情防控局勢的整體好轉(zhuǎn),居家隔離政策逐漸取消.公眾可以參加一些戶外及室內(nèi)社交聚集活動,這有利于公眾心理方面保持健康,從而降低其心理健康方面的信息需求水平。之后,本研究還根據(jù)公眾的提問時間繪制出公眾心理健康信息需求數(shù)據(jù)時期分布圖,如圖5所示.從圖5中也可以看出公眾心理健康信息需求水平與疫情發(fā)生的前后階段呈相關(guān)關(guān)系。
為了更好地探究各時期公眾心理健康信息需求的內(nèi)容特征,本研究提取出各時期的15個關(guān)鍵詞及其TF-IDF值,結(jié)果如表3所示。從表中可看出疫情暴發(fā)前時期公眾心理健康信息需求主要集中在克服消極情緒、與他人的相處以及詢問心理問題的原因。疫情時期的心理健康信息需求主要集中在疫情環(huán)境下發(fā)生的心理健康問題,例如焦慮、壓抑等問題。后疫情時期的心理健康信息需求主要集中在詢問如何克服心理問題以及走出陰影。
3.2公眾心理健康信息需求框架
通過對K-mean聚類和LDA主題模型的結(jié)果進(jìn)行分析,并綜合現(xiàn)有的類目體系,構(gòu)建出本文的公眾心理健康信息需求框架。本框架大類數(shù)根據(jù)肘部法則確定,肘部法則圖像如圖6所示,從圖像中可看出聚類數(shù)確定為9比較合適.通過同樣的方法再確定出每個大類中的子類數(shù),并結(jié)合LDA結(jié)果進(jìn)行需求類目名稱的分析與概括,最終確定本框架的9個大類和22個小類,并對數(shù)據(jù)聚類結(jié)果再通過內(nèi)容分析的修正從而得出公眾心理健康信息需求占比,如表4所示。
從表4中可看出新冠肺炎疫情公眾心理健康信息需求占比最大的前3個大類分別是自我管理與調(diào)節(jié)(43.58%)、社會生活(22.95%)和誘因(12.91%),占比最小的前3個大類分別是預(yù)防(0.33%)、教育(0.90%)和治療(1.84%),這說明疫情期間當(dāng)公眾出現(xiàn)心理健康方面的信息需求時,大部分公眾想要通過自我管理與調(diào)節(jié)的方式而不是去專業(yè)機(jī)構(gòu)治療來滿足其需求。在子類中,占比最大的前3個類目則是其他心理問題的自我管理與調(diào)節(jié)(28.75%)、社會情感支持(13.45)和負(fù)面情緒的自我管理與調(diào)節(jié)(11.24%),占比最小的3個類目分別是抑郁的預(yù)防(0.05%)、心理測試相關(guān)的檢查和診斷(0.11%)、缺愛的癥狀及表現(xiàn)(0.13%),數(shù)據(jù)中與抑郁有關(guān)的信息需求占比為3.84%.而有關(guān)抑郁預(yù)防的信息需求僅占0.05%,這說明公眾對抑郁預(yù)防的認(rèn)識有待提高。
3.3疫情期間不同社會群體的心理問題分布
本研究通過對數(shù)據(jù)的分析,發(fā)現(xiàn)2398條以父母、孩子、朋友或同學(xué)為主體的心理健康信息需求提問數(shù)據(jù),此外還發(fā)現(xiàn)1651條表征公眾抑郁、焦慮、自卑、缺愛、壓力和恐懼的心理問題的數(shù)據(jù)。通過對這些數(shù)據(jù)進(jìn)行交叉統(tǒng)計得到疫情期間不同角色的公眾心理問題分布,如圖7所示。圖7共對893條交叉數(shù)據(jù)進(jìn)行統(tǒng)計.從不同群體的角度可以發(fā)現(xiàn)這6種心理問題普遍集中在自己身上的頻率較高:從不同心理問題的角度可以發(fā)現(xiàn)抑郁這一心理問題在所有群體中出現(xiàn)的頻率均較高。
4討論
本研究發(fā)現(xiàn),新冠疫情暴發(fā)前時期公眾關(guān)注的重點主要集中在克服不良情緒、心理問題事件評價以及詢問造成心理問題的原因。在疫情時期,心理健康方面的信息需求主體為公眾自身.其次為朋友、父母、孩子和同學(xué)。這一時期公眾提問數(shù)據(jù)中含有大量與疫情有關(guān)的信息.這反映出疫情暴發(fā)時期公眾因為長時間居家隔離導(dǎo)致其心理健康方面可能出現(xiàn)問題從而產(chǎn)生相關(guān)的信息需求。此外,這一時期的數(shù)據(jù)中還有很多“焦慮”“壓抑”等表征心理問題的關(guān)鍵詞,這反映出疫情環(huán)境下會加劇公眾心理健康問題的發(fā)生.相關(guān)部門和問答平臺應(yīng)該及時追蹤,提供更多的心理健康方面的服務(wù)。后疫情時期公眾關(guān)注的重點主要是生活方面的心理健康問題以及如何擺脫心理陰影,很多信息需求提問以母親、女生為主體,以家庭為情景,這說明疫情期間家庭中出現(xiàn)心理健康方面的信息需求顯著,并且女性出現(xiàn)心理健康信息需求的比重明顯高于男性,疫情期間有關(guān)部門應(yīng)該重點關(guān)注女性的心理健康信息需求,江永燕等的研究發(fā)現(xiàn)疫情期間男大學(xué)生心理健康水平要明顯優(yōu)于女大學(xué)生。本研究將研究群體擴(kuò)展至社會公眾,發(fā)現(xiàn)就社會公眾而言,疫情期間男性的心理健康水平要明顯好于女性。此外,Belkin的知識非常態(tài)理論指出公眾的信息需求產(chǎn)生于知識非正常狀態(tài),公眾在社會化問答平臺上進(jìn)行心理健康方面的信息需求提問并渴望獲得信息需求反饋來實現(xiàn)其知識的常態(tài)化。Taylor需求層次理論將公眾的需求依次分成內(nèi)在需求、意識需求、形式化需求和折衷需求這4個層次,公眾在社會化問答平臺上進(jìn)行的心理健康方面的信息需求表達(dá)屬于折衷需求,而從形式化需求轉(zhuǎn)化為折衷需求需要公眾進(jìn)行準(zhǔn)確的信息需求表達(dá).否則折衷需求便可能不能完全反映公眾的真實需求,導(dǎo)致公眾的信息需求不能充分滿足。從3個時期的關(guān)鍵詞中,都可看出“心理”和“心里”這兩個關(guān)鍵詞同時出現(xiàn),這反映出公眾在表達(dá)其心理健康方面的信息需求時存在一些描述不準(zhǔn)確的情況,這可能不利于公眾得到及時的心理健康信息需求反饋。
本研究構(gòu)建出公眾心理健康信息需求框架,并將提問數(shù)據(jù)歸類到需求框架中,得出各需求類目數(shù)據(jù)分布情況。研究發(fā)現(xiàn),疫情期間公眾對自我管理與調(diào)節(jié)方面的信息需求最為顯著,這可能是因為疫情期間由于居家隔離,公眾不能去醫(yī)院或有關(guān)心理咨詢機(jī)構(gòu)治療心理方面的問題。此外,由于心理問題污名化現(xiàn)象的存在,公眾對自身存在的心理健康方面的信息需求也不太愿意和他人訴說,所以公眾對自身可能存在的心理健康問題有著強(qiáng)烈的自我管控的欲望,有關(guān)部門及問答平臺應(yīng)該為公眾提供更多的心理健康管理與調(diào)節(jié)方面的知識,更好地滿足公眾的信息需求。此外,公眾最少關(guān)注的需求類目是預(yù)防、教育和治療,這反映出面對心理健康問題公眾不太愿意尋求專業(yè)治療.公眾對心理健康問題的預(yù)防意識和接受專業(yè)心理治療的意識也有待提高,陳祉妍等的研究表明心理咨詢與心理治療有助于維護(hù)和改善公眾心理健康水平,減輕疾病負(fù)擔(dān),促進(jìn)家庭和諧,所以當(dāng)公眾心理問題比較嚴(yán)重的時候,應(yīng)該及時去專業(yè)機(jī)構(gòu)治療,僅靠公眾自我管理與調(diào)節(jié)效果可能并不理想。
本研究還發(fā)現(xiàn)公眾心理健康信息需求提問數(shù)據(jù)中含有很多表征不同社會群體不同心理問題的信息.這說明疫情期間公眾不僅關(guān)注自身的心理問題,也較關(guān)注身邊人的心理健康相關(guān)的信息需求,體現(xiàn)出疫情期間公眾有較強(qiáng)的自我保護(hù)與保護(hù)家人和朋友的意識。通過對這些數(shù)據(jù)的分析,繪制出疫情時期不同群體的心理問題分布圖。群體主要包括提問者本人及提問者的父母、孩子、朋友和同學(xué).這些群體在疫情期間均表現(xiàn)出常見的心理問題,例如抑郁、焦慮、恐懼、壓抑、自卑、缺愛,其中有關(guān)抑郁的心理問題在各個群體中的發(fā)生情況尤為突出。在重大的危機(jī)事件下,公眾極易產(chǎn)生不確定感,尤其是新冠肺炎疫情不可預(yù)測性和突發(fā)性,如果當(dāng)?shù)禺a(chǎn)生較多感染病例時,這種不確定感會轉(zhuǎn)化為公眾的焦慮情緒,直至抑郁。因此有關(guān)部門需要格外重視公眾這種心理問題的發(fā)現(xiàn)、追蹤和治療。此外,缺愛這種心理問題在孩子這一群體中出現(xiàn)的頻次也比較多.這表明疫情期間兒童的心理健康問題不容忽視。劉雯雯等的研究表明兒童處于身心健康快速發(fā)展的時期.缺乏積極的戶外活動會導(dǎo)致其產(chǎn)生情緒低落和抑郁等問題,加之多數(shù)父母對這種心理問題不了解,無法及時幫孩子排解情緒,兒童會出現(xiàn)缺愛引發(fā)的各種心理健康問題,因此父母平時要留意孩子的舉動和情緒變化,爭取給孩子足夠的自由活動空間.增加孩子與同齡人的交流機(jī)會。
5結(jié)論
本研究通過數(shù)據(jù)采集、數(shù)據(jù)處理、K-means聚類、LDA主題模型和需求識別這5大步驟,探究疫情期間基于社會化平臺的公眾心理健康信息需求。根據(jù)疫情發(fā)展態(tài)勢,將數(shù)據(jù)劃分為疫情暴發(fā)前時期、疫情時期和后疫情時期,通過TF-IDF方法提取出各時期前15個關(guān)鍵詞,從而對比分析出各時期公眾心理健康信息需求特點。研究得出以下結(jié)論:首先,疫情期間比較容易出現(xiàn)家庭情境下的心理健康信息需求。其次,公眾容易出現(xiàn)與抑郁有關(guān)的心理健康信息需求。再次,新冠肺炎疫情期間公眾心理健康問題的預(yù)防意識和接受專業(yè)心理援助的意識有待提高。最后,網(wǎng)絡(luò)環(huán)境下心理健康信息需求表達(dá)的準(zhǔn)確性有待加強(qiáng)。
另外,本研究也存在一定的局限和不足,在后續(xù)的研究中,可以通過對微博平臺、心理健康專業(yè)門戶網(wǎng)站或者“知乎”平臺下其他與心理健康有關(guān)的話題數(shù)據(jù)進(jìn)行分析.從而能夠更加全面地探究疫情期間公眾心理健康信息需求。此外,還可以通過設(shè)計其他算法來進(jìn)行數(shù)據(jù)聚類和主題提取,從而更好地探究本研究方向。