周春梅,馮 林,張華輝
(1. 四川工商學(xué)院,四川 成都 611745;2. 四川師范大學(xué),四川 成都 610110)
2020年初的一場新型冠狀病毒以人傳人的方式在全球迅速蔓延。中國政府迅速作出響應(yīng),要求群眾居家隔離,不參加任何聚集性活動,百姓每天通過各大媒體關(guān)注新冠疫情的發(fā)展動向。根據(jù)官方數(shù)據(jù)報道,疫情期間,微博平臺每天超2億網(wǎng)友關(guān)注最新疫情,閱讀量到達7454億,日均發(fā)博同期增長了50%[1]。
青少年群體作為新浪微博主體受眾者,在居家隔離期間,深受網(wǎng)絡(luò)輿情影響,特別是突發(fā)性、隨機性、待驗證性的事件短期內(nèi)成為熱搜,在無法認(rèn)知的情況下,給青少年群體帶來嚴(yán)重的心理負(fù)擔(dān)。數(shù)據(jù)顯示2020年00后搜索“抑郁癥治療”相關(guān)內(nèi)容的熱度同比去年上漲59%[2]。青少年抑郁情緒越高,自我污名感會越高,求助意愿越低[3],導(dǎo)致消極情緒引發(fā)心理問題和精神障礙疾病升高。同時有數(shù)據(jù)顯示,青少年因心理行為問題和精神障礙引發(fā)的刑事或民事案件呈上升狀態(tài),2020年青少年罪犯為281860人,比上年增加38585人[4]。為了降低青少年群體的犯罪、自殺、抑郁等現(xiàn)象出現(xiàn),進一步關(guān)注疫情期間青少年的情感狀態(tài),對其網(wǎng)絡(luò)言論進行情感分析,有助于社會各界對青少年關(guān)注焦點進行了解以及對青少年心理問題采取積極疏導(dǎo)和預(yù)防措施。
研究發(fā)現(xiàn),突發(fā)公共衛(wèi)生事件對大眾的心理造成極大的不良影響。樊富珉提出傳染病流行會引起社會上出現(xiàn)心理壓力和恐慌情緒[5]。郭鵬飛等人在2020年2月13日到19日以問卷的形式對青少年兒童進行焦慮情緒調(diào)查,疫情的傳播途徑、負(fù)面消息以及不實信息對焦慮癥狀產(chǎn)生較大的影響[6]。曾競通過對青少年的訪談,了解到新冠疫情引發(fā)了青少年群體心理的差異性變化,表現(xiàn)出恐慌下的過渡反應(yīng)、盲目趨同行為、躲避心態(tài)下封閉歧視行為以及放棄奮斗散漫心態(tài)[7]。王寧霞采用焦慮障礙量表、應(yīng)激感受量表、建議應(yīng)對方式量表對410名高中生進行問卷調(diào)查,指出新冠肺炎對未經(jīng)世事的青少年群體帶來了很大的心理壓力,410名高中生表現(xiàn)出了各種不同的應(yīng)激行為[8]。
綜上所述,關(guān)于青少年心理問題的研究主要通過問卷調(diào)查或訪談的方式進行,受試者人數(shù)有限,只是青少年群體中的極小一部分或某一區(qū)域的青少年,不具有較強的代表性,同時受試青少年在訪談或調(diào)查期間有可能因抵觸或害羞不能真實的表達情感現(xiàn)狀和心理需求,從而導(dǎo)致研究分析的片面性和不真實性。如果對青少年網(wǎng)絡(luò)匿名評論進行數(shù)據(jù)分析,避免了面對面的尷尬和害羞,可以分析出該群體的真實心理訴求和情緒發(fā)泄內(nèi)容。本文基于計算機技術(shù)、人工智能技術(shù),采用文本分析方法對微博平臺評論進行情感分析,挖掘青少年疫情期間的關(guān)注焦點和情感態(tài)度,為后續(xù)心理問題預(yù)防、干預(yù)措施提供參考。
本研究以抓取青少年微博評論為研究樣本,研究框架分為三個部分,數(shù)據(jù)采集層、數(shù)據(jù)處理層、數(shù)據(jù)分析層,如圖1。
數(shù)據(jù)采集層構(gòu)建爬蟲平臺,使用微博手機版網(wǎng)頁,微博提供接口地址和API地址,采用python中的基于urllib的開源協(xié)議庫requests請求訪問,爬取新冠疫情以來,主流媒體例如“人民日報”、“央視新聞”等發(fā)布新冠疫情新聞,特別是國內(nèi)部分地區(qū)出現(xiàn)了本土病例后,青少年群體對該事件的評論作為數(shù)據(jù)集,返回標(biāo)準(zhǔn)json數(shù)據(jù)進行保存。
圖1 研究思路框圖
數(shù)據(jù)處理層利用python中的jiaba包進行分詞,引入去停用詞庫去除停用詞,采用TF-IDF算法對新冠疫情的評論進行詞頻統(tǒng)計和權(quán)重計算,降低情感詞向量空間維度,簡化青少年對此事件的態(tài)度的情感詞匯分析。
數(shù)據(jù)分析層將提取關(guān)鍵詞運用Wordcloud庫生成可視化云圖,運用LDA模型聚類情感主題詞,最后利用SnowNLP進行情感分類并產(chǎn)生情感餅圖。
TF-IDF由Salton等提出,中心思想是“如果某一個詞以較高的頻率出現(xiàn)在一篇文章中,且在其它文章中出現(xiàn)的頻率較低,則說明這個詞對前者核心內(nèi)容作用較大,權(quán)重較高”[9]。該算法主要由TF (Term Frequency)和 IDF (Inverse Document Frequency)兩部分的乘積構(gòu)成,TF-IDF的計算方法如式(1)。
(1)
其中,ni,j表示詞i在文檔j中出現(xiàn)的次數(shù),∑knk,j表示文檔j中所有詞出現(xiàn)次數(shù)的總和,N為語料庫中文檔總數(shù),di表示語料庫中包含詞i的文檔數(shù),加1操作是防止分母為零的情況。TFi,j是詞i在文檔j中的詞頻歸一化后的結(jié)果,IDFi是詞i對于文檔j區(qū)分能力的度量,它同時也是對TFi,j權(quán)值的調(diào)整,抑制在所有文檔中普遍頻率較高的詞,如“的”、“和”等。
詞頻統(tǒng)計后,利用SnowNLP進行情感分析,引入自定義的“積極”、“消極”的情感主題詞詞袋,訓(xùn)練青少年對該事件的情感程度判斷其是否是積極、消極或中性。
利用LDA(Latent Dirichlet Allocation)模型對分詞后的關(guān)鍵詞進行主題聚類,挖掘語義關(guān)系,采用困惑度低的概率模型分布預(yù)測青少年評論主題并進行分析。
信息論中的困惑度(perplexity)用來評判一個概率模型或概率預(yù)測樣本的好壞程度。低困惑度的概率模型分布能更好地預(yù)測樣本[10]。計算公式為:
(2)
p(ω)=∑p(z│d)*p(w|z)
(3)
其中,p(ω)是指測試集中出現(xiàn)的每一個詞的概率;N表示測試集中出現(xiàn)的所有詞,即測試集的總長度,不排重;z表示訓(xùn)練過的主題;d表示測試集中的各篇文檔。
LDA模型的主要思想是將每篇文章看作所有主題的一個混合概率分布,而將其中的每個主題看作在單詞上的一個概率分布。在一篇文檔中的第i個單詞的概率可以表示為:
(4)
在LDA模型中,參數(shù)z代表主題,參數(shù)ω代表單詞,式(4)中p(zi=j)表示的是從文檔中取出一個單詞屬于主題j的概率,而p(ωi|zi=j)代表的是當(dāng)取出單詞屬于主題j時該單詞為i的概率[11]。
本實驗采用python語言,Inter CoreI5-9400F CPU
2.9Ghz,內(nèi)存8G,操作系統(tǒng)為win10環(huán)境下進行實驗。選取新浪微博評論為數(shù)據(jù)來源,分別爬取2020年1月-2020年3月(下文描述為疫情前期)和2021年1月10日-2021年2月28日(下文描述為疫情中期)“人民日報”、“央視新聞”等官方微博下的評論,重點選取逆行者醫(yī)護人員、全國各省份確診新冠病例報道、職能部門為民服務(wù)等三個主題事件。根據(jù)研究需求,篩選15-29歲青少年網(wǎng)友的評論做數(shù)據(jù)集,疫情前期數(shù)據(jù)共18731條評論,疫情中期數(shù)據(jù)為23145條評論。
4.2.1 語義特征分析
網(wǎng)絡(luò)評論的關(guān)鍵詞可作為青少年對該新聞核心內(nèi)容的濃縮提煉,能夠反映出青少年的情感態(tài)度。經(jīng)過對2020年1-3月和2021年1-2月關(guān)于青少年疫情評論數(shù)據(jù)爬取,分別對評論進行分詞處理,分詞后共116486個和143942個詞匯,分詞效果如表1。
表1 用戶評論分詞預(yù)處理效果
導(dǎo)入包含7227個詞語的停用詞表,采用TextRank算法對數(shù)據(jù)集進行關(guān)鍵詞提取,經(jīng)過詞頻統(tǒng)計選擇排序前20的詞語,詳見表2。
表2 詞頻統(tǒng)計結(jié)果排序前20個高頻詞匯
表2詞頻統(tǒng)計結(jié)果表明,2020年疫情初期,青少年關(guān)注最多是“武漢”,出現(xiàn)了10216次,緊隨其后的是“加油”出現(xiàn)8825次,“病毒”出現(xiàn)4957次,“疫情”出現(xiàn)3259次,“蝙蝠”出現(xiàn)3029次“中國”、“問題”、“標(biāo)準(zhǔn)”也以較高的頻率出現(xiàn),“野味”、“人類”、“物資”、“希望”詞排列靠后。2021年疫情中期,“加油”出現(xiàn)的詞頻最高,達到16321次,其后的是“中國”、“希望”、“口罩”、“病毒”等詞匯,出現(xiàn)頻率在2000次以上,表現(xiàn)出青少年朋友的愛國情懷,帶好口罩,遠離病例,迎接希望,“醫(yī)院”、“疫情”、“物資”等與疫情相關(guān)的詞也以較高的頻率出現(xiàn),詞云中還出現(xiàn)了“感謝”、“相信”、“國家”、“英雄”等詞,反應(yīng)了青少年對抗疫的決心與信心以及對最美逆行者的敬佩。
4.2.2 詞頻可視化呈現(xiàn)
利用Wordcloud生成可視化圖形,分布選擇2020年和2021年輿情詞匯排列前25個詞匯生成云圖,云圖中字體越大,表明詞頻越高。如圖2和圖3,圖2為2020年疫情初期輿情詞云,圖3為2021年疫情中期輿情詞云。
結(jié)合圖2和圖3返回評論查看可知,2020年在疫情初期青少年群體對“武漢”、“蝙蝠”、“病毒”、“疫情”等新聞感到恐慌、焦慮,同時部分為民服務(wù)部門工作人員的工作失誤,起著輿情負(fù)性作用,青少年群體受輿情影響很大,產(chǎn)生較強的消極情感態(tài)度,2021年疫情中期更多是“加油”和“希望”以及對英雄的“感謝”。整個疫情期間,青少年群體中積極情感占主導(dǎo)地位。青少年在疫情兩個階段關(guān)注點有明顯差異,但“加油”這一詞匯在兩個階段的高頻詞中占據(jù)第一第二的位置,展示著青少年群體有一種積極向上樂觀精神和澆不滅的民族態(tài)度在持續(xù)?!跋M痹~頻從排序第十九上升到了第三,體現(xiàn)了青少年的心理資本有所提高;2021年青少年關(guān)注整個中國的抗疫精神和在黨國領(lǐng)導(dǎo)下的團結(jié)一心;“口罩”、“病毒”仍舊以較高的頻率出現(xiàn)在兩年的高頻詞匯里,表明青少年群體對待病毒的仍舊擔(dān)心、焦慮。
圖2 2020年疫情初期輿情詞云
圖3 2021年疫情中期輿情詞云
4.2.3 情感態(tài)度分析
云圖能反應(yīng)青少年疫情期間的關(guān)注焦點,但不能反應(yīng)情感態(tài)度。根據(jù)2020年和2021年疫情期間主要事件不同情感傾向輿情數(shù)據(jù)分析,如表3所示,可以看出正面輿情的占比中,關(guān)于醫(yī)護人員的事件占比最高,負(fù)面輿情占比中,職能部門初期探索未呈現(xiàn)良好結(jié)果情感度最高,總體而言,醫(yī)護人員以最美逆行者的身份給青少年以最強的積極情感。
表3 2020-2021不同事件輿情情感傾向統(tǒng)計
情感態(tài)度能夠有效的反應(yīng)青少年心理狀態(tài),研究以知網(wǎng)的HowNet情感詞表為基礎(chǔ)引入疫情輿情分析的情感詞匯,采用情感分析工具SnowNLP進一步將評論內(nèi)容與情感分類詞表進行情感匹配分詞,情感分析結(jié)果是在【0,1】區(qū)間上的一個值,情感系數(shù)小于0.5的定為消極情感態(tài)度,大于0.5的定為積極情感態(tài)度,其余為中性態(tài)度。根據(jù)對網(wǎng)友2020年和2021年評論的情感分析,得到2020年和2021年疫情輿情情感餅圖,餅圖的占比越大,說明人數(shù)越多,如圖4和圖5。
圖4 2020年疫情初期輿情情感餅圖
圖4顯示在疫情初期,青少年持積極情感態(tài)度的人最多,占總?cè)藬?shù)的67.9%,其次是31.2%的青少年持消極態(tài)度,最少是情感中立的人群,這部分只占總評論人數(shù)的0.9%。圖5疫情中期輿情情感餅圖中,持積極情感態(tài)度的青少年上升到了77.9%,持消極情感態(tài)度的下降到19.5%,中性態(tài)度的占評論人數(shù)的2.6%。
圖5 2021年疫情中期輿情情感餅圖
在2020年疫情爆發(fā)初期,“武漢”成為疫情重災(zāi)區(qū)被封鎖,大部分青少年的關(guān)注點在“人傳人”、“無有效藥”、“封城”、“就醫(yī)難”等話題上,加上疫情防控初期的誤判,防疫預(yù)案的不完整以及“紅會”人員的工作失誤等事件廣泛傳播,各種待證實的消息撲面而來,青少年這一特殊群體知、信、行的水平較差,容易被煽動、感化,消極情緒持續(xù)升高。隨后在黨中央的領(lǐng)導(dǎo)下,倡導(dǎo)“全國一盤棋”,各省份的醫(yī)護工作者陸續(xù)馳援武漢,確診標(biāo)準(zhǔn)落地,新冠確診新增人數(shù)從每天1萬多下降到幾十等新聞事件帶來了積極的情感響應(yīng)。面對突發(fā)性事件,一半以上的青少年網(wǎng)友能夠秉承積極向上的態(tài)度,相信黨國,相信國人上下一心共度難關(guān),同時對醫(yī)護人員表示敬意,給疫區(qū)人民送出祝福與期盼,表現(xiàn)出積極的情感態(tài)度。少部分青少年群體對疫情持中性情感,可能這部分青少年對該事件持回避態(tài)度。
2021年,面對國內(nèi)出現(xiàn)小范圍的疫情爆發(fā),關(guān)注點在“源頭”、“嚴(yán)防死守”、“志愿者辛苦”等話題上,青少年群體經(jīng)過2020年的突發(fā)事件心理應(yīng)激建設(shè)和抗疫精神的渲染、抗疫知識的學(xué)習(xí),大部分青少年網(wǎng)友表現(xiàn)出了面對疫情的信心和良好的心理素養(yǎng),持樂觀積極態(tài)度;也有一部分青少年網(wǎng)友害怕病毒從國外引入,經(jīng)過變異后傳播能力更大,影響范圍更廣,持悲觀態(tài)度。持中立態(tài)度的青少年網(wǎng)友上升到了2.7%,可能該部分青少年對疫情新聞持麻木心態(tài)。
4.2.4 主題詞演化分析
主題詞反應(yīng)了事件的發(fā)酵和受眾群體關(guān)注焦點,通過主題詞掌握青少年的關(guān)注話題,對維護社會和諧、培養(yǎng)良好的社會適應(yīng)心理素養(yǎng)有重要意義,結(jié)合2020年和2021年疫情爆發(fā)不同階段的評論進行困惑度計算,結(jié)果如圖6所示,當(dāng)主題數(shù)為4時,困惑度最低。
從困惑度的角度分析,聚類主題個數(shù)K=4時效果最佳,LDA聚類訓(xùn)練后,根據(jù)確定的最優(yōu)主題數(shù),選擇每個聚類前十個主題詞,如表4所示。
圖6 困惑度計算結(jié)果
表4 LDA聚類團簇表
聚類簇1根據(jù)主題詞的特征,圍繞“疫情”、“春節(jié)”展開分析,帶回評論發(fā)現(xiàn)青少年群體最多的評論是“回家過年”、“不一樣的春節(jié)”、“響應(yīng)領(lǐng)導(dǎo)政策”、“感謝國家,感謝領(lǐng)導(dǎo)”等,體現(xiàn)青少年傳承著中國的傳統(tǒng)價值觀“集體主義”,舍小家為大家,同時也體現(xiàn)出青少年對孫武的“上下同欲者勝”的傳統(tǒng)思想的認(rèn)知。
聚類簇2的主題詞中褒貶不一,積極詞占主要成分,該主題圍繞“英雄”、“抗疫”展開,評論中不少出現(xiàn)“向抗疫英雄致敬”、“中華民族是英雄民族”等評論,體現(xiàn)青少年群體中不少人懷揣著英雄夢。在世界公共衛(wèi)生突發(fā)情況下,提倡顧炎武的“保天下者,皮膚之賤,與有責(zé)焉耳”的理念,黨國提倡時勢造英雄,百姓響應(yīng)號召共同抗疫,不為自己的私利,飽含義無反顧的勇氣,世人皆英雄。
聚類簇3的核心關(guān)鍵詞“道歉”。該聚類把“隔離”人員需要“物資”,“志愿者”、“配送”不及時,“政府”、“人員”新聞發(fā)布會“道歉”體現(xiàn)出來,從側(cè)面可以發(fā)現(xiàn)該部分評論者對此表現(xiàn)出憤怒、恐慌、焦慮等情緒??梢园言擃悮w納為“安全感缺失”。安全感作為青少年心理最基本的心理需求,缺失安全感會導(dǎo)致青少年形成負(fù)性認(rèn)知以及情緒不穩(wěn)定,嚴(yán)重出現(xiàn)強迫癥、焦慮癥等心理障礙。
聚類簇4圍繞“加油”、“致敬”、“感動”展開分析,該類可以歸納為“樂觀精神”,抗疫志愿者在一線辛苦,新聞媒體報道英雄的事跡,全國觀眾除了“致敬”還有“感動”,在各大平臺送出祝福,相互加油,這也解釋了“加油”、“致敬”等詞在關(guān)鍵詞中以高詞頻出現(xiàn)的原因。青少年的每一份“加油”,體現(xiàn)了他們秉承著中華民族打不倒的樂觀精神,每一份“致敬”,體現(xiàn)了他們對英雄的敬意以及對生命的敬畏。
1)整個疫情期間,青少年群體面對突發(fā)事件產(chǎn)生出不同的應(yīng)激心理和情緒,有的憤怒、焦慮、恐慌、抑郁,表現(xiàn)出消極狀態(tài),大部分青少年擁有感動、信任、感謝、致敬的積極情感。
2)2021年面對疫情持積極態(tài)度的青少年比2020年持積極態(tài)度青少年上升了10%,持消極態(tài)度的青少年下降了11.7%。
3)英雄事跡給青少年以正面情感最高,主要體現(xiàn)在對醫(yī)務(wù)工作者、志愿者、一線的英雄的致敬,服務(wù)部門工作失誤給人以負(fù)面情緒最高。
4)疫情中期,大部分青少年保持樂觀積極的情感態(tài)度,能夠有較好的心理資本應(yīng)對突發(fā)事件,但是近五分之一的青少年持消極情感態(tài)度,表現(xiàn)出悲觀、憤怒、無助、無望的情緒,這一部分青少年的心理健康和情緒狀態(tài)值得關(guān)注,同時還有2.6%持的中性態(tài)度的青少年,有可能這部分群體有回避或情感麻木癥狀,只是短暫的緩解疫情對心理沖擊,對該部分青少年的心理健康也要持續(xù)關(guān)注。
1)助力輿情監(jiān)測過渡到情緒監(jiān)測
社會情緒對青少年的集體行為影響極大。輿情內(nèi)容發(fā)酵到一定程度演變成社會情緒,社會情緒支配著社會群體行動,美國學(xué)者sademan提出,社會危害與群眾憤怒演變成社會風(fēng)險。加強輿情檢測,利用人工智能、數(shù)據(jù)挖掘技術(shù)對青少年群體進行情緒、情感挖掘,追蹤青少年情緒變化趨勢,避免青少年群體負(fù)面情緒群體化現(xiàn)象,助推負(fù)面輿情的傳播。
2)加強科學(xué)認(rèn)知,強化危機意識
認(rèn)知-情境理論與情緒安全感理論具有互補性。社會情境的威脅影響著青少年情緒,當(dāng)威脅性越高,青少年的消極情緒越高,加強青少年科學(xué)的認(rèn)知,減弱威脅對青少年負(fù)面情緒的影響,避免青少年的報復(fù)和失調(diào)行為。同時強化青少年危機意識,注入志存高遠理想信念和砥礪前行的奮斗精神,鑄就正確的價值觀,提升青少年群體面對風(fēng)險和威脅的心理素養(yǎng)和行為能力。
3)重視輿情疏導(dǎo),優(yōu)化輿情傳播環(huán)境
官方媒體重視意見領(lǐng)袖的話語權(quán),擁有豐富的信息資源,加強真實正面信息的報道,減少不實信息報道與發(fā)酵,以正能量積極引導(dǎo)青少年群體,對不良的社會心態(tài)進行疏導(dǎo),對非官方媒體,進一步加強媒介素養(yǎng)的提升,打造積極的輿情傳播環(huán)境,減少小范圍負(fù)面輿情群體化現(xiàn)象。