王振杰,彭求實(shí),陳禹江,郭姿樂
(北京大學(xué) 人口研究所,北京 100871)
一種新的冠狀病毒(COVID-19)引起了急性傳染性肺炎的爆發(fā)其傳染性更強(qiáng)且沒有特別有效的治療方式方法。由于COVID-19其自身的極高傳染性,世界大部分國都實(shí)施嚴(yán)格的旅行禁令和隔離措施,這些措施有效控制了疫情的傳播,但與此同時無法避免地引起公眾的集體焦慮和恐慌。國內(nèi)有研究結(jié)果顯示,此次疫情對大學(xué)生心理健康狀況造成很巨大的沖擊和影響[1]。如果不探究其中的影響因素,可能會引發(fā)一系列負(fù)面事件。隨機(jī)森林模型能在不增加計(jì)算機(jī)運(yùn)算量的基礎(chǔ)上較大規(guī)模地增加模型的預(yù)測準(zhǔn)確性和對變量的重要性進(jìn)行排序,并且對變量分布沒有特殊的要求。因此,本研究擬用隨機(jī)森林模型和Logistics回歸相結(jié)合的方法探索新冠疫情下大學(xué)生心理狀況及其影響因素,并根據(jù)分析結(jié)果提出后疫情時期相關(guān)建議。
本調(diào)查實(shí)施于2020年3月1日~2020年4月1日,通過問卷星對北京某大學(xué)在讀的一至四年級大學(xué)生進(jìn)行匿名在線調(diào)查。所有調(diào)查對象均自愿參加,并簽署知情同意書。
一般情況調(diào)查表包括年齡、性別、年級、家庭情況、重大生活事件等等社會人口學(xué)資料。心理狀況部分主要為癥狀自評量表(SCL-90)。該量表包含90個項(xiàng)目,被分為10個因子,分別反映10個方面的心理癥狀,內(nèi)容涵蓋了精神病癥狀學(xué)和行為學(xué),包括軀體化(主要反映主觀的身體不適感)、強(qiáng)迫癥狀、人際關(guān)系敏感(主要指某些個人不自在感和自卑感)、抑郁、焦慮、敵對、恐怖、偏執(zhí)、精神病性(反映精神分裂樣癥狀)和飲食睡眠。SCL-90總分450分,得分越高表示癥狀越嚴(yán)重,各子項(xiàng)目得分之和記為總分,<160分為陰性,≥160分為陽性;二是陽性項(xiàng)目相加法,即單項(xiàng)分≥2分視為陽性項(xiàng)目,項(xiàng)目數(shù)≥43項(xiàng)為總體陽性,<43項(xiàng)為總體陰性[2-3]。變量賦值見表1
表1 變量賦值表
隨機(jī)森林在運(yùn)算量沒有顯著提高的前提下能夠大幅提高預(yù)測精度,并且對多元共線性不敏感,可以用于幾乎任何一種預(yù)測問題,被譽(yù)為最好的算法之一[4-6]。通過Gini系數(shù)計(jì)算出各個變量對分類樹中每個節(jié)點(diǎn)觀測值的影響,然后隨機(jī)森林模型對變量進(jìn)行排序[4,7]。根據(jù)變量重要性排序結(jié)果進(jìn)行逐步隨機(jī)森林模型擬合,并將袋外估算誤差率最小的自變量集再納入logistic回歸模型。本研究以統(tǒng)計(jì)分析以P< 0.05作為檢驗(yàn)水準(zhǔn),隨機(jī)森林模型和統(tǒng)計(jì)分析均在R 3.6.2中進(jìn)行。
本次研究通過問卷星在線收集259人,約15%的樣本存在心理問題。調(diào)查對象的基本情況如表2所示。
表2 調(diào)查對象基本情況
(1)森林?jǐn)?shù)目選擇
隨機(jī)森林模型隨機(jī)種子數(shù)設(shè)為222,分析結(jié)果顯示,心理狀況得分隨機(jī)森林模型、總體項(xiàng)目數(shù)隨機(jī)森林模型均當(dāng)樹的數(shù)量大于1000棵樹以后誤差率平穩(wěn)(圖1-2)。因此,心理狀況得分隨機(jī)森林模型、總體項(xiàng)目數(shù)隨機(jī)森林模型樹的數(shù)量選擇1000。
圖1 心理狀況得分隨機(jī)森林模型
圖2 總體項(xiàng)目數(shù)隨機(jī)森林模型
(2)變量重要性排序
隨機(jī)森林模型隨機(jī)種子數(shù)設(shè)為222,分析結(jié)果顯示,心理狀況得分隨機(jī)森林模型各變量重要性由高到低依次為(圖3):年級、父親的文化程度、母親的文化程度、民族、是否發(fā)生過重大生活事件、居住地、性別。
圖3 心理狀況得分隨機(jī)森林變量重要性排序圖
隨機(jī)森林模型隨機(jī)種子數(shù)設(shè)為222,分析結(jié)果顯示,總體項(xiàng)目數(shù)隨機(jī)森林模型各變量重要性由高到低依次為(圖4):年級、母親的文化程度、父親的文化程度、是否發(fā)生過重大生活事件、居住地、民族、性別。
圖4 總體項(xiàng)目數(shù)隨機(jī)森林變量重要性排序圖
(3)降維
根據(jù)自變量重要性排序結(jié)果,從評分最高的變量開始進(jìn)行逐步隨機(jī)森林。心理狀況得分隨機(jī)森林模型分析結(jié)果顯示(圖5),當(dāng)變量數(shù)為5時袋外估算誤差率最低。自變量重要性評分排名前五的變量依次是年級、父親的文化程度、母親的文化程度、民族、是否發(fā)生過重大生活事件??傮w項(xiàng)目數(shù)隨機(jī)森林模型分析結(jié)果顯示(圖6),自變量重要性評分排名前五的變量依次是年級、母親的文化程度、父親的文化程度、是否發(fā)生過重大生活事件、居住地。
圖5 心理狀況得分逐步隨機(jī)森林分析結(jié)果
圖6 總體項(xiàng)目數(shù)逐步隨機(jī)森林分析結(jié)果
分別將逐步隨機(jī)森林模型中重要性排名前五的自變量集納入心理狀況得分logistics回歸模型和總體項(xiàng)目數(shù)logistics回歸模型(表3-4)。心理狀況得分多因素logistic回歸模型結(jié)果顯示,新冠疫情下漢族大學(xué)生存在心理問題的風(fēng)險(xiǎn)是少數(shù)民族大學(xué)生的0.29倍??傮w項(xiàng)目數(shù)多因素logistic回歸模型顯示,大二年級大學(xué)生心理狀況陽性項(xiàng)目數(shù)(大于43項(xiàng))的風(fēng)險(xiǎn)是大一年級大學(xué)生的2.23倍。
2020年新冠肺炎疫情在全球范圍內(nèi)爆發(fā),不僅對社會各領(lǐng)域產(chǎn)生了直接或間接的影響[1],也對國民的心理健康造成了嚴(yán)重威脅。為加強(qiáng)疫情防控,各高校實(shí)施延遲開學(xué)、線上教學(xué)等措施,大學(xué)生群體原本的日常生活和學(xué)習(xí)受到影響。且隨著居家時間的延長,越來越多大學(xué)生可能出現(xiàn)恐慌、焦慮等負(fù)面心理,這對其心理健康狀況及未來發(fā)展都可能產(chǎn)生一定的沖擊。本研究結(jié)果顯示有心理問題的大學(xué)生比例約為15%,略高于非疫情期間的研究結(jié)果[8]。所以,疫情常態(tài)化期間更應(yīng)重視大學(xué)生的心理健康問題,實(shí)時對大學(xué)生心理健康動態(tài)進(jìn)行監(jiān)測,以期提高心理健康教育的針對性和科學(xué)性,及早預(yù)防與發(fā)現(xiàn),有效干預(yù)與治療問題,改善大學(xué)生的心理健康狀況。
隨機(jī)森林作為一種非參數(shù)回歸技術(shù),對數(shù)據(jù)具有良好的適應(yīng)性,可給出各自變量對因變量的重要性排序,對后續(xù)進(jìn)行統(tǒng)計(jì)回歸分析具有較高參考價值,提供統(tǒng)計(jì)檢驗(yàn)效能[9-10]。本研究分析結(jié)果顯示自變量數(shù)為5時袋外估算誤差率最低,心理狀況得分模型排名前五的影響的變量分別為年級、父親的文化程度、母親的文化程度、民族、是否發(fā)生過重大生活事件;總體項(xiàng)目數(shù)模型自變量為年級、母親的文化程度、父親的文化程度、是否發(fā)生過重大生活事件、居住地。
大二年級的大學(xué)生總體陽性項(xiàng)目數(shù)比例的危險(xiǎn)高于大一年級的大學(xué)生。本研究中,大二年級大學(xué)生心理狀況陽性項(xiàng)目數(shù)(大于43項(xiàng))的風(fēng)險(xiǎn)是大一年級大學(xué)生的2.23倍,該結(jié)果與國內(nèi)學(xué)者關(guān)于不同年級大學(xué)生心理健康的研究結(jié)果一致[11-12]。張百軍等(2014)在對796名河北省三所高校全日制在校大學(xué)生的調(diào)查中發(fā)現(xiàn),二年級大學(xué)生的心理健康狀況相對于其他年級學(xué)生較差,主要原因是在生活、學(xué)業(yè)或就業(yè)等方面的矛盾日益增多導(dǎo)致的。劉民等(2002)研究也認(rèn)為,不同年級在校生心理健康水平存在明顯差異,其中大二年級學(xué)生的心理問題最為嚴(yán)重。大二年級大學(xué)生異常心理問題檢出率高于大一年級,這可能是因?yàn)榇蠖W(xué)生剛進(jìn)校的新鮮感消失,人際關(guān)系敏感,學(xué)業(yè)壓力繁重等原因造成的,故對于突發(fā)事件的心理承受能力也相對較低。而大一學(xué)生心理狀況優(yōu)于其它年級,導(dǎo)致這種情況的主要原因可能是新生課程、學(xué)業(yè)壓力較小等。
表3 心理狀況得分多因素logistic回歸分析
表4 總體陽性項(xiàng)目數(shù)多因素logistic回歸分析
少數(shù)民族大學(xué)生發(fā)生心理問題危險(xiǎn)低于漢族大學(xué)生。本研究結(jié)果顯示,新冠疫情下漢族大學(xué)生存在心理問題的風(fēng)險(xiǎn)是少數(shù)民族大學(xué)生的0.29倍,這一研究結(jié)果與其他學(xué)者關(guān)于少數(shù)民族大學(xué)生心理健康水平狀況基本一致[13-14]。羅鳴春等(2010)研究指出,近15年來少數(shù)民族大學(xué)生的心理健康狀況基本穩(wěn)定,其總體水平略高于全國大學(xué)生平均水平。辛素飛等(2019)對1991-2015年間采用測查SCL-90測查少數(shù)民族心理健康水平的多篇文獻(xiàn)進(jìn)行橫斷歷史的元分析顯示,少數(shù)民族大學(xué)生在各因子上的得分呈下降趨勢,即少數(shù)民族大學(xué)生的心理健康水平整體上逐年提升。辛素飛等在研究中指出,社會變遷帶來的教育、就業(yè)、經(jīng)濟(jì)狀況的變化,貫徹落實(shí)民族融合政策帶來的民族關(guān)系的融合,以及國家對于大學(xué)生心理教育的重視程度增加等,在一定程度上緩解了少數(shù)民族大學(xué)生的心理壓力,促進(jìn)其人際關(guān)系及心理健康狀況的改善,有效提高了民族生的心理健康整體發(fā)展。此外,在本研究中,漢族大學(xué)生樣本量(占92.3%)較多,存在一定偏倚風(fēng)險(xiǎn),這也可能是漢族大學(xué)生出現(xiàn)心理問題風(fēng)險(xiǎn)要高于少數(shù)民族大學(xué)生的原因之一。當(dāng)前,關(guān)于疫情之下不同民族大學(xué)生心理健康狀況的調(diào)查研究仍較少,未來應(yīng)進(jìn)一步開展相關(guān)方面的研究,更多地關(guān)注各民族大學(xué)生的心理健康問題,以提出有針對性的心理干預(yù)與教育措施。
綜上所述,隨機(jī)森林模型能在不增加運(yùn)算量的基礎(chǔ)上提高模型預(yù)測準(zhǔn)確性和對變量的重要性進(jìn)行排序,隨機(jī)森林模型與Logistics回歸相結(jié)合是有效進(jìn)行數(shù)據(jù)分析的一種路徑。通過隨機(jī)森林模型分析發(fā)現(xiàn),影響新冠疫情期間大學(xué)生心理健康的影響因素依次為年級、父親的文化程度、母親的文化程度、民族、是否發(fā)生過重大生活事件、居住地。基于本研究結(jié)果,建議后疫情時期:①高校應(yīng)積極建立或完善在校大學(xué)生心理檔案系統(tǒng)[15],開展周期性心理健康狀態(tài)檢測,特別是疫情期間的心理狀態(tài)以早發(fā)現(xiàn)早干預(yù)。此外,對于不同年級、不同民族、不同地區(qū)的大學(xué)生應(yīng)采取有針對性的干預(yù)措施,“對癥下藥”。通過多種方式,如微信、QQ群、騰訊會議開展專題活動等手段來預(yù)防新冠疫情和疫情常態(tài)化可能對大學(xué)生心理健康產(chǎn)生長期影響;②學(xué)校應(yīng)開展以專業(yè)心理輔導(dǎo)專員為主,院系輔導(dǎo)員為輔的心理輔導(dǎo)團(tuán)隊(duì)[15],將心理健康教育作為必修課,輔以學(xué)生心理疏導(dǎo)工作,提升在校生心理健康整體水平;③進(jìn)行COVID-19相關(guān)知識健康教育,讓大學(xué)生全面了解疫情常態(tài)化下的相關(guān)信息,辨別真?zhèn)?,使其更加積極地面對COVID-19的疫情,提高自我調(diào)節(jié)能力以應(yīng)對負(fù)面情緒,特別是對應(yīng)激性生活事件的應(yīng)對能力,養(yǎng)成良好的行為與思考方式;④疫情期間,家庭也應(yīng)給予足夠的引導(dǎo)與支持[16],緩和大學(xué)生居家的消極情緒,減少應(yīng)激事件帶來的不良影響。