郝婉琳
(西安航空職業(yè)技術(shù)學(xué)院,陜西西安 710089)
大學(xué)時(shí)期是人生觀、價(jià)值觀成型的關(guān)鍵階段,也是心理成熟的重要階段。近年來(lái),由于大學(xué)生心理健康問(wèn)題導(dǎo)致各類(lèi)社會(huì)事件頻發(fā),從而引起了社會(huì)輿論的廣泛關(guān)注[1-4]。目前,我國(guó)高校中設(shè)有專(zhuān)門(mén)的心理健康工作室,由專(zhuān)職人員進(jìn)行心理健康輔導(dǎo)工作。但由于心理健康在高校的教育中通常為輔助、支撐的角色,師資與投入相對(duì)受限,因此心理健康輔導(dǎo)人員沒(méi)有足夠的時(shí)間和精力及時(shí)向?qū)W生提供心理咨詢(xún);此外,由于心理健康問(wèn)題其特殊的屬性,學(xué)生缺乏自我救助意識(shí),導(dǎo)致心理健康問(wèn)題無(wú)法被及時(shí)發(fā)現(xiàn)[5-12]。
為了解決上述問(wèn)題,該文結(jié)合近年來(lái)興起的大數(shù)據(jù)技術(shù),通過(guò)引入心理學(xué)健康評(píng)價(jià)指標(biāo)體系,搭建心理健康數(shù)據(jù)采集平臺(tái)。借助大數(shù)據(jù)處理算法實(shí)現(xiàn)了智能化的心理健康評(píng)估,大幅度簡(jiǎn)化了心理健康工作的流程,提高了工作效率。文中通過(guò)灰度關(guān)聯(lián)算法對(duì)SCL-90 心理健康評(píng)價(jià)體系中的指標(biāo)權(quán)重進(jìn)行分析,并結(jié)合學(xué)生的數(shù)據(jù)采集結(jié)果對(duì)學(xué)生的心理狀態(tài)進(jìn)行評(píng)估;文中還引入了Apriori 關(guān)聯(lián)規(guī)則算法,利用該算法在評(píng)分過(guò)程中進(jìn)行關(guān)聯(lián)分析,從而挖掘產(chǎn)生心理健康問(wèn)題的一般規(guī)律。
在心理健康預(yù)警時(shí),需要根據(jù)大學(xué)生相關(guān)的心理健康指標(biāo)進(jìn)行數(shù)據(jù)采集。為了合理構(gòu)建指標(biāo)評(píng)價(jià)體系,首先需要分析所有指標(biāo)對(duì)于評(píng)價(jià)結(jié)果的影響力強(qiáng)弱關(guān)系。為了實(shí)現(xiàn)該目的,引入了灰度關(guān)聯(lián)分析算法(Grey Relational Analysis,GRA)[13-16]。
其分析的基本思路:首先確定參考數(shù)據(jù)序列,然后引入若干比較序列,并分析參考序列、比較序列之間的相似度用以衡量二者之間的關(guān)聯(lián)度?;叶汝P(guān)聯(lián)算法流程如圖1 所示。
圖1 灰度關(guān)聯(lián)算法流程
1)確定評(píng)價(jià)矩陣
評(píng)價(jià)指標(biāo)矩陣由按照指標(biāo)體系收集的高校所有學(xué)生的具體數(shù)值組成,令所有待評(píng)價(jià)的學(xué)生集合為:
設(shè)心理健康疾病評(píng)判的所有指標(biāo)個(gè)數(shù)為m,則第j個(gè)待評(píng)價(jià)學(xué)生的所有指標(biāo)下的數(shù)據(jù)為:
此時(shí),可以用Yij表示第j個(gè)學(xué)生的第i個(gè)指標(biāo)的采集數(shù)值。根據(jù)以上分析可得到最終的評(píng)價(jià)指標(biāo)體系:
2)歸一化評(píng)價(jià)矩陣
在對(duì)各個(gè)學(xué)生進(jìn)行評(píng)價(jià)時(shí),由于不同指標(biāo)的度量單位不一致,無(wú)法進(jìn)行直接評(píng)價(jià),此時(shí),需要引入歸一化算法消除量綱的影響,方法如下:
經(jīng)過(guò)歸一化,式(3)中的矩陣S可轉(zhuǎn)化為式(5):
3)確定各評(píng)價(jià)指標(biāo)權(quán)重
在進(jìn)行權(quán)重確定時(shí),引入了信息熵。在信息學(xué)中,信息熵可以衡量一個(gè)系統(tǒng)的信息量與不確定性。信息熵越小,表示其越不穩(wěn)定。對(duì)于第i個(gè)指標(biāo)的信息熵,其計(jì)算方法如下:
其中,k為玻爾茲曼常數(shù),計(jì)算得到e的范圍為(0,1)。當(dāng)ei=1 時(shí),表示該指標(biāo)下的采集值完全無(wú)序,沒(méi)有參考價(jià)值。此時(shí),將該指標(biāo)的權(quán)重置為0,因此需要先引入信息熵的差異系數(shù)為:
最終的權(quán)重計(jì)算公式如下:
4)灰色關(guān)聯(lián)度分析
在進(jìn)行學(xué)生心理狀態(tài)評(píng)價(jià)時(shí),需要根據(jù)指標(biāo)體系進(jìn)行分解。該文根據(jù)兩級(jí)指標(biāo)體系,將評(píng)價(jià)系統(tǒng)分為兩層,首先對(duì)分系統(tǒng)進(jìn)行關(guān)聯(lián)度分析,然后進(jìn)行綜合分析。對(duì)于第u個(gè)灰色分系統(tǒng),第j個(gè)學(xué)生的第i個(gè)指標(biāo)可表示為:
隨后,根據(jù)熵值法計(jì)算各個(gè)指標(biāo)的權(quán)重,得到權(quán)重矩陣:
其中,wu,m的檢驗(yàn)標(biāo)準(zhǔn)為wu,m≥0。此時(shí),可得到該分系統(tǒng)u中每個(gè)學(xué)生的評(píng)價(jià)值和期望最佳評(píng)價(jià)值的關(guān)聯(lián)系數(shù):
式(11)中,當(dāng)αu,j0(i)=1 時(shí),表示第j個(gè)學(xué)生與最佳期望的關(guān)系最緊密,即該學(xué)生的心理問(wèn)題最為突出。為了將所有學(xué)生的心理健康狀態(tài)進(jìn)行排序,引入關(guān)聯(lián)度的概念如下:
基于式(13)可得到整個(gè)評(píng)價(jià)系統(tǒng)的關(guān)聯(lián)度矩陣為:
為了挖掘影響大學(xué)生心理健康的各項(xiàng)因素間更深層次的關(guān)系,引入了數(shù)據(jù)挖掘算法用于分析影響因素間的相關(guān)信息。在Apriori 算法中,相關(guān)的符號(hào)定義如表1 所示。
表1 相關(guān)符號(hào)定義
該算法的具體步驟如下:
1)掃描數(shù)據(jù)庫(kù)T,統(tǒng)計(jì)該數(shù)據(jù)庫(kù)中各個(gè)元素出現(xiàn)的次數(shù),得到1-itemset 和L1;
2)利用步驟1)得到的L1,通過(guò)剪枝處理后繼續(xù)迭代,直到無(wú)法計(jì)算出新的頻繁項(xiàng),得到k-itemset和Lk;
3)引入連接操作,則對(duì)于l1、l2兩個(gè)序列有:
該文結(jié)合當(dāng)前的心理健康評(píng)估標(biāo)準(zhǔn),設(shè)計(jì)了評(píng)價(jià)指標(biāo)體系,并基于SQL 數(shù)據(jù)庫(kù)和J2EE 技術(shù)設(shè)計(jì)了數(shù)據(jù)采集系統(tǒng)。文中在進(jìn)行數(shù)據(jù)采集時(shí),基于SCL-90 心理健康測(cè)試表進(jìn)行指標(biāo)體系設(shè)計(jì)。癥狀自評(píng)量表SCL-90 是目前最常用的心理健康測(cè)試表,其包含90 道自評(píng)題目,部分測(cè)試題目如圖2 所示。
圖2 部分測(cè)試題目
所有的測(cè)試題目均包含5 個(gè)評(píng)級(jí),各個(gè)評(píng)級(jí)的說(shuō)明如表2 所示。
表2 評(píng)級(jí)指標(biāo)說(shuō)明
基于SCL-90 對(duì)該調(diào)查表內(nèi)的問(wèn)題進(jìn)行分類(lèi),劃分為9 個(gè)評(píng)判大學(xué)生心理狀態(tài)的指標(biāo)。具體指標(biāo)及其在SCL-90 中對(duì)應(yīng)的題目序號(hào)如表3 所示。
表3 SCL-90指標(biāo)體系
此外,該文還采集了大學(xué)生的基本信息,具體包括性別(XB)、院系(YX)、戶(hù)口(HK)、是否獨(dú)生子女(DS)、是否為單親家庭(DQ)。
結(jié)合表3,搭建了二級(jí)評(píng)價(jià)指標(biāo)體系。其中第一級(jí)體系為具體的題目序號(hào),第二級(jí)指標(biāo)為具體的9項(xiàng)特征。隨后面向某高校,基于圖2 給出的系統(tǒng)進(jìn)行心理測(cè)評(píng)數(shù)據(jù)的信息采集。
經(jīng)過(guò)數(shù)據(jù)采集,共獲得有效數(shù)據(jù)5 726 份。進(jìn)行數(shù)據(jù)仿真實(shí)驗(yàn)時(shí),使用的仿真環(huán)境和Apriori 相關(guān)參數(shù)設(shè)置如表4 所示。
表4 算法仿真環(huán)境
通過(guò)灰度關(guān)聯(lián)規(guī)則,對(duì)表3 中一級(jí)指標(biāo)的權(quán)重進(jìn)行計(jì)算,得到各個(gè)指標(biāo)的權(quán)重分布情況如圖3所示。
圖3 各指標(biāo)的權(quán)重分布情況
由圖3可看出,在所有指標(biāo)中軀體化程度(QTH)對(duì)于結(jié)果的影響最大,其權(quán)重為0.194,焦慮程度(JL)、人際關(guān)系(RJGX)、精神病屬性(JSBX)、偏執(zhí)度(PZ)、敵對(duì)感(DD)等因素的權(quán)重均在0.10 以上。其余幾個(gè)指標(biāo)的權(quán)重較小,對(duì)于心理健康的判別影響均較弱。
結(jié)合灰度關(guān)聯(lián)算法和Apriori 算法,可以實(shí)現(xiàn)對(duì)全部采集人員的心理健康狀態(tài)評(píng)估。經(jīng)過(guò)評(píng)估,該批次人員內(nèi)共有121 人存在心理健康問(wèn)題,占比2.11%,其中27 人存在較為嚴(yán)重的心理健康問(wèn)題。結(jié)合前期該校心理專(zhuān)職教師建立的心理健康臺(tái)賬,進(jìn)行算法的性能分析,結(jié)果如表5 所示。
表5 算法性能分析
從表5 的計(jì)算結(jié)果可看出,算法的F1 值達(dá)到了0.92。準(zhǔn)確率、召回率均在91%以上,可以滿(mǎn)足自動(dòng)化、智能化的心理健康預(yù)警分析需求。
除了得到算法的計(jì)算指標(biāo)外,通過(guò)灰度關(guān)聯(lián)分析,還得到了較多與心理學(xué)理論一致的數(shù)據(jù)分析結(jié)論。比如心理健康問(wèn)題通常會(huì)通過(guò)軀體化特征體現(xiàn),軀體化特征是心理健康問(wèn)題的外在表現(xiàn),恐怖、偏執(zhí)等癥狀也可在一定程度上反映心理健康狀態(tài)。通過(guò)對(duì)嚴(yán)重心理健康問(wèn)題的學(xué)生進(jìn)行分析發(fā)現(xiàn),這些學(xué)生中有63.3%來(lái)自單親家庭,有21.2%來(lái)自較為貧困的農(nóng)村地區(qū)。可看出,心理健康問(wèn)題與大學(xué)生的成長(zhǎng)環(huán)境有著較為緊密的關(guān)聯(lián)。通過(guò)這些分析,可幫助高校的心理健康輔導(dǎo)老師提前確定重點(diǎn)對(duì)象,并實(shí)施相關(guān)的心理輔導(dǎo)幫助學(xué)生更優(yōu)地?cái)[脫心理問(wèn)題的困擾。
該文面向大學(xué)生的心理健康評(píng)估,基于新興的計(jì)算機(jī)、大數(shù)據(jù)技術(shù)設(shè)計(jì)了數(shù)據(jù)采集與分析平臺(tái)。通過(guò)灰度關(guān)聯(lián)算法計(jì)算不同心理健康評(píng)價(jià)指標(biāo)的評(píng)分權(quán)重,并借助Apriori 算法挖掘出導(dǎo)致心理健康的一般性規(guī)律。仿真結(jié)果表明,測(cè)評(píng)結(jié)果與該校的心理健康臺(tái)賬一致,文中的研究成果為高校心理健康工作信息化、智能化發(fā)展提供了參考。