張 宏 陳哲娟 王樹峰 陳聲宇 戴 敏 馬 媛
我國心理疾患防治隊(duì)伍包括從事心理疾患預(yù)防、咨詢和治療的三類人群。其中,心理咨詢師是指運(yùn)用心理學(xué)以及相關(guān)學(xué)科的專業(yè)知識(shí),遵循心理學(xué)原則,通過心理咨詢的技術(shù)與方法,幫助求助者解除心理問題的專業(yè)人員。從2002年起,國家開始組織心理咨詢師職業(yè)資格考試,相應(yīng)的心理咨詢師培訓(xùn)也多以此考試作為內(nèi)容參照。在傳統(tǒng)的培訓(xùn)領(lǐng)域中,對培訓(xùn)效果的檢驗(yàn)一般采用紙筆測驗(yàn),也有一些將紙筆測驗(yàn)計(jì)算機(jī)化的測試(Computer Based Test,CBT)。而以現(xiàn)代測量理論IRT為基礎(chǔ)的計(jì)算機(jī)自適應(yīng)測驗(yàn)(Computer Adaptive Test,CAT)鮮見運(yùn)用。當(dāng)前,計(jì)算機(jī)自適應(yīng)測驗(yàn)以其能夠?yàn)槭軠y者提供更為個(gè)性化、快捷和便利的服務(wù),已經(jīng)成為評價(jià)領(lǐng)域發(fā)展的重要方向。在培訓(xùn)領(lǐng)域中,使用計(jì)算機(jī)自適應(yīng)測驗(yàn)則具有更為獨(dú)特的優(yōu)越性。本文擬介紹在心理咨詢師考試培訓(xùn)中如何創(chuàng)建和使用計(jì)算機(jī)自適應(yīng)測驗(yàn),并進(jìn)一步探討在培訓(xùn)領(lǐng)域中廣泛使用計(jì)算機(jī)自適應(yīng)測驗(yàn)的可能性。
構(gòu)建心理咨詢師職業(yè)資格考試的題庫是實(shí)現(xiàn)計(jì)算機(jī)自適應(yīng)測試的基礎(chǔ)。
首先,題庫構(gòu)建基于勝任力理論。根據(jù)張愛蓮等對心理咨詢師崗位勝任力的綜述,題庫首先區(qū)分了不同層級(jí)的勝任力維度,對頂層勝任力維度的要求屬于宏觀層面的要求,包括了心理咨詢師崗位需要具備的綜合素質(zhì)。其中,對知識(shí)結(jié)構(gòu)的要求則屬于微觀層面的要求,以專業(yè)知識(shí)大綱為藍(lán)圖,描述了每類知識(shí)點(diǎn)下包含的能力要求。宏觀維度與微觀維度的結(jié)合,構(gòu)成了心理咨詢師考試培訓(xùn)題庫的結(jié)構(gòu)框架。在此,最小的勝任力特征被認(rèn)為代表了某種潛在能力(latent trait)。
其次,題庫構(gòu)建還基于項(xiàng)目反應(yīng)理論。在每一個(gè)潛在能力的子庫中,根據(jù)雙參數(shù)模型(2PL),根據(jù)大樣本量計(jì)算了題目鑒別率參數(shù)α和題目難度參數(shù)β,為實(shí)現(xiàn)計(jì)算機(jī)自適應(yīng)測試提供了基礎(chǔ)保證。
從題庫規(guī)模上看,目前尚未有明確的研究指出多大的題庫容量可以使得計(jì)算機(jī)自適應(yīng)測驗(yàn)達(dá)到最優(yōu)化。但題庫的規(guī)模越大,運(yùn)行計(jì)算機(jī)自適應(yīng)測驗(yàn)的效果也會(huì)越好。心理咨詢師考試培訓(xùn)的題庫包含了以往心理咨詢師職業(yè)資格考試的真題及培訓(xùn)模擬用題,題庫總規(guī)模達(dá)到7000道以上,完全能夠滿足計(jì)算機(jī)自適應(yīng)測試的題目數(shù)量需求(見圖1)。
另一個(gè)評價(jià)題庫質(zhì)量的指標(biāo)是題庫中題目的各項(xiàng)參數(shù)分布。一個(gè)平衡的題庫應(yīng)該包含各種難度和區(qū)分度等參數(shù)值的題目。以題目難度為例,難度值高的題目能夠?qū)δ芰λ礁叩氖軠y者進(jìn)行準(zhǔn)確估計(jì),而難度值低的題目能夠提供針對能力水平低的受測者的最大信息量。如果題庫包含了太多過難或過易的題目,則會(huì)對受測者的能力估計(jì)造成偏差。心理咨詢師考試培訓(xùn)題庫中的試題具有較為平衡的難度值分布(見圖2)。
圖1 題庫與自適應(yīng)測驗(yàn)
圖2 心理咨詢師考試培訓(xùn)題庫難度值分布
圖3 計(jì)算機(jī)自適應(yīng)測驗(yàn)流程
計(jì)算機(jī)自適應(yīng)測驗(yàn)是針對能力不同的個(gè)體,從題庫中選擇能夠?yàn)樵搨€(gè)體帶來最大化信息量評估的題目,并準(zhǔn)確估計(jì)受測者能力水平的測試過程。計(jì)算機(jī)自適應(yīng)測驗(yàn)的施測過程(見圖3)既是挑選題目的過程,也是能力估計(jì)的過程。它主要包括三個(gè)階段:
在初始化計(jì)算機(jī)自適應(yīng)測試時(shí),一般選擇具有最大信息量的題目作為開始。通常在單參數(shù)rasch模型下會(huì)選擇難度接近0的題目。由于接受測驗(yàn)的群體基準(zhǔn)能力不同,如果已經(jīng)獲得了相關(guān)受測者能力水平的信息,在心理咨詢師考試培訓(xùn)自適應(yīng)測試系統(tǒng)中允許管理員調(diào)整初始題目的參數(shù),以最好的匹配和預(yù)估受測者的實(shí)際能力水平。
測試過程中第一個(gè)核心的環(huán)節(jié)是對受測者能力的估計(jì)。一般可以選用的能力估計(jì)方法有貝葉斯能力估計(jì)和最大似然能力估計(jì)。由于最大似然估計(jì)在初始階段可能會(huì)導(dǎo)致無效解,所以可以結(jié)合使用貝葉斯方法和最大似然法估計(jì)能力。貝葉斯方法可以在一開始用先驗(yàn)分布避免無效解,當(dāng)至少有一個(gè)成功和一個(gè)失敗的反應(yīng)模式后,再運(yùn)用最大似然法,以發(fā)揮最大似然估計(jì)不依賴任何先驗(yàn)分布的優(yōu)勢。
如何挑選下一道題目是測試過程的第二個(gè)核心環(huán)節(jié)。許多研究已經(jīng)提出了題目篩選的不同方法(見表1)。
其中,最普遍使用的是最大信息量標(biāo)準(zhǔn)(MFI)。運(yùn)用這種標(biāo)準(zhǔn)選擇題目,如果已經(jīng)事先計(jì)算好信息量矩陣,則挑選題目的速度會(huì)非??臁5灿幸粋€(gè)缺點(diǎn),就是MFI方法依賴之前的能力估計(jì)值,這可能造成當(dāng)前能力估計(jì)的偏差,這一點(diǎn)在長度較短的計(jì)算機(jī)自適應(yīng)測驗(yàn)中表現(xiàn)的較為顯著。在心理咨詢師考試培訓(xùn)的計(jì)算機(jī)自適應(yīng)測試中,使用的選題策略就是最大信息量標(biāo)準(zhǔn)。因?yàn)樵谠摐y試中,一個(gè)勝任力維度模塊的測評一般包含15道以上的題目,所以可以有效避免MFI方法自身的局限性。如果測驗(yàn)運(yùn)用的IRT模型比較簡單,那么挑選下一道題目的計(jì)算過程也會(huì)變得比較簡潔。例如,在單參數(shù)rasch模型中,題目難度是選擇下一道題目的唯一影響因素。所以,在平衡測量精度等影響因素的基礎(chǔ)上,心理咨詢師考試培訓(xùn)的計(jì)算機(jī)自適應(yīng)測試盡量使用較為簡潔的IRT模型作為后臺(tái)算法支持。
在心理咨詢師考試培訓(xùn)計(jì)算機(jī)自適應(yīng)測試設(shè)置了三條標(biāo)準(zhǔn)控制在何時(shí)結(jié)束測驗(yàn)。
首先是長度標(biāo)準(zhǔn)。每個(gè)模塊都設(shè)置了測驗(yàn)長度標(biāo)準(zhǔn),長度分為試題長度和作答時(shí)間長度兩項(xiàng)。因?yàn)槭軠y者參加測驗(yàn)的目的是評估培訓(xùn)過程中自身在心理咨詢師崗位上各項(xiàng)勝任能力的增長情況,測驗(yàn)不宜過長,特別是不能超過實(shí)際心理咨詢師職業(yè)資格考試中的長度,不然會(huì)使受測者失去耐心。同時(shí),作答時(shí)間過長超出系統(tǒng)設(shè)置的閾值,測驗(yàn)也會(huì)自動(dòng)終止。
其次是精度標(biāo)準(zhǔn)。在長度標(biāo)準(zhǔn)的范圍內(nèi),如果能力估計(jì)值穩(wěn)定在預(yù)先設(shè)置的精度控制范圍內(nèi),測驗(yàn)也會(huì)終止。此時(shí),受測者可以使用較短的時(shí)間較為準(zhǔn)確的評估自身的能力水平。測驗(yàn)的精度是采用標(biāo)準(zhǔn)誤衡量的,越小的標(biāo)準(zhǔn)誤代表精度越高。在測驗(yàn)管理平臺(tái)中,精度是一個(gè)可以設(shè)定的參數(shù)。
最后是分類標(biāo)準(zhǔn)。這條標(biāo)準(zhǔn)的設(shè)置是對某個(gè)勝任力模塊的評價(jià)分為通過和不通過兩類,只用于簡單判斷受測者是否達(dá)到了此勝任力模塊評價(jià)的最低合格線。這個(gè)分類可以用在培訓(xùn)最初篩查最需要補(bǔ)充的勝任力項(xiàng)目,使培訓(xùn)做到有的放矢。
表1 CAT中挑選下一道題目的方法
將計(jì)算機(jī)自適應(yīng)測試運(yùn)用于培訓(xùn)是評價(jià)領(lǐng)域的一次全新嘗試。在接受培訓(xùn)的情境下,受測者參加評價(jià)的目的是了解自身真實(shí)的能力水平,而不是尋求通過測評或得到較高的分?jǐn)?shù)。因此,心理咨詢師考試培訓(xùn)的計(jì)算機(jī)自適應(yīng)測試系統(tǒng),兼具測評定位和認(rèn)知診斷兩種功能,其評價(jià)結(jié)果將直接服務(wù)于加強(qiáng)目標(biāo)人群的能力建設(shè)。
測評定位功能。這是任何一個(gè)測驗(yàn)必須具備的基本功能。相比較于傳統(tǒng)的紙筆測驗(yàn),計(jì)算機(jī)自適應(yīng)測驗(yàn)在適當(dāng)減少考生作答試題的數(shù)量的同時(shí),還能夠有效提高測量精度。
認(rèn)知診斷功能。計(jì)算機(jī)自適應(yīng)測驗(yàn)應(yīng)用于培訓(xùn)還兼具認(rèn)知診斷功能。計(jì)算機(jī)自適應(yīng)測驗(yàn)可以為受測者提供個(gè)性化服務(wù),根據(jù)不同受測者的能力水平,選擇代表信息量最大的題目,最大限度地估計(jì)其能力水平。而且計(jì)算機(jī)自適應(yīng)測驗(yàn)還增加評價(jià)的靈活性,可以在培訓(xùn)的任何時(shí)刻選擇參加測評,以了解當(dāng)時(shí)的能力狀態(tài)。而且其計(jì)分與分?jǐn)?shù)報(bào)告都具有即時(shí)性。
此外,心理咨詢師考試培訓(xùn)題庫一個(gè)最大的特點(diǎn)是基于崗位勝任力的測評模式。舉辦心理咨詢師職業(yè)資格考試的目的是為了檢驗(yàn)參考者是否具備心理咨詢師的基本能力。而在評估培訓(xùn)效果時(shí),所涉及的能力不僅限于考試大綱的要求,而是對心理咨詢師崗位勝任力的綜合評估。甚至在一些勝任力維度上還超出了當(dāng)前職業(yè)資格考試能夠考察的范圍。例如,心理咨詢師要求具備一些特定的心理素質(zhì),這是通常的知識(shí)技能測驗(yàn)所不能覆蓋的,但計(jì)算機(jī)自適應(yīng)測試已經(jīng)在心理測量,特別是性格測量方面做了大量實(shí)踐工作。這也為將來實(shí)用型資格考試的改革提供了評價(jià)技術(shù)方面的準(zhǔn)備。
將計(jì)算機(jī)自適應(yīng)測試運(yùn)用于心理咨詢師考試培訓(xùn)領(lǐng)域是一次全新的嘗試。計(jì)算機(jī)自適應(yīng)測驗(yàn)具有明顯優(yōu)于傳統(tǒng)紙筆測驗(yàn)的特點(diǎn),且運(yùn)用在培訓(xùn)活動(dòng)中,能夠較快的定位學(xué)員的能力水平,不需要過度考慮題目曝光和測量精度的問題。同時(shí),根據(jù)勝任力模型創(chuàng)設(shè)的自適應(yīng)測試還具有認(rèn)知診斷功能,可以較好的定位學(xué)員能力的欠缺方面,為進(jìn)一步加強(qiáng)針對性的學(xué)習(xí)提供測試反饋。因此,在未來更為廣泛的培訓(xùn)領(lǐng)域使用計(jì)算機(jī)自適應(yīng)測評技術(shù)值得期待。