關(guān)鍵詞 迫選測驗 變點分析 后程隨機(jī)作答 MUPP-2PL模型
1 引言
在心理與教育測驗中,被試常會出現(xiàn)以下現(xiàn)象:因作答動機(jī)不高而隨意選擇答案;因作答時間有限而加速作答;因疲勞而在作答過程中出現(xiàn)表現(xiàn)下降。因此,被試在作答過程中出現(xiàn)異常反應(yīng)是非常普遍的現(xiàn)象。Berry 等人(1992)的研究表明,有超過52% 的被試在測驗中存在隨機(jī)作答現(xiàn)象。在所有的異常反應(yīng)中,后程隨機(jī)作答(back random response,BRR;指被試從最初的基于測試內(nèi)容的作答反應(yīng)改變?yōu)樵跍y試中某個項目開始進(jìn)行隨機(jī)作答,并在其余的測試項目中繼續(xù)這種作答反應(yīng))是最常見的異常反應(yīng)之一 (Berry et al., 1992; Clark et al., 2003)。
當(dāng)前常用的異常作答偵測方法,主要針對能力測驗中常見的異常反應(yīng)開發(fā),而用于偵測人格測驗中異常作答的方法則十分薄弱。隨著人格測驗在人才測評領(lǐng)域的廣泛應(yīng)用,被試在測驗過程中存在異常作答反應(yīng)的問題也逐漸顯露出來。迫選測驗雖然規(guī)避了傳統(tǒng)人格測驗的部分弊端(如社會稱許性),但是鑒于人格測驗的特殊性,比如測驗項目較多、被試缺乏作答動機(jī),偶爾也會受到時間壓力因素的影響,后程隨機(jī)作答反應(yīng)仍然存在,且后程隨機(jī)作答的存在可能會導(dǎo)致被試潛在特質(zhì)估計存在較大誤差,還會影響測驗的信度和效度。
目前關(guān)于偵測后程隨機(jī)作答的研究十分有限,只有Yu 和Cheng(2019)、佘夢華(2021)在測驗中使用變點分析法(change point analysis, CPA)偵查后程隨機(jī)作答,且統(tǒng)計檢驗力較理想。變點分析法相比于傳統(tǒng)的偵查方法,優(yōu)勢在于不僅可以識別被試在測驗過程中是否存在異常反應(yīng),還可以檢測異常變點發(fā)生的具體位置(Shao, 2016; Yu amp; Cheng,2019)。一旦確定了發(fā)生異常反應(yīng)的位置,即可對存在異常反應(yīng)的部分?jǐn)?shù)據(jù)進(jìn)行清洗,而不用刪除掉異常被試的全部數(shù)據(jù)。變點分析方法可最大限度地保留有效數(shù)據(jù),降低異常反應(yīng)的影響,提高參數(shù)估計精度以及測驗的信度和效度。然而,當(dāng)前國內(nèi)外將變點分析方法應(yīng)用在迫選測驗下的異常偵查的研究還是空白。
鑒于迫選測驗在偵測異常作答反應(yīng)領(lǐng)域的空白以及變點分析方法在偵測異常反應(yīng)領(lǐng)域中的優(yōu)越性,本研究擬在變點分析法框架下采用基于似然比檢驗的個人擬合統(tǒng)計量(L max)、基于加權(quán)殘差的個人擬合統(tǒng)計量(Rmax)和基于Wald 檢驗的個人擬合統(tǒng)計量(Wmax)三種指標(biāo)對迫選測驗中的后程隨機(jī)作答反應(yīng)進(jìn)行偵測。已有研究表明Morillo 等人(2016)提出的基于優(yōu)勢模型的MUPP-2PL 模型(multiunidimensional pairwise-preference two-parameterlogistic model)相比其他模型更具有優(yōu)越性:第一,人格測驗中包含的某些結(jié)構(gòu)(例如人格的病理方面)更符合優(yōu)勢模型的假設(shè)(Cho et al., 201; De FranciscoCarvalho et al., 2015);第二,在參數(shù)估計方面,優(yōu)勢模型比展開模型更簡潔(Morillo et al., 2016);第三,采用優(yōu)勢模型形成的量表往往具有更好的心理測量學(xué)特性,例如更高的信度以及效度(Huang amp; Mead,2014)。因此,本研究擬在MUPP-2PL 框架下,將變點分析方法引入迫選測驗的異常偵查中,比較并驗證三種變點分析指標(biāo)在迫選測驗中的效果,為迫選測驗提供有效、合理的異常作答偵查方法。
2 常用的變點分析方法
變點分析法構(gòu)造個人擬合統(tǒng)計指標(biāo)( person fitstatistic, PFS)的原理為:若某被試在測驗中存在變點,那么這個測驗可以題目s 為分界線,將測驗劃分為兩個子測驗:子測驗1 為X 1, X 2, ..., Xs,子測驗2 為Xs +1, Xs+2, ..., XJ。這兩個子測驗在某種統(tǒng)計學(xué)屬性上具有根本性差異,而變點分析方法構(gòu)造的PFS 可對這種差異進(jìn)行量化。若構(gòu)造的個人擬合統(tǒng)計指標(biāo)在變點取s 值時達(dá)到最大,且超出顯著性水平則說明第s 題為變點位置(張龍飛等, 2020)。以下是幾種常用的變點分析指標(biāo):
4 變點分析方法在大五人格問卷中的應(yīng)用
4.1 數(shù)據(jù)描述
實證數(shù)據(jù)選用Morillo 等人(2016)收集的大五人格問卷數(shù)據(jù),他們對來自兩所西班牙大學(xué)的567名學(xué)生進(jìn)行了FCQ 測試,以測量五大特征(宜人性Ag、嚴(yán)謹(jǐn)性Co、外向性Ex、神經(jīng)質(zhì)Ne、開放性O(shè)E)。19人因缺漏數(shù)據(jù)被刪除,剩下548 人有待分析。原問卷由30 個block 組成,每個block 包含2個陳述。本研究選擇開放性這個維度進(jìn)行了分析,開放性是指對待已有經(jīng)驗所持有的勇于求新、對待新鮮事物不斷探索的態(tài)度,且已有研究表明,開放性可正向預(yù)測大學(xué)生的心理健康( 羅薇, 2020)。
另外,在偵測異常作答時借助額外信息(如反應(yīng)時間)來改善偵查結(jié)果。已有研究表明,在能力測驗中偵測具有加速作答的被試時,帶有反應(yīng)時數(shù)據(jù)的變點分析法的統(tǒng)計檢驗力非常理想(Shao et al.,2016)。被試在迫選測驗是否也會受到反應(yīng)時的影響,反應(yīng)時對偵測迫選測驗中的異常反應(yīng)是否具有積極作用值得進(jìn)一步研究。
最后,隨著人格測驗的廣泛應(yīng)用,開發(fā)專門針對迫選測驗的異常反應(yīng)偵測方法也變得尤為迫切。針對迫選測驗特點,開發(fā)新的檢測方法無論是對研究人員還是對被試都具有重要的理論與實際意義。