趙琪鳳
效度研究領(lǐng)域中的爭(zhēng)議
趙琪鳳
在教育和心理測(cè)量界,效度被認(rèn)為是最為核心的概念。作為效度問(wèn)題的根本,構(gòu)想效度研究仍然是心理測(cè)量界的一大難題,仍然存在諸多爭(zhēng)議和挑戰(zhàn)。本文在一系列前期研究和分析的基礎(chǔ)上,從構(gòu)想效度的概念本質(zhì)、構(gòu)想效度的研究視角、構(gòu)想效度的研究方法三大方面探討了效度研究領(lǐng)域中存在的爭(zhēng)議。我們認(rèn)為,迄今為止構(gòu)想效度研究在本質(zhì)定位、探究視角和方法論方面仍然爭(zhēng)議不斷,需要理順和統(tǒng)一,并接受和借鑒物理學(xué)等成熟學(xué)科的一些研究思路和方法,這才是實(shí)現(xiàn)科學(xué)研究構(gòu)想效度的重要途徑。
構(gòu)想效度;構(gòu)想;心理物理學(xué);因果分析
時(shí)至今日,效度研究已經(jīng)經(jīng)歷了近1個(gè)世紀(jì)的歷程,并取得了較為豐碩的研究成果,雖然具體的心理測(cè)驗(yàn)極大地滿足了社會(huì)應(yīng)用及政治決策的需要,但是作為效度問(wèn)題的根本,構(gòu)想效度研究仍然是心理測(cè)量界的一大難題,仍然存在諸多爭(zhēng)議和挑戰(zhàn)。其中,我們認(rèn)為主要的爭(zhēng)議體現(xiàn)在關(guān)于“構(gòu)想效度究竟是指什么有效”的爭(zhēng)議,“對(duì)心理構(gòu)想的解釋采用物理學(xué)視角還是社會(huì)學(xué)視角”之間的爭(zhēng)議,以及在方法論上“確定因果效應(yīng)還是構(gòu)建相關(guān)網(wǎng)絡(luò)”之間的爭(zhēng)議三大方面。
在教育和心理測(cè)量界,效度被認(rèn)為是最為核心的概念。雖然在1921年效度概念正式提出時(shí),研究者就聲稱“效度是指測(cè)驗(yàn)在多大程度上測(cè)到了它想要測(cè)的東西”,但是經(jīng)過(guò)多年的效度研究歷程,我們可以看到這個(gè)概念并不足以清楚、準(zhǔn)確地表達(dá)效度的本質(zhì)含義,至少我們看到不同的學(xué)者根據(jù)自己的理解和知識(shí)背景,以及所處的社會(huì)環(huán)境等因素,對(duì)效度(尤其是構(gòu)想效度)存在不同的理解;正是因?yàn)闆](méi)有對(duì)構(gòu)想效度要測(cè)什么形成一致的認(rèn)識(shí),一些學(xué)者會(huì)對(duì)不同的構(gòu)想效度定義均表認(rèn)同;有時(shí)會(huì)在不同的構(gòu)想效度定義之間反復(fù)、搖擺。因此,“構(gòu)想效度究竟是指什么有效”成了一個(gè)爭(zhēng)議頗多的問(wèn)題,在確定構(gòu)想效度是指什么東西有效方面,已經(jīng)存在各種不同的說(shuō)法和見(jiàn)解,混淆了構(gòu)想效度的研究基礎(chǔ)和思路。
根據(jù)常曉宇(2001)、張凱(2004)等人之前對(duì)構(gòu)想效度概念混亂狀況所做的總結(jié)和闡述,我們認(rèn)為目前心理測(cè)量界對(duì)構(gòu)想效度定義的研究大致呈現(xiàn)以下五種狀態(tài)。
構(gòu)想效度的英文表述是“construct validity”,國(guó)內(nèi)的學(xué)者將這個(gè)關(guān)鍵詞翻譯成中文,就會(huì)出現(xiàn)一些不同的譯法和理解。例如凌文輇、濱治世(1988:16)把構(gòu)想效度翻譯成“構(gòu)造概念效度”,王重鳴(1990:142)把構(gòu)想效度翻譯成“構(gòu)思效度”,劉潤(rùn)清(1991:18)則翻譯為“編制效度”,徐樅巍(1992:344)把構(gòu)想效度理解為“構(gòu)念效度”或“構(gòu)造效度”等。不僅是國(guó)內(nèi)的學(xué)者,國(guó)外的一些研究者也持有同樣的觀點(diǎn),如Allison(1999)認(rèn)為“[Construct(構(gòu)想或結(jié)構(gòu))是]我們想要教或想要測(cè)的東西的表征,如‘聽(tīng)力理解’及其組成成分”。可見(jiàn),很多人把構(gòu)想效度這個(gè)概念譯成“結(jié)構(gòu)效度”。張凱(2004)總結(jié)認(rèn)為:“根據(jù)這個(gè)譯法,有人認(rèn)為結(jié)構(gòu)(構(gòu)想)效度是指所測(cè)能力的構(gòu)成(如智力的各個(gè)因素)和測(cè)驗(yàn)結(jié)構(gòu)(structure)之間的一致性程度或?qū)?yīng)程度”(2004:8)。
部分學(xué)者認(rèn)為,構(gòu)想效度與內(nèi)容效度類似,如果測(cè)驗(yàn)沒(méi)有什么實(shí)在的內(nèi)容可以依據(jù)(談不上內(nèi)容效度)的話,總得找點(diǎn)東西來(lái)代替內(nèi)容效度,這東西就是構(gòu)想效度。
還有的學(xué)者把內(nèi)容效度與構(gòu)想效度混為一談,認(rèn)為內(nèi)容效度的考察大綱是理論結(jié)構(gòu)的一個(gè)樣本,內(nèi)容效度可以轉(zhuǎn)化為構(gòu)想效度,內(nèi)容效度與構(gòu)想效度很難截然分開(kāi),屬于一個(gè)整體。
其實(shí),在建立構(gòu)想效度的方法中,先考察測(cè)驗(yàn)的內(nèi)容效度的方法也是其中一種,“因?yàn)橛行y(cè)驗(yàn)對(duì)所測(cè)內(nèi)容或行為范圍的定義或解釋類似于理論構(gòu)想的解釋”(戴海琦、張鋒、陳雪楓,1999),但這種方法當(dāng)且僅當(dāng)“測(cè)驗(yàn)對(duì)所測(cè)內(nèi)容或行為范圍的定義或解釋類似于理論構(gòu)想的解釋”時(shí)才成立,考察內(nèi)容效度的方法多數(shù)情況下并不適用,況且內(nèi)容效度本身就難以測(cè)定(常曉宇,2001)。
在構(gòu)想效度提出50多年后,出現(xiàn)少量學(xué)者對(duì)構(gòu)想效度持徹底否定的態(tài)度。如Borsboom等人對(duì)Cronbach和Meehl(1955)的認(rèn)識(shí)是:
構(gòu)想效度的觀點(diǎn)從產(chǎn)生就注定了死亡。Cronbach和Meehl(1955)提出的構(gòu)想效度從來(lái)沒(méi)有過(guò)任何研究實(shí)例。相應(yīng)地,在當(dāng)今的效度理論中也沒(méi)有定律網(wǎng)絡(luò)的軌跡(Borsboom et al.,2009)
在這種完全否定的態(tài)度下,Borsboom等人更加堅(jiān)定了對(duì)構(gòu)想效度批判,同時(shí)從效度命名的角度試圖取消“構(gòu)想效度”這一術(shù)語(yǔ):
我們認(rèn)為構(gòu)想效度理論中使用的“構(gòu)想”一詞,在兩個(gè)方面是不一致的,也就是說(shuō),這個(gè)詞同時(shí)指向了理論術(shù)語(yǔ)(如,一個(gè)標(biāo)記)和指派術(shù)語(yǔ)的證明(如,一個(gè)研究者使用一種測(cè)量工具發(fā)現(xiàn)了這一現(xiàn)象)。這種雙重意義制造了大量的誤解和混亂……。因此,我們建議將‘構(gòu)想’一詞去掉,……。我們認(rèn)為效度的概念,正如通常所理解的那樣,在理論上和實(shí)踐上都優(yōu)于構(gòu)想效度概念。最后,我們提出的主張是構(gòu)想效度一直使得研究者躲在迷霧之后,免于思考和解決心理測(cè)量的真正問(wèn)題。(Borsboom et al.,2009)
Borsboom等人在上述觀點(diǎn)中,認(rèn)為構(gòu)想效度中的“構(gòu)想”一詞,不僅沒(méi)有任何實(shí)際意義,反而制造了混亂和誤解,他們更加贊成使用“效度”替代構(gòu)想效度的核心地位,也就是說(shuō)之前對(duì)構(gòu)想效度的多方論述和證明,都是無(wú)益于效度檢驗(yàn)的,可見(jiàn),Borsboom等人(2009)徹底否定了構(gòu)想效度的地位和作用。
除了上述對(duì)構(gòu)想效度概念產(chǎn)生的不同理解和解釋外,提到一個(gè)測(cè)驗(yàn)具有構(gòu)想效度時(shí),究竟是什么東西有效?測(cè)量界有三種不同的解釋:構(gòu)想有效、測(cè)驗(yàn)有效、測(cè)驗(yàn)的分?jǐn)?shù)或分?jǐn)?shù)解釋有效。
測(cè)量界里,這種看法由來(lái)已久。早在提出構(gòu)想效度之時(shí),Cronbach和Meehl就已經(jīng)不是把效度問(wèn)題理解為測(cè)驗(yàn)是否測(cè)到了某個(gè)特質(zhì)這樣單純的事實(shí)性問(wèn)題,而是當(dāng)作由測(cè)驗(yàn)分?jǐn)?shù)所作出的推論是否與包含各種理論與觀察術(shù)語(yǔ)的規(guī)則網(wǎng)絡(luò)(nomological)相一致的問(wèn)題(1955)(陳宏,2012:2)。
Henning(1987:98)認(rèn)為“建立構(gòu)想效度的目的是證明被測(cè)量的潛在的理論構(gòu)想本身是有效的”。
國(guó)內(nèi)的桂詩(shī)春、寧春巖(1997:293)以及陳俊良(1991:103)的說(shuō)法與之類似。
《教育與心理測(cè)量標(biāo)準(zhǔn)》(AERA,1999:5)聲稱,“測(cè)驗(yàn)就是對(duì)構(gòu)想的測(cè)量工具”,“所有測(cè)驗(yàn)分?jǐn)?shù)”都應(yīng)“看作某種構(gòu)想的測(cè)度”(AERA,1999:174)。有了《標(biāo)準(zhǔn)》的支持,效度指構(gòu)想有效這一解釋很快成為測(cè)量界居統(tǒng)治地位的主流意識(shí)(陳宏,2012:2)。
還有學(xué)者認(rèn)為構(gòu)想效度是測(cè)驗(yàn)(測(cè)量)的有效性,如Kelly早在1927年就提出,測(cè)驗(yàn)如果測(cè)到了它聲稱要測(cè)的東西就是有效的(1927:14)。Anastasi對(duì)效度定義的闡述幾十年基本未變,她在效度問(wèn)題上的看法長(zhǎng)期以來(lái)為人們廣泛引用并產(chǎn)生了深遠(yuǎn)影響,Anastasi(1982:144;1997:126)認(rèn)為“測(cè)驗(yàn)的構(gòu)想效度就是測(cè)驗(yàn)在多大程度上測(cè)出了理論構(gòu)想或理論特質(zhì)?!边@種觀點(diǎn)實(shí)質(zhì)上強(qiáng)調(diào)的是測(cè)驗(yàn)或測(cè)量的工具屬性。
國(guó)內(nèi)學(xué)者戴忠恒(1987:233)、凌文輇、濱治世(1988:17)、王重鳴(1990:142)Fraenkel&Wallen(1993:548)、Brown(1996:239)、Kline(1998:37)、劉永芳、房慧聰(2001:188)對(duì)構(gòu)想效度的界定,也都認(rèn)同測(cè)驗(yàn)有效的理解(張凱,2004)。
在構(gòu)想效度的表述對(duì)象問(wèn)題上,目前占據(jù)主導(dǎo)思想的解釋是,效度是分?jǐn)?shù)解釋或根據(jù)分?jǐn)?shù)所作推斷的有效性。Messick(1989:13)說(shuō),“效度不是測(cè)驗(yàn)……的特性,而是測(cè)驗(yàn)分?jǐn)?shù)的意義的特性”。Fraenkel&Wallen(1993:193)說(shuō),“需要證明有效的,不是工具本身,而是工具在特定的應(yīng)用中產(chǎn)生的推論”。Cronbach(1989:151)自己后來(lái)也說(shuō),構(gòu)想效度“證明的是特定的分?jǐn)?shù)解釋”。持這種觀點(diǎn)的還有Ebel&Frisbie(1991:108),Bachman(1990:290),Bachman&Palmer(1996:21),Chapelle(1998:50)等。
1999年APA《標(biāo)準(zhǔn)》的修訂版基本接受了Messick對(duì)效度的定義,承認(rèn)效度檢驗(yàn)過(guò)程所“評(píng)估的是根據(jù)人們提出的應(yīng)用需求對(duì)測(cè)驗(yàn)分?jǐn)?shù)所作的解釋,而非測(cè)驗(yàn)本身。”同時(shí)承認(rèn)“人們提出的測(cè)驗(yàn)應(yīng)用需要對(duì)測(cè)驗(yàn)分?jǐn)?shù)作出解釋,效度指的是證據(jù)和理論對(duì)這種分?jǐn)?shù)解釋的支持程度”(AERA,1999:9)。此后,“這種效度觀念在測(cè)量界便逐漸形成思維定式,而且表述更簡(jiǎn)單、明確、直截了當(dāng)”(陳宏,2012:4)。
正是由于心理測(cè)量學(xué)界對(duì)構(gòu)想效度表述對(duì)象的不確定和不統(tǒng)一的現(xiàn)狀,導(dǎo)致?tīng)?zhēng)議不僅表現(xiàn)為研究者們對(duì)這個(gè)問(wèn)題有不同的理解,而且還表現(xiàn)為,“研究者個(gè)人有時(shí)會(huì)同時(shí)認(rèn)可兩種表述對(duì)象;有時(shí)會(huì)在不同的表述對(duì)象間反復(fù)、搖擺;而且有些學(xué)者在效度表述對(duì)象問(wèn)題上的不一致甚至在同一部著作中也會(huì)出現(xiàn)”(陳宏,2012:4)。這種對(duì)構(gòu)想效度含混不清的表述,很容易給讀者造成誤解和歧義。
Alderson,Clapham和Wall(1995)說(shuō):
每個(gè)理論都包含若干構(gòu)想,并力圖定義構(gòu)想之間的關(guān)系?!瓰榱藴y(cè)出一個(gè)測(cè)驗(yàn)的構(gòu)想效度,編測(cè)驗(yàn)的人必須使測(cè)驗(yàn)和潛在的理論掛上鉤,然后將測(cè)驗(yàn)結(jié)果和那個(gè)理論進(jìn)行比較。(1995:286-287)
這好像是說(shuō)構(gòu)想有效,但他們接著又說(shuō):“構(gòu)想效度就是評(píng)價(jià)一個(gè)測(cè)驗(yàn)對(duì)那些構(gòu)想的測(cè)量程度如何?!边@又似乎是說(shuō)測(cè)驗(yàn)有效了。杰克遜(1996:91)、Sax(1997:313)以及Loewenthal(2001:17)等人對(duì)構(gòu)想效度的表述也同樣存在各種混亂,對(duì)構(gòu)想效度的界定通常指代不明(張凱,2004)。
Henning雖然在陳述效度定義時(shí)說(shuō)過(guò):“效度一般指某個(gè)特定測(cè)驗(yàn)或其任何組成部分作為對(duì)它聲稱要測(cè)量的那個(gè)東西的測(cè)度的恰當(dāng)性”(1987:89),似乎認(rèn)為效度是測(cè)量的屬性,然而其后在同一部著作中定義構(gòu)想效度時(shí),Henning卻明確指出,測(cè)驗(yàn)“聲稱要測(cè)量”的,就是“潛在的理論構(gòu)想”,而“建立構(gòu)想效度的目的,就是證明被測(cè)量的潛在的理論構(gòu)想本身有效”(Henning,1987:89),可見(jiàn)當(dāng)時(shí)在Henning意識(shí)中,效度實(shí)質(zhì)就是構(gòu)想效度。
Borsboom等荷蘭學(xué)者也是很明顯的例子。一方面,他們承認(rèn)效度是測(cè)驗(yàn)本身的屬性,明確肯定Kelly(1927)提出的效度定義是正確的。另一方面,Borsboom等人(2004)在闡述其效度主張的文獻(xiàn)中,卻明確表示:
僅憑心理測(cè)量技術(shù)和心理測(cè)量模型解決不了效度問(wèn)題。正相反,這個(gè)問(wèn)題必須由實(shí)體理論來(lái)處理。測(cè)驗(yàn)效度是個(gè)心理學(xué)無(wú)法外包給方法論去解決的問(wèn)題。(Borsboom et.al.,2004)
顯然,這里“有效”所表述的已非測(cè)驗(yàn)本身的屬性,而是測(cè)驗(yàn)構(gòu)想或有關(guān)構(gòu)想的理論了(陳宏,2012:6)。這些令人費(fèi)解的表述,是由于研究者自身對(duì)構(gòu)想效度理解的模糊和不確定所造成的。
由上述多種多樣的構(gòu)想效度概念,我們可以明確,“構(gòu)想效度究竟是指什么有效”這個(gè)問(wèn)題存在多樣的回答和復(fù)雜的論爭(zhēng),是一個(gè)值得研究的課題。
早在19世紀(jì)中期,心理物理學(xué)的出現(xiàn),引發(fā)了一場(chǎng)關(guān)于人類心理構(gòu)想解釋采用物理學(xué)視角還是采用社會(huì)學(xué)視角的爭(zhēng)論。
心理物理學(xué)(psychophysics)研究,像這個(gè)詞本身所表明的那樣,研究的是精神(心理)世界和物質(zhì)(物理)世界的關(guān)系。這一研究包括提起重物、視覺(jué)明度、視覺(jué)距離和觸覺(jué)距離的實(shí)驗(yàn)(舒爾茲,2005:66)。從名稱上看,心理物理學(xué)一方面要以心理學(xué)為基礎(chǔ),另一方面還要能為心理學(xué)提供數(shù)學(xué)基礎(chǔ)。心理物理學(xué)要從物理學(xué)研究中得到啟發(fā)和方法論,從生理學(xué)和解剖學(xué)中得到更多的神經(jīng)系統(tǒng)方面的東西??梢?jiàn),心理物理學(xué)的解釋視角主張從客觀存在的生理機(jī)制上尋求依據(jù),并結(jié)合物理學(xué)的數(shù)字化表達(dá)方式,力圖使心理學(xué)成為物理學(xué)那樣的精密科學(xué)。而心理學(xué)的傳統(tǒng)做法是將這兩種視角相結(jié)合,一些心理學(xué)家認(rèn)為有關(guān)自然本性視角和后天因素視角的爭(zhēng)論根本就不存在,因?yàn)槿祟愋袨槭怯赏獠凯h(huán)境和遺傳物質(zhì)共同作用的結(jié)果,把兩者分開(kāi)是不明智的。
然而,“在測(cè)量界乃至一般測(cè)驗(yàn)用戶那里,主張效度的實(shí)在性似乎注定是要坐冷板凳的”(陳宏,2012:7),顯然,在關(guān)于人類行為解釋的生物學(xué)和社會(huì)學(xué)(自然本性和后天因素)視角之間的這場(chǎng)爭(zhēng)論中,社會(huì)學(xué)解釋視角占據(jù)了上風(fēng),這一視角對(duì)心理測(cè)驗(yàn)的思考和分析與測(cè)驗(yàn)所處的社會(huì)環(huán)境相聯(lián)系,從道德和實(shí)際應(yīng)用等方面研究人類行為,至今仍是心理測(cè)量和構(gòu)想效度研究的主流觀點(diǎn)。
我們認(rèn)為,主張從生物學(xué)視角解釋行為,其根本還是心理特質(zhì)的實(shí)在性問(wèn)題。我們知道,在經(jīng)驗(yàn)世界里,無(wú)論通過(guò)感官還是借助各種測(cè)量工具,心理特質(zhì)都是無(wú)法直接觀察的,一切關(guān)于特質(zhì)的構(gòu)想和理論都只是假設(shè):假設(shè)被試行為的原因可以用某種特質(zhì)的作用來(lái)解釋,這些特質(zhì)影響了被試行為,被試行為的差異體現(xiàn)了特質(zhì)的差異。
可不幸的是,探究心理特質(zhì)實(shí)在性這一點(diǎn),偏偏正是現(xiàn)代教育和心理測(cè)量界長(zhǎng)期以來(lái)一個(gè)最大的難題。將特質(zhì)的實(shí)在性看作效度的核心,就是要求測(cè)驗(yàn)構(gòu)想確有某種外在的實(shí)體與之明確對(duì)應(yīng)。
其實(shí)早在19世紀(jì)中期,費(fèi)希納就嘗試從生物學(xué)視角解釋人類行為。著名的費(fèi)希納律將感覺(jué)這種不可直接觀察的屬性定為構(gòu)想,然后找到了一種可觀察的屬性——刺激量作為直接測(cè)量對(duì)象,經(jīng)過(guò)反復(fù)試驗(yàn),在刺激量和感覺(jué)量之間找到了一條(用數(shù)學(xué)表達(dá)的)定律,即S=KlogR,根據(jù)上述證明理論的要求,這時(shí)感覺(jué)量作為構(gòu)想得到了證明。這一定律的出現(xiàn)表明,對(duì)心理構(gòu)想實(shí)在性的探究和科學(xué)測(cè)量雖然難度很大,但也并非毫無(wú)希望??梢哉f(shuō),費(fèi)希納開(kāi)拓了心理測(cè)量科學(xué)方法的先例和思路,這一方向是值得繼續(xù)深入挖掘和繼承的。這正是心理測(cè)量需要繼續(xù)努力的方向。而回避和忽略這一研究思路,轉(zhuǎn)而從社會(huì)學(xué)視角解釋行為,則趨于主觀判斷和人為因素的摻雜,研究難度驟然降低,而且可滿足實(shí)際需求和社會(huì)需要,但是“這樣一個(gè)完全靠假設(shè)構(gòu)建起來(lái)的效驗(yàn)推論鏈條是十分脆弱的,因?yàn)榧僭O(shè)終究需要證實(shí):測(cè)驗(yàn)所測(cè)特質(zhì)不僅存在于構(gòu)想,而且有其實(shí)體”(陳宏,2012)。
總之,通過(guò)對(duì)行為解釋的生物學(xué)視角和社會(huì)學(xué)視角之間的論爭(zhēng),我們發(fā)現(xiàn)這兩大研究視角在長(zhǎng)期的爭(zhēng)論中,已經(jīng)形成了兩種主要變量,即與本能相關(guān)聯(lián)的生理機(jī)能因素,和與環(huán)境經(jīng)驗(yàn)相關(guān)聯(lián)的因素。但是這兩種截然不同的觀點(diǎn)是無(wú)法互相融合的,在尚無(wú)定論的情況下只能各自為政。
測(cè)驗(yàn)效度實(shí)質(zhì)上就看測(cè)驗(yàn)是否能夠通過(guò)分?jǐn)?shù)變異真實(shí)反映特質(zhì)作用于被試行為的效應(yīng)。如果效度檢驗(yàn)結(jié)果顯示,分?jǐn)?shù)變異是因特質(zhì)變異而起,這就意味著,當(dāng)前觀察到的被試行為之變異正是測(cè)驗(yàn)打算測(cè)量的那種特質(zhì)變異的效應(yīng),就測(cè)量這一特定的特質(zhì)而言,測(cè)驗(yàn)就是有效的。正是由于作用于測(cè)驗(yàn)分?jǐn)?shù)的一系列心理生理因素始終是個(gè)謎團(tuán),對(duì)二者之間因果關(guān)系的探究也舉步維艱,甚至備遭冷落。
實(shí)際上,因果關(guān)聯(lián)研究是非常必要的。但是因果分析為何未見(jiàn)其效呢?對(duì)于這個(gè)疑問(wèn),陳宏(2012)作出了相應(yīng)的解釋和回答:
因果關(guān)聯(lián)研究在方法論方面有一些優(yōu)勢(shì),卻在效度概念發(fā)展的大半個(gè)世紀(jì)里一直處于測(cè)量專家們的視野之外,最關(guān)鍵的原因,恐怕就在于這種簡(jiǎn)單的從因果效應(yīng)發(fā)生過(guò)程求證的效度檢驗(yàn)思路需要直接的觀察手段,而現(xiàn)代教育心理測(cè)量包括語(yǔ)言測(cè)驗(yàn)恰恰缺少這樣的條件。令人鼓舞的是,近年來(lái),隨著時(shí)間的推移和科技進(jìn)步,我們似乎已經(jīng)可以依稀看到因果關(guān)聯(lián)性的定性研究在測(cè)量領(lǐng)域尤其是效度研究中得以應(yīng)用的希望曙光。(陳宏,2012:18)
可見(jiàn),陳宏(2012)將因果關(guān)聯(lián)研究法的使用局限,歸結(jié)為心理測(cè)量缺少直接的觀察手段,是有一定道理的。畢竟想要得到因果關(guān)系,需要找到確切的關(guān)聯(lián),而直接的觀察手段則是最理想的證明因果關(guān)系的途徑。但是,直接的觀察手段的實(shí)現(xiàn),需要根據(jù)所測(cè)特質(zhì)的具體情況而定,并非所有的特質(zhì)都能夠?qū)崿F(xiàn)直接的觀察。
與因果關(guān)系的艱難探究不同的是,相關(guān)關(guān)聯(lián)的研究則由來(lái)已久,且占據(jù)主導(dǎo)地位,大受社會(huì)學(xué)解釋視角的青睞。早在20世紀(jì)50年代以前效度概念發(fā)展的初期,人們?cè)毡橄嘈庞行Ъ聪嚓P(guān)。例如Guilford曾夸張地認(rèn)為“從某種非常一般的意義上說(shuō),測(cè)驗(yàn)對(duì)任何與其相關(guān)的事物都是有效的”(Guilford,1946)。以至于之后的大多數(shù)研究者都認(rèn)同相關(guān)分析為效度研究的主要方法。
Borsboom等人為了說(shuō)明相關(guān)性分析對(duì)于理論解釋存在的缺陷,他們從以下幾個(gè)方面對(duì)以相關(guān)為基礎(chǔ)的效度檢驗(yàn)研究做出了概括:
第一,世界上各種事物之間完全無(wú)關(guān)的情況實(shí)際上非常少見(jiàn),特別是在社會(huì)科學(xué)領(lǐng)域中,一切事物都趨于彼此相關(guān)(Meehl,1978)。
第二,用相關(guān)來(lái)表示效度,就會(huì)使人誤以為相關(guān)系數(shù)越高,效度就越高……然而,這種邏輯往往還會(huì)導(dǎo)致進(jìn)一步極端的推論,即兩個(gè)變量完全相關(guān),便意味著完全有效,甚至使人誤以為有確切關(guān)聯(lián)的特質(zhì)就是一回事,這可是極大的謬誤。
第三,因?yàn)橄嚓P(guān)關(guān)系本身就是一個(gè)總體依賴的統(tǒng)計(jì)量,所以任何以相關(guān)為基礎(chǔ)建立起來(lái)的效度檢驗(yàn)觀點(diǎn)都必然導(dǎo)致效度在不同總體之間是可變的推論。然而,效度只應(yīng)取決于特質(zhì)變異,與相關(guān)關(guān)系和總體變化并沒(méi)有必然聯(lián)系。(陳宏,2012:16-17)
需要說(shuō)明的是,雖然相關(guān)分析的缺陷已經(jīng)被很多心理學(xué)家所發(fā)現(xiàn)和批判,效標(biāo)關(guān)聯(lián)效度檢驗(yàn)由于依賴于相關(guān)分析的研究方法,存在循環(huán)論證問(wèn)題而遭到研究者的抨擊。但是,心理學(xué)界面臨著社會(huì)對(duì)心理測(cè)量(包括語(yǔ)言測(cè)驗(yàn))的迫切需求,需要回答有關(guān)測(cè)驗(yàn)的效度和效度檢驗(yàn)方面的問(wèn)題,而在心理測(cè)量尚未成熟的情況下,相關(guān)分析這一檢驗(yàn)方法及時(shí)地為心理測(cè)量學(xué)家解圍,成為目前效度檢驗(yàn)的重要方法,這也可以說(shuō)是心理測(cè)量不得不面對(duì)和承認(rèn)的一個(gè)客觀事實(shí)和無(wú)奈。由此可見(jiàn),因果關(guān)系的實(shí)現(xiàn)應(yīng)該居于研究的首位,因果關(guān)系中包含相關(guān)關(guān)系,兩種分析不可分割,但也應(yīng)有主有次。
總之,在效度研究中建立因果關(guān)聯(lián)探究,還是繼續(xù)奉行相關(guān)分析的研究方法,這一爭(zhēng)論正在進(jìn)行,且隨著心理測(cè)量學(xué)家對(duì)心理特質(zhì)和構(gòu)想效度思考的深入,這個(gè)議題日益凸顯出來(lái),并在近些年來(lái)的效度探討中成為關(guān)注的核心問(wèn)題之一。爭(zhēng)論雙方各執(zhí)一詞,有待深入分析和探究。
[1]Alderson,J.C.,Clapham,C.,Wall,D.Language Test Construction and Evaluation[M].Cambridge:Cambridge University Press.1995.
[2]Allison,D.Language Testing and Evaluation:An Introductory Course[M].Singapore:Singapore University Press.1999.
[3]American Psychological Association.Standards for educational and psychological tests and manuals[M].Washington,DC:American Psychological Association.1999.
[4]Anastasi,A.Psychological Testing(5th ed.)[M].New York:Macmillan Publishing Co.,Inc.1982.
[5]Anastasi,A.,Urbina.S.Psychological Testing.(7th ed.)[M].New Jersey:Prentice-Hall,Inc.1997.
[6]Bachman,L.F.Fundamental Consideration in Language Testing[M].New York:Oxford University Press.1990.
[7]Bachman,L.F.,Palmer,A.S.Language Testing in Practice[M].New York:Oxford University Press.1996.
[8]Borsboom,D.,Mellenbergh,G.J.Why psychometrics is not pathological:A comment on Michell[J].Theory&Psychology.2004(14):105-120.
[9]Borsboom,D.,Ange’Iique O.J.Cramer;RogierA.Kievit,Annemarie Zand Scholten,Sanja Franic.The End of Construct Validity.The concept of validity:revisions,new directions,and applications[M].edited by Robert W.Lissitz.Information Age Publishing Inc.2009:135-172.
[10]Chapelle,C.A.Construct definition and validity in SLA research.L.F.Bachman and A.D.Cohn(eds.).Interfaces Between Second Language Acquisition and Language Testing Research[M].Cambridge:Cambridge University Press.1998.
[11]Cronbach,L.J.Five perspectives on validation argument.In H.Wainer&H.Braun(Eds),Test validity[M].Hillsdale,NJ:Lawrence Erlbaum.1988:3-17.
[12]Cronbach,L.J.,Meehl.P.E.Construct validity in psychological tests[M].Psychological Bulletin.1955:52,281-302.
[13]Ebel,R.L.,Frisbie,D.A.Essentials of Educational Measurement[M].New Jersey:Prentice-Hall.1991.
[14]Fraenkel J.R.,Wallen,N.E.How to Design and Evaluate Research in Education(2nd ed.)[M].McGraw-Hill,Inc.1993.
[15]Guilford,J.P.New standards for test evaluation[J].Educational and Psycbological Measurement.1946(6):427-439.
[16]Henning,G.A Guide to Language Testing:Development,Evaluation,Research[M].New York:Newbury House Publisher.1987.
[17]Kelley,T.L.Interpretation of educational measurement[M].Yonkers-on-Hudson,NY:World Book Co.1927.
[18]Meehl,P.E.Theoretical risks and tabularasterisks:Sir Karl,Sir Ronald,and the sIowprogress of soft psychology[J].Journal of Consulting and Clinical Psycbology.1978(46):806-834.
[19]Messick,S.Meaning and Values in Test Validation:The Science and Ethics of Assessment[M].Educational Researcher.1989(18):2,5-11.
[20]常曉宇.效度理論的變遷[D].北京語(yǔ)言大學(xué)碩士畢業(yè)論文,2001.
[21]陳宏.效度的基本概念[J].語(yǔ)言測(cè)試的跨學(xué)科探索:北京語(yǔ)言大學(xué)漢語(yǔ)水平考試中心2011年科研報(bào)告會(huì)論文集.北京:華語(yǔ)教學(xué)出版社,2012.
[22]戴海琦,張鋒,陳雪楓.心理與教育測(cè)量[M].廣州:暨南大學(xué)出版社,1999.
[23]杜·舒爾茲,等,著.葉浩生,譯.現(xiàn)代心理學(xué)史(第八版)[M].鳳凰出版?zhèn)髅郊瘓F(tuán),江蘇教育出版社,2005.
[24]桂詩(shī)春,寧春巖.語(yǔ)言學(xué)方法論[M].北京:外語(yǔ)教學(xué)與研究出版社,1997.
[25]凌文輇,濱治世.心理測(cè)驗(yàn)法[M].北京:科學(xué)出版社,1988.
[26]劉潤(rùn)清.語(yǔ)言測(cè)試和它的方法[M].北京:外語(yǔ)教學(xué)與研究出版社,1991.
[27]徐樅巍,許建鉞,等,譯.效度.引自:Huesn,T.,Postlethwaite,T.N.簡(jiǎn)明國(guó)際教育百科全書·教育測(cè)量與評(píng)價(jià)[M].北京:教育科學(xué)出版社,1992.
[28]張凱.測(cè)量是理論的組成部分—再談構(gòu)想效度[J].云南師范大學(xué)學(xué)報(bào)(對(duì)外漢語(yǔ)教學(xué)與研究版),2004(5):7-14.
(責(zé)任編輯 周黎明)
The Dispute in the Field of Validity Research
ZHAO Qifeng
Validity is of the most important concepts in Educational and Psychological Measurement academia.After 60 years,Construct Validity is still an unsettled problem.Based on the previous studies,We discussed three aspects of validity of the present controversy in the field,including the nature of the concept of construct validity,construct validity research perspective and the research methods.We think that by far the construct validity of position in nature,exploring perspectives and methodological aspects are still controversial.This situation need to be rationalized and unified.Researchers need to accept and learn from some of the established disciplines such as physics research ideas and methods.This is an important way to the realization of scientific research for Construct validity.
Construct Validity;Construct;Psychophysics;Causal Analysis
G405
A
1005-8427(2014)06-0011-7
本文系北京語(yǔ)言大學(xué)校級(jí)科研項(xiàng)目資助(中央高?;究蒲袠I(yè)務(wù)專項(xiàng)資金)(項(xiàng)目編號(hào)為13YBB22)。
趙琪鳳,女,北京語(yǔ)言大學(xué)語(yǔ)言科學(xué)學(xué)院漢語(yǔ)水平考試中心博士,副研究員(北京 100083)