国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

定量數(shù)據(jù)分析效應(yīng)值研究綜述

2014-02-11 21:00蒲顯偉
統(tǒng)計(jì)與信息論壇 2014年11期
關(guān)鍵詞:方差研究者顯著性

蒲顯偉

(南京理工大學(xué) 外國語學(xué)院,江蘇 南京210094)

一、效應(yīng)值研究緣由

近20年來,國外學(xué)者對(duì)定量數(shù)據(jù)分析效應(yīng)值展開了大量研究,該領(lǐng)域的研究在很大程度上是為了應(yīng)對(duì)零假設(shè)顯著性檢驗(yàn)存在的問題。零假設(shè)顯著性檢驗(yàn)產(chǎn)生于20世紀(jì)二三十年代,之后被廣泛地應(yīng)用于社會(huì)學(xué)、教育學(xué)、心理學(xué)、語言學(xué)等人文社會(huì)科學(xué)的定量研究中(Kirk,1996)。顯著性檢驗(yàn)一經(jīng)提出,就有學(xué)者指出其存在的問題。Joseph Berkson于1938年在美國統(tǒng)計(jì)學(xué)會(huì)期刊上發(fā)表了《卡方檢驗(yàn)中的一些解釋困難》一文,對(duì)顯著性檢驗(yàn)的內(nèi)在邏輯和檢驗(yàn)效力提出了挑戰(zhàn)(Kirk,1996;Cohen,1994;Sun,2010)。近年來,國外研究者對(duì)顯著性檢驗(yàn)的批評(píng)更加猛烈,主要包括以下幾點(diǎn):

第一,顯著性檢驗(yàn)的結(jié)果與所要知道的研究結(jié)果背道而馳(Cohen,1994;Lawson Hall,2010)。研究者真正想要知道的是P(H0|D)在給定樣本的情況下零假設(shè)成立的概率,而顯著性檢驗(yàn)所揭示的是P(D|H0)在零假設(shè)成立的情況下樣本發(fā)生的概率。

第二,顯著性檢驗(yàn)受樣本容量的影響較大(Ellis,2010)。統(tǒng)計(jì)顯著性檢驗(yàn)是研究多個(gè)因素相互作用的結(jié)果,如總體的效應(yīng)值、樣本容量和alpha值等,其中樣本大小起著極為重要的作用。Pearson和Hartley在1962年出版的Biometrika Tables for Statisticians一書中列出了在相關(guān)關(guān)系檢驗(yàn)中要使檢驗(yàn)結(jié)果具有統(tǒng)計(jì)顯著性樣本大小與相關(guān)系數(shù)r臨界值的關(guān)系。當(dāng)樣本容量為10時(shí),相關(guān)系數(shù)r必須達(dá)到0.632,檢驗(yàn)結(jié)果才具有顯著性;當(dāng)樣本容量為500時(shí),相關(guān)系數(shù)r只需達(dá)到0.088,因此,只要樣本足夠大,任何研究都能產(chǎn)生顯著性結(jié)果。

第三,以點(diǎn)為界的二分決策容易使研究者產(chǎn)生誤解(Cohen,1994;Rosnow& Rosenthal,2003)。統(tǒng)計(jì)結(jié)果判斷的臨界點(diǎn)(p=0.05或0.001)是人為設(shè)定的,但許多研究者把這一臨界點(diǎn)作為判斷是非的客觀標(biāo)準(zhǔn),甚至把臨界點(diǎn)神圣化了。研究者普遍認(rèn)為,當(dāng)p值從0.05增加到0.06時(shí)所發(fā)生的變化是巨大的,或者p=0.001比p=0.05的結(jié)果更具顯著性。然而如前所述,顯著性檢驗(yàn)的是P(D|H0)在零假設(shè)成立的情況下樣本發(fā)生的概率,而p=0.049的結(jié)果并不比p=0.051的結(jié)果更加重要。

第四,研究者對(duì)顯著性檢驗(yàn)還有其他方面的錯(cuò)誤理解,其中最為普遍的是把統(tǒng)計(jì)顯著性與實(shí)際顯著性等同,并認(rèn)為顯著性水平是能夠成功復(fù)制該研究概率的(Lawson-Hall,2010;Field,2005;Volker,2006)。然而,顯著性水平只表示在零假設(shè)成立的情況下樣本發(fā)生的概率,效應(yīng)值才能表明研究結(jié)果的實(shí)際重要性,檢驗(yàn)功效才表示成功復(fù)制的概率。

由于顯著性檢驗(yàn)存在的問題,國外有學(xué)者建議禁止使用顯著性檢驗(yàn),認(rèn)為顯著性檢驗(yàn)不僅沒有促進(jìn)反而嚴(yán)重阻礙了心理科學(xué)的發(fā)展。但也有研究者持相反的觀點(diǎn),認(rèn)為雖然顯著性檢驗(yàn)有其內(nèi)在的缺陷,但大多數(shù)問題是由于研究者對(duì)其錯(cuò)誤的理解和運(yùn)用而產(chǎn)生的。顯著性檢驗(yàn)并非完全無用,至少它能證明某一個(gè)試驗(yàn)結(jié)果是否由抽樣誤差而產(chǎn)生的。更多的研究者持比較中立的觀點(diǎn),建議在定量研究結(jié)果中增加效應(yīng)值的報(bào)告作為對(duì)顯著性檢驗(yàn)的補(bǔ)充(Cohen,1994;Volker,2006)。

二、效應(yīng)值研究意義

效應(yīng)值是量化樣本結(jié)果與零假設(shè)預(yù)期偏離程度的獨(dú)立于測(cè)量尺度的統(tǒng)計(jì)量,能直觀地表明組間差異的大小或變量之間關(guān)系的強(qiáng)弱,代表研究結(jié)果的實(shí)際顯著性(Ellis,2010)。效應(yīng)值的報(bào)告不僅是許多研究者的建議,而且是一些學(xué)會(huì)和期刊編輯的要求。早在1994年,美國心理學(xué)會(huì)APA格式手冊(cè)第4版就“鼓勵(lì)”研究者提供效應(yīng)值的信息。隨著關(guān)于顯著性檢驗(yàn)的爭(zhēng)論日趨激烈,美國心理學(xué)會(huì)又成立了一個(gè)推斷統(tǒng)計(jì)小組以研究和解決包括顯著性檢驗(yàn)在內(nèi)的關(guān)于統(tǒng)計(jì)應(yīng)用的一些有爭(zhēng)議的問題。專門小組的研究結(jié)果于1999年在American Psychologist期刊上發(fā)表,同時(shí)小組建議對(duì)APA格式手冊(cè)第4版關(guān)于統(tǒng)計(jì)的章節(jié)進(jìn)行修改。2001年APA格式手冊(cè)第5版進(jìn)一步“建議”研究者在報(bào)告顯著性檢驗(yàn)結(jié)果的同時(shí)報(bào)告效應(yīng)值。到了2010年,APA格式手冊(cè)第6版則“要求”研究者報(bào)告效應(yīng)值。2006年美國教育研究學(xué)會(huì)也發(fā)表文章,要求其旗下期刊刊登的文章必須報(bào)告效應(yīng)值。目前,國外不同研究領(lǐng)域近30種期刊,如Contemporary Educational Psychology、Journal of Experimental Education、Language Learning 等,也在其編輯方針中對(duì)定量研究效應(yīng)值報(bào)告作出了明確要求。

國外研究者對(duì)效應(yīng)值在實(shí)際運(yùn)用方面的重要性也作了大量介紹。第一,效應(yīng)值能直觀地表明組間差異的大小或變量之間關(guān)系的強(qiáng)弱,代表研究結(jié)果的實(shí)際顯著性(Sun,2010;Volker,2006)。在顯著性檢驗(yàn)中,當(dāng)p值小于0.05時(shí)零假設(shè)被拒絕,備擇假設(shè)被接受,即樣本與樣本或樣本與總體之間存在差異。然而,差異到底有多大和是否具有實(shí)際意義則無從知曉,而效應(yīng)值就是表示這一差異大小的指標(biāo)。第二,效應(yīng)值可以幫助研究者在實(shí)驗(yàn)前估計(jì)出要使研究具有統(tǒng)計(jì)顯著性所需要的樣本容量(Ellis,2010;Lawson-Hall,2010)。在實(shí)驗(yàn)前確定了效應(yīng)值、alpha值和實(shí)驗(yàn)的功效,就能大致估計(jì)出要使研究結(jié)果具有統(tǒng)計(jì)顯著性所需要樣本的大小。第三,效應(yīng)值是功效分析中不可或缺的參數(shù)(Ellis,2010;Lawson-Hall,2010)。在試驗(yàn)的樣本大小、alpha值和效應(yīng)值已知的情況下,研究者就可以計(jì)算出試驗(yàn)的檢驗(yàn)功效。

效應(yīng)值也是元分析中不可或缺的參數(shù)。元分析是對(duì)眾多現(xiàn)有的關(guān)于同一主題的實(shí)證文獻(xiàn)的再次分析,從而根據(jù)獲得的統(tǒng)計(jì)顯著性等來分析變量之間真實(shí)的相關(guān)關(guān)系。元分析需要的參數(shù)包括效應(yīng)值和樣本容量,而目前很多研究并未直接給出研究結(jié)果的效應(yīng)值,所以元分析者只能根據(jù)其他的統(tǒng)計(jì)量,如t值、F值、χ2值等計(jì)算每個(gè)檢驗(yàn)的效應(yīng)值,這種計(jì)算方法比通過原始數(shù)據(jù)(如均值、方差)計(jì)算效應(yīng)值的誤差更大。因此,效應(yīng)值的報(bào)告不僅能節(jié)省元分析者處理數(shù)據(jù)的時(shí)間,而且能提高元分析的準(zhǔn)確性。

三、效應(yīng)值的分類、計(jì)算和解釋

目前,定量研究中所使用的效應(yīng)值超過70多個(gè)。Lawson-Hall把這些數(shù)目眾多的效應(yīng)值分為兩類:組間差異類(d類)和相關(guān)關(guān)系類(r類)。d類效應(yīng)值以Cohen’s d為代表,以標(biāo)準(zhǔn)分的形式量化組間均值差異,如d=0.5時(shí)表示組間均值差為0.5個(gè)標(biāo)準(zhǔn)分,而其他常用的組間差異類效應(yīng)值還包括 Hedge’s g和 Glass’sΔ;r類效應(yīng)值以皮爾森相關(guān)系數(shù)r為代表,兩個(gè)變量之間的關(guān)系越緊密相關(guān)系數(shù)就越大。除r之外,這類效應(yīng)值還包括各類平方形式的統(tǒng)計(jì)量,如R2,ω2,ε2,η2,η2p等。d 和r這兩類效應(yīng)值是可以互相轉(zhuǎn)換的,有些研究者更傾向于使用r類效應(yīng)值,認(rèn)為r類效應(yīng)值比d類效應(yīng)值更為直觀,更容易被理解。

部分學(xué)者在統(tǒng)計(jì)學(xué)專著和發(fā)表的文章中比較系統(tǒng)詳細(xì)地介紹了定量數(shù)據(jù)分析中常用的參數(shù)和非參數(shù)檢驗(yàn)效應(yīng)值的計(jì)算方法(Lawson-Hall,2010;Field,2005;Volker,2006;Cohen,1988;Ferguson,2009)。需注意的是,每種常用的檢驗(yàn)方法通常會(huì)有計(jì)算方法不同的多個(gè)效應(yīng)值,因此研究者應(yīng)根據(jù)自己的研究設(shè)計(jì)和數(shù)據(jù)特征選用合適的效應(yīng)值。以t檢驗(yàn)為例,常用的效應(yīng)值包括Cohen’s d、Glass’sΔ和 Hedge’s g。Cohen’s d計(jì)算公式為(μ1+μ2)/σ,即用兩組均值差除以總體的方差,而總體的方差難以知曉,故在實(shí)際研究中一般用樣本方差來代替總體方差。當(dāng)兩個(gè)組樣本容量和方差相似時(shí),可用兩組的平均方差來代替總體方差,計(jì)算出的效應(yīng)值為Cohen’s d;當(dāng)兩組樣本容量相似但方差有較大差異時(shí),可用控制組方差代替總體方差,因?yàn)榭刂平M沒有接受實(shí)驗(yàn)處理,其方差相比實(shí)驗(yàn)組更接近總體方差,此時(shí)計(jì)算出的效應(yīng)值為Glass’sΔ。當(dāng)兩組樣本容量差異較大時(shí),可用按樣本容量加權(quán)處理后的平均方差來代替總體方差,計(jì)算出的效應(yīng)值為Hedge’s g。不同方法計(jì)算出的效應(yīng)值大小或多或少會(huì)有所不同。另一需要注意的問題是,單因素方差分析的效應(yīng)值可以用η2或η2p表示,但SPSS軟件包并不直接輸出η2值,而是η2p值,因此對(duì)統(tǒng)計(jì)檢驗(yàn)不太熟悉的研究者可能會(huì)混淆兩者的差異。有研究表明,方差分析中的η2p值通常比η2值偏大,自變量越多,兩者之間差異越大,因此解釋?duì)?p值需要謹(jǐn)慎。常用的參數(shù)和非參數(shù)檢驗(yàn)效應(yīng)值中有一些是SPSS可以直接輸出的,而其他的效應(yīng)值則需要通過SPSS輸出結(jié)果中包含的描述性數(shù)據(jù)(如均值、方差等)和檢驗(yàn)統(tǒng)計(jì)量(如t值、F值、χ2值等)來進(jìn)行計(jì)算。

在效應(yīng)值的解釋方面,目前大多數(shù)研究者采用的是Cohen提出的經(jīng)驗(yàn)法則(Cohen,1988)。以兩類效應(yīng)值最基本的代表d和r為例,當(dāng)d小于0.2或r小于0.1時(shí),效應(yīng)值可忽略不計(jì);當(dāng)d大于0.2小于0.5或r大于0.1小于0.3時(shí)為較小的效應(yīng)值;當(dāng)d在0.5到0.8之間或r在0.3到0.5之間時(shí)是中等效應(yīng)值;當(dāng)d大于0.8或r大于0.5時(shí)為較大效應(yīng)值。這些標(biāo)準(zhǔn)是Cohen根據(jù)多年的研究經(jīng)驗(yàn)總結(jié)出的,一些研究者認(rèn)為還是比較準(zhǔn)確的,但也有研究者對(duì)這些標(biāo)準(zhǔn)提出了質(zhì)疑(Sun,2010)。Ferguson在對(duì)前人研究進(jìn)行分析后總結(jié)出的社會(huì)學(xué)領(lǐng)域的解釋標(biāo)準(zhǔn)比Cohen的標(biāo)準(zhǔn)要大很多,d=0.41、1.15和2.70分別為小、中、大效應(yīng)值標(biāo)準(zhǔn)(Ferguson,2009);Oswald在比較了第二語言習(xí)得領(lǐng)域的27個(gè)元分析研究后提出的效應(yīng)值標(biāo)準(zhǔn)分別為d =0.40、0.70和1.00(Oswald& Plonsky,2010);而Olejnik對(duì)教育學(xué)領(lǐng)域前人研究的分析表明較大的效應(yīng)值在0.246到0.372之間,這比Cohen的標(biāo)準(zhǔn)要小很多(Olejnik&Algina,2000)。用統(tǒng)一的標(biāo)準(zhǔn)去解釋不同學(xué)科領(lǐng)域不同設(shè)計(jì)所研究的實(shí)際顯著性理論,則很難不令人產(chǎn)生質(zhì)疑。Rosnow在其文章中列舉了一個(gè)關(guān)于服用阿司匹林對(duì)于心臟病預(yù)防效果的研究,該研究的效應(yīng)值僅為r=0.034,這表明相對(duì)于對(duì)照組,實(shí)驗(yàn)組服用阿司匹林能降低3.4%的心臟病發(fā)作幾率(Rosnow &Rosenthal,2003)??紤]到阿司匹林服用的方便、安全和價(jià)格的低廉與心臟病發(fā)作對(duì)人體健康和生命的威脅及治療費(fèi)用的昂貴,無法否認(rèn)0.034的效應(yīng)值具有非常重要的實(shí)際意義。

因此,研究者在解釋定量數(shù)據(jù)分析研究結(jié)果效應(yīng)值時(shí)不能機(jī)械地照搬Cohen提出的標(biāo)準(zhǔn),而應(yīng)結(jié)合自己的研究領(lǐng)域、研究設(shè)計(jì)和研究結(jié)果,將自己研究結(jié)果的效應(yīng)值與同領(lǐng)域前人研究結(jié)果的效應(yīng)值進(jìn)行對(duì)比分析和解釋,同時(shí)報(bào)告效應(yīng)值的置信區(qū)間。這樣,經(jīng)過不斷積累和元分析者的努力,各個(gè)研究領(lǐng)域就能制定出適合自身特點(diǎn)的效應(yīng)值解釋標(biāo)準(zhǔn),而機(jī)械地照搬Cohen提出的效應(yīng)值解釋標(biāo)準(zhǔn),則會(huì)又一次陷入顯著性檢驗(yàn)以點(diǎn)為界二分決策的錯(cuò)誤中。

四、效應(yīng)值報(bào)告與解釋研究現(xiàn)狀

APA格式手冊(cè)第4版和第5版出版后,國外研究者對(duì)效應(yīng)值的報(bào)告與解釋現(xiàn)狀展開了大量研究,目的之一是為了考察APA格式手冊(cè)效應(yīng)值報(bào)告的“建議”和美國教育研究學(xué)會(huì)(AERA)的實(shí)證研究報(bào)告指導(dǎo)方針對(duì)定量研究效應(yīng)值報(bào)告現(xiàn)狀的影響。國外關(guān)于效應(yīng)值報(bào)告現(xiàn)狀的研究主要集中在教育學(xué)和心理學(xué)領(lǐng)域,因?yàn)樯鲜鰞蓚€(gè)學(xué)會(huì)對(duì)這兩個(gè)學(xué)科領(lǐng)域的研究者具有較大的影響。

國外對(duì)效應(yīng)值報(bào)告現(xiàn)狀的研究最早開始于1996年。Kirk對(duì)美國心理學(xué)會(huì)的4種心理學(xué)期刊1995年發(fā)表的定量文章進(jìn)行了分析,發(fā)現(xiàn)4種期刊中報(bào)告效應(yīng)值的文章比例由低到高分別為12%、47%、55%、77%(kirk,1996)。Vacha-Haase研究了兩種心理學(xué)期刊于1990—1997年間發(fā)表文章的效應(yīng)值報(bào)告情況(Vacha-Haase,2000)。在這一時(shí)期,兩種期刊報(bào)告效應(yīng)值的文章比例并沒有明顯的上升趨勢(shì),因此認(rèn)為APA格式手冊(cè)第4版的建議對(duì)于效應(yīng)值的報(bào)告現(xiàn)狀并沒有產(chǎn)生較大的影響。Alhijia對(duì)10種教育學(xué)領(lǐng)域的期刊(其中5種明確要求匯報(bào)效應(yīng)值)于2003—2004年間發(fā)表的共99篇定量文章進(jìn)行了對(duì)比分析,發(fā)現(xiàn)兩類期刊在效應(yīng)值報(bào)告比例上沒有統(tǒng)計(jì)顯著性差異,分別為69%和57%(Alhijia&Levy,2009)。具體到不同的統(tǒng)計(jì)檢驗(yàn)方法,兩類期刊文章對(duì)相關(guān)分析效應(yīng)值的報(bào)告比例均為100%,比例最低的是卡方分析,分別為38%和17%。在報(bào)告了效應(yīng)值的文章中,兩類期刊分別有56%和69%的文章對(duì)所使用的效應(yīng)值進(jìn)行了解釋。Sun研究了14種教育學(xué)和心理學(xué)期刊于2005—2007年間發(fā)表的1 243篇文章的效應(yīng)值報(bào)告與解釋現(xiàn)狀,發(fā)現(xiàn)僅有49%的文章報(bào)告了效應(yīng)值,其中又僅有57%的文章解釋了效應(yīng)值(Sun,2010)。這些期刊效應(yīng)值的報(bào)告與解釋在出版年份上(2005—2007年)均沒有統(tǒng)計(jì)顯著性。Peng綜述了1996—2010年間發(fā)表的32篇效應(yīng)值報(bào)告的相關(guān)文章,共包括116種教育學(xué)和心理學(xué)期刊,分析顯示自1999年后,效應(yīng)值的報(bào)告比例、報(bào)告的效應(yīng)值類型、效應(yīng)值的解釋、置信區(qū)間和效應(yīng)值報(bào)告的完整性方面都有所提升,同時(shí)也指出了效應(yīng)值報(bào)告方面存在的問題,如過度使用Cohen’s d,使效應(yīng)值和統(tǒng)計(jì)方法之間缺乏聯(lián)系(Peng,2013)。

目前,其他學(xué)科領(lǐng)域還沒有對(duì)效應(yīng)值的報(bào)告現(xiàn)狀進(jìn)行專門研究。在應(yīng)用語言學(xué)領(lǐng)域,Plonsky對(duì)Language Learning 和 Studies in Second Language Acquisition兩種期刊發(fā)表的606篇定量文章的研究質(zhì)量進(jìn)行了綜述(1990—2010年),并對(duì)效應(yīng)值的報(bào)告作了簡(jiǎn)單統(tǒng)計(jì),結(jié)果表明在前10年中(1990—1999年)僅有4%的文章報(bào)告了效應(yīng)值,后10年中(2000—2010年)這一比例上升到49%,20年的平均比例為26%(Plonsky,2014)。

上述研究在方法上存在兩個(gè)問題:第一,某些統(tǒng)計(jì)檢驗(yàn)方法所輸出的結(jié)果,如相關(guān)分析的r值本身既是統(tǒng)計(jì)量又是效應(yīng)值,而有些文章的作者是否明確知道該統(tǒng)計(jì)量同時(shí)也是效應(yīng)值則不得而知,因此上述研究所報(bào)告的比例可能偏大;第二,上述研究大多是以文章作為分析單位。Peng綜述的32個(gè)研究中27個(gè)是以文章為分析單位,只有5個(gè)是以統(tǒng)計(jì)檢驗(yàn)方法或統(tǒng)計(jì)量為分析單位(Peng,2013)。大多數(shù)的定量分析文章都采用了一個(gè)以上的統(tǒng)計(jì)檢驗(yàn)方法,而有些作者只報(bào)告了其中一部分檢驗(yàn)方法結(jié)果的效應(yīng)值,故上述研究所報(bào)告的比例可能不準(zhǔn)確。因此,筆者以統(tǒng)計(jì)檢驗(yàn)方法為單位,初步分析了國外應(yīng)用語言學(xué)領(lǐng)域的6種期刊(其中3種明確要求定量分析文章報(bào)告效應(yīng)值)發(fā)表于2012—2014年間約150多篇文章(共約240個(gè)檢驗(yàn)方法)效應(yīng)值的報(bào)告情況。結(jié)果發(fā)現(xiàn),兩種期刊在效應(yīng)值的報(bào)告比例上分別為78%和51%,有統(tǒng)計(jì)顯著性差異(χ2=19.06,p=0.000,OR=3.39,CI 95% =1.87-6.17),而明確報(bào)告(即文章中明確提到效應(yīng)值或效應(yīng)值與統(tǒng)計(jì)量不同)效應(yīng)值比例的分別為50%和31%,分別降低了28%和20%。

上述關(guān)于效應(yīng)值報(bào)告的研究發(fā)現(xiàn),盡管效應(yīng)值的報(bào)告比例在慢慢增加,但APA格式手冊(cè)第4、第5版對(duì)效應(yīng)值報(bào)告的“建議”并沒有產(chǎn)生非常顯著的影響。這種結(jié)果可能有如下幾方面原因:第一,APA格式手冊(cè)第4、第5版關(guān)于效應(yīng)值報(bào)告的措辭比較溫和,僅僅是建議而不具有強(qiáng)制性;第二,顯著性檢驗(yàn)已經(jīng)在社會(huì)科學(xué)領(lǐng)域廣泛運(yùn)用了幾十年,單純以p值大小來判斷研究結(jié)果的方法已經(jīng)根深蒂固,傳統(tǒng)很難改變;第三,很少有統(tǒng)計(jì)學(xué)教材對(duì)效應(yīng)值進(jìn)行介紹,因此很多研究者對(duì)效應(yīng)值并不熟悉;第四,也有研究者認(rèn)為效應(yīng)值的報(bào)告并不是解決顯著性檢驗(yàn)問題的萬靈藥,也并不能直觀地表明組間差異的大小,比如d=0.5表示兩個(gè)組的均值差為0.5個(gè)標(biāo)準(zhǔn)分,或?qū)嶒?yàn)組的平均數(shù)位于對(duì)照組平均數(shù)的第79個(gè)百分位,或者兩個(gè)組分布 不重疊部分 為 47.4%(Sun,2010;Olejnik,2000)。這些數(shù)據(jù)對(duì)于不熟悉統(tǒng)計(jì)學(xué)的研究者來說很難理解,而且0.5個(gè)標(biāo)準(zhǔn)分的差異到底是多大也取決于研究所采用的測(cè)量方法。

APA格式手冊(cè)第6版已于2010年出版。不同于第4、第5版對(duì)效應(yīng)值報(bào)告的“建議”,第6版明確“要求”定量數(shù)據(jù)分析文章報(bào)告效應(yīng)值。目前,還沒有研究者研究第6版對(duì)效應(yīng)值的報(bào)告與解釋現(xiàn)狀的影響,可能是因?yàn)檫@種“要求”的影響要相對(duì)較長時(shí)間才能體現(xiàn)。另外,很多期刊從投稿到文章發(fā)表周期較長,最近兩年刊登的文章很多是在2010—2011年撰寫的。

五、中國效應(yīng)值研究現(xiàn)狀

中國對(duì)效應(yīng)值的研究開始于2000年后,也僅有少數(shù)研究者在其發(fā)表的文章中介紹或提到了效應(yīng)值(權(quán)朝魯,2003;張少林,2009;焦璨,2010;楊貴軍,2012)。權(quán)朝魯介紹了效果量在心理學(xué)研究中的意義以及評(píng)價(jià)效果量大小的標(biāo)準(zhǔn),特別介紹了d、和幾個(gè)效果量的測(cè)定方法,并提出了提高效果量的措施。最近5年國內(nèi)關(guān)于效應(yīng)值研究的文章有增多的趨勢(shì),發(fā)表在國內(nèi)核心期刊上的相關(guān)文章有近10篇。張少林討論了中國外語定量研究長期忽略效應(yīng)幅度的現(xiàn)象及原因,闡述了效應(yīng)幅度的概念、意義及其與顯著性水平、概率和樣本容量的關(guān)系,并介紹了幾種用于推斷統(tǒng)計(jì)方法效應(yīng)幅度的計(jì)算程序與判斷標(biāo)準(zhǔn)。在效應(yīng)值的報(bào)告現(xiàn)狀方面,國內(nèi)還沒有人進(jìn)行專門的研究。焦璨對(duì)《心理學(xué)報(bào)》和《心理科學(xué)》兩種期刊于1998—2008年間發(fā)表的文章所采用的統(tǒng)計(jì)方法進(jìn)行了元分析,目的是為了了解國內(nèi)心理學(xué)研究領(lǐng)域最常用的統(tǒng)計(jì)方法及運(yùn)用中存在的問題,發(fā)現(xiàn)兩種期刊報(bào)告效果量的文章分別為30篇和21篇,均僅占所分析文章總數(shù)的1.6%。因此,呼吁中國心理學(xué)會(huì)應(yīng)更加重視效果量的報(bào)告,這種現(xiàn)狀的改變也需要中國心理學(xué)會(huì)、心理統(tǒng)計(jì)學(xué)者、教材編寫者和期刊編輯的共同努力,以使廣大的心理學(xué)研究者和心理學(xué)系的學(xué)生普遍接受效果量的報(bào)告。

六、研究趨勢(shì)與建議

近20年來,國內(nèi)外對(duì)定量數(shù)據(jù)分析效應(yīng)值的研究日趨豐富,研究重點(diǎn)涵蓋了效應(yīng)值的重要性、效應(yīng)值的計(jì)算方法、效應(yīng)值的解釋標(biāo)準(zhǔn)和效應(yīng)值的報(bào)告現(xiàn)狀。效應(yīng)值的研究有如下方面值得進(jìn)一步探討:第一,教育學(xué)和心理學(xué)之外其他學(xué)科領(lǐng)域?qū)π?yīng)值的研究。國內(nèi)外效應(yīng)值的研究主要集中在上述兩個(gè)學(xué)科領(lǐng)域,這是因?yàn)槊绹睦韺W(xué)會(huì)APA格式手冊(cè)和美國教育研究學(xué)會(huì)指導(dǎo)方針對(duì)這兩個(gè)領(lǐng)域的研究者影響較大,近年來其他學(xué)科如應(yīng)用語言學(xué)已有學(xué)者開始對(duì)效應(yīng)值展開研究;第二,不同科學(xué)領(lǐng)域效應(yīng)值解釋標(biāo)準(zhǔn)研究。目前,絕大多數(shù)研究者都是采用Cohen提出的經(jīng)驗(yàn)法則來解釋自己研究結(jié)果,因?yàn)楹茈y找到其他可供借鑒的標(biāo)準(zhǔn),但是相同的效應(yīng)值對(duì)于不同研究領(lǐng)域可能具有不同的實(shí)際意義,因此各學(xué)科的研究者應(yīng)對(duì)自己領(lǐng)域的研究進(jìn)行更多的元分析,以總結(jié)出適合自己學(xué)科甚至學(xué)科之內(nèi)不同研究方向的效應(yīng)值大小標(biāo)準(zhǔn);第三,APA格式手冊(cè)第6版出版后效應(yīng)值報(bào)告現(xiàn)狀研究。2010年APA格式手冊(cè)第6版出版到現(xiàn)在僅過了3年時(shí)間,因此目前還沒有相關(guān)文章的出現(xiàn),預(yù)計(jì)教育學(xué)、心理學(xué)甚至其他學(xué)科領(lǐng)域會(huì)有考察APA格式手冊(cè)第6版效應(yīng)值報(bào)告“要求”的對(duì)效應(yīng)值報(bào)告現(xiàn)狀影響的研究。

改善效應(yīng)值報(bào)告現(xiàn)狀需要期刊編輯、研究者、統(tǒng)計(jì)學(xué)者和統(tǒng)計(jì)學(xué)教師的共同努力。建議更多的期刊編輯在投稿要求中增加對(duì)定量研究效應(yīng)值的報(bào)告要求,期刊編輯是改變效應(yīng)值報(bào)告現(xiàn)狀的主導(dǎo)力量,他們對(duì)效應(yīng)值報(bào)告的要求能產(chǎn)生連鎖反應(yīng);文章作者會(huì)相應(yīng)改變對(duì)研究結(jié)果的推斷和報(bào)告方法;統(tǒng)計(jì)學(xué)專著作者會(huì)修改其出版物;統(tǒng)計(jì)學(xué)教師也會(huì)相應(yīng)改變課程內(nèi)容加入對(duì)效應(yīng)值的介紹。

從事定量分析的研究者也需要在研究方法和研究結(jié)果報(bào)告等多方面作出改變,如在試驗(yàn)前確定一個(gè)大致的效應(yīng)值推斷出研究所需要的樣本大小;數(shù)據(jù)處理前對(duì)數(shù)據(jù)進(jìn)行探索分析從而選擇合適的統(tǒng)計(jì)檢驗(yàn)方法,計(jì)算相應(yīng)結(jié)果的效應(yīng)值;詳細(xì)報(bào)告研究設(shè)計(jì)和各種描述性統(tǒng)計(jì)量可使效應(yīng)值的選擇和計(jì)算更加準(zhǔn)確;報(bào)告所有統(tǒng)計(jì)檢驗(yàn)方法結(jié)果的效應(yīng)值,包括統(tǒng)計(jì)顯著性大于臨界值的統(tǒng)計(jì)結(jié)果,因?yàn)槭苎芯繕颖救萘康挠绊?,研究結(jié)果的統(tǒng)計(jì)顯著性和實(shí)際顯著性很多時(shí)候并不完全匹配;報(bào)告效應(yīng)值的置信區(qū)間以提高效應(yīng)值估計(jì)的準(zhǔn)確性;對(duì)選用的效應(yīng)值的含義、計(jì)算方法等給予適當(dāng)?shù)恼f明;對(duì)效應(yīng)值結(jié)果大小給予明確的解釋,提供解釋標(biāo)準(zhǔn)的參考文獻(xiàn),并同相似研究報(bào)告的效應(yīng)值進(jìn)行對(duì)比分析等。

統(tǒng)計(jì)學(xué)專著作者和統(tǒng)計(jì)學(xué)教師對(duì)于改變效應(yīng)值的報(bào)告現(xiàn)狀也起著非常重要的作用。目前,國外已有一些統(tǒng)計(jì)學(xué)出版物和統(tǒng)計(jì)學(xué)課程加入了對(duì)效應(yīng)值的介紹,而國內(nèi)這方面基本還是空白,需要極大的改善。廣大的在校碩士博士研究生和青年學(xué)者是未來學(xué)術(shù)領(lǐng)域的主力軍,傳授給他們更為科學(xué)的數(shù)據(jù)分析方法,當(dāng)他們成為各自領(lǐng)域?qū)W術(shù)骨干時(shí),效應(yīng)值的報(bào)告狀況就會(huì)產(chǎn)生量到質(zhì)的變化。

只有通過期刊編輯、定量數(shù)據(jù)研究者、統(tǒng)計(jì)學(xué)者和統(tǒng)計(jì)學(xué)教師的共同努力,我們才能走出對(duì)顯著性檢驗(yàn)的迷戀,從而對(duì)數(shù)據(jù)作出更為科學(xué)的解釋。

猜你喜歡
方差研究者顯著性
高等教育中的學(xué)生成為研究者及其啟示
概率與統(tǒng)計(jì)(2)——離散型隨機(jī)變量的期望與方差
本刊對(duì)論文中有關(guān)統(tǒng)計(jì)學(xué)表達(dá)的要求
方差越小越好?
計(jì)算方差用哪個(gè)公式
研究者稱,經(jīng)CRISPR技術(shù)編輯過的雙胞胎已出生??茖W(xué)將如何回應(yīng)?
基于顯著性權(quán)重融合的圖像拼接算法
研究者調(diào)查數(shù)據(jù)統(tǒng)計(jì)
方差生活秀
一種基于詞袋模型的新的顯著性目標(biāo)檢測(cè)方法
灌云县| 江油市| 固阳县| 乌审旗| 蓝田县| 武平县| 焉耆| 安顺市| 卢氏县| 米脂县| 花莲县| 迁西县| 镇江市| 盐城市| 南昌县| 登封市| 公安县| 万山特区| 博客| 新疆| 怀化市| 瓮安县| 金川县| 仙桃市| 黄浦区| 锦屏县| 金湖县| 青河县| 汶上县| 托克逊县| 博爱县| 永靖县| 明溪县| 芦山县| 翁牛特旗| 衡东县| 乌鲁木齐市| 漳平市| 安义县| 于都县| 东丰县|