国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

顯著性檢驗中“邊緣顯著”的教學思路與要點初探

2020-08-16 14:00黃成毅周海霞
西部論叢 2020年5期
關鍵詞:假設檢驗顯著性邊緣

黃成毅 周海霞

摘 要:初涉研究的大學生容易淪為追“星”族,在畢業(yè)論文中過分強調(diào)統(tǒng)計學意義上的顯著性,常使用“邊緣顯著”來掩蓋研究中的所謂不完美。本文力求從教學的角度,分析其教學邏輯、提煉教學要點,為研究方法類課程的老師提供教學參考,以幫助學生理清“邊緣顯著”的實質,樹立正確的假設檢驗觀。

關鍵詞:邊緣顯著;假設檢驗;α值

引 言

假設檢驗對犯I型錯誤的概率α取值標準歷來爭議很大。為什么α不能是0.06而選擇了0.05,兩者有質的差別么?Rosnow(1989)就曾指出,其實上帝愛0.06就像愛0.05一樣多。在一次判斷中α的標準顯然只能有一個,學界公認的0.05為拒絕H0的臨界值,為什么現(xiàn)在大量研究又將其寬限到0.10甚至更大值?這可謂實踐中“游動的α”(Goodman, 1993)。隨著“邊緣顯著”說法的興起,學術新人更容易標準游離。因此,這需要我們?nèi)チ私猞恋?.05和0.10取值的前世今生,在教學中理清思路和要點,以幫助學生在研究中顯著性水平的合理選擇和表達。

一、理清顯著性檢驗中P和α的關系

首先,學生容易將P和α兩者混淆,因為二者在假設檢驗中有等價的功效,而它們最終又都與是否拒絕H0相關,所以二者含義應該一致。其實,F(xiàn)isher的p<0.05和Neyman-Pearson的α=0.05中的共同數(shù)值0.05,二者的理論來源相異,含義不同。數(shù)α稱為顯著性水平,而p值是顯著性概率。從理論來源來看,α與N-P的假設檢驗理論相關聯(lián),p則與Fisher的顯著性檢驗理論相聯(lián)系(鮑貴,席雁,2010)。因此,教學中應先澄清兩者的關系。

二、簡述0.05顯著標準的歷史由來

Fisher被認為是正式提出這一統(tǒng)計顯著性標準的人。他在1925年《研究者的統(tǒng)計方法》一書中首次將0.05作為具有統(tǒng)計顯著意義的最大可接受值,但他在1926年《田間試驗的安排》一文中又承認確實可用其它值來判斷顯著性。他也曾指出,沒有一個科研工作者擁有一個年復一年,在所有情況下用來拒絕虛無假設的固定顯著性水平,更應關注現(xiàn)實的證據(jù)和自己的想法。所以,這種規(guī)定和劃分并沒有一種絕對的算法和理論,甚至還帶有一定的主觀估計性,但一個合適的概率值被大家認可為是“不太可能發(fā)生”事件,且有一位權威的數(shù)學家正式地提出,那么這種值更容易被接受、延用而成為慣例。但這種“非絕對唯一性”就隱含著日后出現(xiàn)另一“合理范圍取值”的可能性。正如越來越多研究者在接受的“邊緣顯著”這一說法。

三、引發(fā)邊緣顯著“合理性”的質疑

α=0.05仍是最被認可的臨界值,但研究者很容易被這一值所困擾,特別是所得P值只是略大于它時。其實P值很容易受到樣本量、標準差的影響,但通常研究者又不愿意再耗精力去擴大樣本或多次研究。這種愛恨交加下,“邊緣顯著”的出現(xiàn)似乎有它的必然性。雖然研究者不應該迷信和固守于慣例中的顯著性水平,但有學者也指出,嚴格意義上講,統(tǒng)計中只有顯著和不顯著兩種結果,加上極其或邊緣這樣的修飾語是不合適的,即使0.05這個值顯得有些武斷,但這個值還是相對寬松的(Dawn Iacobucci, 2005)。即便允許有高于0.05的水平設置,但也不應該出現(xiàn)“邊緣顯著”這樣的概念。若將這種決斷權部分移交給研究者,必然會引來新的麻煩。如果接受這一發(fā)展趨勢,其容忍的度跟0.05這一標準一樣,也會引發(fā)爭議。

四、明確當前“邊緣顯著”的容忍度

最早對于0.10這一標準可上溯到20世紀初。Kendall(1914)曾指出:“想像一下如果我們接受了P=0.01,無論在什么情況下我們都可以采用這條分界線么?這一概率多大程度會對研究者的決斷產(chǎn)生影響更多取決于研究者的謹慎程度了。有些人會認為這個概率已足以說明問題,其他人則可能更保守而需要更小的值,這是一種個人的取向。

目前邊緣顯著通常用在P值大于0.05,但其值又不超過0.10時。例如,通過對中國知網(wǎng)期刊和學位數(shù)據(jù)庫(2000年后)的搜索,共匯集80篇(國內(nèi))心理學論文。其中共有7篇論文對“邊緣顯著”的劃定不在0.05至0.10的范圍(最小為0.048,最大為0.11)。但國外有報告指出有一例研究的P值達到0.24,但仍將兩組差異歸為邊緣顯著(Dar, etal., 1994)。顯然,研究者的這種寬容態(tài)度不可取。

五、增強P值大于0.05時的理智感

出現(xiàn)“邊緣顯著”的字樣,不管他的α取值是如何的“邊緣”,都應該視他拒絕了H0。而讀者則更要關注研究者是否結合效應量來輔助說明他的最終結論,尤其不能將“邊緣顯著”理解為變量間的關聯(lián)或差異“有些顯著”或者“快要顯著了”。這種“邊緣”本就是相對于傳統(tǒng)的α最大可接受值0.05而言的。

不管用邊緣、趨向,還是接近、幾乎顯著,都應該報告P值、樣本量等,并對為什么在此研究中接受邊緣顯著作出說明,尤其要報告效應量進行合理分析。在討論結果時還可以考慮作方向性的描述,不簡單跟從統(tǒng)計的冰冷數(shù)字作“全或無”的判斷,為讀者傳達出更有啟示性的建議,并有后續(xù)研究的改進措施,推動達成更可靠的結論。這些是老師在作為學生研究引路人之初,以“邊緣”顯著為契機,理應筑牢的科學態(tài)度。

參考文獻

[1] Rosnow, Ralph L. Robert Rosenthal, Statistical Procedures and the Justification of Knowledge in Psychological Science[J]. American Psychologist, 1989,44(10): 1276-1284.

[2] Goodman, S.N.p values, hypothesis tests, and likelihood: Implications for epidemiology of a neglected historical debate[J].American Journal of Epidemiology, 1993, 137, 485-496.

[3] 鮑貴,席雁.統(tǒng)計顯著性檢驗:問題與思考[J].南京工程學院學報(社會科學版),2010,10(04):27-32.

[4] Fisher R A . Theory of Statistical Estimation[J]. Mathematical Proceedings of the Cambridge Philosophical Society, 1925, 22:700-725.

[5] Kendall, & Maurice G. (0). An introduction to the theory of statistics[M]. Charles Griffin,1914.

[6] Dar R , Serlin R C , Omer H . Misuse of statistical test in three decades of psychotherapy research[J]. Journal of Consulting & Clinical Psychology, 1994, 62(1):75-82.

基金項目:重慶三峽學院高等教育教學改革研究項目(JGYB2008)。

猜你喜歡
假設檢驗顯著性邊緣
假設檢驗結果的對立性分析
歐盟法院判決明確歐盟商標通過使用獲得顯著性的地域認定標準
淺談商標的顯著性對于商標應用的影響
商標顯著性的司法判斷(一)
統(tǒng)計推斷的研究
一張圖看懂邊緣計算
基于視覺顯著性的紅外與可見光圖像融合
鳳爪重量質量管理報告
基于改進隱馬爾科夫模型的畜禽全基因組關聯(lián)分析中的多重檢驗方法
在邊緣尋找自我