顯著性檢驗中“邊緣顯著”的教學思路與要點初探

2020-08-16 14:00黃成毅周海霞

西部論叢 2020年5期

黃成毅周海霞

摘要：初涉研究的大學生容易淪為追“星”族，在畢業(yè)論文中過分強調(diào)統(tǒng)計學意義上的顯著性，常使用“邊緣顯著”來掩蓋研究中的所謂不完美。本文力求從教學的角度，分析其教學邏輯、提煉教學要點，為研究方法類課程的老師提供教學參考，以幫助學生理清“邊緣顯著”的實質，樹立正確的假設檢驗觀。

關鍵詞：邊緣顯著;假設檢驗;α值

引言

假設檢驗對犯I型錯誤的概率α取值標準歷來爭議很大。為什么α不能是0.06而選擇了0.05，兩者有質的差別么？Rosnow（1989）就曾指出，其實上帝愛0.06就像愛0.05一樣多。在一次判斷中α的標準顯然只能有一個，學界公認的0.05為拒絕H0的臨界值，為什么現(xiàn)在大量研究又將其寬限到0.10甚至更大值？這可謂實踐中“游動的α”（Goodman， 1993）。隨著“邊緣顯著”說法的興起，學術新人更容易標準游離。因此，這需要我們?nèi)チ私猞恋?.05和0.10取值的前世今生，在教學中理清思路和要點，以幫助學生在研究中顯著性水平的合理選擇和表達。

一、理清顯著性檢驗中P和α的關系

首先，學生容易將P和α兩者混淆，因為二者在假設檢驗中有等價的功效，而它們最終又都與是否拒絕H0相關，所以二者含義應該一致。其實，F(xiàn)isher的p<0.05和Neyman-Pearson的α=0.05中的共同數(shù)值0.05，二者的理論來源相異，含義不同。數(shù)α稱為顯著性水平，而p值是顯著性概率。從理論來源來看，α與N-P的假設檢驗理論相關聯(lián)，p則與Fisher的顯著性檢驗理論相聯(lián)系（鮑貴，席雁，2010）。因此，教學中應先澄清兩者的關系。

二、簡述0.05顯著標準的歷史由來

Fisher被認為是正式提出這一統(tǒng)計顯著性標準的人。他在1925年《研究者的統(tǒng)計方法》一書中首次將0.05作為具有統(tǒng)計顯著意義的最大可接受值，但他在1926年《田間試驗的安排》一文中又承認確實可用其它值來判斷顯著性。他也曾指出，沒有一個科研工作者擁有一個年復一年，在所有情況下用來拒絕虛無假設的固定顯著性水平，更應關注現(xiàn)實的證據(jù)和自己的想法。所以，這種規(guī)定和劃分并沒有一種絕對的算法和理論，甚至還帶有一定的主觀估計性，但一個合適的概率值被大家認可為是“不太可能發(fā)生”事件，且有一位權威的數(shù)學家正式地提出，那么這種值更容易被接受、延用而成為慣例。但這種“非絕對唯一性”就隱含著日后出現(xiàn)另一“合理范圍取值”的可能性。正如越來越多研究者在接受的“邊緣顯著”這一說法。

三、引發(fā)邊緣顯著“合理性”的質疑

α=0.05仍是最被認可的臨界值，但研究者很容易被這一值所困擾，特別是所得P值只是略大于它時。其實P值很容易受到樣本量、標準差的影響，但通常研究者又不愿意再耗精力去擴大樣本或多次研究。這種愛恨交加下，“邊緣顯著”的出現(xiàn)似乎有它的必然性。雖然研究者不應該迷信和固守于慣例中的顯著性水平，但有學者也指出，嚴格意義上講，統(tǒng)計中只有顯著和不顯著兩種結果，加上極其或邊緣這樣的修飾語是不合適的，即使0.05這個值顯得有些武斷，但這個值還是相對寬松的（Dawn Iacobucci， 2005）。即便允許有高于0.05的水平設置，但也不應該出現(xiàn)“邊緣顯著”這樣的概念。若將這種決斷權部分移交給研究者，必然會引來新的麻煩。如果接受這一發(fā)展趨勢，其容忍的度跟0.05這一標準一樣，也會引發(fā)爭議。

四、明確當前“邊緣顯著”的容忍度

最早對于0.10這一標準可上溯到20世紀初。Kendall（1914）曾指出：“想像一下如果我們接受了P=0.01，無論在什么情況下我們都可以采用這條分界線么？這一概率多大程度會對研究者的決斷產(chǎn)生影響更多取決于研究者的謹慎程度了。有些人會認為這個概率已足以說明問題，其他人則可能更保守而需要更小的值，這是一種個人的取向。

目前邊緣顯著通常用在P值大于0.05，但其值又不超過0.10時。例如，通過對中國知網(wǎng)期刊和學位數(shù)據(jù)庫（2000年后）的搜索，共匯集80篇（國內(nèi)）心理學論文。其中共有7篇論文對“邊緣顯著”的劃定不在0.05至0.10的范圍（最小為0.048，最大為0.11）。但國外有報告指出有一例研究的P值達到0.24，但仍將兩組差異歸為邊緣顯著（Dar， etal.， 1994）。顯然，研究者的這種寬容態(tài)度不可取。

五、增強P值大于0.05時的理智感

出現(xiàn)“邊緣顯著”的字樣，不管他的α取值是如何的“邊緣”，都應該視他拒絕了H0。而讀者則更要關注研究者是否結合效應量來輔助說明他的最終結論，尤其不能將“邊緣顯著”理解為變量間的關聯(lián)或差異“有些顯著”或者“快要顯著了”。這種“邊緣”本就是相對于傳統(tǒng)的α最大可接受值0.05而言的。

不管用邊緣、趨向，還是接近、幾乎顯著，都應該報告P值、樣本量等，并對為什么在此研究中接受邊緣顯著作出說明，尤其要報告效應量進行合理分析。在討論結果時還可以考慮作方向性的描述，不簡單跟從統(tǒng)計的冰冷數(shù)字作“全或無”的判斷，為讀者傳達出更有啟示性的建議，并有后續(xù)研究的改進措施，推動達成更可靠的結論。這些是老師在作為學生研究引路人之初，以“邊緣”顯著為契機，理應筑牢的科學態(tài)度。

參考文獻

[1] Rosnow， Ralph L. Robert Rosenthal， Statistical Procedures and the Justification of Knowledge in Psychological Science[J]. American Psychologist， 1989，44（10）： 1276-1284.

[2] Goodman， S.N.p values， hypothesis tests， and likelihood： Implications for epidemiology of a neglected historical debate[J].American Journal of Epidemiology， 1993， 137， 485-496.

[3] 鮑貴，席雁.統(tǒng)計顯著性檢驗：問題與思考[J].南京工程學院學報（社會科學版），2010，10（04）：27-32.

[4] Fisher R A . Theory of Statistical Estimation[J]. Mathematical Proceedings of the Cambridge Philosophical Society， 1925， 22：700-725.

[5] Kendall， & Maurice G. （0）. An introduction to the theory of statistics[M]. Charles Griffin，1914.

[6] Dar R ， Serlin R C ， Omer H . Misuse of statistical test in three decades of psychotherapy research[J]. Journal of Consulting & Clinical Psychology， 1994， 62（1）：75-82.

基金項目：重慶三峽學院高等教育教學改革研究項目（JGYB2008）。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

顯著性檢驗中“邊緣顯著”的教學思路與要點初探