呂建聚++張艷
DOI:10.16660/j.cnki.1674-098X.2017.25.233
摘 要:假設檢驗是工科概率統計教學過程中學生反映比較難懂的章節(jié)。本文就假設檢驗原理理解中的一些難點和模糊點,給出了進一步的解釋,目的是使學生更加清晰地理解知識,進一步提高學生的分析問題和解決問題的實踐創(chuàng)新能力。
關鍵詞:假設檢驗 否定域 原假設 備擇假設
中圖分類號:G71 文獻標識碼:A 文章編號:1674-098X(2017)09(a)-0233-02
Abstract: Hypothesis testing is a difficult chapter in the teaching of probability and statistics in engineering. This paper gives a further explanation about some difficulties and fuzzy points in understanding the test principle. The purpose is to make students more clearly understand the knowledge, to further improve the students' ability of analyzing and solving problems.
Key Words: Hypothesis testing; Critical region; Null hypothesis; Alternative hypothesis
假設檢驗是概率論與數理統計課程中的教學重點和難點。由于這部分內容包含了豐富的思想和原理,公式很多,初學者常常覺得暈頭轉向、內容深不可測,大部分學生只能死記硬背公式,應付考試;由于課時有限,教師在課堂上也不可能充分講深講透。本文針對以上問題對教學過程中的一些難點和模糊點,談一些自己的認識和教學體會。
1 檢驗統計量及否定域的構造思想及方法
檢驗統計量及否定域的構造是假設檢驗的核心工作和難點。用通俗的語言來說,否定域就是否定原假設的條件,歸納起來必須滿足兩條:一是觀察到的樣本對原假設不支持,或者說出現了相對于原假設成立的不合理現象,二是,這種不合理要非常明顯,用概率的語言來說,就是出現幾乎不可能發(fā)生的小概率事件。這兩條之中,尋找不合理現象是工作的方向,而不合理的標準可以根據研究對象人為設定?;谝陨侠斫?,構造否定域分3個步驟:
第一步,選擇一個和被檢驗對象貼近度高的檢驗統計量,在原假設成立的前提下可以直觀看出檢驗統計量的大致取值規(guī)律。
關于單個正態(tài)總體均值μ的單邊、雙邊檢驗中,可選用統計量,因為是μ一個良好的無偏估計,與μ同向增減;同理,兩個正態(tài)總體的均值差μ1-μ2的有關檢驗當中,可以選用統計量;總體方差有關的檢驗可以選用樣本標準差S2。
為了計算概率,必要時對初步選定的統計量進行簡單加工,得到分布已知的統計量。
第二步,假定原假設成立,分析擬用統計量取值不合理的情景,對于統計量不合理的取值有一個定性的認識。
第三步,根據對不合理程度的要求,選定一個閾值,即顯著性水平來作為檢驗標準,于是可得否定域。
具體來看正態(tài)總體均值μ的右邊檢驗,第一步,選用作為檢驗統計量;第二步,分析在什么情景下不合理,原假設成立的情景下,通常要比μ0小一些,如果比μ0大很多,就是明顯的不合理;第三步,設定出一個標準值k,成立就否定原假設。
為了解題過程標準化和增加可比性,可將進行再加工,在未知時,用作為檢驗統計量,T是的線性函數,T值很大就不合理,≥作為否定原假設的條件即否定域,α為顯著性水平。學會了這種分析方法,就能夠根據具體的檢驗問題選擇檢驗統計量及構造否定域。
這種思想其實很樸素,生活當中有很多體現,比如某地區(qū)種植小麥,原來畝產量在500kg左右,改種新品種后,平均畝產量比500kg僅僅稍多一些,一般不會認為新品種產量會提高,如果新品種平均畝產達到600kg以上,比500kg明顯的多,農民就會得出新品種產量高的結論。
從上面說明中,也能體會到顯著性水平中“顯著”二字的含義。
2 原假設及備擇假設的設置
原假設和備選假設的設置問題,理論上的困惑是單邊檢驗中等號一定放在原假設當中,實際操作中的困惑是如何正確設置原假設和備選假設。
(1)等號放在原假設里面,是精確控制第一類錯誤的需要。
關于兩類錯誤的取舍思路教材上都有說明,就是控制第一類錯誤的前提下,盡量減少第二類錯誤。廣泛使用的假設檢驗的評價標準N-P準則,大意就是犯第一類錯誤的概率不超過α的前提下,犯第二類錯誤的概率小者為優(yōu)。
原假設不含等號的話,第一類錯誤無法控制。比如正態(tài)總體的單邊假設檢驗,,假設已知,用Z檢驗,否定域為≥,第一類錯誤的概率
隨μ的增大(不超過μ0)而增大,當μ=μ0時達到最大值α,第一類錯誤精確限制,否定域邊界確定。如果原假設不含等號,否定域就不能精確界定。其他參數的單邊檢驗也具有同樣的性質。
(2)關于原假設和備擇假設的設置思路,綜合起來有以下幾點:
一是,純粹從方便記憶和做題的角度看,原假設含有等號,于是考慮問題時,先將提高、降低等不含等號的提法確定為備擇假設,反過來確定原假設。
二是,從原理上理解假設檢驗方法具有保護原假設的特點,即沒有特別明顯的不利于原假設的證據,不拒絕原假設,實踐上看,接受原假設比接受備擇假設容易得多。因此將輕易不能得出的結論或者有可能產生嚴重后果的結論比如改進工藝后產品指標提高、藥品副作用小的情景放在備擇假設,或者體現一定的傾向性,故意將主觀上不希望得出的一些判斷放到備擇假設。
三是,假設檢驗方法是用來解決對已有的認知是否改變以及改變方向進行定性的判斷問題的,僅適用于對參數已經有比較充分了解的情況,若對參數一無所知的話一般不適合這種方法。設置原假設時,把歷史狀態(tài)、已有的認知放在原假設里邊,抓住原假設的“原”字,既好理解也好記憶。
參考文獻
[1] 茆詩松.高等數理統計[M].北京:高等教育出版社,2004.
[2] 陳希儒.數理統計學教程[M].合肥:中國科學技術大學出版社,2015.
[3] 盛驟.概率論與數理統計[M].北京:高等教育出版社,2006.endprint