黃文蝶 周江霖
摘 要:假設(shè)檢驗(yàn)是統(tǒng)計(jì)教學(xué)中的一個(gè)重點(diǎn)和難點(diǎn)。本文以案例式教學(xué)方法為主導(dǎo),結(jié)合啟發(fā)式教學(xué),力圖將這一問題的基本思想與步驟闡述清楚,引導(dǎo)學(xué)生在掌握原理的同時(shí)進(jìn)一步深化統(tǒng)計(jì)思想的培養(yǎng)。
關(guān)鍵詞:假設(shè)檢驗(yàn);案例式教學(xué);啟發(fā)式教學(xué)
假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷中非常重要的一個(gè)問題,也是統(tǒng)計(jì)教學(xué)中的一個(gè)難點(diǎn)所在。本文以案例式教學(xué)方法為主導(dǎo),結(jié)合啟發(fā)式教學(xué),力圖將這一問題的基本思想與步驟闡述清楚,引導(dǎo)學(xué)生在掌握原理的同時(shí)進(jìn)一步深化統(tǒng)計(jì)思想的培養(yǎng)。
一、提出問題
產(chǎn)品質(zhì)量問題是當(dāng)今社會(huì)的一個(gè)熱門話題,這節(jié)課我們就用假設(shè)檢驗(yàn)的方法來檢驗(yàn)一種非處方藥的質(zhì)量是否合乎規(guī)定。
例:一種無需醫(yī)生處方可得到的治療咳嗽和鼻塞的藥,按規(guī)定其酒精含量為5%.今從已出廠的一批藥中,隨機(jī)抽取10瓶,測試其酒精含量為:5.01,4.87,5.11,5.21,5.03,4.96,4.78,4.98,4.88,5.06。已知酒精含量服從正態(tài)分布N(μ,0.00016)。
向?qū)W生提出問題:如果現(xiàn)在你是一名質(zhì)檢員,那么你認(rèn)為這批藥品是否合格?
二、分析問題
引導(dǎo)學(xué)生對(duì)這一問題進(jìn)行逐步深入地分析:現(xiàn)在關(guān)注的是這一批藥的酒精含量——這是我們的研究總體;手頭掌握的資料有,10瓶藥品的酒精含量數(shù)據(jù)以及總體所服從的分布。
判定這批藥品是否合格,關(guān)鍵是看總體均值μ是否為5:若μ=5,則藥品合格;若μ≠5,則藥品不合格。
通過點(diǎn)估計(jì)的學(xué)習(xí),我們知道總體均值可以用樣本均值去估計(jì),容易得到μ的估計(jì)值為4.989,顯然4.989≠5,那么這個(gè)時(shí)候能否下結(jié)論:這批藥品不合格?如果貿(mào)然下這樣的結(jié)論,既不能讓人信服,自己也會(huì)存在疑惑:一方面,樣本均值只是總體均值的一個(gè)估計(jì)量,并不能完全代表總體均值;另一方面,樣本均值受隨機(jī)因素的影響比較大,而4.989與5相差這么小,這個(gè)誤差似乎是可以接受的。到底可以容忍的最大誤差是多少呢?這成了我們最終關(guān)注的問題。
將上述分析過程條理化,我們便得到了假設(shè)檢驗(yàn)的基本步驟。
三、解決問題
1.建立原假設(shè)和備擇假設(shè)
正所謂萬事開頭難,能否合理地建立原假設(shè),關(guān)系著整個(gè)假設(shè)檢驗(yàn)的成敗。關(guān)于如何建立原假設(shè),學(xué)者們各抒己見:茆詩松主張以“不能輕易否定”為原則,何書文以“與事實(shí)相反”為原則……總之一句話,原假設(shè)是受到保護(hù)的、不會(huì)被輕易推翻的。
在我們研究的這個(gè)問題中,建立原假設(shè)與備擇假設(shè)如下:
H0:μ=5, H1:μ≠5
2.構(gòu)造檢驗(yàn)統(tǒng)計(jì)量
在提出原假設(shè)后,要構(gòu)造一個(gè)特殊的統(tǒng)計(jì)量:其分布在原假設(shè)下是已知的,其數(shù)值直接影響最后的結(jié)論。通常情況下,將原假設(shè)中未知參數(shù)的數(shù)值代入?yún)^(qū)間估計(jì)中的樞軸變量,即可得到我們需要的檢驗(yàn)統(tǒng)計(jì)量。
在σ2已知的條件下,μ的區(qū)間估計(jì)中用到的樞軸變量為,將μ=5,σ2 =0.00016,n=10代入,檢驗(yàn)統(tǒng)計(jì)量為,且Z~N(0,1)。
3.確定H0的拒絕域
在H0成立時(shí),觀察檢驗(yàn)統(tǒng)計(jì)量取值的特點(diǎn)(偏大、偏小、絕對(duì)值偏小等),給出對(duì)H0不利的小概率事件,使得小概率事件發(fā)生的樣本觀測值的集合,稱為H0的拒絕域。
為了解釋拒絕域的定義,帶領(lǐng)學(xué)生回顧“小概率事件原理”—小概率事件在一次試驗(yàn)中是不會(huì)發(fā)生的。在學(xué)習(xí)古典概率的時(shí)候,我們曾經(jīng)舉了一個(gè)“女士品茶”的例子:一位常飲牛奶加茶的女士稱,她能從一杯沖好的飲料中辨別出先放茶還是先放牛奶。她在10次試驗(yàn)中都正確地辨別出來了,問該女士的說法是否可信。
我們假設(shè)該女士說法不可信,計(jì)算得出事件A=“10次試驗(yàn)都能正確指出放置茶和牛奶的先后次序”發(fā)生的概率為0.0009766,這是一個(gè)非常小的概率。依據(jù)小概率事件原理,A應(yīng)該是不會(huì)發(fā)生的,這與實(shí)際結(jié)果相矛盾,因此認(rèn)為假設(shè)“該女士說法不可信”不成立,有理由斷言該女士的說法是可信的。
實(shí)際上,在假設(shè)檢驗(yàn)的過程中正是利用了“小概率事件原理”,思路與上述例子是完全一致的:先假定H0成立,如果從試驗(yàn)數(shù)據(jù)計(jì)算出檢驗(yàn)統(tǒng)計(jì)量Z的值非常罕見,此時(shí),我們認(rèn)為小概率事件發(fā)生了,這是由于H0所導(dǎo)致的矛盾,因此,拒絕H0;否則,接受H0。
回到我們研究的問題:若H0成立,則樣本均值與5的差距比較小,即|Z|較小。因此,拒絕域的形式為{|Z|>a},數(shù)值a應(yīng)該如何確定呢?
如果在H0成立的條件下,作出了拒絕H0的結(jié)論,稱之為第一類錯(cuò)誤,將第一類錯(cuò)誤的概率記為α,有時(shí)又稱α為顯著性水平。通常情況下,我們控制犯第一類錯(cuò)誤的概率,α一般取0.05,即P (|Z|>a| H0 ) =0.05。此時(shí),查標(biāo)準(zhǔn)正態(tài)分布表可知,a=1.96,拒絕域?yàn)閧|Z|>1.96}。
4.作出結(jié)論
計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值,觀察其是否落入拒絕域,下結(jié)論。
將樣本均值代入,得到Z=2.75,|Z|>1.96,落入拒絕域中,因此,該批藥品的酒精含量不符合規(guī)定。
四、問題的深入與探索
如果我們將α的值選為0.002,查表可得a=3.090,此時(shí),|Z|在確定拒絕域時(shí),我們介紹了第一類錯(cuò)誤——在H0成立的條件下,作出了拒絕H0的結(jié)論。有一就有二,如果在H0不成立時(shí),作出了接受H0的結(jié)論,稱之為第二類錯(cuò)誤。請同學(xué)們思考:犯第一類錯(cuò)誤的概率與犯第二類錯(cuò)誤的概率,兩者之間是否存在關(guān)系?如果存在關(guān)系,是一種什么樣的關(guān)系?
參考文獻(xiàn):
[1]胡發(fā)勝.宿潔.數(shù)理統(tǒng)計(jì)[M].山東大學(xué)出版社,2004.
[2]茆詩松.概率論與數(shù)理統(tǒng)計(jì)[M].北京:中國統(tǒng)計(jì)出版社,2000.
[3]同濟(jì)大學(xué)應(yīng)用數(shù)學(xué)系.概率統(tǒng)計(jì)簡明教程[M].北京:高等教育出版社,2012.
(作者單位:武警警官學(xué)院)