屈麗娜
【摘 要】假設(shè)檢驗(yàn)在統(tǒng)計(jì)推斷中是一項(xiàng)十分重要內(nèi)容,它在數(shù)理統(tǒng)計(jì)中占有相當(dāng)重要的地位。它是對(duì)總體參數(shù)的取值給出某種假設(shè)后,根據(jù)樣本信息來(lái)判斷所做的假設(shè)是否成立,最后做出某種決策的一種推斷方法[1]。本文主要介紹了對(duì)假設(shè)檢驗(yàn)中原假設(shè)的選取問題和假設(shè)檢驗(yàn)中產(chǎn)生兩類錯(cuò)誤的原因進(jìn)行研究,并且計(jì)算兩類錯(cuò)誤的概率。
【關(guān)鍵詞】假設(shè)檢驗(yàn) 原假設(shè) 兩類錯(cuò)誤
一、假設(shè)檢驗(yàn)的基本思想及方法
假設(shè)檢驗(yàn)是指總體提出某項(xiàng)假設(shè),然后利用從總體中抽樣所得的樣本值來(lái)驗(yàn)證所提出假設(shè)是否正確。在給定備擇假設(shè)H1的情況下對(duì)原假設(shè)H0,如果我們拒絕了原假設(shè)H0,這也就意味著我們必須接受備擇假設(shè)H1,相反的,我們就只能接受原假設(shè)H0。
我們一般可以把假設(shè)檢驗(yàn)分為四步進(jìn)行:(1)依據(jù)實(shí)際的問題提出原假設(shè)H0與備擇假設(shè)H0;(2)選擇合理的檢驗(yàn)統(tǒng)計(jì)量,并且在原假設(shè)H0成立的情況下確定統(tǒng)計(jì)量的分布;(3)按問題的具體要求,選取恰當(dāng)?shù)娘@著性水平α,并且確定原假設(shè)H0的拒絕域;(4)依據(jù)樣本觀察值來(lái)計(jì)算統(tǒng)計(jì)量的觀察值,并與原假設(shè)的拒絕域進(jìn)行比較,從而做出拒絕或接受原假設(shè)H0的判斷。在假設(shè)檢驗(yàn)的四步中,提出原假設(shè)H0與備擇假設(shè)H1是第一步,這一步在假設(shè)檢驗(yàn)中占有舉足輕重的地位。以下將通過實(shí)例對(duì)原假設(shè)的選取問題進(jìn)行深入的分析[2]。
二、原假設(shè)的選取
(一)問題的提出
利用假設(shè)檢驗(yàn)解決一些實(shí)際問題時(shí),常會(huì)發(fā)生一種狀況,即對(duì)于同一個(gè)樣本信息,由于原假設(shè)H0的選取不同,可能會(huì)得到兩種完全相反的檢驗(yàn)結(jié)果。下面我通過兩個(gè)實(shí)例來(lái)說明一下:
例1:某廠批量生產(chǎn)的電燈泡的質(zhì)量標(biāo)準(zhǔn)為平均使用壽命1000小時(shí)。該廠稱他們引進(jìn)了一種新技術(shù)后生產(chǎn)的電燈泡質(zhì)量高于規(guī)定標(biāo)準(zhǔn)。為了證實(shí)廠家所說的真實(shí)性,工作人員隨機(jī)抽取了250個(gè)燈泡作為樣本,測(cè)試電燈泡的平均使用壽命1035小時(shí),其標(biāo)準(zhǔn)差為100小時(shí)。能否說該廠生產(chǎn)的電子元件質(zhì)量顯著地高于規(guī)定標(biāo)準(zhǔn)?
μ值未落入了拒絕域內(nèi),因此接受原假設(shè)H0,即不能說該廠生產(chǎn)的電子元件質(zhì)量顯著地高于規(guī)定標(biāo)準(zhǔn)。
通過例1我們觀察到在同一顯著性水平α下,由于將原假設(shè)H0與備擇假設(shè)H1的位置調(diào)換,產(chǎn)生了完全相反的檢驗(yàn)結(jié)論。這就說明了原假設(shè)的選取對(duì)假設(shè)檢驗(yàn)問題的解決有著至關(guān)重要的地位。
假設(shè)檢驗(yàn)問題的第一步即為建立假設(shè),正確合理地確定原假設(shè)與備擇假設(shè)。這對(duì)檢驗(yàn)結(jié)果的正確與否起到很大的作用,因此正確建立假設(shè)是解決問題的關(guān)鍵。在解決假設(shè)檢驗(yàn)問題時(shí),在假設(shè)檢驗(yàn)中原假設(shè)和備擇假設(shè)地位是不平等的,原假設(shè)是受到保護(hù)的。
(二)原假設(shè)的選取原則
因?yàn)樵僭O(shè)是處于被保護(hù)地位,在實(shí)際問題中選取原假設(shè)時(shí)應(yīng)該遵循以下三點(diǎn)原則:
1.參考過去的有效信息
2.將希望否定的作為原假設(shè)
3.將拒絕后導(dǎo)致嚴(yán)重后果的作為原假設(shè)
三、假設(shè)檢驗(yàn)的兩類錯(cuò)誤
(一)兩類錯(cuò)誤產(chǎn)生的原因
在假設(shè)檢驗(yàn)中,檢驗(yàn)結(jié)果與實(shí)際的情況可能吻合也可能不吻合,因此,檢驗(yàn)中犯錯(cuò)誤是很有可能的[3]。檢驗(yàn)可能犯的錯(cuò)誤有兩類:第一類是當(dāng)H0為真時(shí),由于隨機(jī)性使得樣本觀測(cè)值落入拒絕域中,導(dǎo)致結(jié)果拒絕原假設(shè)H0,這種錯(cuò)誤稱為第一類錯(cuò)誤,其發(fā)生的概率稱為犯第一類錯(cuò)誤的概率,或稱拒真概率,通常記為α;第二類錯(cuò)誤是當(dāng)H0不是真的,即H1為真時(shí),由于隨機(jī)性使得樣本觀測(cè)值落入接受域中,導(dǎo)致結(jié)果為接受原假設(shè)H0,這種錯(cuò)誤稱為第二類錯(cuò)誤,其發(fā)生的概率稱為犯第二類錯(cuò)誤的概率,或稱取偽概率,通常記為β[2]。
(二)兩類錯(cuò)誤的概率的計(jì)算
當(dāng)我們知道了假設(shè)檢驗(yàn)的兩類錯(cuò)誤發(fā)生的原因時(shí),這就為我們計(jì)算它們出現(xiàn)的概率奠定了基礎(chǔ)。從之前的分析,我們知道了,第一類錯(cuò)誤是由于實(shí)際推斷原理所引起的,即“小概率事件不會(huì)發(fā)生”的假定引起的,所以小概率事件發(fā)生的概率即顯著性水平α就是第一類錯(cuò)誤發(fā)生的概率[4]。
犯第二類錯(cuò)誤的概率計(jì)算相比較而言是復(fù)雜的,因此我們?cè)谏鲜隼拥幕A(chǔ)上進(jìn)行進(jìn)一步的設(shè)計(jì):該公司職員實(shí)際工資不是870元,而是860元,原假設(shè)為假,我們依舊假設(shè)實(shí)際工資是870元。下面我們分別作出總體均值為860元和870元這兩種情況下的正態(tài)分布曲線(A和B)我們能夠明確地知道,在理論上存在的若干個(gè)樣本均值中,一旦某個(gè)樣本均值864.4<<875.6時(shí),我們將把870元誤認(rèn)為總體均值,不拒絕原假設(shè)。由于860元才是真實(shí)的情況,所以我們就犯了第二類錯(cuò)誤,即取偽錯(cuò)誤。犯第二類錯(cuò)誤概率的大小是相對(duì)于正態(tài)曲線A而言的,圖1中陰影部分的面積計(jì)算:
結(jié)論
本文主要探討了假設(shè)檢驗(yàn)中的幾個(gè)問題。首先說明了假設(shè)檢驗(yàn)的基本思想以及假設(shè)檢驗(yàn)的一般步驟;然后論述了假設(shè)檢驗(yàn)的第一步原假設(shè)的選取,最后簡(jiǎn)述了假設(shè)檢驗(yàn)中兩類錯(cuò)誤,說明產(chǎn)生“棄真錯(cuò)誤”和“取偽錯(cuò)誤”的原因,文中又進(jìn)一步給出例題進(jìn)行說明,并計(jì)算出兩類錯(cuò)誤的概率[5]。
【參考文獻(xiàn)】
[1]詹曉琳,沈薇薇.顯著性假設(shè)檢驗(yàn)中原假設(shè)的建立[J].上海第二工業(yè)大學(xué)學(xué)報(bào),2012(2).
[2]茆詩(shī)柳,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計(jì)教程[M].北京.高等教育出版社,2004.
[3]韓兆洲等.假設(shè)檢驗(yàn)的一個(gè)常見誤區(qū)[J].統(tǒng)計(jì)與信息論壇,2005(1).
[4] 李文華.雷金星.假設(shè)檢驗(yàn)中兩類錯(cuò)誤的成因、發(fā)生概率及其相關(guān)問題[J].統(tǒng)計(jì)與決策,2005(4):117-119.
[5]曹遠(yuǎn)紅.假設(shè)檢驗(yàn)在體育統(tǒng)計(jì)應(yīng)用中注意的兩個(gè)問題[J].湖南科技學(xué)院學(xué)報(bào),2011(12).endprint