国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

對(duì)參數(shù)假設(shè)檢驗(yàn)中幾對(duì)關(guān)系的研究

2012-09-21 08:21代婷
中國(guó)科技信息 2012年18期
關(guān)鍵詞:假設(shè)檢驗(yàn)區(qū)間概率

代婷

濟(jì)南職業(yè)學(xué)院基礎(chǔ)部, 濟(jì)南 250014

對(duì)參數(shù)假設(shè)檢驗(yàn)中幾對(duì)關(guān)系的研究

代婷

濟(jì)南職業(yè)學(xué)院基礎(chǔ)部, 濟(jì)南 250014

A Research on several couples of relationships of the Hypothesis Testing

參數(shù)假設(shè)檢驗(yàn)中存在四對(duì)密切相關(guān)的概念:原假設(shè)與備擇假設(shè)、兩類(lèi)錯(cuò)誤、P-值法與臨界值法、區(qū)間估計(jì)與假設(shè)檢驗(yàn),深入了解這些概念及其原理之間的關(guān)系有利于準(zhǔn)確把握假設(shè)檢驗(yàn)的思想與方法。

參數(shù)假設(shè)檢驗(yàn);原假設(shè)與備擇假設(shè);兩類(lèi)錯(cuò)誤;P-值法與臨界值法;區(qū)間估計(jì)與假設(shè)檢驗(yàn)

假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的一種重要方法,包括參數(shù)假設(shè)檢驗(yàn)和非參數(shù)假設(shè)檢驗(yàn),參數(shù)假設(shè)檢驗(yàn)即研究者事先對(duì)未知參數(shù)做出假設(shè),再利用樣本信息對(duì)做出的假設(shè)進(jìn)行檢驗(yàn)。其應(yīng)用可涉及社會(huì)生活中的各個(gè)領(lǐng)域,如經(jīng)濟(jì)管理、醫(yī)學(xué)研究、教育管理等。而假設(shè)檢驗(yàn)的應(yīng)用過(guò)程中,存在幾對(duì)關(guān)系,是正確理解和應(yīng)用的關(guān)鍵,若不能正確理解,便會(huì)導(dǎo)致方法失效,甚至帶來(lái)不良后果,因此有必要深入系統(tǒng)地對(duì)這幾對(duì)關(guān)系進(jìn)行研究。

1 原假設(shè)與備擇假設(shè)

按照假設(shè)檢驗(yàn)的原理及步驟,首先要根據(jù)問(wèn)題對(duì)總體參數(shù)做一個(gè)嘗試性的假設(shè),該嘗試性的假設(shè)即為原假設(shè)H0,而后再定義另一個(gè)與原假設(shè)的內(nèi)容完全相反的假設(shè),記為H1,稱作備擇假設(shè)。在假設(shè)檢驗(yàn)的過(guò)程中,二者成對(duì)出現(xiàn),但在應(yīng)用中,如何建立原假設(shè)和備擇假設(shè)并不顯而易見(jiàn),二者若交換,就會(huì)得到相反的結(jié)論。

例如,某品牌電視機(jī)生產(chǎn)廠家,聲稱其產(chǎn)品合格率達(dá)到95%以上,質(zhì)管部門(mén)隨機(jī)抽取了500臺(tái)進(jìn)行檢驗(yàn),經(jīng)檢驗(yàn),發(fā)現(xiàn)480臺(tái)為合格品,那么根據(jù)樣本數(shù)據(jù),有充分理由相信該廠家的說(shuō)法嗎?(a=0.05)

解:首先經(jīng)判斷,確定檢驗(yàn)統(tǒng)計(jì)量為

說(shuō)明Z未落入拒絕域,因此不能拒絕H0,即沒(méi)有理由認(rèn)為該產(chǎn)品合格率低于95%。

模式二,假設(shè)

同樣,Z未落入拒絕域,因此不能拒絕原假設(shè),即沒(méi)有理由認(rèn)為該產(chǎn)品合格率超過(guò)95%。

在上例中,同樣的樣本,同樣的檢驗(yàn)統(tǒng)計(jì)量,當(dāng)交換原假設(shè)和備擇假設(shè)后卻得到兩個(gè)不同的結(jié)論,從區(qū)間的角度來(lái)看,產(chǎn)生這一現(xiàn)象的原因是,在一定的顯著性水平 a下,模式一的接受域?yàn)椋篬-Za,+∞),交換原假設(shè)后,接受域?yàn)?-∞,Za],因此兩種情況下,接受域有公共交集[-Za,Za],當(dāng)樣本觀測(cè)值落入該交集后,則會(huì)產(chǎn)生相反的結(jié)論。因此,若想改變這種現(xiàn)象,可以適當(dāng)提高顯著性水平,從而縮小接受域的交集。另外,還要慎重選擇原假設(shè)。根據(jù)皮爾遜和奈曼的統(tǒng)計(jì)思想,當(dāng)原假設(shè)為真時(shí),拒絕原假設(shè)(即第一類(lèi)錯(cuò)誤)的概率為顯著性水平a,而a一般很小,且可以控制,所以提倡設(shè)置原假設(shè)時(shí),在控制第一類(lèi)錯(cuò)誤的概率a下,盡量使第二類(lèi)錯(cuò)誤的概率β小,即我們只對(duì)犯第一類(lèi)錯(cuò)誤的概率a加以限制,而對(duì)β的具體取值不用考慮,因此,假設(shè)檢驗(yàn)的目的更傾向于拒絕H0,而H0往往是受保護(hù)的,要想拒絕它需要很充分的證據(jù)。所以在設(shè)定原假設(shè)時(shí),一般遵循如下原則:

1 ) 原假設(shè)往往是有事實(shí)依據(jù)的,沒(méi)有足夠的證據(jù)一般不能拒絕。

2 ) 應(yīng)把拒絕時(shí)導(dǎo)致的后果更嚴(yán)重的假設(shè)作為原假設(shè)。

3 ) 無(wú)論是單側(cè)檢驗(yàn),還是雙側(cè)檢驗(yàn),等號(hào)往往出現(xiàn)在原假設(shè)中,即如下三種形式:

2 第一類(lèi)錯(cuò)誤與第二類(lèi)錯(cuò)誤

假設(shè)檢驗(yàn)的基本思想是小概率原理,即認(rèn)為小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生,但不等于絕對(duì)不發(fā)生,于是存在兩類(lèi)錯(cuò)誤,H0為真卻拒絕的錯(cuò)誤為棄真錯(cuò)誤,即第一類(lèi)錯(cuò)誤,其概率為顯著性水平a,是在研究設(shè)計(jì)時(shí)根據(jù)不同研究目的預(yù)先規(guī)定的允許犯第一類(lèi)錯(cuò)誤概率的最大值。反之,若H0不真而被接受,則形成取偽錯(cuò)誤即第二類(lèi)錯(cuò)誤,其概率記作β。

在假設(shè)檢驗(yàn)的過(guò)程中,不對(duì)β進(jìn)行設(shè)置,因此,不能只根據(jù)檢驗(yàn)統(tǒng)計(jì)量的概率P>a就盲目接受H0,而只能說(shuō)“不能拒絕H0”,相反,若p≤a,就可以明確下結(jié)論:拒絕H0,因?yàn)?,犯第一?lèi)錯(cuò)誤的概率不會(huì)超過(guò)事先制定的概率a。

以樣本均值與總體均值比較的單側(cè)Z檢驗(yàn)為例,說(shuō)明a與β的關(guān)系。設(shè),若H0為真,由

則不能拒絕H0,此時(shí)犯第二類(lèi)錯(cuò)誤,概率為β,從圖中可見(jiàn)兩種錯(cuò)誤之間的關(guān)系:

1 ) α+β不一定等于1;

2 ) 在其他條件不變的前提下,兩類(lèi)錯(cuò)誤一個(gè)增大,則另一個(gè)就減小。在圖中可見(jiàn),當(dāng)臨界值Xα向右移動(dòng)時(shí),α減小,則β變大,反之亦然。

3 P-值法與臨界值法

當(dāng)用檢驗(yàn)統(tǒng)計(jì)量的值來(lái)提供證明是否拒絕H0時(shí),可以借助兩種方法:P-值法與臨界值法。P-值是一個(gè)概率值,是由檢驗(yàn)統(tǒng)計(jì)量的樣本觀測(cè)值得出的原假設(shè)可被拒絕的最小顯著性水平,用來(lái)衡量樣本對(duì)原假設(shè)的支持程度,P-值越小,說(shuō)明對(duì)原假設(shè)的支持程度就越低。

臨界值是指導(dǎo)致拒絕原假設(shè)的檢驗(yàn)統(tǒng)計(jì)量的最大值。同樣以正態(tài)總體中均值μ的檢驗(yàn)為例,檢驗(yàn)統(tǒng)計(jì)量仍為,左側(cè)檢驗(yàn)時(shí),若Z≤-Za,則拒絕H0,此時(shí),-Za為臨界值,即標(biāo)準(zhǔn)正態(tài)分布的下側(cè)面積對(duì)應(yīng)于α的Z值;右側(cè)檢驗(yàn)時(shí),若Z≥Za,則拒絕H0;雙側(cè)檢驗(yàn)時(shí),|Z|≥-Za/2,則拒絕H0。

根據(jù)上述對(duì)P-值法和臨界值法的應(yīng)用原理的描述,可以得到兩者之間的關(guān)系為:

1 )、兩種方法計(jì)算所得出的有關(guān)假設(shè)檢驗(yàn)的結(jié)論肯定相同。

2 )、當(dāng)α= P 值時(shí),則P-值法中統(tǒng)計(jì)量的值A(chǔ) 剛好等于臨界值。

3 )、P-值法能更充分驗(yàn)證結(jié)果的顯著程度,是一種實(shí)測(cè)顯著性水平,而臨界值法只能驗(yàn)證在給定的顯著性水平下是否顯著。

4 區(qū)間估計(jì)與假設(shè)檢驗(yàn)

參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)都是用樣本來(lái)統(tǒng)計(jì)推斷總體的方法,兩者在理論和方法上具有很強(qiáng)的相通性。

以對(duì)總體均值進(jìn)行估計(jì)為例,在σ已知的情況下,總體均值的100(1-α)%置信區(qū)間估計(jì)為,說(shuō)明在置信區(qū)間中,有100(1-α)%將總體均值包括在內(nèi),有100α%沒(méi)有將總體均值包括進(jìn)去,說(shuō)明在原假設(shè)為真時(shí),以概率α拒絕它。因此,構(gòu)造一個(gè)100(1-α)%置信區(qū)間并且當(dāng)區(qū)間不包括μ0時(shí)拒絕,等價(jià)于在顯著性水平α下進(jìn)行雙側(cè)假設(shè)檢驗(yàn)。

從上述兩種方法的相通上可以得出二者有著如下關(guān)系:

1 ) 兩者解決問(wèn)題思想方法一致,都是利用樣本資料來(lái)推斷總體指標(biāo),在推斷過(guò)程中,選取同樣的統(tǒng)計(jì)量,使該統(tǒng)計(jì)量落在某個(gè)已知區(qū)間上的概率為 。

2 ) 兩種方法推斷的結(jié)果都有一定的可信度和風(fēng)險(xiǎn)性。

3 ) 區(qū)間估計(jì)的置信度100(1-α)%與假設(shè)檢驗(yàn)中的顯著性水平 密切相關(guān),而置信區(qū)間與假設(shè)檢驗(yàn)中的接受域相同。

4 ) 對(duì)已知資料的掌握程度不同。區(qū)間估計(jì)對(duì)未知參數(shù)一無(wú)所知,利用樣本資料,在一定的保證程度下估計(jì)出它的可能范圍。而假設(shè)檢驗(yàn)對(duì)未知參數(shù)有所了解,但不能確定,因此在一定的顯著性水平下進(jìn)行判斷。

5 ) 由相同的統(tǒng)計(jì)量構(gòu)造的事件不同。區(qū)間估計(jì)得到的是一個(gè)大概率(100(1-α)%)事件,而假設(shè)檢驗(yàn)利用的是小概率(α)事件。

5 小結(jié)

假設(shè)檢驗(yàn)在現(xiàn)實(shí)生活中應(yīng)用廣泛,但在應(yīng)用的過(guò)程中,若不能準(zhǔn)確把握其中的思想及運(yùn)算方法,則不能有效實(shí)現(xiàn)它的用途,本文沿著設(shè)置假設(shè)到完成檢驗(yàn)的過(guò)程,從深入剖析假設(shè)檢驗(yàn)中幾對(duì)重要關(guān)系出發(fā),對(duì)假設(shè)檢驗(yàn)的精髓進(jìn)行了深入的分析,希望為該推斷方法的學(xué)習(xí)與應(yīng)用提供參考。

[1]Anderson,D.R等.商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)[M](第10版).機(jī)械工業(yè)出版社 ,2010.1

[2]顏虹.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M](第2版).人民衛(wèi)生出版社 ,2010.8

[3]蘇再興,王志福等.從區(qū)間估計(jì)的角度思考假設(shè)檢驗(yàn)問(wèn)題[J].科技信息 ,2010(25)

10.3969/j.issn.1001-8972.2012.18.016

代婷,1982年生人,女,漢族,山東濟(jì)南人,碩士,單位:濟(jì)南職業(yè)學(xué)院,研究方向:數(shù)學(xué)教育。

AbstractThere are 4 pairs of relationships in the Hypothesis Testing: null hypothesis and alternative hypothesis、two types of errors、the P-value method and the critical value method、Interval estimation and hypothesis testing,A thorough understanding of the relationships of these concepts and principles is very useful to grasp the thought and method of the Hypothesis Testing.

KeywordsParameter hypothesis testing; null hypothesis and alternative hypothesis; two types of errors; the P-value method and the critical value method; Interval estimation and hypothesis testing

猜你喜歡
假設(shè)檢驗(yàn)區(qū)間概率
你學(xué)會(huì)“區(qū)間測(cè)速”了嗎
第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
概率與統(tǒng)計(jì)(一)
概率與統(tǒng)計(jì)(二)
假設(shè)檢驗(yàn)結(jié)果的對(duì)立性分析
全球經(jīng)濟(jì)將繼續(xù)處于低速增長(zhǎng)區(qū)間
統(tǒng)計(jì)推斷的研究
鳳爪重量質(zhì)量管理報(bào)告
區(qū)間對(duì)象族的可鎮(zhèn)定性分析