辛淑亮++++郭新梅
摘 要: 針對(duì)統(tǒng)計(jì)教科書上χ■測(cè)驗(yàn)與u測(cè)驗(yàn)關(guān)系模糊不清的情況,本文用3個(gè)事例進(jìn)行了χ■測(cè)驗(yàn)、矯正的χ■■測(cè)驗(yàn)、u測(cè)驗(yàn)、矯正的u■測(cè)驗(yàn).結(jié)果表明,對(duì)于k=2和2×2的次數(shù)資料,自由度df=1時(shí),可以用χ■測(cè)驗(yàn);也可以用u測(cè)驗(yàn).數(shù)學(xué)關(guān)系為:χ■=u■;χ■■=u■■;χ■■=χ■■;χ■■=u■■.
關(guān)鍵詞: 假設(shè)測(cè)驗(yàn) 自由度 χ■測(cè)驗(yàn) u測(cè)驗(yàn)
在科研實(shí)踐中,許多試驗(yàn)結(jié)果用百分率表示,如殺蟲率、發(fā)芽率、坐果率、合格率等.這些百分率系由統(tǒng)計(jì)某一屬性的個(gè)體數(shù)目求得,屬間斷性的計(jì)數(shù)資料.這類數(shù)據(jù)假設(shè)測(cè)驗(yàn)的方法主要分兩類:百分率數(shù)據(jù)用u測(cè)驗(yàn);計(jì)數(shù)資料用χ■測(cè)驗(yàn).很多統(tǒng)計(jì)學(xué)書介紹了相關(guān)的假設(shè)測(cè)驗(yàn)方法[1-5],但是都沒(méi)有說(shuō)明兩種假設(shè)測(cè)驗(yàn)的關(guān)系.同時(shí),我們?cè)谑褂孟嚓P(guān)教材時(shí)發(fā)現(xiàn)書中出現(xiàn)了一些有待商榷的例題.針對(duì)這些問(wèn)題,我們利用相關(guān)教材中的例題,對(duì)兩種假設(shè)測(cè)驗(yàn)的關(guān)系進(jìn)行了數(shù)學(xué)推導(dǎo),以明確χ■測(cè)驗(yàn)與u測(cè)驗(yàn)的數(shù)學(xué)關(guān)系.
1.單個(gè)百分率測(cè)驗(yàn)與適合性χ■測(cè)驗(yàn)的關(guān)系
例1:用基因型純合的糯玉米和非糯玉米雜交,按遺傳學(xué)原理,預(yù)期F■植株上糯性花粉粒的P■=0.5,現(xiàn)在一視野中檢視20?;ǚ郏门葱曰ǚ?粒,問(wèn)此結(jié)果和理論百分率P■=0.5是否相符[1]?
解法1:k=2組次數(shù)資料的適合性χ■測(cè)驗(yàn)
假設(shè)H■:總體分布符合1∶1,對(duì)HA:總體分布不符合1∶1.
顯著水平α=0.05
測(cè)驗(yàn)計(jì)算:
理論次數(shù)E■=20×0.5=10
E■=20×0.5=10
χ■=(8-10)■/10+(12-10)■/10=0.8
df=2-1=1
x■■=3.84
統(tǒng)計(jì)推斷:實(shí)得χ■<χ■■,故概率P>0.05.接受H■:總體分布符合1∶1的理論分布,差異不顯著.
解法2:k=2組次數(shù)資料的適合性χ■■測(cè)驗(yàn)
χ■分布是連續(xù)性的,而次數(shù)資料則是間斷性的.由間斷性資料算得的χ■值有偏大的趨勢(shì),尤其是自由度df=1時(shí),用連續(xù)性分布作χ■測(cè)驗(yàn)時(shí),容易發(fā)生第一類錯(cuò)誤.故在假設(shè)測(cè)驗(yàn)時(shí),進(jìn)行連續(xù)性矯正,采用矯正的χ■■測(cè)驗(yàn).
解:假設(shè)H■:總體分布符合1∶1,H■:總體分布不符合1∶1.
顯著水平α=0.05
測(cè)驗(yàn)計(jì)算:
χ■■=(|8-10|-0.5)■/10+(|12-10|-0.5)■/10=0.45
df=2-1=1
χ■■=3.84
統(tǒng)計(jì)推斷:實(shí)得χ■■<χ■■,故概率P>0.05.接受H■:總體分布符合1∶1的理論分布,差異不顯著.
解法3:?jiǎn)蝹€(gè)百分率的u測(cè)驗(yàn)
在理論上,這類百分?jǐn)?shù)應(yīng)按二項(xiàng)分布進(jìn)行假設(shè)測(cè)驗(yàn).但是,如果樣本容量n較大,p不過(guò)小,np和nq皆大于5時(shí),二項(xiàng)分布趨近正態(tài)分布.因而,可以將百分?jǐn)?shù)資料做正態(tài)分布處理,作近似u的測(cè)驗(yàn).
解:假設(shè)H■∶P=0.5,H■∶P≠0.5.
顯著水平α=0.05
測(cè)驗(yàn)計(jì)算:
■=8/20=0.4
■ ■=■=0.111803
u=(0.4-0.5)/0.111803=-0.89443
u■=1.96
統(tǒng)計(jì)推斷:實(shí)得|u|0.05.接受H■∶P=0.5,差異不顯著.
解法4:?jiǎn)蝹€(gè)百分率的u■測(cè)驗(yàn)
因?yàn)槎?xiàng)分布的百分率系由計(jì)數(shù)某一屬性的個(gè)體數(shù)目計(jì)算得來(lái),屬于間斷性的二項(xiàng)分布.用連續(xù)性的正態(tài)分布作u測(cè)驗(yàn)時(shí),容易發(fā)生第一類錯(cuò)誤.所以在假設(shè)測(cè)驗(yàn)時(shí),進(jìn)行連續(xù)性矯正,采用矯正的u■測(cè)驗(yàn).
解:假設(shè)H■∶P=0.5對(duì)H■∶P≠0.5
顯著水平α=0.05
測(cè)驗(yàn)計(jì)算:
u■=(|0.4-0.5|-0.5/20)/0.111803=0.67082
u■=1.96
統(tǒng)計(jì)推斷:實(shí)得u■0.05.接受H■∶P=0.5,差異不顯著.
綜上所述,適合性χ■測(cè)驗(yàn)與單個(gè)百分率u測(cè)驗(yàn)的關(guān)系:
對(duì)于二項(xiàng)分布即k=2的次數(shù)資料,自由度df=2-1=1,適合性χ■測(cè)驗(yàn)與單個(gè)百分率測(cè)驗(yàn)有如下數(shù)學(xué)關(guān)系:
u■=(-0.89443)■=0.8=χ■
u■■=0.67082■=0.45=χ■■
u■■=1.96■=3.84=χ■■
u■■=2.576■=6.64=χ■■
u■■=χ■■
由此可見,當(dāng)自由度df=1時(shí),兩尾u測(cè)驗(yàn)與一尾χ■測(cè)驗(yàn)相對(duì)應(yīng).
圖1 k=2組次數(shù)資料和2×2表次數(shù)資料的統(tǒng)計(jì)方法
2.兩個(gè)百分率測(cè)驗(yàn)與獨(dú)立性χ■測(cè)驗(yàn)的關(guān)系
例2:調(diào)查經(jīng)過(guò)種子滅菌處理與未經(jīng)種子滅菌處理的小麥發(fā)生散黑穗病的穗數(shù),得相依表1,試分析種子滅菌與否和發(fā)生散黑穗病多少是否有關(guān)[1]?
表1 防治小麥散黑穗病的觀察結(jié)果2×2表
解法1:2×2表次數(shù)資料的獨(dú)立性χ■測(cè)驗(yàn)
解:假設(shè)H■:獨(dú)立,H■:不獨(dú)立.
顯著水平α=0.05
測(cè)驗(yàn)計(jì)算:
理論次數(shù)E■=76×210/460=34.69565
E■=76×250/460=41.30435
E■=384×210/460=175.3043
E■=384×250/460=208.6957
χ■=(26-34.69565)■/34.69565+(50-41.30435)■/41.30435
+(184-175.3043)■/175.3043+(200-208.6957)■/208.6957
=4.803676
df=(2-1)(2-1)=1
χ■■=3.84
統(tǒng)計(jì)推斷:實(shí)得χ■>χ■■,故概率P<0.05.否定H■接受H■:不獨(dú)立,差異顯著.
解法2:2×2表次數(shù)資料的獨(dú)立性χ■■測(cè)驗(yàn)
解:假設(shè)H■:獨(dú)立,H■:不獨(dú)立.
顯著水平α=0.05
測(cè)驗(yàn)計(jì)算:
χ■■=(|26-34.69565|-0.5)■/34.69565+(|50-41.30435|-0.5)■/41.30435+(|184-175.3043|-0.5)■/175.3043+(|200-208.6957|-0.5)■/208.6957=4.267135
df=(2-1)(2-1)=1
χ■■=3.84
統(tǒng)計(jì)推斷:實(shí)得χ■■>χ■■,故概率P<0.05.否定H■接受H■:不獨(dú)立,差異顯著.
解法3:兩個(gè)百分率u的測(cè)驗(yàn)
解:假設(shè)H■:P■=P■,H■:P■≠P■.
顯著水平α=0.05
測(cè)驗(yàn)計(jì)算:
■■=26/76=0.342105
■■=184/384=0.479167
■=(26+184)/(76+384)=0.456522
■=1-0.456522=0.543478
S■=■=0.062536
u=(0.342105-0.479167)/0.062536=-2.19173
u■■=1.96
統(tǒng)計(jì)推斷:實(shí)得|u|>u■■,故概率P<0.05.否定H■接受H■,兩者差異顯著.
解法4:兩個(gè)百分率的u■測(cè)驗(yàn)
解:假設(shè)H■:P■=P■,對(duì)H■:P■≠P■.
顯著水平α=0.05
測(cè)驗(yàn)計(jì)算:
u■=(|0.342105-0.479167|-0.5/76-0.5/384)/0.062536=2.065705
u■=1.96
統(tǒng)計(jì)推斷:實(shí)得u■>u■,故概率P<0.05.否定H■接受H■:P■≠P■,差異顯著.
綜上所述,獨(dú)立性χ■測(cè)驗(yàn)與兩個(gè)百分率u測(cè)驗(yàn)的關(guān)系:
對(duì)于2×2表的次數(shù)資料,自由度df=(2-1)(2-1)=1,獨(dú)立性χ■測(cè)驗(yàn)與兩個(gè)百分率u測(cè)驗(yàn)有如下數(shù)學(xué)關(guān)系:
u■=(-2.19173)■=4.803676=χ■
u■■=2.065705■=4.267135=χ■■
u■■=1.96■=3.84=χ■■
u■■=2.576■=6.64=χ■■
由此可見,當(dāng)自由度df=1時(shí),兩尾u測(cè)驗(yàn)與一尾χ■測(cè)驗(yàn)相對(duì)應(yīng).u測(cè)驗(yàn)的兩尾臨界值與χ■測(cè)驗(yàn)的一尾臨界值相等,即u■■=χ■■.
3.討論
對(duì)于例1,在教材中是這樣進(jìn)行假設(shè)測(cè)驗(yàn)的■.
解:假設(shè)H■∶P=0.5,HA∶P≠0.5.
顯著水平α=0.05
測(cè)驗(yàn)計(jì)算:
np=20×0.5=10
S■=■=2.19089
t■=(|8-10|-0.5)/2.19089=0.684653
df=20-1=19
t■=2.093
統(tǒng)計(jì)推斷:實(shí)得t■
因?yàn)楦鶕?jù)無(wú)效假設(shè),可以計(jì)得■ ■.而且已知σ時(shí),無(wú)論樣本大小,都可以用u測(cè)驗(yàn).所以,上述計(jì)算中選用t測(cè)驗(yàn)不合適,t■■=0.684653■=0.46875≠χ■■.這里應(yīng)用S■的計(jì)算公式不妥當(dāng).下面用事例間接證明.
例3:某食品廠的一條生產(chǎn)線上的產(chǎn)品組成指標(biāo)為:一級(jí)品∶二級(jí)品=7∶3.現(xiàn)隨機(jī)抽取了20個(gè)產(chǎn)品做檢驗(yàn),得一級(jí)品13個(gè),二級(jí)品7個(gè).問(wèn)其產(chǎn)品組成比例是否達(dá)到一級(jí)品占70%的生產(chǎn)指標(biāo)[2]?
對(duì)于例3,在教材中是這樣進(jìn)行假設(shè)測(cè)驗(yàn)的[2].
解:假設(shè)H■:P≥0.7,H■:P<0.7.
顯著水平α=0.05
測(cè)驗(yàn)計(jì)算:
■=13/20=0.65
■ ■=■=0.10247
u■=(|0.65-0.7|-0.5/20)/0.10247=0.243975
u■=1.645
統(tǒng)計(jì)推斷:實(shí)得u■0.05.接受H■,差異不顯著.
可以證明,u■■=1.645■=2.706=χ■■,說(shuō)明u測(cè)驗(yàn)的一尾臨界值u■■與χ■測(cè)驗(yàn)的一尾臨界值χ■■相等,即u■■=χ■■.
4.結(jié)論
(1)對(duì)于k=2組次數(shù)資料,可以用適合性χ■測(cè)驗(yàn);也可以用單個(gè)百分率的u測(cè)驗(yàn).
(2)對(duì)于2×2表的次數(shù)資料,可以用獨(dú)立性χ■測(cè)驗(yàn);也可以用兩個(gè)百分率的u測(cè)驗(yàn).
(3)百分率u測(cè)驗(yàn)與χ■測(cè)驗(yàn)的數(shù)學(xué)關(guān)系為:u■=χ■.
(4)百分率矯正的u■測(cè)驗(yàn)與矯正的χ■■測(cè)驗(yàn)的數(shù)學(xué)關(guān)系為:u■■=χ■■.
(5)測(cè)驗(yàn)的兩尾臨界值與χ■測(cè)驗(yàn)的一尾臨界值間,有如下數(shù)學(xué)關(guān)系:u■■=χ■■.
(6)測(cè)驗(yàn)的一尾臨界值與χ■測(cè)驗(yàn)的一尾臨界值間,有如下數(shù)學(xué)關(guān)系:u■■=χ■■.
參考文獻(xiàn):
[1]蓋鈞鎰.試驗(yàn)統(tǒng)計(jì)方法[M].北京:中國(guó)農(nóng)業(yè)出版社,2000:91,135.
[2]王欽德,揚(yáng)堅(jiān).食品試驗(yàn)統(tǒng)計(jì)與統(tǒng)計(jì)分析[M].北京:中國(guó)農(nóng)業(yè)大學(xué)出版社,2010:62.
[3]辛淑亮.現(xiàn)代農(nóng)業(yè)試驗(yàn)統(tǒng)計(jì)[M].北京:中國(guó)統(tǒng)計(jì)出版社,1999.
[4]莫惠棟.農(nóng)業(yè)試驗(yàn)統(tǒng)計(jì)[M].上海:上??茖W(xué)技術(shù)出版社,1984.
[5]劉權(quán).果樹試驗(yàn)統(tǒng)計(jì)及統(tǒng)計(jì)[M].北京:中國(guó)農(nóng)業(yè)出版社,1997.
基金項(xiàng)目:山東省應(yīng)用型人才培養(yǎng)特色名校建設(shè)工程.