吳江鴻
(內(nèi)蒙古民族大學(xué)動物科技學(xué)院,內(nèi)蒙古 通遼 028000)
x2檢驗與u檢驗是生物統(tǒng)計學(xué)中最常用的兩種假設(shè)檢驗,兩者均可檢驗服從二項式分布的樣本。在遺傳學(xué)研究中,常常會對兩種質(zhì)量性狀利用統(tǒng)計次數(shù)法獲取次數(shù)資料,如教學(xué)中常用x2檢驗分析兩種毛色動物的雜交F2代出現(xiàn)的毛色分離比例是否符合某種遺傳比例[1]。同時這類問題也可轉(zhuǎn)化成某一種性狀屬性的觀測百分?jǐn)?shù)是否與理論百分?jǐn)?shù)相同的形式,這樣就可以利用單個樣本百分?jǐn)?shù)的假設(shè)檢驗進行分析。
本文就明道緒、劉永健主編的第六版生物統(tǒng)計附試驗設(shè)計中127頁的例7.1進行比較分析[2],發(fā)現(xiàn)兩種方法得出的結(jié)論不同。進而引入效力分析比較了兩種檢測方法的可靠性。
【例】觀察白色羊與黑色羊雜交F2代的毛色,其中白色羊為181只,黑色羊為79只。檢驗白色羊與黑色羊雜交在F2代的毛色分離是否符合3∶1的理論比例。
本題屬性類別數(shù)k=2,df=k-1=2-1=1,所以進行x2檢驗須對x2作連續(xù)性校正,計算x2c。檢驗步驟為:
提出無效假設(shè)與備擇假設(shè)。
H0:白色羊與黑色羊雜交在F2代的毛色分離符合3:1的理論比例;
HA:白色羊與黑色羊雜交在F2代的毛色分離不符合3∶1的理論比例。
計算理論次數(shù)。
假定白色羊與黑色羊雜交在F2代的毛色分離符合3∶1的理論比例,計算理論次數(shù):
白色的理論次數(shù)T白=260×3/4=195
黑色的理論次數(shù)T黑=260×1/4=65
x2c的計算。
統(tǒng)計推斷。
查 x2表得 x20.05(1)=3.84,x2c=3.739<x20.05(1),P>0.05,接受無效假設(shè)H0白色羊與黑色羊雜交在F2代的毛色分離符合3∶1的理論比例。
該例可根據(jù)F2代羊群中不同毛色羊在整體中所占比例與其理論比例進行比較(見圖1),即根據(jù)某一特定毛色羊分類為單個樣本的百分?jǐn)?shù)的假設(shè)檢驗。
圖1 F2代羊群中黑白毛色觀察比例與理論比例
如將該題進行變形,計算260只F2代羊群中白色羊的觀察比例樣本百分?jǐn)?shù)白是否與其理論遺傳比例p0相一致,則為單個樣本百分?jǐn)?shù)的假設(shè)檢驗。
H0:p=75%,該群體中白色羊的比例與理論遺傳比例相同;
HA:p≠75%,該群體中白色羊的比例與理論遺傳比例不相同。
u值計算。
統(tǒng)計推斷。
|u|>1.96,所以 P<0.05,因此否定 H0,接受 HA:p≠75%,該群體中白色羊的比例與理論遺傳比例不相同。
如將該題進行變形,計算260只F2代羊群中黑色羊的觀察比例樣本百分?jǐn)?shù)黑是否與其理論比例p0相一致,此時,,np0=260×25%=65>30,不用對 u 進行連續(xù)性校正。檢驗步驟為:
提出無效假設(shè)與備擇假設(shè)。
H0:p=25%,該群體中黑色羊的比例與理論遺傳比例相同;
HA:p≠25%,該群體中黑色羊的比例與理論遺傳比例不相同。
u值計算。
統(tǒng)計推斷。
u>1.96,所以 P<0.05,因此否定 H0,接受 HA:p≠25%,該群體中黑色羊的比例與理論遺傳比例不相同。
為了比較兩種方法對同樣的樣本數(shù)據(jù)進行檢驗時出現(xiàn)不同的結(jié)果,本節(jié)將系統(tǒng)地比較x2檢驗與u檢驗的應(yīng)用場景與效力等問題。通過比較x2檢驗與u檢驗對同一樣本數(shù)據(jù)的假設(shè)檢驗發(fā)現(xiàn),在0.05顯著水平下,兩種方法得出的結(jié)論相反。即表明如果該樣本中白色羊與黑色羊雜交在F2代的毛色分離符合3∶1的理論比例是真實存在的,那么x2檢驗的結(jié)果正確。這樣就說明u檢驗在對該樣本數(shù)據(jù)的檢驗過程中犯了一類錯誤。
如果該樣本中白色羊與黑色羊雜交在F2代的毛色分離符合3∶1的理論比例,x2檢驗的結(jié)果不正確,這就說明x2檢驗在對該樣本數(shù)據(jù)的檢驗過程中犯了二類錯誤。為了比較兩種檢驗方法的可靠性,首先列出兩種檢驗方法的應(yīng)用場景與條件(見表1)。
表1 u檢驗和x2檢驗的比較
x2檢驗與u檢驗在該試驗樣本的分析中哪種更可靠一些,對此需要進行可靠性檢測。效力分析(Power Analysis)對于試驗設(shè)計非常重要,它可幫助確定在指定顯著性水平下開展某項試驗所需要的樣本量,并通過評估該試驗設(shè)計的統(tǒng)計效力,給出在現(xiàn)有的樣本量下該試驗結(jié)論的可靠性[3]。如果結(jié)論的可靠性非常低,那么完全可以宣布這個試驗是無效的,應(yīng)該修改或者終止試驗[4]。本文利用R軟件包pwr對兩種檢驗方法進行了效力分析[5]。將兩者的顯著水平都設(shè)置為0.05,樣本數(shù)設(shè)定為260。計算該樣本數(shù)據(jù)在兩種檢驗方法下的效應(yīng)值:x2檢驗的效應(yīng)值為effect.size=ES.w1(P0,P1)=0.1242458;而以黑色羊為例檢驗的效應(yīng)值為=0.0538。然后分別計算兩者的檢測效力 (power),power (x2)=0.5173613,而 power(u)=0.1396603。從結(jié)果可知,兩種方法在樣本量為260的情況下效力值都不是很理想,沒能達到 0.8。但是 power(x2)> power(u),比較而言x2的檢測效力更高一些,較為可靠。
在本科教學(xué)中引入檢測效力的概念非常重要,每一種假設(shè)檢驗方法在處理不同樣本數(shù)據(jù)時的檢測效力是不同的,不能將統(tǒng)計學(xué)的公式簡單帶入,求出P值就萬事大吉,要分析不同假設(shè)檢驗的檢測效力,以及判斷得出的結(jié)論是否可靠。另外效力分析(Power Analysis)對于試驗設(shè)計也非常重要,它可以幫助確定在指定顯著性水平下開展某項試驗所需要的樣本量,更可以幫助研究者進行更合理的試驗設(shè)計。