何桂娟 黃守婷 楊建敏 王景偉 福建農(nóng)林大學(xué)動(dòng)物科學(xué)學(xué)院 福州 350002
Excel在非參數(shù)檢驗(yàn)中的應(yīng)用
何桂娟 黃守婷 楊建敏 王景偉 福建農(nóng)林大學(xué)動(dòng)物科學(xué)學(xué)院 福州 350002
本文以畜牧生產(chǎn)中兩個(gè)具體實(shí)例,介紹了符號(hào)秩和檢驗(yàn)法與Mann-Whitney秩和檢驗(yàn)法的相關(guān)原理及利用Excel電子表格進(jìn)行檢驗(yàn)的計(jì)算方法和操作步驟。該方法具有直觀、便捷和操作簡單等特點(diǎn),在實(shí)際畜牧生產(chǎn)中有較大的實(shí)用性。
Excel配對樣本 非配對樣本 秩和檢驗(yàn)
在畜牧生產(chǎn)過程中,許多資料總體分布類型未知,且樣本容量又較小,無法用參數(shù)統(tǒng)計(jì)法來解決,這時(shí)就可以采用非參數(shù)檢驗(yàn)法(non-parametric test)。非參數(shù)檢驗(yàn)在檢驗(yàn)時(shí)不需利用總體參數(shù)(如平均數(shù)、標(biāo)準(zhǔn)差等)信息,主要利用樣本數(shù)據(jù)之間的差值比較及大小順序來檢驗(yàn)數(shù)據(jù)資料是否來自同一個(gè)總體假設(shè)的檢驗(yàn)方法,主要包括中位數(shù)檢驗(yàn)、Wilcoxon符號(hào)秩和檢驗(yàn)、Mann-Whitney秩和檢驗(yàn)、Kruskal-Wallis檢驗(yàn)等[1]。相對參數(shù)檢驗(yàn)等方法,非參數(shù)檢驗(yàn)對檢驗(yàn)的限制較少,更能避免先見偏差;減少了應(yīng)用中對假設(shè)條件的依賴,直觀性強(qiáng),易于接受[2]。
與大型專業(yè)統(tǒng)計(jì)軟件如SAS和SPSS等相比較,Excel是一個(gè)統(tǒng)計(jì)功能豐富、操作方便、高效的統(tǒng)計(jì)軟件。Excel在畜牧生產(chǎn)中已廣泛運(yùn)用于飼料配方優(yōu)化計(jì)算,試驗(yàn)數(shù)據(jù)記錄處理,繪制統(tǒng)計(jì)圖等。利用Excel實(shí)現(xiàn)非參數(shù)檢驗(yàn),主要是利用其公式與函數(shù)等功能,逐一實(shí)現(xiàn)理論算法的每一步驟,具有操作簡單,直觀易懂等特點(diǎn)。因此,以畜牧生產(chǎn)中兩個(gè)具體實(shí)例,介紹Excel的統(tǒng)計(jì)函數(shù)功能,實(shí)現(xiàn)樣本資料的秩和檢驗(yàn),為解決生產(chǎn)實(shí)際問題提供參考。
1.1 配對樣本 Wilcoxon符號(hào)秩和檢驗(yàn)原理Wilcoxon符號(hào)秩和檢驗(yàn)在符號(hào)檢驗(yàn)法的基礎(chǔ)上進(jìn)一步考慮了差值絕對值的大小。絕對值的秩和能較明確地看出在數(shù)據(jù)的散布程度。設(shè)x1,x2,…xn,和y1,y2,…yn分別為來自總體X、Y的樣本,X、Y的分布函數(shù)分別為連續(xù)函數(shù)F1(x)和F2(x),建立假設(shè):
差值Zi=xi-y i(i=1,2,…n),取差值絕對值的秩,記為Ti。若Zi>0,記其秩為Ti+,稱為正秩,若Zi<0,記其秩為Ti-,稱為負(fù)秩。秩和絕對值較小者即為檢驗(yàn)統(tǒng)計(jì)量T,再根據(jù)樣本容量數(shù)查符號(hào)秩和檢驗(yàn)表得5%水平的顯著性臨界T0.05,當(dāng)檢驗(yàn)統(tǒng)計(jì)量T小于該臨界值時(shí),就表明在這一顯著水平下可以否定原假設(shè)[3]。
1.2 實(shí)例分析
1.2 .1 數(shù)據(jù)來源 資料來源于某奶牛場利用兩種方法檢測10個(gè)奶樣的乳脂率(%)(表1)。
表1 兩種方法檢測的奶樣乳脂率
1.2 .2 數(shù)據(jù)輸入 打開Excel工作表,將數(shù)據(jù)輸入到電子表格(圖1)。
1.2 .3 分析步驟 根據(jù)輸入數(shù)據(jù)計(jì)算兩方法測定結(jié)果的差值,利用函數(shù)“ABS”得出各差值的絕對值,利用Excel排序功能,將絕對值的大小按從小到大順序排列,每一差值絕對值對應(yīng)的順序號(hào)為該差值的秩次,若遇絕對值相同的情況則先求平均秩次,最后將秩次標(biāo)上原差值符號(hào),完成秩次的編輯(圖1)。
點(diǎn)中G2單元的空白框后,在“公式”菜單欄中選擇“插入函數(shù)”條目,點(diǎn)擊“SUMIF”分析工具,彈出函數(shù)參數(shù)對話框(圖2),點(diǎn)中表格秩次數(shù)據(jù)欄開始的F2單元,并拖動(dòng)鼠標(biāo)至F11單元,此時(shí)秩次數(shù)據(jù)自動(dòng)進(jìn)入變量區(qū)域,在“Criteria”選項(xiàng)中輸入“>0”的條件,點(diǎn)擊“確定”按鈕,即求得正秩次和T+,輸入“<0”的條件,則求得負(fù)秩次和T-(圖1)。
圖1 數(shù)據(jù)輸入格式及秩次和計(jì)算結(jié)果
圖2 條件求和參數(shù)對話框
1.2 .4 結(jié)果分析 根據(jù)樣本含量對子數(shù)n(n=10),查符號(hào)秩和檢驗(yàn)表,得顯著性水平為5%的臨界值為T0.05(10)=8。由圖1可知,秩和絕對值較小者為T+=21>T,不能否定兩種檢測方法結(jié)果無差異的假設(shè),表明兩種檢測方法結(jié)果在5%水平下差異不顯著。
2.1 獨(dú)立樣本符號(hào)秩和檢驗(yàn)法 獨(dú)立樣本秩和檢驗(yàn)是抽自兩個(gè)獨(dú)立總體的兩個(gè)獨(dú)立樣本之間的比較,該檢驗(yàn)法又稱為曼-惠特尼(Mann-Whitney)秩和檢驗(yàn)。其基本原理是設(shè)兩個(gè)總體X和Y,它們的分布函數(shù)分別為F1(x)和F2(x),建立假設(shè):
分別從這兩個(gè)總體X、Y抽取容量為n1、n2的樣本,n1+n2=n。計(jì)算取自總體X的樣本秩次和為T1,取自Y的秩次和為T2,抽樣較小的總體秩和即為檢驗(yàn)統(tǒng)計(jì)量T值。如果兩個(gè)總體的分布沒有顯著性差異,則T值不會(huì)太大或太小,而是靠近最大值和最小值的中間,于是可以將T值作為秩和檢驗(yàn)的統(tǒng)計(jì)量,當(dāng)T的實(shí)際值超過臨界值時(shí),就可以否定兩總體的分布沒有顯著性差異的原假設(shè)[2]。
2.2 實(shí)例分析
2.2 .1 數(shù)據(jù)來源 資料來源于某種禽公司孵化室對該公司2個(gè)養(yǎng)殖分場2012年1-8(9)月海蘭蛋雞的孵化率(表2)。
表2 海蘭蛋雞的孵化率
2.2 .2 數(shù)據(jù)輸入 打開Excel工作表,將數(shù)據(jù)輸入到電子表格(編號(hào)1-8為分場一的孵化率,編號(hào)9-17為分場二的孵化率)(圖3)。
2.2 .3 分析步驟 將兩組數(shù)據(jù)合并,按數(shù)值大小由小至大順序排列,數(shù)值最小的秩次為1,數(shù)值最大的秩次為兩組樣本容量之和,相同數(shù)值計(jì)算平均秩次(圖3)。點(diǎn)中D2單元區(qū)域的空白框,在“公式”菜單欄中選擇“插入函數(shù)”條目,點(diǎn)擊求和函數(shù)“SUM”,彈出求和函數(shù)參數(shù)對話框,點(diǎn)中電子表格該列數(shù)據(jù)開始的C2單元,并拖動(dòng)鼠標(biāo)至C9單元,此時(shí)秩次數(shù)據(jù)自動(dòng)進(jìn)入變量區(qū)域。點(diǎn)擊“確定”按鈕,即輸出計(jì)算結(jié)果。用同樣的方法求出分場二孵化率秩次和(圖3)。
圖3 數(shù)據(jù)輸入格式及秩次和計(jì)算結(jié)果圖
2.2 .4 結(jié)果分析 根據(jù)樣本含量令較小一組為n1,樣本含量較大一組為n2,查非配對資料的秩和檢驗(yàn)表可知,5%顯著水平的上限與下限兩個(gè)臨界值T1= 54,T2=90。由圖3可知,樣本含量較小組的秩和T= 67<T2,不能拒絕兩總體分布沒有顯著性差異的原假設(shè),即該公司兩分場海蘭蛋雞孵化率在5%水平下差異不顯著。
通過以上兩個(gè)實(shí)例的分析發(fā)現(xiàn),基于Excel的非參數(shù)檢驗(yàn)方法,簡便實(shí)用,對于不太熟悉專業(yè)統(tǒng)計(jì)軟件的人員來說具有較強(qiáng)的實(shí)用性,在畜牧業(yè)生產(chǎn)及科研中有著重要的應(yīng)用價(jià)值。
[1] 謝莊.獸醫(yī)統(tǒng)計(jì)學(xué)[M].北京:高等教育出版社,2005:107-110.
[2] 袁加軍.統(tǒng)計(jì)基礎(chǔ)實(shí)驗(yàn)[M].廈門:廈門大學(xué)出版社,2010:119-129.
[3] 張勤.生物統(tǒng)計(jì)學(xué)[M].北京:中國農(nóng)業(yè)大學(xué)出版社,2008:214-216.
A
1003-4331(2014)01-0021-02