南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院生物統(tǒng)計(jì)學(xué)系(510515) 葉韻韶 陳平雁
常見定量資料應(yīng)用基于秩轉(zhuǎn)換類參數(shù)方法的可行性*
南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院生物統(tǒng)計(jì)學(xué)系(510515) 葉韻韶 陳平雁△
目的針對配對樣本(單樣本)設(shè)計(jì)、兩個和多個獨(dú)立樣本設(shè)計(jì)的定量資料,分析參數(shù)方法、非參數(shù)方法以及基于秩轉(zhuǎn)換類參數(shù)方法在資料不滿足參數(shù)方法條件下的適用情形。方法介紹基于秩轉(zhuǎn)換類參數(shù)方法的原理及其與非參數(shù)方法的關(guān)系,采用Monte-Carlo模擬方法,考慮正態(tài)和左偏態(tài)兩種分布,方差齊與不齊兩種情形,比較三種方法的I類錯誤率和檢驗(yàn)效能。結(jié)果左偏態(tài)分布時(shí),無論方差是否齊性,或不涉及方差齊性(單樣本設(shè)計(jì)),參數(shù)方法的I類錯誤率偏離設(shè)定水準(zhǔn)且明顯大于非參數(shù)方法和基于秩轉(zhuǎn)換類參數(shù)方法,而檢驗(yàn)效能明顯低于其他兩種方法。方差不齊且正態(tài)分布時(shí),參數(shù)方法的統(tǒng)計(jì)性能明顯優(yōu)于其他兩種方法。非參數(shù)方法和基于秩轉(zhuǎn)換類參數(shù)方法在不同資料類型下的統(tǒng)計(jì)性能相近。結(jié)論基于秩轉(zhuǎn)換類參數(shù)方法與非參數(shù)方法條件性能相近,適用于非參數(shù)方法處理的數(shù)據(jù)。
定量資料 參數(shù)方法 非參數(shù)方法 秩轉(zhuǎn)換 I類錯誤率 檢驗(yàn)效能
對于定量數(shù)據(jù),參數(shù)方法通常需要滿足某些前提條件,如正態(tài)分布和方差齊性等,此種情況下使用參數(shù)方法優(yōu)于非參數(shù)方法已有定論。然而,當(dāng)數(shù)據(jù)不滿足參數(shù)方法所需條件時(shí),包括經(jīng)數(shù)據(jù)轉(zhuǎn)換后仍然不能滿足的情形,校正的參數(shù)方法(如Welch法等用于方差不齊的情況)和非參數(shù)方法都可以考慮[1],同時(shí),基于秩轉(zhuǎn)換類參數(shù)方法(method of ranks,以下簡稱“秩轉(zhuǎn)換類參數(shù)方法”)也是一種選擇[2-5]。雖然Conver等[6]通過理論推導(dǎo)及證明,揭示了常見資料類型秩轉(zhuǎn)換類參數(shù)方法統(tǒng)計(jì)量與非參數(shù)方法統(tǒng)計(jì)量之間的關(guān)系,但是,采用秩轉(zhuǎn)換類參數(shù)方法在應(yīng)用方面是否可行,仍是一個值得探討的問題。為此,本文針對常見的資料類型,即配對樣本(單樣本)設(shè)計(jì)、兩個和多個獨(dú)立樣本設(shè)計(jì)的定量資料,系統(tǒng)介紹相應(yīng)的秩轉(zhuǎn)換類參數(shù)方法,并采用Monte-Carlo方法模擬比較其與參數(shù)方法、非參數(shù)方法的統(tǒng)計(jì)性能,以系統(tǒng)論證秩轉(zhuǎn)換類參數(shù)方法應(yīng)用于數(shù)據(jù)處理實(shí)踐的可行性。
1.配對樣本設(shè)計(jì)
非參數(shù)方法:對于配對樣本設(shè)計(jì),用Di表示配對樣本(Xi,Yi)的差值,即Di=Xi-Yi(i=1,2,…,N),N為樣本量。設(shè)Ri為Di對應(yīng)的秩次(差值為0不進(jìn)行排秩),即Ri=sign(Di)×rank(|Di|),其中sign()表示符號函數(shù),rank()表示|Di|在|D1|,|D2|,…,|Dn|(n是差值非0的對子數(shù))中的秩次,當(dāng)|Di|相等時(shí),即出現(xiàn)相同秩(ties),此時(shí)取平均秩次,由此得非參數(shù)方法Wilcoxon signed ranks(WSR)的檢驗(yàn)統(tǒng)計(jì)量[7]:
ZWSR近似服從標(biāo)準(zhǔn)正態(tài)分布,其中T+為所有正值的秩和。tj為第j個相同秩的個數(shù)。
當(dāng)無相同秩時(shí),公式(1)等價(jià)于:
參數(shù)方法:H0∶E(D)=0,參數(shù)方法對應(yīng)的單樣本t檢驗(yàn)為:
秩轉(zhuǎn)換類參數(shù)方法:用秩次Ri替代原始數(shù)據(jù)Di,差值為0時(shí)做剔除處理,則秩轉(zhuǎn)換類參數(shù)方法的檢驗(yàn)統(tǒng)計(jì)量(單樣本t檢驗(yàn)):
tWSR服從自由度υ=N-1的t分布。
當(dāng)不存在相同秩時(shí),可由公式(2)和公式(4)得出檢驗(yàn)統(tǒng)計(jì)量ZWSR與tWSR的關(guān)系,即:
對于單組設(shè)計(jì),檢驗(yàn)統(tǒng)計(jì)量只需在分子上減去已知參數(shù)(常量),其他關(guān)系式不變。
2.兩獨(dú)立樣本設(shè)計(jì)
非參數(shù)方法:非參數(shù)方法常用Wilcoxon-Mann-Whitney(WMW)檢驗(yàn)。設(shè)X1,X2,…,Xn和Y1,Y2,…,Ym表示兩個獨(dú)立隨機(jī)樣本,其中n≤m,n和m為相應(yīng)兩組的樣本量。設(shè)Ri為兩個獨(dú)立樣本數(shù)據(jù)混合后對應(yīng)的秩次,Ri的取值從1到N(N=n+m)。當(dāng)觀測值相等時(shí),取平均秩次,可得檢驗(yàn)統(tǒng)計(jì)量:秩轉(zhuǎn)換類參數(shù)方法:秩轉(zhuǎn)換類參數(shù)方法(兩獨(dú)立樣本t檢驗(yàn))的檢驗(yàn)統(tǒng)計(jì)量[6]:
tWMW服從自由度υ=N-2的t分布。
當(dāng)不存在相同秩時(shí),檢驗(yàn)統(tǒng)計(jì)量ZWMW與tWMW有以下關(guān)系:
3.多個獨(dú)立樣本設(shè)計(jì)
非參數(shù)方法:(X11,X12,…,X1n1),(X21,X22,…,X2n2),…,(Xk1,Xk2,…,Xknk)表示k個獨(dú)立隨機(jī)樣本,其樣本量依次為n1,n2,…,nk,其中i≤k,j≤nk,即組數(shù)為k,第i組例數(shù)為ni,設(shè)Rij為k個樣本數(shù)據(jù)混合后對應(yīng)的秩次,即Rij的取值為1,2,…,N(N=n1+n2+…+nk),當(dāng)觀測值相等時(shí),取平均秩次,可得Kruskal-Wallis(K-W)檢驗(yàn)的統(tǒng)計(jì)量[8]:
秩轉(zhuǎn)換類參數(shù)方法:用秩次Ri替代原始數(shù)據(jù)后采用方差分析,其檢驗(yàn)統(tǒng)計(jì)量:
對上式(15)求HKW一階導(dǎo)數(shù),可證明FKW是一個關(guān)于HKW的嚴(yán)格單調(diào)遞增函數(shù)。
1.模擬方法及參數(shù)設(shè)置
模擬研究考慮分布、均數(shù)、方差和樣本量等四個因素。因滿足參數(shù)方法條件下(方差齊性和正態(tài)分布)已有結(jié)論,本模擬僅驗(yàn)證不滿足參數(shù)方法的4種情形,即①左偏態(tài)分布(單樣本);②方差(兩樣本或多樣本,后同)齊性且左偏態(tài)分布;③方差不齊且正態(tài)分布;④方差不齊且左偏態(tài)分布。樣本量分別取5、6、8、10、12、14、16、20、25、30、35、40、50和100,有平衡和非平衡設(shè)計(jì)兩種,后者兩組樣本量比例取1∶2。多個獨(dú)立樣本設(shè)計(jì)取3個水平。相同秩次均按平均秩次編秩。均數(shù)及方差的設(shè)置見后述。雙側(cè)檢驗(yàn),檢驗(yàn)水準(zhǔn)α=0.05,模擬次數(shù)10000次。分別計(jì)算三種統(tǒng)計(jì)方法的I類錯誤率和檢驗(yàn)效能。模擬過程采用R 3.1.0軟件。
當(dāng)方差不齊時(shí),參數(shù)方法采用Welch校正。
2.結(jié)果
(1)左偏態(tài)分布
由圖1可見,單樣本或配對樣本設(shè)計(jì),參數(shù)方法的I類錯誤率明顯大于秩轉(zhuǎn)換類參數(shù)方法與非參數(shù)方法,而檢驗(yàn)效能明顯低于其他兩種方法,其他兩種方法的統(tǒng)計(jì)性能相近。
FKW服從自由度υi=k-1,υ2=N-k的F分布。
當(dāng)無相同秩時(shí),檢驗(yàn)統(tǒng)計(jì)量HKW公式(12)與FKW公式(14)的關(guān)系如下:
圖1 左偏態(tài)分布單樣本或配對樣本
(2)方差齊性且左偏態(tài)分布
由圖2可見,兩獨(dú)立樣本設(shè)計(jì),參數(shù)方法的I類錯誤率明顯偏離且低于設(shè)定的檢驗(yàn)水準(zhǔn)0.05,檢驗(yàn)效能亦明顯低于其他兩種方法,秩轉(zhuǎn)換類參數(shù)方法與非參數(shù)方法的統(tǒng)計(jì)性能相近,并優(yōu)于參數(shù)方法。三個獨(dú)立樣本設(shè)計(jì)的結(jié)果與兩獨(dú)立樣本設(shè)計(jì)結(jié)果相一致。
圖2 左偏態(tài)分布且方差齊性(平衡設(shè)計(jì))
(3)方差不齊且正態(tài)分布
由圖3可見,對于I類錯誤率,當(dāng)n≤20時(shí),三種方法的波動幅度較大;當(dāng)n>20時(shí),波動幅度明顯減小,但均未增大趨勢,以參數(shù)方法最接近設(shè)定的檢驗(yàn)水準(zhǔn),秩轉(zhuǎn)換類參數(shù)方法次之,非參數(shù)方法最差。對于檢驗(yàn)效能,三種方法相近。
圖3 正態(tài)分布且方差不齊(平衡設(shè)計(jì))
(4)方差不齊且左偏態(tài)分布
由圖4可見,對于I類錯誤率,參數(shù)方法較其他兩種方法明顯偏大,而且隨樣本量增大呈增大趨勢;其他兩種方法結(jié)果相近,接近設(shè)定檢驗(yàn)水準(zhǔn)。對于檢驗(yàn)效能,參數(shù)方法偏低,其他兩種方法相近。
非平衡設(shè)計(jì)的結(jié)果與平衡設(shè)計(jì)基本一致(因篇幅所限本文未給出)。
對于滿足參數(shù)方法條件的資料(正態(tài)分布和方差齊性),參數(shù)方法優(yōu)于非參數(shù)方法和秩轉(zhuǎn)換類參數(shù)方法已有公認(rèn)結(jié)論,故本研究未考慮這一情形。本研究對于不滿足正態(tài)分布的情況選擇了一種左偏態(tài)分布,主要是考慮這種分布無法通過變量變換滿足參數(shù)方法條件,雖然未考慮更多種類的非正態(tài)分布情形,但有代表性。
圖4 左偏態(tài)分布且方差不齊(平衡設(shè)計(jì))
對于單樣本或配對樣本設(shè)計(jì),不服從正態(tài)分布的情形不宜使用參數(shù)方法,用非參數(shù)方法或秩轉(zhuǎn)換類參數(shù)方法均可,且性能相近。
當(dāng)方差不齊且服從正態(tài)分布時(shí),參數(shù)方法的統(tǒng)計(jì)性能要優(yōu)于其他兩種方法,這一結(jié)果與趙景波等[9]和Skovlund等[10]的研究結(jié)果一致。因此,對于此類資料,盡管不滿足參數(shù)方法的條件,但仍以選擇經(jīng)方差校正的參數(shù)方法為最佳選擇。
當(dāng)服從左偏態(tài)分布時(shí),無論方差齊或不齊,參數(shù)方法的統(tǒng)計(jì)性能較差,不推薦使用。而非參數(shù)方法和秩轉(zhuǎn)換類參數(shù)方法性能相近,均可使用。Zimmerman[11]對該兩種方法進(jìn)行了模擬比較,結(jié)果與本研究相似。
秩轉(zhuǎn)換類參數(shù)方法實(shí)質(zhì)上屬于非參數(shù)方法,我們稱之為“類參數(shù)方法”,是因?yàn)檫@是一種經(jīng)過秩轉(zhuǎn)換后使用常規(guī)參數(shù)方法的檢驗(yàn)。雖然本研究所涉及的最常用的三種資料類型非參數(shù)方法和秩轉(zhuǎn)換類參數(shù)方法性能接近,但我們所以進(jìn)行秩轉(zhuǎn)換類參數(shù)方法的研究,主要是考慮某些資料類型,如析因設(shè)計(jì)等較復(fù)雜設(shè)計(jì)目前尚無適用的非參數(shù)方法,這就為秩轉(zhuǎn)換類參數(shù)方法應(yīng)用的可能性提供了依據(jù),也是我們的后續(xù)研究會進(jìn)一步考慮的課題。
1.Rosner B.Fundamentals of Biostatistics.USA:Brooks/Cole 7th edit. 2011.
2.Friedman M.The use of ranks to avoid the assumption of normality implicit in the analysis of variance.Journal of the American Statistical Association,1937,32(200):675-701.
3.Iman RL.A power study of a rank transform for the two-way classification model when interaction may be present.Canadian Journal of Statistics,1974,2(1-2):227-239.
4.Iman RL,Hora SC,Conover WJ.Comparison of asymptotically distribution-free procedures for the analysis of complete blocks.Journal of the American Statistical Association,1984,79(387):674-685.
5.Conover WJ,Iman RL.Analysis of covariance using the rank transformation.Biometrics,1982:715-724.
6.Conover WJ,Iman RL.Rank transformations as a bridge between parametric and nonparametric statistics.The American Statistician,1981,35(3):124-129.
7.Conover WJ.Practical Nonparametric Statistics.New York:John Wiley,1980.
8.Kruskal WH,Wallis WA.Use of ranks in one-criterion variance analysis.Journal of the American statistical Association,1952,47(260):583-621.
9.趙景波,李洪源,李康.兩個非正態(tài)分布資料比較方法的選擇.中國衛(wèi)生統(tǒng)計(jì),2003,20(3):185-188.
10.Skovlund E,F(xiàn)enstad G.Shold we always choose a nonparametric test when comparing two apparently nonnormal distributions.Joumal of Clinical Epidemiology,2001(54):86-92.
11.Zimmerman DW.A note on consistency of non-parametric rank tests and related rank transformations.British Journal of Mathematical and Statistical Psychology,2012,65(1):122-144.
(責(zé)任編輯:郭海強(qiáng))
Practicability of Parametric Test Based on Rank Transform Statistic for Common Quantitative Data
Ye Yunshao,Chen Pingyan(Department of Bio-statistics,Southern Medical University(510515),Guangzhou)
ObjectiveTo explore the practicability of parametric test,nonparametric test and parametric test based on rank transformation for quantitative data of paired-sample(one-sample)designs,two independent sample designs as well as three or more independent sample designs when data violate normality or homoscedasticity.MethodsIntroducing the theory of parametric test based on rank transformation and comparing type I error and power of the three kind methods by means of Monte Carlo Simulation considering that data are normality or negative skewness and homoscedasticity or heteroscedasticity.ResultsThe results indicate that parametric test contributed to type I error inflations,of which type I error are clearly greater than nonparametric test and parametric test based on rank transformation no matter whether homoscedasticity or not.Parametric test is superior to two others when data are normality but heteroscedasticity.Nonparametric test has a good consistency to parametric test based on rank transformation in different designs.ConclusionType I error and power of parametric test based on rank transformation is nearly equal to that of the nonparametric test when data are applicable to nonparametric test.
Quantitative data;Parametric test;Nonparametric test;Rank transformation;Type I error;Power
*:國家自然科學(xué)基金項(xiàng)目(No.81273191)
△通信作者:陳平雁,E-mail:chenpy99@126.com