王北琪 汪 鵬 尹 平 周基元△
【提 要】 目的 提出一種適用于偏態(tài)分布的多樣本變異系數(shù)比較的平方秩檢驗,并與現(xiàn)有的D’AD與SRT方法進(jìn)行模擬比較。方法 借鑒Levene檢驗的構(gòu)造思想,對原始數(shù)據(jù)做一種新的變換,由此構(gòu)造出一種適用于偏態(tài)分布的多樣本變異系數(shù)比較的MSRT檢驗統(tǒng)計量。在不同參數(shù)設(shè)置下,經(jīng)過Monte Carlo模擬,比較新提出方法與現(xiàn)有方法的第一類錯誤率。同時,將新提出方法與現(xiàn)有方法應(yīng)用于鉛致肝損傷指標(biāo)的數(shù)據(jù),對這些方法做進(jìn)一步的比較。結(jié)果 MSRT方法可以避免D’AD方法對樣本正態(tài)分布假設(shè)的依賴;相比于SRT方法,在偏態(tài)分布下,MSRT方法可以更好地控制第一類錯誤率。在對鉛致肝損傷指標(biāo)γ-GT與ALT的變異系數(shù)的比較分析中,三種方法對兩個指標(biāo)的分析結(jié)果存在差異。結(jié)論 MSRT方法是一種穩(wěn)健且普遍適用的可靠方法。
為消除數(shù)據(jù)間量綱不同的影響,通常使用變異系數(shù)(coefficient of variation,CV)比較兩組或多組數(shù)據(jù)間的離散程度[1-2]。在醫(yī)學(xué)指標(biāo)的篩選中,一般認(rèn)為變異系數(shù)大的指標(biāo)更加重要,因此可以通過比較多樣本變異系數(shù)來判斷指標(biāo)的穩(wěn)健性與敏感性[3]。目前,比較多樣本變異系數(shù)是否存在差異的方法主要有三種:D’AD方法[4]、LRT方法[5]和SRT方法[6],其中D’AD方法與LRT方法均要求樣本服從正態(tài)分布,并且D’AD方法由于其形式簡單而且檢驗效能高,因而比LRT方法使用更廣泛。然而,當(dāng)數(shù)據(jù)不是嚴(yán)格服從正態(tài)分布時,D’AD方法與LRT方法的第一類錯誤率可能會膨脹。因此,Miller提出了SRT方法[6],雖然該方法適用于服從偏態(tài)分布的數(shù)據(jù),但是其第一類錯誤率仍然偏高,從而非常有必要提出一種適用于偏態(tài)分布數(shù)據(jù)而且能很好地控制第一類錯誤率的多樣本變異系數(shù)比較的方法[7]。因此,本文將提出一種適用于偏態(tài)分布數(shù)據(jù)的多樣本變異系數(shù)比較的方法,并與現(xiàn)有的D’AD、SRT方法的第一類錯誤率進(jìn)行模擬比較,同時將這些方法應(yīng)用于鉛致肝損傷指標(biāo)數(shù)據(jù),對這些方法做進(jìn)一步的比較。
用于做方差齊性檢驗的Levene檢驗被證實(shí)是一種穩(wěn)健的方法[8]。多樣本變異系數(shù)比較的SRT方法就是基于Levene檢驗的構(gòu)造思想構(gòu)建出來的。具體而言,設(shè)X為隨機(jī)變量,則由變異系數(shù)的定義可得
(1)
通過改變正態(tài)分布μ、σ2的值來獲得不同的CV值;通過改變均勻分布a、b的值來獲得不同的CV值;類似地,shiftχ2分布χ2(n,δ)中固定n值為4,shift gamma分布G(k,λ,δ)中固定k= 4、λ= 1,改變形狀系數(shù)δ取值以得到不同的變異系數(shù)CV值。模擬數(shù)據(jù)分別從正態(tài)分布、均勻分布、shiftχ2(4)分布與shift gamma(4,1) 分布中進(jìn)行抽樣。
四種方法在四種分布下針對不同樣本量和變異系數(shù)設(shè)置的第一類錯誤率結(jié)果見表1。由表1知,在正態(tài)分布下,D’AD方法能很好地控制第一類錯誤率;對均勻分布,D’AD方法的第一類錯誤率偏保守。對Shiftχ2(4)分布與Shift gamma(4,1)分布,當(dāng)CV≤0.20時,D’AD方法的第一類錯誤率會膨脹;當(dāng)CV=0.50時,其第一類錯誤率又偏保守。當(dāng)CV=0.50且分布為Shiftχ2(4)分布與Shift gamma(4,1)分布時,SRT方法能很好地控制第一類錯誤率,其他情況下其第一類錯誤率會膨脹。對于新提出的MSRT方法,當(dāng)分布為對稱分布時,MSRT1方法的第一類錯誤率均被控制在0.05附近;當(dāng)分布為偏態(tài)分布時,所有方法中MSRT2方法的第一類錯誤率控制得最好,然而部分情況下其第一類錯誤率仍會偏保守。
在鉛中毒導(dǎo)致肝損傷研究中[9],為評價鉛致肝損傷的最佳診斷指標(biāo),采用平行對照的動物實(shí)驗。將65只小白鼠隨機(jī)分為4組,分別為陰性對照組、10mg/kg鉛組、30mg/kg鉛組和60mg/kg鉛組,樣本量分別為17、16、16和16。獲取小白鼠γ-GT與ALT指標(biāo)數(shù)據(jù),其描述統(tǒng)計量見表2。由于樣本量較小,且原始數(shù)據(jù)變異較大,所以考慮截取兩側(cè)10%的數(shù)據(jù)后用樣本均數(shù)估計位置參數(shù)。分別用D’AD、SRT和MSRT1方法比較兩指標(biāo)組間變異系數(shù),結(jié)果見表3。
表1 不同CV值D’AD、SRT、MSRT1和MSRT2方法第一類錯誤率模擬比較
表2 鉛中毒大鼠血清肝酶活力(nkat/L)變化
表3 γ-GT與ALT組間變異系數(shù)檢驗結(jié)果
結(jié)果顯示,D’AD方法在γ-GT的組間變異系數(shù)比較中結(jié)果最為保守(χ2=1.12,P=0.772),而在ALT的結(jié)果中最為敏感(χ2=46.59,P=4.250×10-10)。對γ-GT指標(biāo),SRT方法的P值小于0.05(χ2=9.13,P=0.028),MSRT1方法的P值大于0.05(χ2=7.22,P=0.065);對ALT指標(biāo),SRT方法與MSRT1方法的P值均小于0.05。根據(jù)以上三種方法的結(jié)果,ALT的變異系數(shù)在不同劑量組間差異有統(tǒng)計學(xué)意義,但是尚不能認(rèn)為 γ-GT變異系數(shù)在各組之間存在差異。接下來使用MSRT1方法對γ-GT與ALT的變異系數(shù)在組內(nèi)是否存在差異進(jìn)行檢驗,結(jié)果見表4。由MSRT1方法的檢驗結(jié)果可知,除了60mg/kg鉛組內(nèi)γ-GT與ALT的變異系數(shù)之間差異無統(tǒng)計學(xué)意義外 (χ2=1.32,P=0.250),其余各組的γ-GT與ALT變異系數(shù)之間差異均有統(tǒng)計學(xué)意義。
表4 γ-GT與ALT在不同組別內(nèi)的變異系數(shù)比較的檢驗結(jié)果
多樣本變異系數(shù)的比較可以廣泛應(yīng)用于醫(yī)學(xué)、經(jīng)濟(jì)學(xué)等領(lǐng)域?,F(xiàn)有的方法中,目前應(yīng)用較多的是D’AD方法與SRT方法,然而當(dāng)樣本服從偏態(tài)分布時,其第一類錯誤率會膨脹。因此,本文提出適用于各種分布的多樣本變異系數(shù)比較的MSRT方法。模擬結(jié)果顯示,MSRT方法對所有對稱分布,不論變異系數(shù)和樣本量的大小,其第一類錯誤率都可以控制在預(yù)設(shè)的檢驗水平附近;在偏態(tài)分布下用中位數(shù)估計位置參數(shù)的MSRT2方法的第一類錯誤率被控制得最好。因此,本文提出的MSRT2方法適用于各種分布,是一個較為穩(wěn)健、可靠的比較多樣本間變異系數(shù)的方法。