江紹萍
(1.云南民族大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,昆明 650500;2.云南大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,昆明 650500)
在實(shí)際生活中,研究者經(jīng)常遇見這樣的一類問題,即在2×2列聯(lián)表的對角線上有一個(gè)元素為零;且在理論上,這個(gè)為零的格子在試驗(yàn)中是觀察不到次數(shù)的,故含結(jié)構(gòu)零的2×2列聯(lián)表就產(chǎn)生了。如1997年日本進(jìn)行結(jié)核病的臨床試驗(yàn)[1]稱為TB試驗(yàn),總共進(jìn)行兩次TB試驗(yàn)。在第一次TB試驗(yàn)后,都希望被試驗(yàn)者呈強(qiáng)陽性(Positive也就是有肺結(jié)核抗體)。過一到三周后在進(jìn)行第二次TB試驗(yàn),若第一次試驗(yàn)后呈陽性反應(yīng)的患者將不進(jìn)行第二次TB試驗(yàn)。經(jīng)過第二次TB試驗(yàn)后,患者還是出現(xiàn)陽性或者陰性的反應(yīng),從而得到含結(jié)構(gòu)零的2×2列聯(lián)表。這個(gè)試驗(yàn)中,試驗(yàn)的總樣本數(shù)是固定的,若樣本數(shù)小,那么可能使得其它三個(gè)格子中的樣本數(shù)為零。為了避免這種情況的發(fā)生,在試驗(yàn)中加入了逆抽樣過程。
逆抽樣(又稱為負(fù)二項(xiàng)分布)即為連續(xù)抽樣直到獲得先前固定的r個(gè)感興趣的樣本時(shí)才停止抽樣。在現(xiàn)實(shí)生活中,逆抽樣條件下相對差的估計(jì)問題具有很高的實(shí)用價(jià)值。所以一些學(xué)者已作過類似的研究,如KungJongLui[3,4,5]把逆抽樣的思想加入到2×2列聯(lián)表的研究過程中,他只是建立了Wald統(tǒng)計(jì)量和對數(shù)Wald統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn),且在求解得方法采用極大似然估計(jì)的方法求解感興趣參數(shù)的估計(jì)及方差。M.L.Tang[4]作了逆抽樣條件下兩組獨(dú)立的樣本的風(fēng)險(xiǎn)比的檢驗(yàn)問題。
本文在含結(jié)構(gòu)零的列聯(lián)表中加入逆抽樣,以檢測結(jié)核病抗體的試驗(yàn)為例,即在TB試驗(yàn)中連續(xù)抽樣,直到抽到先前固定x1(x1>0)的個(gè)第一次TB反應(yīng)為陰性的樣本時(shí)才停止抽樣。我們得到如下的列聯(lián)表的形式:
其中 0<πij<1(j=0,1)是列聯(lián)表的相應(yīng)格子中的概率,X11,X10,X00為落入相應(yīng)格子的樣本數(shù)。 并且滿足:π1=π11+π10;π1+π00=1;X11=0,1,…x1;X10=0,1,…,x1;X00=0,1,…。 從而得到變量X=(X11,X10,X00)的概率密度函數(shù)為:
在含結(jié)構(gòu)零的2×2列聯(lián)表中,相對差的定義為:
根據(jù)相對差的定義,可以用參數(shù)δ和π1表示出其它的參數(shù),即 π11=π1(π1-δ),π10=π1(1+δ-π1),π00=(1-π1)。 從而得到了由參數(shù)δ和π1表示的似然函數(shù):
其中,C為不依賴于δ和π1常數(shù),δ為感興趣參數(shù),π1為討厭參數(shù)。
本文感興趣的是檢驗(yàn)相對差δ是否等于先前固定的某一個(gè)值δ0,從而建立如下的假設(shè)檢驗(yàn)問題:
同理,可以求得在H0:δ=δ0條件下參數(shù)的極大似然估計(jì),記為即求解如下方程:
得關(guān)于π1的一元三次方程:
計(jì)算過程中采用一元三次方程的求根公式來求解上述方程組的根。
以往求解感興趣參數(shù)的期望和方差,通常的做法是采用delta方法,但delta方法是一種近似求解的方法,得到的結(jié)果帶有一定的偏差。為了避免出現(xiàn)偏差,本文采用Fisher-score的方法來求解參數(shù)的方差。由此建立Fisher信息陣如下:
在求解Fisher信息陣的過程中應(yīng)該注意到,變量X11服從參數(shù)為x11和π11/π1的二項(xiàng)分布;同理X10服從參數(shù)為x1和π10/π1的二項(xiàng)分布;而變量X00服從參數(shù)為x1和的負(fù)二項(xiàng)分布。故可以得到各隨機(jī)變量的期望如下:
通過求解Fisher信息陣的逆矩陣得到感興趣參數(shù)的方差為:
建立統(tǒng)計(jì)量如下:
在實(shí)際中,可以通過求解各統(tǒng)計(jì)量條件下犯第一類錯(cuò)誤的概率和功效來檢驗(yàn)建立的統(tǒng)計(jì)量的優(yōu)劣性。并采用蒙特卡洛的方法對有限樣本進(jìn)行模擬。當(dāng)給定了δ0和π1的值之后,通過相對差的定義得到 π11,π10,π00的值。 所以模擬的過程中, 相對差 δ0取值為-0.2,-0.1,0.0,0.1;π1取值為 0.3,0.5,0.7,顯著水平為α=5%,得到相應(yīng)的結(jié)果見表1、表2。
表1 統(tǒng)計(jì)量T1,T2,T3,T4條件下犯第一類錯(cuò)誤的概率
表2 統(tǒng)計(jì)量T1,T2,T3,T4條件下的功效
通過計(jì)算犯第一類錯(cuò)誤的概率和功效,得到如下的結(jié)論:
觀察表1、表2發(fā)現(xiàn),Score統(tǒng)計(jì)量是最優(yōu)的。因?yàn)樵趨?shù)取值相同的條件下,它能保證犯第一類錯(cuò)誤的概率最小且功效還能達(dá)到最大。
T3統(tǒng)計(jì)量即Wald-score統(tǒng)計(jì)量適用于處理大樣本的情況。在T3統(tǒng)計(jì)量條件下,所求得的犯第一類錯(cuò)誤的概率隨著樣本值的增大而減小,并趨近于置信水平。所求解得的功效隨著r的增大而增大。
在模擬過程中,無論樣本值r的取值如何,T2統(tǒng)計(jì)量即Score統(tǒng)計(jì)量都能使得犯第一類錯(cuò)誤的概率達(dá)到最小,同時(shí)也使得功效達(dá)到最大。特別在樣本值r小于30的情況下,犯第一類錯(cuò)誤的概率接近于置信水平。隨著樣本值r的增大,功效變化不大。故可以T2統(tǒng)計(jì)量來處理小樣本問題。
通過觀察犯第一類錯(cuò)誤的概率發(fā)現(xiàn),T1統(tǒng)計(jì)量即Wald統(tǒng)計(jì)量比T3統(tǒng)計(jì)量性質(zhì)更穩(wěn)定一些,但是在相同的參數(shù)條件下,T1統(tǒng)計(jì)量求解得的功效比T3統(tǒng)計(jì)量差一些。
通過觀察犯第一類錯(cuò)誤的概率發(fā)現(xiàn),T4統(tǒng)計(jì)量即似然比統(tǒng)計(jì)量的性質(zhì)比較穩(wěn)定,但是觀察功效發(fā)現(xiàn)波動(dòng)性比較大,不太穩(wěn)定,所以T4統(tǒng)計(jì)量比其他的統(tǒng)計(jì)量性質(zhì)要差一點(diǎn)。
現(xiàn)實(shí)生活中逆抽樣的問題經(jīng)常涉及到。本文除了應(yīng)用逆抽樣的方法外,還采用Fisher-Score的方法求解感興趣參數(shù)的方差。這種方法可以比較準(zhǔn)確地求解參數(shù)方差,避免了采用delta方法求解感興趣參數(shù)方差時(shí)存在的誤差。另外,文中建立了四個(gè)統(tǒng)計(jì)量,并討論了這四個(gè)統(tǒng)計(jì)量所使用的條件,還得到了一個(gè)最優(yōu)的統(tǒng)計(jì)量,為以后的研究提供了一個(gè)有用的方法。在以后的問題的討論過程中,可以采用類似的方法討論π11/π12的假設(shè)檢驗(yàn)問題。
[1]Toyota,M.,Kudo,K.,Sumiya,M.,Kobori,O.High Frequency ofIndividuals with Strong Reaction to Tuberculosis among Clinical Trainess[J].Japanese Journal of Infectious Disease,1999,52.
[2]Nian-Sheng Tang,Man-lai Tang,Ivan Siu-Fung Chan.On Test of Equivalence Via Non-unity Relative Risk for Matched-pair Design[J].Statistics in Medicine,2003,22.
[3]Kung-Jong Lui.Estimation of Rate Ratio and Relative Difference in Matched-pairs underInverse Sampling[J].Environmetrics,2001,12.
[4]M.L.Tang,Y.J.Liao,H.K.T.Ng,P.S.Chan.Testing of Rate Ratio under Inverse Sampling[J].Biometrical Journal,2008,89.
[5]Kung-Jong Lui.Point Estimation on Relative Risk under Inverse Sampling[J].Biometrical Journal,1996,38.
[6]Kikuchi,D.A.Inverse Sampling in Case Control Studies Involing a Rare Exposure[J].Biometerical Journal,1987,29.
[7]Kung-Jong Lui.Confidence Intervalsforthe Risk Ratio in Cohort Studies under Inverse Sampling[J].Biometrical Journal,1995,37.
[8]Kung-Jong Lui.Sample Size for the Exact Conditional Test under Inverse Sampling[J].Statistics in Medicine,1995,15.