汪永輝, 金 華, 吳 琴
(華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院, 廣州 510631)
?
基于2個獨立二項分布的風(fēng)險比的信仰推斷
汪永輝, 金華*, 吳琴
(華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院, 廣州 510631)
摘要:2個獨立二項分布參數(shù)之間的風(fēng)險比的非劣效性檢驗在醫(yī)學(xué)統(tǒng)計研究中是一個非常有意義的問題,常用的限制性極大估計方法在大多數(shù)情況下都不能控制第一類錯誤.文中提出用基于信仰推斷法來解決基于2個獨立二項分布參數(shù)之間的風(fēng)險比的非劣效性檢驗問題.模擬結(jié)果顯示:在小樣本的研究情況下,這種基于信仰推斷法的MF檢驗方法能很好地控制第一類錯誤,檢驗功效也不差.
關(guān)鍵詞:二項分布; 非劣性檢驗; 信仰推斷;p值; 功效
非劣效性檢驗在醫(yī)學(xué)統(tǒng)計研究中主要關(guān)注新藥療效是否不比標準藥差.假設(shè)用隨機變量X0表示治療某種疾病的標準藥的療效,用隨機變量X1表示新藥的療效. 從研究病人中隨機抽取n0和n1個病人分別用標準藥和新藥來治療, 并假定標準藥的治愈率是p0, 新藥的治愈率是p1,則X0服從二項分布B(n0,p0),X1服從二項分布B(n1,p1).
上述問題可表示為2×2列聯(lián)表(表1).表中,x0和x1分別為隨機變量X0和X1的觀測值. 醫(yī)學(xué)研究中, 常常將p0和p1分別看成使用標準藥和新藥治療某種疾病的風(fēng)險, 這里討論風(fēng)險比:φ=p1/p0的單邊非劣性假設(shè)檢驗問題:
H0:p1/p0≤φ0,H1:p1/p0≥φ1,
(1)
其中,0<φ0<φ1<1為事先指定的可接受邊界值.式(1)表明當(dāng)H0被拒絕時,新藥的療效并不比標準藥差.
表1 治療某種疾病的2種藥物的治療效果比較
MIETTINEN和NURMINEN[1]給出了假設(shè)檢驗問題(1)的基于討厭參數(shù)p0的約束p1/p0=φ0極大似然估計的檢驗統(tǒng)計量(常稱為MN檢驗)
zMN=
在原假設(shè)H0的條件下, 檢驗統(tǒng)計量zMN近似服從標準正態(tài)分布.因此當(dāng)zMN≥z1-α(這里z1-α是標準正態(tài)分布的100×(1-α)分位點)時,在顯著性水平1-α下,式(1)中原假設(shè)H0被拒絕,從而接受備擇假設(shè)H1.文獻[2-3]表明MIETTINEN和NURMINEN[1]的MN檢驗當(dāng)樣本量N較大時,表現(xiàn)良好. 但是這個檢驗統(tǒng)計量在樣本量不太大的情況下不能很好地控制犯第一類錯誤的概率.
另一方面,有學(xué)者也利用貝葉斯方法來討論假設(shè)檢驗問題(1).ZASLAVSKY[4]基于貝塔先驗分布導(dǎo)出了2個獨立二項分布的整數(shù)參數(shù)風(fēng)險比精確后驗分布,并給出了檢驗的p值:
PEB(φ=p1/p0≤φ0|x0,n0,x1,n1)=
(3)
信仰推斷法是FISHER[5]提出的一種統(tǒng)計方法.HANNIG等[6]發(fā)現(xiàn)信仰推斷法可為小樣本提供比較精確的推斷結(jié)果.但是, 用信仰推斷法研究關(guān)于2個獨立二項分布風(fēng)險比的假設(shè)檢驗問題, 目前國內(nèi)外尚未見有相關(guān)報道.本文利用信仰推斷法[6],在不涉及二項分布參數(shù)p先驗分布的情況下,構(gòu)造了2個獨立二項分布的風(fēng)險比的假設(shè)檢驗問題.模擬顯示效果良好.
1基于信仰分布的檢驗方法
本節(jié)給出假設(shè)檢驗問題(1)的基于信仰分布的新檢驗方法.HANNIG[7]給出了二項分布參數(shù)p的信仰分布:
p=DU(x+1)+(1-D)U(x),
(4)
其中,D是服從均勻分布U[0,1]的隨機變量,U1,…,Un是n個來自于U(0,1)的獨立同分布的隨機變量,U(x)是第x個次序統(tǒng)計量.U(x)的分布是貝塔分布Beta(x+1,n-x),U(x+1)的分布是Beta(x,n-x+1). HANNIG[7]通過模擬研究比較了幾種不同D的選擇,發(fā)現(xiàn)1個貝塔分布pSF=Beta(x+1/2,n-x+1/2)以及2個貝塔分布Beta(x+1,n-x)和Beta(x,n-x+1)的混合分布pMF=(Beta(x+1,n-x)+Beta(x,n-x+1))/2統(tǒng)計性質(zhì)表現(xiàn)良好.下面基于上面2種不同的p的信仰分布,導(dǎo)出假設(shè)檢驗問題(1)的檢驗方法.
第1種情況, 如果二項分布參數(shù)p的信仰分布p~Beta(x+1/2,n-x+1/2),則有X0~Binomial(n0,p0),p0~Beta(x0+1/2,n0-x0+1/2);X1~Binomial(n1,p1),p1~Beta(x1+1/2,n1-x1+1/2).我們推導(dǎo)出的結(jié)果與貝葉斯學(xué)派使用Jeffreys先驗分布Beta(1/2,1/2)得到的后驗分布相同.于是,定義p值如下:
PSF(φ=p1/p0≤φ0|x0,n0,x1,n1)=
(5)
在給定檢驗水平α后, 當(dāng)PSF(φ=p1/p0≤φ0|x0,n0,x1,n1)≤α?xí)r,我們拒絕H0,接受H1.
第2種情況,如果二項分布參數(shù)p是服從混合比為1/2的2個貝塔分布Beta(x+1,n-x)和Beta(x,n-x+1)的混合分布的隨機變量,p~(Beta(x+1,n-x)+Beta(x,n-x+1))/2.這個信仰分布屬于混合貝塔分布,其分布與貝葉斯學(xué)派使用任何先驗分布求得的后驗分布是不同的[8].此時,基于2個獨立二項分布風(fēng)險比φ=p1/p0的精確信仰分布是
B1{x1+1,n1-x1;φp0}B0{x0,n0-x0+1;p0}dp0+
B1{x1,n1-x1+1;φp0}B0{x0+1,n0-x0;p0}dp0+
(6)
(7)
定義p值如下:
PMF(φ=p1/p0≤φ0|x0,n0,x1,n1)=
1.隊伍問題。從成校方面看,目前成校教師大多由原小學(xué)、中學(xué)的專業(yè)教師轉(zhuǎn)崗而來,專業(yè)性不強、年齡偏大,這些都影響整合的推進;從文化禮堂來看,管理人員往往兼任著社區(qū)里其他崗位的工作,工作繁雜,對和成校整合開展活動積極性不高。
(8)
在給定檢驗水平α后,PMF(φ=p1/p0≤φ0|x0,n0,x1,n1)可以定出.當(dāng)PrMF(φ=p1/p0≤φ0|x0,n0,x1,n1)≤α?xí)r,我們拒絕H0,接受H1.
2隨機模擬
為了比較小樣本情形下MIETTINEN和NURMINEN[1]的方法(簡記為MN檢驗)、ZASLAVSKY[4]的方法(簡記為EB)、基于信仰推斷法的SF檢驗以及基于信仰推斷法的MF檢驗的第一類錯誤和檢驗功效,本節(jié)利用統(tǒng)計軟件R編程進行隨機模擬,研究4種方法在樣本量相等(n0=n1)情況下的第一類錯誤和檢驗功效. 有關(guān)參數(shù)p0,φ0以及φ1的取值參考了文獻[9]. 隨機模擬的結(jié)果見圖1和圖2.
為了考察4種方法的第一類錯誤,取n0=n1=20,25,30,50,φ0=0.8,0.9,和p0=0.3,0.3+0.01,0.3+0.02,0.3+0.03,…,0.8.取顯著性水平α=0.05,在重復(fù)實驗10 000次時,其置信水平為95%的置信區(qū)間(0.045 7,0.054 3).
圖1表明,在樣本量相等的小樣本情形下:(i)MN檢驗的第一類錯誤率大部分都超過預(yù)先指定的顯著性水平α=0.05的置信上限,不能很好地控制犯第一類錯誤; (ii)SF檢驗在參數(shù)p0的大多取值情況下,經(jīng)常溢出預(yù)先指定的顯著性水平α=0.05的置信上限;(iii)EB檢驗和MF檢驗的第一類錯誤率表現(xiàn)大部分是相同的,均能保證控制犯第一類錯誤.但是,EB檢驗在參數(shù)p0取一些比較小的值時,會溢出預(yù)先指定的顯著性水平α=0.05.總的來說,就犯第一類錯誤而言,EB檢驗和MF檢驗要優(yōu)于MN檢驗和SF檢驗.
比較4種檢驗的功效,在樣本量相等的小樣本情形下,取φ1=1.0和φ0=0.8,0.9,n0=n1=20,25,30,50.SF檢驗和EB檢驗的功效在大多數(shù)情況下相等,然而, EB檢驗在一些情況下功效高于SF檢驗;MN檢驗功效低于MF檢驗,盡管它們兩者的功效有時會非常接近.MF檢驗的功效在n0=n1=20、p0的取值范圍為0.40~0.65時會高于MN檢驗.因此,從功效來看,MF檢驗也并不比EB檢驗差多少.
下面給出一應(yīng)用實例.考慮隨機雙盲抗血友病重組凝血因子VIIa的平行組研究[10]的數(shù)據(jù).這項研究的主要目的是比較rVIIa 2種給藥方案的治療效果. 對于70 μg/kg組,x0=11,n0=31和對于35 μg/kg組,x1=4,n1=23. 設(shè)定非劣性檢驗的邊界值φ0=0.91,我們來檢驗上面2組數(shù)據(jù)的非劣性假設(shè)檢驗問題:由式(2)可得頻率方法中MN檢驗的p值為0.049 7;貝葉斯方法中EB檢驗的p值為0.050 2;信仰推斷方法中的SF檢驗的p值為0.044 9;信仰推斷方法中的MF檢驗的p值為0.048 8;比較了本文所得p值結(jié)果以及文獻[4]159的例2的p值,發(fā)現(xiàn)這2個結(jié)果非常接近,可見本文方法的有效性.
3小結(jié)
針對傳統(tǒng)的頻率檢驗方法不能在小樣本下控制第一類錯誤的問題以及貝葉斯方法中先驗分布的主觀性問題,本文將信仰推斷法與2個獨立二項分布參數(shù)風(fēng)險比的單邊非劣性假設(shè)檢驗相結(jié)合, 通過構(gòu)建新的信仰單邊非劣性假設(shè)檢驗,進而得到更加有效的檢驗方法.模擬結(jié)果顯示:本文基于信仰推斷法方法MF檢驗?zāi)芎芎玫乜刂频谝活愬e誤,檢驗功效也不差;而目前常用的MN檢驗在大多數(shù)情況下都不能很好地控制第一類錯誤.
本文檢驗方法的樣本量的計算公式,是一個值得進一步研究的問題.
圖14種檢驗方法在顯著性水平0.05下的第一類錯誤率比較
Figure 1Comparison of Type I error rates of 4 test under significance level is 0.05
參考文獻:
[1]MIETTINEN O, NURMINEN M. Comparative analysis of two rates[J]. Statistics in Medicine,1985,4(2):213-226.
[2]ALMENDRA-ARAO F, SOTRES-RAMOS D. Comparison of some non-inferiority asymptotic tests for two independent proportions[J]. Agrociencia, 2009,43(2):163-172.
[3]SOTRES-RAMOS D, ALMENDRA-ARAO F, RAMREZ-FIGUEROA C. Exact critical values for Farrington-Manning noninferiority exact test[J]. Drug Information Journal, 2010,44(2):159-164.
[4]ZASLAVSKY B G. Bayesian hypothesis testing in two-arm trials with dichotomous outcomes[J]. Biometrics, 2013,69(1):157-163.
[5]FISHER R A. Inverse probability[J]. Proceedings of the Cambridge Philosophical Society, 1930,26(4):528-535.
[6]HANNIG J, LAI R C S, LEE T C M. Computational is-
圖24種檢驗方法在φ1=1.0下的檢驗功效比較
Figure 2Comparison of powers of 4 tests underφ1is 1.0
sues of generalized fiducial inference[J]. Computational Statistics & Data Analysis, 2014,71:849-858.
[7]HANNIG J. On generalized fiducial inference[J]. Statistica Sinica, 2009,19(2):491-544.
[8]GRUNDY P M. Fiducial distributions and prior distributions: an example in which the former cannot be associated with the latter[J]. Journal of the Royal Statistical Society: Series B, 1956,18(2):217-221.
[9]JIN H, FENG X B, CHEN M M, et al. Two new methods for non-inferiority testing of the ratio in matched-pair setting[J].TEST, 2014,23(4):691-707.
[10]LUSHER J M, ROBERTS H R, DAVIGNON G, et al. A randomized, double-blind comparison of two dosage levels of recombinant factor VIIa in the treatment of joint, muscle and mucocutaneous haemorrhages in persons with haemophilia A and B, with and without inhibitors[J].Haemophilia, 1998(4):790-798.
【中文責(zé)編:莊曉瓊英文責(zé)編:肖菁】
Fiducial Hypothesis Testing for the Ratio of the Parameters of Two Independent Binomials
WANG Yonghui, JIN Hua*, WU Qin
(School of Mathematical Sciences, South China Normal University, Guangzhou 510631, China)
Abstract:In medical statistics study, non-inferiority test for two independent binomial distribution parameters is a very important problem. The constrained maximum likelihood test statistic cannot control the type I error rates for some cases be investigated. In this article, the fiducial inference methodology is used in order to develop more powerful tests for non-inferiority based on the ratio between two independent binomial distributions. A broad Monte Carlo comparison between different tests for non-inferiority is presented, confirming the preference of the proposed method from a power perspective. Simulation studies suggest that the MF test can control the type I error rates and its empirical type I error rate are much closer to the prespecified nominal significance level than those of other tests well with competitive powers.
Key words:binomial proportions; non-inferiority test; fiducial inference;p-value; power study
收稿日期:2015-10-17《華南師范大學(xué)學(xué)報(自然科學(xué)版)》網(wǎng)址:http://journal.scnu.edu.cn/n
基金項目:國家自然科學(xué)基金青年項目(11401226)
*通訊作者:金華,教授, Email:jinh1@163.com.
中圖分類號:O213.2;O213.8
文獻標志碼:A
文章編號:1000-5463(2016)01-0114-05