南方醫(yī)科大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計學(xué)系(510515) 楊梓瀅 余雯薏 張 玉 周基元
【提 要】 目的 提出一種基于MOVER法中介效應(yīng)置信區(qū)間的構(gòu)造方法,并與Sobel法、百分位數(shù)bootstrap法、偏差校正的百分位數(shù)bootstrap法、乘積分布法和Monte Carlo法進(jìn)行比較。方法 借鑒MOVER法的思想,提出一種新的構(gòu)造中介效應(yīng)置信區(qū)間的MMA方法。在不同參數(shù)設(shè)置下,通過計算機(jī)模擬,比較MMA法與現(xiàn)有方法的第一類錯誤率、檢驗效能、覆蓋率及區(qū)間寬度。同時,將MMA法與現(xiàn)有方法應(yīng)用于多發(fā)性硬化患者數(shù)據(jù),對這些方法做進(jìn)一步的比較。結(jié)果 MMA法在樣本量大于25時均能控制第一類錯誤率,偏差校正的百分位數(shù)bootstrap法的第一類錯誤率可能會膨脹;除了偏差校正的百分位數(shù)bootstrap法,MMA法的檢驗效能明顯高于其余方法;隨著樣本量的增大,MMA法的覆蓋率逐漸趨近0.95;在部分模擬背景下,MMA法的區(qū)間寬度最窄。結(jié)論 MMA法是一種穩(wěn)健且檢驗效能有明顯提高的中介效應(yīng)置信區(qū)間構(gòu)造方法。
中介分析廣泛應(yīng)用于心理學(xué)[1-2]、流行病學(xué)[3-5]等研究領(lǐng)域,其目的不僅要研究自變量和因變量之間的直接關(guān)系,還要探索它們之間是否存在中介效應(yīng)。目前,一般是通過估計中介效應(yīng)的置信區(qū)間進(jìn)行檢驗[6],常用的估計方法有Sobel法[7]、百分位數(shù)bootstrap法[8]、偏差校正的百分位數(shù)bootstrap法[8]、乘積分布法[9]和Monte Carlo法[10]。其中,偏差校正的百分位數(shù)bootstrap法的檢驗效能最高,然而其第一類錯誤率可能會膨脹;Sobel法的區(qū)間寬度最窄,但其在小樣本下的第一類錯誤率偏保守。因此,有必要提出一種新的中介效應(yīng)置信區(qū)間的構(gòu)造方法,以提高其檢驗效能,并縮短其區(qū)間寬度[11]。另一方面,Zou等人[12]提出了基于MOVER法(method of variance estimates recovery)構(gòu)造比值置信區(qū)間的方法,該方法是Fieller法[13]的拓展,其基本思想是利用比值中分子、分母的置信區(qū)間來構(gòu)造比值的置信區(qū)間。當(dāng)分子、分母服從偏態(tài)分布時,該方法的覆蓋率要優(yōu)于Fieller法,并且估計的區(qū)間寬度更窄;當(dāng)分子、分母都服從正態(tài)分布時則與Fieller法等價。因此,本文提出一種基于MOVER法中介效應(yīng)置信區(qū)間的構(gòu)造方法(MOVER-based mediation analysis,MMA),并與上述五種方法進(jìn)行模擬比較,同時將這些方法應(yīng)用到多發(fā)性硬化患者數(shù)據(jù)[14],對這些方法做進(jìn)一步的比較。
考慮如下模型:
Y=β0+cX+e0
(1)
M=β1+aX+e1
(2)
Y=β2+c′X+bM+e2
(3)
其中X、Y與M分別是自變量、因變量與中介變量;β0、β1、β2是截距項;c是X對Y的總效應(yīng);ab是X對Y的間接效應(yīng);c′是扣除M的影響后X對Y的直接效應(yīng);e0、e1、e2是殘差。檢驗中介效應(yīng)有兩種方式[11],一是檢驗公式(1)、(3)中回歸系數(shù)的差c-c′是否為0;二是檢驗公式(2)、(3)中回歸系數(shù)的乘積ab是否為0。由于檢驗前者的第一類錯誤率通常會膨脹[7,11],因此在中介分析中一般直接對ab進(jìn)行檢驗。
圖1 四種情況下比值R的置信區(qū)間上、下限取值
(4)
將上述構(gòu)造中介效應(yīng)置信區(qū)間的方法記為MMA法。
用R語言對新提出的MMA法與現(xiàn)有的Sobel法(Sobel)、百分位數(shù)bootstrap法(percentile)、偏差校正的百分位數(shù)bootstrap法(BC)、乘積分布法(dop)和Monte Carlo法(MC)在不同樣本量(N)、不同中介效應(yīng)強(qiáng)度(ab)下的第一類錯誤率、檢驗效能(power)、覆蓋率和區(qū)間寬度(width)進(jìn)行模擬比較。首先從標(biāo)準(zhǔn)正態(tài)分布隨機(jī)抽樣分別產(chǎn)生樣本量為N的變量X、e1、e2,然后根據(jù)公式(2)、(3)計算得到中介變量M和因變量Y。取N=25,50,100,200,500,1000。參照方杰等人的模擬研究[6],設(shè)置三種中介效應(yīng)為0的參數(shù)組合:a=0,b=0;a=0.39,b=0;a=0,b=0.59;設(shè)置三種中介效應(yīng)不為0的參數(shù)組合:a=0.14,b=0.14;a=0.39,b=0.39;a=0.59,b=0.59,分別對應(yīng)中介效應(yīng)強(qiáng)度為小、中、大的情形。由于MacKinnon等人的模擬研究[7]表明中介分析的模擬結(jié)果不受直接效應(yīng)變化的影響,因此設(shè)c′=0。為簡化模型,β1、β2也設(shè)為0。模擬次數(shù)設(shè)為1000次,顯著性水平設(shè)為α=0.05;bootstrap法和Monte Carlo法的重抽樣次數(shù)分別設(shè)為5000次和1000次。
六種方法第一類錯誤率的模擬結(jié)果見表1。由表1知,當(dāng)a=b=0時,MMA法和其余五種方法的第一類錯誤率都遠(yuǎn)低于0.05,且均低于a=0,b≠0與a≠0,b=0情況下的第一類錯誤率;當(dāng)a、b中至少有一個不為0時,Sobel法偏保守,偏差校正的百分位數(shù)bootstrap法和乘積分布法的第一類錯誤率可能會膨脹,這與文獻(xiàn)[6-7]的研究結(jié)果一致。MMA法、百分位數(shù)bootstrap法和Monte Carlo法在N>25時能很好地控制第一類錯誤率。六種方法覆蓋率的模擬結(jié)果見表2。由表2知,隨著樣本量和中介效應(yīng)強(qiáng)度的增大,六種方法的覆蓋率逐漸趨于0.95。六種方法檢驗效能和區(qū)間寬度的模擬結(jié)果見圖2。由圖2知,隨著樣本量和中介效應(yīng)強(qiáng)度的增大,六種方法的檢驗效能均逐漸增大。其中偏差校正的百分位數(shù)bootstrap法的檢驗效能最高,MMA法次之。針對區(qū)間寬度方面的表現(xiàn),當(dāng)N=25時,Sobel法最優(yōu);當(dāng)50≤N≤200時,總的來講,MMA法最優(yōu);N≥500時,Monte Carlo法最優(yōu)。此外,我們還模擬了a、b至少有一個為負(fù)情況下的結(jié)果,與上述結(jié)果類似,此處不再贅述。
圖2 六種方法檢驗效能和區(qū)間寬度的模擬比較
表1 六種方法第一類錯誤率的模擬比較
表2 六種方法覆蓋率(%)的模擬比較
表3 六種方法在實例分析中的中介效應(yīng)置信區(qū)間及區(qū)間寬度
本文提出了一種基于MOVER法中介效應(yīng)置信區(qū)間的MMA構(gòu)造方法。模擬結(jié)果顯示:現(xiàn)有偏差校正的百分位數(shù)bootstrap法的檢驗效能最高,MMA法次之。然而,注意到偏差校正的百分位數(shù)bootstrap法的第一類錯誤率可能會膨脹,其檢驗效能的結(jié)果不一定可靠。另一方面,實例分析結(jié)果提示:MMA法的中介效應(yīng)置信區(qū)間的寬度最窄。因此,MMA法是一種穩(wěn)健、檢驗效能較高的中介效應(yīng)置信區(qū)間構(gòu)造方法。此外,本研究仍然存在一些不足。由于新提出的MMA法將中介效應(yīng)ab轉(zhuǎn)換為比值的形式進(jìn)行估計,所以當(dāng)a、b的置信區(qū)間都以0為端點、不能取倒數(shù)時,無法求解分母的置信區(qū)間,因此MMA法不再適用。然而,當(dāng)a、b的置信區(qū)間中至少有一個區(qū)間不以0為端點時,即使a、b的置信區(qū)間均以0為內(nèi)點,MMA法仍然適用。另一方面,該方法只考慮了單個中介變量以及因變量僅為計量資料的情況,提示該方法需要向多個中介變量或因變量為計數(shù)資料等方向進(jìn)行拓展,我們將在今后的研究中予以改進(jìn)。