胡純嚴(yán) ,胡良平 ,2*
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
通常,研究者是將一個(gè)數(shù)據(jù)集視為一個(gè)整體來進(jìn)行分析。然而,研究者可能希望在某個(gè)或某些特定的群體中實(shí)施因果中介效應(yīng)分析,以便獲得更精細(xì)的分析結(jié)果。這種思想和做法在統(tǒng)計(jì)學(xué)上稱為分層分析。事實(shí)上,分層分析通常包含以下兩種做法。第一種做法是將整個(gè)數(shù)據(jù)集劃分成若干個(gè)互不相交的子數(shù)據(jù)集,然后,在每個(gè)子數(shù)據(jù)集中實(shí)施各種統(tǒng)計(jì)分析;第二種做法是將各層之間的差異(被稱為隨機(jī)效應(yīng))呈現(xiàn)出來,但仍以整體形式輸出計(jì)算結(jié)果。本文將介紹如何對(duì)不同變量進(jìn)行分層以及基于前述提及的第一種做法采用SAS實(shí)現(xiàn)分層計(jì)算的方法。
一般來說,proc causalmed過程計(jì)算因果中介效應(yīng)和分解,這些效應(yīng)和分解取決于特定水平的協(xié)變量。此外,一些因果中介效應(yīng)是在處理、控制和中介變量的特定水平上定義的。因此,應(yīng)了解如何設(shè)置這些變量水平,以評(píng)估因果中介效應(yīng)。
設(shè)T代表對(duì)結(jié)果變量Y有因果效應(yīng)的處理變量;設(shè)M代表受T影響并對(duì)Y有因果效應(yīng)的中介變量;設(shè)C代表在處理變量與中介變量之間起混淆作用的一般協(xié)變量。各變量的水平在定義因果中介效應(yīng)中的作用如下[1]。①處理變量T的水平t1是研究者指定為所有計(jì)算的效應(yīng)和分解的處理?xiàng)l件的水平,t0是研究者指定為計(jì)算的所有效應(yīng)和分解的參考或控制條件的水平,對(duì)于二值處理變量,通常將t1定義為1,表示存在處理。例如,如果T代表藥物的劑量水平,則t1=10 mg是定義處理?xiàng)l件的劑量水平;通常將t0定義為0,以表示沒有給予處理;例如,如果T代表藥物的劑量水平,則t0=5 mg是定義對(duì)照條件的劑量水平。②中介變量M的水平m*是研究者指定用于計(jì)算受控直接效應(yīng)(controlled direct effect,CDE)的水平。對(duì)于二值中介變量,通常將m*定義為0,將中介變量的值保持在“缺席”水平以評(píng)估CDE。③協(xié)變量C的水平c是計(jì)算因果中介效應(yīng)公式中的條件協(xié)變量的值。
通常情況下,指定協(xié)變量水平c、處理水平t1(處理變量)或控制水平t0(處理變量)會(huì)改變所有中介效應(yīng)和分解的估計(jì)。指定中介變量的受控水平m*不會(huì)改變對(duì)總效應(yīng)(total effect,TE)、自然直接效應(yīng)(natural direct effect,NDE)或自然間接效應(yīng)(natural indirect effect,NIE)的估計(jì),但確實(shí)改變了對(duì)受控直接效應(yīng)(controlled direct effect,CDE)和參考交互作用(reference interaction,IRF)的估計(jì)。
對(duì)于二值處理變量,proc causalmed過程使用變量的第一水平作為默認(rèn)處理水平,使用變量的第二水平(最后一個(gè)水平)作為默認(rèn)控制水平。換言之,二值處理變量的第一水平扮演t1的角色,第二水平扮演t0的角色。
對(duì)于連續(xù)或有序處理變量,研究者往往設(shè)置t1和t0水平使其差值為1。這種設(shè)置適用于線性模型,包括線性回歸分析和線性結(jié)構(gòu)方程建模[2-4]。相關(guān)回歸系數(shù)(或效應(yīng))定義為處理變量T的單位變化對(duì)結(jié)果變量Y的效應(yīng)。在線性模型中,處理變量T對(duì)Y的效應(yīng)僅取決于t1和t0之間的差異,而不取決于t1和t0的數(shù)值。然而,對(duì)于非線性模型、二值響應(yīng)和交互效應(yīng),因果中介效應(yīng)和分解的計(jì)算通常取決于t1和t0本身的水平。使用不同的t1和t0集(即使它們的差異保持不變)會(huì)導(dǎo)致對(duì)因果中介效應(yīng)的不同估計(jì)。在默認(rèn)情況下,proc causalmed過程圍繞處理變量的分布中心設(shè)置處理和控制水平,見式(1)、式(2)。
研究者可以定義自己的處理和控制水平,以評(píng)估因果中介效應(yīng)和分解。例如,研究者可以使用一個(gè)標(biāo)準(zhǔn)差作為變化量,見式(3)、式(4)。
在式(3)和式(4)中,st是處理變量的樣本標(biāo)準(zhǔn)差。在計(jì)算標(biāo)準(zhǔn)誤差時(shí),該樣本標(biāo)準(zhǔn)差被視為固定值。
對(duì)于二值中介變量,proc causalmed過程使用變量的第二水平作為中介變量的默認(rèn)受控(基線)水平m*。這與在mediator語句中指定mediator模型的方式一致。也就是說,在默認(rèn)情況下,該過程對(duì)中介變量第一水平指示的事件的概率進(jìn)行建模。
對(duì)于連續(xù)或有序中介變量,proc causalmed過程在評(píng)估因果中介效應(yīng)時(shí)使用中介變量M的樣本均值作為默認(rèn)受控中介水平m*。
當(dāng)研究者在cover語句中指定了混淆協(xié)變量的效應(yīng)時(shí),proc causalmed過程會(huì)有條件地在協(xié)變量的特定水平上計(jì)算中介效應(yīng)。研究者可以使用一個(gè)或多個(gè)evaluate語句,要求系統(tǒng)在特定設(shè)置下計(jì)算指定的效應(yīng)。
默認(rèn)水平不是研究者可以考慮的唯一設(shè)置。研究者可以在調(diào)用proc causalmed過程步中通過指定以下evaluate語句來要求系統(tǒng)進(jìn)行相應(yīng)的分析,每個(gè)evaluate語句生成一組中介效應(yīng)分析結(jié)果。
evaluate'Conditional on Level 1 of C2'C1=mean C2='1';
evaluate'Conditional on Level 2 of C2'C1=mean C2='2';
evaluate'Conditional on Level 3 of C2'C1=mean C2='3';
總之,研究者可以使用evaluate語句來檢查因果中介效應(yīng),這些效應(yīng)取決于研究者指定的協(xié)變量水平。proc causalmed過程在輸出結(jié)果中顯示這些效應(yīng)以及以默認(rèn)設(shè)置為條件的整體效應(yīng)。
2.1.1 資料來源與背景信息
【例1】文獻(xiàn)[1]中的例子:仿照Marjoribanks討論的理論教育模式[5],模擬了一組包含6個(gè)變量、300個(gè)觀測(cè)的數(shù)據(jù)集,旨在了解父母提供的鼓勵(lì)性環(huán)境(Encourage)是否會(huì)影響兒童的認(rèn)知發(fā)展(Cog-Perform)。為節(jié)省篇幅,有關(guān)數(shù)據(jù)集中6個(gè)變量及其含義參見文獻(xiàn)[1]。試基于數(shù)據(jù)集中的數(shù)據(jù),評(píng)估受控直接效應(yīng)和條件中介效應(yīng)。
2.1.2 創(chuàng)建用于因果中介效應(yīng)分析的數(shù)據(jù)集
因篇幅所限,創(chuàng)建數(shù)據(jù)集Cognitive的SAS程序見文獻(xiàn)[1]。下面直接調(diào)用已創(chuàng)建的SAS數(shù)據(jù)集Cognitive。
2.2.1 用evaluate語句計(jì)算受控直接效應(yīng)
以下SAS程序中的三個(gè)evaluate語句為中介變量(Motivation)指定了不同的值。設(shè)所需要的SAS程序如下:
【SAS程序說明】在evaluate語句中,引號(hào)中的內(nèi)容用于區(qū)分不同的evaluate語句及其所產(chǎn)生的輸出。第一個(gè)evaluate語句指定中介變量(Motivation)水平的平均值,這恰好是默認(rèn)水平;第二個(gè)evaluate語句指定中介變量(Motivation)水平的上限值,即把中介水平設(shè)置為高于平均值的一個(gè)標(biāo)準(zhǔn)差;第三個(gè)evaluate語句指定中介變量(Motivation)水平的下限值,即把中介水平設(shè)置為低于平均值的一個(gè)標(biāo)準(zhǔn)差。
【SAS輸出結(jié)果及解釋】三個(gè)evaluate語句產(chǎn)生的輸出結(jié)果分別見表1、表2、表3。由每個(gè)表的最后一列可知,總效應(yīng)和各成分效應(yīng)均有統(tǒng)計(jì)學(xué)意義。由表2和表3可知,兩次評(píng)估的總體效應(yīng)保持不變。因?yàn)槭芸刂苯有?yīng)是在中介水平(m*)的特定水平上定義的,所以這兩個(gè)評(píng)估導(dǎo)致對(duì)CDE的不同估計(jì)也就不足為奇了。在高于中介變量(Motivation)平均值一個(gè)標(biāo)準(zhǔn)差時(shí),CDE為4.340;在低于中介變量(Motivation)平均值一個(gè)標(biāo)準(zhǔn)差時(shí),CDE為4.019。由于交互作用而產(chǎn)生的百分比也因兩種動(dòng)機(jī)水平而異,一個(gè)百分比是-1.928%,另一個(gè)是2.767%,兩者都很小,可忽略不計(jì)。
表1 將中介變量的水平設(shè)置為平均值時(shí)的因果中介效應(yīng)分析結(jié)果Table 1 Analysis results of causal mediation effect when the level of mediation variable was set to the mean value
表2 將中介變量的水平設(shè)置為上限值時(shí)的因果中介效應(yīng)分析結(jié)果Table 2 Analysis results of causal mediation effect when the level of mediation variable was set to the upper limit
表3 將中介變量的水平設(shè)置為下限值時(shí)的因果中介效應(yīng)分析結(jié)果Table 3 Analysis results of causal mediation effect when the level of mediation variable was set to the lower limit
2.2.2 用evaluate語句計(jì)算以協(xié)變量值(FamSize)為條件的中介效應(yīng)
研究者還可以使用evaluate語句來評(píng)估特定目標(biāo)總體的因果中介效應(yīng)。以下evaluate語句估計(jì)了小家庭(FamSize=3)和大家庭(FamSize=7)的因果中介效應(yīng)。設(shè)所需要的SAS程序如下:
【SAS輸出結(jié)果及解釋】?jī)蓚€(gè)evaluate語句產(chǎn)生的輸出結(jié)果見表4、表5。由表4和表5可知,對(duì)于小家庭和大家庭,所有因果效應(yīng)的模式都是相似的。小家庭似乎具有略高的總體效應(yīng)。對(duì)于這兩組人來說,由于激勵(lì)和動(dòng)機(jī)之間的相互作用而產(chǎn)生的總效應(yīng)的百分比很小;大約40%的總效應(yīng)是由動(dòng)機(jī)的中介作用導(dǎo)致的。
表4 將家庭規(guī)模水平設(shè)置為3(小家庭)時(shí)的因果中介效應(yīng)分析結(jié)果Table 4 Analysis results of causal mediation effect when the family size level is set to 3(small family)
表5 將家庭規(guī)模水平設(shè)置為7(大家庭)時(shí)的因果中介效應(yīng)分析結(jié)果Table 5 Analysis results of causal mediation effect when the family size levelis set to 7(large family)
2.2.3 用evaluate語句計(jì)算以協(xié)變量值(SocStatus)為條件的中介效應(yīng)
下一組evaluate語句評(píng)估了社會(huì)地位(SocStatus)高或低的受試者的因果中介效應(yīng)。設(shè)所需要的SAS程序如下:
【SAS輸出結(jié)果及解釋】?jī)蓚€(gè)evaluate語句的輸出結(jié)果見表6、表7。由結(jié)果可知,兩組的所有因果效應(yīng)模式相似(表6和表7中的計(jì)算結(jié)果接近)。高社會(huì)地位的總體效應(yīng)略高(6.889>6.795)。
表6 將社會(huì)地位水平設(shè)置為高時(shí)的因果中介效應(yīng)分析結(jié)果Table 6 Analysis results of causal mediation effect when the social status level is set to high
表7 將社會(huì)地位水平設(shè)置為低時(shí)的因果中介效應(yīng)分析結(jié)果Table 7 Analysis results of causal mediation effect when the social status level is set to low
2.2.4 用evaluate語句計(jì)算以協(xié)變量值(FamSize和SocStatus)為條件的中介效應(yīng)
研究者還可以在協(xié)變量的水平組合條件下來評(píng)估特定的因果中介效應(yīng)。在以下evaluate語句中,受試者由FamSize和SocStatus水平的組合來定義。設(shè)所需要的SAS程序如下:
proc causalmed data=Cognitive;
model CogPerform=Encourage|Motivation;
mediator Motivation=Encourage;
covar FamSize SocStatus;
evaluate'Most Favorable Environment'FamSize=-.5(SD)SocStatus=1(SD);
evaluate'Least Favorable Environment'FamSize=.5(SD)SocStatus=-1(SD);
run;
【SAS程序說明】標(biāo)記為“最有利環(huán)境”的效應(yīng)分別由FamSize和SocStatus定義,前者的標(biāo)準(zhǔn)差低于平均家庭規(guī)模0.5,后者的標(biāo)準(zhǔn)差高于平均社會(huì)地位水平1。標(biāo)記為“最不利環(huán)境”的效應(yīng)分別由FamSize和SocStatus定義,前者的標(biāo)準(zhǔn)差高于平均家庭規(guī)模0.5,后者的標(biāo)準(zhǔn)差低于平均社會(huì)地位水平1。
【SAS輸出結(jié)果及解釋】?jī)蓚€(gè)evaluate語句產(chǎn)生的輸出結(jié)果見表8、表9。
表8 最有利環(huán)境下的因果中介效應(yīng)分析結(jié)果Table 8 Analysis results of causal mediation effect under the most favorable environment
表9 最不利環(huán)境下的因果中介效應(yīng)分析結(jié)果Table 9 Analysis results of causal mediation effect under the least favorable environment
兩組的所有因果中介效應(yīng)模式相似?!白钣欣h(huán)境”的總效應(yīng)略大于“最不利環(huán)境”的總效應(yīng)(6.897>6.787)。
【結(jié)論】以上結(jié)果表明,在父母鼓勵(lì)對(duì)認(rèn)知發(fā)展的影響中,約有40%是由兒童的學(xué)習(xí)動(dòng)機(jī)介導(dǎo)的,父母鼓勵(lì)與兒童學(xué)習(xí)動(dòng)機(jī)的交互作用較小。這些結(jié)論也適用于不同規(guī)模和社會(huì)地位水平的家庭。
使用evaluate語句,可以為中介變量、協(xié)變量或協(xié)變量之間的水平組合的水平設(shè)置特定的數(shù)值,本質(zhì)上就是分層分析[6-7]。相當(dāng)于將全部資料視為一個(gè)整體,基于不同變量(結(jié)果變量和處理變量除外),將整體劃分成若干個(gè)子集,然后在每個(gè)子集中進(jìn)行因果中介效應(yīng)分析,以便獲得更加精細(xì)的分析結(jié)果。
本文介紹了處理變量、中介變量和協(xié)變量的不同水平的設(shè)置方法,特別介紹了proc causalmed過程中關(guān)于前述提及的各類變量水平的默認(rèn)設(shè)置;通過實(shí)例詳細(xì)展示了如何使用evaluate語句為中介變量和協(xié)變量設(shè)置不同水平,以便實(shí)現(xiàn)分層條件下的因果中介效應(yīng)分析。