胡純嚴(yán) ,胡良平 ,2*
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
當(dāng)結(jié)果變量為二值變量時,因果中介效應(yīng)模型為Logistic回歸模型。此時,因果中介效應(yīng)分析所采用的評價指標(biāo)不適合用算術(shù)平均值,而需要改用優(yōu)勢比(Odds Ratio,OR)[1-2]和多余相對危險度(Excess Relative Risk,ERR)[1,3]。一般來說,優(yōu)勢比適用于來自病例對照研究設(shè)計的定性資料;而相對危險度適用于隊列研究設(shè)計的定性資料。本文采用優(yōu)勢比和多余相對危險度作為評價指標(biāo),分析來自橫斷面研究設(shè)計的定性資料。本文將介紹設(shè)置變量水平的選項和多模態(tài)協(xié)變量,通過實例分析,展示以O(shè)R和ERR為評價指標(biāo)的因果中介效應(yīng)分析和效應(yīng)成分的分解結(jié)果。
當(dāng)結(jié)果變量為連續(xù)性變量時,因果中介效應(yīng)分析涉及的評價指標(biāo)為算術(shù)平均值;而當(dāng)結(jié)果變量為二值變量時,因果中介效應(yīng)分析涉及兩個新評價指標(biāo):OR和ERR。
OR和普通相對危險度(RR)的定義和計算公式在很多文獻(xiàn)中都可以找到[4-5],因篇幅所限,此處從略。以下扼要介紹ERR,計算公式見式(1)[3]。
式(1)中,R0為暴露因素取非暴露水平0時的發(fā)病率,R1為暴露因素取暴露水平1時的發(fā)病率,故R1/R0就是普通相對危險度RR;E=R1-R0,即暴露與非暴露兩種水平條件下發(fā)病率之差量,被稱為多余風(fēng)險度(Excess Risk,ER)。因此,ERR=E/R0就被稱為多余相對風(fēng)險度。
在運(yùn)用proc causalmed過程步時,用戶可以使用evaluate語句請求系統(tǒng)計算以特定變量水平為條件的因果中介效應(yīng)[1]。也就是說,用戶可以進(jìn)行分層因果中介效應(yīng)分析。具體做法是通過指定以下形式的賦值來設(shè)置變量的水平,見式(2)。
式(2)中,var-key代表指定變量的關(guān)鍵詞,以下簡稱“變量鍵”;value-key代表為指定變量的水平設(shè)置具體值的關(guān)鍵詞,以下簡稱“值鍵”。文獻(xiàn)[1]總結(jié)了var-key和value-key的選項,并將有關(guān)內(nèi)容匯總在一張表中,因篇幅所限,此處從略。
要指定賦值,需查找到正確的var-key。用于處理變量、中介變量和協(xié)變量水平時,需采用不同的var-key。例如,假設(shè)在用戶的分析中有一個連續(xù)的處理變量Exposure和一個二值中介變量Perceived-Pain,可使用以下語句確定這些變量的角色。
proc causalmed;
class PerceivedPain;
mediator PerceivedPain=Exposure;
model outcome=PerceivedPain|Exposure;
要將處理水平設(shè)置為最大樣本值,將控制水平設(shè)置為平均值,將中介變量設(shè)置為“無”的水平,可使用以下任何等效設(shè)定:
evaluate'Setting 1'_t1=max_t0=mean_mstar='none';
evaluate'Setting 2'_treatment=max_control=mean_mediator='none';
evaluate'Setting 3'Exposure(treatment)=max Exposure(control)=mean
PerceivedPain='none';
run;
本例顯示,用戶可以直接(通過提供實際變量名)或間接(通過提供關(guān)鍵字)指定變量鍵和值鍵。
需注意的是,分類協(xié)變量的默認(rèn)值鍵可以是樣本均值或模式(mode)。如果在evaluate語句中未為類別協(xié)變量指定任何水平,proc causalmed過程將使用樣本均值,作為在covar語句中指定的所有未指定類別協(xié)變量的默認(rèn)水平。例如,C1、C2和C3的樣本均值是以下設(shè)定的evaluate語句中使用的默認(rèn)水平:
如果在evaluate語句中指定了至少一個類別協(xié)變量的水平,proc causalmed過程將使用mode作為covar語句中指定的未指定類別協(xié)變量的默認(rèn)水平。例如,C2和C3的模態(tài)水平以及C4的樣本均值是以下設(shè)定的evaluate語句中使用的默認(rèn)水平:
如果將模態(tài)指定為分類協(xié)變量的值鍵,并且當(dāng)分類協(xié)變量有多個模態(tài)時,則使用計算平均值的方法來計算變量的水平。為了說明這一點,假設(shè)C1是一個連續(xù)的協(xié)變量,C2和C3是二值協(xié)變量。同時,假設(shè)這三個協(xié)變量分別有6個觀測值。C1:1、2、3、4、5、6;C2:1、1、1、1、1、1;C3:1、1、1、2、2、2。
線性預(yù)測器的設(shè)計矩陣包含一列C1、兩列C2和兩列C3:
假設(shè)指定以下evaluate語句:
evaluate'Setting C'C1=mean C2=mode C3=mode;
C1的平均值為3.5。C2的模態(tài)類別全為“1”,編碼“1 0”被用作C2的協(xié)變量水平。然而,由于C3有“1 0”和“0 1”兩個模態(tài)類別,6個觀測化簡為2個觀測。然后,協(xié)變量水平的最終編碼向量是以下兩個向量的平均值:
于是,在評估因果中介效應(yīng)和分解的公式中使用了平均水平3.5、1、0、0.5和0.5。
如果對C1和C3之間的交互作用建模,則使用以下兩個向量的平均值:
在以上兩行編碼中,最后兩列代表交互作用項。因此,在評估因果中介效應(yīng)和分解的公式中使用了平均水平3.5、1、0、0.5、0.5、1.75和1.75。
3.1.1 資料來源與背景信息
【例1】文獻(xiàn)[1]提供了一個關(guān)于吸煙對嬰兒死亡率的影響的實例。該實例演示了因果中介效應(yīng)分析,其處理變量、結(jié)果變量和中介變量均為二值變量。這些數(shù)據(jù)是從美國國家衛(wèi)生統(tǒng)計中心獲得的2003年嬰兒死亡率的信息。本例使用了100 000個觀察值的隨機(jī)樣本。數(shù)據(jù)集中的主要變量如下:處理變量為Smoking,是母親吸煙行為的指標(biāo),取值為“是”和“否”;結(jié)果變量為Death,是嬰兒出生后一年內(nèi)死亡的指標(biāo),取值為“是”和“否”;中介變量為LowBirthWgt,是低出生體重(<2 500 g)的指標(biāo),取值為“是”和“否”。此外,5個混雜的協(xié)變量:AgeGroup代表產(chǎn)婦年齡,<20歲、20~35歲、>35歲的取值分別為1、2、3;Drinking為孕婦在孕期飲酒的指標(biāo),取值為“是”和“否”;Married代表婚姻狀況,取值為“是”和“否”;Race代表種族,取值包括亞洲人、黑人、西班牙裔、土著(美洲土著)和白人;SomeCollege為母親受教育程度為12年及以上的指標(biāo),取值為“是”和“否”。因篇幅所限,詳細(xì)數(shù)據(jù)從略。試對此資料進(jìn)行因果中介效應(yīng)分析。
基于以下語句可以輸出數(shù)據(jù)集的前10個觀察值,見表1。
表1 數(shù)據(jù)集birthwgt中的前10個觀測值Table 1 The first 10 observations of birthwgt data set
proc print data=sashelp.birthwgt(obs=10);
run;
3.1.2 創(chuàng)建用于因果中介效應(yīng)分析的數(shù)據(jù)集
該數(shù)據(jù)集來自SAS幫助系統(tǒng),數(shù)據(jù)集名為sashelp.birthwgt。調(diào)用時只需在過程步語句中寫出數(shù)據(jù)集選項(data=sashelp.birthwgt)即可,參見下面過程步程序的第一句。
指定因果中介模型,設(shè)所需要的SAS程序如下:
proc causalmed data=sashelp.birthwgt decomp;
class LowBirthWgt Smoking Death AgeGroup Married Race
Drinking SomeCollege/descending;
mediator LowBirthWgt=Smoking;
model Death=LowBirthWgt|Smoking;
covar AgeGroup Married Race Drinking Some-College;
evaluate'Low Birth-Weight'LowBirthWgt='Yes'/nodecomp;
evaluate'Normal Birth-Weight'LowBirthWgt='No'/nodecomp;
run;
【SAS程序說明】decomp選項要求進(jìn)行各種總體效果分解。mediator語句指定響應(yīng)變量LowBirthWgt的中介模型。模型語句指定了響應(yīng)變量“死亡與否”的結(jié)果模型,并假設(shè)低出生體重和吸煙之間存在交互作用。class語句命名分析中的分類變量,降序選項(即descending)建模兩個響應(yīng)的最后一級概率(Death=Yes和 LowBirthWgt=Yes)。covar語句指定了5個協(xié)變量。最后,兩個evaluate語句指定了中介變量的水平,以比較其因果中介效應(yīng)的模式。
【SAS主要輸出結(jié)果及解釋】第一部分輸出結(jié)果見表2。表2顯示了優(yōu)勢比量表和多余相對風(fēng)險量表對嬰兒死亡率效應(yīng)的主要分解。總效應(yīng)的百分比僅顯示在多余相對風(fēng)險量表上。表2的前四行總結(jié)了對優(yōu)勢比量表的效應(yīng)。該量表的受控直接效應(yīng)(controlled direct effect,CDE)為1.894,當(dāng)中介變量LowBirthWgt被控制在水平No時,該數(shù)值就是CDE的值。換言之,這是正常出生體重組的CDE的優(yōu)勢比。相應(yīng)的置信區(qū)間為(1.200~2.588)。優(yōu)勢比量表上的自然直接效應(yīng)(natural direct effect,NDE)和自然間接效應(yīng)(natural indirect effect,NIE)分別為1.363和1.253。它們的乘積與優(yōu)勢比量表上的總效應(yīng)相同,即1.707。表2的后七行總結(jié)了對多余相對風(fēng)險量表的效應(yīng)。自然直接效應(yīng)(0.363)和自然間接效應(yīng)(0.345)在此量表上具有加性;總多余相對風(fēng)險為0.707??杉有允沟檬褂眠@些值更容易推斷“中介變量所占百分比”,即48.717%。因此,大約50%的吸煙對嬰兒死亡率的效應(yīng)是通過降低嬰兒出生體重來實現(xiàn)的。然而,“中介變量所占百分比”的95%置信區(qū)間相當(dāng)寬(29.329%~68.104%),更大的樣本含量將產(chǎn)生更精確的區(qū)間估計。吸煙與低出生體重之間的交互作用所產(chǎn)生的總效應(yīng)的百分比約為8%,這一比例相對較小。同樣,相應(yīng)的95%置信區(qū)間相當(dāng)寬(-30.762%~47.002%)。
表2 對嬰兒死亡率效應(yīng)的匯總Table 2 Summary of effects on infant mortality
第二部分輸出結(jié)果見表3,它由proc causalmed過程步語句中的decomp選項要求進(jìn)行各種總效應(yīng)分解。目前,所有這些分解都是根據(jù)多余相對風(fēng)險尺度計算的[6]。
表3 吸煙對嬰兒死亡率效應(yīng)的分解Table 3 Decompositions of smoking effects on infant mortality
第三部分輸出結(jié)果見表4,是由proc causalmed過程步根據(jù)其對多余相對風(fēng)險量表中總效應(yīng)的貢獻(xiàn)百分比進(jìn)行相應(yīng)的分解所得的結(jié)果。表4中的四因子條目顯示,總效應(yīng)的45.910%既不歸因于交互作用也不歸因于中介作用(“受控直接”),5.380%歸因于參考交互作用但不歸因于中介作用,2.740%歸因于中介作用與交互作用,45.970%歸因于中介作用但不歸因于交互作用。在標(biāo)記為“CDE+PIE+PAI”的三向分解中,歸因于交互作用的總效應(yīng)百分比約為8.120%,這不是很大,但也不可忽略。請注意,此表中的一些置信區(qū)間從負(fù)值到正值不等,表明相應(yīng)的點估計可能不準(zhǔn)確。
表4 吸煙對嬰兒死亡率影響的百分比分解Table 4 Percentage decomposition of smoking effects on infant mortality
第四部分輸出結(jié)果見表5,它是第“3.2”節(jié)中proc causalmed過程步程序中第一個evaluate語句產(chǎn)生的輸出結(jié)果,即當(dāng)中介變量LowBirthWgt設(shè)置為Yes水平時的主要效應(yīng)和百分比。表5中,優(yōu)勢比CDE(針對低出生體重組進(jìn)行評估)為1.092,相應(yīng)的95%置信區(qū)間為(0.780~1.404)。
表5 低出生體重組吸煙效應(yīng)的匯總Table 5 Summary of smoking effects for the low birth-weight group
第五部分輸出結(jié)果見表6,它是第“3.2”節(jié)中proc causalmed過程步程序中第二個evaluate語句產(chǎn)生的輸出結(jié)果,即當(dāng)中介變量LowBirthWgt設(shè)置為No水平時的主要效應(yīng)和百分比。表6中,優(yōu)勢比CDE(針對正常出生體重組進(jìn)行評估)為1.894,相應(yīng)的95%置信區(qū)間為(1.200~2.588)。
表6 正常出生體重組吸煙效應(yīng)的匯總Table 6 Summary of smoking effects for the normal birth-weight group
在基于proc causalmed過程進(jìn)行因果中介效應(yīng)分析時,涉及4類變量,即結(jié)果變量、處理變量、中介變量和協(xié)變量。需要將結(jié)果變量放置在model語句的等號左邊,其他變量(包括中介變量與處理變量之間的交互作用項)放置在model語句的等號右邊;需要將中介變量放置在mediator語句的等號左邊,等號右邊只能放置處理變量;所有的協(xié)變量都必須放置在cover語句中,以列表的形式呈現(xiàn),協(xié)變量之間至少保留一個空格,也允許列出某些協(xié)變量之間的交互作用項,例如,C1|C2,它等價于:C1 C2 C1*C2。通常情況下,變量的類型為二值變量或連續(xù)性變量,所有的二值變量必須通過class語句予以聲明,不出現(xiàn)在class語句中的變量都被視為連續(xù)性變量。
本文介紹了因果中介效應(yīng)分析中涉及的兩個新評價指標(biāo)(OR和ERR)以及設(shè)置變量水平的選項和多模態(tài)協(xié)變量。針對一個實例,采用SAS實現(xiàn)了以優(yōu)勢比和多余相對危險度為評價指標(biāo)的因果中介效應(yīng)分析,給出了詳細(xì)的輸出結(jié)果,并對結(jié)果作出了解釋。