胡純嚴(yán) ,胡良平 ,2*
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
為了分析來自隊列研究設(shè)計的g×2×2表資料,需要完成以下3項主要任務(wù):其一,檢驗各層2×2表資料相對危險度是否滿足齊性;其二,當(dāng)資料滿足齊性要求時,估計共同相對危險度及其95%置信區(qū)間;其三,當(dāng)資料不滿足齊性要求時,估計共同相對危險度及其95%置信區(qū)間。本文將首先介紹有關(guān)的計算方法,然后,結(jié)合實例并基于SAS軟件完成前述提及的3項主要任務(wù)。
設(shè)高維表g×2×2表的表達(dá)模式如下,見表1。
表1 隊列研究設(shè)計下g×2×2表的第h層2×2表資料的表達(dá)模式
在分析“隊列研究設(shè)計”的二維表資料時,可以很方便地依據(jù)公式“RR=a(c+d)/c(a+b)”計算出相對危險度RR的數(shù)值。然而,面對“g×2×2表資料”,卻無法直接計算出RR的數(shù)值。從概念上來說,似乎可以采取某種舉措,將“g×2×2表資料”降維或壓縮成一個“2×2表資料”。但事實上,這種理想的“2×2表資料”是無法直接呈現(xiàn)出來的。于是,統(tǒng)計學(xué)家通過統(tǒng)計學(xué)方法來體現(xiàn)出各層“2×2表資料”之間的“微小差別”,這就是求出各層“2×2表資料”的“權(quán)重系數(shù)wh”。通過它將各層“2×2表資料”進(jìn)行加權(quán)平均,從而間接獲得合并后的相對危險度RR的數(shù)值。在SAS/STAT的FREQ過程中,將“合并后的結(jié)果”稱為“common relative risk[1]”,常譯成“共同或普通或合并相對危險度(以下統(tǒng)稱為‘共同相對危險度’)”。
【說明】基于“g×2×2表資料”估計共同相對危險度的前提條件是高維表資料應(yīng)滿足齊性。針對“相對危險度”的齊性檢驗(也稱為異質(zhì)性檢驗)的具體方法參見本期“科研方法專題”中的《如何正確運用χ2檢驗——高維表資料齊性檢驗與SAS實現(xiàn)》,此處從略。
SAS/STAT中的FREQ過程[1]采用2種方法估計校正的共同相對危險度及其置信區(qū)間,它們分別是:①校正的計算方法,Mantel-Haenszel估計法;②校正的計算方法,logit估計法。嚴(yán)格地說,這兩種方法僅適用于“資料滿足齊性要求”的場合。
2.1.1 高維表資料相對危險度分析的具體內(nèi)容
高維表資料相對危險度分析的具體內(nèi)容包括以下4項:其一,檢驗資料是否滿足齊性要求;其二,估計共同相對危險度;其三,估計共同相對危險度的置信區(qū)間;其四,檢驗共同相對危險度是否等于1。其中,第4項任務(wù)可以通過第3項任務(wù)間接完成。也就是說,當(dāng)置信區(qū)間不包含1時,就等于接受“H1:共同相對危險度RR≠1”這個備擇假設(shè)。
2.1.2 高維表資料共同相對危險度的點估計及置信區(qū)間估計
2.1.2.1 Mantel-Haenszel估計量
基于Mantel-Haenszel估計量(簡稱MH估計量)估計高維表資料共同相對危險度[1],見式(1):
2.1.2.2 Logit估計量
式(6)中分母的定義由式(3)給出。
如果nh11或nh21為 0,在計算RRh和wh之前,需要給第h層的2×2表所有格加上0.5。
2.1.3 高維表資料共同相對危險度是否等于1的檢驗
2.1.3.1 概述
文獻(xiàn)[3-4]介紹了高維表資料共同相對危險度是否等于1的檢驗方法。根據(jù)資料齊性檢驗結(jié)果,可采用“Z檢驗(滿足齊性)”和“χ2檢驗(不滿足齊性)”兩種方法。
2.1.3.2Z檢驗
當(dāng)g×2×2表資料滿足齊性時,高維表資料共同相對危險度是否等于1的檢驗可采用以下Z檢驗(即基于固定效應(yīng)模型推導(dǎo)出的公式),見式(7):
在式(7)中,Z為服從N(0,1)的標(biāo)準(zhǔn)正態(tài)分布的檢驗統(tǒng)計量。其中,分子與分母中的部分統(tǒng)計量分別見下式:
式(10)中分子與分母的部分統(tǒng)計量分別見下式:
2.1.3.3χ2檢驗
當(dāng)g×2×2表資料不滿足齊性時,高維表資料共同相對危險度是否等于1的檢驗可采用下面的χ2檢驗[基于隨機效應(yīng)模型推導(dǎo)出的公式,即基于DerSimonian-Laird法(簡稱DL法)],見式(14):
在式(14)中,χ2為服從自由度為df=1的χ2分布的檢驗統(tǒng)計量;分子與分母中的部分統(tǒng)計量分別見下式:
在式(16)中,τ2的定義見下式:
在式(17)中,Q為齊性檢驗的檢驗統(tǒng)計量;q為高維表的層數(shù)。
RRDL的 100(1-α/2)%置信區(qū)間計算方法見下式:
2.2.1 問題與數(shù)據(jù)
【例1】文獻(xiàn)[5]提供了如下資料,試對7項研究的共同相對危險度進(jìn)行分析。見表2。
表2 阿司匹林預(yù)防心肌梗死后患者死亡與否的7項隨機對照研究結(jié)果
【例2】文獻(xiàn)[6]提供了如下資料,試對13項研究的共同相對危險度進(jìn)行分析。見表3。
表3 BCG疫苗與對照疫苗預(yù)防結(jié)核病療效的隨機對照研究結(jié)果
2.2.2 對例1資料共同相對危險度分析的SAS實現(xiàn)
【例3】沿用例1中的“問題與數(shù)據(jù)”,試對7項研究的共同相對危險度進(jìn)行分析。
【分析與解答】設(shè)所需要的SAS程序如下:
【SAS輸出結(jié)果及解釋】
以上輸出的是“普通優(yōu)比和相對風(fēng)險”的計算結(jié)果,其中,“普通”也叫做“共同或合并”。實際上,就是基于“Mantel-Haenszel法”和“l(fā)ogit法”計算出來的校正“共同相對危險度”的估計值及其95%置信區(qū)間。在本例中,應(yīng)看“相對風(fēng)險(第1列)”的兩種方法計算的結(jié)果(因為第1列上的結(jié)果為“死亡”,是研究者特別關(guān)注的結(jié)局)。RRMH=0.9143,其95%置信區(qū)間為[0.8664,0.9649];RRL=0.9145,其95%置信區(qū)間為[0.8665,0.9651]。
以上是基于“優(yōu)比的齊性檢驗”結(jié)果,可作為基于“相對危險度的齊性檢驗”結(jié)果的參考。結(jié)果顯示:資料滿足齊性要求。
【統(tǒng)計與專業(yè)結(jié)論】在本例中,因95%置信區(qū)間不包含1,說明共同相對危險度與1之間的差別具有統(tǒng)計學(xué)意義。由于RR=0.9145<1,說明阿司匹林組的死亡率低于安慰劑組的死亡率。也就是說,相對于采用安慰劑而言,采用阿司匹林預(yù)防心肌梗死可明顯降低心肌梗死患者的死亡率。
2.2.3 對例2資料共同相對危險度分析的SAS實現(xiàn)
2.2.3.1 基于固定效應(yīng)模型推導(dǎo)出公式進(jìn)行計算
【例4】沿用例2中的“問題與數(shù)據(jù)”,試對13項研究的共同相對危險度進(jìn)行分析。
【分析與解答】設(shè)所需要的SAS程序如下:
【說明】因FREQ過程只能基于“優(yōu)比OR”進(jìn)行齊性檢驗,且檢驗結(jié)果顯示此資料不滿足齊性,可將其視為基于“相對危險度RR”的齊性檢驗的近似結(jié)果,說明由此SAS程序輸出的關(guān)于“共同相對危險度”的點估計及其置信區(qū)間估計結(jié)果不可用,故此處不呈現(xiàn)SAS輸出結(jié)果。
2.2.3.2 基于隨機效應(yīng)模型推導(dǎo)出公式進(jìn)行計算
【例5】沿用例2的“問題與資料”,重新對13項研究的共同相對危險度進(jìn)行分析。
【分析與解答】因SAS/STAT的FREQ過程不能直接對各層2×2表資料的“相對危險度”進(jìn)行齊性檢驗,而且,在資料不滿足齊性的條件下,也沒有基于隨機效應(yīng)模型推導(dǎo)出公式來估計“共同相對危險度及其置信區(qū)間”,故需要改用SAS語言編程來間接實現(xiàn)[7]。
采用SAS語言編程所需要的程序語句較多,因篇幅所限,此處從略,讀者只需要對文獻(xiàn)[7]P392-394上的SAS程序略加修改即可。
【SAS輸出結(jié)果及解釋】
以上分別為滿足齊性條件下MH方法計算的結(jié)果、滿足齊性條件下logit方法計算的結(jié)果和不滿足齊性條件下DL方法計算的結(jié)果。輸出的結(jié)果中各項含義如下:
齊性檢驗結(jié)果:各層2×2表資料的“相對危險度齊性檢驗”結(jié)果為:Q=152.229,df=12,P<0.0001,表明該資料不滿足齊性;I2=92.12%>50.00%,此統(tǒng)計量也表明資料不滿足齊性。
滿足齊性條件下的分析結(jié)果之一:基于MH法估計共同相對危險度RRMH及其95%置信區(qū)間分別為:RRMH=0.63528,[0.58814,0.68619]。注意:本例資料不滿足齊性要求,故不適合保留這部分計算結(jié)果。
滿足齊性條件下的分析結(jié)果之二:基于logit法估計共同相對危險度RRL及其95%置信區(qū)間分別為:RRL=0.65033,[0.60070,0.70405]。注意:本例資料不滿足齊性要求,故不適合保留這部分計算結(jié)果。
不滿足齊性條件下的分析結(jié)果:基于DL法估計共同相對危險度RRDL及其95%置信區(qū)間分別為:RRDL=0.48966,[0.34495,0.69508]。注意:本例資料不滿足齊性要求,故可以基于這部分計算結(jié)果來下統(tǒng)計結(jié)論和專業(yè)結(jié)論。
【統(tǒng)計結(jié)論與專業(yè)結(jié)論】因RRDL=0.48966<1,并且,95%置信區(qū)間[0.34495,0.69508]不包含1,說明共同相對危險度與1之間的差別具有統(tǒng)計學(xué)意義。結(jié)合題目中的臨床問題可知,BCG疫苗的死亡率低于對照疫苗的死亡率。
在SAS/STAT的FREQ過程中,只給出了針對“優(yōu)比”的齊性檢驗,未給出針對“相對危險度”的齊性檢驗(一般來說,對同一個資料而言,前述提及的兩種齊性檢驗結(jié)果基本接近,故在要求不高的前提下,可以將“優(yōu)比的齊性檢驗結(jié)果”作為“相對危險度的齊性檢驗結(jié)果”的近似解);當(dāng)資料滿足齊性時,SAS給出了基于“MH法”與“l(fā)ogit法”校正的共同相對危險度及其置信區(qū)間的估計(等價于“基于固定效應(yīng)模型進(jìn)行Meta分析”的結(jié)果);而當(dāng)資料不滿足齊性時,SAS未給出基于“DL法”的共同相對危險度及其置信區(qū)間的估計(這就是所謂的“基于隨機效應(yīng)模型進(jìn)行Meta分析”的結(jié)果)。解決的辦法有兩種,其一,基于相應(yīng)的公式和 SAS 語言編程[1,7]實現(xiàn)計算;其二,使用專門用于Meta分析的RevMan軟件[6,8-9]實現(xiàn)計算。
本文對g×2×2表資料進(jìn)行了相對危險度分析,其內(nèi)容包括“針對相對危險度的齊性檢驗”,資料滿足齊性條件和不滿足齊性條件下的“共同相對危險度的點估計和區(qū)間估計”;還介紹了資料滿足與不滿足齊性條件下的“共同相對危險度是否等于1的假設(shè)檢驗方法”。通過兩個實例并基于SAS軟件實現(xiàn)了相對危險度分析,并對SAS輸出結(jié)果進(jìn)行了解釋,做出了統(tǒng)計結(jié)論和專業(yè)結(jié)論。