胡純嚴(yán),胡良平,2*
(1. 軍事科學(xué)院研究生院,北京 100850;2. 世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
在分析“人-時間資料”時,若基于“人-年數(shù)”,在所考察的處理因素分別處于“暴露”與“非暴露”水平下,求出兩組受試對象各自的“發(fā)病密度”之后,再求出兩“發(fā)病密度”之比,就獲得了“率比”[1],它類似于分析通常四格表資料所采用的效應(yīng)指標(biāo)“相對危險度”或“優(yōu)勢比”[2-5];但在文獻[6]中,直接將“率比”稱為“相對危險度”。本文將介紹與“率比分析”有關(guān)的內(nèi)容以及基于SAS 軟件實現(xiàn)計算的方法。
分層人-時間資料的列表格式見表1。
表1 分層人-時間資料的列表格式
第i層“率比”是該層中“暴露水平”下的“發(fā)病密度(α1i/t1i)”與“非暴露水平”下的“發(fā)病密度(α2i/t2i)”之比值,相當(dāng)于通常定性資料中的“相對危險度”或“優(yōu)勢比”[2-5]。計算方法見式(1):
第i層率比RRi的100(1-α)%置信區(qū)間的計算見式(2):
為了將各層資料合并起來估計“合并率比”,資料需滿足的前提條件是各層率比相等,這就需要進行不同層間率比的齊性檢驗[1,6]。設(shè)分層因素共有K個水平,齊性檢驗的檢驗假設(shè)如下:
H0:RR1=RR2=…=RRk;H1:至少兩個層的RRi不同;α=0.05。
檢驗統(tǒng)計量見式(5):
式(5)中,RRi為第i層率比[見式(1)];Wi為第i層權(quán)重,RR為合并率比,其計算分別見式(6)、式(7):
在式(6)中,Var[ln(RRi)]為ln(RRi)的方差,計算方法見式(8):
在式(7)中,指數(shù)C的計算方法見式(9):
當(dāng)各層率比滿足齊性要求時,可以對合并率比進行點估計和置信區(qū)間估計[1,6]。合并率比的點估計見式(7)和式(9);合并率比的100(1-α)%置信區(qū)間估計見式(10):
文獻[1]提供了一個分層人-時間資料,見表2。
表2 絕經(jīng)后期婦女是否使用口服避孕藥(OC)患乳腺癌情況的調(diào)查結(jié)果
【例1】試分析表2 資料中“過去使用OC”與“從不使用OC”兩組婦女各年齡組中,乳腺癌發(fā)病的率比是否滿足齊性要求。
【分析與解答】設(shè)所需要的SAS程序[6-7]如下:
以上輸出結(jié)果為:χ2het=0.30263、P=0.98964,說明各層率比滿足齊性要求。
【例2】如表2資料,試分析“過去使用OC”與“從不使用OC”兩組婦女各年齡組中乳腺癌發(fā)病的率比點估計及置信區(qū)間估計;進而求“過去使用OC”與“從不使用OC”兩組婦女乳腺癌發(fā)病合并率比的點估計及置信區(qū)間估計。
【分析與解答】設(shè)所需要的SAS程序[6-7]如下:
【SAS輸出結(jié)果及解釋】
以上輸出結(jié)果是5 個年齡組各自率比(RR_a)及其95%置信區(qū)間的下限(c_low)與上限(c_up)的估計值,5個置信區(qū)間都包含1,說明各年齡組“過去使用OC”與“從不使用OC”的婦女乳腺癌發(fā)病率比與1 之間差異無統(tǒng)計學(xué)意義,即各層中“過去使用OC”與“從不使用OC”的婦女乳腺癌發(fā)病密度相等。
以上輸出結(jié)果是合并率比(RR)及其95%置信區(qū)間下限(c_low)和上限(c_up)的估計值。
【統(tǒng)計結(jié)論和專業(yè)結(jié)論】由以上輸出可知,置信區(qū)間包含1,說明“過去使用OC”與“從不使用OC”兩組婦女乳腺癌發(fā)病率比與1 之間差異無統(tǒng)計學(xué)意義,即整體而言,“過去使用OC”與“從不使用OC”的婦女乳腺癌發(fā)病密度相等。
假設(shè)有一個暴露變量(或危險因素)E,而E有k個水平,第j個暴露水平組用得分Sj表示,這個Sj可以是該組內(nèi)平均暴露水平,如果沒有明顯的計分方法,也可以用整數(shù)1,2,…,k代表k個計分。見表3。
表3 有k個暴露水平的分層的人-時間資料的列表格式
基于表3 中的符號,設(shè)pij代表第i層中第j暴露水平上的真實發(fā)病密度;p^ij代表第i層中第j暴露水平上的觀察發(fā)病密度[1,6]。
假設(shè)ln(pij)=αi+βSj,使用雙側(cè)檢驗及顯著性水平為α。
第一步:建立檢驗假設(shè),確定檢驗水準(zhǔn)。
H0:β=0;H1:β≠0;α=0.05。
第二步:計算檢驗統(tǒng)計量。
上式中分子與分母的計算分別見式(14)、式(15):
上面兩式中,Lxy和Lxx的計算分別見式(16)、式(17):
在式(16)中,A、B、C的計算公式分別見式(18)、式(19)、式(20):
在式(17)中,D、E的計算分別見式(21)、式(22):
在上面各式中,wij=αij=第i層第j暴露水平上的病例數(shù)。
第三步:根據(jù)檢驗統(tǒng)計量的值確定P值,并作出統(tǒng)計推斷和專業(yè)結(jié)論。
【例3】某地鎳精煉工人肺癌死亡資料如表4 所示[6],試問鎳精煉工人的肺癌死亡密度是否隨著鎳暴露量的增加呈增高趨勢?
表4 某地鎳精煉工人肺癌死亡情況調(diào)查結(jié)果
【分析與解答】設(shè)所需要的SAS程序如下:
【統(tǒng)計結(jié)論和專業(yè)結(jié)論】由以上SAS輸出結(jié)果可知,Z=1.58907,P=0.11204>0.05,說明β^=0.25453 與0之間差異無統(tǒng)計學(xué)意義;可以認為:肺癌死亡密度不隨鎳暴露量的增加呈線性增高趨勢。
對人-時間資料進行分析,與對通常的定性資料[2-5]進行分析是大同小異的。從效應(yīng)指標(biāo)上來看,用“發(fā)病密度”取代了“發(fā)病率”,用“率比”取代了“相對危險度(適用于隊列研究設(shè)計四格表資料)”和/或“優(yōu)勢比(適用于病例對照研究設(shè)計四格表資料)”。稍有不同的是:在分析通常的定性資料時,若各層間滿足或不滿足齊性要求,分別由基于“固定效應(yīng)模型”或“隨機效應(yīng)模型”導(dǎo)出的公式去估計“合并或共同”相對危險度或優(yōu)勢比及其置信區(qū)間[2-5,8-13];而分析人-時間資料時,若各層間滿足齊性要求,有方法估計“合并或共同”率比及其置信區(qū)間[1,6];而當(dāng)各層間不滿足齊性要求時,目前尚沒有方法估計“合并或共同”率比及其置信區(qū)間。
本文介紹了“分層人-時間資料中第i層率比的點估計和置信區(qū)間估計”“不同層間率比的齊性檢驗”“合并率比的點估計與置信區(qū)間估計”和“分層人-時間資料線性趨勢性檢驗”等方法;通過兩個實例,介紹了基于SAS 軟件實現(xiàn)前述各種場合下的統(tǒng)計計算的過程,對SAS輸出結(jié)果進行解釋,并做出統(tǒng)計結(jié)論和專業(yè)結(jié)論。