徐應軍
3.5.4 深入分析
是否有關聯(lián)、關聯(lián)的強度、關聯(lián)的范圍是病例對照研究必須要分析的3個基本內(nèi)容,有時為了進一步解釋因素的作用,還需要進行一些深入分析。
3.5.4.1 分層分析(stratification analysis)
是將均衡性檢驗中分布不均的那些因素,即缺乏可比性的因素選來,按照因素的有無或等級分成若干層,再對各層人群進行暴露與疾病聯(lián)系的分析,這種方法稱為分層分析,如對性別分層后,分別在男性間,或女性間分析暴露與疾病的關系,此時各比較組間性別構(gòu)成完全相同,可以排除由于性別構(gòu)成不同對研究結(jié)果的混雜作用。所以分層分析是對資料缺乏可比性的一種處理手段,是單因素水平控制混雜偏倚的有效方法。分層分析的步驟如下:
(1)分析表格:根據(jù)分層因素的有無可以將資料分成兩層,其分析表格的形式見表1,如果按照分層因素的等級可以繼續(xù)分為第三層,……,第n層等,表格的形式是一樣的。
(2)計算各層的OR值:第一層OR1=( a1 d1)/( b1 c1);第二層OR2=( a2 d2)/( b2 c2),依次類推。如果各層的OR值比較接近,如OR1≈OR2,表明兩層資料是同質(zhì)的,可以計算分層后總的效應。
(3)計算總的指標:分層分析不是為了分別計算各層的效應,而是希望得到控制了分層因素影響后總的指標,即總的χ2檢驗、OR值及其95%可信區(qū)間??偟闹笜擞嬎悴捎肕antel-Haensel方法,分別以χ2MH、ORMH、ORMH 95%可信區(qū)間表示,計算公式分別為:
(4)分層分析的意義:分層分析的目的是控制混雜因素,分層后使各因素處于同一水平進行比較,從而克服了混雜因素在病例組與對照組分布不均造成的偏倚。通常將分層前的OR值稱為粗的OR,分層后計算的ORMH是調(diào)整了分層因素的混雜影響后的OR值,也稱為調(diào)整的OR值。
如果OR=ORMH則表明分層因素不起混雜作用。如果OR>ORMH,或OR (5)示例:上期表2分析的是沒有考慮其他任何因素干擾時的收縮壓與心肌梗死的關系。實際上,有很多因素同時與心肌梗死及收縮壓有關系,如性別,因此在下結(jié)論前必須排除性別的混雜影響。根據(jù)性別分層的資料見表2。 1)分別計算各層的OR值 男性OR=(107×124)/(92×101)=1.43 女性OR=(38×125)/(43×77)=1.43 分層后各層的OR值相同,說明兩層資料具有同質(zhì)性。 2)計算 =5.17 自由度為1, >3.84,具有統(tǒng)計學意義,說明分層后收縮壓與心肌梗死仍有關聯(lián)。 3)計算ORMH ORMH= 與分層前的OR比較,ORMH有所降低,可以認為這是性別混雜作用的結(jié)果,性別夸大了關聯(lián)的強度,相對而言,ORMH更能真實反映暴露與疾病的關聯(lián)程度。 4)計算ORMH 95%可信區(qū)間 ORMH=95%CI= 此區(qū)間不包含1,收縮壓與心急梗死有關聯(lián)。 3.5.4.2 劑量反應關系分析 在病例對照研究中,對于定量的,或分等級的因素可以分析暴露的劑量或等級與OR值的關系,即劑量反應關系(dose-effect relationship)。暴露因素與疾病之間存在劑量反應關系是判斷二者因果關系的重要證據(jù)之一。因此在調(diào)查中要盡量收集暴露因素的暴露劑量或暴露的程度等資料。 (1)分析表格:等級資料可以直接根據(jù)暴露的級別由低到高列表,如表3所示。如果是定量資料,需要先劃分若干個數(shù)量組,再由低到高列表,如每日吸煙量與肺癌的關系,吸煙量可分為每日“0”,“1~”,“6~”,“11~”支4個組。 (2) 檢驗:利用R×C(行×列)表檢驗公式進行檢驗,判斷病例組與對照組暴露程度構(gòu)成有無統(tǒng)計學意義。 (3)計算各暴露程度的OR值:以不暴露或最低暴露為參比,令其OR0=1,其他各暴露水平的OR值分別為:OR1=( a1c)/( b1d);OR2=( a2c)/( b2d),依次類推。 (4)線性趨勢χ2檢驗:暴露等級與各OR之間的劑量反應關系需要通過線性趨勢χ2檢驗后進行判斷,公式為: (公式4) (公式5) 式中xi為暴露的水平,可直接取值0,1,2……。檢驗的自由度為1,如果χ2≥3.84,則說明暴露程度與OR值存在線性趨勢,即劑量反應關系。 (5)示例:體重指數(shù)(BMI)與腦卒中復發(fā)關系的病例對照研究結(jié)果見表4。 以BMI<24.0為參比,計算各水平的OR值。結(jié)果顯示,腦卒中的危險性隨體重指數(shù)增加而升高,但是否存在劑量反應關系,需要進行線性趨勢檢驗,檢驗過程如下: T1=60×1+15×2=90 T2=308×1+64×2=436 T3=308×12+64×22=564 自由度為1,χ2=1.81<3.84,P>0.05,無統(tǒng)計學意義,表明根據(jù)該研究結(jié)果還不能認為體重指數(shù)與腦卒中復發(fā)之間存在劑量反應關系。 3.5.5 匹配設計資料分析 頻率匹配設計的資料分析與成組設計相同,個體匹配時,對照的數(shù)目越多,分析方法越復雜,下面僅介紹1:1匹配的資料分析。 3.5.5.1 分析表格 1:1匹配設計的分析表格基本形式見表5。成組設計的四格表中,a、b、c、d分別代表人數(shù),而1:1匹配設計表格中的a、b、c、d分別代表病例與對照的對字數(shù),即a為病例與對照均為暴露的有a對,均不暴露的有d對,實際上a和d在分析中是沒有貢獻的,只有b和c對分析有意義。 3.5.5.2 分析內(nèi)容 (1)有無聯(lián)系:仍然以 檢驗判斷暴露與疾病有無關聯(lián),檢驗采用McNemar公式: χ2=(b-c)2/(b+c) (公式6) 如果(b+c)<40時,采用校正的公式: χ2=(|b-c|-1)2/(b+c) (公式7) 自由度為1,如果 ≥3.84,具有統(tǒng)計學意義,暴露與疾病有關聯(lián)。 (2)關聯(lián)強度:OR的計算公式為: OR=c/b (公式8) (3)關聯(lián)范圍:仍應用Miettinen公式計算OR95%可信區(qū)間。 OR95%CI= (公式9) 3.5.5.3 示例 在一項關于服用雌激素與子宮內(nèi)膜癌關系的研究中,共計發(fā)現(xiàn)病例63人,采用1:1配對設計,組成63個對子,資料見表6。 (1) χ2檢驗:采用McNemar校正公式計算: χ2=(29-3-1)2/(29+3)=19.53 自由度為1,P<0.001,具有統(tǒng)計學意義,可以認為服用雌激素與子宮內(nèi)膜癌有關聯(lián)。 (2)計算OR值: OR=29/3=9.67 說明服用雌激素者發(fā)生子宮內(nèi)膜癌的危險性是未服用者的9.67倍,關聯(lián)非常密切。 (3)計算OR95%可信區(qū)間: OR95%CI= 區(qū)間不包含1,服用雌激素與子宮內(nèi)膜癌存在關聯(lián)。 3.6 注意事項 3.6.1 代表性 病例對照研究要求病例代表目標人群所有該病的患者,對照代表全部非該病人群,這是一種理想的狀態(tài)。在實際研究中,病例可以是任何一類我們感興趣的病例,例如家庭微小環(huán)境與女性肺癌的關系,病例只是女性;青年腦梗死危險因素研究,病例只是青年人。此時的病例并不代表全部患病人群,而只代表這一類病例。由于病例被局限在某一個范圍,選擇能夠代表這一類的病例,以及確定病例的源人群相對容易做到。對照的代表性不一定是未患該病的全人群,應該是病例的源人群。以醫(yī)院為基礎的病例對照研究,幾乎無法保證樣本代表性,能夠做的是盡量擴大研究的樣本量,提高病例組與對照組的均衡性。 3.6.2 可比性 應該承認病例對照研究的設計是存在缺陷的,即病例與對照并非同一個人群的兩個部分,而是分別單獨選來的,這樣就很難做到兩組的同質(zhì)性,因此外部因素對研究結(jié)果的干擾與混雜影響的程度要大于其他類型研究?;谶@種原因,病例對照研究的結(jié)果解釋和評價,必須不十分謹慎,有時需要借助一些資料分析技術,如分層分析、多因素分析等,對一些重要特征進行處理,保證病例與對照在同質(zhì)的基礎上進行比較,使研究結(jié)果得到合理解釋和評價。 3.6.3 對照選擇 在病例對照研究中普遍在的一個問題是對病例選擇比較重視,忽視對照的選擇。這是因為研究者往往認為研究的目標變量是疾病,而且是單一病種,數(shù)量有限。因此把精力幾乎全部投入到病例的選擇上。實際上,對照的選擇有時更加困難和重要,許多研究是由于合適的對照不好選而影響了研究的進度和質(zhì)量。因此,在設計和實施過程中,病例和對照應同等對待,最好是同時進行、同時完成。 3.6.4 偏倚控制 由于病例對照研究的設計特點,決定了這種方法更加容易出現(xiàn)偏倚,因此控制偏倚是病例對照研究的關鍵技術。 3.6.4.1 選擇偏倚的控制 病例對照研究選擇研究對象時很難做到隨機抽樣,另外由于條件等的限制,多數(shù)是在醫(yī)院患者中選擇研究對象,因此極易產(chǎn)生選擇偏倚。常見選擇偏倚有入院率偏倚、現(xiàn)患病例偏倚、無應答偏倚等??刂七x擇偏倚的主要措施有: (1)盡量采取以人群為基礎的研究。如果只能選擇醫(yī)院病例時,可以考慮在多家醫(yī)院選,疾病的就診率越高,包含的醫(yī)院越多,樣本的代表性就越高。 (2)盡量選擇新發(fā)病例研究對象。特別是對于那些病程較長的慢性疾病,存活的現(xiàn)患病例可能是一個有偏性的特殊群體,以他們?yōu)閷ο笱芯窟M行研究,缺乏代表性。另外新發(fā)病例距離暴露時間相對較短,獲取的暴露信息也相對準確和豐富,可以排除患病后發(fā)生的個人行為改變及環(huán)境變化的影響。 (3)盡量選擇多病種或多種對照。在以醫(yī)院為基礎的病例對照研究中,對照應該由多病種的病人組成,可以淡化單病種人群的某些特性對研究結(jié)果的影響,提高代表性。如果采用多種對照的設計,可以通過比較不同對照的研究結(jié)果,判斷選擇偏倚的有無及大小。 3.6.4.2 信息偏倚 病例對照研究最主要的信息偏倚是回憶偏倚,可以產(chǎn)生于調(diào)查員和調(diào)查對象的心理作用及對往事記憶的準確性。控制信息偏倚的主要措施有: (1)盲法(blind)調(diào)查:是控制由于調(diào)查員和調(diào)查對象心理因素對調(diào)查結(jié)果影響的有效方法,分為單盲設計、雙盲設計和多盲設計。單盲(single blindness)設計是只有調(diào)查員或調(diào)查對象不清楚設計方案,例如聘請與課題無關的,經(jīng)過培訓的調(diào)查員進行調(diào)查;雙盲(double blindness)設計是調(diào)查員與調(diào)查對象均不清楚設計方案,但病例對照研究不易做到雙盲,因為所研究的疾病往往要比對照重,而病例又是在確診后選定的,所以病例的心理作用難以控制;多盲設計是不僅調(diào)查員、調(diào)查對象對課題設計處于盲的狀態(tài),而且資料的分析人員等也不清楚,例如聘請非項目組成員擔任調(diào)查員和資料處理員,在患者入院確診前調(diào)查等。 (2)充分利用歷史記錄:個人的病歷、職業(yè)、保險等檔案資料是獲取既往信息的重要來源,既可以彌補個人回憶的不足,又可通過對相同內(nèi)容的對比,分析個人回憶的資料的真實性,例如將個人回憶的職業(yè)史(開始工作年齡、工種變遷時間等信息)與檔案記錄比較,如果準確無誤,可以認定調(diào)查資料的回憶偏倚較小,資料可信;但是,如果差別較大,該份問卷的資料誤差不可忽視,最好重新調(diào)查核實。 3.6.4.3 混雜偏倚 病例對照研究中的外部因素難以控制是產(chǎn)生混雜偏倚的主要原因?;祀s偏倚可通過匹配設計、率的標準化、分層分析及多因素分析等方法加以控制。 3.7 病例對照研究實例 1950年前后,英國的兩位內(nèi)科醫(yī)生Doll和Hill針對吸煙與肺癌的關系進行了病例對照研究,成功地揭示了吸煙的危害作用,成為肺癌病因?qū)W研究史上經(jīng)典的范例。 3.7.1 設計要點 3.7.1.1 病例選擇 以倫敦市20所醫(yī)院1948~1952年期間確診的肺癌患者為病例組。由于肺癌是一種危害極其嚴重的疾病,住院率幾乎為100%,同時研究所包含的醫(yī)院基本涵蓋了倫敦所有能夠接診肺癌的醫(yī)院,因此該研究所選病例可以認為接近倫敦市人群全部病例,具有一定代表性。 3.7.1.2 對照選擇 每確定1例病例,在同一醫(yī)院選擇年齡、性別、居住地等因素相匹配的胃癌等消化道癌癥為對照。 3.7.1.3 調(diào)查表設計 調(diào)查表的重點是關于吸煙,包括是否吸煙、吸煙開始年齡、平均每日吸煙量、吸煙類型、是否戒煙、戒煙年數(shù)等,同時也包含了大量人口學等資料。 3.7.1.4 調(diào)查 由經(jīng)過統(tǒng)一培訓的調(diào)查員,使用同一調(diào)查表,采用相同的方式方法,對病例與對照進行調(diào)查收集資料。 3.7.2 資料分析 3.7.2.1 均衡性檢驗 對病例組與對照組的年齡、性別、社會經(jīng)濟地位、居住地等因素的構(gòu)成進行對比分析,結(jié)果均無統(tǒng)計學意義,表明組間特征具有均衡可比性。 3.7.2.2 吸煙與肺癌的關系 分析結(jié)果顯示,肺癌患者中吸煙的比例為97%,高于對照組的92%,差異具有統(tǒng)計學意義( χ2=19.13,P<0.001),表明吸煙與肺癌有聯(lián)系;聯(lián)系的強度OR=2.97,即吸煙者肺癌的危險性是不吸煙者的2.97倍,區(qū)間估計下限值為1.79,上限為4.95,結(jié)果見表7。 3.7.2.3 分層分析 性別是一個既與吸煙有關聯(lián),又與肺癌有關聯(lián)的因素,為了進一步認識吸煙與肺癌的關系,需要對性別進行分層分析。結(jié)果顯示,分層后男性OR=14.0,女性OR=2.5,層間OR值相差較大,不適宜計算Mantel-Haensel總的和,因為病例組與對照組性別構(gòu)成是均衡的,性別的混雜影響已經(jīng)排除,所以這里可以分別計算各層 ,結(jié)果顯示兩層均有統(tǒng)計學意義(男性χ2=22.04,P<0.0001;女性χ2=5.76,P<0.05),表明無論男性女性,吸煙均與肺癌有關聯(lián),吸煙增加了肺癌的危險性,但對男性的危險性大于女性,見表8。 3.7.2.4 劑量反應關系分析 以平均每日吸煙的支數(shù)作為暴露的劑量單位分組,分析吸煙與肺癌之間的劑量反應關系。結(jié)果顯示,男性平均每日吸煙的支數(shù),病例組與對照組構(gòu)成差別有統(tǒng)計學意義(χ2=43.15,P<0.001),病例組吸煙量大的比例大于對照組,而且OR值隨著暴露劑量的增加而升高,線性趨勢檢驗有統(tǒng)計學意義(線性趨勢 χ2=40.01,P<0.001),表明男性每日吸煙量與肺癌危險性間存在劑量反應關系,見表9。 3.7.3 結(jié)論 經(jīng)過病例對照研究發(fā)現(xiàn)吸煙與肺癌有關聯(lián),吸煙者肺癌的危險性是非吸煙者的2.97倍;吸煙對男性和女性均可增加肺癌的危險性,但對男性的危險性高于女性;肺癌危險性隨每日吸煙支數(shù)增加而升高,存在劑量反應關系。因此,吸煙是肺癌的危險因素,控制吸煙有利于肺癌的預防。 4 隊列研究 隊列研究(cohort study)與病例對照研究同是分析性研究方法。隊列原是古羅馬軍團中的一個方隊,作戰(zhàn)時方隊成員同步?jīng)_鋒陷陣。隊列研究中的隊列通常是指在某個問題上具有相同起點一個人群,例如同年出生,或同時暴露,或同時觀察的一群人。由于隊列研究的設計是先看到人群的暴露情況,并以此為起點追蹤到果,就像隊列一樣,研究人群同步走向?qū)砟骋粫r刻,等待結(jié)局的發(fā)生。因此,從因果時序關系上是先“因”后“果”的研究方法,因而有時也稱為前瞻性研究(prospective study)、隨訪研究(follow-up study)、縱向研究等(longitudinal study)。隊列研究所獲得的因果關系證據(jù)的力度大于病例對照研究,是更深層次的研究方法。 4.1 原理與特性 4.1.1 基本原理 隊列研究是先選定一個研究人群,即建立隊列,再根據(jù)某因素的暴露情況,將研究對象分成若干個組,如暴露組和非暴露組,或不同暴露水平組等,剔除各組內(nèi)已經(jīng)有結(jié)局事件(如發(fā)病或死亡等)或不可能再發(fā)生結(jié)局事件的個體,隨訪觀察一段時間,統(tǒng)計各組研究事件結(jié)局的發(fā)生情況,如發(fā)病人數(shù)、死亡人數(shù)等,計算和比較各組結(jié)局事件的發(fā)生率,如果暴露組的發(fā)生率與非暴露組的發(fā)生率存在統(tǒng)計學差異,則可推斷暴露與事件可能存在因果關系,當暴露組的率高于非暴露組,該因素是為危險因素,當暴露組的率低于非暴露組,該因素為保戶性因素。 在建立隊列時,必須保證隊列成員沒有結(jié)局事件發(fā)生,且將來有發(fā)生結(jié)局事件的可能,否則不符合進入隊列要求。隊列可分為固定隊列和動態(tài)隊列兩種。固定隊列(fixed cohort)是指隊列成員均在短時間內(nèi)進入隊列,隨訪觀察開始后到終止觀察期間,沒有成員退出隊列和新成員加入隊列。動態(tài)隊列(dynamic cohort)是觀察期內(nèi)新成員可隨時加入隊列,但加入隊列后,同時隨訪觀察結(jié)局。 4.1.2 基本特性 4.1.2.1 觀察法研究 與現(xiàn)況研究、病例對照研究相同,隊列研究的暴露因素也是研究前已經(jīng)存的,或過去某一時期暴露過的。 4.1.2.2 先“因”后“果” 隊列研究的設計特點是先確定暴露狀態(tài),再隨訪觀察結(jié)局的發(fā)生,是前瞻性的,是由“因”到“果”的設計,這種設計模式與實驗性研究相似,區(qū)別是實驗性研究的暴露是人為決定的。 4.1.2.3 設立對照組 隊列研究必須設立不同暴露狀態(tài)的對照組,以便對比分析暴露對結(jié)局事件的作用。為了合理比較,暴露組與對照組必須有可比性,理論上對照組與暴露組除了暴露狀態(tài)不同,其他方面都應該保持一致。暴露組與對照組來自同一個人群,這種對照為內(nèi)對照,可比性較好。對照來自其他人群,這種對照為外對照,需要關注對照的可比性。 4.2 隊列研究類型 4.2.1 前瞻性隊列研究 前瞻性隊列研究(prospective cohort study)是從研究對象目前的暴露狀態(tài)開始,隨訪到將來某一時刻,結(jié)局事件需要等待一段時間才能觀察到,這種設計模式稱為前瞻性隊列研究,是隊列研究的基本模式。前瞻性設計暴露和結(jié)局資料是直接通過調(diào)查得到的,相對比較可信,偏倚較小。但對于發(fā)病率較低、需要長時間隨訪的疾病,前瞻性設計需要的樣本量大、觀察期長、投入多,執(zhí)行難度大,可行性較差。 4.2.2 歷史性隊列研究 歷史性隊列研究(historical cohort study)是以過去某個時點的人群為基礎建立隊列,并根據(jù)當時資料記載的每個對象的暴露情況進行分組,在剔除該人群已經(jīng)發(fā)生過研究事件的個體后,開始模擬隨訪到現(xiàn)在,比較各人群事件的發(fā)生率,這種設計模式為歷史性隊列研究。歷史性隊列研究是利用已經(jīng)發(fā)生過的資料,不需要等待事件的發(fā)生,因此可以在短時間內(nèi)完成。雖然是回憶過去,但是根據(jù)歷史記載仍可判斷先“因”后“果”的時序關系。因此,較前瞻性設計而言,是一種快速、節(jié)省的隊列研究方法。歷史性隊列研究必須依據(jù)詳實的歷史資料,而且目前已經(jīng)有結(jié)局發(fā)生,常見于職業(yè)人群的研究,因為每個人的職業(yè)檔案可以提供確切的職業(yè)暴露史和健康體檢資料,是建立歷史性隊列和隨訪的重要憑證。 4.2.3 雙向性隊列研究 雙向性隊列研究(ambispective cohort study)是將歷史性隊列研究與前瞻性隊列研究結(jié)合應用的設計模式,即在歷史性隊列的基礎上,從現(xiàn)在起繼續(xù)前瞻性隨訪一段時間,通常是因為歷史性隊列隨訪的時間不夠,結(jié)局事件尚未出現(xiàn),需要補充隨訪至結(jié)局事件出現(xiàn)。雙向隊列研究可以充分利用歷史資料提供有價值的信息,最大限度地節(jié)省研究的時間和投入。 4.3 研究目的及優(yōu)缺點 4.3.1 研究目的 4.3.1.1 檢驗病因假設 因為隊列研究能夠提供先“因”后“果”的時序關系證據(jù),所以檢驗病因假設的能力要遠遠大于病例對照研究。一般經(jīng)過隊列研究檢驗假設成立,是因果關系的可能性就更大了。但隊列研究執(zhí)行起來難度大,需要大量的人力、物力和時間的投入,因此多是在病例對照研究獲得比較確切假設的基礎上,采取的更為深入的研究方法。 4.3.1.2 探究疾病自然史 通過人群長期的隨訪觀察,可以掌握疾病在個體和人群中發(fā)生、發(fā)展、消亡的自然過程,例如早期血壓、血脂水平及變化規(guī)律,以及遺傳學的某些特征與今后心腦血管事件的關系等。研究疾病自然史有助于制定疾病防治策略和措施。 4.3.1.3 評價防治效果 人群中那些自覺或不自覺采納的,或者是傳統(tǒng)經(jīng)驗的防治疾病的措施及方法,到底效果如何,可以通過隊列研究進行評價,例如觀察戒煙人群是否會降低肺癌的危險性,健康飲食對心血管疾病的影響等。隊列研究評價的措施是研究前人群已經(jīng)存在,或自發(fā)的行為,而非研究開始后人為干預,這是與實驗性研究最大的區(qū)別之一。 4.3.2 優(yōu)缺點 隊列研究的優(yōu)缺點,多數(shù)是與現(xiàn)況研究和病例對照研究比較而言。 4.3.2.1 優(yōu)點 (1)回憶偏倚較?。阂驗楸┞妒窃谑录l(fā)生前調(diào)查到的,屬于雙盲調(diào)查,因此資料受調(diào)查員和調(diào)查對象心理影響較小,而且所調(diào)查的暴露是調(diào)查對象當時的情況,資料相對準確可靠。 (2)可以直接計算相對危險度:隊列研究是觀察隊列人群疾病的發(fā)生情況,可以計算出各暴露人群的發(fā)病率或死亡率,因而可以直接計算各危險因素的相對危險度(RR)。 (3)可以證實先“因”后“果”的時序關系:在隊列研究中所有的暴露因素均是在發(fā)病前確定的,通過隨訪一個潛伏期(incubation period),或潛隱期(latency period),觀察疾病的發(fā)生情況,可以確定“因”在前,“果”在后的時序關系。 (4)可以同時研究多種疾?。宏犃腥巳涸陔S訪過程中,可以發(fā)生各種疾病,因此所觀察到的每一種疾病均可以分析與暴露因素的關系。 4.3.2.2 缺點 (1)實施難度大:隊列研究需要對一個較大規(guī)模的人群進行隨訪,如果所研究的疾病的潛伏期(潛隱期)較長,不僅需要花費較多的時間,而且失訪難以控制,沒有大量的人力、物力和技術保障,幾乎是不可能完成的。因此隊列研究往往是在反復的病例對照研究的基礎上,有充分的把握前提下設計實施的。 (2)資料處理復雜:隊列研究的資料包含了時間的因素,在隨訪過程中,每個人的年齡在變化,由于失訪和結(jié)局事件的發(fā)生,每個人在隊列中貢獻的觀察時間不同,這些因素在資料處理中均需要考慮,造成隊列研究資料處理復雜,尤其是人年計算。 (3)不適合發(fā)病率較低疾病研究:每種研究方法都需要一定數(shù)量的具有陽性事件的個體,如果所研究的疾病發(fā)病率較低,只有擴大隊列規(guī)模,才能滿足研究的要求。當隊列過于龐大,失訪及隨訪質(zhì)量難以控制,偏倚和誤差將會增大,導致研究失敗,因此發(fā)病率低的疾病,尤其是非常罕見的疾病只能采用病例對照研究設計。 4.4 研究設計與實施步驟 4.4.1 設計思路及技術要點 4.4.1.1 技術路線 隊列研究過程的主要環(huán)節(jié)及流程圖1。 4.4.1.2 技術要點 (1)隊列建立:隊列是開始進行追蹤觀察研究的人群,必須含有暴露組和對照組,或不同暴露劑量組。進入隊列的成員必須保證無結(jié)局事件和今后有發(fā)生結(jié)局的可能,各組之間除了研究的暴露因素外,其他因素盡量保持均衡可比。 (2)隨訪(follow-up):從研究對象進入隊列開始至研究終止,這一期間內(nèi)跟蹤觀察的過程為隨訪,是隊列研究的重要特征和關鍵環(huán)節(jié)。隨訪期的長短取決于所研究的疾病的潛伏期或潛隱期,潛伏期越長,隨訪的難度越大。隨訪期間兩項關鍵任務是發(fā)現(xiàn)結(jié)局事件和控制失訪。 (3)失訪偏倚(follow-up bias):隊列成員隨訪期間失去聯(lián)系,研究終止時無法判斷結(jié)局為失訪(loss to follow-up),是隊列研究偏倚的重要來源。當研究的隊列規(guī)模越大,隨訪期越長,失訪越多??刂剖гL是保證研究質(zhì)量,降低偏倚的重要技術。 (4)人時(person time)計算:如果隊列成員進入和退出隊列的時間相差較大,在資料處理時需要引入一個新的概念“人時”,即人和時間的乘積,例如1個人觀察10年為10人年(person year),10個人觀察1年也為10人年,以人時為單位計算發(fā)病率是隊列研究一項重要技術和繁瑣的任務。 `(未完待續(xù))