程 義 李冬冬 陳 峰 郭 威 吳 騁△
1.海軍軍醫(yī)大學衛(wèi)生勤務學系軍隊衛(wèi)生統(tǒng)計學教研室(200433) 2.解放軍94969部隊保障部衛(wèi)生隊
未亡時間偏倚(immortal time bias)又稱為保證時間偏倚(guarantee time bias),是一種特殊的選擇性偏倚[1],廣泛地存在于觀察性研究和藥物臨床試驗中。Gail[2]分析心臟移植的研究時,首次提出了未亡時間偏倚,認為移植組生存時間的延長,部分歸因于未亡時間偏倚的存在。
在進行生存分析時,如果暴露/處理發(fā)生在隨訪期間,在研究開始時,所有的受試者都歸為非暴露/對照組。隨著隨訪的進行,部分患者或早或晚地接受暴露/處理,進入暴露/處理組。從進入研究隊列(如移植注冊)到接受暴露/處理(如接受心臟移植)的隨訪時間稱為“未亡時間”(immortal time)。在“未亡時間”內(nèi),暴露/處理組患者的生存時間要足夠長,直到接受暴露/處理;而非暴露/對照組則沒有這種生存時間的要求。
在生存分析中,由于不恰當?shù)姆纸M方法、未能正確處理“未亡時間”,或者沒有采用正確的統(tǒng)計學方法,都可能產(chǎn)生偏倚,使得分析結(jié)果夸大了暴露/處理效果。
Michele Iudici[3]等分析了風濕病領域,近5年發(fā)表在頂尖雜志上(如新英格蘭醫(yī)學雜志、柳葉刀、美國醫(yī)學會雜志等)的78項觀察性研究,其中的8項研究(10%)存在未亡時間偏倚,這種偏倚的存在,產(chǎn)生了有利于暴露/處理組的結(jié)果。在一項評估二甲雙胍能否提高胰腺癌患者生存率的研究中[4],由于未亡時間偏倚的存在,使得二甲雙胍對胰腺癌的保護作用降低了18%。在藥物流行病學研究中[5],未亡時間偏倚也廣泛存在,甚至難以識別,因此識別并控制這種偏倚,在實踐中至關重要。
本文綜述了處理未亡時間偏倚常用的統(tǒng)計學方法,包括界標分析(landmark method)、時依性Cox模型(time-varying Cox model)以及逆概率加權(quán)(inverse probability weighting,IPW),介紹了每種方法的適用條件和優(yōu)缺點,以及其最新進展和案例應用,并進行了實例分析,以期為相關領域的研究者提供參考。
1.界標分析
(1)界標分析簡介
界標分析是目前處理生存分析中未亡時間偏倚的主要方法之一。該方法旨在無偏地估計暴露/處理組患者和非暴露/對照組患者在界標時間的生存概率。Anderson[6]等在腫瘤學中進行應答組與非應答組的生存分析時,提出了界標分析。Charity J[7]等簡要介紹了界標分析。
在界標分析中,首先選取一個固定的時間作為界標時間,以此為研究起始時間,僅保留界標時間點仍然存活且可隨訪的患者。根據(jù)患者在界標時間前是否接受暴露/處理進行分組。然后使用生存分析的基本方法比較兩組的生存情況,如Kaplan-Meier法、log-rank檢驗、Cox比例風險模型等。在解釋結(jié)果時需要注意,界標分析得到的結(jié)果僅適用于在界標時間時仍存在風險的患者[1,7]。常用統(tǒng)計軟件均可實現(xiàn)界標分析,如R軟件、SAS、SPSS、stata等。
(2)界標分析的優(yōu)勢和局限性
界標分析具有操作簡便、描述直觀以及清晰的圖形化呈現(xiàn)方式[8]等優(yōu)點,用于控制暴露/處理的時依性屬性導致的偏倚,如未亡時間偏倚、領先時間偏倚[9-10]等?;诮鐦朔治?,一些更復雜的模型可用于患者生存概率的動態(tài)預測,如界標分析超級模型(landmark supermodels)[11-12]、界標治愈率模型(landmark cure rate model)[13]。
但是界標分析存在一定的局限性。首先,界標時間選取具有主觀性。選取不同的界標時間,得到的分析結(jié)果也不盡相同,某個界標時間的結(jié)論難以在其他界標時間推廣。因此,研究者首先需要確定,界標分析是否能夠為所研究的問題提供有意義的估計,并根據(jù)疾病進程,選取有臨床意義的時間作為界標時間,并且有必要選取多個界標時間進行敏感性分析,以評價結(jié)果的穩(wěn)健性。
其次,統(tǒng)計效能和精確性下降。界標分析排除了界標時間之前的結(jié)局事件和刪失數(shù)據(jù),降低了統(tǒng)計效能和精確性。因此,在選取界標時間時需要權(quán)衡:選取過早的界標時間,會忽略界標時間之后發(fā)生的暴露/處理,無法進行有效的生存率的比較;選取過晚的界標時間,則會排除更多的患者,從而降低了統(tǒng)計效能。
此外,界標分析是基于觀察性研究的,缺少了隨機化屬性,當結(jié)果顯示組間差別有統(tǒng)計學意義時,干預與結(jié)局之間只能解釋為“相關關系”,而非“因果關系”。
2.時依性Cox模型
(1)時依性Cox模型簡介
Cox比例風險模型(Cox proportional-hazards model)是生存分析中最常用的回歸分析方法,常用于探究多個協(xié)變量對患者生存時間的影響。當暴露/處理具有時依性屬性時,可以納入一個(或多個)時依性的協(xié)變量(time-dependent covariates),采用時依性Cox模型加以控制。
時依性Cox模型本質(zhì)上是增加了一個(或多個)時依性的協(xié)變量,這個變量的取值可以隨時間改變,也就是說允許病人的分組在隨訪過程中改變。這樣,暴露/處理組患者的生存時間就分為兩部分:干預前和干預后。雖然分析中存在時依性的變量,但是分組后的區(qū)間里的協(xié)變量的值是不變的。通過構(gòu)建風險函數(shù),得到對風險比(hazard ratio)的估計,來定量地表示時依性協(xié)變量對結(jié)局的影響。Jiannong Liu[14]等比較了四種處理未亡時間偏倚的方法,認為“時依性Cox模型適用于分析時依性暴露/處理”。
時依性Cox模型可以通過多種統(tǒng)計軟件實現(xiàn),如R軟件的“survival”包、SAS、stata、SPSS等。章仲恒等[15]介紹了利用R語言執(zhí)行時依性Cox模型的具體步驟,有興趣的讀者可參考,此處不再贅述。
(2)時依性Cox模型的優(yōu)勢和局限性
與界標分析不同,時依性Cox模型納入了時依性的協(xié)變量,允許患者分組隨時間改變,充分利用了所有患者的隨訪信息,具有更高的統(tǒng)計效能。時依性Cox模型得到風險比的估計,可以定量的表示時依性協(xié)變量對結(jié)局的影響。此外,當含有多個時依性協(xié)變量,并且協(xié)變量的取值隨時間的變化不止一次時,時依性Cox模型同樣適用。
時依性Cox模型的局限性包括:首先,時依性的Cox模型通過風險比解釋時依性協(xié)變量對結(jié)局事件的影響,缺少生存曲線圖形化的直觀呈現(xiàn)。其次,由于時依性協(xié)變量的存在,風險比例模型在t=0時的軌跡是未知的,不能簡單地根據(jù)風險計算生存概率,這就意味著時依性Cox模型喪失了預測的功能。當基于具有時依性的協(xié)變量進行預測時,界標分析可能更加適用[16]。此外,由于時依性協(xié)變量通常伴隨著混雜因素,因此時依性Cox模型很難探究其中的因果關系。關于其中的數(shù)理機制,F(xiàn)isher和Lin[17]進行了簡要的闡述。
3.逆概率加權(quán)
(1)逆概率加權(quán)簡介
逆概率加權(quán)是一種基于傾向性評分(propensity score)[18]的統(tǒng)計方法,是處理觀察性數(shù)據(jù)的強有力工具。傾向性評分是指患者進入暴露/處理組的概率,常用于控制已觀測的混雜因素,郭申陽等對傾向性評分進行了詳細的介紹[19]。
利用逆概率加權(quán)進行統(tǒng)計分析,首要的一步就是構(gòu)建傾向性評分估計模型。在清晰地了解某種疾病的發(fā)展進程或治療過程后,以患者臨床、人口學、預后和治療特征等作為預測變量,構(gòu)建多因素的傾向性評分估計模型,如logistic回歸,使得每個患者在隨訪的每個階段,都會產(chǎn)生一個進入試驗組的概率估計值。然后利用第一步產(chǎn)生的概率估計值的倒數(shù)作為權(quán)重進行加權(quán),構(gòu)建逆概率加權(quán)模型。這些權(quán)重,部分地消除了由于未隨機化分組產(chǎn)生的偏倚。
在構(gòu)建傾向性模型時,需要滿足一個重要的假設:無遺漏的未觀測混雜因素[20],即所有的混雜因素都考慮在內(nèi)。因此,在研究中,需要盡可能全面地考慮所有會影響到干預與結(jié)局關系的混雜因素。
(2)逆概率加權(quán)的優(yōu)勢和局限性
由于時依性暴露/處理的存在,研究分組缺少了隨機化的過程,使得非暴露/對照組和暴露/處理組間存在混雜因素。通過逆概率加權(quán),使得各組的基線數(shù)據(jù)更加均衡,具有可比性。逆概率加權(quán)也使用了所有的患者數(shù)據(jù),具有較高的統(tǒng)計效能。逆向概率加權(quán)還可以處理刪失數(shù)據(jù)[21],例如在Cox模型的框架下通過逆概率加權(quán)方法來估計存在刪失的協(xié)變量的效應[22]。此外,Agogo[23]提出了基于逆概率加權(quán)的共享參數(shù)聯(lián)合模型(IPTW-weighted joint model),來估計縱向測量數(shù)據(jù)對二分類結(jié)局的效應,有效地控制了混雜因素。
但是,逆概率加權(quán)只是部分控制了各組間的混雜因素,一定程度彌補了缺少隨機化的不足,不可能完全替代隨機化步驟,可以作為界標分析、時依性Cox模型的補充方法。并且,逆概率加權(quán)在軟件實現(xiàn)上更具有挑戰(zhàn)性,Van der Wal[24]等介紹了如何使用R軟件包“ipw”實現(xiàn)逆概率加權(quán)。
我們將Cox模型、界標分析和時依性Cox模型,在R軟件包“JM”中的原發(fā)性膽汁性肝硬化(PBC)數(shù)據(jù)集[25]中進行應用,來比較上述方法處理未亡時間偏倚的效果。PBC數(shù)據(jù)集納入了312名原發(fā)性膽汁性肝硬化的患者,包括患者的一般情況(年齡、性別)、用藥情況、癥狀體征(肝腫大、腹水、蜘蛛痣)等。比較出現(xiàn)腹水的PBC患者與非腹水PBC患者的生存情況。將年齡、性別、用藥情況和是否有腹水,分別納入Cox模型、界標分析和時依性Cox模型進行分析。由于腹水是肝硬化失代償期產(chǎn)生的體征,而PBC失代償期從發(fā)病到確診平均為27個月[26],因此在界標分析中,選取tLM=2作為界標時間,分析結(jié)果如表1。
表1 出現(xiàn)腹水對原發(fā)性膽汁性肝炎化患者死亡風險影響分析結(jié)果
由表1知,由于腹水是PBC患者晚期出現(xiàn)的癥狀,從確診到出現(xiàn)腹水需要經(jīng)過一段“未亡時間”,由于Cox模型受到未亡時間偏倚的影響,低估了腹水組PBC患者死亡風險(HR=2.98)。界標分析和時依性Cox模型,在一定程度上校正了未亡時間偏倚,得到了較為準確的結(jié)果。其中部分腹水患者,早期無腹水,產(chǎn)生腹水后,經(jīng)過治療體征消失,時依性Cox模型準確分析了每一段產(chǎn)生腹水的時間,因此得到了較大的風險比。此外,Cox模型和界標分析以可視化的形式展示,生存曲線分別見圖1和圖2。統(tǒng)計分析使用了SAS 9.4、R軟件。
圖1 腹水與非腹水PBC患者Cox模型生存曲線
圖2 腹水與非腹水PBC患者界標分析生存曲線
本文介紹了幾種常用的未亡時間偏倚處理方法,包括界標分析、時依性Cox模型以及逆概率加權(quán)。界標分析是處理未亡時間偏倚較為有效的方法,它以直觀性、簡便性的特點在醫(yī)學研究中被廣泛應用。時依性Cox模型可以通過風險比的估計定量地描述時依性協(xié)變量對結(jié)局的影響。IPW可以作為界標分析的替代和補充方法。三種方法的特點總結(jié)見表2。
表2 處理未亡時間偏倚的常用統(tǒng)計方法比較
近幾年,統(tǒng)計學家提出了更多的處理方法,或多種方法綜合使用,對未亡時間偏倚的處理日趨成熟。M.A.Nicolaie[11]等構(gòu)建了界標分析的超級模型(supermodels),將界標分析進行拓展,對競爭風險中含有時依性協(xié)變量的問題進行動態(tài)預測。對于不能在任意時刻測量的內(nèi)生性時依性協(xié)變量,提出了縱向生存數(shù)據(jù)的聯(lián)合模型(joint models)[25],并且允許測量誤差的存在[16]。在一項關于冠脈造影和不良結(jié)局關系的研究中,Pierluigi Tricoci等[27]同時使用了IPW和界標分析,部分地彌補了界標分析缺少隨機化屬性的缺陷。
然而,當時依性變量滿足以下條件時:隨時間變化、是結(jié)局的影響因素、受到前一次干預的影響又會影響后一次的干預,則稱之為時依性混雜。存在時依性混雜的情況下,需要進行因果推斷,則需要通過其他的方法處理,如構(gòu)建邊緣結(jié)構(gòu)模型(marginal structural model,MSM)[28]。
隨著循證醫(yī)學的不斷發(fā)展和人們對醫(yī)學研究認識的完善,未亡時間偏倚逐漸受到越來越多的關注,在處理時依性自變量、時依性混雜因素方面,將會有更多、更先進的方法提出,以消除其產(chǎn)生的偏倚。本文僅對處理未亡時間偏倚的常用統(tǒng)計方法進行了綜述,并進行了實例分析,尚需進一步的研究,對這些處理方法的適用條件、穩(wěn)健性、效能進行定量的比較。