谷鴻秋,周支瑞,章仲恒,周權(quán)
當醫(yī)學模式從經(jīng)驗醫(yī)學發(fā)展到循證醫(yī)學,再到精準醫(yī)學,數(shù)據(jù)價值得到前所未有的重視,大數(shù)據(jù)時代數(shù)據(jù)的獲取、存儲及分析與預測技術(shù)的迅速發(fā)展,使得個性化醫(yī)療的遠景越來越成為可能[1]。臨床預測模型作為風險與獲益評估的量化工具,可為醫(yī)生、患者及衛(wèi)生行政人員的決策提供更直觀、理性的信息,因此其應用也越來越普遍。本文將從臨床預測模型的概念、應用場景及研究思路三個方面做一總結(jié)。
臨床預測模型(Clinical Prediction Models,CPMs),又稱臨床預測規(guī)則(Clinical prediction rules)、風險預測模型(Risk prediction models)、預測模型(Predictive models)或風險評分(Risk scores),是指利用數(shù)學公式估計特定個體當前患有某病或?qū)戆l(fā)生某結(jié)局的概率[2-5]。臨床預測模型包括診斷模型(Diagnostic models)和預后模型(Prognostic models)(圖1)[3]。診斷模型關(guān)注的是基于研究對象的臨床癥狀和特征,診斷當前患有某種疾病的概率,多見于橫斷面研究;預后模型關(guān)注的是在當下健康狀況下(健康或患?。?,未來一段時間內(nèi)發(fā)生某結(jié)局(發(fā)病、復發(fā)、死亡,傷殘及并發(fā)癥)的概率,多見于隊列研究。狹義的預后模型特指被診斷患某病后,未來一段時間內(nèi)疾病復發(fā)、死亡,傷殘或發(fā)生并發(fā)癥的概率。臨床預測模型中,常見結(jié)局為患病、發(fā)病、疾病的復發(fā)、死亡,傷殘及并發(fā)癥。常見的預測因子(Predictors)包括社會人口學特征(如年齡、性別)、疾病史、用藥史、體格檢查結(jié)果、影像、電生理、血樣尿樣檢查、病理檢查、疾病階段與特征以及組學(基因組學、蛋白組學、代謝組學、轉(zhuǎn)錄組學及藥物基因組學等)指標。預測因子在其它文獻中也稱作預后因素(Prognostic factors)、決定因素(Determinants),或者是更接近統(tǒng)計術(shù)語的協(xié)變量、自變量。診斷模型與預后模型的劃分只是從應用場景的角度來區(qū)分的,從統(tǒng)計建模的角度來說,二者并無本質(zhì)差異。例如,模型的結(jié)局多為是否發(fā)生,屬于二分類變量;研究效應指標均為結(jié)局出現(xiàn)的絕對風險,即發(fā)生的概率,而非相對危險度(RR)、比值比(OR)或者風險比(HR)等相對效應指標;在模型的技術(shù)層面,也都需面臨預測因子的選擇、建模策略的制定、模型性能的評價等環(huán)節(jié)(圖2)。
圖1 臨床預測模型的概念
圖2 診斷模型與預后模型的異同
與臨床預測模型緊密關(guān)聯(lián)的概念是預測模型研究(Prediction model studies)和預測研究(Prognosis/prediction research),但文獻中未見具體定義。按照“預測研究策略”(PROGRESS)研究組提出的框架,臨床預測模型研究包括四個方面[7-10]:①基本預后研究,即自然狀態(tài)以及當前醫(yī)療質(zhì)量下疾病的進程;②預后因素研究,即與預后相關(guān)的特定因素;③預后模型研究,即建立、驗證預測個體未來結(jié)局風險的統(tǒng)計模型,并評估其影響;④分層醫(yī)學研究,即利用預后信息調(diào)整個體或是具有相同特征人群的治療決策。其中前兩點分別對應傳統(tǒng)流行病學研究中疾病的基本描述與危險因素研究,第三點對應本文所討論的預后模型,最后一點所提及的“分層醫(yī)學”與“精準醫(yī)學”相對應[11]。筆者認為,臨床預測模型,既可為循證醫(yī)學提供高質(zhì)量的證據(jù),也可做為精準醫(yī)學應用和普及的有利工具?!秱€體預后與診斷的多變量預測模型透明報告》(TRIPOD)研究組將預測模型研究分為五大類[3]:①尋找預后與診斷因子的研究;②無外部驗證的預測模型建立研究;③有外部驗證的預測模型建立研究;④預測模型驗證研究;⑤預測模型影響研究。五類研究的差異見圖3,其中尋找預后與診斷因子的研究及模型影響研究同其它三類在目的、研究設計以及結(jié)果報告上有所不同。尋找預后與診斷因子的研究旨在識別出診斷或是預后的獨立因子,而非為個性化預測建立最終的預測模型。預測模型影響研究旨在比較應用與不應用預測模型在醫(yī)生和患者醫(yī)療決策及患者健康結(jié)局上的效果差異。與其它四類不同,預測模型影響研究應遵循比較干預研究設計,而非單個隊列研究設計。預測模型影響研究最理想的設計類型是整群隨機試驗。各類研究在結(jié)果報告上的差異,具體可參考TRIPOD聲明清單[3]。
圖3 五類預測模型研究
臨床預測模型在醫(yī)學研究與實踐中非常普遍。借助臨床預測模型,臨床研究者可以更精準的篩選合適的研究對象,醫(yī)生和患者可更好的做出醫(yī)療決策,政府部門與衛(wèi)生管理者也可更好的進行醫(yī)療質(zhì)量管理,合理配置醫(yī)療資源。此外,臨床預測模型的作用也體現(xiàn)在疾病的三級預防體系中:①一級預防:臨床預測模型可以給患者和醫(yī)生提供基于當前的健康狀態(tài)下,未來患有某病的量化風險值(概率),為健康教育和行為干預提供更直觀、有力的科學工具。例如,基于福明翰心臟研究的福明翰心血管病危險評分明確了降低血脂、血壓可以預防心肌梗死[6]。②二級預防:診斷模型常借助無創(chuàng)的、低成本、易采集的指標,構(gòu)建高靈敏度和特異度的診斷方案,踐行“早發(fā)現(xiàn),早診斷,早治療”的疾病預防理念,具有重要的衛(wèi)生經(jīng)濟學意義。③三級預防:預后模型可對疾病的復發(fā)、死亡,傷殘及發(fā)生并發(fā)癥的概率給出量化的估算,指導對癥治療和康復方案的制定,防止疾病復發(fā)、降低病死率,減少傷殘,促進功能恢復,提高生存質(zhì)量。
臨床預測模型并非單純擬合一個數(shù)學模型那樣草率簡單。從模型建立到應用,臨床預測模型有一套完整的研究流程。多個學者都曾討論過臨床預測模型的研究思路[2,12-15]。筆者綜合文獻及個人研究經(jīng)驗,總結(jié)其研究步驟如下(圖4)。
圖4 臨床預測模型的研究思路
3.1 研究問題的確立與研究類型的選擇臨床預測模型適合回答疾病的診斷或預后相關(guān)問題,不同問題需采用不同的研究設計類型。例如,對于診斷類問題,其預測因子與結(jié)局均在同一時點或很短時間內(nèi),適合采用橫斷面研究數(shù)據(jù)構(gòu)建診斷模型;對于預后類問題,其預測因子與結(jié)局有縱向時間邏輯,適合采用隊列研究數(shù)據(jù)擬合預后模型。診斷模型研究中,需要有“金標準”來單獨診斷疾病,且“金標準”的診斷應該在“盲法”狀態(tài)下進行,即“金標準”的診斷不能借助預測模型中的預測因子信息,以避免診斷評估偏倚(Diagnostic review bias)。預后模型研究中,預測因子與結(jié)局的本質(zhì)就是縱向關(guān)系,且研究者通常希望獲得在自然狀態(tài)下疾病的轉(zhuǎn)歸,因此前瞻性隊列研究是預后模型最常見,也是最佳研究設計類型。
3.2 設計與實施,數(shù)據(jù)管理與質(zhì)控若為全新研究,則應從研究方案、研究者操作手冊、病例報告表、倫理批件等相關(guān)文件的準備開始,并進行數(shù)據(jù)管理與質(zhì)控;若為基于其它研究數(shù)據(jù)開展的回顧性研究,也應對數(shù)據(jù)質(zhì)量進行評估,并根據(jù)實際情況確定用于建模和驗證的數(shù)據(jù)集。
3.3 臨床預測模型的建立與評價建立模型前,應明確已知的、已報道的預測因子,確定入選預測因子的原則及方法、選用模型的類型(傳統(tǒng)模型通常包括適合二分類變量的Logistic回歸模型、適合生存數(shù)據(jù)的Cox回歸模型,以及適合頻數(shù)資料的泊松回歸模型)。擬合模型、估算模型參數(shù)后,運用區(qū)分度(Discrimination),校準度(Calibration)等指標評估模型的性能。
3.4 臨床預測模型的驗證預測模型的效果很有可能因場景、人群的改變而變化。因此,完整的預測模型研究應包括模型的驗證。驗證內(nèi)容包括模型內(nèi)部效度和外部效度。內(nèi)部效度體現(xiàn)模型的可重復性(Reproducibility),利用研究項目本身的數(shù)據(jù)通過交叉驗證(Cross-validation)、Bootstrap驗證等方法來回答;外部效度體現(xiàn)模型的普遍性(Generalizability),需利用研究項目本身以外的數(shù)據(jù)(從時間上、地理上獨立或完全獨立的數(shù)據(jù))來回答。
3.5 臨床預測模型的應用與影響評估臨床預測模型的最終意義在于應用臨床預測模型是否改變了醫(yī)生/患者的行為、改善了患者的結(jié)局或成本效應,此即臨床預測模型的影響研究。與臨床預測模型的驗證不同,評估模型影響研究需要設計隨機對照試驗,且通常為整群隨機對照試驗來評估。
3.6 臨床預測模型的更新即便是經(jīng)過良好驗證的臨床預測模型,由于疾病危險因素、未測量的危險因素、治療措施及治療背景等隨時間變化,模型性能因此下降,此即校準度漂移(Calibration drift)。因此,臨床預測模型需不斷進化、動態(tài)更新。
臨床預測模型的本意是借助少量的、易收集的、檢測成本低廉的預測因子來預測疾病的狀態(tài)和預后。因此,大多數(shù)預測模型都是短小精煉型的。這在信息技術(shù)不發(fā)達、數(shù)據(jù)收集、存儲、分析成本高的時代是科學而理性的。但隨著經(jīng)濟的發(fā)展、技術(shù)的進步,數(shù)據(jù)的收集、存儲成本大大降低,數(shù)據(jù)分析技術(shù)日益提高,臨床預測模型也應突破固有的觀念,采用更大量豐富的數(shù)據(jù)(大數(shù)據(jù)),復雜的模型和算法(機器學習、人工智能),以更精準的結(jié)果服務于醫(yī)生、患者及醫(yī)療決策者。