曹 越,尹慶鋒 綜述 曾憲濤 審校
真實世界研究概述
曹 越1,尹慶鋒2綜述 曾憲濤1審校
真實世界研究;隨機對照試驗;注冊登記研究;臨床大數(shù)據(jù)研究;效力;效果
隨機對照試驗(randomized controlled trail,RCT)作為檢驗療效的金標準,側(cè)重對理論療效進行評價,但臨床實踐時還需參考干預措施在真實世界中的實際效果。真實世界研究(real world study,RWS;real world research,RWR)是近年興起的一種新的研究理念,其與RCT在研究設計與具體實施環(huán)節(jié)上存在差異,二者并非替代而是承啟關系。精心設計的RCT是評價臨床干預措施的基礎,其結(jié)果需RWS的進一步驗證及拓展補充,以評價臨床干預措施在實踐中真實的效益、風險和治療價值,綜合考慮二者才是最佳選擇。注冊登記研究(registry study)與大數(shù)據(jù)臨床研究(big-data clinical trial,BCT)是實現(xiàn)RWS的重要手段。
循證醫(yī)學強調(diào)證據(jù)分級,RCT及其系統(tǒng)評價/Meta分析常常被認為是評價干預措施的“最佳證據(jù)”,并用于指導臨床實踐,但近年愈來愈多的專家指出來自RCT的結(jié)果在外推上存在局限[1,2]。
RCT關注效力研究,強調(diào)對研究對象的納入和干預措施的選擇采取嚴格標準,并通過隨機、對照、盲法等手段排除可能影響試驗結(jié)果的偏倚,以評價干預措施在理想狀態(tài)下所能達到的最大期望作用[2,3]。因此,RCT通常要求研究對象患單一疾病,采用單一干預措施或標準治療,但實際臨床實踐往往較為復雜,研究對象通常罹患多種疾病,同時接受多種治療,致使RCT的代表性與外部真實性存在一定差距[1]。如,Brett等[4]發(fā)現(xiàn),大多數(shù)比較冠狀動脈搭橋手術(shù)(CABG)與冠狀動脈介入手術(shù)(PCI)治療冠心病療效的研究,納入人數(shù)往往不到篩查患者的10%。而在一項關于吸入性糖皮質(zhì)激素(ICS)的RCT中,對研究對象進行正確使用吸入裝置的培訓與指導貫穿試驗始終,以避免因吸入裝置使用不當造成的潛在偏倚[2]。但最近一項針對3654例哮喘患者的調(diào)查指出,85%~90%的患者在面對不同種類的吸入裝置時會犯至少1個潛在的操作錯誤,70%的患者會犯多個潛在的操作錯誤,揭示與參與RCT的研究對象相比,在實際醫(yī)療環(huán)境下的患者往往并沒有接受相對專業(yè)的吸入裝置使用的培訓與指導,極大程度上限制了ICS在真實世界的治療效果[5]。
由此可見,在RCT框架下的“標準化干預”是為了控制諸多混雜因素而構(gòu)建的理論上的標準化,而非臨床對患者的“標準化治療”。故盡管RCT具有毋庸置疑的內(nèi)部有效性,但其嚴格設計的“理想干預過程”亦削弱了試驗結(jié)果與真實世界的相關性,所得結(jié)論并不能輕易進行外推[6]。為向醫(yī)師、患者和衛(wèi)生決策者提供科學且全面的醫(yī)療決策證據(jù),除理論療效外,還需提供這些干預措施在“真實世界”中的實際療效[7]。在此大背景下,重視開展真實世界研究的理念逐漸得到醫(yī)藥界的認同與支持。
RWS源于實效性臨床試驗,是指在較大樣本量(覆蓋具有代表性的更廣大受試者)的基礎上,根據(jù)患者的實際病情和意愿非隨機的選擇干預措施,并開展長期評價,重點關注有意義的結(jié)局指標,以進一步評價干預措施的外部有效性和安全性[3]。RWS涵蓋范圍較廣,除可治療性研究,亦可用于診斷、預后、病因等方面的研究[3]。
2.1 研究目標 RCT多用于藥物上市前研究,RWS關注效果研究,即評價干預措施在真實臨床環(huán)境下所能達到的作用大小,屬于藥物上市后研究。同時RWS還可以用于評價不同醫(yī)療衛(wèi)生干預措施的成本效益[3]。例如,吉西他濱(GEM)被認為是治療晚期或轉(zhuǎn)移性胰腺癌的最佳治療措施,近年有研究顯示,與GEM單獨使用相比,吉西他濱與埃羅替尼聯(lián)合使用(GEM-E)可在一定程度上延長患者生存時間。據(jù)此Shin等[8]經(jīng)韓國國民健康保險數(shù)據(jù)庫開展回顧性研究,結(jié)果發(fā)現(xiàn)兩種療法在總生存期與一年生存率上差異并無統(tǒng)計學意義,且在成本效益上,接受GEM-E治療的患者平均開銷顯著高于GEM組。
2.2 納入與排除標準 RCT的納入與排除標準較為嚴格,一般排除特殊人群及病情嚴重、合并癥較多的復雜病例,強調(diào)納入同質(zhì)性好的患病人群[3,9]。最近一項研究顯示,45%經(jīng)醫(yī)師診斷為慢性阻塞性肺病的患者并不符合傳統(tǒng)臨床試驗的納入標準,并指出年齡較小、女性、非白種人,以及患有糖尿病或抑郁癥的患者往往被排除于RCT之外[10],導致研究所包含的患者與全體患病人群存在差異,一定程度上限制RCT外推性。而RWS恰好彌補了RCT的缺陷,其通過寬泛的納入標準和較少的排除標準,使受試對象在極大程度上與試驗結(jié)果外推人群保持一致,以達到減少選擇性偏倚的目的[3,9]。如,由美國馬薩諸塞大學醫(yī)學院發(fā)起的全球急性冠脈事件注冊研究(global registry of acute coronary events,GRACE)即不考慮患者的入選條件,真實記錄了不同地區(qū)、不同等級醫(yī)院在實際工作中對急性冠脈事件的處理方法與處理結(jié)果[11]。
2.3 樣本量與代表性 根據(jù)受試者損害最小化原則,為避免過多受試者接受可能療效較差的治療或發(fā)生不良反應,倫理學要求在實施RCT前需按確定的檢驗效能和信度估計最小樣本量[3]。然而值得注意的是,即使研究設計和實施過程完美,也可能存在由于樣本量過小而無法準確回答研究問題的情況。Hannan等[12]指出,既往開展的CABG與PCI長期療效比較的RCT樣本量普遍較小(123~1205例),所得結(jié)果亦模棱兩可,其認為無法確定是否CABG與PCI確無差異還是由于樣本量小使結(jié)果產(chǎn)生偏倚。據(jù)此,該團隊通過紐約兩大心臟疾病登記系統(tǒng)納入37212名1997-2000年接受CABG或PCI治療的患者,結(jié)果發(fā)現(xiàn)CABG組患者經(jīng)風險調(diào)整后的生存率高于PCI組,而血管再生率顯著低于PCI組[12]。由此可見RWS采用較寬泛的納入標準,盡量覆蓋廣泛患者人群的設計思路,使其樣本量遠遠超過RCT,并在大樣本基礎上進行亞組分析比較,使結(jié)果更具說服力。目前,關于RWS所需樣本量大小尚無統(tǒng)一標準,但根據(jù)現(xiàn)有RWS來看,絕大部分研究選擇了較大的樣本量(>500例),以保證具有良好的代表性[6]。但也有個別研究采取了相對較小的樣本量,如Magliano等[13]關于心理教育家庭干預對精神分裂癥患者影響的研究僅選取了71名受試對象,但這些受試對象由來自意大利17家公共心理衛(wèi)生中心的34名心理醫(yī)學專業(yè)人員確定,對有如酗酒、藥物濫用和身體疾患等其他并發(fā)情況的患者也未排除,因此可認為,樣本人群基本代表了意大利精神分裂癥患者人群。
2.4 研究時間 為避免受試者長期接受療效較差的治療,大多數(shù)RCT研究持續(xù)時間較短,因此未考慮服藥依從性等因素對療效的影響。既往研究證實ICS是控制哮喘的最佳方式,然而這些RCT持續(xù)時間為12~28周,無法反映ICS的長期療效,近年有研究對ICS與白三烯受體拮抗藥(LTRA)進行真實世界研究,隨訪2年后發(fā)現(xiàn)在主要終點指標—哮喘生活質(zhì)量量表(AQLQ)得分上差異無統(tǒng)計學意義,更有意思得是,在服藥依從性上LTRA組患者依從率(65%)顯著高于ICS組患者(41%),推測原因可能是LTRA為口服藥物,使用方便,在實際醫(yī)療環(huán)境中更易受到患者的青睞與依從,從而提升其治療效果[2]??梢?,由于RWS一般進行較長的臨床觀察與隨訪,更易反映出新藥及治療措施的遠期效應及其不良反應,對健康結(jié)局有全面且較好的評價[3]。
2.5 干預及用藥情況 RCT采用隨機分配方法,對受試者實施單一干預措施或單一用藥,而在RWS中則是根據(jù)患者實際病情和用藥意愿選用藥物或其他干預措施,這是RWS與RCT在試驗設計上最大的區(qū)別,同時在RWS中研究者也不對合并用藥及用藥條件進行限制,完全按照實際需要進行治療并給予觀察和記錄,力求還原最真實的臨床實踐,因此RWS可以說是一個非隨機、開放性、不使用安慰劑的研究[3,14]。Krzyzanowska等[15]通過對美國國家癌癥研究所(NCI)發(fā)起的SEER項目數(shù)據(jù)資源進行整理,納入1991-1996年該數(shù)據(jù)庫注冊登記的1696例經(jīng)病理診斷為局部晚期胰腺癌的患者,并根據(jù)數(shù)據(jù)庫記錄的真實治療狀況將患者分為放化療聯(lián)合治療組、放療單一治療組、化療單一治療組以及無治療組,結(jié)果顯示上述4組調(diào)整后的中位生存期分別為47周、29周、27周與15周,其中接受聯(lián)合治療的患者中位生存期與既往RCT 36~49周的結(jié)果差異不大,反映放化療聯(lián)合治療具有良好的內(nèi)、外部有效性。盡管如此,僅有24%的患者接受了聯(lián)合治療,年齡、經(jīng)濟條件、家庭住址等非疾病因素往往是影響治療接受狀況的主要因素。
2.6 結(jié)局測量指標、數(shù)據(jù)采集與統(tǒng)計分析 RCT結(jié)局測量多以一個或一些特定病癥或體征為評價指標,而RWS結(jié)局測量多采用有廣泛臨床意義的指標,如病死率、復發(fā)率、傷殘程度、生活質(zhì)量等,因此更具臨床應用價值[14]。如,在一項比較ICS與LTRA治療哮喘的真實世界研究中,主要終點指標即為哮喘生活質(zhì)量量表(AQLQ)[2]。RCT與RWS在數(shù)據(jù)采集與統(tǒng)計分析方面無本質(zhì)差異,但相比RCT,RWS往往要求研究者收集更多、更全面的信息,除基本的社會人口學統(tǒng)計特征、患病史、發(fā)病時間、臨床表現(xiàn)、治療以及院內(nèi)結(jié)局相關信息外,部分研究還通過使用病例報告表(case report form,CRF)收集患者出院后的隨訪資料,以獲得遠期結(jié)局相關信息[11]。RCT主要采用Fisher檢驗、χ2檢驗、ROC曲線、log-rank檢驗、Kaplan-Meier生存曲線等統(tǒng)計方法;RWS因影響因素較多,除上述方法外,還常用多因素分析、傾向評分、工具變量等方法控制混雜因素的影響[3,9]。
2.7 研究質(zhì)量控制手段 高質(zhì)量的RCT往往在研究過程中通過隨機分配、盲法、標準化治療或安慰劑等措施對已知、未知或未觀察到的混雜因素進行調(diào)整。但RWS則不然,其根據(jù)患者實際病情和用藥意愿選用藥物或其他干預措施,更為貼近真實醫(yī)療環(huán)境,不存在外推困難的問題,結(jié)果相對真實可靠,但也因“開放性”產(chǎn)生了明顯的觀察者偏倚。對此,RWS通常采用多因素分析、傾向評分等統(tǒng)計方法控制偏倚,然而上述這些方法僅能對已知的混雜因素進行調(diào)整,而對未知或未觀察到的混雜因素則難以控制[16]。
2.8 倫理學問題 RCT在實施過程中可能會涉及多方面的倫理問題,如前所述,為避免過多的受試者長期接受可能療效較差的治療,導致RCT在研究時間、樣本量等方面受到一定限制。而RWS則不盡相同,從本質(zhì)上說,RWS是在真實醫(yī)療環(huán)境下,對具體醫(yī)療干預和實際操作手段最終結(jié)果的評估,并不存在干預等問題,故倫理學原則上不會對研究時間、樣本量等因素進行較多制約[3]。
RWS強調(diào)采用流行病學理論和方法進行觀察性研究、橫斷面研究或隊列研究等,其中屬觀察性研究的注冊登記研究在臨床實踐中運用尤為廣泛。
注冊登記研究為實現(xiàn)研究預期目的,運用觀察性研究方法,前瞻性或回顧性地收集既定項目的臨床數(shù)據(jù)或其他相關數(shù)據(jù),進行合理的分析統(tǒng)計,據(jù)此評估某一特定疾病、特定受試產(chǎn)品或特定醫(yī)療服務的特定效果或結(jié)局。在注冊登記研究中,研究者需根據(jù)其預期目的,收集注冊病例人口學特征、患病史、發(fā)病時間、臨床表現(xiàn)、治療結(jié)局相關信息,甚至需要獲取特定的有關遠期結(jié)局信息。為保證信息的真實、完整,需要在方案設計、計劃實施、數(shù)據(jù)采集、管理和分析上都有嚴格控制規(guī)范[17]。因此,設計和實施良好的注冊登記研究應能全面反映臨床真實情況。另一方面,由于多數(shù)RWS采用大樣本、多中心的設計,觀察時間較久,干預措施往往隨受試者病情或自身意愿發(fā)生變化,致使RWS資料的收集也離不開完備的注冊信息與數(shù)據(jù)庫。
網(wǎng)絡數(shù)據(jù)庫是注冊登記研究的核心[18],在前文介紹的真實世界研究實例中,大部分研究數(shù)據(jù)即來源于注冊登記研究所構(gòu)建的網(wǎng)絡數(shù)據(jù)庫。例如,全球急性冠脈事件注冊研究(GRACE)涵蓋30多個國家265家醫(yī)院,該研究通過病例報告表(CRF)收集急性冠狀動脈綜合征(ACS)患者的臨床特征、治療情況,以及出院后預后情況并構(gòu)建相關數(shù)據(jù)庫,以反映不同地域、不同等級醫(yī)院在處理ACS患者的決策和效果[11]。又如在探討放化療聯(lián)合治療局部晚期胰腺癌效果的研究中,患者信息來源于美國國家癌癥研究所(NCI)發(fā)起的SEER項目數(shù)據(jù)庫,該項目由11家腫瘤注冊登記中心參與,覆蓋全美將近14%的公民[15]。
注冊登記研究因多數(shù)情況需多中心及多方合作,其最大優(yōu)點為可在較短時間內(nèi),集合某個領域內(nèi)的相關數(shù)據(jù),有時甚至可以在全球醫(yī)療資源范圍內(nèi)對數(shù)據(jù)進行整合[19],這些海量數(shù)據(jù)已成為醫(yī)療衛(wèi)生領域“大數(shù)據(jù)”的重要組成部分。同時,隨著信息技術(shù)的發(fā)展,來自于病案首頁、醫(yī)院信息管理系統(tǒng)、醫(yī)療保險數(shù)據(jù)庫等數(shù)據(jù)資源亦成為推動醫(yī)療衛(wèi)生領域“大數(shù)據(jù)”發(fā)展不可或缺的渠道[16]??紤]到這些數(shù)據(jù)均直接來源于臨床信息系統(tǒng),被認為可以反映臨床實踐的真實情況,因此BCT正逐漸成為RWS研究手段之一。
綜上所述,RCT與RWS并非對立或替代關系,而是互補與承啟關系。RCT是評價臨床干預措施的基礎,提供干預措施有效性和安全性信息,若不以RCT結(jié)果作為前提,任何外部有效性的結(jié)果都將受到質(zhì)疑。以RCT為基礎制定相應指南,使新的臨床干預措施真正應用于臨床。但指南僅是推薦,不能替代臨床經(jīng)驗,因此需RWS作為有效補充,以評價新的臨床干預措施在臨床實踐中真實的效益、風險和治療價值,使臨床研究的結(jié)論在RCT后回歸真實世界。
[1] Grapow M T, Von Wattenwyl R, Guller U,etal. Randomized controlled trials do not reflect reality: Real-world analyses are critical for treatment guidelines [J]. J Thorac Cardiovasc Surg, 2006, 132(1): 5-7.
[2] Price D, Brusselle G, Roche N,etal. Real-world research and its importance in respiratory medicine[J]. Breathe(Sheff), 2015, 11(1): 26-38.
[3] 李 敏, 時景璞, 于慧會. 真實世界研究與隨機對照試驗、單病例隨機對照試驗在臨床診療性研究中的關系比較[J]. 中華流行病學雜志, 2012, 33(3): 342-345.
[4] Brett W, Hirschmann M T, Guller U,etal. CABG vs. PCI in coronary artery disease: what is the evidence?[J]. Card Surg Today, 2005, 2: 43-55.
[5] Price D. Assessment of potentially important deviceerrors performed by asthma patients in the global iHARP review service[C]. International Primary Care Respiratory Group Congress, 2014.
[6] 粱遠波,吳 越,鄭景偉. “真實世界”研究的產(chǎn)生背景、概念、方法及其在眼科的應用[J]. 中華眼視光學與視覺科學雜志, 2013, 15(12): 756-759.
[7] 唐金陵,楊祖耀. 觀察與實驗, 效力與效果[J]. 中華流行病學雜志, 2014, 35(3): 221-227.
[8] Shin S, Park C M, Kwon H,etal. Erlotinib plus gemcitabine versusgemcitabine for pancreatic cancer: realworld analysis of Korean national database [J]. BMC Cancer, 2016, 16: 443-450.
[9] 付 玲,周學平, 李國春. “真實世界研究”—中醫(yī)藥科研新思路[J]. 浙江中醫(yī)藥大學學報, 2013, 37(9): 1127-1129.
[10] Prieto-Centurion V, Rolle A J, Au D H,etal. A comparison of three methods used to identify patients with COPD [J]. Am J Respir Crit Care Med, 2013, 187: A5017.
[11] GRACE Investigators. Rationale and design of the GRACE (Global Registry of Acute Coronary Events) Project: amultinational registry of patients hospitalized with acute coronary syndromes [J]. Am Heart J, 2001, 141(2): 190-199.
[12] Hannan E L, Racz M J, Walford G,etal. Long-term outcomes of coronary-artery bypass grafting versus stent implantation [J]. N Engl J Med, 2005, 352(21): 2174-2183.
[13] Magliano L, Fiorillo A, Malangone C,etal. Patient functioning and family burden in a controlled, real-world trial of family psychoeducation for schizophrenia [J]. Psychiatr Serv, 2006, 57(12): 1784-1791.
[14] 田 峰, 謝雁鳴. 真實世界研究: 中醫(yī)干預措施效果評價的新理念[J]. 中西醫(yī)結(jié)合學報, 2010, 8(4): 301-306.
[15] Krzyzanowska M K, Weeks J C, Earle C C. Treatment of locally advanced pancreatic cancer in the real world: Population-based practices and effectiveness [J]. J Clin Oncol, 2003, 21(18): 3409-3414.
[16] 黃卓山, 羅艷婷, 劉金來. 真實世界研究的方法與實踐[J]. 循證醫(yī)學, 2014, 14(6): 364-368.
[17] 盧 偉, 曾繁典, 董 衛(wèi)(譯). 評估患者結(jié)局注冊登記指南[M]. 上海: 上海科學技術(shù)出版社, 2012.
[18] 趙一鳴, 曾 琳, 李 楠, 等. 臨床注冊研究可持續(xù)發(fā)展的科學基礎: 多目標多任務研究方案[J]. 中華醫(yī)學雜志, 2013, 93(46): 3649-3651.
[19] 陳 薇, 劉建平. 注冊研究的定義、設計及國內(nèi)外進展[J]. 現(xiàn)代中醫(yī)臨床, 2014, 21(6): 23-26.
[20] Wang S D. Opportunities and challenges of clinical research in the big-data era: from RCT to BCT [J]. J Thorac Dis, 2013, 5(6):721-723.
(2016-10-08收稿 2016-11-28修回)
(責任編輯 武建虎)
醫(yī)學期刊常用字詞正誤對照表
國家重點研發(fā)計劃專項基金(2016YFC0106300)
曹 越,博士,助理研究員。
1.430071,武漢大學中南醫(yī)院循證與轉(zhuǎn)化醫(yī)學中心,武漢大學循證與轉(zhuǎn)化醫(yī)學中心,武漢大學第二臨床學院循證醫(yī)學與臨床流行病學教研室;2.210008 南京,江蘇法邁生醫(yī)學科技有限公司
曾憲濤,E-mail: zengxiantao1128@163.com
R-1