曾憲濤,劉慧,陳曦,冷衛(wèi)東
觀察性研究(observational study)又稱非實驗性研究(non-experimental study),是指沒有加入研究人員的任何干預(yù)(試驗的或其他方面)措施,允許事件自然發(fā)展的研究過程[1]。醫(yī)學研究中有很大部分是觀察性的研究,多用于評估教育項目和研究可能造成疾病或損害的危險因素,由于人的內(nèi)在特點或?qū)嵤l件涉及醫(yī)學倫理等原因,這類研究通常不能實現(xiàn)隨機化。因此,與隨機對照試驗相比,觀察性研究更容易受到偏倚風險影響,發(fā)生選擇性偏倚的風險大于實驗性研究。
由于觀察性研究能夠提供許多極為重要的信息,并在醫(yī)學研究中占很大的比例,因此,觀察性研究的Meta分析具有重要意義[2]:①對觀察性研究進行定量分析,以確定某因素是否為危險因素;②提供更準確的效應(yīng)量估計和增加統(tǒng)計效能,分析量效關(guān)系;③分析不同研究間的異質(zhì)性;④總結(jié)各單個研究的結(jié)果;⑤研究稀有暴露因素及其相互作用;⑥研究稀少疾病的危險因素。近年來觀察性研究的Meta分析大量涌現(xiàn),并呈逐年增多的趨勢,已成為流行病學研究中的重要部分。
在上一講中,我們對觀察性研究所包含的類型及隨機對照試驗的質(zhì)量評價工具進行了介紹[3],本節(jié)將對觀察性研究的質(zhì)量評價工具做一簡介(診斷性研究屬于較為特殊的觀察性研究,將在下一講中介紹)。
紐卡斯爾-渥太華量表(the Newcastle-Ottawa Scale,NOS)適用于評價病例對照研究和隊列研究[4-5]。它通過三大塊共8個條目的方法評價隊列研究(表1)[6]和病例對照研究(表2)[7],具體包括研究人群選擇(selection)、可比性(comparability)、暴露(exposure)評價或結(jié)果(outcome)評價。NOS對文獻質(zhì)量的評價采用了星級系統(tǒng)的半量化原則,滿分為9顆星。NOS有自己專用的網(wǎng)站(http://www.ohri.ca/programs/clinical_epidemiology/oxford.asp),提供了量表的word及pdf版本,可免費下載。
英國牛津循證醫(yī)學中心文獻嚴格評價項目(critical appraisal skill program,CASP,2004)除了制定了針對隨機對照試驗的質(zhì)量評價清單[3]外,也制定了針對觀察性研究的評價清單[8],主要包括隊列研究與病例-對照研究。CASP清單用于評價隊列研究的清單包括12個問題,其中前2條是篩選問題,后10條是細節(jié)問題;1~7和10~12條均用“是”、“否”及“不知道”判定(表3)[9]。用于評價病例-對照研究的清單包括11個問題,其中前2條是篩選問題,后9條是細節(jié)問題;1~6和9~11條均用“是”、“否”及“不知道”判定(表4)[10]。
美國衛(wèi)生保健質(zhì)量和研究機構(gòu)(Agency for Healthcare Research and Quality,AHRQ)對觀察性研究的質(zhì)量評價標準進行了推薦,其中推薦NOS量表作為評價隊列研究和病例-對照研究的標準;推薦評價橫斷面研究(cross-sectional study)的標準包括11個條目,分別用“是”、“否”及“不清楚”作答[11]:(1)是否明確了資料的來源(調(diào)查,文獻回顧)?(2)是否列出了暴露組和非暴露組(病例和對照)的納入及排除標準或參考以往的出版物?(3)是否給出了鑒別患者的時間階段?(4)如果不是人群來源的話,研究對象是否連續(xù)?(5)評價者的主觀因素是否掩蓋了研究對象其他方面情況?(6)描述了任何為保證質(zhì)量而進行的評估(如對主要結(jié)局指標的檢測/再檢測);(7)解釋了排除分析的任何患者的理由;(8)描述了如何評價和(或)控制混雜因素的措施;(9)如果可能,解釋了分析中是如何處理丟失數(shù)據(jù)的;(10)總結(jié)了患者的應(yīng)答率及數(shù)據(jù)收集的完整性;(11)如果有隨訪,查明預(yù)期的患者不完整數(shù)據(jù)所占的百分比或隨訪結(jié)果。
STROBE(the Strengthening the Reporting of Observational Studies in Epidemiology)聲明[12]是用來規(guī)范觀察性研究報告格式的,包括隊列研究、病例-對照研究及橫斷面研究,自然也可以用來評估這些類型研究的質(zhì)量;對于分子流行病學觀察性研究,亦可以采用其報告規(guī)范,STROBE的擴展版(STROBE-ME)[13]。STREGA(STrengthening the REporting of Genetic Association Studies)聲明[14]也屬于STROBE的擴展版,是專為規(guī)范遺傳學關(guān)聯(lián)研究的報告規(guī)范,亦可以用來評估遺傳關(guān)聯(lián)性研究的質(zhì)量。因其不是專用于評價觀察性研究的質(zhì)量,故在此不詳細列出。
常用于meta分析的觀察性研究包括隊列研究、病例-對照研究及橫斷面研究三大類,因這三類研究受偏倚影響的程度依次增加,目前尚無一種通用的評價工具。NOS的制作很好地結(jié)合了病例對照研究和隊列研究的實際,從隨機對照試驗評價方法中得以引申,能較好地應(yīng)用于非隨機對照試驗的系統(tǒng)評價,已被Cochrane協(xié)作網(wǎng)的非隨機研究方法學組用于培訓中并推薦使用。CASP目前應(yīng)用最多的國家是英國及加拿大。AHRQ橫斷面研究評價標準較為客觀。我們建議選擇NOS評價隊列研究和病例-對照研究;選擇AHRQ橫斷面研究評價標準評價橫斷面研究;在臨床循證時針對單個隊列研究或病例-對照研究則推薦選擇CASP清單,因為它考慮了研究的外部適用性。
表1 隊列研究的NOS評價標準[6]
表2 病例-對照研究的NOS評價標準[7]
表3 評價隊列研究質(zhì)量的CASP清單[9]
表4 評價病例-對照研究質(zhì)量的CASP清單[10]
[1] Grimes DA,Schulz KF. An overview of clinical research: the lay of the land[J]. Lancet,2002,359(9300):57-61.
[2] Egger M,Smith GD,Altman DG. Systematic reviews in health care. Meta-analysis in context [M]. 2nded. London: BMJ Publishing Group, BMA House,Tavistock Square,WC1H 9JR,2001.
[3] 曾憲濤,包翠萍,曹世義,等. Meta分析系列之三:隨機對照試驗的質(zhì)量評價工具[J]. 中國循證心血管醫(yī)學雜志,2012,4(3):183-5.
[4] Stang A. Critical evaluation of the Newcastle-Ottawa scale for the assessment of the quality of nonrandomized studies in metaanalyses[J]. Eur J Epidemiol,2010,25(9):603-5.
[5] Wells GA,Shea B,O’Connell D,et al. The Newcastle-Ottawa Scale (NOS) for assessing the quality if nonrandomized studies in metaanalyses [EB/OL]. [2012-06-15]. http://www.ohri.ca/programs/clinical_epidemiology/oxford.htm.
[6] Wells G,Shea B,O'Connell D,et al. NewCastle-Ottawa Quality Assessment Scale --Cohort Studies[EB/OL]. [2012-06-15]. http://www.ohri.ca/programs/clinical_epidemiology/oxford.asp.
[7] Wells G,Shea B,O'Connell D,et al. NewCastle–Ottawa Quallty Assessment Scale--Case Control Studies [EB/OL]. [2012-06-15]. http://www.ohri.ca/programs/clinical_epidemiology/oxford.asp.
[8] Ibbotson T,Grimshaw J,Grant A. Evaluation of a programme of workshops for promoting the teaching of critical appraisal skills [J]. Med Educ,1998, 32(5):486-91.
[9] CASP(Critical Skills Appraisal Programme)[EB/OL]. [2012-06-15]. http://www.casp-uk.net/wp-content/uploads/2011/11/CASP_Cohort_Appraisal_Checklist_14oct10.pdf.
[10] CASP(Critical Skills Appraisal Programme)[EB/OL]. [2012-06-15]. http://www.casp-uk.net/wp-content/uploads/2011/11/CASP_Case-Control_Appraisal_Checklist_14oct10.pdf.
[11] Rostom A,Dube C,Cranney A,et al. Celiac Disease. Rockville (MD): Agency for Healthcare Research and Quality (US); 2004 Sep. (Evidence Reports/Technology Assessments, No. 104.) Appendix D. Quality Assessment Forms.http://www.ncbi.nlm.nih.gov/books/NBK35156.
[12] Vandenbroucke JP,von Elm E,Altman DG,et al. Strengthening the Reporting of Observational Studies in Epidemiology (STROBE): explanation and elaboration [J]. PLoS Med,2007,4(10):e297.
[13] Gallo V,Egger M,McCormack V,et al. STrengthening the Reporting of OBservational studies in Epidemiology--Molecular Epidemiology (STROBE-ME): an extension of the STROBE Statement [J]. PLoS Med,2011,8(10):e1001117.
[14] Little J,Higgins JP,Ioannidis JP,et al. STrengthening the REporting of Genetic Association Studies (STREGA): an extension of the STROBE statement[J]. PLoS Med,2009,6(2):e22.