朱政 胡雁 周英鳳 顧鶯 邢唯杰 陳瑜 張曉菊
(1.復(fù)旦大學(xué)護理學(xué)院 復(fù)旦大學(xué)JBI循證護理合作中心 上海市循證護理中心,上海 200032;2.復(fù)旦大學(xué)附屬兒科醫(yī)院,上海 201102;3.復(fù)旦大學(xué)附屬腫瘤醫(yī)院,上海 200032)
循證實踐是對公開報道的研究進行組織、整理、評價、整合、分類、遴選和有效利用的過程,以促進證據(jù)向臨床轉(zhuǎn)化,促進護理實踐水平的提高[1]。隨著學(xué)科的不斷發(fā)展,研究的數(shù)量呈現(xiàn)爆炸式增長,如何甄別研究的方法學(xué)質(zhì)量成為了證據(jù)臨床轉(zhuǎn)化研究中的關(guān)鍵問題。文獻質(zhì)量評價是證據(jù)臨床轉(zhuǎn)化選題及問題界定和證據(jù)資源檢索后的關(guān)鍵階段[2]。從哪些方面對研究的方法學(xué)質(zhì)量進行評價?采用什么工具進行方法學(xué)的質(zhì)量評價?如何判斷證據(jù)是否應(yīng)該納入到證據(jù)臨床轉(zhuǎn)化研究中?是研究者和臨床實踐者經(jīng)常會提出的疑問。
在證據(jù)資源金字塔中[3],臨床實踐指南、證據(jù)總結(jié)、系統(tǒng)評價、原始研究、專業(yè)共識均在不同層面提供證據(jù),但形成這些文獻資源的研究均存在一定的偏倚風險,在研究者實際開展文獻質(zhì)量評價的過程中,需要選擇對應(yīng)的方法學(xué)質(zhì)量評價工具進行逐條評價。評價除臨床實踐指南之外的文獻時,由兩位接受過循證醫(yī)學(xué)方法學(xué)培訓(xùn)、且具備所評價文獻涉及專業(yè)背景的研究者單獨、逐條進行評價,當兩位研究者意見出現(xiàn)分歧時,由第3位研究者進行判斷或2人協(xié)商得出結(jié)論。臨床實踐指南評價則由至少2人,最佳4人進行單獨評價,且對評價者的方法學(xué)背景及專業(yè)背景有更高的要求。由于不同條目造成研究偏倚的程度不相同,所以目前除評價指南的AGREE II工具外,文獻質(zhì)量評價工具一般不推薦計算條目得分確定最終是否納入研究,而是根據(jù)總體評價結(jié)果,由研究者判斷研究是否被納入。評價過程應(yīng)是透明、公開、可重復(fù)的。根據(jù)證據(jù)金字塔從上至下的原則[4],本文將介紹采用AGREE II對對基于證據(jù)的臨床實踐指南進行質(zhì)量評價的方法、對證據(jù)總結(jié)的質(zhì)量評價方法、采用JBI 2016版質(zhì)量評價工具對系統(tǒng)評價、專家意見和原始研究進行方法學(xué)質(zhì)量評價的方法。
1.1指南的方法學(xué)質(zhì)量評價 指南可分為基于證據(jù)的臨床實踐指南(簡稱循證指南)和基于專家共識的指南(簡稱專家共識指南)[1]。循證指南是針對某一特定問題、特定的人群,由特定的組織和人員按照規(guī)范化的流程,集合當前最佳的證據(jù),制定證據(jù)等級和推薦,用于指導(dǎo)臨床實踐的指南[1]。專家共識指南是指由某一特定專家團體針對特定問題,通過現(xiàn)場討論和專家咨詢的方式確定臨床實踐推薦的指南[1]。由于專家共識指南并非完全基于大量研究結(jié)果,而是基于專家個人的意見和經(jīng)驗,因此,專家共識指南通常被歸類為專家意見類的證據(jù)。
采用AGREE II指南評價工具對于循證指南的方法學(xué)質(zhì)量進行評價[5]。AGREE II是由AGREE協(xié)作網(wǎng)2009年制定并發(fā)布的指南研究與評價工具的第二版,2017年再次更新。AGREE II由6個領(lǐng)域(23個條目)和2個總體評估條目組成,見表1。AGREE II中推薦評價指南的人數(shù)至少為2人,最佳4人。AGREE II每個條目評分為1~7分,1分表示指南完全不符合該條目,7分表示指南完全符合該條目。
表1 AGREE II指南評價工具
續(xù)表1 AGREE II指南評價工具
2017年AGREE團隊對工具中各領(lǐng)域的標準化得分進行補充[6],具體包括:(1)確定優(yōu)先領(lǐng)域。通過專家共識確定評價標準的優(yōu)先領(lǐng)域,界值可以由優(yōu)先領(lǐng)域得分來設(shè)立。(2)階段式評價。如果某個領(lǐng)域被認為比其他領(lǐng)域重要,可以優(yōu)先僅對該領(lǐng)域進行指南評價,只有滿足該領(lǐng)域的界值后(例如70%標準分),才可繼續(xù)評價其他5個領(lǐng)域。(3)考慮所有領(lǐng)域得分。通過專家共識設(shè)立6個領(lǐng)域中的界值。(4)根據(jù)時間推移改進界值。
1.2證據(jù)總結(jié)的方法學(xué)質(zhì)量評價 證據(jù)總結(jié)是針對某一特定循證問題,由特定組織和人員按照規(guī)范化的流程,集合當前最佳證據(jù),用于指導(dǎo)臨床實踐的文獻類型[7]。相對臨床實踐指南而言,證據(jù)總結(jié)的主題具體,涉及面也相對較窄,例如“脊柱外科術(shù)后患者深靜脈血栓預(yù)防及管理的最佳證據(jù)總結(jié)”[8]。國內(nèi)外有大量機構(gòu)和雜志發(fā)表證據(jù)總結(jié),證據(jù)總結(jié)也是證據(jù)臨床轉(zhuǎn)化研究中被廣泛使用的證據(jù)資源類型。目前,沒有單一的工具來評價證據(jù)總結(jié)的方法學(xué)質(zhì)量。因此,應(yīng)采用追朔參考文獻的方法,評價所用推薦對應(yīng)的研究的方法學(xué)質(zhì)量。例如“在評價抗凝藥物的研究和骨科手術(shù)后早期DVT篩查中,不推薦使用超聲取代靜脈造影術(shù)”[8]這一推薦來源于一篇類實驗性研究,則采用類實驗性研究的質(zhì)量評價工具對所引用的該研究進行質(zhì)量評價。若推薦來源于其他類型原始研究,則采用對應(yīng)的原始研究評價工具對所引用的研究進行評價。
1.3系統(tǒng)評價的方法學(xué)質(zhì)量評價 系統(tǒng)評價是根據(jù)某一具體的臨床問題,采用標準化方法,選擇評估相關(guān)原始研究,篩選出符合納入標準的研究,并從中提取數(shù)據(jù)并分析[1]。系統(tǒng)評價包括定量和定性的系統(tǒng)評價。護理領(lǐng)域中較多采用JBI標準對系統(tǒng)評價的方法學(xué)質(zhì)量進行評價[9],也可采用AMSART 2進行系統(tǒng)評價的質(zhì)量評價。JBI關(guān)于系統(tǒng)評價方法學(xué)質(zhì)量的評價工具包括11個條目,見表2。每一個條目采用“是”“否”“不清楚”和“不確定”進行判定。
表2 JBI關(guān)于系統(tǒng)評價方法學(xué)質(zhì)量的評價工具
續(xù)表2 JBI關(guān)于系統(tǒng)評價方法學(xué)質(zhì)量的評價工具
AMSTAR 2是由AMSTAR工作組發(fā)表的第2版用于評價隨機或非隨機干預(yù)性系統(tǒng)評價的方法學(xué)質(zhì)量的工具[9],共包括16個條目,涉及到系統(tǒng)評價中的選題、設(shè)計、注冊、數(shù)據(jù)提取、統(tǒng)計和討論等全過程。AMSTAR 2中文版由中國循證醫(yī)學(xué)中心引入[10]。
1.4專家意見和專業(yè)共識類文章的方法學(xué)質(zhì)量評價 基于多元化證據(jù)理念,護理領(lǐng)域中將專家意見和專業(yè)共識納入證據(jù)范疇。在缺乏大量高質(zhì)量原始研究的情況下,專家意見和專業(yè)共識類文章對臨床實踐有著重要價值。目前,采用JBI標準對專家意見和專業(yè)共識類文章的方法學(xué)質(zhì)量進行評價[11],評價工具包括6個條目,每個條目采用“是”“否”“不清楚”和“不確定”進行判定,見表3。
表3 JBI關(guān)于專家意見和專業(yè)共識類文章的方法學(xué)質(zhì)量的評價工具
1.5原始研究的方法學(xué)質(zhì)量評價 量性的臨床原始研究按照是否存在人為干預(yù),分為實驗性研究和觀察行研究兩大類。實驗性研究按照是否遵循隨機原則進行分組和設(shè)立對照組分為隨機對照試驗和類實驗性研究。觀察性研究根據(jù)可分為橫斷面研究、隊列研究、病例對照研究等。
1.5.1隨機對照試驗的方法學(xué)質(zhì)量評價 隨機對照試驗(RCT)是原始研究中質(zhì)量相對較高的證據(jù),證據(jù)臨床轉(zhuǎn)化研究中當沒有較高質(zhì)量的指南、證據(jù)總結(jié)和系統(tǒng)評價時,也可以使用隨機對照試驗的研究結(jié)論。對RCT進行方法學(xué)質(zhì)量評價的常用工具包括Cochrane風險偏倚評估工具[12]、JBI循證衛(wèi)生保健中心的評價工具[11]、CASP清單[13]等。其中Cochrane風險偏倚評估工具最常用,該工具主要從6個領(lǐng)域?qū)ρ芯康娘L險偏倚進行評價,每條指標采用“低度偏倚”、“不清楚”和“高度偏倚”進行判定,見表4。
表4 Cochrane 風險偏倚評估工具
續(xù)表4 Cochrane 風險偏倚評估工具
1.5.2類實驗性研究的方法學(xué)質(zhì)量評價 類實驗性研究和隨機對照試驗的區(qū)別在于未按照隨機原則進行分組或未設(shè)立對照組。類實驗性研究的方法學(xué)質(zhì)量評價工具有JBI循證衛(wèi)生保健中心對類實驗性研究論文的質(zhì)量評價工具[11]。該工具包括9個條目,包括:(1)是否清晰闡述研究中的因果關(guān)系。(2)組間基線是否具有可比性。(3)除了要驗證的干預(yù)措施外,各組接受的其他措施是否相同。(4)是否設(shè)立對照組。(5)是否在干預(yù)前后對結(jié)局指標實施多元化測量。(6)隨訪是否完成,如不完整,是否報道失訪并采取措施處理失訪問題。(7)是否采用相同的方式對各研究組研究對象的結(jié)局指標進行測評。(8)結(jié)局指標的測評方法是否可信。(9)資料分析方法是否恰當。評價者需對每個評價項目做出“是”“否”“不清楚”“不適用”的判斷,并最終經(jīng)過小組討論,決定該研究是納入、排除,還是需獲取進一步的信息。
在開展文獻質(zhì)量評價時,應(yīng)根據(jù)科學(xué)、規(guī)范的評價標準進行評價,而并非依靠研究者個人的主觀感受、臨床和科研經(jīng)驗進行判斷。證據(jù)臨床轉(zhuǎn)化研究中主要評價研究的方法學(xué)質(zhì)量。影響研究方法學(xué)質(zhì)量的包括以下3個方面[1]:(1)內(nèi)部真實性,指研究接近真實值的程度或研究偏倚的程度,研究中常見的偏倚包括選擇偏倚、實施偏倚、失訪偏倚和測量偏倚。(2)外部真實性,也被稱為適用性,指研究結(jié)果能否能應(yīng)用到研究對象之外的人群中。(3)重要性,指研究是否具有臨床價值,評價重要性時關(guān)注的是所涉及的臨床問題是否明確、具體,選擇的臨床指標是否正確等。
文獻質(zhì)量評價是開展證據(jù)臨床轉(zhuǎn)化研究中的關(guān)鍵步驟和重要基礎(chǔ),我們建議在證據(jù)臨床轉(zhuǎn)化研究中,針對指南選擇AGREE II評價工具,針對隨機對照研究采用Cochrane風險偏倚工具,針對其他類型研究采用JBI質(zhì)量評價工具,針對證據(jù)總結(jié)需要追溯引用原文進行評價。