鄧通,汪洋,黃笛,曾憲濤,靳英輝,任學(xué)群,王行環(huán)
臨床實(shí)踐指南是縮小當(dāng)前最佳證據(jù)與臨床實(shí)踐間差距的臨床決策工具[1]。目前制訂臨床指南已經(jīng)成為國際熱點(diǎn),各國的醫(yī)學(xué)團(tuán)體、政府機(jī)構(gòu)及其它組織都在積極制訂各種疾病診治指南。而基于循證醫(yī)學(xué)方法制訂臨床實(shí)踐指南在我國也得到了逐步開展和重視[2],循證指南最關(guān)鍵的三個要素是全面收集現(xiàn)有研究證據(jù),對收集到的證據(jù)進(jìn)行質(zhì)量評價并根據(jù)質(zhì)量評價結(jié)果對推薦意見進(jìn)行分級[3]。在多個證據(jù)評價和推薦強(qiáng)度分級標(biāo)準(zhǔn)中,GRADE(The Grading of Recommendations Assessment,Development and Evaluation)分級方法[4]受到國內(nèi)外學(xué)者最廣泛的認(rèn)可,它突破了單從研究設(shè)計角度考慮證據(jù)質(zhì)量的局限性,在對推薦建議分級時將證據(jù)質(zhì)量和其它因素(如患者選擇、資源可利用性等)進(jìn)行綜合考慮。GRADE方法是由GRADE工作組于2004年推出的證據(jù)質(zhì)量和推薦強(qiáng)度分級方法[5]。目前WHO和Cochrane協(xié)作網(wǎng)在內(nèi)的多個國際組織、協(xié)會已采納GRADE分級方法。在本系列文章共納入指南制訂手冊36部,其中英國國家衛(wèi)生與服務(wù)優(yōu)化研究所(NICE)、歐洲人類生殖與胚胎學(xué)會(ESHRE)、中華醫(yī)學(xué)會等19部指南制訂手冊推薦采用GRADE分級方法,另有4部采用根據(jù)GRADE改編的版本[6]。在接下來若干篇文章中將會詳細(xì)介紹與GRADE方法有關(guān)的概念、實(shí)踐和工具。
GRADE方法不僅是一個評級方法,它提供了一個透明和結(jié)構(gòu)化的過程,用于制訂衛(wèi)生保健領(lǐng)域的系統(tǒng)評價和指南的證據(jù)摘要,以及執(zhí)行制訂建議所涉及的步驟。GRADE方法詳細(xì)說明了一種構(gòu)建問題的方法,選擇感興趣的結(jié)局指標(biāo)并評估其重要性,評價證據(jù),將證據(jù)與患者和社會兩者的價值觀和偏好結(jié)合,以形成最終推薦意見,還為臨床醫(yī)生和患者在臨床實(shí)踐中使用推薦意見,以及為決策者制訂衛(wèi)生政策時應(yīng)用該系統(tǒng)提供了指導(dǎo)[7]。
1.1 GRADE方法的優(yōu)勢與目前存在的其他證據(jù)分類分級標(biāo)準(zhǔn)相比,GRADE方法具有以下優(yōu)勢:①它由一個具有廣泛代表性的國際指南制訂小組制訂;②明確界定了證據(jù)質(zhì)量和推薦強(qiáng)度;③清楚評價了不同治療方案的重要結(jié)局;④對不同級別證據(jù)的升級與降級有明確、綜合的標(biāo)準(zhǔn);⑤從證據(jù)評級到推薦意見強(qiáng)度全過程透明;⑥明確承認(rèn)患者價值觀和意愿;⑦就推薦意見的強(qiáng)弱,分別從臨床醫(yī)生、患者、政策制訂者角度做出了明確實(shí)用的詮釋;⑧適用于制作系統(tǒng)評價、衛(wèi)生技術(shù)評估及指南開發(fā)。GRADE方法制訂推薦意見的原理見圖1[8]。
圖1 形成推薦的GRADE過程原理圖
1.2 GRADE方法對證據(jù)質(zhì)量和推薦強(qiáng)度的定義與分級GRADE方法為系統(tǒng)評價和指南提供了一個證據(jù)質(zhì)量評價的體系,同時為指南推薦強(qiáng)度評級提供了一種系統(tǒng)方法[8]?!白C據(jù)質(zhì)量”在指南中被定義為在多大程度上確信效應(yīng)估計值支持作出推薦,“推薦強(qiáng)度”為在多大程度上確信干預(yù)效果利大于弊或弊大于利[9]。最后將每一結(jié)局相對應(yīng)的證據(jù)質(zhì)量評定為“高、中、低和極低”四個等級具體(表1)。GRADE方法將推薦強(qiáng)度分為“強(qiáng)推薦和弱推薦”兩個等級具體(表2)。在使用GRADE方法時,指南小組用“強(qiáng)推薦”表示他們確信相關(guān)的干預(yù)措施利大于弊。用“弱推薦”表示干預(yù)措施有可能利大于弊,但他們把握不大。對于不同的決策者,推薦強(qiáng)度也有不同含義(框1)。
1.3 GRADE方法中影響證據(jù)質(zhì)量和推薦強(qiáng)度的因素
1.3.1 影響證據(jù)質(zhì)量的因素GRADE方法對證據(jù)質(zhì)量進(jìn)行分級的方法始于研究設(shè)計,它將隨機(jī)對照試驗定為高質(zhì)量證據(jù),觀察性研究定為低質(zhì)量證據(jù),然后列出5個可能降低證據(jù)質(zhì)量的因素及3個可能提高證據(jù)質(zhì)量的因素(框2)。
1.3.2 影響推薦強(qiáng)度的因素推薦強(qiáng)度反映了指南專家組在多大程度上確信干預(yù)的理想效果超過了針對該推薦意圖的患者范圍內(nèi)的不良反應(yīng),反之亦然[10]。而決定推薦強(qiáng)度共有四個關(guān)鍵因素,分別是利弊平衡,證據(jù)質(zhì)量,價值觀和意愿以及成本(表3)[11]。
目前GRADE方法已被廣泛傳播,出現(xiàn)在各個研究領(lǐng)域。最開始GRADE方法最成熟的應(yīng)用領(lǐng)域是干預(yù)性和觀察性研究的系統(tǒng)評價和治療性臨床實(shí)踐指南,GRADEpro軟件也是針對干預(yù)性研究而開發(fā)的。但現(xiàn)在GRADE方法在診斷性研究系統(tǒng)評價和診斷性臨床實(shí)踐指南中的應(yīng)用也已經(jīng)得到了長足發(fā)展[12]。國內(nèi)外學(xué)者對GRADE方法在病因研究[13]、預(yù)后研究[14]、成本-效果研究[15]、動物實(shí)驗系統(tǒng)評價[16]、網(wǎng)狀Meta分析[17]和護(hù)理[18]等領(lǐng)域的應(yīng)用也展開了積極的探索。
表1 GRADE證據(jù)質(zhì)量分級詳情表
表2 GRADE證據(jù)推薦強(qiáng)度的詳情表
3.1 GRADEpro簡介GRADE工作組推出了一款簡易、透明的軟件GRADEprofiler(GRADEpro),極大方便了GRADE系統(tǒng)方法學(xué)的普及與應(yīng)用[19]。近10年來,GRADE方法學(xué)得到了廣泛推廣與應(yīng)用[20],在證據(jù)分級和指南制訂過程中發(fā)揮了重要作用。GRADEpro適用于隨機(jī)對照試驗、非隨機(jī)對照試驗和其他類型觀察性研究的證據(jù)體的質(zhì)量評價,主要針對干預(yù)性證據(jù)的質(zhì)量分級。GRADEpro最初研發(fā)是為Cochrane系統(tǒng)評價(CDSR)創(chuàng)建結(jié)果總結(jié)表(SoF),它還能創(chuàng)建GRADE證據(jù)概要表(GRADE evidence profile,EP)和評價概觀表(Overview of Reviews table,OoR)?,F(xiàn)在,隨著GRADE系統(tǒng)的廣泛推廣,GRADEpro也用于非Cochrane系統(tǒng)評價中[19]。
框1 GRADE中推薦強(qiáng)度的含義
3.2 GDT簡介為適應(yīng)計算機(jī)網(wǎng)絡(luò)的飛速發(fā)展,使GRADE系統(tǒng)證據(jù)分級及推薦強(qiáng)度方法學(xué)更加便捷地推廣和使用,GRADE工作組于2013年正式推出了一款在線工具Guideline Development Tool(GRADEpro GDT)——“循證實(shí)踐指南研發(fā)工具”,希望通過GDT致力于將干預(yù)和診斷類實(shí)踐指南制訂過程中的重要數(shù)據(jù)和流程進(jìn)行整合,更方便研究者使用[20]。目前該在線工具已經(jīng)過數(shù)次更新,其在整體頁面風(fēng)格,研究問題及相關(guān)結(jié)局指標(biāo)的錄入、導(dǎo)出與結(jié)果展示,利益沖突的管理,從證據(jù)到推薦的相關(guān)文件表格的產(chǎn)生,結(jié)果的在線共享與傳播等方面均進(jìn)行了更新。更新后的GRADEpro GDT在線工具更智能化和透明化,完善了證據(jù)質(zhì)量分級及循證實(shí)踐指南制訂過程,促進(jìn)了指南制訂的科學(xué)化和體系化。
臨床實(shí)踐指南和嚴(yán)格基于證據(jù)報告的衛(wèi)生技術(shù)評估的關(guān)鍵一步都是證據(jù)總結(jié),即對每一結(jié)局的質(zhì)量分級及效應(yīng)量估計。GRADE工作組已開發(fā)出一套專門方法來呈現(xiàn)可得證據(jù)的質(zhì)量、與質(zhì)量評級有關(guān)的判斷及備選方案對所關(guān)注結(jié)局的影響?,F(xiàn)在我們將總結(jié)這些方法,并稱這些方法為GRADE證據(jù)概要表和結(jié)果總結(jié)表。
框2 影響證據(jù)質(zhì)量的因素
表3 推薦強(qiáng)度的決定因素
證據(jù)概要表(表4)除有結(jié)果總結(jié)表的內(nèi)容外還包含了詳細(xì)的質(zhì)量評價,即除有對每個結(jié)局的結(jié)果總結(jié)外,還包含了對決定證據(jù)質(zhì)量的每個因素的清晰評價。結(jié)果總結(jié)表(表5)包含了對每個結(jié)局的證據(jù)質(zhì)量評價,但沒有該評價所依托的詳細(xì)評判信息[7]。
表4 內(nèi)鏡下與腹腔鏡下對于闌尾炎治療效果的證據(jù)概要表
表5 內(nèi)鏡下與腹腔鏡下對于闌尾炎治療效果的結(jié)果總結(jié)表
5.1 相對效應(yīng)指標(biāo)常用相對效應(yīng)指標(biāo)在二分類變量中有相對危險度(RR)、比值比(OR),相對危險度減少值(RRR)和危險比(HR)其95%的可信區(qū)間(CI)。在連續(xù)性變量中有標(biāo)準(zhǔn)化均數(shù)差(SMD)。
(1)OR即比值比或優(yōu)勢比,是測量疾病與暴露聯(lián)系強(qiáng)度的一個重要指標(biāo)。是某組中某事件的比值與另一組內(nèi)該事件的比值之比。OR=1表示比較組間沒有差異。當(dāng)研究結(jié)局為不利事件時,OR<1表示暴露可能會降低結(jié)局風(fēng)險[21]。
(2)RR是rate ratio或risk ratio或relative risk的縮寫,國內(nèi)翻譯為“相對危險度”,其意義為兩組的事件率之比。RR是反映暴露(干預(yù))與事件關(guān)聯(lián)強(qiáng)度的最有用的指標(biāo)。RR=1表示比較組間沒有差異。當(dāng)研究結(jié)局為不利事件時,RR<1表示干預(yù)可降低結(jié)局風(fēng)險[21](表4~5)。
(3)RRR反映了某試驗因素使某結(jié)果的發(fā)生率增加或減少的相對量,但該指標(biāo)無法衡量發(fā)生率增減的絕對量。
(4)HR即危險比,最適合時間事件數(shù)據(jù)分析的方法是通過危險比來表示干預(yù)效應(yīng)的生存分析。Hazard和Risk在概念上相似,微小的差別在于Hazard表述的是瞬時風(fēng)險而且可能隨時間不斷變化。HR的解釋也與RR類似。時間事件數(shù)據(jù)的Meta分析通常需有單個患者數(shù)據(jù)(IPD)才可進(jìn)行[21]。
(5)SMD即標(biāo)準(zhǔn)化均數(shù)差,為兩組估計均數(shù)差值除以平均標(biāo)準(zhǔn)差而得。由于消除了量綱的影響,因而結(jié)果可以被合并。
5.2 絕對效應(yīng)指標(biāo)常用的絕對效應(yīng)指標(biāo)在二分類變量中有危險差(RD),絕對危險度降低(ARR),以及需要治療的病例數(shù)(NNT)。在連續(xù)性變量中有加權(quán)均數(shù)差(WMD)。
(1)RD即危險差,也被稱為歸因危險度(AR)是指干預(yù)(暴露)組和對照組結(jié)局事件發(fā)生概率的絕對差值,其大小可反映試驗效應(yīng)的大小。
(2)ARR和RD一樣是指干預(yù)(暴露)組和對照組結(jié)局事件發(fā)生概率的絕對差值。
(3)NNT是絕對危險度的倒數(shù),即NNT=1/ARR,是指要使一個患者從治療中得益所需要治療的患者總數(shù),NNT作為一種國際公認(rèn)的療效評價指標(biāo),其意義表達(dá)準(zhǔn)確,直觀易懂,在臨床療效評價中逐漸被推廣應(yīng)用。
(4)WMD即加權(quán)均數(shù)差,在有些文章中的縮寫直接使用MD,用于Meta分析中所有研究具有相同連續(xù)性結(jié)局變量(如體重)和測量單位時(表4)。
5.3 效應(yīng)指標(biāo)相互關(guān)系相對指標(biāo)(RR,OR,SMD)不受基線風(fēng)險的影響,具有較好的一致性。但某些情況下相對指標(biāo)并不能反映關(guān)注事件的真實(shí)風(fēng)險情況,容易夸大效應(yīng)。例某研究試驗組某不良事件的發(fā)生率為0.05%, 對照組為0.005%,此時RR=10,但絕對風(fēng)險差RD僅0.045%。若專業(yè)上認(rèn)為0.05%的不良事件發(fā)生率是可以被接受的,或RD為0.045%可以接受,則此時單獨(dú)報告RR=10會讓人不能接受該干預(yù)措施導(dǎo)致的風(fēng)險,因為RR=10意味著非常強(qiáng)的聯(lián)系。對于普通醫(yī)生和患者而言,他們希望獲得定量而非僅僅是定性結(jié)果。而絕對效應(yīng)與相對效應(yīng)相比能夠直觀的反應(yīng)兩組差異,更易被臨床醫(yī)生和患者理解,所以制作指南時強(qiáng)調(diào)絕對效應(yīng)或者絕對效應(yīng)與相對效應(yīng)相結(jié)合。如果主要結(jié)局為二分類變量,則應(yīng)同時報告相對效應(yīng)(風(fēng)險比或比值比)和絕對效應(yīng)(風(fēng)險差),而單獨(dú)使用相對指標(biāo)或絕對指標(biāo)無法對效應(yīng)及其影響進(jìn)行完整描述。對連續(xù)性變量而言,WMD比SMD更容易解釋。由于SMD被標(biāo)準(zhǔn)化而無量綱,因而難于從專業(yè)上對其結(jié)果進(jìn)行解釋[21,22]。
當(dāng)出現(xiàn)二分類變量時通常會通過相對效應(yīng)計算出絕對效應(yīng)來呈現(xiàn)結(jié)果。RR計算絕對效應(yīng)(每1000人)= 1000×| CER×(1-RR)|,CER=對照組中具有事件的人數(shù)÷對照組中的總?cè)藬?shù)。例:表4和表5的RR為0.31(95%CI:0.13~0.77),CER為7.1%。因此絕對效應(yīng)=1000×0.071×(1-0.31)=每1000少49。OR的絕對效應(yīng)的計算需要將OR轉(zhuǎn)換為RR,然后如上計算相應(yīng)的風(fēng)險,然后如上計算相應(yīng)的風(fēng)險,。HR的絕對效應(yīng)的計算也需要轉(zhuǎn)換為RR再計算,。
隨著臨床實(shí)踐指南的制訂與實(shí)施逐漸受到社會的關(guān)注,越來越多的臨床實(shí)踐指南被發(fā)布及傳播。證據(jù)與推薦意見分級方法學(xué)是指南制訂方法學(xué)的核心環(huán)節(jié),目前GRADE方法作為證據(jù)與推薦意見分級的最新發(fā)展,也越來越多的被引入應(yīng)用。GRADE方法學(xué)也一直在迎接挑戰(zhàn),積極拓寬使用范圍。目前,GRADE方法評估合成證據(jù)體的質(zhì)量,不僅用于治療問題,還可用于診斷、預(yù)后??梢蕴幚砀深A(yù)研究、觀察性研究、動物研究、網(wǎng)狀Meta分析及質(zhì)性研究Meta整合。希望能通過這一系列的文章能夠加強(qiáng)大家對于GRADE方法的理解,促進(jìn)正確應(yīng)用GRADE方法。