臨床實(shí)踐指南制訂方法
--GRADE方法理論篇

2018-02-14 07:19鄧通汪洋黃笛曾憲濤靳英輝任學(xué)群王行環(huán)

中國循證心血管醫(yī)學(xué)雜志 2018年12期

鄧通，汪洋，黃笛，曾憲濤，靳英輝，任學(xué)群，王行環(huán)

臨床實(shí)踐指南是縮小當(dāng)前最佳證據(jù)與臨床實(shí)踐間差距的臨床決策工具[1]。目前制訂臨床指南已經(jīng)成為國際熱點(diǎn)，各國的醫(yī)學(xué)團(tuán)體、政府機(jī)構(gòu)及其它組織都在積極制訂各種疾病診治指南。而基于循證醫(yī)學(xué)方法制訂臨床實(shí)踐指南在我國也得到了逐步開展和重視[2]，循證指南最關(guān)鍵的三個要素是全面收集現(xiàn)有研究證據(jù)，對收集到的證據(jù)進(jìn)行質(zhì)量評價并根據(jù)質(zhì)量評價結(jié)果對推薦意見進(jìn)行分級[3]。在多個證據(jù)評價和推薦強(qiáng)度分級標(biāo)準(zhǔn)中，GRADE（The Grading of Recommendations Assessment，Development and Evaluation）分級方法[4]受到國內(nèi)外學(xué)者最廣泛的認(rèn)可，它突破了單從研究設(shè)計角度考慮證據(jù)質(zhì)量的局限性，在對推薦建議分級時將證據(jù)質(zhì)量和其它因素（如患者選擇、資源可利用性等）進(jìn)行綜合考慮。GRADE方法是由GRADE工作組于2004年推出的證據(jù)質(zhì)量和推薦強(qiáng)度分級方法[5]。目前WHO和Cochrane協(xié)作網(wǎng)在內(nèi)的多個國際組織、協(xié)會已采納GRADE分級方法。在本系列文章共納入指南制訂手冊36部，其中英國國家衛(wèi)生與服務(wù)優(yōu)化研究所（NICE）、歐洲人類生殖與胚胎學(xué)會（ESHRE）、中華醫(yī)學(xué)會等19部指南制訂手冊推薦采用GRADE分級方法，另有4部采用根據(jù)GRADE改編的版本[6]。在接下來若干篇文章中將會詳細(xì)介紹與GRADE方法有關(guān)的概念、實(shí)踐和工具。

1 GRADE方法的基本概念

GRADE方法不僅是一個評級方法，它提供了一個透明和結(jié)構(gòu)化的過程，用于制訂衛(wèi)生保健領(lǐng)域的系統(tǒng)評價和指南的證據(jù)摘要，以及執(zhí)行制訂建議所涉及的步驟。GRADE方法詳細(xì)說明了一種構(gòu)建問題的方法，選擇感興趣的結(jié)局指標(biāo)并評估其重要性，評價證據(jù)，將證據(jù)與患者和社會兩者的價值觀和偏好結(jié)合，以形成最終推薦意見，還為臨床醫(yī)生和患者在臨床實(shí)踐中使用推薦意見，以及為決策者制訂衛(wèi)生政策時應(yīng)用該系統(tǒng)提供了指導(dǎo)[7]。

1.1 GRADE方法的優(yōu)勢與目前存在的其他證據(jù)分類分級標(biāo)準(zhǔn)相比，GRADE方法具有以下優(yōu)勢：①它由一個具有廣泛代表性的國際指南制訂小組制訂；②明確界定了證據(jù)質(zhì)量和推薦強(qiáng)度；③清楚評價了不同治療方案的重要結(jié)局；④對不同級別證據(jù)的升級與降級有明確、綜合的標(biāo)準(zhǔn)；⑤從證據(jù)評級到推薦意見強(qiáng)度全過程透明；⑥明確承認(rèn)患者價值觀和意愿；⑦就推薦意見的強(qiáng)弱，分別從臨床醫(yī)生、患者、政策制訂者角度做出了明確實(shí)用的詮釋；⑧適用于制作系統(tǒng)評價、衛(wèi)生技術(shù)評估及指南開發(fā)。GRADE方法制訂推薦意見的原理見圖1[8]。

圖1 形成推薦的GRADE過程原理圖

1.2 GRADE方法對證據(jù)質(zhì)量和推薦強(qiáng)度的定義與分級GRADE方法為系統(tǒng)評價和指南提供了一個證據(jù)質(zhì)量評價的體系，同時為指南推薦強(qiáng)度評級提供了一種系統(tǒng)方法[8]?！白C據(jù)質(zhì)量”在指南中被定義為在多大程度上確信效應(yīng)估計值支持作出推薦，“推薦強(qiáng)度”為在多大程度上確信干預(yù)效果利大于弊或弊大于利[9]。最后將每一結(jié)局相對應(yīng)的證據(jù)質(zhì)量評定為“高、中、低和極低”四個等級具體（表1）。GRADE方法將推薦強(qiáng)度分為“強(qiáng)推薦和弱推薦”兩個等級具體（表2）。在使用GRADE方法時，指南小組用“強(qiáng)推薦”表示他們確信相關(guān)的干預(yù)措施利大于弊。用“弱推薦”表示干預(yù)措施有可能利大于弊，但他們把握不大。對于不同的決策者，推薦強(qiáng)度也有不同含義（框1）。

1.3 GRADE方法中影響證據(jù)質(zhì)量和推薦強(qiáng)度的因素

1.3.1 影響證據(jù)質(zhì)量的因素GRADE方法對證據(jù)質(zhì)量進(jìn)行分級的方法始于研究設(shè)計，它將隨機(jī)對照試驗定為高質(zhì)量證據(jù)，觀察性研究定為低質(zhì)量證據(jù)，然后列出5個可能降低證據(jù)質(zhì)量的因素及3個可能提高證據(jù)質(zhì)量的因素（框2）。

1.3.2 影響推薦強(qiáng)度的因素推薦強(qiáng)度反映了指南專家組在多大程度上確信干預(yù)的理想效果超過了針對該推薦意圖的患者范圍內(nèi)的不良反應(yīng)，反之亦然[10]。而決定推薦強(qiáng)度共有四個關(guān)鍵因素，分別是利弊平衡，證據(jù)質(zhì)量，價值觀和意愿以及成本（表3）[11]。

2 GRADE方法在各種研究領(lǐng)域中的應(yīng)用

目前GRADE方法已被廣泛傳播，出現(xiàn)在各個研究領(lǐng)域。最開始GRADE方法最成熟的應(yīng)用領(lǐng)域是干預(yù)性和觀察性研究的系統(tǒng)評價和治療性臨床實(shí)踐指南，GRADEpro軟件也是針對干預(yù)性研究而開發(fā)的。但現(xiàn)在GRADE方法在診斷性研究系統(tǒng)評價和診斷性臨床實(shí)踐指南中的應(yīng)用也已經(jīng)得到了長足發(fā)展[12]。國內(nèi)外學(xué)者對GRADE方法在病因研究[13]、預(yù)后研究[14]、成本-效果研究[15]、動物實(shí)驗系統(tǒng)評價[16]、網(wǎng)狀Meta分析[17]和護(hù)理[18]等領(lǐng)域的應(yīng)用也展開了積極的探索。

3 GRADE方法的分級工具

表1 GRADE證據(jù)質(zhì)量分級詳情表

表2 GRADE證據(jù)推薦強(qiáng)度的詳情表

3.1 GRADEpro簡介GRADE工作組推出了一款簡易、透明的軟件GRADEprofiler（GRADEpro），極大方便了GRADE系統(tǒng)方法學(xué)的普及與應(yīng)用[19]。近10年來，GRADE方法學(xué)得到了廣泛推廣與應(yīng)用[20]，在證據(jù)分級和指南制訂過程中發(fā)揮了重要作用。GRADEpro適用于隨機(jī)對照試驗、非隨機(jī)對照試驗和其他類型觀察性研究的證據(jù)體的質(zhì)量評價，主要針對干預(yù)性證據(jù)的質(zhì)量分級。GRADEpro最初研發(fā)是為Cochrane系統(tǒng)評價(CDSR)創(chuàng)建結(jié)果總結(jié)表（SoF），它還能創(chuàng)建GRADE證據(jù)概要表（GRADE evidence profile，EP）和評價概觀表（Overview of Reviews table，OoR）?，F(xiàn)在，隨著GRADE系統(tǒng)的廣泛推廣，GRADEpro也用于非Cochrane系統(tǒng)評價中[19]。

框1 GRADE中推薦強(qiáng)度的含義

3.2 GDT簡介為適應(yīng)計算機(jī)網(wǎng)絡(luò)的飛速發(fā)展，使GRADE系統(tǒng)證據(jù)分級及推薦強(qiáng)度方法學(xué)更加便捷地推廣和使用，GRADE工作組于2013年正式推出了一款在線工具Guideline Development Tool（GRADEpro GDT）——“循證實(shí)踐指南研發(fā)工具”，希望通過GDT致力于將干預(yù)和診斷類實(shí)踐指南制訂過程中的重要數(shù)據(jù)和流程進(jìn)行整合，更方便研究者使用[20]。目前該在線工具已經(jīng)過數(shù)次更新，其在整體頁面風(fēng)格，研究問題及相關(guān)結(jié)局指標(biāo)的錄入、導(dǎo)出與結(jié)果展示，利益沖突的管理，從證據(jù)到推薦的相關(guān)文件表格的產(chǎn)生，結(jié)果的在線共享與傳播等方面均進(jìn)行了更新。更新后的GRADEpro GDT在線工具更智能化和透明化，完善了證據(jù)質(zhì)量分級及循證實(shí)踐指南制訂過程，促進(jìn)了指南制訂的科學(xué)化和體系化。

4 GRADE方法中證據(jù)的呈現(xiàn)形式——證據(jù)概要表和結(jié)果總結(jié)表

臨床實(shí)踐指南和嚴(yán)格基于證據(jù)報告的衛(wèi)生技術(shù)評估的關(guān)鍵一步都是證據(jù)總結(jié)，即對每一結(jié)局的質(zhì)量分級及效應(yīng)量估計。GRADE工作組已開發(fā)出一套專門方法來呈現(xiàn)可得證據(jù)的質(zhì)量、與質(zhì)量評級有關(guān)的判斷及備選方案對所關(guān)注結(jié)局的影響?，F(xiàn)在我們將總結(jié)這些方法，并稱這些方法為GRADE證據(jù)概要表和結(jié)果總結(jié)表。

框2 影響證據(jù)質(zhì)量的因素

表3 推薦強(qiáng)度的決定因素

證據(jù)概要表（表4）除有結(jié)果總結(jié)表的內(nèi)容外還包含了詳細(xì)的質(zhì)量評價，即除有對每個結(jié)局的結(jié)果總結(jié)外，還包含了對決定證據(jù)質(zhì)量的每個因素的清晰評價。結(jié)果總結(jié)表（表5）包含了對每個結(jié)局的證據(jù)質(zhì)量評價，但沒有該評價所依托的詳細(xì)評判信息[7]。

表4 內(nèi)鏡下與腹腔鏡下對于闌尾炎治療效果的證據(jù)概要表

表5 內(nèi)鏡下與腹腔鏡下對于闌尾炎治療效果的結(jié)果總結(jié)表

5 GRADE方法中的常呈現(xiàn)的效應(yīng)指標(biāo)——相對效應(yīng)指標(biāo)和絕對效應(yīng)指標(biāo)

5.1 相對效應(yīng)指標(biāo)常用相對效應(yīng)指標(biāo)在二分類變量中有相對危險度（RR）、比值比（OR），相對危險度減少值（RRR）和危險比（HR）其95%的可信區(qū)間（CI）。在連續(xù)性變量中有標(biāo)準(zhǔn)化均數(shù)差（SMD）。

（1）OR即比值比或優(yōu)勢比，是測量疾病與暴露聯(lián)系強(qiáng)度的一個重要指標(biāo)。是某組中某事件的比值與另一組內(nèi)該事件的比值之比。OR=1表示比較組間沒有差異。當(dāng)研究結(jié)局為不利事件時，OR＜1表示暴露可能會降低結(jié)局風(fēng)險[21]。

（2）RR是rate ratio或risk ratio或relative risk的縮寫，國內(nèi)翻譯為“相對危險度”，其意義為兩組的事件率之比。RR是反映暴露（干預(yù)）與事件關(guān)聯(lián)強(qiáng)度的最有用的指標(biāo)。RR=1表示比較組間沒有差異。當(dāng)研究結(jié)局為不利事件時，RR＜1表示干預(yù)可降低結(jié)局風(fēng)險[21]（表4～5）。

（3）RRR反映了某試驗因素使某結(jié)果的發(fā)生率增加或減少的相對量，但該指標(biāo)無法衡量發(fā)生率增減的絕對量。

（4）HR即危險比，最適合時間事件數(shù)據(jù)分析的方法是通過危險比來表示干預(yù)效應(yīng)的生存分析。Hazard和Risk在概念上相似，微小的差別在于Hazard表述的是瞬時風(fēng)險而且可能隨時間不斷變化。HR的解釋也與RR類似。時間事件數(shù)據(jù)的Meta分析通常需有單個患者數(shù)據(jù)（IPD）才可進(jìn)行[21]。

（5）SMD即標(biāo)準(zhǔn)化均數(shù)差，為兩組估計均數(shù)差值除以平均標(biāo)準(zhǔn)差而得。由于消除了量綱的影響，因而結(jié)果可以被合并。

5.2 絕對效應(yīng)指標(biāo)常用的絕對效應(yīng)指標(biāo)在二分類變量中有危險差（RD），絕對危險度降低（ARR），以及需要治療的病例數(shù)（NNT）。在連續(xù)性變量中有加權(quán)均數(shù)差（WMD）。

（1）RD即危險差，也被稱為歸因危險度（AR）是指干預(yù)（暴露）組和對照組結(jié)局事件發(fā)生概率的絕對差值，其大小可反映試驗效應(yīng)的大小。

（2）ARR和RD一樣是指干預(yù)（暴露）組和對照組結(jié)局事件發(fā)生概率的絕對差值。

（3）NNT是絕對危險度的倒數(shù)，即NNT=1/ARR，是指要使一個患者從治療中得益所需要治療的患者總數(shù)，NNT作為一種國際公認(rèn)的療效評價指標(biāo)，其意義表達(dá)準(zhǔn)確，直觀易懂，在臨床療效評價中逐漸被推廣應(yīng)用。

（4）WMD即加權(quán)均數(shù)差，在有些文章中的縮寫直接使用MD，用于Meta分析中所有研究具有相同連續(xù)性結(jié)局變量（如體重）和測量單位時（表4）。

5.3 效應(yīng)指標(biāo)相互關(guān)系相對指標(biāo)（RR，OR，SMD）不受基線風(fēng)險的影響，具有較好的一致性。但某些情況下相對指標(biāo)并不能反映關(guān)注事件的真實(shí)風(fēng)險情況，容易夸大效應(yīng)。例某研究試驗組某不良事件的發(fā)生率為0.05%, 對照組為0.005%，此時RR=10，但絕對風(fēng)險差RD僅0.045%。若專業(yè)上認(rèn)為0.05%的不良事件發(fā)生率是可以被接受的，或RD為0.045%可以接受，則此時單獨(dú)報告RR=10會讓人不能接受該干預(yù)措施導(dǎo)致的風(fēng)險，因為RR=10意味著非常強(qiáng)的聯(lián)系。對于普通醫(yī)生和患者而言，他們希望獲得定量而非僅僅是定性結(jié)果。而絕對效應(yīng)與相對效應(yīng)相比能夠直觀的反應(yīng)兩組差異，更易被臨床醫(yī)生和患者理解，所以制作指南時強(qiáng)調(diào)絕對效應(yīng)或者絕對效應(yīng)與相對效應(yīng)相結(jié)合。如果主要結(jié)局為二分類變量，則應(yīng)同時報告相對效應(yīng)（風(fēng)險比或比值比）和絕對效應(yīng)（風(fēng)險差），而單獨(dú)使用相對指標(biāo)或絕對指標(biāo)無法對效應(yīng)及其影響進(jìn)行完整描述。對連續(xù)性變量而言，WMD比SMD更容易解釋。由于SMD被標(biāo)準(zhǔn)化而無量綱，因而難于從專業(yè)上對其結(jié)果進(jìn)行解釋[21,22]。

當(dāng)出現(xiàn)二分類變量時通常會通過相對效應(yīng)計算出絕對效應(yīng)來呈現(xiàn)結(jié)果。RR計算絕對效應(yīng)（每1000人）= 1000×| CER×（1-RR）|，CER=對照組中具有事件的人數(shù)÷對照組中的總?cè)藬?shù)。例：表4和表5的RR為0.31（95%CI：0.13～0.77），CER為7.1%。因此絕對效應(yīng)=1000×0.071×（1-0.31）=每1000少49。OR的絕對效應(yīng)的計算需要將OR轉(zhuǎn)換為RR，然后如上計算相應(yīng)的風(fēng)險，然后如上計算相應(yīng)的風(fēng)險，。HR的絕對效應(yīng)的計算也需要轉(zhuǎn)換為RR再計算，。

隨著臨床實(shí)踐指南的制訂與實(shí)施逐漸受到社會的關(guān)注，越來越多的臨床實(shí)踐指南被發(fā)布及傳播。證據(jù)與推薦意見分級方法學(xué)是指南制訂方法學(xué)的核心環(huán)節(jié)，目前GRADE方法作為證據(jù)與推薦意見分級的最新發(fā)展，也越來越多的被引入應(yīng)用。GRADE方法學(xué)也一直在迎接挑戰(zhàn)，積極拓寬使用范圍。目前，GRADE方法評估合成證據(jù)體的質(zhì)量，不僅用于治療問題，還可用于診斷、預(yù)后?？梢蕴幚砀深A(yù)研究、觀察性研究、動物研究、網(wǎng)狀Meta分析及質(zhì)性研究Meta整合。希望能通過這一系列的文章能夠加強(qiáng)大家對于GRADE方法的理解，促進(jìn)正確應(yīng)用GRADE方法。