国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

《針對單一結局和所有結局效應估計總體證據(jù)可信度評價》文獻解讀

2021-03-12 09:27:34劉建平
中國循證兒科雜志 2021年6期
關鍵詞:關鍵性降級總體

劉建平

1 主要內(nèi)容介紹

GRADE證據(jù)體中對療效可信度評估的5個降級因素(偏倚風險[1]、不精確性[2]、不一致性[3]、間接性[4]以及發(fā)表偏倚[5])和3個升級因素(呈現(xiàn)出大的效應量、呈現(xiàn)出劑量效應關系以及可能的混雜因素受到有效的控制)[6],此外還需要考慮決策者可使用的資源。本文解讀著重于討論:①如何針對關鍵或重要的單項結局指標療效的可信度開展綜合性評估;②如何針對所有關鍵結局療效的可信度進行評估。

1.1 針對單個結局療效評價的可信度評估 有別于傳統(tǒng)的證據(jù)分級體系,GRADE證據(jù)是針對某一結局的證據(jù)集合,也就是證據(jù)體的概念,根據(jù)不同的維度(domain)有升降級的體系,是否降級取決于上述5個降級因素,而升級則取決于上述3個升級因素。對這些維度的理解和使用相對比較容易操作,也能夠增加方法學的透明度。在應用這些體系時,需要注意兩點,一是避免機械刻板地套用而不考慮應用的場景;二是要注意各個維度指標之間的關聯(lián)性。這也是在應用GRADE體系當中經(jīng)常容易犯的錯誤。比如,對某單一維度的療效評價結果與針對某結局療效評價的總體評估不相吻合。當出現(xiàn)這樣的情況時,需要對整體評估的結果進行適當?shù)恼{整。

9項類黃酮治療痔瘡的Meta分析[7],以癥狀的持續(xù)存在(癥狀無改善)作為結局指標,以相對危險度(RR)的合并效應值作為療效指標,所得到的分析結果為:RR=0.42 (95%CI:0.28~0.61)。該效應值表明,經(jīng)過類黃酮治療約58%的患者痔瘡癥狀得到緩解。表1呈現(xiàn)了納入研究的5個降級維度的評估結果。

表1 9項類黃酮治療痔瘡癥狀持續(xù)的RCT證據(jù)質量及解讀

從表1和表2的結果看,5個降級維度中3個維度(偏倚風險、不一致性、發(fā)表偏倚)可能導致降級,也就是對療效估計的信心減低。然而,分析干預措施的療效,可見療效的效應中等偏大,癥狀持續(xù)的相對風險(RR=0.42)<0.5,該效應量可能提升對干預的療效信心。如果評估者較為慷慨,更傾向于支持干預措施,那么對類黃酮研究的證據(jù)體的總體質量評價可能視為高質量(不對研究的質量進行降級處理)。如果評估者嚴厲,可能會對證據(jù)質量進行降級處理,而不太看重干預措施的效果,甚至達到極低質量證據(jù)(very low confidence)的層次。對于兩種極端的評估者來說,雖然依據(jù)同樣的評價標準進行判斷,評價的結果卻可能天壤之別,顯然不能準確捕捉干預措施效果的可信度。

表2 9項類黃酮治療痔瘡RCT癥狀持續(xù)效應概要

上述案例的解讀反映了不同的評價者對每個維度(條目)的判斷可能存在差異,原因在于各個維度之間并非有截然的邊界,而是一種連續(xù)性演變,跨越了較少的局限性到非常嚴重的局限性。當針對某一特定維度證據(jù)體處于中間水平時,圍繞降級或升級的閾值上下的決策判斷都可能比較主觀。面對這種情形,最理想的做法是對做出的決定提供充分的判斷依據(jù)。

以類黃酮治療痔瘡為例,2種評估者(對單個維度判斷采取慷慨或嚴厲的態(tài)度)也許都應當對證據(jù)以更為寬廣的眼光看待問題,認可總體質量位于中等質量證據(jù)到低質量證據(jù)的邊界范圍,這也是該系統(tǒng)評價作者結論所做出的判斷[7]?;谠摪咐那闆r,評估者可以從局限性的3個維度(偏倚風險、不一致性或發(fā)表偏倚)中挑選1或2個維度來解釋判斷依據(jù)。例如,相關的解釋可能類似于如下表述:“我們對發(fā)表偏倚進行降級。盡管也存在高偏倚風險和不一致性的擔憂,我們并沒有進一步降低對療效估計的信心,因為后面2個維度中的每一個維度并沒有達到降低一個層級的水平”。類似這樣的陳述反映了對證據(jù)體總體或完整性評估的觀點。對證據(jù)概貌的介紹(表1和表2)中,對證據(jù)體的最終判斷是中等質量的證據(jù),判斷的依據(jù)是對發(fā)表偏倚維度進行了降級。

雖然證據(jù)質量是一個連續(xù)的變量,但是GRADE體系將其分類為4個等級:高、中、低、極低質量。上述案例中的情況可以判斷為中等質量證據(jù),也可能判斷為低質量證據(jù),在判斷中存在的難度在于總體證據(jù)質量是一個連續(xù)性變量,因此,除了提到的5個降級維度之外,還需要考慮其他場景因素(contextual factors),尤其是當判斷處于2個分類閾值不相上下的情景。此時,評估者無論做出中等或低質量證據(jù)的判斷,都是可以接受的。

本解讀文章的原作者強調應當鼓勵系統(tǒng)評價的作者或指南制定者在碰到類似情景時要更加明確,依據(jù)1個或多個維度做出的邊界性決策,應加以特別說明。如同本文表1和表2所呈現(xiàn)的證據(jù)概覽及注釋所做的說明。

雖然將證據(jù)質量連續(xù)性特點人為劃分成分類變量的做法存在一定的局限性,但對待每個維度的升降級作為一種離散的分類判斷,實際上增加了過程的透明性。

文章列舉的案例再次體現(xiàn)了GRADE體系的優(yōu)越性,并不僅僅是確保判斷具有可重復性,而且實現(xiàn)了明確、透明的判斷。但必須承認,證據(jù)評估者不可避免地在對單個維度或總體維度的升降級判斷中存在差異。當判斷的閾值接近于兩個臨近的分類(如中等或低質量證據(jù))時,該閾值特指在降級與不降級之間的判斷閾值,判斷的不一致則可能發(fā)生。然而,對系統(tǒng)評價人員或指南制定者來說,也不必過于擔心,當證據(jù)質量評價作為連續(xù)性變量考慮時,這種判斷的不一致性并非想象中那么突出,也可以通過協(xié)商達成一致性判斷。

1.2 針對所有結局療效評價的可信度評估 GRADE在全球率先提出規(guī)范的證據(jù)質量分級體系,強調根據(jù)不同結局研究質量會有差異,因此,使用GRADE的前提是對結局進行分類,按照不同結局查找相關證據(jù),再評價結局相關的證據(jù)質量。由于系統(tǒng)評價研究本身不涉及對干預措施的推薦,所以不要求對所有結局進行總體證據(jù)質量的評價,而是建議針對每一個重要結局進行證據(jù)質量評價。系統(tǒng)評價的目的之一是為指南的制定提供決策依據(jù),這種決策主要涉及對干預措施療效的可信度進行總體評估。決策的過程原則上應當是明確的、符合邏輯的,對療效的總體評估不應高于任何關鍵決策結局的效應的最低可信度。因此,GRADE工作組建議采用關鍵結局的最低可信度評估,作為此關鍵結局推薦建議相關的總體可信度。這就要求區(qū)分結局的重要性,通常分為關鍵結局(critical outcome)、重要結局(important outcome)和非關鍵結局(not critical outcome)。

在一項采用胰十二指腸切除術治療胰腺癌替代策略的系統(tǒng)評價中[8],有2種術式可供選擇,一種是保留幽門及其附件,二是標準手術不保留幽門及附件。該系統(tǒng)評價中針對不同結局的證據(jù)質量出現(xiàn)明顯差異,從中等質量到極低證據(jù)質量(表3)。面對這樣的情景,指南制定者需要明確該手術治療帶來的不良后果是否是重要的結局,是否是關鍵的結局,如果是重要的結局,對最佳治療策略的決策就不能成為關鍵性的影響因素。如果用于決策的某一關鍵性結局是基于低質量的證據(jù),那么,總體的證據(jù)質量評級就應當反映出來基于低質量證據(jù)。如果一項重要而非關鍵性結局基于較低可信度證據(jù),那么針對關鍵性結局的總體證據(jù)評級應當反映出療效估計具有較高的可信度。

根據(jù)表3中的案例,如果形成推薦建議的專家認為胃排空是一項關鍵性結局,那么對療效估計的總體可信度評級就會非常低。如果認為胃排空是一個重要而非關鍵性結局,總體可信度評估則為低級別。盡管5年生存率的證據(jù)級別為中等質量,根據(jù)圍手術期死亡結局(顯然是一個關鍵性結局)低級別證據(jù)的結果,胃排空的總體級別則被認為是低級別證據(jù)。

表3 胰腺癌不同術式策略與不同結局的不同證據(jù)質量相關

1.3 評估結局的重要性取決于證據(jù)的強度 在指南制定過程的初期,對療效總體可信度評估并非只考慮關鍵的結局,換句話說,判斷結局是否關鍵,是隨著評價的結果而變化的。例如,某一特定的不良事件(比如嚴重的惡心和嘔吐)在初始階段可能被認為是關鍵性結局。然而,當評價結果表明該事件的發(fā)生率較低,比如,<3%的患者會發(fā)生這樣的結局,因此,最終的判斷可能是,該不良反應是重要的,但不是關鍵性結局。

同樣,以類黃酮治療痔瘡的系統(tǒng)評價為例[7]。癥狀持續(xù)作為主要結局指標與之相關的偏倚風險(隨機隱藏不明確、問卷缺乏信效度測評)和發(fā)表偏倚,而不良反應的結局除了這2方面的問題之外,還存在精確度不高的問題。由此,無論對癥狀持續(xù)的可信度判斷如何,對于不良反應結局的判斷將會是較低質量的證據(jù)(可信度較低)。然而,當判斷不良反應結局效應的可信區(qū)間上限的最大值,大約是安慰劑對照組的2倍,即便如此,不良反應事件的發(fā)生率也并不高(約6.3%),而且屬于輕度不良反應。出于上述考慮,可能做出效應總體證據(jù)質量的判斷為低級別證據(jù)(可信度低),而另一些評價者則可能持不同的觀點,對效應的總體評價為中等級別證據(jù)??梢?,在綜合各個維度及效應大小之后做出的判斷仍然存在一定的差異。

另外一個案例是,面對未確診的冠心病但屬于高危風險(>60歲的男性吸煙者伴有高血壓、高膽固醇而無意通過飲食控制的,或者伴有糖尿病和冠心病家族史)的人群時,應當如何做出治療選擇,是否應當使用他汀類藥物來降低心血管事件的風險?一項針對高質量RCT的Meta分析表明,使用他汀類藥物可帶來持續(xù)性的、且具有顯著統(tǒng)計學意義的主要心血管事件和中風的減低,但是對于心血管死亡的降低則不顯著[9]。治療中偶見嚴重的不良反應,但所有不良反應在停藥后很快逆轉至正常。指南制定者在面對這樣的結果時需作出是否對心血管高危人群推薦他汀類藥物治療的選擇。此時,需要確定上述提及的4種結局(心血管死亡、心肌梗死、中風和不良反應)是關鍵性結局。在對證據(jù)的評價之后,上述4種結局當中的3個結局(心肌梗死、中風和不良反應)證據(jù)屬于高級別證據(jù)(可信度高),而心血管死亡的結局由于存在不精確性,證據(jù)評級為中等級別。接下來的問題是,綜合上述4種結局的總體證據(jù)應當評價為高還是中等?從系統(tǒng)評價報告來看,開始做出的判斷為中等級別的證據(jù)。然而,大多數(shù)患者啟用他汀類治療后中風和主要心血管事件的發(fā)生風險顯著減低,因此,有充分的理由推薦使用他汀類藥物治療。顯然,心血管死亡風險是否降低與該項判斷和決策不具有相關性,反之,他汀類藥物增加心血管死亡風險概率幾乎不太可能出現(xiàn)?;诖?,對總體證據(jù)的判斷最恰當?shù)倪x擇應該是高級別證據(jù)(充分的信心)。

總之,對總體證據(jù)的判斷原則是,當可信度高的證據(jù)支持某些關鍵性結局用于推薦干預措施時,人們不需要對支持同樣推薦建議的其他關鍵性結局中的較低可信度證據(jù)進行降級。因為,針對這些關鍵性結局的干預措施所帶來的獲益遠超過其負面效應,而且有高質量證據(jù)支撐。

2 重要觀點

2.1 GRADE體系要求對單個結局的療效評價可信度(證據(jù)質量)進行評估 指南制定的前期步驟要求系統(tǒng)地梳理臨床問題,尤其是關注疾病的結局,并在初始階段對結局進行分類,優(yōu)先排列出與疾病相關的關鍵性、重要和不重要的結局。之后是針對臨床問題開展文獻的系統(tǒng)評價,為干預措施的療效和安全性提供可信的證據(jù)。GRADE體系會按照不同類型的結局對干預措施的效應大小進行評估,同時對支撐該效應的證據(jù)質量進行評價,這些證據(jù)質量決定了對效應認可的信心或可信度(confidence),根據(jù)可信度證據(jù)的質量分為高、中、低和極低4個等級。

2.2 證據(jù)可信度評估要求同時兼顧8個維度的評價(5個降級維度,3個升級維度) 當針對某一具體結局的多項研究(證據(jù)體)進行綜合概括時,針對上述8個維度的要素決定總體證據(jù)的最終級別。

2.3 采用GRADE體系制定指南需要考慮推薦建議形成中相關的所有結局的總體療效可信度評估 除了對單個結局證據(jù)體的質量評價之外,也需要對所有結局的綜合證據(jù)質量進行評估,以便形成對干預措施療效估計值的可信度結果,從而影響推薦建議的決策。理論上講,高級別證據(jù)(可信度高)通常形成強推薦的建議,而中等或低質量證據(jù)(可信度低)形成弱推薦,極低質量證據(jù)則不形成推薦建議。但有時中等級別證據(jù)也可能形成強推薦,尤其在綜合考慮利弊權衡、資源利用度、可及性、適宜性等因素之后。

2.4 合理使用GRADE促進指南制定中關鍵決策過程的充分和透明化 指南制定過程涉及諸多判斷,對證據(jù)的評級決定了對干預措施療效的可信程度,進而影響推薦建議的形成。在應用證據(jù)評級的5個降級維度當中,存在一定的判斷誤差或邊際效應,需要結合具體臨床情景加以靈活應用,并通過充分討論達成共識。所作出的判斷應當具有相關支撐材料和判斷依據(jù),從而使決策過程充分、透明,更具有可信度和說服力。

3 結論

GRADE體系明確界定了針對某一結局療效估計中的可信度評級,這些評級標準可以供系統(tǒng)評價者和指南制定者使用,也就是對干預措施效應評估當中針對特定結局所作出的可信度評價,即總體證據(jù)質量的評價(高、中、低、極低4個等級)。盡管該系統(tǒng)采用了分類等級來評價證據(jù)的可信度,但是效應評估的可信度實際應當按照連續(xù)性變量來對待。在使用該評價系統(tǒng)時,不應生搬硬套,而是應當基于對干預措施推薦的場景來靈活掌握。不同的結局、效應大小以及總體的可信度是判斷的關鍵要素。原則上是以關鍵性結局對效應的評估提供最低可接受的可信證據(jù)作為決策依據(jù)。

猜你喜歡
關鍵性降級總體
社交降級后,終于舒服了
現(xiàn)代年輕人“消費降級”現(xiàn)象大掃描
華人時刊(2023年9期)2023-06-20 08:31:24
用樣本估計總體復習點撥
2020年秋糧收購總體進度快于上年
外匯市場運行有望延續(xù)總體平穩(wěn)發(fā)展趨勢
中國外匯(2019年6期)2019-07-13 05:44:06
“賞石”會被消費降級嗎?
寶藏(2018年12期)2019-01-29 01:51:08
消費降級了嗎?
南風窗(2018年20期)2018-09-28 04:10:40
直擊高考中的用樣本估計總體
關于汽車經(jīng)銷商DMS系統(tǒng)實施的關鍵性
寫作過程中結構起著關鍵性的作用
岳阳市| 贡觉县| 台北县| 桐庐县| 登封市| 金川县| 郑州市| 繁峙县| 茂名市| 丰台区| 龙游县| 屯门区| 尤溪县| 宁蒗| 瑞金市| 禹州市| 大方县| 灵寿县| 古蔺县| 镇坪县| 哈巴河县| 澄迈县| 光泽县| 杭州市| 沽源县| 阿克陶县| 辽中县| 准格尔旗| 平罗县| 平昌县| 凌海市| 溆浦县| 湾仔区| 齐齐哈尔市| 鲜城| 南城县| 五峰| 扬中市| 全南县| 长沙县| 南安市|