国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國際臨床指南評(píng)價(jià)工具的發(fā)展與啟示

2015-03-22 06:48士靖
關(guān)鍵詞:條目指南工具

,士靖,,

臨床指南是循證醫(yī)學(xué)資源的重要組成部分,也是循證醫(yī)學(xué)在醫(yī)療實(shí)踐中的具體應(yīng)用[1]。根據(jù)1990年美國醫(yī)學(xué)研究所(IOM)的定義,臨床指南是系統(tǒng)開發(fā)的多組臨床指導(dǎo)意見,以幫助醫(yī)生和患者針對(duì)特定的臨床問題做出恰當(dāng)處理,選擇和制定適宜的衛(wèi)生保健服務(wù)[2]。其作用是規(guī)范診療流程,為臨床決策提供依據(jù),以減少醫(yī)療差異、提高臨床質(zhì)量和效率、控制醫(yī)療保健費(fèi)用、提高病人醫(yī)療活動(dòng)自主性。因此,臨床指南得到臨床醫(yī)生和管理者的重視。但隨著指南文獻(xiàn)的不斷增加,同一個(gè)主題的不同指南可能有幾種不同、甚至相互矛盾的推薦措施,在臨床指南的使用過程中,過去開發(fā)的許多指南經(jīng)臨床檢驗(yàn)也被證明是不可信,有些甚至有嚴(yán)重錯(cuò)誤。因此,要通過臨床指南評(píng)價(jià)發(fā)現(xiàn)指南開發(fā)過程中的程序問題、方法學(xué)缺陷和潛在利益偏倚并加以解決,保證指南的嚴(yán)謹(jǐn)性、正確性、及時(shí)性與可行性。目前,主要有美國、加拿大、英國、意大利、澳大利亞、法國、德國、西班牙等國家和AGREE、WHO等國際組織制定的20多個(gè)臨床指南評(píng)價(jià)工具[3]。這些評(píng)價(jià)工具的條目數(shù)量和評(píng)價(jià)形式各不相同,也各有優(yōu)劣。

從20世紀(jì)80年代起,我國衛(wèi)生部及各醫(yī)學(xué)協(xié)會(huì)陸續(xù)開發(fā)了一些臨床指南,近年也有學(xué)者開始關(guān)注指南評(píng)價(jià)問題。但是國內(nèi)對(duì)臨床指南的評(píng)價(jià),多是對(duì)評(píng)價(jià)原則與方法的探討[4-5]、對(duì)比分析某一類疾病的不同指南[6]、用文獻(xiàn)計(jì)量方法分析指南的影響力[7],或直接使用國外評(píng)價(jià)工具[8-9],或使用以AGREE為模板稍作改動(dòng)的中文評(píng)價(jià)工具[10],評(píng)價(jià)結(jié)果都不理想。目前我是尚無一個(gè)適用本國國情的、正式的、可以通用的評(píng)價(jià)工具。因此,本文擬通過介紹國外臨床指南評(píng)價(jià)工具的開發(fā)歷程、出臺(tái)背景、演化過程、發(fā)展規(guī)律和存在的問題,為開發(fā)本土化的臨床指南評(píng)價(jià)工具提供可借鑒的國際經(jīng)驗(yàn)。

本文以SCI,PubMed和Google Scholar為數(shù)據(jù)源,使用“guideline”,“appraisal tools”,“quality”,“assessment”和“evaluation”等詞進(jìn)行檢索,對(duì)檢出文獻(xiàn)進(jìn)行分析,鎖定43個(gè)曾被相關(guān)研究人員認(rèn)定為評(píng)價(jià)指南質(zhì)量的工具。再對(duì)所得文獻(xiàn)的參考文獻(xiàn)追溯檢索,得到36篇以各種形式發(fā)表的評(píng)價(jià)工具文獻(xiàn)。選擇其中的英文文獻(xiàn),以“以評(píng)價(jià)指南質(zhì)量為目的、有明顯清晰的評(píng)價(jià)標(biāo)準(zhǔn)條目的通用評(píng)價(jià)工具的最新版本”為納入標(biāo)準(zhǔn),得到22個(gè)符合標(biāo)準(zhǔn)的評(píng)價(jià)工具。通過內(nèi)容分析,確定各評(píng)價(jià)工具的條目?jī)?nèi)容。摘取相關(guān)問題或陳述,根據(jù)問題內(nèi)容對(duì)條目進(jìn)行分類,最后將各條目歸入指定的質(zhì)量維度。由于各評(píng)價(jià)工具的條目不盡相同,選取業(yè)內(nèi)認(rèn)可程度最高、評(píng)價(jià)范圍相對(duì)全面的AGREE評(píng)價(jià)工具,以其6個(gè)維度和23個(gè)條目的框架為基礎(chǔ),匯總22個(gè)工具的維度和條目信息。為便于觀察,按照細(xì)化程度或要求的嚴(yán)格程度對(duì)各條目進(jìn)行了評(píng)級(jí),并用星號(hào)表示(表1)。

1 臨床指南評(píng)價(jià)工具的發(fā)展

通過表1回顧臨床指南評(píng)價(jià)工具發(fā)展歷程,并對(duì)22個(gè)臨床指南評(píng)價(jià)工具進(jìn)行比較。

最早的指南評(píng)價(jià)工具可以追溯到1992年。IOM從指南自身特點(diǎn)出發(fā),提出理想指南應(yīng)該具有8個(gè)屬性,并在此基礎(chǔ)上開發(fā)出了一個(gè)暫時(shí)的指南質(zhì)量評(píng)價(jià)工具[11]。該工具主要評(píng)價(jià)了指南的8種屬性,其中4個(gè)考察指南本身的臨床適用性或適用范圍、臨床的靈活性、可靠性以及有效性和可重復(fù)性,另外4個(gè)考察指南開發(fā)過程的清晰度、多學(xué)科的過程、定期審查和參考文獻(xiàn)。這是循證醫(yī)學(xué)界公認(rèn)的第一個(gè)指南質(zhì)量評(píng)價(jià)工具[3],但由于其操作繁瑣,需要多個(gè)領(lǐng)域的專家共同參與,始終沒有投入使用。此后以該評(píng)價(jià)工具為基礎(chǔ),出現(xiàn)了不少的變型工具,如Shanefelt 1999[12]、Sanders 2000[13]、 Cluzeau 1999[14]和Shiffman 2003[15-16]。

從表1可見,最初的指南評(píng)價(jià)工具的評(píng)價(jià)范圍主要集中在指南的范圍與目的、開發(fā)過程的嚴(yán)謹(jǐn)性和語言清晰性三個(gè)方面,例如Hayward 1995[17]和Calder 1997[18]。而較少提及參與人員、編輯獨(dú)立性和指南的應(yīng)用性。Graham等[19]在2000年發(fā)表的一篇綜述中對(duì)13種臨床指南評(píng)價(jià)工具進(jìn)行比較時(shí),發(fā)現(xiàn)單獨(dú)運(yùn)用這13種評(píng)價(jià)工具中的任何一種都不足以完整而準(zhǔn)確地評(píng)估一篇臨床指南。

1999-2003年是指南評(píng)價(jià)工具開發(fā)的高峰期,Shaneyfelt 1999等13個(gè)指南陸續(xù)出臺(tái)[12-16,20-28]。這些評(píng)價(jià)工具包含的條目較多,維度也較全面。其中APA 2002的條目和維度數(shù)均為最多,有21個(gè)維度下的47個(gè)條目[22]。但APA評(píng)價(jià)要求過高(如要求具有相關(guān)學(xué)科專家、科學(xué)方法論專家、熟悉患者狀況的代表、對(duì)多樣化問題具有專業(yè)知識(shí)和敏感性的分析成員同時(shí)參與),導(dǎo)致最終沒能通過有效性檢驗(yàn)。在13個(gè)評(píng)價(jià)工具中,通過有效性檢驗(yàn)的評(píng)價(jià)工具只有Shaneyfelt的指南質(zhì)量評(píng)估問卷GQAQ 1999[12]和 Cluzeau的臨床指南評(píng)估工具AICG 1999[14]。Cluzeau信度較高,但其量表有37個(gè)條目,臨床應(yīng)用不方便,因此也沒有得到大范圍的推廣。

在吸收上述量表開發(fā)的經(jīng)驗(yàn)教訓(xùn)的基礎(chǔ)上,2001年Agrawal等人開發(fā)了一個(gè)適用于計(jì)算機(jī)的指南質(zhì)量自動(dòng)化評(píng)價(jià)工具GEM-Q[29]。它是一個(gè)基于可擴(kuò)展標(biāo)記語言(XML)的應(yīng)用,根據(jù)指定的質(zhì)量評(píng)價(jià)工具提取出指南文件中的特定文本內(nèi)容,實(shí)現(xiàn)了指南質(zhì)量評(píng)價(jià)的自動(dòng)化[30]。

對(duì)指南開發(fā)起推動(dòng)作用的是2003年出臺(tái)的臨床指南研究與評(píng)價(jià)工具(AGREE)[31]。該工具將指南評(píng)價(jià)定義為:“充分考慮指南制定的潛在偏倚,強(qiáng)調(diào)推薦建議的內(nèi)/外部真實(shí)性和可行性”。AGREE量表在Cluzeau量表的基礎(chǔ)上進(jìn)行了精簡(jiǎn),其有效性已被證實(shí),目前國際上有其諸多語種的翻譯版本。AGREE已被百余篇文獻(xiàn)引用,得到國際上多個(gè)衛(wèi)生保健機(jī)構(gòu)的認(rèn)可,成為指南質(zhì)量評(píng)價(jià)的“金標(biāo)準(zhǔn)”。

從2003年以后,指南評(píng)價(jià)工具開始注重用戶體驗(yàn)。Shiffman 2003[15-16]要求盡可能根據(jù)指南中的醫(yī)療步驟和決策,給出具體的實(shí)施步驟圖;Hindley 2005[32]要求用易于理解的方式總結(jié)證據(jù),有相關(guān)的知識(shí)作為附錄,以便于操作者理解;Hargrove 2008[33]要求通過用戶調(diào)查尋求反饋意見。

2005年,Vlayen等[3]對(duì)指南評(píng)價(jià)工具進(jìn)行了系統(tǒng)評(píng)價(jià)。該研究納入了24個(gè)評(píng)價(jià)工具,涉及10個(gè)質(zhì)量維度下的50個(gè)條目,得出的結(jié)論是AGREE是唯一通過驗(yàn)證的評(píng)價(jià)工具,AGREE使用數(shù)字計(jì)分標(biāo)度,很容易比較指南之間的分?jǐn)?shù),比Cluzeau評(píng)價(jià)工具更加精簡(jiǎn)(僅包含23個(gè)項(xiàng)目并歸入6組維度)。但同時(shí)指出了AGREE的缺陷:沒有設(shè)置“好”與“壞”的分?jǐn)?shù)閾值來定性判斷指南;沒有評(píng)價(jià)指南的臨床內(nèi)容,也沒有評(píng)價(jià)得出各項(xiàng)推薦建議的證據(jù)質(zhì)量。Vlayen等指出,這些是現(xiàn)有評(píng)價(jià)工具普遍存在的問題。

為了進(jìn)一步提高AGREE的科學(xué)性及可行性,AGREE協(xié)作網(wǎng)的部分成員組建了AGREE Next Steps協(xié)會(huì)對(duì)AGREE工具開展了修訂工作,并于2009年發(fā)布了AGREEⅡ[34]和新版用戶手冊(cè)。與原版AGREE 相比, AGREEⅡ作了以下改進(jìn)[35]:各條目以7分表, 代替原版的4分等級(jí)表;用戶手冊(cè)對(duì)23個(gè)條目進(jìn)行了清晰的說明,明確定義了各條目中的術(shù)語概念;提供了使用該評(píng)分表評(píng)價(jià)的案例,為用戶的評(píng)價(jià)提供了詳細(xì)指導(dǎo);增加了“何處查找相關(guān)信息”部分, 指導(dǎo)評(píng)價(jià)者在臨床指南的哪個(gè)部分能找到相關(guān)信息;增加了“如何評(píng)價(jià)”部分, 描述評(píng)價(jià)標(biāo)準(zhǔn)的細(xì)節(jié)信息和評(píng)價(jià)各條目的理由。2012年,國內(nèi)學(xué)者翻譯和引進(jìn)了修訂版AGREE,并開始大量使用AGREE進(jìn)行評(píng)價(jià)。

GLIA 2011是一個(gè)側(cè)重于評(píng)價(jià)指南應(yīng)用性的工具。耶魯醫(yī)學(xué)信息學(xué)中心的Shiffman等人研究發(fā)現(xiàn),大量資源用于臨床實(shí)踐指南的開發(fā),但是臨床實(shí)踐指南在應(yīng)用中還存在問題,于是開發(fā)了GLIA 2011[36]。GLIA旨在幫助提早發(fā)現(xiàn)影響臨床實(shí)踐指南應(yīng)用的內(nèi)部因素并及時(shí)修改完善,提高指南質(zhì)量。QUADAS 2003是一種專門用于診斷性指南的質(zhì)量評(píng)價(jià)工具[37]。還有一些工具雖然并不是嚴(yán)格意義上的指南質(zhì)量評(píng)價(jià)工具,但是為評(píng)價(jià)和提高指南質(zhì)量提供了很好的借鑒,許多研究人員也將其列為評(píng)價(jià)工具進(jìn)行研究,如GRADE,ADAPTE和Guideline 2.0。

GRADE是由WHO的19個(gè)成員國和國際組織2000年成立的“推薦分級(jí)的評(píng)價(jià)、制定與評(píng)估工作組(Grades of Recommendations Assessment,Development and Evaluation,GRADE)”2004年推出的一個(gè)證據(jù)質(zhì)量分級(jí)和推薦強(qiáng)度系統(tǒng)[38]。它明確界定了證據(jù)質(zhì)量和推薦強(qiáng)度,對(duì)證據(jù)的升降級(jí)有明確標(biāo)準(zhǔn),從多角度闡釋推薦意見的強(qiáng)弱標(biāo)準(zhǔn),為指南開發(fā)特別是推薦意見的質(zhì)量提供保障。Cochrane即利用該系統(tǒng)對(duì)系統(tǒng)評(píng)價(jià)的質(zhì)量進(jìn)行判斷,并使用GRADEpro軟件對(duì)評(píng)價(jià)結(jié)果進(jìn)行總結(jié)[39]。ADAPTE是為臨床實(shí)踐指南的改編提供指導(dǎo)的工具,在指南開發(fā)領(lǐng)域受到高度評(píng)價(jià)[40],幾乎包含了所有可被歸入“信息檢索”和“證據(jù)評(píng)價(jià)”質(zhì)量維度的問題,為指南更新提供指導(dǎo)[41]。Guideline(目前更新至Guidelines 2.0)是Schüenemann等人編制的指南開發(fā)所需物品、資源、步驟等的項(xiàng)目清單,為指南開發(fā)的所有階段提供指導(dǎo),從計(jì)劃和提出推薦建議到實(shí)施、評(píng)價(jià)和更新,并試圖找出現(xiàn)存開發(fā)過程和工具的缺陷,提供克服這些缺陷的機(jī)制[42]。

2 啟示

從上述指南評(píng)價(jià)工具的開發(fā)歷程可見,國外臨床指南評(píng)價(jià)經(jīng)歷了一個(gè)不斷改進(jìn)、完善和優(yōu)化的漫長(zhǎng)過程。起初的指南評(píng)價(jià)因維度不夠全面而無法通過有效性檢驗(yàn)。隨著評(píng)價(jià)維度不斷增加,工具使用的便利性受到關(guān)注。AGREE是首個(gè)兼具維度全面性和使用便利性的評(píng)價(jià)工具,因此得以大范圍推廣。專門工作組或國際協(xié)作組織對(duì)AGREE的發(fā)展發(fā)揮了重要作用。從近期研究成果看,一些評(píng)價(jià)工具有放棄全面性評(píng)價(jià)而嘗試從指南的某個(gè)方面進(jìn)行有針對(duì)性評(píng)價(jià)的趨勢(shì)。對(duì)我們的啟示主要表現(xiàn)在以下幾個(gè)方面。

2.1 臨床指南評(píng)價(jià)應(yīng)該更多地考慮利益沖突、病人意愿和社會(huì)價(jià)值取向

2002年,Guyatt等人的解釋被公認(rèn)為循證醫(yī)學(xué)原理的成熟釋義[43]。循證醫(yī)學(xué)應(yīng)“強(qiáng)調(diào)其自身如何形成一種人性化的醫(yī)學(xué)實(shí)踐方法,充分承認(rèn)醫(yī)生對(duì)社會(huì)的責(zé)任和深刻理解及同情病人的痛苦,并優(yōu)先考慮醫(yī)療決策中病人和社會(huì)的價(jià)值取向和意愿,將醫(yī)療決策中病人和社會(huì)的價(jià)值取向和意愿作為評(píng)價(jià)指南質(zhì)量的一個(gè)影響因素”[44]。幾乎所有的評(píng)價(jià)工具都會(huì)評(píng)估文獻(xiàn)搜索方法、證據(jù)質(zhì)量、證據(jù)合成以及是否體現(xiàn)循證醫(yī)學(xué)原則。臨床指南開發(fā)者的利益、標(biāo)準(zhǔn)和價(jià)值觀念間的沖突,以及病人的參與,都會(huì)影響指南的真實(shí)可信度,但現(xiàn)存的研究缺乏對(duì)這些因素的考慮[22,32-33,45-46]。

2.2 臨床指南評(píng)價(jià)應(yīng)兼顧全面性和實(shí)用性

從表1可以看出,AGREE是在 Cluzeau的基礎(chǔ)上建立的,卻得到廣泛的使用。比較分析兩者可以發(fā)現(xiàn),AGREE使用數(shù)字計(jì)分標(biāo)度,使得比較分?jǐn)?shù)變得更容易;AGREE為評(píng)價(jià)者提供指導(dǎo)手冊(cè),便于使用者的理解和操作; AGREE比Cluzeau評(píng)價(jià)工具更加精簡(jiǎn),僅包含23個(gè)項(xiàng)目并歸入6組維度,但沒有對(duì)維度“指南的發(fā)布”進(jìn)行評(píng)價(jià)??傊?,AGREE易于理解的同時(shí)也易于使用,并經(jīng)過多方驗(yàn)證,被國際人士廣泛接受??梢?,臨床指南評(píng)價(jià)工具并不是條目越多、維度越全面越好,還要兼顧使用上的便利性。因此我們對(duì)指南的評(píng)價(jià)應(yīng)該詳略得當(dāng)、重點(diǎn)突出,并且注重評(píng)價(jià)工具的用戶導(dǎo)向,如通過提供指南評(píng)價(jià)指導(dǎo)手冊(cè)、自動(dòng)化評(píng)價(jià)程序等途徑提升用戶體驗(yàn)。

2.3 指南評(píng)價(jià)工具應(yīng)重視對(duì)臨床內(nèi)容的評(píng)價(jià)

現(xiàn)有的評(píng)價(jià)工具多是從開發(fā)流程、方法學(xué)上的嚴(yán)謹(jǐn)性、語言清晰度等方面對(duì)指南進(jìn)行評(píng)價(jià)?;蛟S開發(fā)者認(rèn)為,只要開發(fā)過程嚴(yán)格遵守規(guī)則就能開發(fā)出高質(zhì)量的指南。事實(shí)上,好的證據(jù)基礎(chǔ)并不一定可以得出高質(zhì)量的推薦意見[47]。因此我們應(yīng)該積極尋找更能代表指南臨床內(nèi)容質(zhì)量和正確性的指標(biāo)進(jìn)行評(píng)價(jià)。

2.4 優(yōu)化指南評(píng)價(jià)工具的評(píng)分系統(tǒng)

各個(gè)評(píng)價(jià)工具都對(duì)指南的相應(yīng)條目和維度進(jìn)行質(zhì)量分級(jí),但并不是所有的條目和質(zhì)量維度對(duì)指南的重要性都是相同的[19]。因此應(yīng)當(dāng)根據(jù)各維度的重要性分配給不同的分?jǐn)?shù)權(quán)重,才能優(yōu)化指南評(píng)價(jià)標(biāo)準(zhǔn)體系。

2.5 根據(jù)需要選擇臨床指南評(píng)價(jià)工具

指南評(píng)價(jià)分化為:全面化的指南評(píng)價(jià)、專門化的指南評(píng)價(jià)和指南開發(fā)指導(dǎo)手冊(cè)三類,用戶可以根據(jù)自己的需要選擇相應(yīng)的評(píng)價(jià)工具。如果評(píng)價(jià)的基本目標(biāo)是了解指南適用性,GLIA工具較為合適,因?yàn)樗u(píng)價(jià)了影響指南適用性的各個(gè)方面;如果評(píng)價(jià)目的是獲取指南臨床內(nèi)容質(zhì)量的信息,則ADAPTE更為適用,但對(duì)使用者的技能要求較高;如果目標(biāo)是對(duì)指南進(jìn)行全面性評(píng)價(jià), AGREE II或德語版DELBI最適用[46,48]。

猜你喜歡
條目指南工具
波比的工具
波比的工具
《詞詮》互見條目述略
準(zhǔn)備工具:步驟:
Can we treat neurodegenerative diseases by preventing an age-related decline in microRNA expression?
“巧用”工具
指南數(shù)讀
論碰撞的混搭指南
對(duì)縣級(jí)二輪修志采用結(jié)構(gòu)體式的思考
不服不行的搜索記錄