周英鳳 朱政 胡雁 邢唯杰 顧鶯 張曉菊 陳瑜
(1.復(fù)旦大學(xué)護(hù)理學(xué)院 復(fù)旦大學(xué)JBI循證護(hù)理合作中心 上海市循證護(hù)理中心,上海 200032;2.復(fù)旦大學(xué)附屬兒科醫(yī)院,上海 201102;3.復(fù)旦大學(xué)附屬腫瘤醫(yī)院,上海 200032)
從1996年David Sackett[1]提出循證醫(yī)學(xué)的概念起,循證實(shí)踐意味著臨床人員將最好的研究證據(jù)與專業(yè)人員的臨床經(jīng)驗(yàn)及患者價(jià)值觀相結(jié)合,進(jìn)行臨床決策,由此可見(jiàn),證據(jù)是循證實(shí)踐的核心。而近50年來(lái),醫(yī)學(xué)、護(hù)理及健康科學(xué)領(lǐng)域的飛速發(fā)展,形成了數(shù)量龐大的知識(shí)與信息,但正如著名未來(lái)學(xué)家John Naisbitt[2]在其著作《大趨勢(shì)》中所言:“與過(guò)去面對(duì)知識(shí)的饑荒相比,時(shí)至今日我們卻淹沒(méi)于信息的海洋。在信息社會(huì),失去控制和沒(méi)有組織的信息不再是一種資源,而是一種嚴(yán)重的威脅”。因此,決策者面對(duì)浩瀚的信息海洋,如何獲取真實(shí)、可靠的證據(jù)指導(dǎo)其臨床決策,成為信息社會(huì)的最大挑戰(zhàn)。循證醫(yī)學(xué)誕生至今,盡管國(guó)內(nèi)外學(xué)者對(duì)證據(jù)尚缺乏統(tǒng)一的定義,但從證據(jù)產(chǎn)生的角度,“內(nèi)在真實(shí)性”是證據(jù)最本質(zhì)的特征,即證據(jù)應(yīng)真實(shí)可信;而從證據(jù)應(yīng)用的角度,“外在真實(shí)性”是證據(jù)的重要特征,即證據(jù)應(yīng)具有一定的適用性[3]。因此,對(duì)決策者、實(shí)踐者甚至患者來(lái)說(shuō),基于證據(jù)進(jìn)行臨床決策時(shí),不僅要關(guān)注證據(jù)的內(nèi)在真實(shí)性,更應(yīng)關(guān)注證據(jù)的外在真實(shí)性,以確保臨床決策的有效性,避免將不恰當(dāng)、無(wú)效甚至錯(cuò)誤的證據(jù)應(yīng)用到實(shí)踐中。
本文旨在闡述證據(jù)的內(nèi)涵及特征,介紹證據(jù)評(píng)價(jià)的原則與方法,在此基礎(chǔ)上,提出關(guān)于如何對(duì)證據(jù)進(jìn)行科學(xué)評(píng)價(jià)以推動(dòng)證據(jù)臨床轉(zhuǎn)化的思考和建議。
縱觀國(guó)內(nèi)外不同的研究者或機(jī)構(gòu)對(duì)證據(jù)的界定,有助于了解證據(jù)的內(nèi)涵和外延,明確人們對(duì)證據(jù)這一概念認(rèn)識(shí)的演進(jìn)。2000年,循證醫(yī)學(xué)奠基人David Sackett等[4]將臨床證據(jù)定義為“以患者為研究對(duì)象的各種臨床研究(包括防治措施、診斷、病因、預(yù)后經(jīng)濟(jì)學(xué)評(píng)價(jià)與研究等)所得到的結(jié)果和結(jié)論”,這一概念明確界定了證據(jù)是由臨床研究得出的結(jié)論。此后,Gordon Guyatt等[5]認(rèn)為,“任何經(jīng)驗(yàn)性的觀察都可以構(gòu)成潛在的證據(jù),不論該證據(jù)是否被系統(tǒng)或不被系統(tǒng)收集”。根據(jù)這一定義,將研究得出的結(jié)論和經(jīng)驗(yàn)都界定為證據(jù)。2005年,加拿大衛(wèi)生服務(wù)研究基金采用系統(tǒng)評(píng)價(jià)的方法將證據(jù)定義為“證據(jù)是最接近事實(shí)本身的一種信息,其形式取決于具體情況,高質(zhì)量及方法恰當(dāng)?shù)难芯拷Y(jié)果是最佳證據(jù)”[5],這一定義明確了證據(jù)具有等級(jí)性這一特點(diǎn)。從循證護(hù)理的角度,澳大利亞JBI循證衛(wèi)生保健中心基于證據(jù)多元主義的哲學(xué)觀,將證據(jù)定義為“證據(jù)是用于判斷某個(gè)觀點(diǎn)是否可信的數(shù)據(jù)或信息”[6],而胡雁、郝玉芳教授[7]主編的《循證護(hù)理學(xué)》第2版中,則將證據(jù)定義為“經(jīng)過(guò)研究及臨床應(yīng)用后,證明可信、有效、能夠有力地促進(jìn)醫(yī)療或護(hù)理結(jié)局向積極方向改變的措施、方法”,與之前對(duì)證據(jù)定義最大的不同之處在于,這一概念是站在實(shí)踐者而非研究者的角度去界定證據(jù)的內(nèi)涵,更強(qiáng)調(diào)證據(jù)內(nèi)在真實(shí)性與外在真實(shí)性相統(tǒng)一。
證據(jù)作為循證實(shí)踐三要素的核心,具有4個(gè)特征[7]:(1)多元性:盡管隨機(jī)對(duì)照試驗(yàn)被認(rèn)為是評(píng)價(jià)療效的金標(biāo)準(zhǔn),但衛(wèi)生保健領(lǐng)域問(wèn)題的多樣性決定了不同的研究問(wèn)題需要由不同的研究方法來(lái)解決。因此,多元主義的證據(jù)觀已經(jīng)被普遍接受,不但研究(包括量性研究和質(zhì)性研究)可以作為證據(jù)的來(lái)源,習(xí)慣與傳統(tǒng)、經(jīng)驗(yàn)、專業(yè)判斷、推理等都可以作為證據(jù)的來(lái)源。(2)等級(jí)性:雖然證據(jù)的來(lái)源多元化,但不同的證據(jù)提供的論證強(qiáng)度并不同,這就意味著證據(jù)具有等級(jí)性。證據(jù)的等級(jí)性是循證醫(yī)學(xué)中證據(jù)最鮮明的特征,證據(jù)的等級(jí)系統(tǒng)包括證據(jù)的質(zhì)量等級(jí)和推薦級(jí)別。最早對(duì)證據(jù)進(jìn)行等級(jí)劃分的是加拿大衛(wèi)生部成立的定期體檢工作組[8],在1979年首次基于試驗(yàn)設(shè)計(jì),將證據(jù)分為三級(jí),設(shè)計(jì)良好的RCT級(jí)別最高,專家意見(jiàn)級(jí)別最低,由此開(kāi)啟了對(duì)證據(jù)進(jìn)行分級(jí)的時(shí)代。目前被廣泛接受和使用的證據(jù)分級(jí)系統(tǒng)主要有牛津大學(xué)循證醫(yī)學(xué)中心、GRADE工作組及澳大利亞JBI循證衛(wèi)生保健中心提出的證據(jù)分級(jí)系統(tǒng)。(3)情景相關(guān)性:基于特定時(shí)間、特定人群、特定條件生產(chǎn)出來(lái)的證據(jù),并不一定適用于所有的情景,這意味著證據(jù)具有情景相關(guān)性,這與該情景的資源分布、實(shí)踐條件、政策、文化、習(xí)俗、信仰等因素有關(guān)。既往的研究也指出,即使是基于相同的證據(jù),也可能會(huì)導(dǎo)致不同情境下指南推薦意見(jiàn)的差異[9]。(4)動(dòng)態(tài)變化性:衛(wèi)生保健及健康科學(xué)領(lǐng)域的發(fā)展日新月異,推動(dòng)著研究不斷發(fā)展和人們的認(rèn)知不斷更新,因此證據(jù)不是一成不變的,而是具有動(dòng)態(tài)變化性。既往的研究指出,臨床實(shí)踐指南在發(fā)布后,平均3.6年便過(guò)時(shí)[10]。
證據(jù)評(píng)價(jià)包括對(duì)其內(nèi)在真實(shí)性和外在真實(shí)性兩方面的評(píng)價(jià),內(nèi)在真實(shí)性是指證據(jù)本身應(yīng)真實(shí)可信,而外在真實(shí)性是指證據(jù)應(yīng)具有一定的外推性及適用性。因此,證據(jù)的內(nèi)在真實(shí)性是外在真實(shí)性的前提,若一項(xiàng)證據(jù)缺乏內(nèi)在真實(shí)性,則沒(méi)有必要再去評(píng)價(jià)其外在真實(shí)性。不同的研究者從不同的角度對(duì)證據(jù)的內(nèi)在和外在真實(shí)性進(jìn)行評(píng)價(jià),目前最常用的評(píng)價(jià)依據(jù)包括FAME策略和VIP策略。
3.1FAME策略 澳大利亞JBI循證衛(wèi)生保健中心Alan Pearson等[11]從證據(jù)內(nèi)在真實(shí)性和臨床適用性角度出發(fā),提出了證據(jù)的四大屬性,即FAME策略,從4個(gè)方面對(duì)證據(jù)的內(nèi)在真實(shí)性(即有效性)和外在真實(shí)性(即可行性、適宜性和臨床意義)進(jìn)行了評(píng)價(jià):(1)Feasibility(證據(jù)的可行性):主要指證據(jù)在多大程度上可應(yīng)用于實(shí)踐,包括證據(jù)應(yīng)用所需的資源是否具有可及性,是否有足夠的經(jīng)驗(yàn)和能力開(kāi)展該實(shí)踐,開(kāi)展該項(xiàng)實(shí)踐的成本效果如何等。(2)Appropriateness(證據(jù)的適宜性):主要指證據(jù)應(yīng)用與特定情境是否適合或匹配的程度,包括該實(shí)踐方式在文化、政策、倫理、組織上是否可接受,該實(shí)踐方式可否在大多數(shù)人群中轉(zhuǎn)化或運(yùn)用等。(3)Meaningfulness(證據(jù)的臨床意義):主要指證據(jù)應(yīng)用給患者帶來(lái)的積極體驗(yàn)的程度,包括證據(jù)應(yīng)用是否給患者帶來(lái)積極或不良的體驗(yàn),是否符合患者的價(jià)值觀、意愿或信念。(4)Effectiveness(證據(jù)的有效性):關(guān)注證據(jù)的內(nèi)在真實(shí)性,主要指證據(jù)應(yīng)用在多大程度上能達(dá)到預(yù)期效果,包括該項(xiàng)實(shí)踐活動(dòng)是否獲益,是否具有安全性,是否改善患者健康結(jié)局等。
3.2VIP策略 循證醫(yī)學(xué)則提出了證據(jù)評(píng)價(jià)的VIP策略[3],從3個(gè)方面評(píng)價(jià)證據(jù)的內(nèi)在和外在真實(shí)性:(1)Validity(證據(jù)的真實(shí)性):主要指證據(jù)是否真實(shí)、可靠,評(píng)價(jià)研究實(shí)施過(guò)程中各種偏倚風(fēng)險(xiǎn)對(duì)證據(jù)內(nèi)在真實(shí)性的影響程度,包括選擇偏倚、實(shí)施偏倚、失訪偏倚及測(cè)量偏倚等。(2)Importance(證據(jù)的重要性):主要指證據(jù)是否具有臨床應(yīng)用價(jià)值,評(píng)價(jià)結(jié)局指標(biāo)的統(tǒng)計(jì)效應(yīng)量,然后結(jié)合專業(yè)判斷,評(píng)價(jià)結(jié)局指標(biāo)是否具有臨床意義。(3)Practice(證據(jù)的適用性):主要指證據(jù)的外部真實(shí)性,證據(jù)是否適合具體的臨床情景,證據(jù)產(chǎn)生的情景與證據(jù)所要應(yīng)用的情景是否一致,研究對(duì)象是否具有相似的特征,證據(jù)應(yīng)用是否符合患者的意愿及價(jià)值觀,證據(jù)應(yīng)用可能的獲益與風(fēng)險(xiǎn),證據(jù)應(yīng)用所需的技術(shù)與資源是否具備等。
證據(jù)內(nèi)在真實(shí)性評(píng)價(jià)主要是針對(duì)研究的方法學(xué)質(zhì)量進(jìn)行評(píng)價(jià),其評(píng)價(jià)方法在各大循證醫(yī)學(xué)及循證護(hù)理教科書(shū)中已經(jīng)有非常系統(tǒng)、規(guī)范的描述,并且針對(duì)不同研究設(shè)計(jì)的原始研究和2次研究,均提供了清晰的評(píng)價(jià)清單(具體見(jiàn)本系列文章的第5篇)。
本文將重點(diǎn)介紹證據(jù)外在真實(shí)性的評(píng)價(jià)方法,將證據(jù)應(yīng)用到研究人群以外的情景時(shí),需要依據(jù)專業(yè)判斷評(píng)價(jià)證據(jù)的臨床適用性。
5.1定量評(píng)價(jià)法 定量評(píng)價(jià)方法是通過(guò)數(shù)學(xué)計(jì)算得出評(píng)價(jià)結(jié)論的方法,是指按照數(shù)量分析方法,通過(guò)數(shù)學(xué)運(yùn)算及統(tǒng)計(jì)分析,從客觀量化角度對(duì)研究現(xiàn)象進(jìn)行評(píng)價(jià)與篩選[12]。定量分析方法具有科學(xué)性、客觀性及嚴(yán)密性等特點(diǎn),為人們提供了系統(tǒng)、客觀的數(shù)量分析方法,使結(jié)果更加直觀、具體。在對(duì)證據(jù)外在真實(shí)性進(jìn)行評(píng)價(jià)時(shí),可遴選相關(guān)領(lǐng)域的經(jīng)驗(yàn)豐富的專家,通過(guò)專家會(huì)議法、Delphi專家咨詢法或橫斷面調(diào)查,以證據(jù)的FAME屬性為判斷依據(jù),從證據(jù)應(yīng)用的可行性、適宜性、臨床意義及有效性4個(gè)方面,以打分的形式對(duì)證據(jù)的臨床適用性做出評(píng)價(jià)。然后通過(guò)統(tǒng)計(jì)分析,評(píng)價(jià)專家對(duì)證據(jù)的臨床適用性判斷意見(jiàn)的集中程度和離散程度,作為是否在實(shí)踐中應(yīng)用此證據(jù)的依據(jù)。采用定量評(píng)價(jià)法進(jìn)行證據(jù)評(píng)價(jià),雖然評(píng)價(jià)結(jié)果比較量化、直觀,但無(wú)法對(duì)評(píng)價(jià)結(jié)果進(jìn)行深層次剖析,無(wú)法了解某些證據(jù)臨床適用性差的具體原因,且該方法受專家個(gè)人的學(xué)術(shù)背景及專業(yè)判斷的影響較大,因此,該方法具有一定的局限性。
5.2定性評(píng)價(jià)法 定性評(píng)價(jià)方法是是運(yùn)用分析和綜合、比較與分類、歸納和演繹等邏輯分析的方法,利用專家的知識(shí)、經(jīng)驗(yàn)和判斷對(duì)評(píng)價(jià)對(duì)象做出定性結(jié)論的價(jià)值判斷[12]。定性評(píng)價(jià)方法具有描述性、歸納性及靈活性等特點(diǎn),為人們提供了關(guān)注內(nèi)容實(shí)質(zhì)與本質(zhì)的分析方法,使結(jié)果更深入、更系統(tǒng)。在對(duì)證據(jù)臨床適用性進(jìn)行評(píng)價(jià)時(shí),也可遴選相關(guān)領(lǐng)域的經(jīng)驗(yàn)豐富的專家,通過(guò)專家會(huì)議法、焦點(diǎn)小組訪談法或利益相關(guān)者個(gè)人訪談,以證據(jù)的FAME屬性為訪談或討論提綱,從證據(jù)應(yīng)用的可行性、適宜性、臨床意義及有效性四個(gè)方面,以訪談或討論的方式對(duì)證據(jù)的臨床適用性進(jìn)行深入探討。系統(tǒng)收集專家的意見(jiàn)、觀點(diǎn)及建議,進(jìn)行系統(tǒng)的歸納,深入分析某些證據(jù)臨床適用性差的障礙因素,并探討這些障礙因素如何解決。采用定性評(píng)價(jià)法進(jìn)行證據(jù)評(píng)價(jià),雖然評(píng)價(jià)結(jié)果比較深入,但評(píng)價(jià)結(jié)果不夠精確,有時(shí)甚至難以得出一致的結(jié)論,且該方法受專家個(gè)人價(jià)值觀和背景影響很大,因此,該方法也具有一定的局限性。
5.3定量與定性混合評(píng)價(jià)法 定量評(píng)價(jià)強(qiáng)調(diào)用數(shù)學(xué)工具來(lái)進(jìn)行評(píng)價(jià)和分析,而定性評(píng)價(jià)傾向于用語(yǔ)言描述的方法進(jìn)行解釋與說(shuō)明,基于兩種評(píng)價(jià)方法各有優(yōu)勢(shì)和缺陷,因此,采用兩種評(píng)價(jià)方法相結(jié)合的方式,定性評(píng)價(jià)方法使得定量評(píng)價(jià)所得到的數(shù)字獲得有意義的解釋,更具有目的性,而定量評(píng)價(jià)方法又使得對(duì)客體的認(rèn)識(shí)更具有準(zhǔn)確性,增加了說(shuō)服力[12]。因此,在對(duì)證據(jù)外在真實(shí)性進(jìn)行評(píng)價(jià)時(shí),可以先通過(guò)定量評(píng)價(jià)的方法,請(qǐng)專家對(duì)證據(jù)的臨床實(shí)用性依據(jù)FAME屬性進(jìn)行打分,在統(tǒng)計(jì)分析的基礎(chǔ)上,針對(duì)得分較低及得分變異較大的條目,再通過(guò)定性評(píng)價(jià)的方法,深入探討和分析該證據(jù)臨床適用性差的障礙因素。亦可以先通過(guò)定性評(píng)價(jià)方法,對(duì)證據(jù)的臨床適用性從FAME 4個(gè)方面進(jìn)行分析和討論,根據(jù)討論結(jié)果對(duì)證據(jù)進(jìn)行遴選,然后再通過(guò)定量評(píng)價(jià)方法,得出一致的結(jié)論。定量和定性相結(jié)合的評(píng)價(jià)方法,能確保評(píng)價(jià)結(jié)果更準(zhǔn)確、更客觀、更科學(xué)。
6.1證據(jù)評(píng)價(jià)是將證據(jù)應(yīng)用于實(shí)踐前的必要環(huán)節(jié) 證據(jù)是循證實(shí)踐應(yīng)遵循的核心要素,但并非所有的研究結(jié)論都可成為證據(jù)。循證實(shí)踐強(qiáng)調(diào)科學(xué)的臨床決策應(yīng)當(dāng)依賴于當(dāng)前可獲得的最佳外部證據(jù),而最佳證據(jù)指來(lái)自設(shè)計(jì)嚴(yán)謹(jǐn)且具有臨床意義的研究的結(jié)論,只有真實(shí)可信的最佳證據(jù)才能作為決策的依據(jù)[7]。而研究結(jié)論的真實(shí)性取決于研究過(guò)程中對(duì)各種偏倚風(fēng)險(xiǎn)的控制程度,即研究的方法學(xué)質(zhì)量,偏倚風(fēng)險(xiǎn)越小,研究質(zhì)量就越高,研究結(jié)果的可信度就越高。但研究具有內(nèi)在真實(shí)性,并不意味著具有很好的臨床適用性,因?yàn)樽C據(jù)的情景相關(guān)性的特點(diǎn),在一定情境下真實(shí)可信的證據(jù),應(yīng)用到其他情景未必有效。因此,將證據(jù)應(yīng)用于臨床實(shí)踐之前,采用嚴(yán)謹(jǐn)方法對(duì)證據(jù)的內(nèi)在真實(shí)性和外在真實(shí)性進(jìn)行科學(xué)的評(píng)價(jià),是確保做出最佳臨床決策的重要保障。
6.2證據(jù)評(píng)價(jià)是依據(jù)臨床經(jīng)驗(yàn)和專業(yè)判斷的過(guò)程 除來(lái)自研究的最佳外部證據(jù)外,循證實(shí)踐決策的核心要素還包括來(lái)自專業(yè)人員經(jīng)驗(yàn)與判斷的內(nèi)部證據(jù)。當(dāng)對(duì)研究的真實(shí)性、重要性和臨床適用性進(jìn)行評(píng)價(jià)時(shí),都離不開(kāi)專業(yè)判斷。首先,在對(duì)研究結(jié)論的真實(shí)性進(jìn)行評(píng)價(jià)時(shí),并不僅僅依據(jù)是否采取了控制偏倚風(fēng)險(xiǎn)的措施,更重要的是結(jié)合專業(yè)背景和臨床實(shí)際情況,判斷所采取的措施是否恰當(dāng),有無(wú)違背客觀規(guī)律及倫理原則。其次,在對(duì)研究結(jié)論的外部真實(shí)性進(jìn)行評(píng)價(jià)時(shí),更需要依據(jù)專業(yè)知識(shí)和經(jīng)驗(yàn)評(píng)價(jià)證據(jù)對(duì)特定人群的可行性、適宜性、臨床意義及有效性,將證據(jù)與實(shí)際問(wèn)題相結(jié)合,做出合理的決策。因此,對(duì)證據(jù)進(jìn)行評(píng)價(jià)時(shí),僅依據(jù)統(tǒng)計(jì)學(xué)或臨床流行病學(xué)的方法學(xué)知識(shí)進(jìn)行評(píng)價(jià)是不夠的,不管是對(duì)證據(jù)進(jìn)行內(nèi)在真實(shí)性進(jìn)行評(píng)價(jià),還是對(duì)外在真實(shí)性進(jìn)行評(píng)價(jià),都應(yīng)當(dāng)結(jié)合專業(yè)人員的臨床經(jīng)驗(yàn)和知識(shí),做出科學(xué)的專業(yè)判斷。
6.3證據(jù)評(píng)價(jià)有助于證據(jù)的遴選及明確證據(jù)應(yīng)用可能的障礙因素 由于受到多種因素的影響,包括證據(jù)本身的真實(shí)性及有效性,特定情景的資源、技術(shù)、政策、文化以及患者的價(jià)值觀和意愿等,來(lái)自研究的證據(jù)并非都能應(yīng)用到臨床實(shí)踐中。因此,通過(guò)對(duì)證據(jù)的科學(xué)評(píng)價(jià),明確證據(jù)的臨床適用性、復(fù)雜性、可行性及有效性,遴選出復(fù)雜性低、與現(xiàn)行臨床標(biāo)準(zhǔn)具有較好的一致性(例如不需要對(duì)現(xiàn)行實(shí)踐流程進(jìn)行大規(guī)模調(diào)整)、患者接受度好、及應(yīng)用后患者結(jié)局很可能被改善,且結(jié)局指標(biāo)容易被測(cè)量的證據(jù),優(yōu)先進(jìn)行轉(zhuǎn)化和推廣實(shí)施。此外,證據(jù)評(píng)價(jià)也有助于明確開(kāi)展臨床轉(zhuǎn)化可能存在的障礙因素,比如系統(tǒng)層面資源的缺乏、實(shí)踐者層面技能的不足、患者層面支持性工具的缺乏等,為后續(xù)轉(zhuǎn)化策略的構(gòu)建提供參考和依據(jù)。