羅雙紅
評價受試者結(jié)局?jǐn)?shù)據(jù)缺失(簡稱缺失數(shù)據(jù))相關(guān)的偏倚風(fēng)險在多大程度上降低對證據(jù)體某特定結(jié)果的信心,即缺失數(shù)據(jù)對證據(jù)質(zhì)量的影響,是系統(tǒng)評價中的關(guān)鍵問題之一。Cochrane手冊應(yīng)對這一問題的方案側(cè)重于判斷單個研究缺失數(shù)據(jù)偏倚風(fēng)險的“高”、“低”或“不清楚”,并鼓勵在針對證據(jù)體某特定結(jié)局指標(biāo)統(tǒng)計的Meta分析中基于不同假設(shè)進行敏感性分析。但是這種方案難以評價單個研究缺失數(shù)據(jù)偏倚風(fēng)險對整個證據(jù)體證據(jù)質(zhì)量的影響,就如何在Meta分析中基于不同假設(shè)進行敏感性分析也無具體指導(dǎo),這涉及考慮缺失數(shù)據(jù)多少、干預(yù)組和對照組中的事件發(fā)生率、缺失數(shù)據(jù)的分布以及數(shù)據(jù)缺失的原因等多種現(xiàn)實因素。
為給系統(tǒng)評價中證據(jù)體二分類變量和連續(xù)性變量缺失數(shù)據(jù)相關(guān)的偏倚風(fēng)險判斷提供方法學(xué)指導(dǎo),GRADE 工作組組織有豐富的系統(tǒng)評價工作經(jīng)驗的臨床流行病學(xué)、方法學(xué)和生物統(tǒng)計學(xué)家組成研究小組,進行系統(tǒng)的文獻(xiàn)調(diào)查[1-3],復(fù)習(xí)和評價目前所有的Meta分析時處理缺失數(shù)據(jù)的可能方法,迭代式討論并在已有的系統(tǒng)評價案例中測試評價過的方法,篩選出最合理的處理缺失數(shù)據(jù)的方法[4-6],并通過2次會議對前期研究贊同的方法再次評價和修訂,最終產(chǎn)生判斷證據(jù)體缺失數(shù)據(jù)相關(guān)偏倚風(fēng)險的GRADE方法[7]。為幫助臨床醫(yī)生理解GRADE方法,以便更好地理解臨床實踐循證指南的證據(jù)質(zhì)量,現(xiàn)將其介紹并解讀如下。
2.1 方法的應(yīng)用范圍及相關(guān)定義 該方法用于臨床試驗數(shù)據(jù)的Meta分析,不適用于系統(tǒng)評價人員可獲得的個體水平數(shù)據(jù)的Meta分析;且僅用于處理缺失數(shù)據(jù)相關(guān)偏倚風(fēng)險的判斷,不涉及系統(tǒng)評價中的其他偏倚風(fēng)險判斷。
在GRADE方法中,“缺失數(shù)據(jù)”指系統(tǒng)評價人員不能獲得的受試者結(jié)局?jǐn)?shù)據(jù),包含兩類數(shù)據(jù):①原始研究人員無法獲得的數(shù)據(jù);②原始研究人員可以獲得,但既未發(fā)表也未能提供給系統(tǒng)評價人員的數(shù)據(jù)。處理缺失數(shù)據(jù)首先需確定一組受試者是否有缺失數(shù)據(jù)(例如,撤回同意或違反治療方案的受試者),而困難在于原始研究作者有時不清楚應(yīng)如何報告并在統(tǒng)計分析中處理缺失數(shù)據(jù)(例如,排除缺失數(shù)據(jù)的受試者或?qū)θ笔?shù)據(jù)做出假設(shè))。因此GRADE工作組強調(diào)在進行受試者結(jié)局?jǐn)?shù)據(jù)缺失相關(guān)偏倚風(fēng)險評估前應(yīng)盡一切可能從原始研究作者那里獲得未報告但可能可用的結(jié)局?jǐn)?shù)據(jù),或者至少了解他們是如何處理缺失數(shù)據(jù)的。
GRADE方法中專門指出“缺失數(shù)據(jù)的處理”不同于意向性分析(ITT)。其理由如下:ITT強調(diào)按被隨機分配的組別分析受試者數(shù)據(jù),其就“受試者數(shù)據(jù)分析”的定義存在不同。有人認(rèn)為ITT分析只在沒有失訪的情況下才可能實現(xiàn);有人認(rèn)為ITT分析需要填補缺失數(shù)據(jù);還有人認(rèn)為ITT分析應(yīng)僅限于分析有可用數(shù)據(jù)的受試者,而缺失數(shù)據(jù)應(yīng)作為一個單獨的問題來處理。GRADE工作組是將缺失數(shù)據(jù)作為一個單獨的問題放在敏感性分析中解決。
2.2 方法的基本思想/邏輯
2.2.1 確定主分析 GRADE方法只納入有數(shù)據(jù)的受試者進行Meta分析的主分析;如果對缺失數(shù)據(jù)相關(guān)偏倚的方向和大小很有把握,也可以將直接填補后的結(jié)果作為主分析。
2.2.2 數(shù)據(jù)填補及敏感性分析 對于主分析顯示試驗組干預(yù)措施有益且統(tǒng)計學(xué)上效果顯著的結(jié)果,敏感性分析的目的是檢測“針對某特定的結(jié)局指標(biāo),試驗組干預(yù)措施確實有益且效果顯著”這一推斷的穩(wěn)定性。具體方法是在納入的原始研究中進行一系列逐步嚴(yán)格的缺失數(shù)據(jù)填補,即假設(shè)缺失數(shù)據(jù)受試者的結(jié)果比數(shù)據(jù)可用受試者的結(jié)果更不利于顯示試驗組干預(yù)措施有效,且這種傾向性逐步增高,則逐次對經(jīng)不同傾向性填補后的各項研究進行Meta分析,觀察不同傾向性數(shù)據(jù)填補對Meta分析結(jié)果點估計和區(qū)間估計的影響。
對于主分析顯示試驗組干預(yù)措施有害且統(tǒng)計學(xué)上效果顯著的結(jié)果,可以進行類似的敏感性分析檢測“針對某特定的結(jié)局指標(biāo),試驗組干預(yù)措施確實有害且效果顯著”這一推斷的穩(wěn)定性。即假設(shè)試驗組缺失數(shù)據(jù)受試者不良事件的發(fā)生率比同組數(shù)據(jù)可用受試者更低,和/或?qū)φ战M缺失數(shù)據(jù)受試者不良事件的發(fā)生率比同組數(shù)據(jù)可用受試者更高,且這種傾向性逐步增高,則逐次對經(jīng)不同傾向性填補后的各項研究進行Meta分析,觀察不同傾向性數(shù)據(jù)填補對Meta分析結(jié)果點估計和區(qū)間估計的影響。
依此類推,可以通過假設(shè)試驗組缺失數(shù)據(jù)受試者中不良事件發(fā)生率高于同組數(shù)據(jù)可用受試者,和/或假設(shè)對照組缺失數(shù)據(jù)受試者中不良事件發(fā)生率低于同組數(shù)據(jù)可用受試者的敏感性分析來檢測“干預(yù)措施無害”推斷的穩(wěn)定性;假設(shè)試驗組缺失數(shù)據(jù)受試者中有益事件的發(fā)生率高于數(shù)據(jù)可用受試者,和/或?qū)φ战M缺失數(shù)據(jù)受試者中有益事件的發(fā)生率低于數(shù)據(jù)可用受試者的敏感性分析來檢測“干預(yù)措施無益”推斷的穩(wěn)定性。
2.3 二分類變量結(jié)果缺失數(shù)據(jù)的處理 傳統(tǒng)的缺失數(shù)據(jù)處理采用極端估計值填補與最差情況演示分析的方法,因缺乏合理性,可適用的臨床問題有限。在前述基本思想的基礎(chǔ)上,GRADE工作組采用“按率填補”(imputations using ratios)的方式來填補缺失數(shù)據(jù)并進行敏感性分析,該方式涉及使用RIMPD/FU代表缺失數(shù)據(jù)填補傾向性的大小,其定義如下:
舉例說明如下,并可依此類推。
若以不良事件發(fā)生率(如:艱難梭菌感染)為結(jié)局指標(biāo)的主分析顯示試驗組干預(yù)措施(如:益生菌)有益(如:預(yù)防接受抗生素治療患者艱難梭菌感染),則試驗組缺失數(shù)據(jù)按照RIMPD/FU=1.5、2.0、2.5、3.0、···、5.0依次填補,即試驗組缺失數(shù)據(jù)受試者不良事件發(fā)生率依次按試驗組數(shù)據(jù)可用受試者不良事件發(fā)生率的1.5、2.0、2.5、3.0、···、5.0倍進行填補;和/或?qū)φ战M缺失數(shù)據(jù)按照RIMPD/FU=0.7、0.6、0.5、0.4、···、0.1依次填補,即對照組缺失數(shù)據(jù)受試者不良事件發(fā)生率依次按對照組數(shù)據(jù)可用受試者不良事件發(fā)生率的0.7、0.6、0.5、0.4、···、0.1倍進行填補。逐次對不同RIMPD/FU策略填補缺失數(shù)據(jù)后的研究進行Meta分析,觀察隨試驗組RIMPD/FU不斷遞增和/或?qū)φ战MRIMPD/FU不斷遞減,以不良事件發(fā)生率為結(jié)局指標(biāo)計算的“試驗組干預(yù)措施有益”的效應(yīng)值(如RR值)結(jié)果(包括點估計和區(qū)間估計)是否會被反轉(zhuǎn),并結(jié)合臨床實際討論這種反轉(zhuǎn)的情況是否可能出現(xiàn),以檢測“試驗組干預(yù)措施有益”這一推斷的穩(wěn)定性。若結(jié)果穩(wěn)定,則證據(jù)質(zhì)量不因數(shù)據(jù)缺失的相關(guān)偏倚風(fēng)險而降級,否則應(yīng)降低證據(jù)質(zhì)量等級。
若以有害事件發(fā)生率(如:心肌梗死、腦梗死等并發(fā)癥)為結(jié)局指標(biāo)的主分析顯示試驗組干預(yù)措施(如:某種治療慢性阻塞性肺病的藥物)有害(如:增加慢性阻死性肺病患者心肌梗死、腦梗死等并發(fā)癥風(fēng)險),則試驗組缺失數(shù)據(jù)按照RIMPD/FU=0.7、0.6、0.5、0.4、···、0.1依次填補,即試驗組缺失數(shù)據(jù)受試者有害事件發(fā)生率依次按試驗組數(shù)據(jù)可用受試者有害事件發(fā)生率的0.7、0.6、0.5、0.4、···、0.1倍進行填補;和/或?qū)φ战M缺失數(shù)據(jù)按照RIMPD/FU=1.5、2.0、2.5、3.0、···、5.0依次填補,即對照組缺失數(shù)據(jù)受試者有害事件發(fā)生率依次按對照組數(shù)據(jù)可用受試者有害事件發(fā)生率的1.5、2.0、2.5、3.0、···、5.0倍進行填補。逐次對不同RIMPD/FU策略填補缺失數(shù)據(jù)后的研究進行meta分析,觀察隨試驗組RIMPD/FU不斷遞減和/或?qū)φ战MRIMPD/FU不斷遞增,以有害事件發(fā)生率為結(jié)局指標(biāo)計算的“試驗組干預(yù)措施有害”的效應(yīng)值(如RR值)結(jié)果(包括點估計和區(qū)間估計)是否會被反轉(zhuǎn),并結(jié)合臨床實際討論這種反轉(zhuǎn)的情況是否可能出現(xiàn),以檢測“試驗組干預(yù)措施有害”這一推斷的穩(wěn)定性。若結(jié)果穩(wěn)定則證據(jù)質(zhì)量不因數(shù)據(jù)缺失的相關(guān)偏倚風(fēng)險而降級,否則應(yīng)降低證據(jù)質(zhì)量等級。
特別說明,RIMPD/FU=5.0是GRADE工作組二次研究發(fā)現(xiàn)現(xiàn)有研究同一組別中缺失數(shù)據(jù)受試者相比數(shù)據(jù)可用受試者事件發(fā)生率的最大倍數(shù)[8]。
設(shè)計意圖: 讓學(xué)生參與教具的拼裝,既幫助學(xué)生加深對相關(guān)知識的理解,還鍛煉了學(xué)生的動手能力。同時,模擬抽獎轉(zhuǎn)盤的游戲教學(xué),增強了教學(xué)的趣味性,調(diào)動了學(xué)生的學(xué)習(xí)熱情,打破了傳統(tǒng)課堂教學(xué)中的沉悶氣氛,寓教于樂,有助于活躍課堂氣氛。
2.4 連續(xù)性變量結(jié)果缺失數(shù)據(jù)的處理
2.4.1 所有原始研究均采用相同方法測量同一結(jié)局指標(biāo)的情況
2.4.1.1 只納入數(shù)據(jù)可用受試者進行主分析 當(dāng)合并估計值具有統(tǒng)計顯著性并據(jù)此得出某種推斷時,則進行敏感性分析,以檢測缺失數(shù)據(jù)對該推斷穩(wěn)定性的影響。連續(xù)性變量結(jié)果缺失數(shù)據(jù)處理的難點是需同時估算均值和標(biāo)準(zhǔn)差(SDs)。
2.4.1.2 填補缺失數(shù)據(jù)均值最具合理性的5類數(shù)據(jù)源 A.所有納入試驗的試驗組中的最佳均值;B.所有納入試驗的對照組中的最佳均值;C.本試驗對照組的均值;D.所有納入試驗的試驗組中的最差均值;E.所有納入試驗的對照組中的最差均值。
2.4.1.3 填補缺失數(shù)據(jù)標(biāo)準(zhǔn)差的數(shù)據(jù)源 GRADE工作組測試了許多用于填補缺失數(shù)據(jù)標(biāo)準(zhǔn)差的來源,發(fā)現(xiàn)填補后產(chǎn)生的結(jié)果非常相似,因此GRADE工作組提出所有缺失數(shù)據(jù)的標(biāo)準(zhǔn)差均采用所有納入試驗對照組標(biāo)準(zhǔn)差中的中位數(shù),這樣最為簡單、合理。
2.4.1.4 敏感性分析中缺失數(shù)據(jù)均值的填補策略 針對某特定的結(jié)局指標(biāo),若因試驗組結(jié)果值大于對照組且具有統(tǒng)計學(xué)顯著性,依據(jù)結(jié)局指標(biāo)的定義,可能得出試驗組干預(yù)措施有益、有害、無益或無害的推斷,進行敏感性分析時,在納入的原始研究中進行一系列逐步嚴(yán)格的缺失數(shù)據(jù)填補,圖1顯示,即假設(shè)試驗組缺失數(shù)據(jù)傾向于干預(yù)措施產(chǎn)生的結(jié)果值小,并且這種傾向性逐步增高,和/或?qū)φ战M缺失數(shù)據(jù)傾向于對照措施產(chǎn)生的結(jié)果值大,并且這種傾向性逐步增高,具體數(shù)據(jù)填補策略如下(表1)。策略1使用數(shù)據(jù)C填補試驗組和對照組中的缺失數(shù)據(jù);策略2使用數(shù)據(jù)D填補試驗組中的缺失數(shù)據(jù),使用數(shù)據(jù)B填補對照組中的缺失數(shù)據(jù)。策略3使用數(shù)據(jù)E填補試驗組中的缺失數(shù)據(jù),使用數(shù)據(jù)B填補對照組中的缺失數(shù)據(jù);策略4使用數(shù)據(jù)E填補試驗組數(shù)據(jù)缺失,使用數(shù)據(jù)A填補對照組數(shù)據(jù)缺失。
圖1 連續(xù)性變量結(jié)局指標(biāo)中試驗組結(jié)果值顯著大于對照組缺失數(shù)據(jù)填補策略圖示
表1 連續(xù)性變量結(jié)局指標(biāo)中試驗組結(jié)果值顯著大于對照組缺失數(shù)據(jù)填補策略
圖2和表2顯示,針對某特定的結(jié)局指標(biāo),若因試驗組結(jié)果值小于對照組且效果具有統(tǒng)計學(xué)顯著性,依據(jù)結(jié)局指標(biāo)的定義,可能得出顯示“試驗組干預(yù)措施有益、有害、無益或無害”的推斷時,進行敏感性分析時,在納入的原始研究中進行一系列逐步嚴(yán)格的缺失數(shù)
圖2 連續(xù)性變量結(jié)局指標(biāo)中試驗組結(jié)果值顯著小于對照組缺失數(shù)據(jù)填補策略圖示
表2 連續(xù)性變量結(jié)局指標(biāo)中試驗組結(jié)果值顯著小于對照組的缺失數(shù)據(jù)填補策略
數(shù)據(jù)填補,即假設(shè)試驗組缺失數(shù)據(jù)傾向于干預(yù)措施產(chǎn)生的結(jié)果值大,并且這種傾向性逐步增高;和/或?qū)φ战M缺失數(shù)據(jù)傾向于對照措施產(chǎn)生的結(jié)果值小,并且這種傾向性逐步增高,具體數(shù)據(jù)填補策略如下。策略1使用數(shù)據(jù)C填補試驗組和對照組中的缺失數(shù)據(jù);策略2使用數(shù)據(jù)A填補試驗組中的缺失數(shù)據(jù),使用數(shù)據(jù)E填補對照組中的缺失數(shù)據(jù)。策略3使用數(shù)據(jù)A填補試驗組中的缺失數(shù)據(jù),策略4使用數(shù)據(jù)B填補試驗組數(shù)據(jù)缺失,使用數(shù)據(jù)D填補對照組數(shù)據(jù)缺失。
逐次對經(jīng)不同傾向性填補后的各項研究進行Meta分析,觀察該結(jié)局指標(biāo)的效應(yīng)值結(jié)果(包括點估計和區(qū)間估計)是否會被反轉(zhuǎn),并結(jié)合臨床實際討論這種反轉(zhuǎn)的情況是否可能出現(xiàn),以檢測“試驗組干預(yù)措施有益、有害、無益或無害”等推斷的穩(wěn)定性。若結(jié)果穩(wěn)定,則證據(jù)質(zhì)量不因數(shù)據(jù)缺失的相關(guān)偏倚風(fēng)險而降級,否則應(yīng)降低證據(jù)質(zhì)量等級。
2.4.1.5 具體計算公式:
5nXTi=nFTi+nLTi
6nXCi=nFCi+nLCi
上述公式中,“M”表示均值,“SD”表示標(biāo)準(zhǔn)差,“n”表示組內(nèi)人數(shù),“X”表示合并估計,“F”表示組內(nèi)的數(shù)據(jù)完整受試者,“L”表示組內(nèi)數(shù)據(jù)缺失受試者,“T”表示干預(yù)組,“C”表示對照組,“i”表示納入分析的試驗。
2.4.2 原始研究采用不同方法測量同一結(jié)局指標(biāo)的情況 選擇單一的參考測量工具,將不同工具的效應(yīng)值轉(zhuǎn)換為參考工具的單位,然后如前所述方法進行缺失值的填補和分析。選擇參考測量工具要考慮的兩個關(guān)鍵標(biāo)準(zhǔn):使用頻率高和測量性能好。選擇參考測量工具后,必須將所有結(jié)果轉(zhuǎn)換為該工具的測量單位。
2.5 數(shù)據(jù)缺失偏倚風(fēng)險判斷與證據(jù)質(zhì)量降級的閾值 GRADE工作組強調(diào)證據(jù)質(zhì)量降級的閾值不應(yīng)單憑統(tǒng)計學(xué)顯著性的消失作為判斷標(biāo)準(zhǔn),還應(yīng)結(jié)合臨床情景進行分析,因為閾值的選擇不僅是事實問題(有效/無效),還涉及價值判斷,需考慮具有臨床意義或臨床顯著性的閾值。
對于數(shù)據(jù)缺失率不清楚的情況,如原始研究的作者并未報告有無缺失數(shù)據(jù),GRADE工作組建議使用所有納入系統(tǒng)評價中試驗的中位數(shù)據(jù)缺失率來處理缺失問題。如果有人認(rèn)為這一假設(shè)過于嚴(yán)格,可以在上述基礎(chǔ)上再次進行敏感性分析,即假設(shè)該原始研究試驗組和對照組缺失數(shù)據(jù)率均為零。對于僅報告總?cè)笔?shù)據(jù)而未報告具體每個組別缺失數(shù)據(jù)的試驗,GRADE工作組建議假設(shè)干預(yù)組和對照組的缺失數(shù)據(jù)率相同。對于僅報告一種數(shù)據(jù)填補后分析結(jié)果的試驗,GRADE工作組建議將該結(jié)果用于系統(tǒng)評價的主分析和敏感性分析,并在討論數(shù)據(jù)缺失相關(guān)敏感性分析結(jié)果時,承認(rèn)這種局限性。
證據(jù)體中數(shù)據(jù)缺失相關(guān)偏倚風(fēng)險評估的GRADE方法是一種結(jié)構(gòu)化、透明且相對更具可操作性的方法,該方法重點強調(diào)數(shù)據(jù)填補需兼顧嚴(yán)格性和合理性,以確定數(shù)據(jù)缺失的程度是否足以降低對一個證據(jù)體中某特定結(jié)果的確定性。