何倩,孫艷玲,陶?qǐng)A,吳君怡,桂裕亮,張超,牛玉明,4
? 循證理論與實(shí)踐 ?
應(yīng)用R軟件Metatron程序包實(shí)現(xiàn)診斷準(zhǔn)確性試驗(yàn)Meta分析及程序包匯總比較
何倩1,孫艷玲2,陶?qǐng)A3,吳君怡1,桂裕亮1,張超1,牛玉明1,4
診斷準(zhǔn)確性試驗(yàn)(diagnostic test accuracy,DTA)的靈敏度與特異度之間存在固有的負(fù)相關(guān)性,為避免二者間負(fù)相關(guān)性對(duì)診斷試驗(yàn)結(jié)果的評(píng)價(jià)產(chǎn)生影響,很多學(xué)者提出了雙變量模型,因其保留了原始數(shù)據(jù)的二維結(jié)構(gòu)特性,雙變量模型通過(guò)參數(shù)擬合可以得到靈敏度和特異度的綜合估計(jì)量值及二者之間負(fù)相關(guān)的值,從而對(duì)診斷試驗(yàn)的準(zhǔn)確性進(jìn)行綜合性分析。當(dāng)前最具代表的是由Reitsma等提出的線性混合雙變量模型,Metatron程序包正是基于此模型所研發(fā)的用于DTA Meta分析的程序包,同時(shí)本文將對(duì)R軟件中專用于DTA Meta分析的程序包做出比較,便于使用者選擇。
DTA Meta分析;Metatron程序包;R軟件;雙變量模型
診斷準(zhǔn)確性試驗(yàn)(diagnostic test accuracy,DTA)[1]是以分類變量為結(jié)局指標(biāo)的一類研究,因其靈敏度與特異度之間所固有的負(fù)相關(guān)性,且所選取的參考標(biāo)準(zhǔn)不同,使得DTA Meta分析與其他研究的Meta分析相比有一定的特殊性。隨著DTA Meta分析的方法學(xué)不斷進(jìn)步,診斷準(zhǔn)確性試驗(yàn)的Meta分析模型得到優(yōu)化,對(duì)靈敏度和特異度之間負(fù)相關(guān)性的分析與處理也更為準(zhǔn)確和靈活,如雙變量模型。R語(yǔ)言作為強(qiáng)大的統(tǒng)計(jì)分析軟件,也在不斷的更新其程序包來(lái)融入更多更新的方法學(xué)。如meta4diag程序包、bamdit程序包、metamisc程序包、CopulaREMADA程序包以及Metatron程序包。本文將以Walusimbi等[2]發(fā)表的文章中的GeneXpert組的數(shù)據(jù)為例,來(lái)演示R軟件Metatron程序包實(shí)例操作,并對(duì)R軟件中專用于診斷試驗(yàn)Meta分析的程序包做出相關(guān)總結(jié),比較不同雙變量模型的差異,以便操作者選取合適的程序包使用。
1.1程序包的簡(jiǎn)介及安裝加載 Metatron程序包的最新更新時(shí)間為:2015-02-19,最新版本:V-0.0.1。該程序包通過(guò)功能函數(shù)擬合由Reitsma等提出的雙變量模型[3],從而對(duì)該診斷試驗(yàn)的精度進(jìn)行系統(tǒng)性評(píng)價(jià)。另外,該程序包還可以建立多項(xiàng)式樹模型[4]對(duì)診斷準(zhǔn)確性試驗(yàn)的原始研究進(jìn)行統(tǒng)計(jì)分析,當(dāng)所選取的參考診斷閾值不是金標(biāo)準(zhǔn)時(shí),程序包內(nèi)部能夠檢測(cè)出誤差并進(jìn)行矯正。Metatron程序包的安裝及加載命令如下:install.packages('Metatron')library(Metatron)
該程序包的運(yùn)算過(guò)程需調(diào)用lme4程序包,Matrix程序包,mpt程序包的相關(guān)功能,在執(zhí)行上述加載命令后,R語(yǔ)言會(huì)同時(shí)加載這三個(gè)程序包而無(wú)需另外輸入命令語(yǔ)句。
1.2數(shù)據(jù)的導(dǎo)入 首先,在數(shù)據(jù)加載之前,需要對(duì)數(shù)據(jù)進(jìn)行格式排列,具體數(shù)據(jù)排列格式詳見表1,應(yīng)注意此處Mark可作為協(xié)變量加入模型,因此Mark應(yīng)為字符型而不能為數(shù)值型。數(shù)據(jù)排列完成后,儲(chǔ)存在桌面的Rwork文件中的data.txt文本中。隨后,開始進(jìn)行數(shù)據(jù)的導(dǎo)入,具體命令如下:
data《-read.table("C:/Users/Administrator/ Desktop/Rwork/data.txt",header=TRUE,sep="",na. strings="NA", dec=".", strip.white=TRUE)
表1 示例數(shù)據(jù)排列表
1.3數(shù)據(jù)分析 程序包中的fit.bivar函數(shù)可以擬合Reitsma的雙變量模型,SROC方法是對(duì)診斷試驗(yàn)的靈敏度和特異度進(jìn)行評(píng)價(jià)的經(jīng)典的Meta分析方法,這種方法將診斷OR值作為效應(yīng)量,消除了研究間不同閾值影響,但也不可避免的丟失了有關(guān)試驗(yàn)性能的臨床信息。而由Reitsma等提出的雙變量模型保留了二維的原始數(shù)據(jù),對(duì)敏感度和特異度共同分析,并使用隨機(jī)效應(yīng)方法合并其相關(guān)性。在雙變量模型中添加解釋變量,使靈敏度和特異度所受到的干擾能夠被獨(dú)立分析,避免了因忽略其間負(fù)相關(guān)性而造成對(duì)診斷試驗(yàn)準(zhǔn)確性的低估。
其基本方法學(xué)過(guò)程是,首先直接建立模型的二項(xiàng)誤差和正態(tài)分布隨機(jī)效應(yīng)結(jié)構(gòu)[3],函數(shù)內(nèi)部可調(diào)用lme4程序包中的glmer函數(shù),指定這個(gè)模型為一般的線性混合模型。
fit《-fit.bivar(TP=TP,F(xiàn)N=FN,TN=TN,F(xiàn)P=FP,stud y=Study,data=data )
summary(fit)
建立的模型對(duì)象為fit,并通過(guò)summary( ) 函數(shù)獲取匯總結(jié)果(表2)。接著將一個(gè)單一的協(xié)變量加入模型中,用戶可通過(guò)參數(shù)covarying來(lái)定義這個(gè)協(xié)變量對(duì)靈敏度和特異度是同時(shí)影響還是獨(dú)立影響??蛇x值為"both", "only sensitivity", "only specificity",其中"both"為默認(rèn)值。
fitMark《-fit.bivar(TP=TP,F(xiàn)N=FN,TN=T N,F(xiàn)P=FP,study=Study,data=data,mods=Mark covarying="both")
summary(fitMark)
此處mods=Mark表示將Mark作為單一協(xié)變量加入模型,執(zhí)行上述命令可得到匯總結(jié)果(表3)。
Meta的程序包功能匯總與比較 當(dāng)前通過(guò)建立雙變量模型進(jìn)行DTA Meta的常用程序包有meta4diag程序包[5]、bamdit程序包[6]、metamisc程序包[7]、CopulaREMADA程序包[7]以及Metatron程序包(表4)。
表2 命令summary(fit)執(zhí)行后的結(jié)果
表3 命令summary(fitMark)執(zhí)行后的結(jié)果
在方法學(xué)上,其中前兩者為基于貝葉斯方法的雙變量模型,后三者則為基于經(jīng)典頻率學(xué)派的統(tǒng)計(jì)學(xué)方法。貝葉斯方法的參數(shù)估計(jì)較經(jīng)典頻率學(xué)派更為準(zhǔn)確,但因貝葉斯理論的復(fù)雜性及計(jì)算的難度較大,使其運(yùn)用較為局限[8]。
在圖形上,meta4diag程序包的圖形繪制功能較為突出,包括SROC曲線圖,十字交叉圖,森林圖及后驗(yàn)密度分布圖,尤其是SROC曲線圖的繪制十分靈活,包括五種SROC曲線計(jì)算方法,豐富的線條類型及顏色使圖形更加美觀,且攜帶信息更加直觀。而森林圖顯示的是單個(gè)指標(biāo)的合并,在DTA Meta分析中沒有太大意義。bamdit程序包所繪制的圖形設(shè)置了網(wǎng)格坐標(biāo)底,更凸顯了其側(cè)重于SROC曲線下面積計(jì)算的特點(diǎn)。metamis程序包所繪制的曲線圖對(duì)于顯示結(jié)局指標(biāo)的置信區(qū)間較為直觀。CopulaREMADA程序包所繪制的曲線圖是以靈敏度和特異度為橫縱坐標(biāo),顯示了兩者之間的負(fù)相關(guān)性。
在使用操作上,五個(gè)程序包的內(nèi)部功能都十分強(qiáng)大,命令代碼較為簡(jiǎn)單,只需將數(shù)據(jù)導(dǎo)入,再根據(jù)參數(shù)擬合模型,程序包內(nèi)部即可完成復(fù)雜的迭代運(yùn)算過(guò)程。其中bamdit程序包的參數(shù)設(shè)置較為靈活,可設(shè)置相應(yīng)的鏈數(shù)目、迭代次數(shù)、退火次數(shù)及步長(zhǎng),這要求操作者對(duì)貝葉斯統(tǒng)計(jì)方法有一定的了解。CopulaREMADA程序包使用高斯求積的方法計(jì)算MEI,需先產(chǎn)生一個(gè)概率矩陣,然后將樣本數(shù)據(jù)導(dǎo)入概率矩陣中,這就要求操作者對(duì)概率分布有相關(guān)的了解,從而選擇合適的概率分布類型。
雙變量模型的提出為DTA Meta分析提供了堅(jiān)實(shí)的方法學(xué)理論基礎(chǔ),在此基礎(chǔ)上,R語(yǔ)言運(yùn)用其靈活的編程及程序包開發(fā)和更新功能,跟進(jìn)不斷完善的統(tǒng)計(jì)學(xué)方法學(xué),產(chǎn)生了一些功能強(qiáng)大的程序包。meta4diag程序包所建立的雙變量分層模型主要考慮了各個(gè)層次間變異,而非僅僅是界定為不同分界值上的變異。bamdit程序包中貝葉斯計(jì)算的參數(shù)設(shè)置十分靈活,可產(chǎn)生較多的結(jié)局指標(biāo)以供選擇。metamis程序包由于考慮了研究間相關(guān)性并給出了置信區(qū)間,其結(jié)果更為準(zhǔn)確。CopulaREMADA程序包運(yùn)用了高斯求積的方法,由于進(jìn)行多次反復(fù)的迭代運(yùn)算,其結(jié)果更為精確。而本文所講解的Metatron程序包更側(cè)重于對(duì)靈敏度和特異度之間負(fù)相關(guān)性的分析。使用者可根據(jù)程序包不同的功能及DTA數(shù)據(jù)的特點(diǎn),選擇所需要的程序包執(zhí)行DTA Meta分析。
表4 各程序包功能對(duì)照表
[1] Kim KW,Lee J,Choi SH,et al. Systematic Review and Meta-Analysis of Studies Evaluating Diagnostic Test Accuracy: A Practical Review for Clinical Researchers-Part I. General Guidance and Tips[J]. Korean J Radiol,2015,16(6):1175-87.
[2] Walusimbi S,Bwanga F,de Costa A,et al. Meta-analysis to compare the accuracy of Gene Xpert, MODS and the WHO 2007 algorithm for diagnosis smear-negative pulmonary tuberculosis[J]. BMC Infect Dis,2013,13:507.
[3] Reitsma JB,Glas AS,Rutjes AW,et al. Bivariate analysis of sensitivity and specificity produces informative summary measures in diagnostic reviews[J]. J Clin Epidemiol,2005,58(10):982-90.
[4] Botella J,Huang H,Suero M. Multinomial tree models for assessing the status of the reference in studies of the accuracy of tools for binary classification[J]. Front Psychol,2013,4:694.
[5] 何倩,王曉娜,喻亞宇,等. 應(yīng)用R軟件meta4diag程序包實(shí)現(xiàn)診斷準(zhǔn)確性試驗(yàn)的Meta分析[J]. 中國(guó)循證心血管醫(yī)學(xué)雜志,2016,8(2):138-41.
[6] 王權(quán),何倩,吳君怡,等. 應(yīng)用R軟件bamdit程序包實(shí)現(xiàn)診斷準(zhǔn)確性試驗(yàn)的Meta分析[J]. 中國(guó)循證心血管醫(yī)學(xué)雜志,2016,8(3):260-2.
[7] 王權(quán),楊廉潔,何倩,等. 應(yīng)用R軟件metamisc程序包及CopulaREMADA程序包實(shí)現(xiàn)診斷準(zhǔn)確性試驗(yàn)的Meta分[J]. 中國(guó)循證心血管醫(yī)學(xué)雜志,2016, In Press.
[8] Menten J,Lesaffre E. A general framework for comparative Bayesian meta-analysis of diagnostic studies[J]. BMC Med Res Methodol,2015,15:70.
[9] Leeflang MM. Systematic reviews and meta-analyses of diagnostic test accuracy[J]. Clin Microbiol Infect,2014,20(2):105-13.
[10] Verde PE. Meta-analysis of diagnostic test data: a bivariate Bayesian modeling approach[J]. Stat Med,2010,29(30):3088-102.
[11] Riley RD,Thompson JR,Abrams KR. An alternative model for bivariate random-effects meta-analysis when the within-study correlations are unknown[J]. Biostatistics,2008,9(1):172-86.
[12] Nikoloulopoulos AK. A mixed effect model for bivariate meta-analysis of diagnostic test accuracy studies using a copula representation of the random effects distribution[J]. Stat Med,2015,34(29):3842-65.
本文編輯:姚雪莉
A Meta-analysis on implementation of diagnostic test accuracy with Metatron package in R software and comparison of pooled packages
HE Qian*, SUN Yan-ling, TAO Yuan, WU Jun-yi, GUI Yu-liang, ZHANG Chao, NIU Yu-ming.*Center for Evidence-Based Medicine and Clinical Research, Taihe Hospital, Hubei University of Medicine, Shiyan 442000, China.
NIU Yu-ming, E-mail: niuyuming@yeah.net
There is a connatural negative correlation between sensitivity and specificity of diagnostic test accuracy (DTA). For avoiding the influence of this negative correlation on DTA review results, many scholars propose bivariate model. The bivariate model keeps the two-dimensional nature of original data, so it can produce summary estimated value of the sensitivity and specificity and negative correlation value through parameter fitting for analyzing the accuracy of DTA. At present, the most representative bivariate model is linear mixed bivariate model proposed by Reitsma et al. Metatron package is a package developed based on above mentioned model for implementing DTA Meta-analysis. The specialized packages for DTA Meta-analysis in R software were compared in this paper for users to choose.
Meta-analysis on diagnostic test accuracy; Metatron package; R software; Bivariate model
R4
A
1674-4055(2016)05-0517-03
湖北省教育廳重點(diǎn)項(xiàng)目(D20142102)
1442000 十堰,十堰市太和醫(yī)院(湖北醫(yī)藥學(xué)院附屬醫(yī)院)循證醫(yī)學(xué)中心;2442000 十堰,十堰市太和醫(yī)院(湖北醫(yī)藥學(xué)院附屬醫(yī)院)麻醉科;3442000 十堰,湖北醫(yī)藥學(xué)院影像醫(yī)學(xué)院12級(jí);4442000 十堰,十堰市太和醫(yī)院(湖北醫(yī)藥學(xué)院附屬醫(yī)院)口腔科
共同第一作者:孫艷玲
牛玉明,E-mail:niuyuming@yeah.net
10.3969/j.issn.1674-4055.2016.05.02
中國(guó)循證心血管醫(yī)學(xué)雜志2016年5期