国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

診斷試驗(yàn)缺失值處理方法的比較研究及應(yīng)用

2013-09-07 09:02:18中國(guó)醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院國(guó)家心血管病中心阜外心血管病醫(yī)院心血管疾病國(guó)家重點(diǎn)實(shí)驗(yàn)室醫(yī)學(xué)研究統(tǒng)計(jì)中心100037
關(guān)鍵詞:預(yù)測(cè)值受試者陰性

中國(guó)醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院國(guó)家心血管病中心阜外心血管病醫(yī)院心血管疾病國(guó)家重點(diǎn)實(shí)驗(yàn)室醫(yī)學(xué)研究統(tǒng)計(jì)中心(100037)

黃耀華 唐欣然 王 楊 李 衛(wèi)Δ

診斷試驗(yàn)缺失值處理方法的比較研究及應(yīng)用

中國(guó)醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院國(guó)家心血管病中心阜外心血管病醫(yī)院心血管疾病國(guó)家重點(diǎn)實(shí)驗(yàn)室醫(yī)學(xué)研究統(tǒng)計(jì)中心(100037)

黃耀華 唐欣然 王 楊 李 衛(wèi)Δ

目的 探討診斷試驗(yàn)中缺失值的處理方法并進(jìn)行比較。方法 分別介紹診斷試驗(yàn)常用的4種缺失值處理方法:完整數(shù)據(jù)法(complete case,CC),隨機(jī)缺失法(missing at random,MAR),最差值法 (worst case,WC)以及無(wú)信息結(jié)轉(zhuǎn)法(non-informative imputation,NI),采用不同方法對(duì)實(shí)例數(shù)據(jù)進(jìn)行填充,分別從診斷試驗(yàn)靈敏度、特異度、陽(yáng)性預(yù)測(cè)值和陰性預(yù)測(cè)值四個(gè)方面評(píng)價(jià)缺失值的填充效果。結(jié)果 無(wú)信息結(jié)轉(zhuǎn)法與傳統(tǒng)缺失值處理方法比較,相對(duì)保守且假設(shè)簡(jiǎn)單。結(jié)論 當(dāng)診斷試驗(yàn)中診斷結(jié)果存在缺失值時(shí),無(wú)信息結(jié)轉(zhuǎn)方法可以較保守地估計(jì)真實(shí)的診斷效果。

診斷試驗(yàn) 缺失值 無(wú)信息結(jié)轉(zhuǎn)

△通信作者:李衛(wèi),Email:liwei@mrbc-nccd.com

診斷試驗(yàn)常常由于某些原因無(wú)法得到試驗(yàn)產(chǎn)品的診斷結(jié)果。例如,金標(biāo)準(zhǔn)檢測(cè)方法為有創(chuàng)方法,受試者拒絕參與,樣本受損無(wú)法進(jìn)行診斷檢測(cè),診斷結(jié)果處于灰色區(qū)域等。目前,業(yè)內(nèi)通常會(huì)采用貝葉斯模型〔1-2〕處理金標(biāo)準(zhǔn)結(jié)果缺失的數(shù)據(jù);而對(duì)于新的診斷試劑或方法診斷結(jié)果的缺失,研究者將采用完整數(shù)據(jù)法、最差值法,但都不大理想,無(wú)法客觀評(píng)價(jià)診斷試驗(yàn)的真實(shí)效果。在此類(lèi)診斷試驗(yàn)中,探討缺失值的填充過(guò)程應(yīng)該遵循盡量保守而且所提假設(shè)要盡可能少的原則〔3〕,這樣填補(bǔ)后的缺失值才更有可能和實(shí)際情況一致。本文通過(guò)理論推導(dǎo)闡述二分類(lèi)診斷試驗(yàn)缺失值的四種處理方法,并采用一項(xiàng)丙肝抗體檢測(cè)試劑盒研究的數(shù)據(jù)作為實(shí)例說(shuō)明,從而為選擇適合診斷試驗(yàn)中存在缺失值的分析方法提供依據(jù)。

方 法

診斷試驗(yàn)結(jié)果用T表示,T=1表示診斷陽(yáng)性,T=0表示診斷陰性;D表示受試者金標(biāo)準(zhǔn)的結(jié)果,D=1表示受試者為患病狀態(tài),D=0表示受試者為健康狀態(tài)。NA表示未獲得診斷結(jié)果的人數(shù)。簡(jiǎn)單二分類(lèi)診斷試驗(yàn)評(píng)價(jià)結(jié)果表示為表1。

表1 診斷試驗(yàn)評(píng)價(jià)

在一項(xiàng)診斷試驗(yàn)中,具備完整數(shù)據(jù)病例的分布a,b,c,d值是可以獲得的,而缺失值中的a0,b0,c0,d0是無(wú)法得到的,只能得到經(jīng)過(guò)金標(biāo)準(zhǔn)診斷之后a0,c0之和以及b0,d0之和。只有在獲取a0/c0,b0/d0情況下,研究者才能評(píng)價(jià)該診斷試驗(yàn)中所有受試者的各項(xiàng)評(píng)價(jià)指標(biāo)。

1.完整數(shù)據(jù)法

一般情況下,我們只分析具有明確診斷結(jié)果的完整數(shù)據(jù),傳統(tǒng)的有偏分析中靈敏度Se=a/(a+c)、特異度Sp=d/(b+d)、陽(yáng)性預(yù)測(cè)值PPV=a/(a+b)及陰性預(yù)測(cè)值NPV=d/(c+d)。

2.隨機(jī)缺失法

3.最差值法

4.無(wú)信息結(jié)轉(zhuǎn)法

假設(shè)〔3〕是指在整個(gè)受試人群中診斷為陽(yáng)性人數(shù)與診斷為陰性人數(shù)比值與患病狀態(tài)無(wú)關(guān),而且在獲得完整數(shù)據(jù)的病例和診斷結(jié)果缺失的病例中該比例為一固定值。

實(shí)例分析與結(jié)果

實(shí)例將采用一項(xiàng)丙肝病毒抗體檢測(cè)試劑盒的臨床研究數(shù)據(jù),數(shù)據(jù)如表2。

1.完整數(shù)據(jù)法

2.隨機(jī)缺失法

疾病狀態(tài)下的受試者診斷為陽(yáng)性所占的比例為35/54,所以診斷結(jié)果缺失的7名患者中診斷為陽(yáng)性的人數(shù)應(yīng)為7×(35/54)=4.54,診斷為陰性的人數(shù)應(yīng)為2.46;而健康狀態(tài)下的13名受試者診斷為陽(yáng)性的比例為15/152,所以缺失的13名受試者診斷為陽(yáng)性人數(shù)為13×(15/152)=1.28,診斷為陰性的人數(shù)應(yīng)為11.72。由此可獲得該診斷試驗(yàn)的各項(xiàng)評(píng)價(jià)指標(biāo),Se=(35+4.54)/(35+19+7)=64.8%,SP=(137+11.72)/(137+15+13)=90.1%,PPV=(35+4.54)/(35+4.54+15+1.28)=70.8%,NPV=(137+11.72)/(19+2.46+137+11.72)=87.4%。

表2 丙肝抗體檢測(cè)試劑盒試驗(yàn)評(píng)價(jià)

3.最差值法

在該假設(shè)下,疾病狀態(tài)下的7例缺失數(shù)據(jù)診斷結(jié)果都為陰性,而健康狀態(tài)下的13名受試者診斷結(jié)果都為陽(yáng)性。進(jìn)而可以計(jì)算得到Se=35/(35+19+7)=57.4%,Sp=137/(137+15+13)=83.0%,PPV=35/(35+15+13)=55.6%,NPV=137/(19+137+7)=84.0%。

4.無(wú)信息結(jié)轉(zhuǎn)法

診斷結(jié)果中陽(yáng)性所占的比例與疾病狀態(tài)無(wú)關(guān),因此可以獲得有完整數(shù)據(jù)受試者中診斷結(jié)果為陽(yáng)性的比例,50/156。而在診斷結(jié)果缺失的7名患者和13名健康受試者中,其診斷結(jié)果陽(yáng)性的比例也為該值。因此,可以分別計(jì)算出兩部分缺失數(shù)據(jù)診斷為陽(yáng)性和診斷為陰性人數(shù)。在疾病狀態(tài)下的受試者中診斷為陽(yáng)性的有7×(50/156)=2.24,診斷為陰性的有4.76;健康狀態(tài)下的受試者診斷為陽(yáng)性的有13×(50/156)=4.17,診斷為陰性的有8.83。由此可以計(jì)算Se=(35+2.24)/(35+19+7)=61.0%,Sp=(137+8.83)/(137+15+13)=88.4%,PPV=(35+2.24)/(35+2.24+15+4.17)=66.0%,NPV=(137+8.83)/(137+8.83+19+4.76)=86.0%。

5.四種評(píng)價(jià)方法的比較

通過(guò)對(duì)四種評(píng)價(jià)方法得到的結(jié)果進(jìn)行比較發(fā)現(xiàn),CC方法和MAR填補(bǔ)方法有相同的靈敏度和特異度,在陽(yáng)性、陰性預(yù)測(cè)值方面,CC填補(bǔ)方法較MAR有更高的陰性預(yù)測(cè)值和偏低的陽(yáng)性預(yù)測(cè)值。WC填補(bǔ)方法各項(xiàng)評(píng)價(jià)指標(biāo)均最低。而NI填補(bǔ)方法所獲得的評(píng)價(jià)指標(biāo)位于CC、MAR、WC三種方法之間,可以保守地估計(jì)診斷試驗(yàn)的評(píng)價(jià)效果,但又不會(huì)過(guò)于保守。

表3 四種缺失值處理方法得到診斷結(jié)果的比較(%)

討 論

診斷結(jié)果出現(xiàn)缺失值問(wèn)題在診斷試驗(yàn)中較為常見(jiàn),尤其是在當(dāng)樣本不適用新的診斷方法,或者樣本的診斷結(jié)果無(wú)法評(píng)價(jià)時(shí),缺失值更是無(wú)法避免的現(xiàn)象〔3,5〕。在評(píng)價(jià)一項(xiàng)診斷試驗(yàn)中,存在一定數(shù)量的缺失值往往會(huì)影響評(píng)價(jià)指標(biāo)的真實(shí)性和準(zhǔn)確性。因此,采用合適的填補(bǔ)方法對(duì)缺失數(shù)據(jù)進(jìn)行填補(bǔ)對(duì)于客觀評(píng)價(jià)一項(xiàng)診斷試驗(yàn)就顯得至關(guān)重要了。

本文列舉了簡(jiǎn)單二分類(lèi)診斷試驗(yàn)存在缺失值時(shí)四種分析方法。傳統(tǒng)的有偏評(píng)價(jià)CC并不能全面反應(yīng)診斷試驗(yàn)的診斷效果,其所得出的各項(xiàng)評(píng)價(jià)指標(biāo)在四種評(píng)價(jià)方法中不夠保守,會(huì)一定程度地高估診斷試驗(yàn)的效果。這種方法雖然簡(jiǎn)單,但其帶來(lái)的問(wèn)題顯而易見(jiàn),一方面它可能造成巨大的信息丟失,另一方面會(huì)造成納入分析的樣本量大大減少,從而降低了統(tǒng)計(jì)把握度。

而在MAR填補(bǔ)方法中,缺失值的填補(bǔ)是由受試者本身的疾病狀態(tài)所決定,因此在診斷試驗(yàn)填充后的靈敏度和特異度與完全數(shù)據(jù)集下得到的結(jié)果一致,陽(yáng)性預(yù)測(cè)值甚至比完全數(shù)據(jù)集還要略高。這個(gè)結(jié)果說(shuō)明該填補(bǔ)方法不夠保守,在評(píng)估一項(xiàng)產(chǎn)品的性能中需要謹(jǐn)慎使用。

在最為保守的填補(bǔ)方法WC中,其填補(bǔ)思想是將缺失數(shù)據(jù)都視為診斷結(jié)果錯(cuò)誤。該填補(bǔ)方法固然保守,能低估診斷試驗(yàn)的各項(xiàng)評(píng)價(jià)指標(biāo),但其獲得的指標(biāo)肯定要比真實(shí)世界的各項(xiàng)指標(biāo)低,在大多數(shù)診斷試驗(yàn)中將大大低估診斷試劑或診斷器械的診斷能力。在臨床試驗(yàn)中,這種保守的方法可作為靈敏度分析的一種策略,如果其結(jié)果仍舊滿足臨床需求,則更能強(qiáng)有力證明產(chǎn)品有效性的穩(wěn)定程度。

相比其他幾種方法而言,NI填補(bǔ)方法具有一定的優(yōu)勢(shì)。首先,它的假設(shè)足夠簡(jiǎn)單,即假定缺失值的真實(shí)情況和受試者的疾病狀態(tài)無(wú)關(guān),這樣的假設(shè)單一又足夠簡(jiǎn)單,滿足填充缺失值假設(shè)所遵循的原則。其次,這種方法足夠保守,前面的公式推導(dǎo)已經(jīng)證明在該假設(shè)下所計(jì)算的靈敏度和特異度比CC方法得到的結(jié)果要低,但又不會(huì)像WC方法一樣過(guò)于保守。該方法用在診斷試驗(yàn)的缺失值填補(bǔ)中會(huì)比較客觀地估計(jì)診斷產(chǎn)品的療效〔6〕。

理論上可以將NI填補(bǔ)方法由簡(jiǎn)單的二分類(lèi)診斷試驗(yàn)推廣到連續(xù)變量診斷試驗(yàn)缺失值的填充。但在連續(xù)變量的診斷試驗(yàn)中,填充方法是否會(huì)受到Cut-off值的影響,缺失值的具體填充如何操作等等,這類(lèi)問(wèn)題將會(huì)比二分類(lèi)診斷試驗(yàn)復(fù)雜得多,這方面有待進(jìn)一步挖掘和探討。

1.蘇春娟,閔捷,劉沛,等.診斷試驗(yàn)證實(shí)偏倚校正方法的比較研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2007,24(2):143-145.

2.Pennello GA.Bayesian analysis of diagnostic test accuracy when disease state is unverifiedfor some subjects.J Biopharm Stat,2011,21(5):954-70.

3.Campbell G,Pennello G,Yue L.Missing data in the regulation of medical devices.J Biopharm Stat,2011,21(2):180-95.

4.Little RA,Rubin DB.Statistical Analysis with Missing Data(2nd edn).Wiley:New York,2002.

5.花琳琳,施學(xué)忠,楊永利.不同缺失值填充技術(shù)在HIV/AIDS血液樣品檢測(cè)數(shù)據(jù)中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(6):668-669,673.

6.Shi L,Campbell G,Jones WD,et al.The MicroArray Quality Control(MAQC)-II study of common practices for the development and validation of microarray-based predictive models.Nat Biotechnol,2010,28(8):827-38.

Comparison and Application of Different Methods for Analy-zing Data with Missing in Diagnostic Trials

Huang Yaohua,Tang Xinran,Wang Yang,et al.Medical Research & Biometrics Center,State Key Laboratory of Cardiovascular Diseases,F(xiàn)uwai Hospital National Center for Cardiovascular Diseases,Chinese A-cademy of Medical Sciences and Peking Union Medical College(100037),Beijing

ObjectiveTo explore and compare the results of different methods for analyzing missing data in diagnostic trials.MethodsComplete case method,missing at random method,worst case method,non-informative imputation method are compared for analyzing data with missing in diagnostic trials.An example is used to compare the results with different methods,and the results are evaluated from sensitivity,specificity,positive predictive value,negative predictive value.ResultsComparing with other traditional methods,non-informative imputation method is a kind of method which is conservative and employs only an assumption.ConclusionNon-informative imputation method can conservatively estimate the real diagnostic effect when there exists missing data in diagnostic trials.

Diagnostic trial;Missing data;Non-informative Imputation

(責(zé)任編輯:郭海強(qiáng))

猜你喜歡
預(yù)測(cè)值受試者陰性
IMF上調(diào)今年全球經(jīng)濟(jì)增長(zhǎng)預(yù)期
企業(yè)界(2024年8期)2024-07-05 10:59:04
涉及人的生物醫(yī)學(xué)研究應(yīng)遵循的倫理原則
涉及人的生物醫(yī)學(xué)研究應(yīng)遵循的倫理原則
加拿大農(nóng)業(yè)部下調(diào)2021/22年度油菜籽和小麥產(chǎn)量預(yù)測(cè)值
±800kV直流輸電工程合成電場(chǎng)夏季實(shí)測(cè)值與預(yù)測(cè)值比對(duì)分析
涉及人的生物醫(yī)學(xué)研究應(yīng)遵循的倫理原則
法電再次修訂2020年核發(fā)電量預(yù)測(cè)值
涉及人的生物醫(yī)學(xué)研究應(yīng)遵循的倫理原則
鉬靶X線假陰性乳腺癌的MRI特征
三陰性乳腺癌的臨床研究進(jìn)展
钟山县| 板桥市| 泽州县| 大港区| 县级市| 巧家县| 揭阳市| 淳化县| 武宁县| 屏山县| 囊谦县| 扎兰屯市| 吉水县| 军事| 商河县| 宁明县| 静宁县| 怀柔区| 绥滨县| 如东县| 陈巴尔虎旗| 康定县| 清水县| 贵阳市| 金堂县| 沅陵县| 苏尼特左旗| 元朗区| 临湘市| 南汇区| 平利县| 常德市| 达日县| 星子县| 广东省| 莫力| 钦州市| 迁安市| 巩留县| 石河子市| 晋州市|