南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院生物統(tǒng)計(jì)學(xué)系(510515) 李丹玲 陳平雁
自 Yerushalmy(1947)〔1〕提出靈敏度(SEN)和特異度(SPE)以來(lái),它們一直是評(píng)價(jià)診斷試驗(yàn)最基本和最重要的兩項(xiàng)指標(biāo)。由于靈敏度和特異度是一對(duì)互為矛盾的指標(biāo),即對(duì)于某一診斷方法,一者的增大必定以另一者的減小為代價(jià),反之亦然;所以在不同診斷方法進(jìn)行比較時(shí),一者的靈敏度較高而另一者的特異度較高時(shí),難以對(duì)其做出綜合評(píng)價(jià)。于是結(jié)合靈敏度和特異度的綜合評(píng)價(jià)指標(biāo)由此產(chǎn)生,如標(biāo)準(zhǔn)化診斷準(zhǔn)確率或標(biāo)準(zhǔn)化診斷符合率。然而,此類(lèi)綜合評(píng)價(jià)指標(biāo)又產(chǎn)生了新的問(wèn)題,當(dāng)靈敏度和特異度的重要性不同時(shí),它們就不能反映診斷的真實(shí)價(jià)值〔2〕。為此,我們將在基于靈敏度和特異度特意賦權(quán)的基礎(chǔ)上建立一種新的診斷試驗(yàn)評(píng)價(jià)指標(biāo)-廣義標(biāo)準(zhǔn)化診斷符合率。
兩種試驗(yàn)診斷某種疾病的結(jié)果用表1和表2表達(dá),縱標(biāo)目是以“金標(biāo)準(zhǔn)”或稱(chēng)參照標(biāo)準(zhǔn)確診的受試個(gè)體是“患者”(D+)或“非患者”(D-);橫標(biāo)目為診斷方法所判定的結(jié)果“陽(yáng)性”(T+)或“陰性”(T-)。
表1 甲試驗(yàn)診斷某疾病的結(jié)果
筆者曾提出,兩樣本病例組構(gòu)成不同時(shí),不宜用診斷符合率檢驗(yàn),而應(yīng)該用標(biāo)準(zhǔn)化診斷符合率檢驗(yàn)〔3〕。為便于應(yīng)用,我們將兩樣本的合并人群定義為標(biāo)準(zhǔn)人群。下面導(dǎo)出合并兩樣本為標(biāo)準(zhǔn)人群的標(biāo)準(zhǔn)化診斷符合率檢驗(yàn)公式。由表3可知,病例組的合計(jì)為n1+m1,甲靈敏度為SEN1,預(yù)期的真陽(yáng)性數(shù)為(n1+m1)·SEN1,乙靈敏度為SEN2,預(yù)期的真陽(yáng)性數(shù)為(n1+m1)·SEN2。對(duì)照組的合計(jì)為n2+m2,甲的特異度為SPE1,預(yù)期的真陰性數(shù)位(n2+m2)·SPE1,乙的特異度為SPE2,預(yù)期的真陰性數(shù)位(n2+m2)·SPE2。由直接法求得標(biāo)準(zhǔn)化診斷符合率:
表2 乙試驗(yàn)診斷某疾病的結(jié)果
表3 標(biāo)準(zhǔn)化診斷符合率計(jì)算表
從上,我們得知,標(biāo)準(zhǔn)化診斷符合率其實(shí)質(zhì)是靈敏度與特異度的一個(gè)線(xiàn)性組合,我們?cè)诨陟`敏度和特異度任意賦權(quán)的基礎(chǔ)上建立廣義標(biāo)準(zhǔn)化診斷符合率。
廣義標(biāo)準(zhǔn)化診斷符合率的構(gòu)建遵循如下兩原則:
(1)靈敏度、特異度的權(quán)重之和為1,即靈敏度的權(quán)重為w,特異度的權(quán)重為1-w;
(2)滿(mǎn)足特殊性。當(dāng)靈敏度和特異度同等重要時(shí),即權(quán)重均為0.5時(shí),廣義標(biāo)準(zhǔn)化診斷符合率e'等于標(biāo)準(zhǔn)化診斷符合率e。
因此我們構(gòu)造出來(lái)的廣義標(biāo)準(zhǔn)化診斷符合率有如下形式:
其中0≤w≤1。
廣義標(biāo)準(zhǔn)化診斷符合率的統(tǒng)計(jì)推斷
根據(jù)中心極限定理,當(dāng)樣本量較大時(shí),檢驗(yàn)統(tǒng)計(jì)量
其中Se1'-e2'是兩種診斷試驗(yàn)的廣義標(biāo)準(zhǔn)化診斷符合率之差的標(biāo)準(zhǔn)誤。為求之,我們先計(jì)算其近似方差,由于兩診斷試驗(yàn)相互獨(dú)立,因而有:
至此,兩個(gè)獨(dú)立診斷試驗(yàn)的廣義標(biāo)準(zhǔn)化診斷符合率比較的統(tǒng)計(jì)推斷方法得以建立:
這里,Z~N(0,1)。
檢驗(yàn)統(tǒng)計(jì)量Z為權(quán)重w的單調(diào)函數(shù)
筆者通過(guò)理論證明得知權(quán)重w對(duì)Z的影響如下:
(1)若 SEN1≤SEN2,SPE1≥SPE2,則隨著 w 的增大,Z減小(當(dāng)且僅當(dāng) SEN1=SEN2,SPE1=SPE2時(shí),Z≡0);
(2)若 SEN1<SEN2,SPE1<SPE2,則隨著 w 的增大,Z先減小后增大,最小值點(diǎn)為
假想的兩獨(dú)立診斷試驗(yàn)的結(jié)果分別列于表4,試比較之。
分析結(jié)果見(jiàn)表4,若靈敏度的權(quán)重取0.4(特異度的權(quán)重為0.6),兩法的e'分別為0.577和0.661,兩法的診斷價(jià)值無(wú)統(tǒng)計(jì)學(xué)差異(Z=-1.445,P=0.148);當(dāng)靈敏度和特異度取相同權(quán)重時(shí),即w=0.5時(shí),此時(shí)廣義標(biāo)準(zhǔn)化診斷符合率等于標(biāo)準(zhǔn)化診斷符合率(e),乙法的診斷價(jià)值高于甲法(Z=-2.722,P=0.006)。若靈敏度的權(quán)重取0.6(特異度的權(quán)重為0.4),兩種檢驗(yàn)方法的e'分別為0.519和0.745,乙的診斷價(jià)值高于甲法(Z= -3.909,P <0.001)。
(3)若 SEN1≥SEN2,SPE1≤SPE2,則隨著 w 的增大,Z增大;
(4)若 SEN1>SEN2,SPE1>SPE2,則隨著 w 的增大,Z先增大后減小,最大值點(diǎn)w0同上。我們通過(guò)舉例來(lái)演示上述四種不同情況下Z如何隨w的變化而變化(見(jiàn)圖1)。
〔實(shí)例〕
表4顯示,乙法的靈敏度高于甲法,但其特異度低于后者。此類(lèi)資料若分別比較靈敏度或特異度顯然難以做出一個(gè)完整的判斷,需要用類(lèi)似標(biāo)準(zhǔn)化診斷符合率這樣的綜合指標(biāo)進(jìn)行評(píng)價(jià),這正是標(biāo)準(zhǔn)化診斷符合率的優(yōu)勢(shì)所在。
圖1 檢驗(yàn)統(tǒng)計(jì)量Z為權(quán)重w的單調(diào)函數(shù)
表4 三種不同權(quán)重時(shí)廣義標(biāo)準(zhǔn)化診斷符合率檢驗(yàn)的結(jié)果
關(guān)于靈敏度和特異度的相對(duì)重要性,Galen和Gambino曾有論述〔4〕:(1)對(duì)病情嚴(yán)重但治療有積極意義,漏診會(huì)造成不可挽回的損害而誤診不治帶來(lái)嚴(yán)重后果的疾病,如嗜鉻細(xì)胞瘤,以靈敏度較為重要;(2)對(duì)病情重又屬于不治之癥,誤診會(huì)產(chǎn)生嚴(yán)重后果的疾病,如多發(fā)性硬化癥,以特異度較為重要;(3)對(duì)病情較重但治療有積極意義,漏診和誤診造成危害相當(dāng)?shù)募膊?,如心肌梗塞、糖尿病、某些血液病等,靈敏度和特異度大致同等重要。Galen和Gambino提出的上述概念可看作臨床應(yīng)用的一般原則,尚不具備技術(shù)上的可操作性。本研究所建立的方法可以量化地體現(xiàn)兩者的相對(duì)重要性,而且其意義更為直觀(guān)。
靈敏度和特異度權(quán)重的確定是廣義標(biāo)準(zhǔn)化診斷符合率應(yīng)用的一個(gè)核心問(wèn)題,應(yīng)該由相關(guān)研究領(lǐng)域的專(zhuān)家根據(jù)其專(zhuān)業(yè)知識(shí)、臨床經(jīng)驗(yàn)、同行共識(shí)給出答案。當(dāng)廣義標(biāo)準(zhǔn)化診斷符合率的應(yīng)用更為廣泛的時(shí)候,meta分析等數(shù)據(jù)處理手段也可提供輔助手段。
相對(duì)于標(biāo)準(zhǔn)化診斷符合率,廣義標(biāo)準(zhǔn)化診斷符合率不僅允許靈敏度和特異度任意賦權(quán),而且更滿(mǎn)足特殊性,當(dāng)靈敏度和特異度等權(quán)時(shí)(均為0.5),廣義標(biāo)準(zhǔn)化診斷符合率等價(jià)于標(biāo)準(zhǔn)化診斷符合率,當(dāng)SEN1=SEN2=1或SPE1=SPE2=1時(shí),Z恒為常數(shù)。
試驗(yàn)樣本中的病例組構(gòu)成是診斷試驗(yàn)推斷方法面臨的一個(gè)普遍問(wèn)題,本研究結(jié)果將對(duì)于其他評(píng)價(jià)方法產(chǎn)生很好的啟示作用。
1.Yerushalmy J.Statistical problems in assessing methods of medical diagnosis,with special reference to x-ray techniques.Public Health Reports,1947,62:1432-1449.
2.陳平雁.診斷試驗(yàn)的評(píng)價(jià)指標(biāo)及其應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),1991,8(5):53-57.
3.陳平雁,郭祖超,胡琳.比較兩種診斷試驗(yàn)的統(tǒng)計(jì)方法.中國(guó)衛(wèi)生統(tǒng)計(jì),1990,7(2):22-26.
4.Galen RS,Gambino SR.Beyond normality:the predictive value and efficiency of medical diagnosis.New York:Jonewiley,1975,50-53.
5.Christensen E.Methodology of diagnostic tests in hepatology.Ann Hepatol,2009,8(3):177-183.
6.Reitsma JB,Glas AS,Rutjes AW,et al.Bivariate analysis of sensitivity and specificity produces informative summary measures in diagnostic reviews.J Clin Epidemiol,2005,58(10):982-990.
7.Van den Bruel A,Cleemput I,Aertgeerts B,et al.The evaluation of diagnostic tests:evidence on technical and diagnostic accuracy,impact on patient outcome and cost-effectiveness is needed.J Clin Epidemiol,2007,60(11):1116-1122.