張?jiān)娫?shī),王薇,趙海建,王治國(guó)
(1.北京醫(yī)院 國(guó)家老年醫(yī)學(xué)中心 衛(wèi)生部臨床檢驗(yàn)中心/北京市臨床檢驗(yàn)工程技術(shù)研究中心,北京 100730;2.北京協(xié)和醫(yī)學(xué)院研究生院,北京 100730)
·專家論壇·
臨床化學(xué)檢驗(yàn)中精密度、正確度、總誤差和測(cè)量不確定度的討論
張?jiān)娫?shī)1,2,王薇1,趙海建1,王治國(guó)1,2
(1.北京醫(yī)院 國(guó)家老年醫(yī)學(xué)中心 衛(wèi)生部臨床檢驗(yàn)中心/北京市臨床檢驗(yàn)工程技術(shù)研究中心,北京 100730;2.北京協(xié)和醫(yī)學(xué)院研究生院,北京 100730)
在臨床化學(xué)檢驗(yàn)中,精密度和正確度是測(cè)量程序兩大主要的性能特征,同時(shí)也是臨床實(shí)驗(yàn)室方法確認(rèn)和性能驗(yàn)證的重要內(nèi)容。由Westgard提出的傳統(tǒng)“總誤差(total error,TE)”模型已在臨床實(shí)踐工作中應(yīng)用了幾十年,該模型通過(guò)線性相加將不精密度和偏移結(jié)合在一起。但TE模型無(wú)法覆蓋影響測(cè)量結(jié)果準(zhǔn)確度的所有因素,TE的表達(dá)未分別闡明隨機(jī)誤差和系統(tǒng)誤差的大小,也無(wú)法反映系統(tǒng)誤差和隨機(jī)誤差的關(guān)系。因此,另一模型即測(cè)量不確定度(measurement uncertainty,MU)模型受到了認(rèn)可和標(biāo)準(zhǔn)化機(jī)構(gòu)的推薦。MU模型分別評(píng)定不精密度和偏移引入的MU,并表達(dá)為圍繞最佳估計(jì)值的區(qū)間,在該區(qū)間內(nèi)真值以一定的概率出現(xiàn)。鑒于MU評(píng)定的復(fù)雜性,開(kāi)發(fā)便捷的軟件簡(jiǎn)化MU的計(jì)算,有利于促進(jìn)臨床實(shí)驗(yàn)室中MU的使用。
精密度;正確度;不精密度;偏移;總誤差;測(cè)量不確定度;測(cè)量程序;方法確認(rèn);性能驗(yàn)證
在臨床化學(xué)檢驗(yàn)中,測(cè)量程序的性能直接關(guān)系到測(cè)量結(jié)果的質(zhì)量,并且進(jìn)一步影響臨床決策的制定。因此,臨床實(shí)驗(yàn)室在使用任一測(cè)量程序前均需要對(duì)其進(jìn)行方法確認(rèn)和/或性能驗(yàn)證。ISO 15189[1]條款5.5.1“測(cè)量程序的選擇、驗(yàn)證和確認(rèn)”中也對(duì)此進(jìn)行了描述,提出了臨床實(shí)驗(yàn)室對(duì)測(cè)量程序進(jìn)行確認(rèn)和驗(yàn)證以及評(píng)定測(cè)量不確定度(measurement uncertainty,MU)的要求。在方法確認(rèn)和/或性能驗(yàn)證中,精密度(precision)和正確度(trueness)是必不可少的兩大性能特征,通常分別以不精密度(imprecision)和偏移(bias)表示[2]。根據(jù)Westgard“總誤差(total error,TE)”模型,TE是不精密度和偏移的線性和[3],同一TE可由多種不同的不精密度和偏移結(jié)合而成,且不精密度和偏移的任意結(jié)合會(huì)產(chǎn)生相同的TE。因此,對(duì)于可接受的TE值,可能會(huì)隱藏其中某一組分不可接受的情況,而對(duì)于不可接受的TE值,可能對(duì)于發(fā)現(xiàn)和糾正其根本原因幫助不大?;赥E模型的局限性,且為了更好地描述測(cè)量結(jié)果與真值的關(guān)系,另一重要概念MU被認(rèn)可和標(biāo)準(zhǔn)化機(jī)構(gòu)提出并推薦。
在臨床化學(xué)檢驗(yàn)中,測(cè)量程序的方法確認(rèn)和/或性能驗(yàn)證通常集中于精密度和正確度。精密度,是“在規(guī)定條件下,對(duì)同一或類似被測(cè)對(duì)象重復(fù)測(cè)量所得示值或測(cè)得值間的一致程度”[4],反映測(cè)量結(jié)果隨機(jī)誤差的大小,通常以不精密度表達(dá),常用標(biāo)準(zhǔn)差(s)或變異系數(shù)(CV)表示。正確度,是“無(wú)窮多次重復(fù)測(cè)量所得量值的平均值與一個(gè)參考量值間的一致程度”[5],反映測(cè)量結(jié)果系統(tǒng)誤差的大小,通常用偏移來(lái)度量。偏移是系統(tǒng)測(cè)量誤差的估計(jì)值[4],是由一種或多種系統(tǒng)誤差所引起的。
對(duì)于以上兩個(gè)非常重要的性能特征,制造商提供的試劑說(shuō)明書(shū)中通常只包含有關(guān)精密度的信息,但是一般沒(méi)有或無(wú)法提供有關(guān)正確度的信息。因?yàn)楦鶕?jù)CLSI EP05-A3[6]、EP15-A3[7]、WS/T 420-2013[8]和CLSI EP09-A3[9]等文件,精密度容易通過(guò)樣品的重復(fù)測(cè)量來(lái)獲得,但正確度的評(píng)價(jià)或偏移的估計(jì)則較為困難。偏移的估計(jì)需要與源自參考測(cè)量程序或參考方法的參考量值比較,但是在臨床實(shí)驗(yàn)室的實(shí)踐工作中,由于成本和技術(shù)等問(wèn)題,不可能總是與參考方法比對(duì)。因此,一般與臨床實(shí)驗(yàn)室已用的常規(guī)方法比對(duì),估計(jì)的是評(píng)價(jià)方法和比對(duì)方法之間的偏差[10]。實(shí)驗(yàn)室也可以參加室間質(zhì)量評(píng)價(jià)正確度驗(yàn)證計(jì)劃,將測(cè)量質(zhì)控品所得量值的均值與質(zhì)控品的指定值比較,估計(jì)偏移。但除參考測(cè)量程序以外,使用其他比對(duì)方法需要注意干擾物質(zhì)的影響和基質(zhì)效應(yīng)。
1974年,Westgard等[3]引入了TE的概念,規(guī)定TE是隨機(jī)誤差和系統(tǒng)誤差的線性和,且表達(dá)式為:TE=z×s+bias。其中,s代表不精密度,是精密度的常用表示方式;bias代表偏移,是正確度的度量。TE的概念將精密度和正確度結(jié)合到一起并形成一個(gè)統(tǒng)一的表達(dá)式。在臨床實(shí)驗(yàn)室中,TE有2個(gè)主要用途:(1)描述測(cè)量程序的性能或者在減去偏移之后,通過(guò)不精密度(標(biāo)準(zhǔn)差)對(duì)TE進(jìn)行標(biāo)準(zhǔn)化以獲得西格瑪度量,用于與其他實(shí)驗(yàn)室比較;(2)制定性能規(guī)范,包括允許總誤差、允許不精密度和允許偏移。
然而,該傳統(tǒng)TE模型也存在許多局限性。第一,采用該模型獲得的TE并非檢驗(yàn)過(guò)程完整的TE[11],如生物學(xué)變異、儀器和試劑變異[12]等影響測(cè)量結(jié)果準(zhǔn)確度的因素,TE無(wú)法將其全部覆蓋。確切地說(shuō),此處的TE指的是由分析過(guò)程所引起的總分析誤差(total analytical error,TAE),小于完整檢驗(yàn)過(guò)程的隨機(jī)誤差和系統(tǒng)誤差之和[11,13]。關(guān)于TE和TAE之間的差異,CLSI EP21[14]中有進(jìn)一步的解釋。Westgard在其近期的一篇文章中還將TE的定義修改為:TE=z×s+│bias│[15]。第二,根據(jù)TE的定義,對(duì)于給定的TE值,可以通過(guò)不精密度和偏移的線性相加來(lái)獲得。因此,減少偏移能夠抵消增加的隨機(jī)誤差,反之亦然。但TE的表達(dá)中并未分別闡明隨機(jī)誤差和系統(tǒng)誤差的大小,也沒(méi)有為終端用戶(如臨床醫(yī)生)提供是否應(yīng)該從報(bào)告結(jié)果中加上或減去一定數(shù)值的信息。第三,TE反映的是測(cè)量程序總體的性能,僅使用TE說(shuō)明測(cè)量程序的性能規(guī)范,無(wú)法進(jìn)一步了解測(cè)量結(jié)果不精密度和偏移之間的關(guān)系。由于已知的偏移會(huì)影響測(cè)量結(jié)果的評(píng)估和臨床決策的制定,允許總誤差雖然包含已知的偏移卻通常未對(duì)其具體說(shuō)明。TE雖然在表面上可以滿足臨床醫(yī)生和實(shí)驗(yàn)室人員的需求,但其實(shí)用價(jià)值卻非常有限。但由于任何一種模型都不可能將所有來(lái)源的誤差模型化,并且Westgard的傳統(tǒng)TE模型已涵蓋了TE的大部分[11],因此在提出更好的模型之前,大部分臨床實(shí)驗(yàn)室依然愿意使用Westgard的傳統(tǒng)TE模型來(lái)描述測(cè)量程序的總體性能。第四,在TE模型中,已知的TE需要分解成系統(tǒng)誤差和隨機(jī)誤差,才能與其他因素造成的誤差合并。這也體現(xiàn)了TE缺乏轉(zhuǎn)換性[16]。
基于傳統(tǒng)TE模型的局限性,MU被提出并受到了認(rèn)可和標(biāo)準(zhǔn)化機(jī)構(gòu)的推薦。在臨床化學(xué)檢驗(yàn)中,測(cè)量的性能以及結(jié)果也可以用MU表達(dá),其定義[16]是“根據(jù)所有信息,表征賦予被測(cè)量量值分散性的非負(fù)參數(shù)”,且通用形式是標(biāo)準(zhǔn)差。MU不關(guān)注“真值”的未知性,而是通過(guò)定義一個(gè)量值區(qū)間來(lái)表達(dá)量值不完整性的信息。MU包含測(cè)量程序中所有可能的不確定度來(lái)源,同時(shí)也要求把已知的偏移減少到可忽略或消除。偏移的消除會(huì)導(dǎo)致測(cè)量程序總(或“合成”)不確定度的增加,這是MU使用必須滿足的先決條件,與TE模型對(duì)于已知偏移的保留明顯不同。在計(jì)量學(xué)領(lǐng)域,采用定義良好的校準(zhǔn)品和高計(jì)量學(xué)標(biāo)準(zhǔn)的測(cè)量程序,對(duì)無(wú)干擾成分影響且無(wú)基質(zhì)效應(yīng)的樣品進(jìn)行賦值,可以充分地降低偏移。在臨床化學(xué)檢驗(yàn)中,從校準(zhǔn)品的定義到測(cè)量程序的計(jì)量學(xué)標(biāo)準(zhǔn)均不可能達(dá)到最佳條件,因此校準(zhǔn)品溯源鏈的每次比對(duì)均有不確定度的增加。
在醫(yī)學(xué)實(shí)驗(yàn)室中,原則上有2種評(píng)定MU的方法[16]。第一種,“自下而上(bottom-up)”法,也稱GUM或模型方法,是在全面系統(tǒng)地分析測(cè)量過(guò)程后,識(shí)別出每個(gè)可能的MU來(lái)源并通過(guò)統(tǒng)計(jì)學(xué)或其他方法(如從文獻(xiàn)、產(chǎn)品說(shuō)明書(shū)中獲得性能數(shù)據(jù))評(píng)定每個(gè)來(lái)源MU的大小,并使用方差法(各來(lái)源MU的方差和開(kāi)平方)合并所有來(lái)源的MU以獲得測(cè)量結(jié)果的“合成標(biāo)準(zhǔn)不確定度”。第二種,“自上而下(top-down)”法,這是臨床實(shí)驗(yàn)室中較為經(jīng)濟(jì)實(shí)用的MU評(píng)定方法。在該方法中,精密度(不精密度/實(shí)驗(yàn)室內(nèi)復(fù)現(xiàn)性)和正確度(偏移)是兩個(gè)主要的分量,前者引入的MU可利用室內(nèi)質(zhì)量控制(IQC)數(shù)據(jù)、實(shí)驗(yàn)室間比對(duì)(PT)數(shù)據(jù)或重復(fù)測(cè)量常規(guī)樣本的合并標(biāo)準(zhǔn)差來(lái)評(píng)定,后者引入的MU可利用有證參考物質(zhì)(CRM)(包括正確度驗(yàn)證計(jì)劃的質(zhì)控品)、PT數(shù)據(jù)或與參考測(cè)量方法比較來(lái)評(píng)定,臨床實(shí)驗(yàn)室通常將此二者與TE模型中的隨機(jī)誤差和系統(tǒng)誤差相聯(lián)系。若采用“自上而下”法獲得的MU沒(méi)有達(dá)到目標(biāo)不確定度的要求,則可用“自下而上”法識(shí)別不確定度的各種來(lái)源,并有針對(duì)性地改進(jìn)主要影響因素以減少M(fèi)U。值得一提的是,不同于TE模型采用不同方式處理系統(tǒng)誤差(各系統(tǒng)誤差之和)和隨機(jī)誤差(先計(jì)算各隨機(jī)誤差平方和的平方根,再乘以包含因子k,通常k=1.96),MU模型均采用同一方式處理評(píng)定過(guò)程中所有來(lái)源類型的MU組分,最終獲得的MU也僅包含一種組分。
MU評(píng)定過(guò)程的復(fù)雜性很大程度上阻礙了其在臨床實(shí)驗(yàn)室中的發(fā)展和應(yīng)用。如果可以設(shè)計(jì)軟件并將計(jì)算過(guò)程編寫(xiě)成程序,那么實(shí)驗(yàn)室就能直接輸入變量獲得結(jié)果的MU。目前,已有專家學(xué)者開(kāi)發(fā)出偏導(dǎo)數(shù)的數(shù)值逼近法[13]或模擬測(cè)量函數(shù)法[17],在Microsoft Excel中對(duì)MU的計(jì)算編程。偏導(dǎo)數(shù)的數(shù)值逼近法設(shè)計(jì)的電子表格可以顯示許多有用的信息,包括輸入量值及其對(duì)應(yīng)的絕對(duì)或相對(duì)標(biāo)準(zhǔn)不確定度計(jì)算后每個(gè)來(lái)源不確定度的相對(duì)大小、合成的絕對(duì)和相對(duì)不確定度以及擴(kuò)展不確定度和其在給定置信水平的不確定度區(qū)間等。模擬測(cè)量函數(shù)法在電子表格中則很容易編程且可有幾種算法用于模擬正態(tài)和其他的分布[18]。但這些方法也存在一些局限性,例如偏導(dǎo)數(shù)的數(shù)值逼近法并未解決共向變量以及指數(shù)或?qū)?shù)函數(shù)或者允許相同的輸入量出現(xiàn)在測(cè)量功能的多個(gè)位置等問(wèn)題。
介于MU評(píng)定算法的復(fù)雜性,用電腦編程和制作軟件,發(fā)展MU評(píng)定的簡(jiǎn)便快捷方式,將是一個(gè)必然的發(fā)展趨勢(shì)。若能改進(jìn)現(xiàn)有方法并開(kāi)發(fā)出更好的軟件,不僅有利于臨床實(shí)驗(yàn)室廣泛使用MU,也可為臨床醫(yī)生制定決策提供有力的幫助。
在臨床化學(xué)檢驗(yàn)中,精密度和正確度作為測(cè)量程序的兩大性能特征,同時(shí)也是臨床實(shí)驗(yàn)室方法確認(rèn)和性能驗(yàn)證的重要內(nèi)容。Westgard提出的傳統(tǒng)TE模型通過(guò)線性相加將不精密度和偏移這兩個(gè)獨(dú)立的度量結(jié)合在一起,并創(chuàng)建出一個(gè)獨(dú)立的表達(dá)式。然而,由于TE模型的局限性,其所能提供的信息無(wú)法滿足臨床實(shí)驗(yàn)室或臨床醫(yī)生的應(yīng)用。因此,MU模型被提出以進(jìn)一步描述測(cè)量程序的性能。MU模型除要求消除或減少偏移并用增加的合成不確定度代替,還可將已知的生物學(xué)變異、試劑變異等影響因素合并入MU的評(píng)定中。此外,開(kāi)發(fā)簡(jiǎn)便快捷的MU評(píng)定軟件可推動(dòng)MU在臨床實(shí)驗(yàn)室的廣泛使用。
[1]ISO 15189. Medical laboratories—Requirements for quality and competence[S]. International Organization for Standardization, 2012.
[2]CNAS-CL38. 醫(yī)學(xué)實(shí)驗(yàn)室質(zhì)量和能力認(rèn)可準(zhǔn)則在臨床化學(xué)檢驗(yàn)領(lǐng)域的應(yīng)用說(shuō)明[S].中國(guó)合格評(píng)定國(guó)家認(rèn)可委員會(huì),2012.
[3]Westgard JO, Carey RN, Wold S. Criteria for judging precision and accuracy in method development and evaluation[J]. Clin Chem, 1974, 20(7): 825-833.
[4]JJF 1001-2011. 通用計(jì)量術(shù)語(yǔ)及定義[S]. 國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局,2011.
[5]王治國(guó). 臨床檢驗(yàn)質(zhì)量控制技術(shù)[M]. 第3版. 北京:人民衛(wèi)生出版社,2014: 47-52.
[6]CLSI EP05-A3. Evaluation of precision of quantitative measurement procedures; approved guideline—third edition[S]. Clinical and Laboratory Standards Institute, 2014.
[7]CLSI EP15-A3. User verification of precision and estimation of bias; approved guideline—third edition[S]. Clinical and Laboratory Standards Institute, 2014.
[8]WS/T 420-2013. 臨床實(shí)驗(yàn)室對(duì)商品定量試劑盒分析性能的驗(yàn)證[S]. 中國(guó)國(guó)家衛(wèi)生和計(jì)劃生育委員會(huì),2013.
[9]CLSI EP09-A3. Measurement procedure comparison and bias estimation using patient samples; approved guideline—third edition[S]. Clinical and Laboratory Standards Institute, 2014.
[10]康鳳鳳,王治國(guó). ISO 15189:2012與臨床檢驗(yàn)定量檢測(cè)方法確認(rèn)和性能驗(yàn)證[J]. 臨床檢驗(yàn)雜志,2013, 31(12): 881-884.
[11]Krouwer JS. The problem with total error model in establishing performance specifications and a simple remedy[J]. Clin Chem Lab Med, 2016, 54(8): 1299-1301.
[12]Krouwer JS. How to improve total error modeling by accounting for error sources beyond imprecision and bias[J]. Clin Chem, 2001, 47(7): 1329-1330.
[13]Kallner A. Is the combination of trueness and precision in one expression meaningful? On the use of total error and uncertainty in clinical chemistry[J]. Clin Chem Lab Med, 2016, 54(8): 1291-1297.
[14]CLSI EP21. Evaluation of total analytical error for quantitative medical laboratory measurement procedures—second edition[S]. Clinical and Laboratory Standards Institute, 2016.
[15]Westgard JO. Useful measures and models for analytical quality management in medical laboratories[J]. Clin Chem Lab Med, 2016, 54(2): 223-233.
[16]CNAS TRL-001:2012. 醫(yī)學(xué)實(shí)驗(yàn)室—測(cè)量不確定度的評(píng)定與表達(dá)[S]. 中國(guó)合格評(píng)定國(guó)家認(rèn)可委員會(huì),2012.
[17]Farrance I, Frenkel R. Uncertainty in measurement: a review of Monte Carlo simulation using Microsoft Excel for the calculation of uncertainties through functional relationships, including uncertainties in empirically derived constants[J]. Clin Biochem Rev, 2014, 35(1): 37-61.
[18]Kallner A. Microsoft Excel 2010 offers an improved random number generator allowing efficient simulation in chemical laboratory studies[S]. Clin Chim Acta, 2015, 438(1): 210-211.
R446
A
2017-02-04)
(本文編輯王海燕)
10.13602/j.cnki.jcls.2017.09.01
張?jiān)娫?shī),1991年生,女,碩士研究生,研究方向:臨床實(shí)驗(yàn)室質(zhì)量管理。
王治國(guó),研究員,E-mail: zgwang@nccl.org.cn。