張 路,王治國
(1.北京協(xié)和醫(yī)學院研究生院,北京100730;2.北京醫(yī)院衛(wèi)生部臨床檢驗中心,北京100730)
實驗室在尋求對分析方法和儀器性能進行客觀評價及比對。但是很少有方法可以在一個公平的條件下比較系統(tǒng)性能從而作出公平合理的比較。當前的評估方法是隨意的,其依賴于不清晰的“當前技術水平”評估,或者更關注容易有形的效率指標,如速度、成本或易用性。在購買儀器的決策過程中常常忽視試驗交付質(zhì)量的分析目標和要求。而在這些方面,西格瑪度量是一個很好的工具。
西格瑪度量評價性能的過程可以比喻成一個帶箭的靶。六西格瑪度量確定靶的形狀,質(zhì)量要求確定靶的大小,方法性能數(shù)據(jù)確定箭擊中靶的位置。
西格瑪度量分析不僅提供對分析方法及儀器的客觀評估,還提供實施操作需要的關鍵設計信息。西格瑪度量分析過程的質(zhì)量控制設計方案使用定量的和圖形工具來確定方法和儀器常規(guī)監(jiān)測所需的質(zhì)量控制程序。
六西格瑪是一種廣泛接受的質(zhì)量管理體系,最著名的是通用電氣和摩托羅拉的創(chuàng)新產(chǎn)品管理[1]。制造業(yè)和服務業(yè)以及醫(yī)療機構(gòu)從醫(yī)院到實驗室已采用了六西格瑪。
六西格瑪是一種以每百萬機會的缺陷數(shù)(DPM 或DPMO)來量化過程性能的度量。六西格瑪?shù)哪繕司褪窍蚪档瓦^程中所有變異。過程中的變異會導致由于重新檢測及權(quán)變措施而浪費精力及資源。六西格瑪?shù)亩磕繕耸莿?chuàng)建一個將變異最小化到6倍標準差在容差極限之內(nèi)的過程(見圖1)。在六西格瑪性能水平上(世界級質(zhì)量性能)大約每百萬機會有3個缺陷。
圖1 不精密度(CV)、偏倚(Bias)及允許總誤差(TEa)在預測缺陷中的關系
六西格瑪尺度一般從0到6,但是如果過程變異性足夠低而降低缺陷率,也可超過六西格瑪。在醫(yī)療以外的行業(yè)中,3可被認為是過程的最低可接受的性能。當性能低于3,認為該過程本質(zhì)上是不穩(wěn)定的和不可接受的。與其他行業(yè)不同,醫(yī)療和臨床實驗室似乎是在2 到3 環(huán)境中運行。
六西格瑪?shù)牟糠止π窃谟谄淠軌蛱峁┮粋€通用基準測試的能力。西格瑪度量允許不同過程間的比較,甚至是不同機構(gòu)和不同行業(yè)間過程的比較。
在醫(yī)療領域,常規(guī)過程的西格瑪性能還鮮為人知。美國醫(yī)學研究院發(fā)布了具有里程碑意義的報告:人非圣賢孰能無過[2]。它極好地揭示了美國醫(yī)院每年有48 000到90 000例死亡可以避免。這表明醫(yī)療領域只實施3.8 水平。如果醫(yī)療達到六西格瑪水平,病死者將只有每年16~34例。
Nevalainen等[3]在臨床實驗室西格瑪評估中的開創(chuàng)性工作分析了常規(guī)檢測過程的性能,并發(fā)現(xiàn)很多都是嚴重的不足,詳見表1。
表1 常規(guī)檢驗過程的西格瑪度量
再次探討箭和靶的模型,六西格瑪提供了靶的形狀。形狀將六西格瑪性能目標定義為靶心,以及將四和五西格瑪定義為內(nèi)圈。在三西格瑪圈之外的性能認為是未中靶,這個過程不認為是“適合用途”。
知道靶子的形狀還不夠。還必須描述其大小。在六西格瑪術語中,必須定義容差極限。在檢驗中,容差極限的最好的表達形式就是允許總誤差(TEa)規(guī)范。
TEa是醫(yī)療檢驗領域廣泛接受的概念,此模型結(jié)合方法的不精密度(變異系數(shù),CV)和偏倚(Bias)來計算對試驗結(jié)果的總影響[4]。TEa表示基于患者結(jié)果解釋沒有損害患者醫(yī)療的情況下,試驗結(jié)果中可允許多少結(jié)合的不精密度和Bias。
實驗室規(guī)定質(zhì)量規(guī)范有一定的難度。大多數(shù)實驗室不知道甚至認為不需要知道他們的試驗所要求的分析質(zhì)量。數(shù)十年前,只有很少的質(zhì)量規(guī)范來源。幸運的是,現(xiàn)在可利用并易于獲得的質(zhì)量要求和目標有很多[5]。首先最重要的是美國實驗室實施的臨床實驗室改進修正法案(CLIA)能力驗證指南。CLIA 為大約80個檢驗項目提供了特定的質(zhì)量要求。由能力驗證計劃、室間質(zhì)量保證計劃或同行組比對計劃提供其他的分析基準。在美國以外,澳大利亞皇家病理學家學會(RCPA)及德國醫(yī)學協(xié)會(RiliBak)指南提供一些質(zhì)量規(guī)范來源。
臨床基準也可以用于制定質(zhì)量要求。Carmen Ricos教授及其同事自2000年提供了一個持續(xù)更新的生物學變異數(shù)據(jù)庫[6]。他們將超過300 個不同檢驗項目的不精密度、Bias及TEa 的適當規(guī)范制成表格[7]。ISO15189是新的國際實驗室質(zhì)量認可標準,它也為分析檢測提供指南。最終,越來越多的循證檢驗醫(yī)學(EBLM)研究可用于建立臨床決定區(qū)間。這些區(qū)間又可以用于確定特定試驗的質(zhì)量要求。至少,實驗室可以咨詢使用其結(jié)果的臨床醫(yī)生,通過記錄試驗結(jié)果如何解釋來確定他們試驗過程要求的質(zhì)量。
再次回到箭和靶的模型,建立質(zhì)量要求就是確定靶的大小。既然不同試驗的用途及性能不同,那么箭/過程必須擊中的靶子的大小也不同。六西格瑪和質(zhì)量要求提供靶子的形狀和大小。那么最后就是要確定箭是否擊中或擊中靶的什么位置。為此,需要有關過程實際性能的數(shù)據(jù)。
通常通過統(tǒng)計缺陷數(shù),然后將計數(shù)轉(zhuǎn)化為DPM 或DPMO來評價西格瑪性能[8]。一旦知道了DPM,可以參考標準課本中的六西格瑪表來獲得六西格瑪度量。
在實驗室,計缺陷數(shù)也是通常的六西格瑪度量技術。例如實驗室可計算一段時間內(nèi)的周轉(zhuǎn)時間(turn-around time,TAT)缺陷試驗結(jié)果數(shù)量,然后將其轉(zhuǎn)化為西格瑪性能。
然而,對于實驗室試驗結(jié)果,確定和檢出缺陷是比較困難的。當產(chǎn)生一個試驗結(jié)果時,不可能知道該試驗結(jié)果的真值應該是多少。因此,并不知道結(jié)果是否落在容差極限或質(zhì)量要求內(nèi),也就沒辦法計算試驗過程產(chǎn)生多少的缺陷數(shù)。
但實驗室可以通過使用質(zhì)控品測量變異的方法來確定過程的西格瑪度量。質(zhì)控品是一個已知值,所以可以測量觀察試驗結(jié)果的變異。有了多個質(zhì)控結(jié)果,就可以收集有關試驗過程標準差的信息,并能計算不精密度。通過比較試驗方法和參考方法間的結(jié)果,或通過分析能力驗證、同行比較或一些其他形式的室間保證計劃中試驗方法結(jié)果可以易于獲得分析檢測過程偏倚的信息。
性能數(shù)據(jù)應該是方法性能在特定時間點和特定濃度水平(最好是臨界水平即醫(yī)學決定水平)下的一個準確的反映。這樣西格瑪度量結(jié)果才最好地反映了實際的試驗性能。例如,如果臨界水平在動態(tài)范圍的低限,也應該在相同的濃度范圍內(nèi)估計偏倚,或者來自方法對比研究的回歸方程可以用于在臨界水平上估計偏倚。對于有多個臨界水平的試驗,應該在每個水平上都估計西格瑪度量。
不精密度及偏倚與西格瑪度量的關系可以用圖示說明(圖1)。如果實驗結(jié)果是正態(tài)分布,且已知標準差(不精密度)和偏倚,就可計算可接受性能范圍,相反地也可確定結(jié)果不可接受的濃度范圍(即定義TEa 的容差極限以上及以下的濃度范圍)。
不精密度和偏倚(Bias)與西格瑪度量之間的關系可總結(jié)為以下數(shù)學公式:
σ=(TEa-Bias)/CV
再次回到箭和靶的模型,西格瑪方法給了一個靶,質(zhì)量要求給了靶的大小,方法的性能數(shù)據(jù)給了箭,箭應該使工作人員盡可能地擊中靶心(六西格瑪)。
即使當方法偏倚數(shù)據(jù)丟失,也可以計算出修正的西格瑪度量。度量結(jié)果記錄了方法在理想條件下沒有偏倚出現(xiàn)時達到世界級性能的能力。此種評估的好處是實驗室可以評估除了不精密度外還剩下多少“誤差的空間”。對于一些儀器,甚至西格瑪能力度量就可允許一個實驗室作出關于方法適用性的判斷。
西格瑪度量能力=TEa/CV
可以使用方法評估決定圖(MEDx,見圖2)及其圖上的六西格瑪度量線來圖示說明方法的性能[9]。方法決定圖y軸表示Bias,x軸表示不精密度。每個特定的質(zhì)量要求都畫一種特定的圖(即10%的質(zhì)量要求會使用一個針對10%的方法決定圖),但是有不同質(zhì)量要求的多種方法可以展示在一種標準化操作規(guī)范(OPSpecs)圖上。在一種標準化方法決定圖中,每個軸都設置為100%,且通過計算質(zhì)量要求的百分率來確定試驗的x和y值,見圖3。
圖2 允許總誤差為10%的方法決定圖
圖3 標準化方法決定圖
例如,如果試驗的質(zhì)量要求為10%,CV 為1%,Bias 為2%,則標準化方法決定圖的坐標為(10,20),見圖4。
盡管帶有六西格瑪限的標準化方法決定圖將很多復雜的特征及計算合并成單獨的顯示,但圖的結(jié)果仍然符合箭和靶的模型。圖可以看做是靶的右上象限。圖上原點(0,0)周圍(及所有線以下)的區(qū)域是靶心。標繪的試驗的x及y軸坐標代表了試驗的性能及箭擊中的點。
圖4 具有樣品數(shù)據(jù)點的標準化方法決定圖
有了西格瑪度量公式的簡單參數(shù),實驗室就可以易于確定其所有方法的當前的性能。新儀器的標準方法驗證方案中獲得數(shù)據(jù)也可以用來確定性能度量。此外,要對所有的新方法實施正式的方法驗證研究,此研究在學術會議中常以壁報的形式呈現(xiàn),或以專業(yè)雜志中發(fā)布的學術報告形式,或只是以制造商經(jīng)要求提供的數(shù)據(jù)的形式。實驗室可以用這些數(shù)據(jù)計算西格瑪度量,將其與競爭儀器的西格瑪度量進行比較,將此工具作為其決策過程的一部分。這種應用對于購買新儀器之前客觀評估并比較儀器性能很有價值。它使實驗室有能力預測按照他們的臨床需要將實施某種方法而不實施某種方法。
西格瑪度量分析不限于評估及方法驗證。西格瑪度量也可以用于完善和簡化方法的操作程序。將西格瑪度量結(jié)合在質(zhì)量控制設計工具,如操作規(guī)范圖(OPSpecs)上,允許實驗室能定制和優(yōu)化實驗室實施的質(zhì)量控制程序。合理的質(zhì)量控制設計可以消除很多不經(jīng)濟的2s質(zhì)量控制實踐,用適當?shù)目刂平缦藓涂刂茰y定值個數(shù)來替代它。
圖5 TEa為10%的OPSpecs圖
OPSpecs圖提供對于規(guī)定的質(zhì)量要求取得適當?shù)姆治鲑|(zhì)量保證水平質(zhì)量控制程序所需的控制規(guī)則和控制測定值個數(shù)以及允許不精密度和偏倚的圖形描述[10]。此圖中的斜線代表實際的質(zhì)量控制程序(控制規(guī)則和控制測定值個數(shù))的誤差檢出性能。這些線從上到下的排列是根據(jù)他們的誤差檢出能力;最高的線提供最高的誤差檢出(因此,此線以下有更多的“空間”供方法擊中)。有關質(zhì)量控制的其他細節(jié),如假失控率(Pfr)、控制測定值個數(shù)(N)及批的數(shù)量(R)見圖右側(cè)的區(qū)域。x軸和y軸坐標分別代表方法的不精密度和Bias。如果該“操作點”低于OPSpecs圖的其中一條線,那么說明那條線代表的質(zhì)量控制程序?qū)⑻峁┻m當?shù)男阅埽ㄒ妶D5)。
最后再次討論箭和靶的模型,可以以西格瑪度量分析及方法決定圖相同的方式來觀察OPSpecs圖。OPSpecs圖就像靶的右上象限,原點是靶心。方法性能(箭)應該盡可能地接近靶心。然而,這次靶上不同的圈代表實驗室使用的不同的質(zhì)量控制程序。越接近于靶心,則有更多的質(zhì)量控制程序可用于質(zhì)量管理。
OPSpecs圖和方法決定圖都是針對特定的質(zhì)量要求制作而成。也可以將OPSpecs圖標準化以便于將有不同質(zhì)量要求的多個試驗顯示在同一圖中(見圖6)。
圖6 標準化OPSpecs圖樣板
西格瑪度量分析、方法決定圖及OPSpecs圖為實驗室確定他們當前方法性能及質(zhì)量控制設計,以及比較市場上具有競爭的儀器提供方便的工具。用這種方法可以進行定量計算及目測評估。這些技術為實驗室選擇正確方法并為這種方法選擇正確的質(zhì)量控制提供了一種實用的方法。其產(chǎn)生的結(jié)果就是滿足適當試驗解釋所要求質(zhì)量優(yōu)化的檢測過程。
[1]Wectgard JO.Six sigma OC design and control[M].2nd Edition.Madison WI:Westgard QC,2006.
[2]Institute of Medicine.To err is human:building a safer health system[M].Washington DC:National Academy Press,2001.
[3]Nevalainen D,Berte L,kraft C,et al.Evaluating laboratory performance on quality indicators with the six sigma scale[J].Arch Pathol Lab Med,2000,124(4):516-519.
[4]Westgard JO.Basic planning for quality[M].Madison WI:Westgard QC,2000.
[5]王治國.臨床檢驗質(zhì)量控制技術[M].3版.北京:人民衛(wèi)生出版社,2014.
[6]王治國.生物學變異與參考區(qū)間[M].北京:人民衛(wèi)生出版社,2012.
[7]Ricos C,Alvarez V,Cava F,et al.Desirable specifications for total error imprecision and bias derived from biologic variation[EB/OL].2008-12-20.[2014-10-15].http://www.westgard.com/biodatabase1.htm.
[8]王治國.臨床檢驗6σ質(zhì)量設計與控制[M].北京:人民衛(wèi)生出版社,2012.
[9]Westgard JO.A method evaluation decision chart(MEDx chart)for judging method performance[J].Clin Lab Sci,1996,8(5):277-283.
[10]Westgard JO.Charts of operational process specifications("OPSpecs charts")for assessing the precision,accuracy,and quality control needed to satisfy proficiency testing performance criteria[J].Clin Chem,1992,38(7):1226-1233.