吳平 于曉慧 許慧 山東省醫(yī)療器械產品質量檢驗中心 (濟南 250101)
抽樣檢驗是保證產品質量的主要手段之一。抽樣檢驗分為計數(shù)抽樣檢驗和計量抽樣檢驗兩類。計數(shù)抽樣檢驗以樣本中所含不合格品(或缺陷)個數(shù)為依據斷定總體質量,是目前醫(yī)療器械產品檢測中常用的方法。計量抽樣檢驗適用于質量特征值服從正態(tài)分布或其他連續(xù)分布的情況,通過檢驗出樣本的特征值(如尺寸、強度等),用一個或一組判斷規(guī)則來判定這批產品是否合格。文獻[1]報道了這兩種抽樣檢驗應用的對比情況,并說明這兩種方法各有優(yōu)缺點:計數(shù)抽樣檢驗相對來說使用方便,但不能較充分利用樣本所提供的信息,所以其功效不如計量抽樣檢驗;計量抽樣檢驗計算較為復雜,使用不如計數(shù)抽樣便利,所以適用范圍不夠廣泛。計量抽樣具有兩大優(yōu)點:一是能夠較充分地利用樣本所提供的信息,二是樣本量往往可以比計數(shù)抽樣檢驗少。
本文介紹的是一種計量抽樣檢驗方法——GB/T 3359《數(shù)據的統(tǒng)計處理和解釋 統(tǒng)計容忍區(qū)間的確定》(等同采用ISO 16269-6:2005《數(shù)據的統(tǒng)計處理和解釋 統(tǒng)計容忍區(qū)間的確定》),這種計量抽樣的方式目前在我國醫(yī)療器械行業(yè)標準中尚未被應用。
為了解讀計量抽樣技術的概念,本章假設有兩組總體數(shù)量相同的產品,各從中隨機抽取n 個試驗樣品對其某一特征值進行試驗。圖1 給出了規(guī)定合格上限的這兩組試驗樣品測得試驗結果的分布情況。從圖1 可以看出,兩組樣品的n 個試驗結果數(shù)據都在合格范圍內。如果按計數(shù)抽樣,兩種情況都判為總體合格。但在計量抽樣程序中,我們還可利用圖1 所給的樣品信息進行進一步的分析和判斷。比如,分析出A 組樣品的n 個樣品數(shù)據相對于B 組樣品的樣品數(shù)據離散度較?。藴什钶^小),但均值則離不合格限相對較近等。
圖1. 兩組試驗樣品試驗結果的對比
圖2. 總體質量分布對比
假定該產品總體的這一特征值服從正態(tài)分布,可用樣品試驗結果的均值和樣品標準差粗略繪出總體的分布情況,見圖2。抽取試驗樣品的數(shù)量越多,樣品試驗結果的均值和分布區(qū)間寬度(由樣品標準差確定)越接近于總體正態(tài)分布曲線。
從圖2 中可以看出,盡管A 組樣品的均值相對B 組樣品離不合格限較近,但由于樣品的標準差相對較小,繪出的總體正態(tài)分布曲線落在不合格范圍內的部分可忽略不計;B 組樣品均值盡管相對于A 組樣品離不合格限較遠,但因離散度較大,其總體正態(tài)分布的曲線有明顯的一部分落在了不合格范圍內(這部分的面積為產品的不合格率)。從而可以粗略判斷出A 組樣品所代表的總體質量優(yōu)于B 組樣品所代表總體質量。
像這樣,根據有限數(shù)量樣品的試驗數(shù)據分布對總體質量水平(合格品率)進行分析判定的方式便是以GB/T 3359 為典型代表的計量檢驗的基本內涵所在。GB/T 3359 所給出的方法是,在一定的置信水平下,用有限的隨機樣本的檢驗數(shù)據,利用概率統(tǒng)計學理論估計出樣本所代表的總體的“統(tǒng)計容忍區(qū)間(statistical tolerance interval)”的端點,使統(tǒng)計容忍區(qū)間內曲線下方的面積為聲稱或規(guī)定的總體質量水平(如p=0.95)。對于單側容忍區(qū)間(只規(guī)定上限或下限的情況),其端點為(+ k·S)或(-k·S)(其中 為均值,k 為“容忍極限系數(shù)”,s 為標準差),如果該端點落在合格范圍內,則表明總體質量水平滿足要求,反之則表明總體質量水平不滿足要求。對于雙側容忍區(qū)間(即規(guī)定上限又規(guī)定下限的情況),其端點為(x + k·S)和(- k·S),如果這兩個端點都落在合格范圍內,則表明總體質量水平滿足標準規(guī)定的要求;如果有任一端點落在不合格范圍內,則 表明總體質量水平不滿足標準規(guī)定的要求。
血液成分流經去白細胞濾器后的白細胞殘留量是表明白細胞濾器最重要的性能要求。由于受試驗過程復雜,成本高,血源緊缺等因素的影響,就需要考慮用計量抽樣檢驗的方法,用有限的試驗數(shù)據對總體質量給出更高能力的判定,以進一步確保產品總體的安全有效。
美國標準ANSI/AAMI BF64:2002《去白細胞濾器》中4.2.3.2 條對去白細胞濾器白細胞殘留量的要求規(guī)定如下:
“在95%的置信水平,95%以上的去白細胞濾器過濾后的血液成分的白細胞殘留量每單位血液中應不大于1.0×106?!?/p>
面對這樣的要求,檢驗人員如果不了解GB/T 3359,就不知道如何通過檢驗做出判定。該條文的意思是指:在統(tǒng)計學意義上,去白細胞濾器總體中至少要有95%的白細胞濾器要達到規(guī)定的濾除性能,而得出這種結論的置信水平(正確率)為95%。由于標準對白細胞殘留量給出的是上限要求,GB/T 3359 中規(guī)定的“方差未知時的單側統(tǒng)計容忍區(qū)間”的情況適用。根據GB/T 3359,如果滿足下列公式,則認為符合標準要求。
式中 x — n 個樣本測量結果的平均值,
k3— 容忍極限系數(shù)。根據樣本量n 的不同,按GB/T 3359 表D.4 查出的系數(shù)(如n=5 時,k3=4.203),
s — n 個樣本測量結果的標準差。
ISO 11608-1:2012《醫(yī)用針式注射系統(tǒng) 要求和試驗方法 第1 部分:針式注射系統(tǒng)》中規(guī)定的注射系統(tǒng)與普通注射器相比,系統(tǒng)給藥劑量的精度直接關系到病人的安全。由于試驗復雜,而對產品總體質量的要求又高,也需要考慮用計量抽樣檢驗的方法,用有限樣本的試驗數(shù)據對總體質量給出更高的判定,以進一步確保系統(tǒng)的安全有效。
ISO 11608-1 中對劑量精度參數(shù)給出了上限和下限要求,GB/T 3359 中規(guī)定的“方差未知時的雙側統(tǒng)計容忍區(qū)間”的情況適用。
由于ISO 11608-1 標準沒有給出具體的質量水平也沒有給出置信水平,因此供需雙方就需要在訂貨合同上進行商定。假定供需雙方在供貨合同上規(guī)定用95%置信水平和99%的批質量水平(p=0.99),可按GB/T 3359 的表A.4 確定容忍區(qū)間。假設檢驗樣品數(shù)量為n=12,查GB/T 3359 表E.4得到k4=4.156。用樣品結果的均值、標準差和k4可確定容忍區(qū)間的兩個端點:
其中 x — n 個樣本測量結果的平均值,
k4 — 容忍極限系數(shù),
s — n 個樣本測量結果的標準差。
可見,當(x + k4·s)不大于標準中規(guī)的上限,且(x-k4·s)不小于標準中規(guī)定的下限時,表明提交批在95%置信水平下,總體質量水平滿足合同規(guī)定的要求(合格率不小于99%)。
GB/T 3359 給出了總體特性服從正態(tài)分布或未知類型的連續(xù)分布兩種情況下,總體方差已知或未知時,確定單側和雙側統(tǒng)計容忍區(qū)間的程序。事先規(guī)定批質量水平和判定的置信水平則是確定容忍區(qū)間的兩個先決條件。只要醫(yī)療器械標準或合同中規(guī)定了批總體的質量水平和判定的置信水平,就可以按GB/T 3359 用樣品數(shù)據對總休質量進行判定??紤]到一般讀者掌握GB/T 3359 標準的理論比較困難,2009 版的GB/T 3359 以舉例的方式給出了不同情形下的使用方法,大大提高標準的可用性。讀者只要根據實際情況在標準中找到與之相匹配的示例,便可按示例給出的步驟正確運用并做出判定。
日常檢驗中,即使是采用計數(shù)抽樣的檢驗規(guī)則,在檢驗報告中給出或不給出各樣品的檢驗數(shù)據,給讀者提供的信息量有著很大的差別。前者能使讀者利用GB/T 3359 給出的方法對樣品所代表的總體質量做出進一步的判定,后者則不能。
在樣本量相同的情況下,相對于采用計數(shù)抽樣而言,采用計量抽樣能夠給產品提供更好的質量保證。因此,對于檢驗成本高且總體水平要求高的醫(yī)療器械,計量抽樣比傳統(tǒng)計數(shù)抽樣方法更具有優(yōu)勢,更能有效促進總體質量水平的提高,我們期待未來GB/T 3359 在我國醫(yī)療器械檢驗技術中得到應用。
[1] 易濤,計量抽樣檢驗模型及其應用研究[D],武漢,華中科技大學,2005 年
[2] GB/T 3359-2009 數(shù)據的統(tǒng)計處理和解釋 統(tǒng)計容忍區(qū)間的確定[S]
[3] ANSI/AAMI BF64:2002 去白細胞濾器[S]
[4] ISO 11608-1:2012 醫(yī)用針式注射系統(tǒng) 要求和試驗方法 第1 部分:針式注射系統(tǒng)[S]