王海宏,柳乃奎
[通標(biāo)標(biāo)準(zhǔn)技術(shù)服務(wù)(上海)有限公司,上海 200233]
蛋白質(zhì)回收率控制圖在檢測(cè)質(zhì)量控制方面的應(yīng)用
王海宏,柳乃奎
[通標(biāo)標(biāo)準(zhǔn)技術(shù)服務(wù)(上海)有限公司,上海 200233]
繪制了蛋白質(zhì)回收率的控制圖,利用控制圖中的數(shù)據(jù)以核密度估計(jì)、正態(tài)性檢驗(yàn)等統(tǒng)計(jì)方法分析數(shù)據(jù)的分布及檢測(cè)質(zhì)量。結(jié)果表明,在測(cè)定蛋白質(zhì)時(shí),酸鹽比[濃硫酸的體積(mL)∶硫酸鉀質(zhì)量(g)]約2∶1、消化時(shí)間在2.5~3.0 h時(shí),蛋白質(zhì)檢測(cè)的回收率理想。
控制圖;核密度估計(jì);正態(tài)檢驗(yàn);蛋白質(zhì)檢測(cè)
為保證實(shí)驗(yàn)室檢測(cè)結(jié)果的質(zhì)量,ISO 17025[1]和GB/T 27404[2]均提出了內(nèi)部質(zhì)量控制的要求。內(nèi)部質(zhì)量控制有多種方式,基于數(shù)據(jù)統(tǒng)計(jì)屬性的常規(guī)控制圖是常用的內(nèi)部質(zhì)量控制工具。影響測(cè)量結(jié)果的因素有偶然因素和異常因素,通過(guò)控制圖可以理解和控制測(cè)量過(guò)程并且能夠區(qū)分測(cè)量過(guò)程中的異常因素和偶然因素,當(dāng)一個(gè)測(cè)量過(guò)程中只有偶然因素時(shí),該過(guò)程就是穩(wěn)定的。在控制圖判穩(wěn)后,計(jì)算其控制限、中心線(xiàn)等參數(shù),則控制圖由用于分析轉(zhuǎn)為用于控制。在控制圖應(yīng)用過(guò)程中,每做一個(gè)點(diǎn),其目的不是關(guān)注于當(dāng)天所測(cè)數(shù)據(jù)的變異是多少,而是關(guān)注當(dāng)天數(shù)據(jù)變異的原因是否有異常因素。
當(dāng)控制圖數(shù)據(jù)積累到一定程度時(shí),可利用多種統(tǒng)計(jì)方法對(duì)其分析。筆者對(duì)過(guò)去一段時(shí)間蛋白質(zhì)的檢測(cè)質(zhì)量進(jìn)行分析總結(jié),以便更好地控制檢測(cè)質(zhì)量。
1.1 分析用控制圖的建立
收集了某實(shí)驗(yàn)室以往345個(gè)工作日控制圖的數(shù)據(jù),該質(zhì)控是在每次日常檢測(cè)蛋白質(zhì)時(shí)同時(shí)檢測(cè)色氨酸中蛋白質(zhì)含量,但不做平行試驗(yàn),然后計(jì)算回收率[3]。色氨酸回收率反映了整個(gè)蛋白測(cè)試系統(tǒng)的穩(wěn)定性,包括稱(chēng)樣、消化、蒸餾、滴定、出報(bào)告等步驟。
為便于分析,把這345個(gè)數(shù)據(jù)分為69個(gè)子組(每5個(gè)1組),子組均值和極差見(jiàn)表1。前18個(gè)子組消化時(shí)酸鹽比(濃硫酸的毫升數(shù)∶硫酸鉀克數(shù))約3∶1,消化時(shí)間為1.5~2 h;從19組到36組酸鹽比約2∶1,消化時(shí)間為2.5~3 h;37組到69組酸鹽比3∶1,消化時(shí)間為2.5~3 h。把這3個(gè)階段分別稱(chēng)為0階段、1階段、2階段。利用所有數(shù)據(jù)繪制的均值、極差控制圖分別見(jiàn)圖1、圖2。均值圖中,上下控制限=總均值±0.577×極差均值;極差圖中,上控制限=2.114×極差均值[4]。
由圖1、圖2可知,數(shù)據(jù)分層很明顯,0階段回收率明顯低于1階段和2階段的回收率。在0階段的18個(gè)子組中,回收率低于下控制限有16個(gè),占89%,原因?yàn)橄瘯r(shí)間偏短。由于0階段的回收率偏低,因此將其刪除,然后利用1階段和2階段的數(shù)據(jù)重新繪制控制圖,分別見(jiàn)圖3、圖4。
1.2 控制圖分析
每個(gè)子組均值的數(shù)學(xué)模型為:X=真值+實(shí)驗(yàn)室偏倚+方法偏倚+子組間變異。在應(yīng)用GB/T 4091[4]的判異規(guī)則時(shí)主要考慮是否超出控制限,其它異常模式僅作參考。常規(guī)控制圖的控制限分別位于中心線(xiàn)兩側(cè)的3σ距離處。如果過(guò)程處于控制狀態(tài)則大約有99.7%的點(diǎn)數(shù)落在控制限內(nèi),風(fēng)險(xiǎn)水平大約0.3%。當(dāng)數(shù)據(jù)分布形式有所偏離時(shí),此概率值會(huì)有輕微波動(dòng)。在1階段和2階段數(shù)據(jù)的均值-極差控制圖中共51個(gè)子組,子組均值都在控制限內(nèi),但1階段有2個(gè)子組均值正好等于上控制限,2階段有4個(gè)子組均值等于下控制限,提示2階段的數(shù)據(jù)分散性可能要比1階段大。
表1 子組均值和極差 %
圖1 3個(gè)階段回收率均值圖
圖2 3個(gè)階段回收率極差圖
圖3 刪除0階段后回收率均值圖
圖4 刪除0階段后回收率極差圖
延長(zhǎng)消化時(shí)間能夠提高回收率,這在圖上表現(xiàn)很明顯。起初發(fā)現(xiàn)回收率一直偏低后,按照IDF[3]中的建議,在消化液澄清后,再消化1 h。消化效果與消化時(shí)間與消化液的溫度有關(guān)。增大硫酸鉀的量,會(huì)提高沸點(diǎn),從而加強(qiáng)消化效果,沸點(diǎn)提高后,消化時(shí)間可適當(dāng)降低。不過(guò)消化溫度和時(shí)間不能過(guò)高和過(guò)長(zhǎng),因?yàn)榱蛩徕浖尤肓坎荒芴?,否則溫度太高,生成的硫酸氫銨也會(huì)分解,放出氨而造成損失。因此,一般會(huì)同時(shí)使用另外一種質(zhì)控樣硫酸銨。硫酸銨的回收率反映了消化是否過(guò)于激烈,同時(shí)也反映蒸餾和滴定等步驟的效果。
對(duì)1階段和2階段的回收率進(jìn)行t檢驗(yàn),P<0.05,統(tǒng)計(jì)上有顯著差別,這可能是由于酸鹽比不同所致,2∶1酸鹽比的回收率要略好于3∶1的回收率。1階段回收率的均值為99.29%,2階段回收率均值為99.12%,其差值為0.17%,從技術(shù)上看,這個(gè)均值的差別已很小。
計(jì)量控制圖的一個(gè)前提假設(shè)是數(shù)據(jù)服從正態(tài)分布,但允許小的偏離。由于中心極限定理,平均值總會(huì)趨向于正態(tài)分布,即使單個(gè)觀測(cè)值不服從正態(tài)分布時(shí)也如此。鑒于此,“定期檢查正態(tài)性假設(shè)的持續(xù)有效性是明智的”[4]。對(duì)回收率的數(shù)據(jù)分布進(jìn)一步了解后,對(duì)不確定度評(píng)定等涉及到數(shù)據(jù)分布的質(zhì)控項(xiàng)目能提供深入的信息。判斷正態(tài)性有多種統(tǒng)計(jì)方法,如Kolmogorov-Smirnov檢驗(yàn)、Shapiro-Wilk檢驗(yàn),Anderson-Darling檢驗(yàn)、偏度和峰度檢驗(yàn)等[5,6]。該實(shí)驗(yàn)使用核密度估計(jì)[7]作圖并結(jié)合Shapiro-Wilk檢驗(yàn)法進(jìn)行分析。
2.1 核密度估計(jì)原理
對(duì)色氨酸回收率數(shù)據(jù)作核密度函數(shù)估計(jì),其原理是在對(duì)密度估計(jì)時(shí)讓每一個(gè)樣本都起一定的作用,但作用的大小與樣本xi到x點(diǎn)的距離有關(guān),核函數(shù)的選定依賴(lài)于各樣本作用距離增加而下降的方式和速度。采用高斯核的核密度估計(jì),函數(shù)為:
n——樣本容量,其值為252;
xi——各樣本的數(shù)據(jù),即為色氨酸的回收率數(shù)據(jù)。
窗寬的大小影響所得曲線(xiàn)的形狀,按照文獻(xiàn)方法[5]計(jì)算最優(yōu)窗寬。對(duì)于任意x,所有樣本xi對(duì)x處密度的貢獻(xiàn)可由公式得到,因此可繪制x-散點(diǎn)圖反映數(shù)據(jù)分布。
2.2 色氨酸回收率的核密度估計(jì)
窗寬等信息見(jiàn)表2。圖5是利用子組均值繪制的核密度估計(jì)曲線(xiàn),0階段和1階段分布基本對(duì)稱(chēng),為單峰,近似正態(tài)分布。相比1階段和2階段,0階段峰形較寬,數(shù)據(jù)分散性太大,這和其標(biāo)準(zhǔn)偏差比1階段和2階段大很多相一致。
表2 3個(gè)階段的樣本量、標(biāo)準(zhǔn)偏差和窗寬
圖5 回收率核密度估計(jì)曲線(xiàn)
2.3 核密度分布曲線(xiàn)和正態(tài)分布曲線(xiàn)的比較
利用表1中3個(gè)階段的密度最高點(diǎn)和標(biāo)準(zhǔn)差作為一個(gè)正態(tài)分布的均值和標(biāo)準(zhǔn)差,繪制正態(tài)分布圖并與各階段核密度曲線(xiàn)進(jìn)行比較。用Shapiro-Wilk法對(duì)這3個(gè)階段子組均值作正態(tài)性檢驗(yàn),得到0,1,2階段的P值分別為0.594,0.649,0.391(2011 年10月24日用SPSS檢驗(yàn)P值分別為0.590,0.635,0.369),P值越高說(shuō)明越接近正態(tài)分布,這與圖6中核密度曲線(xiàn)與正態(tài)分布曲線(xiàn)的關(guān)系是一致的。
圖6 核密度分布曲線(xiàn)
綜合分析正態(tài)性、回收率和標(biāo)準(zhǔn)偏差3個(gè)指標(biāo)的情況,得出1階段的實(shí)驗(yàn)條件最好。因此該實(shí)驗(yàn)室應(yīng)把蛋白質(zhì)檢測(cè)條件調(diào)整到酸鹽比為2∶1、消化時(shí)間為2.5~3.0 h。
[1]ISO/IEC17025:2005 檢測(cè)和校準(zhǔn)實(shí)驗(yàn)室能力的通用要求[S].
[2]GB/T27404–2008 實(shí)驗(yàn)室質(zhì)量控制規(guī)范 食品理論檢測(cè)社[S].
[3]ISO 8968–2:2001 (IDF 20–2:2001) Milk––Determination of nitrogen content––Part 2:Block-digestion method (Macro method)[S].
[4]GB/T 4091–2001 常規(guī)控制圖[S].
[5]劉慶武,胡志艷.如何用SPSS、SAS 統(tǒng)計(jì)軟件進(jìn)行正態(tài)性檢驗(yàn)[J].湘南學(xué)院學(xué)報(bào)(自然科學(xué)版),2005,7(3):56-58.
[6]朱紅兵,何麗娟.在SPSS10.0 中進(jìn)行數(shù)據(jù)資料正態(tài)性檢驗(yàn)的方法[J].首都體育學(xué)院學(xué)報(bào),2004,16,9(3):123-125.
[7]SilvermanB W. Density estimation for statistics and data analysis [M]. London:Chapman and Hall,1986.
Applycation of Protein Recovery Control Chart in the Quality Control of Detection
Wang Haihong, Liu Naikui
[SGS–CSTC Standard Technical Service (Shanghai) Co.,Ltd., Shanghai 200233, China]
Control chart of protein recovery was drawn. The information obtained from the chart was used to analyse data distribution and quality of detection by using kernel density estimation and normality test. Analysis results showed that protein recovery was satisfied when acid-salt ratio (volume of concentrated sulfuric acid∶mass of potassium sulphate) was 2∶1 and digestion time was 2.5–3.0 h.
control chart; kernel density estimation; normality test; protein determination
TS207.7
A
1008-6145(2012)01-0082-03
聯(lián)系人:柳乃奎;E-mail:Leo.Liu@sgs.com
2011-11-13
10.3969/j.issn.1008-6145.2012.01.026