国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

商品條碼實驗室能力驗證統計方法應用分析

2021-02-14 03:49郝元張齡羽胡敏
中國自動識別技術 2021年6期
關鍵詞:離群正態(tài)分布條碼

郝元 張齡羽 胡敏/文

能力驗證是通過實驗室間比對,對參加者的能力進行評價的一種方式。周期性的開展檢測能力驗證,是維護與提升條碼檢測能力,掌握各檢測機構條碼檢測能力、水平和環(huán)境的重要手段;同時也是評價條碼檢測結果的一致性,發(fā)現參加實驗室中條碼檢測存在的問題,提高檢測水平,確保實驗室條碼檢測能力符合要求的有效方法;最后還是提高實驗室檢測數據的可信度,為不同實驗室提供外部質量控制的有效手段。

能力驗證評定與統計方法

選擇不同的統計方法對能力驗證的結果起至關重要的作用。能力驗證數據統計的方法有很多種,目前比較常用的方法有中位值與標準化四分位距法和傳統標準差法,本文針對這兩種方法進行介紹,并且對其進行相互對比及分析。分析結果表明對于不同的能力驗證項目以及不同的數據分布,需要考慮相關的標準和要求,選擇合適的能力驗證處理方法,否則會造成結果不準確、將“滿意”結果誤判成“不滿意”等問題。

能力驗證能力評定方法

常用的能力驗證統計方法為Z比分數法,本文采用此方法對不同數據進行分析,其目的是依據能力評定準則將數據的偏離進行定量分析,且此統計方法不需要做任何處理與變換。Z比分數定量結果計算如下:

式中:Z為Z比分數值;x為參加能力驗證實驗室結果;X為數據指定值;σ為能力評定標準差。

使用Z比分數對參加實驗室進行能力評定時,評定準則如下:

2<|Z|<3時,結果表明為“有問題”,產生警戒信號;

能力驗證數據統計與分析方法

能力驗證對數據的處理與分析提出了很大的挑戰(zhàn),雖然大多數數據分布都是近似于對稱的單峰值數據,甚至近似于正態(tài)分布,但是能力驗證數據大多都包含一定比例的偏離數據,造成此數據的原因有很多,例如在條碼檢測中,人員經驗、設備長期未校準、設備校準方法錯誤、測試環(huán)境惡劣等都會造成數據偏移。所以選擇可靠的統計方法將其剔除顯得尤為重要。

中位值與標準化四分位距法

中位值與標準化四分位距法為穩(wěn)健統計方法的一種簡單算法,此方法中需要計算出數據的中位值與上下四分位值。中位值的物理意義表示為數據分布中間位置的一個估計,即一半數據高于它,一半數據低于它,并且在Z比分數計算時,中位值即為指定值。下四分位值Q1表示有四分之三數據高于它,四分之一數據低于它。上四分位值Q3表示有四分之一數據高于它,四分之三數據低于它。具體計算方法如下:

從某次檢測中得到p個檢測數據,將其按照遞增的形式進行排列,表示為:X1,X2,X3,…Xi…Xp。計算其中位值,如下:

式中:med(x)為中位值。

此時計算四分位距(IQR)和標準化四分位距(NIQR),公式如下:

IQR=Q3-Q1

NIQR=0.7413×IQR

式中:Q1為下四分位值;Q3為上四分位值;

其中因數0.7413是從標準正態(tài)分布中計算得出。

傳統標準差統計法

傳統標準差統計法適用于接近于正態(tài)分布的數據分布,所以此方法對離群值較為敏感,如果不剔除離群值,將會對整體數據造成過大影響,所以在對數據處理之前需要用格拉布斯(Grubbs)檢驗法,檢驗與剔除明顯離群值后,再進行數據分析。

因為離群值會對于平均值、標準偏差等參數造成過大的影響,所以在計算過程中需要首先判斷數據是否離群,格拉布斯檢驗法如下所示:

式中:xn為被驗證數值;為樣本平均值;s為樣本標準差。

對于給定的顯著性水平a和測出的數據數n,通過查看格拉布斯檢驗法臨界值表得到臨界值Ga,n,如果Gn>Ga,n,則此驗證數值為離群值。

此時剔除離群值后的數據認為接近于正態(tài)分布數據,采用傳統標準差統計法進行分析。此時在Z比分數計算中,樣本平均值為指定值,樣本的標準差為能力評定標準差。傳統標準差具體計算方法如下:

從某次檢測中得到p個檢測數據,將其按照遞增的形式進行排列,表示為:x1,x2,x3,…xi…xp。

以上兩種方法均為比較簡單直接的統計方法,兩種方法的選擇主要區(qū)別在于被處理數據的分布情況,例如中位值與標準化四分位距法中,因為計算中重要的數據為中位值和高低四分位值,離群值對其影響較小,所以此方法最明顯的特點就是對離群值不敏感。而在傳統標準差法中,計算中的重要數據為平均值、標準差,受離群值影響較大,所以在采用此方法時一般需要先剔除離群值后再計算。

綜上,當數據分布接近正態(tài)分布的時候,兩種方法都可以較為準確的處理數據;當數據分布非正態(tài)分布,并且分布過于集中時,則需要剔除離群值后選擇傳統標準差法。

應用實例

應用實例一

數據為A年條碼檢測能力驗證中的可譯碼度數據,可譯碼度(decodability)為條碼檢測中條碼符號與標準譯碼算法有關的各個單元或單元組合尺寸的可用容差中,未被印制偏差占用的部分與該單元或單元組合尺寸的可用容差之比的最小值,本文不做過多描述。

本次參加實驗室數目為46個,參加本次能力驗證的可譯碼度的數據與Z比分數,見表1,并且已進行由低到高排序處理,數據計算中的幾個重要參數,見表2(下頁)。

表1

續(xù)

表2

數據分布為單個波峰的鐘形曲線,并且從曲線圖中觀察無明顯離群值,具體還需要通過離群值計算來判斷是否存在離群值,如圖1所示。由于數據總量不大,雖與正態(tài)分布曲線有所不同,但是總體分布曲線仍可近似于正態(tài)分布。

圖1 A年可譯碼度數據分布

通過格拉布斯檢驗法可判斷表1中數據無離群值,直接進行傳統法進行數據處理。表1數據整體近似于正態(tài)分布,通過中位值與標準化四分位距法和傳統標準差法計算出的Z比分數結果相近,數據中無“不滿意”結果,序號為1、45、46的結果為“有問題”;最滿意的結果為0.88,且0.88恰好為總數據的中位值,同時也為平均值;滿意結果為2號到44號,結果值區(qū)間為0.86-0.90,滿意結果區(qū)間相差0.04。此時無論選擇中位值與標準化四分位距法還是傳統標準差法均可以相對準確的計算出最滿意結果值與不滿意結果值。

應用實例二

數據為B年條碼檢測能力驗證中的可譯碼度數據,見表3。本次參加實驗室數目為47個,數據同時顯示參加本次能力驗證的可譯碼度的數據與Z比分數,并且已進行由低到高排序處理;數據計算中的幾個重要參數,見表4(下頁)。其中平均值與標準差均為剔除離群值后的結果。

表3

續(xù)

表4

數據分布為多個波峰的鐘形曲線,且為0.86的數據過于集中,從曲線圖中可觀察到存在明顯離群值,如圖2所示??傮w分布曲線與正態(tài)分布不符,所以在使用傳統標準差法進行數據處理時,需要先通過計算剔除離群值。

圖2 B年可譯碼度數據分布

通過格拉布斯檢驗法計算表3中數據,可以計算出序號為47的數據為離群值,所以在進行數據處理時將其剔除,為了驗證其是否剔除的合理,可以將47號數據帶入Z比分數計算公式中,計算出其Z比分數值為4.96,遠大于不滿意結果值,所以將其剔除是合理的。此時從傳統標準差法Z比分數可以看出,從序號2-45為滿意結果,滿意結果區(qū)間為0.84-0.89,滿意結果區(qū)間相差0.05,與表1中結果對比接近。

周期性的開展檢測能力驗證,是維護與提升條碼檢測能力,掌握各檢測機構條碼檢測能力、水平和環(huán)境的重要手段。

當使用中位值與標準化四分位距法計算Z比分數時,計算此組數據的中位值、高低四分位值,可以看出中位值和低四分位值相同,高四分位值和低四分位值相差較小,說明數據分布過于集中。假設此組數據用中位值與標準化四分位距法進行計算,表3中Z比分數只有序號4-38為滿意結果,滿意結果區(qū)間為0.85-0.87,滿意結果區(qū)間相差0.02。然而根據條碼檢測設備的相關標準GB/T 26228.1-2010《信息技術 自動識別與數據采集技術條碼檢測儀一致性規(guī)范第1部分:一維條碼》中對可譯碼度參數項的允許誤差的要求,表3中數據使用中位值與標準化四分位距法計算出的滿意結果范圍對實際應用中的要求過于嚴苛,例如表3中可譯碼度值為0.88和0.89的數據同樣出現了很多組,考慮在實際應用中的誤差要求,當此組數據剔除離群值后的平均值作為標準參考值時,0.88和0.89應該被認同為滿意結果。所以此次能力驗證應根據實際應用要求情況,選擇傳統標準差法進行數據處理。

應用實例一中的數據接近于標準的正態(tài)分布,傳統標準差法和中位值與標準化四分位距法均可作為數據處理的方法。而應用實例二中的分布非正態(tài)分布類型,其數據中有多個數據集中的地方,即分布圖中有多個波峰,并且還存在個別離群值,需要根據實際應用場景選擇合適的方法進行能力驗證統計。

所以在計算Z比分數時,當數據分布接近標準正態(tài)分布,采用中位值與標準化四分位距法和傳統標準差法的結果相近;而當數據分布較為復雜時,需要根據數據的應用需求來進行測試。

猜你喜歡
離群正態(tài)分布條碼
一種基于鄰域粒度熵的離群點檢測算法
關于n維正態(tài)分布線性函數服從正態(tài)分布的證明*
熱線互動
淺析影響商品條碼質量的主要因素
生活常態(tài)模式
日雜商品條碼質量現狀研究
一種相似度剪枝的離群點檢測算法
從數學的角度初步看離群點檢測算法
正態(tài)分布及其應用
候鳥