文/林俊
計(jì)量測試是一項(xiàng)專業(yè)性較強(qiáng)的工作,此項(xiàng)工作最為基本的要求是確保數(shù)據(jù)的精確性,為了實(shí)現(xiàn)這一目標(biāo),操作人員應(yīng)當(dāng)具有豐富的經(jīng)驗(yàn),并且采用的儀器設(shè)備必須具有較高的精密性。然而,受到一些因素的影響,使得計(jì)量測試中常常會出現(xiàn)異常數(shù)據(jù),從而導(dǎo)致計(jì)量結(jié)果的準(zhǔn)確性降低,造成異常數(shù)據(jù)的原因有以下幾個(gè)方面:
(1)操作人員缺乏工作經(jīng)驗(yàn),在測試的過程中會出現(xiàn)各種失誤,這樣會造成檢測結(jié)果的準(zhǔn)確性不足,異常數(shù)據(jù)也會隨之出現(xiàn);
(2)測試儀器受到外界因素的干擾,如機(jī)械振動等,或是選用的儀器本身存在缺陷,由此會增大異常數(shù)據(jù)出現(xiàn)的可能性;
(3)計(jì)量測試的過程中,儀器受到電磁干擾,或是由于供電電壓不穩(wěn)定,使儀器發(fā)生故障,進(jìn)而引起數(shù)據(jù)異常;
(4)儀器在長時(shí)間使用后,未進(jìn)行及時(shí)校驗(yàn),部分元器件損壞、零部件松脫,致使測試過程受到影響,導(dǎo)致檢測結(jié)果不準(zhǔn)確;
(5)在計(jì)量測試的過程中,通常會針對可能出現(xiàn)的異常數(shù)據(jù)選擇相應(yīng)的剔除方法,若是方法選擇的不恰當(dāng),則無法對異常數(shù)據(jù)進(jìn)行有效剔除。
在計(jì)量測試過程中,對異常數(shù)據(jù)進(jìn)行判斷時(shí),應(yīng)當(dāng)選擇正確的方法。目前,較為常用的判斷方法有以下幾種:
2.1.1 拉依達(dá)判斷法
這種方法基于的是拉依達(dá)準(zhǔn)則,具體的判定原理如下:假定某一組測試數(shù)據(jù)當(dāng)中只包含隨機(jī)誤差,通過計(jì)算處理可以獲得標(biāo)準(zhǔn)偏差,根據(jù)特定的概率可確定出一個(gè)區(qū)間范圍,如果誤差超出這個(gè)區(qū)間范圍,則可將之判定為粗大誤差,含有粗大誤差的數(shù)據(jù)則為異常數(shù)據(jù),需要進(jìn)行剔除。該方法可對正態(tài)或是接近正態(tài)分布的數(shù)據(jù)進(jìn)行有效處理,應(yīng)用時(shí),需要確保測試次數(shù)充分,若是測試次數(shù)不足,則會造成粗大誤差的可靠性降低。所以當(dāng)測試次數(shù)較少時(shí),不宜采用該方法對異常數(shù)據(jù)進(jìn)行判斷。該方法具體的判斷過程如下:
對被測試量進(jìn)行等精度測量,由此可獲得x1, x2, …xn,隨后求取算術(shù)平均值x和剩余誤差vi,其中vi可用下式表示:
上式中i=(1, 2, …n),在根據(jù)貝賽爾公式可以計(jì)算出標(biāo)準(zhǔn)偏差σ。如果某個(gè)測量值xb的剩余誤差vb(1≤b≤n),并滿足下式:
則可認(rèn)為xb是含有粗大誤差值的壞值,應(yīng)當(dāng)予以剔除。
2.1.2 格拉布斯判斷法
這種方法是以測試量的正態(tài)分布作為判斷前提,從理論的角度上講,該方法較為嚴(yán)謹(jǐn),操作過程也比較簡便。該方法的判定原理如下:當(dāng)某個(gè)測量值的殘余誤差的絕對值|vi|>Gg時(shí),則可判定該值當(dāng)中存在相對較大的誤差,應(yīng)當(dāng)對誤差進(jìn)行剔除。該方法對異常數(shù)據(jù)的判斷過程如下:
按照測量結(jié)果偏離真值的程度(誤差理論),想要對偶然誤差進(jìn)行有效剔除,至少需要進(jìn)行10次以上的測量,為了確保測量精度和響應(yīng)速度,可將15次確定為一個(gè)單位,當(dāng)獲得15次測量數(shù)據(jù)后,其中可能會含有較大的誤差,可以通過分檢的方法,將可疑值剔除掉。當(dāng)測量值xi對應(yīng)的殘差vi滿足下式時(shí)應(yīng)當(dāng)該數(shù)據(jù)舍去:
在上式當(dāng)中,x表示n次采集到的平均值(∑xi)/n;σ(x)表示測量數(shù)據(jù)組的標(biāo)準(zhǔn)差,可由貝賽爾公式求??;中的n表示測量次數(shù),表示顯著性水平(可取0.01或0.05)。當(dāng)測量次數(shù)n=15,顯著性水平時(shí),則隨后可將15次的采集值存入到同一個(gè)數(shù)組當(dāng)中,求取平均值,對殘差進(jìn)行計(jì)算,進(jìn)而求出σ(x),并將殘差的絕對值與2.41倍的σ(x)進(jìn)行比較,剔除可疑值后再次求取平均值,然后重復(fù)上述步驟驗(yàn)證是否仍有可疑值。在實(shí)際應(yīng)用中發(fā)現(xiàn),基本不需要重復(fù),通常第一遍即可達(dá)到要求。
2.1.3 t-檢驗(yàn)法
這是一種假設(shè)檢驗(yàn)的方法,可在測量次數(shù)n<30的條件下使用,通過對隨機(jī)變量的數(shù)學(xué)期望進(jìn)行檢驗(yàn),看是否與某個(gè)已知的值相等。該方法的檢驗(yàn)過程如下:
假設(shè)(x1, x2, …xn)為正態(tài)隨機(jī)變量x的樣本,期望Mx與已知值m0相等。按照統(tǒng)計(jì)理論,如果上述假設(shè)成立,則統(tǒng)計(jì)量服從自由度n-1的t-分布。當(dāng)正態(tài)隨機(jī)變量小于樣本時(shí),可用該方法對數(shù)學(xué)期望進(jìn)行檢驗(yàn),看是否存在較為顯著的差異,若是有則可將之剔除。
在計(jì)量測試中,對異常數(shù)據(jù)進(jìn)行處理時(shí),異常值的判斷是關(guān)鍵環(huán)節(jié),下面根據(jù)上述的判斷方法,結(jié)合實(shí)例,分析異常數(shù)據(jù)的處理。例如,通過計(jì)量測試獲得如下一組數(shù)據(jù):10.002、10.204、10.218、10.228、10.230、10.312、10.320、10.342、10.346。按照上文中的判斷方法,對該組數(shù)據(jù)中的異常值進(jìn)行剔除,將置信概念的取值設(shè)定為95%,則顯著性水平在該組數(shù)據(jù)中,懷疑最大的10.346為異常值,將整組數(shù)據(jù)相加之后,求出平均值為10.2317,與之相對應(yīng)的x1的平均值為10.2331,δ=0.0912,s=0.0888。通過綜合計(jì)算之后,得出10.346為異常值,應(yīng)當(dāng)從該組數(shù)據(jù)中予以剔除。應(yīng)用上文中的三種判斷方法對該組數(shù)據(jù)進(jìn)行判定,10.346均為異常值。格拉布斯判斷法中的與10.002-10.2317非常接近,由此說明該方法在三種方法中的效果最佳。計(jì)量測試異常數(shù)據(jù)的處理思路如下:先做一個(gè)統(tǒng)計(jì)量,當(dāng)這個(gè)統(tǒng)計(jì)量處于規(guī)定范圍內(nèi)時(shí),可認(rèn)為其服從正態(tài)分布,否則可判定相關(guān)數(shù)據(jù)不服從正態(tài)分布,即其中包含異常數(shù)據(jù),需要進(jìn)行剔除。
綜上所述,計(jì)量測試是一項(xiàng)較為復(fù)雜且系統(tǒng)的工作,在具體的測試過程中,為提高結(jié)果的準(zhǔn)確性,需要對異常數(shù)據(jù)進(jìn)行剔除。本文提出三種異常值的判斷方法,并通過實(shí)例分析,驗(yàn)證了三種方法的效果,結(jié)果表明,格拉布斯判斷法的效果最佳。