蒲雪梅 文志寧 王智猛 祝團飛 李夢龍
(四川大學化學學院 四川成都 610064)
(1)
對于無限次測量,則為:
(2)
按上述陳述,又將出現(xiàn)了第2個問題,為什么公式中出現(xiàn)的是測量次數n而不是樣本數m(即平均值的個數m)?
其實,出現(xiàn)這兩個問題的根源主要是對統(tǒng)計學方面知識了解得不深。為了幫助大家理解平均值標準偏差的概念,我們在這里根據一些相關的統(tǒng)計學知識,并結合在教學和科研實踐中的體會,談談對這兩個問題的一些粗淺理解。
上面摘錄的文獻[1]中的陳述可以表達為:從樣本總體X中抽出m個樣本,每個樣本平行測定的次數為n,即有:
……
需要指出的是:這里提到的“一個樣本”并不是通常分析化學測量中所指的一個具體的實物試樣,而是自總體中隨機抽出的一組測量值,又叫子樣,樣本中所含個體(測量值)的數目n,稱為樣本容量,即樣本的大小[2]。從統(tǒng)計學角度出發(fā),m和n應該足夠大才有意義。
關于如何得到平均值的標準偏差,文獻[1]明確指出,可以通過單次測量結果的標準偏差來估計它的值(這里的“單次”指的是m=1,即只取一個樣本進行n次平行測量),也就是采用式(1)或式(2)計算得到。在推導平均值的標準偏差與單次測量結果的標準偏差之間的關系前,我們先介紹一些有關隨機變量方差的性質。要提請注意的是,以下的數學推導和表達都是以滿足統(tǒng)計學要求的大量隨機變量為基礎的。
2.1 幾個關于獨立同分布隨機變量的重要方差性質[3]
所謂獨立同分布是指:如果一組隨機變量有著相同的概率分布,并且相互之間的取值互不影響(即獨立),那么這組隨機變量就滿足獨立同分布。
假設有一總體X,其期望E(X)、方差D(X)存在,且方差D(X)=σ2,對于服從總體X的一組獨立隨機變量y1,y2,…,yn,(其中n可為任意的有限正整數),它們有以下的方差性質:
D(yi)=σ2
(3)
D(Cyi)=C2D(yi) (C為常數)
(4)
D(y1+y2+…+yn)=D(y1)+D(y2)+…+D(yn)=nσ2
(5)
(6)
因此有:
(7)
將式(7)代入式(6),并結合方差性質式(4)可得:
(8)
又由于xij是一組服從總體X的獨立隨機變量,根據方差性質式(5),可得:
(9)
當用單次測量(即對m個樣本的其中一個進行n次平行測量)的標準偏差來估計平均值的標準偏差時,因為m=1 ,所以式(9)可以簡化為:
上式即為式(2),故式(2)只與單次測量的次數有關。
同樣地,當進行有限次測量時,有:
(1)
由此可見,式(1)和式(2)中沒有出現(xiàn)m的原因在于:式(1)和式(2)中平均值的標準偏差是通過單次測量的標準偏差(即m=1)來估計的。
其實,在教學中并不需要學生掌握此公式的推導,重要的是要理解此公式在分析化學中的意義。我們認為此公式的化學意義主要體現(xiàn)在以下兩方面:① 通過公式所表現(xiàn)的平均值的標準偏差隨測量次數(即樣本容量n)的增加而降低的趨勢,可以獲取這樣的信息:增加測量次數可以減少隨機誤差,提高精密度。所以,在實際分析中,總是要平行稱取幾個試樣組成一個樣本進行平行測量。② 由于在分析實踐中無法知道總體的真實值,我們希望通過少量的測量數據或者說單組測量(m=1)的幾個平行數據來估計包括總體平均值在內的可靠性范圍,即置信區(qū)間:
(10)
在這里,我們要避免另外一個理解誤區(qū)。仍以上述測定面粉中的鎘實驗為例:稱量1份面粉試樣,溶樣、定容以后,用原子吸收平行測定3次,不少學生把這里的平行測定次數3當作了樣本容量n。實際上,此時對于面粉試樣的總體來說,不但樣本數m=1,而且樣本容量n=1(只稱了一個樣),因此,不能用這3次測定的平均值和偏差估算總體均值的置信區(qū)間。
本文在撰寫過程中,作者曾與浙江大學陳恒武教授和吉林大學蘇星光教授進行過多次有益的討論,特此致謝。
參 考 文 獻
[1] 武漢大學.分析化學(上冊).第5版.北京:高等教育出版社,2006
[2] 鄭用熙.分析化學中的數理統(tǒng)計方法.北京:科學出版社,1986
[3] 盛驟,謝式千,潘承毅.概率論與數理統(tǒng)計.第3版.北京:高等教育出版社,2001