朱國仙
統(tǒng)計知識主要包括:隨機抽樣,用樣本估計總體,變量間的相關(guān)關(guān)系這三個部分。掌握三種抽樣方法,會用樣本的頻率分布估計總體分布,理解變量間的相關(guān)關(guān)系是學(xué)習(xí)的重點和學(xué)習(xí)目標。
一、三種抽樣方法
三種抽樣即簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣。統(tǒng)計的基本思想方法是用樣本估計總體,即用局部推斷整體,這就要求樣本應(yīng)具有很好的代表性,而樣本的良好客觀代表性,則完全依賴于抽樣方法。
例1 某鎮(zhèn)有4所中學(xué),為了解該鎮(zhèn)中學(xué)生的視力情況,用(
)抽取人數(shù)(4所中學(xué)的學(xué)生視力有一定差距)最好。
A.抽簽法
B.隨機數(shù)表法
C.系統(tǒng)抽樣法 D.分層抽樣法
解:因為4所中學(xué)的學(xué)生視力有一定的差距,所以應(yīng)采用分層抽樣的方法。選D。
二、用樣本估計總體
l.用樣本的數(shù)字特征估計總體的數(shù)字特征
從數(shù)字特征反映的意義來看,可以分為反映中心位置數(shù)字特征(平均數(shù)、巾位數(shù)、眾數(shù))及反映離散程度數(shù)字特征(標準差、方差)兩類。(1)平均數(shù):各數(shù)據(jù)的平均值;(2)中位數(shù):按從小到大的順序排列,處于中問的數(shù)(或中間兩數(shù)的平均數(shù));(3)眾數(shù):在一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)(非次數(shù));(4)標準差:樣本數(shù)據(jù)到平均數(shù)的平均距離;(5)方差:標準差的平方。
要理解樣本數(shù)字特征的意義,還要注意兩點:(1)因樣本選擇具有隨機性,故由樣本數(shù)據(jù)所得的結(jié)論有可能不準確;(2)樣本數(shù)據(jù)特征具有規(guī)律性,它隨樣本容量的增加而穩(wěn)定于總體相應(yīng)的數(shù)字特征(這個是一定的,不存在隨機性)。
例2 甲乙兩臺機床同時生產(chǎn)一種零件,10天中,兩臺機床每天生產(chǎn)出的次品數(shù)分別如下。
甲:0 l 0 2 2 0 3 1 2 4
乙:2 3 1 1 0 2 1 1 0 1
分別計算這兩組數(shù)據(jù)的平均數(shù)與標準差,從計算結(jié)果看.哪臺機床的性能較好?
解:甲機床的平均數(shù)為1.5.標準差為1.2845;乙機床的平均數(shù)為1.2.標準差為0.8718。從計算結(jié)果可知乙機床的平均數(shù)小.且標準差也小,這說明乙機床生產(chǎn)出的次品數(shù)少,且性能穩(wěn)定,所以乙機床的性能較好。
2.用樣本的頻率分布估計總體的頻率分布
頻率分布直方圖比頻率分布表更直觀、形象地反映了樣本的分布規(guī)律。
頻率分布表的優(yōu)點在于數(shù)據(jù)明顯,有利于對總體相應(yīng)數(shù)據(jù)的計算與說明;頻率分布折線圖的優(yōu)點在于數(shù)據(jù)的變化趨勢直觀,易于觀察數(shù)據(jù)分布特征,且與總體分布的密度曲線關(guān)系密切;頻率分布直方圖可兩者兼顧,但也有不足(數(shù)據(jù)不具體等)。頻率分布折線圖的優(yōu)點是反映了數(shù)據(jù)的變化趨勢。如果樣本容量足夠大,分組的組距足夠小,則這條折線將趨近于一條曲線,稱為總體分布的密度曲線。