利用統(tǒng)計知識來進行數(shù)據(jù)收集、分析與處理時,經常要通過合理的數(shù)據(jù)處理,借助樣本來估計總體,為保證數(shù)據(jù)分析過程的科學性,往往需要從總體取值規(guī)律、總體百分位數(shù)、總體集中趨勢及總體離散程度四個方向的估計來實現(xiàn),達到統(tǒng)計分析與應用的科學性與有效性。
一、總體取值規(guī)律的估計
總體取值規(guī)律的估計,主要以頻率分布、頻率分布直方圖等形式來設置,從中看出數(shù)據(jù)取值規(guī)律及其分布特點。
例1某企業(yè)招聘,一共有200名應聘者參加筆試,他們的筆試成績都在[40,100]內,按照[40,50),[50,60),…,[90,100]分組,得到如圖1所示的頻率分布直方圖,則a=______;該企業(yè)根據(jù)筆試成績從高到低進行錄取,若計劃錄取150人,估計應該把錄取的分數(shù)線定為______分。
解析:依題意,由(0.005+0.010+a+0.030+a+0.015)×10=1,解得a=0.020。因為150/200=0.75,所以1-0.75=0.25。又因為(0.005+0.010)×10=0.15,(0.005+0.010+0.020)×10=0.35,所以錄取的分數(shù)線應定在[60,70)內。設分數(shù)線定為m分,則0.15+(m-60)×0.020=0.25,解得m=65,所以應該把錄取的分數(shù)線定為65分。故填0.020;65。
點評:熟悉頻率分布直方圖的結構特征及數(shù)據(jù)特點,方便從中確定一些相關的數(shù)據(jù)信息,如圖中縱軸上的數(shù)據(jù)是各組的頻率除以組距的結果,圖中各小長方形的面積之和為1等,這些都是識圖與用圖的關鍵。
二、總體百分位數(shù)的估計
總體百分位數(shù)的估計,主要以第幾個百分位數(shù)的確定與應用等形式來設置,借助數(shù)據(jù)分析與數(shù)學運算來求解。
例2(1)某校舉行了全校大課間跑操比賽?,F(xiàn)從該校隨機抽取20個班級的比賽成績,得到如表1所示的統(tǒng)計表,由統(tǒng)計表可得這20個比賽成績的第80百分位數(shù)是()。
A.8.5B.9C.9.5D.10
(2)已知一組數(shù)據(jù)1.3,2.1,2.6,3.7,5.5,7.9,x,9.9的第65百分位數(shù)是7.9,則實數(shù)x的取值范圍是()。
A.[7.9,+∞)B.(7.9,+∞)
C.[7.9,9.9]D.(7.9,9.9)
解析:(1)依題意,由20×80%=16可知第80百分位數(shù)是第16個和第17個成績的平均數(shù)。由題表數(shù)據(jù)可知第16個成績?yōu)?,第17個成績?yōu)?0,所以第80百分位數(shù)為9+10/2=9.5。故選C。
(2)因為8×0.65=5.2,所以第65百分位數(shù)是第6個數(shù),將除去x的其他數(shù)據(jù)從小到大排序可得1.3,2.1,2.6,3.7,5.5,7.9,9.9。當xlt;7.9時,則第6個數(shù)可能是x或5.5,不符合題意;當x≥7.9時,則第6個數(shù)是7.9,符合題意。綜上所述,實數(shù)x的取值范圍是[7.9,+∞)。故選A。
點評:(1)總體百分位數(shù)的估計需要注意的兩個問題:①總體百分位數(shù)的估計的基礎是樣本百分位數(shù)的計算,因此計算準確是關鍵;②由于樣本量比較少,因此對總體的估計可能存在誤差,對總體百分位數(shù)的估計一般是估計值而非精確值。(2)確定要求的p%分位數(shù)所在區(qū)間[A,B),由頻率分布表或頻率分布直方圖知樣本中小于A的頻率為a,小于B的頻率為b,則p%分位數(shù)=A+組距×(p%-a/b-a)。