国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

隨機(jī)抽樣與用樣本估計(jì)總體

2015-08-03 13:38趙銀倉王健
關(guān)鍵詞:平均數(shù)直方圖總體

趙銀倉++王健

隨機(jī)抽樣是研究如何合理收集數(shù)據(jù),而用樣本估計(jì)總體則是研究如何整理與分析數(shù)據(jù),從樣本的數(shù)據(jù)特征來了解整體的情況,由于樣本的隨機(jī)性,所以可以透過部分看整體. 在學(xué)習(xí)這一部分知識(shí)時(shí),要通過實(shí)際問題情境,學(xué)習(xí)隨機(jī)抽樣、樣本估計(jì)總體的基本方法,體會(huì)用樣本估計(jì)總體及其特征的思想;通過解決實(shí)際問題,較為系統(tǒng)地經(jīng)歷數(shù)據(jù)收集與處理的全過程,體會(huì)統(tǒng)計(jì)思維與確定性思維的差異. 由于抽樣方法與用樣本估計(jì)總體所體現(xiàn)的統(tǒng)計(jì)思想是一種重要的思想方法,所以這部分成為高考每年必考的內(nèi)容.

重點(diǎn)難點(diǎn)

隨機(jī)抽樣與用樣本估計(jì)總體要求在解決統(tǒng)計(jì)問題的過程中,用隨機(jī)抽樣方法從總體中抽取樣本,進(jìn)一步體會(huì)用樣本估計(jì)總體的思想,會(huì)用樣本的頻率分布估計(jì)總體分布,會(huì)用樣本的基本數(shù)字特征估計(jì)總體的基本數(shù)字特征;初步體會(huì)樣本頻率分布和數(shù)字特征的隨機(jī)性.

在歷年高考中,該部分知識(shí)在選擇題、填空題和解答題中都有出現(xiàn),考查的方向主要有抽樣方法的選擇,繪制、識(shí)別頻率分布表和頻率分布直方圖、頻率折線圖、莖葉圖,并能應(yīng)用這些圖表解決一些簡單實(shí)際問題.

重點(diǎn):掌握抽樣方法的特點(diǎn)及它們之間的區(qū)別與聯(lián)系,面對(duì)實(shí)際問題能合理選擇抽樣方法抽取樣本;繪制頻率分布表和頻率分布直方圖、頻率折線圖、莖葉圖,會(huì)計(jì)算方差和標(biāo)準(zhǔn)差,并能計(jì)算樣本平均數(shù),還能進(jìn)一步解釋這些統(tǒng)計(jì)數(shù)據(jù)的實(shí)際意義.

難點(diǎn):實(shí)際問題中抽樣方案的確定;頻率分布表和頻率分布直方圖的理解與應(yīng)用,如計(jì)算平均數(shù)等.

方法突破

1.?搖隨機(jī)抽樣與用樣本估計(jì)總體的基本思路

(1)簡單隨機(jī)抽樣的特點(diǎn):總體中個(gè)體性質(zhì)相似,無明顯層次;總體容量較小,尤其是樣本容量較?。挥煤唵坞S機(jī)抽樣方法抽出的個(gè)體帶有隨機(jī)性,個(gè)體間無固定間距.

系統(tǒng)抽樣的特點(diǎn):適用于元素個(gè)數(shù)很多且均衡的總體,各個(gè)個(gè)體被抽到的機(jī)會(huì)均等;總體分組后,在起始部分抽樣時(shí),采用簡單隨機(jī)抽樣.

分層抽樣的特點(diǎn):適用于總體由差異明顯的幾部分組成的情況;分層后,在每一層抽樣時(shí)可采用簡單隨機(jī)抽樣或系統(tǒng)抽樣.

(2)作頻率分布直方圖的步驟:①求極差;②確定組距和組數(shù);③將數(shù)據(jù)分組;④列頻率分布表;⑤畫頻率分布直方圖.

(3)標(biāo)準(zhǔn)差與方差:標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大小,標(biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大,標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小,因?yàn)榉讲钆c原始數(shù)據(jù)的單位不同,且平方后可能夸大了偏離程度,所以雖然方差與標(biāo)準(zhǔn)差在刻畫樣本數(shù)據(jù)的分散程度上是一致的,但在解決實(shí)際問題時(shí),一般多用標(biāo)準(zhǔn)差.

2. 隨機(jī)抽樣與用樣本估計(jì)總體的基本策略

(1)理解抽樣方法的區(qū)別與聯(lián)系

簡單隨機(jī)抽樣是系統(tǒng)抽樣與分層抽樣的基礎(chǔ),是一種等概率的抽樣,由定義應(yīng)抓住以下特點(diǎn):它要求總體個(gè)數(shù)較少;它是從總體中逐個(gè)抽取的;它是一種不放回抽樣.

系統(tǒng)抽樣又稱等距抽樣,號(hào)碼序列一確定,樣本即確定了,但要求總體中不能含有一定的周期性,否則其樣本的代表性是不可靠的,甚至?xí)?dǎo)致明顯的偏向.

(2)分析總體特征,選擇合理的抽樣方法. 抽樣方法經(jīng)常交叉使用,比如系統(tǒng)抽樣中的第一均衡部分,可采用簡單隨機(jī)抽樣,分層抽樣中,若每層中的個(gè)體數(shù)量仍很大時(shí),則可輔之以系統(tǒng)抽樣.

(3)準(zhǔn)確繪制頻率分布表和頻率分布直方圖、頻率折線圖、莖葉圖. 通過頻率分布表和頻率分布直方圖可以對(duì)總體作出估計(jì),這就依賴于繪制圖表的準(zhǔn)確性.在計(jì)數(shù)和計(jì)算時(shí)一定要準(zhǔn)確,在繪制小矩形時(shí),寬窄要一致,這樣才能使繪制的頻率分布圖表準(zhǔn)確地反應(yīng)實(shí)際問題.

(4)理解估計(jì)總體的有關(guān)概述并熟記有關(guān)公式. 若取值x1,x2,…,xn的頻率分別為p1,p2,…,pn,則其平均值為x1p1+x2pn+…+xnpn. 若取值x1,x2,…,xn的平均數(shù)為■,方差為s2,則ax1+b,ax2+b,…,axn+b的平均數(shù)為a■+b,方差為a2s2.

典例精講

■例1 (2013年高考陜西卷)某單位有840名職工,現(xiàn)采用系統(tǒng)抽樣方法,抽取42人做問卷調(diào)查,將840人按1,2,…,840隨機(jī)編號(hào),則抽取的42人中,編號(hào)落入?yún)^(qū)間[481,720]的人數(shù)為( )

A. 11 B. 12 C. 13 D. 14

思索 當(dāng)總體中所含的個(gè)體數(shù)比較大,并且個(gè)體間沒有顯著差異,被抽取的概率一樣時(shí),采用系統(tǒng)抽樣法. 本題從840中用系統(tǒng)抽樣抽取42人,則每20人為一組,每組抽取一人. 因此只需要按等間隔抽取規(guī)則求出編號(hào)落入?yún)^(qū)間[481, 720]的組數(shù),并且還要弄清首未兩組是否為全體.

破解 根據(jù)從編號(hào)1開始,每20人一組等距分組規(guī)則,第1組的編號(hào)區(qū)間為[1,20],第2組的編號(hào)區(qū)間為[21,40],以此類推,編號(hào)落入?yún)^(qū)間[481,720]的為第24組至第35組的全體,共有12組,所以抽取的42人中, 編號(hào)落入?yún)^(qū)間[481,720]的人數(shù)為12人,故選B.

■例2 (2014年高考廣東卷)已知某地區(qū)中小學(xué)生人數(shù)和近視情況分別如圖1和圖2所示. 為了了解該地區(qū)中小學(xué)生的近視形成原因,用分層抽樣的方法抽取2%的學(xué)生進(jìn)行調(diào)查,則樣本容量和抽取的高中生近視人數(shù)分別為( )

圖1 圖2

A. 200,20?搖 B. 100,20?搖?搖?搖?搖

C. 200,10 ?搖?搖 D. 100,10

思索 由于中小學(xué)生的年齡差異明顯,因而近視情況的差異很大,所以選用分層抽樣方法. 本題考查統(tǒng)計(jì)圖表的實(shí)際應(yīng)用,問題的關(guān)鍵是識(shí)圖,讀懂題目給出的圖表,明白其中數(shù)據(jù)的意義.

破解 根據(jù)題中的圖可知,該地區(qū)中小學(xué)生一共有10000人,因?yàn)橐槿?%的學(xué)生,所以樣本容量是10000×2%=200. 因?yàn)楦咧猩慕暵蕿?0%,所以抽取的高中生近視的人數(shù)為2000×2%×50%=20. 故選A.endprint

■例3 (2014年高考北京卷)從某校隨機(jī)抽取100名學(xué)生,獲得了他們一周課外閱讀時(shí)間(單位:小時(shí))的數(shù)據(jù),整理得到數(shù)據(jù)分組及頻數(shù)分布表和頻率分布直方圖(如圖3).

圖3

(1)從該校隨機(jī)選取一名學(xué)生,試估計(jì)這名學(xué)生該周課外閱讀時(shí)間少于12小時(shí)的概率;

(2)求頻率分布直方圖中的a,b的值;

(3)假設(shè)同一組中的每個(gè)數(shù)據(jù)可用該組區(qū)間的中點(diǎn)值代替,試估計(jì)樣本中的100名學(xué)生該周課外閱讀時(shí)間的平均數(shù)在第幾組.(只需寫出結(jié)論)

思索 本題要能夠讀懂頻數(shù)分布表及直方圖,明確圖表中每個(gè)數(shù)據(jù)的數(shù)學(xué)意義:頻數(shù)分布表以2小時(shí)為單位分組,直方圖中矩形的高為頻率與組距的比,寬為閱讀時(shí)間,面積為閱讀時(shí)間在該范圍的頻率,直方圖中小矩形的面積和為1. 從頻率分布直方圖來估計(jì)平均值,等于直方圖中每個(gè)小矩形的面積乘小矩形底邊中點(diǎn)的橫坐標(biāo)之和.

破解 (1)根據(jù)頻數(shù)分布表,100名學(xué)生中課外閱讀時(shí)間不少于12小時(shí)的學(xué)生共有6+2+2=10(名),所以樣本中的學(xué)生課外閱讀時(shí)間少于12小時(shí)的頻率是1-■=0.9. 故從該校隨機(jī)選取一名學(xué)生,估計(jì)其課外閱讀時(shí)間少于12小時(shí)的概率為0.9.

(2)課外閱讀時(shí)間落在組[4,6)內(nèi)的有17人,頻率為0.17,所以a=■=■=0.085. 課外閱讀時(shí)間落在組[8,10)內(nèi)的有25人,頻率為0.25,所以b=■=■=0.125.

(3)由頻數(shù)分布圖中的數(shù)據(jù)可得平均數(shù)為■=0.06×1+0.08×3+0.17×5+0.22×7+0.25×9+0.12×11+0.06×13+0.02×15+0.02×17=7.68,所以樣本中的100名學(xué)生課外閱讀時(shí)間的平均數(shù)在第4組.

■例4 (2014年高考湖南卷)某企業(yè)有甲、乙兩個(gè)研發(fā)小組,為了比較他們的研發(fā)水平,現(xiàn)隨機(jī)抽取這兩個(gè)小組往年研發(fā)新產(chǎn)品的結(jié)果如下:(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b). 其中a,a分別表示甲組研發(fā)成功和失?。籦,b分別表示乙組研發(fā)成功和失敗.

(1)若某組成功研發(fā)一種新產(chǎn)品,則給該組記1分,否則記0分. 試計(jì)算甲、乙兩組研發(fā)新產(chǎn)品的成績的平均數(shù)和方差,并比較甲、乙兩組的研發(fā)水平.

(2)若該企業(yè)安排甲、乙兩組各自研發(fā)一種新產(chǎn)品,試估計(jì)恰有一組研發(fā)成功的概率.

思索 本題綜合考查隨機(jī)樣本的收集,用樣本的平均數(shù)與方差估計(jì)總體. 根據(jù)規(guī)定用1和0來表示研發(fā)的成功與失敗,將隨機(jī)抽取的研發(fā)結(jié)果轉(zhuǎn)化為關(guān)于反映甲、乙成績的兩組數(shù)值,計(jì)算它們的平均值與方差,以此來比較它們的研發(fā)水平.

破解 (1)甲組研發(fā)新產(chǎn)品的成績?yōu)?,1,1,0,0,1,1,1,0,1,0,1,1,0,

1,其平均數(shù)為x甲=■=■,方差為s2甲=■1-■?搖2×10+0-■?搖2×5=■.

乙組研發(fā)新產(chǎn)品的成績?yōu)?,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均數(shù)為x乙=■=■,方差為s2乙=■1-■?搖2×9+0-■?搖2×6=■.

因?yàn)閤甲>x乙,s2甲

(2)記E={恰有一組研發(fā)成功}.在所抽得的15個(gè)結(jié)果中,恰有一組研發(fā)成功的結(jié)果是(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),共7個(gè),故事件E發(fā)生的頻率為■. 將頻率視為概率,即得所求概率為P(E)=■.

變式練習(xí)

1. (2014年高考天津卷)某大學(xué)為了了解在校本科生對(duì)參加某項(xiàng)社會(huì)實(shí)踐活動(dòng)的意向,擬采用分層抽樣的方法,從該校四個(gè)年級(jí)的本科生中抽取一個(gè)容量為300的樣本進(jìn)行調(diào)查. 已知該校一年級(jí)、二年級(jí)、三年級(jí)、四年級(jí)的本科生人數(shù)之比為4∶5∶5∶6,則應(yīng)從一年級(jí)本科生中抽取________名學(xué)生.

2. 為了考察某校各班參加課外書法小組的人數(shù),在全校隨機(jī)抽取5個(gè)班級(jí),把每個(gè)班級(jí)參加該小組的人數(shù)作為樣本數(shù)據(jù). 已知樣本平均數(shù)為7,樣本方差為4,且樣本數(shù)據(jù)互相不相同,則樣本數(shù)據(jù)中的最大值為________.

3. 以下莖葉圖記錄了甲、乙兩組各五名學(xué)生在一次英語聽力測試中的成績(單位:分),已知甲組數(shù)據(jù)的中位數(shù)為15,乙組數(shù)據(jù)的平均數(shù)為16.8,則x,y的值分別為________.

圖4

4. (2014年高考廣東卷)某車間20名工人年齡數(shù)據(jù)如下表:

(1)求這20名工人年齡的眾數(shù)與極差;

(2)以十位數(shù)為莖,個(gè)位數(shù)為葉,作出這20名工人年齡的莖葉圖;?搖?搖?搖?搖?搖

(3)求這20名工人年齡的方差.

5. (2014年高考重慶卷)20名學(xué)生某次數(shù)學(xué)考試成績(單位:分)的頻率分布直方圖如圖5所示.

圖5

(1)求頻率分布直方圖中a的值;

(2)分別求出成績落在[50,60)與[60,70)中的學(xué)生人數(shù);

(3)從成績?cè)赱50,70)的學(xué)生中任選2人,求此2人的成績都在[60,70)中的概率.

參考答案

1. 60 2. 10 3. 5,8

4. (1)眾數(shù)為30,極差為21.

(2)略 (3)12.6

5. (1)據(jù)直方圖知組距為10,由(2a+3a+6a+7a+2a)×10=1,解得a=■=0.005.

(2)成績落在[50,60)中的學(xué)生人數(shù)為2×0.005×10×20=2. 成績落在[60,70)中的學(xué)生人數(shù)為3×0.005×10×20=3.

(3)記成績落在[50,60)中的2人為A1,A2,成績落在[60,70)中的3人為B1,B2,B3,則從成績?cè)赱50,70)的學(xué)生中任選2人的基本事件共有10個(gè),即(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3). 其中2人的成績都在[60,70)中的基本事件有3個(gè),即(B1,B2),(B1,B3),(B2,B3). 故所求概率為P=■. ■

猜你喜歡
平均數(shù)直方圖總體
加權(quán)平均數(shù)的應(yīng)用
符合差分隱私的流數(shù)據(jù)統(tǒng)計(jì)直方圖發(fā)布
2020年秋糧收購總體進(jìn)度快于上年
外匯市場運(yùn)行有望延續(xù)總體平穩(wěn)發(fā)展趨勢(shì)
用直方圖控制畫面影調(diào)
直擊高考中的用樣本估計(jì)總體
基于空間變換和直方圖均衡的彩色圖像增強(qiáng)方法
基于直方圖平移和互補(bǔ)嵌入的可逆水印方案
黔南| 依兰县| 平安县| 文登市| 泰顺县| 娱乐| 永兴县| 介休市| 榆中县| 都昌县| 吐鲁番市| 丹寨县| 乌海市| 淮北市| 榆中县| 通辽市| 明光市| 德清县| 寿宁县| 顺昌县| 平湖市| 泰州市| 河南省| 溧阳市| 常州市| 若羌县| 佛坪县| 昭平县| 南澳县| 天镇县| 张掖市| 墨脱县| 龙游县| 金川县| 朔州市| 化州市| 宽城| 丰县| 浦东新区| 茶陵县| 恩平市|