趙銀倉++王健
隨機(jī)抽樣是研究如何合理收集數(shù)據(jù),而用樣本估計(jì)總體則是研究如何整理與分析數(shù)據(jù),從樣本的數(shù)據(jù)特征來了解整體的情況,由于樣本的隨機(jī)性,所以可以透過部分看整體. 在學(xué)習(xí)這一部分知識(shí)時(shí),要通過實(shí)際問題情境,學(xué)習(xí)隨機(jī)抽樣、樣本估計(jì)總體的基本方法,體會(huì)用樣本估計(jì)總體及其特征的思想;通過解決實(shí)際問題,較為系統(tǒng)地經(jīng)歷數(shù)據(jù)收集與處理的全過程,體會(huì)統(tǒng)計(jì)思維與確定性思維的差異. 由于抽樣方法與用樣本估計(jì)總體所體現(xiàn)的統(tǒng)計(jì)思想是一種重要的思想方法,所以這部分成為高考每年必考的內(nèi)容.
重點(diǎn)難點(diǎn)
隨機(jī)抽樣與用樣本估計(jì)總體要求在解決統(tǒng)計(jì)問題的過程中,用隨機(jī)抽樣方法從總體中抽取樣本,進(jìn)一步體會(huì)用樣本估計(jì)總體的思想,會(huì)用樣本的頻率分布估計(jì)總體分布,會(huì)用樣本的基本數(shù)字特征估計(jì)總體的基本數(shù)字特征;初步體會(huì)樣本頻率分布和數(shù)字特征的隨機(jī)性.
在歷年高考中,該部分知識(shí)在選擇題、填空題和解答題中都有出現(xiàn),考查的方向主要有抽樣方法的選擇,繪制、識(shí)別頻率分布表和頻率分布直方圖、頻率折線圖、莖葉圖,并能應(yīng)用這些圖表解決一些簡單實(shí)際問題.
重點(diǎn):掌握抽樣方法的特點(diǎn)及它們之間的區(qū)別與聯(lián)系,面對(duì)實(shí)際問題能合理選擇抽樣方法抽取樣本;繪制頻率分布表和頻率分布直方圖、頻率折線圖、莖葉圖,會(huì)計(jì)算方差和標(biāo)準(zhǔn)差,并能計(jì)算樣本平均數(shù),還能進(jìn)一步解釋這些統(tǒng)計(jì)數(shù)據(jù)的實(shí)際意義.
難點(diǎn):實(shí)際問題中抽樣方案的確定;頻率分布表和頻率分布直方圖的理解與應(yīng)用,如計(jì)算平均數(shù)等.
方法突破
1.?搖隨機(jī)抽樣與用樣本估計(jì)總體的基本思路
(1)簡單隨機(jī)抽樣的特點(diǎn):總體中個(gè)體性質(zhì)相似,無明顯層次;總體容量較小,尤其是樣本容量較?。挥煤唵坞S機(jī)抽樣方法抽出的個(gè)體帶有隨機(jī)性,個(gè)體間無固定間距.
系統(tǒng)抽樣的特點(diǎn):適用于元素個(gè)數(shù)很多且均衡的總體,各個(gè)個(gè)體被抽到的機(jī)會(huì)均等;總體分組后,在起始部分抽樣時(shí),采用簡單隨機(jī)抽樣.
分層抽樣的特點(diǎn):適用于總體由差異明顯的幾部分組成的情況;分層后,在每一層抽樣時(shí)可采用簡單隨機(jī)抽樣或系統(tǒng)抽樣.
(2)作頻率分布直方圖的步驟:①求極差;②確定組距和組數(shù);③將數(shù)據(jù)分組;④列頻率分布表;⑤畫頻率分布直方圖.
(3)標(biāo)準(zhǔn)差與方差:標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大小,標(biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大,標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小,因?yàn)榉讲钆c原始數(shù)據(jù)的單位不同,且平方后可能夸大了偏離程度,所以雖然方差與標(biāo)準(zhǔn)差在刻畫樣本數(shù)據(jù)的分散程度上是一致的,但在解決實(shí)際問題時(shí),一般多用標(biāo)準(zhǔn)差.
2. 隨機(jī)抽樣與用樣本估計(jì)總體的基本策略
(1)理解抽樣方法的區(qū)別與聯(lián)系
簡單隨機(jī)抽樣是系統(tǒng)抽樣與分層抽樣的基礎(chǔ),是一種等概率的抽樣,由定義應(yīng)抓住以下特點(diǎn):它要求總體個(gè)數(shù)較少;它是從總體中逐個(gè)抽取的;它是一種不放回抽樣.
系統(tǒng)抽樣又稱等距抽樣,號(hào)碼序列一確定,樣本即確定了,但要求總體中不能含有一定的周期性,否則其樣本的代表性是不可靠的,甚至?xí)?dǎo)致明顯的偏向.
(2)分析總體特征,選擇合理的抽樣方法. 抽樣方法經(jīng)常交叉使用,比如系統(tǒng)抽樣中的第一均衡部分,可采用簡單隨機(jī)抽樣,分層抽樣中,若每層中的個(gè)體數(shù)量仍很大時(shí),則可輔之以系統(tǒng)抽樣.
(3)準(zhǔn)確繪制頻率分布表和頻率分布直方圖、頻率折線圖、莖葉圖. 通過頻率分布表和頻率分布直方圖可以對(duì)總體作出估計(jì),這就依賴于繪制圖表的準(zhǔn)確性.在計(jì)數(shù)和計(jì)算時(shí)一定要準(zhǔn)確,在繪制小矩形時(shí),寬窄要一致,這樣才能使繪制的頻率分布圖表準(zhǔn)確地反應(yīng)實(shí)際問題.
(4)理解估計(jì)總體的有關(guān)概述并熟記有關(guān)公式. 若取值x1,x2,…,xn的頻率分別為p1,p2,…,pn,則其平均值為x1p1+x2pn+…+xnpn. 若取值x1,x2,…,xn的平均數(shù)為■,方差為s2,則ax1+b,ax2+b,…,axn+b的平均數(shù)為a■+b,方差為a2s2.
典例精講
■例1 (2013年高考陜西卷)某單位有840名職工,現(xiàn)采用系統(tǒng)抽樣方法,抽取42人做問卷調(diào)查,將840人按1,2,…,840隨機(jī)編號(hào),則抽取的42人中,編號(hào)落入?yún)^(qū)間[481,720]的人數(shù)為( )
A. 11 B. 12 C. 13 D. 14
思索 當(dāng)總體中所含的個(gè)體數(shù)比較大,并且個(gè)體間沒有顯著差異,被抽取的概率一樣時(shí),采用系統(tǒng)抽樣法. 本題從840中用系統(tǒng)抽樣抽取42人,則每20人為一組,每組抽取一人. 因此只需要按等間隔抽取規(guī)則求出編號(hào)落入?yún)^(qū)間[481, 720]的組數(shù),并且還要弄清首未兩組是否為全體.
破解 根據(jù)從編號(hào)1開始,每20人一組等距分組規(guī)則,第1組的編號(hào)區(qū)間為[1,20],第2組的編號(hào)區(qū)間為[21,40],以此類推,編號(hào)落入?yún)^(qū)間[481,720]的為第24組至第35組的全體,共有12組,所以抽取的42人中, 編號(hào)落入?yún)^(qū)間[481,720]的人數(shù)為12人,故選B.
■例2 (2014年高考廣東卷)已知某地區(qū)中小學(xué)生人數(shù)和近視情況分別如圖1和圖2所示. 為了了解該地區(qū)中小學(xué)生的近視形成原因,用分層抽樣的方法抽取2%的學(xué)生進(jìn)行調(diào)查,則樣本容量和抽取的高中生近視人數(shù)分別為( )
■
圖1 圖2
A. 200,20?搖 B. 100,20?搖?搖?搖?搖
C. 200,10 ?搖?搖 D. 100,10
思索 由于中小學(xué)生的年齡差異明顯,因而近視情況的差異很大,所以選用分層抽樣方法. 本題考查統(tǒng)計(jì)圖表的實(shí)際應(yīng)用,問題的關(guān)鍵是識(shí)圖,讀懂題目給出的圖表,明白其中數(shù)據(jù)的意義.
破解 根據(jù)題中的圖可知,該地區(qū)中小學(xué)生一共有10000人,因?yàn)橐槿?%的學(xué)生,所以樣本容量是10000×2%=200. 因?yàn)楦咧猩慕暵蕿?0%,所以抽取的高中生近視的人數(shù)為2000×2%×50%=20. 故選A.endprint
■例3 (2014年高考北京卷)從某校隨機(jī)抽取100名學(xué)生,獲得了他們一周課外閱讀時(shí)間(單位:小時(shí))的數(shù)據(jù),整理得到數(shù)據(jù)分組及頻數(shù)分布表和頻率分布直方圖(如圖3).
■
■
圖3
(1)從該校隨機(jī)選取一名學(xué)生,試估計(jì)這名學(xué)生該周課外閱讀時(shí)間少于12小時(shí)的概率;
(2)求頻率分布直方圖中的a,b的值;
(3)假設(shè)同一組中的每個(gè)數(shù)據(jù)可用該組區(qū)間的中點(diǎn)值代替,試估計(jì)樣本中的100名學(xué)生該周課外閱讀時(shí)間的平均數(shù)在第幾組.(只需寫出結(jié)論)
思索 本題要能夠讀懂頻數(shù)分布表及直方圖,明確圖表中每個(gè)數(shù)據(jù)的數(shù)學(xué)意義:頻數(shù)分布表以2小時(shí)為單位分組,直方圖中矩形的高為頻率與組距的比,寬為閱讀時(shí)間,面積為閱讀時(shí)間在該范圍的頻率,直方圖中小矩形的面積和為1. 從頻率分布直方圖來估計(jì)平均值,等于直方圖中每個(gè)小矩形的面積乘小矩形底邊中點(diǎn)的橫坐標(biāo)之和.
破解 (1)根據(jù)頻數(shù)分布表,100名學(xué)生中課外閱讀時(shí)間不少于12小時(shí)的學(xué)生共有6+2+2=10(名),所以樣本中的學(xué)生課外閱讀時(shí)間少于12小時(shí)的頻率是1-■=0.9. 故從該校隨機(jī)選取一名學(xué)生,估計(jì)其課外閱讀時(shí)間少于12小時(shí)的概率為0.9.
(2)課外閱讀時(shí)間落在組[4,6)內(nèi)的有17人,頻率為0.17,所以a=■=■=0.085. 課外閱讀時(shí)間落在組[8,10)內(nèi)的有25人,頻率為0.25,所以b=■=■=0.125.
(3)由頻數(shù)分布圖中的數(shù)據(jù)可得平均數(shù)為■=0.06×1+0.08×3+0.17×5+0.22×7+0.25×9+0.12×11+0.06×13+0.02×15+0.02×17=7.68,所以樣本中的100名學(xué)生課外閱讀時(shí)間的平均數(shù)在第4組.
■例4 (2014年高考湖南卷)某企業(yè)有甲、乙兩個(gè)研發(fā)小組,為了比較他們的研發(fā)水平,現(xiàn)隨機(jī)抽取這兩個(gè)小組往年研發(fā)新產(chǎn)品的結(jié)果如下:(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b). 其中a,a分別表示甲組研發(fā)成功和失?。籦,b分別表示乙組研發(fā)成功和失敗.
(1)若某組成功研發(fā)一種新產(chǎn)品,則給該組記1分,否則記0分. 試計(jì)算甲、乙兩組研發(fā)新產(chǎn)品的成績的平均數(shù)和方差,并比較甲、乙兩組的研發(fā)水平.
(2)若該企業(yè)安排甲、乙兩組各自研發(fā)一種新產(chǎn)品,試估計(jì)恰有一組研發(fā)成功的概率.
思索 本題綜合考查隨機(jī)樣本的收集,用樣本的平均數(shù)與方差估計(jì)總體. 根據(jù)規(guī)定用1和0來表示研發(fā)的成功與失敗,將隨機(jī)抽取的研發(fā)結(jié)果轉(zhuǎn)化為關(guān)于反映甲、乙成績的兩組數(shù)值,計(jì)算它們的平均值與方差,以此來比較它們的研發(fā)水平.
破解 (1)甲組研發(fā)新產(chǎn)品的成績?yōu)?,1,1,0,0,1,1,1,0,1,0,1,1,0,
1,其平均數(shù)為x甲=■=■,方差為s2甲=■1-■?搖2×10+0-■?搖2×5=■.
乙組研發(fā)新產(chǎn)品的成績?yōu)?,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均數(shù)為x乙=■=■,方差為s2乙=■1-■?搖2×9+0-■?搖2×6=■.
因?yàn)閤甲>x乙,s2甲 (2)記E={恰有一組研發(fā)成功}.在所抽得的15個(gè)結(jié)果中,恰有一組研發(fā)成功的結(jié)果是(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),共7個(gè),故事件E發(fā)生的頻率為■. 將頻率視為概率,即得所求概率為P(E)=■. 變式練習(xí) 1. (2014年高考天津卷)某大學(xué)為了了解在校本科生對(duì)參加某項(xiàng)社會(huì)實(shí)踐活動(dòng)的意向,擬采用分層抽樣的方法,從該校四個(gè)年級(jí)的本科生中抽取一個(gè)容量為300的樣本進(jìn)行調(diào)查. 已知該校一年級(jí)、二年級(jí)、三年級(jí)、四年級(jí)的本科生人數(shù)之比為4∶5∶5∶6,則應(yīng)從一年級(jí)本科生中抽取________名學(xué)生. 2. 為了考察某校各班參加課外書法小組的人數(shù),在全校隨機(jī)抽取5個(gè)班級(jí),把每個(gè)班級(jí)參加該小組的人數(shù)作為樣本數(shù)據(jù). 已知樣本平均數(shù)為7,樣本方差為4,且樣本數(shù)據(jù)互相不相同,則樣本數(shù)據(jù)中的最大值為________. 3. 以下莖葉圖記錄了甲、乙兩組各五名學(xué)生在一次英語聽力測試中的成績(單位:分),已知甲組數(shù)據(jù)的中位數(shù)為15,乙組數(shù)據(jù)的平均數(shù)為16.8,則x,y的值分別為________. ■ 圖4 4. (2014年高考廣東卷)某車間20名工人年齡數(shù)據(jù)如下表: ■ (1)求這20名工人年齡的眾數(shù)與極差; (2)以十位數(shù)為莖,個(gè)位數(shù)為葉,作出這20名工人年齡的莖葉圖;?搖?搖?搖?搖?搖 (3)求這20名工人年齡的方差. 5. (2014年高考重慶卷)20名學(xué)生某次數(shù)學(xué)考試成績(單位:分)的頻率分布直方圖如圖5所示. ■ 圖5 (1)求頻率分布直方圖中a的值; (2)分別求出成績落在[50,60)與[60,70)中的學(xué)生人數(shù); (3)從成績?cè)赱50,70)的學(xué)生中任選2人,求此2人的成績都在[60,70)中的概率. 參考答案 1. 60 2. 10 3. 5,8 4. (1)眾數(shù)為30,極差為21. (2)略 (3)12.6 5. (1)據(jù)直方圖知組距為10,由(2a+3a+6a+7a+2a)×10=1,解得a=■=0.005. (2)成績落在[50,60)中的學(xué)生人數(shù)為2×0.005×10×20=2. 成績落在[60,70)中的學(xué)生人數(shù)為3×0.005×10×20=3. (3)記成績落在[50,60)中的2人為A1,A2,成績落在[60,70)中的3人為B1,B2,B3,則從成績?cè)赱50,70)的學(xué)生中任選2人的基本事件共有10個(gè),即(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3). 其中2人的成績都在[60,70)中的基本事件有3個(gè),即(B1,B2),(B1,B3),(B2,B3). 故所求概率為P=■. ■
數(shù)學(xué)教學(xué)通訊·初中版2015年2期