胡云兵
在人教版《數(shù)學(xué)選修2—3》的課本中,第二章《隨機(jī)變量及其分布列》分別介紹了兩種離散型隨機(jī)變量的概率分布:超幾何分布與二項(xiàng)分布。通過實(shí)例,讓同學(xué)們認(rèn)識模型所刻畫的隨機(jī)變量的共同特點(diǎn),從而建立新的模型,并能運(yùn)用兩個模型解決一些實(shí)際問題。然而部分同學(xué)不能準(zhǔn)確地辨別要解決的問題是超幾何分布還是二項(xiàng)分布,對這兩個模型的定義不能很好地理解,一遇到含“取”或“摸”的題型,就認(rèn)為是超幾何分布,不加分析,濫用公式。事實(shí)上,超幾何分布和二項(xiàng)分布確實(shí)有著密切的聯(lián)系,但也有明顯的區(qū)別,
課本對于超幾何分布的定義是這樣的:
對于二項(xiàng)分布的定義是這樣的:若隨機(jī)變量X的分布列為P(X=k) =Cp*(1—p)",其中0
其概率分布如表2。
超幾何分布與二項(xiàng)分布都是取非負(fù)整數(shù)值的離散分布,表面上看,兩種分布的概率求法有截然不同的表達(dá)式。
課本中對超幾何分布的模型建立是這樣的:若有N件產(chǎn)品,其中M件是次品,無放回地任意抽取n件,則其中恰有的次品件數(shù)X服從超幾何分布。而對二項(xiàng)分布則使用比較容易理解的射擊問題來建立模型。若將超幾何分布的概率模型改成:若有N件產(chǎn)品,其中M件是次品,有放回的任意抽取n件,則其中恰有的次品件數(shù)X服從二項(xiàng)分布。在這里,兩種分布的差別就在于“有放回”與“無放回”的差別,超幾何分布是不放回地抽取,二項(xiàng)分布是有放回地抽取;超幾何分布需要知道總體容量,二項(xiàng)分布不需要知道總體容量,但需要知道“成功率”。
教材上用高爾頓板導(dǎo)出了正態(tài)分布,事實(shí)上在這個試驗(yàn)中,小球落進(jìn)各個槽中的分布是一個概率p=0.5的二項(xiàng)分布,從一個二項(xiàng)分布導(dǎo)出正態(tài)分布,正好揭示了二項(xiàng)分布與正態(tài)分布之間的聯(lián)系,
我們知道二項(xiàng)分布的隨機(jī)變量是離散的,當(dāng)n取不同值時(shí),它的分布會有差別,隨著n的增加,二項(xiàng)分布越來越接近于正態(tài)分布。
題型一超幾何分布
例1某批產(chǎn)品共有10件,已知從該批產(chǎn)品中任取1件,則取到的是次品的概率為p=0.2,現(xiàn)從該批產(chǎn)品中任意抽取3件。
(1)求取出的3件產(chǎn)品中恰好有1件是次品的概率;
(2)求取出的3件產(chǎn)品中次品的件數(shù)X的概率分布列與期望,
解析:
點(diǎn)評:超幾何分布的特征是:只做了一次試驗(yàn),且這一次試驗(yàn)是在有限個(個數(shù)非常明確、具體)元素中選取若干個元素。典型案例是抽球時(shí)每次抽完不放回。
例2 (2021年北京高三期末)在學(xué)期末,為了解學(xué)生對食堂用餐滿意度情況,某興趣小組按性別采用分層抽樣的方法,從全校學(xué)生中抽取容量為200的樣本進(jìn)行調(diào)查。被抽中的同學(xué)分別對食堂進(jìn)行評分,滿分為100分。調(diào)查結(jié)果顯示:最低分為51分,最高分為100分。隨后,興趣小組將男、女生的評分結(jié)果按照相同的分組方式分別整理成了頻數(shù)分布表和頻率分布直方圖,如表4和圖1所示。
女生評分結(jié)果的頻率分布直方圖(圖1)。
男生評分結(jié)果的頻數(shù)分布表如表4。
為了便于研究,興趣小組將學(xué)生對食堂的評分轉(zhuǎn)換成了“滿意度情況”,兩者的對應(yīng)關(guān)系如表5。
(1)求a的值;
(2)為進(jìn)一步改善食堂狀況,從評分在[50,70)的男生中隨機(jī)抽取3人進(jìn)行座談,記這3人中對食堂“不滿意”的人數(shù)為X,求X的分布列。
解析:
點(diǎn)評:“在6個元素中選取3個元素”,符合超幾何分布的特征。
題型二二項(xiàng)分布
例3 (2021年太原高三5月模擬)人的體重是人的身體素質(zhì)的重要指標(biāo)之一。某校抽取了高二的部分學(xué)生,測出他們的體重(kg),體重在40 kg至65 kg之間,按體重進(jìn)行如下分組:第1組[40,45),第2組[45,50),第3組[50,55),第4組[55,60),第5組[60,65],并制成如圖2所示的頻率(視為概率)分布直方圖。已知第一組與第三組的頻率之比為1:3,第3組的頻數(shù)為90。
(1)求該校抽取的學(xué)生總數(shù)以及第2組的頻率;
(2)用這些樣本數(shù)據(jù)估計(jì)全市高二學(xué)生(學(xué)生數(shù)眾多)的體重,若從全市高二學(xué)生中任選5人,設(shè)X表示這5人中體重不低于55 kg的人數(shù),求X的分布列和數(shù)學(xué)期望。
解析:
點(diǎn)評:當(dāng)題目當(dāng)中出現(xiàn)“將頻率視為概率”,“某某與某某相互獨(dú)立”,“從大量(且不知道大量具體的數(shù)值)中選取少數(shù)幾個個體”等關(guān)鍵字眼時(shí),該分布即為二項(xiàng)分布。
例4 某工廠的某種產(chǎn)品成箱包裝,每箱200件,每一箱產(chǎn)品在交付用戶之前要對產(chǎn)品進(jìn)行檢驗(yàn),如檢驗(yàn)出不合格品,則更換為合格品。檢驗(yàn)時(shí),先從這箱產(chǎn)品中任取20件檢驗(yàn),再根據(jù)檢驗(yàn)結(jié)果決定是否對余下的所有產(chǎn)品檢驗(yàn)。設(shè)每件產(chǎn)品為不合格品的概率都為p(0
(1)記20件產(chǎn)品中恰有2件不合格品的概率為f(p),求f(p)的最大值點(diǎn)po。
(2)現(xiàn)對一箱產(chǎn)品檢驗(yàn)了20件,結(jié)果恰有2件不合格品,以(1)中確定的p。作為p的值,已知每件產(chǎn)品的檢驗(yàn)費(fèi)用為2元,若有不合格品進(jìn)入用戶手中,則工廠要對每件不合格品支付25元的賠償費(fèi)用。
①若不對該箱余下的產(chǎn)品檢驗(yàn),這一箱產(chǎn)品的檢驗(yàn)費(fèi)用與賠償費(fèi)用的和記為X,求E(X);
②以檢驗(yàn)費(fèi)用與賠償費(fèi)用和的期望值為決策依據(jù),是否該對這箱余下的所有產(chǎn)品作檢驗(yàn)?
解析:
點(diǎn)評:題目當(dāng)中出現(xiàn)了“各件產(chǎn)品是否為不合格品相互獨(dú)立”的字眼,符合二項(xiàng)分布的特征。
(責(zé)任編輯徐利杰)