●李 輝 (杭州外國語學校 浙江杭州 310023)
二項分布若干性質的思考
●李 輝 (杭州外國語學校 浙江杭州 310023)
我們知道:若離散型隨機變量ζ的分布列為P(ζ =k)=Cknpk(1 -p)n-k,k=0,1,2,…,n,其中0≤p≤1,則稱 ζ服從二項分布,記作 ζ~B(n,p).二項分布的使用條件為:在n次獨立重復試驗中,某事件發(fā)生的次數即服從二項分布.二項分布是概率教學中一個非常重要的分布,本文通過對二項分布的一些思考,期望有助于讀者對二項分布的理解.
例1在10件產品中有2件次品,連續(xù)抽3次,每次抽1件.
(1)當放回抽樣時,求抽到的次品數ζ的分布列;
(2)當不放回抽樣時,求抽到的次品數η的分布列.
解(1)根據題意容易求得ζ的分布列如表1所示.
表1 ζ的分布列
(2)根據題意可求得η的分布列如表2所示.
表2 η的分布列
顯然,2種不同的抽樣方式并沒有改變次品數的數學期望.
思考1放回與不放回為什么不影響數學期望?
問題一般化:設在N件產品中有M(M≤N)件不合格品,從中任取n(n≤N)件進行檢查,求取得不合格品數ζ的數學期望.
這里,還假定取出的產品數不超過合格品總數,即n≤N-M.若沒有這個假定,則隨機變量ζ的取值范圍應是 s,s+1,s+2,…,m,其中 m=min{M,n},s=max{0,n-(N -M)}.在具體問題中不難理解,例如共有10件產品,其中次品數為6,從中取出5件產品,則取出的產品中次品數ζ的取值范圍是 1,2,3,4,5.
(1)當放回抽樣時,ζ服從二項分布
通過上述算式可以看出:放回與不放回確實不影響次品數的數學期望.我們也可以從另一個角度來理解:放回抽樣是n次獨立重復試驗,每次取到次品的概率都是P=,概率本身就是一種“理想”,因此每次取到“理想”的次品數都是件,n次獨立重復試驗取到“理想”的次品數當然是np;不放回抽樣等價于放回抽樣.把每個產品看成由的次品和1-的合格品組成,可以認為每次取出一件產品,抽到次品的概率仍為,因此n次不放回的抽樣等同于放回抽樣,仍看作n次獨立重復試驗,即每次抽到次品的概率都是,故不放回的次品數的數學期望與放回的次品數的數學期望相等.這是一種對于放回與不放回不影響數學期望的樸素的理解方式.
思考2二項分布與其他分布有什么關系?
超幾何分布與二項分布的關系:第一:在n次試驗中,取得不合格品數X可能服從超幾何分布或二項分布.當這n次試驗是獨立重復試驗時,X服從二項分布;當這n次試驗是不放回抽取時,X服從超幾何分布.第二:在不放回n次抽取試驗中,抽到的次品數X服從超幾何分布.但是當產品的數目N很大時,因為
所以X的分布列近似于二項分布,并且隨著X的增加,這種近似的精確度也會增加.
兩點分布與二項分布的關系:若隨機變量X的分布列具有表3所示的形式,則稱X服從兩點分布,p=P(X=1)稱為成功概率.
表3 X的分布列
容易求得
兩點分布是最簡單的離散型隨機變量,它是二項分布的基礎,也是二項分布的一個特例,即n=1時的二項分布.二項分布可以看作是兩點分布的一般形式,因為n次獨立重復試驗每次的數學期望都是p,所以從整體上看n個獨立的兩點分布即為二項分布,它的期望當然是n個期望的和,即
幾何分布與二項分布的關系:若離散型隨機變量ζ的分布列為
另外在二項分布中,n的值是確定的,ζ的取值是變化的,Eζ是由n和p決定的,但若反過來認為n的取值是可變的,n=1,2,3,…,則 ζ=1 始終成立,即Eζ=1.又因為幾何分布也是獨立重復試驗,即每次試驗事件發(fā)生的概率p也是不變的,所以
這時,幾何分布和二項分布只是一個問題的2個方面罷了,關鍵是哪個量作為隨機變量.
思考3如果二項分布的數學期望是np,那么服從二項分布的隨機變量取何值時的概率是最大的?
我們可以看出在二項分布的數學期望附近的概率達到最大值,這具有一種必然性.因為數學期望反映了隨機變量取值的平均水平,通過大量的隨機試驗,有大量的隨機變量的取值相對聚集在平均水平附近,所以隨機變量在數學期望附近的概率達到最大值.
數學期望本身就是一種“數學理想”,概率也是一種“數學理想”.對于“理想”的理解更有助于我們對于概率概念的理解.概率是發(fā)生于大量的隨機試驗中的,只要這個試驗的次數足夠地多,頻率就逐漸地趨向于概率.概率是一個理論值.只要這個試驗的次數足夠地多,試驗出來的隨機變量的平均值就會趨向于這個隨機變量的理論的平均值,即它的數學期望.它是一個平衡點,具有一種必然性,是發(fā)生于大量偶然中的必然.