張志成,張 艷
(1.河南工學(xué)院,河南 新鄉(xiāng) 453003;2.河南師范大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,河南 新鄉(xiāng) 453007)
中心極限定理是概率論中重要的基本理論,在概率論及數(shù)理統(tǒng)計(jì)的理論研究和實(shí)際應(yīng)用中都有著舉足輕重的地位。關(guān)于相互獨(dú)立的隨機(jī)變量之和的極限分布的一系列定理統(tǒng)稱為中心極限定理。只要n充分大,我們就可以用中心極限定理作近似計(jì)算。它為解決實(shí)際應(yīng)用問題提供了理論基礎(chǔ)。
國內(nèi)外不少專家、學(xué)者廣泛研究了中心極限定理在實(shí)際中的應(yīng)用。2005 年唐莉等人以彩票業(yè)和保險(xiǎn)業(yè)為實(shí)例討論了大數(shù)定律和中心極限定理的實(shí)際應(yīng)用[1]。同年,王東紅研究了大數(shù)定律與中心極限定理在保險(xiǎn)中的重要應(yīng)用[2]。2011 年,王丙參等人討論了中心極限定理在制定保費(fèi)及自留額、擬定保險(xiǎn)單位數(shù)及減少保險(xiǎn)個(gè)人平均危險(xiǎn)值等方面的應(yīng)用[3]。2018 拉窮等探討和分析了中心極限定理在保險(xiǎn)經(jīng)營中的應(yīng)用[4]。本文從概率預(yù)測和樣本容量推斷兩個(gè)方面來探討中心極限定理在實(shí)際生活中的應(yīng)用。
棣莫佛-拉普拉斯中心極限定理[5]:
中心極限定理表明,如果某一個(gè)量的變化受到許多隨機(jī)因素的影響,且這些因素中每一個(gè)所起的作用都很小,那么這個(gè)量就服從或近似服從正態(tài)分布。而在經(jīng)濟(jì)問題中這些量是很常見的。這就是為什么我們對經(jīng)濟(jì)問題進(jìn)行定量分析時(shí),往往假定在主要因素的影響之外其他各種因素的影響可以用一個(gè)服從正態(tài)分布的隨機(jī)變量來描述的原因。
在解決實(shí)際問題時(shí),很多總體的分布往往是未知的,或僅知道其分布概型但里面含有未知的參數(shù)。這時(shí),我們要了解總體的分布,需要根據(jù)以往的統(tǒng)計(jì)數(shù)據(jù)或經(jīng)驗(yàn)數(shù)據(jù)來估計(jì)未知的參數(shù)。因此我們可以采用抽樣的方法,利用已知的統(tǒng)計(jì)數(shù)據(jù)或經(jīng)驗(yàn)數(shù)據(jù)估計(jì)出總體的概率,并將其作為條件,對某事件發(fā)生的情況作出預(yù)測。
例如:假設(shè)人在新冠肺炎傳染性疾病流行時(shí)的感染率為0.5%,為滿足防疫的需要,在某社區(qū)隨機(jī)抽取500 人進(jìn)行檢疫,結(jié)果發(fā)現(xiàn)感染人數(shù)不超過1 人,問該傳染病是否已經(jīng)在該社區(qū)流行?
我們不難發(fā)現(xiàn),這類問題經(jīng)常將樣本值與期望值進(jìn)行比較或?qū)⒖傮w的概率與抽樣的頻率進(jìn)行比較,這時(shí)將很難得到合理的結(jié)論,往往需要用概率去預(yù)測。
假設(shè)該傳染病已經(jīng)在本地區(qū)流行,感染率p為0.005,任取500 人進(jìn)行檢疫,則有X人感染的頻率為X/500,且X~N(500,0.005)。
由式(1),可得
還有一些問題,我們只知道它可以用二項(xiàng)分布來描述,而總體的概率未知或無法估計(jì),這時(shí)根據(jù)大數(shù)定律,我們可以用抽樣的頻率來估計(jì)總體的概率,但是如何在一定的可信度下,使估計(jì)值滿足精度的要求?樣本容量取多少合適?根據(jù)棣莫佛-拉普拉斯中心極限定理,可以給出一種簡單的推斷方法[6]。
例如:某農(nóng)場欲購買一大批種子,為了了解某品牌種子的真實(shí)發(fā)芽率,事先購買了一部分樣本進(jìn)行發(fā)芽實(shí)驗(yàn)。那么應(yīng)該先購買多少粒種子,才能使得實(shí)驗(yàn)的發(fā)芽率與真實(shí)發(fā)芽率的絕對誤差不超過假設(shè)推斷的可信度
顯然總體X(該批種子發(fā)芽的數(shù)量)服從二項(xiàng)分布,而總體概率p(該批種子發(fā)芽的概率)未知,假設(shè)先購買了n粒種子X1,X2,…,Xn進(jìn)行發(fā)芽實(shí)驗(yàn),則X1,X2,…,Xn是來自總體X的一個(gè)簡單隨機(jī)樣本,fn為購買的n粒種子發(fā)芽的數(shù)量。那么在可信度n應(yīng)取多少才能使
即滿足式(3)的n的值即為所求
可得,對于任意的p,有n2401。
故應(yīng)先購買2401 粒種子,才能有95%的把握使實(shí)驗(yàn)發(fā)芽率與真實(shí)發(fā)芽率的絕對誤差不超過0.05。
假如該農(nóng)場經(jīng)推斷后購買了3000 粒種子做發(fā)芽實(shí)驗(yàn),結(jié)果有2700 粒種子發(fā)芽,此時(shí)推斷出該批種子的真實(shí)發(fā)芽率的置信區(qū)間(置信水平為95%)是
則該農(nóng)場可根據(jù)該置信區(qū)間決定是否大批量購買該品牌的種子。
中心極限定理在實(shí)際生活中的應(yīng)用非常廣泛。本文以中心極限定理為理論依據(jù),針對生活中的一些實(shí)際問題,討論了其在概率預(yù)測、樣本容量推斷等方面的應(yīng)用,為教學(xué)和科研提供一定的參考。