国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

淺談中心極限定理

2021-11-20 02:18:24夏文文河南財(cái)經(jīng)政法大學(xué)
環(huán)球市場(chǎng) 2021年30期
關(guān)鍵詞:二項(xiàng)分布正態(tài)概率論

夏文文 河南財(cái)經(jīng)政法大學(xué)

一、引言

中心極限定理在概率論中有著極其廣泛的應(yīng)用背景。提到中心極限定理,要先介紹一位叫棣莫佛的數(shù)學(xué)家,雖然出生在法國(guó),但他卻在32歲時(shí)成為英國(guó)皇家學(xué)會(huì)會(huì)員。他在1718年首次出版的《機(jī)遇論》被稱為概率論史上有三部里程碑性質(zhì)的著作之一。1712年,一位叫亞歷山大的人向他提出了一個(gè)關(guān)于賭博的問(wèn)題,最終他給出了二項(xiàng)分布下每局獲勝概率p=0.5的證明。但是當(dāng)局?jǐn)?shù)n很大時(shí),計(jì)算就變得非常困難。因此棣莫佛就找到了一個(gè)近似的算法,它就是后面我們所熟知的“二項(xiàng)分布的正態(tài)近似”。因此可以說(shuō)棣莫佛的工作在數(shù)理統(tǒng)計(jì)的發(fā)展史上有著里程碑式的意義。

在實(shí)際生活中,有些現(xiàn)象會(huì)受到很多相互獨(dú)立的因素的綜合影響,如果每個(gè)獨(dú)立因素的影響都非常小,單獨(dú)來(lái)看的話并不好研究,但如果放在一起的綜合影響近似服從正態(tài)分布。在研究中經(jīng)常需要考慮研究對(duì)象受許多相互獨(dú)立的隨機(jī)因素的綜合影響。比如在射擊時(shí),子彈命中的位置偏離目標(biāo)位置的程度,就受到很多隨機(jī)因素(如空氣阻力、風(fēng)向、射擊所用槍支的結(jié)構(gòu)等)的綜合影響。同時(shí),許多研究結(jié)果表明,受到這些許多綜合影響的隨機(jī)變量近似服從正態(tài)分布。

二、什么是中心極限定理

在統(tǒng)計(jì)學(xué)中,想要研究某個(gè)總體的某種指標(biāo),如果這個(gè)總體很大,通常都是通過(guò)從該總體中用某種方法抽取一定的樣本,然后根據(jù)抽樣得到的樣本結(jié)果來(lái)估計(jì)該總體的情況。但樣本畢竟是樣本,它和總體之間還是有一定差別的。所以我們通常還要根據(jù)抽樣結(jié)果,計(jì)算出相應(yīng)的置信區(qū)間,這樣會(huì)更具有說(shuō)服力。除此之外,我們往往還會(huì)進(jìn)行假設(shè)檢驗(yàn),將樣本值和假設(shè)值進(jìn)行比較,以此來(lái)判斷我們所作的假設(shè)是否正確。

但是,想要獲得置信區(qū)間或者進(jìn)行假設(shè)檢驗(yàn),都必須知道樣本的分布屬于哪一種類型。如果我們連樣本的分布類型都不知道,相應(yīng)的統(tǒng)計(jì)量我們也就不可能知道,更不可能求出置信區(qū)間或者進(jìn)行假設(shè)檢驗(yàn)。但還好我們有偉大的數(shù)學(xué)家,他們發(fā)現(xiàn)的中心極限定理幫我們解決了這一難題。

在實(shí)際中,許多問(wèn)題的研究都需要求n個(gè)獨(dú)立同分布隨機(jī)變量和的分布函數(shù)Fn(y),當(dāng)n很大時(shí),大多數(shù)情況下尋求準(zhǔn)確的Fn(y)是很難的。而中心極限定理的思想對(duì)求解Fn(y)提供了很大的幫助,我們可以用極限的方法求Fn(y)的近似分布。我們習(xí)慣上把概率論中有關(guān)論證大量獨(dú)立隨機(jī)變量的和近似服從正態(tài)分布的這一類定理統(tǒng)稱為中心極限定理。

三、兩個(gè)常用的中心極限定理

下面給出了在概率論中兩種常用的中心極限定理的主要內(nèi)容和它們之間的關(guān)系。

(一)林德貝格——列維中心極限定理

從這個(gè)定理我們可以看出,獨(dú)立同分布隨機(jī)變量的共同分布不管是什么分布,只要共同分布的方差存在,且不為0,那么大量該隨機(jī)變量和的分布就近似為正態(tài)分布。

(二)拉普拉斯中心極限定理

設(shè)隨機(jī)變量Xn服從于二項(xiàng)分布B(n,p),n=1,2,…,則

通過(guò)該定理可以知道,當(dāng)n充分大(n 30)時(shí),服從二項(xiàng)分布的隨機(jī)變量Xn近似服從于正態(tài)分布,期望為np,方差為np(1-p)。

這個(gè)定理是最早的中心極限定理,它是用正態(tài)分布近似計(jì)算二項(xiàng)分布的一種方法,因此被稱為“二項(xiàng)分布的正態(tài)近似”。當(dāng)n很大時(shí),二項(xiàng)分布隨機(jī)變量的計(jì)算結(jié)果就會(huì)非常大,利用“二項(xiàng)分布的正態(tài)近似”的思想使問(wèn)題變得簡(jiǎn)單化。除此之外,我們還常用到“二項(xiàng)分布的泊松近似”,它們之間還是有一定的區(qū)別。比如,當(dāng)p很小,而np又不太大時(shí),我們常用泊松近似;當(dāng)np和np(1-p)都比較大,一般認(rèn)為np>=5和np(1-p)>=5時(shí),就可以用正態(tài)近似。

當(dāng)使用“二項(xiàng)分布的正態(tài)近似”時(shí),往往需要修正,合理的修正可以提高精確度。設(shè)Xn~B(n,p),如果滿足np>=5和np(1-p)>=5,那么二項(xiàng)分布的正態(tài)近似的公式為:

(三)兩個(gè)中心極限定理的關(guān)系

拉普拉斯中心極限定理其實(shí)就是隨機(jī)變量序列獨(dú)立同二項(xiàng)分布情形下的林德伯格中心極限定理。前者要求隨機(jī)變量序列服從于二項(xiàng)分布,而后者則是要求獨(dú)立同分布即可。

四、中心極限定理的重要性質(zhì)

1.當(dāng)樣本容量或?qū)嶒?yàn)次數(shù)n很大時(shí)(一般n>=30),隨機(jī)變量和的分布近似服從正態(tài)分布。隨機(jī)變量和的均值為nμ,隨機(jī)變量和的方差為nσ2,σ為總體標(biāo)準(zhǔn)差。

2.當(dāng)樣本容量或?qū)嶒?yàn)次數(shù)n很大時(shí),獨(dú)立同分布隨機(jī)變量的算術(shù)平均值 的分布近似為正態(tài)分布。其中樣本均值的期望與總體均值相等,而方差等于總體方差除以樣本容量。

五、中心極限定理的在生活中的應(yīng)用

中心極限定理在實(shí)際中的應(yīng)用也是十分的廣泛。保險(xiǎn)這個(gè)行業(yè)對(duì)我們來(lái)說(shuō)并不陌生,它是降低因意外事故造成損失的保障。保險(xiǎn)的賠付一般都是比較大額的,那么就會(huì)有人好奇保險(xiǎn)公司什么情況下會(huì)發(fā)生賠本呢?它賠本的概率有多大呢?

實(shí)例:某家保險(xiǎn)公司年初有5000個(gè)同齡同階層的人投保,并且已知該類人在兩年內(nèi)會(huì)出現(xiàn)重大意外事故的概率為0.005。該保險(xiǎn)公司規(guī)定每個(gè)投保人都要在第一年的年初繳納2000元作為保險(xiǎn)費(fèi),而在意外事故死亡后其所填受益人可以從保險(xiǎn)公司得到20萬(wàn)元。問(wèn)在該保險(xiǎn)公司的投?;顒?dòng)中,該公司將有多大的概率會(huì)賠本?

在投保中記第k個(gè)人在兩年內(nèi)意外身亡為“Yk=1”,否則為“Yk=0”,那么該隨機(jī)變量服從二點(diǎn)分布B(1,0.005)。該保險(xiǎn)公司在第一年年初可以收到保險(xiǎn)費(fèi)5000*2000=10000000元,所以當(dāng)兩年內(nèi)死亡人數(shù)超過(guò)50人時(shí)保險(xiǎn)公司才會(huì)賠本。各Yk為獨(dú)立同分布的隨機(jī)變量,E(Yk)= 0.005,D(Yk)=0.005*(1-0.005)=0.004975,由修正后的“二項(xiàng)分布的正態(tài)近似”公式可得:

由此可見(jiàn),該保險(xiǎn)公司賠本的概率近似為0。這也就解釋了保險(xiǎn)市場(chǎng)新的公司不斷萌發(fā)的原因。盡管如此,一份保險(xiǎn)對(duì)我們來(lái)說(shuō)還是十分必要的,在你生活困難時(shí),它于你是雪中送炭;在生活美滿時(shí),它于你便是錦上添花。

六、中心極限定理的作用

中心極限定理的主要作用可以總結(jié)為以下三個(gè)方面:

(一)用樣本來(lái)估計(jì)總體

當(dāng)我們?cè)跊](méi)有辦法知道總體所有數(shù)據(jù)的情況下,總體的分布顯然也就無(wú)法得知。我們可以用樣本的值來(lái)估計(jì)總體相應(yīng)的值。在收集到了隨機(jī)抽取的樣本數(shù)據(jù)之后,我們可以計(jì)算出樣本的平均值和標(biāo)準(zhǔn)差,由中心極限定理的性質(zhì),我們也就可以計(jì)算出總體的平均值和標(biāo)準(zhǔn)差。

(二)根據(jù)總體的平均值和標(biāo)準(zhǔn)差,判斷樣本是否來(lái)自于該總體

如果我們知道了某個(gè)總體的具體信息,并且知道某個(gè)樣本的數(shù)據(jù),我們就可以利用中心極限定理的性質(zhì),計(jì)算出樣本來(lái)自于該總體的概率。如果所得的概率非常低,我們就可以確定樣本不屬于該總體。

(三)求未知非正態(tài)分布的置信區(qū)間

在大樣本的情況下,要想求得未知分布的置信區(qū)間,就需要用到中心極限定理的內(nèi)容。即可以利用正態(tài)分布的性質(zhì)來(lái)求解出該未知分布的置信區(qū)間。

七、中心極限定理的意義

正態(tài)分布在概率論中占有著舉足輕重的地位,它是許多概率和分布的理論基礎(chǔ)。很多隨機(jī)變量的分布都與正態(tài)分布有關(guān)系,比如我們所熟知的t分布、卡方分布、F分布等等。除此之外,在一些相關(guān)性檢驗(yàn)中我們也能發(fā)現(xiàn)正態(tài)分布的身影,比如Pearson相關(guān)系數(shù)檢驗(yàn)的前提條件就是該檢驗(yàn)只能在正態(tài)分布的假定下進(jìn)行,而Spearman秩相關(guān)檢驗(yàn)和Kendall τ相關(guān)檢驗(yàn)都用到了大樣本下的正態(tài)近似。而中心極限定理則可以將大量隨機(jī)變量和的分布最終歸到正態(tài)分布的陣營(yíng)之中,由此可見(jiàn)它在概率論和數(shù)理統(tǒng)計(jì)中有著非常重要的作用。

其次,中心極限定理還為概率論和數(shù)理統(tǒng)計(jì)在統(tǒng)計(jì)學(xué)的應(yīng)用奠定了理論基礎(chǔ)。在統(tǒng)計(jì)學(xué)的研究中,由于直接研究總體的特征比較困難,我們常常用抽樣的方式進(jìn)行研究,用某種方法和規(guī)則從總體中抽選一定的樣本,并根據(jù)樣本的某些指標(biāo)來(lái)估計(jì)總體。但這個(gè)關(guān)鍵是要知道樣本的分布,然而很多時(shí)候樣本的分布都是未知的。中心極限定理指出只要樣本容量n足夠大時(shí),未知總體的樣本分布就近似為正態(tài)分布。因此,只要得到足夠多的樣本統(tǒng)計(jì)數(shù)據(jù),就可以用正態(tài)分布的性質(zhì)來(lái)處理。因此就可以利用中心極限定理把數(shù)理統(tǒng)計(jì)中的一些方法應(yīng)用到統(tǒng)計(jì)學(xué)中。

猜你喜歡
二項(xiàng)分布正態(tài)概率論
二項(xiàng)分布與超幾何分布的區(qū)別與聯(lián)系
深度剖析超幾何分布和二項(xiàng)分布
概率與統(tǒng)計(jì)(1)——二項(xiàng)分布與超幾何分布
淺談《概率論與數(shù)理統(tǒng)計(jì)》課程的教學(xué)改革
二項(xiàng)分布參數(shù)的E-Bayes估計(jì)及其應(yīng)用
雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗(yàn)
基于泛正態(tài)阻抗云的諧波發(fā)射水平估計(jì)
半?yún)?shù)EV模型二階段估計(jì)的漸近正態(tài)性
論《概率論與數(shù)理統(tǒng)計(jì)》教學(xué)改革與學(xué)生應(yīng)用能力的培養(yǎng)
基于正態(tài)變換的貸款組合定價(jià)模型構(gòu)建及實(shí)證
九寨沟县| 汝南县| 青浦区| 孝感市| 五原县| 扶绥县| 汉沽区| 凌云县| 万荣县| 庆云县| 从江县| 元朗区| 泗水县| 买车| 夏津县| 丹凤县| 墨竹工卡县| 嘉鱼县| 瓮安县| 奉节县| 万安县| 客服| 张掖市| 新乐市| 宜州市| 淄博市| 静海县| 垫江县| 沭阳县| 榆林市| 顺昌县| 谢通门县| 宝清县| 汕头市| 靖西县| 盐池县| 海盐县| 涪陵区| 晴隆县| 江川县| 绥宁县|