国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

正態(tài)分布與統(tǒng)計學(xué)的關(guān)系史研究*

2010-08-15 00:47:13朱春浩
關(guān)鍵詞:皮爾遜正態(tài)正態(tài)分布

朱春浩

(武漢船舶職業(yè)技術(shù)學(xué)院公共課部,湖北武漢 430050)

形如“中間高,兩頭低”的鐘形曲線所代表的正態(tài)分布,由于其強(qiáng)大的普適性,是概率論中最重要的一種連續(xù)型分布。從形式上看,它屬于概率論的范圍,但同時又是統(tǒng)計學(xué)的基石,因此它的提出和應(yīng)用具有獨(dú)特的雙重理論背景和重要價值。

現(xiàn)有文獻(xiàn)大多只是談?wù)撃骋粋€人物或某一階段對正態(tài)分布理論所做的工作,并且以詳實地記錄其理論上的推導(dǎo)和證明為主,對于正態(tài)分布從開始不受重視到之后大行其道的發(fā)展背景和歷史根源并沒有進(jìn)行詳盡地挖掘和明確地表述,而后者對于數(shù)學(xué)研究則更具有理論價值和指導(dǎo)意義。

本文以正態(tài)分布的歷史發(fā)展為題材,對其不同階段的發(fā)展背景——同期概率論和統(tǒng)計學(xué)的發(fā)展?fàn)顩r及其代表人物的重要工作做了系統(tǒng)的分析與總結(jié),并以此為線索來考證概率統(tǒng)計理論由互相孤立到彼此滲透,再到相互交融的發(fā)展特點(diǎn)。筆者試圖從這些角度入手,對正態(tài)分布與統(tǒng)計學(xué)的關(guān)系史的演化作一個全面的梳理和考察,以期為相關(guān)歷史研究和教育提供借鑒意義。

1 正態(tài)分布與統(tǒng)計學(xué)的關(guān)系史

從歷史上看,正態(tài)分布從問世到作為分析統(tǒng)計數(shù)據(jù)的概率模型經(jīng)歷了4個階段:18世紀(jì)30年代,棣莫弗最初在研究對一個概率作近似計算時發(fā)現(xiàn)了正態(tài)曲線,但由于多種原因它并沒有作為刻畫隨機(jī)現(xiàn)象的概率分布;1809年,高斯在研究測量誤差時,第一次以概率分布的形式重新提出此分布,并贏得了人們的普遍關(guān)注和研究,然而人們對統(tǒng)計數(shù)據(jù)與觀測數(shù)據(jù)不相容性的認(rèn)識,使得它的應(yīng)用范圍卻僅限于天文學(xué)、測地學(xué)等誤差論領(lǐng)域;19世紀(jì)中葉至末期,凱特勒在社會領(lǐng)域,高爾頓等人在生物學(xué)領(lǐng)域的工作,使正態(tài)分布迅速擴(kuò)大到許多自然科學(xué)和社會科學(xué)領(lǐng)域,并最終進(jìn)入統(tǒng)計學(xué),成為一系列核心理論的基礎(chǔ)和導(dǎo)火索;20世紀(jì)初,以戈塞特為先驅(qū),費(fèi)歇爾為主將,掀起了小樣本理論的革命,大大提升了正態(tài)分布在統(tǒng)計學(xué)中的地位,使得用正態(tài)分布擬合數(shù)據(jù)繼續(xù)占據(jù)應(yīng)用的主流,相關(guān)回歸分析、多元分析、方差分析、因子分析等統(tǒng)計方法,陸續(xù)登上了歷史舞臺,成為推動現(xiàn)代統(tǒng)計學(xué)飛速發(fā)展的一個強(qiáng)大動力。

1.1 發(fā)現(xiàn)

在概率論的研究中,棣莫弗(A.De Moiver,1667-1754)第一次引入了正態(tài)密度函數(shù)。正態(tài)分布的發(fā)現(xiàn),在相當(dāng)長時間里被人遺忘了。直到1924年卡爾·皮爾遜(K.Pearson,1857-1936)著《正態(tài)曲線史》(A History of the Normal Curve)一文,重新提到棣莫弗的工作,人們才認(rèn)識到他的貢獻(xiàn)。

1733年11月12日,棣莫弗將其一篇7頁的論文送給了幾位朋友,后來,棣莫弗聽取朋友的意見做了修改,又增加一些內(nèi)容,收錄在《機(jī)遇論》(The Doctrine of Chances)(第2版)。正是在這篇文章中,他第一次導(dǎo)出了正態(tài)概率曲線的表達(dá)式。

棣莫弗指出:如果視二項式展開式的各項為一系列豎直線段的長度,把這些線段擺在同一直線上方且與之垂直,那么線段的上端點(diǎn)將描繪出一條曲線。由此得到的曲線具有兩個拐點(diǎn),它們分別位于最大項對應(yīng)點(diǎn)的兩側(cè)。該曲線就是今日的正態(tài)概率曲線,進(jìn)而棣莫弗又得到以下近似公式,即在n次獨(dú)立重復(fù)試驗中事件出現(xiàn)m次的概率之期望值滿足

棣莫弗曾說:“我中斷了這一步的研究,后來我值得尊敬的、有學(xué)問的朋友斯特林①James Stirling,1692-1770。先生做了進(jìn)一步的探討和研究,找到了”1774年,拉普拉斯(P.S.Laplace,1749-1827)首先證明了,并對棣莫弗的結(jié)果進(jìn)行推廣,建立了中心極限定理較一般的形式,即今天的棣莫弗一拉普拉斯中心極限定理。

棣莫弗的二項式正態(tài)逼近的工作,是概率論應(yīng)用及統(tǒng)計學(xué)中最富有成效及最具有指導(dǎo)意義的發(fā)現(xiàn)。之后,經(jīng)拉普拉斯、俄羅斯學(xué)派等學(xué)者的努力,到20世紀(jì)30年代獨(dú)立變量和的中心極限定理最一般的形式最終完成,嗣后統(tǒng)計學(xué)家發(fā)現(xiàn),一系列的重要統(tǒng)計量,在樣本量時,其極限分布都具有正態(tài)形式,這構(gòu)成了大樣本方法的基礎(chǔ)。如今,大樣本方法在統(tǒng)計方法中占據(jù)了很重要的地位,飲水思源,棣莫弗的工作可以說是這一重要發(fā)展的源頭。

二項概率逼近的研究固然重要,可在當(dāng)時棣莫弗的工作并未引起人們更多的重視,正態(tài)曲線也僅僅停留在一個數(shù)學(xué)表達(dá)式的層面,在實際應(yīng)用中還沒有找到其適合存活的土壤。

在實質(zhì)等同原則的引領(lǐng)下,美國經(jīng)過幾十年的自由蓬勃發(fā)展起來的轉(zhuǎn)基因技術(shù)領(lǐng)先全世界,在技術(shù)發(fā)展的同時,為了防止轉(zhuǎn)基因技術(shù)被濫用從而影響正常的社會秩序,美國在世界上最早開展了規(guī)范轉(zhuǎn)基因技術(shù)發(fā)展的立法實踐,建立了相比其他國家來說非常完善的轉(zhuǎn)基因技術(shù)法律法規(guī)規(guī)范體系。

陳希孺先生認(rèn)為:棣莫弗本人并不是一個統(tǒng)計學(xué)家,他從未從統(tǒng)計學(xué)的觀點(diǎn)去考慮其工作的意義。棣莫弗的出發(fā)點(diǎn)始終是:把P作為一個已知值,如何在數(shù)值上去逼近二項式概率及其指定次數(shù)的和,而不是把看p作未知,如何通過觀察結(jié)果去對p進(jìn)行推斷的問題。

英國數(shù)學(xué)史學(xué)家托德亨特(I.Todhunter,1820-1884)在其文獻(xiàn)中完全遺漏了棣莫弗的“逼近”在《機(jī)遇論》中的擴(kuò)展及其劃時代性。他沒有強(qiáng)調(diào)這是斯特林公式的起源,是正態(tài)曲線的第一次出現(xiàn),是先于拉普拉斯和高斯的工作;他也沒有提出棣莫弗擴(kuò)展了牛頓的術(shù)語以及指導(dǎo)了統(tǒng)計學(xué)幾乎一個世紀(jì)的發(fā)展路線??枴て栠d認(rèn)為托德亨特在抓住科學(xué)革命的趨勢,以及挖掘當(dāng)時與科學(xué)革命相關(guān)的思想方面幾乎全部失敗。

正是在托德亨特的影響下,棣莫弗的這篇論文才沒有被作為對統(tǒng)計學(xué)的數(shù)學(xué)理論和統(tǒng)計實踐有廣泛影響的原則被使用,我們現(xiàn)在所知的正態(tài)分布也沒有被稱作“棣莫弗分布”②"Stigler命名律"這篇文章最初發(fā)表在紀(jì)念美國著名社會學(xué)家R.K.Merto的論文集"Science and social structure"上。"沒有什么科學(xué)發(fā)現(xiàn)是以他的最初發(fā)明者命名的"這一說法最初就是來源于Merton,Stigler將其文章的題目命為"Stigler命名律",就是為了以一種強(qiáng)烈與幽默的方式,表達(dá)這一規(guī)律的有效性。。在這種意義下,我們可以看出史學(xué)家在科學(xué)的傳播和發(fā)展中所起到的向?qū)宰饔?。由此看,在棣莫弗時代,使正態(tài)分布作為一種有效的概率模型的時機(jī)還遠(yuǎn)不成熟。

1.2 再生

無論是對自然現(xiàn)象還是對社會現(xiàn)象進(jìn)行觀測,總會產(chǎn)生誤差,這一點(diǎn)在很早以前人們就注意到了,但是對于其觀測值所呈現(xiàn)出的隨機(jī)性,人們總是認(rèn)識模糊,眾說紛紜,不能達(dá)成統(tǒng)一。進(jìn)入18世紀(jì),數(shù)學(xué)呈現(xiàn)出一個很重要的特征:“工作的目標(biāo)不是數(shù)學(xué),而是求解社會問題;數(shù)學(xué)是實現(xiàn)實踐目的的一種方法”。這段時期,數(shù)學(xué)、物理學(xué)和天文學(xué)是自然科學(xué)的主體。數(shù)學(xué)的主流是由微積分發(fā)展起來的數(shù)學(xué)分析,由于分析方法廣泛而卓有成效的應(yīng)用,致使天文學(xué)和物理學(xué)變得數(shù)學(xué)化起來;隨著科學(xué)數(shù)學(xué)化進(jìn)程的深入,概率論的地位也就日益增強(qiáng),它不僅得到傳統(tǒng)哲學(xué)和神學(xué)的認(rèn)可,而且為眾多的科學(xué)成果所證實。這樣,概率論就進(jìn)入到廣泛應(yīng)用的時期,而把概率論應(yīng)用到描述誤差的問題中來就推動了誤差論的發(fā)展。

天文學(xué)家伽利略(G.Galileo,1564-1642)可能是第一個提出隨機(jī)誤差概念并對其有所研究的學(xué)者。他在1632年出版的著作《關(guān)于兩個主要世界系統(tǒng)的對話》中提及這個問題。雖然他沒有提出“隨機(jī)”和“分布”這樣的概念,而是使用“觀測誤差”的名稱,但他揭示了正態(tài)概率定律的許多特征,所描述的性質(zhì)實則為現(xiàn)在的隨機(jī)誤差分布。

1809年,高斯(Gauss,1777-1855)發(fā)表論著《天體運(yùn)行論》,在該書末尾,他寫了一節(jié)有關(guān)“數(shù)據(jù)結(jié)合”的問題,以極其簡單的手法導(dǎo)出誤差分布——正態(tài)分布①這個分布第一次在1893年被卡爾·皮爾遜稱為正態(tài)分布。,并用最小二乘法②最小二乘法最早出現(xiàn)在勒讓德(Legendre,1752-1833)于1805年發(fā)表的論著《計算彗星軌道的新方法》附錄中。該附錄占據(jù)了這本80頁小冊子的最后9頁,在前面關(guān)于衛(wèi)星軌道計算的討論中沒有涉及最小二乘法,可以推測他當(dāng)時感到這一方法尚不成熟。關(guān)于最小二乘法,高斯宣稱自1795年以來他一直使用這個原理,這立刻引起了勒讓德的強(qiáng)烈反擊,他提醒說科學(xué)發(fā)現(xiàn)的優(yōu)先權(quán)只能以出版物確定,并嚴(yán)斥高斯剽竊了他人的發(fā)明,他們間的爭執(zhí)延續(xù)了多年。因而,這兩位數(shù)學(xué)家之間關(guān)于優(yōu)先權(quán)的爭論,在數(shù)學(xué)史上的知名度僅次于牛頓和萊布尼茲之間關(guān)于微積分發(fā)明權(quán)的爭論。現(xiàn)在一般認(rèn)為,二人各自獨(dú)立地發(fā)明了最小二乘法,盡管早在10年前,高斯就使用這個原理,但第一個用文字形式發(fā)表的是勒讓德,高斯較之于勒讓德把最小二乘法推進(jìn)得更遠(yuǎn),他由誤差函數(shù)推導(dǎo)出這個方法并詳盡闡述了最小二乘法的理論依據(jù)。加以驗證。

最小二乘法在19世紀(jì)初發(fā)明后,很快得到歐洲一些國家的天文學(xué)家和測地學(xué)家的廣泛關(guān)注。誤差的分布是“正態(tài)”的,也立刻得到天文學(xué)家的關(guān)注及大量經(jīng)驗的支持。如貝塞爾(Bessel,1784-1846)對幾百顆星球作了三組觀測,并比較了按照正態(tài)規(guī)律在給定范圍內(nèi)的理論誤差值和實際值,對比表明它們非常接近一致。拉普拉斯在1810年也給出了正態(tài)規(guī)律的一個新的理論推導(dǎo)并寫入其《分析概率論》中。

正態(tài)分布作為一種統(tǒng)計模型,在19世紀(jì)極為流行,一些學(xué)者甚至把19世紀(jì)的數(shù)理統(tǒng)計學(xué)稱為正態(tài)分布的統(tǒng)治時代。在其影響下,最小二乘法也脫出測量數(shù)據(jù)意義之外而發(fā)展成為一個包羅極大,應(yīng)用極其廣泛的統(tǒng)計模型。到20世紀(jì)正態(tài)小樣本理論充分發(fā)展后,高斯研究成果的影響更加顯著。

總之,高斯對誤差正態(tài)分布的提出,以及與之相伴的最小二乘法和中心極限定理一般形式的誕生,對后世的影響極大,這也使正態(tài)分布同時有了“高斯分布”的名稱?,F(xiàn)今德國10馬克的印有高斯頭像的鈔票,其上還印有正態(tài)分布的密度曲線,這無疑傳達(dá)了一種觀念:在高斯的一切科學(xué)貢獻(xiàn)中,對人類文明影響最大者就是正態(tài)分布,這也充分預(yù)示了正態(tài)分布之后在概率論和統(tǒng)計學(xué)中所取得的重要性地位。

1.3 融合

把正態(tài)分布的舞臺拓展出去的當(dāng)屬凱特勒(A.Quetelet,1796-1874),他與正態(tài)曲線有關(guān)的工作分為兩個方面:一是把誤差理論應(yīng)用到新的領(lǐng)域,二是“平均人”的概念。前者的靈感來源于人口普查,后者則是使統(tǒng)計方法獲得廣泛應(yīng)用的理論基礎(chǔ)。二者相輔相成,共同構(gòu)成了凱特勒思想的根基。他首次強(qiáng)調(diào)了正態(tài)分布的用途,并將以它為基礎(chǔ)的統(tǒng)計方法應(yīng)用到天文學(xué)、數(shù)學(xué)、物理學(xué)、生物學(xué)、社會統(tǒng)計學(xué)及氣象學(xué)等研究范圍,在他的影響下,正態(tài)分布獲得了普遍認(rèn)可和廣泛應(yīng)用,以至有些學(xué)者認(rèn)為19世紀(jì)是正態(tài)分布在統(tǒng)計學(xué)中占統(tǒng)治地位的時代。

在凱特勒的啟發(fā)下,高爾頓(A.Galton,1822-1911)對正態(tài)分布懷有濃厚的興趣,最早把統(tǒng)計方法應(yīng)用于生物學(xué),他繼續(xù)研究和推廣正態(tài)曲線,提出了中位數(shù)、四分位數(shù)、百分位數(shù)及四分位偏差等概念,并創(chuàng)立了回歸分析,對英國生物統(tǒng)計學(xué)派的興起起到了奠基性作用。

用他自己的語言可以最生動地描述這一點(diǎn):“我第一次對誤差的高斯定律——正規(guī)曲線產(chǎn)生興趣應(yīng)歸功于一篇討論某高山群海拔的地理學(xué)論文,我充分理解了他所展示的這個漂亮定律的廣泛應(yīng)用,之后我更是嘗到了熟悉凱特勒工作的樂趣。我?guī)缀醪恢肋€有什么可以像誤差的頻數(shù)定律所表示的和諧秩序這樣使人印象深刻,如果希臘人知道它的話,一定會把它奉為神靈來祭拜。它在最激烈的雜亂中平靜地盛行著,并且不求聞達(dá)?!?/p>

他與凱特勒一樣相信正態(tài)曲線是“適用于無數(shù)情況”的一般法則。他最早把統(tǒng)計方法應(yīng)用于生物學(xué),并作了兩點(diǎn)突破:第一,他指出,若干個同質(zhì)數(shù)據(jù)的混合體,可借助正態(tài)分布分離開,他極其廣泛地搜集資料,目的就在于探索把大量已知數(shù)目歸納為能夠用于描述和比較的幾個簡單公式的途徑和方法;第二,引進(jìn)了“統(tǒng)計尺度”的概念,把非數(shù)量性指標(biāo)(如智力)數(shù)量化,從而能夠進(jìn)行計算和比較,并指出:同一物種若其某數(shù)量性指標(biāo)(如身高)可用正態(tài)曲線擬合,則其他指標(biāo)也可用正態(tài)分布擬合,這種思想在心理學(xué)和教育學(xué)中出現(xiàn)了很多追隨者。

然而,這種無所不在的正態(tài)性也給高爾頓帶來一些困惑:“身高曲線和正態(tài)曲線之間的一致性,形成了我對自然遺傳定律研究的主要依靠。數(shù)學(xué)家基于描述誤差的目的發(fā)現(xiàn)了誤差定律,我們現(xiàn)在正帶著另一種目的去利用他們的勞動成果。”,“但是總有機(jī)會去正當(dāng)?shù)匾苫?,建立在誤差定律嚴(yán)格性基礎(chǔ)上的結(jié)論在逼近變量之間的相互作用時是否正確。當(dāng)我們把理論上的結(jié)論放在頻率試驗中檢驗時,發(fā)現(xiàn)人類學(xué)者可能在使用誤差頻數(shù)定律的性質(zhì)上比以前少了很多猶豫”。

高爾頓首先發(fā)現(xiàn)親子兩代身高數(shù)據(jù)服從同一正態(tài)分布,這引發(fā)了他兩方面的考慮:①按照中心極限定理所述,正態(tài)分布是由大量微小因素的影響而形成的,但眾所周知遺傳是一個顯著性因素,這應(yīng)如何解釋?②身高作為一種遺傳性狀,其優(yōu)勢傳遞給下一代,應(yīng)出現(xiàn)兩極分化的態(tài)勢,但子代身高穩(wěn)定的正態(tài)分布與此相悖。這成為他相關(guān)回歸思想產(chǎn)生的萌芽,帶著這些困惑,他開始對由實驗和抽樣得來的數(shù)據(jù)進(jìn)行統(tǒng)計分析。高爾頓首先借助兩個類比實驗,分別回答了這兩個問題。第一個是“正態(tài)漏斗”實驗。他利用許多小球從漏斗中落下,途經(jīng)有規(guī)律安置的障礙物,最終形成的正態(tài)曲線為例,以及在途中安插適當(dāng)?shù)拈y門,形成大小不同的球源,繼續(xù)下落,最終仍形成正態(tài)分布的結(jié)果,指出遺傳作為一個顯著性因素,仍可以分解為大量微小因素作用的疊加,這就與中心極限定理相一致了。高爾頓的發(fā)現(xiàn)表明,同質(zhì)性表面的背后包含了許多“異質(zhì)”的成分,這進(jìn)一步回答了正態(tài)分布得以廣泛應(yīng)用的原因。第二個是種豌豆試驗。1875年,他挑選了大小不同的豌豆種子,并分派不同的人去種。1877年,他對親子代的數(shù)據(jù)分別進(jìn)行分析,得到重大發(fā)現(xiàn):相同大小的種子的后代仍符合正態(tài)分布,且方差與種子大小無關(guān);子代的平均與母代的大小有對應(yīng)關(guān)系,且有向母代平均線性收縮的趨勢,總朝著一般平均數(shù)發(fā)展,這就初步回答了子代均值與母代一樣的原因。

8年后,為進(jìn)一步驗證他的解釋,高爾頓成立了一個“人體測量實驗室”。他向社會征求了205對夫婦及他們的928個成年子女的身高數(shù)據(jù),并進(jìn)行了統(tǒng)計分析。他把父母的平均身高作為母代變量x,把子代變量記為y(其中,女子身高乘以1.08),并把相應(yīng)的數(shù)據(jù)繪制成二維的,就發(fā)現(xiàn)相等強(qiáng)度的數(shù)據(jù)點(diǎn)出現(xiàn)在一條橢圓曲線上。于是問題就轉(zhuǎn)化為去尋找一個(x,y)的二維分布,來解釋這一現(xiàn)象。在數(shù)學(xué)家狄克遜的幫助下,他很快得到了二維正態(tài)分布的答案。雖然早在1846年,法國天文學(xué)家布雷瓦斯已經(jīng)對二元和三元正態(tài)分布進(jìn)行過探討,但他并沒有提到任何“相關(guān)”的術(shù)語。1886年,高爾頓發(fā)表了有關(guān)這種觀察的論文,提出父子之間的身高,有顯著的相關(guān)性:父代身材高,則子代的平均身材也高;但是從子代的組別觀察中,發(fā)現(xiàn)有退步現(xiàn)象,即“回歸”到父代平均數(shù)去。1888年,高爾頓在《自然遺傳》中,提出了中位數(shù)、四分位數(shù)、百分位數(shù)及四分位偏差等概念,引進(jìn)了回歸直線,并賦予相關(guān)概念前所未有的重要性,成為相關(guān)回歸理論的奠基者。這一理論后經(jīng)埃其渥斯、卡爾·皮爾遜等人的發(fā)展,成為一種得力的統(tǒng)計方法。

這樣,由于凱特勒和高爾頓的創(chuàng)新思想與實干精神的結(jié)合,正態(tài)分布逐步完成了從丑小鴨向白天鵝的蛻變。如果說,充斥著偶然性的世界是一個紛亂的世界,那么,正態(tài)分布為這個紛亂的世界建立了一定的秩序,直達(dá)理論的核心地位,使得偶然性現(xiàn)象在數(shù)量上被計算和預(yù)測成為可能。worth,1845-1926)、卡爾·皮爾遜和威爾頓(W.

1.4 影響

進(jìn)入現(xiàn)代統(tǒng)計時期,以埃其渥斯(F.Edgeworth,1845-1926)、卡爾·皮爾遜和威爾頓(W.F.R.Weldon,1860-1906)等人為先導(dǎo),引發(fā)了正態(tài)分布及其相關(guān)理論的一系列創(chuàng)新和深化。

在20世紀(jì)以前,統(tǒng)計學(xué)所處理的數(shù)據(jù)一般都是大量的、自然采集的,所用的方法以拉普拉斯中心極限定理為依據(jù),總是歸結(jié)到正態(tài)。這種大樣本統(tǒng)計學(xué)的頂峰和押陣大將,當(dāng)屬卡爾·皮爾遜。到了19世紀(jì)末期,數(shù)據(jù)與正態(tài)擬合不好的情況也日漸為人們所注意:凱特勒曾建議用二項分布去擬合“偏態(tài)”數(shù)據(jù)——這個思想后來成為卡爾·皮爾遜引進(jìn)其著名的曲線族的出發(fā)點(diǎn);高爾頓也認(rèn)識到,一組觀測值的幾何均值可能更好地表示估計的最可能值,如果是這樣的話,觀測值的對數(shù)可以被假設(shè)服從正態(tài)分布,這就導(dǎo)致了對數(shù)正態(tài)分布,這也激發(fā)了卡爾·皮爾遜的工作;而直接吸引卡爾·皮爾遜注意力的是1892年威爾頓的提問,他在用正態(tài)曲線去擬合一組“那波里蟹”體寬數(shù)據(jù)時,得到一個雙峰分布,并告知了皮爾遜,這引發(fā)了卡爾·皮爾遜的一系列成就。

皮爾遜首先認(rèn)為這可能是兩個正態(tài)分布的混合,于是給出復(fù)合分布函數(shù)去擬合,并提出用矩方法去估計其參數(shù)。隨后,卡爾·皮爾遜認(rèn)為,統(tǒng)計學(xué)需要的是一種能把觀測數(shù)據(jù)轉(zhuǎn)化為一個預(yù)測模型的方法,于是他希望找出一族曲線,去擬合從實際問題中得來的數(shù)據(jù),以便在正態(tài)分布不適用時可供選擇使用。1892-1895年,他依賴清晰的表達(dá)能力、精湛的數(shù)學(xué)功底以及堅持自我的精神在這項工作中獲得了成功,并以《數(shù)學(xué)用于進(jìn)化論》為總題目發(fā)表了一系列論文。由于正態(tài)分布在人們心中根深蒂固的地位,卡爾·皮爾遜的曲線族在當(dāng)時同樣引發(fā)了一場爭論,并由于各種理由不被絕大多數(shù)學(xué)者承認(rèn),但它同對數(shù)正態(tài)分布、極值分布等分布一樣,終究為人們提供了一種有用的工具,擴(kuò)大了統(tǒng)計方法的武庫。在理論上,多元正態(tài)分布的重要意義在于:它把起初純屬于誤差分析的線性模型理論與“統(tǒng)計數(shù)據(jù)”的分析溝通起來。1892年,埃其渥斯從兩元、三元以及四元變量開始工作,對于多元正態(tài)分布給出了第一個陳述。1896年,卡爾·皮爾遜在此基礎(chǔ)上給出了更加明確的推導(dǎo),并發(fā)展了一套比高爾頓的相關(guān)理論更一般化和精確化的復(fù)相關(guān)和多重回歸理論,他指出,這樣一個理論對于回答威爾頓提出的那類問題是很有必要的。在試圖把數(shù)據(jù)擬合到他的頻數(shù)曲線上時,卡爾·皮爾遜面臨對擬合優(yōu)度檢驗的需要,這使他于1900年建立了作為現(xiàn)代統(tǒng)計學(xué)牢固基礎(chǔ)的x2擬合優(yōu)度檢驗。

進(jìn)入20世紀(jì)之后,人工試驗條件下所得數(shù)據(jù)的統(tǒng)計分析問題,日漸被人們所重視。由于試驗數(shù)據(jù)量有限,那種依賴于近似正態(tài)分布的傳統(tǒng)方法開始招致質(zhì)疑,這促使人們研究這種情況下正確的統(tǒng)計方法問題??枴て栠d的理論指導(dǎo)和在釀酒公司工作的經(jīng)歷使得戈塞特(W.S.Gosset,1876-1937)具備了研究小樣本問題的良好條件。1908年,他發(fā)表著名論文《均值的或然誤差》(The Probable Error of a Mean),提出了正態(tài)樣本中樣本均值和標(biāo)準(zhǔn)差的比值的t分布,并給出了應(yīng)用上極其重要的第一個分布表格。雖然其推導(dǎo)有一些漏洞,但這并不影響其在歷史上的功績。

隨后費(fèi)歇爾(R.A.Fisher,1890-1962)為解決這些漏洞,開始了與哥塞特的通信及長達(dá)二十余年的友誼和研究。費(fèi)歇爾發(fā)展了“n維幾何”的方法,這成為正態(tài)樣本統(tǒng)計量的抽樣分布中一個極為有力的方法。自1915年開始,沿用這個方法費(fèi)歇爾獲得了一些應(yīng)用上極重要的統(tǒng)計量如相關(guān)系數(shù),正態(tài)樣本中絕對偏差、回歸系數(shù)、相關(guān)比、多重回歸和偏相關(guān)系數(shù)等的分布,以及來自兩個正態(tài)總體的樣本方差的比值的分布。同時,他發(fā)展了估計,充分性,似然,推斷,方差分析和實驗設(shè)計的思想,使得正態(tài)性假設(shè)在統(tǒng)計分析中發(fā)揮了關(guān)鍵性作用。此后,有關(guān)相關(guān)回歸分析中一些重要統(tǒng)計量的精確分布如t分布、f分布以及x2分布的產(chǎn)生,與多維正態(tài)分布一起,始終雄踞于統(tǒng)計學(xué)的要津,發(fā)揮關(guān)鍵性作用。至此,這場革命再次從理論上鑒定了正態(tài)分布的基礎(chǔ)性作用,在費(fèi)歇爾的推動下,現(xiàn)代統(tǒng)計學(xué)開始出現(xiàn)各種分支并迅速發(fā)展起來。

2 結(jié) 語

正態(tài)分布從提出時的不受重視到之后在統(tǒng)計學(xué)中大行其道的歷史過程,精辟地詮釋了在發(fā)展的不同階段概率論與統(tǒng)計學(xué)相關(guān)理論間的相互影響,成為相關(guān)研究的一個理論典范!

在統(tǒng)計學(xué)發(fā)展的歷史中,沒有哪一個理論,象正態(tài)分布那樣被廣泛地發(fā)展。人們總是設(shè)法利用改進(jìn)了的新觀念和新方法,去研究該理論的應(yīng)用基礎(chǔ)及其數(shù)學(xué)性質(zhì),它的產(chǎn)生和發(fā)展,它的新理論和新應(yīng)用,它的傳遞性和同其它理論的相互作用,推動了整個統(tǒng)計學(xué)的發(fā)展。

1 A.Hald.A History of Probability and Statistics and Their Applications before 1750[M].New York:John Wiley and Sons Inc,1990.

2 A.Hald.A History of Mathematical Statistics from 1750to 1930[M].New York:John Wiley and Sons Inc,1998.

3 E.S.Person and M.G.Kendall.Studies in the History of Statistics and Probability[C].Charles Griffin &Company Limited London & High Wycombe,1970.

4 I.Todhunter.A History of the Mathematical of Theory of Probability from the Times of Pascal to That of Laplace[M].NewYork:Chelsea,1965.

5 I.Hacking.The Emergence of Probability[M].London:Cambridge University Press,1975.

6 K.Person.The History of Statistics in the 17th and 18th Centuries,Against the Changing Bachground of Intellectual,Scientific and Religious Thought[M].Charles Griffin & Company Limited London & High Wycombe,1978.

7 陳希孺.?dāng)?shù)理統(tǒng)計學(xué)簡史[M].湖南:湖南教育出版社,2002.

8 賈小勇等.最小二乘法的創(chuàng)立及其思想方法[J].西北大學(xué)學(xué)報(自然科學(xué)版),2006(3):507-511.

9 徐傳勝等.亞伯拉罕·棣莫弗的概率思想與正態(tài)概率曲線[J].西北大學(xué)學(xué)報(自然科學(xué)版),2006(2):339-343.

10 徐傳勝,張梅東.正態(tài)分布兩發(fā)現(xiàn)過程的數(shù)學(xué)文化比較[J].純粹數(shù)學(xué)與應(yīng)用數(shù)學(xué),2007(1):137-144.

11 于忠義.高斯與觀測誤差分布的發(fā)現(xiàn)[J].統(tǒng)計與信息論壇,2006(6):28-30.

12 朱春浩.簡明概率論學(xué)術(shù)史綱要[J].武漢船舶職業(yè)技術(shù)學(xué)院學(xué)報,2010(5):103-107.

13 朱春浩.概率論思想方法的歷史研究[M].四川:電子科技大學(xué)出版社,2007.

14 朱春浩.最小一乘法與最小二乘法:歷史與差異[J].統(tǒng)計與決策,2007(6):9-10.

猜你喜歡
皮爾遜正態(tài)正態(tài)分布
現(xiàn)代統(tǒng)計學(xué)之父:卡爾·皮爾遜
現(xiàn)代統(tǒng)計學(xué)之父:卡爾·皮爾遜
Excel在水文學(xué)教學(xué)中的應(yīng)用
卡方分布的探源
基于對數(shù)正態(tài)分布的出行時長可靠性計算
雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗
正態(tài)分布及其應(yīng)用
基于泛正態(tài)阻抗云的諧波發(fā)射水平估計
正態(tài)分布題型剖析
半?yún)?shù)EV模型二階段估計的漸近正態(tài)性
灵璧县| 甘孜县| 通道| 宜君县| 林州市| 平遥县| 开平市| 民乐县| 元阳县| 固安县| 嵊州市| 夏津县| 高碑店市| 洪湖市| 丹巴县| 宁明县| 潜江市| 兰州市| 昌江| 赤水市| 萨嘎县| 赤壁市| 温州市| 称多县| 平原县| 渭源县| 桐庐县| 芦山县| 南靖县| 中卫市| 万安县| 辰溪县| 台北县| 东源县| 汉沽区| 汝南县| 棋牌| 大连市| 中阳县| 正宁县| 凯里市|