殷清濤(甘肅省敦煌市敦煌中學(xué))
關(guān)于廣義正態(tài)分布性質(zhì)的研究
殷清濤
(甘肅省敦煌市敦煌中學(xué))
正態(tài)分布是由德國著名數(shù)學(xué)家高斯首先得到的,所以也常常稱為高斯分布。正態(tài)分布在數(shù)學(xué)、物理、化學(xué)及工程中都具有非常重要的地位,尤其在統(tǒng)計(jì)學(xué)中有著重大的影響力。事實(shí)上,正態(tài)分布是應(yīng)用最為廣泛的一種分布,它存在于人們生產(chǎn)生活的各個(gè)方面。例如,同一機(jī)器生產(chǎn)出的大量產(chǎn)品的質(zhì)量分布;同一年齡段人類的身高、體重分布;某一地區(qū)年降水量的分布;科學(xué)實(shí)驗(yàn)中測(cè)量同一物體的誤差分布,理想氣體的速度分布等等?,F(xiàn)在人們知道,正態(tài)分布是由中心極限定理保證的。實(shí)際應(yīng)用中,還存在一些其他形式的分布,例如t分布、F分布等,其實(shí),這些分布也是由正態(tài)分布直接導(dǎo)出的。正態(tài)分布可以用來估計(jì)頻數(shù)分布,制定參考值范圍,質(zhì)量控制等等。然而,我們知道,作為保證正態(tài)分布的中心極限定理,是以大數(shù)法則為前提的,具體地說,事件的數(shù)目越多,中心極限定理越嚴(yán)格,才能保證趨向于正態(tài)分布。理論上講,事件的數(shù)目為無窮大時(shí),中心極限定理才嚴(yán)格正確,分布才是正態(tài)分布。實(shí)際生活中,事件的數(shù)目顯然不是無窮大,因此正態(tài)分布實(shí)際上并不能準(zhǔn)確無誤地表示分布規(guī)律。在本篇文章中提出以廣義正態(tài)分布代替?zhèn)鹘y(tǒng)正態(tài)分布,可以很有效地解決這一矛盾。
傳統(tǒng)正態(tài)分布的分布函數(shù)可表示為:
從上式可以看出,正態(tài)分布的核心是自然指數(shù)e,是自然對(duì)數(shù)的底數(shù),是一個(gè)無限不循環(huán)小數(shù),其值約為2.71828……,它是一個(gè)超越數(shù)。自然指數(shù)在整個(gè)數(shù)學(xué)史上都具有非常重要的地位。自然指數(shù)是由一個(gè)重要極限給出的。即當(dāng)n趨于無限時(shí)(1+1/n)n=e。以自然指數(shù)為底數(shù)的對(duì)數(shù)叫做自然對(duì)數(shù),一般用ln表示。自然對(duì)數(shù)的含義是在單位時(shí)間內(nèi),持續(xù)的翻倍增長(zhǎng)所能達(dá)到的極限值。
所謂廣義正態(tài)分布,就是在傳統(tǒng)的正態(tài)分布基礎(chǔ)上,增加上一個(gè)量q,該量稱為非廣延參數(shù),已經(jīng)被廣泛應(yīng)用于物理、化學(xué)、生物、工程、經(jīng)濟(jì)、計(jì)算機(jī)科學(xué)等各個(gè)領(lǐng)域中。它的正確性已經(jīng)得到了廣泛承認(rèn)。接下來,從微分方程出發(fā)研究廣義正態(tài)分布:
考慮這樣一個(gè)簡(jiǎn)單的一階線性微分方程:dy/dx=y,它的解是y=ex,反函數(shù)是y=lnx。很容易看出該微分方程導(dǎo)出了自然指數(shù)和自然對(duì)數(shù)。
再考慮非線性微分方程:dy/dx=yq,它的解是y=[1+(1-q)x]1/(1-q)=exq,反函數(shù)是當(dāng)q無限接近1時(shí),得到了自然指數(shù)和自然對(duì)數(shù)的極限形式,以后簡(jiǎn)單稱之為廣義自然指數(shù)和廣義自然對(duì)數(shù)。以廣義自然指數(shù)為基礎(chǔ),便可以得到廣義正態(tài)分布函數(shù):
對(duì)于自然對(duì)數(shù)和自然底數(shù),有如下基本性質(zhì):
這兩個(gè)基本性質(zhì)是正態(tài)分布得以廣泛應(yīng)用的一個(gè)重要理由,因?yàn)樗鼈兪沟谜龖B(tài)分布在運(yùn)算中極為簡(jiǎn)便,若缺少這兩個(gè)基本性質(zhì),幾乎所有涉及正態(tài)分布的運(yùn)算量都將增大很多倍。然而,廣義自然指數(shù)與廣義自然底數(shù)卻不具備傳統(tǒng)自然對(duì)數(shù)與傳統(tǒng)自然底數(shù)的這些優(yōu)良性質(zhì),即exq·eyq=eq(x+y+(1-q)xy),很顯然exq·eyq不等于exyq;同理從lnq(xy)=lnqx+lnqy+(1-q)lnqlnqy可以看出當(dāng)q不等于1時(shí),lnqx+lnqy不等于lnq(xy),這使得廣義正態(tài)分布在實(shí)際應(yīng)用中計(jì)算繁瑣,下面定義一套新的運(yùn)算法則,可以有效簡(jiǎn)化廣義正態(tài)分布的計(jì)算量。
如果同時(shí)定義廣義乘法與廣義加法規(guī)則如下:
則以上性質(zhì)可以得到保持:
可以看到在廣義乘法規(guī)則下exq×eyq正好等于ex+yq;
可以看到,在廣義加法規(guī)則下lnqx+lnqy正好等于lnqxy。
既然定義了廣義乘法與廣義加法規(guī)則,廣義除法與廣義減法規(guī)則也就自然而然地給出,此處不再詳述。接下來,在此基礎(chǔ)上建立較為復(fù)雜的運(yùn)算:廣義微分和廣義積分,從而形成一整套廣義運(yùn)算規(guī)則。首先定義廣義微分:
于是相應(yīng)的廣義積分由下式給出:
以上討論的廣義正態(tài)分布下的運(yùn)算法則都是相對(duì)簡(jiǎn)潔的,事實(shí)上實(shí)際運(yùn)算中還會(huì)出現(xiàn)很多本文未能包含的情況,但不管多么復(fù)雜的運(yùn)算,總能從本文定義的加減乘除以及微分積分經(jīng)過適當(dāng)?shù)慕M合以及變形給出。在廣義運(yùn)算規(guī)則下,廣義正態(tài)分布中的運(yùn)算量大大減少,這很好地減輕了工業(yè)生產(chǎn)和科學(xué)實(shí)驗(yàn)中的計(jì)算量,具有非常重要的實(shí)際意義。
為了進(jìn)一步說明廣義正態(tài)分布的重要性,以下將舉出兩個(gè)廣義正態(tài)分布成功應(yīng)用的例子。
例1.某地抽樣調(diào)查兩百名十九歲的男大學(xué)生的身高,發(fā)現(xiàn)平均身高為172.5厘米,標(biāo)準(zhǔn)差為3.98厘米。求這兩百名十九歲男大學(xué)生中,有多少人身高分布在168.5厘米到176.5厘米之間?若依照傳統(tǒng)正態(tài)分布理論,可以很容易得出67%的男大學(xué)生處在該范圍,于是算出應(yīng)該有134人身高分布在168.5厘米到176.5厘米之間。然而實(shí)際情況卻有所偏差。該地抽樣調(diào)查結(jié)果顯示,這兩百名十九歲的男大學(xué)生身高處在該范圍的人數(shù)為136人。應(yīng)用廣義正態(tài)分布理論,取q值為0.96,可發(fā)現(xiàn)廣義正態(tài)分布計(jì)算所得值為136人,與實(shí)際抽樣調(diào)查結(jié)果相同。事實(shí)上,傳統(tǒng)正態(tài)分布與實(shí)際的偏差來源于抽樣的局限性。抽樣的樣本容量越小,理論與實(shí)際的偏差越大,q越偏離1,越應(yīng)該使用廣義正態(tài)分布。傳統(tǒng)正態(tài)分布嚴(yán)格來講只適用于抽樣容量無限大的情況。
例2.理想氣體分子的速度分量分布。物理學(xué)中經(jīng)常以理想氣體為例來驗(yàn)證新理論的正確性。所謂理想氣體,是指氣體分子本身體積與容器總體積相比很小,可忽略不計(jì),且氣體分子之間的作用力也很小,也可忽略不計(jì)的氣體。一般認(rèn)為,理想氣體的速度分量遵循麥克斯韋分布律,麥克斯韋分布律實(shí)質(zhì)上也就是正態(tài)分布。然而,理想氣體的速度分量分布,是否真的遵從正態(tài)分布,一般多年來都是作為一個(gè)既定的事實(shí),從未在實(shí)驗(yàn)上直接測(cè)量驗(yàn)證過。近年來,越來越多的科學(xué)家認(rèn)為,正態(tài)分布或許只是一種可能的分布,而不是唯一的分布。另外,理想氣體的條件過于苛刻,實(shí)際上不存在能夠滿足理想氣體條件的真實(shí)氣體。廣義正態(tài)分布為對(duì)應(yīng)的廣義麥克斯韋分布律提供了一種可能,對(duì)于不同的氣體,取不同的q值,可以更好地描述真實(shí)氣體系統(tǒng)。
周秋生.廣義正態(tài)分布及其二次函數(shù)的性質(zhì)[J].測(cè)繪工程,1999(1).
·編輯薄躍華