朱貴鳳
(天津現(xiàn)代職業(yè)技術(shù)學(xué)院,天津 300222)
生物統(tǒng)計(jì)學(xué)在生命科學(xué)的研究以及生產(chǎn)實(shí)踐中起著非常重要的作用,生物統(tǒng)計(jì)學(xué)是集科學(xué)的實(shí)踐性、以及科學(xué)的應(yīng)用性還有方法論于一體的一門學(xué)科,應(yīng)當(dāng)明確的是,生物統(tǒng)計(jì)學(xué)的重要任務(wù)之一是應(yīng)用于實(shí)踐。憑借統(tǒng)計(jì)推理的能力,學(xué)會(huì)從不確定性和概率的角度認(rèn)真思考問(wèn)題,深刻理解統(tǒng)計(jì)學(xué)的所有基本原理。在科學(xué)實(shí)驗(yàn)中,統(tǒng)計(jì)學(xué)原理的應(yīng)用更為突出。因此,我們說(shuō)生物統(tǒng)計(jì)學(xué)是數(shù)理統(tǒng)計(jì)在生物學(xué)研究中的應(yīng)用,它結(jié)合數(shù)理統(tǒng)計(jì)原理和統(tǒng)計(jì)方法,來(lái)理解、分析、推斷和解釋生命過(guò)程中的各種現(xiàn)象和各種實(shí)驗(yàn)調(diào)查數(shù)據(jù)。它屬于應(yīng)用數(shù)學(xué)領(lǐng)域。它不僅為設(shè)計(jì)實(shí)驗(yàn)和收集數(shù)據(jù)提供了正確的手段,而且生物特征識(shí)別能夠給出真實(shí)客觀的科學(xué)結(jié)論。生物數(shù)學(xué)包含了許多分支,其中生物特征學(xué)是最早形成的分支之一,其核心是運(yùn)用統(tǒng)計(jì)學(xué)原理和方法研究生物客觀現(xiàn)象和問(wèn)題,在這樣的過(guò)程中形成一門新的學(xué)科,即生物數(shù)學(xué)。由于各種問(wèn)題需要對(duì)生物學(xué)進(jìn)行深入研究,這極大地促進(jìn)了統(tǒng)計(jì)學(xué)在許多基本方面的發(fā)展和完善。統(tǒng)計(jì)方法在生物學(xué)等領(lǐng)域的應(yīng)用,對(duì)于正確理解、正確推斷和正確解釋生命科學(xué)中的各種定量現(xiàn)象,在生物學(xué)界顯得越來(lái)越重要。統(tǒng)計(jì)分析和實(shí)驗(yàn)設(shè)計(jì)是生物科學(xué)研究中不可分割的兩個(gè)部分。統(tǒng)計(jì)分析的原理和方法是實(shí)驗(yàn)設(shè)計(jì)的基礎(chǔ)。正確設(shè)計(jì)的實(shí)驗(yàn)為統(tǒng)計(jì)分析提供了更豐富、更可靠的內(nèi)容信息,二者緊密結(jié)合,得出科學(xué)合理的結(jié)論,不斷推動(dòng)應(yīng)用生物學(xué)研究的快速發(fā)展。因此,生物統(tǒng)計(jì)學(xué)是人類不可缺少的一門重要學(xué)科??梢院?jiǎn)單概括為:生物統(tǒng)計(jì)學(xué)主要包括生物統(tǒng)計(jì)學(xué)語(yǔ)言、生物統(tǒng)計(jì)學(xué)數(shù)據(jù)描述、生物統(tǒng)計(jì)學(xué)分析工具、概率基礎(chǔ)和統(tǒng)計(jì)方法。下面重點(diǎn)介紹概率基礎(chǔ)在生物統(tǒng)計(jì)學(xué)中的重要應(yīng)用。
概率基礎(chǔ)主要包括:隨機(jī)試驗(yàn)、隨機(jī)事件、概率的統(tǒng)計(jì)定義、小概率原理、隨機(jī)變量、隨機(jī)變量的概率分布等。它們是如何應(yīng)用于生物科學(xué)的?
隨機(jī)試驗(yàn)是指在同一條件下觀察某種生物現(xiàn)象的一種試驗(yàn),當(dāng)然包括各種科學(xué)試驗(yàn)。比如:新冠病毒在全球范圍內(nèi)肆虐,目前還沒有完全被人類制服而且控制住,要控制好這場(chǎng)疫情,疫苗起到了至關(guān)重要的作用,全球都在進(jìn)行大規(guī)模的試驗(yàn),研究開發(fā)疫苗。這些就需要進(jìn)行隨機(jī)試驗(yàn)。
在人類進(jìn)行的各類社會(huì)實(shí)踐中有些現(xiàn)象在一定條件下必然發(fā)生,或不可能發(fā)生。例如,太陽(yáng)會(huì)從西邊升起,魚兒離開水不能存活下去。他們分別稱為不可能事件和必然事件。然而在生物科學(xué)中大量存在的,卻是在一定條件下可能發(fā)生也可能不發(fā)生的現(xiàn)象,又例如,某人感染了新冠肺炎病毒,過(guò)馬路恰好遇到了紅燈,等等,這些有可能發(fā)生也有可能不發(fā)生的現(xiàn)象叫隨機(jī)事件。
1.在同一條件下進(jìn)行n次重復(fù)試驗(yàn),如果隨機(jī)事件A發(fā)生了m次,其比值m比n稱為隨機(jī)事件A發(fā)生的頻率,當(dāng)實(shí)驗(yàn)次數(shù)逐漸增大時(shí),隨機(jī)事件A的頻率越來(lái)越穩(wěn)定地接近某一數(shù)值P,那么就把P稱為隨機(jī)事件A發(fā)生的概率,這樣得出的定義就是概率的統(tǒng)計(jì)定義。
例如,某大型孵化室記錄了某品種動(dòng)物8批入孵種蛋的孵化結(jié)果,見下表。
從上表可以看出,8批次孵化率圍繞一個(gè)穩(wěn)定值A(chǔ)=0.965做小幅擺動(dòng)。而這個(gè)穩(wěn)定值又無(wú)法準(zhǔn)確地確定。在實(shí)際生活中用它們的加權(quán)平均數(shù)作為孵化率,來(lái)評(píng)價(jià)種蛋質(zhì)量和孵化技術(shù)的好壞,這就是概率基礎(chǔ)在生物科學(xué)的應(yīng)用。
又例如,全球都在研究治療新冠肺炎的疫苗,目前國(guó)內(nèi)至少有四家公司在研究生產(chǎn)疫苗,世界上多個(gè)著名大學(xué)和生物制藥公司合作開發(fā)疫苗。但是大家都在關(guān)注疫苗成功的概率是多少?
2.古典概率
若隨機(jī)試驗(yàn)滿足:隨機(jī)事件的總數(shù)是有限的,每個(gè)隨機(jī)事件出現(xiàn)的可能性相等,稱為古典概率。
例:某社區(qū)有40人報(bào)名參加防疫志愿者服務(wù),其中有黨員25人,志愿者分為4個(gè)小組,(每組10人),現(xiàn)在要挑選一名志愿者,求下列概率:(1)選到的志愿者是第一組的同學(xué),(2)選到的自愿者是黨員
解 設(shè)A={志愿者是第一組的},B={志愿者是黨員}
生物統(tǒng)計(jì)學(xué)中概率基礎(chǔ)的一個(gè)有趣的例子就是對(duì)男性和女性出生率的研究。傳統(tǒng)的看法是男孩和女孩出生的比例約各占50%,但事實(shí)是男孩比女孩更容易出生。法國(guó)數(shù)學(xué)家拉普拉斯在其著作《概率論的哲學(xué)探索》中,根據(jù)法國(guó)的研究資料,研究了男孩或女孩的出生的概率問(wèn)題,經(jīng)過(guò)近10年的統(tǒng)計(jì)研究,法國(guó)每個(gè)地區(qū)出生的男女人數(shù)之比總是在一定數(shù)值比擺動(dòng),為了找出問(wèn)題所在,拉普拉斯選擇巴黎對(duì)這一地區(qū)進(jìn)行實(shí)地調(diào)查實(shí)驗(yàn),研究發(fā)現(xiàn)該地區(qū)出現(xiàn)了“重女輕男”的現(xiàn)象,這與中國(guó)的“重男輕女”不同,由于自然因素的影響,必然會(huì)影響統(tǒng)計(jì)規(guī)律。人們不禁要問(wèn),為什么男孩比女孩多一點(diǎn)?拉普拉斯從概率的角度解釋了這個(gè)問(wèn)題,因?yàn)閹в蠿染色體的精子和帶有Y染色體的精子與卵子交配的機(jī)會(huì)并不完全相同。這也說(shuō)明了概率論基礎(chǔ)知識(shí)在生物學(xué)中的廣泛應(yīng)用。
在統(tǒng)計(jì)學(xué)中,小概率事件的概率通常界定在小于0.05或0.01之間,這稱為小概率原理。小概率原理已在生物統(tǒng)計(jì)學(xué)上進(jìn)行科學(xué)檢驗(yàn)中得到廣泛的應(yīng)用。在后疫情時(shí)期,雖然我們周邊得新冠肺炎的病人幾乎沒有,也可以說(shuō)現(xiàn)階段在我國(guó),我們得新冠肺炎的概率屬于小概率事件,但是我們?nèi)匀徊荒艿粢暂p心麻痹大意,我們還是要求人們?cè)诠矆?chǎng)合戴口罩,尤其是乘坐交通工具時(shí)戴口罩,不聚集,勤洗手,常通風(fēng)等等。某種意義上講概率基礎(chǔ)知識(shí)在科學(xué)防控上意義很大。
在生物統(tǒng)計(jì)學(xué)中每次做的隨機(jī)試驗(yàn)的結(jié)果至少有兩種可能。若用字母x表示一次試驗(yàn)可能發(fā)生的結(jié)果。那么x的取值范圍就應(yīng)該是數(shù)值0.1.2.....或者某一區(qū)間(a,b)。究竟會(huì)出觀什么結(jié)果當(dāng)然是隨機(jī)的。我們稱這樣的x為隨機(jī)變量。
例如:用某種新冠肺炎疫苗給10名感染新冠肺炎的病人注射后,其痊愈的可能結(jié)果是“0人痊愈”、“1人痊愈”、“2人痊愈”……“10人痊愈”。若用x表示痊愈人數(shù),那么x的取值為0,1,2,……,10。
例如:測(cè)定某位新冠肺炎患者感染的病毒數(shù),x表示測(cè)定結(jié)果,則x的取值結(jié)果就是0,1,……。
例如:測(cè)量某個(gè)成年者的體重,表示測(cè)定結(jié)果的變量x所取的值為一個(gè)范圍(a,b),x值可以是這個(gè)范圍內(nèi)的任何實(shí)數(shù)。
又例如:測(cè)量燈泡的壽命,x表示測(cè)定結(jié)果,則x可能取值為(a,b)內(nèi)的任何數(shù)值。
隨機(jī)變量的概率分布是生物統(tǒng)計(jì)學(xué)概率基礎(chǔ)中一個(gè)非常重要的基本概念。所謂隨機(jī)變量的概率分布,是指對(duì)所有可能的隨機(jī)試驗(yàn)結(jié)果和所有可能結(jié)果發(fā)生的概率的描述,以及對(duì)所有可能的隨機(jī)試驗(yàn)結(jié)果的研究,以揭示生物世界存在的統(tǒng)計(jì)規(guī)律,這也是隨機(jī)變量概率分布的重要作用。其中,二項(xiàng)分布是離散型隨機(jī)變量最常見的分布,正態(tài)分布是連續(xù)型隨機(jī)變量最常見的分布。作為概率論基礎(chǔ)上的兩個(gè)重要概念,它們是生物統(tǒng)計(jì)學(xué)研究中不可缺少的重要內(nèi)容。
1.二項(xiàng)分布
設(shè)X示事件A發(fā)生的人數(shù),
故稱X服從參數(shù)為n,p二項(xiàng)分布。記為X~B(n,p),其中n,p稱為參數(shù)
例如:某國(guó)高風(fēng)險(xiǎn)區(qū)感染新冠肺炎的概率為0.7,求在這一地區(qū)檢查10人,恰有3人
感染新冠肺炎的概率。
設(shè)X表示檢查10人感染新冠肺炎的人數(shù)
2.正態(tài)分布
正態(tài)分布就是指的是一種大多數(shù)變數(shù)都集中在平均數(shù)附近,由平均數(shù)向兩側(cè)分散的變數(shù)逐漸減少的連續(xù)型概率分布。其分布密度曲線是一條光滑的型似于座鐘的曲線,是一條對(duì)稱而且連續(xù)的曲線。在生物統(tǒng)計(jì)學(xué)的理論研究和實(shí)際應(yīng)用中,概率基礎(chǔ)的正態(tài)分布起著重要的作用。在人類社會(huì)科學(xué)中,許多變量服從或近似服從正態(tài)分布,如動(dòng)物的日增重、產(chǎn)蛋率、產(chǎn)奶量、產(chǎn)毛量、乳脂率、瘦肉率、體型指數(shù)、某些生理指標(biāo)等,以及人的身高、體重、體重等,血液粘度指數(shù)等等也服從或近似服從正態(tài)分布。實(shí)驗(yàn)誤差和我們班上學(xué)生的數(shù)學(xué)成績(jī)也近似服從正態(tài)分布。在人類社會(huì)實(shí)踐中,許多概率統(tǒng)計(jì)分析方法都是基于正態(tài)分布的。
注意:一般正態(tài)分布的分布函數(shù)F(x)與標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)Φ(x)之間的關(guān)系為
于是:
比如:一群山羊的體重X~N(100,400),試計(jì)算該群山羊體重在80~120 kg范圍內(nèi)的概率。
=Φ(1)-Φ(-1)
=2Φ(1)-1
=2×0.8413-1
=0.6826
即該群山羊體重在80~120 kg范圍內(nèi)的概率為0.682 6這就是運(yùn)用概率統(tǒng)計(jì)方法研究生物科學(xué)的實(shí)際應(yīng)用。
新冠病毒在全球肆虐,目前還仍然沒有得到完全控制。眾所周知:要控制好這場(chǎng)疫情,疫苗起到了至關(guān)重要的作用,以色列的一項(xiàng)研究已經(jīng)顯示,在大規(guī)模接種新冠疫苗后,以色列的疫情防控取得了顯著效果,成為海外第一個(gè)通過(guò)接種疫苗成功遏制疫情的國(guó)家。全球都在關(guān)注疫苗成功的概率是多少?
我們需要了解一下疫苗的原理:疫苗就是基于特異性免疫機(jī)制,所謂特異性免疫具有相當(dāng)?shù)膶R恍运会槍?duì)特定的外來(lái)異物發(fā)揮免疫作用。當(dāng)病毒進(jìn)入人體后,用它表面的特殊結(jié)構(gòu)穿過(guò)細(xì)胞膜,在細(xì)胞中大量復(fù)制,復(fù)制出新的病毒去感染其他健康的細(xì)胞,迅速地人體內(nèi)的免疫細(xì)胞就會(huì)很快地發(fā)現(xiàn)這些病毒。疫苗的生產(chǎn)過(guò)程是,首先,科學(xué)家從病患的身體上分離出毒株,經(jīng)過(guò)體外細(xì)胞培養(yǎng),使病毒株大量復(fù)制增值,最關(guān)鍵的一步是將這些毒株用科學(xué)方法進(jìn)行滅活處理,使他們失去原有的致病性,然后將失去毒性的病毒少量的放入人體內(nèi),人體就會(huì)產(chǎn)生抗體,疫苗除了直接注射滅活的抗原,讓機(jī)體自然產(chǎn)生抗體以外,還有一種是直接注射抗體,這兩種的作用都是一樣的,他們都使人體不再容易感染到病毒。
目前世界很多國(guó)家都在研制疫苗,我國(guó)也有多家公司在研制疫苗,疫苗成功的概率達(dá)到99%以上,遠(yuǎn)遠(yuǎn)高于其他國(guó)家疫苗的成功率。
通過(guò)概率統(tǒng)計(jì)研究有如下的數(shù)據(jù)表明:在單針接種后28天,陳薇團(tuán)隊(duì)研發(fā)的克威莎疫苗三期臨床試驗(yàn)結(jié)果,該疫苗的總體保護(hù)效力達(dá)到了74.8%,美國(guó)強(qiáng)生公司研發(fā)的也是單針疫苗,盡管都同處于三期臨床試驗(yàn),但總體保護(hù)效力僅有66%,不過(guò)都高于世衛(wèi)組織規(guī)定的50%。在單針接種后28天陳薇團(tuán)隊(duì)研發(fā)的克威莎疫苗針對(duì)重癥病例的保護(hù)效力則達(dá)到了100%。美國(guó)強(qiáng)生公司疫苗針對(duì)重癥病例保護(hù)效力為85%。見下圖表:表-1.表-2
表-1
表-2
由表-1.表-2知:“從疫苗保護(hù)作用來(lái)看美國(guó)強(qiáng)生公司的疫苗明顯低于陳薇團(tuán)隊(duì)研發(fā)的克威莎疫苗數(shù)據(jù),從而說(shuō)明了陳薇團(tuán)隊(duì)研發(fā)的疫苗的效果會(huì)更好?!边@也體現(xiàn)了概率基礎(chǔ)在科學(xué)防控方面起到了重要作用是生物科學(xué)最直接的應(yīng)用。
綜上所述:概率基礎(chǔ)在生物統(tǒng)計(jì)學(xué)中有著重要的作用,它的應(yīng)用無(wú)處不在,它在我們?nèi)祟惖纳钪薪o予了最具應(yīng)用的廣泛性和實(shí)踐性,尤其在現(xiàn)在為我們抵御病毒侵害提供最有力的理論依據(jù),為科學(xué)防控打下堅(jiān)實(shí)的科學(xué)基礎(chǔ)。
天津職業(yè)院校聯(lián)合學(xué)報(bào)2021年5期