張卓,尹曉麗
(山西大學(xué)商務(wù)學(xué)院,山西 太原 030031)
在概率論中,全概率公式與貝葉斯公式是十分重要的一組公式,它們是處理復(fù)雜隨機事件有關(guān)概率問題的得力工具。教學(xué)中既是重點也是難點,以下通過一則實例展開教學(xué)初探。
【實例】某地區(qū)肝癌發(fā)病率為0.04%。在該地區(qū)進行血檢,肝癌患者化驗呈陽性概率為99%,健康人化驗呈陽性概率為0.1%?,F(xiàn)從中隨機抽查一人,求化驗為陽性的概率。
【初窺】化驗呈陽性有兩種可能:患者化驗呈陽性或正常人化驗呈陽性。所以,呈現(xiàn)陽性這一結(jié)果確實是受多種因素影響的復(fù)雜隨機事件,將其設(shè)為B。導(dǎo)致B 發(fā)生的原因設(shè)為完備事件組。設(shè)A:在該地區(qū)隨機抽查一人為患者。A:在該地區(qū)隨機抽查一人為健康人。由全概率公式可知,B 事件的概率可拆分為兩個互斥的,受單因素影響的事件概率之和,即:
【再窺】事實上,普查的目的并不在此,而是想知道化驗為陽性的人是否真的患病。故提出新問題:“已知某人檢查結(jié)果呈陽性,求其確為癌癥患者的概率”,即已知結(jié)果事件B 發(fā)生了,求事件A 發(fā)生的概率,這樣的問題屬于貝葉斯理論研究的范疇。下面我們來看貝葉斯公式:
設(shè)A1,A2,…An…是一個完備事件組,且P(B)>0,P(A1)>0(i=1,2,…),
此處引導(dǎo)學(xué)生自己推導(dǎo):等號左側(cè)為條件概率,按公式展開,分母按照全概率公式展開,考慮各個情形下事件B 發(fā)生的概率,分子按照乘法公式展開,考慮單一因素影響下事件B 發(fā)生的概率,即可得貝葉斯公式。
貝葉斯公式貌似簡單,就是條件概率公式、乘法公式、全概率公式的重組,但它的出現(xiàn)引發(fā)了概率界的巨大變化,出現(xiàn)了貝葉斯學(xué)派、貝葉斯統(tǒng)計。這是因為在此之前的概率,均為正向概率,如分母上的全概率公式,是計算結(jié)果的概率,是從原因到結(jié)果的正向思維。而貝葉斯公式是在結(jié)果發(fā)生后,反推其原因的概率,是逆向思維,又稱為逆概公式,是質(zhì)的飛躍。
下面利用貝葉斯公式來解決以上提到的新問題“已知化驗結(jié)果呈陽性,問確實為癌癥患者的概率”。依照貝葉斯公式,代入數(shù)據(jù)可得,結(jié)果為P(A|B)=0.2846。這表明醫(yī)務(wù)工作者僅憑一次化驗為陽性就判斷此人為癌癥患者的把握并不到3 成。于是建議此人復(fù)查。若化驗結(jié)果仍為陽性,則幾乎可以認定他是患者,而不是懷疑。如何解釋態(tài)度的轉(zhuǎn)變呢? 下面我們將其量化,具體計算第二次試驗為陽性的條件下,此人為患者的概率。注意此時我們就不能再利用P(A)=0.04%來計算分母了。因為此人第一次化驗結(jié)果呈陽性。有了這一新信息的加入,判斷他患病的可能性就增大至0.2846,而非對自然人群患病率的判斷0.04%。再次使用貝葉斯公式,代入數(shù)值計算可得結(jié)果為0.997。
【三窺】這三個概率的關(guān)系:本例中患病的概率P(A)先于試驗,是在沒有已知任何復(fù)雜事件是否發(fā)生的情況下人們通過已有的經(jīng)驗給出的,稱為先驗概率。P(A|B)是在增加了結(jié)果(檢驗出陽性)發(fā)生的這個新信息后,對原因事件發(fā)生概率P(A)的重新判斷,后于試驗,稱為后驗概率。故,貝葉斯公式的作用可看作是由先驗概率獲得后驗概率,再由后驗概率修正先驗概率。比如第一次做化驗后,醫(yī)務(wù)人員就用后驗概率0.2846 修正了先驗概率0.0004,從而懷疑此人患病。復(fù)查后醫(yī)務(wù)人員對其患病這一事件態(tài)度的轉(zhuǎn)變正是源于用第二次試驗后的后驗概率0.997 修正了先驗概率0.2846,是對先驗概率的重新認識。只要細心觀察,貝葉斯公式無處不在,馬航搜救正是利用了貝葉斯理論,在獲得新信息后不斷修正并確定新的搜救范圍來尋找失聯(lián)客機。
【總結(jié)】全概率公式與貝葉斯公式都是原有知識的重組,是條件概率、乘法概率公式結(jié)合的產(chǎn)物,它們的應(yīng)用背景都是處理受多重因素影響的復(fù)雜隨機事件的概率問題。不同之處在于:由因索果用全概,執(zhí)果溯因用逆概。