王 燕
(合肥師范學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,安徽 合肥 230601)
作為解決復(fù)雜概率問(wèn)題的一個(gè)重要工具,貝葉斯公式是概率論教學(xué)中的重點(diǎn)和難點(diǎn),同時(shí)又是貝葉斯統(tǒng)計(jì)的理論核心,以此為基礎(chǔ)發(fā)展起來(lái)的貝葉斯估計(jì)、貝葉斯網(wǎng)絡(luò)、貝葉斯分析、貝葉斯學(xué)習(xí)等理論在人工智能、數(shù)據(jù)挖掘、經(jīng)濟(jì)預(yù)測(cè)、醫(yī)學(xué)診斷、質(zhì)量監(jiān)控等領(lǐng)域發(fā)揮著重要的作用,因此,學(xué)習(xí)和理解貝葉斯公式非常重要。
從學(xué)生熟悉的小故事、生活中遇到的實(shí)際問(wèn)題和概率中經(jīng)常列舉的質(zhì)量檢測(cè)問(wèn)題引申出教學(xué)內(nèi)容,調(diào)動(dòng)學(xué)生的學(xué)習(xí)興趣,激發(fā)學(xué)生的求知欲。通過(guò)引例,引導(dǎo)學(xué)生利用條件概率公式和全概率公式,推導(dǎo)出貝葉斯公式的具體形式及求解方法。在給出貝葉斯公式之后,對(duì)公式的條件、應(yīng)用背景進(jìn)行深入的解讀,讓學(xué)生更加深入地理解貝葉斯公式,并簡(jiǎn)單介紹一下貝葉斯的生平,讓同學(xué)們認(rèn)識(shí)到任何一個(gè)數(shù)學(xué)公式或者理論的產(chǎn)生都不是那么容易的。給出貝葉斯公式在信用問(wèn)題中應(yīng)用的例子,此案例既與學(xué)生所學(xué)專業(yè)背景有關(guān),又能很好地體現(xiàn)課程思政,在講解例子的過(guò)程中,給同學(xué)們解釋了先驗(yàn)概率和后驗(yàn)概率,這是本節(jié)的難點(diǎn),但基于實(shí)例對(duì)于兩個(gè)概念的理解是十分有利的。最后,進(jìn)一步列舉貝葉斯公式的其他應(yīng)用領(lǐng)域,擴(kuò)展本節(jié)學(xué)習(xí)內(nèi)容。課后思考題的選擇,是貝葉斯公式在“疾病診斷”中應(yīng)用的案例,這個(gè)案例既有益于學(xué)生理解先驗(yàn)概率和后驗(yàn)概率,也能增強(qiáng)學(xué)生解決實(shí)際問(wèn)題的能力。
從“狼來(lái)了”的故事中村民們對(duì)小男孩的信任度如何急劇下降,體檢中某項(xiàng)指標(biāo)出現(xiàn)異常時(shí)醫(yī)生讓患者復(fù)查的依據(jù),產(chǎn)品出現(xiàn)質(zhì)量問(wèn)題時(shí)如何追究經(jīng)濟(jì)責(zé)任等問(wèn)題,一步步設(shè)問(wèn),引出微課教學(xué)內(nèi)容——貝葉斯公式。
為了推導(dǎo)出貝葉斯公式,給出一個(gè)產(chǎn)品檢驗(yàn)中的例子。引例與最開(kāi)始提出的問(wèn)題相契合,背景簡(jiǎn)單,易于理解。
例1某工廠有三條生產(chǎn)線生產(chǎn)同一種產(chǎn)品,設(shè)三條生產(chǎn)線線的產(chǎn)量分別占總產(chǎn)量的0.25、0.35、0.40,又設(shè)這三條生產(chǎn)線的不合格品率依次為0.02、0.02、0.01。若該廠規(guī)定,出了不合格樣品要追究有關(guān)生產(chǎn)線的經(jīng)濟(jì)責(zé)任,但該商品是哪一條生產(chǎn)線生產(chǎn)的標(biāo)志已經(jīng)脫落,問(wèn)每條生產(chǎn)線應(yīng)該承擔(dān)多大的責(zé)任?[1]
分析首先設(shè)出隨機(jī)事件,設(shè)A為抽取的產(chǎn)品為不合格品,B1,B2,B3分別表示抽取的產(chǎn)品是第i(i=1,2,3)條生產(chǎn)線生產(chǎn)的,則B1,B2,B3為樣本空間S的一個(gè)劃分,由題意可知三條生產(chǎn)線生產(chǎn)的概率分別為P(B1)=0.25,P(B2)=0.35,P(B3)=0.40,抽取的產(chǎn)品是第i(i=1,2,3)條生產(chǎn)線生產(chǎn)的,它正好是不合格品的概率分別是P(A|B1)=0.02,P(A|B2)=0.02,P(A|B3)=0.01,這些都是條件概率。
要追究三條生產(chǎn)線的經(jīng)濟(jì)責(zé)任,即為計(jì)算這件不合格品正好屬于第i條生產(chǎn)線的概率,也就是考查P(Bi|A)(i=1,2,3)的值。
代入數(shù)據(jù),可以求得
分析一下這些數(shù)據(jù)的意義,以P(B1|A)=0.3125為例,它表示如果這件產(chǎn)品是不合格品,它是第一條流水線生產(chǎn)的概率是31.25%,也就是第一條流水線要承擔(dān)的31.258%的責(zé)任。假設(shè)罰款100元,第一條流水線要罰31.25元。
通過(guò)比較可以看出,不合格品來(lái)自第三條流水線的可能性是最大的,因此,第三條流水線應(yīng)該承擔(dān)最大的責(zé)任。
結(jié)論由條件概率的定義、乘法公式、全概率公式推導(dǎo)得到的這個(gè)公式實(shí)際上就是貝葉斯公式,把它一般化,就可以得到貝葉斯公式的精確表述。
定理[2]設(shè)試驗(yàn)E的樣本空間為S。A為E的事件,B1,B2,…,Bn為S的一個(gè)劃分,且P(A)>0,P(Bi)>0(i=1,…,n),則
稱為貝葉斯公式。
解讀公式
1.對(duì)公式條件的條件進(jìn)行解讀,B1,B2,…,Bn為S的一個(gè)劃分,保證了分母可以按全概率公式展開(kāi),P(A)>0,P(Bi)>0是為了保證公式中的兩個(gè)條件概率有意義。
2.公式中的A看成是結(jié)果,B1,B2,…,Bn看成是導(dǎo)致A發(fā)生的所有可能的原因,是一個(gè)“已知結(jié)果求原因”的公式。由于全概率公式是“知因求果”正向思維,而貝葉斯公式是“執(zhí)果索因”逆向思維,也被稱為“逆概率公式”。
3.貝葉斯公式的歷史:最早是英國(guó)的數(shù)學(xué)家貝葉斯提出來(lái)的,所以以他的名字命名。他所發(fā)表的有關(guān)貝葉斯公式的文章很長(zhǎng)一段時(shí)間內(nèi)在學(xué)術(shù)界都沒(méi)有引起什么反響,可時(shí)至今日,貝葉斯公式已經(jīng)發(fā)展成一整套統(tǒng)計(jì)推斷方法——貝葉斯統(tǒng)計(jì),應(yīng)用非常廣泛。
例2某商業(yè)銀行對(duì)創(chuàng)業(yè)人群提供小額貸款,某人承諾兩年內(nèi)還清貸款,否則視為不守承諾。假設(shè)對(duì)該人的信任度為0.7,可信的人不遵守承諾的概率為0.1,不可信的人不遵守承諾的概率為0.8。若此人兩年內(nèi)未還清貸款,求銀行對(duì)此人的信任度為多少?
解讀名詞信任度,就是指可以被相信的程度,是一個(gè)人是可信的人的概率的大小。
分析這個(gè)人兩年內(nèi)未還清貸款,即為一個(gè)不遵守承諾的人,可信的人可能會(huì)不遵守承諾,不可信的人也可能會(huì)不遵守承諾,所以這個(gè)人可信與否構(gòu)成了不遵守承諾的所有可能原因,很明顯,這兩個(gè)原因是互斥的。如果把創(chuàng)業(yè)人群看成是一個(gè)樣本空間,那他們就是樣本空間的一個(gè)劃分,問(wèn)題是若此人兩年內(nèi)未還清貸款,求銀行對(duì)此人的信任度為多少?也就是求:若這個(gè)人未遵守承諾,他是一個(gè)可信的人的概率是多少?這是一個(gè)“已知結(jié)果求原因”的問(wèn)題,可以應(yīng)用貝葉斯公式解答。
由貝葉斯公式得,
結(jié)論若這個(gè)人未及時(shí)還清貸款,他的信任度將由0.7降至0.23,其信用程度大大降低。
延伸1貝葉斯公式的一個(gè)重要應(yīng)用,就是在新信息的條件下,對(duì)B事件概率的重新估計(jì)。一般來(lái)說(shuō),貝葉斯公式中,A事件未發(fā)生前Bi事件的概率定義為先驗(yàn)概率,有了A事件這個(gè)新信息后,再對(duì)Bi事件發(fā)生的概率的估計(jì)定義為后驗(yàn)概率,貝葉斯公式正是在計(jì)算這個(gè)后驗(yàn)概率。這道題目中,P(B)為先驗(yàn)概率,P(B|A)為后驗(yàn)概率。
延伸2進(jìn)一步思考下面的問(wèn)題:如果此人之后再次提出貸款申請(qǐng),承諾兩年內(nèi)還清貸款,銀行批準(zhǔn)。若此人兩年內(nèi)又未還清貸款,求銀行對(duì)此人的信任程度變?yōu)槎嗌伲?/p>
這個(gè)人第二次未及時(shí)還清貸款后,其信任度已經(jīng)下降到0.036,從0.7到0.23,再到0.036,貝葉斯公式從數(shù)量上體現(xiàn)了這個(gè)人的信任度是如何急劇下降的。
如此低的信任度,將給個(gè)人的征信帶來(lái)污點(diǎn),以后這個(gè)人的房貸、車貸、信用卡等都會(huì)受到影響。貸款額度要比別人的少,利率要比別人的高。如果逾期嚴(yán)重,甚至坐飛機(jī)、高鐵,住賓館都無(wú)法透支消費(fèi),子女無(wú)法上重點(diǎn)學(xué)校,失信寸步難行。
延伸3貝葉斯公式的應(yīng)用遠(yuǎn)不止此,在疾病診斷、經(jīng)濟(jì)預(yù)測(cè)、刑偵決策和質(zhì)量控制等凡是用到概率預(yù)測(cè)的地方,都會(huì)用到貝葉斯公式,貝葉斯公式無(wú)處不在。
1.貝葉斯公式是一個(gè)平凡的公式,它是由條件概率、乘法公式和全概率公式推導(dǎo)得出的;
2.貝葉斯公式又是一個(gè)神奇的公式:它是逆概率公式,實(shí)現(xiàn)了P(A|Bi)到P(Bi|A)的轉(zhuǎn)化;它是一個(gè)由果求因的公式,與全概率公式正好相反;它本質(zhì)上體現(xiàn)了利用樣本信息對(duì)先驗(yàn)概率的修正。
思考題某一地區(qū)肝癌的發(fā)病率為0.0004,先用甲胎蛋白法進(jìn)行普查。醫(yī)學(xué)研究表明,化驗(yàn)結(jié)果是存在錯(cuò)誤的。已知患有肝癌的人其化驗(yàn)結(jié)果99%呈陽(yáng)性(有病),而沒(méi)有患肝癌的人其化驗(yàn)結(jié)果99.9%呈陰性(無(wú)病)。現(xiàn)某人的檢驗(yàn)結(jié)果呈陽(yáng)性,問(wèn)他真患肝癌的概率是多少?
延伸思考
1.檢驗(yàn)結(jié)果呈陽(yáng)性是否一定患有肝癌?
2.這種普查對(duì)于診斷一個(gè)人是否患有肝癌有無(wú)意義?
關(guān)于貝葉斯公式的微課設(shè)計(jì),主要有以下幾個(gè)特點(diǎn):
(1)步步緊扣,教學(xué)設(shè)計(jì)體現(xiàn)完整性與邏輯性。各個(gè)教學(xué)環(huán)節(jié)和內(nèi)容的設(shè)計(jì)銜接緊密,邏輯性強(qiáng),體現(xiàn)了設(shè)計(jì)的完整性與合理性,前面的案例與后面的例題講解形成了首尾呼應(yīng)的良好效果。
(2)遵循規(guī)律,教學(xué)過(guò)程注重?cái)?shù)學(xué)思想方法的滲透。教學(xué)過(guò)程中通過(guò)一步步的設(shè)問(wèn)引出今天的教學(xué)內(nèi)容,主體按照“由引例引出貝葉斯公式—貝葉斯公式的精確表述—回到貝葉斯公式的應(yīng)用”的順序組織教學(xué)內(nèi)容,使學(xué)生能全面認(rèn)識(shí)所學(xué)內(nèi)容,形成完整的知識(shí)框架,還能培養(yǎng)學(xué)生應(yīng)用數(shù)學(xué)解決實(shí)際問(wèn)題的意識(shí)。
(3)合理選擇,開(kāi)發(fā)案例教學(xué)中的思想政治元素。誠(chéng)信是社會(huì)主義核心價(jià)值觀的重要組成部分,是做人做事的基本準(zhǔn)則。通過(guò)講解貝葉斯公式在信用問(wèn)題中的應(yīng)用的例子,建立了誠(chéng)信模型,教育學(xué)生做人做事要講誠(chéng)信[4-6]。
合肥師范學(xué)院學(xué)報(bào)2021年3期